冲击效应的估计值---以冲击的值度量的效应。这种方法已经被用于测量印度尼西亚的克隆(cronyism)主义(Fisman),谁在战争强手中贸易(war diamonds)(La Ferrara)。 其次,如果我们有参与者和未参与者的面板数据。
我们可以使用未参与者的产出作为普通时间效应?的估计值。这种估计法常常叫做差异中的差分或dif-in-dif。因为它是通过比较参与者和未参与者的产出变化来估计参与效应的。我们来看看它的名字是怎么来的,在方程(6.1)中放弃(xit?1?xit)?,再一次假定在1期没有人接受参与,而在2期一些人接受参与。这意味着,对于所有的个体来说?i0?0,而对于某些人来说?i1?1,其他人?i1?0。取一阶差分
?yit?yit?1?yit,消除了固定效应。我们得到:
?yit????it??(ei1?ei0)
,而?i1?1的样本用来识别参与效应。 ?i1?0的样本用来识别?(普通时间变化)
?1为1期未参与样本Y的均换句话说,令U和T分别标示参与和未参与,令?值,我们就有:
i?UU??yit???
?1???0 ??UU? ??yit?????i?T?1???0 =?可以推出:
TT????yit???yit ?i?TTi?U?1???0)?(??1???0) =(?是差异的差分---因此它的别名叫做差异中的差分(dif-in-dif)。
6.1.2扩充部分(多于两期)
虽然面板数据在估计参与效应时,有可能消除引起内生性的许多因素,但是它不能完全消除基于不可观测因素的选择问题。但是这些必须是时变的不可观测因素---如个体特定的冲击和个体的时间趋向。如果我们有多于两期的数据,我们可能可以控制这些因素。个体时间趋向可以通过加入时间和个体虚拟变量的交互项来得到控制。
26
TUU 例如:
yit?xit???1?it?ui?thi?eit
这里hi是个体的特定系数。一个具有个体时间趋向的例子是Ravallion和Jalan关于中国贫困的研究,样本以省为单位,作者允许存在省际特定趋向。
假设在个体参与的过程中有足够大的变化,多期面板数据可能可以使我们控制个体水平上的异质性参与效应,例如,工人的学习能力可能是不同的。相同技能水平工人可能从相同方式的培训中获益不同,因为一些工人学的快些---就是说从有限期的培训课程中学到的技能更多。考虑到这种情况,我们可以这样估计:
yit?xit???1?it?ui??ithi?eit (6.2)
这里hi是个体特定系数。参与应该以加性可分的方式(additive manner)进行。有许多参与都不是以这种进行的----如,外科手术。但是如果参与是偏头痛的药物,我们预计不同的人对药物的反应不同,那么我们可以通过在个体间随时间变换参与,然后使用上面的模型来估计?,这样可能可以控制参与应该以加性的方式进行的。 6.1.3 使用dif-in-dif 推导
估计?是一件事,还有 一件事是推断干预是否是统计显著的。为了推断估计是一致的,估计的标准差也必须是一致的。Bertrand,Duflo Mullainathan(2004)检验了92篇出版的使用US的面板数据的应用差异中的差分回归方法并报告了结果的论文。这些论文寻求识别关于产出收益---一般是工资---的州法律(state law)的参与效应。面板数据的平均期限是16.5年,中值是11年。回归使用个体数据分析。法律随时间的变化应用于识别法律效应。法律没有变化的州是用作控制组的。因此我们就有了差异中的差分估计法。
BDM这些论文的大部分都没有报道一致的标准差。误差随时间的强自相关性,显著地提高了参与效应显著的可能性。下面我们进行说明,他们像许多论文一样使用相同的数据库,设想相同的假设的合乎规定的变化。然后他们估计这些合规定的变化对女性的工资是否有显著的影响。他们发现在他们的67.5%模拟(simulation)通过了5%显著水平的检验。换句话说,应用差异中的差分来使用个体面板数据研究法律变化效应,会出现严重的推导(inference)问题:寻找显著的效应是有偏的??BDM还发现参数法估计的误差相关性来修正标准差是没用的。
BDM列出了多种修正误差的序列相关性的方法。下面三种方法是有效的: 1、块自举法(block bootstrap)研究者使用(6.2)进行估计。估计的系数是一致的。研究者为了构建标准差,他们对人工抽取的相同样本大小的M重新估计(6.2),检验系数估计值的蒙特卡罗分布(Monte carlo) 分布。蒙特卡罗(Monte carlo) 分布是对系数的样本分布的近似,因此它可以用于计算置信区间或进行假设检验。块自举法里,每一个州用一个块样本代替。这意味着,例如,在一个自举样本里,当不考虑加利福尼亚州时佛罗里达州就可以出现3次。M必须足够大,这个方法才管用(如,
27
最少200,1000更好)。如果州(如,组)数量降低到如20或10,你这个方法的效力就几乎没有了:在这种情况下,标准差太宽,以至于如果0假设是真的我们却不能拒绝它(类型Ⅱ误差)。
2、事前事后平均法:
它最简单的形式是,在法律变化前后平均独立(independence)变量,对相应的2期面板应用差异中的差分估计法。它更加精密的形式,(1)研究者使用没有参与变量的如同方程(6.2)的模型对年度数据进行估计,(2)获得残差,然后平均2期的残差。(3)对两期残差使用差异中的差分。
3、怀特标准差:研究者还是估计方程(6.2),但是它对White-Newey-West-Conley的标准差修正进行了扩展,允许随时间非独立性(non-independence over tiime)。我已经成果的使用了相似的方法对网络数据(network/dyadic data)进行了推导。系数的相关矩阵估计值W这样获得:
?N?'?1W?(XX)??uj'uj(?XX)
?j?1?'?1uj??ejtxjt
t?1T这里N是州/组的数量,T是时期的期数,X是回归矩阵,ejt是j州,在t年的残差。STATA中,通过对每个州的全部时期使用聚类(cluster)命令可以实现这个方
法。
7.倾向得分法
匹配法的思想迎合了关注倾向得分作为完成匹配的一种方法的原始文献。它不是依靠控制变量来消除遗漏变量偏差。这个方法的优点是,它不需要考虑控制变量对产出影响的方程形式的假设。我们简要介绍以下这种方法。
回忆起来,倾向得分p(x)的定义是:
p(x)?Pr(??1|x)
它表示具有特性X的个体接受参与的可能性。我们也可以将ATE和ATT写成倾向得分的形式。
方法a :
假定1.(伍德里奇 18.8)0?p(x)?1
假定18.8的意思是没有“空单元”(null cell):对每一个X值,有一个非0的可能性,W不是0就是1。假定ATE’1和18.8的结合,被Rosenbaum和Rubin叫做参与的强
28
无关性。
命题2.(伍德里奇 18.3)如果18.8成立,那么
?[??p(x)]y?ATE?E??
?p(x)[1?p(x)]??[??p(x)]y?1 ATT?E????1)?[1?p(x)]?Pr(证明P28-29略
要执行上面的方法,我们需要p(x)的估计值。一种方法是使用灵活的Logit回归---对X的各种函数(平方,交互,取log)进行Logit回归。另一种方法是使用非
?)。那么ATE和ATT的?(xi)?F(x;?参数方法。比如说,我们已经选取合适的估计法p一致估计值是:
?(xi)]y1N[?i?p? ATE????Ni?1p(xi)(1?p(xi))NN?[??p(x)]y11??ii?TT?A???i? ?(xi)]?Ni?1[1?pN?i?1??1因为??N?(xi)。 ??i?是对Pr(??1)的一致估计。很清楚,导致相似的预期值pi?1N???TE和A?TT。伍德里奇说使用delta方法可以获不同估计p(xi)方法也会导致相似的A得渐近有效的标准差(在12.5.2部分),但是他也指出,没有考虑到细节问题的话,
这个方法有些复杂。
方法b:部分出局(partialling out)
幸运的是,基于倾向得分方法还有一个更加简单的估计法:
?(xi)回归 (7.2) yi 对1, ?i , p?(xi)扮演控制函数的角色:不是控制各个X,我们只?i的系数就是ATE,这里p控制参与的可能性的产生效应。这个方法的合理性在于,如果在回归方程中包括X,
则可以控制基于可观察的选择问题;但是,倾向得分包括了所有解释为什么选择接受参与的X的信息。因此估计是倾向得分对选择偏差的完全修正,而且它包含了所有与估计参与效应有关的信息。
然而要使这个方法有效,我们还需要一个额外的假定:
29
假定3.(伍德里奇P18.4)E(y1?y0|x)?m1(x)?m0(x)与Var(?|x)?p(x)(1?p(x))无关。
?(xi)估计是一致的,且N渐命题4.(伍德里奇 18.4)如果假定P18.4成立,p近正态的,那么对于平均参与效应ATE来说,?的系数就是一致且N渐近正态的。
假定P18.4可能是个强假定,因为他们都是X的函数。但是相关是一个线性的关系。Var(wx)是p(x)的非单调二次函数,而m1(x)?m0(x)却是x的单调函数。因此,零相关性可能近似保持。(这个发现类似于事实:如果Z是标准正态随机变量,那么Z2和Z是无关的---尽管他们不是独立的(independence))
方法C 异质性效应部分出局(partialling out with heterogeneous effects)
?(xi),?i(p?(xi)???p) 回归 (7.3) yi 对 1,?i ,p1?p?其中?N?(x) ?pii?1N假定5.( 伍德里奇 P18.5)E[y0|p(x)],E[y1|p(x)]关于X是线性的
命题6.(伍德里奇 P18.5—Rosenbaum Rubin)在假设ATE.1和P18.5下,(7.3)
?i上的系数一致地估计ATE。
伍德里奇指出在许多应用中,假定P18.5可能约束性太强了。原因是, p(x)位于0和1之间是有界的,这个假定暗指y0,y1也是有界的。他补充道,如果违犯这个假定,“只要用一个低阶多项式代替p(xi)”,不需要更复杂的操作。
部分出局中剔除偏差(con)
方法b和方法c看起来比直接控制X更吝啬,如回归(4.2)。这是一个幻觉。事实上,如果使用线性可能性模型估计倾向得分,回归(4.2)--控制X---和回归(7.2)---控制p(x)---,将会得到ATE同样的估计值。
这是多变量回归一般原理的简单运用。说我们有一个形式为y??1x1??2x2?u的
???。回归模型,。我们通过OLS估计得到?现在想象,我们估计形式为x1??1x2?v的12?回归?x2,v?1????x1?x?1。回归模型,得到?。定义x那么,如果我们Y对v(或,对x1,x2?是一样的。 ?的系数和?回归),v1我们也注意到,在回归(4.2),?(ATE)的标准差是可信的。在回归(7.2)时,我们应该修正预测回归元(predicted regressor)。在线性回归中,可以通过使用由
30
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库第六讲政策效应评估(6)在线全文阅读。
相关推荐: