们如何解释异质性效应。个体特性xi不是随机指派的,因此它可能和不可观测个体特性有关。因此xi的异质效应可能竟不是xi导致的。看起来好像,随机化实验没有消除(经济学)思考的必要性。
4.4推理和假说验证
到现在为止,我们已经讨论了如何获得ATE和ATT的估计值。下一个问题就是如何获得估计值的标准差,这样我们就可以进行推理和假说的验证。对于以回归法估计的ATE和ATT,最常见的问题—如,异方差,群聚类(group clustering)及其他类似的问题。对于其他估计法,如简单的t检验,已经有文献指出如何获得正确的标准差。Deaton(2009)提到,关于t检验的文献,对两种人群(参与和未参与)具有不同的方差感到担忧。STATA ttest检验命令就有一个这样的选项。我认为在回归内容上,这个问题可能通过“robust”命令得到解决。
对于非参数估计的ATE和ATT,事情就有点微妙了。伍德里奇简洁的讨论过这些问题,他注意到,在许多情况下,获得非参数估计法的一致标准差的唯一可信的方法,是自举法。在STATA中实现自举法并不特别困难。这里有一个简单的办法给你
?,它是N个样本获得的真实?的估计值。你想要开个头。说你有一个一致估计值???a。下面你要做的是: 检验是否??a,而且?1. 选取从N个样本中随机选取K个样本代替真实样本。在这个人工选择的样
本中,一些原始个体会出现多次;还有一些从来就没出现过。
2. 3.
? 用人工选择的样本估计?重复这个过程M次,M是个大数字,如,起码是100,最好是1000.
k
k
?的真实分布。 ?。M个估计值的分布就是?这样得出m次估计的?4.
??a。检验??a自举法的P值是 ?的估计次数,保证?令ma是?m。
kkma
这是一般的理论。如果是群/聚类,那么你需要在聚类中选取随机化样本,如,有替换地抽取分块里面的样本。当然,如果你的分块很少,事情就没那么顺利。但是这只是我们预想的。还有许多一般的假说检验技术,如前突变方法(permutation method),这个方法在STATA里面也有。
McKenzie(2008)讨论了其他有趣问题,叫做,分层法。对于应用领域实验法的研究者来说,对样本进行分层来确保在参与组和控制组之间的可观测特性的平衡性是很平常的事。人们一直知道,样本分层会影响标准差的分布。例如STATA,具有一整套系列的SVY命令来参与样本设计,包括分层。一般来说,对于给定的样本容量,分层法在抽取信息方面比纯随机样本更有效。这意味着没有考虑分层计算出来的标准差
21
是被高估了---降低了我们对估计的信心。因此修正的分层法应该改善t值,对于标准回归分析,SVY命令一般应该可以达到目的。
5、回归不连续设计
回归不连续设计是一种应用于特定类型数据的回归方法。就是说,存在一个干预的合格标准,如,低于特定收入门槛?的人是合格的,其他人不合格,那么我们可以对比略略高于?和略略低于?的个体,使用他们的差别作为在?点的参与效应。回归不连续设计在Lee(pp.57-)有详细的介绍,也就是从他那里我组织了这部分内容;Lee 区分了三种类型的回归不连续设计,我也会对他们进行讨论。
5.1参数RDD
Lee使用与我略有不同的标记来方便比较我的观点和他的书的不同。令d标示以收入检测的干预(参与),x为收入。个体x>?则d=0, x??则d=1。收入x对产出变量y的效应是独立的。如果我们假定这个效应是线性的,而且对于参与者和未参与者是相同的,我们就可以用以下形式的模型估计:
yi??1??ddi??xxi?ui
和(4.2)一样,----?d?ATE,模型(4.2)是参数RDD。
问题是,对x的影响方式这个假定是否公正。要检验它,我们可以简单地绘制x,y坐标系,看看xy坐标里,?点是否是断点,不然它就是线性的。xy坐标上断点跳跃的幅度就是ATE。
5.2灵敏非参数RDD
如果y和x的关系不是线性的,以致很难建立可信的模型,我们可以求助于非参数方法。这个方法只要求选择是基于可观测因素,局部的---也就是,在?附近。令:
yji??d?g(xi)?uji ,j?{0,1} (5.1)
这里g(x)是假定?点连续,但不确知其形式的函数。如先前一样,是否是合格的参与者,要看x和?的大小比较。我们现在要做的关键假定是,选择是局部的基于可观测因素,就是说:
limE(u0|x)?limE(u1|x)
x??x??在这个假定下,通过限制我们的分析是在?的边界附近的样本进行,我们可以识别ATE??d。一个这种方法的例子是Black(1999)通过对比在毗连的拥有不同质
22
量的学校区域,邻近的房子来估计人们愿意对学校质量支付的多少价格。房屋价格作为愿意为学校质量出价的证据。在Cogneau,他们用相似的方法来比较Cote d’Ivoire 和它的邻居的宏观政策-,只是通过比较不同国家的相邻地区的健康和教育产出。后者的应用备受推崇,因为它允许应用参与效应的方法论去评估宏观政策。当然,要使用这个方法,样本必须是独立的,在实践中,这也并非必需。(如,如果从一个地区到另一个地区具有外部性)。
5.3模糊非参数RDD
如果门槛不是灵敏的,我的意思是,有些x>?的人参与了项目,而有些x
ATE??d?limx??E(y|x)?limx??E(y|x)limx??E(d|x)?limx??E(d|x)
要估计上面的值,我们可能要使用单边核回归(one-sided kernel regressions)来获得上式的四个表达式的近似值。细节参看Lee。问题在于小样本的单边核回归的属性可能不好。
另一个可能的估计法是这样运行的。选择是基于接近?的可观测因素暗指: limE[(1?d)u0?du1]?0
x??意味着u0和u1之间没有差别。(伍德里奇是标注的v0和v1)。使用(5.1)在x??时x的期望:
E(yi|xi)??dE(di|xi)?g(xi) , x??
(5.1)减去上式得到:
yi?E(yi|xi)??d[di?E(di|xi)]?ui ,x??
这揭示了一个两步估计法,如下:
第一步:非参数法估计在?附近样本的E(yi|xi)和E(di|xi),例如,使用核回归。 第二步:用yi?E(yi|xi)对di?E(di|xi)回归,获得?d的估计量bd。
23
两步都只使用x?X??的样本,这里c标示?的邻域,在这邻域里,(??c,??c)X对Y的影响与d的相关性可以忽略。
Lee(p.33)也推荐了一种估计法,它的工作原理如下。定义EN(.|xi)是对
E(.|xi)的非参数估计,使用除观察i之外的所有样本(这类似于跨界有效思想
(cross-validation idea))。那么ATE 就是:
bd??{di?EN(d|xi)}{yi?EN(y|xi)}1[xi?X?]i?{di?EN(d|xi)}1[xi?X?]i2ii2{d?E(d|x)}1[x?X]?iNii?i22
AVar(bd)??{di?EN(d|xi)}[yi?EN(y|xi)?bd?{di?EN(d|xi)}1[xi?X?]2 5.4 前后估计(before-after)
事前事后估计法也可以看作是回归不连续设计。比如说,我们观察到两期的产出
yit---参与前时刻,参与后时刻。还有其他随时间变化的因素影响yit。但是如果这些
因素影响d的速度很慢,那么我们可以应用RDD来估计参与效应。它最简化的形式:
ATE??(yi1?yi0)
i?1N一个事前事后的例子是巨大冲击—如,飓风,洪灾,火灾—对人类福利效应的估
计。这种数据是自然实验的一个例子,这里“参与”是一种冲击。比如说,比较飓风前后的营养情况,来估计飓风对营养的效应。如果影响营养的其他时变(time-varying)因素在这个之间内没有大变化,那么这个效应是真实的。在实践中,这一点往往不能成立---例如,季节效应,或者如果我们研究的是没有冲击也会随年龄变化很快的小孩的营养。
6、 匹配法(Matching)
现在为止我们的焦点都在于对比可对比组。这就是为什么我们要把X划分为小单元或我们比较非常接近合格门槛?的样本。匹配法进一步推进了这个逻辑。
6.1面板数据
基于可观测因素选择的思想是控制变量X,X会影响产出和参与的可能性。在许多情况下,X向量可能非常大,而且我们不需要用所有必需的数据。还有,时间不变
24
(time-invariant)个体特性,它不能观察到却被人们认为或料想和参与有关。如果我们有面板数据,我们可能可以控制这些会影响产出和参与的时间不变的不可观察因素。
比如说,我们拥有面板数据,同一个体的参与随时间有所变化。这是有可能的,例如,由于参与是随时间分阶段进行的。或者因为参与(如,自然实验)是随时间变化的。假定个体i在t时的产出变量yit依赖于时变的可观测因素xit,时变参与?it,时间不变个体效应ui(它计算所有时不变个体特性的效应),以及干扰eit:
yit?xit????it??t?ui?eit
?xit????it???iDi??t?eit
i?1N这里如果个体是i则Di=1,其它情况则Di=0。令x标示(xit,D1,?DN)。那么,如果ATE.1’成立,而且x是这个扩展的x,命题18.1和,18.2成立。我们就可以用之前勾画了轮廓的方法来估计ATE和ATT。在回归分析情况下,这典型地牵涉到估计一
?是我们对ATE 的估计值。?个固定效应的模型。如前所述,如果我们只有两期t=0,t=1
的数据,模型可以用差分估计:
yi1?yi0?(xi1?xi0)??(?i1??i0)????(ei1?ei0) (6.1)
6.1.1 事件研究和差异中的差分(event studies and dif-in-dif)
首先假定我们只有参与者的样本。
进一步我们假设参与者只在1期接受参与,最后,假设??0。?i1?1,?i0?0;在这些假定下,方程(6.1)可以通过比较个体事前事后的产出来估计参与效应。这和“事前事后”估计法期望我们控制个体的固定效应是一样的道理。它是通过简单的计算两者的差异进行估计。为了解释它的原理,我们放弃方程(6.1)的以X为条件。我们马上就看到,参与效应?就是所有个体的产出均值之差yi1?yi0。
这种差分估计法的缺陷在于,它不允许我们控制住一个平常时间效应(common time effect)?。换句话说,识别参与效应依赖于严苛的假定??0。这个假定可以推出,只能在严格不存在平常时间效应的情况下,才可以用这个方法对参与者的数据进行评估。这就和事前-事后的假定基本相同了,也即,假定环境因素不会随时间有太大改变,所以我们可以合理地认为??0。
事件研究是这些估计法的很好解释。进行典型的事件研究时,研究者获得特定冲击的值,冲击发生后马上检验冲击的值—--如,新信息的披露。因为假定基本情况(fundamentals)不会明天就和今天不同,冲击之后瞬时的冲击值的变化就可以作为
25
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库第六讲政策效应评估(5)在线全文阅读。
相关推荐: