过Mill比率(Mill ration)方法直接修正选择偏差。这也需要工具变量。我们将会讨论这些方法如何应用在参与效应中。
现在,你对可信地估计参与效应的难度有了更深的了解,你可能从一开始就预想到了这些困难。下次政策制定者要求你协助评估一个项目,需要一个随机试验。在一个随机试验里,参与是在个体间随机安排的,而且收集了参与者(treated)和未参与者(untreated)的相应产出的信息。接受参与的个体称为参与者;其他称为控制组-或简称为controls。因而,通过构建随机试验,W和方程(1.1)误差项不相关了,随机化消除了基于不可观察因素的选择问题。
就算是随机试验,人们还是要小心解释结果。可以合理的预想,补贴培训项目帮助缺乏培训的人。但是它应该对不需要培训的人不产生影响(意味着忽视了一般均衡影响)。这意味着随机试验的结果并不一定适用于其他组。这个思想即后面讲到的参与者的参与效应(treatment effect on the treated),意思是说,只考虑那些接受参与的个体组的参与效应。
这里还存在参与的自选择问题,即。尽管有资格参与却拒绝参与。在这篇文献中,这个问题表述为“主动参与”问题或自选择参与:政策制定者想要关注那些有资格但却拒绝参与的特定个体。这是我们要讨论的另一个问题。
2、符号
既然已经以一个例子引出这一课程的主要问题,就让我们介绍一些符号。我们定义文献中的平均参与效应或ATE。在最简单的情况下,ATE 简单表示为:
ATE?E(y1?y0)
如前所述这里的Y1,Y0是参与和未参与的相应的产出变量,ATE是所有涉及人群的参与的平均收益。
文献也关注参与者的平均参与效应(Average treatment effect on the treated),伍德里奇标记为ATE1,我们就标记为ATT。,定义如下:
ATT?E[y1?y0|??1]
第一眼看过去,这个表达式看起来很无理,通过定义,我们不能观察到参与个体的Y0,因此以W=1为条件使Y0不可能观测到。这当然是真的:我们不能观察到参与者的Y0。但是我们可以寻求反事实(counter-factual)来得到Y0。ATT是要求出参与者由于参与,多获得多少Y。
为了说明ATE和ATT的区别,参考PROGRESSA的例子,二十世纪90年代后期墨西哥乡村引入的扶贫干预,从那时开始这个项目被许多拉丁美洲国家模仿。在PROGRESSA项目里,乡村人口依据他们的收入和健康情况被划分为合格(注:穷人)和不合格的住户,合格住户获得有条件的财政补助,而不合格住户什么都没有得到。因此在每个村子不是每个人都参与。ATE给出整个村子的平均参与效应-包括合格和不合格的住户。ATT给出参与者--就是说穷人的平均参与效应。在这种情形下,我们预期 ATT>ATE.
6
这些定义可以扩展到允许以协变量为条件。比如说X是协变量的向量,以X为条件的ATE和ATT:
ATE(x)?E(y1?y0|x)
ATT(x)?E(y1?y0|x,??1)
通过选择X,我们可以定义样本的子集的参与效应-如,女性或未受教育的人群。通过整合X 可以获得包含整个相关群体的ATE和ATT。举个例子,如果ATE(men)=a, ATE(women)=b,那么整个人群的ATE就是男性和女性ATE的平均值。 如之前提到的,估计ATE和ATT的困难在于我们不能观察到反事实:我们只能观察到同一个人的Y1,或者Y0,不能同时观察到两个。换言之,可观察到的结果就是:
y?(1??)y0??y1?y0??(y1?y0) (2.1)
那么我们怎么才能估计ATE和ATT呢?
第一种可能的方法就是W和(Y1,Y0)在统计上是独立的(注:随机实验)。不要搞混。这不表示W和(2.1)的Y是独立的,我们知道这也不可能发生。它的意思是:Y0,Y1的分布不依赖于一个人是否接受参与。例如:如果参与是随机分布的,则可以确保独立性。
独立性意味着,接受参与的可能性和参与的收益是独立的。在这种情况下,可以得出,ATE=ATT,因为E(y1?y0|??1)?E(y1?y0)。而且ATE可以简化为:
E(y|??1)?E(y1|??1) ( 由方程(2.1)得到)
?E(y1) (由独立性得到)
同样的
E(y|??0)?E(y0|??0)?E(y0)
从而得到:
ATE?ATT?E(y|??1)?E(y|??0)
通过从参与者的平均产出减去未参与者的平均产出可以得到平均参与效应。这表示,简单的随机试验可以简单的从均值之差获得无偏一致和渐近的估计平均参与效应。有时候这种方法被称为“差分”(dif)估计法,因为它取的是两个均值之差。 参与的随机化不是经常可以实现的。假设W和Y0相互独立,则结果是差分估计法的ATT,仍然是一致估计量。为了验证,我们这样写:
7
E(y|??1)?E(y|??0)?E(y1|??1)?E(y0|??0) ?E(y1|??1)?E(y0|??0)?E(y0|??1)?E(y0|??1)
?E(y0|??1)?E(y0|??0)?E(y1?y0|??1)现在如果W和Y0是相互独立的,我们可以得到
E(y0|?)?E(y0) (2.2)
上面方程的前两项消失了:差分估计量是ATT。
不幸的是条件(2.2)是一个强假设。如果个体可以决定是否参与,这些从参与中获利最多的人群会选择参与。这导致一个选择偏差,因为参与者比未参与者期望的Y0更低。在就业培训项目中,例如,挣得极少的人群更有可能加入就业培训。许多参与效应文献关注于参与这个原因的偏差。
定义?g?E(yg),这里g?{0,1} y0??0??0,y1??1??1 那么:
y1?y0?ATE?(?1??0) 以W=1条件,有
ATT?ATE?E(?1??0)
这里E(?1??0)是特定个人从参与中的获益。如果Y1-Y0和 W不独立,ATE和ATT一般情况下是不等同的。幸运的是,通常我们可以在比W与(Y0,Y1)相互独立更弱的假设下估计ATE和ATT。谈到这里我们现在跳转到下一章。
第二部分 基于可观测因素的选择/参与的无关性
参与效应评估方法可以分为两大类,只依赖于可观察因素或只依赖于不可观察产生的偏差。我们先看第一类。可观察因素偏差在文献中也叫做参与的无关性(Ignorability of treatment)。这个术语使人有点困惑——为什么大家都想忽略参与,因为这正是我们试图估计的东西。它基本的含义是:一旦我们以可观测因素为条件,参与不再和产出相关,因此我们忽略选择效应。
3.介绍 3.1假定
在文献中我们已经定义了两种类型的可观测偏差的假定。 假定1.(伍德里奇ATE.1):条件独立 以X为条件,W和(Y0,Y1)是独立的
8
假定2.(伍德里奇ATE.1’):条件均值独立性
E(y0x,w)?E(y0x),E(y1x,w)?E(y1x)
在绝大多数情况下,假定ATE.1’足够确保参与的无关性。假定ATE.1 w是x的一个决定性函数时成立,如:如果W=g(x)-那么就是“可观测选择”。这种情况下的问题在于,如果X也影响产出,我们需要在估计参与效应时控制X。如果X完全可以预测W,那么参与者和未参与者的X值就不会重叠(overlap)。结果是我们不能计算条件参与效应。
下面我来说明其中的道理。想象一下,个体当且仅当他们都是未受教育时才接受培训:未受教育可以完美的预测到参与。这里的问题就是:我只能估计到受教育者的Y0和未受教育者的Y1。那么我不能计算参与效应,因为我没有参与者的对照者的反事实。这暗指如果选择是纯粹由可观测因素决定的-那些可观测因素进入产出方程-那么我不能估计出参与效应。
为了得出参与效应,我们需要某些重叠,就是说,我们需要可观测因素不完全决定选择,例如,通过设定w=g(x,a) ,这里a独立于(x,y0,y1),a一个不可观察的,严格说来,已经不是“基于可观测因素的选择”,但是只要a独立于(x,y0,y1), 就满足ATE.1了。谨记的点是,要使ATE.1成立,a不能与(Y0,Y1)任意相关。语义的讨论解释了为什我们推荐“参与的无关性”而不是“基于可观测因素选择”。但是这个术语本身也是令人困惑的。最后,重要的不是我们应该使用那个术语,而是我们要明白这一假定的真正本质。
由ATE.1’我们可以得到:
ATT(x)?E(y1?y0|x,??1)
?E(y1?y0|x)?ATE(x)
但是无条件的情况不能以此类推。那么我们可以这样写
ATE?E[ATE(x)] ATT?E[ATE(x),??1]
如果参与者和一般个体有不同的X(如,贫穷和未受教育),那就不是上面这个结果了。
3.2 实验法 3.2.1随机实验法
随机实验的目的是确保产出和参与的独立性。因此ATE.1是成立的。因为参与是完全随机分配的,通过计算参与者和未参与者的平均产出差值,就可以得出一致估计
9
的ATE。甚至控制协变量都是不必要的-除非你想检验个体间的效应是否不同,在这种情况下,你可以参看ATE(x),即子群体的平均参与效应-如,女人,小孩,穷人。 近几年人们对随机实验法的兴趣按指数增长,以至于我有时感觉在经济学里只有引用随机实验法才能做实证。尽管这是绝对的夸大了,但随机实验法在近期是极度有影响势力的,特别是对于能简单了解到随机实验法用处的政策制定者来说,很有影响力。就因为如此,我认为随机试验将会越来越普及。 3.2.2 平衡和随机化方法
个体间参与的随机化,在原理上应该会导致参与者和控制组在各个角度看都是相似的。因此,如果我们观察每个个体的特性向量Zi,随机化可以保证:
E[z|??1]?E[z|??0]
这表示,一般情况下:
1NT?zi?i?T1zi (3.1) ?NCi?C这里T和C分别表示参与组和控制组。
我们马上可以想到,如果随机化质量不好,就会违背(3.1)。因此,如果参与组和控制组之间Zi的差别过大,就表示随机化过程出错了-如,政治力量的干预,选择的消弱(selective attrition),干预(干预政策)提供者的操纵。然而,有时由于机会的不同(as the result of chance),也可能引起Zi之间的差别。如果样本量很小,那么两组Zi区别过大的情况就特别容易出现,这种情况时常发生,因为典型随机化常常发生在乡村或社区级别,参与者和控制组的数量都很小。
正因如此,许多研究者会报告控制组和参与组之间的平衡统计量。---如,求出
1NT?zi和
i?T1NCi?C?zi之差的平均数,和t值。这很好。但是必须注意,我们预期部分
T统计量是显著的,例如:就算零假设是真的,具有5%的显著性的检验平均会产生5%的错误的拒绝。因此,说20个Zi变量应该平均有一个显著T统计值。这不是我们应该关注的原因,但是,20个变量中有一半在统计上的显著,应该是我们关注的原因。
尽管应该关注多少个变量的显著性还不清楚。如果Zi和产出相关,控制Zi在随后的分析中将可以消除偏差(参看基于可观测因素的选择)。这很容易实现。但是,因为不平衡,就表示参与者和控制组样本不是完全随机选择的,它表明,他们可能不具有完全的可对比性。这也会使得基于不可观察因素的选择问题出现的可能性增加,因此对实验法的结果产生怀疑。
诸如这些原因,研究者常常寻求方法,即通过选择满足初始平衡条件的参与组和控制组来确保平衡性。已经有很多种技术应用于实践中,主要的技术有:1.分层法(stratification);2.再随机化(re-randomization);3.配对匹配(pairwise matching)。它们都假定研究者在随机化之前收集了Zi的信息。
⊿分层法工作方式如下面所述。
10
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库第六讲政策效应评估(2)在线全文阅读。
相关推荐: