77范文网 - 专业文章范例文档资料分享平台

第六讲政策效应评估(3)

来源:网络收集 时间:2019-04-15 下载这篇文档 手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:或QQ: 处理(尽可能给您提供完整文档),感谢您的支持与谅解。点击这里给我发消息

假设说,我们有一个样本为2N的样本,我们希望把它们划分为两个相等的组,参与者和控制组。样本首先根据Zi的值被划分为个体或区间段。例如,假设Z包括性别和年龄,分层会要求将2N分为M组具有相同性别和年龄的组,然后随机的选取每组的一半个体参与参与,另外一半作为控制组。注意,分层影响标准差,所以分层法会影响干预(inference)。但是,修正标准差的方法是存在的。Stata可以执行这个修正 ,例如使用SVY命令。McKenzie进一步指出,在使用分层法时,研究者在随后的分析中应该包括每一层的虚拟变量。

⊿再随机化的工作方式如下:

(1)将2N样本随机抽取一半作为参与者,另一半作为控制组;(2)计算所有的Zi的t统计量;(3)如果所有(或一小部分)t统计量不是显著的,继续这个随机化;否则回到第(1)步;直到找到可以所有Zi通过平衡性检验,再随机化才结束。这个方法在实践中应用很少。它的问题在于,很难对在随机化过程中的标准误进行修正。大部分研究者在操作时忽略修正这个难题。

⊿配对匹配法工作方式如下面所述:

(1)把2N样本划分为具有相似特性的N对;(2)使每一对中的一个随机进入参与组,另一个进入控制组。这个方法也保证了平衡性。McKenzie认为,用这个方法获得有效干预的最简单的方法,就是在随后的分析中使用配对虚拟变量。但问题是,如何把样本配对。操作时,我们需要测量样本间的“相似性”标准。有一种标准就是Mahalanobis 距离测量法。

Mahalanobis 距离是这样计算的。假设说特性向量Z,我们构建计算Z的差距: ||zi?zj||?((zi?zj)V(zi?zj))'12

这里V是一个合适权重矩阵。对矩阵V来说,我们可以使用特性Z的方差的对角线的逆矩阵。在这种情况下,矩阵V通过它的标准差对Z进行标准化。两个样本的距离就是标准化协变量的差值的绝对值的加总。另一种方法就是使V?S,这里S是特性变量Z的协方差矩阵。得出的距离就称为Mahalanobis公制(metric)。 有了这个距离测量法后,我们构建匹配对(pair):(1)随机选择个体i;(2)找到最接近的j,构成匹配对(i,j);(3)除非所有的2N个体都配对成功,否则放弃匹配对(i,j),回到(1)。这叫做最近邻居匹配法。这个方法我将会在后面的文章里讨论。

?13.2.3 自然实验法

随机实验法的组织费用很高,需要花费很大一笔钱财。在许多情况下也会出现伦理问题。例如。,进行以下试验就违背伦理:毁灭某些学校,来研究其对教育和今后收入的影响。相似地,随机选取去越南打仗的人,其他人待在美国,同样地违背伦理。 幸运的是,这种实验有时是自然发生的。例如:想想看,台风或地震毁坏了某些村子的学校,或多或少是随机的,而其他邻近且非常相似的社区的学校却依然挺立。对比由人控制的实验法—受控实验法(controlled experiment)这些实验被称为自然试验。

人们有时也进行非控制的试验(uncontrolled)。一些在参与效应方面最有权威的论

11

文利用了诸如准-实验法(quasi-experiment)的优点。下面是一些例子。(参看Angrist ,Krueger 2001,表1是其它的例子)

Angrist(1990),使用越南战争期间使用的美国军队应征抽奖号码,来鉴定无意识的参军对今后收入的影响。

Angrist,Krueger(1991)使用出生时间作为教育时间的工具变量-在12月31日之前出生的孩子法律允许他比那些在12月31日之后出生的孩子早离开学校一年。12月31日是美国小学的入学截止日期(cutoff date)。所以出生时间可以用作衡量教育的回报。 Fisman从股票市场的数据中,使用Suharto终止来鉴定由crony运作的公司。La Ferrara 同样使用Savimbi来鉴定与贸易战争(war diamonds)有牵连的公司。

其他的准实验的例子包括学生宿舍的分配(检验同龄人效应-许多大学是随机分配的。);中奖者和意外的遗产(在公司投资中用来检验信用约束);签证/绿卡抽奖(用来估计从国际移民得到的经济回报)。 3.2.4顺从性和污染性

在实验中有些事不能严格的按照计划进行是很正常的。例如,在控制组的个体,可能在研究者进行的实验之外的场合,接受参与(Manski 1996)。换句话说,某些未参与者却也是参与的。这就叫做“污染”(contamination)。例如。在医药实验时就会发生污染,如安慰剂(placebo)的服用者会自己在网上获得药物。这种污染对参与组和控制组之间的显著差异会产生偏差。这意味着参与效应被低估了。但是,如果在污染存在的情况下参与仍然显著,这常常就是说明参与效应比报告的效应还要强。

负的污染也是有可能发生的。Chris Woodruff提到这样一种情况。在他的实验里,Chris 为斯里兰卡的小公司提供资金赞助。在一个部门-竹子家具-资金赞助的接受者用它购买所有的竹子原料,把它的竞争对手赶出市场。在这种情况下来比较参与和未参与的效应,是高估了参与的效应。

同样也有可能个体会拒绝提供的参与。在医药实验里,某些参与者可能不服用药物。在经济实验里,一些人可能有机会参加职业培训,但不能好好利用它。在文献里,这些问题叫做顺从性(compliance)问题。有时“顺从性”指的是两个问题都有的情况---如,参与者把一些参与漏给控制组。

在不顺从的情况下,通过对比参与者和控制组来检验主动参与(intent to treat)的效应还是可行的。不测量参与本身,却测量干预的效应。某些情况下,这可能比测量参与效应还要好。说明一下,想象政策制定者考虑介绍一个职业培训项目,但是他们知道,不是所有的个体都是他们的培训目标,然而同时,他们意识到就算没有这个项目,某些个体也参加私人组织的培训。在其他各点都相同的情况下,很明显,控制组和参与组之间的差别,比参与者和未参与者的差别要小:一些控制者接受了参与,一些合格的参与者拒绝参与。因此,仅仅比较资格者和控制组,低估了参与效应,但它缩小了对目标人群的政策效应。在这个情况下,评估主动参与(intent-to-treat)的效应,在某种程度上是对政策参与者参与效应的较好的测量。

但这并不总是成立。在近期的一篇论文里,Van de Walle描述了一个道路修复工程的评估。世界银行提供资金给越南政府给贫穷山村修路。其他的乡村不会从世界银行获得资助,也就意味着,只能作为道路修复工程对经济增长和福利水平提高的控制

12

组。如Van de Walle描述,越南政府简单地把参与组省下的资金,重新分配给控制乡村。这表示控制乡村最后得到了和参与组一样多的道路修复资金。在这种极度污染的情况下,我们能发现两组的产出有显著的差异,这是令人诧异的3。

从这个例子我们可以学到两点。第一,它教给我们,不能天真的认为控制组不会获得参与---而且进行实验的人(政府,NGO)会成功的抵制住压力来参与控制组。第二,在这个实验里,主动参与的方法不管用,因为干预取代了对控制组的资金支持。对比控制组和参与组不能得到任何证据,以了解如果我们把干预推广,会发生什么事情。这个例子说明,这个方法在什么情况下是不管用的。

3.2.5 双盲(double-blind),安慰剂效应(placebo effect),霍桑效应(Hawthorne effect),响应偏差(response bias)

在医药实验里,在参与组和控制组之间设定双盲装置的贯常方法,不能区别他们属于哪个组。通过给控制组提供一个安慰剂就可以解决,如。糖药片或水注射液。执行参与的人(护士)必须对她用的是安慰剂还是真药不知情---否则她可能会走漏消息。这就是所谓的双盲(double-blind):病人和护士都不知道他们用的是什么药。

接受安慰剂的病人比什么都没用的病人康复更好,这常常发生。为什么会这样还不清楚。但是可能与错误报告或精神-肉体效应(psycho-somatic effect)有关。病人相信他们使用的是真药,因此相信他们能从中获得益处,而错误地报告他们的情况,这就发生了响应偏差。如果“某些事正在作用”于病患的信念,改善了病人的免疫系统,你就是产生了精神-肉体效应。这种效应经常被称为安慰剂效应。加入安慰剂参与的目的,是从参与的化学效应中净除精神-肉体效应。

“霍桑效应”是用来描述实验中另一种形式的扭曲。在19世纪30年代,芝加哥的霍桑工作室(Hawthorne works)进行各种各样的实验,检验照明条件的变化对工人生产率的影响。研究者们发现,改善的照明条件提高了生产率,而且建议提供更好的照明条件。这个结论随后遭到人们的批评,因为它没有意识到,工人可能会觉得在研究者的观察下,他们会更加努力工作。乃至于,Hawthorne效应现在普遍用于描述这样一种情形:在一个实验里能发现参与效应,仅仅是因为实验条件本身导致产出/行为的变化。其他形式的响应偏差,发生在调查对象希望通过回答他们察觉到的问题来帮助研究者。减小响应偏差的一种方法是避免“引导”问题,即避免调查对象知晓研究的目的。

在医药实验(和其它实验)里,这些词条很容易理解。但是他们也开始影响经济研究者的思想。可能在干预具有使调查者偏向于放大他们从中获得的收益的“暖光”(warm glow)效应时,出现Hawthorne效应。因此,经济研究者开始对从主观的调查者身上推断的参与效应产生怀疑,除非它们(参与和收益)之间的联系足够模糊不清(使调查者不清楚研究者的目的)—例如,通过设计质询----介于参与的相关问题和从参与得到的收益的相关问题之间。如果控制组只是因为他们被调查而改变他们的行为或产出——例如,因为他们觉得某些人关心他们的近况,那么就会出现安慰剂效应。一些控制实验也引入安慰剂参与来净除其它干预操作可能借助的渠道。但是在社

13

会科学中,设置一个确实令人信服的安慰剂参与很困难。(顺便说一句,在医药实验里这也是困难的,因为病人常常通过其它资源获得信息来确认他们在哪个组。)

设想一个经济或政策实验,这些顾虑已经引导研究者寻找确认人口普查员(enumerator)不知道他们要研究的确切目标---因此不会引起鼓励调查者错误地陈述不同的产出估计。这个方法也不总能实现,因为研究者的时间有限,等等原因。底线是,希望执行受控实验的人,必须严格注意把错误的报告或安慰剂效应导致的偏差最小化。

3.2.6 内部有效性和外部有效性

我们已经知道,建议一个避免偏差的实验是很困难的。如果能找到这样的实验法,它会获得研究总体正确的参与效应,我们就说是内部有效的。接下来的问题是:这个估计结果告诉我们什么?即另外的人群,或在不同时间的同一人群接受同样的参与可能得到参与效应是什么?这个问题称为外部有效性。

为什么参与可能对同一人群具有效应,但是对另外的人群却没有效应的原因很多。Deaton(2009)提到一个案例,治疗关节炎的药物对年龄20-65岁的个体是非常有效的。但是对65岁以上的个体却有很大的负作用,最后实验必须取消,因为它的坏处多过好处。据推测,医药实验在更年轻的人群中进行,因为让他们加入实验更容易。但是他们和关节炎患者的目标人群相差很远,他们主要是年纪更长者。

实验室实验常常因为缺乏外部有效性而被人批判。许多这样的实验都是由大学生带领的,这些大学生常常是学习经济学的。这个人群不能代表一般人群。要解决这个问题,研究者必须开始把实验室实验带到实验室之外的领域,设计模仿以计算机为基础的实验室实验的议定书。这样的实验室实验已经在儿童,非洲农民,猎犬收集者等等这样的领域进行。

尽管在这些领域进行实验室实验,实验室实验看起来是作假的或谋划的,不是真实的生活状态,从这个意义上说,它常常是“奇怪的”。这导致关于它们的外部有效性的关注:在游戏情形下,人们的反应可能会与生活情形下不同。研究者常常寻求通过变换实验框架来研究这种可能性——如,一些参与是简洁的短语而有些参与是有内容的。框架效应经常会出现。研究者常常提供给参与者足够大的利益,来引导“严肃”的行为。显然,这个方法在穷人中实行更容易达到目标。

随机化领域实验法(field experiment)并不时常会遇到这些问题。但是这样就表示它们的外部有效性就有保证了?不是。实验室实验法几乎总是关注于程式化(stylized)刺激的“纯”人类行为反应,而领域实验法一般是解决政策干预问题的。除了研究者对实验的控制比实验室实验法要少之外,实验对象对给定刺激的特定行为反应也更少具有直接的指示性。干预可以触发多种不同的行为反应,其中一些没有测量或不能测量。考虑到这个问题,确定通过什么样的行为或自然法则(physical)途径来获得参与效应常常是有困难的。没有这些信息,领域实验就不能清楚地告诉我们,在其它情况下参与是怎样影响人的行为的。

还有其它影响外部有效性的问题。例如,在没有研究者监督下,干预的质量可能会下降。可能还会出现其它一般均衡效应---如,某个国家可能没有进行大规模的干预,又或者只有小部分人可以从干预中获得收益(如,提供工作受训建议)。如果每个人

14

都受到了同样的干预,干预的效果可能会显著下降。

以上的评论主要应用于“简化-形式”(reduced-form)参与效应分析,即研究者对外部变化W对产出Y的效应进行简单的记载。如果扩大干预范围,没有W是如何影响Y的信息,我们就不知道在另一人群里W是怎么影响Y的。因此,如果我们能从领域实验里知道些什么信息,那些信息是不清晰的。在这样的观察背后,存在一个非常普遍的事实,叫做我们预测未来的能力---也就是说,预测Y是如何被还没有发生的干预影响的—最终依赖于我们选取的模型,这些模型具有各种不同的影响产出Y的过程。这个模型可能不明显或就藏在我们的脑袋里。但是只有以模型为基础,我们才可以做预测。模型越好,预测就越准。所以领域实验只有在它能告诉我们隐含在模型之下的信息,帮助我们来重新定义这个模型的时候才有用。因此,那些纯简化形式的领域实验,因为没有告诉我们任何关于人的行为的信息,最终对于做预测和政策建议是无用的。经济学的科学过程,就像其他科学一样,不能在没有理论的支持的情况下进行。(也不需要一定是标准的经济学理论。)

难道这就意味着领域实验法没用?不尽然。这只意味着这些具有外部有效性的提供信息的领域实验,最终揭示了一些关于人类行为的有趣的事情。实践中,这意味着这些领域实验是实验室实验和标准领域实验的混合:他们模仿真实生活中的干预,因此不会受到人为造作引起的偏差;但是他们是设计用来检验关于人类行为假说的。这些假说可能来自于标准经济理论,或来自于行为心理学—或两者都有。但是他们都是对刺激和激励的行为反应。在List和Karlan的著作里有这个方法的很好例子。

4、估计

现在在无关性假定成立的前提下,我们讨论参与效应的评估。通过联合ATE.1’和(2.1),我们可以构建一个简单的对应不同X值的ATE(x)的估计。这些估计可以获得ATE和ATT。

E(y|x,?)?E(y0|x,?)??[E(y1|x,?)?E(y0|x,?)]

?E(y0|x)??[E(y1|x)?E(y0|x) ?E(yO|x)??ATE(x)

上式可变换为:

ATE(x)?E(y1|x)?E(y0|x)

?E(y1|x,??1)?E(y0|x,??0)

通过计算Y1和Y0的条件均值,我们可以计算出ATE。

4.1 非参数法

如果我们的样本够大,X的值不多,我们可以把数据分为几个部分,计算每一个部分的参与和未参与样本均值,就可以得到每一个ATE(x)一致估计值。得到ATE和

15

百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库第六讲政策效应评估(3)在线全文阅读。

第六讲政策效应评估(3).doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印 下载失败或者文档不完整,请联系客服人员解决!
本文链接:https://www.77cn.com.cn/wenku/zonghe/596634.html(转载请注明文章来源)
Copyright © 2008-2022 免费范文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ: 邮箱:tiandhx2@hotmail.com
苏ICP备16052595号-18
× 注册会员免费下载(下载后可以自由复制和排版)
注册会员下载
全站内容免费自由复制
注册会员下载
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: