77范文网 - 专业文章范例文档资料分享平台

计量经济学:一元线性回归模型和多元线性回顾模型习题以及解析

来源:网络收集 时间:2018-10-28 下载这篇文档 手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:或QQ: 处理(尽可能给您提供完整文档),感谢您的支持与谅解。点击这里给我发消息

例6.对于人均存款与人均收入之间的关系式St????Yt??t使用美国36年的年度数据得如下估计模型,括号内为标准差:

??384.105?0.067YStt(151.105)R2

(0.011)

??19.092 3=0.538 ?(1)?的经济解释是什么?

(2)?和?的符号是什么?为什么?实际的符号与你的直觉一致吗?如果有冲突的话,你可以给出可能的原因吗?

(3)对于拟合优度你有什么看法吗?

(4)检验是否每一个回归系数都与零显著不同(在1%水平下)。同时对零假设和备择假设、检验统计值、其分布和自由度以及拒绝零假设的标准进行陈述。你的结论是什么?

解答:

(1)?为收入的边际储蓄倾向,表示人均收入每增加1美元时人均储蓄的预期平均变化量。

(2)由于收入为零时,家庭仍会有支出,可预期零收入时的平均储蓄为负,因此?符号应为负。储蓄是收入的一部分,且会随着收入的增加而增加,因此预期?的符号为正。实际的回归式中,?的符号为正,与预期的一致。但截距项为负,与预期不符。这可能与由于模型的错误设定形造成的。如家庭的人口数可能影响家庭的储蓄形为,省略该变量将对截距项的估计产生影响;另一种可能就是线性设定可能不正确。

(3)拟合优度刻画解释变量对被解释变量变化的解释能力。模型中53.8%的拟合优度,表明收入的变化可以解释储蓄中53.8 %的变动。

(4)检验单个参数采用t检验,零假设为参数为零,备择假设为参数不为零。双变量情形下在零假设下t 分布的自由度为n-2=36-2=34。由t分布表知,双侧1%下的临界值位于2.750与2.704之间。斜率项计算的t值为0.067/0.011=6.09,截距项计算的t值为384.105/151.105=2.54。可见斜率项计算的t 值大于临界值,截距项小于临界值,因此拒绝斜率项为零的假设,但不拒绝截距项为零的假设。

三、习题

6

(一)基本知识类题型 2-1.解释下列概念: 1) 总体回归函数 2) 样本回归函数 3) 随机的总体回归函数 4) 线性回归模型

5) 随机误差项(ui)和残差项(ei) 6) 条件期望 7) 非条件期望 8) 回归系数或回归参数 9) 回归系数的估计量 10) 最小平方法

2-2.判断正误并说明理由:

1) 随机误差项ui和残差项ei是一回事

2) 总体回归函数给出了对应于每一个自变量的因变量的值 3) 线性回归模型意味着变量是线性的

4) 在线性回归模型中,解释变量是原因,被解释变量是结果 5) 随机变量的条件均值与非条件均值是一回事

2-3.回答下列问题:

1) 线性回归模型有哪些基本假设?违背基本假设的计量经济学模型是否就不可估计? 2) 总体方差与参数估计误差的区别与联系。 3) 随机误差项ui和残差项ei的区别与联系。

4) 根据最小二乘原理,所估计的模型已经使得拟合误差达到最小,为什么还要讨论模型的

拟合优度问题?

5) 为什么用决定系数R2评价拟合优度,而不用残差平方和作为评价标准? 6) R2检验与F检验的区别与联系。 7) 回归分析与相关分析的区别与联系。

7

11) 最大似然法 12) 估计量的标准差 13) 总离差平方和 14) 回归平方和 15) 残差平方和 16) 协方差 17) 拟合优度检验 18) t检验 19) F检验

8) 最小二乘法和最大似然法的基本原理各是什么?说明它们有何区别? 9) 为什么要进行解释变量的显著性检验?

10) 是否任何两个变量之间的关系,都可以用两变量线性回归模型进行分析?

2-2.下列方程哪些是正确的?哪些是错误的?为什么?

t?1,2,?,n ⑴ yt????xtt?1,2,?,n ⑵ yt????xt??t?x?????⑶ yt??tt?x??????t??⑷ ytt?x???⑸ yt??t?x????t??⑹ yt?x??????t⑺ yt??t?x??????t?t??⑻ ytt?1,2,?,n t?1,2,?,n t?12,,?,n t?12,,?,n

t?1,2,?,n t?1,2,?,n

其中带“^”者表示“估计值”。

2-3.下表列出若干对自变量与因变量。对每一对变量,你认为它们之间的关系如何?是正的、负的、还是无法确定?并说明理由。

因变量 GNP 个人储蓄 小麦产出 美国国防开支 棒球明星本垒打的次数 总统声誉 学生计量经济学成绩 日本汽车的进口量 利率 利率 降雨量 前苏联国防开支 其年薪 任职时间 其统计学成绩 美国人均国民收入 自变量

(二)基本证明与问答类题型

2-4.对于一元线性回归模型,试证明: (1)E(yi)????xi (2)D(yi)??

8

2(3)Cov(yi,yj)?0 i?j

2-5.参数估计量的无偏性和有效性的含义是什么?从参数估计量的无偏性和有效性证明过程说明,为什么说满足基本假设的计量经济学模型的普通最小二乘参数估计量才具有无偏性和有效性?

2-6.对于过原点回归模型Yi??1Xi?ui ,试证明

Var(?1)?2-7. 试证明: (1)(2)(3)

??u2?Xi2

?ei?0,从而:e?0 ?0

?0;即残差ei与Yi的估计值之积的和为零。

?exiii?i?eY2

2-8.为什么在一元线性方程中,最小二乘估计量与极大似然估计量的表达式是一致的?证

1n?2明:σ的ML估计量为????i ,并且是有偏的。

ni?12~2-9.熟悉t统计量的计算方法和查表判断。

2-10.证明:R?(ryx) ;其中R2是一元线性回归模型的判定系数,ryx是y与x的相关

22系数。

2-11. 试根据置信区间的概念解释t检验的概率意义,即证明:对于显著性水平α,当

ti?t?时,bi的100(1-α)%的置信区间不包含0。

22-12.线性回归模型

yt????xt??tt?1,2,?,n

1的0均值假设是否可以表示为

n??t?1nt?0?为什么?

2-13.现代投资分析的特征线涉及如下回归方程:rt??0??1rmt?ut;其中:r表示股票或债券的收益率;rm表示有价证券的收益率(用市场指数表示,如标准普尔500指数);t表示时间。在投资分析中,β1被称为债券的安全系数β,是用来度量市场的风险程度的,即市场的发展对公司的财产有何影响。依据1956~1976年间240个月的数据,Fogler和Ganpathy得到IBM股票的回归方程;市场指数是在芝加哥大学建立的市场有价证券指数:

9

rt?0.7264?1.0598rmt r2?0.4710

(0.3001) (0.0728)

要求:(1)解释回归参数的意义;(2)如何解释r2?(3)安全系数β>1的证券称为不稳定证券,建立适当的零假设及备选假设,并用t检验进行检验(α=5%)。 2-14. 已知模型Yi????xi?ui,证明:估计量α可以表示为:??????(n?xW)y 这

iii?1n1里Wi?xi?xi?

22-15.已知两个量X和Y的一组观察值(xi,yi),i=1,2,?,n。 证明:Y的真实值和拟合值有共同的均值。

2-16.一个消费分析者论证了消费函数Ci?a?bYi是无用的,因为散点图上的点(Ci,Yi)不在直线Ci?a?bYi上。他还注意到,有时Yi上升但Ci下降。因此他下结论:Ci不是Yi的函数。请你评价他的论据(这里Ci是消费,Yi是收入)。

2-17.证明:仅当R2=1时,y对x的线性回归的斜率估计量等于x对y的线性回归的斜率估计量的倒数。

?Sx2-18.证明:相关系数的另一个表达式是:r?? 其中?为一元线性回归模型一次项

Sy?系数的估计值,Sx、Sy分别为样本标准差。

2-19.对于经济计量模型:Yi?b0?b1Xi?ui ,其OLS估计参数b1的特性在下列情况下会受到什么影响:(1)观测值数目n增加;(2)Xi各观测值差额增加;(3)Xi各观测值近似相等;(4)E(u2)=0 。

2-20.假定有如下的回归结果:Yt?2.6911?0.4795Xt,其中,Y表示美国的咖啡的消费量(每天每人消费的杯数),X表示咖啡的零售价格(美元/杯),t表示时间。 要求:

(1)这是一个时间序列回归还是横截面序列回归?做出回归线; (2)如何解释截距的意义,它有经济含义吗?如何解释斜率? (3)能否求出真实的总体回归函数?

? 10

第二章 经典单方程计量经济学模型:一元线性回归模型

一、内容提要

本章介绍了回归分析的基本思想与基本方法。首先,本章从总体回归模型与总体回归函数、样本回归模型与样本回归函数这两组概念开始,建立了回归分析的基本思想。总体回归函数是对总体变量间关系的定量表述,由总体回归模型在若干基本假设下得到,但它只是建立在理论之上,在现实中只能先从总体中抽取一个样本,获得样本回归函数,并用它对总体回归函数做出统计推断。

本章的一个重点是如何获取线性的样本回归函数,主要涉及到普通最小二乘法(OLS)的学习与掌握。同时,也介绍了极大似然估计法(ML)以及矩估计法(MM)。

本章的另一个重点是对样本回归函数能否代表总体回归函数进行统计推断,即进行所谓的统计检验。统计检验包括两个方面,一是先检验样本回归函数与样本点的“拟合优度”,第二是检验样本回归函数与总体回归函数的“接近”程度。后者又包括两个层次:第一,检验解释变量对被解释变量是否存在着显著的线性影响关系,通过变量的t检验完成;第二,检验回归函数与总体回归函数的“接近”程度,通过参数估计值的“区间检验”完成。

本章还有三方面的内容不容忽视。其一,若干基本假设。样本回归函数参数的估计以及对参数估计量的统计性质的分析以及所进行的统计推断都是建立在这些基本假设之上的。其二,参数估计量统计性质的分析,包括小样本性质与大样本性质,尤其是无偏性、有效性与一致性构成了对样本估计量优劣的最主要的衡量准则。Goss-markov定理表明OLS估计量是最佳线性无偏估计量。其三,运用样本回归函数进行预测,包括被解释变量条件均值与个值的预测,以及预测置信区间的计算及其变化特征。

二、典型例题分析

例1、令kids表示一名妇女生育孩子的数目,educ表示该妇女接受过教育的年数。生育率对教育年数的简单回归模型为

kids??0??1educ??

1

(1)随机扰动项?包含什么样的因素?它们可能与教育水平相关吗?

(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。 解答:

(1)收入、年龄、家庭状况、政府的相关政策等也是影响生育率的重要的因素,在上述简单回归模型中,它们被包含在了随机扰动项之中。有些因素可能与增长率水平相关,如收入水平与教育水平往往呈正相关、年龄大小与教育水平呈负相关等。

(2)当归结在随机扰动项中的重要影响因素与模型中的教育水平educ相关时,上述回归模型不能够揭示教育对生育率在其他条件不变下的影响,因为这时出现解释变量与随机扰动项相关的情形,基本假设4不满足。

例2.已知回归模型E????N??,式中E为某类公司一名新员工的起始薪金(元),N为所受教育水平(年)。随机扰动项?的分布未知,其他所有假设都满足。

(1)从直观及经济角度解释?和?。

?满足线性性、无偏性及有效性吗?简单陈述理由。 ?和?(2)OLS估计量?(3)对参数的假设检验还能进行吗?简单陈述理由。 解答:

(1)???N为接受过N年教育的员工的总体平均起始薪金。当N为零时,平均薪金为?,因此?表示没有接受过教育员工的平均起始薪金。?是每单位N变化所引起的E的变化,即表示每多接受一年学校教育所对应的薪金增加值。

?满足线性性、无偏性及有效性,因为这些性质的的成立无需?和仍?(2)OLS估计量?随机扰动项?的正态分布假设。

(3)如果?t的分布未知,则所有的假设检验都是无效的。因为t检验与F检验是建立在?的正态分布假设之上的。

例3、在例2中,如果被解释变量新员工起始薪金的计量单位由元改为100元,估计的截距项与斜率项有无变化?如果解释变量所受教育水平的度量单位由年改为月,估计的截距项与斜率项有无变化? 解答:

首先考察被解释变量度量单位变化的情形。以E*表示以百元为度量单位的薪金,则

2

E?E*?100????N??

由此有如下新模型

E*?(?/100)?(?/100)N?(?/100)

或 E*??*??*N??*

这里?*??/100,?*??/100。所以新的回归系数将为原始模型回归系数的1/100。 再考虑解释变量度量单位变化的情形。设N*为用月份表示的新员工受教育的时间长度,则N*=12N,于是

E????N??????(N*/12)??

或 E???(?/12)N*??

可见,估计的截距项不变,而斜率项将为原回归系数的1/12。

例4、对没有截距项的一元回归模型

Yi??1Xi??i

称之为过原点回归(regrission through the origin)。试证明

(1)如果通过相应的样本回归模型可得到通常的的正规方程组

?e?0

?eX?0iii 则可以得到?1的两个不同的估计值:

~???XY??1?YX, ??ii1??X?。

2i?均为无偏估计量。 (2)在基本假设E(?i)?0下,?1与?1~~?X通常不会经过均值点(X,Y),但拟合线Y??? (3)拟合线Y??1X则相反。 1?是?的OLS估计量。 (4)只有?11解答:

(1)由第一个正规方程

~?et?0得

或 求解得

~(Y???t1Xt)?0 ~Y???t1?Xt

?1?Y/X

3

~

由第2个下规方程

?Xt?X)?0得 (Yt??1t

?XYtt2???1?Xt

??(求解得 ?1~?XY)/(?Xtt2t)

(2)对于?1?Y/X,求期望

11~E(?1)?E(YX)?E[(?1Xt??t)]Xn?X1 ?[E{1t)?E(?t)]

XnX??1??1X这里用到了Xt的非随机性。

??( 对于?1?XY)/(?Xtt2t),求期望

?)?E(XY/X2)E(??tt?t1?(?(11)E(XY)?()E[Xt(?1Xt??t)]tt2?2?XX?t?t112)?(X)?()XtE(?t)??11?t22?XX?t?t

?X??X必须等于Y。但??X通过点(X,Y),????(3)要想拟合值Y111?XY?Xt2ttX,

?X上。 ???通常不等于Y。这就意味着点(X,Y)不太可能位于直线Y1???X经过点(X,Y)。 相反地,由于?1X?Y,所以直线Y1(4)OLS方法要求残差平方和最小

Min RSS?~~?e2t?X)2 ??(Yt??1t?求偏导得 关于?1

?RSS?X)(?X)?0 ?2?(Yt??1tt???1即

?Xt?X)?0 (Yt??1t???XY???ii1

??X?

2i4

?是OLS估计量。 可见?1例5.假设模型为Yt????Xt??t。给定n个观察值(X1,Y1),(X2,Y2),?,

(Xn,Yn),按如下步骤建立?的一个估计量:在散点图上把第1个点和第2个点连接起来

并计算该直线的斜率;同理继续,最终将第1个点和最后一个点连接起来并计算该条线的斜

?,即?的估计值。 率;最后对这些斜率取平均值,称之为??的几何表示并推出代数表达式。 (1)画出散点图,给出??的期望值并对所做假设进行陈述。这个估计值是有偏的还是无偏的?解(2)计算?释理由。

(3)证明为什么该估计值不如我们以前用OLS方法所获得的估计值,并做具体解释。 解答:

(1)散点图如下图所示。

(X2,Y2) (Xn,Yn)

(X1,Y1)

首先计算每条直线的斜率并求平均斜率。连接(X1,Y1)和(Xt,Yt)的直线斜率为

(Yt?Y1)/(Xt?X1)。由于共有n-1条这样的直线,因此

1t?nYt?Y1???] ?[n?1t?2Xt?X1(2)因为X非随机且E(?t)?0,因此

E[Yt?Y1(???Xt??t)?(???X1??1)???1]?E[]???E[t]??

Xt?X1Xt?X1Xt?X1这意味着求和中的每一项都有期望值?,所以平均值也会有同样的期望值,则表明是无偏的。

(3)根据高斯-马尔可夫定理,只有?的OLS估计量是最付佳线性无偏估计量,因此,

?的有效性不如?的OLS估计量,所以较差。 这里得到的?

5

(4)根据需求的价格弹性定义:弹性=斜率×(X/Y),依据上述回归结果,你能求出对咖啡需求的价格弹性吗?如果不能,计算此弹性还需要其他什么信息? (三)基本计算类题型

2-21.下面数据是对X和Y的观察值得到的。 ∑Yi=1110; ∑Xi=1680; ∑XiYi=204200 ∑Xi2=315400; ∑Yi2=133300

假定满足所有的古典线性回归模型的假设,要求:(1)b1和b2?(2)b1和b2的标准差?(3)r2?(4)对B1、B2分别建立95%的置信区间?利用置信区间法,你可以接受零假设:B2=0吗?

2-22.假设王先生估计消费函数(用模型Ci?a?bYi?ui表示),并获得下列结果:

Ci?15?0.81Yi,n=19

(3.1) (18.7) R2=0.98 这里括号里的数字表示相应参数的T比率值。

要求:(1)利用T比率值检验假设:b=0(取显著水平为5%);(2)确定参数估计量的标准方差;(3)构造b的95%的置信区间,这个区间包括0吗?

2-23.下表给出了每周家庭的消费支出Y(美元)与每周的家庭的收入X(美元)的数据。

每周收入(X) 80 100 120 140 160 180 200 220 240 260 每周消费支出(Y) 55,60,65,70,75 65,70,74,80,85,88 79,84,90,94,98 80,93,95,103,108,113,115 102,107,110,116,118,125 110,115,120,130,135,140 120,136,140,144,145 135,137,140,152,157,160,162 137,145,155,165,175,189 150,152,175,178,180,185,191 ? 要求:

(1)对每一收入水平,计算平均的消费支出,E(Y︱Xi),即条件期望值; (2)以收入为横轴、消费支出为纵轴作散点图; (3)在散点图中,做出(1)中的条件均值点;

(4)你认为X与Y之间、X与Y的均值之间的关系如何?

(5)写出其总体回归函数及样本回归函数;总体回归函数是线性的还是非线性的?

11

2-24.根据上题中给出的数据,对每一个X值,随机抽取一个Y值,结果如下:

Y X 70 80 65 100 90 120 95 140 110 160 115 180 120 200 140 220 155 240 150 260 要求:

(1)以Y为纵轴、X为横轴作图,并说明Y与X之间是怎样的关系? (2)求样本回归函数,并按要求写出计算步骤;

(3)在同一个图中,做出样本回归函数及从上题中得到的总体回归函数;比较二者相同吗?为什么?

2-25.下表给出了1990~1996年间的CPI指数与S&P500指数。

年份 1990 1991 1992 1993 1994 1995 1996 CPI 130.7 136.2 140.3 144.5 148.2 152.4 159.6 S&P500指数 334.59 376.18 415.74 451.41 460.33 541.64 670.83 资料来源:总统经济报告,1997,CPI指数见表B-60,第380页;S&P指数见表B-93,第406页。

要求:(1)以CPI指数为横轴、S&P指数为纵轴做图;

(2)你认为CPI指数与S&P指数之间关系如何?

(3)考虑下面的回归模型:(S&P)t?B1?B2CPIt?ut,根据表中的数据运用OLS估计上述方程,并解释你的结果;你的结果有经济意义吗?

2-26.下表给出了美国30所知名学校的MBA学生1994年基本年薪(ASP)、GPA分数(从1~4共四个等级)、GMAT分数以及每年学费的数据。

学校

Harvard Stanford Columbian Dartmouth Wharton Northwestern Chicago MIT Virginia UCLA

ASP/美元 102630 100800 100480 95410 89930 84640 83210 80500 74280 74010

GPA 3.4 3.3 3.3 3.4 3.4 3.3 3.3 3.5 3.2 3.5

GMAT 650 665 640 660 650 640 650 650 643 640

学费/美元 23894 21189 21400 21225 21050 20634 21656 21690 17839 14496

12

Berkeley Cornell NUY Duke

Carnegie Mellon North Carolina Michigan Texas Indiana Purdue Case Western Georgetown Michigan State Penn State Southern Methodist Tulane Illinois Lowa Minnesota Washington

71970 71970 70660 70490 59890 69880 67820 61890 58520 54720 57200 69830 41820 49120 60910 44080 47130 41620 48250 44140

3.2 3.2 3.2 3.3 3.2 3.2 3.2 3.3 3.2 3.2 3.1 3.2 3.2 3.2 3.1 3.1 3.2 3.2 3.2 3.3

647 630 630 623 635 621 630 625 615 581 591 619 590 580 600 600 616 590 600 617

14361 20400 20276 21910 20600 10132 20960 8580 14036 9556 17600 19584 16057 11400 18034 19550 12628 9361 12618 11436

要求:(1)用双变量回归模型分析GPA是否对ASP有影响?

(2)用合适的回归模型分析GMAT分数是否与ASP有关?

(3)每年的学费与ASP有关吗?你是如何知道的?如果两变量之间正相关,是否意味着进到最高费用的商业学校是有利的;

(4)你同意高学费的商业学校意味着高质量的MBA成绩吗?为什么? 2-27.从某工业部门抽取10个生产单位进行调查,得到下表所列的数据:

单位序号 1 2 3 4 5 6 7 8 9 10 年产量(万吨)y 210.8 210.1 211.5 208.9 207.4 205.3 198.8 192.1 183.2 176.8 工作人员数(千人)x 7.062 7.031 7.018 6.991 6.974 7.953 6.927 6.302 6.021 5.310 要求:假定年产量与工作人员数之间存在线性关系,试用经典回归估计该工业部门的生产函

13

数及边际劳动生产率。

2-28.下表给出了1988年9个工业国的名义利率(Y)与通货膨胀率(X)的数据:

国家

澳大利亚 加拿大 法国 德国 意大利 墨西哥 瑞典 英国 美国

Y(%) 11.9 9.4 7.5 4.0 11.3 66.3 2.2 10.3 7.6

X(%) 7.7 4.0 3.1 1.6 4.8 51.0 2.0 6.8 4.4

资料来源:原始数据来自国际货币基金组织出版的《国际金融统计》

要求:

(1)以利率为纵轴、通货膨胀率为横轴做图; (2)用OSL进行回归分析,写出求解步骤;

(3)如果实际利率不变,则名义利率与通货膨胀率的关系如何? (四)自我综合练习类题型

2-29.综合练习:自己选择研究对象,收集样本数据(利用我国公开发表的统计资料),应用计量经济学软件(建议使用Eviews3.1)完成建立计量经济学模型的全过程,并写出详细的研究报告。(通过练习,能够熟练应用计量经济学软件Eviews3.1中的最小二乘法)

四、习题参考答案

2-1.答:

⑴总体回归函数是指在给定Xi下的Y的分布的总体均值与Xi有函数关系。 ⑵样本回归函数指对应于某个给定的X的Y值的一个样本而建立的回归函数。 ⑶ 随机的总体回归函数指含有随机误差项的总体回归函数,形如:

Yi??1??2Xi?ui

⑷线性回归模型指对参数?为线性的回归,即?只以它的1次方出现,对X可以是或不是线性的。

⑸随机误差项也称误差项,是一个随机变量,针对总体回归函数而言。

14

⑹残差项是一随机变量,针对样本回归函数而言。

⑺条件期望又称条件均值,指X取特定Xi值时的Y的期望值。 ⑼回归系数(或回归参数)指?1、?2等未知但却是固定的参数。

⑽回归系数的估计量指用?1、?2等表示的用已知样本所提供的信息去估计出来的量。 ⒀估计量的标准差指度量一个变量变化大小的标准。

⒁总离差平方和用TSS表示,用以度量被解释变量的总变动。

⒂回归平方和用ESS表示,用以度量由解释变量变化引起的被解释变量的变化。 ⒃残差平方和用RSS表示,用以度量实际值与拟合值之间的差异,是由除解释变量以外的其他因素引起的。

⒄协方差用Cov(X,Y)表示,是用来度量X、Y二个变量同时变化的统计量。

2-2.答:错;错;错;错;错。(理由见本章其他习题答案) 2-3.答:

⑴线性回归模型的基本假设(实际是针对普通最小二乘法的基本假设)是:解释变量是确定性变量,而且解释变量之间互不相关;随机误差项具有0均值和同方差;随机误差项在不同样本点之间是独立的,不存在序列相关;随机误差项与解释变量之间不相关;随机误差项服从0均值、同方差的正态分布。违背基本假设的计量经济学模型还是可以估计的,只是不能使用普通最小二乘法进行估计。

⑸判定系数R?2??ESSRSS?1?,含义为由解释变量引起的被解释变量的变化占被解TSSTSS释变量总变化的比重,用来判定回归直线拟合的优劣。该值越大说明拟合得越好。

⑽不是。 2-8.证明:

??由于 ?1?XY?Xt2tt,因此

2?)?Var(Var(?1?XtYt?X2t?XtX)?Var(?t2Yt)????X2Xt?t??Var(?1Xt??t) ??2Xt2??Xt2?2Var(?t)???? ?? 22222(?Xt)(?Xt)?Xt 2-9.证明:

15

⑴根据定义得知,

?e??(Yii?Yi)??(Yi??1??2Xi)??Yi?n?1??2?Xi?

?nY?n?1?n?2X?n(Y??1??2X)?Y??1??2X

??ei?0

e?从而使得:e?n证毕。 ⑵

i?0

?i)(Xi?X)??(YiXi?XYi?XiY??XY?i)??eiXi??(Yi?Y???YiXi?XYi?(Yi?ei)Xi?X(Yi?ei)???(YiXi?XYi?YiXi?eiXi?XYi?eiX??(eiXi?eiX)??eiX(n?1)?0??eiXi?0证毕。 ⑶

?eY???e(??????e?nX??eiii11i22Xi)??1?ei??2?eiXi

i?0证毕。

2-14.答:线性回归模型:yt????xt??t中的0均值假设E(u2)?0不可以表示为:

1n??t?1nt?0,因为前者表示取完所的可能的样本组合后的平均状态,而后者只是一个样本的

平均值。 2-16.证明:

16

?x???y????i?1nyi?xn?y??xii?1nni

2i??xi?1?iy?i??x?i(yi?y)??x?iyi?y?x?i??x?iyi ??xi?1i?1i?1i?1i?1nnnnn????i?1nyi?nx??xi?1n2i1?xy?(???iii?1i?1nnnx??xi?1n2i)yi

证毕。

2-17.证明:

?x)?0 ?满足正规方程?y?(?????和???iii?1n???x ????i??yi?i)?0即表明Y的真实值与拟合值有共同的均值。 ??(yi?yi?1n证毕。

2-18.答:他的论据是错误的。原因是他忽略了随机误差项ui,这个随机误差项可取正值和负值,但是E(ui)?0,将Ci与Yi的关系表达为Ci????Yi是不准确的,而是一个平均关系。 2-19.证明:

?0???1xi, ?i??设:y????y, ?i??x01i?iy?i)2?iy?i)2(?x(?(x2?i?由于:R? ?1??x222?i?y?i?i?x?y2?1线性回归的斜率估计量:?证毕。 2-20.证明:

?y?x????xi2ii?11 ?2????(xy)/y?ii?i?117

?y??x 又∵ ????x?2Sx???x2n?1, Sy??y?2n?1

S ∴?x?Sy??y??x?n?1???x?y2??x22??y??x?y?x22?r

n?1证毕。 2-22.解:

⑴这是一个横截面序列回归。(图略)

⑵截距2.6911表示咖啡零售价在t时刻为每磅0美元时,美国平均消费量为每天每人2.6911杯,这个数字没有经济意义;斜率-0.4795表示咖啡零售价与消费量负相关,在t时刻,价格上升1美元/磅,则平均每天每人消费量减少0.4795杯; ⑶不能;

⑷不能;在同一条需求曲线上不同点的价格弹性不同,若要求出,须给出具体的X值及与之对应的Y值。 2-23.解:

X? ⑴?X?ni?168,YY??ni?111

??(Xi?X)(Yi?Y)??(XiYi?YXi?YiX?XY)?204200?1680?111?168?1110?10?168?111 ?17720又??(Xi?X)2??(Xi2?2XiX?X2)??Xi2?2?10X2?10X2?315400?10?168?168?33160

??2

(X?X)(Y?Y)17720????0.5344(X?X)33160?ii2i

?1?Y??2X?111?0.5344?168?21.22

? ⑵?

2e??2in?2(Y??i?i)2?Y10?2(Y??2i?i?Y?i2)?2YiY8

18

??21.22?0.5344X ?Yii?i?Y?i2)??(Yi2?2?21.22Yi?2?0.5344XiYi??12??22Xi2?2?1?2Xi)??(Yi2?2YiY?133300?2?21.22?1110?2?0.5344?204200?10?21.22?21.22?0.5344?0.5344?315400?2?21.22?0.5344?1680?620.81620.81?2????77.60

8?X??Var(?)?n?(X?X)2i21i2?77.60?315400?73.81,se(?1)?73.81?8.5913

10?33160Var(?2)??2?x2i?77.60?0.0023,se(?2)?0.0023?0.0484

331602i ⑶r?1?2?(Yi?Y)22?e,

??ei2?620.81,620.81?0.9385

10090又??(Yi?Y)?133300?123210?10090?r2?1?

⑷?p(t?2.306)?95%,自由度为8

21.22??1?2.306,解得: 1.4085??1?41.0315为?1的95%的置信区间。

8.59130.5344??2?2.306,解得:0.4227??2?0.646为?2的95%的置同理,??2.306?0.0484??2.306?信区间。

由于?2?0不在?2的置信区间内,故拒绝零假设:?2?0。 2-24.解:

⑴由于参数估计量?的T比率值的绝对值为18.7且明显大于2,故拒绝零假设

H0:??0,从而?在统计上是显著的;

⑵参数?的估计量的标准方差为15/3.1=4.84,参数?的估计量的标准方差为0.81/18.7=0.043;

⑶由⑵的结果,?的95%的置信区间为:

19

),显(0.81?t0.975(n?2)0.043,0.81?t0.975(n?2)0.043)?(0.81?0.091,0.81?0.091然这个区间不包括0。 2-25.解:

⑴E(YXi?80)?65 E(YXi?100)?77

E(YXi?120)?89 E(YXi?140)?101 E(YXi?160)?113 E(YXi?180)?125 E(YXi?200)?137 E(YXi?220)?149 E(YXi?240)?161 E(YXi?260)?173

第三章、经典单方程计量经济学模型:多元线性回归模型

一、内容提要

本章将一元回归模型拓展到了多元回归模型,其基本的建模思想与建模方法与一元的情形相同。主要内容仍然包括模型的基本假定、模型的估计、模型的检验以及模型在预测方面的应用等方面。只不过为了多元建模的需要,在基本假设方面以及检验方面有所扩充。

本章仍重点介绍了多元线性回归模型的基本假设、估计方法以及检验程序。与一元回归分析相比,多元回归分析的基本假设中引入了多个解释变量间不存在(完全)多重共线性这一假设;在检验部分,一方面引入了修正的可决系数,另一方面引入了对多个解释变量是否对被解释变量有显著线性影响关系的联合性F检验,并讨论了F检验与拟合优度检验的内在联系。

本章的另一个重点是将线性回归模型拓展到非线性回归模型,主要学习非线性模型如何转化为线性回归模型的常见类型与方法。这里需要注意各回归参数的具体经济含义。 本章第三个学习重点是关于模型的约束性检验问题,包括参数的线性约束与非线性约束检验。参数的线性约束检验包括对参数线性约束的检验、对模型增加或减少解释变量的检验以及参数的稳定性检验三方面的内容,其中参数稳定性检验又包括邹氏参数稳定性检验与邹氏预测检验两种类型的检验。检验都是以F检验为主要检验工具,以受约束模型与无约束模型是否有显著差异为检验基点。参数的非线性约束检验主要包括最大似然比检验、沃尔德检

20

验与拉格朗日乘数检验。它们仍以估计无约束模型与受约束模型为基础,但以最大似然原理进行估计,且都适用于大样本情形,都以约束条件个数为自由度的?2分布为检验统计量的分布特征。非线性约束检验中的拉格朗日乘数检验在后面的章节中多次使用。

二、典型例题分析

例1.某地区通过一个样本容量为722的调查数据得到劳动力受教育的一个回归方程为

edu?10.36?0.094sibs?0.131medu?0.210fedu

R2=0.214

式中,edu为劳动力受教育年数,sibs为该劳动力家庭中兄弟姐妹的个数,medu与fedu分别为母亲与父亲受到教育的年数。问

(1)sibs是否具有预期的影响?为什么?若medu与fedu保持不变,为了使预测的受教育水平减少一年,需要sibs增加多少?

(2)请对medu的系数给予适当的解释。

(3)如果两个劳动力都没有兄弟姐妹,但其中一个的父母受教育的年数为12年,另一个的父母受教育的年数为16年,则两人受教育的年数预期相差多少? 解答:

(1)预期sibs对劳动者受教育的年数有影响。因此在收入及支出预算约束一定的条件下,子女越多的家庭,每个孩子接受教育的时间会越短。

根据多元回归模型偏回归系数的含义,sibs前的参数估计值-0.094表明,在其他条件不变的情况下,每增加1个兄弟姐妹,受教育年数会减少0.094年,因此,要减少1年受教育的时间,兄弟姐妹需增加1/0.094=10.6个。

(2)medu的系数表示当兄弟姐妹数与父亲受教育的年数保持不变时,母亲每增加1年受教育的机会,其子女作为劳动者就会预期增加0.131年的教育机会。

(3)首先计算两人受教育的年数分别为 10.36+0.131?12+0.210?12=14.452 10.36+0.131?16+0.210?16=15.816

因此,两人的受教育年限的差别为15.816-14.452=1.364

例2.以企业研发支出(R&D)占销售额的比重为被解释变量(Y),以企业销售额(X1)与利润占销售额的比重(X2)为解释变量,一个有32容量的样本企业的估计结果如下:

Y?0.472?0.32log(X1)?0.05X2(1.37)(0.22)(0.046)

R2?0.099其中括号中为系数估计值的标准差。

(1)解释log(X1)的系数。如果X1增加10%,估计Y会变化多少个百分点?这在经济上是一个很大的影响吗?

(2)针对R&D强度随销售额的增加而提高这一备择假设,检验它不虽X1而变化的假设。分别在5%和10%的显著性水平上进行这个检验。

(3)利润占销售额的比重X2对R&D强度Y是否在统计上有显著的影响?

21

解答:

(1)log(x1)的系数表明在其他条件不变时,log(x1)变化1个单位,Y变化的单位数,即?Y=0.32?log(X1)?0.32(?X1/X1)=0.32?100%,换言之,当企业销售X1增长100%时,企业研发支出占销售额的比重Y会增加0.32个百分点。由此,如果X1增加10%,Y会增加0.032个百分点。这在经济上不是一个较大的影响。

(2)针对备择假设H1:?1?0,检验原假设H0:?1?0。易知计算的t统计量的值为t=0.32/0.22=1.468。在5%的显著性水平下,自由度为32-3=29的t 分布的临界值为1.699(单侧),计算的t值小于该临界值,所以不拒绝原假设。意味着R&D强度不随销售额的增加而变化。在10%的显著性水平下,t分布的临界值为1.311,计算的t 值小于该值,拒绝原假设,意味着R&D强度随销售额的增加而增加。

(3)对X2,参数估计值的t统计值为0.05/0.46=1.087,它比在10%的显著性水平下的临界值还小,因此可以认为它对Y在统计上没有显著的影响。

例3.下表为有关经批准的私人住房单位及其决定因素的4个模型的估计量和相关统计值(括号内为p-值)(如果某项为空,则意味着模型中没有此变量)。数据为美国40个城市的数据。模型如下:

housing??0??1density??2value??3income??4popchang??5unemp??6localtax??7statetax??

式中housing——实际颁发的建筑许可证数量,density——每平方英里的人口密度,value——自由房屋的均值(单位:百美元),income——平均家庭的收入(单位:千美元),popchang——1980~1992年的人口增长百分比,unemp——失业率,localtax——人均交纳的地方税,statetax——人均缴纳的州税 变量 C Density Value Income Popchang Unemp Localtax Statetax RSS R2 模型A 813 (0.74) 0.075 (0.43) -0.855 (0.13) 110.41 (0.14) 26.77 (0.11) -76.55 (0.48) -0.061 (0.95) -1.006 (0.40) 4.763e+7 0.349 1.488e+6 1.776e+6 模型B -392 (0.81) 0.062 (0.32) -0.873 (0.11) 133.03 (0.04) 29.19 (0.06) -1.004 (0.37) 4.843e+7 0.338 1.424e+6 1.634e+6 模型C -1279 (0.34) 0.042 (0.47) -0.994 (0.06) 125.71 (0.05) 29.41 (0.001) 4.962e+7 0.322 1.418e+6 1.593e+6 模型D -973 (0.44) -0.778 (0.07) 116.60 (0.06) 24.86 (0.08) 5.038e+7 0.312 1.399e+6 1.538e+6 ?2 ?AIC

(1)检验模型A中的每一个回归系数在10%水平下是否为零(括号中的值为双边备择p-值)。根据检验结果,你认为应该把变量保留在模型中还是去掉?

22

(2)在模型A中,在10%水平下检验联合假设H0:?i =0(i=1,5,6,7)。说明被择假设,计

算检验统计值,说明其在零假设条件下的分布,拒绝或接受零假设的标准。说明你的结论。

(3)哪个模型是“最优的”?解释你的选择标准。 (4)说明最优模型中有哪些系数的符号是“错误的”。说明你的预期符号并解释原因。确认

其是否为正确符号。 解答:

(1)直接给出了P-值,所以没有必要计算t-统计值以及查t分布表。根据题意,如果p-值<0.10,则我们拒绝参数为零的原假设。

由于表中所有参数的p-值都超过了10%,所以没有系数是显著不为零的。但由此去掉所有解释变量,则会得到非常奇怪的结果。其实正如我们所知道的,多元回去归中在省略变量时一定要谨慎,要有所选择。本例中,value、income、popchang的p-值仅比0.1稍大一点,在略掉unemp、localtax、statetax的模型C中,这些变量的系数都是显著的。

(2)针对联合假设H0:?i =0(i=1,5,6,7)的备择假设为H1:?i =0(i=1,5,6,7) 中至少有一个不为零。检验假设H0,实际上就是参数的约束性检验,非约束模型为模型A,约束模型为模型D,检验统计值为

F?(RSSR?RSSU)/(kU?kR)(5.038e?7?4.763e?7)/(7?3)??0.462

RSSU/(n?kU?1)(4.763e?7)/(40?8)显然,在H0假设下,上述统计量满足F分布,在10%的显著性水平下,自由度为(4,32)

的F分布的临界值位于2.09和2.14之间。显然,计算的F值小于临界值,我们不能拒绝H0,所以βi(i=1,5,6,7)是联合不显著的。

(3)模型D中的3个解释变量全部通过显著性检验。尽管R2与残差平方和较大,但相对来说其AIC值最低,所以我们选择该模型为最优的模型。

(4)随着收入的增加,我们预期住房需要会随之增加。所以可以预期β3>0,事实上其估计值确是大于零的。同样地,随着人口的增加,住房需求也会随之增加,所以我们预期β4>0,事实其估计值也是如此。随着房屋价格的上升,我们预期对住房的需求人数减少,即我们预期β3估计值的符号为负,回归结果与直觉相符。出乎预料的是,地方税与州税为不显著的。由于税收的增加将使可支配收入降低,所以我们预期住房的需求将下降。虽然模型A是这种情况,但它们的影响却非常微弱。

4、在经典线性模型基本假定下,对含有三个自变量的多元回归模型:

Y??0??1X1??2X2??3X3??

你想检验的虚拟假设是H0:?1?2?2?1。

??2??)。 ?,??的方差及其协方差求出Var(? (1)用?1212 (2)写出检验H0:?1?2?2?1的t统计量。

(3)如果定义?1?2?2??,写出一个涉及?0、?、?2和?3的回归方程,以便能直接得到?估计值??及其标准误。 解答:

23

(1)由数理统计学知识易知

Var(??1?2??2)?Var(??1)?4Cov(??1,??2)?4Var(??2) (2)由数理统计学知识易知

t???1?2??2?1?se(??,其中se(??2??)为(???2??)的标准差。 1?2??12122) (3)由?1?2?2??知?1???2?2,代入原模型得

Y??0?(??2?2)X1??2X2??3X3????0??X1??2(2X1?X2)??

3X3??这就是所需的模型,其中?估计值??及其标准误都能通过对该模型进行估计得到。

三、习题

(一)基本知识类题型 3-1.解释下列概念:

1) 多元线性回归 2) 虚变量 3) 正规方程组 4) 无偏性 5) 一致性

6) 参数估计量的置信区间 7) 被解释变量预测值的置信区间 8) 受约束回归 9) 无约束回归 参数稳定性检验

3-2.观察下列方程并判断其变量是否呈线性?系数是否呈线性?或都是?或都不是?1) Y3i??0??1Xi??i 2) Yi??0??1logXi??i

24

3)

logYi??0??1logXi??i

4) Yi??0??1(?2Xi)??i 5) Yi??0??i ?1Xi?6) Yi?1??0(1?Xi1)??i

7) Yi??0??1X1i??2X2i10??i

3-3.多元线性回归模型与一元线性回归模型有哪些区别?

3-4.为什么说最小二乘估计量是最优的线性无偏估计量?多元线性回归最小二乘估计的正规方程组,能解出唯一的参数估计的条件是什么?

3-5.多元线性回归模型的基本假设是什么?试说明在证明最小二乘估计量的无偏性和有效性的过程中,哪些基本假设起了作用? 3-6.请说明区间估计的含义。

(二)基本证明与问答类题型

3-7.什么是正规方程组?分别用非矩阵形式和矩阵形式写出模型:

yi??0??1x1i??2x2i????kxki?ui,i?1,2,?,n的正规方程组,及其推导过程。

3-8.对于多元线性回归模型,证明: (1)(2)

?ei?0

0??e??(??yii?x?????x)e?0 ??11ikkii3-9.为什么从计量经济学模型得到的预测值不是一个确定的值?预测值的置信区间和置信度的含义是什么?在相同的置信度下如何才能缩小置信区间?为什么?

3-10.在多元线性回归分析中,t检验与F检验有何不同?在一元线性回归分析中二者是否

有等价的作用?

3-11.设有模型:y??0??1x1??2x2?u,试在下列条件下: (1)?1??2?1 (2)?1??2

分别求出?1和?2的最小二乘估计量。

25

?2?e22?in?3??yi???2?yix2i???3?yix3i15?3?66042.269?0.7266?74778.346?2.7363?4250.912

?6.3821se(?21)?Var(?1)?115?A???12.768 其中:X2??x222A?3i?X??x2i?2XX???x2ix3i?x222i?x3i?x2ix3i?x

2ix3i同理,可得:se(?2)?0.0486,se(?3)?0.8454 拟合优度为:R2???2?yix2i???3?yix3i?y2?0.9988

iR2?1?(1?R2)n?1n?k?0.9986 ⑶d.f.?12,??5%,查表得P(t?2.179)?0.95

?2.179?0.7266??20.0486?2.179,得到0.6207??2?0.8325

?2.179?2.7363??30.8454?2.179,得到0.8942??3?4.5784

??295%的置信区间为:0.6207??2?0.8325,

?395%的置信区间为:0.8942??3?4.5784

⑷H0:Bi?0,(i?1,2,3),H1:Bi?0

??5%(双边),d.f.?15?3?12查表得临界值为?2.179?t?2.179则:t53.1572?0?1?12.9768?4.0963?2.179,?拒绝零假设:B1?0

t?2?0.7266?00.0486?14.9509?2.179,?拒绝零假设:B2?0

t?2.7363?0?30.8454?3.2367?2.179,?拒绝零假设:B3?0

⑸所有的部分系数为0,即:H20?B1?B2?0,等价于H0:R?0

方差来源 平方和 自由度 平方和的均值 来自回归 65963.018 2 32981.509 来自残差

79.2507

12

6.6042

36

总离差 66042.269 F?32981.509?4994.0203,??5%,d.f.?2,12,F临界值为3.89

6.6042?F值是显著的,所以拒绝零假设。

3-23.解:

⑴对给定在5%的显著水平下,可以进行t检验,得到的结果如下:

系数 假设符号 T值 5%显著水平 ? ?pt+ ? ?pt?1+ ? ?U

3-28.解:

⑴在降雨量不变时,每亩增加一磅肥料将使第t年的玉米产量增加0.1蒲式耳/亩;在每亩施肥量不变的情况下,每增加一英寸的降雨量将使第t年的玉米产量增加5.33蒲式耳/亩;

⑵在种地的一年中不施肥、也不下雨的现象同时发生的可能性极小,所以玉米的负产量不可能存在;

⑶如果?F的真实值为0.40,并不能说明0.1是有偏的估计,理由是0.1是本题估计的参数,而0.40是从总体得到的系数的均值。

⑷不一定。即便该方程并不满足所有的古典模型假设、不是最佳线性无偏估计值,也有可能得出的估计系数等于5.33。 3-29.解:

⑴该方程组的矩阵向量形式为:

???3??121???1?251???????9? ???2???????116?????8????3?????121??1?3??3???1???????????2???251??9???1? ???116???8???2?????????3??(TSS?RSS)53?3?3?1?9?2?8?2???1.9 ⑵?n?k13?3 37

?的方差—协方差矩阵为: ⑶??121??)???2(???)?1?1.9?251?V?Cov(?????116??

?1?6.525?2.475?0.675????2.4751.1250.225? ??0.619????0.6750.225? 38

百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库计量经济学:一元线性回归模型和多元线性回顾模型习题以及解析在线全文阅读。

计量经济学:一元线性回归模型和多元线性回顾模型习题以及解析.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印 下载失败或者文档不完整,请联系客服人员解决!
本文链接:https://www.77cn.com.cn/wenku/zonghe/237354.html(转载请注明文章来源)
Copyright © 2008-2022 免费范文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ: 邮箱:tiandhx2@hotmail.com
苏ICP备16052595号-18
× 注册会员免费下载(下载后可以自由复制和排版)
注册会员下载
全站内容免费自由复制
注册会员下载
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: