的区别。将设ui,t符合同方差假设:
a、当ui,t无序列相关时,FE比FD更有效;
b、如果ui,t遵循随机游走过程ui,t=ui,t-1+vi,t,vi,t:n(0,σ2),Δui,t是无序列相关的,此时FD相对更有效;
c、如果严格外生性假定不满足,则FD相对FE比较好; d、当T很大时,或者N不足够大时,FD更有效;
e、可以同时使用两种方法,比较两种统计量估计的结果,并分析差异存在的原因。
侯振新 052015001 一、使用
1、 使用自然对数使得对系数的解释颇具吸引力
2、 由于斜率系数不随测度单位的变化而变化,所以可以忽略以对数形式出现的变量的
测度单位
3、 当y>0时,使用log(y)作为因变量的模型,通常比使用y的水平值作为因变量的模
型更接近CLM假定
4、 严格为正的变量,其条件分布常常具有异方差性或偏态性,取对数后,即使不能消
除这两方面的问题,也可以使之有所缓和
5、 取对数通常会缩小变量的取值范围,在某些情况下还相当可观,这就使得估计值对
因变量或自变量的异常(或极端)观测不是那么敏感
二、利用GPA.RAW中的数据,我们得到预测大学GPA的如下方程:
colgpa = 1.493 + 0.00149 sat - 0.01386 hsperc-0.06088 hsize + 0.00546 hsize (0.075) (0.00007) (0.00056) (0.01650) (0.00227)
n = 4137 ,
^^2
R = 0.278 , R22 = 0.277 ,
? = 0.560
有一名学生,sat = 1200 , hsper = 30 , hsize = 5 。定义一个新的自变量组: sat0 = sat – 1200 , hsperc0 = hsperc – 30 , hsize0 = hsize – 5 , hsizeq0 = 将colpga对这些新变量进行回归时得到
hsize2 - 25 .
colgpa = 2.700 + 0.00149 sat - 0.01386 hsperc-0.06088 hsize + 0.00546 hsize (0.020) (0.00007) (0.00056) (0.01650) (0.00227)
n = 4137 ,
^2
R = 0.278 , R22 = 0.277 ,
? = 0.560
^
问题1:该学生GPA 的预测值是多少?
问题2:该学生大学预期GPA的一个95%的置信区间是多少? 问题3:该学生未来的大学GPA的一个95%的置信区间是多少?
答案1:2.70
答案2:2.70-1.96*0.020~2.70+1.96*0.020 ,或约为 2.66~2.74 答案3:2.70 -(0.020*0.020?0.560*0.560)
~2.70+0.020*0.020?0.560*0.560)(1/21/2
约为1.60~3.80
截面数据和面板数据分析题目
042015045 唐正东
1.你能分别举出三个时间序列数据、截面数据、混合数据、虚拟变量数据的实际例子吗? 答:(1)时间序列数据如:每年的国民生产总值、各年商品的零售总额、各年的年均人口增长数、年出口额、年进口额等等;
(2)截面数据如:复旦大学2002年各位教师年收入、2002年各省总产值、2002年5月上海市各区罪案发生率等等;
(3)混合数据如:1990年~2000年各省的人均收入、消费支出、教育投入等等;
(4)虚拟变量数据如:婚否,身高是否大于170厘米,受教育年数是否达到10年等等。
2.判断下列说法是否正确,并简要说明为什么。
(1)当异方差出现时,最小二乘估计是有偏的和不具有最小方差特性; 答:不正确。这个时候估计式是无偏的,但是不具有最小方差性。 (2)当异方差出现时,常用的t和F检验失效;
答:正确。由于方差不是常数而是变数,这时一般意义上t比值的分布是未知的,但肯定不再遵从t-分布,使得t检验失效;同理,在异方差条件下,F比值也不再是遵从F-分布,F检验也失效。
(3)异方差情况下,通常的OLS估计一定高估了估计量的标准差; 答:一般是低估了其标准差。
(4)如果OLS回归的残差表现出系统性,则说明数据中有异方差性; 答:是,但同时也要考虑自相关性的存在。
(5)如果回归模型中遗漏一个重要变量,则OLS残差必定表现出明显的趋势;
答:是。尤其是在经济、金融数据中,这种异方差性的现象更为突
出。
(6)如果模型遗漏一个非恒定方差的回归元,则残差将会呈异方差。
答:一般来说是的,但是有时候不见得会表现出来或者说不一定能够观察得到。
赵忠辉(052015126)
1、一个研究者将估计包含一个滞后变量得下列计量经济模型:
yt??1??2x2t??3x?t3?y4?t?1?t
?yt??1??2x2t??3x?t3?y4?t?1?t式中?t和?t为独立分布(iid)的扰动项。
这些模型是否有同样的下列值:(a)残差平方和(RSS);(b)R2;(c)经调整的R2?请解释你对上述每一种情况给出的答案。
2、为什么经济学家希望从回归方程中剔除不显著的变量? 3、(a)为什么有必要假定回归模型的扰动项是正态分布的?
(b) 实际运用模型时,应该怎样解决残差并不是正态分布这一问题? 范惠众 052015024 一
,
请
问
对
于
一
个
计
量
模
型
,
例
如
:
要检验单个变量参数的统计显著情况我们可以使用t统计量,要检验多个变量参数的联合统计显著情况,我们可以使用F统计量。那么请问:
1, F统计量可以用来检验单个变量参数的统计显著情况吗?如果可以,请问这个检验和t
统计量有区别吗?(答案:F统计量可以用来检验单个变量参数的统计显著情况。并且F统计量和t统计量的检验是没有差别的,检验单一变量之排除性的F统计量等于对应的t统计量的平方。)
2, 如果F统计量可以用来检验单个变量的参数的统计显著情况,那么请问为什么我们还需
要t统计检验?(答案:首先:t统计量相对F统计量比较容易获得。其次,F统计量之所以被需要是因为其检验联合统计显著的功能。因为F统计量是t统计量的平方,所以t统计量还可以方便的用于单侧对立假设的检验。综上,F统计量的比较优势是检验联合统计显著,虽然也可用于检验单个统计量的显著性,但是操作不方便。单个统计量的显著性检验主要使用t统计量。)
二,对于模型交互项参数的解释:
一个棒球队员的收入salary可能取决于如下因素: Year投身棒球运动的年数
Gamesyr参加正规棒球比赛以来的年数 ……
Black表示人种为黑人。 Hispan表示西班牙人。
Perblack表示黑人人口在一个城市中的比例。 Perchisp表示一个城市中西班牙人口所占的比例。 对330个大型俱乐部的棒球运动员估计了如下模型:
Log(salary)=a1+a2*years+a3*gamesyr+a4*black+a5*hispan+a6*black*percblack+a7*hispan*perchisp+u
其中回归结果是:a4=-0.198(0.125)、a5=-0.190(0.153)、 a6=0.0125(0.0050)、a7=0.020(0.0098) n=330 R平方=0.638
请问从上面的回归结果对交互项进行分析可以分析出一个城市中黑人或西班牙人比例对黑人或西班牙人球员的薪水的影响的什么结论?你将如何解释这个结论?能否简单的人为存在对黑人或者西班牙人的歧视?
(答:对交互项进行分析:首先,保持perchisp不变的情况下,black的系数为-0.198,这确实意味着如果一名黑人运动员在一个没有黑人的城市里——perblack=0,那么这个黑人比一个条件相当的白人少挣约19.8%。随着perblack的提高,因为hispan不变,所以相当于白人比例在减少,黑人的薪水相对白人的薪水逐渐增加。在一个拥有10%的黑人城市里,黑人的log(salary)要比白人小-0.198+0.0125*10=-0.073,甚至当黑人比例高到20%时黑人挣得比白人还多。同样的分析可以对hispan适用。
但是这不能简单就得出存在对黑人和西班牙人存在歧视,因为在那些少数民族聚居的城市里,白人挣得比黑人西班牙人还要少。城市种族构成对薪水的重要性可能源于运动员的偏好:可能最好的黑人运动员不成比例的居住在那些黑人较多的城市,而最好的西班牙籍运动员则倾向于居住在那些西班牙人较多的城市里。)
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说教育文库面板数据题目(3)在线全文阅读。
相关推荐: