可以用直线回归描述y与x之间的关系. (2)回归方程为:y?12112.629?3.314x (3)
? 10
从图上可看出,检验误差项服从正态分布。
第三章 多元线性回归
3.11 解:(1)用SPSS算出y,x1,x2,x3相关系数矩阵: 相关性 Pearson 相关性 y x1 x2 x3 y x1 x2 y 1.000 .556 .731 .724 . .048 .008 x1 .556 1.000 .113 .398 .048 . .378 11
x2 .731 .113 1.000 .547 .008 .378 . x3 .724 .398 .547 1.000 .009 .127 .051
x3 N y x1 x2 x3 .009 10 10 10 10 .127 10 10 10 10 .051 10 10 10 10 . 10 10 10 10 所以~r=
系数a 模型 非标准化系数 B 1 (常量) 标准系数 t Sig. -1.974 B 的 95.0% 置信区间 下限 上限 零阶 相关性 偏 部分 共线性统计量 容差 VIF 标准 误差 试用版 176.459 -348.280 .096 -780.083.500 60 .556 .731 .724 .825 .687 .586 1.211 1.455 1.708 x1 x2 x3 3.754 7.101 12.447 1.933 2.880 10.569 .385 1.942 .535 2.465 .277 1.178 .100 .049 -.977 8.485 .053 14.149 .621 .350 .709 .444 .433 .212 .284 -13.4138.310 5 a. 因变量: y (2)
???348.28?3.754x1?7.101x2?12.447x3 所以三元线性回归方程为y模型汇总 模型 R 1 .898a R 方 .806 调整 R 方 .708 标准 估计的误差 23.44188 R 方更改 .806 F 更改 8.283 更改统计量 df1 3 df2 6 Sig. F 更改 .015 a. 预测变量: (常量), x3, x1, x2。 (3) 由于决定系数R方=0.708 R=0.898较大所以认为拟合度较高
(4)
Anovab 模型 平方和 df 均方 12
F Sig. 1 回归 残差 总计 13655.370 3297.130 16952.500 3 6 9 4551.790 549.522 8.283 .015a a. 预测变量: (常量), x3, x1, x2。 b. 因变量: y
因为F=8.283 P=0.015<0.05所以认为回归方程在整体上拟合的好
(5)
系数a 模型 非标准化系数 B 1 (常量) x1 x2 x3 a. 因变量: y 3.754 7.101 12.447 1.933 2.880 10.569 .385 1.942 .100 .535 2.465 .049 .277 1.178 .284 -.977 .053 -13.415 8.485 14.149 38.310 .556 .731 .724 .621 .709 .433 .350 .444 .212 .825 1.211 .687 1.455 .586 1.708 -348.280 标准 误差 176.459 标准系数 试用版 t Sig. 下限 -780.060 B 的 95.0% 置信区间 上限 83.500 零阶 相关性 偏 部分 共线性统计量 容差 VIF -1.974 .096
(6)可以看到P值最大的是x3为0.284,所以x3的回归系数没有通过显著检验,应去除。
去除x3后作F检验,得: Anovab 模型 1 回归 残差 总计 平方和 12893.199 4059.301 16952.500 df 2 7 9 均方 6446.600 579.900 F 11.117 Sig. .007a a. 预测变量: (常量), x2, x1。 b. 因变量: y
由表知通过F检验 继续做回归系数检验
13
系数a 模型 非标准化系数 B 1 (常量) -459.624 x1 x2 4.676 8.971 标准系数 t Sig. B 的 95.0% 置信区间 下限 -821.547 .381 3.134 上限 -97.700 8.970 14.808 相关性 零阶 偏 部分 共线性统计量 容差 VIF 标准 误差 试用版 153.058 1.816 2.468 .479 .676 -3.003 .020 2.575 3.634 .037 .008 .556 .731 .697 .808 .476 .672 .987 1.013 .987 1.013 a. 因变量: y
此时,我们发现x1,x2的显著性大大提高。
(7)x1:(-0.997,8.485) x2:(0.053,14.149) x3:(-13.415,38.310)
?*?0.385x1*?0.535x2*?0.277x3* (8)y(9) 残差统计量a 预测值 标准 预测值 预测值的标准误差 调整的预测值 残差 标准 残差 Student 化 残差 已删除的残差 Student 化 已删除的残差 Mahal。 距离 Cook 的距离 居中杠杆值 a. 因变量: y 极小值 175.4748 -1.438 10.466 188.3515 -25.19759 -1.075 -2.116 -97.61523 -3.832 .894 .000 .099 极大值 292.5545 1.567 20.191 318.1067 33.22549 1.417 1.754 50.88274 2.294 5.777 3.216 .642 均值 231.5000 .000 14.526 240.1835 .00000 .000 -.123 -8.68348 -.255 2.700 .486 .300 标准 偏差 38.95206 1.000 3.127 49.83914 19.14022 .816 1.188 43.43220 1.658 1.555 .976 .173 N 10 10 10 10 10 10 10 10 10 10 10 10
所以置信区间为(175.4748,292.5545)
(10)由于x3的回归系数显著性检验未通过,所以居民非商品支出对货运总量影响不大,但是回归方程整体对数据拟合较好
3.12 解:在固定第二产业增加值,考虑第三产业增加值影响的情况下,第一产
14
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库《应用回归分析》课后习题部分答案-何晓群版(3)在线全文阅读。
相关推荐: