4.9
(1)用普通最小二乘法建立y与x的回归方程,并画出残差散点图. 【程序】
data d1; input x y@@; cards;
679 0.79 292 0.44 1012 0.56 493 0.79 582 2.7 1156 3.64 997 4.73 2189 9.5 1097 5.34 2078 6.85 1818 5.84 1700 5.21 747 3.25 2030 4.43 1643 3.16 414 0.5 354 0.17 1276 1.88 745 0.77 435 1.39 540 0.56 874 1.56 1543 5.28 1029 0.64 710 4 1434 0.31 837 4.2 1748 4.88 1381 3.48 1428 7.58 1255 2.63 1777 4.99 370 0.59 2316 8.19 1130 4.79 463 0.51 770 1.74 724 4.1 808 3.94 790 0.96 783 3.29 406 0.44 1242 3.24 658 2.14 1746 5.71 468 0.64 1114 1.90 413 0.51 1787 8.33 3560 14.94 1495 5.11 2221 3.85 1526 3.93 ;
proc print; run;
proc plot data=d1; plot y*x='.'; run;
由散点图知,y和x满足线性关系,建立回归方程,作残差散点图。
proc reg data=d1 ; model y=x/r;
output out=out r=residual; run;
proc gplot data=out; plot residual*x; run;
方差分析 源 模型 误差 自由度 1 51 平方 和 均方 F 值 Pr > F 302.63314 302.63314 121.66 <.0001 126.86602 2.48757 429.49915 校正合计 52 P值<0.05,回归方程显著有效。
均方根误差 1.57720 R 方 0.7046 因变量均值 3.41321 调整 R 方 0.6988 变异系数 46.20882 R方=0.7046,调整R方=0.6988,回归方程的拟合度较高。
参数估计值 变量 Intercept x
自由度 1 1 参数 估计值 标准 误差 t 值 Pr > |t| -1.88 0.0655 -0.83130 0.44161 0.00368 0.00033390 11.03 <.0001 常数项P值>0.05,不显著。 去掉常数项重新拟合。
proc reg data=d1; model y=x/noint; run;
方差分析 源 模型 误差 自由度 1 52 平方 和 均方 F 值 Pr > F 911.26758 911.26758 349.25 <.0001 135.68082 2.60925 1046.94840 R 方 0.8704 未校正合计 53
均方根误差 1.61532 因变量均值 3.41321 调整 R 方 0.8679 变异系数 47.32546
P值<0.05,回归方程显著。F值和R方都变大,所以回归方程的拟合度有显著提高。
参数估计值 变量 自由度 x 1 参数 估计值 标准 误差 t 值 Pr > |t| 0.00314 0.00016776 18.69 <.0001 回归方程为 y=0.00314x 残差散点图为:
(2)诊断该问题是否存在异方差 残差散点图呈发散状态,认为存在异方差。 利用等级相关系数法判断是否存在异方差。
proc reg data=d1; model y=x/r noint;
output out=out r=residual; run; data out1; set out;
z=abs(residual);
run;
proc corr data=out1 spearman; var x z; run;
Spearman 相关系数, N = 53 Prob > |r| under H0: Rho=0 x x 1.00000 z 0.21271 0.1262 1.00000 z 0.21271 0.1262
残差绝对值ei与xi的等级相关系数rs=0.21271,P值=0.126,认为ei与自变量xi显著相关,存在异方差。
(3)如果存在异方差,用幂指数型的权函数建立加权最小二乘回归方程。
data d2; set d1;
array row{10} w1-w10;
array p{10}(-2,-1.5,-1,-0.5,0,0.5,1,1.5,2,2.5); do i=1 to 10; row{i}=1/x**p{i}; end; run;
proc print; run;
proc reg data=d2; model y=x/r; weight w1;
output out=out r=residual; run;
proc gplot data=out; plot residual*x; run;
方差分析 源 模型 误差 自由度 1 51 平方 和 均方 F 值 Pr > F 1291308644 1291308644 228.46 <.0001 288267545 5652305 1579576189 校正合计 52 P值<0.05,回归方程显著。
均方根误差 2377.45764 因变量均值 6.22575 变异系数 38187 R 方 0.8175 调整 R 方 0.8139 R方=0.8175,调整R方=0.8139,回归方程拟合度较高。
参数估计值 变量 Intercept x 自由度 1 1 参数 估计值 标准 误差 t 值 Pr > |t| -3.86 0.0003 -2.40038 0.62183 0.00460 0.00030415 15.11 <.0001
参数检验P值均<0.05,所以参数有效。 回归方程为y=-2.40038+0.00460x
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库应用回归分析习题4.9答案在线全文阅读。
相关推荐: