77范文网 - 专业文章范例文档资料分享平台

项目八 假设检验(4)

来源:网络收集 时间:2018-11-29 下载这篇文档 手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:或QQ: 处理(尽可能给您提供完整文档),感谢您的支持与谅解。点击这里给我发消息

碳含量x/%电阻y/??0.10150.30180.40190.55210.7022.60.8023.80.9526

试求y对x的经验回归直线方程, 并作简单回归分析.

3. 下表列出了18个5~8岁儿童的重量和体积. 重量x/kg 体积y/dm3 重量x/kg 体积y/dm3 (1) 画出散点图;

?x,并作回归分析; ??a??b(2) 求y关于x的线性回归方程y17.1 16.7 15.8 15.2 10.5 10.4 15.1 14.8 13.8 13.5 12.1 11.9 15.7 15.7 18.4 18.3 11.9 11.6 17.1 16.7 10.4 10.2 16.7 16.6 15.0 14.5 16.5 15.9 16.0 15.8 15.1 15.1 17.8 17.6 15.1 14.5 (3) 求x?14.0时y的置信水平为0.95的预测区间.

4.下面给出了某种产品每件平均单价Y(单位:元)与批量x(单位:件)之间的关系的一组数 据

xy201.81251.70301.65351.55401.48501.40601.30651.26701.24751.21801.20901.18

(i)作散点图. (ii)以模型Y?b0?b1x?b2x2??,?~N(0,?2)拟合数据, 求回归方程

??b?x?b?x2,并作简单回归分析.] ??bY012

实验3 方差分析

实验目的 学习利用Mathematica求单因素方差分析的方法.

基本命令

1.调用线性回归软件包的命令<

<

2.线性设计回归的命令DesignedRegress 在线性回归模型

Y ??X????

中,向量Y是因变量,也称作响应变量.矩阵X称作设计矩阵, ?是参数向量??是误差向量??

????????DesignedRegress也是作一元和多元线性回归的命令, 它的应用范围更广些. 其格式与命令Regress的格式略有不同:

DesignedRegress[设计矩阵X,因变量Y的值集合,

RegressionReport ->{选项1, 选项2, 选项3,?}] RegressionReport(回归报告)可以包含:ParameterCITable(参数?的置信区间表??????PredictedResponse (因变量的预测值), MeanPredictionCITable(均值的预测区间), FitResiduals(拟合的残差), SummaryReport(总结性报告)等, 但不含BestFit.

实验准备—将方差分析问题纳入线性回归问题

在线性回归中, 把总的平方和分解为回归平方和与误差平方和之和, 并在输出中给出了方差分析表. 而在方差分析问题中, 也把总的平方和分解为模型平方和与误差平方和之和, 其方法与线性回归中的方法相同. 因此只要把方差分析问题转化为线性模型的问题, 就可以利用线性回归中的设计回归命令DesignedRegress做方差分析.

单因素试验方差分析的模型是

?Yij??j??ij,?2??ij~N(0,?),各?ij独立, ?i?1,2,?,n;j?1,2,?,s.j? (3.1)

上式也可改写成

?Yi1??1??i1,??Yij??1?(?j??1)??ij,2??ij~N(0,?),?i?1,2,?,n1,j?2,3,?,s;各?ij独立,i?1,2,?,nj;j?1,2,?,s. (3.2)

给定具体数据后, 还可(2.2)式写成线性模型的形式:

Y ??X????????????????????????????????????????????????????????????????????????????

其中X称为设计矩阵, 它的元素是0或1. 由于(3.2)的每一个等式的右边都有?1,因此X的第一列都是1, 线

??0?????1????????????s?1?性模型中就有了必须要有的常数这一列.

是线性模型中的参数.?1相当于线性模型中常数项

?0.?2??1,?3??1,?相当于线性模型中的参数?1,?2,?.当然也可以用?2或?3代替?1.Y是因变量(向

量),??是误差向量.可以通过下面的例子来了解和熟悉此方法.

实验举例

例3.1 (教材 例3.1) 今有某种型号的电池三批, 它们分别是A,B,C三个工厂所生产的. 为评比起质量, 各随机抽取5只电池为样品, 经试验得其寿命(单位:h)如下表:

A B C 40 26 39 42 28 50 48 34 40 45 32 50 38 30 43 试在显著性水平0.05下检验电池的平均寿命有无显著的差异. 若差异是显著的, 试求均值差

?A??B,?A??C及?B??C的置信水平为95%的置信区间.

这是方差分析问题, 先把它转化为线性模型:

Y ??X?????

?Y1A????Y?5A?Y1B?Y????Y5B??Y1C????Y?5C??1???????1????1???,X?????1????1??????1???0?01?10?00?????0??A0??????,????B??A?0???C??A?1????1????11??????51??12????,???????52????13??????53??????????????? 令

则线性模型(3.3)与方差分析模型(3.1)完全等价. 模型(3.3)完全可以用DesignedRegress命令作设计回归, 得到所要的方差分析表.

我们面临的任务是:

(1) 检验3个总体的均值是否相等,即作假设检验

H0:?A??B??C;H1:?A,?B,?C不全相等

(2) 求均值差?A??B,?A??C及?B??C的置信水平为95%的置信区间. 任务(1)等价于对模型(3.3)作检验:

H0:?B??A??C??A?0;H1:?B??A,?C??A不全等于零

而任务(2)等价于求?B??A,?C??A及?C??B的置信区间. 在DesignedRegress命令中加入选项

RegressionReport->{ParameterCITable,MeanPredictionCITable,SummaryReport}

后便能完成上述任务.

用回归分析作单因素方差分析

完成对模型的假设检验和对模型参数的区间估计任务.输入设计矩阵和数据

X1={{1.0,0,0},{1,0,0},{1,0,0},{1,0,0},{1,0,0},{1,1,0},{1,1,0},{1,1,0},

{1,1,0},{1,1,0},{1,0,1},{1,0,1},{1,0,1},{1,0,1},{1,0,1}};

Y1={40,42,48,45,38,26,28,34,32,30,39,50,40,50,43}; 再输入设计回归命令

DesignedRegress[X1,Y1,RegressionReport->

{ParameterCITable,MeanPredictionCITable,SummaryReport}] (*回归报告输出参数的置信区间,均值的置信区间和总结报告*)

执行后得到输出

Estimate SE CI 1 42.6 1.89912 {38.4622,46.7378}

{ParameterCITable->2 -12.6 2.68576 {-18.4518,-6.74822}

3 1.8 2.68576 {-4.05178,7.65178}

MeanPredictionCITable-> Observed Predicted SE CI 40. 42.6 1.89912 {38.4622,46.7378} 42. 42.6 1.89912 {38.4622,46.7378} 48. 42.6 1.89912 {38.4622,46.7378} 45. 42.6 1.89912 {38.4622,46.7378} 38. 42.6 1.89912 {38.4622,46.7378} 26. 30. 1.89912 {25.8622,34.1378} 28. 30. 1.89912 {25.8622,34.1378} 34. 30. 1.89912 {25.8622,34.1378} 32. 30. 1.89912 {25.8622,34.1378} 30. 30. 1.89912 {25.8622,34.1378} 39. 44.4 1.89912 {40.2622,48.5378} 50. 44.4 1.89912 {40.2622,48.5378} 40. 44.4 1.89912 {40.2622,48.5378} 50. 44.4 1.89912 {40.2622,48.5378} 43. 44.4 1.89912 {40.2622,48.5378}

Estimate SE TStat PValue 1 42.6 1.89912 22.4314 3.63987×10-11

{ParameterCITable->2 -12.6 2.68576 -4.6914 0.00052196

3 1.8 2.68576 0.6702 0.515421

Rsquared->0.739904,AdjustedRSquared->0.696554, EstimatedVariance->18.0333,ANOVATable->

DF SumOfsq MeanSq Fratio Pvalue

Model 2 615.6 307.8 17.0684 0.000309602 Error 12 216.4 18.0333 Total 14 832.

从参数置信区间表(ParameterCITable)可知: ?A的点估计是42.6, 估计量的标准差为1.89912, ?A的置信水平为0.95的置信区间是(38.4622,46.7378). ?B??A的点估计是?12.6,标准差为2.68576, ?B??A的置信水平为0.95的置信区间是(?18.4518,?6.74822).

?C??A的点估计是1.8, 标准差为2.68576, ?C??A的置信水平为0.95的置信区间是

(?4.05178,7.65178).

从均值置信区间表(MeanPredictionCITable)知: ?A的点估计, ?A的置信区间同参数置信区间表, ?B的点估计为30.0, 置信度为0.95的置信区间是(25.8622,34.1378),?C的点估计为44.4, 置信度为0.95的置信区间是(40.2622,48.5378).

从参数表(ParameterTable)知: 关于?B??A是否等于零的假设检验结果是否定的, 即?B??A不等于零. 关于?C??A是否等于零的假设检验结果是不否定原假设, 即不否定?C??A等于零的假设. 从Rsquared->0.739904知Y的变化中的74%是由模型引起的,26%是由误差引起的. 从EstimatedVariance->18.0333知模型中的误差项?的方差的估计是????????

最后从方差分析表知平方和的分解结果是:总的平方和?832.0,模型引起的平方和(效应平方和)???????误

差平方和????????作假设检验??

H0:?B??A??C??A?0;H1:?B??A,?C??A不全等于零?

时??统计量F的观察值为17.0684, F的P值为0.000309602, 检验结果显然否定原假设,即三个工厂生产的电池的平均寿命有显著差异.

总结起来: 三个工厂生产的电池的平均寿命有显著差异. ?A??B的置信水平为0.95的置信区间是(6.74822,18.4518). ?A??C的置信水平为0.95的置信区间是

(?7.65178,4.05178).?

???????看来只有?B??C的置信区间未能求得.只要改变设计矩阵X, 再作一次设计回归.

输入?

X2={{1.0,0,1},{1,0,1},{1,0,1},{1,0,1},{1,0,1},{0,1,1},{0,1,1},{0,1,1},

{0,1,1},{0,1,1},{0,0,1},{0,0,1},{0,0,1},{0,0,1},{0,0,1}};

?? DesignedRegress[X2,Y1,RegressionReport->

{ParameterCITable,MeanPredictionCITable,SummaryReport}]

就能得到类似于对x1,y1的设计回归结果(输出结果省略了),从参数置信区间表可以得到?B??C的置信水平为0.95的置信区间是(?20.2518,?8.54822).

例3.2 (教材 例3.2) 将抗生素注入人体会产生抗生素与血浆蛋白质结合的现象,以致减少了药效. 下表中列出了5种常用的抗生素注入到牛的体内时, 抗生素与血浆蛋白质结合的百分比. 试在水平??0.05下检验这些百分比的均值有无显著的差异.

青霉素 四环素 链霉素 红霉素 氯霉素 29.6 27.3 5.8 21.6 29.2 24.3 32.6 6.2 17.4 32.8 28.5 30.8 11.0 18.3 25.0 32.0 34.8 8.3 19.0 24.2 本例也是单因素方差分析问题. 输入

X3={{1.0,0,0,0,0},{1,0,0,0,0},{1,0,0,0,0},{1,0,0,0,0},{1,1,0,0,0},{1,1,0,0,0},

{1,1,0,0,0},{1,1,0,0,0},{1,0,1,0,0},{1,0,1,0,0},{1,0,1,0,0},{1,0,1,0,0}, {1,0,0,1,0},{1,0,0,1,0},{1,0,0,1,0},{1,0,0,1,0},{1,0,0,0,1},{1,0,0,0,1}, {1,0,0,0,1},{1,0,0,0,1}};

Y3={29.6,24.3,28.5,32.0,27.3,32.6,30.8,34.8,5.8,6.2,11.0,8.3,21.6,17.4,

18.3,19.0,29.2,32.8,25.0,24.2}; DesignedRegress[X3,Y3,RegressionReport->

{ParameterCITable,MeanPredictionCITable,SummaryReport}] 执行以后得到输出

{ParameterCITable-> Estimate SE CI

1 28.6 1.50456 {25.3931,31.8069} 2 2.775 2.12777 {?1.76024,731024} 3 ?20.775 2.12777 {?25.3102,?16.2398} 4 ?9.525 2.12777 {?14.0602,?4.98976} 5 ?0.8 2.12777 {?5.33524,3.73524} {ParameterTable->

Estimate SE TStat PValue

1 28.6 1.50456 19.0088 6.58118×10?12 2 2.775 2.12777 1.30418 0.21183 3 ?20.775 2.12777 ?9.76373 6.83788×10?8 4 ?9.525 2.12777 ?4.47651 0.000443597 5 ?0.8 2.12777 ?0.37598 0.712196

Rsquared->0.915985,AdjustedRSquared->0.893581, EstimatedVariance->9.05483,ANOVATable-> DF Sumofsq MeanSq Fratio Pvalue

Model 4 1480.82 370.206 40.8849 6.73978×10?8 Error 15 135.822 9.05483 Total 19 1616.65

因为F检验的P值非常小,所以即使在检验的水平??0.01时,这些百分比的均值有显著差异.

注: 利用Mathematica语句, 我们也可以直接编程计算方差分析表. 有兴趣的读者可参考更高一级的实验教材(如[10],[11]等).

实验习题

1.设有三台机器用来生产规格相同的铝合金薄板. 取样, 测量薄板的厚度精确至千分之一厘米, 得结果如下表:

机器1机器2机器30.2360.2570.2580.2380.2530.2640.2480.2550.2590.2450.2540.2670.2430.2610.262考察机器这一因素对薄板厚度有无显著的影响(??0.05).

2.下表给出了小白鼠在接种3种不同菌型的伤寒杆菌后存活的天数

菌型甲乙丙2574611386256存活4107779天数712526105663104

试问,小白鼠在接种了不同菌型的伤寒杆菌后存活的天数是否有显著性差异(??0.05)?

百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库项目八 假设检验(4)在线全文阅读。

项目八 假设检验(4).doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印 下载失败或者文档不完整,请联系客服人员解决!
本文链接:https://www.77cn.com.cn/wenku/zonghe/323112.html(转载请注明文章来源)
Copyright © 2008-2022 免费范文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ: 邮箱:tiandhx2@hotmail.com
苏ICP备16052595号-18
× 注册会员免费下载(下载后可以自由复制和排版)
注册会员下载
全站内容免费自由复制
注册会员下载
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: