数理统计大作业
一、100个男同学身高样本统计分析
本例通过对100个男同学的身高测量,得到了男同学身高的统计样本,身高样本从小到大排列如下表所示:
表1. 身高样本表
身高调查结果列表 165.7 169.1 170.8 171.6 172.9 173.3 174.2 174.7 175.3 175.8 176.6 177 177.9 178.9 179.4 181 183 166.3 169.4 170.9 171.9 172.9 173.3 174.3 174.9 175.4 175.8 176.5 177.1 178 179 179.5 181.3 183.5 167.6 169.8 171 172.3 172.8 173.8 174.6 174.9 175.5 175.9 176.9 177.2 178.2 179.1 180.1 181.2 183.6 168 17.05 171.2 172.4 173 173.9 174.8 174.9 175.7 176 176.9 177.3 178.4 179.2 180 181.7 184 168.3 170.9 171.3 172.5 173.1 174 174.9 175 175.7 176.4 177 177.3 178.5 179.3 180.2 182.2 168.5 170.6 171.5 172.8 173.2 174.1 174.6 175.2 175.7 176.5 177 177.5 178.6 179.9 180.6 182.7 1、身高样本直方图的绘制
把身高区段分成了10段,每段所含的人数进行列表如下:
表2. 身高样本分段表
身165-167-169-171-173-175-177-179-181-183-高 167 169 171 173 175 177 179 181 183 185 人2 4 8 13 17 18 15 11 6 4 数 根据上表画出容量为100的身高样本直方图如下图所示:
身高分布直方图2015人数1050人数身高(cm)图1. 身高样本直方图
由身高样本分布直方图可以看出,身高分布大致呈正态分布,以下将给出证明。
2、箱型图的绘制
由100个男同学的身高统计样本可以得到,样本中位数为
(175.4?175.5)/2?175.45cm
样本第第一四分位数为172.8?(172.9-172.8)/4?172.83cm 样本第三四分位数为178.2?(178.4-178.2)?3/4?178.35cm 根据以上数据画样本分布箱型图为:
身高170(cm)190185180175165160155150
图2. 身高样本箱型图
由箱型图可以看出,样本基本相对于中位数对称,分布范围处于165-185之间,没有离群点,符合正态分布的特征。
二、利用?2拟合优度检验法检验样本的分布函数
根据样本直方图和箱型图,试猜想总体分布符合正态分布,设样本身高为X,则
X?N(?,?2),则要检验假设
H0:P(X)??(x??)2?? exp?2???2?2????1?的最大似然估计为X?175.45,?2的最大似然估计为
M*21?100(Xi?i?1100?X)2?15.98
上面已经把抽样得到的容量为100的样本分为10个互不相容的区间,由于?2拟合优度检验法要求每个互不相容的事件至少有4-6个事件所以分为8个事件如下表
表3.
事件 A1 A2 A3 A4 A5 A6 A7 A8
区间 165-169 169-171 171-173 173-175 175-177 177-179 179-181 181-185 样本个数 6 8 13 17 18 15 11 10 概率Pi 0.054 0.08 0.137 0.185 0.196 0.161 0.105 0.082 样本频率 0.060 0.084 0.131 0.169 0.177 0.153 0.108 0.100 其中每个事件的概率Pi可根据标准正态分布的计算结果查表取得,样本频率即每个区间的样本数除以样本总数100得到。
(?i?np?i)2?2??2(8?1?2)即则检验统计量?????1.392,由于?np?ii?12m2??2??2(5),若??0.05,则?0.05(5)?16.75,由于1.392?16.75,故接受
H0:P(X)??(x??)2?? exp?2???2?2????1即样本服从正态分布。
二、白菜价格对肯德基套餐价格相关性统计分析
调查得到市场上不同时期的白菜的价格和相应时间某种肯德基套餐的价格如下表所示:
表3.不同时期白菜价格和肯德基套餐价格统计表
白菜价格X 肯德基套餐价格Y 白菜价格X 肯德基套餐价格Y 白菜价格X 肯德基套餐价格Y 3.4 26.2 0.7 14.1 6.1 43.2 1.8 17.8 3 22.3 4.8 36.4 4.6 31.3 2.6 19.6 3.8 26.1 2.3 23.1 4.3 31.3 3.1 27.5 2.1 24 5.5 36 1.1 17.3 样本散点图如下:
价格散点图50403020100024白菜价格68肯德基价格样本点 图3. 价格散点图
1、 使用普通最小二乘法建立一元线性回归方程
?0?y???1x,??1??(xi?i?1n?x)(yi?y)
(xi?i?1n?x)2?0,??1为一元线性回归常数和系数的估计值,根据上表的数据得到 式中的??1?4.919?0?10.278,??
所以回归方程为:y?4.419x?10278
2、 回归方程的显著性检验
(1) t检验
假设H0:?1?0,H1:?1?0
2??1?N(?1,?),因而如果假设H0:?1?0成立的情况下,回归系数 Lxx2??1?N(0,?),构造t统计量t?Lxx?1???Lxx2
1??其中?n?22ei,其中ei为残差;如果假设成立的话t服从自由度为n-2的t?i2?12n分布。若显著性水平为??0.05时,t??2.131
本例中t?12.525?t??2.131,所以拒绝原来的假设,接受H1:?1?0。
2
(2) F检验 F检验构造统计量F?n-2)的F分布。 式中:SR?nSR/1,当假设H0:?1?0成立时F服从自由度为(1,
Se/(n?2)(yi?i?1n?y)2,称为回归平方和;
Se?ei,称为残差平方和。 ?i2?1把以上数据带入得到F?SR/1841.77??156.88?F0.9?3.14
Se/(n?2)69.75/13说明接受H1:?1?0。 3、 残差分析
残差列表如下所示:
表4.
项目 项目 x1 x9 x2 x10 x3 x11 x4 x12 x5 x13 x6 x14 x7 x15 x8 残差 -0.804 -1.333 -1.607 1.508 1.972 -1.334 0.379 -2.736 残差 -3.468 -0.131 3.391 1.611 2.914 2.509 -2.871 画出残差图如下所示
残差图10.0005.000残差0.000-5.000-10.000图4. 残差图
05101520
由残差图可以看出,残差范围基本在0附近波动,范围在(-5,+5)中间,回归
模型满足基本假设。 4、 单点预测
根据回归方程,当白菜价格为x0时,可以预测肯德基套餐的价格为
y0?10.278?4.919x0
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库哈工大研究生数理统计小论文大作业在线全文阅读。
相关推荐: