120540、120547、120588、120935。 2、体重对体质健康影响的分析
本题要求出体重对体质健康的影响,而体质健康是一个抽象的概念,根据题目中所给出的测试项目,本文把体质健康看成是身高、肺活量、跳远等6项的综合成绩的体现。体重对体质健康的影响就体现在体重对其他五项测试的相关性上。
根据常识,正常体型的人体重越重应该越健康,而偏胖体型的人群中,恰恰相反,越重越不健康。所以,在求解过程中若直接将所有人根据体重的数值来考虑其健康状况就较为片面。例如,某人过矮而又偏胖,他的体重与某一正常人的体重直接比较未免有失偏颇。为了得出更科学的数据,我们应该先将依据体型将学生分类。身体质量指数(BMI)是目前国际上普票普遍采用的判断身体形态的标准,计算公式如下:
2 身体质量指数(BMI)?体重(kg)?身高(m)根据以上公式的计算数据及世界卫生组织的规定,我们将学生划分为3个等级:过轻、正常、超重,并以此为标准进行相关的分析与研究,判断标准见表1:
表1 男女身体质量指数划分表 男 女 过轻 <20 <18 正常 20-24 18-22 超重 >24 >22 3、计算相关系数 当体重变化时,引起体质健康的变化具体表现为各指标值得变化,所以要分析体重对体质健康的影响,也就是分析各因素与体重之间的相关关系。本题中通过积差相关系数中的Pearson简单相关系数来判断相关关系。相关系数计算公式为:
r?
??x?x??y?y?iii?1n??xi?x???yi?y?i?1i?1n2n (1)2
其中,r表示相关系数,n表示样本数,xi和yi分别表示两变量的变量值,x和y分
别为表示变量的平均值。
由公式(1)可以求出各指标与体重之间的相关系数。通过相关系数矩阵可以判断原始变量之间是否存在相关关系,并直观地反应哪些变量具有较强的相关性,运用SPSS软件,得出结果见表2:
表2 各指标与不同BMI等级的体重之间相关系数 身高 肺活量 台阶 握力 坐位体前屈 立定跳远 偏瘦 男 0.811 0.369 0.197 0.279 0.234 女 0.899 0.611 -0.083 0.573 0.458 男 0.788 0.403 0.286 0.327 0.236 正常 女 0.762 0.232 0.043 0.131 0.06 男 0.564 0.243 0.004 0.042 0.042 超重 女 0.595 0.316 -0.081 -0.102 -0.135 注:测试中握力这一项测试只针对于男生,坐位体前屈这一项测试只针对于女生。 从表2可以看出:
(1)身高与体重具有很强的相关性,相同体型的人群中体重越高,身高一般也越高。 (2)肺活量与体重的相关系数较高。在偏瘦的大学生中,男女生都呈较为显著的相关
4
性,说明偏瘦的人越重,肺活量越高;体型正常及偏胖的大学生中肺活量与体重有较强相关性,且体型正常的人群中男生相关性比女生更高,而超重人群中女生更高。 (3)台阶试验是一种有效的心血管功能及心肺机能运动负荷试验,与体重相关性较弱。
不过我们仍能从上表得出台阶测试的先关性随体重的增加相关性越来越小,最后甚至呈负相关,说明越胖心肺机能越差。
(4)握力体重指数与体重在偏瘦及正常的大学生中呈显著地正相关,反映了男大学生
的前臂和手部肌肉的力量随着体重的增大而增大。而超重的大学生则几无相关性。 (5)偏瘦的女生中坐位体前曲与体重相关性显著,而体型正常及偏胖的女生则几无相
关性。同台阶测试一样,我们一样发现越胖,坐位体前屈越差。
(6)立定跳远与体重存在一定的相关性。偏瘦的大学生立定跳远与体重相关性显著,
而体型正常及超重的人立定跳远相关性有所减弱。立定跳远是反应下肢相对爆发力大小的指标。随着体重超出正常范围值的增加,大学生下肢的相对爆发力逐渐较小。 综上所述:体重对体质健康是有影响的,其中对身高、肺活量的影响最大。 5.1.2检验测试结果的正确性和准确性
在对大样本的测试过程中,不可避免的存在一定的误差,因此需要检验测试结果的正确性,这是提高数据质量的重要措施和关键环节,也是统计工作的重点和难点。
首先,本文先分析测试结果出现偏差的可能原因。在假设测试机械结果一切正常可信的条件下,无非有以下三点可能的原因:学生发挥失常、出现冒名顶替、操作员数据输入错误。
接着,本文对每种出现偏差的原因找出其应对方法。在这之前本文先引出两个准确可信的大样本数据应该具有的性质: 1、正态分布性
由于与自然相关的事物大多是近似正态分布,例如人的身高分布、体重分布等,所以这6组中的不同指标也应该服从正态分布。因此测试结果的正确性也就是检测数据的正态分布性,将不满足统计规律的数据剔除。
检验数据的正态分布性有多种方法:频数分布直方图、Q-Q图、P-P图等。本文利用SPSS软件,对1000多学生的测试数据绘制Q-Q图,检验其正态分布性,剔除异常值。Q-Q图是以样本的分位数作为横坐标,以按照正态分布计算的相应分位点作为纵坐标,把样本表现为指标坐标系的散点。如果资料服从正态分布,则样本点应该呈一条围绕第一象限y?x曲线附近。
x?x其横坐标Qi?i ,xi为观测值,x为平均值,?为标准差。由Qi的计算式,本
?文得出,它与xi呈线性关系,只需找到远离y?xxi过大或过小都导致Qi远离直线y?x。的点我们就能找出异常点。此方法可以找出操作员输入错误的点。
对于问题的具体解决,本文首先仍按照上文的做法将男女大学生分为偏瘦、正常、超重,共6组数据。
下面那以男生正常组肺活量正态Q-Q图为例,如图1所示:
5
图1 男生正常组的肺活量正态Q-Q图 观察图1,可以发现男生正常组的肺活量大致服从正态分布,但有4个点明显不满足统计规律,远离数据正态分布所对应的位置,需要将其剔除。
按照此种方法绘制这6组的所有Q-Q图(见附录一),可以得出所有样本至少有22个异常值(图中的点可能有重复)。由于本题只要求判断1、2、3班测试结果的正确性,所以对22个数据进行筛选,最终得出1、2、3班的异常值分别为120011;120053、120055;120082。 2、稳定性
在上文的基础上我们不难得出,对于与体重相关性较大的项目,身体质量指数BMI大致相同的人其测试项目的值浮动范围应较为集中,若有某项数值过大过小的情况,即有可能为虚假信息。按此方法可以找出发挥失常以及冒名顶替的学生。
以男生的握力体重指数为例,绘制握力体重指数与BMI关系图,如图2所示:
握力体重指数与BMI关系图 握力体重指数1201008060402001520253035BMI40男生:握力体重指数;图2 握力体重指数与BMI的关系
观察图2,发现某些点的握力体重指数过高或者过低,可能存在虚假信息。按照此种方法分别绘制4个指标(女生的坐位体前屈与体重相关性不大故略)与BMI的关系图找出所有的异常点,共找出了48个异常点。也就是说最多有48个人的数据不可信(具体名单见附录2)。最后进行筛选,得出1、2、3班的异常值为:120004、120017;120059;120082。
3、异常值检验
按常理来说,如果某人肺活量高,握力强,那么他的跳远成绩也应该不会太差;反
6
之,某人肺活量低,握力小,那么他的跳远成绩也不应该很好。即人的各项测试成绩应该具有相关性。通过数据的以上2种分布特性,可以找出过大或过小值,即异常点。但不排除某些学生的各项身体素质都较好,所以需要对前两个步骤踢出的7个异常值进行检验。按Q-Q的结果,1班的120011台阶测试值过高,但我们观察其他测试项目的值也颇高,反应了该为同学的体育素质较好,并非异常点。这样的疑似异常点还有120131、120225、120481、120662、120923。这些人所有测试的结果都很好,本文认为是他们身体素质过硬的缘由造成,因此他们予以保留。
综上所述,全校共发现48名学生的测试结果不可信。具体名单见附录二。其中1、2、3,3个班共有6个测试结果不正确。分别为: 1班:120017台阶测试偏小,120004台阶测试偏小;
2班:120053台阶测试偏小,120055台阶测试偏多,120059坐立体前曲偏小; 3班:120082立定跳远值偏小。 5.2问题二的模型建立与求解 5.2.1生源的选取
附表1中共有1069个样本,这1069名学生来自8个不同的区域。为了保证选取的数据具有代表性,所以先要对数据进行预处理,剔除异常值,即采用问题一中剔除后的样本数据。又由于不同BMI值的学生的体能健康差异较大,若直接选取,会对最后验证显著性差异有一定的影响,所以在采用剔除后的样本数据时,需要将样本分为6组:男偏瘦、男正常、男超重;女偏瘦、女正常、女超重。最后,运用excel中的rand函数对这6组数据随机选取,根据选取出来的数字先按性别分类,再按区域号进行排序。 5.2.2检验显著性差别
对于这8个区域,每一个区域都可以看成一个独立样本,且每一个区域的各项指数可近似认为服从正态分布,所以可以采用独立样本T检验[3],将每两个区域的所有指标差异性进行比较。所谓T检验,亦称studentt检验(Student'stest),其主要用于样本量含量较小的情况,例如n?30。所以在用rand函数随机选取时,每组只需选取30个,对于数据量较小的组别,则采取所有样本。
两独立样本T检验就是根据样本数据对两个样本来自的总体的均值是否有显著性差异进行推断。从两研究总体中随机抽取样本,在对这两个样本进行比较的时候,首先需要判断两总体方差是否相同,即方差齐性检验。若两总体方差相等,则直接用t检验。若不等,可采用t'检验或变量变换或秩和检验等方法。下面以男生组的第一、第二区域的身高指标为例,具体步骤如下: 1、判断总体方差是否相等(F检验)
(1)首先,提出假设(SPSS默认零假设为两总体方差相等)即,假设如下:
2,即两总体方差相等 H0:?12??22 H1:?12??2,即两总体方差不相等
(2)计算检验统计量F
22(x?x)S大? F?2 ,其中S2?n?1S小(3)根据给定的显著水平?确定临界值,或者计算F值所对应的P值
P值即概率,反应某一事件发生的可能性大小。统计学根据显著性检验方法所得到的P值,一般以P?0.05为显著,P?0.01为非常显著。P值仅反应两组差别有无统计学
7
意义,并不表示差别大小。 (4)做出统计决策
若F值所对应的P值<显著水平???0.05?,则认为两总体方差不等。 若F值所对应的P值>显著水平???0.05?,则认为两总体方差相等。
对于男生组的1,2区域中的身高指标,其P值为0.861>0.05,所以认为两个总体的方差相等。
2、构造t统计量
判断方差是否相等,是进行何种T检验的前提。
(1)若两总体方差未知且相等,则采用T检验,统计量t为:
x1?x2t??t?n1?n2?2?
22SP/n1?SP/n2n1?n2?2(2)若两总体方差未知且不等,可采用t'检验或变量变换或秩和检验等方法。
对于本题,两个总体的方差时相等的,所以只需采取T检验。运用SPSS软件得出1,2区域内的身高指标的t统计量值为0.727。 3、决策判断。
求出T值所对应的P值,并与显著性水平进行比较。
若P<显著水平???0.05?,则拒绝原假设H0,即认为两总体均值存在显著性差异。
若P>显著水平???0.05?,则接受原假设H0,即认为两总体均值不存在显著差异。 由于t?0.727???0.05,所以男生组,一二区域的身高指标不存在显著性差异。 运用此种方法,可以得出男生组的1,2;1,3;1,4区域的6项指标的差异性对比,见表3
表3 男生组部分区域6项指标差异性对比 身高 体重 肺活量 台阶测试 握力指数 立定跳远 1-2组 1-3组 1-4组 其中,S2P2n1?1?S12??n2?1?S2? ?P1 0.861 0.352 0.279 0.866 0.222 0.216 P2 0.727 0.758 0.432 0.899 0.035 0.454 P1 0.256 0.946 0.278 0.533 0.031 0.134 P2 0.485 0.481 0.709 0.908 0.120 0.057 P1 0.492 0.703 0.309 0.262 0.03 0.644 P2 0.4 0.930 0.670 0.595 0.479 0.814 注:P1指在F检验中,检验统计量F所对应的的P值; P2指在T检验中,检验统计量t所对应的的P值。
观察表2,我们发现,在这3组区域指标差异性对比中,只有1-2组的握力指数存在显著性差异,其他各组指标都不存在显著性差异。男生组剩余各组的差异性对比及女生组的差异性对比存在见附录三。
综合以上8个区域,每2个区域的差异性对比,可以发现存在显著差异性的组别如下:
男:1-2组握力指数;1-8组握力指数;
女:1-2组的肺活量指数、台阶测试指数;1,3组的肺活量指数、台阶测试指;
8
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库大学生体质健康评价问题-2013年苏北数学建模联赛 A题(2)在线全文阅读。
相关推荐: