77范文网 - 专业文章范例文档资料分享平台

SAS方差分析(理论+程序实例)(4)

来源:网络收集 时间:2020-06-17 下载这篇文档 手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:或QQ: 处理(尽可能给您提供完整文档),感谢您的支持与谅解。点击这里给我发消息

输出的结果见表25.4所示:

The SAS System Analysis of Variance Procedure Class Level Information Class Levels Values BRAND 5 ACME AJAX CHAMP TUFFY XTRA Number of observations in data set = 20//20个记录,自由度19 Analysis of Variance Procedure Dependent Variable: WEAR Source DF Sum of Squares//tss Mean Square F Value Pr > F Model 4 0.61700000//组间误差 0.15425000 7.40 0.0017 Error 15 0.31250000//组内误差 0.02083333 Corrected Total 19 0.92950000 R-Square C.V. Root MSE WEAR Mean 0.663798 6.155120 0.14433757 2.34500000 Source DF Anova SS Mean Square F Value Pr > F BRAND 4 0.61700000 0.15425000 7.40 0.0017 Levene's Test for Equality of WEAR Variance ANOVA of Squared Deviations from Group Means//齐性检验 Sum of Mean Source DF Squares Square F Value Pr > F BRAND 4 0.000659 0.000165 0.5310 0.7149 Error 15 0.00466 0.00031 Analysis of Variance Procedure 表25.4 单因素设计的方差分析结果

结果分析:anova过程总是输出两个基本的方差分析表。一个是总体模型的方差分析表,一个是包含模型中各个变量的方差分析。首先输出class语句中规定的每个变量(brand)、分类变量的取值数(5)、具体取值(ACME AJAX CHAMP TUFFY XTRA)以及数据集中的观察个数(20)。

接着anova过程对model语句中每个因变量输出方差分析表。包括:因变量的总平方和(0.9295)、属于模型部分的平方和(0.6170)、属于误差部分的平方和(0.3125)、自由度DF(4、5、19)、模型的均方MS(0.15425=0.617/4)、误差的均方MSE(0.02083333=0.3125/15)、模型的F值(7.40=0.15425000/0.02083333)、分布大于7.40的概率(0.0017)、R2(0.663798=0.617/0.9295)、变异系数CV(6.155120=100×0.0208333、因变量的/2.345)

上海财经大学经济信息管理系IS/SHUFE

Page 16 of 30

标准差(0.14433757=0.0208333)、因变量均值(2.345)。

对模型中的每个效应,anova过程还输出方差分析表。brand自由度DF(4)、平方和(0.617)、均方MS(0.15425=0.617/4)、F值(7.40=0.15425000/0.02083333)、分布大于7.40的概率(0.0017)。

总体F检验是显著的(0.0017<0.05),表明模型是有意义的。品牌brand的F检验也是显著的(0.0017<0.05),表明不同品牌的均值不全相等。这里两个F检验是完全相同的,这仅仅是因为在模型中只有一项brand。注意,我们可以用glm过程替代这个anova过程,能得到相同的方差分析结果。最大区别是glm过程将计算每个效应的类型1和类型3平方和,而anova只计算类型1的平方和。对于单因素和多因素平衡数据来说,anova过程的SS1、glm过程的SS1和SS3都相同。

Levene的 方差齐性检验结果表明:不能拒绝(0.7149>0.05)不同品牌组里观察值的方差是相等的原假设。

最后输出的是每种品牌的观察数、均值和标准差。例如,ACME品牌的观察数为4,均值为2.32500000,标准差为0.17078251。 2. 均值的多重比较和置信区间

例25.2 继续上例的分析。由于品牌brand的F检验是显著的(0.0017<0.05),表明5种不同品牌的均值不全相等,但可能存在某2个或某3个或某4个品牌的均值相同。因此,常需要进一步的均值多重比较和置信区间分析。

程序如下:

proc anova data=study.veneer;

class brand; model wear=brand; means brand /ducan;

means brand /lsd clm cldiff;

run;

程序说明:第一个means语句选用了ducan选项,要求计算输出组间均值比较的新多重极差检验,结果见表25.5(a)。第二个means语句选用了lsd clm选项,对所有组均值进行两两t检验,输出各组均值的置信区间,结果见表25.5(b)。第二个means语句还选用了lsd cldiff选项,将对各组间均值之差采用最小显著差检验,输出各组间均值之差的置信区间,结果见表25.5(c)。

表25.5(a) Duncan的新多重极差检验

上海财经大学经济信息管理系IS/SHUFE

Page 17 of 30

The SAS System Analysis of Variance Procedure Duncan's Multiple Range Test for variable: WEAR NOTE: This test controls the type I comparisonwise error rate, not the experimentwise error rate Alpha= 0.05 df= 15 MSE= 0.020833 Number of Means 2 3 4 5 Critical Range .2175 .2280 .2346 .2390 Means with the same letter are not significantly different. Duncan Grouping Mean N BRAND A 2.6000 4 TUFFY A B A 2.3750 4 XTRA B A 表25.5(a)中结果分析:注意到各组均值按大到小排列(2.60,2.375,2.375,2.3250,2.0500),在标题“Duncan Grouping”下是一系列字母A、B、C,如果均值间差异不显著标上相同的字母,否则标上不同的字母。对于Duncan多重极差检验来说,5个均值之间的比较,只要看最大的均值与最小的均值之差的是否大于临界值0.239,因为2.600-2.050=0.55>0.239,则为显著,所以品牌TUFFY的均值不同与AJAX,应该标识不同的字母。因为存在5个均值之间最大差的显著性,接下来就需要比较4个均值之间差的显著性,临界值为0.2346。2.600-2.325=0.275>0.2346,显著,2.375-2.050=0.325>0.2346,显著,只要存在一个显著性,就需要继续比较3个均值之间差的显著性。虽然,均值2.600、2.375和2.375之间的差小于0.2280,均值2.375、2.375和2.325之间的差也小于0.2280,但由于存在2.375-2.050=0.325>0.2280,显著,继续比较2个均值之间差的显著性。2.600-2.375=0.225>0.2175,显著,2.325-2.050=0.275>0.2175,显著,其他相邻两均值比较不显著。

表25.5(b) 各组均值的t检验置信区间

T Confidence Intervals for variable: WEAR Alpha= 0.05 Confidence= 0.95 df= 15 MSE= 0.020833 Critical Value of T= 2.13 Half Width of Confidence Interval= 0.153824 Lower Upper BRAND N Confidence Mean Confidence Limit Limit TUFFY 4 2.44618 2.60000 2.75382 XTRA 4 2.22118 2.37500 2.52882 表25.5(b)中结果分析:均值t分布的95%置信区间的一半宽度为0.153824,因此TUFFY品牌均值置信区间的下限为2.600-0.153824=2.44618,上限为2.600+0.153824=2.75382。其他品牌均值的置信区间计算,同样是均值加减0.153824而得到的。

表25.5(c) lsd最小显著差检验

上海财经大学经济信息管理系IS/SHUFE

Page 18 of 30

The SAS System T tests (LSD) for variable: WEAR NOTE: This test controls the type I comparisonwise error rate not the experimentwise error rate. Alpha= 0.05 Confidence= 0.95 df= 15 MSE= 0.020833 Critical Value of T= 2.13145 Least Significant Difference= 0.2175 Comparisons significant at the 0.05 level are indicated by '***'. Lower Difference Upper BRAND Confidence Between Confidence Comparison Limit Means Limit TUFFY - XTRA 0.0075 0.2250 0.4425 *** TUFFY - CHAMP 0.0075 0.2250 0.4425 *** TUFFY - ACME 0.0575 0.2750 0.4925 *** TUFFY - AJAX 0.3325 0.5500 0.7675 *** XTRA - TUFFY -0.4425 -0.2250 -0.0075 *** XTRA - CHAMP -0.2175 0.0000 0.2175 XTRA - ACME -0.1675 0.0500 0.2675 XTRA - AJAX 0.1075 0.3250 0.5425 *** CHAMP - TUFFY -0.4425 -0.2250 -0.0075 *** CHAMP - XTRA -0.2175 0.0000 0.2175 CHAMP - ACME -0.1675 0.0500 0.2675 CHAMP - AJAX 0.1075 0.3250 0.5425 *** ACME - TUFFY -0.4925 -0.2750 -0.0575 *** 表25.5(c)中结果分析:注意在显著水平为0.05上,两两比较的最小显著差为0.2175,如果显著则被标上“***”。例如,TUFFY均值减XTRA均值=2.600-2.375=0.225>0.2175,显著。综合分析的结果表明,AJAX品牌均值显著与其他品牌均值不同,且为最小的均值;TUFFY品牌均值也显著与其他品牌均值不同,且为最大的均值;XTRA、CHAMP、ACME三个品牌均值之间无显著差异。 3. 有计划的均值比较和参数估计

例25.3 继续上例的分析。有时在实际情况中,多重比较要按某种分类标准来进行,例如,假设我们知道5种品牌的制造商情况,品牌ACMX、AXAX和CHAMP来自美国U.S.制造商,而品牌TUFFY和XTRA来自非美国non-U.S.制造商。如果我们有兴趣比较美国品牌的均值与非美国品牌的均值是否有差异。

程序如下:

proc glm data=study.veneer;

class brand; model wear=brand;

contrast 'US vs NON-U.S.' brand 2 2 2 -3 -3;

上海财经大学经济信息管理系IS/SHUFE

Page 19 of 30

estimate 'US vs NON-U.S.' brand 2 2 2 -3 -3;

run;

程序说明:使用contrast语句来产生有计划的均值比较分析和使用estimate语句进行参数估计。注意在anova过程中没有这两条语句,必须使用glm过程。使用contrast语句前,应该首先表达出所关心的均值线性组合的原假设,如

H0:1/3(?ACME??AJAX??CHAMP)?1/2(?TUFFY??XTRA) 等价于H0:2(?ACME??AJAX??CHAMP)?3(?TUFFY??XTRA)?0contrast语句的三个基本参数,一是标签('US vs NON-U.S.'),二是效应名(brand),三是效应的数字系数表(2 2 2 -3 -3)。应特别注意的是,数字系数的次序是匹配分类变量按字母数字次序的水平值。事实上,均值线性组合的系数同样是model语句中效应参数组合的系数,这是因为,?i????i,将它们分别代入均值线性组合后,可得到

2(?ACME??AJAX??CHAMP)?3(?TUFFY??XTRA)?2(???ACME????AJAX??CHAMP??XTRA)?3(???TUFFY????XTRA) ?2(?ACME??AJAX??XTRA)?3(?TUFFY??XTRA)所以,estimate语句的使用格式与contrast语句非常类同。

输出的主要结果见表25.6所示:

表25.6 有计划的均值比较和参数估计

The SAS System Contrast DF Contrast SS Mean Square F Value Pr > F US vs NON-U.S. 1 0.27075000 0.27075000 13.00 0.0026 T for H0: Pr > |T| Std Error of Parameter Estimate Parameter=0 Estimate 表3.16中结果分析:显示了美国品牌均值与非美国品牌均值比较的平方和为0.27075,F值为13=0.27075/0.020833,这个F(1,15)分布F值大于13的概率为0.0026小于0.05,因此原假设是显著的,拒绝接受,即美国品牌均值与非美国品牌均值是不同的。效应组合的参数估计为-1.425=3×(2.325+2.050+2.375)-2×(2.600+2.375),对于原假设参数是否为0的t检验,t统计量为-3.60,概率为0.0026小于0.05,拒绝接受。注意到t检验的p值为0.0026,与对比分析的F检验的p值相同,这是因为两种检验是相同的,F值等于t的平方。 4. 随机单位组试验设计的方差分析

例25.4 某食品公司对一种食品设计了四种包装。为了考察哪种包装最受欢迎,选了十个有近似相同销售量的商店作试验,其中两种包装各指定两个商店,另两种包装各指定三个商店销售。在试验期中各商店的货架排放位置、空间都尽量一致,营业员的促销方法也基本相同。观察在一定时期的销售量,数据见表25.7所示。试比较四种包装的销售量是否一致。

表25.7 四种包装在10个商店中的销售量

包装类型 (treat) A1 A2 商店(block) 1 12 14 2 18 12 3 13 商店数 n 2 3 Page 20 of 30

上海财经大学经济信息管理系IS/SHUFE

百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库SAS方差分析(理论+程序实例)(4)在线全文阅读。

SAS方差分析(理论+程序实例)(4).doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印 下载失败或者文档不完整,请联系客服人员解决!
本文链接:https://www.77cn.com.cn/wenku/zonghe/1105869.html(转载请注明文章来源)
Copyright © 2008-2022 免费范文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ: 邮箱:tiandhx2@hotmail.com
苏ICP备16052595号-18
× 注册会员免费下载(下载后可以自由复制和排版)
注册会员下载
全站内容免费自由复制
注册会员下载
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: