③ 嵌套模型
Model y=a b c(a b);
④ 包含嵌套、交叉和主效应的模型 Model y=a b(a) c(a) b*c(a); Model语句的选项列表有:
int——打印与截距有关的假设检验结果。anova过程总是把截距作为模型的一个效应进行处理,缺省时,不打印结果。
? nouni——不打印单变量分析结果。 4) means 语句。
该语句是用来计算在means语句后列出的每个效应所对应的因变量均值。Anova过程可以对出现在model语句等号右边的任一效应计算因变量的均值。不过这些均值没有针对模型中的效应进行修正。如果需要修正的均值,应该调用glm过程,使用其中的lsmenas语句。在anova过程里可以使用任意多个means语句,它们放在model语句后面。
Means语句的选项列表主要有两个内容,一是选择多重比较的检验方法,二是规定这些检验的细节,注意这些细节选项只能用于主效应。
① 多重比较的检验方法
? bon——对所有主效应均值之差进行Bonferroni的t检验。 ? duncan——对所有主效应均值进行Duncan的多重极差检验。
? dunnett<(‘格式化对照值’)>——进行Dunnett的双尾t检验。用以检验对所有主效应均值的某个水平作为对照,处理有无显著差异。为了规定这个对照效应的水平,在括号内用单引号把这个水平的格式化值括起来。缺省时,效应的第一个水平作为对照。
? dunnettl<(‘格式化对照值’)>——进行Dunnett的单尾t检验。它检验是否任一个处理显著地小于这个对照。
? dunnettu<(‘格式化对照值’)>——进行Dunnett的单尾t检验。它检验是否任一个处理显著地大于这个对照。
? gabriel——对所有主效应均值进行Gabriel的多重对比检验。
? regwf——对所有主效应均值进行Ryan-Einot-Gabriel-Welsch的多重F检验。 ? regwq——对所有主效应均值进行Ryan-Einot-Gabriel-Welsch的多重极差检验。 ? scheffe——对所有主效应均值进行Scheffe的多重对比检验。 ? sidak——对所有主效应均值水平依据Sidak不等式进行调整后,对其均值之差两两进行t检验。
? Smm|gt2——当样本量不等时,基于学生化最大模和Sidak不相关t不等式,等到Hochberg的GT2方法,对主效应均值进行两两对比检验。
? snk——对所有主效应均值进行Student-Newman-Keuls的多重极差检验。
? t|lsd——对所有主效应均值进行两两t检验,它相当于在单元观察数相等时Fisher的最小显著差(Fisher’s least-significant-difference)检验。
? tukey——对所有主效应均值进行Tukey的学生化极差检验。
? waller——对所有主效应均值进行Waller-Duncan的k比率(k-ratio)检验。 ② 多重比较的检验细节
? alpha=p——给出均值间对比检验的显著性水平。缺省值是0.05。 ? cldiff——要求把两两均值之差的结果用置信区间的形式输出。 ? clm——对变量的每个水平的均值按置信区间形式输出。
? e=效应——指定在多重对比检验中所使用的误差均方。如果缺省,使用残差均方(MS)。指定的效应必须是在model语句中出现过的效应。
上海财经大学经济信息管理系IS/SHUFE
Page 11 of 30
? kratio=值——给出Waller-Duncan检验的类型1/类型2的误差限制比例。Kratio的合理值为50、100、500,大约相当于两水平时alpha值为0.1、0.05、0.01。缺省值为100。
? lines——按下降次序列出所有检验方法产生的均值,并用一条线段在均值旁指出非显著的子集。
? hovtest——要求输出组间方差齐性的Levene检验。 5) test语句
? 在分析中,如果这个语句缺省,仍然使用残差均方(MS)作为误差项对所有平方和(SS)计算F值。但用户可以使用本语句要求使用其他效应作为误差项,得到另外的F检验。可以使用多个test语句,把它们放在model语句后面。Test语句的选项为:
? h=效应——规定模型里哪些效应用来作为假设的效应。
? e=效应——规定一个而且只能是一个效应用来作为误差项,这个说明项是必须的。 2. glm过程的语句格式
proc glm是分析符合一般线性模型(General Linear Models)的数据,因此取名GLM。它能被用在许多不同的分析中,如简单回归、多元回归、方差分析、协方差分析、加权回归、多项式回归、偏相关分析、多元方差分析等。
在glm过程中的大多数方差分析的语句和选项与anova过程中基本相同。用anova过程编写的程序几乎不用修改就可在glm过程中运行。glm过程仅仅是附加了三条语句:contrast、estimate和lsmeans。contrast和estimate语句允许你测试和估计均值的某种功能。lsmeans语句允许你计算调整后的均值。
glm过程的主要控制语句如下:
proc glm 输入数据集名 <选项列表> ;
class 变量列表 ;
model 因变量列表=自变量列表 选项列表>; contrast ‘标签’ 效应 值表 选项列表>; estimate ‘标签’ 效应 值表 选项列表>; lsmeans 效应列表 选项列表> ; means 效应列表 选项列表> ;
output
其中class语句、model语句是必需的,而且class语句必须出现model语句之前。其他语句必须放在model语句之后。下面主要介绍与anova过程相比不同的语句和新增加的语句。 1) model语句。
在glm过程的model语句中可以使用几种不同效应,下面是使用这些效应的几个例子,a、b和c代表分类变量;y1、y2、x1和x2代表连续变量。
Model y=x1; (简单回归) Model y=x1 x2; (多重回归) Model y=x1 x1*x1; (多项式回归) Model y1 y2=x1 x2; (多元回归)
Model y=a; (单因素方差分析) Model y=a b c; (主效应模型) Model y=a b a*b; (因素模型) Model y=a b(a) c(b a); (嵌套模型)
上海财经大学经济信息管理系IS/SHUFE
Page 12 of 30
Model y1 y2=a b; (多元方差分析模型) Model y=a x1 (协方差分析模型)
Model语句的主要选项有(与anova过程中的model语句选项相同不再列出): ? solution——打印正规方程的解,即参数估计值。
e1/e2/e3/e4——打印模型中每一效应的类型1/类型2/类型3/类型4的可估函数,并计算相应的平方和。
ss1/ss2/ss3/ss4——对每个效应,打印与类型1/类型2/类型3/类型4的可估函数相关的平方和。
alpha=0.01/0.05/0.1——指定置信区间的?水平。缺省值为0.05。
cli/clm——打印每一观察的预测值/预测均值的置信限,两者不能同时使用。 p——打印自变量没有缺失值的每一观察值、预测值和残差值。同时还打印Durbin-Waston统计量。
xpx——打印叉积矩阵X?X。
i——打印矩阵X?X的逆矩阵或广义逆矩阵。 2) contrast语句。
提供一种获得一般假设检验的技巧。其中,效应可以是截距,用字符intercept表示。通过规定L向量或M矩阵来构造一元假设检验L??0或多元假设检验L?M?0。例如,当发现某两个因素的交互作用项有显著性时,我们可用本语句来实现一个因素被控制在某水平上,对另一个因素的各水平间进行两两比较的目的。
设M因素有三个水平a、b、c,V因素有两个水平1、2,且M?V有显著性。如果我们要比较
?a?(?b??c)
的差异,那么有几种不同的比较方法:
① 在因素V的每一个水平上,分别比较因素M的三个水平a、b、c均值的之间的线
性关系假设是否显著。也即
12H0:?a1?0.5?b1?0.5?c1?0和H0:?a2?0.5?b2?0.5?c2?0。
② 在因素V平均的所有水平上,比较因素M的三个水平a、b、c均值的之间的线性
关系假设是否显著。也即
H0:0.5(?a1?0.5?b1?0.5?c1)?0.5(?a2?0.5?b2?0.5?c2)?0。
③ 在因素V平均的子集上,比较因素M的三个水平a、b、c均值的之间的线性关系
假设是否显著。也即
H0:(?a1?0.5?b1?0.5?c1)?(?a2?0.5?b2?0.5?c2)?0
glm模型为双因素试验设计的方差分析指定了下面的效应公式
?ij????i??j?(??)ij
(25.25)
其中?ij是因素Mi水平与因素Vj水平在ij单元上所有观察值的平均。?为总平均。?i是因素M在i水平上的主效应,?j是因素V在j水平上的主效应,(??)ij为因素M和因素V上海财经大学经济信息管理系IS/SHUFE
Page 13 of 30
在ij水平上的交互效应。因此,对任一观察值有
yijk??ij??ijk????i??i?(??)ij??ijk (25.26)
因此,根据单元均值给出的线性组合可以转换成效应模型的合并参数形式,即L??0,如
?a1?0.5?b1?0.5?c1????a??1?(??)a1?0.5??0.5?b?0.5?1?0.5(??)b1 ?0.5??0.5?c?0.5?1?0.5(??)c1??a?0.5?b?0.5?c?(??)a1?0.5(??)b1?0.5(??)c1同理
?a2?0.5?b2?0.5?c2??a?0.5?b?0.5?c?(??)a2?0.5(??)b2?0.5(??)c2
相应的glm过程的语句为
proc glm ;
class M V ; model Y=M V M*V;
contrast ‘a vs b,c in v1’M 1 -0.5 -0.5 M*V 1 0 -0.5 0 -0.5 0; contrast ‘a vs b,c in v1’M 1 -0.5 -0.5 M*V 0 1 0 -0.5 0 -0.5; run ;
Contrast语句中的可选项: e——打印整个L向量。
e=效应——规定模型中的某个效应作为误差项。过程将把这一效应作为单变量F检验的分母。如果缺省,过程把均方误差(MSE)作为误差项。
etype=n——指明e=效应的类型(1、2、3、4)。如果指明e=而没有指明etype=,则使用最高类型。
3) Estimate语句
可用来估计参数的线性函数,通过用参数的估计b乘以向量L来得到Lb。其中
b?(X?X)?X?Y。Estimate语句的使用格式同contrast语句。
estimate语句中的可选项: e——打印整个L向量。
divisor=数字——为简便地输入效应的系数而规定的一个值,用该值除以所有系数使得分数系数可以作为整数输入。例如
estimate ‘1/3(a+b)-2/3c’ M 1 1 -2 /divisor=3; 可替代
estimate ‘1/3(a+b)-2/3c’ M 0.33333 0.33333 -0.66667; 4) Lsmeans语句
计算列在语句中的每一效应的最小二乘均值(LSM)。最小二乘均值估计是针对非均衡数据设计的,而类和子类的算术平均值是针对均衡数据设计的。
lsmeans语句中的可选项:
cov——在选项out=指明的输出数据集中输出协方差。 e——打印用以计算最小二乘均值的可估函数。
上海财经大学经济信息管理系IS/SHUFE
Page 14 of 30
e=效应——规定模型中的某个效应作为误差项。 etype=n——指明e=效应的类型(1、2、3、4)。
out=输出数据集名——产生一个包含LSM值、标准差及协方差的输出数据集。 pdiff——打印假设检验H0:LSM(i)?LSM(j)的所有可能的概率值。 stderr——打印LSM的标准差和H0:LSM?0的概率值。
tdiff——打印假设检验H0:LSM(i)?LSM(j)的t值和相应的概率值。
pdiff=all/control/conroll/controlu——打印最小二乘均值之差的概率值。
adjust=bon/dunnett/scheffe/sidak/smm/gt2/tukey/t——要求多重比较对最小二乘均值之差的概率值和置信限进行调整。缺省值为t。
slice=效应——通过规定的这个效应来分开交叉的LSM效应。例如,假定交叉项A*B是显著的,如果想对B的每个效应检验A的效应,使用下面语句:
lsmeans A*B /slice=B;
八、 实例分析
1. 单因素试验设计的均值比较
例25.1 考虑在5种不同品牌的人工合成胶合板材料上进行磨损时间测试,每种品牌的材料做四次试验,且都是采用的同一种磨损措施,所有的试验都是在完全随机的顺序下在相同的机器上完成的。
程序如下:
data study.veneer;
input brand $ wear @@; cards;
ACME 2.3 ACME 2.1 ACME 2.4 ACME 2.5 CHAMP 2.2 CHAMP 2.3 CHAMP 2.4 CHAMP 2.6 AJAX 2.2 AJAX 2.0 AJAX 1.9 AJAX 2.1 TUFFY 2.4 TUFFY 2.7 TUFFY 2.6 TUFFY 2.7 XTRA 2.3 XTRA 2.5 XTRA 2.3 XTRA 2.4 ;
proc anova data=study.veneer;
class brand; model wear=brand; means brand;
means brand /hovtest; //方差齐性检验
run;
程序说明:因为数据仅仅是按照brand值分类,所以在class语句中这是仅有的一个变量。变量wear是被分析的因变量,故wear出现在model语句等号的左边。在方差分析表中,除了总方差和误差外,方差的来源仅仅是由于各种不同brand值的变异造成的,因此brand出现在model语句等号的右边。Means语句计算主效应brand不同水平所对应的因变量均值,选项hovtest计算不同品牌组方差齐性的假设检验。
上海财经大学经济信息管理系IS/SHUFE
Page 15 of 30
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库SAS方差分析(理论+程序实例)(3)在线全文阅读。
相关推荐: