第三部分 试验设计与数据分析方法
对于化工、化学、制药、生物、材料等学科专业,经常要通过实验与观测来找寻研究对象的变化规律,通过对规律的研究来达到各种目的,如提高产量、提高性能、降低各类消耗等。通过科学的试验设计,能够用较少的试验次数达到预期的试验目的,大大节省人力和物力的消耗;随之进行合理的分析和处理伴随试验过程所产生的大量数据,才能获得研究对象的变化规律,达到科研和生产的目的。本章在《分析化学》的基本实验数据处理的基础上,重点介绍最常用的正交试验设计法和正交实验数据的两种基本分析方法:极差分析法、方差分析法。 一、正交试验设计
在科学研究和工业生产实践中往往需要考虑众多影响因素,需要研究多个因子对试验指标值的效应。通常因素的水平数常多于2个,尽管多因素完全方案可以综合研究各因子的简单效应、主效应及因子间的交互效应,但是,当试验因子数增多或因子的水平数增加时,往往会使试验方案的规模过大而难以全面实施,当各因素的水平数相同,均为m时,因素数k与试验次数n的关系为n=m,例如对于3因素4水平的试验如果进行每个因素的每个水平均进行水平组合进行全面试验至少要做43=64次试验,如果是5因素4水平的试验,进行全面试验至少为45=1024次试验,随着因素数的增加,试验次数增加的更快,同时带来大量的待分析试验数据。
实践证明,正交试验设计(简称正交设计)就是在保证因素水平搭配均衡的前提下,利用已经制成的一系列正交表从完全方案中选出若干个处理组合以构成部分实施方案,从而减小试验规模,并保持效应综合可比之特点。在实际操作中,通过利用正交表科学安排设计试验,在不影响全面了解对象中诸多因素对其性能指标影响的条件下,大大减少试验次数,同时也减少了统计分析的工作量,达到了提高试验效率的目的。 1. 正交表类型和特点 (1) 正交表的格式
在正交试验设计中,常把正交表写成表格的形式。为使用方便,便于记忆,正交表的名称一般简记为
Ln(m1×m2×?×mk),
其中L为正交表代号,n代表正交表的行数或试验处理组合数,即利用该正交表安排试验时,应实施的试验处理组合数;m1×m2×?×mk表示正交表共有k列(最多可安排的因素数),每列的水平数分别为m1,m2,?,
kmk。任何一个名为Ln(m1×m2×?×mk)的正交表都有一个对应的表格,用于安排试验方案和分析试验结果。
(2) 正交表的类型
正交表是一种特殊的表格,它是正交设计中安排实验和分析测试结果的基本工具,可分为两种表格,分别是等水平正交表、混合水平正交表。 ① 等水平正交表
在Ln(m1×m2×?×mk)中,若m1=m2=?=mk,则称为等水平正交表,简记作Ln(mk),其中L为正交表代号,
n为正交表横行数(需要做的试验次数),m为水平数,k为因素数正交表纵列数(能安排的最多因素数)。
常用的等水平正交表如下:
二水平正交表:L4(23),L8(27),L16(215),? 三水平正交表:L9(34),L27(313),L81(341),? 四水平正交表,L16(45),L64(421),? 五水平正交表:L25(5),L125(5),? 如表3-1是一个常用的等水平正交表。
表3-1 正交表L9(3)
试验号 1 1 2 1 1 2 1 2 列号 3 1 2 4 1 2 4
6
31
3 4 5 6 7 8 9
1 2 2 2 3 3 3 3 1 2 3 1 2 3 3 2 3 1 3 1 2 3 3 1 2 2 3 1 表3-1中L9(34)表示4因素3水平试验,按照正交表设计试验次数为9次,如果进行全面试验至少要做64次,可见正交设计大大减少了试验次数。 ② 混合水平正交表
表3-2 正交表L8(4×2)
列号 试验号 1 2 3 4 5 6 7 8 1 1 1 2 2 3 3 4 4 2 1 2 1 2 1 2 1 2 3 1 2 1 2 2 1 2 1 4 1 2 2 1 1 2 2 1 5 1 2 2 1 2 1 1 2 1
4
在Ln(m1×m2×?×mk)中,若m1,m2,?,mk不完全相等,则称为混合水平正交表。其中最常用的是Ln(m1k1m2k2)型混合水平正交表。其中m1k1表示,水平数为m1的有k1列;m2k2表示,水平数为m2的有k2列。用这类正交表安排试验时,水平数为m1的因素最多可安排k1个,水平数为m2的因素最多可安排k2个。
科学实践中,由于实验条件所限,某因素不能多取水平;有时需要重点考察的因素可多取水平,而其他因素水平数可适当减少。混合正交表正是用来设计该类试验的,即各因素的水平数不完全相同的正交表。表3-2是一张混合水平正交表,此表最多可安排4水平因素1个和2水平因素4个。常用的混合水平正交表有:L8(4×2),L16(4×2),L16(4×2),L16(4×2)。 2、正交表的基本性质
由正交表的定义可以得出,它具有下列性质: (1) 正交性
正交表的正交性主要表现在:① 任一列中各元素(即水平)出现次数相等;② 任何两列的同行元素构成的元素对为一个“完全对”,且每种元素对出现次数相同。
由正交表的正交性可以看出:① 正交表各列的地位平等,表中各列之间可以相互置换,称为列置换;② 正交表的各行之间也可相互置换,称为行置换;③ 正交表的同一列的水平间也可以相互置换,称为水平置换。上述三种置换称为正交表的三种初等变换。经过初等变换得到的正交表称为原正交表的等价表。实际应用时,可根据不同试验的要求,把一个正交表变换成与之等价的其他变换形式。 (2) 代表性
① 由于正交表的任一列的不同水平都会出现,试验中包含了所有因素的所有水平;同时,由于正交表的任何两列的所有水平都出现,且相互配合,使得对任意两个因素的所有水平信息及任2个因素间的组合信息
1
4
12
9
4
3
无一遗漏。因此,尽管用正交表安排的是部分试验方案,但却能了解到全面试验的情况,在这个意义上说,正交试验可以代表全面试验。
② 由于正交表的正交性,正交试验的试验点(处理组合)必然均衡地分布在全面试验之中,因而具有很强的代表性。所以,由部分试验寻找的最优条件与全面试验所寻找的最优条件,应该有一致的趋势。 (3) 综合可比性
由于正交表的正交性,使得任意因素的不同水平具有相同的试验条件,这就保证了在每列因素的各个水平的效应中,最大限度地排除了其他因素的干扰,从而可以综合比较该因素不同水平对试验指标值的影响,把这种特性称为综合可比性。
不可否认正交试验作为部分实施试验,相对于全面实施试验来说,具有减少处理组合数,缩小试验规模,提高试验效率的优点。但是,正交设计也有其不足的一面,如果设计不当,会出现某些因素效应与其他因素的交互效应相混杂的问题。解决该问题的办法是在正交设计中通过巧妙的表头设计,可以达到避免重要因素的效应与重要的交互效应相互混杂的目的。 3. 正交试验设计的基本步骤
正交试验设计总的来说包括两部分:一是实验设计,二是数据处理。基本步骤可简单归纳如下。 (1) 明确实验目的,确定评价指标
任何一个试验都是为了解决某一个问题,或是为了得到某些结论而进行的,所以任何一个正交试验都应该有一个明确的目的,这是正交试验设计的基础。如产品的产量、纯度等试验指标是通常用来表示实验结果特性的值,常常用它来衡量或考核试验效果。 (2) 确定因素和水平
影响试验指标的因素很多,试验因素的选择首先要根据专业知识与以往的研究经验,尽可能全面考虑到影响试验指标的诸因素。然后根据试验要求和尽量少选因素的原则,选出主要因素,略去次要因素,以减少要考察的因素。如果对问题了解不够,可以适当多取一些因素。确定因素的水平时,尽可能使因素的水平数相等,以方便试验数据处理。最后列出因素水平表。
在实际工作中,应根据专业知识和有关资料,尽可能把水平设置在最佳区域或接近最佳区域。如果经验或资料不足,不能保证把因素水平定在最佳区域附近,就需要把水平尽量拉开,尽可能使最佳区域包含在拉开的区间内。然后通过1~2套试验,逐步缩小水平范围,以便寻找出最佳区域。 (3) 选择适当的正交表
根据因素数和水平数来选择合适的正交表。一般要求,因素数≤正交表列数,因素水平数与正交表对应的水平数一致,在满足上述条件的前提下,选择较小的表。例如,对于4因素3水平的试验,满足要求的表有L9(34),L27(313)等,一般可选择L9(34),但是如果要求精度高,并且试验条件允许,可以选择较大的表。表头设计就是将试验因素安排到所选正交表相应的列中。 (4) 明确试验方案进行试验,对试验结果进行统计分析
根据正交表和表头设计确定每套试验的方案,然后进行试验,得到以试验指标形式表示的试验结果。对正交试验结果的分析,通常采用两种方法:一种是极差分析法(或称直观分析法);另一种是方差分析法。通过试验结果分析可以得到因素主次顺序、优方案等有用信息。 (5) 进行验证试验,作进一步分析
优方案是通过统计分析得出的,还需要进行试验验证,以保证优方案与实际一致,否则还需要进行新的正交试验。
二、正交实验数据分析方法 1. 正交实验设计结果的极差分析法 (1) 单指标正交实验设计结果的极差分析法
极差分析法又称直观分析法,它具有计算简便、直观形象、简单易懂等优点,是正交试验结果常用的分析方法,极差分析法简称R法。根据实验指标的个数,可把正交试验设计分为单指标试验设计与多指标试验设计,下面通过例子说明如何用正交表进行单指标正交设计,以及如何对试验结果进行极差(直观)
分析。
例3.1 以合成某有机化合物的产率为试验指标。该有机化合物的合成主要影响因素为反应温度、时间及催化剂,现对其合成工艺进行优化,以提高产率。根据前期条件试验,确定的因素与水平如表3-3所示,假定因素间无交互作用。
表3-3 例3.1的因素水平表
水平 1 2 3 (A)温度/℃ 100 80 60 (B)反应时间/h 3 1 5 (C)催化剂种类 甲 乙 丙 注意:为了避免人为因素导致的系统误差,因素的各水平哪一个定为1水平、2水平、3水平,最好不要简单地完全按因素水平数值由小到大或由大到小的顺序排列,应按“随机化”的方法处理,例如用抽签的方法,将3 h定为B1,1 h定为B2,5 h定为B3。
解:本题中试验的目的是提高产品的产率,试验的指标为单指标产率,因素和水平 是已知的,所以可以从正交表的选取开始进行试验设计和极差分析。
① 选正交表。本例是一个3水平的试验,因此要选用Ln(3m)型正交表,本例共有3个因素,且不考虑因素间的交互作用,所以要选一张m≥3的表,而L9(34)是满足条件m≥3最小的Ln(3m)型正交表,故选用正交表L9(34)来安排试验。
② 表头设计。本例不考虑因素间的交互作用,只需将各因素分别安排在正交表L9(34)上方与列号对应的位置上,一般1个因素占有一列,不同因素占有不同的列(可以随机排列),就得到所谓的表头设计(见表3-4)。
表3-4 例3.1的表头设计
因素 列号 A 1 空列 2 B 3 C 4 不放置因素或交互作用的列称为空白列(简称空列),空白列在正交设计的方差分析 中也称为误差列,一般最好留至少一个空白列。
表3.5 例3.1的试验方案
试验号 1 2 3 4 5 6 7 8 9 A 1 1 1 2 2 2 3 3 3 空列 1 2 3 1 2 3 1 2 3 B 1 2 3 2 3 1 3 1 2 C 1 2 3 3 1 2 2 3 1 试验方案 A1B1C1 A1B2C2 A1B3C3 A2B2C3 A2B3C1 A2B1C2 A3B3C2 A3B1C3 A3B2C1 ③ 明确试验方案。完成了表头设计之后,只要把正交表中各列上的数字1,2,3分别看成是该列所填因素在各个试验中的水平数,这样正交表的每一行就对应着一个试验方案,即各因素的水平组合,如表3-5所示。注意,空白列对试验方案没有影响。
例如,对于5号试验,试验方案为A2B3C1,它表示反应条件为:温度80℃、时间5 h、催化剂甲。 ④ 按规定的方案做试验,得出试验结果。按正交表的各试验号中规定的水平组合进行试验,本例总共要做
9个试验,将试验结果(指标)填写在表的最后一列中,如表3.6。
在实施实验中注意以下事项:第一,严格按照规定的方案完成每一号试验,即使其中有某号试验事先根据专业知识可以肯定其试验结果不理想,但仍然需要认真完成该号试验;第二,试验进行的次序没有必要完全按照正交表上试验号码的顺序,可按抽签方法随机决定试验进行的顺序,事实上,把试验顺序打“乱”,有利于消除实验误差干扰,以及外界条件所引起的系统误差等不利影响;第三,试验条件的控制力求做到十分严格,尤其是在水平的数值差别不大时。例如在本例中,因素A的A1=100℃,A2=80℃,B3=60℃,温度差别不大,如果控制不好就将使这个试验失去正交试验设计的特点,使后续的结果分析丧失了必要的前提条件,而得不到正确的结论。
表3.6 例3.1试验方案及实验结果分析
试验号 1 2 3 4 5 6 7 8 9 A 1 1 1 2 2 2 3 3 3 1.79 2.64 1.92 0.597 0.880 0.640 0.85 空列 1 2 3 1 2 3 1 2 3 2.09 2.23 2.03 0.697 0.743 0.677 0.20 B 1 2 3 2 3 1 3 1 2 1.95 2.30 2.10 0.650 0.767 0.700 0.35 ABC A2B2C2 C 1 2 3 3 1 2 2 3 1 2.02 2.28 2.05 0.673 0.760 0.683 0.26 产率 0.50 0.75 0.54 0.91 0.88 0.85 0.68 0.60 0.64 K1 K2 K3 k1 k2 k3 极差R 因素主次 优方案 ⑤ 计算级差,确定因素的主次顺序。首先解释表3-6中引入的三个符号。
Ki:表示任一列上水平号为i(本例中i=1,2或3)时所对应的试验结果之和。例如,在表3-6中,在C
因素所在的第4列上,第1,5,9号试验中C取C1水平,所以K1为第1,5,9号试验结果之和,即K1=0.50+0.88+0.64=2.02;第3,5,7号试验中B取B3水平,所以K3为第3,5,7号试验之和,即K3=0.54+0.88+0.68=2.10;同理可以计算出其他列中的Ki,结果如表3-6所示。
ki = Ki/s,其中s为任一列上各水平出现的次数,所以ki表示任一列上因素取水平i时所得试验结果的算
术平均值。例如,在本例中s=3,在B因素所在的第3列中,k1=1.95/3=0.650,k2=2.30/3=0.767,
k3=2.10/3=0.700。同理可以计算出其他列中的ki,结果如表3-6所示。
R:称为极差,在任一列上R={K1,K2,K3}max-{K1,K2,K3}min,或R={k1,k2,k3}max-{k1,k2,k3}min。例如,在第3
列上,最大的Ki为K2(=2.30),最小的Ki为K1(=1.95),所以R=2.30-1.95=0.35,或R=0.767-0.650=0.117。
通常各列的极差是不相等的,这说明各因素的水平改变对试验结果的影响是不相同的,极差越大,表示该列因素的数值在试验范围内的变化,会导致试验指标在数值上有更大的变化,所以极差最大的那一列,就是因素的水平对试验结果影响最大的因素,即最主要的因素。在本例中,由于RA>RB>RC,所以各因素从主到次的顺序为:A(温度),B(反应时间),C(催化剂种类)。
当极差计算显示空白列的极差比其他所有因素的极差还要大,说明因素之间可能存在不可忽略的交互作用,
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库第三部分 试验设计与数据分析方法在线全文阅读。
相关推荐: