实验设计方法 实验设计方法赵选民
概要:实验设计是人类在长期的生产斗争和科学实验中为了提高产品的质量和数量,解决多因素试验问题,在不断总结实践经验的基础上逐步形成和发展起来的。它是利用正交表来安排多因素试验,利用统计数学原理来进行数据分析的一种科学方法。
做好实验设计,可提高效率,降低实验成本,并科学地得到正确的结果,实验设计不当,往往得到的结果会错误并会误导分析,从而影响决策和判定。
4.1 试验设计概念
电视上有很多关于声称能提高打高尔夫成绩的广告,你不能确定为什么这些广告能提高你的球技,但你对提高成绩很关心,先有以下物品在采购范围之内:
1)两种高尔夫球棒 a)平牌 b)考微牌
2)两种高尔夫球 a)塔梯牌 b)排那牌
打球场地有两种,两种场地风情况不同,
场地A由于四周环山而没有风
场地B位于海滨而有很大风
你带有设备,你如何知道所做的能提高成绩?
试验设计步骤的引入:
在本案例中:
试验设计步骤一:明确试验目的,即为“提高打高尔夫成绩”。
试验设计步骤二:明确试验指标,即为“杆数越少成绩越好,水平越高”。
试验设计步骤三:确定因子和水平。
A.因子:试验因素指当试验条件变化,试验考核指标也发生变化时,影响考核指标取值的量称为试验因子(因素),一般记为A,B,C等。
试验因子可以理解为试验过程中的自变量。
从广义上讲,试验因子可理解为若干变量间的某种确定关系,
定量因素: 因素有可能按数量表示的称为定量描述的因素。
定性因素: 因素有不可能按数量表示的称为定性描述的因素。
可控因素: 在试验过程中有些因素所处的状态是可以控制或调节的,如加热温度、熔化温度、切削速度等,这样的因素称为可控因素。
不可控因素: 一些因素所处的状态是不能控制或调节的,如未装空调的生产环境的温度、湿度等,称为不可控因素或干扰因素。
本例中因子数有三:球棒、球、风
B.水平:
试验因子的水平(位级)是指试验因子所处的状态。对于定量变量,任一选择值就是水平,例如:如果试验在两种温度下进行,那么因子温度有两种水平;在定性变量情况,清洁和不清洁是两种水平。一般试验方案是由若干个试验因子所组成的若干组合,因子在试验方案中变化的几种状态,就称为有几个水平(位级)。例如,在化学试验中,温度、时间、压力这些因子允许在一定范围内变化,但在一个试验方案中,温度、时间、压力等因子总是固定在几个状态中变化。
温度可以是100℃,120℃,150℃等;
时间可以是1h,1.5h,2h等;
压力可以是1Mpa,1.5Mpa,2Mpa等。
这称为试验中因子的三个位级(水平)。
本例中因子数对应水平如下:
因子 水平1 水平2
球棒 平牌 考微牌
球 塔梯牌 排那牌
风状况 有风 没风
试验设计步骤四:明确试验方案,本题试验所有组合如下:
1、平牌球棒 塔梯牌球 没风
2、考微牌球棒 塔梯牌球 没风
3、平牌球棒 排那牌球 没风
4、考微牌球棒 排那牌球 没风
5、平牌球棒 塔梯牌球 大风
6、考微牌球棒 塔梯牌球 大风
7、平牌球棒 排那牌球 大风
8、考微牌球棒 排那牌球 大风
试验方案结构重组:
试验设计步骤五、六:实施试验,记录结果,如下:
试验设计步骤七:分析数据。
A. 直观分析:
(1) 计算某因子的某一水平对实验数据的影响(因子记为A/B/C,水平记为:1/2/3):
A1的试验回应值=所有试验条件为A1的试验回应值求和除以试验条件为A1的试验次数,本例题中
平牌球棒的平均值=(76+78+78+76)/4=77;试求其他因子个水平的回应值;
(2) 计算某因子对实验数据的影响(因子记为A/B/C,水平记为:1/2/3),影响指标为因子水平之间的极差值,差值R越大,影响越大:
RA为A的极差,极差的计算方法为RA= A[max]- A[min], 本例题中R球棒=82-77=5;试求R球、R风?
(3) 确定主次因子顺序,在本例题中
(4)做出因子水平影响图;本例题得图如下
(5)最佳条件确认,对比得出,在本例题中由于杆数值是愈小愈好,所以依此选出的最佳条件为:平牌球棒+塔梯牌球+大风。
(6)确认实验:将预期的缺陷数和“确认实验”的结果做比较。
(7)交互作用分析,对照所得数据画出因子交互作用图,因子交互作用图如有交叉则有交互作用,无交叉就没有交互作用;
试画出本例题中所有因子的交互作用图,最后确定试验的最佳条件
C.方差分析
评判标准:波动越大,因子对结果影响越大。
试验设计步骤八:结论,由于交互作用的存在,成为一名更好的高尔夫球手,使用平牌球棒和当时状况时使用:大风搭配塔梯牌球,没风搭配排哪牌球
4.2 实验设计
4.2.1 实验设计的概念
4.2.2 试验设计所要研究和解决的问题
如何以尽可能少的试验次数获得足够有效的数据,并分析得出比较可靠的结论,找出影响结果的主要因素。
1.实验策略,总结试验设计步骤:
1)明确试验目的
2)明确试验指标
3)确定因子和水平
4)试验设计方案
5)实施试验设计
6)收集数据
7)分析数据
8)得出结论
4.2.3 试验设计经典案例:瓷砖工厂的实验
在1953年,日本一个中等规模的瓷砖制造公司,花了200万元,从西德买来一座新的隧道,窑本身有80公尺长,窑内有一部搬运平台车,上面堆着几层瓷砖,沿着轨道缓慢移动,让瓷砖承受烧烤。
问题是,这些瓷砖尺寸大小的变异,他们发现外层瓷砖,有50%以上超出规格,则正好符合规格。引起瓷砖尺寸的变异,很明显地在制程中,是一个杂音因素。
解决问题,使得温度分布更均匀,需要重新设计整个窑,需要额外再花50万元,投资相当大。
试验方法一:一次一个因素法,所谓一次一个因素法,就是先固定一种组合,而其它因子保持固定,然后每次改变一个条件,将相邻的两次实验结果进行比较,以估计两个条件的效果差异,实验方案如下表:
缺点是不能保证结果的再现性,尤其是有交互作用时。
试验方法二:全因子实验法,所有可能的组合都必须加以深究,信息全面,但相当耗费时间、金钱,例如:7因子,2水准共须做128次实验;13因子,3水准就必须做了1,594,323次实验,如果每个实验花3分钟,每天8小时,一年250个工作天,共须做40年的时间。
试验方法三:田口式实验计划法,由田口玄一博士所提出的一套实验方法,它在工业上较具有实际应用性,是以生产力和成本效益,而非困难的统计为依归。厂商必须致力于在生产前就使复杂的产品达到高品质。减少变异亦即要有较大的再现性和可靠性,而最终目的就是要为制造商和消费者节省更多的成本。
正交表是一种规格化的表格,各种各样的正交表都已构造出来了,对于解决实际问题的应用来说,只要掌握正交表的应用方法就达到目的了。
正交表的符号
Ln(ji)
其中:
L――正交表的代号;
n――正交表的行数(试验次数、试验方案数);
j――正交表中的数码(因素的位级数);
i――正交表的例数学(试验因素的个数);
N=ji――全部试验次数(完全因素位级组合数)。
试写出直交表L8(27)最多可以配置几个因子,每个因子几个水平,一共要做多少次试验。
试写出直交表L9(34)最多可以配置几个因子,每个因子几个水平,一共要做多少次试验
试写出直交表L81(340)最多可以配置几个因子,每个因子几个水平,一共要做多少次试验
试写出直交表L64(421)最多可以配置几个因子,每个因子几个水平,一共要做多少次试验
正交表一般有以下两个特点:
﹝1﹞ 每一列中,不同的字码出现的次数
相等。如右表中“1”、“2”和“3”各出现3次。
﹝2﹞ 任意两列中,将同一行的两个字码
看成有序数字对时,则必然构成完全有序数字对,
而且每种数字对出现的次数相等。
凡满足上述两个条件的表就称为正交表。
正交表的特性:
a. 每一列中各种字码出现相同的次数,这就
保证了试验条件均衡地分散在配合完全的水平组
合之中,因而代表性强,容易出现好条件。这正
是正交表的均衡分散性。
b. 任意两列中全部有序数字对出现相同的次数。也就是说,对于每列因素在各个水平进行比较的结果之和﹝Ⅰ、Ⅱ、Ⅲ…﹞中,其它因素各个水平的出现次数都是相同的。这就保证了在各个水平的效果中,最大限度地排除了其它因素的干扰,因而能有效地进行比较,作出展望,这是正交表的整齐可比性。
在后四次实验中,B、C、D、E、F、G等6个因素的两种选择也都出现了两次,于是我们可以大胆的得出结论,Y1、Y2、Y3、Y4的总和之所以与Y5、Y6、Y7、Y8的总和不同,就是由A1与A2的差异导致的,因为其他因素的两个水准都出现了相同的次数,其影响力已经各自抵消!(这个结论虽然大胆,但确实可靠,原理将在后述内容中说明),同理:
B1和B2的作用分别对应于Y1+Y2+Y5+Y6与Y3+Y4+Y7+Y8 ;
C1和C2的作用分别对应于Y1+Y2+Y7+Y8与Y3+Y4+Y5+Y6;
D1和D2的作用分别对应于Y1+Y3+Y5+Y7与Y2+Y4+Y6+Y8;
。。。。。。
最佳条件确认:
由于缺陷是愈小愈好,所以依此选出的最佳条件为:A1B2C2D1E2F1G2。
确认实验:将预期的缺陷数和“确认实验”的结果做比较。
但事实上厂商选得是A1B2C1D1F1G2,主要的原因是C(蜡石)要因的价格很贵,但改善的效果又不大,所以选C1(蜡石含量为43%)
讨论:从本案例中,你认为最能提供最完整的实验数据的是那一个方法?
一次一个因子法
全因子法
正交实验法
各种实验法有何优点?
练一练:合成氨纯度实验,按给出条件选择正交表
三个可控因子,分别有2个取值水平,共有2*2*2共8种组合
因子A——温度,低水平:460度;高水平:500度
因子B——压力,低水平:250大气压;高水平:270大气压
因子C——反应时间,低水平:20分钟;高水平:30分钟
三因子正交试验表结果:
1.对结果进行分析,试分析主次因子,得出最佳条件。
2.有交互作用正交表设计:
从该数据表计算交互作用,AB交互效应=[(A高B高+A低B低)-(A高B低+A低B高)]/2
本例题中则有
试计算得出 ,做出交互作用图如下,有交叉,说明有交互作用,
重新设计:AB交互作用项,实际中很多情况下各因素是彼此存在交互作用,如果因素A和B存在交互作用,可以把它们之间的交互作用看作一个新的因素,记为A×B。表中的交互作用列A×B刚好是相应列的乘积。