2k完全析因设计相对于一次一因子法(OFAT),不但能够提供更多的实验信息,同时实验数目也已经大大降低。但是,实验数目降低的还是不够,尤其是当因子个数增加时。比如,24完全析因设计需要16次实验,而26完全析因就需要64次实验,这已经超出了大多数可执行的实验次数数目了。
如果我们仔细的分析所获的结果,建立的6因子回归方程中,估计的主效应项有6个,二阶交互效应项有15个,三阶交互效应项有20个……,除了主效应,二阶交互效应项外,有42项是三阶和三阶以上的交互效应项,这些效应项我们一般认为已经没有具体的物料意义。
所以,我们自然会提出一个问题,能不能少做一些实验,但是又能估计出主效应项和二阶交互项呢?
答案是当然是可以的。部分析因设计就是这样的设计类型。
部分析因设计的实施原理
下面我们用一个案例来介绍部分析因设计的实施原理。
我们首先设计一个24完全析因设计,然后列出这个完全析因设计的标准序以及所能估计的效应项。
根据上面的表,我们可以看出24完全析因设计是可以估计出所有的主效应项,二阶交互效应项,以及所有的三阶和四阶交互效应项。
那么,有哪些方法可以删掉一些实验,所获得的实验数据还可以估计出主效应项和二阶交互项呢?当然三阶和四阶交互效应项可以适当的不予考虑。
其中一个较好的做法是将估计四阶交互效应项(ABCD)中的所有ABCD取“-1”的实验行删掉,只保留所有取“1”的8行实验。这样做可以保证剩余的8行实验中,A,B,C,D这四列中仍保持了正交性,依然具有“均衡分散,整齐可比”的性质,可以较容易的计算回归方程。
不过,仔细的观察剩余的8行实验来估计的各项效应的表,我们发现除去全为“1”的ABCD列以外,其余14列中,每一列都有与之成对的另一列是完全相同的,比如D与ABC列完全相同,AB与CD列完全相同。完全相同的两列,在进行回归分析时,计算出来的效应或者回归方程系数是完全相同的,也就是这两列的效应发生了“混淆(Confounding)”,也可以说这两列互为别名。
是否可以选别的条件作为删去8行实验的标准呢?比如,选BCD所有取“1”的8行实验保留,但是这时发生混淆的是D与BC列,显然不如D与ABC列发生混淆要好一些。经过所有的比较,可知ABCD取“1”的这种安排方法是所有安排中效果最好的。
混淆总是不好的,那能否不产生混淆呢?答案是:如果选择部分析因设计,混淆是不可避免的。我们能做的只是希望混淆安排的更合理一些,也就是尽量让我们感兴趣的主效应和交互效应项与更高阶的交互效应项发生混淆。在默认高阶交互效应项忽略不计的时,就可以很好的估计感兴趣的主效应项和二阶交互效应项了。
部分析因设计的描述
前面的例子中,我们只保留了ABCD取“1”的8行实验,也就是令ABCD=1,称为“定义关系(Defining Relation)”,简称“字”。我们让D与ABC列发生混淆,则称D=ABC为“生成元(Generator)”。一旦定义关系和生成元确定了,那么这个部分析因设计就确定了。
当然,我们可以在上面部分析因设计的基础上继续删减实验,比如,26完全析因设计需要进行64次实验,如果我们做两次删减,将实验次数删减至16次。那么,合理的做法是什么呢?
实践显示,我们选择定义关系:ABCE=ABDF=CDEF=1是最优的方案,因此此时,E=ABC,F=ABD等,没有任何主效应与二阶交互效应发生混淆,只有部分二阶交互效应内部的混淆,比如AB=CE。
如果我们选择另外一种定义关系:ABCDF=BCDE=AEF=1,那么此时发生混淆的是A=EF,E=AF,主效应项与二阶交互效应项发生混淆,与上面相比,这并不是最优的方案。
由此可见,当删减的实验数目增减,“定义关系”个总个数也会增加,“生成元”则也会发生变化。不同的定义关系会造成不同的混淆情况,为了更好的解释部分析因设计中这种定义关系与混淆之间的关系,提出了分辨度的概念。
分辨度是指所有的定义关系中最短的那个字的长度,比如ABCDF=BCDE=AEF=1,最短的是AEF,则分辨度为III;ABCE=ABDF=CDEF=1,最短的都是四个字母,因此分辨度为IV。一般:
分辨度为III的部分析因设计:主效应项之间没有混淆,主效应项与二阶交互效应项之间混淆;
分辨度为IV的部分析因设计:主效应项之间没有混淆,主效应项与三阶交互效应项之间混淆,二阶交互效应项之间部分发生混淆;
分辨度为V的部分析因设计:主效应项之间没有混淆,主效应项与四阶交互效应项之间混淆,二阶交互效应项与三阶交互效应项之间混淆;
以此类推,可见如果默认三阶及三阶以上的交互效应项的效应可以忽略不计,那么分辨度为V的设计就已经足够估计主效应项和所有的二阶交互效应项了。常规的做法是部分析因设计中,至少要选择分辨度为IV或以上的设计类型。
那么,又该如何确定因子数,实验数目与分辨度的关系呢?就算确定了实验数目,又该如何确定定义关系与生成元呢?
上面这个表给出了不同的因子个数,实验总次数以及分辨度之间的关系,可以根据此表来确定给定因子数目下获得一定分辨度的实验总次数。至于定义关系和生成元的选择,DoE软件会给出默认的最优方案。除非设计者有特别的要求,由DoE软件给出的设计通常是最合理的。
部分析因设计的计划
与完全析因设计不同,部分析因设计的计划制定阶段需要确定试验总次数和分辨度,以及确定定义关系和生成元。有两种方法,一种是DoE软件默认定义关系和生成元,一种是指定定义关系和生成元。
默认定义关系和生成元的部分析因设计
在Minitab软件中选择“统计>DoE>因子>创建因子设计”,先在下拉菜单中选择因子数,点击“显示可用设计”,根据分辨度的要求,确定所需要做的实验总次数。打开“设计”,选择确定实验总次数的设计类型,设定中心点数目。打开“因子”和“选项”,设定方法与完全析因设计相同,点击确定,即可完成部分析因设计,得到实验计划表。
与完全析因不同的是,部分析因设计会同时给出设计生成元和别名结结构,也就是混淆情况。我们需要判定想要研究或者感兴趣的效应项之间是否发生了混淆,如果没有,那么这个部分析因设计就可以使用,进入实验设计的执行和分析阶段。
指定定义关系和生成元的部分析因设计
如果万一出现我们感兴趣的效应项之间在部分析因设计中出现了混淆,那该如何处理呢?办法有两个:(1)将因子名称互相交换就有可能自动解决;(2)自行指定设计定义关系和生成元。
举个例子,设计6个因子的部分析因设计,希望能够考察所有的主效应项和二阶交互效应项AB,AC,CE和DE是否显著?那么,该如何设计这个部分析因设计呢?
我们在解代数方程时,所用到的“移项法则”在设计生成元时同样有效。由上面条件可以推出,我们希望在所设计的部分析因实验中,AB≠CE,AB≠DE,AC≠DE,移项之后可变形为,E≠ABC,E≠ABD,E≠ACD,如果只做16次实验,也就是设计A,B,C,D四个因子的设计中三阶交互项只有四个,ABC,ABD,ACD个BCD,其中三个不能使用,那么只能选择E=BCD。条件中对F没有要求,所以,F可以任意选择,比如F=ABC。
在Minitab软件中选择“统计>DoE>因子>创建因子设计”,选择“两水平因子(指定生成元)”在下拉菜单中选择因子数,点击“设计”,选择“全因子”,在“生成元”选项中,填写生成元:E=BCD F=ABC,其余“因子”和“选项”设定同前面。点击确定,即可得到设计效果。
可以看出,别名结构(混淆情况)中,AB,AC,CE和DE之间互不为别名,也就是没有混淆,达到了我们的设计要求。
部分析因设计的分析
部分析因设计的分析与完全析因设计相同,也是按照七大步骤的方法顺序进行。
唯一不同的地方是,如果选择的是分辨度为IV的部分析因设计,在各效应项显著性检验时,如果分析结果中如果出现某些二阶交互效应显著时,不能仅从表面上的结果来决定取舍,要仔细分析混淆的结构,查看别名结构表中,此显著效应项与那些效应项是混淆的,再根据背景材料予以判断,最终决定谁来入选。
如果不能通过背景材料来判断,可能就需要通过进一步的实验来区分这些混淆的交互效应了。