您当前的位置:检测资讯 > 实验管理

常用的实验设计(DoE)类型

嘉峪检测网        2023-09-22 08:45

实验设计的类型有多种不同的分类方法,本次按照不同的研究目的来介绍常用到的几个设计类型。
 
用于因子筛选研究的设计
 
用于因子筛选研究的设计类型主要包括:完全析因设计,部分析因设计和Plackett-Burman设计。
完全析因设计
Fisher针对一次一因子实验法(OFAT)的缺点提出析因实验法,很简单,也很容易想到的一个设计就是将所有因子的所有水平的所有组合都至少进行一次实验,这就是完全析因设计。
完全析因设计包含了所有的组合,因此,可以估计出所有的主效应和所有的各阶交互效应。同时也以为完全析因设计包含了所有的组合,所需要的实验总次数也较多,所以,在因子个数不是太多(一般小于5),并且需要考虑交互效应时,可以选择完全析因设计。
 
基于完全析因设计的定义不难计算,k个因子,每个因子研究2个水平,则总实验数为2k。k个因子,每个因子研究3个水平,则总实验数为3k。完全析因设计的总实验数随着因子个数,随着因子水平数目的增长而呈指数级增长。
实践证明,2水平的实验设计在实际应用中已经足够,如果加上中心点,在一定程度上可以代替3水平的实验,而且分析时简明易行,现在已经普遍使用。
我们一般将这种k个因子的2水平完全析因设计记为2k实验。实际应用中,使用的完全析因设计则普遍为(2k+中心点)的设计方式。
根据2k完全析因设计的设计表,不难发现这种设计本质上一种正交设计。我们后面会解释这种正交设计的优点所在。
部分析因设计
完全析因设计,计算只进行2水平的2k实验,我们也不难发现,总实验数随着因子个数的增加而急剧增加。比如5个因子需要32次实验,6个因子则需要64次实验。
如果我们仔细的分析所获的结果,建立的6因子回归方程中,估计的主效应项有6个,二阶交互效应项有15个,三阶交互效应项有20个……,除了主效应,二阶交互效应项外,有42项是三阶和三阶以上的交互效应项,这些效应项我们一般认为已经没有具体的物料意义。
所以,我们自然会提出一个问题,能不能少做一些实验,但是又能估计出主效应项和二阶交互项呢?答案是可以的。部分析因设计就是这样的设计类型。
 
我们在完全析因设计的所有实验中选择1/2,1/4甚至1/8部分等等实验来进行,大大减少了总实验次数。但是,任何“努力”的舍弃都要付出代价。部分析因设计的代价就是混淆。
 
由于总实验次数的减少,能够估计的效应项数目也会减少,这样就造成了不同效应项之间的混淆。在部分析因设计中,一些效应项与其他效应项已经无法分开,计算出来的效应项是两者的总和。只不过,如果发生混淆的是主效应项和高阶效应项,没有物理意义的高阶效应项可以忽略,那还可以认为主效应项是可估计的。能够帮助我们估计主效应项和二阶交互项的部分析因设计依然是可以选择使用的。
 
 
Plackett-Burman设计
 
Plackett-Burman设计是实验次数最少的另一类因子筛选研究所用的设计类型。一般如果实验经费特别昂贵,或者实验原料极其难以获得,那么节省每一次实验都是有价值的。
Plackett-Burman设计也是一种正交设计,只不过此时总实验次数不是2k,而是4的整数倍。所以,Plackett-Burman设计就是所有恰为4的整数倍的n情况下给出的设计,比较有用的是n=12,20,24……的设计,常记为Ln。下图是一个L12的Plackett-Burman设计表。
 
L12的Plackett-Burman设计,在12次实验中最多可安排11个因子,因此节省实验次数上还是很有优势的,但是致命的缺点是,这种设计的只能分析主效应,因为主效应项与二阶交互项是混淆的,如果存在显著的二阶交互项,则会导致主效应项也不能得到准确的分析。
 
Plackett-Burman设计只能用于因子筛选研究,不到万不得已,一般不采用此方法。 
 
用于因子回归研究的设计类型
 
用于因子回归研究的设计类型主要包括:完全析因设计、中心复合设计和Box-Behnken设计。完全析因设计只能用于拟合线性模型,中心复合设计和Box-Behnken设计则可以用于拟合含有二次项的曲率模型。 
完全析因设计
完全析因设计也可以用于因子回归研究,即用于确定Y与X的关系式,找出Y对于X的回归方程。完全析因设计只能拟合与Y与X的线性模型关系式,不过加了中心点的完全析因设计可以帮助判断模型中的弯曲效应是否显著。
如果模型中的没有弯曲的趋势,那么线性回归模型则已经足够,即无需再多做实验。但是如果发现模型中有弯曲的趋势,那么最好的做法是拟合一个含有二次项的回归方程,这时就需要在增加一些实验点来解析模型的二次项,这就需要下面所介绍的响应曲面方法了(中心复合设计或者Box-Behnken设计)。
关于完全析因设计的内容在上面章节已经介绍,这里就不再重复赘述了。 
中心复合设计(Central Composite Design,CCD)
中心复合设计是在完全析因设计的基础上,通过增补实验点来合成的。中心复合设计的整个实验由下面三部分的实验点构成(按照下面坐标):
(1)立方体点(Cube Point)或者角点(Corner Point),各点坐标皆为1或者-1,这就是完全析因实验设计中的实验点;共有2k个实验点;
(2)中心点(Center Point),同完全析因设计,各点的坐标皆为0;
(3)星号点(Star Point)或者轴点(Axial Point),需要增补的实验点,除一个因子的坐标为±α之外,其余因子的坐标皆为0。共有2k个实验点;
所以,中心复合设计的总实验数为(2k+2K+中心点)。
 
中心复合设计在完全析因设计的基础上进行,如果因子水平不变,那么前面完全析因设计的实验数据就可以直接用中心复合设计上,而不需要再额外的重复完全析因设计的实验,这种能力利用前面实验数据的策略就是“序贯实验”策略。
根据星号点的α取值的不同,中心复合设计又可分为中心复合序贯设计(Central CompositeCircumscribed Design,CCC),中心复合表面设计(Central Composite Face-centeredDesign,CCF)和中心复合有界设计(Central Composite Inscribed Design,CCI)。后续我们会介绍这三种CCD设计的区别和不同。
 
Box-Behnken设计
 
Box-Behnken设计是另外一种响应曲面设计,它是将所有的因子的实验点设计安排在棱的中点上。三因子的Box-Behnken设计如下图。
 
Box-Behnken设计的总实验点数要比CCD少。Box-Behnken设计最适合的是在立方体角点(所有因子高水平或者低水平的组合)无法获得响应数据时。
 
不过,Box-Behnken设计的缺点是失去了序贯性,前面完全析因设计的实验数据无法利用,而后续的Box-Behnken设计也无法使用前面的Box-Behnken设计实验数据,也就是每批次的实验都需要重新做。
 
因此,除非有特别情况(角点数据无法获得),或者极端重视实验次数时,否则通常不会优先选择Box-Behnken设计。 
 
用于稳健性研究的设计类型
 
用于稳健性研究的设计,一般也称为稳健参数设计(Robust Parameter Design),它是通过选择可控因子的水平组合来减少一个系统或者过程对噪音变化的敏感性,从而达到减少系统波动的目的。
大家都知道,输入变量(因子)有两类:可控因子和噪声因子。响应变量会受到两类因子的影响。如何才能减少响应变量的误差呢?很自然的想法是减少噪声的误差,但是这通常需要付出较高的经济代价。
稳健参数设计则是另外一种更好的策略选择。这种策略是通过探索可控因子与噪声因子间的交互作用,从而用改变可控因子的水平组合的办法来减少响应变量的误差,因为可控因子更容易改变,这种方法更经济,更方便。
如果可控因子本身会受到噪音的影响而发生波动,那么响应变量与这个可控因子的关系则是非线性的,那么我们就可以选择斜率较小的平坦区域从而使响应变量的误差减小。这种方法本质是通过选择参数的最佳设置来寻求减小响应变量的误差,因此被称为参数设计。
 
使用乘积表进行位置-散度建模的方法是目前最通用的做法。
乘积包括内表和外表两部分。内表(InterArray)是为了考察可控各因子的不同水平搭配的效果,是用来安排可控因子的,通常用全因子设计或者部分因子设计进行,也称为控制表(Control Array)。
 
外表(Outer Array)是未来考察噪声因子的效应,要对内表中的每个实验条件安排一个噪声表(Noise Array)。这样做,相当于内表中的每个水平组合与噪声表中的所有组合相乘构成一个乘积表(直积表),也称为内外表(Inter-outer Array)。
 
如果内表和外表的实验次数分别为n1和n2,那么乘积表的总实验次数为n=n1*n2
 
 
用于混料研究的设计类型
 
在生物药物工艺开发中,有时候需要研究一些配方配比的问题,比如培养基配方,一般由多种成分按照相应的比率制作而成,混料中所有的成分或者分量之和总是为1,这种类型的实验设计称为混料设计,p个因子的混料设计一般称为p维混料设计。
混料设计根据实验区域内选点方法的不同,可以分为单纯形质心法设计、单纯形格点法设计和极端顶点法设计。
单纯形质心法
在p个因子的混料设计问题中,单纯形质心法的基本思想是:实验点由下列p批点组成。
第一批:各个顶点,共p个实验点;
第二批:每两个顶点的质心,共(p(p-1)/2)个实验点;
第三批:每三个顶点的质心,共(p(P-1)(p-2)/3!)个实验点;
……总之,p批点共计有2p-1个实验点。
 
 单纯形格点法
以平面三角形坐标系来说,等边三角形的每一遍分为相等的d段,过这些分点做平行于三角形底边的线,就可以形成三线坐标的格点网络,这里的d称为个格度。单纯形格点法的基本思想就是讲全部格子点集内的每个点依次选中,来作为实验点。
因此,单纯形格点法中的格子点是由维数和格度两个参数给定的,此格子点集记为{p,d}。d=1,可以拟合线性方程;d=2,可以拟合二次方程;d=3,可以拟合三次方程;所以,通常到格度为3就足够了。
 极端顶点法
在很多实际的混料设计问题中,各个分量常常要受到上下界的限制,各分量之间还有一些约束条件需要满足,对这类问题有一种简便的方法,即极端顶点设计法。各个限制平面的交点处称为极端顶点。
 
 
 

 
分享到:

来源:星辰纯视界