我们用完全析因设计和部分析因设计拟合的都是线性回归方程,但是,如果发现有弯曲的趋势,那就需要去拟合一个含有二次项的回归方程。
要估计这些二次项的系数,原来的因子设计所安排的设计点就不够用了,需要再增补一些实验点。这种先后分两阶段完成全部实验的策略称为“序贯实验”策略。适用于这种策略的方法有很多,其中最常用的就是中心复合设计(Central Composite Design,CCD)。
中心复合设计(CCD)
下面是一个3因子的中心复合设计的示意图。
整个实验由三部分的实验点构成:
(1)角点,各点的坐标皆为1或者-1,这是组成因子实验的部分;
(2)中心点,各点的坐标均为0;
(3)星号点,也称为轴点,除了一个自变量坐标为±α外,其余自变量坐标均为0。K个因子情况下,共有
2k个星号点;
关于中心复合设计,有三个问题需要讨论:
A:因子设计的部分如何选择?
在因子设计部分,通常选取完全析因设计的安排方法,只有当因子个数大于5时才考虑部分析因设计,这时通常要求分辨率在V以上。
B:星号点如何选择,即α的值如何确定?
关于α的选择,主要的考虑点之一是旋转性,即希望将来某点处的预测值的方差仅与该点到实验点中心的距离有关,而与其所在方位无关,也就是响应变量的预测精度在以设计中心为球心的球面上是相同的,这时候α取值α = F1/4,其中,F为因子实验点的总数。当因子个数为k时,α = 2k/4,这种α取值是CCD设计最典型的方式,既可以满足旋转性,也可以实现实验的序贯性,这种实验设计方式称为中心复合序贯设计(Central Composite Circumscribed Design,CCC)。
如果希望进行CCD实验,但是同时希望因子水平安排不超过立方体边界,可以将星号点设置为α=±1,计算机会自动将原来的CCD缩小到整个立方体内,这种设计方式称为中心复合有界设计(Central Composite Inscribed Design,CCI)。这种设计失去了序贯性,保留了旋转性。
还有一种设计方式,就是α=1,这意味着星号点的位置在立方体的表面上,这种设计称为中心复合表面设计(Central Composite Face-Centered Design,CCF)。这种设计方式保留了序贯性,失去了旋转性。
C:中心点个数如何确定?
如果目的是想整个实验区域内的预测值都有一致均匀的精度,那中心点的个数要足够的多,可以按照下面这个表进行。但是如果目的只是估计实验随机误差,那中心点个数选择4个以上就可以了。
响应曲面设计的计划
整个响应曲面设计的计划应包含两个阶段:求最优实验区域;安排响应曲面实验。
第一阶段:用最速上升法寻找实验最优区域
这一阶段的目的是识别目前实验区域的状况,究竟该区域已经接近或者达到能使响应变量达到最佳值的最优区域,还是仍原理最优区域?
我们以望大型问题为例来讨论,通常响应变量的极大值是在有曲面的弯曲的“山顶”部分,因此,我们首先要特别认真的分析数据是否显示了弯曲性,或者在数据拟合线性回归方程时的ANOVA表中是否显示了失拟现象。如果弯曲或者失拟不严重,则说明目前的实验区域仍是远离最优区域,这时首要的任务是先沿着最陡峭的方向爬上去,当可以肯定达到山顶区域时,再建立细致的曲面方程来描述其数学规律。
通常的做法是,沿着线性回归方程的等值线垂直的方向作为“最速前进方向”,边沿着此方向前进边做实验,对每个选定的位置只做一次即可。若响应变量的数值持续增加,则继续前进,直到响应变量数值出现了下降的情况才停止。选定刚刚得到的最佳值之处作为新一批响应曲面设计的中心点,转入第二阶段,安排响应曲面实验具体操作时,前进步长不要太大,第一步常以刚好抵达因子实验的边界为最好,这时可以保证第一步迈出后其响应变量值肯定是增加的。沿着该方向继续前进,每前进一步都要进行一次实验,如果获得的响应变量值继续增大,则沿着该方向再前进一步,直到获得的响应变量值开始减小,接下来我们就可以以此点为中心,在该区域上安排若干实验点,尽量拟合一个二次曲面方程,这样就可以找到最优值了。这种方法被称为“最速上升法”。
第二阶段:在已确认的最优区域范围内,进行相应曲面实验
在Minitab中,选择“统计>DoE>响应曲面>创建响应曲面设计”,选择中心复合设计(CCD)或者Box-Behnken设计,选定因子个数。
在“设计”对话框内选定总实验次数,中心点实验次数以及α值。α值有三种选择(1)默认,这时计算机会按照因子个数,旋转性和正交性的要求自动求出α值;(2)选“表面中心(α=1)”,即安排中心复合表面设计(CCF):(3)自定义α值。
在“因子”对话框内设定各因子的实际水平。当“水平定义”栏中选定“立方体点”时,表示这时设定的水平作为立方体点,也就是中心复合序贯设计(CCC),星号点会超出立方体。选定“轴点”时,表示这时设定的水平作为轴上的星号点,也就是中心复合有界设计(CCI),星号点会到达立方体的边界而不超出,立方体点会向内收缩。
在“选项”对话框内选择“随机化运行顺序”,软件会输出随机化的运行顺序,如果不选择,则输出标准化的安排方法。标准化顺序中,开始部分为因子设计点(立方体点),中间部分为星号点,最后为中心点。
响应曲面设计的分析
响应曲面设计的分析方法与完全析因和部分析因设计相同,也是按照七大步骤的方法顺序进行。
最主要的区别在于其选择的效应项不同。响应曲面设计需要拟合二次曲面,效应项的选择中要比因子设计增加了各自变量的平方项。
除此之外,所有的分析均与完全析因设计相同。
Box-Behnken设计
响应曲面的另一种设计方法就是Box-Behnken设计。这种设计安排是将因子各实验点取在立方体的棱的重点上。3因子的Box-Behnken设计设计取点示意图如下:
这种设计所需要的实验点数要比CCD要少,也具有近似的旋转性,特别适合在立方体顶点无法获得数据时使用。最大的缺点是设计没有序贯性,上批进行过的实验结果对下批实验几乎没有用,每批实验都要重新做。
Box-Behnken设计的设计与分析
Box-Behnken设计的设计与分析与中心复合设计相同,也可以按照按照七大步骤的方法顺序进行。可参考完全析因设计。