于慧春 殷勇 李欣
回歸正交試驗設(shè)計把試驗規(guī)劃、數(shù)據(jù)處理以及實用、可靠回歸方程建立統(tǒng)一起來,不僅使得在每個試驗點上獲得的數(shù)據(jù)含有最大的信息量,并且大大減少試驗次數(shù),使得數(shù)據(jù)的統(tǒng)計分析具有一些較好的性質(zhì)。因而,在科學(xué)研究中應(yīng)用非常廣泛。為了更深入的理解回歸正交試驗設(shè)計方法,本文對回歸正交試驗設(shè)計的原理及特點進(jìn)行了較為詳細(xì)的分析,以期為廣大師生的學(xué)習(xí)及應(yīng)用提供一定的幫助。
深入了解事物本質(zhì),找出不確定性變量之間的相互依存關(guān)系,常用的分析方法就是回歸分析。普通的回歸分析方法,只是被動的處理已有的試驗數(shù)據(jù),而對試驗的規(guī)劃幾乎不提任何要求,并且對所獲得的回歸方程的精度也不做研究。這樣,不僅盲目的增加了試驗次數(shù),而且試驗數(shù)據(jù)還存在不能提供充分信息的弊端,導(dǎo)致在許多多因子問題中達(dá)不到試驗?zāi)康摹?/p>
為獲得高質(zhì)量的回歸方程而按相應(yīng)的要求安排試驗,稱為回歸試驗設(shè)計。其目的是為了減少試驗次數(shù),簡化回歸計算,并使回歸方程實用、可靠。回歸正交設(shè)計,是指試驗方案的結(jié)構(gòu)矩陣具有正交性的回歸設(shè)計。是在正交設(shè)計基礎(chǔ)上發(fā)展起來的,可建立方程,選擇最佳的方案。其突出優(yōu)點是用很少的處理組合得出完全實施試驗相同項數(shù)的回歸模型,計算過
程極為簡單并已消除了回歸系數(shù)之間的相關(guān)性,統(tǒng)計性質(zhì)得到了明顯改善。因而,回歸正交試驗設(shè)計在尋求最佳工藝及配方,以及建立生產(chǎn)過程的回歸數(shù)學(xué)模型,以用于控制和預(yù)測等研究中應(yīng)用非常廣泛,因此,本文結(jié)合自己對回歸正交試驗設(shè)計方法的理解,對回歸正交試驗設(shè)計的原理及特點作一簡單的介紹。
進(jìn)行回歸正交試驗設(shè)計,首先確定各因子的變化范圍,然后對其各因子進(jìn)行編碼,編碼即對各因素進(jìn)行線性變換。編碼的意義主要是:消除各因子單位及數(shù)值大小對結(jié)果的影響,使得各因子的研究區(qū)域由因素空間的多維長方體變?yōu)榫幋a空間的多維正立方體,且在編碼空間的取值范圍都是,從而保證各因素的不同水平都是“平等”的。
例如:以一個兩因子的研究為例,如圖1所示,因子的研究區(qū)域在因子空間是一個矩形,因子取值單位不同,數(shù)量級不同,會對回歸方程的可靠性產(chǎn)生不利影響,如因子本身與所研究指標(biāo)間的相關(guān)性可能并不強,但是由于數(shù)量級不較大,導(dǎo)致結(jié)果傾向于該因子,而將實際與指標(biāo)相關(guān)性較強,但數(shù)值較小的因子忽略掉。通過編碼,研究區(qū)域變成一個正方形,在編碼空間,兩個因子的取值范圍相同,“地位平等”, 從而避免了因素單位及數(shù)值大小對結(jié)果的影響。
一次回歸(一元或多元)在編碼空間選試驗點,每個因子都分別選其上下兩個水平,這樣就可以運用兩水平正交表來安排試驗,選用兩水平正交表時,用-1代換表中的2,代換后正交表中的-1,+1既表示因子水平的不同狀態(tài)(兩種狀態(tài)),也表示因子水平變化數(shù)量的大?。ㄒ蛩卦诰幋a空間的取值范圍)。以比較常用的二水平正交表L8(27)為例,用-1代換表中的2后,正交表如表1所示。
很明顯,以兩水平正交表編制的這種試驗計劃,如以表示在第
次試驗中第
個變量的編碼值,于是在試驗計劃中有
任一列的和
任兩列的內(nèi)積
由此體現(xiàn)出這種設(shè)計具有正交性,所以這種設(shè)計稱為正交設(shè)計。
編碼空間中試驗點的分布情況,以三因子試驗為例,所選的試驗點在編碼空間的分布如圖2所示。所選試驗點正好是編碼空間一個正立方體的頂點。因此,回歸正交試驗設(shè)計所選的試驗點都分布在編碼空間的多維正立方體的各個頂點上,也體現(xiàn)了均勻分布的特點。
在編碼空間回歸的數(shù)學(xué)模型為:
N:試驗次數(shù)
:隨機誤差的方差
是p維編碼空間的一個球面,球心在原點,半徑為。
的計算公式表明,當(dāng)所選的試驗點到原點的距離相等時,即所選的試驗點位于同一球面時,其預(yù)測值的方差時相等的。N和是一定的,所選的各試驗點的預(yù)測值的方差
只與
有關(guān),
不變,
不變。預(yù)測值只與預(yù)測點的位置有關(guān),與其方位無關(guān),可提高預(yù)測的精度。回歸正交試驗的這一性質(zhì)稱為“旋轉(zhuǎn)性”。
“旋轉(zhuǎn)性”對在最優(yōu)工藝尋找過程中排除誤差干擾具有重要意義,因為同一球面上的點,其預(yù)測值的方差相等,所以可以通過直接比較預(yù)測值的好壞,來確定預(yù)測值相對較優(yōu)的研究區(qū)域,而不必考慮誤差干擾的影響,并且獲得性能較佳的回歸方程。
此外,通過對圖2編碼空間試驗點的分布進(jìn)行分析可知,在編碼空間,每個因子都只取其上下兩個水平,所構(gòu)成的試驗點分布為多維空間的正立方體的頂點,每個試驗點到原點的距離相等,所以這些試驗點分布在編碼空間的一個球面上。增加任何一個水平,所構(gòu)成的試驗點其分布都與這些試驗點不會落在同一個球面上,試驗設(shè)計“旋轉(zhuǎn)性”的特點就丟失了,所得到的回歸方程性能也會相應(yīng)變差。因此,要使得回歸正交試驗設(shè)計具有“旋轉(zhuǎn)性”這一特點,即所選的試驗點在編碼空間分布在一個球面上,則每個因子只能選上下兩個水平(每個因子的研究區(qū)域范圍相同),不能增加任何一水平。
每個因子確定取上下兩個水平后,則只能利用相應(yīng)的二水平正交表來設(shè)計試驗,設(shè)計方法具有“正交性”和“旋轉(zhuǎn)性”,既能用較少的試驗次數(shù)得到較優(yōu)的回歸方程,且計算簡單。
回歸正交試驗設(shè)計首先確定各因子取值范圍,然后進(jìn)行編碼,將原因素空間的回歸問題轉(zhuǎn)換為編碼空間中指標(biāo)值對轉(zhuǎn)換后因子的回歸問題,從而消除了不同單位及量綱對結(jié)果的不利影響;選用二水平正交表,每個因子只選上下兩個對稱水平,保證試驗設(shè)計的“正交性”和“旋轉(zhuǎn)性”,從而保證了所獲得的回歸方程具有更高的精度及可靠性,同時也大大減少了試驗次數(shù)。
基金項目:“食品試驗設(shè)計”精品資源共享課程,研究生課程建設(shè)項目,校級,編號:2016YKJ-005。
(作者單位:河南科技大學(xué)食品與生物工程學(xué)院)