高鑫雨,趙勝利
(曲阜師范大學(xué)統(tǒng)計學(xué)院,273165,山東省曲阜市)
自20世紀(jì)20年代英國統(tǒng)計學(xué)家Fisher R A在農(nóng)業(yè)生產(chǎn)中創(chuàng)立試驗設(shè)計以來,試驗設(shè)計已在各個領(lǐng)域得到廣泛的發(fā)展,其主要任務(wù)是研究最優(yōu)設(shè)計的構(gòu)造以及對試驗數(shù)據(jù)進(jìn)行統(tǒng)計分析.著名統(tǒng)計學(xué)家Box G E P說過,假如有10%的工程師使用各種試驗設(shè)計方法,產(chǎn)品的質(zhì)量與數(shù)量都會得到很大提高[1].因子設(shè)計在各類試驗中應(yīng)用相當(dāng)廣泛,常用于研究各因子對試驗指標(biāo)是否具有顯著影響.在實際問題中,影響試驗指標(biāo)的因子往往有多個,而當(dāng)涉及的因子數(shù)較多時,因子的水平組合數(shù)會迅速增加,受試驗條件的限制往往難以全部實施.正交設(shè)計則是安排多因子試驗的一種高效的試驗設(shè)計方法.方差分析是對因子進(jìn)行顯著性檢驗的常用方法,且方差分析需要滿足3項基本假定:正態(tài)性、方差齊性和隨機(jī)性.正態(tài)性和隨機(jī)性在實際中容易得到滿足,由于試驗在實際操作時環(huán)境復(fù)雜,方差齊性通常得不到滿足,因此在不同的處理組合下會有不同的試驗誤差方差,在這種情況下,采用方差分析對因子進(jìn)行顯著性檢驗會產(chǎn)生一定的誤差,且檢驗犯第一類錯誤的概率可能與顯著性水平產(chǎn)生偏離.
在實際試驗中經(jīng)常遇到試驗因子的水平數(shù)不相等的情況,這種情況下實施試驗需要用到混水平正交設(shè)計.混水平正交設(shè)計因為其靈活的水平組合在各種混水平試驗中得到非常廣泛的應(yīng)用[1].
本文在不同處理組合下試驗誤差方差不等的情況下,考察混水平正交試驗因子的顯著性檢驗問題,從方差分析中F統(tǒng)計量的構(gòu)造給出新的檢驗統(tǒng)計量,利用隨機(jī)模擬的方法獲得相應(yīng)的臨界值,分別通過傳統(tǒng)的F檢驗與新檢驗方法檢驗各因子效應(yīng)的顯著性,模擬結(jié)果表明在試驗誤差方差不等時F檢驗犯第一類錯誤的概率嚴(yán)重偏離顯著性水平,新的檢驗方法犯第一類錯誤的概率更精確.
對2水平正交表L8(27)通過并列法改造可以得到混水平正交表L8(4×24),由于4水平因子的自由度為3,因此在2水平正交表中應(yīng)該占3列,這3列的選法是:任取2列再加上其交互作用列,由此3列組成一個4水平列,4水平的對應(yīng)法則如下:將任取的2列的4個數(shù)對對應(yīng)4個水平,即:(1,1)→1,(1,2)→2,(2,1)→3,(2,2)→4.
此時4個數(shù)對各出現(xiàn)兩次,不失一般性,取第1、2兩列加上其交互作用列第3列組成一個4水平列,經(jīng)過上述改造,即可得到混水平正交表L8(4×24)[1].
表1 L8(4×24)正交表
對2水平正交表L16(215)通過上述相同的方法改造可以得到混水平正交表L16(4×212),此時4個數(shù)對各出現(xiàn)四次,不失一般性,仍取第1、2兩列加上其交互作用列第3列組成一個4水平列,經(jīng)過上述改造,即可得到混水平正交表L16(4×212).
表2 L16(4×212)正交表
還可將2水平正交表L16(215)改造成混水平正交表L16(8×28),由于8水平因子的自由度為7,因此在2水平正交表中應(yīng)占7列,這7列的選法是:任取3列獨立列再加上其交互作用列,由此7列組成一個八水平列,八水平的對應(yīng)法則如下:將任取的3列的8個數(shù)對對應(yīng)8個水平,即:
(1,1,1)→1,(1,1,2)→2,(1,2,1)→3,(1,2,2)→4,
(2,1,1)→5,(2,1,2)→6,(2,2,1)→7,(2,2,2)→8.
此時8個數(shù)對各出現(xiàn)2次,不失一般性,取第1、2、4列加上其交互作用列第3、5、6、7列組成一個8水平列,經(jīng)過上述改造,即可得到混水平正交表L16(8×28).
表3 L16(8×28)正交表
1.2.1 統(tǒng)計模型
考慮因子的水平數(shù)不等的等重復(fù)試驗,利用正交表進(jìn)行試驗設(shè)計,設(shè)正交表為Ln(qp),假設(shè)有n個處理組合,在同一處理組合下重復(fù)進(jìn)行m次試驗.考慮如下線性統(tǒng)計模型
yij=ui+εij,i=1,…,n,j=1,…,m,
1.2.2 顯著性檢驗
為檢驗各因子的效應(yīng)是否顯著,對如下假設(shè)作出檢驗
由于存在重復(fù)試驗,因此如果把每一處理組合下的數(shù)據(jù)結(jié)果看作一個組,則組內(nèi)的平方和反應(yīng)的是純誤差,可用組內(nèi)平方和度量
fk=q-1,
由Cochran定理知,當(dāng)原假設(shè)成立即因子的效應(yīng)為0,并且各試驗誤差的方差相等時,S內(nèi)/σ2~χ2(n(m-1)),Sk/σ2~χ2(p-1),且S內(nèi)與Sk相互獨立,故
當(dāng)統(tǒng)計量Fk≥F1-α(p-1,n(m-1))時,認(rèn)為在顯著性水平α下因子是顯著的,即認(rèn)為該因子的效應(yīng)不為0,其中F1-α是相應(yīng)自由度的F分布的1-α分位數(shù)[1].
由于改造后的表仍是正交表,設(shè)計仍是正交設(shè)計,因此,平方和分解式與方差分析與改造前相同,并且可以用改造前的正交表計算混水平試驗的各列平方和,只需按表頭設(shè)計計算因子在改造前的正交表中所占列的平方和.
方差分析是對因子進(jìn)行顯著性檢驗的常用方法,然而方差分析需要假定不同處理組合下具有相同的試驗誤差方差,由于試驗在實際操作時環(huán)境復(fù)雜,因此在不同的處理組合下會有不同的試驗誤差方差,在這種情況下,采用方差分析的方法對因子進(jìn)行顯著性檢驗會產(chǎn)生一定的誤差,且檢驗犯第一類錯誤的概率可能與顯著性水平產(chǎn)生偏離,從而因子的顯著性檢驗容易發(fā)生誤判,為此,從F統(tǒng)計量的構(gòu)造出發(fā)給出新的檢驗統(tǒng)計量,并采用隨機(jī)模擬的方法獲得相應(yīng)的臨界值.
將F統(tǒng)計量變形得到
此時Fk的分子服從χ2(1),接下來考慮Fk分母的分布.注意到
因此可以將Fk的分母變形為
由上述推導(dǎo)過程可知,在原假設(shè)成立的條件下,當(dāng)不同處理組合下試驗誤差的方差不相等時,變形后的F統(tǒng)計量的分子服從χ2(1),分母是以試驗誤差方差為權(quán)重的n個χ2(m-1)的加權(quán)和.
對于由2水平正交表改造的混水平正交試驗,可以采用改造前的正交表計算各列平方和,只需按表頭設(shè)計將因子在改造前的正交表中所占列的平方和相加,由卡方分布的可加性知,變形后的F統(tǒng)計量分子服從χ2(a),其中卡方分布的自由度a取決于因子在改造前的正交表中所占列的列數(shù),分母的分布保持不變.
顯然,此時的檢驗統(tǒng)計量不再服從F分布,如果仍用F1-α(p-1,n(m-1))作為顯著性檢驗的臨界值是不合理的,因子的顯著性也容易發(fā)生誤判,由于檢驗統(tǒng)計量的精確分布很難確定,因此采用隨機(jī)模擬的方法來確定檢驗的臨界值,隨機(jī)模擬過程如下:
步驟2 對于l=1,…,M;
步驟2.1 生成一個χ2(a)的隨機(jī)變量Ul;
步驟2.2 生成n個相互獨立的χ2(m-1)的隨機(jī)變量Vl1,…,Vln;
步驟2.3 計算檢驗統(tǒng)計量
步驟3 取顯著性水平α,計算檢驗統(tǒng)計量的分位數(shù)qα.
以3個由2水平正交表改造的混水平正交表為例,在不同處理組合的試驗誤差方差相等和不等兩種情況下,分別利用F檢驗和改進(jìn)后的新檢驗方法對因子的顯著性檢驗進(jìn)行模擬對比,隨機(jī)模擬過程重復(fù)10 000次.
假設(shè)試驗1需要考察5個因子A、B、C、D、E的顯著性,其中因子A是4水平因子,因子B、C、D、E是4個2水平因子,為此,選用混合水平正交表L8(4×24)進(jìn)行試驗,置因子A在正交表的4水平列上,即由正交表L8(27)的第1,2,3列組成的列,再將因子B、C、D、E安排在剩余的2水平列上,表頭設(shè)計如表4.
表4 試驗1的表頭設(shè)計
假設(shè)不同處理組合下的試驗誤差具有相同的方差2,總平均為10,因子A與因子D是顯著因子,并且βA=0.4,βD=0.65,因子B、C、E均為不顯著因子,即因子B、C、E的效應(yīng)為0,因此試驗1的統(tǒng)計模型為yij~N(10+0.4A+0.65D,2),其中A和D根據(jù)因子的水平組合取±1.假設(shè)在同一處理組合下重復(fù)進(jìn)行若干次試驗,取顯著性水平為0.05,分別利用F檢驗與改進(jìn)后的新檢驗方法來檢驗各因子效應(yīng)的顯著性,得到拒絕原假設(shè)的百分比,如表5所示.
表5 試驗1在5%水平下拒絕原假設(shè)的百分比
假設(shè)試驗2需要考察因子A、B、C、D、E、F、G的顯著性,其中因子A是4水平因子,因子B、C、D、E、F、G是二水平因子,假定根據(jù)專業(yè)知識還需考察交互作用A×B與A×C,為此,選用混合水平正交表L16(4×212)進(jìn)行試驗.
置因子A在正交表的4水平列上,即由正交表L16(215)的第1,2,3列組成的列,再將因子B安排在第4列,交互作用A×B安排在第5,6,7列,即由因子A在L16(215)所占的3列與B所在列的交互列組成的列,再將因子C安排在第8列,交互作用A×C安排在第9,10,11列,最后將因子D、E、F、G依次安排在剩余的列,綜上可得表頭設(shè)計如表6.
表6 試驗2的表頭設(shè)計
假設(shè)不同處理組合下的試驗誤差具有相同的方差2,總平均為10,因子A、B以及交互作用A×B與A×C顯著,并且各個顯著因子的效應(yīng)分別為βA=0.3,βB=0.55,βA×B=0.35,βA×C=0.2,因子D、E、F、G均為不顯著因子,因此,試驗2的統(tǒng)計模型為yij~N(10+0.3A+0.55B+0.35AB+0.2AC,2),其中A、B、AB及AC根據(jù)因子的水平組合取±1,取顯著性水平0.05,分別利用F檢驗與改進(jìn)后的新檢驗方法來檢驗各因子效應(yīng)的顯著性,得到拒絕原假設(shè)的百分比,如表7所示.
表7 試驗2在5%水平下拒絕原假設(shè)的百分比
假設(shè)試驗3需要考察因子A、B、C、D、E、F、G的顯著性,其中因子A是8水平因子,因子B、C、D、E、F、G是2水平因子,假定試驗不需要考察交互作用,為此,選用混合水平正交表L16(8×28)進(jìn)行試驗.置因子A在正交表的八水平列上,再將因子B、C、D、E、F、G依次安排在2~7列,可得表頭設(shè)計如表8.
表8 試驗3的表頭設(shè)計
假設(shè)不同處理組合下的試驗誤差具有相同的方差2,總平均為10,僅因子A是顯著因子,且因子A的效應(yīng)為βA=0.2,因子B、C、D、E、F、G均為不顯著因子,即因子的效應(yīng)為0,因此,試驗3的統(tǒng)計模型為yij~N(10+0.2A,2),其中A根據(jù)因子的水平組合取±1,取顯著性水平為0.05,分別利用F檢驗與改進(jìn)后的檢驗方法來檢驗各因子效應(yīng)的顯著性,得到拒絕原假設(shè)的百分比,如表9所示.
表9 試驗3在5%水平下拒絕原假設(shè)的百分比
由表5、表7、表9的模擬結(jié)果對比可知,當(dāng)不同處理組合下的試驗誤差方差相等時,傳統(tǒng)的F檢驗與改進(jìn)后的新檢驗方法犯第一類錯誤的概率均接近顯著性水平0.05,且隨著重復(fù)次數(shù)的增加犯第一類錯誤的概率相對穩(wěn)定.綜上,在試驗誤差方差相等的情況下,對混水平正交試驗因子的顯著性作檢驗,改進(jìn)后的新檢驗方法與F檢驗均有較精準(zhǔn)的誤差控制.
假定試驗4與試驗1所考察的因子以及因子效應(yīng)的大小相同,但試驗4在不同處理組合下的試驗誤差方差不相等,即試驗誤差方差與處理組合有關(guān).假定試驗4的試驗誤差方差受因子B、C、D的影響,且其系數(shù)分別為0.5、0.55、0.4,則試驗4的統(tǒng)計模型為
yij~N(10+0.4A+0.65D,
exp(0.5B+0.55C+0.4D)),
取顯著性水平0.05,分別利用F檢驗與改進(jìn)后的新檢驗方法來檢驗各因子效應(yīng)的顯著性,得到拒絕原假設(shè)的百分比,模擬對比的結(jié)果如表10所示.
表10 試驗4在5%水平下拒絕原假設(shè)的百分比
假定試驗5與試驗2所考察的因子以及因子效應(yīng)的大小相同,但試驗5在不同處理組合下的試驗誤差方差不相等,即試驗誤差方差與處理組合有關(guān).假定試驗5的試驗誤差方差受因子A、C以及交互作用A×B的影響,且其系數(shù)分別為0.45、0.25、0.5,則試驗5的統(tǒng)計模型
yij~N(10+0.3A+0.55B+0.35AB+0.2AC,
exp(0.45A+0.25C+0.5AB)),
取顯著性水平0.05,分別利用F檢驗與改進(jìn)后的新檢驗方法來檢驗各因子效應(yīng)的顯著性,得到拒絕原假設(shè)的百分比,模擬對比的結(jié)果如表11所示.
表11 試驗5在5%水平下拒絕原假設(shè)的百分比
假定試驗6與試驗3所考察的因子以及因子效應(yīng)的大小相同,但試驗6在不同處理組合下的試驗誤差方差不相等,即試驗誤差方差與處理組合有關(guān).假定試驗6的試驗誤差方差僅受因子A的影響,且其系數(shù)為0.45,則試驗6的統(tǒng)計模型
yij~N(10+0.2A,exp(0.45A)),
則在顯著性水平0.05下,分別利用F檢驗與改進(jìn)后的新檢驗方法來檢驗各因子效應(yīng)的顯著性,得到拒絕原假設(shè)的百分比,模擬對比的結(jié)果如表12所示.
表12 試驗6在5%水平下拒絕原假設(shè)的百分比
由表10~表12的模擬結(jié)果對比可知,當(dāng)不同處理組合下的試驗誤差方差不相等時,傳統(tǒng)的F檢驗犯第一類錯誤的概率嚴(yán)重偏離0.05,從而因子效應(yīng)的顯著性容易發(fā)生誤判,改進(jìn)后的新檢驗方法犯第一類錯誤的概率幾乎接近顯著性水平0.05,且隨著重復(fù)次數(shù)的增加犯第一類錯誤的概率更穩(wěn)定.綜上,在試驗誤差方差不等的情況下,對混水平正交試驗因子的顯著性作檢驗,改進(jìn)后的新檢驗方法比F檢驗有更精準(zhǔn)的誤差控制.
因子設(shè)計在各類試驗中應(yīng)用相當(dāng)廣泛,用于研究各因子對試驗指標(biāo)是否具有顯著影響.在實際問題中,影響試驗指標(biāo)的因子往往有多個,要考察它們就要用到多因子試驗設(shè)計,正交設(shè)計就是安排多因子試驗的一種高效的試驗設(shè)計方法.方差分析中的F檢驗是對因子進(jìn)行顯著性檢驗的常用方法,然而方差分析需要假定不同處理組合下具有相同的試驗誤差方差,由于試驗在實際操作時環(huán)境復(fù)雜,因此在不同的處理組合下會有不同的試驗誤差方差,在這種情況下,采用方差分析對因子進(jìn)行顯著性檢驗會產(chǎn)生一定的誤差.
為此,從方差分析中F統(tǒng)計量的構(gòu)造給出新的檢驗統(tǒng)計量,通過隨機(jī)模擬的方法獲得相應(yīng)的臨界值,以3個混水平正交表為例,在不同處理組合的試驗誤差方差相等和不等兩種情況下,分別利用F檢驗和改進(jìn)后的新檢驗方法對因子的顯著性檢驗進(jìn)行模擬對比,得到結(jié)論如下:
當(dāng)不同處理組合下的試驗誤差方差相等時,考察等重復(fù)的混水平正交試驗的因子顯著性檢驗問題,傳統(tǒng)的F檢驗與改進(jìn)后的新檢驗方法犯第一類錯誤的概率均接近顯著性水平0.05,且隨著重復(fù)次數(shù)的增加犯第一類錯誤的概率相對穩(wěn)定,改進(jìn)后的新檢驗方法與F檢驗均有較精準(zhǔn)的誤差控制.當(dāng)不同處理組合下的試驗誤差方差不相等時,傳統(tǒng)的F檢驗犯第一類錯誤的概率嚴(yán)重偏離0.05,從而因子效應(yīng)的顯著性容易發(fā)生誤判,改進(jìn)后的新檢驗方法犯第一類錯誤的概率幾乎接近顯著性水平0.05,且隨著重復(fù)次數(shù)的增加犯第一類錯誤的概率更穩(wěn)定,因此,改進(jìn)后的新檢驗方法比F檢驗?zāi)芨珳?zhǔn)的控制檢驗誤差.
綜上可知,F(xiàn)檢驗對方差齊性的偏離較為敏感,在考察等重復(fù)的混水平正交試驗因子的顯著性檢驗問題時,方差齊性檢驗十分必要,若不同處理組合下的試驗誤差方差不全相等,則應(yīng)采用提出的新檢驗方法判斷因子效應(yīng)的顯著性,否則會產(chǎn)生一定誤差.