張曉琴,趙深淼
二水平正交飽和設(shè)計(jì)中零效應(yīng)搜索法的推廣
張曉琴,趙深淼
(山西大學(xué)數(shù)學(xué)科學(xué)學(xué)院,山西太原030006)
文[5]中提出的零效應(yīng)搜索法是分析飽和設(shè)計(jì)的有效方法.一般假定誤差是服從正態(tài)分布的.零效應(yīng)搜索法對(duì)于密度函數(shù)是對(duì)稱(chēng)分布的函數(shù)也適用,因此零效應(yīng)搜索法對(duì)t分布也適用.由于t分布的密度函數(shù)比較復(fù)雜,無(wú)法給出統(tǒng)計(jì)量的具體形式,但可通過(guò)模擬來(lái)實(shí)現(xiàn),通過(guò)對(duì)各種情況的模擬計(jì)算來(lái)說(shuō)明零效應(yīng)搜索法對(duì)t分布也適用.本文選擇自由度為3的t分布做模擬.并且在此假定下,也能很好的識(shí)別飽和設(shè)計(jì)中的顯著因子,誤差方差的估計(jì)也很好.
正交飽和設(shè)計(jì);次序統(tǒng)計(jì)量;零效應(yīng)搜索法;顯著效應(yīng);t分布
在飽和設(shè)計(jì)中,穩(wěn)健設(shè)計(jì)在質(zhì)量改進(jìn)中有廣泛的應(yīng)用,研究如何正確識(shí)別顯著因子的效應(yīng)和估計(jì)誤差方差是近年來(lái)的熱點(diǎn)問(wèn)題.已有的分析正交飽和設(shè)計(jì)的方法都是基于ε~N(0,1)假定下做的研究,如:Chen[1]提出了MaxUr方法,該方法只能識(shí)別顯著因子,得不到誤差方差的估計(jì);文[2]給出的是一種逐步檢驗(yàn)顯著因子的方法,也沒(méi)有給出σ的具體估計(jì)形式.而零效應(yīng)搜索法在識(shí)別顯著因子和估計(jì)誤差方面都有很好的結(jié)果.本文在零效應(yīng)搜索法的基礎(chǔ)上,將該方法推廣到t分布下做了更進(jìn)一步的研究.由于t分布的密度函數(shù)比較復(fù)雜,寫(xiě)不出統(tǒng)計(jì)量的具體形式,但可通過(guò)模擬實(shí)現(xiàn).
本文試驗(yàn)是基于2水平的因析試驗(yàn).
2水平正交表Ln(2m)(m=n-1)的飽和設(shè)計(jì)通常用如下的線性統(tǒng)計(jì)模型來(lái)描述(詳見(jiàn)[3]):
其中,β0是一般平均,β1,β2,…,βm代表因子的主效應(yīng)或某些需要考察的交互效應(yīng),都是待估參數(shù).
易見(jiàn),模型(1)中β=(β0,β1,…,βm)T的最小二乘估計(jì)為:
總平方和SST與各列平方和SSj(j=1,…,m)之間滿足
其中SST的自由度為n-1,SSj(j=1,…,m)的自由度為1.
我們的目標(biāo)是,利用n個(gè)觀測(cè)值y1,y2,…,yn,借助某個(gè)方法來(lái)判斷,在m個(gè)效應(yīng)中哪些效應(yīng)是顯著的.即考慮如下的假設(shè)檢驗(yàn)問(wèn)題:
引理1[4]若s個(gè)隨機(jī)變量X1,X2,…,Xs獨(dú)立同分布,其相應(yīng)的次序統(tǒng)計(jì)量記為:X1;s≤X2;s≤…≤Xs;s,假如它們的數(shù)學(xué)期望都存在,并記μi;s=E(Xi,s)為第i個(gè)次序統(tǒng)計(jì)量的期望,則有下式成立:
這里μr+1;s和μr;s分別表示來(lái)自總體的容量為s的樣本的第r+1個(gè)和第r個(gè)次序統(tǒng)計(jì)量的期望,μr;s-1表示同一總體容量為s-1的樣本的第r個(gè)次序統(tǒng)計(jì)量的期望.
分別用估計(jì)^μr+1;s=ξr+1,^μr;s=ξr,^μr;s-1=(ξr+1+ξr)/2代替μr+1;s,μr;s,μr;s-1,可得W統(tǒng)計(jì)量[5]如下:
零效應(yīng)搜索法的步驟:
(1)首先由y1,…,yn算得^βj及SSj(1≤j≤m),算出Ws(3≤s≤m)的值.
(2)對(duì)給定的顯著性水平α,我們可以按s由小到大的順序比較每對(duì)Ws,Ws,α(3≤s≤m)的大小,若滿足Ws>Ws,a的最小s=q+1,則零效應(yīng)個(gè)數(shù)就是q.
考慮正交表H=L16(215)對(duì)應(yīng)的飽和設(shè)計(jì)模型(1),即yi=β0+β1xi1+…+β15xi,15+εi,i=1,…,16.令εi是取自t(3)的隨機(jī)數(shù),即σ2=3.我們依次假設(shè)顯著因子的個(gè)數(shù)分別為1個(gè),2個(gè),4個(gè),6個(gè).1個(gè)顯著因子時(shí),取β1=size;2個(gè)顯著因子時(shí),取β1=size,β2=2size;4個(gè)顯著因子時(shí),β1=β2=size,β3=β4=2size;6個(gè)顯著因子時(shí),β1=β2=size,β3=β4=2size,β5=β6=4size;8個(gè)顯著因子時(shí),β1=β2=size,β3=β4=2size,β5=β6= 3size,β7=β8=4size;10個(gè)顯著因子時(shí),β1=β2=β3=size,β4=β5=β6=2size,β7=β8=β9=3size,β10=4size;其中size=1,2,3,4.上面所有的沒(méi)有列出來(lái)的效應(yīng)以及β0都等于0.對(duì)于上述的每種情況,我們利用SA S的rannor函數(shù)構(gòu)造出自由度為3的t-分布,產(chǎn)生均值為0,方差為3的隨機(jī)數(shù).并且對(duì)每種情況都模擬計(jì)算100次,下面的表1到表6列出了每種情況下所計(jì)算出的100個(gè)σ^2的均值σ^2和標(biāo)準(zhǔn)差s.
表1 1個(gè)顯著因子Table 1 One significant factor
表2 2個(gè)顯著因子Table 2 Two significant factors
表3 4個(gè)顯著因子Table 3 Four significant factors
表4 6個(gè)顯著因子Table 4 Six significant factors
表5 8個(gè)顯著因子Table 5 Eight significant factors
表6 10個(gè)顯著因子Table 6 Ten significant factors
上述計(jì)算結(jié)果顯示,對(duì)2水平的飽和設(shè)計(jì)而言,當(dāng)所有的非零效應(yīng)都大于3時(shí),σ2的估計(jì)較好,其與真實(shí)值的偏差不超過(guò)0.38.當(dāng)顯著因子的效應(yīng)小于3時(shí),σ2的估計(jì)稍微偏小,這是因?yàn)槲覀冞x擇的εi是取自t(3)的隨機(jī)數(shù),估計(jì)值偏小是正常的.另外,σ2的估計(jì)的標(biāo)準(zhǔn)差隨著顯著效應(yīng)值的增大而增大,接近于目標(biāo)值3.這說(shuō)明我們給出的關(guān)于2水平飽和設(shè)計(jì)的誤差的估計(jì)方法是一個(gè)令人滿意的方法,對(duì)密度函數(shù)為對(duì)稱(chēng)函數(shù)的分布均適用,都能用該方法來(lái)估計(jì),且不再需要效應(yīng)稀疏原理的約束.
例1 考慮正交表H=L16(215)對(duì)應(yīng)的飽和設(shè)計(jì)模型(1),即yi=β0+β1xi1+…+β15xi,15+εi,i=1,…, 16.令εi是取自t(3)的隨機(jī)數(shù),即σ=3.又令β1=β2=2,β3=β4=4,β5=β6=6,β7=β8=8,β0=β9=…=β15= 0.而各個(gè)xij的取值情況詳見(jiàn)引言的模型敘述.可得到如下的試驗(yàn)數(shù)據(jù)(y1,…,y16)=(42.703,28.768 4,-9.319 9,-23.123 8,0.407 3,-14.968 8,6.6922,-8.087 1,-0.378 7,-14.217 7,7.041 2,-7.488 0, 9.480 1,-10.480 8,7.284 2,-8.312 0).在顯著性水平α=0.05下進(jìn)行分析.
首先由(2)算出各個(gè)βj的最小二乘估計(jì)^βj(j=1,…,15).算出各效應(yīng)平方和SSj=16^β2j(j=1,…,15),具體見(jiàn)表7的第3,4列.并將Ws(3≤s≤5)與其對(duì)應(yīng)的臨界值Ws,0.05(見(jiàn)附表)列于表8的第2,3列.觀察發(fā)現(xiàn),滿足Ws>Ws,0.05的最小的s=8,從而零效應(yīng)個(gè)數(shù)q=8-1=7.這與模擬前給定的零效應(yīng)個(gè)數(shù)是一致的.而σ2的估計(jì)^σ2=SSe/7=(SS1;15+…+SS7;15)/7=2.627 93.即^σ=1.621 01.由q=7可初步判定最小的7個(gè)SSj;15對(duì)應(yīng)的效應(yīng)為零,另外的8個(gè)效應(yīng)非零,即表7,表8中打*所對(duì)應(yīng)的效應(yīng)1,2,3,4,5,6,7,8是顯著的.再由t-統(tǒng)計(jì)量進(jìn)行驗(yàn)證,即計(jì)算效應(yīng)1,2,3,4,5,6,7,8的t-統(tǒng)計(jì)量的值,見(jiàn)表9.又注意到在顯著性水平α=0.05時(shí),t1-0.05/2(7)=2.364 62,通過(guò)觀察可見(jiàn),顯著效應(yīng)確實(shí)為1,2,3,4,5,6,7,8.
表7 例1中^βj及SSjTable 7 ^βjandSSjin the Example 1
表8 例1中W統(tǒng)計(jì)量及其臨界值Table 8 W-statistic and its critical value
表9 t-檢驗(yàn)Table 9 t-test
另外,模擬計(jì)算1 000次的結(jié)果顯示,結(jié)果如下:有527次正好選出所有真正顯著的因子,有137次誤將一個(gè)不顯著的因子判定為顯著的,80次誤判2個(gè),66次誤判3個(gè),65次誤判4個(gè),45次誤判5個(gè),80次漏判.出現(xiàn)漏判的原因是我們選擇的ε~t(3),而隨機(jī)誤差的標(biāo)準(zhǔn)差是3所以可能將取值比較小的顯著因子誤判為零因子.這與我們選擇的隨機(jī)變量的分布函數(shù)是分不開(kāi)的.因?yàn)閠-分布的密度函數(shù)比較特殊,它的峰比標(biāo)準(zhǔn)正態(tài)分布的峰尖,尾比標(biāo)準(zhǔn)正態(tài)分布的尾更重.
用零效應(yīng)搜索法對(duì)t分布的模擬結(jié)果表明,零效應(yīng)搜索法適用于密度函數(shù)是對(duì)稱(chēng)分布的函數(shù).能較好的識(shí)別顯著因子,且對(duì)誤差方差σ2的估計(jì)結(jié)果也令人滿意.
[1] CHEN Y.On the Analysis of Unreplicated Factorial Designs[J].Biometrical J ournal,2003,46:125-140.
[2] WU S S,WANG W.Step K-up Simultaneous Tests for Identifying Active Effects in Orthogonal Saturated Designs[J].A nn Statist,2007,35:449-463.
[3] 茆詩(shī)松,周紀(jì)薌,陳 穎.試驗(yàn)設(shè)計(jì)[M].北京:中國(guó)統(tǒng)計(jì)出版社,2004.
[4] KARPL J K,KAPADIA C H,OWEN D B.Handbook of Statistical Distributions[M].New York and Basel:Marcel Dekker Inc,1976.
[5] 張曉琴,張應(yīng)山,茆詩(shī)松.二水平正交飽和設(shè)計(jì)的統(tǒng)計(jì)分析——零效應(yīng)搜索法[J].華東師范大學(xué)學(xué)報(bào)(自然科學(xué)版), 2008,1:51-59.
Spread of the Procedure of Searching Zero Effects in the Statistical Analysis of 2-Level Orthogonal Saturated Designs
ZHANG Xiao-qin,ZHAO Shen-miao
(School of Mathematical Sciences,Shanxi University,Taiyuan030006,China)
The article[5]proposed the procedure of searching zero effects which is a effective method in analyzing orthogonal saturated designs.Generally,it assume that the errors are subject to normal distribution. Because the density function oft-distribution is also a symmetric distribution,the procedure of searching zero effects is also applicable to thet-distribution.The density function oft-distribution is much more complicated,so it can’t give the specific form of statistics.However,it can achieve by simulation,through the simulation of various situations,illustrate that the procedure of searching zero effects is applicable to thetdistribution.Choosing the distribution oft(3)to do the simulation,under this assumption,it can also identify significant factor in orthogonal saturated designs,and the estimated of error varianceis also very well.
orthogonal saturated designs;order statistics;Procedure of Searching Zero Effects;active effects;t-distribution
O212.1
A
0253-2395(2010)02-0182-04
2009-05-26
國(guó)家自然科學(xué)基金(44K55050);山西省高校高新技術(shù)產(chǎn)業(yè)化項(xiàng)目(20090006)
張曉琴(1975-),女,山西長(zhǎng)治人,博士,研究方向:試驗(yàn)設(shè)計(jì).E-mail:zhangxiaoqin@sxu.edu.cn