王 鈺,李濟洪
無重復因析試驗中一種散度效應(yīng)的估計方法
王 鈺,李濟洪*
(山西大學計算中心,山西太原030006)
在無重復因析試驗的多個散度效應(yīng)分析中,現(xiàn)有的許多方法都存在錯誤識別的現(xiàn)象,即兩個顯著的散度效應(yīng)可能在它們的交互列上產(chǎn)生一個錯誤的(spurious)散度效應(yīng).為了解決這種模棱兩可性,文章提出了一種基于閉的位置效應(yīng)集合殘差的改進H方法(稱為AH方法),證明了AH的估計的無偏性,并通過一個基于實例的模擬驗證了此方法.
多個散度效應(yīng);無重復因析;無偏性;模擬
無重復因析試驗中散度效應(yīng)的分析近年來得到了許多學者的關(guān)注.最早Harvey[1]從一般回歸模型的角度考慮了散度參數(shù)的估計問題,提出了一個H估計方法.而Box和Meyer[2]于1986年最先從試驗設(shè)計的角度提出了一個無重復因析試驗中散度效應(yīng)的分析方法.接著Wang[3],Bergman和Hynén[4],Brenneman和Nair[5]分別研究了此問題,提出了基于對數(shù)散度模型的不同散度效應(yīng)識別和估計方法.最近,McGrath和Yeh[6],Chen-Tuo Liao[7],van de Ven[8]又分別從各種角度出發(fā),給出了一些新的散度效應(yīng)估計方法和研究結(jié)果.但是在多個散度效應(yīng)的分析中,上面提到的方法都存在錯誤識別的現(xiàn)象,即兩個顯著的散度效應(yīng)可能在它們的交互列上產(chǎn)生一個錯誤的散度效應(yīng).為了解決這種模棱兩可性,McGrath and Lin[9]曾提出了一個基于閉的位置效應(yīng)集合殘差樣本方差的檢驗統(tǒng)計量.本文就是在此基礎(chǔ)上,把上述閉的位置模型應(yīng)用于H估計,給出了一種新的估計方法,記為AH估計.接著討論了AH估計的無偏性,并通過一個基于實例的模擬驗證了此方法.
考慮位置散度模型
模型(1)稱為位置效應(yīng)模型,是利用響應(yīng)的均值對因子效應(yīng)建模;模型(2)稱為散度效應(yīng)模型,是利用響應(yīng)的方差對因子效應(yīng)建模.在試驗設(shè)計中就是要首先識別出對位置和散度有顯著影響的因子效應(yīng),然后設(shè)置因子的水平使得響應(yīng)的方差達到最小,均值盡可能接近目標值.而在顯著效應(yīng)的識別過程中,又需要首先給出因子效應(yīng)的估計,然后借助于半正態(tài)概率圖,Lenth方法等識別顯著的因子效應(yīng).因此可見,因子效應(yīng)的估計尤為重要.
在模型中,y=(y1,y2,…,yn)′是觀測值向量,x′i是n×p維設(shè)計矩陣X的第i行;X=(X1,X2,…,Xp),p
假定:
1.S(k+)={j:Xk,j=+1}記因子k的正水平的行標的集合;S(k-)={Xk,j=-1}記因子k的負水平的行標的集合,其中Xk,j是Xk的第j個元素.
2.記k1=k2°k3,如果Xk1可以通過Xk2和Xk3的對應(yīng)元素相乘得到,例如因子A和B的交互項AB=A°B.
3.如果集合S對于運算°是封閉的,則稱它為閉集,記為S.
4.L={I,l1,…,lp-1}和D={I,d1,…,dq-1}分別記顯著的位置和散度效應(yīng)集.
在無重復因析試驗中,無論是位置還是散度效應(yīng)的研究,效應(yīng)稀疏原則常常被假定,即只有大約30%的效應(yīng)被認為是顯著的.所謂的效應(yīng)鑒別就是識別出顯著的位置和散度效應(yīng).而位置效應(yīng)的鑒別問題已經(jīng)被廣泛的研究,相關(guān)文獻可參考Hamade和Balakrishnan[10]的綜述文章.在本文中總假定正確的位置模型已經(jīng)被識別,主要考慮散度效應(yīng)的估計問題.
^β對于對數(shù)線性散度模型,如果記{ri,i=1,2,…,n}為擬合位置模型以后得到的殘差,即ri=yi-x′i^β,^β為β的普通最小二乘估計,那么對散度效應(yīng)因子k,Harvey[1]提出H方法可以表示為:
McGrath和Lin[9]曾提出了一個基于閉的位置效應(yīng)集殘差樣本方差的ML檢驗統(tǒng)計量,此閉的位置效應(yīng)集包括四部分: 1.總均值項;2.顯著的位置效應(yīng)以及它們的交互效應(yīng)列;3.顯著的散度效應(yīng)以及它們的交互效應(yīng)列;4.上面所有列的交互列.例如:如果L={I,A,B},D={I,C,D},那么擬合的閉的位置效應(yīng)模型~L={I,A,B,AB,C,D,CD,A C,A D,A CD,BC,BD, BCD,ABC,ABD,ABCD}.本文就是把擬合此位置模型的殘差應(yīng)用于H方法,然后得到了一種新的散度效應(yīng)估計方法,稱為AH估計.如果記{~ri,i=1,2,…,n}為擬合的殘差,則散度參數(shù)φk的AH估計可以表示為如下形式:
接下來考慮AH估計的無偏性,為證明的方便首先給出幾個引理.
引理1[5]記L={I,l1,…,lp-1},k∈{2,…,n},Lk={k,k°l1,…,k°lp-1},則擬合位置模型LEK=L∪Lk得到的殘差有如下形式:
引理2[5]在給定模型(1)下,φk的AH估計的期望
定理 如果ˉL記閉的位置效應(yīng)集,ˉD記顯著散度效應(yīng)的閉集,并且dimˉL≤n/2,則對任意的k∈ˉD?~L,DAHk是無偏的.
證明 由ˉL構(gòu)造,我們知道它肯定是一個閉集,并且可以寫為引理1中LEk的形式,那么由引理1和引理2
記{Si,i=1,…,M}為ˉL所對應(yīng)的設(shè)計矩陣的M個不同的行的組合,則由ˉL的閉集性質(zhì),有?j,m∈Si,x′jxm=p;j∈Si,m∈Si′,i≠i′,x′jxm=0.并且對j,m∈Si,當j=m時,~hjm=1-p/n,當j≠m時,~hjm=-p/n.(詳細的證明見文獻[11])不妨設(shè)S(k +)={S1,…,SM/2},S(k-)={SM/2+1,…,SM},又因為k∈ˉD?ˉL,類似地記φˉL={φ0,φl1,…,φlq},q=dimˉL,那么AH估計的期望
又對任意的j,m∈Si,x′j=x′m,
對任意j∈Si,m∈Si′,i≠i′,
這樣,(4)可以寫為證明完畢.
本節(jié)考慮一個最早的由Davies[12]提出,后被Bergman和Hynén[4],McGrath和Lin[9]都分析過的染料質(zhì)量的實例,它使用了一個25-1V部分因析設(shè)計,五個試驗因子分別是溫度(A),原始材料(B),減壓(C),烘爐干燥壓力(D),真空漏泄(E).表1中給出了它的設(shè)計矩陣和響應(yīng),所有的作者都發(fā)現(xiàn)因子D對位置有較大的影響,關(guān)于顯著的散度效應(yīng),McGrath和Lin[9]鑒別出了因子E,而Bergman和Hynén[4](BH方法)發(fā)現(xiàn)除了因子E之外還有D,D E.但是我們知道BH方法存在錯誤識別的現(xiàn)象,下面我們就通過基于此實例的模擬來給出本文方法和BH方法,H方法的一個對照.
具體地,假定真正的位置模型是L={I,D},散度模型是D={I,D,E},βD=33,φD=φE=2,模擬次數(shù)為5 000次.模擬結(jié)果見表2.
表1 設(shè)計矩陣和響應(yīng)Table 1 Design Matrix and Responses
表2 基于實例的模擬對照Table 2 Simulateed Comparison Based on Real Example
從表2中我們可以看到BH方法高估了因子D E,偏度達到了1.56,從而在識別中肯定會錯誤識別D E,而H方法雖然無偏的估計出了D E,但它卻低估了因子E,從而可能會丟掉顯著的因子E.對于AH方法,它無偏的估計出了因子D,E,D E,并且AH估計的均方誤差一致地比BH方法和H方法小,比如AH方法使因子D E的均方誤差從BH估計的2.78,H估計的0.43減小到了0.36.從而可見本文方法可以用于多個散度效應(yīng)的參數(shù)估計問題研究,不會出現(xiàn)對參數(shù)的高估和低估現(xiàn)象,保證散度效應(yīng)的正確識別.
在試驗設(shè)計中,效應(yīng)稀疏原則是最基本的三大原則之一,即在所有因子效應(yīng)中至多有30%的效應(yīng)是顯著的,那么在此原則下對于一大類位置散度模型,定理條件dimˉL≤n/2常??梢詽M足,并且本文中提到的所有方法都是在效應(yīng)稀疏原則下得到的.當dimˉL≤n/2不能滿足時,無法給出一個精確的條件來保證散度參數(shù)估計的無偏性.特別地,當dimˉL=n/2時,對于任意的k?ˉL,因子k都是不可估的,相關(guān)的參考文獻見Brenneman和Nair[5].
當模型假設(shè)不正確時,本文方法同樣適用,可以直接推廣.但方法的性質(zhì)需要作進一步的探討,比如此時可能得不到參數(shù)估計的無偏性,只能給出一個近似無偏的條件,這也是我們下一步要做的工作.
[1] HAVREY A C.Estimating Regression Models with Multiplicative Heteroscedasticity[J].Econometrica,1976,44:461-465.
[2] BOX G E P,MEYER R D.Dispersion Effects from Fractional Designs[J].Technometics,1986,28:19-27.
[3] WANG P C.Tests for Dispersion Effects from Orthogonal Arrays[J].Computational Statistics and Data A nalysis,1989, 8:109-117.
[4] BERGMAN B,HYNéN A.Dispersion Effects form Unreplicated Designs in the 2k-pSerises[J].Technometrics,1997,39: 191-198.
[5] BRENNEMAN W A,NAIR V N.Methods for Identifying Dispersion Effects in Unreplicated Factorial Experiments:A Critical Analysis and Proposed Stra tegies[J].Technometrics,2001,43:388-404.
[6] MCGRATH R N,YEH A B.A Quick,Compact Two-Sample Dispersion Test:Count Five[J].The A merican Statistician, 2005,59:47-53.
[7] LIAO Chen-Tuo.Two-level Factorial Designs for Searching Dispersion Factors and Estimating Location Main Effects[J]. J ournal of Statistical Planning and Inf erence,2006,136:4071-4087.
[8] VAN de VEN P M.On the Equivalence of Three Estimators for Dispersion Effects in Unreplicated Two-level Factorial Designs[J].J ournal of Statistical Planning and Inf erence,2008,138:18-29.
[9] MCGRATH R N,LIN KJ.Testing Multiple Dispersion Effects in Unreplicated Fractional Factorial Designs[J].Technometrics,2001,43:406-414.
[10] HAMADA M,BALAKRISHNAN N.Analyzing Unreplicated Factorial Experiments:A Review with Some New Proposals[J].Statistica Sinica,1998,8:1-41.
[11] BRENNEMAN W A.Inference for Location and Dispersion Effects in Unreplicated Factorial Experiments[J].Unpublished Ph D dissertation.University of Michigan,Statistics Department.
[12] DAVIES O L.Design and Analysis of Industrial Experiments[M].London:Oliver and Boyd,1956.
A Estimator of Dispersion Effects in Unreplicated Factorial Experiments
WANG Yu,LI Ji-hong
(Computer Center,Shanxi University,Taiyuan030006,China)
In the analysis of multiple dispersion effects for unreplicated factorial experiments,there often exists the phenomenon for picking up factors spuriously,that is,two active dispersion effects may create a spurious dispersion effect in their interaction column,and the most existing methods are subject to these spurious effects.To resolve the ambiguousness,a adapted H method(called the AH method)was introduced based on residuals from the fitted closed set of location effects.The unbiased condition of the AH estimator was proved,and the simulations based on a real example were used to illustrate the results.
multiple dispersion effects;unreplicated factorial;unbiasedness;simulation
O212.1
A
2009-01-15;
2009-02-05
國家自然科學基金(60873128)
王 鈺(1981-),男,助教,碩士,主要從事概率統(tǒng)計研究.E-mail:wangyu@sxu.edu.cn,*通訊聯(lián)系人E-mail: lijh@sxu.edu.cn
0253-2395(2010)02-0186-04