李光輝,李俊鵬,張崇岐
(1.凱里學(xué)院 理學(xué)院,貴州凱里 556011;2.廣州大學(xué)經(jīng)濟與統(tǒng)計學(xué)院,廣東廣州 510006)
由格子點集所構(gòu)造的設(shè)計在生產(chǎn)實踐中經(jīng)常被使用,而關(guān)于它們的諸多性質(zhì)卻少有文獻(xiàn)進(jìn)行討論及證明.鑒于此,本文在此基礎(chǔ)上,對已有的混料格子點集的部分性質(zhì)進(jìn)行了證明,并補充了相關(guān)性質(zhì).首先,§2給出了混料試驗的基本概念與記號,§3討論了混料格子點集的基本性質(zhì);§4列舉了格子點集的兩個應(yīng)用,分別是非參數(shù)回歸模型的建模與格點剖分下的均勻性檢驗;§5總結(jié)并提出了進(jìn)一步可研究的問題.
q分量混料試驗域可以表示為
它是q ?1維空間中的一個單純形.若試驗還受到其他約束條件的限制,將試驗域記作
其中φj(x)是關(guān)于x ∈Sq?1的已知函數(shù),aj,bj(j=1,2,···,k)為已知常數(shù).
定義1設(shè)i1,i2,···,iq是1,2,···,q的一個置換排列,?x=(x1,x2,···,xq)T∈Sq?1,由x生成的置換點集為H(x)={x,x1,x2,···,xp},其中xi=(xi1,xi2,···,xiq)T,i=1,2,···,p,它表示經(jīng)下標(biāo)置換后得到的所有互不相同的試驗點構(gòu)成的集合.令H(x)=[x,x1,x2,···,xp]T表示將H(x)中的各試驗點按行排列而成的矩陣,稱之為置換點矩陣.
例如令x1=(1,0,···,0)T,, 則由這兩個點生成的置換點集為
其中eq(j)表示第j個元素為1,其余元素為0 的q維列向量.
性質(zhì)2.1當(dāng)1 其中Iq為q階單位陣,為元素全部為1的q維列向量. 定義2記 為q分量m階格子點集. 若L{q,m}={x1,x2,···,xN},其中xi=(xi1,xi2,···,xiq)T,i=1,2,···,N.將該點集中的試驗點按行排列而成的矩陣記為L(q,m)=[x1,x2,···,xN]T. 以下討論關(guān)于L{q,m}以及對應(yīng)規(guī)范多項式的一些性質(zhì). 性質(zhì)3.1對于任意的m ∈Z+,格子點集總可以表示為由若干試驗點生成的置換點集之并,即有 在混料試驗設(shè)計中,隨著分量q及模型階數(shù)m的增加,需要生成高階的格子點集.而逐一生成并儲存高階格子點集需要耗費大量的內(nèi)存,所以可以考慮儲存格子點集的生成元,然后再由生成元經(jīng)過置換變換而得到.則關(guān)于格點設(shè)計有以下性質(zhì). 性質(zhì)3.2L{q,m}中一共包含個試驗點. 文[7]中有提及該性質(zhì),但未進(jìn)行證明.Scheffé[8]在提出格點設(shè)計時也對這一性質(zhì)進(jìn)行了簡要說明.實際上,該性質(zhì)可等價于找到q個非負(fù)整數(shù)α1,α2,···,αq,使得成立的組合數(shù).每個格子點都與一個0-1編碼的數(shù)一一對應(yīng),如試驗點就與 是對應(yīng)的,它可以抽象為在q+m ?1個位置上,選出q ?1個位置放入“0”,而在剩下的位置放入“1”,其中第1個“0”前有α1個“1”,表示第一個分量為,以此類推,第q ?1個0后的αq個“1”表示第q個分量為. 例如3分量3階格子點集中,以下三個點對應(yīng)的編碼關(guān)系可表示為 性質(zhì)3.3若k個正整數(shù)m1,m2,···,mk的最大公約數(shù)為m,則 記int(X)=表示不包含試驗域X邊界的區(qū)域.例如表示單純形Sq?1的不含邊界的內(nèi)部區(qū)域,所有的分量都是正數(shù).則有以下性質(zhì). 性質(zhì)3.4, 其中#(A)表示集合A中元素的個數(shù). 證先計算L{q,q+m}邊界上點的數(shù)量.由于 若x=(x1,x2,···,xq)T∈L{q,q+m},且x ∈Sq?1int(Sq?1),則稱x是L{q,q+m}的邊界點,其中的分量x1,x2,···,xq至少有一個為0.設(shè)x中有一個分量為0,這樣的邊界點一共有個,若x中有2個分量為0,這樣的邊界點一共有個,以此類推,若x中有q ?1個分量為0,這樣的邊界點一共有個.所以有 由性質(zhì)3.4,可以得到一個更一般的結(jié)論. 性質(zhì)3.5, 其中m ≥q. 由性質(zhì)3.4可知,L{q,q+m}的內(nèi)點個數(shù)等于#(L{q,m}),要求L{q,m}的內(nèi)點個數(shù),等價于將m個小球放入到q個盒子中,且盒子不允許有空,由此可以得到性質(zhì)3.5的結(jié)論. q分量m階混料規(guī)范多項式是由m階完全型多項式變換而來,下面先討論完全型多項式. 性質(zhì)3.6對于q分量混料系統(tǒng),m階完全多項式為 該性質(zhì)在文[7]中有所提及,但未給出證明.本文給出該性質(zhì)的詳細(xì)證明. 證在(4)式中,常數(shù)項β0共1項;一次項共q項;二次項部分可以分解為 以此類推,直到m次項可以分解為 對于q分量混料系統(tǒng)來說,不能直接使用完全型多項式(4),因為q分量受到基本約束條件的限制,如果直接使用完全型多項式模型,則信息矩陣必然是退化的.關(guān)于這一問題的討論可以參見文獻(xiàn)[7].混料規(guī)范多項式與完全型多項式不同,最大的區(qū)別在于混料規(guī)范多項式不含有常數(shù)項.為方便記,令關(guān)于x=(x1,x2,···,xq)T∈Sq?1的函數(shù)如下. 記1,2,3,4階混料規(guī)范多項式分別為 在以上記號的基礎(chǔ)上,給出以下性質(zhì). 性質(zhì)3.7對于m階混料規(guī)范多項式ηm(x),m=1,2,3,4一共有項. 由于混料格子點集中的點數(shù)與規(guī)范多項式中的項數(shù)是相等的,所以在使用格子設(shè)計時,通常會考慮使用規(guī)范多項式來建模.在一階和二階規(guī)范多項式建模的情形下,使用格子點集能達(dá)到D-最優(yōu),而使用三階及四階規(guī)范多項式來建模則不能達(dá)到D?最優(yōu).很多情形下,都使用二階混料規(guī)范多項式來建模,這一情形下模型對應(yīng)的信息矩陣就十分重要,于是給出下面的性質(zhì). 性質(zhì)3.8考慮L{q,2}作為試驗點集,對于設(shè)計 其中x1=(1,0,···,0)T,,測度w1,w2滿足,使用二階混料規(guī)范多項式建模,所得到的信息矩陣為 使用格子點集可以將單純形區(qū)域剖分成若干個沒有共同內(nèi)點的子單純形,在不同的子單純形上取重心就可以構(gòu)造出最大距離準(zhǔn)則下的均勻設(shè)計,也可以用于單純形域上分布的均勻性度量.下面使用文[9]中介紹的方法,對單純形Sq?1進(jìn)行剖分. 首先構(gòu)造兩個q因子m水平的完全析因設(shè)計陣.令lm=(0,1/m,···,(m ?1)/m)T, 其中N0=mq,然后將單純形Sq?1剖分為若干個沒有共同內(nèi)點的部分,令 若有I(<1)I(>1)=1,j=1,2,···,r,其中I(·)為示性函數(shù),記 則滿足單純形內(nèi)的下界約束矩陣與上界矩陣分別為 這樣一來,單純形Sq?1就被剖分為若干個沒有共同內(nèi)點的子區(qū)域,即有 其中aj=(aj1,aj2,···,ajq)T,bj=(bj1,bj2,···,bjq)T分別是(6)式中矩陣L與U的第j行元素. 例如當(dāng)q=3時,S3?1被2階格子點集剖分為4個全等的子單純形,如圖1(a)所示;被3階格子點集剖分為9個全等的子單純形,特別的,S3?1被m階格子點集剖分為m2個子單純形,并且這些子單純形是全等的.當(dāng)q=4時,情況變得稍顯復(fù)雜,S4?1被2階格子點集剖分為8個子單純形,其中在子區(qū)域內(nèi)包含了4個子單純形,該區(qū)域共有6 個極端頂點,如圖1(b)所示. 圖1 格點剖分下的子單純形 當(dāng)q=5時,S5?1被2階格子點集剖分為16個子單純形,在子區(qū)域內(nèi)包含了11個子單純形,并且這11個子單純形與余下的子單純形體積不全相等.當(dāng)格子點集的階數(shù)更高時,剖分的情形則會更加復(fù)雜. 性質(zhì)3.9使用L{q,m}可以將Sq?1剖分為mq?1個沒有共同內(nèi)點的子單純形. 眾所周知,多項式回歸模型在混料試驗域上建模??紤]最優(yōu)設(shè)計,而一個設(shè)計是否達(dá)到最優(yōu),不僅取決于試驗點的選取,還依賴于各試驗點處重復(fù)的試驗次數(shù).所以一個自然的想法是:與其在相同的試驗點處重復(fù)試驗,不如考慮在更多的試驗點下各進(jìn)行一次試驗,以此獲得更多試驗點下的結(jié)果.由性質(zhì)3.6,性質(zhì)3.7和性質(zhì)3.8可知,如果要在單純形區(qū)域上建立高階混料多項式模型,當(dāng)模型中分量個數(shù)q和階數(shù)m較大時,則難以保證其穩(wěn)健性.因此可以考慮非參數(shù)的方法建立非參數(shù)回歸模型. 此外如果一個試驗的模型形式是已知的,使用最優(yōu)設(shè)計能使得響應(yīng)的預(yù)測方差達(dá)到最小,而如果試驗所涉及到的模型的基本形式都是未知的,此時格點設(shè)計能夠很好的滿足非參數(shù)建模的要求,其中最關(guān)鍵的一點是:格點設(shè)計中相鄰的各點之間距離幾乎相等,它使得使用非參數(shù)回歸更為穩(wěn)健. 考慮在試驗域X上使用格子點集來建模,記 定義高斯核函數(shù)為 其中h為已知的窗寬參數(shù),若試驗在各點處的觀測值為y1,y2,···,yN,則基于(7)的非參數(shù)回歸模型為 如果在試驗域內(nèi)有足夠多的格子點,選擇適合的窗寬,能使得非參數(shù)回歸模型具有良好的預(yù)測效果.在Sq?1上使用非參數(shù)回歸建模,一般需要使用m(m ≥4)階的格子點集,當(dāng)q較大時,所需要進(jìn)行的試驗次數(shù)會非常的多,隨著分量數(shù)的增加,不可避免的會面對維數(shù)災(zāi)禍的問題.當(dāng)然,在q較小的情形下,使用高階格子點集來建模,則非參數(shù)回歸模型是一個不錯的選擇. 例4.1設(shè)3分量的回歸模型為 令h=0.1,分別使用m=3,4,5階格子點集來建立非參數(shù)回歸模型,所得到的結(jié)果如圖2所示.其中(a)是模型(8)的曲面圖,(b),(c),(d)分別為m=3,4,5階格子點集建立的非參數(shù)回歸模型的曲面圖.由此可見,隨著階數(shù)的增加,格子點數(shù)越來越多,擬合的曲面也越來越光滑,擬合效果也更好. 圖2 Sq?1上的非參數(shù)回歸建模 在很多情形下,會面對所謂的混料數(shù)據(jù),即收集到的數(shù)據(jù)為x1,x2,···,xN ∈Sq?1.這時想知道這些數(shù)據(jù)在單純形域內(nèi)分布是否均勻,這就可以使用格點剖分下的χ2檢驗來進(jìn)行.由§3中介紹的格點剖分方法,即性質(zhì)3.3,性質(zhì)3.4以及性質(zhì)3.9可知,Sq?1可以由L{q,m}剖分為mq?1個沒有共同內(nèi)點的子單純形,記為 其中k=mq?1,Vi=V {xi1,xi2,···,xiq} 表示由xi1,xi2,···,xiq為頂點構(gòu)成的子單純形,需要檢驗的是P={x1,x2,···,xN}在Sq?1內(nèi)是否分布均勻,所提出的原假設(shè)為 令NVi=#{P ∩Vi},i=1,2,···,k為Vi中包含試驗點的個數(shù),由文[11]可知,單純形的體積為 由L{q,m}剖分下的子單純形的體積近似為 (當(dāng)q ≥4時,剖分得到的子單純形的體積有些許差異),則有 λ(P)可以用于度量P的均勻程度,如果P在Sq?1內(nèi)分布越均勻,則λ(P)就會越小,反之越大.再令 當(dāng)原假設(shè)H0成立時,有χ2近似服從自由度為k的χ2分布,即.文[9]中給出了一個χ2檢驗的實例. 混料格點設(shè)計在實際中應(yīng)用廣泛,文[12]中介紹的混料分類模型也是基于格子點集來構(gòu)造的最優(yōu)設(shè)計.關(guān)于格點設(shè)計的其他性質(zhì)和應(yīng)用還有待進(jìn)一步的發(fā)掘.例如在Sq?1上建模,使用4階以內(nèi)的混料規(guī)范多項式就足夠了.但是如果考慮在局部使用分塊擬合的話,則需要使用更高階的多項式,而目前的文獻(xiàn)中沒有介紹到更高階的混料多項式,于是可以考慮構(gòu)造更高階的混料規(guī)范多項式.此外3階混料多項式使用3階格子點集來構(gòu)造的設(shè)計并不是最優(yōu)的,且3階以上的情形更是如此,如何將格子點集與混料規(guī)范多項式結(jié)合起來,且使得設(shè)計達(dá)到最優(yōu),這是一個值得研究的問題.還有使用格點剖分情形下的單純形區(qū)域上的均勻性檢驗可以檢驗出混料數(shù)據(jù)的均勻性,然而如果在約束區(qū)域內(nèi),要實現(xiàn)低階的格點剖分是比較困難的,一方面可以考慮在試驗域X內(nèi)生成低階格子點集,另一方面,可求出格點覆蓋區(qū)域以外部分的體積,再用類似于4.1中所給出的方法構(gòu)造χ2統(tǒng)計量進(jìn)行檢驗.關(guān)于這部分問題都有待進(jìn)一步研究.§3 格點設(shè)計的性質(zhì)
§4 格點設(shè)計的應(yīng)用
4.1 基于格點設(shè)計的非參數(shù)回歸建模
4.2 格點剖分下的均勻性檢驗
§5 總結(jié)