于慧春,殷 勇,李 欣,袁云霞,吳 昊
(河南科技大學(xué)食品與生物工程學(xué)院,河南洛陽 471023)
在科學(xué)研究中,針對某個具體的指標(biāo),其影響因素往往有多個,考查多個因素及其交互作用對指標(biāo)的影響,屬于多因素試驗(yàn)。在多因素試驗(yàn)中,找出各因素的最優(yōu)水平組合,最直接且易于理解的做法就是對所有因素水平的組合都進(jìn)行試驗(yàn),根據(jù)試驗(yàn)指標(biāo)值來確定各因素的最優(yōu)水平組合[1-2]。這樣做的最大問題就是當(dāng)因素?cái)?shù)較多時,試驗(yàn)次數(shù)以因素?cái)?shù)為指數(shù)增長,隨著因素?cái)?shù)的正交增多,試驗(yàn)次數(shù)迅速增長,導(dǎo)致試驗(yàn)災(zāi)難,讓人難以接受,甚至難以完成。因此,只能減少試驗(yàn)次數(shù),從全部的試驗(yàn)中選擇部分試驗(yàn)來實(shí)施。那么關(guān)鍵的問題就是如何選擇部分試驗(yàn),使其既能大大減少試驗(yàn)次數(shù),又能代表全面試驗(yàn)的結(jié)果。從全部試驗(yàn)中“科學(xué)”地選擇“部分試驗(yàn)”的過程,即“試驗(yàn)設(shè)計(jì)”。常用的多因素試驗(yàn)設(shè)計(jì)方法有正交設(shè)計(jì)法、參數(shù)設(shè)計(jì)法、回歸設(shè)計(jì)法、均勻設(shè)計(jì)法、混料設(shè)計(jì)法。
正交試驗(yàn)設(shè)計(jì)在科學(xué)試驗(yàn)中應(yīng)用非常廣泛。因此,結(jié)合自己對正交試驗(yàn)設(shè)計(jì)方法的理解,對正交試驗(yàn)設(shè)計(jì)的特點(diǎn)和“正交性”的理解作一簡單的介紹。
正交試驗(yàn)設(shè)計(jì)(Orthogonal Experimental Design)是一種主要的分式析因設(shè)計(jì)方法,是尋求因素水平的較優(yōu)組合的一種簡單、高效、快速的試驗(yàn)設(shè)計(jì)方法[3]。在正交試驗(yàn)設(shè)計(jì)中,各因素的水平根據(jù)先驗(yàn)知識進(jìn)行確定,如此全部因素水平的組合,即在因素空間所有試驗(yàn)點(diǎn)的分布是確定的,正交試驗(yàn)設(shè)計(jì)即從所有試驗(yàn)點(diǎn)中根據(jù)“正交性”選擇部分有代表性試驗(yàn)點(diǎn)來實(shí)施試驗(yàn),選出的這部分試驗(yàn)點(diǎn),構(gòu)成一張表,即“正交表”。
正交試驗(yàn)設(shè)計(jì)方法就是利用已經(jīng)造好了的“正交表”中各試驗(yàn)點(diǎn)的因素水平搭配方案來安排試驗(yàn)并進(jìn)行數(shù)據(jù)分析即可。因此,相對來說是最簡單、最易于理解和掌握的一種試驗(yàn)設(shè)計(jì)方法。
正交表具有均衡搭配、綜合可比的特點(diǎn),這一特點(diǎn)決定其正交性,具有重要的意義。
(1)均衡搭配。任一因素的任一水平與其他因素的每一水平搭配的次數(shù)均相等。
(2)綜合可比。任一因素的各水平出現(xiàn)的次數(shù)相等[3-4]。
關(guān)于正交表的特點(diǎn)比較容易理解,以一個最簡單的三因素二水平的L4(23)正交表為例來說明。
L4(23)正交表見表1。
表1 L4(23)正交表
由表1可知,各個因素的水平均出現(xiàn)2次,各個因素的水平與任一因素的水平均搭配1次。因此,所選的試驗(yàn)點(diǎn)是均衡搭配、綜合可比的。
也可以用圖來表示,以三因素三水平的試驗(yàn)設(shè)計(jì)為例。
三因素三水平正交試驗(yàn)設(shè)計(jì)試驗(yàn)點(diǎn)的分布見圖1。
圖1 三因素三水平正交試驗(yàn)設(shè)計(jì)試驗(yàn)點(diǎn)的分布
由圖1可知,對應(yīng)于因素A有A1,A2,A3共3個平面,同樣對應(yīng)于因素B和C也各有3個平面B1,B2,B3和 C1,C2,C3,一個面代表一個因素水平,9個因素水平,所以共9個平面。圖中所有交點(diǎn)即全面試驗(yàn)的所有試驗(yàn)點(diǎn),被選出構(gòu)成正交表的試驗(yàn)點(diǎn)用⊙表示。選取試驗(yàn)點(diǎn)時,要求每個因素的每個水平都要同等看待。
由圖1可知,①這9個平面中,每個面上的試驗(yàn)點(diǎn)一樣多,即對各因素水平的選擇次數(shù)一樣多,每一個因素每一個水平出現(xiàn)次數(shù)均等。這體現(xiàn)了對各因素水平的同等看待,即綜合可比的特點(diǎn)。②每個平面上都有3行、3列,每行、每列上的點(diǎn)一樣多,每個平面的每行每列都有一個點(diǎn),而且只有一個點(diǎn),因而每個平面上都恰好有3個點(diǎn)。這體現(xiàn)了所選試驗(yàn)點(diǎn)分布的均勻性,即均衡搭配的特點(diǎn)。總共選用9個試驗(yàn)點(diǎn)代表全面試驗(yàn),試驗(yàn)次數(shù)大大降低。
正交表的正交性相對來說,比較難以理解,首先解釋根據(jù)正交性來選試驗(yàn)點(diǎn)的意義,然后再來證明正交表的正交性。
正交的意義:線性代數(shù)中,“正交”是“垂直”這一概念的推廣,“正交”意味著2個向量相互獨(dú)立,不相關(guān),即兩個向量的內(nèi)積為0,如定義2個向量的夾角,則“正交”可直觀理解為兩向量“垂直”。從“正交”的基本概念可知,向量“正交”的實(shí)際意義是:向量各自包含的信息沒有重疊,不相交。由此,可以這樣來理解,整個因素空間的全部信息,分布在所有試驗(yàn)點(diǎn),每個試驗(yàn)點(diǎn)都包含一部分信息,且各個試驗(yàn)點(diǎn)所包含的信息存在交叉和重疊。因此,正交試驗(yàn)設(shè)計(jì)方法的實(shí)質(zhì)就是找出那些信息不重疊、不相關(guān)的試驗(yàn)點(diǎn),這些有代表性的試驗(yàn)點(diǎn)即代表了因素空間的全部信息,又避免了信息重疊,這樣就能用部分的試驗(yàn)次數(shù)來代表試驗(yàn)的全部信息。所以,“正交表”中的試驗(yàn)點(diǎn)就是從因素空間全部試驗(yàn)點(diǎn)組合所選出的有代表性的試驗(yàn)點(diǎn),由他們所組成的試驗(yàn)表,具有正交性,因此稱為“正交表”。
正交表的正交性如何體現(xiàn):強(qiáng)調(diào)正交表的正交性的意義,那么如何體現(xiàn)出其正交性?弄明白這一點(diǎn),對真正理解正交試驗(yàn)設(shè)計(jì)方法的實(shí)質(zhì)有重要的幫助作用。
正交表中每一個因素都可看作是一個向量,其各水平可以看作向量的元素(正交表中的列)[5]。正交表中各個字母,僅僅代表因素的不同水平,沒有實(shí)際的數(shù)學(xué)意義,所以可以用其他任何字符來代替,為了較直接地證明其正交性,用不同的數(shù)字或字母來替換。如2水平的正交表,可以用a和-a來分別代表其2個水平,三水平的正交表可以用a,-a和0來分別代表其3個水平,以此類推,四水平時,分別用a,-a,b,-b來分別代表其4個水平,五水平分別用a,-a,b,-b和0來分別代表其5個水平等進(jìn)行這樣的替換后,正交表中任意兩列的乘積的和為0,即正交表中每一列當(dāng)作一個向量,任意兩列的內(nèi)積為0,以一個3水平正交表L9(34)為例(見表2),表中的3個水平分別用a,-a和0來表示。
替代后的三水平正交表見表2。
表2 替代后的三水平正交表
由表2可知,對各水平的表示方法進(jìn)行替代,替代后任意兩列內(nèi)積為0,換其他任何水平的正交表,均是如此。之所以有這樣的結(jié)果,正是因?yàn)樵谶x試驗(yàn)點(diǎn)時,所依據(jù)的均衡搭配、綜合可比的思想。依據(jù)這一思想在因素空間來選擇試驗(yàn)點(diǎn),保證了正交表的“正交性”,這是實(shí)現(xiàn)用較少的試驗(yàn)來代替全面試驗(yàn)的理論基礎(chǔ)。
依據(jù)正交性從全面試驗(yàn)中選出有代表性的試驗(yàn)點(diǎn)構(gòu)成正交表,具有均衡搭配、綜合可比的特點(diǎn);反之,正交表的均衡搭配、綜合可比的特點(diǎn),也保證了正交表的正交性。正交表的正交性保證了所選出各個試驗(yàn)點(diǎn)信息的不重疊,是實(shí)現(xiàn)用較少的試驗(yàn)代替全面試驗(yàn)的理論基礎(chǔ)。