馬涵濤
(河南科技大學(xué)第一附屬醫(yī)院,河南 洛陽 471003)
實驗計劃法(DOE)是一種以方差分析為基礎(chǔ),利用概率論、數(shù)理統(tǒng)計和線性代數(shù)等基本統(tǒng)計理論及最少實驗次數(shù)安排(直交表),科學(xué)地安排實驗方案,正確地分析實驗結(jié)果,盡快獲得優(yōu)化方案的一種數(shù)學(xué)方法。DOE包括一系列的統(tǒng)計技術(shù),可用于統(tǒng)計和非統(tǒng)計數(shù)據(jù),對復(fù)雜的關(guān)系進(jìn)行統(tǒng)計和分析,以找出變異產(chǎn)生的根源,確定每個變量的作用和變量之間的相互影響。自Fisher 1958年發(fā)明該方法以來,在農(nóng)學(xué)、工程技術(shù)等學(xué)科領(lǐng)域得到了廣泛應(yīng)用,20世紀(jì)70年代Sucker[1]和Leuenberger[2]率先將DOE應(yīng)用于醫(yī)藥領(lǐng)域。傳統(tǒng)的實驗操作均以標(biāo)準(zhǔn)操作規(guī)程(SOP)為基準(zhǔn)進(jìn)行,DOE使用實驗的方法來驗證標(biāo)準(zhǔn)操作中參數(shù)產(chǎn)生的合理性,通過對實驗參數(shù)進(jìn)行篩選和優(yōu)化,構(gòu)建科學(xué)、高效的實驗方法和技術(shù)路線,提高實驗效率及精確度。
隨著全球經(jīng)濟(jì)一體化格局的形成及信息技術(shù)的普遍應(yīng)用,在世界范圍內(nèi)有效配置資源已成為可能,企業(yè)面臨著日趨嚴(yán)峻的市場競爭。競爭的焦點從早期的降低勞動力成本,20世紀(jì)70年代的提高企業(yè)整體效率,以及20世紀(jì)80年代的全面滿足以質(zhì)量、價格、交貨期與服務(wù)等方面要求為核心的競爭,轉(zhuǎn)化為現(xiàn)在的新產(chǎn)品競爭。這是由于顧客越來越復(fù)雜多變的個性化需求,以及現(xiàn)代工業(yè)設(shè)計技術(shù)的快速發(fā)展導(dǎo)致的。工業(yè)設(shè)計是一種運(yùn)用工程技術(shù)方法,在社會、經(jīng)濟(jì)和時間等因素約束范圍內(nèi),根據(jù)市場需求從事的產(chǎn)品設(shè)計工作。根據(jù)國際公認(rèn)的理解,工業(yè)設(shè)計是一種創(chuàng)造性行為,因此具有藝術(shù)性;而同時由于應(yīng)用了大量的以數(shù)理統(tǒng)計為基礎(chǔ)的設(shè)計控制技術(shù),故又具有科學(xué)性。
20世紀(jì)80年代,由摩托羅拉公司首先提出了六西格瑪管理法。1999年3月,由Steve Zinkgraf博士將六西格瑪管理法運(yùn)用于設(shè)計開發(fā)領(lǐng)域,并結(jié)合設(shè)計控制技術(shù)創(chuàng)立了六西格瑪設(shè)計(DFSS)方法體系。該方法用關(guān)鍵質(zhì)量特性(CTQ)準(zhǔn)確定義與跟蹤顧客需求,并將設(shè)計控制劃分為定義(define)、測量(measure)、分析(analyze)、設(shè)計(design)與驗證(verify)5 個階段,簡稱為 DMADV。定義:選定設(shè)計項目,并進(jìn)行前期市場預(yù)研。測量:將顧客需求轉(zhuǎn)化成關(guān)鍵質(zhì)量特性,對關(guān)鍵質(zhì)量特性盡量用可測量的定量數(shù)據(jù)表達(dá),并對系統(tǒng)設(shè)計進(jìn)行評價和控制。分析:即分析影響關(guān)鍵質(zhì)量特性和詳細(xì)設(shè)計輸出的影響因素,進(jìn)行主次排序,采用適宜的分析工具來對詳細(xì)設(shè)計階段進(jìn)行分析和評價,并進(jìn)一步建立初步實驗計劃。設(shè)計:實施詳細(xì)設(shè)計進(jìn)行具體的實驗設(shè)計以優(yōu)化參數(shù)組合,并對詳細(xì)設(shè)計結(jié)果進(jìn)行評價。驗證:進(jìn)入改進(jìn)設(shè)計階段,完成工藝設(shè)計,進(jìn)行樣機(jī)實驗及小批量實驗,對詳細(xì)設(shè)計結(jié)果進(jìn)行驗證,并最終形成量產(chǎn),完成整個設(shè)計項目。
日本質(zhì)量管理專家田口玄一(Taguchi)博士認(rèn)為,工業(yè)產(chǎn)品70%的質(zhì)量水平是在設(shè)計階段決定的,因此可以說產(chǎn)品的質(zhì)量是設(shè)計出來的而不是制造出來的。從統(tǒng)計質(zhì)量管理的角度看,設(shè)計質(zhì)量的改進(jìn)過程就是不斷聚焦與顧客需求同步的產(chǎn)品質(zhì)量特征值,并在設(shè)計周期中盡量減少與這些質(zhì)量特征值之間差異的過程。設(shè)計質(zhì)量控制技術(shù)是達(dá)成設(shè)計質(zhì)量改進(jìn)的一組工具方法集,主要包括質(zhì)量功能展開(QFD)、失效模式與影響分析(FMEA)、故障樹分析(FTA)、田口穩(wěn)健設(shè)計方法(Taguchi)、響應(yīng)曲面模型(RSM)及調(diào)優(yōu)設(shè)計(EVOP)等。
從設(shè)計質(zhì)量控制技術(shù)特點來看,田口穩(wěn)健設(shè)計、響應(yīng)曲面模型與調(diào)優(yōu)設(shè)計都屬于實驗設(shè)計法范疇。從實驗設(shè)計的發(fā)展來看,實驗設(shè)計法主要分為兩大流派:一是西方統(tǒng)計質(zhì)量專家(以G.E.BOX為代表)提出的經(jīng)典方法,二是日本著名質(zhì)量管理專家田口玄一博士創(chuàng)立的田口方法。經(jīng)典方法采用統(tǒng)計回歸的思想擬合出質(zhì)量特性和影響因素之間的函數(shù)關(guān)系,并進(jìn)行響應(yīng)曲面分析,尋找工藝參數(shù)的最佳配置,從而使輸出質(zhì)量特性最優(yōu)。經(jīng)典方法追求均值最優(yōu),統(tǒng)計推導(dǎo)嚴(yán)謹(jǐn),實驗階段分明,有序貫性的特點。田口方法注重實驗設(shè)計與工程技術(shù)的結(jié)合,提出穩(wěn)健設(shè)計的思想,在實驗中綜合考慮誤差因素,尋求設(shè)計參數(shù)的優(yōu)化配置,從而獲得較為穩(wěn)定的輸出質(zhì)量特性。
實驗設(shè)計過程可分成實驗方案的設(shè)計和實驗結(jié)果數(shù)據(jù)分析兩部分。實驗方案的設(shè)計包括確定實驗指標(biāo)、選取因素、確定因素水平、建立實驗指標(biāo)的數(shù)學(xué)模型和設(shè)計實驗方案。實驗設(shè)計的方法類型很多,但為了提高實驗的準(zhǔn)確性和可靠性,都必須遵循3個基本原則,即隨機(jī)化原則、重復(fù)原則和局部控制原則。實驗結(jié)果數(shù)據(jù)分析是應(yīng)用線性代數(shù)、概率論和數(shù)理統(tǒng)計等數(shù)學(xué)工具對實驗數(shù)據(jù)進(jìn)行分析和處理,包括擬合模型、對模型的檢驗、實驗統(tǒng)計量的計算及對實驗經(jīng)過的解釋等。通常所說的實驗設(shè)計是指以概率論、數(shù)理統(tǒng)計和線性代數(shù)等為理論基礎(chǔ),科學(xué)地安排實驗方案,正確地分析實驗結(jié)果,盡快獲得優(yōu)化方案的一種數(shù)學(xué)方法。
在企業(yè)研發(fā)和管理實踐中,為了開發(fā)、設(shè)計、研制新產(chǎn)品,更新或改進(jìn)老產(chǎn)品,優(yōu)化生產(chǎn)工藝方法或流程,降低原材料、動力等資源消耗,都需要深入研究質(zhì)量特性與影響因素的關(guān)系。一個標(biāo)準(zhǔn)設(shè)計/生產(chǎn)過程都要受到可控因素X1,X2…Xn以及不可控因素Z1,Z2…Zm的共同作用。一般情況下,質(zhì)量特性和影響因素之間的關(guān)系式并不能根據(jù)工程知識直接建立,需要使用DOE進(jìn)行實驗與分析來找出其關(guān)系,進(jìn)一步確定設(shè)計/工藝參數(shù)的優(yōu)化組合。在設(shè)計過程中,DOE是至關(guān)重要的改善技術(shù)。
2.2.1 因子設(shè)計(factorial DOE)
主要用于篩選設(shè)計,適用數(shù)學(xué)模型為線性模型。
完全要因設(shè)計(full factorial DOE,也稱為析因?qū)嶒灒?是應(yīng)用最普遍、最簡單的一種類型。假設(shè)某一實驗包括3個因素,每個因素設(shè)高、低2個水平,可將其視為一正方形,各因素水平相交于正方形的角上,該正方形即為考察區(qū)域。其他各種類型設(shè)計均是在基于此正方形的邊或面的中心增加實驗點。對于 n個因子 k水平的完全要因?qū)嶒灒P椭械闹餍?yīng)與交互效應(yīng)共計 kn-1個,模型中需要估計的參數(shù)有 kn個,因此完全要因?qū)嶒炐枰?kn次實驗。一般選擇兩水平因子實驗對主效應(yīng)與交互效應(yīng)進(jìn)行分析和評價,然后用追加中心點的方法判斷響應(yīng)擬合過程中是否存在曲率。根據(jù)效應(yīng)稀疏原理,很多系統(tǒng)在主效應(yīng)和低階的交互作用處于支配地位時,高階交互作用一般可被忽略,因此二階以上的交互作用可以不用考慮。若存在曲率,則采用響應(yīng)曲面模型進(jìn)行分析。
部分要因設(shè)計:部分要因設(shè)計源自完全要因設(shè)計[3-4]。由于設(shè)計中常常面對3個以上因子的參數(shù)優(yōu)化選擇問題,完全要因設(shè)計中盡管設(shè)定因子為兩水平,但隨著因子數(shù)的增加,實驗次數(shù)還是會以指數(shù)級增長,因此在因子數(shù)較多時,可選擇部分要因設(shè)計。將 n個2水平因子安排在2n-p次實驗中,實驗次數(shù)受 p值的調(diào)節(jié),p=1時是1/2部分要因?qū)嶒?,p=2時則是1/4部分要因?qū)嶒灐来祟愅?。實驗次?shù)的降低使主因子與交互作用及交互作用間存在了混淆關(guān)系,博克斯-亨特(BOX-Hunter)進(jìn)行了分辨度設(shè)計(Design Resolution)。如分辨度Ⅲ是指主因子間沒有混淆,但主因子與兩因子交互作用以及兩因子交互作用間存在混淆關(guān)系;分辨度Ⅳ是指主因子間及主因子與兩因子交互作用沒有混淆,但兩因子交互作用間存在混淆關(guān)系;分辨度Ⅴ是指主因子間、主因子與兩因子交互作用及兩因子交互作用間均未混淆,但兩因子交互作用與三因子交互作用之間存在混淆關(guān)系。分辨度越低,實驗次數(shù)越少,混淆關(guān)系越復(fù)雜。
普通因子設(shè)計(general factorial design):普通因子設(shè)計各因子水平數(shù)可以不同,其實驗次數(shù)為各因子水平數(shù)之積。如某試驗涉及2個因子A和B,因子A包括3個水平,因子B包括4個水平,則實驗次數(shù)為12次。通常用于所涉及因子水平數(shù)不一致的情況。
Plackett-Burman設(shè)計:1946年,Plackett和 Burman提出了Plackett-Burman設(shè)計。此設(shè)計是一種非常經(jīng)濟(jì)的設(shè)計方法,實驗次數(shù)均為4的倍數(shù),因其分辨度較低,兩因子間交互作用嚴(yán)重混淆,主要用于只有主因子發(fā)揮作用的篩選設(shè)計,所有的交互作用均被忽略。各因子均為兩水平,設(shè)計過程中因子數(shù)為11,19,23,27,31共5種,實驗次數(shù)為 n+1次(n為因子數(shù))。如果實驗中所包含因子達(dá)不到上述5種規(guī)定數(shù)量,則設(shè)定一定數(shù)量啞因子(dummy factor)達(dá)到上述數(shù)量即可。
2.2.2 響應(yīng)曲面模型(RSM DOE)
在科學(xué)研究和技術(shù)實踐中線性關(guān)系僅為特例,多元關(guān)系的非線性是客觀規(guī)律的主流。RSM是對多元關(guān)系的非線性進(jìn)行優(yōu)化的實驗方法之一,于1951年由Box等[5]提出,可同時評估幾個因子的效果及其交互作用,而傳統(tǒng)的優(yōu)化方法一次僅能對一種因子進(jìn)行優(yōu)化,且難以比較幾個因子間的交互作用。響應(yīng)曲面模型分2個階段:上述的因子實驗是第一階段,用于建立一階數(shù)學(xué)模型,從而可以分析出重要影響因子與輸出的變化規(guī)律,確定最優(yōu)的因子組合;第二階段,選擇響應(yīng)曲面模型方法擬合二次回歸方程,并繪制出響應(yīng)曲面與等高線圖。
RSM只適合連續(xù)的計量值的擬合,用于考察一系列定量參數(shù)和1個或多個響應(yīng)值之間的關(guān)系,主要包括中心復(fù)合型設(shè)計(CCD)和Box-Behnken設(shè)計。CCD其實是兩水平因子設(shè)計(完全要因設(shè)計或部分要因設(shè)計)增加中心點和軸向點,其因子的水平數(shù)可達(dá)五水平,即+α,-α,+1,-1,0,面向中心點設(shè)計 α值為1,因此只有3個水平。其α值與因子數(shù)有關(guān)。因子可為數(shù)值因子(numeric factors)和絕對值因子(categoric factors),每增加 1 個絕對值因子或其水平增加1個實驗次數(shù)將增加1倍。CCD通常需增加3~5個中心點,用以估計實驗誤差和考察模型的準(zhǔn)確程度。增加的軸向點可以更好地評價各水平所取范圍內(nèi)的效果,使結(jié)果更具可靠性[6]。Box-Behnken設(shè)計每個因子有三水平,沒有軸向點,所有實驗點均在考察范圍之內(nèi)。與相同數(shù)量因素的CCD相比,實驗次數(shù)相對較少,因此更快捷,更經(jīng)濟(jì)。
DOE通常分6步進(jìn)行:確定影響實驗結(jié)果的各種因素、水平和對實驗結(jié)果進(jìn)行評估的響應(yīng)值;選擇適宜的實驗設(shè)計方法,篩選設(shè)計或優(yōu)化設(shè)計;產(chǎn)生設(shè)計矩陣,進(jìn)行實驗;將實驗結(jié)果輸入計算機(jī),產(chǎn)生效果圖,顯示實驗結(jié)果整體趨勢;進(jìn)行下一步實驗設(shè)計,得出最佳化值;對結(jié)果進(jìn)行驗證。
DOE涉及大量數(shù)據(jù)的產(chǎn)生與使用,手動分析DOE數(shù)據(jù)工作量,難度都非常大,必須有良好的信息管理系統(tǒng),借助計算機(jī)信息技術(shù)對這些大量的數(shù)據(jù)進(jìn)行管理和分析,才能獲得最佳的效果。DOE軟件目前只有英文的,一般都具有 t檢驗、回歸分析、反應(yīng)曲面法(RSM)、變異數(shù)分析(ANOVA)、反應(yīng)圖表(response graphs)等功能,Design Expert是當(dāng)前使用最廣的DOE軟件,在響應(yīng)曲面和混合設(shè)計方面比JMP和MINITAB詳細(xì)完整得多,它擁有混合式設(shè)計(mixture Design),可在最短的時間發(fā)現(xiàn)最佳化的公式,用最少的成本和時間,找出影響實驗的重要因子。如實驗因子有 X,Y,Z 3項,透過實驗設(shè)計可找出系統(tǒng)的反應(yīng)。假設(shè)系統(tǒng)的反應(yīng)是f(x,y,z)=100 X+10 Y+ Z,就可以忽略 Z 因子,甚至是 Y 因子,因為整個系統(tǒng)幾乎是由 X因子所操控。系統(tǒng)的反應(yīng)可以簡化成 f(x,y,z)=100 X。因?qū)嶒灂r實際實驗的組合有限,而優(yōu)化分析的結(jié)論來自于統(tǒng)計推理,難免與實際情況有偏差,故需要進(jìn)行確認(rèn)實驗,即按所得最佳設(shè)定運(yùn)行過程,檢驗實際結(jié)果是否與預(yù)期一致。
DOE在制藥行業(yè)中的應(yīng)用主要包括提取純化、成型工藝等因素的篩選與水平優(yōu)化、方法驗證時的穩(wěn)健性試驗。設(shè)計方法的選擇既要考慮信息需求,又要考慮實驗數(shù)量。如果僅是單一的實驗參數(shù)篩選,應(yīng)用分辨度較低的設(shè)計即可滿足要求,如完全要因設(shè)計和部分要因設(shè)計。部分要因設(shè)計較完全要因設(shè)計分辨度低,實驗次數(shù)少,所產(chǎn)生信息量也較少。分辨度為Ⅲ的部分要因設(shè)計實驗次數(shù)最少,但不能檢測各種交互作用的效果。
在工藝篩選優(yōu)化過程中,所涉及因素很多,從眾多因素中篩選出對評價指標(biāo)產(chǎn)生顯著影響的主要因素,可選用完全要因設(shè)計、部分要因設(shè)計或Plackett-Burman設(shè)計法進(jìn)行設(shè)計。所有設(shè)計中各因子均為高、低2個水平,又稱雙水平篩選設(shè)計,可用較少的實驗次數(shù)篩選大量的因子。因子數(shù)為2~4個時可選完全要因設(shè)計,通常因子數(shù)目達(dá)4個以上時多選用分辨度較低、實驗次數(shù)較少的部分因子設(shè)計或Plackett-Burman設(shè)計。如楊冀艷等[7]用Plackett-Burman設(shè)計對影響荷葉總黃酮得率的因素進(jìn)行了評價,篩選出具有顯著效應(yīng)的因素,即乙醇濃度、液固比和提取次數(shù),然后用響應(yīng)面分析法確定了主要影響因素的最佳提取條件為乙醇濃度67%、液固比34∶1(V/m),提取3次,在此條件下荷葉總黃酮得率的預(yù)測值可達(dá)3.19%,實測值為3.17%,兩者較接近。
部分因子設(shè)計時應(yīng)根據(jù)實驗需要及因子數(shù)設(shè)計適當(dāng)?shù)?p值,通常 p值的不同有時對結(jié)果無顯著影響。但因子數(shù)量一定時并不是實驗次數(shù)越少越好,在進(jìn)行實驗設(shè)計時需要考慮標(biāo)準(zhǔn)誤差,其值與自由度有關(guān)。自由度較低時,t值、ME及 SME均偏高,所得結(jié)果可能會與相同情況下自由度高時有差異。另外,實驗次數(shù)較少時,每次實驗響應(yīng)值差異明顯,變異系數(shù)較大,也會對結(jié)果產(chǎn)生一定影響[8]。
篩選出對響應(yīng)值具有顯著影響的各因子后,需要進(jìn)一步通過優(yōu)化設(shè)計找出最優(yōu)值。通常選擇響應(yīng)曲面設(shè)計中的中心復(fù)合型設(shè)計或Box-Behnken設(shè)計,找出靶向、最大化或最小化響應(yīng)值。如吳大章等[9]采用Box-Behnken設(shè)計優(yōu)化紫蘇葉揮發(fā)油-β-環(huán)糊精包合物制備工藝,得到優(yōu)化制備工藝制得紫蘇葉揮發(fā)油-β -環(huán)糊精包合物的平均包合率為(75.8±0.9)% ,收得率為(73.13 ±1.2)%,預(yù)測性良好。若同時有數(shù)個響應(yīng)值,需根據(jù)實驗要求設(shè)定每個響應(yīng)值的重要程度,得出最優(yōu)值,以滿足各響應(yīng)值的需要[10]。
DOE發(fā)展至今已涉及多個領(lǐng)域,國外制藥工藝的篩選、優(yōu)化及驗證中也已廣泛應(yīng)用,但目前國內(nèi)報道很少。一方面,可能是因為DOE不僅需要專業(yè)知識,還需要一定的數(shù)學(xué)及統(tǒng)計學(xué)知識;另一方面,DOE是對各實驗參數(shù)一個系統(tǒng)、全面的篩選與優(yōu)化,雖然盡可能地減少了實驗次數(shù),但在某些情況下,工作量仍然非常大。DOE有其獨特的優(yōu)勢,不僅可以節(jié)約時間和成本,而且還可大大提高參數(shù)可信度和精確度,值得進(jìn)一步推廣應(yīng)用。
參考文獻(xiàn):
[1]Sucker H.Methoden zum Planen und Auswerten von Versuchen I,F(xiàn)actorial Design,eine Einfuhrung[J].Informationsd,rbeitsgem Pharm,Verfahrenstech,1971,17(1 - 2):52 -68.
[2]Leuenberger H,Becher W.A factorial design for compatibility studies on preformulation work[J].Pharm Acta Helv,1975,50(4):88 - 91.
[3]Montgomery DC.Design and Analysis of Experiments[M].Wiley,New York,1996:4.
[4]Carlson R.Design and Optimisation in Organic Synthesis[J].Elsevier,Amsterdam,1992:215 -220.
[5]Box GEP,Wilson KB.On the experimental attainment of optimum conditions[J].J Royal Statistical Society,1951,13(1):1 - 45.
[6]Montgomery DC,Myers RH.Response Surface Methodology[M].Wiley,New York,1995:176.
[7]楊冀艷,胡 磊,許 楊.Plackett-Burman設(shè)計和響應(yīng)面法優(yōu)化荷葉總黃酮的提取工藝[J].食品科技,2009,30(6):29 -33.
[8]Vannecke C,Baré S,Bloomfield M,et al.An experimental design approach to the optimisation of a flow injection analysis method for glycine[J].J Pharm Biomed Anal,1999,18(6):963 - 973.
[9]吳大章,吳品江,楊 明.設(shè)計-效應(yīng)面法優(yōu)化紫蘇葉揮發(fā)油-β-環(huán)糊精包合物制備工藝[J].成都中醫(yī)藥大學(xué)學(xué)報,2009(1):81-87.
[10]Ragonese R,Macka M,Hughes J,et al.The use of the Box - Behnken experimental design in the optimisation and robustness testing of a capillary electrophoresis method for the analysis of ethambutol hydrochloride in a pharmaceutical formulation[J] .J Pharm Biomed Anal,2002,27(6):995-1 007.