崔紅新,楊帥朋,張濘杰,王子翰,黃 瓊,趙 迪,馮素香,3
1.河南中醫(yī)藥大學(xué)藥學(xué)院(鄭州 450046)
2.河南中醫(yī)藥大學(xué)呼吸疾病中醫(yī)藥防治省部共建協(xié)同創(chuàng)新中心(鄭州 450046)
3.河南中醫(yī)藥大學(xué)河南省現(xiàn)代中藥研發(fā)與應(yīng)用工程研究中心(鄭州 450046)
在藥物制劑生產(chǎn)工藝過(guò)程中,為了達(dá)到最佳工藝條件,技術(shù)人員常把因素對(duì)工藝的影響作為重要課題研究[1-2]。傳統(tǒng)研究因素間關(guān)系的常用分析方法包括正交設(shè)計(jì)、均勻設(shè)計(jì)及回歸分析等,這些方法不僅需要統(tǒng)計(jì)的相關(guān)性判斷、假設(shè)檢驗(yàn)等,還需要進(jìn)行大量的試驗(yàn)或足夠大的樣本量,同時(shí)傳統(tǒng)統(tǒng)計(jì)方法的結(jié)果形式比較單一,無(wú)法動(dòng)態(tài)分析因素之間、因素和試驗(yàn)結(jié)果指標(biāo)間的相關(guān)關(guān)系[3-7]。粗糙集理論是一種能有效分析不精確、不完整和不一致信息數(shù)據(jù)的數(shù)學(xué)方法,不需要提供所處理數(shù)據(jù)之外的其他先驗(yàn)知識(shí),而是通過(guò)對(duì)數(shù)據(jù)進(jìn)行分析和推理,挖掘隱含的關(guān)系,進(jìn)而揭示因素之間動(dòng)態(tài)變化的潛在規(guī)律。
粗糙集理論目前已廣泛應(yīng)用于數(shù)據(jù)挖掘、故障檢測(cè)和工程控制等領(lǐng)域,但在醫(yī)藥領(lǐng)域中的應(yīng)用較少[8-12]。本研究以《中醫(yī)藥統(tǒng)計(jì)學(xué)》中“優(yōu)化經(jīng)典名方‘四物湯’提取工藝,提高藥材的有效成分提取率”為例[13],以該案例中正交設(shè)計(jì)試驗(yàn)預(yù)處理數(shù)據(jù)為數(shù)據(jù)來(lái)源,采用粗糙集理論決策方法,探討四物湯提取生產(chǎn)工藝過(guò)程中因素之間的相互作用,提高有效成分提取率,尋求最佳組合搭配。
粗糙集理論由波蘭數(shù)學(xué)家Z.Pawlak 于1982年提出[14]。該理論的基本思路是首先確立考察工藝的因素,對(duì)數(shù)據(jù)資料離散化處理,建立信息表,繼而形成條件屬性與決策屬性的決策表,進(jìn)行決策表屬性約簡(jiǎn),利用粗糙集理論的決策分析系統(tǒng),處理決策表的數(shù)據(jù),得出條件屬性和決策屬性之間的決策規(guī)則模型。通過(guò)進(jìn)一步分析決策規(guī)則模型,探尋各因素之間以及因素和結(jié)果指標(biāo)之間的動(dòng)態(tài)內(nèi)在規(guī)律。
本研究旨在探究四物湯提取生產(chǎn)工藝過(guò)程中提取時(shí)間、加水量和提取次數(shù)對(duì)試驗(yàn)指標(biāo)藥材多糖成分含量的影響,利用正交設(shè)計(jì)的正交表L9(34)安排試驗(yàn),進(jìn)行預(yù)處理[13],試驗(yàn)因素水平及試驗(yàn)結(jié)果分別見(jiàn)表1 和表2。
表1 四物湯提取因素水平Table 1.The extraction factor level of Siwu decoction
表2 四物湯提取因素正交試驗(yàn)結(jié)果Table 2.Orthogonal test results of Siwu decoction extraction factors
利用正交設(shè)計(jì)試驗(yàn)方案的數(shù)據(jù)作為論域,提取時(shí)間、加水量和提取次數(shù)作為條件屬性,多糖成分含量作為決策屬性,條件屬性按其數(shù)值從小到大進(jìn)行離散,決策屬性按其數(shù)值從小到大進(jìn)行離散,建立因素與試驗(yàn)指標(biāo)多糖成分含量的相關(guān)關(guān)系決策表,見(jiàn)表3。
表3 四物湯提取因素水平與多糖成分含量水平相關(guān)關(guān)系的決策表Table 3.The decision table of the correlation between the extraction factor level and the content level of polysaccharide in Siwu decoction
建立決策表后,進(jìn)行屬性約簡(jiǎn),建立決策規(guī)則模型:Rx: desc([X]C)→desc([X]D),其中desc([X]C)表示因素提取時(shí)間、加水量和提取次數(shù)的特定取值,desc([X]D)表示試驗(yàn)指標(biāo)藥材多糖成分含量的特定取值。決策規(guī)則Rx: desc([X]C)→desc([X]D)表示因素提取時(shí)間、加水量和提取次數(shù)取不同水平時(shí),指標(biāo)多糖成分含量水平的變化。通過(guò)此決策規(guī)則模型可以探究因素對(duì)多糖成分含量的影響,以及因素之間相互作用的內(nèi)在規(guī)律。
采用粗糙集軟件Rosetta 進(jìn)行數(shù)據(jù)分析,將因素水平與多糖成分含量水平相關(guān)關(guān)系的決策表載入Rosetta 系統(tǒng)后,軟件基于粗糙集理論的KDD決策分析系統(tǒng),根據(jù)粗糙集理論對(duì)決策表數(shù)據(jù)進(jìn)行處理、逐步分析,得到?jīng)Q策規(guī)則結(jié)果。按照決策屬性的離散原則,決策屬性水平越高表示藥材多糖成分含量越高,提取效果越好,根據(jù)此規(guī)則對(duì)四物湯提取工藝規(guī)則表模型進(jìn)行分析。利用Excel 軟件繪制三維曲面圖,橫軸分別表示提取時(shí)間、加水量或提取次數(shù)的水平,縱軸表示多糖成分含量的水平,曲面的不同顏色表示多糖成分含量的不同水平,水平顏色從高到低依次為淺灰色、粉色、淺藍(lán)色、綠色、深藍(lán)、黃色、深灰色、深橘色、橘色。
根據(jù)Rosetta 軟件的決策模型,按照選取支持度均達(dá)到最小值0.1 和置信度達(dá)到1 的標(biāo)準(zhǔn),獲取Ga(genetic algorithm)規(guī)則表,見(jiàn)表4。
表4 四物湯提取工藝模型規(guī)則表Table 4.Rule table of the extraction process model of Siwu decoction
由表4 的決策規(guī)則1~9 條可以看出,提取時(shí)間水平為1、加水量水平為1~3 時(shí),多糖成分含量總水平平均值為6/3;提取時(shí)間水平為2、加水量水平為1~3 時(shí),多糖成分含量總水平平均值為17/3;提取時(shí)間水平為3、加水量水平為1~3 時(shí),多糖成分含量總水平平均值為22/3。說(shuō)明當(dāng)提取時(shí)間水平、加水量水平增高時(shí),多糖成分含量水平呈遞增趨勢(shì),見(jiàn)圖1。
圖1 提取時(shí)間、加水量與多糖成分含量水平的三維曲面圖Figure 1.Three-dimensional curved surface diagram of extraction time, water content and polysaccharide content level
由表4 的決策規(guī)則10~18 條可以看出,提取時(shí)間水平為1、提取次數(shù)水平為1~3 時(shí),多糖成分含量總水平平均值為6/3;提取時(shí)間水平為2、提取次數(shù)水平為1~3 時(shí),多糖成分含量總水平平均值為17/3;提取時(shí)間水平為3、提取次數(shù)水平為1~3 時(shí),多糖成分含量總水平平均值為22/3。說(shuō)明當(dāng)提取時(shí)間水平、提取次數(shù)水平增高時(shí),多糖成分含量水平呈遞增趨勢(shì),見(jiàn)圖2。
圖2 提取時(shí)間、提取次數(shù)與多糖成分含量水平的三維曲面圖Figure 2.Three-dimensional curved surface diagram of extraction time, extraction times and polysaccharide content level
由表4 的決策規(guī)則19~27 條可以看出,加水量水平為1、提取次數(shù)水平為1~3 時(shí),多糖成分含量總水平平均值為6/3;加水量水平為2、提取次數(shù)水平為1~3 時(shí),多糖成分含量總水平平均值為17/3;加水量水平為3、提取次數(shù)水平為1~3 時(shí),多糖成分含量總水平平均值為22/3。說(shuō)明當(dāng)加水量水平、提取次數(shù)水平增高時(shí),多糖成分含量水平呈遞增趨勢(shì),見(jiàn)圖3。
圖3 加水量、提取次數(shù)與多糖成分含量水平的三維曲面圖Figure 3.Three-dimensional curved surface diagram of water addition, extraction times and polysaccharide content level
根據(jù)決策規(guī)則1~9 可知,當(dāng)提取時(shí)間為3 水平、加水量為3 水平時(shí),多糖成分含量為9 水平;由規(guī)則10~18 可知,當(dāng)提取時(shí)間為3 水平、提取次數(shù)水平為3 或2 時(shí),多糖成分含量水平為8 或9 水平;由規(guī)則19~27 可知,加水量為3 水平、提取次數(shù)水平為3 或2 時(shí),多糖成分含量水平為8 或9 水平。綜合平衡以上三因素與試驗(yàn)指標(biāo)的內(nèi)在關(guān)系,四物湯優(yōu)化提取工藝的三因素三水平最佳搭配為提取時(shí)間為3 水平、加水量為3 水平、提取次數(shù)為2 水平,即提取時(shí)間為1.5 小時(shí)、加水量為1 ∶ 20、提取次數(shù)為2 次。
基于三維曲面圖,結(jié)合決策規(guī)則中提取時(shí)間、加水量、提取次數(shù)水平與多糖成分含量水平的動(dòng)態(tài)變化規(guī)律可以發(fā)現(xiàn),當(dāng)提取時(shí)間、加水量、提取次數(shù)水平均增高時(shí),多糖成分含量水平呈遞增趨勢(shì)。
本研究結(jié)果顯示,當(dāng)提取時(shí)間為1.5 小時(shí)、加水量為1 ∶ 20、提取次數(shù)為2 次時(shí),試驗(yàn)結(jié)果最好,此結(jié)果與參考資料中采用正交設(shè)計(jì)分析的結(jié)果一致[13]。正交設(shè)計(jì)分析方法是利用方差分析的原理,多次對(duì)因素不同水平進(jìn)行計(jì)算,得出最佳搭配,但該方法計(jì)算量大,且不能充分反映因素之間的內(nèi)在聯(lián)系。本研究采用粗糙集理論方法能夠以動(dòng)態(tài)變化形式,以結(jié)局指標(biāo)與三因素不同水平變化影響的過(guò)程為研究重點(diǎn),充分反映各因素之間以及因素和試驗(yàn)結(jié)果之間的相關(guān)關(guān)系,從更深層次揭示因素之間的內(nèi)在規(guī)律。
本研究結(jié)果表明,粗糙集理論方法能夠有效分析和推理不完整的數(shù)據(jù)信息,挖掘因素之間的相關(guān)關(guān)系,它不同于基于概率論為基礎(chǔ)的數(shù)據(jù)挖掘,不需要進(jìn)行相關(guān)性的系列假設(shè)檢驗(yàn)。與模糊數(shù)學(xué)理論及證據(jù)理論方法的數(shù)據(jù)挖掘相比,粗糙集理論方法不需要提供所處理信息之外的任何預(yù)知知識(shí)。因此,該方法可作為醫(yī)藥科學(xué)領(lǐng)域解決實(shí)際問(wèn)題的一種實(shí)用方法。
綜上所述,本研究以四物湯為例,探究工藝因素之間以及因素與結(jié)果指標(biāo)之間的相關(guān)關(guān)系,應(yīng)用粗糙集理論決策規(guī)則模型的方法更全面地揭示事物之間的內(nèi)在動(dòng)態(tài)規(guī)律,并提供一種新穎的研究方法,從而進(jìn)一步提高藥物制劑的工藝質(zhì)量。