堵錫華,王超
(徐州工程學(xué)院 化學(xué)化工學(xué)院, 江蘇 徐州 221018)
烏藥為樟科山胡椒屬植物常綠灌木烏藥的干燥根,湖南、浙江、江蘇、江西等我國(guó)長(zhǎng)江以南地區(qū)均有分布,為常用的理氣鎮(zhèn)痛藥,具有行氣止痛、溫腎散寒之功效[1],亦有抗炎、抗氧化及抑菌等生物活性[2-3],常用來醫(yī)治由跌打損傷、腹部疼痛、寒疝及脈管炎、心臟病引起的心胸疼痛等癥[4]. 目前,國(guó)內(nèi)外對(duì)烏藥的化學(xué)成分分析及工藝提取、抗氧化特性、抗病毒及抗腫瘤活性等方面有較為深入的研究[5-8],其中,對(duì)化學(xué)成分分析的相關(guān)研究較為常見[9-11],對(duì)化學(xué)成分性質(zhì)的研究則較少.
保留時(shí)間是氣相色譜(GC)定性分析的重要指標(biāo),化合物分子的保留時(shí)間等相關(guān)定性數(shù)據(jù)數(shù)量龐大無法通過實(shí)驗(yàn)一一獲取,因此將宏觀的保留值與分子的微觀結(jié)構(gòu)聯(lián)系起來,是氣相色譜保留值定性和智能高效化的重要理論依據(jù)[12]. 本文將定量結(jié)構(gòu)-保留相關(guān)性研究方法與在化學(xué)[13-14]、藥物化學(xué)[15]、環(huán)境科學(xué)[16]等領(lǐng)域得到廣泛應(yīng)用的人工神經(jīng)網(wǎng)絡(luò)(artificial neural networks,ANN)方法相結(jié)合,針對(duì)文獻(xiàn)[17]得到的湖南產(chǎn)烏藥68種化學(xué)成分的色譜保留時(shí)間,建立其與分子連接性指數(shù)、電性拓?fù)錉顟B(tài)指數(shù)的BP神經(jīng)網(wǎng)絡(luò)模型. 本文通過分析烏藥化學(xué)成分的分子結(jié)構(gòu),用獲得的相關(guān)結(jié)構(gòu)指數(shù)預(yù)測(cè)色譜保留時(shí)間的數(shù)據(jù),預(yù)測(cè)的保留時(shí)間與實(shí)驗(yàn)值的相對(duì)平均誤差為2.66%. 研究為通過氣相色譜法快速高效檢測(cè)烏藥復(fù)雜的化學(xué)成分提供了理論依據(jù).
湖南產(chǎn)烏藥68種化學(xué)成分的色譜保留時(shí)間數(shù)據(jù)來自文獻(xiàn)[17],詳見表1.
利用Chemoffice繪圖軟件繪制烏藥68種化學(xué)成分的分子結(jié)構(gòu)圖,在Matlab軟件中調(diào)用該分子結(jié)構(gòu),依照文獻(xiàn)[18-19]的方法自編程序,計(jì)算68個(gè)分子的分子連接性指數(shù)和電性拓?fù)錉顟B(tài)指數(shù),剔除二類指數(shù)中大部分?jǐn)?shù)據(jù)為0的數(shù)組,對(duì)余下的數(shù)組用Minitab軟件中最佳變量子集回歸法進(jìn)行篩選,將連接性指數(shù)(0X,5X和5Xc)和電性拓?fù)錉顟B(tài)指數(shù)(E1,E2和E3)相結(jié)合,尋找與烏藥化學(xué)成分色譜保留時(shí)間相關(guān)性最強(qiáng)的結(jié)構(gòu)參數(shù).各指數(shù)值見表1.
表1 烏藥化學(xué)成分的結(jié)構(gòu)參數(shù)及色譜保留時(shí)間
續(xù)表1
續(xù)表1
將Minitab軟件最佳變量子集回歸篩選的6種連接性指數(shù)和電性拓?fù)錉顟B(tài)指數(shù)與烏藥化學(xué)成分的色譜保留時(shí)間進(jìn)行回歸分析,得到相關(guān)性方程:
t=6.3290X-5.7255X+8.4585Xc-
0.815E1-0.663E2-2.206E3-2.838,
(1)
表2 Jackknifed相關(guān)系數(shù)的檢驗(yàn)
對(duì)這68個(gè)相關(guān)系數(shù)作直方圖(見圖1),Jackknifedr基本呈正態(tài)分布;為檢明烏藥化學(xué)分子中是否存在“離域”的色譜保留時(shí)間,對(duì)68個(gè)相關(guān)系數(shù)以0.920為圓心,0.002為間距作雷達(dá)圖(見圖2),68個(gè)Jackknifedr值均落在區(qū)間內(nèi),說明模型不存在異常的保留時(shí)間值.
以優(yōu)化篩選的連接性指數(shù)(0X,5X,5Xc)和電性拓?fù)錉顟B(tài)指數(shù)(E1,E2和E3)為神經(jīng)網(wǎng)絡(luò)的輸入變量,以湖南產(chǎn)烏藥化學(xué)成分的色譜保留時(shí)間為輸出變量,綜合Andrea和文獻(xiàn)[20]中2種隱含層變量選擇規(guī)則,得到:
2.2>N/M≥1.4,
(2)
其中,N為總樣本數(shù),M為總權(quán)重,計(jì)算公式為
M=(Im+1)Hi+(Hi+1)Ou,
(3)
其中,Im,Hi,Ou分別為神經(jīng)網(wǎng)絡(luò)三層結(jié)構(gòu)中輸入層、隱含層和輸出層的變量數(shù). 這里,輸入層變量數(shù)Im=6,保留時(shí)間作為輸出層變量數(shù)Ou= 1,故隱含層變量Hi可取4或5.經(jīng)比較,當(dāng)Hi取5時(shí),模型的相關(guān)系數(shù)值最大,故本模型采用6∶5∶1的網(wǎng)絡(luò)結(jié)構(gòu),隱含層采用tansig傳遞函數(shù),輸出層采用purelin傳遞函數(shù),迭代次數(shù)為3 000次.
為防止“過訓(xùn)練、過擬合”,在數(shù)據(jù)運(yùn)算過程中,將68種化學(xué)成分分為訓(xùn)練集(以每5個(gè)分子作為一組,
圖1 Jackknifed相關(guān)系數(shù)r的直方圖Fig.1 Histogram of correlation coefficent r
圖2 Jackknifed相關(guān)系數(shù)r的雷達(dá)圖Fig.2 Radar map of Jackknifed correlation coefficent r
取其中第1,3,4個(gè)分子)、測(cè)試集(取每組的第2個(gè)分子)和驗(yàn)證集(取每組的第5個(gè)分子,依此類推),對(duì)其進(jìn)行神經(jīng)網(wǎng)絡(luò)法分析,模型總相關(guān)系數(shù)rt達(dá)0.994 0,相關(guān)性較高,訓(xùn)練集相關(guān)系數(shù)r1達(dá)到0.992 9,測(cè)試集相關(guān)系數(shù)r2達(dá)到0.997 0,驗(yàn)證集相關(guān)系數(shù)r3達(dá)到0.997 9,可以看出,訓(xùn)練集、測(cè)試集、驗(yàn)證集的相關(guān)系數(shù)與總相關(guān)系數(shù)較為接近,利用該神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)得到的烏藥化學(xué)成分的色譜保留時(shí)間與文獻(xiàn)方法分析檢測(cè)的實(shí)驗(yàn)值吻合度較高,平均相對(duì)誤差為2.66%,預(yù)測(cè)值與實(shí)驗(yàn)值關(guān)系見圖3.圖3中無特別遠(yuǎn)離直線的點(diǎn),說明預(yù)測(cè)值較接近實(shí)驗(yàn)值.
圖3 保留時(shí)間的實(shí)驗(yàn)值與預(yù)測(cè)值的相關(guān)性Fig.3 Relationship between experiment and predicted values of t
烏藥因具有多種抗炎、抗氧化、抗腫瘤的活性成分,成為越來越多研究者關(guān)注的熱點(diǎn). 大量研究證實(shí),烏藥含有豐富的呋喃倍半萜及其內(nèi)酯、黃酮、生物堿、揮發(fā)油等成分,由于成分較為復(fù)雜,難以用實(shí)驗(yàn)方法對(duì)其性質(zhì)一一研究. 為此,本文通過計(jì)算烏藥化學(xué)成分的分子連接性指數(shù)和電性拓?fù)錉顟B(tài)指數(shù),篩選出能反映分子空間結(jié)構(gòu)信息的3種連接性指數(shù)(0X、5X、5Xc),以及能反映電子結(jié)構(gòu)信息的3種電性拓?fù)錉顟B(tài)指數(shù)(E1、E2、E3),結(jié)合這6種指數(shù)構(gòu)建BP神經(jīng)網(wǎng)絡(luò)模型,能很好地反映烏藥化學(xué)成分色譜保留時(shí)間的變化規(guī)律.
當(dāng)外部檢測(cè)條件一定時(shí),本模型中的3種連接性指數(shù)(0X、5X分別代表0價(jià)、5價(jià)的路徑指數(shù),5Xc代表簇項(xiàng)指數(shù))說明碳原子的個(gè)數(shù)以及原子之間的連接方式對(duì)保留時(shí)間有影響;3種電性拓?fù)錉顟B(tài)指數(shù)(E1代表“—CH3”基團(tuán)的取值,E2代表“—CH2—”基團(tuán)的取值,E3代表“>CH—”基團(tuán)的取值)則說明分子中伯、仲、叔碳原子對(duì)保留時(shí)間有影響,但同樣是伯碳原子、仲碳原子或叔碳原子,由于所處位置不同,原子之間的相互作用力就不同,各性質(zhì)特征值也不同,因此,只有將連接性指數(shù)與電性拓?fù)錉顟B(tài)指數(shù)相結(jié)合構(gòu)建的模型,才能反映這一規(guī)律. 從表1所列的分子及保留時(shí)間可以看出,當(dāng)檢測(cè)條件固定時(shí),碳原子及基團(tuán)的數(shù)量、連接方式、范德華作用力、色散力、誘導(dǎo)力等均對(duì)保留時(shí)間產(chǎn)生影響,當(dāng)碳原子數(shù)增加時(shí),分子體積增大,色散力增大,保留時(shí)間延長(zhǎng).
篩選出的分子結(jié)構(gòu)指數(shù)與烏藥化學(xué)成分的色譜保留時(shí)間呈高度的非線性關(guān)系. 本文根據(jù)分子拓?fù)浣Y(jié)構(gòu)、電性結(jié)構(gòu)特征構(gòu)建的神經(jīng)網(wǎng)絡(luò)模型,有良好的穩(wěn)定性,預(yù)測(cè)能力較強(qiáng).對(duì)預(yù)測(cè)湖南產(chǎn)烏藥化學(xué)成分的色譜保留時(shí)間、探索色譜保留機(jī)制、選擇合適的色譜條件有一定的指導(dǎo)作用.
浙江大學(xué)學(xué)報(bào)(理學(xué)版)2018年6期