堵錫華,王 超,李 靖,宋 明,田 林
(徐州工程學(xué)院化學(xué)化工學(xué)院,江蘇 徐州 221018)
【研究意義】香葉天竺葵為牻牛兒苗科天竺葵屬草本植物,原產(chǎn)于非洲,現(xiàn)在我國(guó)云南中西部、江蘇、浙江、四川等地也已有種植,具有主治“風(fēng)濕、疝氣”、生物抗氧化能力等藥用價(jià)值[1-2],又有作為香料重要原料的經(jīng)濟(jì)價(jià)值。香葉天竺葵精油為其莖和葉中的主要有效成分,作為玫瑰香韻的主要原料, 是調(diào)配各種香水、香粉、膏霜、皂用香精等日用香精和食用香精的重要香原料[3-4]?!厩叭搜芯窟M(jìn)展】所以近年來(lái)對(duì)香葉天竺葵的相關(guān)研究受到人們?cè)絹?lái)越多的關(guān)注[5-6],但這些研究工作主要集中在成分分析或藥用領(lǐng)域方面[7-9],采用神經(jīng)網(wǎng)絡(luò)方法對(duì)香葉天竺葵進(jìn)行相關(guān)性質(zhì)的研究未見(jiàn)有報(bào)道。
神經(jīng)網(wǎng)絡(luò)方法是一個(gè)多學(xué)科交叉的前沿研究方法,它通過(guò)模擬人的大腦,來(lái)對(duì)研究對(duì)象的相關(guān)信息進(jìn)行系統(tǒng)的智能處理,利用該法將其應(yīng)用于定量結(jié)構(gòu)-保留相關(guān)性研究(QSRR)工作,成為色譜分析研究工作者重要的也是簡(jiǎn)便高效的手段[10-11],它已成為色譜研究中重要的分支,在食品科學(xué)[12]、藥學(xué)[13]、環(huán)境科學(xué)[14]等領(lǐng)域得到越來(lái)越廣泛的應(yīng)用?!颈狙芯壳腥朦c(diǎn)】在前面[15-17]工作方法的基礎(chǔ)上,根據(jù)文獻(xiàn)[18]檢測(cè)出的61個(gè)香葉天竺葵精油的香氣分子列出的色譜保留指數(shù)RI,按照文獻(xiàn)[19-20]方法編寫(xiě)了相關(guān)的計(jì)算程序,計(jì)算了61個(gè)香氣分子的分子連接性指數(shù)和電性拓?fù)錉顟B(tài)指數(shù),通過(guò)最佳變量子集回歸,篩選了其中5種結(jié)構(gòu)參數(shù)作為神經(jīng)網(wǎng)絡(luò)的輸入層變量,以氣相色譜保留指數(shù)作為輸出層變量,建構(gòu)得到的神經(jīng)網(wǎng)絡(luò)模型的總相關(guān)系數(shù)rt達(dá)到0.9987的高度相關(guān),利用該神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)得到的色譜保留指數(shù)與文獻(xiàn)值吻合度較為理想,相對(duì)平均誤差只有0.67 %?!緮M解決的關(guān)鍵問(wèn)題】研究工作對(duì)利用氣相色譜分析技術(shù)快速分析香葉天竺葵精油的成分、指導(dǎo)生產(chǎn)不同香氣的香精產(chǎn)品具有實(shí)際意義。
表1 RI與參數(shù)的最佳變量子集回歸結(jié)果
(1)
式中:n為香葉天竺葵精油香氣成分分子的樣本總數(shù),b為模型的變量數(shù),r2為模型的決定系數(shù),這里計(jì)算得到的FIT值越大,說(shuō)明模型越穩(wěn)定,預(yù)測(cè)能力也就越高,當(dāng)然最優(yōu)模型需根據(jù)相關(guān)性、誤差和FIT等綜合判斷。
表2 香氣成分的結(jié)構(gòu)參數(shù)
續(xù)表2 Continued table 2
序號(hào)化合物0X4X5XcE3E8RI文獻(xiàn)值預(yù)測(cè)值誤差9(Z)-氧化芳樟醇5(呋喃型)8.1320.7780.982-0.0550107710860.7910綠花白千層醇11.1620.9104.0544.027015961589-0.4511八氫四甲基萘甲醇11.1620.3632.9093.4423.32916121608-0.2212(E)-氧化芳樟醇5(呋喃型)8.1320.7780.982-0.055010921086-0.6013異胡薄荷醇8.8010.6691.4091.167011551151-0.3214喇叭花醇11.1620.8404.0544.0270162316401.0515橙花醛7.5550.2310.34002.48812461222-1.9016薄荷酮7.7620.3421.2051.5540.49911701164-0.5217異薄荷酮7.7620.3421.2051.5540.49911651164-0.09186-甲基-3,5-庚二烯-2-酮6.1400.1410.16401.29211051082-2.05196,10,14-三甲基-2-十五酮14.0040.4721.5662.5400.339187218740.08206-甲基-5-庚烯-2-酮6.4000.2730.24601.5599869910.4821甲酸香茅酯8.8770.1820.5950.6351.372127913011.6922甲酸香葉酯8.6700.1590.46102.60813041296-0.6023惕各酸香葉酯11.6700.2170.57503.01717001687-0.7524丁酸香葉酯11.0070.1810.59002.528155815630.3025丙酸香葉酯10.3000.1810.53502.486147714820.3626丁酸香茅酯11.2140.2040.7410.6301.320152915300.0527丙酸香茅酯10.5070.2040.6900.6301.28414441441-0.2428乙酸香葉酯9.5930.1810.48902.38913841382-0.1229惕各酸香茅酯11.8770.2400.7270.6011.86016671659-0.4630乙酸香茅酯9.8000.2040.6350.6301.19313571343-1.04312-甲基丁酸香葉酯11.9290.2190.70203.76215861585-0.0932異戊酸香葉酯11.8770.2800.6280.3662.523161316210.4633β-波旁烯10.4220.6364.0154.8041.593139114061.0534β-石竹烯10.4750.5192.2821.7273.108142714370.7135去氫白菖蒲烯10.3780.3532.1742.3240153115360.2936β-蓽澄茄烯10.4220.6593.9814.8261.59713901367-1.6637α-依蘭油烯10.5850.3862.6193.3993.275150115070.3938α-蒎烯7.1460.5461.5801.9231.6469409420.2139α-欖香烯10.8530.5931.5250.6134.526149215081.0840β-愈創(chuàng)木烯10.6900.3612.3221.7056.908149015101.3541δ-杜松烯10.6380.3942.5562.5205.09315241504-1.3242α-蛇麻烯10.6380.4441.23803.027146114620.0943β-杜松烯10.5850.4252.6503.5463.275150115090.5544α-芹子烯10.4750.5142.7281.6173.047149314990.4245別香橙烯10.4220.6053.6794.8751.59014711463-0.56
續(xù)表2 Continued table 2
序號(hào)化合物0X4X5XcE3E8RI文獻(xiàn)值預(yù)測(cè)值誤差51月桂烯6.9830.1830.29602.49599110223.1352α-古蕓香烯10.6380.5873.4633.9083.67114121411-0.0553α-松油烯7.1460.2410.8180.7403.12110191018-0.1354α-杜松烯10.5850.4062.6193.3993.27515371507-1.9355α-水芹烯7.0940.2520.8141.5731.414100510171.1956γ-芹子烯10.5270.4992.6300.7824.790146514650.0157玫瑰醚7.7620.2550.9151.2301.36511151104-0.9858大根香葉烯 D10.4220.2711.2551.4482.81514851485-0.0159石竹烯氧化物10.8830.7082.6902.2091.504159416030.5360對(duì)傘花烴6.8870.2120.6070.6530102510441.82612,2,6-三甲基-6-乙烯基四氫吡喃7.8140.5730.900009649680.45
將文獻(xiàn)[18]中列出的61種香氣成分的氣相色譜保留指數(shù),與優(yōu)化篩選出的5種結(jié)構(gòu)參數(shù)0X,4X,5Xc,E3和E8進(jìn)行回歸分析,得到的回歸方程為:
RI=114.7860X-311.9594X+126.0565Xc-69.722E3-20.800E8+343.764
(2)
S=89.375F=70.034
利用式(2)對(duì)香氣成分的色譜保留指數(shù)進(jìn)行預(yù)測(cè),所得預(yù)測(cè)值與文獻(xiàn)值基本吻合,2者的相對(duì)平均誤差為4.59 %。
表3 Jackknifed相關(guān)系數(shù)的檢驗(yàn)
圖1 Jackknifed相關(guān)系數(shù)r的雷達(dá)圖Fig.1 Radar map of correlation coefficient r
為提高預(yù)測(cè)氣相色譜保留指數(shù)的準(zhǔn)確性,用神經(jīng)網(wǎng)絡(luò)法深入進(jìn)行研究。根據(jù)表1中篩選得到的0X,4X,5Xc,E3和E8共5個(gè)分子結(jié)構(gòu)參數(shù),將這5個(gè)參數(shù)作為神經(jīng)網(wǎng)絡(luò)方法中的輸入層變量,61種香葉天竺葵精油香氣成分的氣相色譜保留指數(shù)作為輸出層變量,按照許祿等學(xué)者[24]相關(guān)建議規(guī)則:
1.4≤ρ(=n/M)<2.2
(3)
其中,n為香氣成分的樣本個(gè)數(shù),M為網(wǎng)絡(luò)總權(quán)重。M的定義又為:
M=(I+1)H+(H+1)Q
(4)
其中,I、H、Q為三層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中的輸入層、隱含層及輸出層的變量數(shù)。這里采用5個(gè)分子結(jié)構(gòu)參數(shù)作為輸入層變量,即I=7; 用香氣成分的色譜保留指數(shù)作為輸出層變量,即Q= 1; 故如要使式(3)和式(4)符合要求,H可選取4、5或6,通過(guò)分別計(jì)算、分析、比較,發(fā)現(xiàn)當(dāng)H取6時(shí),所得模型的結(jié)果最優(yōu),故這里網(wǎng)絡(luò)結(jié)構(gòu)采用5∶6∶1的結(jié)構(gòu)方式,隱含層的傳遞函數(shù)用tansig,輸出層的傳遞函數(shù)用purelin,訓(xùn)練傳遞函數(shù)用trainlm,初始速率為0. 001,最大迭代次數(shù)則采用3000次。
為進(jìn)一步判斷模型的預(yù)測(cè)能力,防止過(guò)擬合,將全部香葉天竺葵精油的香氣成分61個(gè)分子分為3組:訓(xùn)練集(每5個(gè)分子為1組,取其中的第1、3、4個(gè)分子)、測(cè)試集(第2個(gè)分子)、驗(yàn)證集(第5個(gè)分子),由此計(jì)算分析,得到了神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)保留指數(shù)模型的總相關(guān)系數(shù)rt=0.9987,訓(xùn)練集相關(guān)系數(shù)r1
圖2 預(yù)測(cè)值和文獻(xiàn)值的關(guān)系圖Fig.2 Relationship between literal andpredictor of RI
=0.9986、測(cè)試集相關(guān)系數(shù)r2=0.9996、驗(yàn)證集的相關(guān)系數(shù)r3=0.9986,可以看出,各集的相關(guān)系數(shù)與模型的總相關(guān)系數(shù)均較為接近,利用該建構(gòu)的QSRR神經(jīng)網(wǎng)絡(luò)模型,計(jì)算得到香葉天竺葵精油香氣成分的氣相色譜保留指數(shù)預(yù)測(cè)值(Pre.),與文獻(xiàn)值吻合度非常理想,兩者的相對(duì)平均誤差僅為0.67 %,遠(yuǎn)優(yōu)于采用多元回歸方法的預(yù)測(cè)精度,故神經(jīng)網(wǎng)絡(luò)法建立模型的預(yù)測(cè)能力明顯優(yōu)于多元回歸分析方法。將保留指數(shù)的預(yù)測(cè)值與文獻(xiàn)值列于表2中,兩者的關(guān)系圖見(jiàn)圖2,神經(jīng)網(wǎng)絡(luò)模型的權(quán)重和偏置見(jiàn)表4。
在氣相色譜分析中,保留指數(shù)是使用廣泛并被公認(rèn)的色譜定性指標(biāo),但影響保留指數(shù)大小的因素有:載體的吸附作用、柱溫、進(jìn)樣量的大小、載氣的純度等等,其中最主要的是被測(cè)組分和固定相之間的分子間作用力大小,當(dāng)固定相一定時(shí),被測(cè)組分在色譜柱上的保留行為,則與該組分分子的空間拓?fù)?、幾何和電性等結(jié)構(gòu)特性具有密切的關(guān)系[25]。本模型選用分子連接性指數(shù)中的0X、4X、5Xc和電性拓?fù)錉顟B(tài)指數(shù)中的E3、E8共5個(gè)變量中,分子連接性指數(shù)中的0X、4X和5Xc分別代表0、4階路徑指數(shù)和簇項(xiàng)指數(shù),電性拓?fù)錉顟B(tài)指數(shù)中的E3和E8分別代表 >CH-和 >C=兩種基團(tuán)的結(jié)構(gòu)參數(shù)值,這5個(gè)參數(shù)變量所代表的基團(tuán)對(duì)模型的貢獻(xiàn)最大,說(shuō)明分子中原子之間的連接形式、連接何種基團(tuán)、相鄰原子的作用力大小等均對(duì)色譜保留指數(shù)能產(chǎn)生影響,從61個(gè)香葉天竺葵精油香氣成分的分子結(jié)構(gòu)與保留指數(shù)的關(guān)系可以看出,隨著有機(jī)化合物分子中碳原子數(shù)目的增加,分子體積逐漸增大,色散力逐漸增強(qiáng),化合物在固定相上的色譜保留作用逐漸增強(qiáng);當(dāng)碳原子數(shù)目一定時(shí),分子支化度增大,組分與固定相之間的接觸面減小,色散力逐漸減小,保留作用也逐漸減小。由于單一的分子結(jié)構(gòu)參數(shù)不能充分反映原子間復(fù)雜的影響關(guān)系,故將蘊(yùn)含了拓?fù)洹缀魏碗娦越Y(jié)構(gòu)信息的連接性指數(shù)與電性拓?fù)錉顟B(tài)指數(shù)有機(jī)結(jié)合,揭示了基團(tuán)之間的作用和影響,反映出了香葉天竺葵精油香氣成分色譜保留指數(shù)的變化規(guī)律。利用篩選的5個(gè)結(jié)構(gòu)參數(shù)建立的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,得到氣相色譜保留指數(shù)預(yù)測(cè)值的相對(duì)平均誤差僅為0.67 %。通過(guò)對(duì)全部61個(gè)香葉天竺葵精油香氣成分的色譜保留指數(shù)進(jìn)行預(yù)測(cè),只有對(duì)月桂烯分子預(yù)測(cè)時(shí),相對(duì)誤差最大達(dá)到3.13 %,這可能與該分子鏈上有多個(gè)烯鍵的相互作用使保留指數(shù)偏小有關(guān)。
表4 BP-ANN 模型的權(quán)重和偏置
(1)通過(guò)MINITAB優(yōu)化篩選的5個(gè)結(jié)構(gòu)描述子與香葉天竺葵精油的香氣成分保留指數(shù)具有高度的非線性相關(guān)性,利用結(jié)構(gòu)參數(shù)與保留指數(shù)相關(guān)性建構(gòu)的神經(jīng)網(wǎng)絡(luò)模型,不但對(duì)內(nèi)部化合物樣本有好的估算能力,而且對(duì)外部化合物樣本有較強(qiáng)的預(yù)測(cè)能力。
(2)5種分子結(jié)構(gòu)參數(shù)0X、4X、5Xc、E3、E8與香氣成分色譜保留指數(shù)之間建立的QSRR模型,經(jīng)檢驗(yàn)不存在異常的離域值,具有良好的穩(wěn)定性和較強(qiáng)的預(yù)測(cè)能力。
(3)神經(jīng)網(wǎng)絡(luò)方法具有比多元回歸分析方法更好的預(yù)測(cè)準(zhǔn)確度和糾錯(cuò)能力。
(4)根據(jù)分子拓?fù)浣Y(jié)構(gòu)特征構(gòu)建的神經(jīng)網(wǎng)絡(luò)模型,對(duì)預(yù)測(cè)香氣成分的色譜保留指數(shù)、選擇合適的色譜分離條件、探索色譜保留機(jī)制能起到積極的指導(dǎo)作用。