蘭作平,廖立敏,劉 宇,余 瑜*
1重慶醫(yī)科大學藥學院,重慶400016; 2重慶醫(yī)藥高等專科學校,重慶400030;3內江師范學院資源與環(huán)境科學學院,內江641112
全緣葉綠絨蒿揮發(fā)性組分定量結構-色譜保留關系研究
蘭作平1,2,廖立敏3,劉 宇1,余 瑜1*
1重慶醫(yī)科大學藥學院,重慶400016;2重慶醫(yī)藥高等??茖W校,重慶400030;3內江師范學院資源與環(huán)境科學學院,內江641112
提出頂點及頂點相互作用矢量的概念,并將該矢量用于復雜樣本的分子結構表征。采用逐步回歸結合統(tǒng)計檢測對變量進行篩選后,再用多元線性回歸建立了定量結構-色譜保留(QSRR)關系的7變量模型,模型的建模計算值復相關系數(shù)(R)為0.990,標準偏差(SD)為1.325;留一法(LOO)交互檢驗復相關系數(shù)(RCV)為0.983,標準偏差(SDCV)為1.696。結果表明該矢量具有較強的分子結構表達能力,模型具有良好的估計能力與穩(wěn)定性。
全緣葉綠絨蒿;揮發(fā)性有機物;結構描述子;定量結構色譜保留相關
分子結構與色譜保留之間的定量關系的構建,需要引入相應的結構描述子。長期以來,研究者們在這方面已經做了許多有意義的工作。例如利用分子的幾何結構、拓撲性質及連接特征和各種物化參數(shù)等進行結構描述,然后建立QSRR模型來預測化合物的色譜保留值[1,2]。全緣葉綠絨蒿(Meconopsis integrifolia Franch.)又稱綠絨蒿,系罌粟科綠絨蒿屬一年生草本植物,分布于甘肅、青海、西藏等省區(qū)。全緣葉綠絨蒿可以應用于食品及藥品,具有清熱止咳的功效,藏醫(yī)用其花治療肝熱病和肺熱病。最近官艷麗等[3]采用水蒸氣蒸餾法提取出了全緣葉綠絨蒿花精油,用GC-MS法分離并分析鑒定其成分,最后鑒定出55個揮發(fā)性化學成分(表1)。這些化合物包括烷烴、環(huán)烷烴、烯烴、芳烴、醇、酯等,并且還含有N、O、S等雜原子,因此分子的元素組成復雜及結構跨度大,我們稱之為復雜樣本。本文根據(jù)有機化合物分子的隱氫圖,提出頂點及頂點相互作用矢量的概念,為驗證該矢量在分子結構表征上的普適性,采用由此55種物質組成的復雜樣本進行建模研究。借助逐步回歸、多元線性回歸和留一法交互檢驗建立了7變量的分子結構與氣相色譜保留值之間的相關模型(QSRR),取得較好的結果,可望為天然藥物及精細化工產品的色譜行為提供有益參考。
表1 55個化合物及其保留時間Table 1 Fifty-five components and their retention times
3 9 E i c o s a n e C 20 H 42 2 4.2 3 2 3.8 0 1 -0.4 2 9 2 3.7 7 8 -0.4 5 2 4 0 M e t h y l l i n o l e a t e C 19 H 34 O 2 2 6.3 6 2 7.1 2 0 0.7 6 0 2 7.1 5 5 0.7 9 5 4 1 M e t h y l l i n o l e n a t e C 19 H 32 O 2 2 6.4 4 2 7.6 3 6 1.1 9 6 2 7.6 9 3 1.2 5 3 4 2 M e t h y l s t e a r a t e C 19 H 38 O 2 2 6.8 9 2 5.9 9 8 -0.8 9 2 2 5.9 6 3 -0.9 2 7 4 3 L i n o l e i c a c i d C 18 H 32 O 2 2 7.4 0 2 8.0 3 8 0.6 3 8 2 8.0 8 8 0.6 8 8 4 4 L i n o l e n i c a c i d C 18 H 30 O 2 2 7.6 0 2 8.5 5 3 0.9 5 3 2 8.6 3 0 1.0 3 0 4 5 E t h y l l i n o l e a t e C 20 H 36 O 2 2 7.7 3 2 9.1 5 3 1.4 2 3 2 9.2 3 8 1.5 0 8 4 6 E h t y l l i n o l e n a t e C 20 H 34 O 2 2 7.9 1 2 9.6 6 8 1.7 5 8 2 9.7 8 0 1.8 7 0 4 7 S t e a r i c a c i d C 18 H 36 O 2 2 8.1 0 2 6.9 1 8 -1.1 8 2 2 6.8 2 8 -1.2 7 2 4 8 D o c o s a n e C 22 H 46 2 8.6 2 2 7.5 6 8 -1.0 5 2 2 7.5 0 2 -1.1 1 8 4 9 1 -D o c o s e n e C 22 H 44 2 8.8 9 2 7.5 6 8 -1.3 2 2 2 7.4 8 5 -1.4 0 5 5 0 T r i c o s a n e C 23 H 48 3 0.6 4 2 9.4 5 7 -1.1 8 3 2 9.3 7 0 -1.2 7 0 5 1 3 -M e t h y t r i c o s a n e C 24 H 50 3 1.6 3 2 9.2 4 5 -2.3 8 5 2 9.0 8 7 -2.5 4 3 5 2 T e t r a c o s a n e C 24 H 50 3 2.0 0 3 1.3 4 8 -0.6 5 2 3 1.2 9 1 -0.7 0 9 5 3 P e n t a c o s a n e C 25 H 52 3 3.2 5 3 3.2 4 2 -0.0 0 8 3 3.2 4 1 -0.0 0 9 5 4 H e p t a c o s a n e C 27 H 56 3 5.2 0 3 7.0 3 5 1.8 3 5 3 7.3 1 3 2.1 1 3 5 5 O c t a c o s a n e C 28 H 58 3 8.6 0 3 8.9 3 5 0.3 3 5 3 8.9 9 6 0.3 9 6
在有機化合物分子的隱氫圖中,每一個非氫原子即為分子頂點。我們認為整個有機物分子的性質與分子頂點本身及頂點之間的相互作用存在密切關系,而分子中的非骨架氫原子對整個分子性質的影響可以忽略不計。并且不同類型的分子頂點及頂點之間的相互作用對分子性質的貢獻不同,同類型的分子頂點及頂點之間的相互作用對分子性質的貢獻具有加和性。因此我們首先需將分子內的非氫原子進行分類,分子內的非氫原子依據(jù)其所連接的其它非氫原子數(shù)分為A1、A2、A3、A4四類,分別表示與1、2、3、4個其它非氫原子相連,如與兩個非氫原子相連的仲碳原子屬于A2原子類型。
對于分子頂點本身對分子性質的貢獻。本文引入了Hall和Kier[4]所提出的原子固有狀態(tài)(I),并對文獻的計算方法進行了一定的修正,得到了所謂的分子頂點矢量,用于表征分子頂點自身的狀態(tài)對分子性質的影響。其計算式如下:
上式中,xi表示分子中頂點原子類型為i的所有頂點原子的貢獻值,νi是頂點原子類型為i的原子價電層的電子數(shù);ni為該原子價電層所屬的主量子數(shù)是該原子參與成σ和π鍵的總電子數(shù)為成σ鍵的電子數(shù)。如單個CSP、、在分子中的頂點貢獻值分別是2.5000、1.6667、1.2500。根據(jù)頂點原子的分類,分子中最多含四類原子,則每個分子將最終得到四個頂點矢量,分別記為x1、x2、x3和x4。
對于分子頂點間的相互作用對分子性質的貢獻。頂點之間的相互作用與頂點原子電性及相隔距離密切相關。一般而言,依據(jù)庫侖定律,電性越大、距離越小,相互作用就越大。本文借鑒文獻[5-8]的表征方法來表征分子頂點間的相互作用對分子性質的貢獻,即化合物分子中四類頂點原子發(fā)生相互作用可以組合出以下幾種方式:m11、m12、m13、m14、m22、m23、m24、m33、m34、m44,分別記為x5、x6、x7、x8、x9、x10、x11、x12、x13、x14十個頂點相互作用矢量。各元素可按下式計算:
Z為頂點原子相對于C原子的相對電負性,如O的相對電負性為3.44/2.55=1.3490;rij是原子i、j之間的相對距離(即所經最短途徑相對于碳碳單鍵的相對鍵長之和),n和l為原子所屬類型。
這樣對于每一個有機化合物分子,將有十四個變量來描述其結構信息。與文獻[5-8]相比,像CH4、NH3等只有單個頂點的分子結構信息將可以得到表達。將樣本分子的頂點原子按原子屬性及連接方式輸入到自編C語言程序加以處理,得到所有樣本分子的十四個矢量值。
由于變量數(shù)較多,并且變量之間可能存在著共線性,因此對變量進行篩選并且使樣本數(shù)/變量數(shù)符合N/n≧5的經驗規(guī)則,尋找最佳變量組合就顯得尤為必要。本文采用SPSS統(tǒng)計處理軟件對變量作逐步回歸(SMR)分析。為控制模型穩(wěn)定性和消除變量間共線性影響,對每步變量計算方差膨脹因子(VIF)[9]。VIF定義為:VIF=(1-r2)-1,式中r為某自變量與其他變量相關程度(經自由度校正)。VIF為1.0,表示各變量間無相關性;VIF值在1.0~10.0間,表示變量間無明顯共線性,相關方程可接受;VIF值大于10,相關方程不可靠。
逐步回歸(SMR)分析發(fā)現(xiàn)當7個變量入選模型時,建模復相關系數(shù)R、標準偏差SD、留一法交互檢驗復相關系數(shù)RCV及標準偏差SDCV同時達到理想值,此時變量之間也不存在明顯共線性(VIF最大值為9.90),并且符合N/n≧5的經驗規(guī)則。7變量模型如下:
模型擬合:n=55,m=7,R=0.990,SD= 1.325,F(xiàn)M1=324.673;
LOO檢驗:RCV=0.983,SDCV=1.696,F(xiàn)CV= 195.533
圖1 模型估計及預測值與實驗值相關圖Fig.1 Plot of estimated values and predicted values vs.experimental values
化合物的色譜保留時間與頂點間的相互作用存在良好的線性關系[8,10],而本研究中頂點矢量及頂點相互作用矢量在模型中均有體現(xiàn),并且發(fā)現(xiàn)在逐步回歸中x11首先被引入模型,說明化合物的色譜保留時間的確也受到分子頂點自身所處狀態(tài)的影響。而上述模型對所有樣本在文獻所述條件下的氣相色譜保留時間進行了估計和預測,結果列于表1的Cal及Pre(cv)欄。模型估計值及留一法交互檢驗值對實驗值作圖及殘差分布分別見圖1及圖2。
圖2 模型估計及預測誤差分布圖Fig.2 Plot of estimated and predicted residuals scattered
由圖1可以看出,幾乎所有樣本點都落在45°的對角線上或附近,由圖2容易發(fā)現(xiàn)大部分樣本點的估計與留一法檢驗誤差落在2SD(圖中虛線)以內。在模型擬合中只有1個樣本點(1.8%)、留一法交合檢驗中只有4個樣本點(7.3%)落在2SD外,說明模型的具有良好的穩(wěn)定性和預測能力,估計的準確性較高。需要進一步說明的是,本文所研究的樣本為來自天然產物的復雜樣本體系,分子結構跨度大(包括烷烴、環(huán)烷烴、烯烴、醇、酸和酯等,并且還含有N、O等雜原子)。對于這樣復雜的樣本,本文所取得的結果應是滿意的。
化合物在色譜柱上的保留行為與它們同固定相之間的相互作用有關。當固定相一定時,這種相互作用的程度大小將直接與化合物的組成、化學結構、鍵合狀態(tài)和電性特征相關。從本文的研究結果可以看出,提出的頂點及頂點相互作用矢量能很好地表征化合物的組成、化學結構、鍵合狀態(tài)和電性特征。描述參數(shù)取值完全來自分子本身,具有計算過程簡單,結果精度高等優(yōu)點。本文取得的良好結果對于天然藥物中揮發(fā)性有機化合物等復雜樣本的QSRR研究具有一定的參考價值。
1 Zhou P(周鵬),Mei H(梅虎),Tian FF(田菲菲),et al.Novel generalized correlative index used to carry out research in Quantitative Structure-retention Relationship for some persistent organic pollutants.Chin J Anal Chem(分析化學), 2006,34:1096-1100.
2 Zhang T(張婷),Liang YZ(梁逸曾),Zhao CX(趙晨曦),et al.Prediction of temperature-programmed retention indices from molecule structures.Chin J Anal Chem(分析化學),2006,34:1607-1610.
3 Guan YY(官艷麗),Dawa ZM(達娃卓瑪),Gesang SL(格桑索朗),et al.Study on essential oil from flowers of Meconopsis integrifolia.Chin Pharm J(中國中藥雜志),2007,42:539-540.
4 Hall LH,Kier LB.Electrotopological state index for atom types:a novel combination of electronic,topological,and valence state information.J Chem Inf Comput Sci,1995,35: 1039-1045.
5 Liu SS,Yin CS,Cai SX,et al.Molecular structural vector description and retention index of polycyclic aromatic hydrocarbons.Chem Intell,2002,61:3-15.
6 Sun LL,Zhou Y,Li GR,et al.Molecular electronegativitydistance vector(MEDV-4):a two-dimensional QSAR method for the estimation and prediction of biological activities of estradiol derivatives.J Mol St-Th,2004,679:107-113.
7 Zhou Y,Sun LL,Mei H,et al.Estimation and prediction of relative retention indices of polychlorinated naphthalenes in GC with molecular electronegativity distance vector.Chromatographia,2006,64:565-570.
8 Liao LM,Mei H,Li JF,et al.Estimation and prediction on retention times of components from essential oil of Paulownia tomentosa flowers by molecular electronegativity-distance vector(MEDV).J Mol St-Th,2008,850:1-8.
9 Sutter JM,Peterson TA,Juts PC.Prediction of gas chromatographic retention indices of alkylbenzenes.Anal Chim Acta,1997,342:113-122.
10 Liao LM(廖立敏),Mei H(梅虎),Li JF(李建鳳),et al.Prediction on retention times of components from essential oil of Tilia mongolica leaves by H-MEDV.Nat Prod Res Dev(天然產物研究與開發(fā)),2008,20:47-51.
Quantitative Structure-Retention Relationship(QSRR)of Volatile Constituents of Meconopsis integrifolia Franch
LAN Zuo-ping1,2,LIAO Li-min3,LIU Yu1,YU Yu1*1College of Pharmacy Chongqing Medical University,Chongqing 400016;2Chongqing Pharmaceutical College,Chongqing 400030,China;3College of Resource and Environment Science,Neijiang Normal University,Neijiang 641112,China
The concept of vectors of vertexes and their interaction were proposed to characterize the molecular structure of complicated samples.Through stepwise multiple regression(SMR),a model with 7 variables could be obtained by multiple linear regression(MLR).The correlation coefficient(R)of the model was 0.990 and the standard deviation(SD) was 1.325.Then the model was evaluated by the cross validation with the leave-one-out(LOO)procedure and the correlation coefficient(RCV)of 0.983 and standard deviations(SDCV)of 1.696 were obtained.The results showed that the vectors were superior in molecular structural characterization.The stability and predictability of the model was satisfactory.
Meconopsis integrifolia Franch;volatile organic compounds(VOC);structural descriptor;quantitative structure-retention relationship(QSRR)
1001-6880(2011)06-1091-05
2010-06-07 接受日期:2010-12-06
重慶市衛(wèi)生局醫(yī)學科研資助項目(2009-2-134);四川省教育廳青年基金項目(09ZB036)
*通訊作者 Tel:86-23-68485983;E-mail:yuyu3519@163.com.
O657.7
A