仝建波, 徐夏夢, 陳 洋, 程芳玲, 杜經(jīng)武
(陜西科技大學(xué) 化學(xué)與化工學(xué)院, 陜西 西安 710021)
聚合物作為材料科學(xué)的重要研究內(nèi)容[1],在日常生活中的應(yīng)用越來越廣泛,對其一些重要性質(zhì)的測試非常重要,通過實驗方法對其進行一一測試已不太現(xiàn)實,建立其分子結(jié)構(gòu)與化合物性質(zhì)之間的定量關(guān)系并藉此預(yù)測其它化合物的性質(zhì)[2,3],長期以來一直是化學(xué)家、藥學(xué)家和環(huán)境科學(xué)家所關(guān)注的研究領(lǐng)域.眾所周知,折射率n是真空中的光速與該物質(zhì)中的光速之比,它是聚合物的一種基本光學(xué)性質(zhì)[4],直接與其他的光學(xué)、電學(xué)和磁學(xué)性質(zhì)(比如電導(dǎo)、絕對介電率、磁化率等)相聯(lián)系.折射率被廣泛用于材料科學(xué)[5,6],它可以指示出一種聚合物能否應(yīng)用于特定目的.因而建立聚合物折射率的定量結(jié)構(gòu)性質(zhì)關(guān)系,不僅有助于深入了解聚合物結(jié)構(gòu)性質(zhì)間的關(guān)系,也有重要的實用價值,尤其對尚未合成出來的聚合物.具體以部分非共軛聚合物單體為研究對象[7],獲得其折射率性質(zhì)參數(shù),利用分子電性作用矢量表征分子結(jié)構(gòu),建立非共軛聚合物與折射率間關(guān)系,并預(yù)測聚合物及其性質(zhì),取得了較好的結(jié)果.
取121種非共扼聚合物為樣本[7],包括聚烯烴、聚(甲基)丙烯酸酯、聚苯乙烯、聚醚、聚酞胺、聚碳酸酯等.因為折射率受到溫度的影響,故所有589 nm處的折射率的實驗值都是在室溫條件下測定的.由于聚合物的原子數(shù)目巨大,且分子量的不確定性,對其整體結(jié)構(gòu)的描述難以實現(xiàn),因此用聚合物的單體作為替代模型結(jié)構(gòu)來進行描述,并與其折射率間建立關(guān)系,以得到一個穩(wěn)定性較好的數(shù)學(xué)模型.
分子電性作用矢量是在分子電性距離矢量[8,9]的基礎(chǔ)上改進后,提出的更能準(zhǔn)確、全面反映二維分子結(jié)構(gòu)的一種描述子.下面介紹幾個相關(guān)概念.原子類型:有機分子常見原子為H、C、N、O、S、F、Cl、Br、I等其大都處于元素周期表中ⅠA、ⅣA、ⅤA、ⅥA、ⅦA族.按照周期表族的定義,同一族的元素具有相似的化學(xué)性質(zhì),因此將原子按其所處周期表的族進行分類是較為簡單且化學(xué)意義明確的做法.由此將有機物中常見原子分為5類(1:H;2:C;3:N、P;4:O、S;5:F、Cl、Br、I);原子相對電性(ARE):通常將分子中的原子看作是沒有體積且?guī)в须姾傻馁|(zhì)點,原子之間通過化學(xué)鍵傳遞電性而發(fā)生相互作用.此外,參照定義電負(fù)性是指不同原子吸引電子能力的相對大小,其在一定程度上反映了分子內(nèi)部電荷分布情況.因此,這里使用Pauling電負(fù)性作為原子的電性標(biāo)度,進一步規(guī)定計算中取原子的ARE值,即原子相對于碳原子Pauling電負(fù)性的比值.例如氧原子相對電性為:AREO=PEO/PEC=1.349 0.原子相對鍵距:由于分子中原子的相互作用是隨其連接距離的增加而迅速減小,因此可以將原子的作用距離看作是連接它們的最短鍵距而忽略其它連接路徑.為達(dá)到數(shù)據(jù)統(tǒng)一目的,這里仿照ARE處理辦法將C-C單鍵鍵長視為分子電性作用矢量的標(biāo)準(zhǔn)鍵長,而其它化學(xué)鍵鍵長與其比值就為相對鍵長(RBL).例如C-O單鍵相對鍵長為:RBLC-O=BLC-O/BLC-C=0.928 6.進一步將分子中原子相對鍵距定義為連接兩原子最短路徑中所有化學(xué)鍵RBL之和.
分子體系中原子是以帶有一定數(shù)量電荷的微觀質(zhì)點形式存在,電荷之間相互作用構(gòu)成分子內(nèi)部結(jié)構(gòu)特征支配方式.而這種分子內(nèi)部微觀作用又以相應(yīng)物化性質(zhì)在物質(zhì)宏觀狀態(tài)上表現(xiàn)出來.描述點電荷相互作用基本公式為庫侖定律.利用該定律可表達(dá)分子內(nèi)部電荷作用方式.本研究通過將常見原子類型按元素周期表的族劃分為5類,由于具有不同化學(xué)性質(zhì)的各類原子之間相互作用所產(chǎn)生的效果必然有所差異,因此將各類作用情況視為不同的描述分量加以區(qū)分.最終得到15個分子電性作用矢量描述子表示為1-1、1-2、1-3、1-4、1-5、2-2、2-3、2-4、2-5、3-3、3-4、3-5、4-4、4-5、5-5原子作用方式.其計算如下:
(1)
式中k、l是指原子類型(共5類),原子i、j分別屬于第k類原子和第l類原子;ARE為原子相對電性大??;ARBij表示原子i、j之間的距離(以相對鍵長表示),是從原子i通過一個或多個化學(xué)鍵連接到原子j的所有路徑中各個相對鍵長加和的最小值.MEIV共有15個元素(或稱15個結(jié)構(gòu)描述子):v11、v12、v13、v14、v15、v22、v23、v24、v25、v33、v34、v35、v44、v45、v55簡寫成X1、X2、X3、X4、X5、X6、X7、X8、X9、X10、X11、X12、X13、X14、X15.
選用的121個非共軛聚合物及其折射率的實驗值取自文獻(xiàn).建立的多元線性回歸方程是對樣本的統(tǒng)計分析,模型的擬合能力和預(yù)測能力可以用一些統(tǒng)計指標(biāo)來評價.擬合能力的評價指標(biāo)有復(fù)相關(guān)系數(shù)Rcum、標(biāo)準(zhǔn)偏差SD、統(tǒng)計量F等.模型Rcum和F越高,SD越小,模型的擬合能力越強.對于建立多元線型回歸模型的最終目的是預(yù)測未知化合物的性質(zhì),因此模型的預(yù)測能力比擬合能力更為重要.模型的擬合能力強并不等于預(yù)測能力也強,有時甚至?xí)苋?,這就是所謂的過擬合現(xiàn)象.因此定量構(gòu)效關(guān)系模型的驗證是構(gòu)效關(guān)系研究中不可或缺的重要環(huán)節(jié).其中留一法的復(fù)相關(guān)系數(shù)Rcum是目前使用較廣的一種,然而Tropsha[10-12]等提出:Rcum值的大小與模型預(yù)測能力并無多大關(guān)系,評價模型的預(yù)測能力可以用Qext來衡量[13,14]:
(2)
圖1 96個訓(xùn)練集中非共軛聚合物逐步回歸Rcun與RCV
當(dāng)m=11時,RCV出現(xiàn)最大值(0.884),SDCV保持最小值(1.308),此時模型最為穩(wěn)定且具有對外部樣本最佳的預(yù)測能力(如圖1所示).通過以上分析,可知選用11個變量建立方程最好,其模型為:
Y=1.482-0.025×X1+0.010×X2-0.008×X3+0.012×X4+0.044×X5+0.026×X6+0.002×X7-0.003×X8+0.018×X9-0.004×X10+0.009×X11
N= 97Rcum=0.916SD=0.021F=36.707
運用上述模型預(yù)測97個訓(xùn)練集及24測試集樣本的折射率,將計算結(jié)果與實驗值進行對比(如圖2所示).
圖2 MLR模型對97個內(nèi)部樣本集估計值及對24個外部樣本集預(yù)測值與實驗值相關(guān)情況
模型的驗證是QSPR研究中不可或缺的重要環(huán)節(jié).對于一個優(yōu)秀的模型,不但要求其對內(nèi)部樣本有較好的估算結(jié)果,更應(yīng)當(dāng)對外部樣本有較強的預(yù)測能力.內(nèi)部采用留一法檢驗,其復(fù)相關(guān)系數(shù)(Rcum)為0.916;對外部樣本的預(yù)測能力用Qext來衡量,Qext=0.923.內(nèi)外部檢驗的結(jié)果均表明,所建立模型的精確性和穩(wěn)定性較好且計算簡單、易懂.
利用分子電性作用矢量建立的模型,通過原子的相對電負(fù)性和相對距離去描述部分非共軛聚合物的分子結(jié)構(gòu),計算簡單,結(jié)構(gòu)參數(shù)的取值完全來自分子本身的結(jié)構(gòu),不需要加入任何經(jīng)驗性的性質(zhì)參數(shù)或校正參數(shù),較為客觀.通過計算所得的11個MEIV描述子與其折射率呈高度相關(guān),結(jié)果表明用MEIV建立的定量結(jié)構(gòu)性質(zhì)關(guān)系模型的預(yù)測能力良好.
[1] 許 杰.聚合物光子學(xué)材料的定量結(jié)構(gòu)-性質(zhì)關(guān)系研究及其在光纖波導(dǎo)設(shè)計中的應(yīng)用[D].合肥:中國科學(xué)技術(shù)大學(xué),2006:17-20.
[2] 仝建波,王 平,李云飛,等.咪唑衍生物類抗艾滋病藥物3D-QSSR研究[J].原子與分子物理學(xué)報,2011,28(1):41-46.
[3] 仝建波,車 挺,李云飛,等.部分有機物蝌蚪麻醉活性的預(yù)測[J].原子與分子物理學(xué)報,2011,28(2):208-212.
[4] 徐聰恩,馮 俊.玻璃材料折射率及色散的高準(zhǔn)確測量[J].上海計量測試,2012,229(3):18-23.
[5] 胡金兵,陳家璧,梁斌明,等.基于正折射率材料的一維負(fù)折射率光子晶體[J].應(yīng)用激光,2012,32(1):65-69.
[6] 靳 偉,馬 紅,孫宇航,等.基于Matlab的棱鏡折射率的測定實驗的數(shù)據(jù)處理[J].西安郵電學(xué)院學(xué)報,2011,16(S2):107-110.
[7] Xu J,Chen B,Zhang Q J,et al.Prediction of refractive indices of linear polymers by a four-description QSPR model[J].Poylmer,2004,45(26):8 651-8 659.
[8] Liu S S,Cai S X,Cao C Z,et al.Molecular electronegative distance vector (MEDV) related to 15 properties of alkanes[J].J.Chem.Inf.Comput.Sci,2000,40(6):1 337-1 348.
[9] 仝建波,李云飛,劉淑玲,等.分子電性作用矢量法取代芳烴的構(gòu)效關(guān)系研究[J].原子與分子物理學(xué)報,2010,27(5):839-843.
[10]哈力旦 A,吳成柯,方 勇.多描述編碼技術(shù)的新發(fā)展[J].中國圖象圖形學(xué)報,2005,10(3):275-280.
[11]Tropsha A,Gramatica PG, ombar V K. The importance of being earnest: Validation is the absolute essential for successful application and inerpretation of QSPR models[J].QSAR Comb. Sci., 2003,22(1):69-77.
[12]Gramatica P, Pilutti P, Papa E. Validated QSAR prediction of OH tropospheric degradation of VOCs:Splitting into training-test sets and consensus modeling[J]. J. Chem. Inf. Comput. Sci., 2004, 44(5):1 794-1 802.
[13]仝建波,曾 暉,張生萬,等.原子電性距離矢量用于萜類化合物核磁共振碳譜的QSSR研究[J].原子與分子物理學(xué)報,2007,24(2):374-378.
[14]仝建波,李云飛,劉淑玲,等.分子電性作用矢量法用于硝基苯類化合物的毒性研究[J]. 原子與分子物理學(xué)報,2010,27(6):1 040-1 044.