李梅蘭, 李 仲( .青海大學(xué) 化工學(xué)院,青海 西寧 8006; .青海民族大學(xué) 物理與電子信息工程學(xué)院,青海 西寧 80007)
?
有機(jī)羧酸pKa的定量結(jié)構(gòu)—性質(zhì)關(guān)系
李梅蘭1, 李 仲2
( 1.青海大學(xué) 化工學(xué)院,青海 西寧 810016; 2.青海民族大學(xué) 物理與電子信息工程學(xué)院,青海 西寧 810007)
應(yīng)用物質(zhì)結(jié)構(gòu)-性質(zhì)關(guān)系(QSPR)方法研究了 34 種羧酸pKa與分子描述符之間的定量關(guān)系,采用DRAGON 5.4軟件和HyerChem7計(jì)算了34種羧酸分子的568種結(jié)構(gòu)類參數(shù)和12種量子化學(xué)參數(shù)。根據(jù)偏差權(quán)重法篩選出61種結(jié)構(gòu)描述符,采用多元逐步回歸分析建立了34種羧酸結(jié)構(gòu)-性質(zhì)關(guān)系,得到最佳方程。方程相關(guān)系數(shù)R=0.990,標(biāo)準(zhǔn)偏差S=0.170。且有F>Fα,表明方程回歸效果顯著;對(duì)回歸系數(shù)的t檢驗(yàn)結(jié)果均有Sig<0.05,表明6個(gè)參數(shù)對(duì)pKa影響顯著?!爸鹨惶蕹苯徊骝?yàn)證的結(jié)果證明模型具有良好的穩(wěn)定性和較強(qiáng)的預(yù)測(cè)能力。6個(gè)參數(shù)物理意義及其對(duì)pKa影響的深入分析表明,其中羧基中氫原子凈電荷(QH)和羧基中非羥基氧原子凈電荷(Q=O)是影響羧酸強(qiáng)度的關(guān)鍵因素。
羧酸; pKa; DRAGON; 密度泛函; 定量結(jié)構(gòu)性質(zhì)關(guān)系
1.1 分子結(jié)構(gòu)類參數(shù)的計(jì)算、刪減與合并
采用DRAGON5.4(2006)軟件計(jì)算34種羧酸化合物分子結(jié)構(gòu)類參數(shù)[11]。根據(jù)羧酸分子結(jié)構(gòu)信息特點(diǎn),本文選定結(jié)構(gòu)組成描述符、拓?fù)涿枋龇?、連接性指數(shù)、特征值指數(shù)、徑向分布函數(shù)描述符、3D-MoRSE描述符及電荷描述符7類568種結(jié)構(gòu)類參數(shù)。計(jì)算方法步驟:首先將34種樣本羧酸化合物結(jié)構(gòu)輸入Hyperchem 7程序中,采用分子力學(xué)方法MM+進(jìn)行初步優(yōu)化,在此基礎(chǔ)上用半經(jīng)驗(yàn)量子化學(xué)方法AM 1繼續(xù)優(yōu)化,用HF/6-31*進(jìn)一步進(jìn)行兒何優(yōu)化,最后將優(yōu)化好的分子結(jié)構(gòu)輸入Dragon 5.4程序中計(jì)算化合物的各種結(jié)構(gòu)參數(shù)。通過計(jì)算,每個(gè)化合物均得到568種結(jié)構(gòu)參數(shù)。
如此眾多的分子結(jié)構(gòu)參數(shù),在進(jìn)行變量篩選之前要事先進(jìn)行刪減,剔除那些不能為模型提供有用信息的參數(shù),通常采用偏差權(quán)重法,即根據(jù)標(biāo)準(zhǔn)偏差大小來作為剔除的依據(jù)。例如,有些參數(shù)對(duì)所有化合物來說數(shù)值為常數(shù)(包括為零)或者變化較小,即標(biāo)準(zhǔn)偏差很小,顯然無法有效表征結(jié)構(gòu)的差異性,因此被刪除。另外,對(duì)于參數(shù)間相關(guān)系數(shù)大于0.90以上的任意2個(gè)結(jié)構(gòu)參數(shù),由于存在“共線性”,因此其中之一也應(yīng)被刪除。值得指出的是,還有一些結(jié)構(gòu)參數(shù),如結(jié)構(gòu)組成描述符中的MW(molecular weight)、nAT(number of atoms) 、nSK(number of non-H atoms) 、nBT(number of bonds) 、nBO(number of non-H bonds)等,這些參數(shù)顯然不能區(qū)分異構(gòu)體,不能為模型提供有用信息,因而也必須刪減。
最后,經(jīng)過刪減合并壓縮,7類61種結(jié)構(gòu)參數(shù)進(jìn)行下一步的特征變量篩選。
1.2 量子化學(xué)參數(shù)計(jì)算
在用HF/6-31*對(duì)羧酸分子進(jìn)一步進(jìn)行兒何構(gòu)型全優(yōu)化的基礎(chǔ)上,利用Hyperchem 7中的密度泛函程序在DFT-B3LYP/6-31G*水平下進(jìn)行羧酸化合物分子電子結(jié)構(gòu)和QSAR模塊計(jì)算。獲得分子總能量ET、分子最高占據(jù)軌道能(HOMO)、分子最低空軌道能(LUMO)、羧基中非羥基氧原子凈電荷(Q=O)、羧基中氫原子凈電荷(QH)、羧基碳原子凈電荷(QC)、分子偶極矩、水合能、分子平均極化率、脂水分配系數(shù)、分子表面積及分子體積共計(jì)12種量子化學(xué)參數(shù)數(shù)據(jù)。
由于Hyperchem 7對(duì)原子序數(shù)35號(hào)以上重原子(含Br)不能進(jìn)行DFT-B3LYP/6-31G*水平計(jì)算,因此這里只對(duì)34種取代羧酸進(jìn)行了電子結(jié)構(gòu)和QSAR模塊計(jì)算。
1.3 特征變量的篩選與預(yù)測(cè)模型的建立
傳統(tǒng)史觀認(rèn)為,人民群眾是歷史的創(chuàng)造者,歷史大勢(shì)是不可遏制的,不被個(gè)人左右的。但在《午夜的孩子》里,個(gè)人的行動(dòng)改變了歷史走向。薩里姆的介入影響甚至左右了巴基斯坦的歷史進(jìn)程?!逗菲垦菥毜男袆?dòng)》一章中,薩利姆參加扎菲爾姨父的晚宴,并幫助姨父用辣椒罐等器皿來代替各種勢(shì)力,進(jìn)行策劃1958年的軍事政變事的布陣。之后,陪同姨父逮捕了米爾扎總統(tǒng)并將其趕出巴基斯坦,得到后來出任巴基斯坦總統(tǒng)的阿尤布·汗將軍的賞識(shí),從而使薩利姆認(rèn)識(shí)到了自己對(duì)民族歷史的影響“我不僅顛覆了一個(gè)政府,而且將一個(gè)總統(tǒng)送到了流亡之鄉(xiāng)”。
QSPR建模的關(guān)鍵就是要選擇出與預(yù)測(cè)性質(zhì)關(guān)聯(lián)程度高的分子描述符,因此必須對(duì)候選特征變量進(jìn)行篩選。將已經(jīng)選出的61種結(jié)構(gòu)參數(shù)和12種量子化學(xué)參數(shù),即共計(jì)73種候選特征變量數(shù)值與34種羧酸的pKa實(shí)驗(yàn)值進(jìn)行逐步回歸分析[12],據(jù)此篩選出6個(gè)特征變量,并建立了預(yù)測(cè)羧酸強(qiáng)度的多元線性回歸方程。34種羧酸的6個(gè)特征變量值及實(shí)驗(yàn)值pKa,obs.參見表1。逐步回歸分析是采用SPSS13.0統(tǒng)計(jì)分析軟件包計(jì)算完成的[13]。
2.1 預(yù)測(cè)模型與結(jié)果
預(yù)測(cè)羧酸強(qiáng)度的多元線性回歸方程如下:
pKa=69.074-35.333Q=O-199.723QH-2.5×10-6ET-1.761RDF20V+0.076SS-.548X3
(15.608-17.628-16.697-7.752-8.1373.816-5.5950.0000.0000.0000.0000.0000.0010.000-0.714?-1.198?-0.400?-0.414?0.241?-0.291?)
R=0.990(R2=0.979)S=0.170602F=212.324 (Sig=0.000)n=34
式中:R表示相關(guān)系數(shù);S表示標(biāo)準(zhǔn)偏差;F是Fisher檢驗(yàn)值(α=0.05,Sig為檢驗(yàn)概率);n是樣本容量。方程下括號(hào)的內(nèi)容,按行計(jì)依次為t檢驗(yàn)值、檢驗(yàn)概率及標(biāo)準(zhǔn)回歸系數(shù)(星號(hào)*表示)。
從方程給出的統(tǒng)計(jì)檢驗(yàn)參數(shù)來看,F(xiàn)=212.324≥Fα(6/27)=2.46,F檢驗(yàn)通過(Sig<0.05),說明總體上看方程有意義;所有系數(shù)t檢驗(yàn)通過(Sig<0.05),說明方程中所有系數(shù)有意義,對(duì)pKa的影響是顯著的,顯然這正是逐步回歸分析的必然結(jié)果。
從方程給出的相關(guān)系數(shù)和標(biāo)準(zhǔn)偏差來看,相關(guān)系數(shù)高達(dá)0.990,且S僅為0.170,說明進(jìn)入模型中的6個(gè)特征參變量與羧酸酸強(qiáng)度關(guān)聯(lián)程度很高,方程可以用于羧酸強(qiáng)度的預(yù)測(cè)。由方程預(yù)測(cè)的pKa,cal.值與偏差Δ見表1。圖1給出了預(yù)測(cè)pKa,cal.的非標(biāo)準(zhǔn)化數(shù)值和實(shí)驗(yàn)值pKa,obs.的關(guān)系圖,由圖可以看出,兩者符合得很好。經(jīng)計(jì)算,預(yù)測(cè)平均絕對(duì)差僅為0.117,預(yù)測(cè)精度是很高的。與文獻(xiàn)中的類似研究工作相比,本文方法的預(yù)測(cè)精度比拓?fù)渲笖?shù)提取羧酸分子結(jié)構(gòu)特征建立關(guān)聯(lián)其強(qiáng)度預(yù)測(cè)方程的精度要高一些[7-9]。例如,文獻(xiàn)[9]中利用電拓?fù)錉顟B(tài)指數(shù)En及價(jià)分子連接性指數(shù)mXv,建立了有機(jī)羧酸pKa與拓?fù)渲笖?shù)的7元指數(shù)的7元回歸數(shù)學(xué)模型,其相關(guān)系數(shù)僅為0.967;自定義分子樹拓?fù)渲笖?shù)建立羧酸化合物pKa值的7元回歸定量模型[7],其相關(guān)系數(shù)也只是達(dá)到0.9871。與文獻(xiàn)[4]中使用拓?fù)鋮?shù)、量子化學(xué)電子參數(shù)等20種變量建立的7元回歸方程(R=0.957,F=46.49,S=0.305)相比, 本文方法的預(yù)測(cè)精度明顯地高一些。
表1 34種羧酸的部分結(jié)構(gòu)參數(shù)、pKa和預(yù)測(cè)誤差
圖1 pKa的實(shí)驗(yàn)值與預(yù)測(cè)值的線性關(guān)系
2.2 模型檢驗(yàn)
從殘差分布圖2可以看出,基本呈正態(tài)分布,表明參與回歸建模的多元數(shù)據(jù)滿足正態(tài)性經(jīng)典統(tǒng)計(jì)學(xué)的基本假定。由于研究的樣本容量較小(34個(gè)),進(jìn)一步還可以采用“逐一剔除”的方法[14]驗(yàn)證模型穩(wěn)定性。即每次剔除一個(gè)化合物,剩余的33個(gè)化合物建模,求其相關(guān)系數(shù),結(jié)果為等于0.992的有1個(gè),0.991有3個(gè),0.990有13個(gè),0.989有15個(gè),0.988有2個(gè),平均值為0.989 6,與0.990十分接近,所以該模型中不存在有顯著影響的異常值,模型中不存在隨機(jī)相關(guān),有可以被接受的總體穩(wěn)定性,所建回歸模型是穩(wěn)定有效的,6個(gè)特征變量可以用于羧酸強(qiáng)度變化規(guī)律解析。
圖2 34種羧酸的pKa殘差分布圖
2.3 影響羧酸強(qiáng)度因素分析
比較標(biāo)準(zhǔn)回歸系數(shù)大小可以得出預(yù)測(cè)34種羧酸強(qiáng)度各個(gè)因素的重要程度。方程中,標(biāo)準(zhǔn)回歸系數(shù)大小(取絕對(duì)值)依次為1.198(QH)、0.714(Q=O)、0.414(RDF20V)、0.400(ET)、0.291(X3)、0.241(SS)。表明對(duì)于34種羧酸強(qiáng)度預(yù)測(cè),量子化學(xué)參數(shù)中的羧基中氫原子凈電荷(QH)和羧基中非羥基氧原子凈電荷(Q=O),標(biāo)準(zhǔn)回歸系數(shù)最大,是影響羧酸強(qiáng)度的關(guān)鍵因素。這不難理解。羧酸的酸性受取代基多種電子效應(yīng)的影響,如誘導(dǎo)效應(yīng)、共軛效應(yīng)及場(chǎng)效應(yīng)等,最后反映到QH和Q=O上。顯然,Q=O較低,而QH較高,則意味著—O—H鍵極性加大 ,氫原子也就容易離解,羧酸酸性也就強(qiáng)(pKa低)一些了。這與文獻(xiàn)[1]中得出的羧酸的酸性可用QH來衡量,是羧酸酸性變化的主要因素的結(jié)論是完全一致的。當(dāng)然作為與分子穩(wěn)定性有關(guān)的量子化學(xué)參數(shù)總能量ET,顯然也是影響羧酸酸性的一個(gè)因素。3個(gè)結(jié)構(gòu)類參數(shù)RDF020V、X3及SS在逐步回歸建模時(shí)順利進(jìn)入方程,表明它們也是影響羧酸強(qiáng)度的因素,只是標(biāo)準(zhǔn)回歸系數(shù)小一些,說明結(jié)構(gòu)參數(shù)的重要性低一些。但正是這3個(gè)結(jié)構(gòu)參數(shù),包含羧酸分子中各取代基的電負(fù)性、電拓?fù)錉顟B(tài)及分子空間結(jié)構(gòu)等重要結(jié)構(gòu)組成信息,它們體現(xiàn)出的空間結(jié)構(gòu)因素,和量子化學(xué)參數(shù)體現(xiàn)出的電子效應(yīng)因素共同作用的結(jié)果決定羧酸強(qiáng)度。因此從物理意義來講,篩選出的3個(gè)量子化學(xué)參數(shù)和3個(gè)結(jié)構(gòu)類參數(shù)能很好地關(guān)聯(lián)羧酸強(qiáng)度,從而可以建立高精度的預(yù)測(cè)羧酸強(qiáng)度方程。
其實(shí)在羧酸強(qiáng)度的 QSPR研究中,已經(jīng)看到單一的量子化學(xué)法或分子拓?fù)渲笖?shù)法提取羧酸分子結(jié)構(gòu)特征,往往得不到精度高的預(yù)測(cè)模型。這是因?yàn)榱孔踊瘜W(xué)參數(shù)注重分子局部電子結(jié)構(gòu)特征細(xì)節(jié),如各取代基復(fù)雜的電子效應(yīng)的描述,不能直接概括出分子幾何結(jié)構(gòu)特征,缺乏對(duì)分子整體的描述;而以分子結(jié)構(gòu)和價(jià)態(tài)理論為基礎(chǔ)的拓?fù)渲笖?shù)類參數(shù),注重原子價(jià)態(tài)、結(jié)合順序、分枝及分子形狀等分子空間結(jié)構(gòu)的描述,對(duì)分子局部電子結(jié)構(gòu)特征細(xì)節(jié)不能表征。正是由于表征分子各取代基復(fù)雜的電子效應(yīng)與空間結(jié)構(gòu)因素分開考慮,即沒有考慮影響性質(zhì)的電子效應(yīng)和空間結(jié)構(gòu)因素的共同作用,從而導(dǎo)致建立的預(yù)測(cè)羧酸強(qiáng)度模型精度不高。
應(yīng)用QSPR原理研究 34 種羧酸pKa與分子描述符之間的定量關(guān)系。采用DRAGON 5.4軟件和HyerChem7計(jì)算了34種羧酸分子的568種結(jié)構(gòu)類參數(shù)和12種量子化學(xué)參數(shù)。根據(jù)偏差權(quán)重法等篩選出61種結(jié)構(gòu)描述符。采用多元逐步回歸分析建立了預(yù)測(cè)34種羧酸pKa的最佳方程。模型經(jīng)多種方法驗(yàn)證,表明具有良好的穩(wěn)定性和較強(qiáng)的預(yù)測(cè)能力。進(jìn)入方程中的6個(gè)參數(shù),經(jīng)物理意義及其對(duì) pKa影響的深入分析表明,其中的量子化學(xué)參數(shù)QH和Q=O標(biāo)準(zhǔn)回歸系數(shù)最大,是影響羧酸強(qiáng)度的關(guān)鍵因素,而3個(gè)結(jié)構(gòu)類參數(shù)體現(xiàn)出的空間結(jié)構(gòu)因素和量子化學(xué)參數(shù)體現(xiàn)出的電子效應(yīng)因素共同作用的結(jié)果決定羧酸強(qiáng)度。
[1] 李 仲. 硝基苯化合物生物毒性的定量構(gòu)效關(guān)系研究[J].河南師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2010,38(5):135-138.
[2] Karelson M, Lobanov V S, Katritzky A R. Quantum-chemical descriptors in QSAR/QSPR studies[J].Chem Rev, 1996,96:1027-1043.
[3] 舒元梯. 飽和一元羧酸物理化學(xué)性質(zhì)的定量探討[J]. 樂山師范學(xué)院報(bào),2002,17(4):26-29.
有顯著的差異。同時(shí),選用化學(xué)惰性的全氟代的溶劑對(duì)樣品以及質(zhì)譜結(jié)果的影響能降到最低。由此可見,在用MALDI TOF質(zhì)譜進(jìn)行聚合物分析時(shí),溶劑的選擇原則盡可能選用樣品和基質(zhì)都能溶的溶劑,若無此類溶劑,則選用兩者分別的良溶劑。
參考文獻(xiàn)(References):
[1] Till G, Steffen W, Jana F,etal. Mass spectrometry in polymer chemistry: a state-of-the-art up-date [J]. Polymer Chemistry, 2010(1)1: 599-617.
[2] Walterová Z, Horsk J. Quantification in MALDI-TOF mass spectrometry of modified polymers [J]. Analytica Chimica Acta, 2011, 693(1-2): 82-88.
[3] Lallana E, Ferreri T, Carroccio S C,etal. End-group rearrangements in poly(propylene sulfide) matrixassisted laser desorption/ionization time-of-flight analysis.Experimental evidence and possible mechanisms [J]. Rapid Communications in Mass Spectrometry, 2012, 26(18): 2158-2164.
[4] Peacock P M and. McEwen C N. Mass Spectrometry of Synthetic Polymers [J].Analytical Chemistry, 2004, 76(13): 3417-3428.
[5] Kim K, Hasneen A, Paik H J,etal. MALDI-TOF MS characterization of polystyrene synthesized by ATRP [J]. Polymer, 2013, 54(22): 6133-6139.
[6] Arnould M A,Wesdemiotis C, Geiger R J,etal. Structural characterization of polyester copolymers by MALDI mass spectrometry [J]. Progress in Organic Coatings, 2002, 45: 305-312.
[7] 何美玉,何江濤. MALDI-TOF MS分析研究合成高分子的綜述 [J]. 質(zhì)譜學(xué)報(bào), 2002, 23(1): 43-55.
[8] Ute B, Andreas D, Michae Kl,etal. Mass spectrometry of synthetic polymers by UV-matrix-assisted laser desorption/ionization [J]. Analytical Chemistry, 1992, 64(22): 2866-2869.
[9] Danis P O, Karr D E, Mayer F,etal. The analysis of water-soluble polymers by matrix-assisted laser desorption time-of-flight mass spectrometry [J]. Organic Mass Spectrometry, 1992, 27(7): 843-846.
[10] Wu T, Hu H L, Jiang D,etal. Identification of two polyamides (PA11 and PA1012) using pyrolysis-GC/MS and MALDI-TOF MS [J]. Polymer Testing, 2013, 32(2): 426-431.
[11] Janus L, Carbonnier B, Morcellet M,etal. Mass spectrometric characterization of a new 2-hydroxypropyl-beta-cyclodextrin derivative bearing methacrylic moieties and its copolymerization with 1-vinyl-2-pyrrolidone [J]. Macromolecular Bioscience, 2003, 3(3-4): 198-209.
[12] Yol A M, Dabney D, Wang S F,etal. Differentiation of Linear and Cyclic Polymer Architectures by MALDI Tandem Mass Spectrometry (MALDI-MS2) [J]. Journal of the American Society for Mass Spectrometry, 2013, 24(1): 74-82.
[13] Lallana E, Ferreri T, Carroccio S C,etal. End-group rearrangements in poly(propylene sulfide) matrix-assisted laser desorption/ionization time-of-flight analysis. Experimental evidence and possible mechanisms [J]. Rapid Communications in Mass Spectrometry, 2012, 26(18): 2158-2164.
[14] Sharma M, Yameen H S, Tumanskii B,etal. Bis(1,3-di-tert-butylimidazolin-2-iminato) Titanium Complexes as Effective Catalysts for the Monodisperse Polymerization of Propylene [J]. Journal of the American Chemical Society, 2012, 134(41): 17234-17244.
[15] Zagorevskii D V, Nasrullah M J, Raghunadh V,etal. The effect of tetrahydrofuran as solvent on matrix-assisted laser desorption/ionization and electrospray ionization mass spectra of functional polystyrenes [J]. Rapid Communications in Mass Spectrometry, 2006, 20(2): 178-180.
Quantitative Structure—Property Relationship Study on pKaValues of Substituted Carboxylic Acids
LIMei-lan1,LIZhong2
(1. College of Chemical Engineering, Qinghai University, Xining 810008, China; 2. College of Physics & Electronic Information Engineering, Qinghai University for Nationalities, Xining 810007, China)
Quantitative structure-property relationship (QSPR) method is performed to study the relationship between Pkavalues and molecular descriptors of 34 sorts of substituted carboxylic acids. With the DRAGON 5.4 software and HyerChem 7, 568 structural parameters and 12 quantum chemistry parameters for 34 sorts of substituted carboxylic acids are calculated. 61 structural descriptors are chosen by using the variable selection method of weighted deviation. Through stepwise regress, a equation of QSAR of 34 sorts of substituted carboxylic acids has been successfully proposed. TheR(correlation) andS(standard error) are 0.990 and 0.170, respectively. Furthermore, the two-sidedt-test was used to validate the significance of the 6 descriptors. With the statistically significance (<0.05), correlation coefficients of descriptors show that the 6 descriptors have important impaction the pKavalues. Furthermore, leave-one-out cross validation as performed, the results confirmed the good stability and powerful prediction of this model. The physical meaning and the influence of the 6 parameters on pKaof substituted carboxylic acids were investigated. The two parameters, net charge of the hydrogen atoms in carboxyl (QH) and net charge of the oxygen atom in non-hydroxyl (Q=O) are the key factors affecting the acid intensity of substituted carboxylic acids.
carboxylic acid; DRAGON; DFT; quantitative structure-property relationship (QSPR)
2014-04-08
國(guó)家教育部春暉計(jì)劃(Z2012108)
李梅蘭(1969-),女,青海西寧人,副教授,現(xiàn)主要從事應(yīng)用化學(xué)研究。Tel.:18797373976;E-mail: youjiezi2008@163.com
O 658.0
A
1006-7167(2015)02-0020-04