潘善飛 胡桂香 呂 楊 鄒建衛(wèi) 俞慶森
(1浙江大學(xué)寧波理工學(xué)院分子設(shè)計(jì)與營養(yǎng)工程市重點(diǎn)實(shí)驗(yàn)室,浙江寧波 315100; 2浙江大學(xué)化學(xué)系,杭州 310027)
離子液體中有機(jī)物溶解度的QSPR模型分析
潘善飛1,2胡桂香1,*呂 楊1,2鄒建衛(wèi)1俞慶森1,2
(1浙江大學(xué)寧波理工學(xué)院分子設(shè)計(jì)與營養(yǎng)工程市重點(diǎn)實(shí)驗(yàn)室,浙江寧波 315100;2浙江大學(xué)化學(xué)系,杭州 310027)
采用偏最小二乘(PLS)分析方法對(duì)84個(gè)有機(jī)物在四種不同的離子液體中的溶解度進(jìn)行基于VolSurf參數(shù)的定量構(gòu)性關(guān)系(QSPR)研究,取得較好的結(jié)果.訓(xùn)練集模型對(duì)預(yù)測(cè)集具有良好的預(yù)測(cè)能力.參數(shù)分析表明有機(jī)物具有較大體積的親水區(qū)域,對(duì)溶解度有利,且有機(jī)物與離子液體之間的相互作用能約為-0.84 kJ·mol-1.一定的疏水性對(duì)溶解度也是有利因素,當(dāng)離子液體具有小體積的疏水取代基,有機(jī)物具有不對(duì)稱的局部疏水區(qū)域?qū)θ芙舛扔欣?當(dāng)離子液體具有大體積或多個(gè)疏水取代基,有機(jī)物較高的疏水體積對(duì)溶解度有利.多元線性回歸(MLR)顯示親水參數(shù)W1最重要,表明分子的親水性是影響有機(jī)物在離子液體中溶解的關(guān)鍵因素.
離子液體; 溶解度; 定量構(gòu)性關(guān)系; VolSurf; 偏最小二乘分析; 多元線性回歸
離子液體(IL)是由有機(jī)陽離子和有機(jī)或無機(jī)陰離子組成的有機(jī)鹽,在室溫或接近室溫時(shí)呈液態(tài)[1-2]. IL具有熱穩(wěn)定性、低揮發(fā)性和強(qiáng)導(dǎo)電性等特殊的物理化學(xué)性質(zhì)[3-5],在化學(xué)反應(yīng)、分離過程、電化學(xué)以及環(huán)境保護(hù)等領(lǐng)域已有廣泛應(yīng)用[6-11].不同的有機(jī)物在IL中的溶解度也不相同,因此研究并預(yù)測(cè)有機(jī)物在IL中的溶解度對(duì)于開發(fā)綠色化學(xué)反應(yīng)及環(huán)境保護(hù)等具有重要意義.VolSurf[12-15]是一種較新的計(jì)算方法,它通過計(jì)算分子的三維相互作用場(chǎng),并采用映像處理方法,把讀入或計(jì)算得到的三維分子相互作用場(chǎng)轉(zhuǎn)化為容易理解和解釋的簡單分子參數(shù).本文使用VolSurf方法得到表征有機(jī)物三維結(jié)構(gòu)信息的VolSurf參數(shù),采用偏最小二乘分析(PLS)和多元線性回歸(MLR)方法建立參數(shù)與有機(jī)物溶解度之間的定量構(gòu)性關(guān)系(QSPR)模型,并對(duì)結(jié)果進(jìn)行比較分析.
本文共涉及84個(gè)有機(jī)化合物,均來自文獻(xiàn)[2],其結(jié)構(gòu)式見表1.化合物在IL中的溶解度數(shù)據(jù)以lgL表示,L表示奧斯特瓦爾德溶解系數(shù),無量綱. lgL數(shù)值越大,則溶解度越大.溶解度實(shí)驗(yàn)值見表2, lgL后的數(shù)字分別對(duì)應(yīng)四種IL.IL結(jié)構(gòu)均為烷基咪唑雙(三氟甲磺酰)亞胺鹽,如圖1所示.
圖1 四種ILs的結(jié)構(gòu)Fig.1 Structures of the four ILs
在Sybyl 6.8[16]軟件中,構(gòu)建84個(gè)化合物的結(jié)構(gòu)式,采用Triops力場(chǎng),Gasteiger-Hükel電荷,能量收斂標(biāo)準(zhǔn)為0.42 kJ·(mol·nm)-1對(duì)化合物進(jìn)行優(yōu)化.將優(yōu)化好的分子采用VolSurf 3.07A/GRID軟件計(jì)算其三維分子場(chǎng),在四種不同的IL中均使用水(OH2)與疏水(DRY)兩種探針,并在八個(gè)不同的能量級(jí)上計(jì)算探針與目標(biāo)分子的相互作用,結(jié)果共產(chǎn)生62個(gè)VolSurf參數(shù).各參數(shù)的物理意義詳見文獻(xiàn)[17].
表2 化合物溶解度的實(shí)驗(yàn)值、計(jì)算值與預(yù)測(cè)值Table 2 Experimental,calculated and predicted values of compounds′solubilities
采用主成分分析(PCA)和PLS方法對(duì)分子的三維結(jié)構(gòu)參數(shù)及其與化合物在IL中的溶解度之間的關(guān)系進(jìn)行研究.模型的最佳主成分?jǐn)?shù)用軟件自帶的留一交叉驗(yàn)證方法(leave-one-out validation)得到,以預(yù)測(cè)能力q2最大值為最佳主成份.為了提高模型的相關(guān)性及預(yù)測(cè)能力,使用程序自帶的部分因子設(shè)計(jì)(FFD)技術(shù)選擇有效變量,使變量數(shù)下降.建立包括整個(gè)樣本集的模型1.為了檢驗(yàn)?zāi)P偷念A(yù)測(cè)能力,根據(jù)模型1的PLS分析結(jié)果,采用軟件自帶模塊中的MDC[19]方法選擇子集作為訓(xùn)練集建立模型2,并用模型2對(duì)其余化合物的溶解度進(jìn)行預(yù)測(cè).MDC方法能夠從所有化合物中選出最具有代表性的化合物,因此可避免模型2與模型1偏離過大.為了探明影響化合物溶解度最重要的三維結(jié)構(gòu)信息,進(jìn)一步對(duì)參數(shù)進(jìn)行多元線性回歸分析,并對(duì)結(jié)果進(jìn)行分析討論.
2.1.1 IL1模型
IL1模型共包括57個(gè)化合物.研究中發(fā)現(xiàn)化合物29的溶解度為異常值,將其刪除進(jìn)行后續(xù)研究. FFD技術(shù)使變量數(shù)降至58.PCA分析顯示,變量信息主要集中在前兩個(gè)主成分,可以解釋61.98%的信息量,第1和第2主成分的信息量分別為43.30%和18.68%.模型1的PLS分析顯示,在主成分?jǐn)?shù)為6時(shí),模型的相關(guān)性r2=0.98,預(yù)測(cè)能力q2=0.94,計(jì)算標(biāo)準(zhǔn)偏差Sc=0.17,預(yù)測(cè)標(biāo)準(zhǔn)偏差Sp=0.29.化合物溶解度的實(shí)驗(yàn)值和計(jì)算值見表2.
根據(jù)模型1的結(jié)果,采用MDC方法從56個(gè)化合物中選出50個(gè)分子作為訓(xùn)練集建立模型2,其余6個(gè)化合物作為預(yù)測(cè)集.FFD技術(shù)使變量數(shù)降至60, PLS分析顯示,模型最佳主成分?jǐn)?shù)為8,r2=0.99,q2= 0.95,Sc=0.14,Sp=0.27.模型2中化合物溶解度實(shí)驗(yàn)值與計(jì)算值/預(yù)測(cè)值相關(guān)性見圖2,化合物溶解度的計(jì)算值和預(yù)測(cè)值見表2.模型2對(duì)其余6個(gè)化合物進(jìn)行預(yù)測(cè),在主成分?jǐn)?shù)為8時(shí),預(yù)測(cè)結(jié)果最好,預(yù)測(cè)標(biāo)準(zhǔn)偏差為0.25,與模型2的預(yù)測(cè)標(biāo)準(zhǔn)偏差0.27非常接近,說明預(yù)測(cè)效果好.
圖2 模型2中化合物溶解度的實(shí)驗(yàn)值與計(jì)算值或預(yù)測(cè)值之間的相關(guān)性(IL1)Fig.2 Relationship between experimental and calculated or predicted values of compounds′solubilities in model 2(IL1)○:training set;●:test set;the line is fitted with the training set.
60個(gè)參數(shù)及其相關(guān)系數(shù)如圖3所示.各參數(shù)意義如下:1-33為水探針OH2產(chǎn)生的參數(shù),依次為V、S、R、G、W1-8、Iw1-8、Cw1-7、Emin1-3OH2、D12OH2、D13OH2、D23OH2;34-54為疏水探針產(chǎn)生的參數(shù),依次為D1-8、ID1-3、ID5-8、Emin1-3DRY、D12DRY、D13DRY、D23DRY;55-58為混合參數(shù),依次為HL1-2、A、CP;59-60為POL和MW.相關(guān)系數(shù)大于零,表示正相關(guān),同理相關(guān)系數(shù)小于零表示負(fù)相關(guān).柱越長表示相關(guān)系數(shù)越大,對(duì)溶解度的影響越大.下同.
圖3 參數(shù)在模型2中的相關(guān)系數(shù)(IL1)Fig.3 Coefficient plot of descriptors in model 2(IL1)
由圖3可以看出,除了參數(shù)CP與化合物溶解度呈弱的負(fù)相關(guān),其余參數(shù)均呈正相關(guān).CP為臨界堆積參數(shù),定義為:疏水體積/(親水表面積×疏水長度).絕大部分親水參數(shù)與化合物溶解度呈較高的正相關(guān),表明分子內(nèi)具有較大體積的親水區(qū)域?qū)衔锶芙舛扔欣?其中W1、W2表現(xiàn)為強(qiáng)的正相關(guān),這提示我們有機(jī)物在IL1中溶解時(shí),兩者之間的相互作用能與有機(jī)物和水探針相互作用的第一、二能級(jí)(-0.84,-2.09 kJ·mol-1)相近.與親水參數(shù)相比,疏水參數(shù)與化合物溶解度呈較弱的正相關(guān),說明分子內(nèi)一定的疏水性也對(duì)溶解度有利.從圖中可以看出,參數(shù)ID1-3,Emin3DRY呈較強(qiáng)的正相關(guān),ID為疏水相互作用能矢量參數(shù),是指從分子的質(zhì)量中心指向疏水區(qū)域中心的矢量,數(shù)值高,說明分子表面具有不對(duì)稱的局部疏水區(qū)域;數(shù)值小,說明分子表面的疏水區(qū)或者距離分子的質(zhì)量中心很近,或者它們?cè)诜肿酉鄬?duì)的兩端處于平衡.ID1,2,3與溶解度呈較強(qiáng)的正相關(guān),說明在有機(jī)物與疏水探針相互作用的第一、二、三能級(jí)上(-0.84,-1.67,-2.51 kJ·mol-1),具有不對(duì)稱的局部疏水區(qū)域的分子在IL1中的溶解度高.這個(gè)能級(jí)與水探針能級(jí)接近.由此可以看出,有機(jī)物在IL1中溶解時(shí),兩者之間的相互作用能大約為-0.84--2.51 kJ·mol-1,并且化合物與IL1不僅存在大面積的極性相互作用,也存在局部疏水相互作用.Emin3DRY為疏水探針與化合物之間三個(gè)局部最小相互作用能之一,該參數(shù)與溶解度較強(qiáng)的正相關(guān)進(jìn)一步證實(shí)了化合物與IL1之間局部疏水相互作用能的存在.HL1-2為親水-親脂平衡參數(shù),數(shù)值越高,表示分子內(nèi)親水區(qū)域較疏水區(qū)域大,弱的正相關(guān)表示親水區(qū)域較疏水區(qū)域大的分子溶解度高.A為兩親矩,是從疏水區(qū)域中心指向親水區(qū)域中心的矢量,與溶解度正相關(guān),說明疏水區(qū)與親水區(qū)的不平衡性越高,溶解度越大.CP是唯一一個(gè)與溶解度呈負(fù)相關(guān)的參數(shù),說明具有較大的疏水體積對(duì)溶解度不利,但大的親水表面積或者疏水長度對(duì)溶解度有利.由此可見,四個(gè)混合參數(shù)的結(jié)論與親水、疏水參數(shù)完全一致.極化率POL和分子量MW不是從三維分子場(chǎng)中計(jì)算得到的參數(shù),與所使用的探針的數(shù)目和類型無關(guān).POL與分子體積V相關(guān)性很高,V, POL,MW均與溶解度呈正相關(guān),說明在一定范圍內(nèi),大體積、高分子量的化合物在IL1中溶解度高.
圖4 模型2中化合物溶解度的實(shí)驗(yàn)值與計(jì)算值或預(yù)測(cè)值之間的相關(guān)性(IL2)Fig.4 Relationship between experimental and calculated or predicted values of compounds′solubility in model 2(IL2)○:training set;●:test set;the line is fitted with the training set.
2.1.2 IL2模型
IL2模型包括60個(gè)化合物.研究中發(fā)現(xiàn)化合物29,34的溶解度為異常值,將其刪除進(jìn)行后續(xù)研究.變量數(shù)為59時(shí),PCA分析顯示,前三個(gè)主成分可以解釋65.94%的信息量,第1、2、3主成分的信息量分別為49.20%、9.51%和7.23%,第一主成分最重要.模型1的PLS分析顯示,在主成分?jǐn)?shù)為9時(shí),r2=0.98, q2=0.91,Sc=0.10,Sp=0.23.化合物溶解度的實(shí)驗(yàn)值和計(jì)算值見表2.
根據(jù)模型1的結(jié)果,從58個(gè)分子中選出50個(gè)作為訓(xùn)練集建立模型2,其余8個(gè)化合物作為預(yù)測(cè)集.變量數(shù)為60時(shí),PLS分析顯示,模型最佳主成分?jǐn)?shù)為9,r2=0.98,q2=0.87,Sc=0.11,Sp=0.27.模型2中化合物溶解度實(shí)驗(yàn)值與計(jì)算值/預(yù)測(cè)值相關(guān)性見圖4,化合物溶解度的計(jì)算值和預(yù)測(cè)值見表2.模型2對(duì)其余8個(gè)化合物進(jìn)行預(yù)測(cè),在主成分?jǐn)?shù)為9時(shí),預(yù)測(cè)結(jié)果最好,預(yù)測(cè)標(biāo)準(zhǔn)偏差為0.16,遠(yuǎn)小于模型2的預(yù)測(cè)標(biāo)準(zhǔn)偏差0.27,說明預(yù)測(cè)效果非常好.
60個(gè)參數(shù)及其相關(guān)系數(shù)如圖5所示.各參數(shù)意義如下,1-32為水探針OH2產(chǎn)生的參數(shù),依次為V、S、R、G、W1-8、Iw1-6、Iw8、Cw1-7、Emin1-3OH2、D12OH2、D13OH2、D23OH2;33-54為疏水探針產(chǎn)生的參數(shù),依次為D1-8、ID1-8、Emin1-3DRY、D12DRY、D13DRY、D23DRY;55-58為混合參數(shù),依次為HL1-2、A、CP;59-60為POL和MW.
圖5 參數(shù)在模型2中的相關(guān)系數(shù)(IL2)Fig.5 Coefficient plot of descriptors in model 2(IL2)
圖6 模型2中化合物溶解度的實(shí)驗(yàn)值與計(jì)算值或預(yù)測(cè)值之間的相關(guān)性(IL3)Fig.6 Relationship between experimental and calculated or predicted values of compounds′solubilities in model 2(IL3)○:training set;●:test set;the line is fitted with the training set
由圖5可以看出,除個(gè)別參數(shù)外,大部分參數(shù)與化合物溶解度呈正相關(guān).對(duì)于親水參數(shù)來說,絕大部分與化合物溶解度呈較高的正相關(guān),說明分子內(nèi)具有較大體積的親水區(qū)域?qū)衔锶芙舛扔欣?其中W1、W2表現(xiàn)為強(qiáng)的正相關(guān),這與IL1結(jié)果相同. D23OH2是唯一的負(fù)相關(guān)親水參數(shù),該參數(shù)為親水探針與化合物之間第二、第三局部最小相互作用能之間的距離,負(fù)相關(guān)說明兩者之間距離過大對(duì)溶解度不利.大部分疏水參數(shù)與溶解度呈正相關(guān),其中D6-D8表現(xiàn)為較強(qiáng)的正相關(guān),說明分子的疏水性越強(qiáng),在IL2中的溶解度越大.ID5-7參數(shù)顯示出弱的負(fù)相關(guān),說明分子具有過高的不對(duì)稱的局部疏水區(qū)域?qū)θ芙舛炔焕?HL1-2,A參數(shù)與溶解度呈弱的負(fù)相關(guān),說明分子內(nèi)過高的親水性對(duì)溶解度不利.CP與溶解度呈正相關(guān),說明具有較大的疏水體積對(duì)溶解度有利.POL和MW均與溶解度呈正相關(guān),這一點(diǎn)與IL1結(jié)果相同.
2.1.3 IL3模型
IL3模型共包括52個(gè)化合物.研究中發(fā)現(xiàn)化合物29的溶解度為異常值,將其刪除進(jìn)行后續(xù)研究.變量數(shù)為59時(shí),PCA分析顯示,變量信息主要集中在前兩個(gè)主成分,可以解釋65.93%的信息量,第1和第2主成分的信息量分別為50.51%和15.42%.模型1的PLS分析顯示,在主成分?jǐn)?shù)為6時(shí),r2= 0.98,q2=0.91,Sc=0.19,Sp=0.36.化合物溶解度的實(shí)驗(yàn)值和計(jì)算值見表2.
圖7 參數(shù)在模型2中的相關(guān)系數(shù)(IL3)Fig.7 Coefficients plot of descriptors in model 2(IL3)
根據(jù)模型1的結(jié)果,采用MDC方法從51個(gè)化合物中選出40個(gè)分子作為訓(xùn)練集建立模型2,其余11個(gè)化合物作為預(yù)測(cè)集.變量數(shù)為50時(shí),PLS分析顯示,模型最佳主成分?jǐn)?shù)為5,r2=0.96,q2=0.90,Sc= 0.23,Sp=0.37.模型2中化合物溶解度實(shí)驗(yàn)值與計(jì)算值(預(yù)測(cè)值)相關(guān)性見圖6,化合物溶解度的計(jì)算值和預(yù)測(cè)值見表2.模型2對(duì)其余11個(gè)化合物進(jìn)行預(yù)測(cè),在主成分?jǐn)?shù)為5時(shí),預(yù)測(cè)結(jié)果最好,預(yù)測(cè)標(biāo)準(zhǔn)偏差為0.16,遠(yuǎn)小于模型2的預(yù)測(cè)標(biāo)準(zhǔn)偏差0.37,說明預(yù)測(cè)效果非常好.
50個(gè)參數(shù)及其相關(guān)系數(shù)如圖7所示.各參數(shù)意義如下:1-32為水探針OH2產(chǎn)生的參數(shù),依次為V、S、R、G、W1-8、Iw1-8、Cw1-7、Emin1-3OH2、D13OH2、D23OH2;33-45為疏水探針DRY產(chǎn)生的參數(shù),依次為D2-3,D6,D8,ID1-2,ID4-7,Emin1-2DRY,D23DRY;46-49為混合參數(shù),依次為HL1-2、A、CP;50為POL.
比較圖7與圖3可以發(fā)現(xiàn),兩者非常接近.除了參數(shù)CP與化合物溶解度呈弱的負(fù)相關(guān),其余參數(shù)均呈正相關(guān).絕大部分親水參數(shù)與化合物溶解度呈較高的正相關(guān),且W1、W2表現(xiàn)為強(qiáng)的正相關(guān);疏水參數(shù)與化合物溶解度也呈正相關(guān),且ID1-2呈較強(qiáng)的正相關(guān);HL1-2、A均與溶解度呈弱的正相關(guān),CP與溶解度呈負(fù)相關(guān);POL與溶解度呈正相關(guān).所有結(jié)果均與IL1相同,說明有機(jī)物在IL1與IL3中的溶解度的影響因素相同.
2.1.4 IL4模型
IL4模型共包括38個(gè)化合物.研究中發(fā)現(xiàn)化合物29、34的溶解度為異常值,將其刪除進(jìn)行后續(xù)研究.變量數(shù)為57時(shí),PCA分析顯示,變量信息主要集中在前兩個(gè)主成分,可以解釋65.02%的信息量,第 1和第 2主成分的信息量分別為 55.61%和9.41%.模型1的PLS分析顯示,在主成分?jǐn)?shù)為5時(shí),r2=0.94,q2=0.82,Sc=0.19,Sp=0.34.化合物溶解度的實(shí)驗(yàn)值和計(jì)算值見表2.
圖8 模型2中化合物溶解度的實(shí)驗(yàn)值與計(jì)算值或預(yù)測(cè)值之間的相關(guān)性(IL4)Fig.8 Relationship between experimental and calculated or predicted values of compounds′solubilities in model 2(IL3)○:training set;●:test set;the line is fitted with the training set.
根據(jù)模型1的結(jié)果,采用MDC方法從36個(gè)化合物中選出30個(gè)分子作為訓(xùn)練集建立模型2,其余6個(gè)化合物作為預(yù)測(cè)集.變量數(shù)為54時(shí),PLS分析顯示,模型最佳主成分?jǐn)?shù)為4,r2=0.93,q2=0.83,Sc= 0.22,Sp=0.35.模型2中化合物溶解度實(shí)驗(yàn)值與計(jì)算值(預(yù)測(cè)值)相關(guān)性見圖8,化合物溶解度的計(jì)算值和預(yù)測(cè)值見表2.模型2對(duì)其余6個(gè)化合物進(jìn)行預(yù)測(cè),在主成分?jǐn)?shù)為4時(shí),預(yù)測(cè)結(jié)果最好,預(yù)測(cè)標(biāo)準(zhǔn)偏差為0.36,與模型2的預(yù)測(cè)標(biāo)準(zhǔn)偏差0.35非常接近,說明預(yù)測(cè)效果較好.
54個(gè)參數(shù)及其相關(guān)系數(shù)如圖9所示.各參數(shù)意義如下:1-30為水探針OH2產(chǎn)生的參數(shù),依次為V、S、R、G、W1-8、Iw2-8,、Cw1-7、Emin1-2OH2、D12OH2、D13OH2;31-48為疏水探針DRY產(chǎn)生的參數(shù),依次為D1-8、ID1-7、Emin1-2DRY、D23DRY; 49-52為混合參數(shù),依次為HL1-2、A、CP;53-54為POL和MW.
圖9 參數(shù)在模型2中的相關(guān)系數(shù)(IL4)Fig.9 Coefficient plot of descriptors in model 2(IL4)
由圖9可以看出,對(duì)于30個(gè)親水參數(shù),除了個(gè)別表現(xiàn)為極弱的負(fù)相關(guān),大部分與溶解度呈正相關(guān),其中W1,W2表現(xiàn)為強(qiáng)的正相關(guān),說明分子內(nèi)具有較大體積的親水區(qū)域?qū)衔锶芙舛扔欣?對(duì)于疏水參數(shù),D5-8表現(xiàn)為強(qiáng)的正相關(guān),說明分子的疏水性越強(qiáng),在IL4中的溶解度越大;ID5-6參數(shù)顯示出一定的負(fù)相關(guān),說明分子具有過高的不對(duì)稱的局部疏水區(qū)域?qū)θ芙舛炔焕?這些均與IL2結(jié)果類似.不同的是,D23DRY參數(shù)與溶解度呈負(fù)相關(guān),說明疏水探針與化合物之間第二、第三局部最小相互作用能之間的距離過大對(duì)溶解度不利.HL1-2、A參數(shù)與溶解度呈弱的負(fù)相關(guān),說明分子內(nèi)過高的親水性對(duì)溶解度不利;CP與溶解度呈正相關(guān),說明具有較大的疏水體積對(duì)溶解度有利,這也與IL2結(jié)果相同.另外,POL和MW與溶解度呈正相關(guān).
在PLS模型中,參數(shù)數(shù)量較多,為了探明化合物在IL中溶解的主要影響因素,采用MLR中的逐步回歸方法對(duì)溶解度與模型2中的參數(shù)進(jìn)行建模分析,所得方程列于表3.
從表中可以看出,在四種IL中,影響有機(jī)物溶解度的最重要的參數(shù)均為親水參數(shù)W1,且均與溶解度呈正相關(guān),表明分子內(nèi)具有較大體積的親水區(qū)域?qū)衔锶芙舛扔欣?且有機(jī)物與IL之間的相互作用能約為-0.84 kJ·mol-1,這點(diǎn)與PLS結(jié)果一致.模型中參數(shù)之間的相關(guān)性見表4,由表可見,各模型參數(shù)之間的相關(guān)性均小于0.90,說明模型具有較高的穩(wěn)定性.圖10所示為各IL中溶解度最大和最小化合物的W1區(qū)域.在IL1中,溶解度最大和最小的化合物分別為69(4.76)和49(-0.06),從圖中可以看出,69化合物的W1區(qū)域遠(yuǎn)大于49,有利因素使得69的溶解度遠(yuǎn)高于49的.IL2中的68(4.71)與54 (1.23);IL3中的40(5.58)與49(-0.17);IL4中的23 (4.41)與1(1.21),W1區(qū)域與溶解度情況均與IL1完全相同,進(jìn)一步驗(yàn)證了W1參數(shù)對(duì)溶解度的影響程度.
表3 有機(jī)物在四種IL中的溶解度的MLR模型Table 3 MLR models of compounds′solubilities in four ILs
圖10 四種IL中化合物溶解度最大和最小分子的W1親水區(qū)域Fig.10 Hydrophilic region W1 of compounds with the maximum and minimum solubility in four ILs
在IL1初始建模時(shí)發(fā)現(xiàn),化合物29溶解度的預(yù)測(cè)偏差為2.83,遠(yuǎn)遠(yuǎn)大于模型的預(yù)測(cè)標(biāo)準(zhǔn)偏差0.47,且在其它離子液體中均存在類似情況.因此,在每種IL的PLS模型中,化合物29均作為異常值被刪除.這可能是因?yàn)?9號(hào)化合物乙腈是所有化合物中極性最強(qiáng)的物質(zhì),在IL中的溶解有別于其它化合物,因此出現(xiàn)較大偏差.化合物34在IL2與IL4的模型中被刪除,IL1中缺少34的溶解度數(shù)據(jù),而IL3中,雖然34沒有被刪除,但其偏差0.45遠(yuǎn)大于計(jì)算偏差0.19.這可能是因?yàn)?4號(hào)四氯化碳是對(duì)稱性好、非極性強(qiáng)的化合物,在IL中的溶解稍有別于其它化合物.
表4 MLR模型中各參數(shù)之間的相關(guān)性Table 4 Correlation between parameters in MLR models
對(duì)比PLS模型可以發(fā)現(xiàn),四種IL中的溶解度的影響因素具有相同之處,如親水參數(shù)基本與化合物溶解度呈正相關(guān),且W1、W2均表現(xiàn)為強(qiáng)的正相關(guān);大部分疏水參數(shù)也與化合物溶解度呈正相關(guān); POL、MW與溶解度呈正相關(guān).由此可見,分子內(nèi)具有較大體積的親水區(qū)域以及適當(dāng)?shù)氖杷畢^(qū)域?qū)衔锶芙舛扔欣?且有機(jī)物與IL之間的相互作用能約為-0.84 kJ·mol-1;在一定范圍內(nèi),分子的極化率與分子量越大,分子在IL中的溶解度越高.但I(xiàn)L不同,影響因素也稍有區(qū)別,其中IL1和IL3類似,而IL2和IL4類似.如在IL1,IL3中,疏水參數(shù)的最強(qiáng)作用為ID類參數(shù),強(qiáng)調(diào)了分子不對(duì)稱的局部輸水區(qū)域,且HL1-2、A與溶解度呈正相關(guān),而CP為負(fù)相關(guān);在IL2和IL4中,疏水參數(shù)的最強(qiáng)作用為D類參數(shù),強(qiáng)調(diào)了分子的疏水性能,而部分ID類參數(shù)則為負(fù)相關(guān),HL1-2,A參數(shù)與溶解度呈負(fù)相關(guān),而CP為正相關(guān).這可能是由IL的結(jié)構(gòu)引起的.IL3, IL1的3位取代基分別為疏水的乙基,丁基,取代基體積相對(duì)較小,但有機(jī)物與取代基之間的疏水作用又有利于溶解,因此具有不對(duì)稱局部輸水區(qū)域的分子有利于在兩種IL中的溶解.而IL2的3位取代基為己基,體積較大,不對(duì)稱的局部疏水區(qū)已經(jīng)不能滿足疏水作用需要,因此,疏水作用重要性增加,使得D與溶解度呈正相關(guān),而ID出現(xiàn)負(fù)相關(guān).IL4的3位取代基雖然為小體積乙基,但由于2位甲基的引入,使得疏水作用增加,因此結(jié)果與IL2類似.HL1-2、A、CP四個(gè)混合參數(shù)與溶解度的相關(guān)性更進(jìn)一步證實(shí)了在IL1和IL3中化合物具有不對(duì)稱局部疏水區(qū)對(duì)溶解度有利,而在IL2和IL4中,化合物具有較大的疏水區(qū)域?qū)θ芙舛扔欣?
另外,無論是PLS模型還是MLR模型,IL1-3的結(jié)果均優(yōu)于IL4.這可能是因?yàn)镮L4是1,2-二甲基-3-乙基咪唑雙(三氟甲磺酰)亞胺鹽,與其它三個(gè)IL相比,由于2位甲基的引入,使得咪唑環(huán)上氮原子的電荷強(qiáng)度減弱,離子性降低,僅采用親水探針和疏水探針不足以模擬有機(jī)物在其中的溶解情況,從而導(dǎo)致結(jié)果稍劣.
對(duì)一系列有機(jī)物在四種不同的IL中的溶解度進(jìn)行了QSPR研究,得到了較好的結(jié)果,訓(xùn)練集對(duì)預(yù)測(cè)集具有較好的預(yù)測(cè)能力.PLS模型的參數(shù)分析表明,對(duì)于四種IL,親水參數(shù)與化合物溶解度呈正相關(guān),且一、二能級(jí)的親水體積為強(qiáng)的正相關(guān),說明分子內(nèi)具有較大體積的親水區(qū)域?qū)衔锶芙舛扔欣?且有機(jī)物與IL之間的相互作用能約為-0.84 kJ· mol-1.有機(jī)物在IL中溶解也需具備一定的疏水性,對(duì)于具有小體積取代基的IL1和IL3,不對(duì)稱的局部疏水區(qū)域?qū)θ芙舛扔欣?而對(duì)于具有大體積或多個(gè)取代基的IL2和IL4,較高的疏水體積對(duì)溶解度有利.POL、MW也與溶解度呈正相關(guān),說明在一定范圍內(nèi),分子的極化率與分子量越大,分子在IL中的溶解度越高.MLR方法分析表明,在所有的參數(shù)中,親水參數(shù)W1是最重要的參數(shù),說明有機(jī)物要在IL中溶解,首先具備較高的親水性能.
1 Jonathan,G.H.;Heather,D.W.;Richard,P.S.;Ann,E.V.;Robin, D.R.Chem.Commun.,1998:1765
2 Alan,R.K.;Minati,K.;Iva,B.S.S.;Svetoslav,H.S.;Dimitar,A. D.;Mati,K.;William,E.A.J.Chem.Eng.Data,2008,53(5): 1085
3 Luís,C.B.;Jo?o,N.R.;Joaquim,J.M.;Carlos,A.M.Chem.Eur. J.,2002,8(16):3671
4 Tom,W.Coord.Chem.Rev.,2004,248:2459
5 John,S.W.J.Mol.Catal.A-Chem.,2004,214:11
6 Thomas,W.Chem.Rev.,1999,99(8):2071
7 Zhao,D.B.;Wu,M.;Kou,Y.Catal.Today,2002,74:157
8 Xu,L.J.;Chen,W.P.;Xiao,J.L.Organometallics,2000,19: 1123
9 Richard,A.B.;Pamela,P.;Erin,M.;Charles,A.E.;Charles,L.L.; Philip,G.J.J.Am.Chem.Soc.,2001,123:1254
10 Fuller,J.;Carlin,R.T.;Osteryoung,R.A.J.Electrochem.Soc., 1997,144(11):3881
11 Blanchard,L.A.;Hancu,D.;Bechman,E.J.;Brenneche,J.F. Nature,1999,399:28
12 Sé bastien,R.;Giulia,C.;Giuseppe,E.;Patrick,G.;Alessandra,P.; Pierre-Alain,C.;Bernard,T.J.Mol.Graphics Modell.,2001,19 (6):521
13 Gabriele,C.;Manuel,P.;Wolfgang,G.Eur.J.Pharm.Sci.,2000, 11(Suppl.2):S29
14 Bernard,T.;Andrzej,J.B.Eur.J.Pharm.Sci.,2000,11(Suppl.2): S3
15 Yan,L.F.;Hu,G.X.;Xu,J.;Zhao,W.N.;Yu,Q.S.Acta Phys.-Chim.Sin.,2008,24(12):2249 [顏琳芳,胡桂香,徐 晶,趙文娜,俞慶森.物理化學(xué)學(xué)報(bào),2008,24(12):2249]
16 SYBYL Molecular Modelling Softwate.Version 6.8.St.Louis, MO:Tripos,2001
17 Cruciani,G.;Crivori,P.;Carrupt,P.A.;Testa,B.J.Mol.Struct.-Theochem,2000,503:17
18 Brian,D.H.;Richard,M.H.;Elizabeth,R.;John,W.Quant.Struct.-Act.Relat.,1996,15:285
QSPR Model Analysis on the Solubility of Organic Compounds in Ionic Liquids
PAN Shan-Fei1,2HU Gui-Xiang1,*Lü Yang1,2ZOU Jian-Wei1YU Qing-Sen1,2
(1Key Laboratory for Molecular Design and Nutrition Engineering of Ningbo City,Ningbo Institute of Technology, Zhejiang University,Ningbo 315100,Zhejiang Province,P.R.China;2Department of Chemistry, Zhejiang University,Hangzhou 310027,P.R.China)
A quantitative structure-property relationship(QSPR)study on the solubility of 84 organic compounds in 4 different ionic liquids was done based on VolSurf parameters using the partial least square(PLS)statistical method and good results were obtained.The training set model predicts the solubilities of the test set well.An analysis of the VolSurf descriptors show that large volume hydrophilic regions are beneficial for solubility,and the interaction energy is about-0.84 kJ·mol-1between the organic compounds and the ionic liquids.A certain degree of hydrophobicity is also favorable for solubility.When the ionic liquids have a small hydrophobic substituent,an asymmetric partial hydrophobic region in the organic compound is advantageous for solubility.If the ionic liquid has a large hydrophobic substituent,a large hydrophobic region in the organic compound benefits the solubility.Multiple linear regression (MLR)analysisshowsthathydrophilicparameterW1 isthemostimportantparameter,whichindicatesthathydrophilicity is a key factor that influences the solubility of organic compounds in ionic liquids.
Ionic liquid; Solubility; Quantitative structure-property relationship; VolSurf; Partial least square; Multiple linear regression
O641;O645
Received:February 26,2010;Revised:May 11,2010;Published on Web:July 6,2010.
*Corresponding author.Email:hugx@nit.zju.edu.cn;Tel:+86-574-88229517.
The project was supported by the National Natural Science Foundation of China(20803063).
國家自然科學(xué)基金(20803063)資助項(xiàng)目
?Editorial office of Acta Physico-Chimica Sinica