劉鵬飛,馬 羚,焦 龍
(西安石油大學(xué) 化學(xué)化工學(xué)院,陜西 西安 710065)
隨著節(jié)能減排、綠色環(huán)保發(fā)展的要求越來(lái)越嚴(yán),傳統(tǒng)能源因具有不可再生、污染嚴(yán)重的缺點(diǎn)已不能滿足當(dāng)前社會(huì)對(duì)能源的新要求[1],因此發(fā)展更多的綠色新能源技術(shù)勢(shì)在必行。染料敏化太陽(yáng)能電池(DSSCs)是一類具有廣闊發(fā)展前景的光伏技術(shù),因其成本低廉、制造簡(jiǎn)單,受到了越來(lái)越多的關(guān)注[2-3]。
標(biāo)準(zhǔn)的DSSCs 由導(dǎo)電氧化物、TiO2半導(dǎo)體薄膜、電解質(zhì)、反電極和光敏劑五個(gè)元件組成[4]。在這些成分中,光敏劑是DSSCs 的核心部分,它控制著太陽(yáng)光的捕獲以及激子的產(chǎn)生。在TiO2半導(dǎo)體薄膜上光敏劑感應(yīng)并吸收太陽(yáng)光時(shí),會(huì)產(chǎn)生激發(fā)態(tài)電子,接著注入到導(dǎo)電氧化物的導(dǎo)帶中,最后轉(zhuǎn)移到反電極中。因此,DSSCs 的轉(zhuǎn)化效率很大程度可以被認(rèn)為受光敏劑材料性能的影響。到目前為止,人們已設(shè)計(jì)出多種染料敏化劑,金屬絡(luò)合物和無(wú)金屬有機(jī)敏化劑已成功地應(yīng)用于DSSCs。盡管基于金屬絡(luò)合物敏化劑的DSSCs 的功率轉(zhuǎn)換效率(PCE)已達(dá)到近13%[5],但是基于釕類金屬絡(luò)合物的敏化劑成本高、毒性大,難以廣泛應(yīng)用于太陽(yáng)能電池。相比之下,無(wú)金屬有機(jī)敏化劑具有更高的摩爾消光系數(shù)、更低的成本、毒性小等優(yōu)點(diǎn)[6],受到了研究者的關(guān)注。然而,有機(jī)染料敏化劑的合成和相關(guān)染料敏化太陽(yáng)能電池性能測(cè)試通常采用傳統(tǒng)的試驗(yàn)方法,這種方法不但耗費(fèi)時(shí)間和金錢,且最終結(jié)果可能令人失望。因此,需要一種合理的方法完成對(duì)有機(jī)染料敏化劑的快速識(shí)別,以節(jié)約不必要的時(shí)間和金錢的浪費(fèi)。
近年來(lái),作為研究染料敏化劑的一類有前途的工具,計(jì)算機(jī)輔助方法已成功應(yīng)用于有機(jī)染料敏化太陽(yáng)能電池的研究。全息定量構(gòu)效關(guān)系(HQSAR)是一種特殊的定量構(gòu)效關(guān)系(QSAR)方法,能夠方便、快速地構(gòu)建高質(zhì)量的QSAR 模型。HQSAR 模型中使用的結(jié)構(gòu)描述符是一種稱為分子全息的特殊片段指紋,與傳統(tǒng)的二維結(jié)構(gòu)描述符相比,其可以編碼更多的分子信息,如立體化學(xué)、分支和環(huán)狀結(jié)構(gòu)。由該方法構(gòu)建的HQSAR 模型的預(yù)測(cè)精度高于傳統(tǒng)的2D-QSAR 方法,可與更復(fù)雜的3D-QSAR 方法相媲美。因此,HQSAR方法對(duì)有機(jī)染料敏化劑的分子研究具有很大的潛力。
本研究的主要目的是采用HQSAR 方法建立預(yù)測(cè)香豆素染料敏化太陽(yáng)能電池短路電流密度(Jsc)的定量模型,并利用該模型的分子貢獻(xiàn)圖,為香豆素衍生物的設(shè)計(jì)找到有利于Jsc值提高的基團(tuán)。
從文獻(xiàn)[7-8]中收集了48 種香豆素類有機(jī)染料短路電流密度(Jsc)的實(shí)驗(yàn)值,見表1。這些化合物被隨機(jī)地分為訓(xùn)練集(41 種化合物)和測(cè)試集(7種化合物,表1 中編號(hào)帶*表示為測(cè)試集分子),它們的初始結(jié)構(gòu)用SYBYL-X 2.0(Tripos,U.S.)軟件包的Sketch Molecule 模塊構(gòu)建。
HQSAR 建模通常包括以下步驟。首先,每個(gè)所研究的染料分子被分成幾個(gè)分子片段。然后將每個(gè)分子片段映射成一個(gè)從0~231 的偽隨機(jī)整數(shù),并編碼成具有一定長(zhǎng)度的整數(shù)字符串。這個(gè)整數(shù)字符串被命名為分子全息。通過(guò)調(diào)整兩個(gè)片段參數(shù)(片段區(qū)分和片段大?。┑慕M合,可以獲得不同的分子全息。最后,通過(guò)使用偏最小二乘法(PLS)回歸建立分子全息圖與所研究分子性質(zhì)之間的定量關(guān)系模型。
HQSAR 模型的性能與三個(gè)關(guān)鍵參數(shù)直接相關(guān):片段區(qū)分(fragment distinction)、片段大小(fragment size)和全息圖長(zhǎng)度(hologram length,HL)。整數(shù)字符串的長(zhǎng)度由全息圖長(zhǎng)度參數(shù)定義,即53 到401 之間的12 個(gè)素?cái)?shù)。SYBYL-X 2.0 程序可以直接提供全息圖長(zhǎng)度的最優(yōu)設(shè)置。參數(shù)片段區(qū)分和片段大小需要用戶進(jìn)行實(shí)驗(yàn)優(yōu)化。在HQSAR 模型的開發(fā)中,片段結(jié)構(gòu)的類型是通過(guò)片段區(qū)分來(lái)定義的,包括六種選擇:原子類型(A)、鍵(B)、連通性(C)、氫原子(H)、手性(Ch)、供體和受體原子(DA)。片段中的原子數(shù)由片段大小指定,在SYBYL 中,片段大小默認(rèn)設(shè)置為“4~7”。此外,HQSAR 模型還可以顯示分子貢獻(xiàn)圖,以不同的顏色作為工具來(lái)說(shuō)明化合物結(jié)構(gòu)及其相關(guān)性質(zhì)之間的關(guān)系。紅色和橙紅色表示該位點(diǎn)的原子或基團(tuán)對(duì)分子性質(zhì)有負(fù)面影響;白色表示該位點(diǎn)的原子和基團(tuán)對(duì)分子性質(zhì)有中等貢獻(xiàn);黃色和綠色表明該位點(diǎn)的原子或基團(tuán)對(duì)分子性質(zhì)有積極的貢獻(xiàn)。
QSAR 模型可能存在過(guò)擬合的風(fēng)險(xiǎn),因此,在使用前通常需要檢驗(yàn)?zāi)P唾|(zhì)量。留一法交叉驗(yàn)證的相關(guān)系數(shù)(q2cv)、留一法交叉驗(yàn)證的均方根誤差(RMSECV)、預(yù)測(cè)的均方根誤差(RMSEP)、預(yù)測(cè)的平方相關(guān)系數(shù)(Q2F3)、一致性相關(guān)系數(shù)(CCC)等統(tǒng)計(jì)指標(biāo)用于評(píng)估HQSAR 模型的性能。Chirico 等[9]建議一個(gè)可靠的QSAR 模型需要滿足:q2cv>0.5,Q2F3>0.70,CCC >0.85。
q2cv、RMSEP、RMSECV、CCC 和Q2F3的定義如下:
碎片區(qū)分參數(shù)和碎片大小參數(shù)直接關(guān)系到HQSAR 模型的質(zhì)量,通過(guò)對(duì)這兩個(gè)參數(shù)進(jìn)行實(shí)驗(yàn)優(yōu)化,可以確定最優(yōu)HQSAR 模型的參數(shù)設(shè)置。
首先,進(jìn)行片段區(qū)分參數(shù)的優(yōu)化。該訓(xùn)練集通過(guò)在默認(rèn)片段大小“4~7”下改變片段區(qū)分參數(shù)的設(shè)置構(gòu)建了多個(gè)候選的HQSAR 模型。對(duì)于這些模型,計(jì)算和比較了5 個(gè)關(guān)鍵統(tǒng)計(jì)指標(biāo)。表2列出了6 種最佳HQSAR 模型的關(guān)鍵統(tǒng)計(jì)指標(biāo)。由表2 可以看出,將片段區(qū)分參數(shù)設(shè)置為“A、B、DA”,所建立的HQSAR 模型的q2cv為0.833,與其他參數(shù)設(shè)置相比是最優(yōu)的。因此,在后續(xù)研究中,片段區(qū)分參數(shù)應(yīng)設(shè)置為“A、B、DA”。
表2 不同碎片區(qū)分參數(shù)下的HQSAR 模型的統(tǒng)計(jì)結(jié)果Tab.2 Statistics of the HQSAR models built with different fragment distinctions
其次,進(jìn)行片段大小參數(shù)的優(yōu)化。在片段區(qū)分“A、B、DA”的情況下,根據(jù)片段大小不同,共構(gòu)建了多個(gè)候選的HQSAR 模型。訓(xùn)練集仍用于構(gòu)建這些候選HQSAR 模型。表3 顯示了6 種最佳HQSAR 模型的關(guān)鍵統(tǒng)計(jì)指標(biāo)。如表3 所示,將片段大小設(shè)置為“2~5”,得到了最優(yōu)的HQSAR 模型,其中q2cv達(dá)到了0.846。明顯地,應(yīng)分別地將片段區(qū)分、片段大小、全息圖長(zhǎng)度和主成分(PC)設(shè)置為“A、B、DA”“2~5”“307”和“6”以建立最優(yōu)的HQSAR 模型。
表3 不同碎片大小參數(shù)下的HQSAR 模型的統(tǒng)計(jì)結(jié)果Tab.3 Statistics of the HQSAR models built with different fragment sizes
對(duì)2.1 中獲得最有效的HQSAR 模型質(zhì)量進(jìn)行驗(yàn)證。
首先,進(jìn)行了外部測(cè)試集驗(yàn)證。采用所開發(fā)最佳的HQSAR 模型預(yù)測(cè)測(cè)試集中所有染料分子的Jsc值,并構(gòu)建這些分子實(shí)驗(yàn)值與預(yù)測(cè)值的線性關(guān)系圖,結(jié)果見圖1 和表1。根據(jù)圖1 和表1 的預(yù)測(cè)結(jié)果,對(duì)于這7 種染料分子Jsc值的預(yù)測(cè),它們的Jsc,pred值與Jsc,pred值比較接近,且線性 關(guān)系為Jsc,pred=1.199×Jsc,pred-2.284 (R=0.964),RMSEP=1.731,CCC=0.879,Q2F3=0.814,表明最佳的HQSAR模型可以預(yù)測(cè)香豆素染料敏化劑DSSCs 的Jsc值。
其次,進(jìn)行留一交叉驗(yàn)證法(LOO-CV),進(jìn)一步檢驗(yàn)HQSAR 模型預(yù)測(cè)Jsc值的性能。依次預(yù)測(cè)全部訓(xùn)練集分子的Jsc值以及繪制Jsc,pred值與Jsc,pred值的線性關(guān)系圖,結(jié)果見圖1 和表1。根據(jù)圖1 和表1 所示的結(jié)果,訓(xùn)練集染料分子Jsc,pred值與Jsc,pred值基本接近,RMSECV=1.951。通過(guò)這兩種方法的驗(yàn)證,可知HQSAR 方法可以建立香豆素化合物結(jié)構(gòu)與Jsc值之間的定量模型,所建立的模型可以較為準(zhǔn)確地預(yù)測(cè)香豆素化合物DSSCs 的Jsc值。
圖1 實(shí)驗(yàn)值與預(yù)測(cè)值散點(diǎn)圖Fig.1 Plot of experimental value and predicted value
研究并分析獲得的最優(yōu)HQSAR 模型提供的分子貢獻(xiàn)圖,探究香豆素類衍生物中對(duì)其相關(guān)染料敏化太陽(yáng)能電池Jsc值有顯著影響的原子或基團(tuán)。圖2 顯示了香豆素類衍生物中具有代表性分子的分子貢獻(xiàn)圖。分子29(Jsc=12.10)可以通過(guò)在分子31(Jsc=15.60)母體結(jié)構(gòu)的C-3 位置添加一個(gè)噻吩基團(tuán)而獲得。在它的分子貢獻(xiàn)圖中,所添加噻吩基團(tuán)的顏色出現(xiàn)黃色,說(shuō)明噻吩基團(tuán)有利于提高Jsc值以及在香豆素類衍生物分子中引入正作用基團(tuán)同樣可以提高Jsc值。在分子31 的母體結(jié)構(gòu)C-3 位置引入一個(gè)丙烯腈基團(tuán),可以將分子31 的結(jié)構(gòu)轉(zhuǎn)化為分子36。分子31 相關(guān)染料敏化太陽(yáng)能電池的Jsc值從15.60 增加到18.80。如它的分子貢獻(xiàn)圖所示,C-7 位的丙烯腈部分原子呈黃色,說(shuō)明在C-3 的位置引入丙烯腈對(duì)Jsc值有正向影響。因此,丙烯腈、噻吩基團(tuán)的引入有利于香豆素染料敏化劑Jsc值的提高,這為香豆素染料敏化劑的設(shè)計(jì)提供了理論依據(jù)。
圖2 香豆素衍生物代表性分子的HQSAR分子貢獻(xiàn)圖Fig.2 HQSAR molecular contribution maps of several representative molecules of coumarin derivatives
采用全息定量構(gòu)效關(guān)系(HQSAR)方法研究了48 種香豆素類衍生物結(jié)構(gòu)與Jsc值之間的關(guān)系。獲得最佳HQSAR 模型的留一法交叉驗(yàn)證的相關(guān)系數(shù)q2cv為0.846,留一法交叉驗(yàn)證的均方根誤差(RMSECV)為1.195。對(duì)測(cè)試集7 種化合物的性質(zhì)進(jìn)行了預(yù)測(cè),預(yù)測(cè)的均方根誤差(RMSEP)為1.731,預(yù)測(cè)的平方相關(guān)系數(shù)(Q2F3)為0.814,一致性相關(guān)系數(shù)(CCC)為0.879。表明所建立的HQSAR模型具有良好的預(yù)測(cè)能力和穩(wěn)健度。另外,該模型的分子貢獻(xiàn)圖明確了丙烯腈、噻吩基團(tuán)是影響Jsc值的關(guān)鍵結(jié)構(gòu)因素。因此,HQSAR 方法可用于研究有機(jī)染料分子結(jié)構(gòu)對(duì)染料敏化太陽(yáng)能電池的短路電流密度的影響。