張紹立,趙秋琳,王 璁,邱馨儀,曹人杰,鄭 重,屠幼萍
(華北電力大學(xué) 高電壓與電磁兼容北京市重點(diǎn)實(shí)驗(yàn)室,北京102206)
由于SF6有很強(qiáng)的溫室效應(yīng)[1-3],自20 世紀(jì)80 年代以來(lái),許多學(xué)者逐步開(kāi)始探索可用于替代SF6的絕緣氣體[4-5]。正確預(yù)測(cè)候選絕緣氣體的絕緣強(qiáng)度是尋找替代氣體的關(guān)鍵步驟,通過(guò)定量構(gòu)效關(guān)系(quantitative structure-property relationship,QSPR)模型可以建立相應(yīng)的氣體分子描述符-絕緣強(qiáng)度定量構(gòu)效關(guān)系模型,用來(lái)預(yù)測(cè)其他類(lèi)型氣體分子的絕緣強(qiáng)度,提高絕緣氣體的篩選效率和設(shè)計(jì)效率,因此,該模型逐漸引起了研究者們的關(guān)注[6-8]。
國(guó)內(nèi)外學(xué)者已經(jīng)基于多種化學(xué)模擬方法研究了影響氣體分子絕緣強(qiáng)度的微觀因素[9-16]。在構(gòu)建的氣體絕緣強(qiáng)度QSPR 模型中,使用的分子結(jié)構(gòu)相關(guān)參數(shù)主要有極化率、電子親合能、偶極矩、電離能、吸收強(qiáng)度和分子軌道能隙等,參數(shù)值通常采用量子化學(xué)方法計(jì)算得到。然而,量子化學(xué)方法計(jì)算過(guò)程非常復(fù)雜,計(jì)算量非常龐大,當(dāng)不采取量化參數(shù)分子描述符去表征分子之間的差異時(shí),分子與分子之間最直觀的區(qū)別是其組成基團(tuán)類(lèi)型或基團(tuán)個(gè)數(shù)不同。雖然以往的氣體絕緣強(qiáng)度QSPR 模型能很好地預(yù)測(cè)氣體分子的絕緣強(qiáng)度,但是對(duì)分子描述符進(jìn)行量化計(jì)算是相當(dāng)抽象的,并且只憑借絕緣氣體分子的量化計(jì)算數(shù)值并不能篩選出對(duì)分子絕緣強(qiáng)度影響較大的基團(tuán)。
本文首次將氣體分子絕緣強(qiáng)度和分子拓?fù)渲笖?shù)建立聯(lián)系,以得到顯著影響氣體分子絕緣強(qiáng)度的基團(tuán)及其影響程度。首先,基于密度泛函理論(density functional theory,DFT)對(duì)47 種絕緣氣體的分子結(jié)構(gòu)進(jìn)行優(yōu)化計(jì)算,其次,采用電性拓?fù)錉顟B(tài)指數(shù)作為絕緣氣體分子基團(tuán)的量化指標(biāo),建立基團(tuán)與氣體絕緣強(qiáng)度的關(guān)系,并且采用逐步多元回歸法,篩選出氣體分子中對(duì)絕緣強(qiáng)度貢獻(xiàn)度較大的基團(tuán),以期為現(xiàn)有絕緣氣體遴選及新型絕緣氣體分子的設(shè)計(jì)提供理論支撐。
分子層面的分子描述符不能甄別氣體分子中的基團(tuán),而分子拓?fù)渲笖?shù)是一種對(duì)化合物分子結(jié)構(gòu)的數(shù)學(xué)描述,通過(guò)計(jì)算分子拓?fù)渲笖?shù)不僅可以直觀便捷地對(duì)絕緣氣體分子的基團(tuán)進(jìn)行定量表征,而且基于分子拓?fù)渲笖?shù)所表示的拓?fù)湫畔?,可以?jì)算和分析對(duì)分子性質(zhì)參數(shù)產(chǎn)生顯著影響的特定基團(tuán)及其影響程度。
從1947年第一個(gè)分子拓?fù)渲笖?shù)出現(xiàn)至今,已經(jīng)陸續(xù)提出了百余種分子拓?fù)渲笖?shù),不同的分子拓?fù)渲笖?shù)可用于表征不同分子的結(jié)構(gòu)信息,進(jìn)而反映分子中的基團(tuán)類(lèi)型、分支數(shù)以及分子形狀等拓?fù)湫畔?。由于不同分子拓?fù)渲笖?shù)的適用范圍存在差異,為了量化絕緣氣體分子內(nèi)部具體組成結(jié)構(gòu),進(jìn)而基于基團(tuán)貢獻(xiàn)計(jì)算影響氣體絕緣強(qiáng)度的特征基團(tuán),就必須先從多種類(lèi)分子拓?fù)渲笖?shù)中選出反映各絕緣氣體分子的拓?fù)湫畔?。可?yīng)用于計(jì)算過(guò)程的目標(biāo)分子拓?fù)渲笖?shù)需具備如下特點(diǎn):①對(duì)樣本內(nèi)全部絕緣氣體分子均有效;②可以充分表征絕緣氣體分子自身的立體結(jié)構(gòu)與拓?fù)洵h(huán)境等性質(zhì);③能對(duì)不同基團(tuán)進(jìn)行明顯地區(qū)分和表征,也就是對(duì)于不同結(jié)構(gòu)存在唯一性;④和絕緣強(qiáng)度相關(guān)性好。
特點(diǎn)①~③由分子描述符適用范圍與計(jì)算原理決定,而特點(diǎn)④則需對(duì)氣體絕緣強(qiáng)度和分子拓?fù)渲笖?shù)進(jìn)行相關(guān)性計(jì)算分析,也就是采用多種數(shù)學(xué)統(tǒng)計(jì)指標(biāo)去判斷二者的相關(guān)性是否良好。
計(jì)算分子拓?fù)渲笖?shù)的一般程序?yàn)椋菏紫劝逊肿咏Y(jié)構(gòu)進(jìn)行圖形化處理,再把圖形數(shù)值化處理為矩陣。計(jì)算化學(xué)領(lǐng)域常用的分子拓?fù)渲笖?shù)包括分子連接指數(shù)(molecular connectivity index,MIC)、Kappa 指數(shù)、Wiener 指數(shù)以及電性拓?fù)錉顟B(tài)指數(shù)(electrotopological state indices,ETSI)等。MIC只能反映分子尺寸和分子之間的聯(lián)系,不能表征原子價(jià)態(tài)、拓?fù)洵h(huán)境和電性等信息。而Kappa指數(shù)只能用來(lái)刻畫(huà)分子柔性與形狀,不能滿(mǎn)足分子拓?fù)渲笖?shù)特性。Wiener 指數(shù)通過(guò)圖形化分子結(jié)構(gòu)再寫(xiě)距離矩陣來(lái)計(jì)算,雖然能實(shí)現(xiàn)分子結(jié)構(gòu)的數(shù)字化,但它僅能區(qū)分分子類(lèi)型,無(wú)法判斷分子中所含基團(tuán)的類(lèi)型,也就是不能對(duì)基團(tuán)進(jìn)行數(shù)字化表示。其他相似條件下分子拓?fù)渲笖?shù)也較多,而電性拓?fù)錉顟B(tài)指數(shù)能夠充分表征化合物分子本身的立體結(jié)構(gòu)、取代基、電性效應(yīng)影響等性質(zhì),它能更好地描述分子中原子或基團(tuán)之間的相互作用及其影響。經(jīng)過(guò)以上分析,本文采用電性拓?fù)錉顟B(tài)指數(shù)來(lái)表征各絕緣氣體分子拓?fù)浣Y(jié)構(gòu)。
使用分子軌道理論對(duì)分子中的電子排布進(jìn)行分析時(shí),分析的是整個(gè)分子空間內(nèi)電子的狀態(tài)變化。每個(gè)原子在分子中都會(huì)受到分子內(nèi)部其他原子的擾動(dòng),因此當(dāng)原子在構(gòu)成分子時(shí),分子整體的軌道及能級(jí)由隸屬于某一個(gè)原子的電子同其他的微觀粒子一起構(gòu)成。電性拓?fù)錉顟B(tài)指數(shù)能夠?qū)⒒衔锓肿拥慕Y(jié)構(gòu)信息(拓?fù)浣Y(jié)構(gòu)、成鍵價(jià)態(tài)和原子電子結(jié)構(gòu)等)以數(shù)字形式來(lái)表征,進(jìn)而定量地描述分子內(nèi)部每個(gè)原子所處的拓?fù)洵h(huán)境以及同分子中其他原子間的電性相互作用。其計(jì)算含原子本征值與擾動(dòng)值兩部分[17],本征值計(jì)算公式如式(1)所示。
式(1)中:δi=σi-h;=σi+πi+ki-h;Ni是原子i上電子層的層數(shù);σi、πi與ki分別是原子i所成σ鍵數(shù)、π鍵數(shù)和孤對(duì)電子數(shù);h是直接鍵合在原子i上的氫原子個(gè)數(shù)。
由Ii的計(jì)算可知,Ni表示的電子層數(shù)可表征原子的大小,其數(shù)值愈大,本征值愈低。1/δi可表征原子連接程度,即體現(xiàn)原子拓?fù)浣Y(jié)構(gòu)。δvi/δi表征原子價(jià)電子密度,即刻畫(huà)原子電子結(jié)構(gòu)特征。
原子i本征態(tài)所受擾動(dòng)ΔIi可表示為式(2)。
式(2)中:Ij是原子j的本征值;r2ij是原子i、j間最短路徑數(shù)加上1。
某原子的電性拓?fù)錉顟B(tài)指數(shù)就是該原子的本征值與其他原子對(duì)其的擾動(dòng)值之和,如式(3)所示。
再把屬于同一原子類(lèi)型的全部原子的電性拓?fù)錉顟B(tài)指數(shù)計(jì)算結(jié)果相加,即可得到分子中所含各原子類(lèi)型的電性拓?fù)錉顟B(tài)指數(shù)(electrotopological state indices for atom type,ETSIAT)。
要研究絕緣氣體分子中基團(tuán)與絕緣強(qiáng)度間的定量構(gòu)效關(guān)系,必須先確定氣體分子的絕緣強(qiáng)度數(shù)據(jù)、分子的種類(lèi)與結(jié)構(gòu)。為使絕緣強(qiáng)度數(shù)據(jù)可靠,本研究根據(jù)如下3個(gè)原則來(lái)尋找和甄別氣體中絕緣強(qiáng)度數(shù)據(jù)[6,12-15]:
(1)本研究采用相同環(huán)境條件、均勻電場(chǎng)、相同氣體壓力和放電間距,同時(shí)采用SF6作為內(nèi)標(biāo)進(jìn)行實(shí)驗(yàn)測(cè)量。
(2)去除對(duì)實(shí)驗(yàn)結(jié)果存在爭(zhēng)議的氣體分子,如SO2,它的絕緣強(qiáng)度為0.52~1.50,明顯無(wú)法應(yīng)用于構(gòu)效關(guān)系模型的構(gòu)建。
(3)氣體樣本絕緣強(qiáng)度數(shù)據(jù)符合正態(tài)分布。
所建的樣本集含有47 個(gè)絕緣氣體分子并標(biāo)有氣體CAS(chemical abstracts service)號(hào)碼,用來(lái)區(qū)分同分異構(gòu)體,詳見(jiàn)表1,其中Er是相對(duì)于SF6的絕緣強(qiáng)度數(shù)值,所選數(shù)值為臨界電氣強(qiáng)度。表中含有2~18 個(gè)C、H、O、N、S、F、Cl、Br 原子構(gòu)成的多種有機(jī)或無(wú)機(jī)氣體分子,氣體類(lèi)型完整,絕緣強(qiáng)度分布模式較廣泛,適用于構(gòu)效關(guān)系模型。樣本集氣體的絕緣強(qiáng)度Q-Q 圖如圖1 所示,Q-Q 圖將所有樣本氣體的絕緣強(qiáng)度數(shù)值作為X 軸數(shù)據(jù),Y 軸數(shù)據(jù)則對(duì)應(yīng)其正態(tài)分布分位數(shù)。由圖1 可見(jiàn)當(dāng)絕緣強(qiáng)度低于1時(shí)各點(diǎn)均繞對(duì)角線分布,表明樣本集大部分?jǐn)?shù)據(jù)近似于符合正態(tài)分布。
表1 絕緣氣體絕緣強(qiáng)度數(shù)據(jù)Tab.1 Insulation strength data of insulating gases
圖1 樣本氣體絕緣強(qiáng)度Q-Q圖Fig.1 Q-Q diagram of insulation strength of air samples
基于以上理論,本文對(duì)樣本集中47種絕緣氣體分子的原子類(lèi)型電性拓?fù)錉顟B(tài)指數(shù)(ETSIAT)進(jìn)行計(jì)算,全部氣體分子共有22 種類(lèi)型的ETSIAT 值。除ETSIAT 外,基團(tuán)電性拓?fù)錉顟B(tài)指數(shù)也能將基團(tuán)所含全部原子的電性拓?fù)錉顟B(tài)指數(shù)相加,以表征基團(tuán)的電子與結(jié)構(gòu)信息[18],故本文還對(duì)絕緣氣體分子C5F10O 內(nèi)包含的羰基與C4F7N 內(nèi)包含的氰基基團(tuán)電性拓?fù)錉顟B(tài)指數(shù)進(jìn)行了計(jì)算,以豐富絕緣氣體樣本集中的自變量類(lèi)型,避免漏掉對(duì)氣體分子絕緣強(qiáng)度可能產(chǎn)生顯著影響的特征基團(tuán)。表2為兩個(gè)基團(tuán)類(lèi)型電性拓?fù)錉顟B(tài)指數(shù)的本征值和絕緣氣體分子中所含的原子類(lèi)型電性拓?fù)錉顟B(tài)指數(shù)的本征值,符號(hào)S 代表ETSI,s 代表一個(gè)單鍵,d 代表一個(gè)雙鍵,t 代表一個(gè)三鍵。
表2 電性拓?fù)錉顟B(tài)指數(shù)本征值Tab.2 Eigenvalue of electrotopological state indices
確定了樣本數(shù)據(jù)后,接下來(lái)進(jìn)行自變量的篩選與模型的建立。本文使用逐步多元回歸法進(jìn)行電性拓?fù)渲笖?shù)的篩選與建模,自變量的篩選原則如下:
(1)為了統(tǒng)計(jì)結(jié)果的顯著性并且對(duì)樣本能夠進(jìn)行抽一法交互檢驗(yàn)(leave-one-out cross validation,LOO-CV),去掉只對(duì)1 個(gè)樣本具有非零值的自變量。
(2)計(jì)算并判斷每次進(jìn)出模型自變量F值的顯著性水平,在自變量F值顯著水平低于0.05時(shí),變量可選擇進(jìn)入模型,若顯著性水平高于0.10 則移出模型。
圖2 為計(jì)算步驟流程圖。依照?qǐng)D2 計(jì)算流程,采用逐步多元回歸法,最后構(gòu)建回歸方程如式(4)所示。
圖2 計(jì)算流程圖Fig.2 Calculation flow chart
式(4)中,各自變量的符號(hào)含義如表3所示。
定量構(gòu)效關(guān)系中的最后一步是模型的檢驗(yàn)與評(píng)價(jià),最常使用決定系數(shù)R2和調(diào)整決定系數(shù)Adj.R2來(lái)檢驗(yàn)與評(píng)價(jià)模型的預(yù)測(cè)能力和穩(wěn)健性。經(jīng)計(jì)算得到該模型中決定系數(shù)R2=0.899,調(diào)整決定系數(shù)Adj.R2=0.885,同時(shí)利用抽一法交互檢驗(yàn)(LOO-CV)對(duì)所建模型進(jìn)行驗(yàn)證,計(jì)算得到模型的交叉驗(yàn)證系數(shù)=0.849,可見(jiàn)各統(tǒng)計(jì)指標(biāo)均表現(xiàn)良好,說(shuō)明本研究建立的模型穩(wěn)定性好、預(yù)測(cè)能力強(qiáng)。表3 為篩選出來(lái)的6個(gè)特征基團(tuán)即各自變量的符號(hào)含義和相關(guān)統(tǒng)計(jì)量數(shù)據(jù)。自變量標(biāo)準(zhǔn)化回歸系數(shù)(variance inflation factor,VIF)代表了其他自變量不變情況下自變量變化1 個(gè)單位后因變量的平均變化量,可反映它們對(duì)絕緣強(qiáng)度的影響程度。
表3 各自變量相關(guān)統(tǒng)計(jì)量數(shù)據(jù)Tab.3 Statistics related to each variable
由表3 可知,該模型的各變量與絕緣強(qiáng)度都有明顯的正向影響關(guān)系,同時(shí)各變量間沒(méi)有自相關(guān)關(guān)系。
基團(tuán)的含義在基團(tuán)取代法中,既可包括單原子也可包括多原子,為便于表達(dá),本研究把經(jīng)過(guò)篩選后全部由單原子或者多原子構(gòu)成的基團(tuán)都統(tǒng)一稱(chēng)為基團(tuán)。因?yàn)楸绕鹩迷撃P蛠?lái)預(yù)測(cè)絕緣強(qiáng)度值,本文更注重通過(guò)在分子拓?fù)渲笖?shù)和絕緣強(qiáng)度之間構(gòu)建定量函數(shù)模型,來(lái)得到絕緣氣體分子中對(duì)其絕緣強(qiáng)度影響顯著的基團(tuán),以便為用基團(tuán)取代方式進(jìn)行絕緣氣體分子設(shè)計(jì)時(shí)給出優(yōu)先考慮的基團(tuán)種類(lèi),所以為避免因結(jié)構(gòu)信息缺失造成預(yù)測(cè)準(zhǔn)確度下降,對(duì)不包含這6 個(gè)篩選基團(tuán)的分子,應(yīng)通過(guò)分子層面上的構(gòu)效關(guān)系模型開(kāi)展預(yù)測(cè)與計(jì)算。
在該模型中,所有基團(tuán)系數(shù)為正,說(shuō)明隨著6個(gè)基團(tuán)的電性拓?fù)錉顟B(tài)指數(shù)增大,氣體絕緣強(qiáng)度也將增大。其中,=C=的本征值為2.50,位于所有自變量本征值的中間水平,比大多數(shù)碳鏈基團(tuán)的本征值大,而比其他主族元素基團(tuán)的本征值小。>CH-的本征值為1.33,處于所有自變量本征值的較低水平,因?yàn)槠渌蟛糠衷訉?duì)于>CH-的擾動(dòng)均為負(fù)值,故計(jì)算得到的電性拓?fù)錉顟B(tài)指數(shù)會(huì)比它的本征值要小。=C=和>CH-兩種基團(tuán)均含C 元素,通常充當(dāng)連接性基團(tuán),即組成碳鏈基本骨架,形成的碳鏈越長(zhǎng),各原子間相互作用越弱,ETSI 越趨近于它的本征值,即分子內(nèi)其他原子對(duì)其干擾較小。反映到模型中即其對(duì)因變量的正向影響增大,使氣體分子絕緣強(qiáng)度得到提高。
樣本集氣體分子中CHFCl2、CHF2Cl、CF3H 不僅具有相似的結(jié)構(gòu)并且均含有>CH-基團(tuán),它們的絕緣強(qiáng)度依次為0.92、0.42、0.36。樣本集氣體分子中含=C=的氣體分子有COS 與CO2,其絕緣強(qiáng)度依次為0.90、0.35。兩組氣體分子結(jié)構(gòu)相同,區(qū)別是碳基團(tuán)所連的同一主族元素電負(fù)性不一樣。圖3為一些主族元素電負(fù)性推薦值,可見(jiàn)O 元素的電負(fù)性大于S 的電負(fù)性,F(xiàn)、Cl、Br、I元素的電負(fù)性依次減小。對(duì)于同主族元素,在元素周期表位置越靠下,則原子體積越大。故在分子結(jié)構(gòu)一致并且分子中含有相同原子個(gè)數(shù)的情況下,同=C=與>CH-相連的基團(tuán)電負(fù)性越小,其體積就會(huì)越大,其他原子對(duì)=C=與>CH-的擾動(dòng)越小,這對(duì)提高氣體分子的絕緣強(qiáng)度是相當(dāng)有利的。
圖3 電負(fù)性推薦值Fig.3 Recommended value of electronegativity
篩選得到的另外4 個(gè)基團(tuán),>C=O 本征值為6.67,-Cl 本征值為4.11,-C≡N 本征值為6.50,-F 本征值為8.00,它們的本征值位于全部自變量基團(tuán)中較高數(shù)值水平,受到其他原子的擾動(dòng)一般為正,故隨著它們ETSI的增大,其絕緣強(qiáng)度也將提高。除此之外,4 個(gè)基團(tuán)均具有較高的電負(fù)性值,-C≡N 的電負(fù)性值是2.80,-Cl 的電負(fù)性值是3.16,-F 的電負(fù)性值是3.98[19]。因>C=O 碳原子上的另外兩個(gè)鍵可與其他原子或基團(tuán)以單鍵或者雙鍵的方式結(jié)合,所以電負(fù)性值具有不確定性,但是通常它們比鹵族元素具有更大的電負(fù)性。例如>C=O 若與F 原子鍵合成-COF,則基團(tuán)的電負(fù)性值為3.32。從上述分析中可發(fā)現(xiàn),篩選得到的其他4 個(gè)基團(tuán)在電性拓?fù)錉顟B(tài)指數(shù)本征值上均表現(xiàn)出高數(shù)值水平,均為高電負(fù)性值基團(tuán)。
相對(duì)于量化參數(shù)這種分子層面上的分子描述符,本文中計(jì)算分子拓?fù)渲笖?shù)的過(guò)程不需要對(duì)每一種絕緣氣體分子結(jié)構(gòu)進(jìn)行逐一優(yōu)化計(jì)算,極大地降低了計(jì)算成本,并且能夠在更精細(xì)的基團(tuán)層面上研究影響氣體絕緣強(qiáng)度的因素,得到顯著影響氣體絕緣強(qiáng)度的特征基團(tuán)及各自貢獻(xiàn)度,為采用基團(tuán)取代方式進(jìn)行絕緣氣體分子設(shè)計(jì)提供了優(yōu)先考慮的基團(tuán)種類(lèi)。
從基團(tuán)層面出發(fā),利用分子拓?fù)渲笖?shù)定量表達(dá)絕緣氣體分子基團(tuán)結(jié)構(gòu),并考察了對(duì)絕緣強(qiáng)度有顯著影響的基團(tuán)及貢獻(xiàn)度,得到如下主要結(jié)論:
(1)用逐步多元回歸法篩選出了顯著影響絕緣強(qiáng)度的6 個(gè)基團(tuán):=C=、>CH-、-F、-C≡N、-Cl、>C=O。>CH-及=C=是兩種類(lèi)型碳鏈的基本骨架,ETSI值較低,當(dāng)分子結(jié)構(gòu)一致并且分子中含有相同原子個(gè)數(shù)的情況下,同=C=與>CH-相連的基團(tuán)電負(fù)性越小,其體積就會(huì)越大,對(duì)提高氣體分子的絕緣強(qiáng)度就越有利。
(2)-F、-C≡N、-Cl、>C=O 均具有較高的電負(fù)性值,同時(shí)ETSI值高,對(duì)于絕緣強(qiáng)度有正向促進(jìn)作用,在設(shè)計(jì)或篩選SF6替代氣體選擇基團(tuán)時(shí)可優(yōu)先考慮,但是也要注意Cl 元素的環(huán)保性能受到一定限制,因此若設(shè)計(jì)的新型氣體分子含Cl 原子,則在判斷能否推廣使用前需開(kāi)展多重條件下的測(cè)試。