許 范, 蘇俊奎, 文 燕, 甘禮社, *
1. 五邑大學生物科技與大健康學院, 廣東 江門 529020 2. 浙江大學藥學院現(xiàn)代中藥研究所, 浙江 杭州 310058
有機小分子化合物尤其是天然產(chǎn)物, 一般具有多個手性中心, 而確定手性中心的絕對構(gòu)型是結(jié)構(gòu)鑒定中的難點之一。 目前確定手性分子絕對構(gòu)型的方法有: 手性有機合成; 基于NMR的Mosher法或位移試劑法[1]; X射線單晶衍射; 手性光譜學方法等。 在這些方法中, 相對于手性有機合成過程的繁瑣復(fù)雜; 基于NMR的Mosher法中要求化合物中必須含有易于衍生化的基團、 需要昂貴的手性試劑而且會對樣品造成損失; 以及基于Bijvoet法的X射線單晶衍射(或Cu靶)需要樣品純度高、 合適的培養(yǎng)條件等要求; 手性光譜學方法對于樣品的純度、 能夠結(jié)晶等條件要求不高, 測量所需樣品量少, 測量之后樣品可回收, 因此得到了廣泛地應(yīng)用。
電子圓二色光譜(electronic circular dichroism, ECD)是手性光譜法中最常用的手段之一。 通過手性化合物溶液的左旋圓偏光和右旋圓偏光的吸收系數(shù)之差Δε, Δε隨波長變化即可獲得圓二色光譜, 它對絕對構(gòu)型和構(gòu)象特征十分敏感[2]。 傳統(tǒng)的圓二色光譜所用的平面偏振光的波長范圍一般在200~400 nm, 屬于紫外區(qū), 由于其吸收光譜是分子電子能級躍遷引起的, 稱為電子圓二色光譜。
目前, 傳統(tǒng)的半經(jīng)驗規(guī)律已經(jīng)難以滿足對ECD譜圖的解釋, 隨著計算機技術(shù)的迅速發(fā)展以及密度泛函理論(density functional theory, DFT)[3]和含時密度泛函理論(time-dependent density functional theory, TDDFT)[4-5]的成熟, 量子化學計算已經(jīng)成為一種越來越強大的工具。 通過ECD的理論計算與實驗值進行比較, 已成為確定有機小分子絕對構(gòu)型的有效流行技術(shù)[6-8]。
在ECD計算模擬過程中, 常常涉及多個構(gòu)象的數(shù)據(jù)處理、 加合、 參數(shù)調(diào)整、 評價等繁瑣過程, 導(dǎo)致數(shù)據(jù)處理量大, 標準不統(tǒng)一。 本課題組一直致力于ECD的計算模擬確定小分子絕對構(gòu)型的研究, 在本文中, 我們對目前ECD模擬技術(shù)方法進行了總結(jié), 更利用Python語言開發(fā)了一款自動化處理高斯ECD計算結(jié)果、 模擬ECD曲線的軟件(ECD Curve, Windows版), 能夠進行實時模擬參數(shù)調(diào)節(jié)并與實測曲線對比。 該軟件專門針對ECD的Gaussian計算結(jié)果, 依據(jù)高斯函數(shù)展寬, 從而得到某個構(gòu)象的理論光譜圖, 只需將輸出文件拖拽進入相應(yīng)的文件框中, 即可自動生成相應(yīng)的理論光譜圖, 對半高全寬等參數(shù)的調(diào)整即可獲得該化合物的理論光譜圖, 極大地方便了ECD計算結(jié)果的數(shù)據(jù)處理和作圖過程。
計算ECD常用的量子化學程序有Gaussian[9]和Dalton[10]兩種軟件, 其中Dalton是免費軟件, 主要用來計算閉殼層的基態(tài)。 Gaussian是一款商用軟件, 可在不同型號的大型計算機, 超級計算機, 工作站和個人計算機上運行, 具備Linux版本和Windows版本, 并且搭配GaussView的可視化軟件, 是目前計算化學領(lǐng)域內(nèi)流行、 應(yīng)用范圍廣的綜合性量子化學計算程序包。
1.2.1 ECD理論光譜模擬原理
計算所得的圓二色光譜數(shù)據(jù)主要是化合物的某一構(gòu)象在一系列能量狀態(tài)(波長)下的電子激發(fā)能(eV)和轉(zhuǎn)子強度的數(shù)據(jù)(10-40erg-esu-cm), 由于在實驗中得到的圓二色光譜的吸收帶的強度是在一段波長范圍內(nèi)分布的, 因此需要用到Gaussian函數(shù)進行吸收帶的線性模擬展寬, 其理論公式表示如式(1)
(1)
式(1)中, ΔEi和Ri分別代表i態(tài)下的電子激發(fā)能和轉(zhuǎn)子強度,σ為譜峰的半高全寬, 這些均是調(diào)整ECD理論光譜圖的重要參數(shù)。
1.2.2 玻爾茲曼分布理論
一個化合物在溶液中是由多種構(gòu)象組成的一個混合體, 而每個構(gòu)象根據(jù)其能量的大小占全部構(gòu)象的比例服從玻爾茲曼分布
(2)
式(2)中,ρi為i構(gòu)象所占比例,i、j為構(gòu)象編號;ni為處于第i構(gòu)象的分子數(shù); ΔGi是指構(gòu)象i相對于最低能構(gòu)象的吉布斯自由能(kcal·mol-1);T為溫度, 一般為室溫(298.15 K);R理想氣體常數(shù)(0.001 985 899 5)。
1.3.1 數(shù)據(jù)處理和譜圖擬合
(1)利用Excel數(shù)組公式實現(xiàn)的數(shù)據(jù)處理方法
數(shù)組公式是公式在以數(shù)組為參數(shù)時的一種應(yīng)用。 數(shù)組公式可以看成是有多重數(shù)值的公式。 與單值公式的不同之處在于它可以產(chǎn)生一個以上的結(jié)果。 本課題組利用Excel數(shù)組公式實現(xiàn)計算ECD的理論光圖譜的模擬, 主要根據(jù)前述1.2.1介紹的ECD計算的高斯函數(shù)展寬公式, 將ECD計算得到的第1~60個電子激發(fā)能(eV)和轉(zhuǎn)子強度的數(shù)據(jù)(10-40erg-esu-cm)分別填入Excel中。 其中A列A1:A60為該構(gòu)象計算所得的60個激發(fā)態(tài)的電子激發(fā)能, B列B1:B60為對應(yīng)的60個激發(fā)態(tài)的轉(zhuǎn)子強度。 在A列61中設(shè)置一個波長(如150~450 nm中的起始150 nm), 則B列61中可用數(shù)組公式=SUM((A$1:A$60)*(B$1:B$60)*EXP(-POWER(((1240/A61)-(A$1:A$60))/($C$1), 2)))/(22.96*($C$1)*SQRT(PI()))計算出該波長下的理論ECD吸收值(Δε)。 以此類推, 填滿150~450 nm波長范圍, 就可以自動求出每個波長下的數(shù)值, 從而獲得某個構(gòu)象的ECD曲線數(shù)據(jù)。 多個優(yōu)勢構(gòu)象又依據(jù)玻爾茲曼分布占比在Excel表格中設(shè)定公式進行加權(quán), 生成該化合物的總的計算ECD的理論光譜圖。 將此編輯完成的Excel表格保存, 在Origin軟件中打開, 以兩列數(shù)據(jù)(X軸為波長、Y軸為Δε)作圖, 可以得到最終呈現(xiàn)的ECD理論光譜圖。
圖1 ECD計算的流程圖
(2)運用已開發(fā)的軟件實現(xiàn)的方法
除了Gaussview軟件之外, SpecDis[11]是一個處理計算化學結(jié)果的小工具。 此工具需要先提取幾何優(yōu)化和振動分析后得到的輸出文件中的吉布斯自由能, 并且自動新建gibb的文件夾, 將所有構(gòu)象的吉布斯自由能保存成為allheats.txt之后, 抓取與計算ECD相關(guān)的激發(fā)態(tài)等參數(shù), 自動新建spectra的文件夾, 生成相應(yīng)的各個構(gòu)象的*.bil文件。 最后, 需要在此選擇路徑打開之前的gibb的文件夾和各個構(gòu)象的*.bil文件, 相應(yīng)的計算ECD曲線生成。 就整個操作流程來說, 操作步驟過多, 略顯繁瑣, 對于數(shù)據(jù)處理過程不夠簡便。
Multiwfn[12]是由盧天開發(fā)的一款功能強大的波函數(shù)分析軟件, 但也需要將優(yōu)化完生成的吉布斯自由能以及各個構(gòu)象相應(yīng)的玻爾茲曼分布占比需要匯總在命名為multiple.txt的文件中, 并且與相應(yīng)的計算ECD相關(guān)參數(shù)的輸出文件保存在同一路徑下。 整體來說, 流程不夠簡便, 一旦涉及多構(gòu)象的處理就顯得繁瑣。
1.3.2 理論ECD和實測ECD對比
在ECD光譜圖中呈現(xiàn)正峰的為正cotton效應(yīng), 負峰的為負cotton效應(yīng)。 最終確定化合物絕對構(gòu)型主要是將計算得到的ECD的理論光譜圖與通過圓二色光譜儀檢測得到的實驗ECD光譜圖進行對比, 觀察兩者出現(xiàn)的cotton效應(yīng)與波長是否一致。 當然, ECD理論光譜圖可以進行適當?shù)恼{(diào)整, 使得ECD的理論光譜圖與實測的ECD光譜圖更好地吻合, 但也應(yīng)該限定在有限的范圍內(nèi), 否則極容易出錯。 一般設(shè)置在0.2~0.6 eV范圍內(nèi), 以0.4為最常見。 由于實際測定過程中能量的衰減和耗散, 預(yù)測的理論ECD 光譜相對實測值可能會有一定的整體偏移, 通常可以進行在-30~+30 nm之間的平移[13-14]。 除了肉眼對比觀察之外, SpecDis引入相似因子的概念以量化兩種曲線之間的匹配程度, 這是一種發(fā)展趨勢[11]。
激發(fā)態(tài)的計算不能提供完整的曲線, 而只能給出每個躍遷的激發(fā)態(tài)相對應(yīng)的轉(zhuǎn)子強度, 而要將這些數(shù)據(jù)轉(zhuǎn)化為ECD的理論光譜, 需要使用前述提及的Gaussian函數(shù)等進行理論展寬。 本軟件主要運用Python語言編寫代碼, 針對幾何優(yōu)化和振動分析的計算環(huán)節(jié)中得到的輸出文件進行數(shù)據(jù)定位, 抓取得到各個構(gòu)象的吉布斯自由能, 并且根據(jù)前述提及的玻爾茲曼分布理論進行處理, 得到各個構(gòu)象的玻爾茲曼分布占比。 同時, 將ECD性質(zhì)計算得到的輸出文件進行數(shù)據(jù)定位, 抓取得到與ECD計算相關(guān)的電子激發(fā)能(eV)和轉(zhuǎn)子強度的數(shù)據(jù)(10-40erg-esu-cm), 依據(jù)Gaussian函數(shù)展寬, 得到ECD計算的理論光譜圖。 基于以上理論及數(shù)據(jù)處理, 運用Python語言, 從而開發(fā)得到一款可以調(diào)節(jié)半高全寬σ、 構(gòu)象個數(shù)以及波長范圍的自動化處理Gaussian ECD計算結(jié)果的軟件。
對比目前已開發(fā)的軟件和利用Excel數(shù)組公式實現(xiàn)的數(shù)據(jù)處理方法, 本課題組開發(fā)的軟件操作流程更加簡單, 只需直接將幾何優(yōu)化和振動分析的輸出文件和計算ECD性質(zhì)的輸出文件拖拽進入相應(yīng)頁面板塊, 即可生成相應(yīng)的計算曲線, ECD計算譜圖的數(shù)據(jù)處理的操作流程變得更加便捷。
該軟件圖形界面主要由譜圖生成板塊、 優(yōu)化生成的輸出文件板塊、 ECD生成的輸出文件板塊以及參數(shù)設(shè)置板塊這四個板塊組成。 將優(yōu)化生成的各個優(yōu)勢構(gòu)象的輸出文件直接拖拽至OPT板塊, 各個構(gòu)象會依據(jù)玻爾茲曼分布占比顯示在Weight列中, 然后將ECD計算生成的輸出文件拖拽至ECD板塊, 然后將parm中填寫σ為半高全寬的數(shù)值,X1為波長λ的起始波長,X2為波長λ的結(jié)束波長。
圖2 軟件ECD Curve的界面
將σ、X1和X2進行修改, 或者單獨點擊log-fit、 curve-fit或者all-fit, 點擊generate, 可以生成相應(yīng)的修改之后的曲線。
該軟件免費供測試使用, 網(wǎng)址鏈接如下: https://www.onlinedown.net/soft/10019240.htm。
選取三個化合物(見圖3), 分別用Excel數(shù)組公式擬合和使用軟件ECD Curve進行擬合, 兩相對比, 驗證該軟件的吻合程度。
圖3 利用Excel數(shù)組公式和軟件ECD Curve作圖的擬合對比
根據(jù)以上三個化合物的ECD理論光譜的擬合對比來看, 由于Origin處理Excel表格數(shù)據(jù)時, 會刪減激發(fā)態(tài)以更好得擬合實測的ECD結(jié)果, 所以擬合的差異主要在200 nm以下。 從整體來看, 用軟件ECD Curve能很好地重現(xiàn)數(shù)組公式的結(jié)果, 從而證明可以用該軟件處理ECD的數(shù)據(jù)獲得可靠的模擬結(jié)果。
ECD是最成熟的手性光學方法之一, 在過去的幾十年中經(jīng)歷了巨大的技術(shù)發(fā)展, ECD無疑仍然是解決各種立體化學和分析問題的最廣泛使用的手性技術(shù)之一。 本研究對ECD曲線的模擬方法、 ECD計算結(jié)果的評價標準進行了總結(jié), 在此基礎(chǔ)上, 運用Python語言開發(fā)了一款自動化處理高斯ECD計算結(jié)果、 模擬ECD曲線的軟件, 能夠進行實時模擬參數(shù)調(diào)節(jié)并與實測曲線對比, 該軟件使用方便, 省去了使用Excel數(shù)組公式擬合曲線的繁瑣步驟, 且對比之下擬合的理論光譜圖并無明顯差異, 這極大縮短了我們在通過計算確定化合物絕對構(gòu)型過程中數(shù)據(jù)處理的過程, 很大程度上方便了我們對于ECD的理論光譜圖的獲取及其與實測值對比中的實時參數(shù)調(diào)整。