仝建波, 白 敏, 趙 翔, 常 佳
(陜西科技大學(xué)化學(xué)與化工學(xué)院,陜西科技大學(xué)教育部輕化工助劑化學(xué)與技術(shù)重點(diǎn)實(shí)驗(yàn)室,陜西西安 710021)
艾滋病(Acquired Immunodeficiency Syndrome,AIDS)是由人類免疫缺陷病毒(Human Immunodeficiency Virus,HIV)感染引起的全身性傳染病[1]。HIV可分為Ⅰ型(HIV-1)和Ⅱ型(HIV-2)[2,3],二者之間存在一定的免疫交叉反應(yīng)。艾滋病絕大多數(shù)由HIV-1引起。逆轉(zhuǎn)錄酶(Reverse Transcriptase,RT)在HIV-1的復(fù)制循環(huán)中起著關(guān)鍵性的作用,因此,HIV-1逆轉(zhuǎn)錄酶是抗HIV/AIDS藥物發(fā)展中的一個重要生物靶點(diǎn)[4]。針對HIV-1逆轉(zhuǎn)錄酶的藥物分為核苷類逆轉(zhuǎn)錄酶抑制劑(Nucleoside Reverse Transcriptase Inhibitors,NRTIs)和非核苷類逆轉(zhuǎn)錄酶抑制劑(Non-nucleoside Reverse Transcriptase Inhibitors,NNRTIs)[5]。NNRTIs類藥物具有活性高、毒性低、結(jié)構(gòu)多樣化、酶的結(jié)構(gòu)清楚、藥物作用靶點(diǎn)明確等優(yōu)點(diǎn)[6 - 8],因此一直是尋找新的抗艾滋病藥物的重要方向之一。
定量構(gòu)效關(guān)系(QSAR)作為一種重要的藥物設(shè)計(jì)方法,通常來講有兩種QSAR模型:2D-QSAR和3D-QSAR。CoMFA[9]是3D-QSAR中應(yīng)用比較廣泛的一種方法。本文采用第二代CoMFA方法,即Topomer CoMFA[10,11]方法對41個HIV-1逆轉(zhuǎn)錄酶抑制劑進(jìn)行3D-QSAR分析。所建立的Topomer CoMFA模型結(jié)合Topomer Search[12]技術(shù)可以進(jìn)行基于配體的虛擬篩選,為新藥的設(shè)計(jì)奠定基礎(chǔ)。不同于CoMFA的是:Topomer CoMFA是通過一系列完全客觀一致的疊合規(guī)則完成3D-QSAR分析的準(zhǔn)備工作,并且具有重復(fù)性高的優(yōu)勢。利用Topomer CoMFA方法可以快速建立預(yù)測模型并進(jìn)行分析與評價,為同類小分子抑制劑的結(jié)構(gòu)優(yōu)化提供理論依據(jù)[13]。
41個HIV-1逆轉(zhuǎn)錄酶抑制劑分子結(jié)構(gòu)與活性數(shù)據(jù)見表1[14]?;钚詷?biāo)度為pIc50(-logIc50),其中Ic50值為HIV-1病毒感染細(xì)胞半數(shù)抑制濃度。按照隨機(jī)化原則將數(shù)據(jù)集劃分為36個訓(xùn)練集分子和5個測試集分子,訓(xùn)練集用來建立模型,測試集用以驗(yàn)證模型的外部預(yù)測能力。此外,對13號和34號分子的不同構(gòu)象進(jìn)行了驗(yàn)證,結(jié)果見表1。
表141個HIV-1逆轉(zhuǎn)錄酶抑制劑的結(jié)構(gòu)及其pIc50
No.R1R2R3XExperimental pIc50Predicted pIc5013-CF3MeCH2OCH2CH2OHO4.354.3123-FMeCH2OCH2CH2OHO5.485.4033-ClMeCH2OCH2CH2OHO4.895.0143-BrMeCH2OCH2CH2OHO5.245.1253-IMeCH2OCH2CH2OHO5.005.0563-NO2MeCH2OCH2CH2OHO4.474.5273-OHMeCH2OCH2CH2OHO4.094.1383-OMeMeCH2OCH2CH2OHO4.664.6593,5-Me2MeCH2OCH2CH2OHO6.596.71103,5-Cl2MeCH2OCH2CH2OHO5.896.0711Hi-PrCH2OCH2CH2OHO7.207.42123,5-Me2EtCH2OCH2CH2OHO7.897.52133,5-Me2i-PrCH2OCH2CH2OHO8.578.50,8.3914HMeCH2OCH2PhO7.067.0115HEtCH2OCH2MeO7.727.5816HEtCH2OCH2MeS7.587.4517a3,5-Me2EtCH2OCH2MeO8.248.67183,5-Me2EtCH2OCH2MeS8.308.5419HEtCH2O-c-HexS5.795.6920HEtCH2OCH2-c-HexS6.456.4321HEtCH2OCH2C6H4(4-Me)S7.117.1822HEtCH2OCH2C6H4(4-Cl)S7.927.9023HEtCH2OCH2CH2PhS7.047.09243,5-Cl2EtCH2OCH2MeO8.138.0325HEtCH2O-i-PrO6.476.5626aHEtCH2O-c-HexO5.405.7527HEtCH2OCH2-c-HexO6.356.4728aHEtCH2OCH2CH2PhO7.047.11294-NO2MeCH2OCH2CH2OHO3.723.6830a4-CNMeCH2OCH2CH2OHO3.603.34314-OHMeCH2OCH2CH2OHO3.563.44324-OMeMeCH2OCH2CH2OHO3.603.64334-COMeMeCH2OCH2CH2OHO3.963.96344-COOHMeCH2OCH2CH2OHO3.453.48,3.38353-CONH2MeCH2OCH2CH2OHO3.513.5336HCOOMeCH2OCH2CH2OHO5.185.1637aHCONHPhCH2OCH2CH2OHO4.744.1338HSPhCH2OCH2CH2OHO4.684.6739HCCHCH2OCH2CH2OHO4.744.6740HCCPhCH2OCH2CH2OHO5.475.52413-NH2MeCH2OCH2CH2OHO3.603.61
aChosen as the test set.
圖1 13號分子的切割方式Fig.1 Cutting style of molecule 13
采用Sybyl 2.0-X軟件包中的sketch molecule模塊繪制出化合物的結(jié)構(gòu),對所有的化合物分子進(jìn)行優(yōu)化,優(yōu)化過程采用Powell能量梯度法、Tripos力場,能量收斂設(shè)為0.05 kcal/mol,優(yōu)化次數(shù)設(shè)定為1 000次,分子荷載電荷為Gasteiger-Huckel電荷,其余參數(shù)以Sybyl 2.0-X默認(rèn)。
以活性最高的13號分子為模板對36個訓(xùn)練集化合物的結(jié)構(gòu)進(jìn)行切割,切割方式如圖1。選擇以S為中心進(jìn)行切割生成Ra和Rb基團(tuán),接著軟件會對其余的分子結(jié)構(gòu)自動識別并進(jìn)行切割,最后對Ra和Rb基團(tuán)周圍的立體場和靜電場進(jìn)行計(jì)算,并采用偏最小二乘回歸分析法[15]建模生成3D-QSAR模型。采用留一法交互驗(yàn)證評價模型的內(nèi)部預(yù)測能力。利用建立的Topomer CoMFA模型對5個測試集化合物的活性進(jìn)行預(yù)測,以此評價模型的外部預(yù)測能力。
采用Topomer Search技術(shù)可以從大量的化合物數(shù)據(jù)庫中篩選出R基團(tuán)(R-groups)。本文利用建立的Topomer CoMFA模型對ZINC(2012)數(shù)據(jù)庫中的Drug-like類(包含130 000個分子)進(jìn)行篩選,以得到具有高活性貢獻(xiàn)的Ra和Rb基團(tuán),其中Topomer距離值設(shè)置為185,其他參數(shù)以Sybyl 2.0-X默認(rèn)。
圖2 41個抑制劑生物活性的實(shí)驗(yàn)值與預(yù)測值的線性回歸圖Fig.2 Linear regression between experimental and predicted pIC50of 41 inhibitors
圖3 Topomer CoMFA模型三維等勢圖Fig.3 3D contour of Topomer CoMFA model(a)steric field map of Ra;(b)electrostatic field map of Ra;(c)steric field map of Rb;(d)electrostatic field map of Rb.
以13號分子為模板,Topomer CoMFA三維等勢圖見圖3。圖3(a)和3(c)分別表示Ra和Rb基團(tuán)的立體場等勢圖,綠色區(qū)域表示引入體積較大的取代基有利于活性的提高,黃色區(qū)域表示不宜引入體積較大的取代基。圖3(b)與3(d)分別表示Ra和Rb基團(tuán)的靜電場等勢圖,紅色區(qū)域表示引入負(fù)電性取代基有利于活性的提高,藍(lán)色區(qū)域表示引入正電性取代基有利于活性的提高。圖3(a)中,R3取代基鏈端有大片黃色區(qū)域,R2取代基鏈端有大片綠色區(qū)域。圖3(b)中R3取代基近端有大塊藍(lán)色和紅色區(qū)域,R2取代基周圍有大塊藍(lán)色區(qū)域。圖3(c)中苯環(huán)的3位點(diǎn)和4位點(diǎn)處有大片黃色區(qū)域,5位點(diǎn)處有大塊綠色區(qū)域。圖3(d)中苯環(huán)的3位點(diǎn)、4位點(diǎn)和5位點(diǎn)處有大塊紅色區(qū)域。
綜上所述,Ra基團(tuán)的R3取代基處不適宜引入體積大的基團(tuán),例如以-CH2OCH2CH2OH取代17號分子的-CH2OCH2Me得到12號分子后活性降低。R2取代基處適宜引入體積較大的基團(tuán),例如以體積較大的異丙基取代12號分子的乙基得到13號分子后活性明顯增大。Rb基團(tuán)中苯環(huán)的3位和4位點(diǎn)處適宜引入體積較小并帶負(fù)電的基團(tuán),5位點(diǎn)處適宜引人體積較大并帶負(fù)電的基團(tuán),例如2號分子在此處引入體積小并帶負(fù)電的氟基,而7號分子引入體積比氟基大并帶正電的羥基,因此2號分子的活性大于7號分子。31、32號分子的活性較低是因?yàn)樵诒江h(huán)的4位點(diǎn)處引入了體積大的羥基和甲氧基。
Topomer Search的結(jié)果中主要包含兩項(xiàng):Topomer距離和R基團(tuán)的活性貢獻(xiàn)值。Topomer距離通過計(jì)算值評價化合物與提問結(jié)構(gòu)基團(tuán)的結(jié)構(gòu)相似性程度;而R基團(tuán)的活性貢獻(xiàn)則是基于Topomer CoMFA模型對R基團(tuán)活性值的預(yù)測打分。基于Topomer CoMFA模型,采用Topomer Search技術(shù)對ZINC(2012)數(shù)據(jù)庫進(jìn)行篩選,得到5個Ra基團(tuán)和5 000個Rb基團(tuán),以活性最高的13號分子為模板進(jìn)行過濾,挑選出明顯高于13號分子的Ra和Rb貢獻(xiàn)值的R基團(tuán)。最終得到1個Ra基團(tuán)和20個Rb基團(tuán)。
用最終篩選得到的Ra和Rb基團(tuán)分別替換13號分子的Ra和Rb基團(tuán),得到20個新化合物分子的結(jié)構(gòu),對新分子進(jìn)行優(yōu)化,優(yōu)化方法同41個樣本分子,利用建立的Topomer CoMFA模型對新化合物進(jìn)行活性預(yù)測,結(jié)果有19個新設(shè)計(jì)的化合物預(yù)測活性值高于13號分子。新設(shè)計(jì)的分子Ra附近取代基團(tuán)體積增大,因此活性有所增大。另外,化合物的活性高低還會受Rb基團(tuán)影響。
本文采用Topomer CoMFA方法對36個訓(xùn)練集HIV-1逆轉(zhuǎn)錄酶抑制劑進(jìn)行了三維定量構(gòu)效關(guān)系分析,并利用所建立的模型對5個測試集抑制劑進(jìn)行了活性預(yù)測。采用Topomer Search技術(shù)對ZINC數(shù)據(jù)庫進(jìn)行R基團(tuán)的虛擬篩選,并設(shè)計(jì)出20個具有更高活性的抑制劑分子。結(jié)果表明利用Topomer CoMFA方法能夠建立有效的3D-QSAR模型,可以對未知化合物的生物活性進(jìn)行預(yù)測,利用Topomer Search可以有效的從數(shù)據(jù)庫中篩選出有高貢獻(xiàn)的R基團(tuán),用以設(shè)計(jì)出新的藥物分子,為抗艾滋病新藥設(shè)計(jì)提供了新的候選物。