吳魯陽, 王天浩, 馮 怡, 張 星, 仝建波
(陜西科技大學 化學與化工學院 陜西省輕化工助劑重點實驗室, 陜西 西安 710021)
艾滋病,即獲得性免疫缺陷綜合癥(Acquired Immune Deficiency Syndrome,AIDS)已經(jīng)成為了當今時代仍未被攻克的醫(yī)學難題之一[1].目前,在發(fā)展中國家,人類免疫缺陷病毒/獲得性免疫缺陷綜合癥(HIV/AIDS)的流行對于公共衛(wèi)生來說仍是一個巨大的挑戰(zhàn).根據(jù)聯(lián)合國艾滋病規(guī)劃署(UNAIDS)的報告,2017年全球有近3 690萬人感染艾滋病病毒,94萬人死于艾滋病,180萬人新感染艾滋病病毒[2].我國衛(wèi)生計生委發(fā)布的《2016年我國衛(wèi)生和計劃生育事業(yè)發(fā)展統(tǒng)計公報》指出,艾滋病依然占全國甲乙類傳染病共報告死亡數(shù)的首位,占全部甲乙類傳染病共報告死亡數(shù)的78.4%[3].
人類免疫缺陷病毒(Human Immunodeficiency Virus,HIV)是消滅艾滋病的主要障礙,如何有效地抑制該病毒是當前艾滋病的研究重點之一[4].人類免疫缺陷病毒可分為兩種類型,即I型(HIV-1)和II型(HIV-2)[5-7],這兩種類型的病毒之間存在一定的聯(lián)系,而絕大多數(shù)AIDS都是由I型(HIV-1)病毒所引起的[8,9].目前,HIV的藥物主要有逆轉(zhuǎn)錄酶抑制劑、整合酶抑制劑、蛋白酶抑制劑和進入抑制劑4種[10].
吡喃酮類化合物作為一類新型抗艾滋藥物,具有良好的生物利用度,同時具備生產(chǎn)成本低、分子量小、結(jié)構(gòu)簡單等優(yōu)點,因此具有良好的研究應用前景.如果能夠進一步研究結(jié)構(gòu)、優(yōu)化設計分子并提高其生物活性,則有望成為一類新型高效抗艾滋藥物[11].
三維定量構(gòu)效關系[12]是一種應用廣泛的設計藥物分子的方法,它可以有效地把分子結(jié)構(gòu)與其理化性質(zhì)、結(jié)構(gòu)參數(shù)、生物活性等結(jié)合起來.三維定量構(gòu)效關系中具代表性的方法有CoMFA(Coparative molecular field analysis)與CoMSIA(Coparative molecular similarity index analysis)[13].
本文采用第二代CoMFA方法,即易位體比較分子場(Topomer CoMFA)[14]對18個吡喃酮類化合物進行3D-QSAR研究,建立了Topomer CoMFA模型,并通過Topomer Search技術[15]在ZINC數(shù)據(jù)庫中進行R基團的虛擬篩選,設計出高活性的新分子,并采用分子對接[16]研究了新設計的分子與蛋白活性位點間的結(jié)合方式,在理論上為實際合成該系列新藥物提供了理論參考.
本文所研究的18個吡喃酮類化合物來源于文獻[11,17].所有選取的18個化合物的分子結(jié)構(gòu)骨架見圖1所示,其結(jié)構(gòu)和生物活性值見表1所示.采取隔三選一的方法將整個數(shù)據(jù)集分為訓練集與測試集兩部分,其中13個化合物作為訓練集建立3D-QSAR模型,其余5個化合物作為測試集檢驗模型的預測能力.所有化合物的生物活性用pIC50(-logIC50)表示,IC50為抑制劑的半抑制濃度.
圖1 化合物的結(jié)構(gòu)骨架
表1 化合物的結(jié)構(gòu)和生物活性值
運用Powell能量梯度法,施加Tripos分子力場優(yōu)化化合物分子[18],通過加載Gastelger-Huckel電荷,設定0.05 kcal/mol為能量收斂梯度值,1 000為最大迭代次數(shù),剩余參數(shù)為SYBYL2.0-X默認值,取得分子的最低能量構(gòu)象[19].
以訓練集pIC50值最高的12號分子作為模板,通過兩種方式對吡喃酮類化合物進行切割,并對其周圍的立體場和靜電場進行計算,利用偏最小二乘回歸法(PLSR)對化合物進行建模.
本研究采用Topomer Search[20]技術,通過ZINC數(shù)據(jù)庫中,篩選得到高活性貢獻值的R基團.其中,Topomer CoMFA距離值為185.0,剩余參數(shù)為SYBYL2.0-X默認值.
篩選結(jié)果由Topomer CoMFA距離和R基團的活性貢獻值體現(xiàn),從數(shù)據(jù)庫中篩選測出的R基團貢獻值[21].一般在分子相似程度范圍內(nèi),R基團貢獻值越大,表明基團越有價值.
采取Surflex-dock[22]技術進行分子對接,由PDB數(shù)據(jù)庫提供對接所用的蛋白酶晶體結(jié)構(gòu),PDB數(shù)據(jù)庫 ID為:1EE0,對接方式為SFXC.通過Total-Score、Crash和Polar函數(shù)評價分子對接結(jié)果[23]:Total-Score為總打分函數(shù),分值越高表明受體與配體的親和能力越好;Crash為碰撞打分函數(shù),絕對值越趨近于零表明受體與配體對接的不適當程度越??;Polar為極性函數(shù),結(jié)合位點在分子表面時,分值越高越好;結(jié)合位點在分子內(nèi)部時,分值越低越好.
通過Topomer CoMFA模型構(gòu)建及預測化合物活性,以活性值最高的12號分子為如表2所示對化合物采用兩種切割方式.
其中R1基團為藍色,R2基團為紅色,公共骨架為綠色.從表2可得出,兩個模型的主成分數(shù)N分別為2和3,F(xiàn)(Fisher驗證值)分別為19.799和23.879,r2(非交叉相關系數(shù))均大于0.6,q2(交互驗證系數(shù))均大于0.5,SEE(標準估計誤差) 分別為0.253和0.199,結(jié)果表明兩種切割方式下構(gòu)建的3D-QSAR模型都具有良好的擬合與預測能力,但模型2還較好的保存有化合物公共骨架,有利于R基團同公共骨架的選擇.基于以上因素,選擇模型2進行分子設計及對接研究.
圖2為模型2下的18個化合物實驗和預測活性值的線性回歸圖.圖中各點均勻分布于45 °線兩側(cè),模型2的預測和擬合能力較強.
表2 Topomer CoMFA建模結(jié)果
三維等勢圖(圖3)是在12號分子為模板的基礎上,按模型2構(gòu)建形成的.R1的立體場等勢圖和靜電場等勢圖分別為圖3(a)、3(b);R2立體場等勢圖和靜電場等勢圖分別為圖3(c)、(d).圖3(a)、(c)綠色部分表示增大取代基的體積可提高化合物的活性,黃色部分表示減小取代基的體積可提高化合物的活性;圖3(b)、(d)紅色區(qū)域表明如引入帶負電性取代基可提高化合物的活性,藍色區(qū)域表明引入帶正電性取代基可提高化合物的活性.
通過對圖3(a)分析可知,R1取代基的位置上有大片綠色和小塊黃色區(qū)域,表明綠色區(qū)域引入大基團取代基有利于活性的提高;表明黃色區(qū)域引入小基團的取代基有利于活性的提高.例如在黃色區(qū)域,化合物10(pIC50=-0.65)在R1取代基苯環(huán)的Z處用基團-CH2OCH3取代了化合物17、08、14、07、01、06(pIC50=-1.04,-1.08,-1.38,-1.50,-1.54,-1.60)上的-H、化合物04(pIC50=-0.82)上的-CH2OH以及化合物03(pIC50=-1.18)上的-OCH3,活性有顯著提高.
由圖3(c)可以看出,在R2取代基的位置上有大片綠色區(qū)域,說明在此處引入體積大的取代基有利于活性的提高,以及部分少許黃色區(qū)域,說明在此處引入體積小的基團有利于活性的提高.例如在黃色區(qū)域,化合物02(pIC50=-1.52)在R2取代基的位置上用-H取代了化合物06(pIC50=-1.60)的-OH取代基,活性相對提高;在大片綠色區(qū)域,化合物 08、10、11和12(pIC50=-1.08,-0.65,-0.57,-0.15)在R2取代基苯環(huán)的位置上用-OCH2CH2OH取代了化合物 03、14、02(pIC50=-1.18,-1.38,-1.52)上的-H、化合物07(pIC50=-1.50)上的-NH2和化合物06(pIC50=-1.60)上的-OH,活性明顯提高.
(a)R1立體場等勢圖 (b)R1靜電場等勢圖
(c)R2立體場等勢圖 (d)R2靜電場等勢圖圖3 Topomer CoMFA三維等勢圖
采用Topomer Search技術對R1和R2基團進行篩選,得到12個高活性的R2基團,同時選擇12號分子的R1基團作為新分子的R1基團,共設計12個新的吡喃酮類化合物.通過Sketch Molecule繪制12個新化合物分子結(jié)構(gòu),并進行優(yōu)化,化合物活性預測采用建立的Topomer CoMFA模型進行,新設計的12個化合物結(jié)構(gòu)和預測活性值詳見表3所示.
通過表3可知,01、02、03、04、05、06、12號共7個新設計的分子活性值高于模板分子.表明新設計的化合物理論上具有較好的抗艾滋病作用,可以作為抗艾滋藥物的候選化合物.
選擇PDB數(shù)據(jù)庫中與所研究的吡喃酮類化合物相關聯(lián)的大分子蛋白1EE0作為對接構(gòu)象,蛋白酶1EE0分類為轉(zhuǎn)移酶(乙酰乙酰輔酶A絡合的2-吡喃酮合酶).對1EE0進行預處理,提取出蛋白配體B/CAA700,通過創(chuàng)建形成活性口袋.如圖4所示,表現(xiàn)出活性位點空間內(nèi)配體小分子與大分子蛋白的相互作用.通過可行性驗證分析,驗證對接的準確性與可靠性.首先,導入提取的蛋白配體B/CAA700,對其加氫、優(yōu)化;接著把配體作為分子直接對接到大分子蛋白1EE0上,對接結(jié)果如圖5所示.得出配體B/CAA700構(gòu)象(紅色)與對接產(chǎn)生的1EE0對接構(gòu)象(綠色)在空間內(nèi)重疊程度良好,表明該方法準確可靠.
表3 設計化合物分子結(jié)構(gòu)與活性預測值
續(xù)表3
圖4 原型分子生成圖(灰色區(qū)域為原型分子)
圖5 晶體結(jié)構(gòu)中配體構(gòu)象與對接構(gòu)象的對接模式
將活性值高于模板分子的7個新設計的分子與1EE0進行對接,共得到5個滿足要求的對接模型.其中對接模型對應函數(shù)數(shù)值見表4所示.新設計分子01、03、04、05、06對接大分子蛋白活性位點的交互作用如圖6所示.其中,綠色線狀代表氨基酸殘基,黃色虛線代表氫鍵.
表4 分子對接結(jié)果
由圖6(a)看出,對于01號分子,對接構(gòu)象中O原子與B/ARG312中的H原子形成氫鍵,距離為1.927 ?;對接構(gòu)象中F原子與B/ARG274中的H原子形成氫鍵,距離為2.459 ?;對接構(gòu)象中O原子與B/ARG274中的H原子形成氫鍵,距離為1.926 ?,其形成另一個氫鍵距離為1.979 ?.
從圖6(b)可知,對于03號分子,對接構(gòu)象中O原子與B/ARG63中的H原子形成氫鍵,距離為1.852 ?;對接構(gòu)象中O原子與B/ARG274中的H原子形成另一個氫鍵,距離為2.501 ?.
由圖6(c)看出,對于04號分子,對接構(gòu)象中O原子與B/ARG274中的H原子形成氫鍵,距離為2.040 ?,其形成另一個氫鍵距離為2.741 ?;對接構(gòu)象中O原子與B/LYS67中的H原子形成氫鍵,距離為1.971 ?.
從圖6(d)可知,對于05號分子,對接構(gòu)象中O原子與B/ARG274中的H原子形成氫鍵,距離為1.978 ?;對接構(gòu)象中O原子與B/LYS60中的H原子形成氫鍵,距離為2.153 ?,其形成另一個氫鍵距離為2.552 ?.
由圖6(e)看出,對于06號分子,對接構(gòu)象中O原子與B/ARG312中的H原子形成氫鍵,距離為1.548 ?;對接構(gòu)象中H原子與B/THR68中的O原子形成氫鍵,距離為2.185 ?;對接構(gòu)象中O原子與B/LYS67中的H原子形成氫鍵,距離為2.633 ?.
(a)、(b)、(c)、(d)、(e)分別表示新設計分子01、03、04、05、06號分子與1EE0的氫鍵作用圖圖6 氫鍵相互作用圖
綜上結(jié)果表明,一般配體分子與B/ARG274殘基有氫鍵作用,如01、03、04、05號分子;配體分子與B/ARG312殘基有氫鍵作用,如01、06號分子;配體分子與B/LYS67殘基有氫鍵作用,如04、06號分子.
為了進一步說明這幾種氨基酸殘基的重要性,選擇原數(shù)據(jù)集中活性最高的12號分子與活性最低的06號分子分別進行對接研究,其結(jié)果如圖7所示.表明對接標準均符合要求.氨基酸殘基B/ARG312、B/ARG274均與兩個分子形成氫鍵;對于12號分子,還有氨基酸殘基B/THR68、B/ARG63、B/LYS60與分子作用生成氫鍵,對于06號分子,還有氨基酸殘基B/LYS67與分子作用生成氫鍵.
(a)、(b)分別表示12、06號分子與1EE0的氫鍵作用圖圖7 氫鍵相互作用圖
本文通過Topomer CoMFA 模型的建立,對18個吡喃酮類化合物進行了3D-QSAR研究,得到了良好穩(wěn)定性及預測值的3D-QSAR模型.
首先,通過立體場與靜電場,分析了不同取代基結(jié)構(gòu)對活性的影響;然后,采用虛擬篩選技術從ZINC數(shù)據(jù)庫篩選得到高活性基團,共設計出12個具備較高活性的新分子,其中7個分子活性高于原數(shù)據(jù)集分子,1個分子與模板分子活性相等;最后,利用Surflex-dock模塊分析了5個分子配體及大分子蛋白1EE0之間的相互作用模式.
對接結(jié)果表明:配體與B/ARG274、B/ARG312、B/LYS67等氨基酸殘基可以形成強的氫鍵相互作用,為抗艾滋病藥物的進一步設計與合成提供了理論參考.