石誠,鄭珩
(中國藥科大學(xué)生命科學(xué)與技術(shù)學(xué)院,江蘇 南京 210009)
計算機輔助藥物設(shè)計(computer-aided drug design,CADD)已成為制藥公司和學(xué)術(shù)界的重要工具[1]。更快、更便宜的計算機以及相關(guān)軟硬件的發(fā)展使得以原子尺度模擬復(fù)雜生物系統(tǒng)成為可能,極大地促進了CADD的發(fā)展,如扎那米韋、伊馬替尼等藥物被成功開發(fā)上市[2]。Singh等[3]利用CADD對其所設(shè)計的乙酰靛紅腙和乙?;萼玎旱奈膸爝M行篩選,得到了具有顯著抗菌活性的乙酰靛紅1e(該化合物對大腸埃希菌的體外IC50為1.95μmol·L-1)以及針對白色念珠菌的先導(dǎo)化合物 1n(其體外 IC50為 15.67μmol·L-1)。通過定量構(gòu)效關(guān)系(quantitative structure-activity relationship,QSAR) 對化合物的生物活性的取代基效應(yīng)進行預(yù)測,并使用分子對接研究了可接受的細(xì)菌和真菌蛋白質(zhì)選擇的支架,從而得到了靛紅的最高的配體效率。除此以外,分子相互作用揭示了3'N取代的靛紅衍生物可作為抑制細(xì)菌和真菌感染疾病的有效候選物。CADD的方法主要可分為2類[4]:基于蛋白質(zhì)結(jié)構(gòu)(三維)的藥物設(shè)計(structurebased drug design,SBDD)和基于配體(二維)的藥物設(shè)計(ligand-based drug design,LBDD)(見圖1),在本綜述中,筆者將分別介紹這2種方法在新型抗耐藥菌藥物設(shè)計和篩選中的應(yīng)用。
圖1 計算機輔助藥物設(shè)計的代表性工作流程Figure 1 Representative workflow of computer-aided drug design
SBDD方法主要用于分析大分子三維結(jié)構(gòu)信息,通常是蛋白質(zhì)或核酸,以確定對其各自生物功能很重要的關(guān)鍵位點和相互作用。然后利用這些信息來設(shè)計抗菌藥物,其可競爭性地結(jié)合于靶標(biāo),從而中斷微生物存活所必需的生物途徑[5]。SBDD可以分為2類[6]:從頭設(shè)計(de novo)方法和虛擬篩選(virtual screening,VS)方法。此過程中往往也會使用分子動力學(xué)(molecular dynamics,MD)模擬來深入了解配體與靶蛋白的結(jié)合模式,并研究相互作用過程中結(jié)構(gòu)的變化。
De novo方法利用來自3D受體的信息來發(fā)現(xiàn)與結(jié)合位點良好匹配的小片段,然后根據(jù)適當(dāng)?shù)倪B接規(guī)則連接,產(chǎn)生一種結(jié)構(gòu)新穎并可以合成的配體,用于進一步篩選。如Boibessot等[7]就基于這種策略設(shè)計出了一系列抑制細(xì)菌組氨酸激酶(histidine kinase,HK)的噻吩衍生物。組氨酸激酶是細(xì)菌雙組分信號轉(zhuǎn)導(dǎo)系統(tǒng)(twocomponent signal transduction system,TCS)的重要組成部分,細(xì)菌體內(nèi)通常存在幾十對TCS,調(diào)控了包括細(xì)菌趨化性、孢子形成、營養(yǎng)元素代謝以及次級代謝產(chǎn)物合成等許多重要的生理過程。由于TCS目前只在細(xì)菌和哺乳動物之外的真核生物中被發(fā)現(xiàn),而在人類和其他哺乳動物體內(nèi)尚未被發(fā)現(xiàn),因此可作為新型抗菌藥物作用靶標(biāo)。在這個研究中,他們基于一個分辨率為1.61×10-10m的激酶WalK(PDB:3SL2)ATP結(jié)合結(jié)構(gòu)域的X射線結(jié)構(gòu),設(shè)計了能與結(jié)構(gòu)中關(guān)鍵元素形成氫鍵和疏水相互作用的片段,連接成新的配體化合物,再經(jīng)過VS方法獲得了8種能顯著抑制TCS中組氨酸激酶的噻吩衍生物(1~8),其中化合物2和8對枯草芽孢桿菌等多種細(xì)菌具有廣譜活性,最低抑菌濃度(minimum inhibitory concentration,MIC)和最低殺菌濃度(minimum bactericidal concentration,MBC)基本均在 7~32mg·L-1之間。
還有一個較好的例子是Jakopin等[8]對DNA促旋酶抑制劑的設(shè)計,DNA促旋酶和拓?fù)洚悩?gòu)酶Ⅳ是Ⅱa型拓?fù)洚悩?gòu)酶,它們是在轉(zhuǎn)錄和復(fù)制過程中監(jiān)督DNA拓?fù)錉顟B(tài)所需的必需細(xì)菌酶。它們的ATP酶結(jié)構(gòu)域GyrB和ParE分別被認(rèn)為是小分子抑制劑的可行靶標(biāo)。在此研究中,作者將最近公開的一系列吡咯酰胺GyrB抑制劑作為先導(dǎo)結(jié)構(gòu),基于取代的5-苯基-1,2,4-二唑中心支架設(shè)計了其類似物的小型文庫。其噻唑羧酸部分被二唑-羧酸生物異構(gòu)取代,通過優(yōu)化而得到的一系列化合物中,化合物9活性最好,其對大腸埃希菌DNA旋轉(zhuǎn)酶的 IC50為 1.2μmol·L-1,對糞腸球菌 ATCC29212MIC 可達 75μmol·L-1,對大腸埃希菌拓?fù)洚悩?gòu)酶Ⅳ和相應(yīng)的金黃色葡萄球菌ATCC25923均表現(xiàn)出顯著的抑制作用。
VS是一種快速且廉價的方法,利用小分子文庫(見表1),可以鑒定替代目標(biāo)生物分子現(xiàn)有配體的具有特定生物活性的化合物,或發(fā)現(xiàn)具有可用結(jié)構(gòu)信息的未探索的已知靶標(biāo)的化合物[9]。
表1 計算機輔助藥物設(shè)計的各種常用軟件及資源Table 1 Various commonly used softwares and resources for computer-aided drug design
在VS過程中常需使用分子對接,用來預(yù)測化合物在特定目標(biāo)結(jié)合位點的可能的結(jié)合模式,并基于其構(gòu)象以及與結(jié)合口袋中發(fā)現(xiàn)的特征的互補性來估計親和性[10],隨著計算機技術(shù)的發(fā)展,VS也越來越多地被應(yīng)用于生物領(lǐng)域,包括對抗生素耐藥性的研究[11-12],其巨大潛力和價值已經(jīng)通過各種抑制劑和拮抗劑的發(fā)現(xiàn)得到證實[13],例如4SC-101(10)[14],新型極光激酶A抑制劑(化合物11)[15],新型抗菌骨架ZINC00978022(化合物12)和ZINC24469052(13)[16]以及HIV-1逆轉(zhuǎn)錄酶和DNA聚合酶的雙重抑制劑(化合物14)[17]。
Gudzera等[18]報道了利用VS方法篩選結(jié)核分枝桿菌(M. tuberculosis)亮氨酰tRNA合成酶(Leucyl-tRNA synthetase,LeuRS)的小分子抑制劑。LeuRS在蛋白質(zhì)合成中起著不可或缺的作用,它們的結(jié)構(gòu)在原核生物和真核生物中存在差異,這種結(jié)構(gòu)差異可用于開發(fā)抑制病原體合成酶但不抑制人類相關(guān)功能的藥物,由于其酶活性位點中關(guān)鍵氨基酸不易發(fā)生突變,因此這類酶抑制劑不太可能誘發(fā)耐藥性。最近,LeuRS已經(jīng)被臨床驗證為開發(fā)新型抗耐藥菌藥物的靶標(biāo)[19]。作者通過對結(jié)核分枝桿菌和人LeuRS的氨基酸序列進行比對,發(fā)現(xiàn)2種酶活性位點的氨基酸序列具有顯著差異,可開發(fā)針對結(jié)核分枝桿菌LeuRS的選擇性抑制劑。使用已知的嗜熱棲熱菌LeuRS結(jié)構(gòu)作為模板,預(yù)測了結(jié)核分枝桿菌LeuRS的三維結(jié)構(gòu),通過篩選100000個有機化合物的化合物文庫,最終發(fā)現(xiàn)6種對結(jié)核分枝桿菌LeuRS具有抑制活性的化合物。其中活性最好的化合物2,6-二溴-4-{[4-(4-硝基-苯基)-噻唑-2-基 ]-亞肼基甲基 }-苯酚(15),對結(jié)核分枝桿菌耐藥株LeuRS的IC50為2.27μmol·L-1。對所有活性化合物的抗結(jié)核分枝桿菌耐藥株H37Rv作用進行檢測,4-{[4-(4-溴-苯基)-噻唑-2-基 ]亞肼基甲基}-2-甲氧基-6-硝基-苯酚(16)表現(xiàn)出最佳活性,IC50為 10.01 μmol·L-1。
除此以外,VS也經(jīng)常與其他方法聯(lián)用,最近,Li等[20]利用分子對接模擬與基于分子相互作用的指紋(interaction fingerprints,IFPs)的方法對金屬-β-內(nèi)酰胺酶(metal beta lactamase,MBL)VIM-2 晶體結(jié)構(gòu)進行VS,得到能與重要的催化活性位點殘基如Arg228、Asn233、Phe61、Tyr67和Asp120以及鋅離子相互作用的化合物,再使用熒光法進行二次篩選,用核磁共振光譜方法檢測了化合物與apo-VIM-2以及含有鋅離子的Zn(II)VIM-2的結(jié)合模式,最后通過結(jié)晶學(xué)分析發(fā)現(xiàn)了MBL抑制的新模式,該化合物與活性位點鋅離子相鄰殘基結(jié)合,但不涉及金屬螯合。這可能有助于篩選臨床上有用的靶向MBL的抑制劑。
在潛在藥物靶標(biāo)結(jié)構(gòu)未知的情況下,使用諸如同源性建?;驈念^結(jié)構(gòu)預(yù)測等方法預(yù)測該結(jié)構(gòu)是具有挑戰(zhàn)性的,因此我們需要從一組對相關(guān)靶標(biāo)(受體或酶)具有活性的配體中取得信息,從而鑒定能夠產(chǎn)生生物學(xué)活性的結(jié)構(gòu)或物理化學(xué)性質(zhì)(分子描述符)[21]。
QSAR方法主要基于將目標(biāo)藥物相互作用活性與各種分子描述符相關(guān)聯(lián)的統(tǒng)計學(xué)。由于結(jié)構(gòu)相似的分子傾向于顯示相似的生物活性[22],可根據(jù)計算實驗確定的生物活性與小配體結(jié)合劑的各種性質(zhì)之間的相關(guān)性來獲得QSAR。QSAR和藥效團模型之間的一個區(qū)別在于,藥效團模型是基于活性配體的必要或基本特征構(gòu)建的,而QSAR除了考慮基本特征外,還考慮了影響活性的特征,在建立QSAR后,可以使用交叉驗證[23]等方法對這些模型進行驗證。通過對分子特征的研究,QSAR模型可用于預(yù)測新型分子的生物活性和篩選分子數(shù)據(jù)庫以找到潛在的活性分子。
最近,為發(fā)現(xiàn)抗革蘭陰性細(xì)菌的有效抗生素,Lee等[24]對鮑氏不動桿菌 KASⅢ(abKAS III)的抑制劑YKsa-6進行了QSAR研究,評估了YKsa-6類似物中疏水基團羥基的位置和數(shù)目等對其抗革蘭陰性細(xì)菌活性的作用,發(fā)現(xiàn)這些化合物的疏水性對抗革蘭陰性細(xì)菌活性是很關(guān)鍵的。基于此篩選出2個活性化合物YKab-4(4-[(3-氯-4-甲基苯基)氨基亞氨基甲基 ]苯-1,3-二醇)(17)和YKab-6(4-[[3-(三氟甲基)苯基]氨基亞氨基甲基]苯酚)(18),其表現(xiàn)出強效抗菌活性,對 abKAS III的 MIC 為 2~8mg·L-1。
QSAR的成功取決于選擇的分子描述符以及模型預(yù)測生物活性的能力。通過將統(tǒng)計學(xué)方法應(yīng)用于線性QSAR可以選擇對預(yù)測生物活性很重要的分子描述符,然而,生物活性與分子描述符之間的關(guān)系并不總是線性的。利用機器學(xué)習(xí)方法,如神經(jīng)網(wǎng)絡(luò)和支持向量機方法可生成QSAR非線性擬合模型來解決這個問題。通常使用主成分分析(principal component analysis,PCA)去除非獨立的描述符來簡化擬合的復(fù)雜性。如Ciura等[25]使用薄層色譜獲得大環(huán)內(nèi)酯類抗生素的親脂性和疏水性參數(shù),利用色譜數(shù)據(jù)和計算的親脂性之間的統(tǒng)計學(xué)相關(guān)性構(gòu)建QSAR模型,預(yù)測了大環(huán)內(nèi)酯類抗生素對化膿性鏈球菌、肺炎鏈球菌和單核細(xì)胞增生李斯特菌等微生物的生物活性。
藥物篩選旨在鑒定含有不同骨架的化合物,他們具有特定的3D結(jié)構(gòu)與靶標(biāo)產(chǎn)生相互作用[26],因此,當(dāng)前藥效團的研究可以基于候選化合物的生物活性構(gòu)象,將結(jié)合位點信息也并入藥效團模型中。獲得藥效團模型的方法也?;谂潴w分子的疊合[22]。幾種常用的自動藥效團生成程序包括Discovery Studio、PHASE、LigandScout和MOE等,已經(jīng)廣泛運用到藥物篩選中,一個典型的例子是Eissa等[27]對所合成的一系列新的(6-甲氧基-2-萘基)丙酰胺衍生物潛在抗菌活性的探索,使用Discovery Studio2.5軟件進行藥效團生成,用于指導(dǎo)構(gòu)建3D-QSAR藥效團模型,預(yù)測化合物活性。
在缺少受體3D信息和一組活性配體的情況下,可以創(chuàng)建序列衍生的3D藥效團模型。根據(jù)相似的受體可以與類似的配體結(jié)合的概念,3D藥效團可以使用同源模型和3D晶體結(jié)構(gòu)來檢測蛋白質(zhì)家族中配體生物分子識別的共同序列基序,并創(chuàng)建單一特征藥效團數(shù)據(jù)庫。如Koseki等[28]使用的基于藥效團的VS方法,他們使用MOE軟件構(gòu)建含有461383種化合物的虛擬庫(化合物信息來自ChemBridge數(shù)據(jù)庫),通過對候選化合物KTP3的結(jié)構(gòu)進行相似性搜索和篩選,鑒定了2種具有顯著活性的化合物——KTPS1和KTPS2,它們對恥垢分枝桿菌的半數(shù)最大抑制濃度分別為8.04和17.1μmol·L-1,這些化學(xué)物質(zhì)的結(jié)構(gòu)和生物學(xué)信息可能有助于開發(fā)用于治療結(jié)核病的新型抗生素。雖然藥效團模型也有其局限性,但這對于有限或沒有受體和配體信息的藥物靶標(biāo)是具有吸引力的技術(shù)。
雖然CADD具有明顯的優(yōu)勢,但必須指出的是,CADD還面臨著一些挑戰(zhàn),例如如何準(zhǔn)確識別和預(yù)測配體結(jié)合模式和親和力等。藥物發(fā)現(xiàn)需要面對的困難之一是藥物多態(tài)現(xiàn)象。當(dāng)藥物具有不同的形式如化學(xué)式相同但結(jié)構(gòu)不同時,則會發(fā)生藥物多態(tài)性,這對成功研發(fā)藥物有很大的影響。為了滿足實際的需要,研究者們往往也會同時使用SBDD和LBDD的方法,因為這2種方法在優(yōu)點和缺點上可以互補,在藥物研發(fā)工作中結(jié)合不同的基于結(jié)構(gòu)和基于配體的設(shè)計策略也已經(jīng)被確認(rèn)為比任何單一方法都更有效[6],一個例子是雜合對接程序HybridDock[29],它結(jié)合了基于結(jié)構(gòu)和基于配體的方法。這種雜合方法能顯著改善結(jié)合構(gòu)象和結(jié)合親和力的預(yù)測結(jié)果。
隨著多重耐藥的爆發(fā),CADD為抗耐藥菌新藥的研發(fā)提供了新的思路。常用策略包括對靶向突變蛋白的小分子調(diào)節(jié)劑的設(shè)計,在已知耐藥突變體結(jié)構(gòu)的情況下,設(shè)計構(gòu)建其與藥物結(jié)合形成的復(fù)合物,并從復(fù)合物中得到有價值的信息。Frey等[30]就是基于此,通過確定二氫葉酸還原酶(dihydrofolate reductase,DHFR)的雙突變體(H30N/F98Y)與抗葉酸劑所形成的復(fù)合物晶體結(jié)構(gòu),從而發(fā)現(xiàn)了金黃色葡萄球菌DHFR中的突變抗性機制。除此以外,借助計算機手段還有可能探索由其他機制(與蛋白質(zhì)突變無關(guān))而導(dǎo)致的耐藥性,一個典型的例子是β-內(nèi)酰胺酶抑制劑的開發(fā)[31],研究人員使用化合物庫的VS和結(jié)構(gòu)引導(dǎo)優(yōu)化,得到數(shù)百種晶體結(jié)構(gòu)(獨立存在或與抑制劑結(jié)合的形式存在),使得可能深入了解所涉及的抑制機制,從而發(fā)現(xiàn)有效的抑制劑(內(nèi)酰胺和非內(nèi)酰胺)[32],如clavulanate(19)、tazobactam(20)和sulbactam(21)。除此以外,CADD也可用于描述抑制劑與不太可能發(fā)生突變的蛋白質(zhì)區(qū)域的相互作用,從而揭示新的耐藥機制,避免抗性的發(fā)展[33]。
總而言之,以上的例子已經(jīng)成功證明了CADD在開發(fā)抗耐藥菌藥物方面的潛力,雖然也有著一些限制,但是毫無疑問,這種以知識為導(dǎo)向的方法已經(jīng)成為藥物設(shè)計過程中的一個重要部分。它能夠通過利用已有的受體-配體相互作用的知識和理論,來指導(dǎo)藥物的發(fā)現(xiàn)、能量和結(jié)構(gòu)優(yōu)化,以及優(yōu)化合成路線,在過去的10年中,隨著基因組、后基因組計劃的開展,人們已經(jīng)鑒別出大量疾病相關(guān)的潛在靶點,理論計算方法諸如蛋白質(zhì)結(jié)構(gòu)預(yù)測、虛擬高通量篩選和對接等已被用于加速藥物發(fā)現(xiàn)過程,學(xué)術(shù)界和制藥工業(yè)使用基于配體的方法篩選到許多廣譜抗結(jié)核藥物,目前正在評估其臨床療效。
從算法的角度上,CADD還需要重點研究分子柔性以及溶劑,提高藥物對受體的靶向性以及計算效率。與此同時,需要整合現(xiàn)有的基于硅片的技術(shù),將化學(xué)、結(jié)構(gòu)生物學(xué)、生物信息學(xué)以及計算技術(shù)領(lǐng)域有機地結(jié)合起來。由此,可減輕虛擬藥物發(fā)現(xiàn)方法的一些缺點,并且盡可能挖掘CADD的全部潛力。