梁立,胡建平,2,杜文義,左柯,劉嵬,茍小軍
1 成都大學 四川抗菌素工業(yè)研究所 藥食同源植物資源開發(fā)四川省高校重點實驗室,四川 成都 6101062 樂山師范學院 化學學院,四川 樂山 614004
?
HCV NS3/4A蛋白酶與Faldaprevir類似物的分子識別機制及其復合物運動模式
梁立1,胡建平1,2,杜文義1,左柯1,劉嵬1,茍小軍1
1 成都大學 四川抗菌素工業(yè)研究所 藥食同源植物資源開發(fā)四川省高校重點實驗室,四川 成都 610106
2 樂山師范學院 化學學院,四川 樂山 614004
梁立, 胡建平, 杜文義, 等. HCV NS3/4A蛋白酶與Faldaprevir類似物的分子識別機制及其復合物運動模式. 生物工程學報, 2016, 32(5): 669–682.
Liang L, Hu JP, Du WY, et al. Molecular recognition mechanism and motion of HCV NS3/4A protease with Faldaprevir analogue. Chin J Biotech, 2016, 32(5): 669–682.
摘 要:Faldaprevir類似物 (Faldaprevir analogue molecule, FAM) 能有效抑制HCV NS3/4A蛋白酶的催化活性,是一種潛在抗HCV先導化合物。通過生物信息學統(tǒng)計分析了已報道的HCV NS3/4A 蛋白酶晶體結構,得到了FAM-HCV NS3/4A蛋白酶晶體結構。對FAM-HCV NS3/4A蛋白酶復合物進行了20.4 ns的分子動力學模擬,重點從氫鍵和結合自由能兩個角度分析了二者分子識別中的關鍵殘基及結合驅動力。氫鍵和范德華力是促使FAM特異性結合到蛋白V132-S139、F154-D168、D79-D81和V55的活性口袋中的主要驅動力,這與實驗數據較為吻合。耐藥性突變實驗分析了R155K、D168E/V和V170T定點突變對FAM分子識別的影響,為可能存在的FAM耐藥性提供了分子依據。最后,用自由能曲面和構象聚類兩個方法探討了體系的構象變化,給出體系的4種優(yōu)勢構象,為后續(xù)的基于HCV NS3/4A蛋白酶結構的Faldaprevir類似物抑制劑分子設計提供一定的理論幫助。
關鍵詞:HCV NS3/4A蛋白酶,Faldaprevir類似物分子,分子動力學模擬,結合自由能,構象變化
Received: August 31, 2015; Accepted: March 16, 2016
Supported by: National Natural Science Foundation of China (Nos. 11247018, 11147175), Research Key Project of Sichuan Province Education Department (No. 12ZA066), Leshan Science and Technology Project (No. 14SZD018).
Xiaojun Gou. Tel: +86-28-84616301; E-mail: gxjmeprd@163.com
國家自然科學基金 (Nos. 11247018, 11147175), 四川省教育廳科研重點項目 (No. 12ZA066), 樂山市科技計劃項目 (No. 14SZD018)資助。
丙型肝炎病毒 (Hepatitis C virus,HCV) 感染是造成慢性肝病和肝移植的主要原因之一[1]。據估計,全球范圍內有1.6-1.8億人長期感染HCV[2-3],其中一部分會發(fā)展為進行性肝纖維化,最終導致肝硬化,晚期肝病及肝癌[4]。目前的丙型肝炎標準診療方案 (Standard of care,SOC) 是聯合使用長效干擾素 (PEG-IFNα) 和廣譜抗病毒藥物利巴韋林 (Ribavirin)[5]。但這種治療方案的持續(xù)病毒學應答 (Sustained viral responses,SVR) 受治療周期、HCV基因型等因素的影響,在40%-80%大范圍內波動[6],治療效果往往不夠理想。Pawlotsky課題組的研究結果表明[7],在SOC中加入直接作用性抗病毒(Directly acting antiviral,DAA) 藥物后SVR顯著提高,療效令人滿意。
HCV NS3/4A蛋白酶 (Protease,PR) 是由NS3絲氨酸蛋白與輔助因子NS4A蛋白以非共價鍵結合而成的二聚體。NS3絲氨酸PR是HCV非結構蛋白加工成熟過程的關鍵酶,與三磷酸核苷酸酶、RNA解螺旋酶結合,構成HCV復制所必需的非結構蛋白NS3。NS3屬于胰PR超家族,擁有PR和RNA解螺旋酶雙重活性[8],位于由HCV RNA編碼的前體多聚蛋白的開放閱讀框 (Open reading frame,ORF) 中的非結構蛋白區(qū)中。另外,NS3/4A PR能水解TRIF和MAVS兩種人類免疫蛋白,從而干擾人體對HCV的先天性免疫應答[9-10]。NS3/4A PR還可通過調控IFN-3的表達水平,破壞細胞內免疫通路,誘導宿主產生免疫逃逸[11]。
HCV NS3/4A PR抑制劑是首類進入臨床試驗的DAA藥物。Faldaprevir類似物分子 (Faldaprevir analogue molecule,FAM)[12]作為一種HCV NS3/4A PR抑制劑,能有效抑制NS3/4A PR活性。阻斷HCV的復制、翻譯和翻譯后多聚蛋白的加工成熟,還可使IFN更好地發(fā)揮抗病毒療效。
構象變化和分子識別是藥物設計的基礎。目前有關HCV NS3/4A PR與FAM之間識別機制和復合物體系在水中構象變化等問題尚未見報道。本文用分子動力學 (Molecular dynamics,MD) 模擬方法對這些問題進行了研究,為后續(xù)的結構改造、新藥研發(fā)提供結構及理論支撐。圖1給出了FAM的化學結構,圖中數字表示原子序號,括號里的數字用來表示極性氫,這些極性氫有可能和蛋白質部分形成氫鍵[12]。
圖1 FAM的分子結構[12]Fig. 1 Molecular structure of FAM[12].
1.1分子動力學模擬
在HCV NS3/4A PR和FAM的晶體結構[12](PDB代碼:4K8B) 中,包含有輔助結晶的離子和結晶水,考慮到這些水分子等并未與FAM結合,也未參與活性中心的構成。故刪去4條鏈的非蛋白部分,包括A鏈的ZN201、SO4203 和SO4204,B鏈的ZN201、SO4203,以及D鏈的SO4301及所有的結晶水分子。僅保留體系中PR的氨基酸與FAM部分,并以此作為MD模擬的初始結構。MD模擬采用AMBER[13]程序以及AMBER力場,其中生物大分子的力場參數基于實驗值擬合[14]。模擬溫度為26.85 ℃,溶劑使用TIP3P水模型[15]。
首先,將復合物置于去頭八面體水盒子中,使復合物邊緣距盒子壁0.8 nm,此時盒子里共加入9 820個水分子,體系總原子數為15 614。隨后進行兩次能量優(yōu)化,第一次是約束溶質的10 000步能量優(yōu)化,約束力常數為2.091×105kJ/(mol·nm2),由5 000步最陡下降法優(yōu)化和5 000步共軛梯度能量優(yōu)化組成。第二次是去約束的5 000步最陡下降和5 000步共軛梯度能量優(yōu)化,收斂條件為能量梯度小于4.182×10-4kJ/(mol·nm2)。能量優(yōu)化完成后,開始進行MD模擬,整個模擬過程分為兩步分進行:首先進行約束動力學模擬,約束力常數為4.182×103kJ/(mol·nm2),期間溫度使用Langevin dynamics升溫機制,溫度偶聯因子設為1.0,溫度從–273.15 ℃逐步升高到26.85 ℃,模擬400 ps;接著,再進行20 ns的無約束恒溫MD模擬。用SHAKE算法[16]約束鍵長,非鍵半徑為1 nm;模擬積分步長為2 fs,每隔1 ps采集一次構象,共采集20 400個構象。并使用VMD軟件對體系模擬全過程跟蹤監(jiān)測。
1.2能量分解
在本文中,用MM/GBSA (Molecular mechanics/generalized Born surface area) 方法[17-18]進行能量分解分析。其基本思想是把每個殘基的能量貢獻近似分為力學(Molecule mechanics,MM) 方法計算的真空分子內能、用廣義波恩 (Generalized Born,GB) 模型[19-20]計算的極性溶劑化能,以及用LCPO算法[21-22]計算的非極性溶劑化能,并且把能量分解到殘基的主鏈原子核側鏈原子上。這里,真空分子內能可分為極性的靜電相互作用和非極性的范德華相互作用兩部分。LCPO算法認為非極性溶劑化能與溶劑可接近表面積 (Solvent accessible surface area,SASA) 呈正相關。通過MM/GBSA能量分解,可以觀察到HCV NS3/4A PR中的主要殘基對FAM結合所做出的貢獻。
1.3自由能曲面
自由能曲面 (Free energy landscape,FEL)是通過研究自由能曲面圖的最小值 (即體系最穩(wěn)定的狀態(tài)) 和分界點 (即體系變化過程中的一個短暫的狀態(tài)) 來表示生物學過程中發(fā)生的動力學變化的一種分析方法[23-26]。一些主成分(Principal component,PC) 可以用以表示重要的動力學過程,這些PC也可以來繪制自由能曲面圖[27],具體根據公式:
式中,坐標X表示PC,kB表示玻爾茲曼常數,T是絕對溫度,P(X)是體系PC的概率。
1.4聚類分析
使用MMTSB工具[28],對MD模擬得到的20 400個體系構象進行聚類分析 (Cluster analysis)。分析過程依據Daura等[29]提出的觀點:逐一計算各構象之間的RMSD值,以此為基礎建立RMSD矩陣 (N×N, N為構象數)。人為設定一個RMSD閾值,在任意兩構象RMSD值之間進行比較,若其差值小于此閾值則歸為一類。以每一類中能量最低的構象作為該類的代表構象。本文中,以體系整體RMSD值建立矩陣,對體系整體構象的聚類情況進行了討論。
2.1HCV NS3/4A PR的生物信息學分析
截止目前,在蛋白質數據庫 (www.rcsb.org)中檢索HCV NS3/4A PR,得到相關結構104個。其中僅來源于丙型肝炎病毒的結構有81個,而其中結合了NS4A 蛋白的成熟復合物結構僅有17個。表1給出了蛋白質數據庫中收錄的成熟HCV NS3/4A PR結構生物學信息。表中PDB表示解析結構的PDB代碼,Res.表示解析的分辨率,Sequence為HCV NS3/4A PR的氨基酸序列,ligand則表示結構中的小分子結合信息。
從表1可以看出,該17個結構分辨率相差較大,但均在可接受范圍內。除4U01外均為二聚體結構,其中3LOX、3LON、3OYP、2XCN、2OBO、2A4Q、2F9U和1RTL的NS3A、NS4A蛋白單體氨基酸序列之間不一致,表中僅給出了相對較全的單體序列。考慮到后續(xù)對二聚體結構整體的模擬工作,避免二聚體結構不完整對模擬結果可能造成的誤差,故沒有選取這些結構。加之結合有FAM的晶體結構僅有4K8B一個,故選其用于后續(xù)的MD模擬。
2.2體系整體的模擬分析
圖2顯示了HCV NS3/4A PR和FAM的復合物體系在模擬過程中的勢能隨時間的變化。分子勢能在400 ps以后達到平衡。經計算,平衡后的勢能平均值為–4.26×105kJ/mol,標準偏差為2 000 kJ/mol,波動范圍小于0.47%。由于模擬體系較大,共含有15 614個原子,波動對結果的影響不大,可以忽略??梢?,HCV NS3/4A PR和FAM的復合物結構在模擬過程中維持穩(wěn)定可靠。
表1 HCV NS3/4A PR結構生物學信息Table 1 The structural biological information of HCV NS3/4A PR
圖2 體系勢能隨時間的變化Fig. 2 Potential energy of the system versus simulation time.
圖3A給出了PR分子中A鏈、B鏈、C鏈和D鏈主鏈Cα原子的方均根偏差 (Root mean square deviation,RMSD) 隨時間的變化。從圖3A可以看出,蛋白酶在400 ps后基本趨于平穩(wěn)。A、B鏈的RMSD高于C、D鏈。經計算,A鏈RMSD為 (0.125±0.020) nm、B鏈RMSD為(0.117±0.017) nm、C鏈和D鏈分別為(0.062±0.019) nm和 (0.060±0.017) nm。說明C、D鏈較A、B鏈穩(wěn)定。這與其結構有關,A、B鏈較長,含177個氨基酸殘基,為蛋白酶的主體部分,大部分暴露在溶劑中,更易受到溶劑的影響;而C、D鏈僅含12個氨基酸,分別結合與A、B鏈外側的結合口袋中,受到口袋內氨基酸殘基的牽制作用,穩(wěn)定性較好。
圖3B給出了體系整體主鏈Cα原子、配體FAM的ligand分子的RMSD隨時間的變化。與圖3A對比發(fā)現兩個小分子的RMSD值在模擬過程中基本趨于平衡,經計算,ligand的RMSD 為 (0.173±0.024) nm,無較大波動。表明FAM穩(wěn)定地結合在活性口袋中。而體系整體的RMSD數值則維持在較高位置,這可能是由于復合物分子較大,通過兩分子FAM相互作用,形成二聚體結構,故在模擬過程中分子內有著較為顯著的相對運動,4條鏈的相對位置及角度有較大變化。
圖3 蛋白質體系中Cα原子與FAM方均根偏差隨時間的變化Fig. 3 RMSD of the Cαatoms in the proteinic system and FAM versus simulation time.
圖4給出了復合物分子中蛋白酶B鏈和D鏈的主鏈Cα方均根漲落 (Root mean square fluctuation,RMSF) 分布。由于體系為二聚體結構,為簡化分析運算,此處僅分析B鏈和D鏈。從圖4中可以看到4個區(qū)域的漲落較大,分別是P96-S101、P115-R119、R123-L126、V158-V163。通過VMD觀察這4個區(qū)域在水中模擬的運動軌跡,發(fā)現P96-S101段和P115-R119段是兩個loop區(qū),暴露在水中,與周圍的殘基作用較弱,所以柔性較大;R123-L126段和V158-V163段則是兩個β折疊片,均與FAM結合部位相近。較大的運動幅度可能是受到了小分子的影響。D鏈僅有較小的漲落出現,說明其柔性較小。
圖4 體系B鏈和D鏈Cα原子的方均根漲落分布Fig. 4 RMSF distribution of the Cα atoms in chain B and chain D.
圖5A給出了晶體結構中蛋白酶A鏈和B鏈溫度因子 (B-factor,B因子) 的自相關性??梢钥吹?,A鏈和B鏈的相關性很高,其相關系數為0.81,這表明模擬分析方法可靠。圖5B給出了模擬計算得到的B因子與X-ray實驗所得B因子的相關性。一般來說,體系較大的RMSF和B因子均可用于說明相應的殘基部分柔性較大。經計算,二者相關性為0.68??紤]到樣本數達到了177個,兩組數據存在著較為顯著的相關性,進而證明用模擬計算分析得到的柔性分布結論較為可靠。
圖5 晶體結構A鏈和B鏈的B因子相關性以及晶體結構B因子與分子模擬B因子數據的相關性Fig. 5 The correlation of B-factors for crystal structure from PDB of chain A with chain B, and that of calculated B-factor values in chain B from MD simulation with B-factors from crystal structure.
2.3分子識別
表2列出了各能量項對FAM與HCV NS3/4A PR結合自由能的貢獻。結合自由能(Binding free energy) 對藥物分子的活性評價起著重要的作用。表2中ELEIN表示真空狀態(tài)下分子內能的靜電能部分;VDWIN表示真空中分子內能的范德華能部分;ELEPB是指通過PB算法計算出的體系與溶劑之間的靜電能;VDWPB是指通過PB算法計算得到的體系與溶劑之間的范德華能。Protease表示對HCV NS3/4A PR單獨計算的能量結果;FAM則表示單獨考慮FAM的能量結果;Complex表示對復合物進行模擬計算的能量值;Delta值則是復合物形成前后的能量變化。
表2 各能量對結合自由能的貢獻 (kJ/mol)Table 2 The contribution to binding free energy by each kind of energy (kJ/mol)
從表2可以看出,當FAM與PR結合成復合物時,體系內能減小。這一過程主要通過兩條途徑實現:一是體系內能的靜電部分減小,釋放了17.08 kJ/mol;二是體系內能的范德華部分的減小,釋放了73.78 kJ/mol,促進了復合物的形成。體系溶劑化能的范德華部分也降低(-8.70 kJ/mol);但代替犧牲溶劑化能的靜電部分在結合過程中則大幅增大 (50.92 kJ/mol),逆轉了內能靜電部分降低引起的促結合結果。
綜上,非極性相互作用為FAM與PR識別的主要驅動力。此外,體系總焓變?yōu)?48.65 kJ/mol,總熵變?yōu)?16.92 kJ/mol,求得體系絕對結合自由能為-31.73 kJ/mol。實驗文獻[12]提到,與FAM結構類型很高的化合物抑制劑的實驗結合自由能值ΔGexp。此化合物僅以O取代了N30,所以其實驗數據有較高的參考價值。經對比,計算得出的理論值與實驗值基本吻合。
氫鍵的存在可以維持復合物分子的穩(wěn)定性,同時也可以增強受體-配體分子之間的特異性識別。為進一步探討HCV NS3/4A PR與FAM的識別機制,表3列出了二者之間形成的氫鍵。氫鍵采用幾何判據[30],供體原子-氫原子-受體原子之間的夾角大于135°,供體原子-受體原子之間的距離小于0.35 nm。表中l(wèi)igand1和ligand2分別表示結合在A鏈和B鏈的FAM,Freq表示氫鍵占有率,即氫鍵在整個模擬過程中出現的概率,Freq越大表示對應的氫鍵越穩(wěn)定。
從表3可以看出,FAM與A157、R155和S139形成了穩(wěn)定的氫鍵,與X-ray實驗數據[12]一致。其中,S139位于HCV NS3/4A PR的催化中心,是酶發(fā)揮生物活性的關鍵殘基之一;R155和A157位于的扭曲片段也是PR抑制劑的重要結合部位[1]。FAM與PR之間較為穩(wěn)定的3個氫鍵為維持復合物的穩(wěn)定性,并有助于促進抑制劑的特異性識別,發(fā)揮較高的抑制活性 (Ki=0.02 μmol/L)。
表4列出了HCV NS3/4A PR與底物FAM識別的關鍵殘基能量分解結果??紤]到體系為同源二聚體結構,并結合兩分子FAM,為方便分析,此處僅研究了與B鏈結合的ligand2。表中的Resid表示關鍵殘基的殘基號,ligand1表示與A鏈結合的FAM;Evdw為真空范德華結合能;Eele為真空靜電結合能;Egb為極性溶劑化結合能,Egbsur表示非極性溶劑化結合能。能量分解顯示,小分子ligand1在結合過程中起著重要作用,說明復合物中FAM以雙分子形式存在是其發(fā)揮藥效的重要形式。B鏈的F154’-A157’段和R130’ -Y134’段也在結合中起著關鍵的作用,與有關文獻[1]報道的HCV NS3/4A蛋白酶抑制劑結合部位基本一致。此外,V55’也在FAM的結合中作出了較大的貢獻。Welsch等[31]曾探究過V55突變后產生酰胺基抵抗的現象,可見,V55’是FAM發(fā)揮抑制作用的關鍵殘基。由此可以斷定:HCV NS3/4A蛋白酶的F154-A157、R130-Y134為FAM結合的主要區(qū)域,V55與另一分子的FAM為維持復合物結構穩(wěn)定,發(fā)揮抑制作用提供了重要保證。
表3 FAM和HCV NS3/4A PR之間所形成的氫鍵Table 3 The hydrogen bonds between FAM and HCV NS3/4A protease
圖6A給出了在勢能最低構象中,以ligand2 (FAM) 為中心,半徑為0.4 nm范圍內的接觸殘基。圖中,D79’–D81’、V132’–S139’、F154’–D168’、用黃色solid-ribbon模式表示,A鏈的關鍵殘基用紅色stick模式表示,B鏈的關鍵殘基用藍色stick模式表示,FAM ligand1用 line模式表示。ligand2 (FAM) 用stick模式表示。從圖中可以看出位于酶催化中心的H57’的咪唑環(huán)與FAM的喹啉環(huán)通過π-π作用結合在一起。表明蛋白酶此處活性口袋平坦,FAM的喹啉環(huán)為使其在活性口袋中結合地更加緊密,有利于提高抑制活性。圖6B主要展示了FAM在復合物中的雙分子結合模式。從圖中可以看出,ligand2分子的苯環(huán)與ligand1分子的喹啉環(huán)相互平行。經計算,平面間的距離為 (0.446±0.049) nm,符合產生π-π作用的條件。通過VMD跟蹤觀察,也發(fā)現FAM在模擬過程中一直保持這一結構。結合表3的能量分解分析,可以進一步確定,這種結合模式非常穩(wěn)定,在分子識別和維持抑制活性方面作出了重要的貢獻。
表4 HCV NS3/4A蛋白酶與底物FAM結合密切相關殘基的能量分解結果 (kJ/mol)Table 4 The energy decomposition of the key residues in HCV NS3/4A protease significantly concerned with binding ligand FAM. (kJ/mol)
圖6 HCV NS3/4A PR與底物FAM的結合模式圖Fig. 6 The map of the binding mode between HCV NS3/4A protease and FAM.
2.4耐藥性突變
有報道[32-35]顯示,HCV NS3蛋白R155K、D168E/V和V170T突變株對包括Faldaprevir等多種HCV NS3/4A PR可逆抑制劑產生耐藥。為了進一步探究這些突變殘基對FAM分子識別的影響,對復合物晶體結構相關氨基酸進行了定點突變,并對突變后與FAM形成復合物的結合自由能量變進行了分析。圖7給出了HCV NS3/4A PR氨基酸定點突變后關鍵殘基對結合自由能貢獻的變化。圖中藍色表示野生型 (Wild type,WT) HCV NS3/4A PR關鍵殘基的結合自由能;紅色表示R155K突變株NS3/4A PR關鍵殘基的結合自由能;淡藍色表示D168E突變株NS3/4A PR關鍵殘基的結合自由能,而紫色和綠色則分別表示D168V和V170T突變株NS3/4A PR關鍵殘基的結合自由能。
經計算,形成FAM-R155K突變株復合物的結合自由能變?yōu)?11.55 kJ/mol,FAM-D168E突變株復合物為-17.48 kJ/mol,而形成FAM-D168V突變株復合物與FAM-V170T突變株復合物的結合自由能變則分別為-10.91 kJ/mol和-12.14 kJ/mol。與野生型FAM-NS3/4A PR復合物的-31.73 kJ/mol相比不難看出,R155、D168和V170的突變對FAM的結合能力造成了不同程度的下降。說明FAM對突變型的HCV NS3/4A PR結合能力較弱。另外,從圖7可以看出突變株的V55、I153和F154能量下降最明顯。這可能是由于R-K、D-E、D-V以及V-T突變后,改變了口袋內部的疏水性造成的;此外,側鏈體積增加,使得口袋內部的原子堆積,從而使得口袋發(fā)生了形變,降低了FAM的結合自由能。雖然突變株的A156、A157的結合自由能較野生型高,但由于突變后影響了FAM識別的大部分關鍵殘基,故復合物體系總體自由能顯著降低。再次證明了V55、I153和F154 對FAM的識別十分重要,與前文分析結果一致。
圖7 HCV NS3/4A PR氨基酸定點突變后關鍵殘基對結合自由能貢獻的變化Fig. 7 The change of the decomposition of key HCV NS3/4A PR residues after the site-directed amino acid mutation.
2.5構象變化
2.5.1自由能曲面分析
圖8給出了26.85 ℃下體系自由能曲面圖。圖中的顏色越深,相應區(qū)域的自由能越低。由圖8可知,體系在模擬過程中存在4個相對獨立的低自由能區(qū)域,即左側的M1、右上部的M2、中部的M3以及右下部的M4。為了進一步分析圖中出現低自由能區(qū)的原因,我們進行了聚類分析。這4個區(qū)域分別與圖9中的4類能量最低構象相對應。
圖8 體系的自由能曲面圖Fig. 8 The free energy landscape map of the system.
2.5.2聚類分析
圖9給出了HCV NS3/4A蛋白酶與FAM所構成的復合物聚類分析的結果。RMSD域值為0.31 nm。從圖9中可以看出經過MD模擬所得的20 400個體系構象共4類,1.0 ns以前為第1類;2.76-4.41 ns、4.62-5.92 ns、6.03-6.04 ns、6.16-6.19 ns之間為第2類;4.42-4.61 ns、1.62-1.76 ns、5.93-6.15以及6.20-20.4 ns之間為第3類;剩余構象合為第4類,它們所占的概率分別是5.34%、15.63%、70.67%和8.36%。聚類分析結果表明,在MD模擬的20.4 ns時間內,HCV NS3/4A蛋白酶和配體FAM形成的復合物存在4個優(yōu)勢構象;各類構象之間有一定的結構躍遷,這也部分地解釋了RMSD中出現的漲落。
圖9 基于HCV NS3/4A蛋白酶RMSD的聚類分析Fig. 9 Cluster analysis based on RMSD of the HCV NS3/4A protease.
圖10給出了復合物聚類分析得到的各類代表性構象。圖中結合于A鏈的FAM用stick模式表示;另一分子FAM和蛋白酶催化中心(H57、D81和S139) 用紫紅色stick表示;藍色片段表示能量分解中有較大貢獻的F154-A157 和R130-Y134。從圖10可以看到,在4類代表性構象中,口袋區(qū)的結合模式變化不大,僅是ligand2 (FAM) 分子的苯環(huán)與ligand1分子的喹啉環(huán)空間相對位置略有變化,這點在圖6也有提到。結合模式方面,FAM的吡咯環(huán)主體通過C22和N23位取代側鏈,穩(wěn)定附著于F154-A157段,為其喹啉環(huán)側鏈和乙烯基側鏈順利嵌入催化中心提供了保證。由于此3處催化中心位于蛋白酶內部,在模擬過程中,沒有發(fā)生明顯的相對位移,使得FAM更有效地占據催化中心,發(fā)揮抑制活性。
對HCV NS3/4A蛋白酶與底物FAM的復合物進行20.4 ns的顯含水分子動力學模擬?;赗MSF計算值找出了分子的柔性區(qū)域,并與實驗B因子值進行了相關性分析,良好的相關性驗證了模擬方法的可靠性。FAM的取代尿素側鏈上的NH與蛋白酶A157,以及乙烯基側鏈的O與S139形成較為穩(wěn)定的氫鍵。結合自由能計算值與類似化合物的實驗值吻合較好,其中范德華相互作用為復合物形成的主要驅動力。通過能量分解分析發(fā)現,FAM的雙分子結合模式為發(fā)揮藥效關鍵形式,V55在形成復合物的關鍵殘基,對現有實驗數據做了有益補充。隨后的耐藥性突變實驗也證明了V55、I153和F154對FAM識別重要作用。最后,對復合物體系的構象變化做了簡要分析,得到了模擬過程中的4類代表性穩(wěn)定構象。模擬結果為以HCV NS3/4A蛋白酶為靶點的藥物分子設計和藥物分子的作用機理研究提供了一定的理論指導。
圖10 聚類分析的代表構象Fig. 10 The representative conformation of cluster analysis.
REFERENCES
[1] Guan Y, Sun HY, Li YY, et al. The competitive binding between inhibitors and substrates of HCV NS3/4A protease: a general mechanism of drug resistance. Antiviral Res, 2014, 103 (3): 60–70.
[2] Lavanchy D. Evolving epidemiology of hepatitis C virus. Clin Microbiol Infect, 2011, 17(2): 107–115.
[3] Shepard CW, Finelli L, Alter MJ. Global epidemiology of hepatitis C virus infection. Lancet Infect Dis, 2005, 5(9): 558–567.
[4] Chen SL, Morgan TR. The natural history of hepatitis C virus (HCV) infection. Int J Med Sci, 2006, 3(2): 47–52.
[5] Poordad F, Dieterich D. Treating hepatitis C: current standard of care and emerging direct-acting antiviral agents. J Viral Hepat, 2012, 19(7): 449–464.
[6] Zeuzem S, Poordad F. Pegylated-interferon plus ribavirin therapy in the treatment of CHC: individualization of treatment duration according to on-treatment virologic response. Curr Med Res Opin, 2010, 26(7): 1733–1743.
[7] Pawlotsky JM. New hepatitis C therapies: the toolbox, strategies, and challenges. Gastroenterology, 2014, 146(5): 1176–1192.
[8] Kim DW, Gwack Y, Han JH, et al. C-terminaldomain of the hepatitis C virus NS3 protein contains an RNA helicase activity. Biochem Biophys Res Commun, 1995, 215(1): 160–166.
[9] Baril M, Racine ME, Penin F, et al. MAVS dimer is a crucial signaling component of innate immunity and the target of hepatitis C virus NS3/4A protease. J Virol, 2009, 83(3): 1299–1311.
[10] Li K, Foy E, Ferreon JC, et al. Immune evasion by hepatitis C virus NS3/4A protease-mediated cleavage of the Toll-like receptor 3 adaptor protein TRIF. Proc Natl Acad Sci USA, 2005, 102(8): 2992–2997.
[11] Foy E, Li K, Wang CF, et al. Regulation of interferon regulatory factor-3 by the hepatitis C virus serine protease. Science, 2003, 300(5622): 1145–1148.
[12] LaPlante SR, nar H, Lemke CT, et al. Ligand bioactive conformation plays a critical role in the design of drugs that target the hepatitis C virus NS3 protease. J Med Chem, 2014, 57(5): 1777–1789.
[13] Wang JM, Cieplak P, Kollman PA. How well does a restrained electrostatic potential (RESP) model perform in calculating conformational energies of organic and biological molecules. J Comput Chem, 2000, 21(12): 1049–1074.
[14] Wang JM, Wolf RM, Caldwell JW, et al. Development and testing of a general amber force field. J Comput Chem, 2004, 25(9): 1157–1174.
[15] Jorgensen WL, Chandrasekhar J, Madura JD, et al. Comparison of simple potential functions for simulating liquid water. J Chem Phys, 1983, 79(2): 926–935.
[16] Ryckaert JP, Ciccotti G, Berendsen HJC. Numerical integration of the cartesian equations of motion of a system with constraints: molecular dynamics of n-alkanes. J Comput Phys, 1977, 23(3): 327–341.
[17] Kollman PA, Massova I, Reyes C, et al. Calculating structures and free energies of complex molecules: combining molecular mechanics and continuum models. Acc Chem Res, 2000, 33(12): 889–897.
[18] Wang W, Donini O, Reyes CM, et al. Biomolecular simulations: recent developments in force fields, simulations of enzyme catalysis, protein-ligand, protein-protein, and protein-nucleic acid noncovalent interactions. Annu Rev Biophys Biomol Struct, 2001, 30(1): 211–243.
[19] Simonson T. Macromolecular electrostatics: continuum models and their growing pains. Curr Opin Struct Biol, 2001, 11(2): 243–252.
[20] Bashford D, Case DA. Generalized born models of macromolecular solvation effects. Annu Rev Phys Chem, 2000, 51 (1): 129–152.
[21] Still WC, Tempczyk A, Hawley RC, et al. Semianalytical treatment of solvation for molecular mechanics and dynamics. J Am Chem Soc, 1990, 112(16): 6127–6129.
[22] Weiser J, Shenkin PS, Still WC. Approximate atomic surfaces from linear combinations of pairwise overlaps (LCPO). J Comput Chem, 1999, 20(2): 217–230.
[23] Maisuradze GG, Liwo A, Scheraga HA. Relation between free energy landscapes of proteins and dynamics. J Chem Theory Comput, 2010, 6(2): 583–595.
[24] Chen LY. Exploring the free-energy landscapes of biological systems with steered molecular dynamics. Phys Chem Chem Phys, 2011, 13(12): 6176–6183.
[25] Nguyen PH, Derrenumaux P. Configurational entropy: an improvement of the quasiharmonic approximation using configurational temperature. Phys Chem Chem Phys, 2012, 14(2): 877–886.
[26] Hegger R, Altis A, Ngeuyen PH, et al. How complex is the dynamics of peptide folding? Phys Rev Lett, 2007, 98(2): 028102.
[27] Barlow PN, Steinkasserer A, Norman DG, et al. Solution structure of a pair of complement modules by nuclear magnetic resonance. J Mol Biol, 1993, 232(1): 268–284.
[28] Feig M, Karanicolas J, Brooks III CL, et al. MMTSB tool set: enhanced sampling and multiscale modeling methods for applications in structural biology. J Mol Graphics Modell, 2004, 22(5): 377–395.
[29] Daura X, Gademann K, Jaun B, et al. Peptide folding: when simulation meets experiment. Angew Chem Int Ed, 1999, 38(1/2): 236–240.
[30] Hu JP, Gong XQ, Su JG, et al. Study on the molecular mechanism of inhibiting HIV-1 integrase by EBR28 peptide via molecular modeling approach. Biophys Chem, 2008, 132(2/3): 69–80.
[31] Welsch C, Schweizer S, Shimakami T, et al. Ketoamide resistance and hepatitis C virus fitness in Val55 variants of the NS3 serine protease. Antimicrob Agents Chemother, 2012, 56(4): 1907–1915.
[32] Berger KL, Lisetté L, Triki I, et al. Viral resistance in hepatitis C virus genotype 1-infected patients receiving the NS3 protease inhibitor Faldaprevir (BI 201335) in a phase 1b multiple-rising-dose study. Antimicrob Agents Chemother, 2013, 57(10): 4928–4936.
[33] Berger KL, Triki I, Cartier M, et al. Baseline hepatitis C virus (HCV) NS3 polymorphisms and their impact on treatment response in clinical studies of the HCV NS3 protease inhibitor faldaprevir. Antimicrob Agents Chemother, 2014, 58(2): 698–705.
[34] zeuzem S, buggisch P, agarwal K, et al. The protease inhibitor, GS-9256, and non-nucleoside polymerase inhibitor tegobuvir alone, with ribavirin, or pegylated interferon plus ribavirin in hepatitis C. Hepatology, 2012, 55(3): 749–758.
[35] Soumana DI, Ali A, Schiffer CA. Structural analysis of asunaprevir resistance in HCV NS3/4A protease. ACS Chem Biol, 2014, 9(11): 2485–2490.
(本文責編 郝麗芳)
Molecular recognition mechanism and motion of HCV NS3/4A protease with Faldaprevir analogue
Li Liang1, Jianping Hu1,2, Wenyi Du1, Ke Zuo1, Wei Liu1, and Xiaojun Gou1
1 Key Laboratory of Medicinal and Edible Plants Resources Development of Sichuan Education Department, Sichuan Industrial Institute of Antibiotics, Chengdu University, Chengdu 610106, Sichuan, China
2 College of Chemistry, Leshan Normal University, Leshan 614004, Sichuan, China
Abstract:Faldaprevir analogue molecule (FAM) has been reported to effectively inhibit the catalytic activity of HCV NS3/4A protease, making it a potential lead compound against HCV. A series of HCV NS3/4A protease crystal structures were analyzed by bioinformatics methods, and the FAM-HCV NS3/4A protease crystal structure was chosen for this study. A 20.4 ns molecular dynamics simulation of the complex consists of HCV NS3/4A protease and FAM was conducted. The key amino acid residues for interaction and the binding driving force for the molecular recognition between the protease and FAM were identified from the hydrogen bonds and binding free energy analyses. With the driving force of hydrogen bonds and van der Waals, FAM specifically bind to the active pocket of HCV NS3/4A protease, including V130?S137, F152?D166, D77?D79 and V55, which agreed with the experimental data. The effect of R155K, D168E/V and V170T site-directed mutagenesis on FAM molecular recognition was analyzed for their effect on drug resistance, which provided the possible molecular explanation of FAM resistance. Finally, the system conformational change was explored by using free energy landscape and conformational cluster. The result showed four kinds of dominant conformation, which provides theoretical basis for subsequent design of Faldaprevir analogue inhibitors based on the structure of HCV NS3/4A protease.
Keywords:HCV NS3/4A protease, Faldaprevir analogue molecule, molecular dynamics simulation, binding free energy, conformational change
Corresponding authors: Jianping Hu. Tel: +86-833-2152297; E-mail: hujianping@emails.bjut.edu.cn