靳皓茹 李娟 方慧生
摘要:蛋白質(zhì)在許多生命進(jìn)程中起著關(guān)鍵作用,通過與其他蛋白質(zhì)相互作用來發(fā)揮其生物學(xué)功能。因此,研究蛋白質(zhì)-蛋白質(zhì)相互作用對于探索生命的真諦、理解疾病相關(guān)機(jī)理,以及研究新藥提升人們的健康水平具有重要的作用。隨著生物信息學(xué)的不斷發(fā)展,越來越多的計(jì)算方法被應(yīng)用于蛋白質(zhì)結(jié)構(gòu)及功能的研究。其中,蛋白質(zhì)-蛋白質(zhì)對接,分子動力學(xué)模擬等技術(shù)在蛋白質(zhì)相互作用中得到了較為廣泛的應(yīng)用。本文對蛋白質(zhì)蛋白質(zhì)對接及分子動力學(xué)模擬等生物信息學(xué)方法的基本原理,相關(guān)軟件及其在蛋白質(zhì)-蛋白質(zhì)相互作用研究中的應(yīng)用進(jìn)行概述。
關(guān)鍵詞:蛋白質(zhì)-蛋白質(zhì)對接;分子動力學(xué)模擬;蛋白質(zhì)-蛋白質(zhì)相互作用
Abstract:Proteins that play a critical role in many cellular processes often perform their functions by interacting with other proteins. Therefore, the studies of protein-protein interactions are vital to exploring the essence of life, understanding the mechanism of diseases and developing new drugs to improve human health. With the sustained development of bioinformatics, more and more computational methods have been applied to structural and functional research of proteins. Protein-protein docking and molecular dynamics simulation are both widely applied to the studies of protein-protein interactions. This article reviews the theory of computational methods, softwares and the application in protein-protein interactions.
Key words:Protein-protein docking; Molecular dynamics simulation; Protein-protein interactions
眾所周知,蛋白質(zhì)在生物進(jìn)程中扮演著重要的角色。蛋白質(zhì)通過與其他生物大分子(如蛋白質(zhì),DNA和RNA)相互作用介導(dǎo)細(xì)胞內(nèi)各種重要的生理過程,如基因的復(fù)制、轉(zhuǎn)錄、翻譯以及細(xì)胞周期調(diào)控、信號轉(zhuǎn)導(dǎo)、免疫反應(yīng)等,其中,蛋白質(zhì)-蛋白質(zhì)相互作用尤為常見。因此蛋白質(zhì)-蛋白質(zhì)相互作用的研究有助于人們探明其細(xì)胞內(nèi)功能,從而了解各種疾病發(fā)生機(jī)制,為進(jìn)一步的新藥研發(fā)提供幫助。目前為止,研究蛋白質(zhì)-蛋白質(zhì)相互作用主要有酵母雙雜交、免疫共沉淀、親和色譜、質(zhì)譜、核磁共振等多種實(shí)驗(yàn)方法,這些技術(shù)為蛋白質(zhì)相互作用研究做出了重要貢獻(xiàn),積累了寶貴的數(shù)據(jù)資源。
隨著計(jì)算機(jī)處理能力的不斷提升,生物信息學(xué)的理論模擬方法得到迅速發(fā)展和廣泛應(yīng)用。生物信息學(xué)整合數(shù)學(xué),物理,化學(xué),信息學(xué)等眾多學(xué)科的優(yōu)勢,以計(jì)算模擬手段進(jìn)行生物學(xué)相關(guān)研究。自Janin和同事們[1]首次運(yùn)用自動化對接算法預(yù)測牛胰蛋白酶抑制劑-胰蛋白酶復(fù)合物3D結(jié)構(gòu)至今,蛋白質(zhì)-蛋白質(zhì)對接領(lǐng)域已取得很大進(jìn)步。該方法常用于蛋白質(zhì)結(jié)構(gòu)及功能研究,分析配體與蛋白質(zhì)間或者蛋白質(zhì)-蛋白質(zhì)間的相互作用模式,便于研究者從原子水平探究受體-配體間作用機(jī)制。分子動力學(xué)模擬在誕生至今的幾十年中不斷隨著計(jì)算機(jī)軟硬件技術(shù)的快速提升而愈加發(fā)展完善,已經(jīng)成為研究蛋白質(zhì)、核酸等生物大分子的結(jié)構(gòu)和動力學(xué)特性的重要工具。本文將對蛋白質(zhì)-蛋白質(zhì)對接和分子動力學(xué)模擬的基本原理及其在蛋白質(zhì)間相互作用研究中的應(yīng)用進(jìn)行簡要概述。
1 蛋白質(zhì)-蛋白質(zhì)對接
準(zhǔn)確的蛋白質(zhì)-蛋白質(zhì)復(fù)合物結(jié)構(gòu)是進(jìn)行蛋白質(zhì)-蛋白質(zhì)相互作用研究的基礎(chǔ)。然而,通過實(shí)驗(yàn)方法測定蛋白質(zhì)-蛋白質(zhì)復(fù)合物結(jié)構(gòu)比測定單個(gè)蛋白質(zhì)更加困難。隨著計(jì)算機(jī)水平的不斷發(fā)展,人們開始希望用計(jì)算模擬手段來預(yù)測蛋白質(zhì)復(fù)合物的真實(shí)結(jié)構(gòu),并希望從原子層面來分析蛋白質(zhì)-蛋白質(zhì)相互作用的內(nèi)部機(jī)制。蛋白質(zhì)-蛋白質(zhì)分子對接是一種常用的方法。它是指利用兩個(gè)單體蛋白質(zhì)的三維空間結(jié)構(gòu),來預(yù)測蛋白質(zhì)-蛋白質(zhì)復(fù)合物結(jié)構(gòu)。解決蛋白質(zhì)對接問題有兩個(gè)關(guān)鍵因素:打分函數(shù)和搜索算法[2]。打分函數(shù)應(yīng)能夠區(qū)分出正確的或近似正確的蛋白質(zhì)對接復(fù)合物,而且搜索算法需嚴(yán)格地探索由相互作用的蛋白質(zhì)形成的巨大構(gòu)象空間。
1.1打分函數(shù) 蛋白質(zhì)-蛋白質(zhì)對接可以被歸類為一個(gè)全局最優(yōu)化問題,其主要目的是找到蛋白質(zhì)分子間最穩(wěn)定關(guān)聯(lián)結(jié)構(gòu)。使用打分函數(shù)是準(zhǔn)確評估結(jié)合蛋白間的相互作用所必需的。打分函數(shù)有兩個(gè)作用:構(gòu)象采集和母板選擇及精制。打分函數(shù)的根本目的是從錯(cuò)誤的對接取向中區(qū)分出正確或近似正確的對接取向。打分函數(shù)主要有兩種類型:基于物理原理的函數(shù)和基于實(shí)驗(yàn)知識的函數(shù)。通常,基于物理原理的能量函數(shù)用分子力場如CHARMM[3]和AMBER[4]描述蛋白質(zhì)-蛋白質(zhì)相互作用。
打分函數(shù)可能包括幾何學(xué)與化學(xué)的互補(bǔ),靜電力、范德華力和氫鍵的相互作用以及解相關(guān)能量項(xiàng)。最常用的打分函數(shù)是形狀互補(bǔ)。經(jīng)常將形狀互補(bǔ)與FFT算法聯(lián)合應(yīng)用于詳盡的全局搜索。靜電場在帶電粒子或極性分子間的相互作用中扮演著重要角色。泊松-玻爾茲曼方程常被用來解決從原子水平獲得溶劑化生物分子系統(tǒng)的靜電電位問題。打分函數(shù)包括了極其重要的離散和核心相互作用,通常用范德華力相互作用來描述。
1.2搜索算法 搜索算法的主要目的就是在勢能圖上定位最穩(wěn)定的狀態(tài)。對接復(fù)合物可能解的構(gòu)象搜索可通過兩種不同的方案執(zhí)行。第一種方案是進(jìn)行全空間搜索,第二種是隨機(jī)地或按一定順序只搜索局部空間??焖俑道锶~變換是最為著名的用于全空間的搜索算法之一。Katchalski-Katzi[5]和助手首次將快速傅里葉變換法用于蛋白質(zhì)對接,確定受體配體間幾何契合。該方法被應(yīng)用于許多程序,如GRAMM[6], FTDock[7],3D-Dock[8]以及ZDock[9]。局部搜索算法包括模擬退火,蒙特卡洛法及遺傳算法等。Vieth和助手們[10]發(fā)現(xiàn)分子動力學(xué)法最適于進(jìn)行大空間搜索,而遺傳算法比其他算法更適合進(jìn)行小空間搜索。大多數(shù)情況下,蒙特卡洛算法和分子動力學(xué)算法都用來進(jìn)行蛋白質(zhì)柔性處理。
1.3對接過程 蛋白質(zhì)-蛋白質(zhì)對接一般通用的過程包括:①盡可能多的從全局或局部搜索中生成對接復(fù)合物;②篩選和評估復(fù)合物;③精制和重排。這三步可被細(xì)分為更多步。第一步完成剛體的全局搜索,盡可能多的生成對接蛋白質(zhì)-蛋白質(zhì)構(gòu)象。在第二步中,采用生物或?qū)嶒?yàn)信息和打分函數(shù)來掃描并評估第一步得到的對接復(fù)合物。錯(cuò)誤對接復(fù)合物的得分比接近X射線結(jié)構(gòu)復(fù)合物的得分高是很常見的,許多得分高的結(jié)構(gòu)并不實(shí)際存在。應(yīng)過濾掉這些不實(shí)際存在的結(jié)構(gòu),將剩下的對接復(fù)合物進(jìn)行評估。第三步涉及到側(cè)鏈及可能骨架的柔性。柔性處理時(shí)主要進(jìn)行重排側(cè)鏈。
2 分子動力學(xué)模擬
分子動力學(xué)模擬是一門利用經(jīng)典力學(xué)來模擬大分子體系運(yùn)動的方法,它綜合了數(shù)學(xué)、統(tǒng)計(jì)物理、化學(xué)、計(jì)算機(jī)等多門學(xué)科的內(nèi)容。分子力場是分子動力學(xué)模擬的基礎(chǔ)。它采用簡單的函數(shù)來描述分子能量與結(jié)構(gòu)之間的關(guān)系。分子力場的基本函數(shù)形式包括了原子之間的成鍵相互作用與非鍵相互作用。非鍵相互作用主要包含了范德華力與長程靜電力。
2.1分子動力學(xué)模擬過程 分子動力學(xué)模擬的步驟主要包括了四步:第一步是確定初始構(gòu)象,初始構(gòu)象盡量選越接近模擬系統(tǒng)的結(jié)構(gòu)越好,通常是能量較低的構(gòu)象。通常采用分子力學(xué)方法對其構(gòu)象進(jìn)行優(yōu)化;第二步平衡相過程,在前一步中已經(jīng)確定的模擬體系將進(jìn)行平衡相過程。在構(gòu)建平衡相的過程中,須對其構(gòu)象以及溫度等參數(shù)進(jìn)行調(diào)控并加以監(jiān)控,還要判斷體系是否已經(jīng)達(dá)到平衡;第三步生產(chǎn)相過程,模擬體系中的分子以及構(gòu)成分子的原子開始根據(jù)初始速度運(yùn)動,此時(shí)根據(jù)牛頓力學(xué)和預(yù)先給定的粒子間相互作用勢來對各個(gè)粒子的運(yùn)動軌跡進(jìn)行計(jì)算,并從這個(gè)過程中抽取計(jì)算分析時(shí)所需要的數(shù)據(jù)和樣本;第四步將對計(jì)算結(jié)果進(jìn)行深入分析處理。
2.2研究進(jìn)展及常用軟件 Tajkhorshid等成功的模擬了水分子通過不同通道亞型的過程[11]。Xu等在水溶液和磷脂雙層中對β淀粉樣多肽進(jìn)行了多次長時(shí)間分子動力學(xué)模擬,發(fā)現(xiàn)在生物膜和有機(jī)溶劑中以α螺旋為主,在水溶液中則以無規(guī)則卷曲為主[12]。京都大學(xué)醫(yī)學(xué)研究科的巖田想[13]成功分析了存在于細(xì)胞的,負(fù)責(zé)將物質(zhì)運(yùn)送到細(xì)胞內(nèi)的一種蛋白Mhp1的構(gòu)造,運(yùn)用該結(jié)果通過在計(jì)算機(jī)上模擬,在分子層次上弄清了Mhp1將物質(zhì)運(yùn)往細(xì)胞內(nèi)的機(jī)制。
目前,用于分子動力學(xué)模擬的軟件越來越成熟。較為常用的主要有:GROMACS,NAMD, AMBER,CHARMM,TINKER、LAMMPS等。GROMACS[14]是用戶界面友好的分子動力學(xué)模擬軟件,模擬中的參數(shù)條件和基本功能已經(jīng)趨于成熟,里面包含多種力場,非常適用于模擬生物大分子這種復(fù)雜體系。同時(shí)由于其速度快,在非生物體系統(tǒng)中也得到了廣泛的應(yīng)用。AMBER[15]不僅是一個(gè)程序,而是包含了從體系準(zhǔn)備到動力學(xué)模擬,再到軌跡分析等一系列程序的集合。同時(shí),AMBER 還是一系列力場的名稱,這些力場涵蓋了蛋白質(zhì)、核酸、糖類、脂類等眾多生物大分子。NAMD同樣適用于模擬計(jì)算蛋白質(zhì)、核酸等生物大分子體系,而且并行計(jì)算效率非常高。
3 展望
目前,蛋白質(zhì)分子對接及分子動力學(xué)模擬等計(jì)算手段雖然已廣泛用于蛋白質(zhì)-蛋白質(zhì)間相互作用的相關(guān)研究,但還是存在一些值得改進(jìn)的地方。例如,蛋白質(zhì)-蛋白質(zhì)對接過程中,蛋白質(zhì)柔性的相關(guān)處理,構(gòu)象搜索的合理性及打分函數(shù)的準(zhǔn)確度;分子動力學(xué)模擬中力場的種類和所研究體系的匹配度等。隨著計(jì)算機(jī)技術(shù)不斷的發(fā)展,這些生物信息學(xué)方法有待進(jìn)一步優(yōu)化和相關(guān)軟件需要進(jìn)一步完善,從而使其更適用于蛋白質(zhì)等生物大分子的模擬研究。總之,將生物信息學(xué)方法與傳統(tǒng)實(shí)驗(yàn)手段相結(jié)合來進(jìn)行蛋白質(zhì)間相互作用等生物大分子體系研究,是一條有待進(jìn)一步發(fā)展的有效途徑。
參考文獻(xiàn):
[1]WodakS J,JaninJ.Computer analysis of protein-protein interaction[J].Journal of molecular biology,1978,124:323-342.
[2]Taylor,J.S.and Burnett,RM.DARWIN:A program for docking flexible molecules[J].Proteins. 2000,41:173-191.
[3]Brooks,B.R.,States,D.J., S.andKarplus,M.CHARMM: a program for macromolecular energy, minimization, and dynamics calculations[J].J.Comput.Chem.1983,4: 87-217.
[4]Ferguson, D.M., Kollman,P.A.A second generation force field for the simulation of proteins, nucleic acids, and organic molecules[J]. J. Am. Chem. Soc,1995, 117: 5179-5197.
[5]Katchalski,Vakser,I.A.Molecular surface recognition: determination of geometric fit between proteins and their ligands by correlation techniques[J].Proc.Nat.Acad.Sci.USA,1992.89: 2195-2199.
[6]Tovchigrechko, Vakser, I.A.Development and Testing of an Automated Approach to Protein Docking[J].Proteins,2005,60:296-301.
[7]Gabb,H.A.,Sternberg,M.J.E.Modeling protein docking using shape complementarity, electrostatics and biochemical information[J].JMB.1997,272:106-120.
[8]Moont, Sternberg,M.J.E.Modelling protein-protein and protein-DNA docking[J].In Bioinformatics - From Genomes to Drugs,2001,1:361-404.
[9]Chen, R.and Weng,Z.A novel shape complementarity scoring function for protein-protein docking[J].Proteins,2003,51:397-408.
[10]Vieth, M., Hirst.Assessing search strategies for flexible docking[J].J.Comput.Chem,1998,19: 1623-1631.
[11]Tajkhorshid,E, Schulten, K.,Control of the selectivity of the aquaporin water channel family by global orientational tuning[J]. Science, 2002, 296: 525-530.
[12]Xu ,Y.,Jiang, H.Conformational transition of amyloid beta-peptide[J].PNAS.USA,2005,102: 5403-5407.
[13]Shima mura,T.,Beckstein. Molecular basis of alternating access membrane transport by the sodium-hydantoin transporter Mhp1[J].Science.2010,328:470-473.
[14]E.Lindahl,D.van der Spoel, Gromacs 3.0: A Package for Molecular Simulation and Trajectory Analysis[J].Journal of Molecular Modeling,2001,7:306-317.
[15]D.Case, B.Wang,R.The Amber Biomolecular Simulation Programs[J].Journal of Computational Chemistry,2005,26:1668-1688.
編輯/金昊天