滕家曼, 劉玉婷, 朱國梁, 諶莊琳, 陳彥濤
(深圳大學化學與環(huán)境工程學院,深圳市環(huán)境化學與生態(tài)修復重點實驗室,廣東 深圳 518071)
蛋白藥物具有生物活性高、特異性強及毒副作用小等優(yōu)點,但在臨床應用過程中也遇到了一系列問題[1]。比如蛋白藥物通常熱穩(wěn)定性差,需要同時面對腎臟過濾及蛋白酶解作用,導致藥代動力學嚴重低于預期。作為一種提升蛋白藥物體內半衰期的修飾方法,利用共價鍵在蛋白質表面綴合高分子長鏈,有效推動了醫(yī)藥產業(yè)的發(fā)展[2]。蛋白質-聚乙二醇(PEG)偶聯(lián)物是目前最成功的偶聯(lián)物形式,其PEG長鏈以無規(guī)線團的形式把目標蛋白包覆、保護起來,將其體內循環(huán)半衰期成功延長10~100倍[3]。目前已有十幾種蛋白-PEG偶聯(lián)物作為長效藥物獲得了上市批準,被應用于糖尿病、肝炎等重大惡疾的臨床治療[4]。然而,PEG自身不可生物降解,易在腎臟中聚集,長期給藥易導致免疫應答甚至較高的肝臟脂肪含量[5]。利用化學或生物手段,尋找具有低免疫原性、可生物降解的PEG替代物是目前該領域亟待解決的難點[6,7]。
作為一種潛在的PEG替代物,兩性離子多肽(ZIPP)近年來獲得了極大關注。ZIPP保持了多肽鏈的先天優(yōu)勢,如可生物降解、可序列設計等。另一方面,與兩性離子聚合物類似[8],ZIPP在序列中含有等物質的量之比的陽離子殘基(如賴氨酸)和陰離子殘基(如谷氨酸),空間上近鄰的正負電荷賦予ZIPP優(yōu)良的親水性、抗吸附特性及“隱身”能力,有效延長了在血漿中的停留時間[9]。Jiang課題組首先揭示了以賴氨酸和谷氨酸為重復單元的聚多肽poly(KE)有著最強的抗吸附能力[10];poly(KE)與內酰胺酶形成偶聯(lián)物后,環(huán)境耐受性及催化活性都得到大幅度提高[11,12]。2019年,Chilkoti課題組[13]利用類彈性蛋白聚多肽(ELP)修飾胰高血糖素樣肽GLP-1后,體內半衰期延長了71倍;對ELP序列進行突變,獲得兩性離子多肽ZIPP,其偶聯(lián)物生物活性再次提高1.7倍,體內半衰期由5~6 h延長到12 h[13]?,F(xiàn)有的偶聯(lián)物構效關系認為[3],長鏈高分子具有無規(guī)線團構象,其把目標蛋白包覆起來后,有效避免了腎臟清除和酶解作用,但也阻礙了目標蛋白與其受體的有效結合。Chilkoti課題組[13]的實驗研究說明,在相同分子量或類似空間尺寸情況下,兩性離子特性也能夠提高偶聯(lián)物藥效動力學特性。受限于儀器分辨率,相關實驗研究仍然停留在宏觀或介觀層面,尚不能在分子層面上給出結構與功能的關系。
本文借助于分子模擬手段,以GLP-1蛋白為研究對象,試圖在微觀層面揭示出兩性離子多肽與GLP-1蛋白的相互作用模式,探究ZIPP與普通多肽(如ELP)在物理化學性質上的差異。一般來說,蛋白偶聯(lián)物的藥代動力學行為受到多重因素的影響,如高分子鏈的鏈長、序列差異及接枝位點等。已有模擬研究中,乙二醇寡聚物,而非長鏈高分子,被成功用來探究PEG與目標蛋白的相互作用模式[14,15],這有效避免了其他因素對研究對象的干擾??紤]到兩性離子長鏈多肽也呈無規(guī)線團狀構象[13],本文采取了類似的策略,利用五肽與GLP-1蛋白的混合體系,試圖研究ZIPP五肽與GLP-1的相互作用模式。研究結果顯示,3種五肽都能夠有效穩(wěn)定GLP-1蛋白的螺旋構象;尤其是含有賴氨酸和谷氨酸的ZIPP五肽,其適當?shù)氖杷院挽o電相互作用,既能夠有效保護GLP-1蛋白,也不易被其他物質識別而表現(xiàn)出“隱身”特性。
本文研究對象GLP-1及五肽的序列信息參考了Chilkoti課題組[13]的相關實驗研究。GLP-1的氨基酸序列為AAHGEGTFTSDVSSYLEEQAAKEFIAWLVKGAG,是內源性GLP-1的突變體,在體內有著更高的穩(wěn)定性。3種五肽序列為:VPGAG、VPKEG和VPREG,文中分別簡寫為GA-pep、KE-pep和RE-pep。其中,GA-pep可以認為是類彈性蛋白多肽(ELP)的充分單元,而KE-pep和RE-pep是兩性離子多肽(ZIPP)。
研究對象GLP-1及五肽的初始結構由Chimera軟件[16]生成。GLP-1被設置為α-螺旋結構,肽平面二面角夾角分別為:Φ= 57°,Ψ= 47°;3種五肽被設置為β-片層結構,肽平面二面角夾角分別為:Φ= 139°,Ψ= 135°。為避免鏈末端的電荷影響,五肽N端和C端分別被乙?;王0坊舛恕?/p>
本文以GLP-1與五肽的混合體系為主要研究對象,分別稱為GLP@GA、GLP@KE、GLP@RE。體系中GLP-1的濃度為7.9 mol/L,GLP-1與五肽的物質的量之比為1∶40。作為對照組,本文也對不含五肽的GLP-1水溶液進行了模擬,該體系簡稱為GLP@WAT。
考慮到GLP-1與五肽的混合物體系較為龐大,本文使用粗?;鯬ACE(ver 1.3)[17,18]加速模擬進程。PACE力場由吳云東院士及韓偉教授主導開發(fā),其忽略了蛋白質中的非極性氫,但是保留了蛋白質的大部分原子細節(jié),同時對水分子進行了粗?;幚?。其勢能函數(shù)(E)表示如下:
式中的能量項既考慮了殘基間的近程相互作用(Ebond表 示與鍵長有關的能量,Eangle表示與鍵角有關的能量,Edihedral和Eimproper表示與二面角有關的能量,E?,ψ,χ1表示與旋轉偏差有關的能量);同時也包含了殘基間遠程相互作用,如Epolar表 示的極性庫侖相互作用和Enon?polar表 示的非極性范德華相互作用;此外,還囊括了ECGW?CGW表示的粗?;肿樱–GW)之間的非共價相互作用,以及ECGW?UA表示的水與殘基之間的非共價相互作用。到目前為止,PACE粗?;P鸵驯怀晒糜趯Φ鞍踪|折疊、多肽自組裝、蛋白-多肽相互作用的研究[19]。
本工作的所有模擬都基于GROMACS軟件包(ver 2018.1)[20]來進行。在210 nm3的立方盒子內,先把GLP-1蛋白放置于中央,將40條五肽隨機插入到盒子內,繼續(xù)加入鈉離子和氯離子使得體系整體呈電中性,并設置NaCl最終濃度為0.1 mol/L。盒子中充滿水分子,且所有原子的運動符合周期性邊界條件。
正式的分子模擬可分為3個階段:能量最小化、熱力學弛豫及成品模擬。在能量最小化階段,利用最速下降法對模擬體系進行5000步的能量優(yōu)化。在熱力學弛豫階段,將模擬體系溫度從100 K緩慢升到310 K,模擬步長設置為2 fs,該過程持續(xù)500 ps,并對蛋白質進行位置限制,力常數(shù)設置為1000 kJ/nm,且體系體積保持不變。在成品模擬階段,將體系放置在恒溫恒壓系綜中進行模擬,系統(tǒng)溫度和壓力分別保持在310 K和0.1 MPa,模擬步長為5 fs,該過程持續(xù)1000 ns。
在模擬運行過程中,每10步更新一次近鄰列表,短程近鄰列表的閾值為1.2 nm。非鍵范德華相互作用及長程靜電相互作用的閾值為1.2 nm,相對介電常數(shù)設為15。利用Nose-Hoover方法及Parrinello-Rahman方法維持體系的溫度和壓力在設定值,耦合時間常數(shù)分別為1.0 ps和2.0 ps。
本研究中的4個模擬體系各進行了2次分子動力學模擬,總模擬時間超過8000 ns。
成品模擬的最后200 ns的模擬被用來開展數(shù)據(jù)分析。利用VMD軟件[21]的Timeline模塊獲得蛋白質二級結構的時間演化趨勢;利用GROMACS的聚類函數(shù)獲取模擬體系的典型構象,進一步使用PyMol軟件[22]對構象進行渲染;利用GROMACS軟件自帶的分析模塊獲取體系的徑向分布函數(shù)(RDF)、原子接觸(Atomic contact)、GLP-1蛋白的位置漲落(RMSF)、均方位移(MSD)及末端距(Distance)。GLP-1蛋白的末端距定義為N端α碳與C端α碳之間的距離。參考文獻[19],當氨基N原子與羰基O原子之間距離小于0.32 nm時,定義為發(fā)生靜電相互作用;當殘基原子與水原子之間的距離小于0.5 nm時,定義為發(fā)生了原子接觸。
已有研究顯示,游離態(tài)的GLP-1蛋白不具有穩(wěn)定的二級結構[23];而GLP-1蛋白與受體結合后,以長螺旋的形式存在[24]。在五肽存在的情況下,GLP-1蛋白空間構象如何變化,至今未有相關的實驗研究。本研究中,GLP-1蛋白和五肽的初始構象分別被設定為α-螺旋和β-片層結構。由圖1(a)可知,模擬開始后,游離GLP-1的構象變得非常不穩(wěn)定,初始螺旋結構被分子熱運行迅速破壞。由圖1(b, c, d)可知,體系中引入40條五肽后,GLP-1蛋白的螺旋結構得以穩(wěn)定;尤其在GLP@RE體系中,除2個末端外,GLP-1整體呈現(xiàn)長螺旋結構。
圖1 各模擬體系中GLP-1蛋白的二級結構隨時間的變化情況Fig. 1 Time evaluation of the secondary structures for GLP-1 protein in different simulated systems
為定量觀察體系的演化情況,本研究統(tǒng)計了混合體系中五肽與水的接觸數(shù)。如圖2(a)所示,接觸數(shù)在前100 ns內快速下降,這說明五肽分子能夠在短時間內調整空間分布。五肽與GLP-1的接觸數(shù)(見圖2(b))呈現(xiàn)出較大的漲落,但250 ns以后圍繞平均值周期性變動,說明整個模擬體系基本到達熱力學平衡態(tài)。在3個混合物體系中,GA-pep與水形成了最少的接觸數(shù),這說明GA-pep具有較強的疏水性,形成了較為致密的聚集體,同時與GLP-1蛋白形成了最多的接觸數(shù)。KE-pep和RE-pep等兩性離子多肽具有一定的親水性,形成了的聚集體較為疏松;相較而言,KE-pep形成的聚集體最為疏松,與GLP-1蛋白形成了最少的接觸數(shù)。
圖2 各模擬體系中五肽的原子接觸數(shù)(Atomic contact)隨時間的變化情況:(a)五肽與水溶劑的接觸數(shù);(b)五肽與GLP-1蛋白的接觸數(shù)Fig. 2 Time evaluation of the atomic contacts for pentapeptides with (a) water and (b) GLP-1 protein in different simulated systems
模擬體系進入平衡態(tài)后,本研究進一步統(tǒng)計了GLP-1蛋白的末端距及二級結構分布。如圖3所示,游離GLP-1蛋白的螺旋比例僅為30.8%,其末端距也最小(0.67 nm);在得到五肽保護后,其螺旋比例則明顯提高。相比GA-pep,ZIPP更有利于GLP-1形成螺旋構象;特別是在GLP@KE體系中,螺旋比例增加到60.4%,近乎是GLP@WAT體系的2倍。圖4給出了GLP-1在不同體系中的典型構象。游離GLP-1蛋白的整體構象呈現(xiàn)為無規(guī)線團,N端與C端相互靠攏,呈閉環(huán)狀,并形成少量β-片(見圖1(a))。引入五肽后,GLP-1蛋白的兩個末端被迫分開,增強了形成螺旋的概率;尤其是在GLP@RE體系中,GLP-1形成了單根長螺旋。而在GLP@GA和GLP@KE體系中,GLP-1蛋白形成了多個短螺旋。
圖3 熱力學平衡后,各模擬體系中GLP-1蛋白的(a)二級結構分布及(b)末端距Fig. 3 (a) Distribution of secondary structures and (b) end-to-end distance of GLP-1 protein in different simulated systems when reaching thermodynamic equilibrium
圖4 熱力學平衡后,各模擬體系中GLP-1蛋白的典型構象Fig. 4 Typical conformation of GLP-1 protein in different simulated systems when reaching thermodynamic equilibrium
綜合圖1及圖3,GLP-1蛋白N端片段傾向于形成線團(coil)或轉折(turn)等結構,而多肽片段Asp15-Val33是否形成螺旋則依賴于微環(huán)境。相關實驗也發(fā)現(xiàn)了類似規(guī)律,如Thornton等[25]發(fā)現(xiàn)十二烷基磷膽堿(DPC)膠束有助于GLP-1形成含有兩個螺旋片段的構象,而Chang等[26]發(fā)現(xiàn)三氟乙醇水溶液有助于GLP-1形成單個長螺旋構象。
本研究利用徑向分布函數(shù)(g(r))探討了五肽在GLP-1蛋白周圍的分布情況(圖5(a))。GA-pep在形成致密聚集體的同時,也傾向于緊緊包圍在GLP-1蛋白表面,因而在r= 0.5 nm附近呈現(xiàn)最高峰;KE-pep傾向于分散在水溶液中,從而遠離GLP-1蛋白表面。圖5(b)顯示,五肽主要與GLP-1的10-12位殘基和C端螺旋發(fā)生接觸,而很少能接觸到GLP-1蛋白的中間序列部分,這也說明五肽聚集體并沒有完全把GLP-1蛋白包埋。
圖6(a~c)給出了3個混合體系的模擬快照(snapshot),更直觀地顯示出五肽在GLP-1蛋白周圍的分布情況。GA-pep形成了較為致密的聚集體,只對GLP-1蛋白的兩個末端形成了局部包覆,混合體系整體呈現(xiàn)左右結構;KE-pep形成的聚集體非常疏松,均勻分布在GLP-1蛋白周圍,但是只與兩個末端形成原子接觸,混合體系整體呈現(xiàn)核殼結構;RE-pep聚集體介乎其間,更接近GA-pep情形,只與GLP-1蛋白兩個末端形成原子接觸。本研究還對五肽分子單獨存在的溶液體系進行了粗?;M。經(jīng)過500 ns的熱力學松弛,3種五肽分子在水溶液中呈現(xiàn)出了不同的聚集狀態(tài),如圖6(e~f)所示。與混合體系模擬結果,可見3種五肽分子的不同聚集行為與是否引入GLP-1蛋白無關;換言之,五肽分子的內在特性決定了五肽與目標蛋白之間的相互作用模式。
圖5 (a)五肽在GLP-1周圍的徑向分布情況;(b)GLP-1各個殘基與多肽的原子接觸情況Fig. 5 (a) Radial distribution functions (RDF) of around GLP-1; (b) Atomic contacts with pentapeptides for each residue of GLP-1
圖6 各模擬體系中多肽在GLP-1蛋白周圍的典型分布Fig. 6 Typical distribution of pentapeptides around GLP-1 protein in different simulated systems
為繼續(xù)探究五肽形成聚集體及包覆GLP-1蛋白的驅動力,本文統(tǒng)計了混合體系內的靜電相互作用情況。由圖7可見,KE-pep與GLP-1蛋白形成了最少的靜電作用,同時KE-pep聚集體內部也形成最少的靜電作用,這充分說明KE-pep具有最高的親水性,傾向于均勻分散在水溶液中。RE-pep聚集體內部形成了最多的靜電作用,但與GLP-1的靜電作用稍微低于GLP@GA體系,這體現(xiàn)了驅動力的差異:RE-pep以靜電作用作為形成聚集體的主要驅動力,而GA-pep同時利用靜電及疏水作用形成致密聚集體,并以此與GLP-1形成最多的原子接觸。相比游離GLP-1蛋白,與五肽混合后,其兩個末端被迫分開,內部靜電作用稍有減少。
為了探究五肽中各殘基對驅動力的貢獻,本文進一步統(tǒng)計了各殘基與GLP-1的原子接觸數(shù)。如圖8所示,GA-pep中Gly3和Ala4與GLP-1形成了最多的接觸,而Val1和Pro2與GLP-1形成了最少的接觸,這說明疏水性強的Val1和Pro2相互靠攏,驅動GA-pep形成致密聚集體;其C端朝外,與GLP-1蛋白形成接觸。相比KE-pep,RE-pep的Val1和Arg3與GLP-1蛋白形成了最多的接觸,且明顯高于KE-pep對應的殘基;這說明,RE-pep的Arg3不但有利于自身形成聚集體,也促進了其與GLP-1蛋白形成局部包覆。
圖7 各模擬體系中靜電相互作用情況Fig. 7 The electrostatic interactions among GLP-1 protein and pentapeptides in different simulated systems
相較GA-pep,兩性離子多肽KE-pep和RE-pep都顯示了親水性。本文統(tǒng)計了水分子在ZIPP關鍵殘基周圍的徑向分布函數(shù)。如圖9所示,Glu4側基氧原子周圍的水分子密度基本相似,但Lys3側基氮原子周圍的水分子密度明顯高于Arg3。這表明KEpep喜歡分散在水環(huán)境中,而富含精氨酸的RE-pep更喜歡與其他殘基形成靜電作用。
圖8 各模擬體系中五肽各殘基與GLP-1蛋白的原子接觸數(shù)Fig. 8 Atomic contacts with GLP-1 for each residue of pentapeptide
本研究使用兩個序參量刻畫GLP-1蛋白的動力學性質。圖10顯示,各殘基在其位置附近的漲落明顯受到了五肽的影響。引入五肽后,GLP-1蛋白序列的中間部分形成了螺旋結構,其位置漲落受到抑制;但其N末端相關殘基的位置漲落變動更強烈,尤其是GLP@GA體系,這表明GA-pep聚集體與GLP-1蛋白N端的相互作用稍弱。
圖9 水分子在兩性離子多肽特定殘基周圍的徑向分布:(a)賴氨酸及精氨酸側基N原子周圍的水分子分布;(b)谷氨酸側基O原子周圍的水分子分布Fig. 9 Radial distribution of water molecules around some specific residues of zwitterionic pentapeptides: (a) The distribution of water molecules around N atoms of the side groups of LYS and ARG; (b) The distribution of water molecules around the O atom of the side groups of GLU
圖10 各模擬體系中GLP-1蛋白的動力學性質:(a)各殘基的根均方(RMSF)漲落情況;(b)GLP-1均方位移(MSD)隨時間變化情況Fig. 10 Kinetic properties of GLP-1 protein in different simulated systems: (a) The root-mean-squared fluctuation (RMSF) of each residue;(b) The mean-squared displacement (MSD) of GLP-1 as functions time
水溶液中,GLP-1蛋白與五肽混合后,其擴散能力也必然受到影響。圖10計算了不同模擬體系中GLP-1蛋白的均方位移?;趷垡蛩固箶U散理論,游離GLP-1的擴散系數(shù)為0.13 nm2/ns,與GA-pep、KE-pep或REpep混合后,其擴散系數(shù)分別降低至0.036 s、0.047 s、0.014 nm2/ns??梢娢咫木奂w明顯阻礙了GLP-1在溶液中的擴散,尤其是RE-pep,其聚集體密度低于GA-pep,但最強烈地影響了GLP-1的擴散能力;相比而言,由KE-pep組成的松散外殼對GLP-1的擴散阻力最小。
(1)游離GLP-1的兩末端相互靠近,形成環(huán)狀構象,螺旋比例僅為30%;而與五肽混合后,GLP-1兩末端傾向于與五肽形成相互作用,中間片段形成較為規(guī)整的螺旋結構。
(2)兩性離子五肽VPKEG具有較高的親水性,傾向于均勻分散在水溶液中,在GLP-1周圍形成疏松的保護層。兩性離子五肽VPREG以靜電作用為主,傾向于相互靠攏形成聚集體,也穩(wěn)定了GLP-1的長螺旋結構。對照組VPGAG具有較高的疏水性,傾向于形成致密的聚集體,雖然與GLP-1形成了最多的原子接觸,但未能充分包埋GLP-1并提供足夠的保護。
(3)賴氨酸、谷氨酸組合讓兩性離子五肽VPKEG具備了恰當?shù)挠H疏水性和靜電作用,既能維持GLP-1螺旋構象,也避免了被免疫蛋白識別,賦予其“隱身”特性。