姚衛(wèi)鋒,盧桂玲,謝艷秋,于 旺,宋蒙蒙,李士穎
(1.天津市中醫(yī)藥研究院附屬醫(yī)院皮膚科,天津300120;2.天津公安醫(yī)院內(nèi)三科,天津300042)
衣原體感染與人類的多種疾病關(guān)系密切[1],同時(shí)本身也是衣原體噬菌體的宿主。衣原體噬菌體與衣原體的關(guān)系逐漸成為研究的熱點(diǎn)。近10年發(fā)現(xiàn)的衣原體噬菌體已達(dá)5株,其20面對(duì)稱衣殼均含有3種蛋白分子,其中Vp1(virus protein1)分子量最大,在衣殼中含量最高,肽鏈長(zhǎng)度最長(zhǎng),有形成標(biāo)志性抗原表位的良好物質(zhì)基礎(chǔ)[2]。本文旨在分析各株噬菌體Vp1氨基酸序列的保守區(qū)及其結(jié)構(gòu)信息,為實(shí)證研究奠定基礎(chǔ)。
1.1 材料 衣原體噬菌體Vp1蛋白氨基酸序列Genbank 序列號(hào)分別為 Chp2(NP_054647.1);Chp3(YP_022479.1);Chp4(YP_338238.1);phiCPAR39(NP_510872.1);phiCPG1(NP_510872.1)。
1.2 方法 以ClustalX程序比對(duì)各株衣原體噬菌體衣殼蛋白Vp1序列獲得高保守區(qū)序列。蛋白二級(jí)結(jié)構(gòu)預(yù)測(cè)應(yīng)用DNAStar軟件提供的Protean模塊進(jìn)行,采用Gamier-Robson方法、Chou-Fasman方法、Eisenberg方法和Karplus-Schulz方法分析蛋白二級(jí)結(jié)構(gòu)。B細(xì)胞表位預(yù)測(cè)以7個(gè)氨基酸殘基為一組,分別按 Kyte-Doolittle、Emini和 Jameson-Wolf方案預(yù)測(cè)其親水性、表面可及性和抗原性指數(shù)。
2.1 序列高保守區(qū)比對(duì)結(jié)果 衣原體噬菌體Vpl高保守蛋白序列:ClustalX序列比對(duì)結(jié)果見圖1(以Chp2Vp1氨基酸序列定位):N端第1-215,300-565區(qū)域比對(duì)后標(biāo)為連續(xù)“*”,一致性很強(qiáng),為高保守區(qū);各序列第216-299位及第461-470位比對(duì)后無(wú)連續(xù)“*”“:”“.”,其間甚至出現(xiàn)比對(duì)“空溝(以“-”表示)”,序列差異顯著。
圖1 Vp1蛋白序列比對(duì)Fig 1 Vp1 protein sequencealignment
2.2 保守區(qū)二級(jí)結(jié)構(gòu)分析結(jié)果 蛋白二級(jí)結(jié)構(gòu)預(yù)測(cè)Chou-Fasman方案示:小長(zhǎng)度的α螺旋(alpha regions)稀疏散布、長(zhǎng)短不均的β折疊(beta regions)相對(duì)密集分布于序列全長(zhǎng);相對(duì)長(zhǎng)度更短的轉(zhuǎn)角結(jié)構(gòu)(t urn r egions)在以上兩者間的全序列范圍頻繁出現(xiàn),且該結(jié)構(gòu)與柔性區(qū)域(f le xible regions,Karplus-Schulz方法)的位置基本重疊。Gamier-Robson方案示:全序列只有3個(gè)短長(zhǎng)度α螺旋,散在分布;β折疊長(zhǎng)度比較均勻,小間隔密布于序列全長(zhǎng),其間隔長(zhǎng)度多小于鄰近β折疊長(zhǎng)度;轉(zhuǎn)角結(jié)構(gòu)和無(wú)規(guī)卷曲結(jié)構(gòu)(c oil r egions)位置也與柔性區(qū)域基本重疊,大部分富集于序列N端1-300位氨基酸殘基范圍內(nèi),位于β折疊間隔區(qū)域,長(zhǎng)度整體上大于Chou-Fasman方案預(yù)測(cè)結(jié)果。Eisenberg方案預(yù)測(cè)α螺旋、β折疊長(zhǎng)度不均,全序列范圍疏密相間,二者位置與Gamier-Robson方案類似(圖2)。綜合3種方法:α螺旋集中區(qū)域?yàn)镹端第57-101,145-201,231-264,311-356,418-454,507-534;β折疊在全序列范圍小段密集間斷分布,富集范圍為N端第33-74,135-174,211-249,294-353,409-438,473-499,528-565。轉(zhuǎn)角結(jié)構(gòu)在全序列范圍以小片段形式排布,富集范圍為N端第22-55,93-128,172-215,227-291,328-382,494-552。
2.3 B細(xì)胞表位預(yù)測(cè)結(jié)果 以Kyte-Doolittle方案分析,蛋白親水性較高的區(qū)域(hydrophilicity plot)為N端第 1-11,21-32,99-111,157-167,174-197,201-208,226-233,240-254,261-269,277-300,321-333,343 -358,372 -384,416 -436,474 -501,521 -529。Jameson-Wolf法預(yù)測(cè)抗原指數(shù)(a ntigenic i ndex)較高的區(qū)域?yàn)?N 端第 1-11,21-37,52-59,99-114,123-130,160-169,173-183,189-196,203-208,214 -221,227 -234,237 -244,250 -256,261 -266,278 -292,323 -335,345 -353,373 -384,392 -399,427 -435,459 -472,478 -504,520 -531,536 -541,548-555。大多數(shù)的高抗原指數(shù)區(qū)域與預(yù)測(cè)的親水區(qū)重合。Emini方案預(yù)測(cè)氨基酸殘基蛋白質(zhì)表面可及性(s urface p robability p lot),顯示 N端第 1-8,103-110,158-164,175-183,189-196,240-244,260-266,278-283,289-299,322-332,345-357,372 -381,417 -423,427 -434,478 -488,523 -528區(qū)段很可能位于蛋白質(zhì)的表面(圖2)。
圖2 二級(jí)結(jié)構(gòu)及B細(xì)胞抗原表位預(yù)測(cè)圖Fig 2 Predict the secondary structureand B cellepitope
迄今為止全世界已發(fā)現(xiàn)6種衣原體噬菌體,分別是 Chp1、Chp2、Chp3、Chp4、CPAR39 和 phiCPG1。第一株噬菌體Chp1發(fā)現(xiàn)后并未引起注意,隨著衣原體感染病例及衣原體耐藥性的增加,近十年衣原體的噬菌體研究逐漸引起重視,相繼發(fā)現(xiàn)了5株新的噬菌體。研究顯示衣原體噬菌體屬微病毒家族,都有20面體衣殼和單鏈核苷酸序列[3]。
衣原體噬菌體的衣殼是由Vp1、Vp2、Vp3 3種衣殼蛋白以符合熱力學(xué)定律原則對(duì)稱組裝的[2]。Vp1是分子量最大的結(jié)構(gòu)蛋白分子,其插入環(huán)IN5暴露于衣殼表面,由多肽鏈的第216和299之間的氨基酸構(gòu)成,能形成蘑菇樣的突起[4],推測(cè)Vp1蛋白參與噬菌體與宿主的識(shí)別過(guò)程。以各株噬菌體Vp1多肽序列進(jìn)行比對(duì)并構(gòu)建種系發(fā)生樹發(fā)現(xiàn)Chp1與其他5株噬菌體的親緣關(guān)系最遠(yuǎn),其他5株噬菌體分為2個(gè)亞群:分別為phiCPG1/phiCPAR39和Chp2/Chp3/Chp4。因此,我們對(duì)后5株噬菌體的Vp1蛋白序列展開分析。剔除Chp1Vp1序列后,發(fā)現(xiàn)N端第1-215,300-565區(qū)域保守度很高,未出現(xiàn)差異顯著的比對(duì)空溝,說(shuō)明這兩個(gè)區(qū)域?qū)p1蛋白分子的結(jié)構(gòu)構(gòu)成有重要價(jià)值??紤]到噬菌體的突變率很高,上述兩個(gè)區(qū)域在各種Vp1蛋白中能保有高度一致,說(shuō)明其能穩(wěn)定遺傳、難以替代。因而對(duì)該區(qū)域的進(jìn)一步結(jié)構(gòu)分析將能為尋找通用標(biāo)志物(表位)提供理論基礎(chǔ)。
相對(duì)三級(jí)/四級(jí)結(jié)構(gòu)預(yù)測(cè)的低可信度,二級(jí)結(jié)構(gòu)預(yù)測(cè)的可信度較高且仍在不斷改進(jìn)。Gamier-Robson法、Chou-Fasman法、Eisenberg法和Karplus-Schulz[5-6]方案都預(yù)測(cè)到蛋白的β折疊比α螺旋的數(shù)量多,可以認(rèn)為蛋白的二級(jí)結(jié)構(gòu)以β折疊為主:該結(jié)構(gòu)依靠氨基酸殘基間的氫鍵形成“剛性”折疊,成為蛋白分子中心的“支架”,除特殊情況暴露于分子表面外,普遍難以被免疫系統(tǒng)識(shí)別[7]。Vp1蛋白基本的結(jié)構(gòu)骨架是β折疊組成的,α螺旋只是輔助的結(jié)構(gòu)構(gòu)成單位。轉(zhuǎn)角和無(wú)規(guī)卷曲常常位于分子表面,因而有可能與抗體/受體作用,而且糖基化、磷酸化等蛋白加工過(guò)程也相應(yīng)成為可能[8]。轉(zhuǎn)角這種“結(jié)構(gòu)”在進(jìn)化中保守性很強(qiáng)[9],這種“保守性”提示轉(zhuǎn)角對(duì)蛋白質(zhì)的結(jié)構(gòu)和功能進(jìn)化都有重要意義。分析中發(fā)現(xiàn)Vp1蛋白除多變區(qū)外,其N端第1-215,300-565區(qū)域有頻繁出現(xiàn)的轉(zhuǎn)角和無(wú)規(guī)則卷曲結(jié)構(gòu),說(shuō)明Vpl蛋白有較為復(fù)雜的空間結(jié)構(gòu),肽鏈不斷折疊、卷曲,這樣能形成大量的潛在突出于分子表面的蛋白結(jié)構(gòu),成為潛在的蛋白間相互作用區(qū)域。
研究表明暴露于蛋白表面的區(qū)域容易被識(shí)別,潛在表位的蛋白分子表面可及性分析必不可少[10]。同時(shí),蛋白質(zhì)分子中疏水性氨基酸殘基一般埋藏在蛋白質(zhì)分子內(nèi)部,而親水性氨基酸殘基位于蛋白質(zhì)分子表面,親水性部位分析也成為暴露區(qū)域分析的重要一環(huán)。相對(duì)肽鏈中氨基酸殘基的性質(zhì),同時(shí)提出了抗原指數(shù)分析方案[11]??乖笖?shù)分析結(jié)果表明有25個(gè)集中的抗原表位區(qū)域且指數(shù)值較高,并與親水性部位、表面可及性綜合分析,認(rèn)為蛋白N端第1-8,103-110,158-164,189-196,252-259,273-284,322-332,427-434,478-488是優(yōu)勢(shì)B細(xì)胞表位。除去252-259,273-284兩個(gè)表位,其它均位于序列保守區(qū)。上述區(qū)域均避開了分析的“剛性結(jié)構(gòu)—α螺旋及β折疊”區(qū)域。
目前已經(jīng)從人類衣原體中發(fā)現(xiàn)了一株衣原體噬菌體—phiCPAR39,并觀察到其與肺炎衣原體株CPAR39的相互作用。因而對(duì)噬菌體Vp1蛋白高保守區(qū)的分析將為在更廣范圍內(nèi)尋找人類衣原體噬菌體奠定基礎(chǔ)。同時(shí)高保守區(qū)分析也為重組和建立衣原體基因輸送工具奠定了基礎(chǔ)。此外,衣原體噬菌體具有不同的、重疊的細(xì)胞嗜性特點(diǎn)—即它可以感染原來(lái)的宿主衣原體也可感染其他數(shù)種衣原體,為今后構(gòu)建多宿主敏感型重組衣原體噬菌體提供了理論支持。
[1]Saka H A,Valdivia RH.Acquisition ofnutrientsby Chlamydiae:unique challenges of living in an intracellular compartment[J].Curr Opin Microbiol,2010,13(5):4
[2]SaitM,LivingstoneM,Graham R,etal.Identification,sequencingand molecularanalysisofChp4,anovelchlamydiaphageofChlamydophilaabortusbelonging to the familyMicroviridae[J].Gen Virol,2011,92(7):1733
[3]Sliwa-Dominiak J,Suszyńska E,Pawlikowska M,etal.Chlamydia bacteriophages[J].Arch Microbiol,2013,195(10):765
[5]Kodaira K,Nakano K,Okada S,etal.Nucleotide sequence of the genome of the bacteriophage 3:interrelationship of the genome structure and the gene productswith those of the phages,X174,G4 and K[J].Biochim Biophys Acta,1992,30(11):277
[6]Ponomarenko JV,BournePE.Antibody-protein interactions:benchmark datasetsand prediction toolsevaluation[J].StructBiol,2007,7(63):1
[7]Su C H,Pal N R,Lin K L,etal.Identification of amino acid propens;ties that are strong determinants of linear B-cell epitopeusingneuralnetworks[J].PLOSOne,2012,7(2):617
[8]Larsen JE,Lund O,Nielsen M.Improvedmethod for predieting linear B-cellepitopes[J].Immunome Res,2006,2(2):1
[9]Beaver JE,BournePE,Ponomarenko JV.EpitopeViewer:a Javaapplication for thevisualizationand analysisofimmuneepitopesin theimmuneepitopedatabaseandanalysisresource[J].ImmunomeRes,2007,21(2):3
[10]Yoo SY,Merzlyak A,ChungW J,etal.Facile growth factor immobilization platform based on engineered phagematrices[J].SoftMatter,2011,14(7):1660
[11]鄭小莉,張藝,謝曉東,等.鼠Minele蛋白B細(xì)胞抗原表位預(yù)測(cè)及多克隆抗體制備[J].免疫學(xué)雜志,2011,27(8):683
[12]SaraswathiS,Fernández-Martínez J,KolińskiA,etal.Distributions of amino acids suggest that certain residue typesmore effectively determine proteinsecondary structure[J].Mol Model,2013,19(10):4337