于文清,閆鳳超,劉文志,*,鄭桂萍,肖俊杰
(1.上饒師范學院 生命科學院,江西 上饒334001;2.黑龍江省農(nóng)墾科學院,哈爾濱 150036; 3.黑龍江八一農(nóng)墾大學,黑龍江 大慶 163319)
EsxAs(早期分泌抗原靶6,Early secreting antigenic target-6,ESAT6)是一類小分子分泌蛋白,一般含有100左右個氨基酸,具有保守的WXG氨基酸基序[1],因此被稱為WXG超級家族成員。該蛋白呈螺旋狀結(jié)構,與EsxB(CFP-10)共同組成VII型分泌系統(tǒng)(T7SS),EsxA最先在動物病原菌結(jié)核分支桿菌(Mycobacteriumtuberculosis)中發(fā)現(xiàn)[2],與其致病力密切相關[3-5],后陸續(xù)在其它動物病原菌中也發(fā)現(xiàn)了該類蛋白[6]。EsxA除了與動物致病菌的致病性相關外[7-8],還能夠誘導動物的免疫原活性[9-11],也有研究發(fā)現(xiàn),在單核球增多性李斯特菌中(Listeriamonocytogenes),EsxA與宿主病原菌的致病性無關[12]。在非致病細菌中也存在EsxA編碼基因,如在天藍色鏈霉菌中,EsxA與EsxB形成同源二聚體,與宿主菌成孢相關[13]。
前期研究發(fā)現(xiàn),植物根際促生菌土地類芽胞桿菌(Paenibacillusterrae)NK3-4基因組中攜帶著EsxA編碼基因,但EsxA在類芽胞桿菌中發(fā)揮何種功能尚無相關報道,是否與類芽胞桿菌對植物的促生效應相關也尚未可知。本文采用生物信息學技術分析了該EsxA的基本性質(zhì)、蛋白的3D結(jié)構及系統(tǒng)發(fā)育關系,以期為包括NK3-4菌株在內(nèi)的類芽胞桿菌EsxA基因外源分泌表達、活性保持條件及功能的深入研究提供理論依據(jù)。
將NK3-4基因組中注釋為毒力因子(Virulence factor EsxA)的氨基酸序列提交ExPASy Proparam tool(https://web.expasy.org/cgi-bin/protparam/protparam)分析其基本性質(zhì),將氨基酸序列提交NCBI中的BLSTp進行序列相似性比對,并檢索保守域。
將NK3-4 菌株EsxA氨基酸序列提交在線蛋白質(zhì)結(jié)構預測網(wǎng)站SWISS-MODEL(https://www.swissmodel.expasy.org/interactive/rgsxPX/models/),通過同源建模預測其3D結(jié)構[14],大致步驟如下:
(1)模板搜索選擇及建模:將序列提交SWISS-MODEL后,會自動匹配相似的模板,對于每個識別的模板,都列出了預測模板-目標匹配質(zhì)量,選擇質(zhì)量最高的模板建模。將模板與目標序列比對,模板與序列之間保守匹配的結(jié)構被從模板復制建模,用片段庫插入或刪除,再重新建模,而后重建側(cè)鏈,最后利用最小作用力的幾何學特性構建模型。
(2)建模質(zhì)量評估及配基建模:利用QMEAM評分功能進行全局性和殘基模型質(zhì)量評估。配基建模時,只有滿足以下全部條件后才代表存在配基:(i)配體在模板庫中注釋為生物學相關;(ii)配體與模型聯(lián)結(jié)在一起;(iii)配體與模型之間不沖突;(iv)與配體結(jié)合的殘基在模板與目標蛋白之間是特異保守的。
利用MEGA6軟件對NK3-4菌株EsxA及與其同源性較高的蛋白序列進行聚類分析,這些蛋白的氨基酸序列從Uniport數(shù)據(jù)庫(https://www.uniprot.org/)中獲得。對比序列類型選擇“Translated protein Sequenences”,統(tǒng)計方法采用鄰接法(Neighbor-joining),模板采用最大似然法(Maximum Composite Likeliood method)。系統(tǒng)發(fā)生檢測采用自舉法(Bootstrap method),成對比對參數(shù)(Pairwise Alignment)為缺口開啟罰分(Gap Opening Penalty):10,且缺口延伸罰分(Gap Extenson Penalty):0.1;多重比較參數(shù)(Multiple Alignment)為缺口開啟罰分:10,缺口延伸罰分:0.2;蛋白權值矩陣(Protein Weight Matrix):Gonnet;特殊氨基酸罰分(Residue-specific Penalties):ON,親水性罰分(Hydrophilic Penalties):ON;缺口分離距離(Gap Separation Distance):4;末端缺口分離(End Gap Separation):OFF。
2.1.1 NK3-4 菌株EsxA的理化性質(zhì)
NK3-4菌株EsxA含有91個氨基酸,分子質(zhì)量10 276.53 道爾頓,理論等電點 5.29,分子式為C445H711N125O146S4,原子數(shù)目1 431,消光系數(shù)(280 nm)5 500,Abs 0.1%(=1 g/L)0.535,估計半衰期為30 h(哺乳動物的網(wǎng)狀細胞,體外),>20 h(酵母,體內(nèi))和>10 h(大腸桿菌,體內(nèi))。不穩(wěn)定指數(shù)46.28,歸為不穩(wěn)定。脂肪族指數(shù)65.38,大致親水性平均值-0.548。表明NK3-4菌株EsxA為弱酸性、親水性蛋白質(zhì),三級結(jié)構不穩(wěn)定。
2.1.2 NK3-4菌株EsxA的保守域
CDD分析表明,EsxA 含有WXG100 ESAT6保守域及WXG高度保守基序第44到46個氨基酸:W(甘氨酸)-E(谷氨酸)-G(色氨酸),是WXG超級家族成員,該EsxA氨基酸序列及其保守域(見圖1)。
圖1 土地類芽胞桿菌NK3-4 EsxA氨基酸序列及其保守域Fig.1 Amino acide sequence and conserved domain of EsxA in Paenibacillus terrae NK3-4
2.2.1 模板篩選及模型構建結(jié)果
將NK3-4菌株EsxA氨基酸序列提交SWISS-MODEL后,共查出417個模板,其中一個名為EsxA的蛋白與提交序列識別率30%,相似性36%,可以該蛋白為模板建模。蛋白模板是同源二聚體,沒有配基,A、B鏈(見圖2)分別覆蓋NK3-4菌株EsxA 1~90及7~90個氨基酸,覆蓋率99%。
圖2 土地類芽胞桿菌NK3-4 EsxA結(jié)構預測模板Fig.2 Template for Paenibacillus terrae NK3-4 EsxA 3D structure prediction
2.2.2 建模質(zhì)量評估結(jié)果
建模評估表明,分子概率統(tǒng)計表明,分子概率分值1.22,沖突分數(shù)4.42,拉氏親和99.41%,拉氏離群值0.0%,旋轉(zhuǎn)異構體異常值0.0%,C-Beta偏差為0。全局性模型質(zhì)量評估顯示,QMEAN為-1.06(見圖3a);局部模板質(zhì)量評估表明,預測的局部文庫與目標序列預測相似性(見圖3b);預測模型與同源蛋白質(zhì)三級結(jié)構的相似性分析表明,與PDB結(jié)構的非冗余集比較,標準QMEAN4分值為0.74(見圖3c),結(jié)果表明(散點圖中以紅色五角星標記),Z得分<1,顯示該預測模型結(jié)構穩(wěn)定,是最佳的理想結(jié)構。
圖3 土地類芽胞桿菌NK3-4 EsxA結(jié)構預測模板質(zhì)量評估結(jié)果Fig.3 Assessment results of template for Paenibacillus terrae NK3-4 EsxA structure prediction
拉氏構象分析表明,預測模型壞鍵0/1 394、壞角6/1 874,包括A66 Phe、(B8 Thr-B9 Pro)、A59 Ala、A82 Asn、B11 Gln、B49 Lys,兩個亞基中,分別有97.8%和95.6%的氨基酸殘基位于深綠色最佳允許區(qū)域,且全部殘疾均位于額外允許區(qū)域(見圖4)。表明預測模型中全部氨基酸殘基均形成了合理的二面角,構成的蛋白質(zhì)結(jié)構穩(wěn)定。
圖4 土地類芽胞桿菌NK3-4 EsxA結(jié)構預測模板拉氏構象圖Fig. 4 Ramachandran plots of template for Paenibacillus terrae NK3-4 EsxA注:圖中深綠色區(qū)域代表鍵角穩(wěn)定,綠色區(qū)域代表鍵角雖然不穩(wěn)定,但可在自然界存在,淡綠色區(qū)域代表鍵角不穩(wěn)定.
2.2.3 NK3-4菌株EsxA 3D結(jié)構預測結(jié)果
NK3-4菌株EsxA 結(jié)構分析顯示,EsxA形成同源二聚體,其中每個亞基都由一個β折疊連接兩個α螺旋組成,這兩個α螺旋反向平行排列。二聚體中兩個亞基的肽鏈反向排列,所有N末端和兩個C末端均暴露在外。這個二聚體是不對稱的結(jié)構,其中一個亞基(B鏈)自由的N端肽段暴露出來,形成3D結(jié)構(見圖5)。
圖5 預測的NK3-4菌株EsxA激發(fā)子結(jié)構Fig.5 Predicted structure of Paenibacillus terrae NK3-4 EsxA注:a,b為EsxA二聚體;c和d為計算出的二聚體表面電勢圖(藍色-正電荷,橙色-負電荷,紫色-中性);b和d分別為a和c旋轉(zhuǎn)180°后的圖象;圖中標注了每個肽鏈的C端和N端(標注1的為A鏈,標注2的為B鏈).
聚類分析表明,EsxA主要分成兩個大簇(見圖6a,6b),NK3-4菌株EsxA與其中一簇中的兩個P.terrae及兩株多粘類芽胞桿菌(Paenibacilluspolymyxa)聚為一個小支,該小支內(nèi)的氨基酸序列是完全相同的,同時與其它類芽胞桿菌聚為一小簇(見圖6c),這一小簇再依次與側(cè)短芽胞桿菌(Brevibacilluslaterosporus),Paenibacillusyonginensis,高溫放線菌(Thermoactinomycessp)及韓氏芽胞桿菌(Bacilluskoreens)聚為一個大簇(見圖6a);在另一個大簇中,另一些類芽胞桿菌屬菌株EsxAs聚為一小簇(見圖6b),這兩個大簇與紅色梭菌(Clostridiumroseum)和氈毛梭菌(ClostridiumfelsineumDSM 794)最終聚到一起。可見,EsxAs在種間及屬間進化關系是不保守的,它們被明顯的分為兩個進化關系較遠的類簇,EsxAs做為一類分泌型小分子蛋白,廣泛存在于包括類芽胞桿菌的微生物中,且包括NK3-4菌株在內(nèi)的類芽胞桿菌的EsxAs與動物致病菌的毒力因子EsxAs親緣關系甚遠。親緣關系較遠可能是EsxA功能存在差異的原因。
圖6 土地類芽胞桿菌NK3-4 EsxA的系統(tǒng)發(fā)育樹Fig. 6 Phylogenetic tree of Paenibacillus terrae NK3-4 EsxA注:樹上分類單元標注了各蛋白在Uniport中的登錄號及來源菌種或菌株名稱,a,b,c分別為不同亞分支。
本文分析了類芽胞桿菌NK3-4 EsxA的基本性質(zhì)、3D分子結(jié)構及系統(tǒng)發(fā)育關系,為其后續(xù)研究與應用提供了理論依據(jù),主要表現(xiàn)在明確該蛋白的基本理化性質(zhì),可為EsxA基因外源分泌表達條件優(yōu)化提供依據(jù),也可為分泌表達至胞外的蛋白純化條件優(yōu)化提供參考,還可為優(yōu)化蛋白活性保持條件提供依據(jù)。3D結(jié)構預測有助于了解EsxA的特殊結(jié)構及功能,有助于認識該蛋白可能存在的與其它分子之間的相互作用的位點,并指導進行功能確認的生物學實驗設計。系統(tǒng)發(fā)育關系分析可為判斷該EsxA在進化過程中的保守性與變異性提供依據(jù),本文將NK3-4菌株EsxA與其相似性最高的34個蛋白質(zhì)進行聚類分析,表明這些EsxA在種內(nèi)與種間均是不保守的,說明其編碼基因變異性強,是一類進化速度較快的蛋白,這也是我們認為其在類芽胞桿菌中與在病原細菌中具有不同功能的依據(jù)。在包括NK3-4菌株在內(nèi)的類芽胞桿菌中,在類芽胞桿菌與植物進行互作時,其EsxA是否通過分泌到細胞外參與類芽胞桿菌對植物的促生效應,如參與宿主與植物的互作,其作用的分子機制如何,將是作者下一步研究將要揭示的答案。
采用生物信息學技術,明確了土地類芽胞桿菌NK3-4基因組攜帶的EsxA基因編碼的小分子分泌型蛋白的理化性質(zhì),分析了保守域并定位了及保守基序WEG。采用建模的方式,通過對模板的一系列質(zhì)量評估,預測了蛋白質(zhì)的3D結(jié)構,并基于該EsxA氨基酸序列構建了系統(tǒng)發(fā)育樹,系統(tǒng)發(fā)育分析表明,包括NK3-4菌株在內(nèi)的類芽胞桿菌的EsxA與致病細菌的EsxA同源關系較遠,這暗示非致病菌分泌的EsxA可能具有與病原菌分泌的EsxA具有截然不同的功能。結(jié)果為NK3-4菌株在內(nèi)的非致病菌EsxA基因外源分泌表達條件、蛋白活性保持及功能的深入研究奠定了理論基礎。