張凱強, 韓長志,2*
(1.西南林業(yè)大學生物多樣性保護學院, 昆明 650224; 2.云南省森林災害預警與控制重點實驗室, 昆明 650224)
受體介導的內吞作用作為諸多生物體內大多數細胞與環(huán)境相互作用的重要途徑之一[1-2],通過內吞相關蛋白作用,實現對于特定生物大分子的攝取[3]。文獻[4]對于模式真菌(釀酒酵母、構巢曲霉等)中的內吞作用相關蛋白展開了諸多研究工作,明確含有NPFxD基序以及DPFxD基序的蛋白,且基序蛋白通常參與內吞靶向信號過程。對于植物病原絲狀真菌而言,其內吞過程與菌絲細胞的生長、分化以及發(fā)育等關系密切[5]。
禾谷炭疽菌[Colletotrichumgraminicola(Cesati) Wilson]是一種半活體營養(yǎng)型植物病原絲狀真菌,可以侵染玉米、小麥、高粱等禾本科植物而引起炭疽病,給世界各國農業(yè)生產造成巨大的經濟損失[6-7]。20世紀以來,學者們對植物病原絲狀真菌的研究主要集中在遺傳轉化系統(tǒng)[8]、細胞凋亡[9]、異源蛋白表達[10]等方面。隨著2012年該菌全基因組序列的釋放[11],促進了學術界對于其促分裂原活化蛋白激酶(mitogen-activated protein kinase,MAPK)信號轉導途徑[12]和G蛋白信號調控因子(regulators of G-protein signaling, RGS)[13]以及Rab蛋白[14]等研究工作。本研究小組前期對該菌的G蛋白信號通路相關蛋白[15-16],碳水化合物活性酶類蛋白[7]、RGS蛋白[13]、效應分子motif序列[17]等開展了諸多研究報道,并且對該菌NPFxD基序蛋白進行了找尋及特征解析[18]。NPFxD基序以及DPFxD基序蛋白作為模式真菌中均含有的內吞相關蛋白,對于植物病原絲狀真菌來說,以上兩種蛋白的找尋及特征解析有助于后續(xù)有針對性的開展生物學試驗對其功能進行研究,但目前學術界對于植物病原絲狀真菌生長發(fā)育過程中DPFxD基序蛋白的報道較為少見,且中外學者對禾谷炭疽菌中存在具有DPFxD基序的蛋白情況尚未見學術報道。
鑒于此,基于文獻[19]報道,利用模式真菌構巢曲霉Aspergillusnidulans中具有DPFxD基序的蛋白氨基酸序列,利用同源序列比對及關鍵詞搜索等方法,對禾谷炭疽菌中全蛋白進行分析,找尋具有DPFxD基序的蛋白,并對上述蛋白的保守結構域、跨膜結構域、亞細胞定位、理化性質等特征進行分析,為進一步開展生物學的試驗驗證工作打下堅實的理論基礎。
通過NCBI數據庫下載禾谷炭疽菌M1.001全基因組序列(https://www.ncbi.nlm.nih.gov/genome/?term=Colletotrichum+graminicola)。
利用EMBOSS fuzzpro[20]預測獲取具有DPFxD保守結構域的蛋白質序列,對上述所獲得序列進行匯總分析,最終明確該菌中DPFxD基序蛋白登錄號、功能等相關信息。
1.3.1 跨膜區(qū)結構預測
利用在線跨膜區(qū)結構預測網站HMMTOP version 2.0[21]和TMHMM Server v.2.0[22]等對具有DPFxD基序的蛋白進行預測分析。
1.3.2 保守結構域預測
利用在線保守結構域特征分析軟件SMART[23]對具有DPFxD基序的蛋白進行分析。
1.3.3 蛋白亞細胞定位分析
利用亞細胞定位分析軟件ProtComp v9.0[24]對具有DPFxD基序的蛋白進行預測進行并繪制其的定位情況。
1.3.4 理化性質分析
利用理化性質測定程序Protscale[25]對具有DPFxD基序的蛋白進行預測。
1.3.5 信號肽預測
利用蛋白質轉運肽線在分析軟件TargetP 2.0 Server[26]對具有DPFxD基序的蛋白進行預測,利用蛋白質信號肽在線分析軟件SignalP 5.0 Server[22]對具有DPFxD基序的蛋白進行預測。
1.3.6 二級結構預測
采用蛋白質二級結構預測在線分析軟件Phyre[27]對具有DPFxD基序的蛋白進行預測。
1.3.7 系統(tǒng)進化樹構建
在NCBI數據庫中在線進行Blastp搜索獲取同源序列,并利用ClustalX[28]和MEGA X軟件[29]分別對其進行多重比對分析和構建系統(tǒng)進化樹。
文獻[19]對構巢曲霉中的全基因組開展DPFxD基序蛋白的搜索工作,利用EMBOSS fuzzpro軟件包進行預測[20],通過對禾谷炭疽菌全基因組序列進行分析,共獲得了48條含有DPFxD基序的蛋白序列,如表1所示。
表1 禾谷炭疽菌中DPFxD蛋白的基本信息及獲取方法
基于TMHMM跨膜結構域分析,具有1個及以上跨膜結構域的蛋白共9個,而具有2個及以上跨膜結構域的蛋白共4個,其ID分別為GLRG_05394、GLRG_01154、GLRG_09972、GLRG_01891;進一步利用HMMTOP進行預測發(fā)現,具有1個及以上跨膜結構域的蛋白共18個,而具有2個及以上跨膜結構域的蛋白共9個,其中ID為GLRG_09972、GLRG_05394、GLRG_01891的蛋白具有跨膜結構域的數量較多,分別為19、8和7個。
SMART在線分析表明,僅有9個蛋白具有明顯的保守結構域,其ID分別為GLRG_00466、GLRG_05048、GLRG_05276、GLRG_00892、GLRG_09336、GLRG_02591、GLRG_10373、GLRG_10778、GLRG_03100(圖1)。這些蛋白具有的保守結構域不相同,包括抑制蛋白C末端結構域、Tre-2-BUB2p-Cdc16p結構域、與各種細胞活動相關的ATP酶、水解酶、類GAL4 Zn(II)2Cys6(或C6鋅)雙核簇DNA結合域、真菌特異性轉錄因子結構域、UVSB PI-3激酶,MEI-41和ESR-1的結構域、類固醇結合域、泛素相互作用基序等。
Arrestin_C為抑制蛋白C末端結構域;TBC為Tre-2-BUB2p-Cdc16p結構域;AAA為AAA結構域;Cutinase為角質酶;GAL4為類GAL4 Zn(II)2Cys6(或C6鋅)雙核簇DNA結合域;Fungal trans為真菌特異性轉錄因子結構域;UME為UVSB PI-3激酶,MEI-41和ESR-1的結構域;FATC為FRAP、ATM、TRRAP C終端命名的結構域;Cyt-b5為類固醇結合結構域;UIM為泛素相互作用基序圖1 DPFxD基序蛋白保守結構域預測Fig.1 Conserved domain prediction of protein with DPFxD motif protein
對蛋白進行亞細胞定位分析(圖2),結果表明,ID為GLRG_04048、GLRG_05276、GLRG_09972、GLRG_10373的蛋白亞細胞定位分別在質膜、細胞核、內質網、線粒體,其余44個蛋白均定位在胞外。
圖2 亞細胞定位分析Fig.2 Subcellular localization
對48個DPFxD基序蛋白中氨基酸組成情況進行分析,結果顯示,A(丙氨酸)含量最高,平均達64個;L(亮氨酸)、S(絲氨酸)含量次之,均為58個;而W(色氨酸)、C(半胱氨酸)含量較低,平均僅為10個和6個(圖3)。
圖3 DPFxD基序蛋白氨基酸組成情況Fig.3 Amino acid composition of DPFxD motif protein
理論等電點位于5.51~6.00的蛋白數量最多,達10個,所占比例為20.83%;等電點位于4.51~5.00、5.01~5.50、6.01~6.50和8.50~9.00的蛋白數量次之,均為6個,所占比例為12.50%[圖4(a)]。就蛋白穩(wěn)定性而言,共31個蛋白不穩(wěn)定系數大于40,所占比例為65.58%親水性總平均值小于0的蛋白共43個,所占比例為89.58%,且親水性總平均值總和為-19.69,平均為-0.41[圖4(b)],屬于親水性蛋白。就脂肪族氨基酸指數而言,共34個蛋白分布于70~105,所占比例為70.83%,其中脂肪族氨基酸指數在70~80的蛋白數量最多,達16個,所占比例為33%[圖4(b)]。
圖4 DPFxD基序蛋白基本理化性質Fig.4 Basic physical and chemical properties of DPFxD motif protein
對48個DPFxD基序蛋白的親(疏)水性進行預測,結果表明,在親(疏)水性最強氨基酸殘基及位置方面也存在較大差異。蛋白ID為GLRG_01254的蛋白中位于1 442位的R親水性最強,親水性系數為-4.100;而ID為GLRG_05394的蛋白中位于294位和298位的L和V疏水性最強,疏水性系數為3.744[圖5(a)]。進一步對每個蛋白的最強親(疏)水性氨基酸殘基進行統(tǒng)計分析,結果顯示:最強親水性氨基酸殘基為D和R的蛋白數量最多,分別為12和11個;而最強疏水性氨基酸殘基為L、A和V的蛋白數量最多,分別為12、9、8個[圖5(b)]。
圖5 DPFxD基序蛋白的親(疏)水性氨基酸殘基的分布Fig.5 Distribution of hydrophilic (hydrophobic) amino acid residues of DPFxD motif protein
通過TargetP分析,8個DPFxD基序蛋白定位于信號肽,僅有1個蛋白定位于線粒體,其余蛋白轉運肽預測可靠性不高,未得到有效定位情況。其中ID為GLRG_04278的蛋白定位于線粒體,預測可靠性高達90.36%;ID為GLRG_06381的蛋白定位于信號肽,預測可靠性達99.99%。由于TMHMM和HMMTOP程序對于跨膜結構和信號肽的預測存在重疊性,利用SignalP 5.0進一步分析,結果顯示,6個DPFxD基序蛋白具有明顯的信號肽,其余均無明顯信號肽,信號肽切割位點位于15~20的蛋白有4個,所占比例為67%(表2)。
表2 DPFxD基序蛋白的轉運肽及信號肽特征
蛋白ID為GLRG_07485的蛋白α螺旋比例較高,達84%,但其卻不含TM螺旋和β螺旋;ID為GLRG_06771的蛋白無規(guī)則卷曲的比例高達96%,而其他3種結構比例較低;總體來看48個蛋白中TM螺旋與β螺旋比例較低,最高僅為43%和37%,如圖6所示。
圖6 二級結構分析Fig.6 Secondary structure analysis
以C.graminicola中的48個含有DPFxD基序的蛋白序列為基礎,在NCBI中進行同源蛋白找尋。結果顯示,該菌中的DPFxD蛋白與炭疽菌屬中有較高同源性以及較近親緣關系的病菌有C.sublineola、C.incanum、C.tofieldiae等,分為明顯的4大類(圖7),表明C.graminicola中大部分DPFxD基序蛋白之間的同源性較高。4個分支中所含DPFxD基序蛋白數量分別為17、17、5和9個,其中ID為GLRG_11942、GLRG_02591、GLRG_09867、GLRG_10778、GLRG_09021的5個蛋白屬于同一分支,其親緣關系較近,但與其他幾個分支相比該分支蛋白數量最少;ID為GLRG_06381、GLRG_06312、GLRG_10946、GLRG_05394、GLRG_01891、GLRG_09972、GLRG_07696、GLRG_07485、GLRG_00466的9個蛋白屬于同一分支;其余兩個分支中蛋白數量最多,均為17個。結果表明,C.graminicola中具有DPFxD基序的蛋白在長期進化過程中總體較為穩(wěn)定,但部分蛋白在進化過程中產生了較大分化。
植物病原絲狀真菌中的分泌蛋白及CAZymes等致病因子在其生長發(fā)育及致病過程中發(fā)揮著重要作用[30],隨著學術界對禾谷炭疽菌致病因子不斷的深入研究,一些如GPCR[16]、PI-PLC[31]、Pth11[32]、CFEM[33]等涉及G蛋白信號效應分子逐漸得到進一步確認。然而,對于禾谷炭疽菌DPFxD基序蛋白的研究報道還比較罕見。具有DPFxD基序的蛋白可用于其他正常受體的內化過程,對于缺乏泛素化位點的受體尤為重要[34]。內吞作用可以大量存在絲狀真菌菌絲尖端,并且菌絲尖端的快速延伸可能需要配合內吞作用[35]來實現。中外學者對內吞在病菌菌絲生長中的作用已有了相對明確的了解,如稻瘟菌中內吞調控蛋白可以有效抑制寄主免疫反應[36]。根據前人內吞機制調控蛋白研究成果分析,禾谷炭疽菌菌絲成長過程極有可能與內吞機制的調控有關聯(lián)。當植物通過各種信號途徑激活體內的免疫受體,從而減緩病菌等的進一步擴散和傳播;同樣,當禾谷炭疽菌感應到植物的免疫防御反應時也會采取的應對手段,如分泌毒素、角質酶、果膠酶和纖維素酶等致病因子的方式,破壞寄主植物的免疫受體,建立寄生關系,從而達到侵染的目的。而內吞作用在禾谷炭疽菌寄生過程中的地位和作用,內吞作用與解毒物質分泌之間的聯(lián)系,內吞作用與植物防御反應情況以及內吞作用對效應分子分泌和植物中營養(yǎng)吸收的影響等問題均有待于對具有DPFxD基序的蛋白功能開展進一步的研究和探討,從而較好地明確內吞機制,更好地防控植物病原菌。
通過關鍵詞搜索、Blastp比對分析、跨膜結構域以及亞細胞定位等進行預測分析,首先明確了C.graminicola中存在48個DPFxD基序蛋白;其次,通過在線分析軟件SMART、ProtComp v9.0等,明確其保守結構域、信號肽、蛋白質二級結構、疏水性、遺傳關系等情況;最后測定出有多條與DPFxD基序蛋白預測功能相同的蛋白質序列;此外,通過遺傳關系分析,明確禾谷炭疽菌DPFxD基序蛋白與炭疽菌屬中的C.incanum、C.sublineola、C.tofieldiae等病菌有較高的同源性和較近的親緣關系等。以上這些成果為深入研究其他炭疽菌屬真菌DPFxD基序蛋白提供有益的參考價值。