覃悅,祝友朋,韓長志
西南林業(yè)大學(xué)生物多樣性保護(hù)學(xué)院/云南省森林災(zāi)害預(yù)警與控制重點實驗室,昆明 650224
黃單胞菌(Xanthomonascampestris)在分類上歸屬于薄壁菌門(Gracilicutes)暗細(xì)菌綱(Scotobacteria)假單胞菌科(Pseudomonadaceae)黃單胞菌屬(Xanthomonas)[1]。前人研究發(fā)現(xiàn),該菌是專性好氧、化能有機(jī)營養(yǎng)型革蘭氏陰性植物病原細(xì)菌,能引起十字花科蔬菜及芒果、核桃等多種重要農(nóng)林經(jīng)濟(jì)植物病害,給生產(chǎn)上造成巨大的經(jīng)濟(jì)損失,嚴(yán)重影響著上述農(nóng)林產(chǎn)業(yè)的健康發(fā)展。近年對該菌的研究主要集中于致病基因功能[2]、HarpinX耐熱機(jī)制[3]、轉(zhuǎn)錄調(diào)節(jié)因子[4]、效應(yīng)蛋白[6]、該菌與黃原膠的作用關(guān)系[7]以及分類研究[8]等方面。
植物作為生物界的重要生產(chǎn)者之一,在其生長發(fā)育的全過程中始終受到來自于真菌、細(xì)菌和卵菌等微生物的侵染[9]。特別是近年隨著對上述微生物分泌蛋白、CAZymes蛋白研究的不斷深入[10],證實病原細(xì)菌與植物相互作用過程中,病原細(xì)菌通過分泌系統(tǒng)將分泌蛋白輸入到寄主組織中,以更好地侵染植物,這些分泌蛋白還可作為效應(yīng)分子與植物中的防衛(wèi)反應(yīng)相關(guān)分子發(fā)生作用,從而在植物中實現(xiàn)定殖、擴(kuò)展等[11]。前人已對稻瘟菌[12]、致病疫霉菌[13]和大麗輪枝菌[14]等植物病原真菌分泌蛋白開展了大量研究,筆者所在研究室前期已完成對黃單胞菌X.campestrisB100、X.campestrisCN14、X.campestrispv.campestris8004(上述菌株登錄號分別為GCA_000070605.1、GCA_000401735.2、GCA_000012105.1,以下分別簡稱為XCB100、XC8004、XCCN14)等黃單胞菌中分泌蛋白的預(yù)測工作,然而,尚不清楚其理化性質(zhì)、保守結(jié)構(gòu)域以及亞細(xì)胞定位情況,制約著對該病菌分泌蛋白功能的進(jìn)一步研究。本研究基于前期研究結(jié)果,利用Protscale、SMART、TargetP 2.0 Server等生物信息學(xué)分析軟件對上述分泌蛋白展開理化性質(zhì)、保守結(jié)構(gòu)域以及轉(zhuǎn)運肽等分析,以期為深入開展對分泌蛋白在黃單胞菌侵入寄主植物過程中功能解析奠定基礎(chǔ),也為后續(xù)開展生物學(xué)實驗提供重要的理論支撐。
前期筆者所在研究室根據(jù)分泌蛋白所具有的典型特征,從信號肽、亞細(xì)胞定位以及跨膜結(jié)構(gòu)等方面入手,利用諸多生物信息學(xué)分析軟件,確定黃單胞菌XCB100、XCCN14和XC8004中具有典型特征的分泌蛋白數(shù)量分別為135、135、128個。
運用Protscale蛋白質(zhì)數(shù)據(jù)庫分析分泌蛋白質(zhì)的理化性質(zhì),包括理論等電點、不穩(wěn)定性系數(shù)、親水性、疏水性等[15]。
采用SMART[16]分析分泌蛋白質(zhì)的保守結(jié)構(gòu)域。
采用TargetP 2.0[17]分析分泌蛋白質(zhì)的轉(zhuǎn)運肽。
采用Microsoft Excel對所獲得的數(shù)據(jù)進(jìn)行分析,并采用Origin作圖軟件完成分析圖制作。
采用Protscale蛋白質(zhì)數(shù)據(jù)庫分析XCB100、XC8004、XCCN14中的分泌蛋白所具有的理論等電點,可知其分別為3.71~11.39、3.92~11.07、3.71~11.39(圖1A),進(jìn)一步分析發(fā)現(xiàn),XCB100分泌蛋白中,位于8.51~9.00和9.01~9.50的分泌蛋白數(shù)量最多(均為18個,比例為13.24%),其次位于5.51~6.00的分泌蛋白數(shù)量(為17個,比例為12.25%);XC8004分泌蛋白中,位于9.01~9.50的分泌蛋白數(shù)量最多(18個,比例為13.33%),再是是位于5.51~6.00的分泌蛋白數(shù)量(為17個,比例為12.59%);XCCN14分泌蛋白中,位于8.51~9.00的分泌蛋白數(shù)量最多(19個,比例為14.07%),其次是位于6.01~6.50的分泌蛋白數(shù)量(為17個,比例為12.59%)(圖1A)。
同時,按照理論等電點數(shù)值大小將分泌蛋白酸堿性分為酸性(小于6.0)、中性(6.0~8.0)以及堿性(大于8.0)蛋白,對XCB100、XC8004、XCCN14中的分泌蛋白理論等電點進(jìn)行分析,結(jié)果顯示:XCB100分泌蛋白中,酸性蛋白數(shù)量為43個(比例為31.85%),中性蛋白數(shù)量為35個(比例為25.93%),堿性蛋白數(shù)量為57個(比例為42.22%);XC8004分泌蛋白中,酸性蛋白數(shù)量為44個(比例為34.38%),中性蛋白數(shù)量為27個(比例為21.09%),堿性蛋白數(shù)量為57個(比例為44.53%);XCCN14分泌蛋白中,酸性蛋白數(shù)量為34個(比例為25.19%),中性蛋白數(shù)量為40個(比例為29.63%),堿性蛋白數(shù)量為61個(比例為45.19%)(圖1A)。上述結(jié)果表明,3種黃單胞菌中分泌蛋白的理論等電點數(shù)值范圍具有較大的相似性,酸性、中性及堿性蛋白所占比例基本相似,尤以堿性蛋白所占比例較高,高于40%。進(jìn)一步對上述3種黃單胞菌中分泌蛋白理論等電點與氨基酸長度之間的關(guān)系進(jìn)行分析,結(jié)果顯示,3種黃單胞菌中分泌蛋白的氨基酸長度多為100~400 aa,理論等電點多分布于4.5~7.0以及7.5~10.0,并且理論等電點與氨基酸長度之間無明顯相關(guān)關(guān)系(圖1B)。
與此同時,通過對分泌蛋白的原子數(shù)量、分子質(zhì)量及分子式、消光系數(shù)、脂肪族氨基酸指數(shù)和半衰期等分析,發(fā)現(xiàn)不同類型分泌蛋白所含正、負(fù)電荷氨基酸殘基數(shù)不同,即堿性蛋白的負(fù)電荷氨基酸數(shù)均小于正電荷氨基酸殘基數(shù);酸性蛋白中的正電荷氨基酸殘基數(shù)都小于負(fù)電荷氨基酸殘基數(shù);而中性蛋白中的正負(fù)電荷氨基酸殘基數(shù)基本相同;此外,分子數(shù)量較大的蛋白,其原子數(shù)量也較多(數(shù)據(jù)未顯示)。
圖1 黃單胞菌中分泌蛋白理論等電點分布(A)及其與氨基酸長度之間關(guān)系(B)情況
就所預(yù)測的不穩(wěn)定系數(shù)而言,黃單胞菌XCB100、XC8004、XCCN14的分泌蛋白中分別有61、58以及59個蛋白的不穩(wěn)定性系數(shù)大于40,屬于不穩(wěn)定蛋白,所占比例分別為45.19%、45.32%、43.70%,其他均為穩(wěn)定蛋白(圖2A)。就疏水性而言,XCB100、XC8004、XCCN14的分泌蛋白中分別有112、111以及112個蛋白總平均親水性小于0,屬于親水性蛋白,所占比例分別為82.96%、86.72%和82.96%,其余總平均親水性均大于0,屬于疏水性蛋白,所占比例分別為17.04%、13.28%和17.04%(圖2B)。
圖2 黃單胞菌中分泌蛋白不穩(wěn)定性系數(shù)(A)及總平均親水性(B)分布情況
同時,對3種黃單胞菌中分泌蛋白的最強(qiáng)親(疏)水性氨基酸殘基基本情況進(jìn)行統(tǒng)計分析,結(jié)果顯示,在XCB100中,尤以ID為WP_012437464.1的分泌蛋白中位于177、178位的D(天冬氨酸)和Q(谷氨酰胺)親水性最高,數(shù)值為-3.878,而ID為WP_012437104.1的分泌蛋白中位于121位的L(亮氨酸)疏水性最高,數(shù)值為4.056;在XC8004中,尤以ID為WP_011035929.1位于68、69位的R(精氨酸)和D親水性最高,數(shù)值為-4.167,而ID為WP_011037118.1位于7位的V(纈氨酸)疏水性最高,數(shù)值為3.967;在XCCN14中,尤以ID為WP_012438695.1位于123位的A(丙氨酸)親水性最高,數(shù)值為-3.656,而ID為WP_011037118.1位于7位的V疏水性最高,數(shù)值為3.967(圖3A)。進(jìn)一步對每個分泌蛋白的最強(qiáng)親(疏)水性氨基酸殘基進(jìn)行統(tǒng)計分析,結(jié)果顯示:最強(qiáng)親水性氨基酸殘基為D和R的分泌蛋白數(shù)量最多,平均分別為23和18個,而最強(qiáng)疏水性氨基酸殘基為A和L的分泌蛋白量最多,平均分別為37和47個(圖3B、C)。
對黃單胞菌中分泌蛋白開展保守結(jié)構(gòu)域分析,結(jié)果顯示:在XCB100中,蛋白ID為WP_011035886.1、WP_011037118.1、WP_011037974.1、WP_011038629.1、WP_011039020.1、WP_012436993.1、WP_012438073.1、WP_012438413.1、WP_012439258.1、WP_012439656.1、WP_014508988.1、WP_016944960.1和WP_040942357.1共13個蛋白具有明顯的保守結(jié)構(gòu)域,占總數(shù)的9.63%,同時,蛋白ID為WP_011037926.1、WP_011038879.1、WP_011039016.1、WP_011270059.1、WP_012437014.1、WP_012437247.1、WP_012437258.1、WP_012437398.1、WP_012437449.1、WP_012437450.1、WP_012437612.1、WP_012437952.1、WP_012437992.1、WP_012438203.1、WP_012438695.1、WP_012438717.1、WP_012438813.1、WP_012439163.1和WP_012439607.1共19個蛋白具有跨膜結(jié)構(gòu)域,占總數(shù)的14.07%(圖4A)。
在XC8004中,蛋白ID為WP_011035886.1、WP_011035887.1、WP_011036342.1、WP_011037118.1、WP_011037197.1、WP_011037525.1、WP_011037974.1、WP_011038535.1、WP_011038629.1、WP_011039020.1和WP_011039187.1共11個蛋白具有明顯的保守結(jié)構(gòu)域,占總數(shù)的8.59%,同時,15個蛋白具有跨膜結(jié)構(gòu)域,其ID分別為WP_011035714.1、WP_011035929.1、WP_011036687.1、WP_011036707.1、WP_011037342.1、WP_011037617.1、WP_011037623.1、WP_011038205.1、WP_011038708.1、WP_011038879.1、WP_011039016.1、WP_011269491.1、WP_011269534.1、WP_011270059.1、WP_011270084.1,占總數(shù)的11.72%(圖4B)。
A. 黃單胞菌中分泌蛋白氨基酸殘基分布情況; B. 最強(qiáng)親水性氨基酸殘基分布情況; C. 最強(qiáng)疏水性氨基酸殘基分布情況。A.The distribution of amino acid residues of secreted proteins in Xanthomonas; B.The distribution of the strongest hydrophilic amino acid residues; C. The distribution of the strongest hydrophobic amino acid residues.
A. XCB100; B. XC8004; C. XCCN14.
在XCCN14中,蛋白ID為WP_011036342.1、WP_011037118.1、WP_011037197.1、WP_011039020.1、WP_012437825.1、WP_014508988.1、WP_014509546.1、WP_019237225.1、WP_040940901.1、WP_040941816.1、WP_040942357.1和WP_052844708.1共12個蛋白具有明顯的保守結(jié)構(gòu)域,占總數(shù)的8.89%; 同時,22個蛋白具有跨膜結(jié)構(gòu)域,其ID分別為WP_011036687.1、WP_011038879.1、WP_011039016.1、WP_011270059.1、WP_012437398.1、WP_012437450.1、WP_012437952.1、WP_012437992.1、WP_012438695.1、WP_014506100.1、WP_040940353.1、WP_040940532.1、WP_040940540.1、WP_040940551.1、WP_040940557.1、WP_040940705.1、WP_040940805.1、WP_040941246.1、WP_040941554.1、WP_043877915.1、WP_076054737.1、WP_108133933.1,占總數(shù)的16.30%(圖4C)。
黃單胞桿菌XCB100、XC8004、XCCN14中分別有135、128、135個分泌蛋白定位于S(信號肽):在XCB100中,有32個蛋白預(yù)測概率大于0.8,約占總數(shù)的23.70%;有36個分泌蛋白所處的概率在0.6~0.8,約占總數(shù)的26.67%;有40個分泌蛋白所處的預(yù)測概率在0.4~0.6,約占總數(shù)的29.63%;有27個分泌蛋白所處的預(yù)測概率在0.2~0.4,約占總數(shù)的20.00%。在XC8004中,有29個預(yù)測概率大于0.8,約占總數(shù)的22.66%;有39個分泌蛋白所處的概率在0.6~0.8,約占總數(shù)的30.47%;有38個分泌蛋白所處的預(yù)測概率在0.4~0.6,約占總數(shù)的29.69%;有22個分泌蛋白所處的預(yù)測概率在0.2~0.4,約占總數(shù)的17.19%。在XCCN14中,有28個分泌蛋白的預(yù)測概率大于0.8,約占總數(shù)的20.74%;有38個分泌蛋白所處的概率在0.6~0.8,約占總數(shù)的28.14%;有43個分泌蛋白所處的預(yù)測概率在0.4~0.6,約占總數(shù)的31.85%;有22個分泌蛋白所處的預(yù)測概率在0.2~0.4,約占總數(shù)的19.26%(圖5)。
近年來,關(guān)于植物病原菌分泌蛋白和碳水化合物活性酶、效應(yīng)分子等的研究已經(jīng)成為植物病理學(xué)研究的重點和難點[10]。植物病原菌全基因組序列的公布,為學(xué)術(shù)界深入開展上述病原菌致病基因的研究提供了重要的數(shù)據(jù)支撐。國內(nèi)外學(xué)者對真菌[18]、卵菌[19]及枯草芽孢桿菌、細(xì)菌性黑斑病菌[11]等病原菌分泌蛋白進(jìn)行了大量的生物信息學(xué)分析,但尚缺乏對于植物病原菌中分泌蛋白理化性質(zhì)及特征分析工作的研究。分泌蛋白的理化性質(zhì)及特征關(guān)系著其功能的發(fā)揮,前人研究表明,病原菌在侵染植物的過程中分泌蛋白發(fā)揮著極其重要的作用,即植物病原真菌、卵菌以及細(xì)菌等不同物種之間,甚至在同一群體不同物種之間,以及同一物種不同種之間,所含有的分泌蛋白比例較為近似,這為未來學(xué)術(shù)界進(jìn)一步開展不同物種、不同群體以及同一物種不同種之間分泌蛋白的功能共性化和差異化研究提供了重要的參考。
圖5 黃單胞菌分泌蛋白含有潛在轉(zhuǎn)運肽的預(yù)測可靠性分析
本研究采用生物信息學(xué)分析軟件對3個黃單胞菌XCB100、XCCN14和XC8004菌株中的分泌蛋白理化性質(zhì)及特征進(jìn)行了分析,3種黃單胞菌中具有典型特征的分泌蛋白分別為135、135、128,利用Protscale、SMART、TargetP 2.0 Server等生物信息學(xué)分析軟件對上述分泌蛋白展開理化性質(zhì)、保守結(jié)構(gòu)域以及轉(zhuǎn)運肽等分析,初步明確了黃單胞菌分泌蛋白的理化性質(zhì)及其特征。結(jié)果表明,3種黃單胞菌中分泌蛋白理論等電點與氨基酸長度之間無相關(guān)關(guān)系,以堿性蛋白質(zhì)、穩(wěn)定蛋白質(zhì)、親水性蛋白質(zhì)居多,平均44.73%的蛋白為不穩(wěn)定蛋白,平均83.21%的蛋白總平均親水性小于0,屬于親水性蛋白,親水性最強(qiáng)氨基酸殘基以D和R居多,而疏水性最強(qiáng)氨基酸殘基以A和L居多。同時,每個黃單胞菌的分泌蛋白中平均有12個具有明顯的保守結(jié)構(gòu)域,并且所有分泌蛋白具有信號肽,轉(zhuǎn)運肽預(yù)測可能性分布也較為平均,因此,推測上述具有不同保守結(jié)構(gòu)域的分泌蛋白質(zhì)在實現(xiàn)侵染后具有多樣性的功能,這可能與培養(yǎng)和生存環(huán)境等因素有一定關(guān)系。