董章勇, 陳欣瑜, 舒永馨,羅 梅,向梅梅
(仲愷農(nóng)業(yè)工程學(xué)院,廣東 廣州 510225)
【研究意義】茄子是一種十分重要的農(nóng)作物,在我國的栽種面積逐年增加。至今為止,茄子的栽種面積高達(dá)20余萬hm2[1]。近年來,茄子病害的發(fā)病程度與日俱增,其中茄子枯萎病是一種對(duì)農(nóng)業(yè)生產(chǎn)影響嚴(yán)重并且非常常見的土傳性病害,其發(fā)病率在10 %~40 %[2]。茄子枯萎病發(fā)病流行期可使植株整株死亡,使病田中茄子產(chǎn)量減產(chǎn)20 %~30 %[3]。茄子枯萎病在農(nóng)業(yè)生產(chǎn)中有“難防治,防治效果差”的特點(diǎn)。引起茄子枯萎病菌的病原物是由尖孢鐮刀菌所引起的。尖孢鐮刀菌屬于半知菌亞門(Deuteromycotina)梗胞目(Moniliales)鐮刀菌屬(Fusarium)[4]。Snyder和Hansen把鐮刀菌屬里面組內(nèi)的全部的種都合為1個(gè)種,并命名為尖孢鐮刀菌(Fusariumoxysporum)[5]。而由尖孢鐮刀菌是引起的茄子枯萎病對(duì)茄科作物的危害極大,能夠在對(duì)農(nóng)業(yè)生產(chǎn)上造成嚴(yán)重的經(jīng)濟(jì)損失[6]。尖孢鐮刀菌的防控是十分艱難的,主要是因?yàn)樗粌H能在宿主植物中存活,還能在土壤及空氣中存活8年以上并且仍然能夠表現(xiàn)出非常強(qiáng)的致病性[7]。對(duì)于其致病機(jī)理的研究顯得尤其重要。而效應(yīng)蛋白被認(rèn)為在植物病原物與寄主間的相互作用中發(fā)揮著重要的作用?!厩叭搜芯窟M(jìn)展】效應(yīng)因子(effector)也稱效應(yīng)子或效應(yīng)蛋白,廣義上是指能夠選擇性地結(jié)合其他目標(biāo)蛋白及調(diào)節(jié)其生物活性的一類小分子蛋白[8-11]。依據(jù)病原菌效應(yīng)分子的特點(diǎn),絕大多數(shù)效應(yīng)分子都是分泌蛋白[9,12]。效應(yīng)分子一般具有以下特征:①含有N-端信號(hào)肽;②沒有跨膜結(jié)構(gòu)域;③定位于細(xì)胞質(zhì);④序列具有特異性;⑤富含半胱氨酸;⑥重復(fù)元件多;⑦小分子蛋白[13-14]。前期有眾多關(guān)于病原菌效應(yīng)蛋白的研究?!颈狙芯壳腥朦c(diǎn)】本研究以本實(shí)驗(yàn)室前期測(cè)序獲得的茄子枯萎病菌菌株Fomg14004全基因組的16485個(gè)蛋白序列為研究材料進(jìn)行效應(yīng)子的篩選。依靠前述的7個(gè)特點(diǎn)以及病原互作數(shù)據(jù)庫(PHI)進(jìn)行候選效應(yīng)子的初步篩選。研究結(jié)果一方面為茄子枯萎病菌的致病機(jī)理研究建立材料基礎(chǔ),另一方面為其它植物病原菌的效應(yīng)因子篩選提供方法參考。【擬解決的關(guān)鍵問題】篩選出茄子枯萎病菌效應(yīng)蛋白,為進(jìn)一步研究其功能提供材料。
茄子枯萎病菌菌株Fomg14004的全基因組序列來自本實(shí)驗(yàn)室測(cè)序組裝預(yù)測(cè)數(shù)據(jù),共16 485個(gè)蛋白質(zhì)序列。
1.2.1 分泌蛋白組的預(yù)測(cè) 利用SignalP v4.1進(jìn)行信號(hào)肽的預(yù)測(cè)[15]。得到具有信號(hào)肽的蛋白序列。利用TMHMM v2.0 (http://www.cbs.dtu.dk/services/TMHMM/)進(jìn)行跨膜層數(shù)的預(yù)測(cè)[16-17]。將具有信號(hào)肽的蛋白序列文件提交。得到跨膜數(shù)小于2的蛋白序列。采用TargetP v1.1(http://www.cbs.dtu.dk/services/TargetP/)分析軟件[18]。將跨膜層數(shù)小于2 的蛋白序列進(jìn)行篩選。使用ProtCompv9.0(http://linux1.softberry.com/berr y.phtml?topic=protcomppl&group=programs&subgroup=proloc)在線分析軟件[17]。篩選出蛋白質(zhì)定位于細(xì)胞質(zhì)器中的蛋白序列。
1.2.2 分泌蛋白組的特征分析 利用perl工具進(jìn)行分泌蛋白組的特征分析,分析出經(jīng)過分泌蛋白組預(yù)測(cè)的蛋白序列的長(zhǎng)度特征。將最終結(jié)果復(fù)制到Excel中進(jìn)行統(tǒng)計(jì),并作圖。
1.2.3 效應(yīng)因子的致病性預(yù)測(cè) 在Linux系統(tǒng)中采用perl程序?qū)?jīng)過分泌蛋白組預(yù)測(cè)的蛋白序列進(jìn)行cysteine含量分析。篩選出cysteine含量大于等于6的蛋白序列,并進(jìn)行cysteine含量柱形圖統(tǒng)計(jì)。使用T-Reks(http://bioinfo.montp.cnrs.fr/?r=t-reks/)在線分析軟件[18]。得到高重復(fù)性高氨基酸含量的蛋白序列。再使用PHI數(shù)據(jù)庫進(jìn)行蛋白序列的分析(http://www.Phi-base.org/downloadLink.htm)。將小于或等于300個(gè)氨基酸殘基的小分子蛋白序列挑取出來,作為候選的致病效應(yīng)因子。
茄子枯萎病菌全基因組共16 485個(gè)蛋白序列。經(jīng)過SignalP v4.1分析后得到1601個(gè)具有信號(hào)肽的蛋白序列;然后經(jīng)過TMHMM v2.0分析得到1481個(gè)跨膜數(shù)小于2的蛋白序列;1481個(gè)具有信號(hào)肽的蛋白經(jīng)過TargetP v1.1分析得到1449個(gè)定位為S的蛋白序列;最后經(jīng)過ProtComp v9.0分析,得到1376個(gè)蛋白質(zhì)定位于細(xì)胞質(zhì)中的分泌蛋白序列。
將1376個(gè)蛋白序列進(jìn)行長(zhǎng)度分析后,得到516個(gè)蛋白序列長(zhǎng)度小于300(圖1),占37.5 %;632個(gè)蛋白序列長(zhǎng)度在300~599,占45.93 %; 178個(gè)蛋白序列長(zhǎng)度在600~999,占12.94 %;46個(gè)蛋白序列長(zhǎng)度在1000~2000,占3.34 %;4個(gè)蛋白序列長(zhǎng)度大于2000,占0.29 %。
圖1 1376個(gè)基因蛋白長(zhǎng)度分類Fig.1 1376 gene protein length classification
2.3.1 分泌組蛋白的半胱氨酸含量和重復(fù)元件分析結(jié)果 將1376個(gè)蛋白序列進(jìn)行cysteine含量分析,得到cysteine含量大于等于6的蛋白序列共733個(gè)(圖2)。將733個(gè)cysteine含量大于或等于6的蛋白序列進(jìn)行multiple tandem repeats分析。最終得到219個(gè)multiple tandem repeats大于或等于9的蛋白序列。
2.3.2 病原寄主互作數(shù)據(jù)庫分析比對(duì)結(jié)果 將富含半胱氨酸且高重復(fù)性的219個(gè)蛋白序列和Pathogen-Host Interaction database(PHI)數(shù)據(jù)庫進(jìn)行比對(duì)。共216個(gè)蛋白在PHI數(shù)據(jù)中獲得注釋。其中,97個(gè)蛋白被證明缺失后會(huì)造成致病力減弱(reduced virulence),占總數(shù)的50 %;11個(gè)蛋白缺失后會(huì)完全失去致病力(loss of pathogenicity),占總數(shù)的6 %,推測(cè)其為致病因子;10個(gè)蛋白已被證明是植物無毒效應(yīng)因子(Effectors),占總數(shù)的5 %;其中17個(gè)Mixed outcome蛋白序列里面有7個(gè)蛋白序列分別為失去致病力-毒性減弱和毒性減弱-失去致病力,歸為候選效應(yīng)因子,占總數(shù)的4 %;剩余的65個(gè)蛋白則被認(rèn)為是不影響病原的致病力的,占總數(shù)的33 %。因此,作為候選效應(yīng)因子的基因共有125個(gè),其中包括:植物無毒效應(yīng)因子10個(gè),致病力減弱基因97個(gè),致病力喪失基因11個(gè),混合型基因7個(gè),具體分類及基因功能如表1所示。
圖2 733個(gè)分泌基因的半胱氨酸含量分類Fig.2 Number of cysteine residues of the 733 secretome genes
2.3.3 小分子蛋白的篩選結(jié)果 一般的效應(yīng)因子都是小分子蛋白,其蛋白序列長(zhǎng)度均應(yīng)小于300個(gè)氨基酸,因此,將上述步驟獲得的125個(gè)基因序列進(jìn)行長(zhǎng)度篩選,去除大于300個(gè)氨基酸的蛋白序列。最終得到29個(gè)基因序列,這29個(gè)基因序列則被認(rèn)為是候選致病相關(guān)效應(yīng)因子(表2)。
表1 219種蛋白的基因功能的匯總Table 1 Summary of gene functions of 219 proteins
表2 29個(gè)候選致病相關(guān)效應(yīng)因子Table 2 29 candidate pathogenic effectors
續(xù)表2 Continued table 2
序號(hào)Code基因名稱Genename蛋白長(zhǎng)度ProteinlengthCysteine數(shù)目Thenumberofcysteine基因的功能Genefunction6g2630.t127913毒力減弱Reducedvirulence7g2867.t119213毒力減弱Reducedvirulence8g4309.t11976毒力減弱Reducedvirulence9g4311.t12039毒力減弱Reducedvirulence10g5742.t124826毒力減弱Reducedvirulence11g5896.t12298毒力減弱Reducedvirulence12g5964.t113011毒力減弱Reducedvirulence13g6744.t12627效應(yīng)子(植物無毒性決定簇)Effector(plantavirulencedeterminant)14g7829.t11088毒力減弱Reducedvirulence15g8388.t12079毒力減弱Reducedvirulence16g9248.t12939毒力減弱Reducedvirulence17g10142.t11978毒力減弱Reducedvirulence18g10352.t12288效應(yīng)子(植物無毒性決定簇)Effector(plantavirulencedeterminant)19g10355.t12966毒力減弱Reducedvirulence20g11621.t12147毒力減弱Reducedvirulence21g12071.t12916毒力減弱Reducedvirulence22g12442.t124020毒力減弱Reducedvirulence23g12923.t12646毒力減弱Reducedvirulence24g13311.t12967毒力減弱Reducedvirulence25g13540.t12808毒力減弱Reducedvirulence26g13889.t118110毒力減弱Reducedvirulence27g15041.t12997毒力減弱Reducedvirulence28g15627.t12819毒力減弱Reducedvirulence29g16404.t12929毒力減弱Reducedvirulence
病原菌是通過分泌一定數(shù)量的效應(yīng)因子到寄主體內(nèi)完成侵入、定殖和擴(kuò)展,從而實(shí)現(xiàn)致病過程,因此效應(yīng)因子是植物病原菌的重要功能蛋白[8-11,20]。隨著大量病原真菌基因組測(cè)序的完成,許多植物病原真菌基因組的效應(yīng)因子被逐漸預(yù)測(cè)和分析。曹友志[17]利用楊生褐盤二孢菌(Marssoninabrunnea)全基因組數(shù)據(jù),基于真菌效應(yīng)因子的普遍特征,利用生物信息學(xué)工具預(yù)測(cè)出約106個(gè)符合要求的候選效應(yīng)因子基因。李孟瓊[18]從稻瘟菌數(shù)據(jù)庫中的到21個(gè)效應(yīng)因子基因的開放閱讀框序列。由此可見,效應(yīng)因子在各個(gè)物種維持正常生命活動(dòng)中扮演著重要角色,但在不同物種中效應(yīng)因子的功能差異很大。本論文首次對(duì)茄子枯萎病菌Fomg14004 全基因組的16 485個(gè)蛋白質(zhì)的氨基酸序列進(jìn)行預(yù)測(cè),除了使用SignalP v4.1, TargetP v1.1, TMHMM v2.0和ProtComp v9.0等主流分泌蛋白分析軟件進(jìn)行篩選外,還結(jié)合半胱氨酸含量、蛋白重復(fù)序列,PHI數(shù)據(jù)庫比對(duì)以及小分子蛋白篩選等步驟,最終獲得29個(gè)候選致病效應(yīng)因子。與上述已經(jīng)報(bào)道到的其他真菌的全基因組效應(yīng)分子的預(yù)測(cè)所得到的數(shù)量相比,本次試驗(yàn)所得的候選效應(yīng)分子的數(shù)量更少、更嚴(yán)謹(jǐn),也更有利用下游的基因功能驗(yàn)證實(shí)驗(yàn)。
目前,效應(yīng)子雖然已經(jīng)歸納出了一些分析特征[23-25],依照不同的標(biāo)準(zhǔn)分析還是可能得到不同的結(jié)果。曹友志[17]將篩選條件設(shè)定為:① 氨基酸序列長(zhǎng)度:50~300 aa;②含有信號(hào)肽;③ 不含跨膜區(qū)域;④富含半胱氨酸;⑤具有高度序列特異性。其篩選到106個(gè)蛋白為效應(yīng)子。閆麗斌等[26]是基于對(duì)玉米大斑病菌全基因組序列進(jìn)行分泌蛋白的篩選,繼而對(duì)其蛋白半胱氨酸含量、信號(hào)肽長(zhǎng)度及冗余性分析,其獲得了60個(gè)候選效應(yīng)分子。而本研究將獲得的219個(gè)蛋白序列進(jìn)一步跟PHI數(shù)據(jù)庫進(jìn)行比對(duì)分析,且保留了小于300個(gè)氨基酸序列的蛋白作為最后的候選效應(yīng)子,最后得到29個(gè)候選效應(yīng)子。這可以進(jìn)一步將一些已經(jīng)確認(rèn)的非致病性的蛋白剔除,有利于縮小范圍進(jìn)行后續(xù)功能驗(yàn)證實(shí)驗(yàn)的開展。
本論文首次對(duì)茄子枯萎病菌全基因組的致病相關(guān)效應(yīng)因子進(jìn)行了預(yù)測(cè)和分析,流程簡(jiǎn)單,耗時(shí)較少,結(jié)果準(zhǔn)確。一方面,獲得的29個(gè)致病相關(guān)效應(yīng)因子可作為下一步致病功能的研究材料;另一方面,本論文所建立的方法則為其它植物病原真菌的效應(yīng)因子篩選提供方法參考。