摘要:[目的]本研究旨在解析對松枯梢病原菌Sphaeropsis sapinea具有強拮抗活性的生防菌株森吉木霉Trichoderma songyi M75的基因組基本信息。[方法]采用Illumina NovaSeq PE 150為依托的第二代測序技術對森吉木霉M75菌株進行基因組測序。[結果]M75菌株全基因組總長34 483 860 bp.GC含量49.50%,與木霉屬真菌特征相吻合。在GO數(shù)據(jù)庫中,森吉木霉M75共注釋了28 494個基因;在KEGG數(shù)據(jù)庫中有8192個基因富集在KEGG中的383條不同的在三級代謝通路中,主要集中表現(xiàn)在代謝途徑通路(848個)、次生代謝產(chǎn)物的生物合成通路(330個)、抗生素的生物合成(243個)、微生物代謝通路(240個)、氨基酸的生物合成(118個)、碳代謝通路(112個)等相關的代謝與次生代謝產(chǎn)物合成通路中;共有2 184個基因在KOG數(shù)據(jù)庫中獲得蛋白功能注釋;在碳水化合物活性酶CAZy數(shù)據(jù)庫中,共注釋了259個糖苷水解酶GHs基因,105個糖基轉移酶GTs基因,7個多糖裂解酶PLs基因,21個糖類脂解酶CEs基因,54個糖類結合組件CBMs基因。森吉木霉M75全基因組中共包含41個基因簇,451個基因,多數(shù)與次級代謝產(chǎn)物的合成相關。[結論]本研究首次獲得了生防真菌森吉木霉的基因組序列信息,為木霉的遺傳信息、抑菌機制及抑菌物質的代謝通路等研究提供了數(shù)據(jù)支持和重要參考。
關鍵詞:森吉木霉;基因組;基因功能注釋;次級代謝
中圖分類號:S763.15 文獻標識碼:A 文章編號:1001-1498(2024)05-0160-09
在我國,由C型松枯梢病原菌松球殼孢菌(Sphaeropsis sapinea (Fr.) Dyko&B.Sutton)侵染松屬(PinUS)、冷杉屬(Abies)、落葉松屬(Larix)、雪松屬(Cedrus)、云杉屬(Picea)、刺柏屬(Juniperus)、崖柏屬(Thuja)和黃杉屬(Pseudotsuga)8個屬約60種針葉植物的嫩梢、針葉、芽和球果等多個部位引起的病害稱為松枯梢?。ㄓ置缮铱莶。?。其典型癥狀為松球殼孢菌侵染頂芽,導致頂芽受害,新梢萎蔫彎曲無法正常生長,新生的針葉顏色逐步變枯黃,發(fā)展成枯梢。松枯梢病已是目前世界范圍內(nèi)針葉樹上最常見和分布最廣的重要病害之一。
為了防治松枯梢病,現(xiàn)代營林措施高度依賴化學農(nóng)藥,通常大量使用殺菌劑和熏蒸劑,導致化學物質在土壤中逐年富集,對環(huán)境產(chǎn)生巨大的負面影響,此外,化學藥劑的長期重復使用也會導致病原菌產(chǎn)生抗藥性。這促使人們尋求減少或消除使用農(nóng)藥的有害生物控制新策略,即將生防菌劑與低劑量的化學藥劑相結合使用,可有效控制植物病害且對環(huán)境危害較小。
已有眾多研究表明,木霉屬(Trichoderma)中豐富的真菌物種是可以用來當做生物防治劑開發(fā)的有益真菌種類,這種類群的真菌可以產(chǎn)生各種抗生素和拮抗作用酶等,同時可以通過誘導提高植物系統(tǒng)抗性以及對植物病原真菌的寄生作用來抑制病害的發(fā)生并降低危害,它們的代謝多樣性和強大的資源競爭力,使木霉屬中的很多有益真菌被開發(fā)制作為商業(yè)生物肥料和生物防控制劑。
2008年Martinez D等人首次對里氏木霉(Trichoderma reesei E.G. Simmons)展開基因組測序,里氏木霉由此成為第一個完成全基因組測序的木霉屬真菌,此后,隨著測序技術的不斷發(fā)展以及測序成本的逐年降低,研究人員相繼公布了深綠木霉(Trichoderma atroviride P.Karst.)和綠木霉(Trichoderma virens(J.H.Mill.,Giddens& A.A. Foster) Arx)的基因組信息,哈茨木霉(Trichoderma harzianum Rifai)和蓋斯姆木霉(Trichoderma gamsii Samuels&Druzhin)也于2015和2016年相繼完成測序。此后,更多的木霉屬真菌相繼完成測序,獲得全基因組水平的基因信息,這標志著針對木霉屬的研究正逐漸進入全基因組時代,而關注木霉屬真菌基因表達層面的研究也為木霉基因功能的開發(fā)和利用奠定了基礎。
截至目前,森吉木霉(Trichoderma songyiM.S.Park, Seung Y.Oh&Y.W.Lim)這一物種還未開展全基因組測序,為填補這一空白,獲得森吉木霉完整的基因序列,本研究以實驗室前期篩選獲得的1株對松球殼孢菌具有較強抑菌活性且抑菌譜廣泛的森吉木霉M75菌株作為研究對象,采用lllumina NovaSeq PE 150為依托的第二代測序技術對該菌株進行基因組測序,通過基因組組分分析,基因通用功能注釋與效應因子注釋,深入研究森吉木霉菌株M75生防功能的內(nèi)在機制,闡述并推測森吉木霉具有高強度抑菌活性的可能原因,擴充生防木霉菌庫,為生防木霉的拮抗機理研究奠定基礎,同時為微生物防治松枯梢病及其他重要林木病害的技術開發(fā)和應用提供基因組水平上的數(shù)據(jù)支持和理論依據(jù)。
1 材料與方法
1.1 試驗材料
供試菌株:森吉木霉M75由本實驗室分離篩選獲得,現(xiàn)保藏于中國林業(yè)微生物菌種保藏管理中心,保藏編號:CFCC54490。
1.2 試驗方法
1.2.1 菌絲體收集
用打孔器打取直徑5 mm的森吉木霉M75菌餅,接入裝有250 mL PDB培養(yǎng)基的500 mL三角瓶中,置于28℃、180 r·min-1的搖床上振蕩培養(yǎng)96 h,得到森吉木霉M75的發(fā)酵液,收集30 mL發(fā)酵液于50 mL離心管中,4℃下10 000 r·min-1離心10 min,棄上清,取沉淀,收集菌絲體。
1.2.2 文庫構建及庫檢
采用SDS法提取森吉木霉M75菌株樣本基因組DNA,通過凝膠電泳檢測樣本DNA的純度,基于Qubit技術進行定量分析。選取質量檢測合格的DNA,通過Covaris超聲儀將目的DNA打斷成長度約為350 bp的片段。處理完成后的DNA片段,按NEB試劑盒中的方法操作,進行末端修復、加PolyA尾、純化和擴增處理后,獲得所需文庫。建立好所需文庫后,通過Qubit 2.0熒光計(美國Invit-rogen公司)定量分析,先稀釋到2.0 ng·μL-1,檢測其插入片段,接頭引物長度符合預期后,為保證文庫質量,通過Q-PCR對其有效濃度準確分析。
1.2.3 測序、組裝與組分分析
利用IlluminaNovaSeq PE 150,并按照有效濃度相關參數(shù)對不同文庫進行測序。使用readfq(v10.0)軟件對采集數(shù)據(jù)中的低質量數(shù)據(jù)部分過濾處理,過濾后得到的數(shù)據(jù)為有效數(shù)據(jù)。具體操作方法為:去除所含低質量堿基中(Mass value在20以下)超過40%的reads,刪掉N堿基在10%及以上的reads,刪掉接頭引物序列重疊部分超過15 bp的reads,同時對可能來自于其他物種的信息進行過濾,除去重復樣本污染。得到清潔數(shù)據(jù)后,對所獲得的樣本基因組進行組裝,得到反映基因組基本情況的序列文件,并對組裝結果進行評價。具體處理流程如下:經(jīng)過預處理后得到Clean Data,使用SOAPdenovo(v2.04),SPAdes(v3.5.0)。ABySS(v1.4.8)組裝軟件進行組裝,使用CISA(http://sb.nhri.org.tw/CISA/en/CISA)軟件進行整合;而為使組裝的序列更完整,需再次利用測序的雙末端數(shù)據(jù)配對關系鏈接contigs,同時基于相應的覆蓋關系填充空隙。應用Gapcloser(v1.1.2)軟件工具進行數(shù)據(jù)處理,過濾長度低于50 bp的片段。使用Tandem RepeatFinder(v4.04)軟件預測串聯(lián)重復序列,根據(jù)重復單元長度及數(shù)目篩選出其中的微衛(wèi)星以及小衛(wèi)星序列。具體測序和組裝過程由北京諾禾致源公司完成。
1.2.4 基本功能注釋
使用Diamond軟件(v0.9.10.111)針對編碼基因序列進行不同數(shù)據(jù)庫的功能注釋,包括GO(Gene Ontology)、KEGG(Kyoto Encyclopedia of Genes and Genomes)、CAZy(Carbonhydrate-Active Enzymes Data-base)、KOG(Clusters of Orthologous Groupsfor Eukaryotic Complete Genomes)等功能基因數(shù)據(jù)庫。GO注釋采用InterPro(v66.0)軟件完成,KO及Pathway注釋使用KEGG的KAAS(v2.1)自動化注釋系統(tǒng),KOG注釋使用egg-NOG-mapper(v4.5)完成。相關基因功能注釋時依據(jù)如下的流程進行:(1)將所預測基因的蛋白序列與各功能數(shù)據(jù)庫中的蛋白序列進行比較(evalue≤1e-5);(2)將按默認值(identity≥40%,coverage≥40%)對比對結果進行過濾,對所獲得的各序列的比對結果,確定出其中分值最高的進行基因基本功能注釋。
1.2.5 效應因子注釋
效應因子注釋主要包括樣品全基因組中的分泌蛋白和次級代謝基因簇。在研究過程中通過SignaIP(v6.0)和TMHMM(v2.Oc)等軟件工具對其進行預測,檢測全基因組序列中是否含有信號肽等與分泌蛋白相關的生物信號或結構,并對所分析的蛋白序列是否為分泌蛋白進行全面預測。采用antiSMASH程序(v6.1.1)對基因組進行次級代謝基因簇預測。
2 結果與分析
2.1 組裝結果統(tǒng)計
森吉木霉M75全基因組總長度為34 483 860bp,大小約34.5 MB,GC平均含量(鳥嘌呤和胞嘧啶與全部堿基的摩爾百分比)為49.50%,共預測到9 315個編碼基因,編碼區(qū)的總長度為15 352 435 bp,約1.50 MB,占全基因組總長的44.52%.統(tǒng)計分析確定出其中編碼基因長度1 648 bp。散在重復序列共2 674個,總長度198 068 bp,在全基因組中占比0.57%;小衛(wèi)星DNA 2 768個,總長度118 514 bp,占比為0.3%;微衛(wèi)星DNA 388個,總長度16 186 bp,所占比例0.05%。詳見表1。
2.2 基本功能注釋
2.2.1 GO數(shù)據(jù)庫注釋
GO數(shù)據(jù)庫分析所得結果如圖1所示:分析此圖結果可知相應的細胞組分共包括10類,其中細胞(cell)和細胞組分(cellpart)相關基因最多,分別注釋了2 511個。分子功能共包含12類,其中催化活性(catalyticactivity)相關基因最多,注釋了3 511個,其次為結合(binding)相關基因3 411個,相對較少的是伴金屬活性(metallochaperone activity)4個、電子載體活性(electron carrier activity)1個、通道調節(jié)劑活性(channel regulator activity)3個。生物過程共包含25類,基因注釋最多的功能為細胞過程(cellular process)3 527個、細胞代謝(metabotic process)3 560個,而節(jié)律過程(thythmic process)注釋1個、氮素利用(hitrogen utilization)注釋1個、細胞殺傷(cellkilling)注釋3個、生長(gro注釋wth)2個、免疫系統(tǒng)過程(immune system process)注釋2個,這些功能涉及到的基因較少。
2.2.2 KEGG代謝通路數(shù)據(jù)庫注釋
在森吉木霉M75的代謝通路中,基因覆蓋率最高的類型是新陳代謝(metabolism),在新陳代謝二級分類單元下,全球地圖概覽(gloabal and overviewmaps)基因最多,注釋了927個,碳水化合物代謝(ca巾ohydrate metabolism)319個,氨基酸、脂類和能量代謝(Amino acids,lipids,andenergy metabolism)共596個;其他二級分類單元下,運輸和分解代謝(transport and catabolism)277個,信號轉導(signal transduction)238個,翻譯(translation) 301個,折疊分類和降解(folding,sorting and degradation)221個(圖2)。根據(jù)基因在KEGG數(shù)據(jù)庫注釋中的富集分析可知(表2),在三級代謝通路中,森吉木霉M75全基因組中8 192個基因富集在KEGG中的383條不同的代謝通路中,其中,代謝途徑通路(metabolic pathways)共注釋848個基因、次生代謝產(chǎn)物的生物合成通路(biosynthesis ofsecondary metabolites)注釋330個基因、微生物代謝通路(microbial metabolism in diverseenvironments)240個、碳代謝通路(carbonmetabolism)112個。
2.2.3 碳水化合物活性酶(CAZy)數(shù)據(jù)庫注釋
森吉木霉M75菌株在CAZy數(shù)據(jù)庫中的注釋結果表明,在森吉木霉M75的全基因組序列中,有259個與碳水化合物相關聯(lián)的糖苷水解酶GHs基因,30個氧化還原酶AAs基因,105個糖基轉移酶GTs基因,54個糖類結合組件CBMs基因,7個多糖裂解酶PLs基因,21個糖類脂解酶CEs基因(圖3)。
2.2.4 KOG數(shù)據(jù)庫注釋
如圖4所示,在森吉木霉M75全基因組中,共有2 184個基因在KOG數(shù)據(jù)庫中獲得蛋白功能注釋,蛋白質功能共分為24個類型,主要集中表現(xiàn)在一般通用功能預測(general function prediction only)241個、翻譯后的修飾,蛋白質周轉及伴侶蛋白(posttranslational modification,protein turnover,chaperones) 211個、翻譯、核糖體結構與生物合成(translation,ribosomal structure andbiogenesis) 202個、能量的產(chǎn)生和轉化(energyproduction and conversion) 191個、氨基酸的轉運與代謝(amino acid transport and metabolism)171個。在防御機制(defense mechanisms)注釋8個、核結構(nuclear structure)6個、細胞運動(cell motility)1個,功能注釋較少。
2.3 效應因子注釋
2.3.1 分泌蛋白預測
測序結果顯示森吉木霉M75具有信號肽結構的蛋白個數(shù)為872個,具有跨膜結構的1 798個,分泌蛋白703個。
2.3.2 次級代謝基因簇分析
預測結果統(tǒng)計如圖5所示:森吉木霉M75全基因組中共包含41個基因簇,共451個基因。其中,TIPKS型基因簇13個,包含135個基因,N RPS-like型10個,包含127個基因,NRPS型基因簇6個,包含75個基因,萜烯類terpene基因簇8個,包含43個基因,NRPS,TIPKS型3個,包含48個基因,NRPS,NRPS-like,TIPKS型1個,包含23個基因。
3 討論
木霉屬真菌由于其對各種生態(tài)條件及生存環(huán)境的高度適應性和寄生拮抗等功能,在當今農(nóng)業(yè)領域中被廣泛用作商業(yè)生物殺菌劑。除此之外,木霉能成功作為生物防治劑還歸因于這些真菌能夠產(chǎn)生較多的次生代謝產(chǎn)物,這些次生代謝產(chǎn)物如細胞壁水解酶可以破壞寄主植物細胞壁,這些次生代謝產(chǎn)物的合成與各種基因的調控息息相關,因此從基因組層面探究木霉的代謝途徑及生物功能,成為全面開發(fā)利用木霉屬真菌的必要手段。
本研究基于新一代測序技術對森吉木霉M75菌株完成了基因組測序,與哈茨木霉、綠木霉、深綠木霉等木霉屬中的近緣物種相比,他們的基因組大小較為接近,都約為35 MB左右。其中,森吉木霉M75在GO數(shù)據(jù)庫中獲得注釋的基因數(shù)目高達28 294個,遠高于哈茨木霉Th-33的6 238個,碳水化合物酶相關的糖苷水解酶基因259個,高于子囊菌綱中發(fā)現(xiàn)的GHs的平均數(shù)量211個;糖基轉移酶GTs基因105個,與里氏木霉的103個相差不大,略高于平均水平96個;糖類脂解酶CEs基因21個,也略高于平均水平16個,多糖裂解酶PLs基因7個,低于平均水平18個。在次級代謝基因簇中,森吉木霉M75具有8個萜烯類terpenes基因簇。Croteau等人在對萜烯類物質進行研究時發(fā)現(xiàn),萜烯是一大類具有高度多樣化功能的次生代謝產(chǎn)物,對植物病原菌具有一定的抵御能力。而TPS基因簇恰恰就是控制萜烯類物質合成的次級代謝基因簇,這表明森吉木霉M75菌株強大的代謝合成能力可能與萜烯類基因簇的控制有關,這或許是生防菌株森吉木霉M75具有強抑菌活性的原因。本研究結果首次解析了森吉木霉全基因組信息,獲得了大量與次級代謝相關的功能基因,有助于全面了解木霉的生防機制,同時為更深層次進行木霉屬真菌的功能基因研究奠定理論基礎并提供數(shù)據(jù)支持。
4 結論
本研究獲得了森吉木霉M75的基因組序列,全基因組總長34 483 860 bp,GC含量49.50%,與木霉屬真菌特征相吻合。在GO數(shù)據(jù)庫共注釋了28 494個基因;在KEGG數(shù)據(jù)庫中,森吉木霉M75全基因組中8 192個基因富集在KEGG中的383條不同的在三級代謝通路中,主要集中表現(xiàn)在代謝途徑(848個)、次生代謝產(chǎn)物的生物合成通路(330個)、抗生素的生物合成(243個)、微生物代謝通路(240個)、氨基酸的生物合成(118個)、碳代謝通路(112個)等與代謝或代謝產(chǎn)物合成相關的通路中;共有2 184個基因在KOG數(shù)據(jù)庫中獲得蛋白功能注釋;在碳水化合物活性酶CAZy數(shù)據(jù)庫中,共注釋了259個糖苷水解酶GHs基因,105個糖基轉移酶GTs基因,7個多糖裂解酶PLs基因,21個糖類脂解酶CEs基因,54個糖類結合組件CBMs基因;森吉木霉M75全基因組中共包含41個基因簇,451個基因,多數(shù)與次級代謝產(chǎn)物的合成相關,存在較大開發(fā)潛力。
(責任編輯:崔貝)
基金項目:北京市公園管理中心科技課題(ZX2024012);國家重點研發(fā)計劃課題(2018YFC1200402);國家自然科學基金面上項目(31270682)