趙文君,律鳳霞,艾 鑫
(牡丹江師范學院 生命科學與技術學院,黑龍江 牡丹江 157011)
灰樹花(Griflola frondosa)又名栗蘑、蓮花菌、貝頁多孔菌等,素有“食藥用菌王子”的美譽,分類學上隸屬于真菌界、擔子菌亞門、層菌綱、非褶菌目、多孔菌科,其子實體肉質,珊瑚狀分枝層疊似菊,富含多種糖類、酚類和酸類等活性物質,具有抗氧化、抑病毒、抑腫瘤活性等生理作用,是一種食藥兼用的珍稀食用菌.[1-4]近幾年食用菌轉錄組測序研究內(nèi)容大幅增加,但對灰樹花子實體形成機制及酸性代謝物質在病原菌中的生物防治作用研究少見報導.[5-6]本研究提取灰樹花菌原基總RNA,基于SBS(sequencing by synthesis)技術,用IIIumina Hiseq高通量平臺對RNA進行轉錄組測序,對原始數(shù)據(jù)拼接、過濾、重建形成轉錄組Unigene數(shù)據(jù),與5大數(shù)據(jù)庫進行功能注釋比對、分類,研究其酸性物質代謝路徑,為灰樹花在植物病害生物防治中的應用提供理論依據(jù),為今后深入開展灰樹花活性物質研究和種質資源的利用提供依據(jù).[7-10]
灰樹花菌株牡丹江師范學院生命科學與技術學院食用菌研發(fā)中心提供.
儀器壓力蒸汽滅菌器(DSX-280B),超凈工作臺,醫(yī)用離心機(H1650R),電泳儀(DYY-6D),PCR擴增儀(PTC-100).
試驗材料制備母種培養(yǎng)基:馬鈴薯200 g,葡萄糖20 g,胰蛋白胨10 g,KH2PO41.5 g,定容至1 L,pH值4.5~5.栽培種培養(yǎng)基:木屑80%,麥麩9%,石膏粉1%,腐殖土10%;含水量60~65%,pH值5.5~6.5.灰樹花子實體原基:灰樹花液體培養(yǎng)后菌絲球接種到栽培菌袋內(nèi),24℃恒溫培養(yǎng)至菌絲長滿菌袋,覆土保濕栽培,待子實體拱出土面后采集.
RNA的提取Plant Total RNA Islation Ki(50T)試劑盒提取灰樹花子實體總RNA,檢測RNA的完整性和污染情況,合格的RNA保存用于后續(xù)測序.
轉錄組測序數(shù)據(jù)處理及分析過濾低質量數(shù)據(jù),去除5’或3’末端質量值低于20或者含N的堿基,去除trim后reads長度低于75 bp的序列及接頭序列.[11]采用組裝軟件Trinity(v2.2.0)對樣品數(shù)據(jù)從頭進行組裝,得到長的非冗余的Unigene序列.[12,13]將Unigene序列與Nr,COG,SwissProt,KEGG,GO等數(shù)據(jù)庫進行比對,獲得Unigene的注釋信息.
利用Trinity軟件對測序獲得的原始reads數(shù)據(jù)進行拼接,數(shù)據(jù)總堿基數(shù)達102348 417 bp(97.61 M),最短長度為25 bp,最長長度為21111 bp,平均長度為47.8 bp,N50為47 bp,GC堿基含量為54.29%.處理后重新獲得38189個Unigene,總堿基數(shù)為48354 644 bp,平均長度為1266.19 bp,最短Unigene為201 bp,最長Unigene12658 bp,N50為2028 bp,GC堿基含量為52.76%.說明從頭組裝的數(shù)據(jù)質量較好.見圖1.
圖1 Unigene不同長度餅狀分布圖
圖1顯示,Unigene長度主要集中在200~500 bp之間,占比34.24%;500~1000 bp(20.01%)和大于2000 bp(20.38%)的Unigene數(shù)量相近.
通過BLAST程序將灰樹花Unigene分別與Nr,Swissprot,KEGG,COG等數(shù)據(jù)庫進行比對.由表1可以看出,共有31928個Unigene被有效注釋,其中有1485個Unigene在四個數(shù)據(jù)庫中共同注釋,占總數(shù)的3.89%;有14192個Unigene在至少兩個以上的數(shù)據(jù)庫中共同比對,占總數(shù)的37.16%.在Nr數(shù)據(jù)庫中被注釋到的Unigene最多有31454個,占總數(shù)的82.36%;在KEGG數(shù)據(jù)庫中被注釋到的Unigene個數(shù)最少為1832個,占總數(shù)的4.8%.
表1 灰樹花Unigene的功能注釋不同數(shù)據(jù)庫分布情況
灰樹花Unigene序列與Nr數(shù)據(jù)庫比對,有31454個(82.36%)Unigene被有效注釋.在Nr數(shù)據(jù)庫中,匹配序列相似度達到80%以上的Unigene有18893個(60.07%),匹配序列相似度在40%~80%的有12134個(38.58%),匹配序列相似度低于40%的有427個(1.36%).
灰樹花Unigene在Nr數(shù)據(jù)庫中同源匹配排序前10的物種有:灰樹花菌(Griflola frondosa)24896個(79.15%),繡球菌(Sparassis crispa)1075個,小鱗多孔菌(Polyporus brumalis)966個,Obba rivulosa 878個,污叉絲孔菌(Dichomitus squalens)571個,紅栓菌(Trametes cinnabarina)551個,絨毛栓菌(Trametes pubescens)805個,F(xiàn)ibroporia radiculosa 354個,離 心 射 脈 革 菌(Phlebia centrifuga)116個,赭 黃 齒 耳(Steccherinum ochraceum)104個,表明灰樹花序列及基因功能研究在Nr數(shù)據(jù)庫中公布的數(shù)量較多.
Swissprot數(shù)據(jù)庫中有被注釋Unigene12357個,匹配同源序列相似度達到高于80%的Unigene有998個(8.08%),同源相似度在40%~80%有620個(50.16%),同源相似度小于40%的有516個(41.76%)
共有12234個灰樹花Unigene在GO數(shù)據(jù)庫中被注釋到.主要涉及分子學功能、生物途徑和細胞組分3大主類60個亞分類.在分子功能中含有19個功能組,其中結合功能和催化活性功能的UniGene數(shù)量最多;細胞組分含有20個亞類組,參與細胞成分的Unigene數(shù)量最多;生物過程含有21個亞類組,參與細胞過程的Unigene數(shù)量最多.
灰樹花Unigene在KEGG數(shù)據(jù)庫中1832個被有效注釋,占總數(shù)的4.8%.KEGG數(shù)據(jù)庫的生物通路分四大主類:細胞過程、環(huán)境信息處理、遺傳信息處理和新陳代謝,內(nèi)含20條二級亞類.其中12條與新陳代謝相關,涉及Unigene數(shù)量:碳水化合物代謝399個,氨基酸代謝190個,核苷酸代謝135個,糖的生物合成和代謝65個,萜類和聚酮類化合物代謝11個,輔助因子和維生素代謝63個,其他氨基酸代謝82個.其次,遺傳信息處理有4條通路1067個基因,細胞過程有2條通路70個基因,環(huán)境信息處理有2條通路273個基因.
灰樹花UniGene在COG數(shù)據(jù)庫中有12248個被注釋.一般功能預測被注釋的最多為1930個(占15.76%),其次是翻譯后的修飾1279個(占10.44%)、信號轉導機制1102個(占9%)、次生代謝產(chǎn)物的合成,運輸和分解代謝1017個(占8.3%),細胞活力被注釋的最少只有11個(占9%).
研究采用Illumina測序平臺對灰樹花菌原基進行轉錄組測序,并獲得了大量轉錄組信息.灰樹花栽培誘導形成子實體原基,提取總RNA處理后轉錄組測序,獲得38189個Unigene,平均長度1266.19 bp.Unigene與Nr數(shù)據(jù)庫比對,與灰樹花菌相似序列最多.袁衛(wèi)東[14]和聶文強[15]等人在2012年和2017年采用高通量測序技術分別對灰樹花子實體和菌絲體進行轉錄組測序,共獲得63137個Unigene和18077個Unigene,與Nr數(shù)據(jù)庫比對兩人數(shù)據(jù)均與變色栓菌的相似序列最多.上述兩人數(shù)據(jù)結果與本實驗得出的數(shù)據(jù)結果不一致,推測可能是變色栓菌與灰樹花菌同屬于多孔菌科,兩者的相似序列較多.近年來灰樹花的研究不斷深入,灰樹花菌在公共數(shù)據(jù)庫中的序列也更加完善,可以在數(shù)據(jù)庫中直接比對大部分灰樹花序列.
在Swissprot數(shù)據(jù)庫中檢測到蛋白序列同源12357條;與KEGG數(shù)據(jù)庫比對,1832個Unigene分為20條生物通路,最多的是代謝通路,有12條,涉及2484個Unigene;與GO數(shù)據(jù)庫比對,12234個Unigene,分為生物過程、分子功能、細胞組成3大類60個分支;與COG數(shù)據(jù)庫比對,12248個Unigene.此外,還有6261個Unigene在數(shù)據(jù)庫中未得到注釋,推測可能是灰樹花的特異性新基因、非編碼RNA序列或目前公共基因數(shù)據(jù)庫尚未完善.通過生物信息學分析,可為挖掘新功能基因、種質資源創(chuàng)新、遺傳多樣性分析、確定活性成分合成路徑等提供新思路.