焦晶凱
(上海乳業(yè)生物工程技術(shù)研究中心 乳業(yè)生物技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室,上海 200436)
基于RNA-Seq技術(shù)的干酪基質(zhì)下紅曲霉生長(zhǎng)轉(zhuǎn)錄組初步信息分析
焦晶凱
(上海乳業(yè)生物工程技術(shù)研究中心 乳業(yè)生物技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室,上海 200436)
采用轉(zhuǎn)錄組測(cè)序(RNA-Seq)技術(shù),對(duì)生長(zhǎng)在干酪基質(zhì)環(huán)境下的紅曲霉(Monascus)進(jìn)行了轉(zhuǎn)錄組分析。采用第二代測(cè)序技術(shù),基于Illumina NextSeq 500測(cè)序平臺(tái)進(jìn)行分析,得到了序列總長(zhǎng)度為59 935 140 bp的轉(zhuǎn)錄本(transcripts),22 377 414 bp長(zhǎng)度的非重復(fù)序列基因(unigene),共18 042條。對(duì)聚類得到的Unigene與數(shù)據(jù)庫(kù)NR、GO、KEGG、eggNOG和Swiss-Prot進(jìn)行比對(duì)并作基因功能注釋,注釋到GO數(shù)據(jù)庫(kù)的序列有12 186條,注釋到eggNOG數(shù)據(jù)庫(kù)的序列有17 777條,KEGG中有3 251條序列被注釋到,涉及的pathway有42條。這些注釋信息的完成在基因組學(xué)上為紅曲霉應(yīng)用于干酪的生產(chǎn)提供了重要依據(jù)。
紅曲霉;干酪;轉(zhuǎn)錄組;RNA-Seq技術(shù);基因注釋
紅曲霉(Monascus)是我國(guó)最早應(yīng)用于食品加工的有益真菌之一,紅曲中含有多種對(duì)人體有益的活性成分,紅曲霉發(fā)酵產(chǎn)物中含有洛伐他汀等多種活性物質(zhì)、含有淀粉酶、糖化酶等多種酶類、含有Monacolin K、γ-氨基丁酸、麥角固醇、天然植物激素等功能成分、還含有大量的天然紅曲色素[1-3]。對(duì)于紅曲霉發(fā)酵研究已有幾十年的歷史,有研究將紅曲霉用于發(fā)酵豆粕[4]、豆腐黃漿水發(fā)酵紅曲色素[5]、以麥麩為基質(zhì)的紅曲霉發(fā)酵[6]、也有研究者將小米、大米、大豆和玉米糠等充當(dāng)?shù)孜颷7],但將其應(yīng)用于干酪生產(chǎn)卻罕有人研究。
隨著生物工程和分子生物學(xué)的高速發(fā)展,RNA-seq測(cè)序技術(shù)已被用于水稻在不同氮源供應(yīng)下的轉(zhuǎn)錄組表達(dá)研究[8]、膜莢黃芪轉(zhuǎn)錄組表達(dá)研究[9]、南極海魚轉(zhuǎn)化生長(zhǎng)因子-β(transforming growth factor-β,TGF-β)信號(hào)傳導(dǎo)研究[10]及微藻轉(zhuǎn)錄組研究[11]等。RNA-seq測(cè)序技術(shù)是近年來(lái)建立的進(jìn)行轉(zhuǎn)錄組分析的分子生物學(xué)研究方法,具有數(shù)據(jù)冗余性低,信息涵蓋量大,分析準(zhǔn)確,研究范圍小,針對(duì)性強(qiáng),快速有效等優(yōu)點(diǎn),可檢測(cè)到低表達(dá)基因的存在,以及對(duì)沒有基因組學(xué)背景的新物種均可進(jìn)行轉(zhuǎn)錄表達(dá)概況分析等多方面優(yōu)點(diǎn)[12-15]。
為了充分了解紅曲霉在干酪基質(zhì)上的表達(dá)信息,本研究使用RNA-seq測(cè)序技術(shù)分析了紅曲霉在干酪基質(zhì)上生長(zhǎng)的轉(zhuǎn)錄表達(dá)信息,旨在發(fā)現(xiàn)紅曲霉在不同基質(zhì)上生長(zhǎng)基因的差異化表達(dá),為優(yōu)化生產(chǎn)紅曲霉干酪提供理論依據(jù)。
1.1 材料與試劑
紅曲霉(Monascus):中國(guó)普通微生物菌種保藏管理中心(ChinaGeneralMicrobiologicalCultureCollectionCenter,CGMCC),編號(hào)CGMCC No.7603;干酪樣品(新西蘭低鹽切達(dá)):乳業(yè)生物技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室,光明乳業(yè)股份有限公司乳業(yè)研究院提供。RNase酶H、DNA聚合酶I:賽默飛世爾科技(中國(guó))有限公司。
1.2 儀器與設(shè)備
Trizol總RNA抽提試劑盒、Quant-iT PicoGreen dsDNA Assay試劑盒:美國(guó)Invitrogen公司;NanoDropTM8000分光光度計(jì)、Qubit熒光計(jì):賽默飛世爾科技(中國(guó))有限公司;TruSeq RNA Sample Prep試劑盒(Illumina)、QIAquick PCR純化試劑盒:德國(guó)Qiagen公司;AMPure XP分選磁珠:美國(guó)Beckman Coulter公司;E6090 QuantifluorTM-ST熒光計(jì)美國(guó)Promega公司。
1.3 試驗(yàn)方法
1.3.1 樣品的制備
干酪樣品121℃、20 min滅菌,制備平板,挑取紅曲霉樣品放入無(wú)菌水,混合,取100 μL涂布。30℃培養(yǎng)7 d。
1.3.2 RNA提取和構(gòu)建mRNA-Seq文庫(kù)
提取經(jīng)過RNA提取和濃縮,使用分光光度計(jì)對(duì)RNA進(jìn)行定性和定量,取2 μg RNA樣品進(jìn)一步純化,使用帶有Oligo-dT的分選磁珠結(jié)合poly-A將mRNA從總RNA中分離出來(lái),使用片段化試劑獲得200~300 bp的信使核糖核酸(messenger ribonucleic acid,mRNA)片段,隨后使用引物(5'-AATGATACG GCGACCACCGA和5'-CAAGCAGAAGACGGCATACGA)合成雙鏈互補(bǔ)脫氧核糖核酸(comple mentarydeoxyribonucleic acid,cDNA),對(duì)200~300 bp片段進(jìn)行純化,對(duì)DNA片段進(jìn)行末端修復(fù),在DNA 3'末端引入堿基A,進(jìn)行A、T配對(duì),對(duì)目標(biāo)DNA片段進(jìn)行純化和擴(kuò)增,對(duì)所構(gòu)建mRNA-Seq文庫(kù)進(jìn)行驗(yàn)證和定量,在Illumina NextSeq500測(cè)序平臺(tái)下進(jìn)行測(cè)序。
1.3.3 Illumina測(cè)序和注釋
通過Illumina測(cè)序得到下機(jī)數(shù)據(jù),分別對(duì)每個(gè)樣品的下機(jī)數(shù)據(jù)進(jìn)行統(tǒng)計(jì),采用FastQC對(duì)下機(jī)數(shù)據(jù)進(jìn)行質(zhì)量控制,過濾測(cè)序數(shù)據(jù)中一些帶接頭、低質(zhì)量的reads,使用針對(duì)轉(zhuǎn)錄組拼接的Trinity軟件對(duì)高質(zhì)量序列進(jìn)行拼接,拼接完成后,可獲得contig和transcript兩個(gè)序列,對(duì)拼接得到的contig和transcript序列進(jìn)行統(tǒng)計(jì),使用Unigene聚類及功能注釋。
2.1 Illumina測(cè)序和轉(zhuǎn)錄分析
通過Illumina測(cè)序得到下機(jī)數(shù)據(jù),reads總數(shù)為46454276,堿基總數(shù)為6641541010,經(jīng)過濾后得到Clean reads總數(shù)為46 272 196,Clean堿基數(shù)為6 614 000 681,對(duì)拼接得到的重疊群(contig)和轉(zhuǎn)錄本(transcript)序列進(jìn)行統(tǒng)計(jì),結(jié)果見表1。由表1可知,重疊群(contig)和轉(zhuǎn)錄本(transcript)序列總長(zhǎng)度分別為39 102 300 bp和59 935 140 bp,序列總數(shù)分別為71 255 bp和19 732 bp,N50分別為1 470 bp和1 751bp,長(zhǎng)度>N50分別為7 081條和10 739條。通過統(tǒng)計(jì)表明該轉(zhuǎn)錄組測(cè)序及數(shù)據(jù)組裝質(zhì)量結(jié)果良好,符合進(jìn)行進(jìn)一步的基因功能注釋和分類要求。
表1 拼接結(jié)果統(tǒng)計(jì)Table 1 Statistics of transcriptome data results
2.2 Unigene功能注釋
將Trinity拼接得到的每一條transcript與美國(guó)國(guó)家生物技術(shù)信息中心(NationalCenterofBiotechnologyInformation,NCBI)數(shù)據(jù)庫(kù)BLAST比對(duì),對(duì)得到Unigene進(jìn)行統(tǒng)計(jì)和基因功能注釋,所用到的數(shù)據(jù)庫(kù)包括NR、GO、KEGG、eggNOG和Swiss-Prot。共18 042條序列在NR數(shù)據(jù)庫(kù)中被注釋,全部Unigene在此數(shù)據(jù)庫(kù)中被注釋到。KO數(shù)據(jù)庫(kù)中比對(duì)序列最少,僅有3 251條序列得到注釋,占比18.02%,有2 946條序列在全部數(shù)據(jù)庫(kù)中得到注釋,占比16.33%,如圖1所示,被注釋到主要同源基因?yàn)榍咕鷮?Aspergillus),如米曲霉(Aspergillus oryzae)、煙曲霉(Aspergillus fumigatus)等。
圖1 Unigene注釋結(jié)果分布Fig.1 Distribution of Unigene annotation results
2.3 Unigene功能分類
2.3.1 GO分類注釋
BLAST2GO軟件將Unigene與GO數(shù)據(jù)庫(kù)進(jìn)行比對(duì),對(duì)比得到的同源序列有12186條,占總Unigene的67.54%,覆蓋GO數(shù)據(jù)庫(kù)中三大功能分類(生物過程、細(xì)胞組成和分子作用),涉及功能組分和生物學(xué)途徑共92項(xiàng),如圖2所示,占比較大的主要包括生物合成過程、分解過程、碳水化合物代謝過程、細(xì)胞氮化合物代謝過程、細(xì)胞蛋白修飾過程、細(xì)胞周期、細(xì)胞分裂、氧化還原酶活性、核酸結(jié)合轉(zhuǎn)錄因子活性、小分子代謝過程、轉(zhuǎn)運(yùn)、翻譯、細(xì)胞質(zhì)、胞質(zhì)溶膠、細(xì)胞器、質(zhì)膜、蛋白復(fù)合物、DNA結(jié)合、酶結(jié)合、離子結(jié)合、RNA結(jié)合等。
圖2 Unigene的GO分類注釋Fig.2 GO classifications annotation of Unigene
2.3.2 eggNOG分類注釋
將所有Unigene與eggNOG數(shù)據(jù)庫(kù)進(jìn)行BLAST對(duì)比,有17 777條序列被注釋成功,占比98.53%,除eggNOG數(shù)據(jù)庫(kù)中X分類目錄沒有注釋到序列外,其余分類目錄均有注釋,如表2所示。
由表2可知,在已知功能中,與一般性功能預(yù)測(cè)蛋白同源的序列最多,共3 376條,占比14.93%,然后依次是翻譯后修飾,蛋白質(zhì)周轉(zhuǎn),伴侶,共同源序列1 190條;信號(hào)轉(zhuǎn)導(dǎo)機(jī)制,共比對(duì)同源序列1 014條;轉(zhuǎn)錄,比對(duì)同源序列1 012條;碳水化合物運(yùn)輸和代謝,比對(duì)同源序列932條;翻譯、核糖體結(jié)構(gòu)和生物合成,共887條;細(xì)胞內(nèi)運(yùn)輸,分泌和水泡運(yùn)輸,共859條;復(fù)制,重組和修復(fù),共837條;脂質(zhì)運(yùn)輸和新陳代謝,共806條;此外還有氨基酸運(yùn)輸和代謝、能源生產(chǎn)與轉(zhuǎn)化、RNA加工和修飾等。
表2 All-Unigenes的eggNOG分類注釋Table 2 eggNOG classifications annotation of All-Unigenes
2.3.3 KEGG通路分析
如圖3所示,通過KEGG的KAAS自動(dòng)化注釋系統(tǒng)進(jìn)行所有Unigene的KO及Pathway注釋,共3 251條序列得到注釋,占比18.02%,紅曲霉生長(zhǎng)注釋信息主要涉及包括代謝、遺傳信息過程、環(huán)境信息過程、細(xì)胞過程、有機(jī)體系和人類疾病在內(nèi)的的六大功能模塊,42條代謝通路,主要有碳水化合物代謝通路、脂代謝通路、氨基酸代謝通路、外源性物質(zhì)的生物降解和代謝通路、翻譯、折疊、分選和退化、信號(hào)轉(zhuǎn)導(dǎo)通路、細(xì)胞生長(zhǎng)和死亡通路、內(nèi)分泌系統(tǒng)和神經(jīng)系統(tǒng)通路等,此外還涉及癌癥、神經(jīng)退行性疾病、傳染性疾病和內(nèi)分泌代謝疾病等人類疾病的基因。
圖3 KEGG分類注釋及通路分析Fig.3 Classifications annotation of KEGG and Pathway analysis
本研究通過轉(zhuǎn)錄組測(cè)序,研究紅曲霉在干酪基質(zhì)中生長(zhǎng)的基因功能注釋、GO功能分類及對(duì)紅曲霉生長(zhǎng)在干酪基質(zhì)上的代謝通路的初步分析。新一代測(cè)序技術(shù)憑借著靈敏度高和運(yùn)行成本低已成為生命科學(xué)研究的新手段,轉(zhuǎn)錄組測(cè)序可以對(duì)特定細(xì)胞在某一功能狀態(tài)下的轉(zhuǎn)錄本進(jìn)行測(cè)序,并以此進(jìn)一步做功能注釋、分類注釋、代謝通路分析和差異表達(dá)分析等。通過對(duì)紅曲霉的轉(zhuǎn)錄組GO分類注釋分析得出紅曲霉在干酪中的生長(zhǎng)涉及的合成、分解過程、碳水化合物代謝過程、細(xì)胞氮化合物代謝過等一些列具體生物過程、細(xì)胞組成和分子作用過程。通過eggNOG分類注釋分析得出在干酪生長(zhǎng)基質(zhì)中紅曲霉主要運(yùn)用翻譯后修飾,蛋白質(zhì)周轉(zhuǎn),伴侶,信號(hào)轉(zhuǎn)導(dǎo)機(jī)制,轉(zhuǎn)錄和碳水化合物運(yùn)輸和代謝等。通過KEGG通路分析得出紅曲霉在干酪基質(zhì)上表達(dá)通路主要是碳水化合物代謝通路、脂代謝通路、氨基酸代謝通路等。為此,通過調(diào)整干酪基質(zhì)組成成分可以更好的調(diào)控紅曲霉的代謝表達(dá),可誘導(dǎo)紅曲霉在干酪基質(zhì)上向更有利的通路方向轉(zhuǎn)化,對(duì)研究高質(zhì)量的紅曲霉干酪具有重要意義。此外通路分析得出紅曲霉轉(zhuǎn)錄中還涉及癌癥、神經(jīng)退行性疾病、傳染性疾病和內(nèi)分泌代謝疾病等人類疾病的基因,為進(jìn)一步研究紅曲霉的益生功能特性提供理論支持。
[1]許贛榮.紅曲霉菌的研究進(jìn)展[J].中國(guó)釀造,2002,21(s1):7-11.
[2]蒲立檸,陳光靜,闞建全.響應(yīng)面試驗(yàn)優(yōu)化青稞麩皮薏仁紅曲霉發(fā)酵工藝[J].食品科學(xué),2017,32(2):264-270.
[3]JIRASATID S,NOPHARATANA M,KITSUBUN P,et al.Statistical optimization forMonacolinK and yellow pigment production and citrinin reduction byMonascus purpureusin solid-state fermentation[J].J Microbiol Biotechnol,2013,23(3):364-374.
[4]石 琳,尹 園,王 帥,等.紅曲霉發(fā)酵高溫豆粕高產(chǎn)可溶性多肽[J].食品科學(xué),2015,36(19):137-142.
[5]王 薇,馬 波,許云華,等.利用豆腐黃漿水發(fā)酵紅曲色素的研究[J].中國(guó)調(diào)味品,2017,42(1):44-46.
[6]姚 青.以麥麩為基質(zhì)的紅曲霉的固態(tài)發(fā)酵及抗氧化活性研究[D].杭州:浙江工業(yè)大學(xué),2015.
[7]余幫榮.基于不同底物的紅曲霉發(fā)酵產(chǎn)色素的研究[J].科技創(chuàng)新與應(yīng)用,2017(16):82-85.
[8]YANGSY,HAODL,SONGZZ,etal.RNA-Seqanalysisofdifferentially expressed genes in rice under varied nitrogen supplies[J].Gene,2015,555(2):305-317.
[9]XIU B L,LING M,AI H Z,et al.High-throughput analysis and characterization ofAstragalus membranaceustranscriptome using 454 GS FLX[J].PLoS One,2014,9(5):1-8.
[10]XU Q H,CAI C,HU X X,et al.Evolutionary suppression of erythropoiesis via the modulation of TGF-β signalling in an Antarctic icefish[J].Mol Ecol,2015,24(18):4664-4678.
[11]ZHENG M G,TIAN J H,YANG G P,et al.Transcriptome sequencing,annotation and expression analysis ofNannochloropsissp.at different growth phases[J].Gene,2013,523(2):117-121.
[12]夏麗飛,陳林波,李 梅,等.基于RNA-Seq的雌蕊缺失茶樹花轉(zhuǎn)錄組分析[J].分子植物育種,2017,15(3):858-866.
[13]孫瑞芬,張艷芳,郭樹春,等.基于RNA-Seq技術(shù)的鹽脅迫向日葵轉(zhuǎn)錄組信息分析[J].分子植物育種,2015,13(12):2736-2742.
[14]蘭道亮,熊顯榮,位艷麗,等.基于RNA-Seq高通量測(cè)序技術(shù)的牦牛卵巢轉(zhuǎn)錄組研究:進(jìn)一步完善牦?;蚪Y(jié)構(gòu)及挖掘與繁殖相關(guān)新基因[J].中國(guó)科學(xué):生命科學(xué),2014,44(3):307-317.
[15]劉 歡,黃麗娜,張奮強(qiáng),等.RNA-Seq高通量測(cè)序技術(shù)在果樹功能基因組學(xué)研究的應(yīng)用進(jìn)展[J].生物技術(shù)進(jìn)展,2017,7(2):144-148.
JIAO Jingkai
(State Key Laboratory of Dairy Biotechnology,Shanghai Engineering Research Center of Dairy Biotechnology,Dairy Research Institute,Shanghai 200436,China)
TS261.1
0254-5071(2017)11-0118-04
10.11882/j.issn.0254-5071.2017.11.026
2017-08-07
上海市科委工程技術(shù)研究中心能力提升項(xiàng)目(16DZ2280600);國(guó)家“十二五”科技支撐計(jì)劃課題(2013BAD18B02)
焦晶凱(1988-),女,工程師,碩士,主要從事微生物分子生物學(xué)和乳制品方面的研究工作。