蔡時可, 梅瑜, 陳煒玲, 史廣生, 李靜宇, 王繼華
(1.廣東省農(nóng)作遺傳改良重點(diǎn)實驗室/廣東省農(nóng)業(yè)科學(xué)院作物研究所,廣東廣州 510640;2.廣東省道地南藥資源保護(hù)與利用工程技術(shù)研究中心,廣東廣州 510640;3.廣東良田農(nóng)林科技有限公司,廣東清遠(yuǎn) 526070)
金毛狗[Cibotium barometz(L)J.Sm.]為桫欏目蚌殼蕨科植物,屬國家二級保護(hù)植物,分布于我國西南和華南地區(qū)以及印度、緬甸、泰國和馬來西亞等東南亞國家,多生于林下[1-3]。其為根狀莖,臥生,粗大,含有揮發(fā)油、蕨素類、芳香族化合物、水溶性酚酸類化合物、黃酮類化合物、氨基酸和無機(jī)元素等化學(xué)成分[4]。其味苦甘、性溫,多見于苗、瑤和壯藥,又稱金狗脊、金扶金、金絲毛和百枝等,為2015 年版《中國藥典》(一部)所收錄,具有防治骨質(zhì)疏松、止血、鎮(zhèn)痛、抑菌、抗炎和抗風(fēng)濕等藥理活性,莖上的茸毛也具有止血的功能[1,4]。最早在南朝梁代陶弘景《名醫(yī)別錄》記載,金毛狗產(chǎn)地為河北(常山)太行山脈的山谷,但其品種與產(chǎn)地記載十分混亂[1]。目前,金毛狗還沒有人工大規(guī)模種植,市售金毛狗藥材均為野生資源,但由于其受破壞性采集,資源逐漸減少[1]。對其研究大多集中在化學(xué)成分的分離鑒定,并鑒定出一些藥用的化合物。采用超臨界CO2流體萃取,硅膠柱反復(fù)層析分離化合物,并通過理化數(shù)據(jù)和波譜數(shù)據(jù)確定其有機(jī)酸類、(24R)-豆甾4-烯-3-酮、24-亞甲基環(huán)木菠蘿烷醇、β-谷甾醇和山柰素-3-O-α-L-(4-O-乙酰基)鼠李糖基-7-O-α-L-鼠李糖甙等多種化合物的結(jié)構(gòu)[5-7]。
近年來,植物轉(zhuǎn)錄組學(xué)技術(shù)在分析細(xì)胞基因表達(dá)及其調(diào)控規(guī)律,解析藥用成分合成代謝通路、挖掘關(guān)鍵基因、開發(fā)分子遺傳標(biāo)記等研究中有重要的作用[8]。特別是沒有基因組測序物種,由于基因組數(shù)據(jù)不完整,重要代謝途徑的深入挖掘還存在一定的局限,而轉(zhuǎn)錄組的分析可以預(yù)測和鑒定出相關(guān)的功能基因,為藥用植物生長發(fā)育及次生代謝的分子機(jī)制的研究提供基礎(chǔ)的基因信息[9]。金毛狗基因組還未公布,其轉(zhuǎn)錄組學(xué)的研究也還未見報道。為此,本研究開展金毛狗的轉(zhuǎn)錄組分析,以期為解析金毛狗藥用物質(zhì)合成關(guān)鍵基因的挖掘和調(diào)控以及開發(fā)分子標(biāo)記提供遺傳學(xué)基礎(chǔ),現(xiàn)將研究結(jié)果報道如下。
1.1 實驗材料實驗材料為廣東省農(nóng)業(yè)科學(xué)院作物研究所南藥資源圃栽培的金毛狗,于2021 年5 月份取樣,采集健壯植株的葉片,用錫箔紙包裹并在液氮處理20 min,置于-80 ℃冰箱中保存?zhèn)溆谩?/p>
1.2 金毛狗RNA的提取采用北京康為世紀(jì)生物科技有限公司生產(chǎn)的總RNA 提取試劑盒提取金毛狗葉片總RNA,通過1%電泳凝膠檢測其完整性,并采用Invitrogen Qubit?2.0 熒光計及試劑盒(Fluorometer Life Tech Invitrogen,Q32886)進(jìn) 行定量。
1.3 轉(zhuǎn)錄組測序與拼接組裝轉(zhuǎn)錄組測序由北京百邁客生物科技有限公司采用Illumina HiSeq 2500平臺完成。通過FastQC 軟件對測序得到的原始數(shù)據(jù)進(jìn)行質(zhì)量評估,采用Trimmomatic 過濾掉接頭和低質(zhì)量的Reads(Reads 長度小于35 nt、帶N 堿基、Q值<20)得到高質(zhì)量的Clean Data[10]。使用Trinily軟件進(jìn)行de novo拼接組裝獲得轉(zhuǎn)錄本(Transcript),并采用RSeQC(RNA-seq data QC)軟件冗余序列,得到金毛狗轉(zhuǎn)錄組的單基因簇(Unigene)[11]。
1.4 基因功能注釋將組裝長度在200 bp以上的金毛狗Unigene 在核酸序列數(shù)據(jù)庫(Nucleotide Sequence Database,NT),保守域數(shù)據(jù)庫(Conserved Domain Database,CDD),非冗余蛋白數(shù)據(jù)庫(Nonredundant protein database,NR),蛋白結(jié)構(gòu)域預(yù)測(Protein families database of alignments and hidden Markov models,PFAM)數(shù)據(jù)庫,蛋白質(zhì)直系同源簇(cluster of orthologous groups of proteins,COG)數(shù)據(jù)庫,真核生物直系同源組(eukaryotic orthologous groups)數(shù)據(jù)庫和TrEMBL等多個公共數(shù)據(jù)庫中進(jìn)行比對注釋。
1.5 基因結(jié)構(gòu)分析對長度在1 000 bp 以上的金毛狗Unigene使用微衛(wèi)星識別工具(MISA)軟件鑒定簡單重復(fù)序列(SSR)位點(diǎn),并利用Primer 3 軟件(http://primer3.sourceforge.net/releases.php)設(shè)計相應(yīng)的SSR引物[12]。
2.1 轉(zhuǎn)錄組測序與de novo組裝金毛狗cDNA 文庫的構(gòu)建由北京百邁客生物科技有限公司完成,測序平臺為Illumina Hiseq 2500。原始數(shù)據(jù)質(zhì)控后共得到35 667 038 條Clean Reads,計10 609 302 958 bp。其中,GC 含量為49.85%,Q30 bases ratio 達(dá)到93.71%,表明測序數(shù)據(jù)準(zhǔn)確可靠,質(zhì)量較好。Clean Reads 進(jìn)行de novo組裝,共得到204 874 條Transcript,267 502 815 bp,平均長度為1 305.69 bp,N50 為2 210 bp。其中:有129 992 條Transcript 的序列長度大于500 bp,占總數(shù)的63.45%;1 000 bp以上的則有96 492 條,占總數(shù)的47.10%。見表1。Transcript 經(jīng)過去冗余,共獲得87 791 條Unigene,總長度61 264 724 bp,平均長度為697.9 bp,N50為1 262 bp。其中:長度大于500 bp的序列有30 727條,占總序列數(shù)目的35%;長度在1 000 bp 以上的有16 318條序列,占總數(shù)的18.55%。見表1和圖1。
圖1 金毛狗Unigene序列長度分布Figure 1 Length distribution of unigenes of the Cibotium barometz(L)J.Sm.
表1 金毛狗轉(zhuǎn)錄組測序的結(jié)果Table 1 Results of transcriptome sequencing in Cibotium barometz(L)J.Sm.
2. 2 Unigene功能注釋見表2。共有33 682(38.37%)條金毛狗Unigene 在CDD、KOG、COG、NR、NT、PFAM、SwissProt、TrEMBL 等多個數(shù)據(jù)庫中獲得注釋信息。其中:在NR 數(shù)據(jù)庫中有29 303 條,87.0%的Unigene 得到注釋,數(shù)目最多;其次為TrEMBL 數(shù)據(jù)庫,共有28 744條Unigene,占總數(shù)的85.342%;而在COG 數(shù)據(jù)庫中注釋的最少(7 525 條,22.34%)。通過與NR 庫的比對,金毛狗Unigene 序 列 與 近 緣 種 屬 的 Selaginella moellendorffii, Physcomitrium patens, Marchantia polymorpha 和Picea sitchensis 分 別 有10.90% 、9.06%、7.71%和6.69%的序列相同,其中,與江南卷柏Selaginella moellendorffii相似度最高。結(jié)果見圖2。
圖2 NR數(shù)據(jù)庫的同源物種分類Figure 2 Classification of homologous species in the NR database
表2 Unigene 的功能注釋Table 2 Functional annotation of assembled unigenes
2.3 京都基因與基因組百科全書(KEGG)功能注釋共有20 379 條金毛狗Unigene 在KEGG 數(shù)據(jù)庫中得到注釋,包括五大類:代謝(4 099 條,20.11%)、遺傳信息過程(2 989 條,14.67%)、細(xì)胞過程(577 條,2.83%)、環(huán)境信息過程(719 條,3.53%)和有機(jī)系統(tǒng)(548 條,2.69%)。根據(jù)其代謝過程,可劃分為11 個功能分類,共涉及99 條代謝通路。結(jié)果見圖3。在代謝中,與次生代謝、氨基酸代謝和脂質(zhì)代謝相關(guān)的Unigene 分別為316條(1.55%)、686 條(3.37%)和679 條(3.33%)。在有機(jī)系統(tǒng)中,719 條Unigene 涉及環(huán)境適應(yīng),占3.53%。在遺傳信息過程中最多為轉(zhuǎn)錄(1 215 條,5.96%)的Unigene,而在細(xì)胞過程中,與轉(zhuǎn)運(yùn)和分解代謝相關(guān)的Unigene最多(577條,2.83%)。共檢測到562 條Unigene 涉及信號轉(zhuǎn)導(dǎo),可用于分析金毛狗對信號因子的響應(yīng)。金毛狗主要含有苯丙烷類、黃酮、類黃酮類、酚類、氨基酸等化學(xué)成分,本研究鑒定到184 條Unigene 涉及苯丙烷類的生物合成,80條Unigene涉及類黃酮類物質(zhì)的生物合成,1 條Unigene 涉及異黃酮生物合成類化合物生物合成,2 條Unigene 涉及黃酮和黃酮醇生物合成,43 條Unigene 與異喹啉生物堿生物合成相關(guān),19 條Unigene 參與甜菜紅色素的生物合成,41 條Unigene涉及二苯乙烯類、二芳基庚烷類和姜辣素生物合成,31條Unigene涉及托烷、哌啶和吡啶生物堿的生物合成。
圖3 金毛狗Unigene的KEGG功能分類Figure 3 Functional classification of unigenes in Cibotium barometz(L)J.Sm.by KEGG
2. 4基因本體論(GO)功能注釋共有25 246 條金毛狗Unigene 在GO 數(shù)據(jù)庫中得到注釋,分為生物過程(biological process)、細(xì)胞組分(cellular component)及分子功能(molecular funtion)三大類和44 個具體功能分類,包括代謝過程、刺激響應(yīng)、生物調(diào)節(jié)和轉(zhuǎn)運(yùn)活性等。其中:分子功能中的結(jié)合注釋到的Unigene 最多,共有14 930 條,占59.14%;細(xì)胞組分中的細(xì)胞骨架和生物過程中的細(xì)胞過程注釋的Unigene 也較多,分別為14 439和14 219條,與藥用成分相關(guān)的催化活性為11 380條,抗氧化活性為146條。這些通路與金毛狗的生長發(fā)育和藥用成分的合成密切相關(guān)。結(jié)果見圖4。
圖4 金毛狗Unigene的GO功能分類Figure 4 Gene ontology(GO)functional classification of Cibotium barometz(L)J.Sm.unigenes
2.5 轉(zhuǎn)錄因子分析植物轉(zhuǎn)錄因子主要調(diào)節(jié)各種基因表達(dá)模式,常見的種類有bHLH、MYB 和NAC 等。通過研究這些轉(zhuǎn)錄因子的作用機(jī)制是功能基因組學(xué)的重要環(huán)節(jié)。根據(jù)金毛狗的Unigene比對結(jié)果,共鑒定到2 189 個轉(zhuǎn)錄因子,可分為212 個轉(zhuǎn)錄因子家族,其中,C2H2 轉(zhuǎn)錄因子類的Unigene數(shù)量最多,共103條,占總數(shù)的4.71%,其次是C3H(90 條,4.12%),bHLH(72 條,3.29%),AP2/ERF-ERF(63條,2.88%),MYB-related(57 條,2.6%),RLK-Pelle_SD-2b(48 條,2.19%)和PHD(47 條,2.15%)等家族。結(jié)果見圖5。這些轉(zhuǎn)錄因子涉及金毛狗的生長發(fā)育、次生代謝和合成、環(huán)境響應(yīng)等多種生物學(xué)過程。轉(zhuǎn)錄因子的分析有利于研究金毛狗的次生代謝物如苯丙烷類、黃酮、類黃酮類等有效成分的生物合成和調(diào)控。
圖5 金毛狗轉(zhuǎn)錄因子分類Figure 5 Transcription factor classification of Cibotium barometz(L)J.Sm.
2.6 SSR分析采用MISA 對組裝長度為1 000 bp以上的16 318 條Unigene 進(jìn)行SSR 檢測,并對SSR的類型和密度進(jìn)行統(tǒng)計。結(jié)果表明,在4 605 條Unigene中共鑒定到6 456個SSR位點(diǎn)。其中:856條Unigene 中檢測到2 個以上的SSR 位點(diǎn),占總Unigene 總數(shù)的18.59%;352 條Unigene 中檢測到430 個復(fù)雜重復(fù)類型的SSR 位點(diǎn),占7.64%。最豐富的重復(fù)類型是雙堿基重復(fù),共檢測到2 502個位點(diǎn),占38.74%;其次為單堿基重復(fù)1 411 個,占21.86%;三堿基重復(fù)1 150個,占17.81%;四堿基重復(fù)27個、六堿基重復(fù)15個,最少的為五堿基重復(fù),僅檢測到3個位點(diǎn)。結(jié)果見圖6?;? 456個SSR 位點(diǎn),使用Primer 3.0 軟件設(shè)計引物,為進(jìn)一步開發(fā)金毛狗的遺傳標(biāo)記和近緣種屬的遺傳圖譜提供了基礎(chǔ)數(shù)據(jù)。
圖6 金毛狗Unigene的SSR位點(diǎn)密度分布Figure 6 Density distribution of SSR locus for unigenes in Cibotium barometz(L)J.Sm.
隨著高通量測序技術(shù)的發(fā)展,轉(zhuǎn)錄組分析數(shù)據(jù)產(chǎn)出速度快、成本低,在功能基因挖掘和分子標(biāo)記開發(fā)上的應(yīng)用越來越廣泛[8]。本研究基于Illumina HiSeq 2500 高通量測序平臺對金毛狗葉片進(jìn)行轉(zhuǎn)錄組測序,共獲得10.1 G的Clean Data,經(jīng)過mRNA 片段化隨機(jī)性檢驗,插入片段長度檢驗,轉(zhuǎn)錄組測序數(shù)據(jù)飽和度檢驗等轉(zhuǎn)錄組測序文庫質(zhì)量評估,其中Q30 bases ratio達(dá)到93.71%,GC含量為49.85%,結(jié)果表明金毛狗轉(zhuǎn)錄組測序數(shù)量大,質(zhì)量高。通過de nove組裝,本研究共獲得204 874 個長度在200 bp 以上的Transcript,共有87 791 條Unigene,平均長度為697.85 bp,N50 為1 262 bp,表明金毛狗轉(zhuǎn)錄組序列組裝質(zhì)量較高。共有33 682 條(38.37%)Unigene 序列在多個公共數(shù)據(jù)庫中獲得功能注釋,與江南卷柏Selaginella moellendorffii的親緣關(guān)系最為接近。本研究鑒定到184 條Unigene 涉及苯丙烷類的生物合成,80 條Unigene 涉及類黃酮類物質(zhì)的生物合成,1 條Unigene 涉及異黃酮生物合成類化合物的生物合成,2 條Unigene 涉及黃酮和黃酮醇生物合成,43 條Unigene與異喹啉生物堿生物合成相關(guān),19條Unigene 參與甜菜紅色素的生物合成,41 條Unigene 涉及二苯乙烯類、二芳基庚烷類和姜辣素生物合成,31條Unigene涉及托烷、哌啶和吡啶生物堿的生物合成。這也與金毛狗主要含苯丙烷類、黃酮、類黃酮類、酚類、氨基酸等化學(xué)成分密切相關(guān)[5,13]。這些與次生代謝相關(guān)Unigene的鑒定結(jié)果,表明了其富含次生代謝相關(guān)基因,為明晰金毛狗黃酮類和萜類物質(zhì)的合成途徑和代謝網(wǎng)絡(luò)提供了數(shù)據(jù)支撐。
中藥材來源廣泛,部分品種有多個基源植物,中藥材的質(zhì)量穩(wěn)定備受產(chǎn)業(yè)的關(guān)注,藥材真?zhèn)蔚蔫b定一直以來是研究的重點(diǎn)和難點(diǎn)[14]。金毛狗加工的中藥材及飲片混亂現(xiàn)象嚴(yán)重,非正品多為單芽狗脊蕨和蜈蚣草,但三者功效不同[15]。但通過形態(tài)、微觀結(jié)構(gòu)、薄層層析等普通的傳統(tǒng)的鑒定方法很難快速、準(zhǔn)確地加以甄別[16]。隨著技術(shù)的發(fā)展,開展中藥材分子鑒定的研究和應(yīng)用十分必要[17]。其中,SSR標(biāo)記操作簡單、重復(fù)性好,利用轉(zhuǎn)錄組可以開發(fā),并已在甘草、鐵皮石斛、枸杞等中藥材用于遺傳圖譜的構(gòu)建[18-19]。本研究共檢測到6 456 個候選的SSR 位點(diǎn),其中雙堿基重復(fù)的類型最多,共檢測到2 502個位點(diǎn),隨著堿基重復(fù)數(shù)的增加而在Unigene 上的SSR 位點(diǎn)減少。堿基類型在Unigene 上的分布密度也與其他藥用植物,如溪黃草、肇實和黃金艾蒿一致,表明利用金毛狗轉(zhuǎn)錄組鑒定的SSR位點(diǎn)可靠[20-22]。轉(zhuǎn)錄組的分析為金毛狗SSR 分子標(biāo)記的開發(fā),用于群體遺傳多樣性分析、遺傳圖譜構(gòu)建和真?zhèn)舞b定提供了依據(jù)。
綜上所述,本研究為解析金毛狗藥用成分的次級代謝物質(zhì)合成通路及分子生物學(xué)研究提供了基礎(chǔ)的遺傳信息,也為金毛狗的保護(hù)和利用提供了方法。