劉志強(qiáng),高 崎1, ,李 航,江美芳,陳 冉
基于代謝組學(xué)和轉(zhuǎn)錄組學(xué)的不同生長年限下銀杏萜類生物合成關(guān)鍵基因表達(dá)分析
劉志強(qiáng)2,高 崎1, 2*,李 航2,江美芳2,陳 冉2
1. 上海中醫(yī)藥大學(xué)中藥學(xué)院,上海 201203 2. 上海上藥杏靈科技藥業(yè)股份有限公司,上海 201703
以不同發(fā)育階段不同樹齡的銀杏葉(銀杏幼樹葉,多年生銀杏樹葉)為對象,分析次生代謝物變化規(guī)律,測定黃酮及萜內(nèi)酯含量,分析萜類生物合成的通路和關(guān)鍵基因表達(dá),為提高銀杏萜內(nèi)酯產(chǎn)量提供分子生藥學(xué)數(shù)據(jù)。采用液相色譜-質(zhì)譜聯(lián)用(LC-MS)技術(shù),并進(jìn)行高通量轉(zhuǎn)錄組學(xué)測序(RNA-seq),從差異表達(dá)基因中尋找次生代謝物生物合成的關(guān)聯(lián)酶基因。代謝數(shù)據(jù)表明,不同樹齡,不同發(fā)育階段的銀杏葉次生代謝物明顯不同,黃酮類成分,老樹葉片與幼樹葉4~7月含量均呈下降趨勢;同發(fā)育階段,幼樹葉含量高于老樹葉片含量;萜內(nèi)酯類成分,老樹葉片4~7月含量略微呈上升趨勢,幼樹葉略微呈緩降趨勢;同發(fā)育階段,幼樹葉含量高于老樹葉片含量。轉(zhuǎn)錄組分析出萌發(fā)期,老樹葉片與幼樹葉片生長狀態(tài)相似,5~7月老樹葉與幼樹葉基因表達(dá)發(fā)生較大變化。篩選出49條與萜類合成有關(guān)的候選基因,分析后發(fā)現(xiàn)甲羥戊酸途徑(mevalonate pathway,MVA)中老樹葉表達(dá)高于幼樹葉;甲基赤藻糖醇磷酸途徑(methylerythritol 4-phosphate pathway,MEP)中幼樹葉表達(dá)高于老樹葉。幼樹葉比老樹葉藥用活性成分含量更高,適合作為藥材。銀杏葉內(nèi)萜類合成途徑可能主要依賴于MEP途徑,且相關(guān)基因表達(dá)量與代謝成分相互證明。
銀杏;測序;轉(zhuǎn)錄組;代謝組;萜類
銀杏L.又名白果樹,為銀杏科銀杏屬的單科單屬落葉喬木。銀杏作為傳統(tǒng)中藥,具有抗氧化、抗凋亡、改善腦血流、抑制血小板活性等多種藥理作用[1],可用于治療腦卒中、腦梗死、冠心病穩(wěn)定型心絞痛等疾病的治療[2-3]?!吨袊幍洹?020年版規(guī)定,銀杏內(nèi)酯和銀杏黃酮為銀杏葉提取物的主要藥用成分,其中黃酮醇苷質(zhì)量分?jǐn)?shù)不少于24%,萜內(nèi)酯不少于6%[4]。隨著銀杏葉提取物制劑的廣泛使用,如何提高銀杏藥用活性成分的含量成為一個(gè)新的問題。一般而言,植物次生代謝物的積累與發(fā)育階段有著密切聯(lián)系,研究銀杏主要次生代謝物的變化,為其生產(chǎn)實(shí)踐提供理論依據(jù)。
目前,有關(guān)銀杏的基因研究也伴隨著測序技術(shù)的發(fā)展也在被廣泛的開展。2016年完成了銀杏的基因組測序,為銀杏轉(zhuǎn)錄組測序提供了可參考基因,這使得銀杏次生代謝物生物合成的研究變得更為便利,特別是涉及到黃酮醇苷的類黃酮生物合成通路以及相關(guān)的功能基因都被頻繁報(bào)道[5]。本實(shí)驗(yàn)旨在運(yùn)用代謝組數(shù)據(jù)結(jié)合轉(zhuǎn)錄測序結(jié)果,采用新型分析軟件與更為科學(xué)的算法對不同樹齡不同生長階段的銀杏葉進(jìn)行比較分析,篩選銀杏葉萜類生物合成的關(guān)鍵表達(dá)基因,為闡述其生物合成途徑提供依據(jù),為銀杏葉種植采摘提供理論數(shù)據(jù)。
銀杏葉樣品采集自四川省都江堰市申都中藥有限公司種植石羊村種植基地(N30°5′40″,E103°41′10″),根據(jù)基地實(shí)驗(yàn)記錄數(shù)據(jù)分別于2019年4月下旬、2019年5月下旬、2019年6月下旬、2019年7月下旬選取2年生幼樹(Y4~7)和20年生老樹(L4~7)進(jìn)行采摘,以液氮速凍后放于?80 ℃保存,用于總RNA提取。為保證采取樣品的一致性,采集相同地點(diǎn)銀杏葉,干燥后用作化學(xué)成分分析。每份樣品設(shè)置3個(gè)生物學(xué)重復(fù)。對照品信息見表1。
表1 對照品收集信息
Table 1 Reference collection information
化合物CAS批號廠家 奎寧酸77-95-2K29D9B77039上海源葉生物科技有限公司 原兒茶酸99-50-3H21J9Z64031上海源葉生物科技有限公司 沒食子兒茶素970-74-11297/17878上海詩丹德標(biāo)準(zhǔn)技術(shù)服務(wù)有限公司 白果內(nèi)酯33570-04-6P08J9F52398上海源葉生物科技有限公司 表兒茶素490-46-0C20N6Q5882上海源葉生物科技有限公司 銀杏內(nèi)酯J107438-79-9D29J9G53845上海源葉生物科技有限公司 銀杏內(nèi)酯C15291-76-6C28S6G3986上海源葉生物科技有限公司 3-O-β-D-吡喃葡糖基槲皮素482-35-9P25J9F65872上海源葉生物科技有限公司 3-O-[α-L-吡喃鼠李糖(1′′→2′′)]-[α-L-吡喃鼠李糖(1′′→6′′)]-β-D-吡喃葡萄糖基山柰酚55804-74-58257上海詩丹德標(biāo)準(zhǔn)技術(shù)服務(wù)有限公司 蘆丁153-18-4Y16M9S61523上海源葉生物科技有限公司 銀杏內(nèi)酯A15291-75-5W25A7K13730上海源葉生物科技有限公司 3-O-[α-L-吡喃鼠李糖(1′′→2′′)]-[α-L-吡喃鼠李糖(1′′→6′′)]-β-D-吡喃葡糖基異鼠李素104472-68-6Y14S8H43976上海源葉生物科技有限公司 銀杏內(nèi)酯B15291-77-7D15D8G50608上海源葉生物科技有限公司 3-O-[β-D-吡喃葡萄糖基(1′′→2′′)]-α-L-吡喃鼠李糖-槲皮素143016-74-48301上海詩丹德標(biāo)準(zhǔn)技術(shù)服務(wù)有限公司 3-O-β-D-吡喃葡萄糖基山柰酚480-10-4Y19M8H36474上海源葉生物科技有限公司 3-O-[α-L-吡喃鼠李糖(1′′→6′′)]-β-D-吡喃葡萄糖基山柰酚17650-84-9Y15N8H48277上海源葉生物科技有限公司 3-O-[α-L-吡喃鼠李糖(1′′→6′′)]-β-D-吡喃葡糖基異鼠李素55033-90-45771上海詩丹德標(biāo)準(zhǔn)技術(shù)服務(wù)有限公司 3-O-[β-D-吡喃葡萄糖基(1′′→2′′)]-α-L-吡喃鼠李糖-異鼠李素604-80-8S08A8D33447上海源葉生物科技有限公司 3-O-[α-L-吡喃鼠李糖(1′′→6′′)]-β-D-吡喃葡萄糖基丁香亭53430-50-58260上海詩丹德標(biāo)準(zhǔn)技術(shù)服務(wù)有限公司 3-O-[β-D-吡喃葡萄糖基(1′′→2′′)]-α-L-吡喃鼠李糖-山柰酚142451-65-88308上海詩丹德標(biāo)準(zhǔn)技術(shù)服務(wù)有限公司 3-O-[6-O-香豆酰基-β-D-吡喃葡萄糖基(1′′→2′′)]-α-L-吡喃鼠李糖-槲皮素143061-65-88244上海詩丹德標(biāo)準(zhǔn)技術(shù)服務(wù)有限公司 3-O-[6-O-香豆?;?β-D-吡喃葡萄糖基(1′′→2′′)]-α-L-吡喃鼠李糖-山柰酚111957-48-38258上海詩丹德標(biāo)準(zhǔn)技術(shù)服務(wù)有限公司 木犀草素491-70-32226/17876上海詩丹德標(biāo)準(zhǔn)技術(shù)服務(wù)有限公司 芹菜素520-36-5404/17869上海詩丹德標(biāo)準(zhǔn)技術(shù)服務(wù)有限公司 白果素521-32-4Y15J9L63710上海源葉生物科技有限公司 異銀杏素548-19-6Y10N8Y47776上海源葉生物科技有限公司 金松雙黃酮521-34-6P03M9F55041上海源葉生物科技有限公司 銀杏酸(C13:0)20261-38-5P11D8F50448上海源葉生物科技有限公司 銀杏酸(C15:1)22910-60-7Y24M9H57091上海源葉生物科技有限公司 銀杏酸(C17:1)111047-30-4Y23M9H62018上海源葉生物科技有限公司
2.1.1 樣品制備 將采摘的樣品烘干磨粉后精確稱量各個(gè)時(shí)期樣品粉末0.5 g,置具塞離心管中,加入50%甲醇10 mL,渦旋振蕩1 min,超聲提取15 min,再振蕩1 min,離心(轉(zhuǎn)速6000 r/min)10 min,分取上清液于25 mL量瓶中,重復(fù)上述操作1次,合并2次上清液,用50%甲醇定容至25 mL。
2.1.2 色譜條件[6]樣品于Waters Acquity UPLC/Xevo G2-XS Q-TOF超高效液相色譜質(zhì)譜聯(lián)用儀進(jìn)行測定,每個(gè)樣品平行3針,保證平行實(shí)驗(yàn)。色譜柱為Waters Acquity UPLC BEH C18柱(100 mm×2.1 mm,1.7 μm),柱溫45 ℃,體積流量0.2 mL/min,進(jìn)樣體積1 μL。流動相為0.2 mol/L醋酸銨溶液(含0.1%甲酸)(A)-乙腈(B),梯度洗脫:0~60 min,98%~2% A;60~70 min,2% A;70~71 min,2%~98% A;71~75 min,98% A。
2.1.3 質(zhì)譜條件 負(fù)離子模式,Sensitivity模式(分辨率為30 000);毛細(xì)管電壓?2.5 kV;樣品錐孔電壓40 V;源偏移電壓80 V;源溫120 ℃;脫溶劑溫度450 ℃;錐孔氣50 L/h;脫溶劑氣體積流量800 L/h;霧化氣壓力600 kPa;質(zhì)量數(shù)校正范圍/50~1000,校正溶液為0.5 mmol/L甲酸鈉溶液,體積流量20 μL/min;實(shí)時(shí)校正lock spray為1 ng/μL的亮氨酸腦啡肽溶液,/554.2615;數(shù)據(jù)采集方法為MSE,數(shù)據(jù)類型為continuum,能量范圍10~40 V,掃描時(shí)間為0.2 s。采用Waters UNIFI軟件進(jìn)行相關(guān)分析。
2.1.4 方法學(xué)考察 按照參考文獻(xiàn)方法[6],取銀杏葉樣品進(jìn)行精密度、穩(wěn)定性、重復(fù)性試驗(yàn),結(jié)果RSD均小于3%,表明該方法穩(wěn)定可靠。
2.1.5 數(shù)據(jù)分析 通過在國內(nèi)外數(shù)據(jù)庫,包括CNKI數(shù)據(jù)庫、PubMed、ScienceDirect、Web of Science等,以“銀杏酮酯”“銀杏葉提取物”“銀杏”“銀杏葉”“銀杏花”“銀杏果”“Ginkgo biloba extract50”“Ginkgo biloba extract”“Ginkgo”“Ginkgo biloba”“Ginkgo biloba flowers”“Ginkgo nut”為關(guān)鍵字檢索相關(guān)文獻(xiàn),匯總銀杏葉中可能的化學(xué)成分,將化學(xué)成分名稱、分子式導(dǎo)入到UNIFI軟件(Waters公司)建立銀杏酮酯化學(xué)成分?jǐn)?shù)據(jù)庫。將樣本質(zhì)譜分析所得的原始數(shù)據(jù)導(dǎo)入配套的UNIFI工作站中,根據(jù)建立的化學(xué)成分?jǐn)?shù)據(jù)庫,提取所有離子,并對提取離子排除分析,通過對照品對照,進(jìn)一步確證化合物。
使用TRIzol?試劑(植物組織RNA純化試劑)按照制造商說明(Invitrogen,Carlsbard,CA,美國)從銀杏葉組織中提取總RNA,使用DNase I (TaKara)去除基因組DNA。然后用2100生物分析儀(安捷倫科技公司,圣克拉拉,美國)測定總RNA質(zhì)量的完整性和純度,并使用rd-2000(NanoDrop Thermo Scientific,Wilmington,DE,美國)進(jìn)行定量。符合文庫構(gòu)建要求(260/280=1.8~2.2,260/230≥2.0,RIN≥8.0,28S:18S≥1.0,>2 μg)。利用Illumina TruSeqTM RNA樣品制備試劑盒(San Diego,CA)制備銀杏雙葉RNA-seq轉(zhuǎn)錄組文庫后,在Illumina Hiseq xten測序儀(Illumina, San Diego,CA)上進(jìn)行2×150 bp的雙端測序,每個(gè)樣本選擇3份進(jìn)行生物學(xué)重復(fù)。
通過使用SeqPrep(https://github.com/ jstjohn/SeqPrep)和Sickle(https://github.com/najoshi/ sickle)對大量的raw reads進(jìn)行了裁剪和質(zhì)量控制得到clean data,用HISAT2(http://ccb.jhu.edu/ software/hisat2/index.shtml)與銀杏基因組(http://gigadb.org/dataset/100209)進(jìn)行序列比對[7],得到mapped reads并進(jìn)行質(zhì)量評估。
基于所選參考基因組序列,使用StringTie(http://ccb.jhu.edu/software/stringtie/)軟件對Mapped Reads進(jìn)行拼接,并與原有的基因組注釋信息進(jìn)行比較,尋找原來未被注釋的轉(zhuǎn)錄區(qū),發(fā)掘該物種的新轉(zhuǎn)錄本和新基因,從而補(bǔ)充和完善原有的基因組注釋信息[8-9]。
將獲得的所有Unigene與NCBI蛋白數(shù)據(jù)庫nonredundant(NR)進(jìn)行比對,以值<1×10?5為閾值,通過BLAST算法進(jìn)行功能注釋[10]。同時(shí),將Unigene在Swiss-Prot、Pfam、COG、GO和KEGG各大數(shù)據(jù)庫的功能注釋進(jìn)行匯總,分析預(yù)測其功能分類和參與的生物學(xué)途徑。
為了識別2個(gè)不同樣本間的差異表達(dá)基因(differential expression genes,DEGs),使用TPM法衡量每個(gè)轉(zhuǎn)錄本表達(dá)水平。借用RSEM(http:// deweylab.biostat.wisc.edu/rsem/)對基因進(jìn)行了定量分析[11]。利用R統(tǒng)計(jì)軟件包EdgeR(http://www. bioconductor.org/packages/2.12/bioc/html/edgeR.html)進(jìn)行差異表達(dá)分析。
此外,以Bonferroni為多重驗(yàn)證法,以值≤0.01為閾值,用Goatools(https://github.com/ tanghaibao/Goatools)和KOBAS(http://kobas.cbi.pku. edu.cn/home.do)進(jìn)行了GO功能富集和KEGG通路分析[12-13]。
3.1.1 銀杏葉化學(xué)成分分析 為了對銀杏葉的化學(xué)成分進(jìn)行研究,采用50%甲醇溶液超聲提取的方法,分別獲得不同年限不同發(fā)育階段銀杏葉除銀杏雙黃酮及烷基酚類以外的其余成分。通過UPLC Q-TOF/MS分析得到銀杏葉總離子流圖(TIC),見圖1。根據(jù)總離子流圖所得到的化合物精確相對分子質(zhì)量、二級碎片信息,與對照品和實(shí)驗(yàn)室構(gòu)建的數(shù)據(jù)庫比對,共鑒定出55個(gè)化合物,其中30個(gè)已與對照品比對,結(jié)果見表2。
圖1 銀杏葉總離子流圖
表2 銀杏葉化合物質(zhì)譜信息
Table 2 Mass spectrum information of leaves compounds
峰號化合物名稱分類分子式m/z[M-H]?誤差(×10?6)tR/min二級碎片 1*奎寧酸有機(jī)酸類C7H12O6191.055 0?2.81.25173.05 2*原兒茶酸有機(jī)酸類C7H6O4153.018 5?2.14.97135.03, 109.03 3*沒食子兒茶素黃烷醇類C15H14O7305.065 2?2.07.96243.03, 177.02, 137.02, 125.02, 109.03 4*兒茶素黃烷醇類C15H14O6289.070 72.08.25137.02, 125.02 53-O-β-D-吡喃葡萄糖基二氫山柰酚黃酮類C21H22O11449.107 808.73287.06, 259.06 6*白果內(nèi)酯萜內(nèi)酯類C15H18O8325.091 8?0.611.36237.11, 193.12, 163.11 7*表兒茶素黃烷醇類C15H14O6289.070 6?0.411.80273.08, 137.02, 123.04 83-O-[β-D-吡喃葡萄糖 (1′′→2′′)]-[α-L-吡喃鼠李糖(1′′→6′′)]-β-D-吡喃葡萄糖基槲皮素黃酮類C33H40O21771.196 5?0.614.43609.14,462.08, 301.03 9*銀杏內(nèi)酯J萜內(nèi)酯類C20H24O10423.128 1?0.614.81379.14, 367.14, 349.09 10*銀杏內(nèi)酯C萜內(nèi)酯類C20H24O11439.123 4?0.115.58411.13, 383.13, 321.13 113-O-[β-D-吡喃葡萄糖(1′′→2′′)]-[α-L-吡喃鼠李糖(1′′→6′′)]-β-D-吡喃葡萄糖基山柰酚黃酮類C33H40O20755.202 3?0.616.03593.15, 463.09, 301.03 123-O-β-D-吡喃葡萄糖楊梅黃酮黃酮類C21H20O13479.082 5?1.116.09316.02, 287.02, 271.02 13*3-O-[α-L-吡喃鼠李糖(1′′→6′′)]-β-D-吡喃葡萄糖基楊梅黃酮黃酮類C27H30O17625.140 31.416.22316.02 143-O-[β-D-吡喃葡萄糖(1′′→2′′)]-[α-L-吡喃鼠李糖(1′′→6′′)]-β-D-吡喃葡萄糖基山柰酚同分異構(gòu)體黃酮類C33H40O20755.201 9?0.316.99593.15, 463.09, 301.03 153-O-[6-O-香豆酰基-β-D-吡喃葡萄糖基(1′′→2′′)]-α-L-吡喃鼠李糖-7-O-β-D-吡喃葡糖基槲皮素黃酮類C42H46O23917.233 3?1.317.94755.18, 609.14, 300.03 16*3-O-β-D-吡喃葡糖基槲皮素黃酮類C21H20O12463.087 3?0.418.86300.03, 271.02, 255.03 173-O-β-D-吡喃鼠李糖基槲皮素黃酮類C21H20O11447.092 0?0.418.86285.04, 271.09, 151.00 18*3-O-[α-L-吡喃鼠李糖(1′′→2′′)]-[α-L-吡喃鼠李糖(1′′→6′′) ]-β-D-吡喃葡萄糖基山柰酚黃酮類C33H40O19739.207 20.318.88447.09, 284.03 19*蘆丁黃酮類C27H30O16609.145 8019.18463.09, 300.03, 271.02 20*銀杏內(nèi)酯A萜內(nèi)酯類C20H24O9407.133 3?0.619.27379.14, 351.15, 319.16 21*3-O-[α-L-吡喃鼠李糖(1′′→2′′)]-[α-L-吡喃鼠李糖(1′′→6′′)]-β-D-吡喃葡糖基異鼠李素黃酮類C34H42O20769.218 1?0.519.30447.11, 284.05
*已與對照品比對鑒定
*identified by comparison with the reference
3.1.2 多元統(tǒng)計(jì)分析 為了分析銀杏葉不同發(fā)育階段代謝產(chǎn)物組的動態(tài)變化,對不同生長年限不同發(fā)育階段的銀杏葉進(jìn)行非監(jiān)督模式識別的主成分分析(principal component analysis,PCA)圖2分別為多年生老樹葉與幼苗葉片;多年生老樹葉不同生長階段;幼苗葉不同生長階段的PCA分析散點(diǎn)圖[14]。圖2-A顯示出多年生老樹葉緊密分布在PC1的負(fù)半軸,而幼苗葉分布在正半軸;圖2-B、C表明多年生老樹葉與幼苗葉4~7月逐漸從PC1負(fù)半軸過渡至PC1正半軸。結(jié)果表明,無論是樹齡還是生長階段對于銀杏葉的代謝物質(zhì)組成均會產(chǎn)生較大變化。為了進(jìn)一步分析不同生長年限不同發(fā)育階段銀杏葉黃酮醇與萜內(nèi)酯類成分的含量變化,通過半定量方法對其進(jìn)行相對含量測定。圖3可明顯看出各類成分的變化趨勢,黃酮類成分,老樹葉片與幼樹葉4~7月含量均呈下降趨勢;同時(shí)期內(nèi),幼樹葉含量高于老樹葉片量。萜內(nèi)酯類成分,大樹葉片4~7月含量略微呈上升勢,幼樹葉略微呈緩降趨勢;同時(shí)期內(nèi),幼樹葉含量高于老樹葉片量。
A-老樹與幼樹整體成分差異 B-幼樹不同生長階段成分差異 C-老樹不同生長階段成分差異,字母前數(shù)字代表月份
3.2.1 銀杏轉(zhuǎn)錄測序質(zhì)量分析及注釋情況 通過Illumina Hiseq xten測序平臺測序,最后處理得到的8組樣品數(shù)據(jù)統(tǒng)計(jì)如表3所示。各樣品堿基質(zhì)量超過30的比例均在90%以上,且GC含量均在50%左右,測序組裝效果好;與銀杏參考基因進(jìn)行序列比對,對比效率均在90%以上,測序精度高。
組裝拼接后共得39 137條Unigene,將轉(zhuǎn)錄組組裝獲得的所有基因和轉(zhuǎn)錄本與6大數(shù)據(jù)庫(NR、Swiss-Prot、Pfam、COG、GO和KEGG)進(jìn)行比對。從圖4可以看出NR數(shù)據(jù)庫可注釋到31 936條;Swiss-Prot數(shù)據(jù)庫可注釋到25 235條;Pfam數(shù)據(jù)庫可注釋到21 561條;COG數(shù)據(jù)庫可注釋到28 922條;GO數(shù)據(jù)庫可注釋到27 503條;KEGG數(shù)據(jù)庫可注釋到13 504條;共注釋到32 358條,占Unigene 總數(shù)的82.68%。
3.2.2 樣本間表達(dá)量分析 通過基因的表達(dá)矩陣,可驗(yàn)證實(shí)驗(yàn)設(shè)計(jì)的合理性,了解樣本間特別是生物學(xué)重復(fù)間的相關(guān)性。圖5可以表明L4和Y4,Y5和Y6、Y7,L5和L6、L7的基因表達(dá)相關(guān)性更高。說明在4月樹葉處于萌發(fā)期,老樹葉片與幼樹葉片生長狀態(tài)相似,5~7月老樹葉與幼樹葉基因表達(dá)發(fā)生較大變化。
選取不同樹齡差異最大的L7與Y7;老樹基因表達(dá)差異最大的L4與L7;幼樹葉基因表達(dá)差異最大的Y4和Y5進(jìn)行差異分析。發(fā)現(xiàn)L7vsY7存在3811條顯著差異基因,上升2068條,下降1743條;發(fā)現(xiàn)L4vsL7存在4836條顯著差異基因,上升2527條,下降2309條;發(fā)現(xiàn)Y4vsY5存在3060條顯著差異基因,上升1510條,下降1550條,結(jié)果如圖6所示。將上述組別的差異表達(dá)基因分別進(jìn)行KEGG通路注釋,由于銀杏葉中的活性成分為萜內(nèi)酯和黃酮醇類,其中黃酮醇類成分為次級代謝產(chǎn)物,因此主要分析“其他次級代謝產(chǎn)物生物合成(biosynthesis of other secondary metabolites)”和“萜類和聚酮類化合物的代謝(metabolism of terpenoidsand polkketides)”。為了更清楚的了解所關(guān)注的黃酮類成分及萜內(nèi)酯類成分與差異表達(dá)基. 因是否在有關(guān)通路上存在相關(guān)性,對3組差異基因再進(jìn)行KEGG富集分析,篩選出flavonoid biosynthesis和terpenoid backbone biosynthesis 2條代謝通路來分析相關(guān)性(表4)。從結(jié)果可以看出幼樹葉在不同發(fā)育階段表達(dá)基因差異最大的Y4和Y5在黃酮和萜內(nèi)酯的生物合成上均不具有顯著性富集;老樹葉在不同發(fā)育階段表達(dá)基因差異最大的L4與L7在黃酮的生物合成上不具有顯著性富集,在萜內(nèi)酯的生物合成上存在顯著性富集;不同樹齡表達(dá)基因差異最大的L7與Y7在黃酮和萜內(nèi)酯的生物合成上均具有顯著性富集。根據(jù)KEGG通路注釋結(jié)果圖7可以看出,Y4Y5、L4L7、L7Y7的差異表達(dá)基因都在這2類代謝途徑中得到了注釋。
圖3 不同發(fā)育階段不同樹齡銀杏黃酮類與銀杏萜內(nèi)酯類成分相對含量
表3 轉(zhuǎn)錄組測序數(shù)據(jù)質(zhì)量分析
Table 3 Transcriptome sequencing data quality analysis
編號 clean readsclean bases誤差率/%Q20/%Q30/%GC/%總mapped數(shù)(占比/%)multiple mapped數(shù)(占比/%)Uniquely mapped數(shù)(占比/%) L45889750088291619030.023498.6795.7446.2657 040 427(96.85)5 151 043(8.75)51 889 384(88.10) L55276008878450518900.023498.6595.7646.8450 411 574(95.55)8 014 104(15.19)42 397 470(80.36) L65711333885442949530.023498.6895.7946.9854 453 219(95.34)7 026 826(12.30)47 426 393(83.04) L74251996262817080550.024598.2394.6745.1040 438 620(95.11)3 486 004(8.20)36 952 616(86.91) Y45015673675034781590.023398.7495.9046.0048 811 805(97.32)3 122 339(6.23)45 689 466(91.09) Y54677433669910404650.023198.7996.0545.9045 382 803(97.03)3 295 340(7.05)42 087 463(89.98) Y65848607687201654480.023398.7195.8446.6956 448 409(96.52)4 790 414(8.19)51 657 995(88.33) Y74743437069591274450.024298.3494.9846.2445 389 674(95.69)3 925 925(8.28)41 463 749(87.41)
圖4 功能注釋統(tǒng)計(jì)圖
圖5 表達(dá)量分析
圖6 差異表達(dá)基因Venn圖
表4 差異基因與通路相關(guān)性
Table 4 Correlation between different genes and pathways
組別黃酮生物合成途徑萜類骨架生物合成途徑 Y4vsY50.6400.230 L4vsL70.330 0.036* L7vsY7 0.025* 0.021*
表中數(shù)值表示差異基因和黃酮、萜類骨架生物合成途徑的相關(guān)性,*<0.05即差異顯著,**<0.01即差異極顯著
In the table represents the difference between genes and flavonoid and terpene biosynthesis of skeleton relationship between the way,*< 0.05 says significant difference,**< 0.01 says that the difference is significant
對KEGG數(shù)據(jù)庫黃酮生物合成(map00941)和萜類生物合成(map00900)2條途徑注釋分析,發(fā)現(xiàn)相關(guān)蛋白均被多條Unigen注釋到。注釋情況見表5。
有關(guān)銀杏黃酮類生物合成相關(guān)基因表達(dá)分析已經(jīng)被報(bào)道[5],這里著重對銀杏萜類成分生物合成相關(guān)表達(dá)基因進(jìn)行分析。根據(jù)藥典記載,銀杏藥用活性成分主要為總黃酮醇苷和萜內(nèi)酯2類。其中,萜內(nèi)酯為銀杏特有成分,也是銀杏葉提取物的質(zhì)量控制檢測標(biāo)準(zhǔn)。
圖7 差異基因KEGG富集分析統(tǒng)計(jì)圖
表5 萜類與黃酮類生物合成相關(guān)基因注釋
Table 5 Comments on genes related to biosynthesis of terpenoids and flavonoids
通路基因名稱中文名稱縮寫注釋到的Unigene數(shù) 萜類MVA合成途徑acetyl-CoA C-acetyltransferase乙酰CoA?;D(zhuǎn)移酶AACT 5 hydroxymethylglutaryl-CoA reductase羥基甲基戊二酰-CoA還原酶HMGCR25 mevalonate kinase甲羥戊酸激酶MK 1 phosphomevalonate kinase磷酸甲羥戊酸激酶PMVK 4 diphosphomevalonate decarboxylase二磷酸甲羥戊酸脫羧酶MVD 2 萜類MEP合成途徑1-deoxy-D-xylulose-5-phosphate synthase1-脫氧-D-木桐糖-5-磷酸合酶DXS 6 1-deoxy-D-xylulose-5-phosphate reductoisomerase1-脫氧-D-木酮糖-5-磷酸還原異構(gòu)酶DXR 1 2-C-methyl-D-erythritol 4-phosphate cytidylyltransferase2-C-甲基-D-赤蘚糖醇4-磷酸胞苷酰轉(zhuǎn)移酶CMS 1 4-diphosphocytidyl-2-C-methyl-D-erythritol kinase4-二磷酸胞苷-2-C-甲基-D-赤蘚糖醇激酶CMK 2 2-C-methyl-D-erythritol 2,4-cyclodiphosphate synthase2-C-甲基-D-赤蘚糖醇2,4-環(huán)二磷酸合酶MCS 2 黃酮類合成途徑chalcone synthase查耳酮合成酶CHS17 flavonol synthase黃酮醇合酶FLS19 flavanone 3-dioxygenase黃烷酮3-羥化酶F3H 8 chalcone isomerase查耳酮異構(gòu)酶CHI 3 flavonoid 3′,5′'-hydroxylase類黃酮3′,5′-羥化酶F3'5'H 8 flavonoid 3′-hydroxylase類黃酮3′-羥化酶F3'H 5 dihydroflavonol 4-reductase二氫黃酮醇4-還原酶DFR19 anthocyanidin synthase花色素合成酶ANS 7 anthocyanidin reductase花色素還原酶ANR11
萜類合成通路主要分為MVA及MEP,通過對萜類合成通路基因進(jìn)行篩選注釋,發(fā)現(xiàn)在這2條通路上的關(guān)鍵基因均被注釋,且存在顯著性差異。本著轉(zhuǎn)錄研究為基因動態(tài)表達(dá)的原則,為了尋找銀杏萜類合成的規(guī)律,本實(shí)驗(yàn)對不同樹齡,不同生長階段的銀杏在這2條通路上的多個(gè)關(guān)鍵基因表達(dá)進(jìn)行比較分析。發(fā)現(xiàn)這些基因雖然大多都被多個(gè)Unigene所注釋,但Unigene其表達(dá)模式趨于一致,故選取表達(dá)量最高的Unigene作為豐度衡量。
圖8表現(xiàn)出,MVA途徑中、、3個(gè)基因表達(dá)量超過200,且均為老樹,、表達(dá)較低。從同一發(fā)育階段比較來看,老樹4~7月均高于幼樹葉;從不同發(fā)育階段來看,老樹呈上升趨勢,在6、7月表達(dá)高于4、5月;幼樹葉則出現(xiàn)緩降趨勢,6、7月表達(dá)低于4、5月。MEP途徑中DXR和MCS表達(dá)最高,從同一發(fā)育階段來看,幼樹葉4~7月表達(dá)均高于老樹;從不同發(fā)育階段看,幼樹葉呈緩降趨勢,老樹呈上升趨勢。
圖8 萜類生物合成途徑功能基因表達(dá)量分析
通過對不同樹齡,不同生長階段的銀杏葉次級代謝物進(jìn)行PCA分析,發(fā)現(xiàn)無論是樹齡差異還是生長階段的不同都會產(chǎn)生明顯的差別。銀杏葉提取物的藥用活性成分主要是黃酮醇苷及銀杏內(nèi)酯2大類次生代謝物,通過對黃酮醇苷(槲皮素、異鼠李素、山柰素)和銀杏內(nèi)酯含量測定,發(fā)現(xiàn)幼樹葉中2類成分均明顯高于老樹葉含量,這佐證了選取銀杏幼樹葉入藥的合理性,由于采摘后重新生長的葉片代謝積累會發(fā)生較大改變,缺少后續(xù)積累數(shù)據(jù),對于7月是否為最佳采摘時(shí)期有待進(jìn)一步研究。
本次轉(zhuǎn)錄測序檢測到表達(dá)基因共39 137個(gè),其中已知基因33 663個(gè),新基因5474個(gè);表達(dá)轉(zhuǎn)錄本共59 312個(gè),其中已知轉(zhuǎn)錄本31 947個(gè),新轉(zhuǎn)錄本27 365個(gè)。根據(jù)基因表達(dá)分析發(fā)現(xiàn)幼樹葉比老樹葉代謝更為旺盛,幼樹每個(gè)月整體基因表達(dá)都具有顯著性差異,老樹葉經(jīng)歷4個(gè)月的生長后才表現(xiàn)出整體基因表達(dá)差異。經(jīng)過KEGG富集分析發(fā)現(xiàn)與生長階段這一因素相比,樹齡的差異導(dǎo)致銀杏黃酮類和萜類的差異更為明顯,這也與代謝成分測定的結(jié)果相吻合。通過KEGG通路注釋,篩選出49條與銀杏萜類生物合成的相關(guān)基因,并進(jìn)一步分析了這些基因的表達(dá)狀況。結(jié)果表明,銀杏葉萜類合成可能更依賴于MEP通路,MEP上的結(jié)構(gòu)基因表達(dá)模式與代謝含量結(jié)果相對應(yīng),特別是DXS的表達(dá)模式幾乎與銀杏內(nèi)酯變化一致。DXS可能是銀杏內(nèi)酯生物合成的主要限速基因。利用基因工程技術(shù),提高DXS的表達(dá),從而提升銀杏內(nèi)酯的量是具有一定的可行性,這也是本研究的下一步工作。
利益沖突 所有作者均聲明不存在利益沖突
[1] 李思佳, 耿劍亮, 張悅, 等. 銀杏藥理作用研究進(jìn)展 [J]. 藥物評價(jià)研究, 2017, 40(6): 731-741.
[2] 李春雷, 張峰. 維生素、葉酸聯(lián)合銀杏葉提取物對老年腦卒中患者認(rèn)知功能影響研究 [J]. 中國生化藥物雜志, 2015, 35(8): 107-109.
[3] 張鵬飛, 廖麗君, 譚玉萍. 銀杏葉提取物治療慢性阻塞性肺疾病作用機(jī)制的研究進(jìn)展 [J]. 中國全科醫(yī)學(xué), 2017, 20(15): 1906-1910.
[4] 中國藥典 [S]. 四部. 2015: 1491-1493.
[5] 劉偉, 王俊燚, 李萌, 等. 基于轉(zhuǎn)錄組測序的銀杏類黃酮生物合成關(guān)鍵基因表達(dá)分析 [J]. 中草藥, 2018, 49(23): 5633-5639.
[6] 何厚洪, 杜昕, 金輝輝, 等. 銀杏葉提取物HPLC指紋圖譜研究及共有峰的LC-MS鑒定 [J]. 藥物分析雜志, 2017, 37(6): 1107-1112.
[7] Grabherr M G, Haas B J, Yassour M,. Full-length transcriptome assembly from RNA-Seq data without a reference genome [J]., 2011, 29(7): 644-652.
[8] 魯光輝, 李新峰, 馮亮, 等. 銀杏內(nèi)酯B對癲癇大鼠血腦屏障保護(hù)作用的研究 [J]. 藥物評價(jià)研究, 2020, 43(4): 765-772.
[9] Conesa A, G?tz S, García-Gómez J M,. Blast2GO: A universal tool for annotation, visualization and analysis in functional genomics research [J]., 2005, 21(18): 3674-3676.
[10] Kanehisa M, Goto S. KEGG: Kyoto encyclopedia of genes and genomes [J]., 2000, 28(1): 27-30.
[11] Li B, Dewey C N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome [J]., 2011, 12: 323.
[12] Robinson M D, McCarthy D J, Smyth G K. edgeR: A bioconductor package for differential expression analysis of digital gene expression data [J]., 2010, 26(1): 139-140.
[13] Xie C, Mao X Z, Huang J J,. KOBAS 2.0: A web server for annotation and identification of enriched pathways and diseases [J]., 2011, 39: W316-W322.
[14] 秦偉瀚, 花雷, 郭延壘, 等. UPLC-Q-TOF-MS結(jié)合代謝組學(xué)分析冬蟲夏草不同部位的差異性 [J]. 中國實(shí)驗(yàn)方劑學(xué)雜志, 2018, 24(21): 69-76.
Expression analysis of key genes in terpenoid biosynthesis ofunder different growth years based on metabolomics and transcriptome
LIU Zhi-qiang1, GAO Qi1, 2, LI Hang2, JIANG Mei-fang2, CHEN Ran2
1. School of Pharmacy, Shanghai University of Traditional Chinese Medicine, Shanghai 201203, China 2. Shanghai Xingling Science and Technology Pharmaceutical Co., Ltd., Shanghai 201703, China
leaves (leaves, perennialleaves) at different development stages and ages were used as objects to determine the content of flavonoids and terpene lactones in their secondary metabolites, to analyze the pathways of terpene biosynthesis and the expression of key genes, and to provide molecular biopharmaceutical data for improving the yield of ginkgo terpenolactone.Based on liquid chromatography-mass spectrometry (LC-MS) metabolomic technology, and high-throughput transcriptomics sequencing (RNA-seq) to find the related enzymes of secondary metabolite biosynthesis from differentially expressed genes.It was found that the secondary metabolites ofleaves at different ages and developmental stages were significantly different in metabolomics. Firstly, the content of flavonoids, both in the tree leaves and nursery leaves, was presented by a decreasing trend from April to July. While at the same developmental stage, the content in nursery leaves was higher than that in tree leaves. Secondly, the content of terpene lactones in tree leaves was presented by a slightly increasing trend from April to July, however, a slightly decreasing trend in nursery leaves. While at the same development stage, the content in nursery leaves was higher than that in tree leaves. Then analyzed in the transcriptome, the growth status of old leaves was similar with the nursery leaves in germination stage, and there was a relatively large change in the gene expressions of old leaves and nursery leaves in May, June and July. After screening out 49 candidate genes related to terpenoid synthesis and analyzing them, it was found that the expression of tree leaves in mevalonate (MVA) pathway pathway was higher than that in nursery leaves; The later was higher than the former in methylerythritol 4-phosphate (MEP) pathway.The nursery leaves have a higher content of medicinal active ingredients than tree leaves, which are suitable as medicinal materials. The terpenoid synthesis pathway inleaves may mainly depend on the MEP pathway, and the expression levels of related genes and metabolic components are mutually proven.
L.; transcription; sequencing; metabolic group; terpenoids
R286.12
A
0253 - 2670(2022)04 - 1138 - 10
10.7501/j.issn.0253-2670.2022.04.022
2021-08-06
上海市國資委企業(yè)技術(shù)創(chuàng)新和能級提升項(xiàng)目(2018010)
劉志強(qiáng),男,碩士研究生,研究方向?yàn)橹兴巹?chuàng)新及其產(chǎn)業(yè)化發(fā)展。E-mail: 546895057@qq.com
高 崎,男,碩士生導(dǎo)師,教授,研究方向?yàn)橹兴巹?chuàng)新及其產(chǎn)業(yè)化發(fā)展。E-mail: gaoqi@xingling.com.cn
[責(zé)任編輯 時(shí)圣明]