胡賽文,丁怡寧,畢光耀,李翠翠,蘇 春,竇利軍,李賀敏,夏 至*
? 藥材與資源?
藥用植物萹蓄葉綠體基因組特征與系統(tǒng)進(jìn)化分析
胡賽文1,丁怡寧1,畢光耀1,李翠翠1,蘇 春2,竇利軍3,李賀敏1,夏 至1*
1.河南農(nóng)業(yè)大學(xué)農(nóng)學(xué)院,河南 鄭州 450002 2.西北農(nóng)林科技大學(xué)生命科學(xué)院,陜西 楊凌 712100 3.河南省信陽(yáng)生態(tài)環(huán)境監(jiān)測(cè)中心,河南 信陽(yáng) 464000
以藥用植物萹蓄為材料,利用高通量技術(shù)測(cè)定基因組DNA序列,對(duì)葉綠體基因組進(jìn)行組裝和序列分析,為進(jìn)一步開展藥用植物萹蓄的群體遺傳學(xué)和遺傳多樣性研究奠定基礎(chǔ)。利用華大MGISEQ-2000PE150測(cè)序平臺(tái),雙末端測(cè)序策略對(duì)其全基因組DNA建庫(kù)測(cè)序,測(cè)定萹蓄的基因組DNA序列,用NOVO Plasty組裝葉綠體基因組,采用最大似然法(maximum likelihood,ML)構(gòu)建系統(tǒng)進(jìn)化樹。萹蓄葉綠體基因組全長(zhǎng)為163 461 bp,GC值37.5%,具1個(gè)典型的四分區(qū)域結(jié)構(gòu),包括1個(gè)大單拷貝區(qū)(large single copy region,LSC)、1對(duì)反向重復(fù)區(qū)(inverted repeats,IR)和1個(gè)短單拷貝區(qū)(small single copy,SSC),序列長(zhǎng)度分別為88 023、31 066、13 306 bp。萹蓄的葉綠體基因組共有130個(gè)基因,其中編碼蛋白基因、rRNA基因與tRNA基因的數(shù)量分別為83、8、37個(gè)。系統(tǒng)進(jìn)化分析表明,萹蓄與木蓼屬的額河木蓼構(gòu)成一單系分支,具有100%支持率。萹蓄隸屬于蓼科的蓼屬,與木蓼屬的額河木蓼親緣關(guān)系較近。萹蓄葉綠體基因組的組裝、序列特征、間隔區(qū)的篩選及系統(tǒng)進(jìn)化分析為后續(xù)開展群體遺傳學(xué)和遺傳多樣性研究奠定基礎(chǔ)。
萹蓄;蓼屬;葉綠體全基因組;組裝;系統(tǒng)發(fā)育
藥用植物萹蓄L.隸屬于蓼科(Polygonaceae)蓼屬L.,為一年生或多年生草本,主要分布在我國(guó)的河南、浙江、山東、河北、吉林等地[1-2]。萹蓄始載于《神農(nóng)本草經(jīng)》, 全草皆可入藥[3],臨床多用于治療泌尿系統(tǒng)感染、腎炎、細(xì)菌性痢疾、非胰島素依賴性糖尿病、結(jié)石等疾病[4-6]?!吨袊?guó)藥典》2020年版規(guī)定萹蓄有效成分為楊梅苷(含量不得少于0.030%)[3]。此外,中藥材萹蓄還含有豐富的化學(xué)成分,主要包括黃酮類、酚酸類、苯丙素類等[7]?,F(xiàn)代藥理學(xué)研究表明萹蓄具有利尿、降壓、抑菌、抗氧化[8]和保肝等諸多的藥理作用,臨床應(yīng)用十分廣泛。目前,有關(guān)藥用植物萹蓄的研究主要集中在化學(xué)成分分析和藥理學(xué)研究等方面,該植物葉綠體基因組組裝、基因組特征和系統(tǒng)進(jìn)化分析等未見報(bào)道。
葉綠體不僅是綠色植物光合作用的重要場(chǎng)所、也是綠色植物最重要的細(xì)胞器之一。它利用太陽(yáng)能和二氧化碳轉(zhuǎn)換成化學(xué)能與氧氣,維持地球生態(tài)平衡[9]、參與環(huán)境信號(hào)的響應(yīng),在逆境響應(yīng)中也起著重要作用[10]。葉綠體具有一整套用于光合作用、能量代謝、蛋白質(zhì)合成及氮、硫同化相關(guān)的基因,分布在大小為120~180 kb的環(huán)狀基因組上,具有結(jié)構(gòu)保守,母性遺傳等特點(diǎn)[11-12]。葉綠體基因組一般為閉環(huán)雙鏈DNA結(jié)構(gòu),陸生植物的葉綠體基因組結(jié)構(gòu)通常由1個(gè)大單拷貝區(qū)域(large single copy,LSC)、1個(gè)短單拷貝區(qū)域(small single copy,SSC)和2個(gè)反向重復(fù)區(qū)域(inverted repeat,IR)組成[13]。葉綠體基因組擁有相對(duì)獨(dú)立的基因組和遺傳序列,并且不像核基因組一般有著復(fù)雜的重復(fù)序列,其基因序列保守,間隔區(qū)變異位點(diǎn)豐富,適宜的進(jìn)化速率[14]能夠?yàn)橹参锊煌燃?jí)的親緣關(guān)系,系統(tǒng)進(jìn)化關(guān)系及遺傳多樣性研究提供較為可靠的信息[15]。
近年來,隨著測(cè)序技術(shù)的不斷改進(jìn),測(cè)序平臺(tái)的不斷升級(jí),一系列組裝和注釋軟件如plasmidSPAdes[16]、NOVOPlasty[17]、GetOrganelle[18]等的開發(fā)與更新,多種重要的藥用植物葉綠體基因組已完成測(cè)序和分析,如丹參Bunge[19]、人參C.A.Mey[20]、三七(Burkill) F.H.Chen ex C.Chow & W.G.Huang[21]、粗莖秦艽Duthie ex Burk[22]、曼陀羅L.[23]、五味子(Turcz.) Baill[24]、鐵皮石斛Kimura et Migo[25]和三葉崖爬藤Diels & Gilg[26]等。本研究以藥用植物萹蓄為材料,利用高通量測(cè)序方法測(cè)定萹蓄基因組DNA序列,并對(duì)該植物的葉綠體基因組進(jìn)行組裝和注釋。進(jìn)而分析萹蓄葉綠體基因組序列特征,IR邊界特征,間隔區(qū)信息位點(diǎn)的特征,并對(duì)萹蓄及其近緣19種植物的葉綠體基因組序列進(jìn)行系統(tǒng)發(fā)育分析,驗(yàn)證其在科級(jí)系統(tǒng)發(fā)育中的位置,為藥用植物萹蓄的種質(zhì)資源的鑒定、開發(fā)和利用提供一定的理論依據(jù)。
萹蓄新鮮葉片釆集于河南省新鄉(xiāng)市原陽(yáng)縣小吳莊村河南農(nóng)業(yè)大學(xué)科教園區(qū)(35°6′32″N,113°56′34″E),由河南農(nóng)業(yè)大學(xué)生命科學(xué)院李家美教授和農(nóng)學(xué)院中藥材系夏至教授鑒定為蓼科植物萹蓄L.,憑證標(biāo)本保存于河南農(nóng)業(yè)大學(xué)標(biāo)本館,憑證標(biāo)本號(hào)為XZ-2020-11。葉片裝入取樣袋后帶回實(shí)驗(yàn)室,用無(wú)菌水沖洗數(shù)次,晾干后置于?80 ℃冰箱備用。萹蓄及其近緣物種葉綠體基因組序列來源于NCBI數(shù)據(jù)庫(kù),實(shí)驗(yàn)材料詳細(xì)信息見表1。
表1 植物樣品來源
Table 1 Plant samples used in this study
物種來源GenBank登錄號(hào) Afrobrunni chiaerecta (Asch.) Hutch.NCBIMH286316 額河木蓼Atraphaxis irtyschensis Yang et HanNCBIMG878984 吉木乃沙拐棗Calligonum jeminaicum Z.M.MaoNCBIMN202608 泡果沙拐棗C.junceum FlourNCBIMK854997 金蕎麥Fagopyrum dibotrys (D.Don) HaraNCBIMF491390 蕎麥Fagopyrum esculentum Moench.NCBINC 010776 何首烏Fallopia multiflora Thunb.NCBIMK330002 Fallopia sachalinensis (F.Schmidt) RonseNCBINC 047446 Muehlenbeckia australis (Forst.f.) CausedNCBIMG604297 山蓼Oxyria digyna (L.) HillNCBIMN564931 中華山蓼O.sinensis Hemsl.NCBIKX774248 萹蓄Polygonum aviculare Linn.var.vegetum Ledeb.河南原陽(yáng)MW044669 虎杖Reynoutria japonica Houtt.NCBIMT301955 波葉大黃Rheum franzenbachii Munt.NCBIMN564923 掌葉大黃Rheum palmatum L.NCBINC 027728 小大黃Rheum mpumilum L.NCBIMN564927 皺葉酸模Rumex crispus L.NCBIMN055629 羊蹄Rumex japonicus Houtt.NCBIMN720269 Symmeria paniculate Benth.NCBIMH286353 藍(lán)花丹Plumbago auriculata Lam.NCBIMH286308
采用北京天根生化植物DNA提取試劑盒(Tiangen Biotech Co.,中國(guó))提取樣品萹蓄新鮮葉片的總DNA,利用1%的瓊脂糖凝膠電泳檢測(cè)DNA完整性。樣品送至華大生物科技公司(北京)后,使用NanoDrop2000微量分光光度計(jì)(Thermo Scientific,美國(guó))檢測(cè)總DNA的純度和濃度。MGISEQ-2000 PE150測(cè)序平臺(tái)測(cè)序,測(cè)序完成后,利用華大自主開發(fā)的過濾軟件SOAPnuke過濾參數(shù),過濾步驟為(1)過濾接頭:測(cè)序read匹配上adapter序列的25%或者以上則刪除整條read;(2)過濾低質(zhì)量數(shù)據(jù):如果測(cè)序read中質(zhì)量值低于20的堿基占整條read的30%或者以上則刪除整條read;(3)去N:如果測(cè)序read中N含量占整條read的1%或者以上,則刪除整條read。(4)獲得Clean reads。數(shù)據(jù)以FASTQ格式儲(chǔ)存,用于后續(xù)的拼接和注釋。
葉綠體基因組的拼接釆用NOVOPlasty[17]程序,插入片段大小設(shè)為150 bp。過濾后的reads用Geneious 11.0.3[27]拼接軟件組裝成重疊群,并對(duì)組裝中的簡(jiǎn)并堿基,進(jìn)行人工修正。利用Geneq-Annotation of Organellar(https://chlorobox.mpimp golm.mpg.de/geseq.html),結(jié)合NCBI上已報(bào)道的何首烏(GenBank登錄號(hào):MK330002)注釋結(jié)果對(duì)萹蓄葉綠體全基因組進(jìn)行基因注釋,參數(shù)為默認(rèn)值,最后進(jìn)行手動(dòng)調(diào)整。tRNA用ANAGORNV1.2.38(https://chlorobox.mpimpgolm.mpg.de/geseq.html)預(yù)測(cè)。注釋完成后,使用Geneious11.0.3[27]生成GenBank格式的文件,并提交到GeneBank(https://www.ncbi.nlm.nih.gov /genbank/),登錄號(hào)為MW044669。利用在線工具OGDRAW-DRAW Organelle Genome Maps(https:// chlorobox.mpimp-golm.mpg.de/OGDraw.html)繪制葉綠體結(jié)構(gòu)圖。
IR區(qū)域在葉綠體基因中具有高度保守性,但是IR/SC邊界區(qū)域仍存在細(xì)微的變化,IR邊界的膨脹和收縮被認(rèn)為是被子植物葉綠體全基因組大小變化的主要機(jī)制[28]。在植物進(jìn)化過程中,IR/SC邊界不同程度的擴(kuò)張和收縮導(dǎo)致了邊界和基因組長(zhǎng)度的多樣性[29]。本研究使用Geneioous 11.0.3[27]軟件獲得蓼科7個(gè)屬7種植物葉綠體基因組的IRA/IRB、LSC和SSC和邊界基因的序列長(zhǎng)度,進(jìn)行比較分析,探討蓼科植物葉綠體基因組IR邊界的收縮和擴(kuò)張?zhí)卣?。使用Adobe illustrator軟件繪制7種蓼科植物葉綠體基因組IR邊界對(duì)比圖。
相比葉綠體基因編碼區(qū),葉綠體基因間隔區(qū)在近緣物種間往往具有更高的變異位點(diǎn),通常被用來構(gòu)建屬間、屬內(nèi)種間物種系統(tǒng)進(jìn)化發(fā)育關(guān)系。本研究基于蓼科已注釋的11個(gè)屬17種植物的葉綠體基因組序列特征,利用phylosuite vl.2.1[30]提取17個(gè)物種葉綠體基因組32個(gè)共有的間隔區(qū),利用MAFFT[31]進(jìn)行多重比對(duì)。統(tǒng)計(jì)這些間隔區(qū)的信息位點(diǎn)百分率,為下一步構(gòu)建蓼科屬級(jí)以下物種系統(tǒng)進(jìn)化關(guān)系提供分子標(biāo)記。
從NCBI數(shù)據(jù)庫(kù)選取已公開發(fā)布的19個(gè)蓼科物種葉綠體基因組數(shù)據(jù)(表1),同時(shí)以近緣的白花丹科(Plumbaginaceae)藍(lán)花丹L.為外類群,利用phylosuite vl.2.1[30]軟件基于MAFFT[31]進(jìn)行多重比對(duì)。系統(tǒng)發(fā)育分析采用最大似然法(maximum likelihood,ML),利用CIPRES Science Gateway服務(wù)器(http://www.phylo.org/)中RaxML-HPC2 7.6.3軟件(Stamatakis 2006)構(gòu)建系統(tǒng)發(fā)育樹。利用Bootstrap(BS)(1000次重復(fù))檢驗(yàn)各分支的支持率。系統(tǒng)發(fā)育樹導(dǎo)出后利用FigTree version1.4.2查看。
測(cè)序結(jié)果去除接頭和低質(zhì)量的數(shù)據(jù)后,共獲得2.32 Gb原始數(shù)據(jù),原始reads為15 471 394條,Q20達(dá)97.86%。組裝和注釋后得到萹蓄的葉綠體基因組。結(jié)果表明,萹蓄為共價(jià)閉合的雙鏈環(huán)狀分子(圖1),全長(zhǎng)為163 461 bp,GC值35.6%,是一個(gè)典型的4分區(qū)域結(jié)構(gòu),包括1個(gè)LSC、1對(duì)IR和1個(gè)SSC,它們的長(zhǎng)度分別為88 023、31 066、13 306 bp。IR、LSC和SSC區(qū)域的GC值存在一定的差異,其中,IR區(qū)域的GC值最高(41.3%),LSC(35.5%)和SSC(32.5%)均較低,詳細(xì)信息見表2。
萹蓄葉綠體基因組共包括128個(gè)基因,非重復(fù)基因113個(gè),其中83個(gè)編碼蛋白基因、8個(gè)rRNA基因與37個(gè)tRNA基因。LSC區(qū)包含的基因最多,包括60個(gè)蛋白編碼基因和22個(gè)tRNA基因;SSC區(qū)包括1個(gè)tRNA基因(-)和11個(gè)蛋白編碼基因;所有的rRNA基因、14個(gè)tRNA基因和12個(gè)蛋白編碼基因在IR區(qū)(表2)。其中,蛋白質(zhì)編碼基因中與自我復(fù)制相關(guān)基因除rRNA基因和tRNA基因外(表3),還包括14個(gè)核糖體小亞基基因、10個(gè)核糖體大亞基基因和4個(gè)RNA聚合酶亞基基因;光合作用相關(guān)的基因有46個(gè),包括12個(gè)NADH脫氫酶基因、5個(gè)光合系統(tǒng)I基因、15個(gè)光合系統(tǒng)II基因、6個(gè)細(xì)胞色素復(fù)合物編碼基因、6個(gè)ATP合酶基因、1個(gè)二磷酸核酮糖羧化酶大亞基基因和1個(gè)依賴ATP的蛋白酶單元p基因;此外還有5個(gè)其他功能基因及6個(gè)未知功能基因。在tRNA中-、-、-、-、-、-和-各有2個(gè)拷貝;4個(gè)核糖體RNA均有2個(gè)拷貝,分別位于反向重復(fù)區(qū)IRA和IRB。核糖體蛋白大小亞基編碼的基因中,、、和這3個(gè)基因均有2個(gè)拷貝,其余為1個(gè)拷貝。NADH脫氫酶亞基中的基因及未知功能蛋白基因和的拷貝數(shù)均為2。
LSC和SSC:大單拷貝區(qū)域、小單拷貝區(qū)域;IRA和IRB:2個(gè)反向重復(fù)區(qū)域;內(nèi)圈深色部分:GC含量
表2 萹蓄葉綠體基因組堿基組成及特征
Table 2 Base composition and characteristic of chloroplast genome in P.aviculare
區(qū)域A/%T/%C/%G/%GC/%蛋白編碼基因數(shù)tRNA基因數(shù)rRNA基因數(shù)基因總數(shù)長(zhǎng)度/bp LSC31.632.918.317.335.560220 8288 023 SSC35.632.017.015.432.511 10 1213 306 IRA/IRB30.128.719.721.641.312148 3431 066 總計(jì)31.131.519.118.437.583378128163 461
因19、基因分別橫跨LSC/IRb、SSC/IRb邊界,故未統(tǒng)計(jì)在表2內(nèi)
the19 andF genes across the boundaries of LSC/IRb and SSC/IRb, and they were not listed in table 2
表3 萹蓄葉綠體基因組編碼的基因
Table 3 Encoded genes present in chloroplast genome of P.aviculare
基因分組基因名稱數(shù)量 tRNAtrnH-GUG、trnK-UUUa、trnQ-UUG、trnS-GCU、trnG-UCCa、trnR-UCU、trnC-GCA、trnD-GUC、t rnY-GUA、trnE-UUC、trnT-GGU、trnS-UGA、trnG-GCC、trnfM-CAU、trnS-GGA、trnT-UGU、trnL-UAAa、trnF-GAA、trnV-UACa、trnM-CAU、trnW-CCA、trnP-UGG、trnI-CAUc、trnL-CAAc、trnV-GACc、trnI-GAUac、trnA-UGCac、trnR-ACGc、trnN-GUUc、trnL-UAG37 rRNArrn16c、rrn23c、rrn4.5c、rrn5c8 核糖體蛋白小亞基rps2、rps3、rps4、rps7c、rps8、rpsll、rpsl2ac、rpsl4、rpsl5、rpsl6a、rpsl8、rpsl914 核糖體蛋白大亞基rpl2ac、rpl14、rpl16a、rpl20、rpl22、rpl23、rpl32、rpl33、rpl3610 RNA聚合酶rpoA、rpoB、rpoCla、rpoC24 NADH脫氫酶亞基ndhAa、ndhBac、ndhC、ndhD、ndhE、ndhF、ndhG、ndhH、ndhI、ndhJ、ndhK12 光系統(tǒng)I亞基psaA、psaB、psaC、psaI、psaJ、5 光系統(tǒng)II亞基psbA、psbB、psbC、psbD、psbE、psbF、psbH、psbI、psbJ、psbK、psbL、psbM、psbN、psbT、psbZ15 細(xì)胞色素b/f復(fù)合物亞基petA、petB、petD、petG、petL、petN6 ATP合成酶亞基atpA、atpB、atpE、atpFa、atpH、atpI6 Rubisco大亞基rbcL1 蛋白酶clpPb1 成熟酶matK1 包裹膜蛋白cemA1 乙酰CoA梭化酶亞基accD1 細(xì)胞色素C合成酶ccsA1 翻譯起始因子infA1 未知功能蛋白Ycf1c、ycf2c、ycf3b、ycf46 總計(jì) 130
a和b分別表示含有1個(gè)和2個(gè)內(nèi)含子;c表示含有2個(gè)拷貝基因
a represent one intron, b represent two introns; c represents two copies of the gene
內(nèi)含子在基因表達(dá)調(diào)控中發(fā)揮重要作用,萹蓄葉綠體基因組中有18個(gè)基因有內(nèi)含子。其中,-、、、、、、、、、、、、、和各有1個(gè)內(nèi)含子,而、、具2個(gè)內(nèi)含子。matK基因位于基因內(nèi),整個(gè)編碼區(qū)為內(nèi)含子的一部分,存在序列共用現(xiàn)象;基因的3′端與基因的5′端,基因的3′端與基因的5′端、的3′端與的5′端重疊。
蓼科7個(gè)屬7個(gè)物種葉綠體全基因組的IR-LSC和IR-SSC邊界比較表明,蓼科各屬物種邊界具有高度的保守性,其LSC/IRb邊界(JLB),SSC/IRb邊界(JSB)、SSC/IRa邊界(JSA)和LSC/IRa邊界(JLA)的側(cè)翼基因完全相同,但擴(kuò)張程度存在一定的差異。蓼科7個(gè)物種在JLB邊界全部位于rps19基因內(nèi),中華山蓼、掌葉大黃和何首烏中LSC和IRb區(qū)向rps19基因擴(kuò)張的程度相同,均為171、108 bp。泡果沙拐棗、蕎麥、萹蓄和羊蹄的LSC和IRb區(qū)向rps19的擴(kuò)張程度變異較小,分別為174 bp和108 bp、176 bp和103 bp、172 bp和107 bp、169 bp和110 bp。萹蓄的JLB邊界擴(kuò)張范圍,位于7個(gè)種之內(nèi)。JSB邊界擴(kuò)張范圍顯示,中華山蓼、掌葉大黃、泡果沙拐棗、萹蓄與羊蹄的邊界非常相似,均位于基因內(nèi)部,基因在IRb和SSC區(qū)的擴(kuò)張變異范圍, 分別為95 bp和2134 bp,95 bp和2140 bp,19 bp和2225 bp,64 bp和2186 bp,62 bp和2182 bp。萹蓄的JLB邊界擴(kuò)張范圍,位于7個(gè)種之內(nèi)。但何首烏和蕎麥的基因已全部擴(kuò)張到SSC區(qū)內(nèi)部,距JSB邊界分別為53 bp和196 bp。JSA邊界的擴(kuò)張范圍顯示,其側(cè)翼基因完全相同,均為基因(位于SSC區(qū))和基因(位于IRa區(qū))。其中7個(gè)物種的rps15基因和基因距JSA邊界的堿基長(zhǎng)度范圍變異較大,分別9~267 bp和0~282 bp。萹蓄的JSA邊界擴(kuò)張范圍,位于7個(gè)種之內(nèi)。JLA邊界擴(kuò)張范圍顯示,其側(cè)翼基因完全相同,均為(位于IRa區(qū))和(位于LSC區(qū))2個(gè)基因。其中7個(gè)物種的和2個(gè)基因距JLA邊界堿基長(zhǎng)度范圍變異不大,分別163~207 bp和2~63 bp。萹蓄的JLA邊界擴(kuò)張范圍,位于7個(gè)種之內(nèi)。萹蓄及6個(gè)蓼科植物的葉綠體全基因組邊界圖見圖2。
圖2 萹蓄及6個(gè)蓼科植物的葉綠體全基因組邊界圖
由于虎杖和額河木蓼的葉綠體基因組注釋不完全,除了葉綠體基因組全長(zhǎng)比較分析后,IR區(qū)、SSC區(qū)和LSC區(qū)序列長(zhǎng)度未做分析。葉綠體基因組特征比較分析見表4。萹蓄及蓼科18種近緣植物葉綠體基因組的序列長(zhǎng)度范圍介于158 851~170 974 bp,其中皺葉酸模的葉綠體全基因組的長(zhǎng)度最短(158 851 bp),的葉綠體基因組最長(zhǎng)(170 974 bp)。萹蓄的葉綠體基因組長(zhǎng)度為163 461 bp,介于蓼科19個(gè)物種的葉綠體基因組長(zhǎng)度范圍之內(nèi)。萹蓄及蓼科18種近緣植物葉綠體基因組GC含量的范圍為37.1%~38.3%,其中的GC含量最低(37.1%),的GC含量最高(38.3%)。萹蓄葉綠體基因組的GC含量為37.5%,介于蓼科19個(gè)物種葉綠體基因組GC含量之內(nèi)。利用Geneious 11.0.3分別得到萹蓄及蓼科18種近緣植物的IR區(qū)、LSC區(qū)和SSC區(qū)序列,結(jié)果表明,IR區(qū)的序列長(zhǎng)度范圍介于30 399~34 631 bp,皺葉酸模的IR區(qū)最短(30 399 bp),的IR區(qū)最長(zhǎng)(34 631 bp)。萹蓄I(lǐng)R區(qū)長(zhǎng)度為31 066 bp,介于蓼科19個(gè)物種IR區(qū)長(zhǎng)度范圍之內(nèi)。LSC區(qū)的序列長(zhǎng)度范圍介于84 888~88 340 bp,其中蕎麥LSC區(qū)的序列長(zhǎng)度最短(84 888 bp),何首烏LSC區(qū)的序列長(zhǎng)度最長(zhǎng)(88 340 bp)。萹蓄的LSC區(qū)的序列長(zhǎng)度為88 023 bp,介于蓼科19個(gè)物種LSC區(qū)長(zhǎng)度范圍之內(nèi)。SSC區(qū)的序列長(zhǎng)度范圍介于12 657~13 881 bp。其中,皺葉酸模的SSC最短(12 657 bp),何首烏最長(zhǎng)為(13 881 bp)。萹蓄的SSC區(qū)的序列長(zhǎng)度為13 306 bp,介于蓼科19個(gè)物種SSC區(qū)長(zhǎng)度范圍之內(nèi)。
表4 19種植物葉綠體基因組的特征
Table 4 Chloroplast genome characteristics of 19 plants
物種葉綠體基因組長(zhǎng)度/bpGC值/%LSC長(zhǎng)度/bpSSC長(zhǎng)度/bpIR長(zhǎng)度/bp Afrobrunnichia erecta170 97437.188 05813 65434 631 額和木蓼164 19237.5??? 吉木乃沙拐棗162 53537.588 16013 31930 528 泡果沙拐棗162 45937.588 10713 41630 468 金蕎麥159 91937.985 13413 30930 738 蕎麥159 59938.084 88813 87530 412 何首烏163 77337.588 34013 88130 776 Fallopia sachalinensis163 48537.587 70313 56631 108 Muehlenbeckia australis163 48437.488 16713 48530 916 山蓼160 69837.585 74813 17230 889 中華山蓼160 40437.585 50113 13330 885 萹蓄163 46137.588 02313 30631 066 虎杖163 41037.5??? 波葉大黃161 68837.486 94612 78430 979 掌葉大黃161 54137.386 51813 11130 956 小大黃161 74937.386 99712 81230 970 皺葉酸模158 85137.685 03912 65730 399 羊蹄159 29237.585 02813 00630 629 Symmeria paniculata162 50138.386 92013 43531 073
“?”代表GenBank注釋缺失,不完全
“?”represent GenBank annotation missing
基于蓼科11個(gè)屬17種植物(虎杖和未統(tǒng)計(jì)在內(nèi))的32個(gè)葉綠體基因組間隔區(qū)信息序列特征統(tǒng)計(jì)表明(表5),在32個(gè)葉綠體基因間隔區(qū)中,變異位點(diǎn)百分率變化范圍為2.2%~23.4%,最高的為psbK-psbI基因間隔區(qū),其變異位點(diǎn)百分率為23.4%。超過20%有8個(gè),分別為ndhE-ndhG、psaJ-rpl33、psbK-psbI、rpl33-rps18、rps16-trnQ-UUG、trnE-UUC-trnT- GGU、trnF-GAA-ndhJ、trnT-GGU-psbD。這些變異位點(diǎn)百分率較高的葉綠體基因間隔區(qū),能提供足夠多的信息位點(diǎn),為蓼科屬間和種間物種進(jìn)化關(guān)系及分子鑒定提供較高的分辨率。
表5 蓼科植物17個(gè)物種的32個(gè)葉綠體基因間隔區(qū)矩陣位點(diǎn)信息
Table 5 Information of 32 chloroplast intergenic region in 17 species of Polygonaceae
基因間隔區(qū)信息位點(diǎn)/%非信息位點(diǎn)/%一致位點(diǎn)/%基因間隔區(qū)信息位點(diǎn)/%非信息位點(diǎn)/%一致位點(diǎn)/% accD-psaI18.610.770.7rps7-trnV-GAC 4.3 2.093.7 atpF-atpH15.0 7.977.1rps16-trnQ-UUG21.112.866.1 atpH-atpI18.611.569.9rrn4.5-rrn513.5 1.984.6 clpP-psbB16.1 7.376.6rrn5-trnR-ACG 8.2 2.889.0 ndhB-rps7 2.2 2.095.8trnC-GCA-petN17.011.072.0 ndhC-trnV-UAC12.410.377.3trnD-GUC-trnY-GUA19.2 7.673.2 ndhE-ndhG20.720.458.9trnE-UUC-trnT-GGU20.813.266.0 petA-psbJ16.2 8.974.9trnF-GAA-ndhJ20.1 9.370.6 petB-petD 9.9 8.881.3trnL-CAA-ndhB 6.9 2.890.3 petN-psbM19.3 9.271.5trnL-UAA-trnF-GAA19.5 6.873.7 psaJ-rpl3323.013.963.1trnN-GUU-ycf1 7.9 4.887.3 psbE-petL19.0 8.972.1trnP-UGG-psaJ15.414.969.7 psbK-psbI23.4 9.067.6trnQ-UUG-psbK13.0 9.977.1 psbM-trnD-GUC17.112.470.5trnR-ACG-trnN-GUU 6.0 3.190.9 rpl33-rps1820.216.563.3trnT-GGU-psbD20.911.367.8 rpoB-trnC-GCA19.312.168.6ycf2-trnL-CAA 3.7 2.693.7
葉綠體基因組序列用進(jìn)行多重比對(duì)后,矩陣長(zhǎng)221 423 bp,其中信息位點(diǎn)20 235 bp(9.1%),非信息位點(diǎn)22 977 bp(10.4%),一致位點(diǎn)178 211 bp(80.5%),利用最大似然法和貝葉斯法構(gòu)建萹蓄及18種蓼科植物葉綠體全基因組的系統(tǒng)發(fā)育樹(圖3)。系統(tǒng)發(fā)育樹結(jié)果顯示,蓼科植物除國(guó)外分布的2個(gè)屬和,位于系統(tǒng)樹基部位置。其余的取樣類群可以分為3個(gè)主要分支,分支A僅包括蕎麥屬2個(gè)種構(gòu)成單系分支,具有100%支持率。分支B包括3個(gè)屬,大黃屬、山蓼屬、酸模屬構(gòu)成單系分支具有100%,分支B內(nèi)這3個(gè)屬的單系性都得到100%支持率。分支C包括6個(gè)屬,虎杖屬、木蓼屬、沙拐棗屬、、何首烏屬、蓼屬構(gòu)成單系分支具有74%支持率。分支C內(nèi),沙拐棗屬的單系性都得到100%支持率。萹蓄與額河木蓼聚在一支具有100%支持率。何首烏屬與虎杖屬聚在一支,具有100%支持率。
圖3 基于葉綠體全基因組構(gòu)建的系統(tǒng)發(fā)育樹
萹蓄作為我國(guó)傳統(tǒng)的藥材之一,具有重要的藥用和經(jīng)濟(jì)價(jià)值。本研究完成了藥用植物萹蓄葉綠體基因組的測(cè)序、組裝與注釋。對(duì)比萹蓄與蓼科其他19個(gè)物種的葉綠體基因組分析結(jié)果表明,萹蓄葉綠體基因組具有典型的4分區(qū)域結(jié)構(gòu),包括1個(gè)LSC區(qū)、1對(duì)IR區(qū)和1個(gè)SSC區(qū),其葉綠體基因組長(zhǎng)度位于蓼科物種葉綠體基因組長(zhǎng)度范圍之內(nèi)。被子植物中除部分列當(dāng)科和蘭科寄生植物的葉綠體基因組較短外,如[32](葉綠體基因組全長(zhǎng)70 028 bp),天麻[33](葉綠體基因組全長(zhǎng)35 304 bp)等,常見的葉綠體基因組大小為120~180 kb,共編碼100~200個(gè)基因,包括70~80個(gè)蛋白質(zhì)編碼基因,30~32個(gè)tRNA基因,4個(gè)rRNA基因[34]。此外,除部分列當(dāng)科和蘭科寄生植物的葉綠體基因組部分基因發(fā)生丟失,具有較快的進(jìn)化速率外,大多數(shù)植物的葉綠體基因組結(jié)構(gòu)和序列相當(dāng)保守,重復(fù)片段較少[33]。萹蓄與蓼科其他6個(gè)屬植物的葉綠體基因組IR邊界均具有高度的保守性,其LSC/IRb邊界(JLB),SSC/IRb邊界(JSB)、SSC/IRa邊界(JSA)和LSC/IRa邊界(JLA)的側(cè)翼基因完全相同。且萹蓄的葉綠體基因組各邊界的擴(kuò)張范圍,均位于蓼科物種葉綠體基因組IR邊界的擴(kuò)張范圍之內(nèi)。這表明在蓼科,萹蓄與其他物種的葉綠體基因組均具有較高保守性,適合用來解決屬級(jí)以上分類等級(jí)的系統(tǒng)發(fā)育關(guān)系。
相對(duì)于葉綠體基因組編碼區(qū)基因具有較高的保守性,葉綠體基因組的基因間隔區(qū)往往具有豐富的變異位點(diǎn),本研究比較分析了蓼科17個(gè)物種的葉綠體基因組中32個(gè)基因間隔區(qū),發(fā)現(xiàn)間隔區(qū)序列提供變異位點(diǎn)超過20%以上共計(jì)有8個(gè),分別是ndhE-ndhG、psaJ-rpl33、psbK-psbI、rpl33-rps18、rps16-trnQ-UUG、trnE-UUC-trnT-GGU、trnF- GAA-ndhJ、trnT-GGU-psbD。這些基因間隔區(qū)在蓼科的屬間和種間提供了豐富的信息位點(diǎn)。由于葉綠體基因組在大多數(shù)被子植物中為母系遺傳,重組率低,核苷酸置換率適中[35],進(jìn)一步結(jié)合雙親遺傳的核基因片段聯(lián)合分析,為蓼科植物屬下大范圍的物種鑒定,雜交起源,多倍體物種的形成和系統(tǒng)進(jìn)化分析提供可靠的分子標(biāo)記片段。
為進(jìn)一步界定藥用植物萹蓄在蓼科的系統(tǒng)位置,基于蓼科19個(gè)物種葉綠體基因組全長(zhǎng)構(gòu)建的系統(tǒng)發(fā)育樹結(jié)果表明,除國(guó)外分布的2個(gè)種和,其余的17物種分別聚在3個(gè)不同分支內(nèi)。萹蓄位于分支C內(nèi),與木蓼屬的額河木蓼親緣關(guān)系最近,二者構(gòu)成一單系分支具有100%的支持率,形態(tài)特征也支持這2個(gè)種所在蓼屬和木蓼屬親緣關(guān)系較近,二者均具有莖直立,花被片五枚,柱頭片狀,瘦果具翅等特征[1]。該分支內(nèi),虎杖屬與何首烏屬親緣關(guān)系較近,二者構(gòu)成一單系分支,具有100%支持率。分支B主要包括酸模族的3個(gè)屬大黃屬、酸模屬和山蓼屬,葉綠體全基因組的系統(tǒng)發(fā)育樹支持酸模族的單系性,具有100%的支持率,形態(tài)學(xué)特征顯示該族具有花被片4~6枚,雄蕊6~9枚,瘦果具3棱等特征[1]。大黃屬,酸模屬和山蓼屬的各自單系性也得到100%的支持率。分支A主要由蕎麥屬的2個(gè)種構(gòu)成,也組成一單系群,具有100%的支持率。本研究基于葉綠體基因組數(shù)據(jù)表明,萹蓄隸屬于蓼科的蓼屬,與木蓼屬的額河木蓼親緣關(guān)系較近。
近年來,隨著新一代測(cè)序技術(shù)和生物信息學(xué)的快速發(fā)展,越來越多的藥用植物物種的葉綠體基因組被報(bào)道。葉綠體基因組作為超級(jí)條形碼或基于葉綠體基因測(cè)序分析篩選DNA片段顯示出巨大的物種識(shí)別潛力,特別是在物種親緣關(guān)系較近的物種間[36]。本研究首次報(bào)道了蓼科中藥材萹蓄的葉綠體全基因組,綜合分析蓼科藥用植物如大黃、何首烏和虎杖等的葉綠體基因組序列,結(jié)構(gòu)和特征,篩選一批葉綠體基因組的間隔區(qū)。這為蓼科藥用植物的分子鑒定,種質(zhì)資源保護(hù),系統(tǒng)進(jìn)化關(guān)系及遺傳多樣性研究奠定基礎(chǔ)。
利益沖突 所有作者均聲明不存在利益沖突
[1] 中國(guó)科學(xué)院中國(guó)植物志編輯委員會(huì).中國(guó)植物志(第17卷)[M].北京: 科學(xué)出版社, 1994: 126.
[2] 國(guó)家中醫(yī)藥管理局《中華本草》編委會(huì).中華本草-2 [M].上海: 上海科學(xué)技術(shù)出版社, 1999: 639.
[3] 中國(guó)藥典 [S].一部.2020: 348.
[4] 王桂芝, 胡海濤, 董鵬達(dá), 等.中藥萹蓄的研究現(xiàn)狀 [J].黑龍江醫(yī)藥, 2010, 23(4): 614-616.
[5] 趙愛華, 趙勤實(shí), 林中文, 等.萹蓄的化學(xué)成分研究 [J].天然產(chǎn)物研究與開發(fā), 2002, 14(5): 29-32.
[6] 湯迎爽, 宋紅儒, 楊麗甲.萹蓄的研究進(jìn)展 [J].時(shí)珍國(guó)醫(yī)國(guó)藥, 2004, 15(1): 54.
[7] 李曼曼, 劉增輝, 王海燕, 等.萹蓄抑菌活性及化學(xué)成分研究 [J].天然產(chǎn)物研究與開發(fā), 2014, 26(4): 526-530.
[8] 鄭澤生, 楊愛梅, 張富祿, 等.萹蓄草提取物的抗氧化和抑菌活性研究 [J].中醫(yī)藥學(xué)報(bào), 2019, 47(5): 55-58.
[9] Daniell H, Lin C S, Yu M,.Chloroplast genomes: Diversity, evolution, and applications in genetic engineering [J]., 2016, 17(1): 134.
[10] Pogson B J, Ganguly D, Albrecht-Borth V.Insights into chloroplast biogenesis and development [J]., 2015, 1847(9): 1017-1024.
[11] Twyford A D, Ness R W.Strategies for complete plastid genome sequencing [J]., 2017, 17(5): 858-868.
[12] Yu X Y, Zuo L H, Lu D D,.Comparative analysis of chloroplast genomes of fivespecies: Genome comparative and evolution analysis [J]., 2019, 689: 141-151.
[13] Zhang F J, Wang T, Shu X C,.Complete chloroplast genomes and comparative analyses of,, and(Amaryllidaceae) [J]., 2020, 21(16): 5729.
[14] 邢少辰, CLARKE JIHONG LIU.葉綠體基因組研究進(jìn)展 [J].生物化學(xué)與生物物理進(jìn)展, 2008, 35(1): 21-28.
[15] 張靖雯, 姜在民, 蔡靖.紫丁香與羽葉丁香葉綠體DNA提取方法研究 [J].西北林學(xué)院學(xué)報(bào), 2018, 33(4): 95-99.
[16] Antipov D, Hartwick N, Shen M,.plasmidSPAdes: Assembling plasmids from whole genome sequencing data [J]., 2016, 32(22): 3380-3387.
[17] Dierckxsens N, Mardulyn P, Smits G.NOVOPlasty: De novo assembly of organelle genomes from whole genome data [J]., 2017, 45(4): e18.
[18] Jin J J, Yu W B, Yang J B,.GetOrganelle: A fast and versatile toolkit for accurate de novo assembly of organelle genomes [J]., 2020, 21(1): 241.
[19] Qian J, Song J Y, Gao H H,.The complete chloroplast genome sequence of the medicinal plant[J]., 2013, 8(2): e57607.
[20] Zhao Y B, Yin J L, Guo H Y,.The complete chloroplast genome provides insight into the evolution and polymorphism of[J]., 2015, 5: 696.
[21] 宋菊, 龍?jiān)录t, 林麗梅, 等.五加科植物葉綠體基因組結(jié)構(gòu)與進(jìn)化分析 [J].中草藥, 2017, 48(24): 5070-5075.
[22] 董博然, 趙志禮, 倪梁紅, 等.龍膽科葉綠體基因組結(jié)構(gòu)特征及其藥用植物鑒定意義 [J].中草藥, 2020, 51(6): 1641-1649.
[23] Yang Y, Dang Y Y, Li Q,.Complete chloroplast genome sequence of poisonous and medicinal plant: Organizations and implications for genetic engineering [J]., 2014, 9(11): e110656.
[24] 郭豪杰, 劉久石, 羅麗, 等.五味子葉綠體基因組結(jié)構(gòu)解析與比較分析 [J].中國(guó)科學(xué): 生命科學(xué), 2017, 47(7): 728-739.
[25] Biswal D, Konhar R, Debnath M,.Chloroplast genome sequence annotation of(Asparagales: Orchidaceae), an endangered medicinal orchid from northeast India [J]., 2017, 19: 1-8.
[26] 蔣明, 王軍峰, 應(yīng)夢(mèng)豪, 等.三葉崖爬藤葉綠體基因組的組裝與序列分析 [J].中草藥, 2020, 51(2): 461-468.
[27] Kearse M, Moir R, Wilson A,.Geneious Basic: An integrated and extendable desktop software platform for the organization and analysis of sequence data [J]., 2012, 28(12): 1647-1649.
[28] Wang W B, Yu H, Wang J H,.The complete chloroplast genome sequences of the medicinal plant(Oleaceae) [J]., 2017, 18(11): 2288.
[29] Dong W L, Wang R N, Zhang N Y,.Molecular evolution of chloroplast genomes of orchid species: Insights into phylogenetic relationship and adaptive evolution [J]., 2018, 19(3): 716.
[30] Zhang D, Gao F L, Jakovli? I,.PhyloSuite: An integrated and scalable desktop platform for streamlined molecular sequence data management and evolutionary phylogenetics studies [J]., 2020, 20(1): 348-355.
[31] Katoh K, Standley D M.MAFFT multiple sequence alignment software version 7: Improvements in performance and usability [J]., 2013, 30(4): 772-780.
[32] Wolfe K H, Morden C W, Palmer J D.Function and evolution of a minimal plastid genome from a nonphotosynthetic parasitic plant [J]., 1992, 89(22): 10648-10652.
[33] 馬瀟.蘭科質(zhì)體基因組組系統(tǒng)學(xué)研究 [D].北京: 中國(guó)科學(xué)院大學(xué), 2018.
[34] 李巖, 呂光輝, 張雪妮, 等.十字花科植物葉綠體基因組結(jié)構(gòu)及變異分析 [J].西北植物學(xué)報(bào), 2017, 37(6): 1090-1101.
[35] Drouin G, Daoud H, Xia J N.Relative rates of synonymous substitutions in the mitochondrial, chloroplast and nuclear genomes of seed plants [J]., 2008, 49(3): 827-831.
[36] 姜汶君, 郭夢(mèng)月, 龐曉慧.葉綠體基因組在藥用植物鑒定及系統(tǒng)進(jìn)化研究中的應(yīng)用 [J].世界中醫(yī)藥, 2020, 15(5): 702-708.
Characterization and phylogenetic analysis of complete chloroplast genome of medicinal plant
HU Sai-wen1, DING Yi-ning1, BI Guang-yao1, LI Cui-cui1, SU Chun2, DOU Li-jun3, LI He-min1, XIA Zhi1
1.College of Agronomy, Henan Agricultural University, Zhengzhou 450002, China 2.College of Life Sciences, Northwest A&F University, Yangling 712100, China 3.Xinyang Environmental Monitoring Center of of Henan Province, Xinyang 464000, China
The complete chloroplast genome of medicinal plantsequenced by high-throughput technologies was assembled for the sequence analysis to provide evidence for its population genetics and diversity studies.DNA library was constructed forwith the paired-end strategy, and MGISEQ-2000PE150 was used to sequence DNA ofin Beijing Genomics Institute (China).The complete chloroplast genome was assembled using NOVO Plasty software, and sequence analysis was performed based on gene annotation results.Phylogenetic analyses were performed using Maximum-Likelihood (ML) methods.The complete chloroplast genome ofwas 163 461 bp in length with a GC content of 37.5%.The chloroplast genome exhibited a typical quadripartite structure, including a large single copy region (LSC), a pair of inverted repeats (IR), and a small single copy (SSC), and the sequence lengths were 88 023, 31 066 and 13 306 bp.The chloroplast genome harbored 130 genes, including 83 protein-coding genes, eight rRNA genes, and 37 tRNA genes.Phylogenetic analyses result indicated thatwas sister towith bootstrap value of 100%.Our result verified thatbelonged to the Polygonaceae, and it was closely related to.Sequence assembly, sequence features, intergenic region screening and phylogenetic analysis of medicinal plantchloroplast genome provide a basis for its future studies on both population genetics and genetic diversity.
L.;L.; chloroplast genome; assembly; phylogenetic analysis
R286.12
A
0253 - 2670(2022)09 - 2776 - 10
10.7501/j.issn.0253-2670.2022.09.021
2021-10-09
國(guó)家自然科學(xué)基金面上項(xiàng)目(31770370);河南省高等學(xué)校重點(diǎn)科研項(xiàng)目計(jì)劃(18A360006)
胡賽文(1992—),女,碩士,研究方向?yàn)橹兴庂Y源的分子鑒定。
通信作者:夏 至,教授,主要從事中藥資源的分子鑒定及中藥資源可持續(xù)利用研究。E-mail: xiazhiemail@126.com
[責(zé)任編輯 時(shí)圣明]