汪雨 唐露 邵士成 馬長樂 李健 羅艷
摘 要: ???為理解珍稀瀕危蘭科植物龍頭蘭(Pecteilis susannae)和景洪白蝶蘭(P. hawkesiana)的葉綠體基因組的基本特征,開發(fā)用于物種鑒定、保護(hù)遺傳學(xué)和系統(tǒng)發(fā)育分析的分子標(biāo)記,該研究利用二代測序技術(shù)對龍頭蘭和景洪白蝶蘭進(jìn)行淺層基因組測序,采用生物信息學(xué)分析方法進(jìn)行葉綠體基因組的拼接、組裝和注釋,并與其他近緣物種進(jìn)行比較基因組分析和系統(tǒng)發(fā)育分析。結(jié)果表明:(1)龍頭蘭和景洪白蝶蘭的葉綠體基因組大小分別為154 407 bp和153 891 bp,由一對26 550 bp和26 523 bp的反向重復(fù)序列(IR)、84 204 bp和83 756 bp的大單拷貝區(qū)(LSC)、17 103 bp和17 089 bp的小單拷貝區(qū)(SSC)組成;均注釋了111個唯一基因,包括77個蛋白質(zhì)編碼基因、30個tRNA基因和4個rRNA基因。(2)在葉綠體基因組中分別鑒定出94個和92個簡單重復(fù)序列(SSRs)。 (3)二者之間存在706個單核苷酸多態(tài)性(SNPs)位點(diǎn)和152個插入缺失(InDels)位點(diǎn),其中cpInDel 067等可以區(qū)分2個物種。(4)觀察到1個差異較大的基因(accD)和9個高變區(qū)(rps19-psbA、matK-trnQ-UUG、psbM-psbD、trnT-UGU-ndhJ、accD-psaI、ycf4-cemA、clpP-psbB、ndhF-trnL-UAG、rps15-ycf1)。(5)系統(tǒng)發(fā)育分析結(jié)果顯示,龍頭蘭、景洪白蝶蘭和鵝毛玉鳳花(Habenaria dentata)的親緣關(guān)系較近。在白蝶蘭屬2種葉綠體基因組研究中獲得的SSR位點(diǎn)、InDels和高變區(qū)序列可為物種鑒定、開發(fā)利用及其資源保護(hù)提供有價值的遺傳信息。
關(guān)鍵詞: ?龍頭蘭, 景洪白蝶蘭, 葉綠體基因組, 分子標(biāo)記, 系統(tǒng)發(fā)育
中圖分類號: ??Q943
文獻(xiàn)標(biāo)識碼: ???A
文章編號: ??1000-3142(2024)01-0043-13
Comparative analysis of chloroplast genomes of two
rare Pecteilis species (Orchidaceae)
WANG Yu1,2, TANG Lu1, SHAO Shicheng1, MA Changle2,3, LI Jian4, LUO Yan1*
( 1. Centre for Gardening and Horticulture, Xishuangbanna Tropical Botanical Garden, Chinese Academy of Sciences, Mengla 666300, Yunnan,
China; 2. School of Landscape Architecture, Southwest Forestry University, Kunming 650224, China; 3. Southwest Landscape Architecture
Engineering Technology Research Center, State Forestry and Grassland Administration, Kunming 650224, China; 4. Orchid
Conservation & Research Center of Shenzhen and the National Orchid Conservation Center of China, Shenzhen Key
Laboratory for Orchid Conservation and Utilization, Key
Laboratory of National Forestry and Grassland
Administration for Orchid Conservation and
Utilization, Shenzhen 518114, Guangdong, China )
Abstract: ??Pecteilis susannae and P. hawkesiana are rare and endangered species with important medicine and ornament value. However, little is known about the genetic information of these two species. In order to understand the basic characteristics of the chloroplast genome of these two Pecteilis species, and to develop molecular markers for species identification, conservation genetic and phylogenetic analysis, the genome skimming approach using next-generation sequencing methods was used to generate chloroplast DNA sequences in this study. The chloroplast genomes were assembled and annotated by bioinformatics analysis. Simple sequence repeats (SSRs), single nucleotide polymorphisms (SNPs), and insertions and deletions (InDels) were identified. Furthermore, comparative chloroplast genomic and phylogenetic analyses were conducted with closely related species. The results were as follows: (1) The newly sequenced chloroplast genomes of P. susannae and P. hawkesiana were 154 407 bp and 153 891 bp in size. They comprised a pair of 26 550 bp and 26 523 bp inverted repeats (IR) that separated a large 84 204 bp and 83 756 bp single copy region (LSC) and a small 17 103 bp and 17 089 bp single copy region (SSC), respectively. Both chloroplast genomes contained 111 unique genes, including 77 protein-coding genes, 30 tRNA and 4 rRNA genes. (2) Ninety-four simple sequence repeats (SSRs) were identified in the P. susannae chloroplast genome and 92 in that of P. hawkesiana. (3) Comparisons of ?two chloroplast genomes revealed that there were nucleotide variations including 706 single-nucleotide polymorphism sites and 152 InDels between the two Pecteilis species, of which several markers (cpInDel 067) could discriminate the two Pecteilis species. (4) The one most divergent gene (accD) and the nine most divergent intergenic regions (rps19-psbA, matK-trnQ-UUG, psbM-psbD, trnT-UGU-ndhJ, accD-psaI, ycf4-cemA, clpP-psbB, ndhF-trnL-UAG, rps15-ycf1) among genomes were detected. (5) The phylogenetic analysis based on the chloroplast genome sequences revealed that P. susannae, P. hawkesiana and Habenaria dentata are closely related. The molecular markers (SSRs, InDels and hotspots) developed from the chloroplast genomes of two Pecteilis species ?in the present study can be used to identify related species and provide valuable genetic resources in utilizing and conserving natural resources.
Key words: ?Pecteilis susannae, P. hawkesiana, chloroplast genome, molecular markers, phylogeny
白蝶蘭屬(Pecteilis)為地生蘭,隸屬于蘭科(Orchidaceae)紅門蘭亞科(subfamily Orchidoideae)紅門蘭族(tribe Orchideae)紅門蘭亞族(subtribe Orchidinae),全世界約有10種,主要分布于亞洲熱帶至亞熱帶地區(qū)(Jin et al.,2014,2017;Teoh,2021)。長期以來,白蝶蘭屬與紅門蘭亞族的玉鳳花屬(Habenaria)系統(tǒng)發(fā)育關(guān)系不清(Pridgeon et al.,2001)。2個屬在形態(tài)學(xué)方面的關(guān)鍵區(qū)別在于合蕊柱的結(jié)構(gòu):白蝶蘭屬的花藥室具寬的藥隔,柱頭無柄附著在唇瓣基部;玉鳳花屬的花藥室的藥隔較窄,柱頭與唇瓣基部之間形成柱頭枝(stigmaphore)(Wah et al.,2021)。此外,白蝶蘭屬的花通常比玉鳳花屬的大,唇瓣通常有較長的距。但是,根據(jù)最近的分子系統(tǒng)發(fā)育分析,白蝶蘭屬并非單系,嵌于玉鳳花屬中(Jin et al.,2014,2017)。
龍頭蘭(P. susannae)是白蝶蘭屬的模式種,也稱白蝶花,從東喜馬拉雅一直到東南亞和馬來半島都有分布(Wah et al.,2021)。在我國,龍頭蘭廣泛分布于南部和西南部各省區(qū),生長于海拔500~2 500 m的山坡林下開闊地、溝邊和草坡(Wu et al.,2009)。雖然龍頭蘭在我國分布范圍廣,但近年來,生境喪失和過度采挖導(dǎo)致野生種群數(shù)量急劇下降。我國分布的白蝶蘭屬植物還包括滇南白蝶蘭(P. henryi)、狹葉白蝶蘭(P. radiate)和景洪白蝶蘭(P. hawkesiana)。景洪白蝶蘭分布于東南亞熱帶地區(qū),2015年才在我國云南西雙版納自治州發(fā)現(xiàn)有分布,個體數(shù)量極少,非常稀有(Li et al.,2015)。目前,我國白蝶蘭屬植物的野生資源的基礎(chǔ)調(diào)查尚不深入,遺傳信息缺乏,極大地阻礙了對該屬野生資源的保護(hù)和利用。
高等植物的葉綠體基因組(chloroplast genome,cpDNA)較小,通常為典型的環(huán)狀四分體結(jié)構(gòu),由大單拷貝區(qū)(large single copy,LSC)、小單拷貝區(qū)(small single copy,SSC)和2個反向重復(fù)區(qū)(inverted repeats,IRs)構(gòu)成(Ruhlman & Jansen,2014)。目前葉綠體基因組通過高通量的淺層基因組測序(genome skimming)技術(shù)較易獲得(Fu et al.,2022; 黎若竹等,2022)。植物的葉綠體基因組較核基因組更具有保守性和遺傳穩(wěn)定性,進(jìn)化速率適中,不存在基因重組現(xiàn)象等特征,在植物系統(tǒng)發(fā)育研究中得到廣泛應(yīng)用。葉綠體基因組序列揭示了許多基因結(jié)構(gòu)變異,包括簡單重復(fù)序列(simple sequence repeats,SSRs)、單核苷酸多態(tài)性(single nucleotide polymorphisms,SNPs)和插入缺失(insertions and deletions,InDels)等。齊丹等(2018)利用南方梨屬(Pyrus)葉綠體基因組的6個片段發(fā)現(xiàn)秦嶺淮河以南地區(qū)的砂梨和白梨親緣關(guān)系較近,湖南地區(qū)的砂梨遺傳多樣性更豐富。湯晨茜等(2022)比較了陜甘花楸(Sorbus koehneana)和爪瓣花楸(S. unguiculata)的葉綠體基因組,探究二者的系統(tǒng)發(fā)育關(guān)系。陳模舜和楊仲毅(2022)利用26個天臺鵝耳櫪(Carpinus tientaiensis)葉綠體基因組的SNP進(jìn)行分析,揭示天臺鵝耳櫪的遺傳多樣性和譜系分化。植物葉綠體基因組序列經(jīng)常被用作DNA條形碼(DNA barcoding)的分子標(biāo)記進(jìn)行物種鑒別,包括matK、rbcL、psbA-trnH和atpF-atpH等(Kress & Erickson,2007;Lahaye et al.,2008)。李鎮(zhèn)兵等(2022)對3個品種木芙蓉(Hibiscus mutabilis)的葉綠體基因組進(jìn)行分析后認(rèn)為,使用ycf1、ndhB等基因可以對木芙蓉品種間及近緣種間進(jìn)行鑒定。李冉郡等(2022)對大黃(Rheum spp.)藥材基原物種的葉綠體基因組高變區(qū)進(jìn)行特異DNA條形碼開發(fā),可以精準(zhǔn)地鑒別3種大黃。姚輝等(2015)認(rèn)為石斛屬(Dendrobium)的psbK-psbI片段可以作為石斛屬的候選分子標(biāo)記,并成功利用其完成6份樣品的鑒定。潘佳佳(2017)對高變位點(diǎn)進(jìn)行篩選后,成功找到霍山石斛(D. huoshanense)的特異性位點(diǎn),可以高效地將霍山石斛從各種楓斗類石斛產(chǎn)品中分辨出來。
本研究基于二代測序技術(shù)進(jìn)行基因組淺層測序,利用生物信息學(xué)軟件組裝了龍頭蘭和景洪白蝶蘭的葉綠體基因組,詳細(xì)比較了2種白蝶蘭屬葉綠體基因組的結(jié)構(gòu)差異,并與親緣較近的玉鳳花屬植物進(jìn)行比較和系統(tǒng)發(fā)育關(guān)系的分析,擬探討:(1)龍頭蘭和景洪白蝶蘭中的葉綠體基因組中有哪些位點(diǎn)可以作為特征性分子標(biāo)記;(2)葉綠體基因組是否能夠辨析白蝶蘭屬和玉鳳花屬的系統(tǒng)發(fā)育關(guān)系。
1 材料與方法
1.1 試驗(yàn)材料
龍頭蘭和景洪白蝶蘭(圖1)均保存于中國科學(xué)院西雙版納熱帶植物園保育苗圃中(101°46′ E、21°54′ N)。采集2種植物的新鮮葉片放置于硅膠中干燥保存。
1.2 DNA的提取和測序
取干燥后的龍頭蘭和景洪白蝶蘭葉片,放入組織研磨器中充分研磨,按照植物總DNA提取試劑盒Tiangen DNA試劑盒(TIANGEN,中國)說明書使用方法進(jìn)行葉片DNA的提取,并按照Illumina TruSeq文庫制備試劑盒(Illumina,USA)構(gòu)建DNA文庫,測序文庫由上海派森諾生物科技有限公司通過Illumina HiSeq 2500平臺進(jìn)行淺層基因組測序,測序讀長為PE150。
1.3 葉綠體基因組的組裝和注釋
測序所得的原始數(shù)據(jù)經(jīng)fastp軟件(Chen et al.,2018)進(jìn)行過濾,獲得高質(zhì)量的HQ data,之后使用GetOrganelle平臺進(jìn)行葉綠體基因組的組裝(Jin et al.,2020),組裝后獲得的數(shù)據(jù)導(dǎo)入Bandage v0.8.1檢查(Wick et al.,2015),判斷其是否為雙鏈環(huán)狀四分體結(jié)構(gòu)。確認(rèn)組裝所得的數(shù)據(jù)合格可用后,將其分別上傳至GeSeq(Michael et al.,2017)和CPGAVAS2(Shi et al.,2019)平臺進(jìn)行葉綠體基因組注釋。在NCBI(National Center for Biotechnology Information)數(shù)據(jù)庫中檢索蘭科紅門蘭亞族已發(fā)表且注釋的狹葉白蝶蘭(KX871237)、線葉十字蘭(H. linearifolia, NC_059696)和H. cruciformis(NC_059695)作為參考序列,將注釋后獲得的兩組數(shù)據(jù)使用Geneious prime 2022.0.2軟件進(jìn)行人工校正比對。利用Organellar Genome DRAW(Greiner et al.,2019)在線工具繪制龍頭蘭和景洪白蝶蘭的葉綠體基因組圖譜?;蚪M長度、LSC區(qū)長度、SSC區(qū)長度、IR區(qū)長度、GC含量等通過Geneious prime 2022.0.2進(jìn)行統(tǒng)計。
1.4 簡單重復(fù)序列分析
利用MISA程序(Beier et al.,2017)預(yù)測龍頭蘭和景洪白蝶蘭的簡單重復(fù)序列(SSRs),單核苷酸的最小重復(fù)單位設(shè)置為10個,二核苷酸的最小重復(fù)單位設(shè)置為5個,三核苷酸的最小重復(fù)單位設(shè)置為4個,四核苷酸、五核苷酸和六核苷酸的最小重復(fù)單位設(shè)置為3個。
1.5 序列差異分析
使用Geneious prime 2022.0.2的插件MAFFT Alignment將2種白蝶蘭屬的葉綠體基因組序列進(jìn)行比對,通過BioEdit軟件編輯整理,使用DnaSP v6.12.03計算單核苷酸變異(SNPs)和插入缺失(InDels)的數(shù)量,每100 bp計算突變率,并評估2種白蝶蘭屬植物的葉綠體基因組的核苷酸多樣性(Pi)值,當(dāng)Pi值高于0.030 0時,將其定義為高變區(qū)。
1.6 比較基因組分析
從NCBI上下載已公布的1種白蝶蘭屬和3種玉鳳花屬的葉綠體基因組,包括狹葉白蝶蘭、鵝毛玉鳳花(H. dentate,OK012095)、線葉十字蘭、H. cruciformis,與本研究組裝的龍頭蘭和景洪白蝶蘭,利用mVISTA程序(Frazer et al.,2004))對3種白蝶蘭屬和3種玉鳳花屬的葉綠體基因組序列進(jìn)行比較。通過R v4.1.3軟件運(yùn)行IRscope腳本(Amiryousefi et al.,2018),比較6個物種中LSC區(qū)、SSC區(qū)和IR區(qū)的邊界基因。
1.7 系統(tǒng)發(fā)育分析
除了已下載的上述4種白蝶蘭屬和玉鳳花屬植物以外,再從NCBI上下載另外4種已公布的玉鳳花屬植物的葉綠體基因組序列,包括絲瓣玉鳳花(H. fordii,NC_026775)、毛葶玉鳳花(H. ciliolaris,MN495594)、H. chejuensis(NC_046821)、落地金錢(H. aitchisonii,MW316693),以紅門蘭亞族的緣毛鳥足蘭(Satyrium nepalense var. ciliatum,MN497244)為外類群(Jin et al.,2017),將龍頭蘭和景洪白蝶蘭的葉綠體基因組序列與這些近緣物種進(jìn)行系統(tǒng)發(fā)育關(guān)系分析。通過PhyloSuite v1.2.2平臺(Zhang et al.,2020)查找最適模型后使用IQ-TREE構(gòu)建Maximum Likelihood(ML)系統(tǒng)發(fā)育樹。通過FigTree v1.4.0軟件編輯系統(tǒng)發(fā)育樹。
2 結(jié)果與分析
2.1 龍頭蘭和景洪白蝶蘭葉綠體基因組的基本特征
在去除低質(zhì)量reads后,分別得到了龍頭蘭和景洪白蝶蘭3.37 Gb和1.07 Gb的葉綠體基因組序列數(shù)據(jù)。在組裝之后通過Bandage v0.8.1軟件檢查,判斷組裝后的數(shù)據(jù)可用?;蚪M結(jié)構(gòu)為閉合的環(huán)狀四分體結(jié)構(gòu),與典型的被子植物葉綠體基因組結(jié)構(gòu)相同。
2個白蝶蘭屬植物的葉綠體基因組的基因圖譜如圖2所示。龍頭蘭葉綠體基因組全長154 407 bp,包含一對26 550 bp的IR區(qū),由84 204 bp的LSC區(qū)和17 103 bp的SSC區(qū)分開。景洪白蝶蘭葉綠體基因組全長153 891 bp,包含一對26 523 bp的IR區(qū),由83 756 bp的LSC區(qū)和17 089 bp的SSC區(qū)分開(表1)。龍頭蘭葉綠體基因組的GC含量為36.5%,景洪白蝶蘭的GC含量為36.6%,二者都是在IR區(qū)的GC含量最高(43.0%),并且高于基因組的GC含量。龍頭蘭和景洪白蝶蘭的葉綠體基因組均注釋了111個唯一基因(unique genes),包含77個蛋白質(zhì)編碼基因、30個轉(zhuǎn)運(yùn)RNA(tRNA)基因和4個核糖體RNA(rRNA)基因(表2)。其中,18個基因含有1個內(nèi)含子,2個基因(pafI和clpP 1)含有2個內(nèi)含子(表2)。在所有基因中,有19個基因位于反向重復(fù)區(qū)且具有2個拷貝(ndhB、rps7、rps12、rps19、rpl2、rpl23、rrn4.5、rrn5、rrn16、rrn23、trnA-UGC、trnH-GUG、trnI-CAU、trnI-GAU、trnL-CAA、ycf2、trnN-GUU、trnR-ACG和trnV-GAC,表2)。注釋的龍頭蘭和景洪白蝶蘭的葉綠體基因組信息已提交至GenBank上,序列號分別為OP435916和OP435917。
2.2 葉綠體基因組中的簡單重復(fù)序列特征
在龍頭蘭的葉綠體基因組中共檢測到94個SSRs,包括4種類型的SSRs,單核苷酸、二核苷酸、三核苷酸和四核苷酸重復(fù)序列分別為74、16、1、3個,其中54個SSRs位于基因間隔區(qū)(intergenic spacer,IGS)、17個SSRs位于蛋白質(zhì)編碼區(qū)(coding sequence,CDS)、23個SSRs位于內(nèi)含子上(圖3)。在景洪白蝶蘭的葉綠體基因組中共檢測到92個SSRs,包括5種類型的SSRs,單核苷酸、二核苷酸、三核苷酸、四核苷酸和五核苷酸重復(fù)序列分別為72、15、1、3、1個,其中,58個SSRs位于IGS中,15個SSRs位于CDS中,19個SSRs位于內(nèi)含子中(圖3)。在單核苷酸SSRs中,龍頭蘭和景洪白蝶蘭分別有3個和4個C/G型,其余均為A/T型。大多數(shù)二核苷酸SSRs為AT/TA型。這一結(jié)果與葉綠體基因組的SSRs通常由A/T組成而很少包含C/G的觀點(diǎn)一致(Kuang et al.,2011;陳模舜和楊仲毅,2022)。
2.3 葉綠體基因組中的突變和插入缺失
比對2種白蝶蘭屬植物的葉綠體基因組序列,發(fā)現(xiàn)共有706個點(diǎn)突變。其中IR區(qū)、LSC區(qū)、SSC區(qū)發(fā)生點(diǎn)突變次數(shù)分別為48、517、141次(表3)。706個SNPs標(biāo)記中包括259個轉(zhuǎn)換和447個顛換(圖4)。經(jīng)統(tǒng)計發(fā)現(xiàn),在兩條葉綠體基因組序列中,發(fā)生突變頻次最高的區(qū)域?yàn)閮?nèi)含子,每100 bp大約會發(fā)生6.238 53次突變事件。
在2種白蝶蘭屬植物的葉綠體基因組中共檢測到InDels 152個,其中IR區(qū)、LSC區(qū)、SSC區(qū)分別產(chǎn)生了8、131、13個InDels(表3)。內(nèi)含子區(qū)域每100 bp會發(fā)生1.743 12次InDels事件。而蛋白質(zhì)編碼區(qū)相對保守,每100 bp僅發(fā)生0.013 94次。在LSC區(qū)trnL-UAA和trnF-GAA 2個基因之間的序列中發(fā)現(xiàn)了最長的InDels(104 bp)。另外3個較長的InDels也在LSC區(qū),分別位于trnT-GGU和psbD基因之間(84 bp)、ndhC和trnV-UAC基因之間(54 bp)、trnL-UAA基因內(nèi)(50 bp)。這4個較大的InDels可以作為潛在的分子標(biāo)記開發(fā)區(qū)域,用來特異性識別龍頭蘭和景洪白蝶蘭。
2.4 葉綠體基因組序列的核苷酸多樣性
通過計算龍頭蘭和景洪白蝶蘭的葉綠體基因組間的核苷酸多樣性(Pi)值可知,基因間隔區(qū)的Pi值為0~0.053 4(圖5: A),編碼區(qū)的Pi值為0~0.018 9(圖5: B),表明二者的編碼區(qū)序列相對保守。大多數(shù)的高變位點(diǎn)位于LSC區(qū),其次是SSC區(qū),IR區(qū)序列的Pi值較低。在非編碼區(qū)中,petG-trnW-CCA的核苷酸多樣性值最高(Pi=0.053 4),除此之外,還有5個基因間隔區(qū)rps16-trnQ-UUG、rps14-psaB、petD-rpoA、rpl16-rps3、rrn4.5-rrn5(Pi>0.030 0)可視為高變區(qū)。在編碼區(qū)中,psaJ基因的核苷酸多樣性值最高(Pi=0.018 9),以及其他2個基因trnS-GGA(Pi=0.011 5)和rpl32(Pi=0.011 5)的核苷酸多樣性值均大于0.010 0,可視為多樣性較高的基因。這些核苷酸多樣性程度高的基因和基因間隔區(qū)可開發(fā)為潛在的物種鑒定的特異性分子標(biāo)記。
2.5 白蝶蘭屬和玉鳳花屬的基因組比較
筆者將新測序的2種白蝶蘭屬植物與其近緣種狹葉白蝶蘭、鵝毛玉鳳花、線葉十字蘭和H. cruciformis共6個種的葉綠體基因組的邊界基因進(jìn)行了比較分析。葉綠體基因組邊界收縮擴(kuò)張分析顯示(圖6),6個種在LSC/IRb、IRb/SSC、SSC/IRa和IRa/LSC邊界都具有相同的基因,包括rpl22、ndhF、ycf1、rps19和psbA,并且收縮和擴(kuò)張的程度較為相似。Rpl22基因跨LSC/IRb邊界,6個種僅有1 bp之差。ndhF基因跨IRb/SSC邊界,6個種僅有6 bp之差,其中龍頭蘭、景洪白蝶蘭和鵝毛玉鳳花相同,而狹葉白蝶蘭、線葉十字蘭和H. cruciformis相同。ycf1基因跨SSC/IRa邊界,在龍頭蘭和鵝毛玉鳳花中延伸至IR區(qū)993 bp,在景洪白蝶蘭和狹葉白蝶蘭中延伸至IR區(qū)1 002 bp,在線葉十字蘭和H. cruciformis中延伸至IR區(qū)1 032 bp(圖6)。從邊界分析來看,白蝶蘭屬3種和玉鳳花屬3種之間無明顯差異,表明葉綠體基因組結(jié)構(gòu)不支持2個屬的劃分。
以注釋的狹葉白蝶蘭序列為參考序列,利用在線軟件mVISTA分析了6個物種葉綠體基因組的序列差異(圖7)。由圖7可知,6個物種中LSC區(qū)和SSC區(qū)的差異性高于IR區(qū),非編碼區(qū)的差異性高于編碼區(qū)。其中,差異性較大的基因?yàn)閍ccD,差異性較高的區(qū)域有rps19-psbA、matK-trnQ-UUG、psbM-psbD、trnT-UGU-ndhJ、accD-psaI、ycf4-cemA、clpP-psbB、ndhF-trnL-UAG、rps15-ycf1等區(qū)域,可以利用這些區(qū)域,開發(fā)特異性標(biāo)記,進(jìn)行物種鑒定和系統(tǒng)發(fā)育研究。
2.6 系統(tǒng)發(fā)育分析
通過PhyloSuite獲取最適模型為TVM+R2+F,采用此模型構(gòu)建所選白蝶蘭屬和玉鳳花屬的系統(tǒng)發(fā)育樹,以緣毛鳥足蘭作為外類群。由圖8可知,10種白蝶蘭屬和玉鳳花屬植物形成了3個分支,其中絲瓣玉鳳花單獨(dú)分出來為基部分支, 毛葶玉鳳花、H. chejuensis、鵝毛玉鳳花、景洪白蝶蘭、龍頭蘭聚為一個單系分支,而落地金錢、狹葉白蝶蘭、H. cruciformis、線葉十字蘭聚為一個單系分支。龍頭蘭、鵝毛玉鳳花和景洪白蝶蘭則聚為一個亞分支,而后二者形成了姐妹群的關(guān)系,表明三者的親緣關(guān)系較近。2種白蝶蘭屬嵌入玉鳳花屬,表明這2屬從葉綠體基因組構(gòu)建的系統(tǒng)發(fā)育樹上不能分開。
3 討論與結(jié)論
3.1 基因組序列特征比較分析
在蘭科紅門蘭亞族中玉鳳花屬、舌唇蘭屬、鳥足蘭屬(Satyrium)、無柱蘭屬(Amitostigma)、手參屬(Gymnadenia)等屬已有葉綠體基因組的報道,基因組大小為146 754~156 120 bp(Kim et al.,2020)。本文首次報道并解析了紅門亞蘭族中白蝶蘭屬2種的葉綠體基因組的序列特征。龍頭蘭和景洪白蝶蘭的葉綠體基因組結(jié)構(gòu)與大多數(shù)被子植物葉綠體基因組結(jié)構(gòu)相似, 都為典型的環(huán)狀四分體結(jié)構(gòu),它們的長度、基因組結(jié)構(gòu)、基因數(shù)目、GC含量等均與以前報道的紅門蘭族物種的基因組特征相似。已報道的H. cruciformis、狹葉白蝶蘭等物種的葉綠體基因組均編碼了113個唯一基因,包括79個蛋白質(zhì)編碼基因、30個tRNA和4個rRNA,GC含量為36.6%(Kim et al.,2017,2020);在本研究中,龍頭蘭和景洪白蝶蘭都包含111個唯一基因,包括77個蛋白質(zhì)編碼基因、30個tRNA基因和4個rRNA基因,GC含量分別為36.5%和36.6%。在蘭科植物葉綠體基因組中編碼NAD(P)H脫氫酶復(fù)合體的ndh基因截短或丟失的現(xiàn)象較為多見,但在紅門蘭亞科中很少發(fā)生(Kim et al.,2020)。絲瓣玉鳳花的葉綠體基因組中具有11個ndh基因(Lin et al.,2015),本研究中龍頭蘭和景洪白蝶蘭的葉綠體基因組中也包含了完整基因結(jié)構(gòu)的11個ndh基因,沒有截短和丟失的現(xiàn)象。
3.2 特異分子鑒定標(biāo)記的篩選
本研究通過基因組的比較研究,在2種白蝶蘭屬植物中鑒定出的SSRs、InDels和核苷酸序列高變區(qū)等均可作為特異的分子標(biāo)記鑒定物種。本研究發(fā)現(xiàn)龍頭蘭葉綠體基因組中共有94個SSRs,景洪白蝶蘭葉綠體基因組中共有92個SSRs,二者在SSRs數(shù)量上僅相差2個。龍頭蘭不存在五核苷酸重復(fù)序列,景洪白蝶蘭有1個五核苷酸重復(fù)。已報道的同屬狹葉白蝶蘭中共檢測到76個SSRs位點(diǎn),包括58個單核苷酸SSRs、17個二核苷酸SSRs和1個三核苷酸SSRs(Kim et al.,2017)。這些SSRs位點(diǎn)可進(jìn)一步開發(fā)為遺傳標(biāo)記用于遺傳多樣性研究及同屬近緣種間鑒別的分子標(biāo)記。InDel標(biāo)記具有穩(wěn)定性好、多態(tài)性高、分型系統(tǒng)簡單等優(yōu)點(diǎn),在作物育種、醫(yī)學(xué)診斷等領(lǐng)域多有應(yīng)用(楊潔等,2016)。在黃麻(Corchorus capsularis)和長蒴黃麻(C. olitorius)中共鑒定出了294個InDels,其中cpIndel 205可以將這2種黃麻屬植物區(qū)分開來(Fang et al.,2021)。本研究在龍頭蘭和景洪白蝶蘭葉綠體基因組中共鑒定出152個InDels,其中cpInDel 067(104 bp)位于大單拷貝區(qū)trnL-UAA基因和trnF-GAA基因之間,全長超過100 bp,可以作為潛在的區(qū)分2個物種的分子標(biāo)記。高變序列較短,作為DNA條形碼可以經(jīng)濟(jì)、快速地區(qū)分同屬近緣物種(楊嘉鵬等,2020)。Li等(2020)利用葉綠體基因組的LSC區(qū)可高效、精準(zhǔn)地對楓斗類石斛進(jìn)行中藥材鑒定。姚輝等(2015)利用psbK-psbI片段可成功分辨18種藥用石斛及其混偽品。楊嘉鵬等(2020)篩選出5個高度變異的基因間隔區(qū)序列(psbI-trnS、psbC-trnS、clpP-ex1-psbB、psaJ-rpl33、rpl33-rps18)可用于藥用石豆蘭(Bulbophyllum)的鑒定。本研究中2種白蝶蘭屬植物中的多數(shù)高變位點(diǎn)位于LSC區(qū),基因間隔區(qū)序列petG-trnW-CCA、rps16-trnQ-UUG、rps14-psaB、petD-rpoA、rpl16-rps3、rrn4.5-rrn5為高變區(qū),可用于中藥材龍頭蘭及其混淆種的鑒別。
3.3 基于葉綠體基因組的白蝶蘭屬和玉鳳花屬的系統(tǒng)發(fā)育關(guān)系
長期以來,關(guān)于紅門蘭亞族內(nèi)的進(jìn)化與分類問題爭議不斷。在白蝶蘭屬與玉鳳花屬中具寬大扇形的唇瓣側(cè)裂片的種類在形態(tài)上最為接近,傳統(tǒng)的形態(tài)學(xué)分類主要是根據(jù)柱頭是否有柄將二者區(qū)分開來(Wah et al.,2021)。但是,形態(tài)學(xué)特征往往變異豐富、個體差異較大。因此,我們需要結(jié)合更加充分的分子證據(jù)。玉鳳花屬和白蝶蘭屬的遺傳背景資料尚十分缺乏,僅報道了為數(shù)不多的一些物種的葉綠體基因組。本研究通過GenBank檢索到的玉鳳花屬和白蝶蘭屬物種的葉綠體基因組序列構(gòu)建了基于葉綠體基因組的系統(tǒng)發(fā)育樹,發(fā)現(xiàn)景洪白蝶蘭和鵝毛玉鳳花親緣關(guān)系最近,并與龍頭蘭聚為一個單系分支,這一單系分支與Jin等(2014,2017)基于2個核基因和5個葉綠體基因片段得到的結(jié)果一致。龍頭蘭和景洪白蝶蘭在花形態(tài)上與分布于亞洲熱帶的玉鳳花屬的一些類群非常接近,如花白色、花大、寬藥隔、唇瓣具扇形裂片等。因此,二者的柱頭是否有柄的形態(tài)特征不能作為分屬的特征。Jin等(2017)指出柱頭有柄的特征在這一單系分支中至少獨(dú)立消失了2次。同屬于白蝶蘭屬的分布于溫帶的狹葉白蝶蘭并未與龍頭蘭和景洪白蝶蘭聚成一支,而是和玉鳳花屬的H. cruciformis和線葉十字蘭親緣關(guān)系更近。Kim等(2017)和Tachibana等(2021)認(rèn)為該種屬于玉鳳花屬,本研究支持該觀點(diǎn),狹葉白蝶蘭應(yīng)置于玉鳳花屬中。本研究初步的系統(tǒng)發(fā)育結(jié)果與Jin等(2014,2017)基于核基因和葉綠體基因片段的分子系統(tǒng)發(fā)育分析得出的結(jié)果一致,均認(rèn)為目前劃分的白蝶蘭屬并非單系,與玉鳳花屬嵌套不能分開,可歸并至玉鳳花屬中。完整的葉綠體基因組長度約15 kb,包含77~78個蛋白質(zhì)編碼基因,通過葉綠體基因組建樹,序列長度、變異率和信息位點(diǎn)均大大增加,物種間關(guān)系的支持率都很高,多數(shù)分支的支持率高達(dá)100%,表明利用葉綠體基因組序列構(gòu)建系統(tǒng)的發(fā)育樹為解決白蝶蘭屬和玉鳳花屬物種之間的物種關(guān)系提供了有用信息,在今后的研究中,可在進(jìn)一步全面取樣的基礎(chǔ)上,探討這一復(fù)雜類群的種間系統(tǒng)發(fā)育關(guān)系。
致謝 ?中國科學(xué)院西雙版納熱帶植物園王曉靜提供照片,謹(jǐn)致謝意。
參考文獻(xiàn):
AM IRYOUSEFI A, HYVNEN J, POCZAI P, 2018. IRscope: an online program to visualize the junction sites of chloroplast genomes[J]. Bioinformatics, 34(17): 3030-3031.
BEIER S, THIEL T, MUENCH T, et al., 2017. MISA-web: a web server for microsatellite prediction[J]. Bioinformatics, 33(16): 2583-2585.
CHEN MS, YANG ZY, 2022. Genealogical structure and differentiation analysis of Carpinus tientaiensis based on single nucleotide polymorphism of chloroplast genome[J]. Guihaia, 42(10): 1703-1716. ?[陳模舜, 楊仲毅, 2022. 基于葉綠體基因組SNP的天臺鵝耳櫪譜系結(jié)構(gòu)與分化分析[J]. 廣西植物, 42(10): 1703-1716.]
CHEN SF, ZHOU YQ, CHEN YR, et al., 2018. Fastp: an ultra-fast all-in-one FASTQ preprocessor[J]. Bioinformatics, 34(17): 884-890.
FANG SS, ZHANG LM, QI JM, et al., 2021. De novo assembly of chloroplast genomes of Corchorus capsularis and C. olitorius yields species-specific InDel markers[J]. Crop J, 9(1): 216-226.
FRAZER KA, PACHTER L, POLIAKOV A, et al., 2004. VISTA: computational tools for comparative genomics[J]. Nucleic Acids Res, 32(Suppl. 2): W273-W279.
FU CN, MO ZQ, YANG JB, et al., 2022. Testing genome skimming for species discrimination in the large and taxonomically difficult genus Rhododendron[J]. Mol Ecol Resour, 22(1): 404-414.
GREINER S, LEHWARK P, BOCK R, 2019. Organellar-GenomeDRAW(OGDRAW)version 1.3.1: expanded toolkit for the graphical visualization of organellar genomes[J]. Nucleic Acids Res, 47(W1): W59-W64.
JIN JJ, YU WB, YANG JB, et al., 2020. GetOrganelle: a fast and versatile toolkit for accurate de novo assembly of organelle genomes[J]. Genome Biol, 21(1): 241.
JIN WT, JIN XH, SCHUITEMAN A, et al., 2014. Molecular systematics of subtribe Orchidinae and Asian taxa of Habenariinae (Orchideae, Orchidaceae) based on plastid matK, rbcL and nuclear ITS[J]. Mol Phylogenet Evol, 77: 41-53.
JIN WT, SCHUITEMAN A, CHASE MW, et al., 2017. Phylogenetics of subtribe Orchidinae s.l. (Orchidaceae; Orchidoideae) based on seven markers (plastid matK, psaB, rbcL, trnL-F, trnH-psbA, and nuclear nrITS, Xdh): implications for generic delimitation[J]. BMC Plant Biol, 17(1): 222.
KIM C, DO HDK, JUNG J, et al., 2020. Characterization of the complete chloroplast genome of Korean endemic, Habenaria cruciformis (Orchidaceae)[J]. Mitochondrial DNA Part B, 5(3): 3287-3289.
KIM YK, JO S, CHOON SH, et al., 2020. Plastome evolution and phylogeny of Orchidaceae, with 24 new sequences[J]. Front Plant Sci, 11: 22.
KIM YK, KWAK MH, HONG JR, et al., 2017. The complete plastome sequence of the endangered orchid Habenaria radiata (Orchidaceae)[J]. Mitochondrial DNA Part B, 2(2): 704-706.
KRESS WJ, ERICKSON DL, 2007. A two-locus global DNA Barcode for land plants: the coding rbcL gene complements the non-coding trnH-psbA spacer region[J]. PLoS ONE, 2(6): e508.
KUANG DY, WU H, WANG YL, et al., 2011. Complete chloroplast genome sequence of Magnolia kwangsiensis (Magnoliaceae): implication for DNA barcoding and population genetics[J]. Genome, 54(8): 663-673.
LAHAYE R, VAN DER BANK M, BOGARIN D, et al., 2008. DNA barcoding the floras of biodiversity hotspots[J]. Proc Natl Acad Sci USA, 105(8): 2923-2928.
LI JW, YE DP, LIU JX, et al., 2015. Orchids newly recorded to China[J]. Plant Divers Resour, 37(3): 246-252.
LI LD, JIANG Y, LIU YY, et al., 2020. The large single-copy (LSC) region functions as a highly effective and efficient molecular marker for accurate authentication of medicinal Dendrobium species[J]. Acta Pharm Sin B, 10(10): 1989-2001.
LI RJ, WU LW, XIN TY, et al., 2022. Analysis of chloroplast genomes and development of specific DNA barcodes for identifying the original species of Rhei Radix et Rhizoma[J]. Acta Pharm Sin, 57(5): 1495-1505. [李冉郡, 武立偉, 辛天怡, 等, 2022. 大黃藥材基原物種葉綠體基因組分析與特異DNA條形碼開發(fā)[J]. 藥學(xué)學(xué)報, 57(5): 1495-1505.]
LI RZ, CAI J, YANG JB, et al., 2022. Plastid phylogenomics resolving phylogenetic placement and genera phylogeny of Sterculioideae (Malvaceae s. l.)[J]. Guihaia, 42(1): 25-38. [黎若竹, 蔡杰, 楊俊波, 等, 2022. 利用葉綠體基因組數(shù)據(jù)解析錦葵科梧桐亞科的系統(tǒng)位置和屬間關(guān)系[J]. 廣西植物, 42(1): 25-38.]
LI ZB, REN T, DENG JJ, et al., 2022. Comparative analysis of the chloroplast genomes of three cultivars of Hibiscus mutabilis and its related species [J]. Guihaia, 42(12): 2007-2020. [李鎮(zhèn)兵, 任婷, 鄧姣姣, 等, 2022. 木芙蓉三個品種及近緣種的葉綠體基因組比較分析[J]. 廣西植物, 42(12): 2007-2020.]
LIN CS, CHEN JJW, HUANG YT, et al., 2015. The location and translocation of ndh genes of chloroplast origin in the Orchidaceae family[J]. Sci Rep, 5(1): 1-10.
MICHAEL T, PASCAL L, TOMMASO P, et al., 2017. GeSeq-versatile and accurate annotation of organelle genomes[J]. Nucleic Acids Res, 45(W1): W6-W11.
PAN JJ, 2017. Analysis of genetic relationship of Dendrobium huoshanense population and its identification based on chloroplast genome[D]. Nanjing: Nanjing Normal University. [潘佳佳, 2017. 基于葉綠體基因組的霍山石斛居群親緣關(guān)系分析及其鑒定研究[D]. 南京: 南京師范大學(xué).]
PRIDGEON AM, CRIBB PJ, CHASE MW, et al., 2012. Genera Orchidacearum: Vol. 2, Orchidoideae (Part 1)[M]. Oxford: Oxford University Press.
QI D, CHANG YJ, CAO YF, et al., 2018. Genetic diversity and phylogenetics of pear(Pyrus L.)germplasm resources from south China revealed by chloroplast DNA[J]. Acta Hortic Sin, 45(12): 2308-2320. [齊丹, 常耀軍, 曹玉芬, 等, 2018. 基于葉綠體DNA信息的南方梨屬種質(zhì)的遺傳多樣性和演化分析[J]. 園藝學(xué)報, 45(12): 2308-2320.]
RUHLMAN TA, JANSEN RK, 2014. The plastid genomes of flowering plants[J]. Meth Mol Biol, 1132: 3-38.
SHI LC, CHEN HM, JIANG M, et al., 2019. CPGAVAS2, an integrated plastome sequence annotator and analyzer[J]. Nucleic Acids Res, 47(W1): W65-W73.
TACHIBANA T, NISHIKAWA Y, KUBO N, et al., 2021. Morphological and genetic diversities of Habenaria radiata (Orchidaceae)in the Kinki area, Japan[J]. Int J Mol Sci, 22(1): 311.
TANG CQ, QIU ZX, TAN C, et al., 2022. Sorbus koehneana (Rosaceae): its complete chloroplast genome and phylogenetic relationship with S. unguiculata[J]. Acta Hortic Sin, 49(3): 641-654. [湯晨茜, 仇志欣, 檀超, 等, 2022. 陜甘花楸葉綠體基因組及其與爪瓣花楸的系統(tǒng)關(guān)系[J]. 園藝學(xué)報, 49(3): 641-654.]
TEOH ES, 2021. Pecteilis Rafin.[M]. Cham: Springer International Publishing: 231-233.
WAH LK, KUMAR P, GALE SW, 2021.971. Pecteilis susannae: Orchidaceae[J]. Curtiss Bot Mag, 38(1): 57-71.
WICK RR, SCHULTZ MB, ZOBEL J, et al., 2015. Bandage: interactive visualization of de novo genome assemblies[J]. Bioinformatics, 31(20): 3350-3352.
WU ZY, RAVEN PH, HONG DY, 2009. Flora of China: Vol. 25 (Orchidaceae)[M]. Beijing: Science Press; St. Louis: Missouri Botanical Garden Press: 136-137.
YANG J, HE J, WANG DB, et al., 2016. Progress in research and application of InDel markers[J]. Biodivers Sci, 24(2): 237-243.[楊潔, 赫佳, 王丹碧, 等, 2016. InDel標(biāo)記的研究和應(yīng)用進(jìn)展[J]. 生物多樣性, 24(2): 237-243.]
YANG JP, ZHU ZL, FAN YJ, et al., 2020. Comparative plastomic analysis of three Bulbophyllum medicinal plants and its significance in species identification[J]. Acta Pharm Sin, 55(11): 2736-2745. [楊嘉鵬, 朱紫樂, 范雅娟, 等, 2020. 三種石豆蘭屬藥用植物的葉綠體基因組比較分析及其在物種鑒定中的意義[J]. 藥學(xué)學(xué)報, 55(11): 2736-2745.]
YAO H, YANG P, ZHOU H, et al., 2015. Identification of medicinal plant Dendrobium based on the chloroplast psbK-psbI intergenic spacer[J]. Acta Pharm Sin, 50(6): 783-787. [姚輝, 楊培, 周紅, 等, 2015. 基于葉綠體psbK-psbI序列的石斛屬藥用植物鑒定[J]. 藥學(xué)學(xué)報, 50(6): 783-787.]
ZHANG D, GAO F, JAKOVLIC I, et al., 2020. PhyloSuite: An integrated and scalable desktop platform for streamlined molecular sequence data management and evolutionary phylogenetics studies[J]. Mol Ecol Resour, 20(1): 348-355.
( 責(zé)任編輯 鄧斯麗 )
收稿日期: ??2023-09-01
基金項(xiàng)目: ??深圳市瀕危蘭科植物保護(hù)與利用重點(diǎn)實(shí)驗(yàn)室開放基金(OU202204); 中國科學(xué)院西雙版納熱帶植物園園林園藝中心研究基金(E2ZK291B05); 國家自然科學(xué)基金(32270225)。
第一作者: ?汪雨(1997-),碩士研究生,研究方向?yàn)閳@林植物資源與應(yīng)用,(E-mail)wangyu@swfu.edu.cn。
* 通信作者: ??羅艷,博士,研究員,研究方向?yàn)樘m科植物多樣性與保護(hù),(E-mail)luoyan@xtbg.org.cn。