中圖分類號:Q943.2 文獻標識碼:A 文章編號:1000-3142(2025)04-0716-14
Chloroplast genome analysis Pogostemon cablin from different origins
XING Bingnan,LIANG Yingying,WU Wenru*,LU Yaru, ZOU Heyuan,PENG Xiaoqi (SchoolPharmaceutical Sciences,Guangzhou 51Ooo6,China
Abstract:Pogostemoncablinpossssssignificant medical and industrialvalues,as itcanbe usedfor medicinal purposes as well as for essential oil extraction. However,the yield and quality P . cablin can vary depending on the ecological environments andartificial cultivation measures employed in diferent production regionsandorigins.Inorder
to study the structural characteristics and compare the diferences the chloroplast genome P .cablindifferent origins,this study used the DNBSeq sequencing platform to sequence the whole genome P . cablin,used GetOrganelle to assemble the complete chloroplast genome,annotated the chloroplast genome on the CPGAVAS2 website,and analyzed the basic structural characteristics,IR/SC boundary comparison,genome comparison and collinearityanalysis, simplerepeat sequences and interspersed repeat sequences,diversityanalysis and relative usage analysis synonymous codons.The results were as follows:(1)The fullength the chloroplast genomes 2O different origins P .cablin was 152 461-152 510 bp,and 132 genes were annotated,including 87 CDSs,37tRNA genes and 8 rRNA genes.(2) The mVISTA comparison found that atpF,atpF-atpH,rps16-trnQ-UUG,rpoB-trmC-GCA,accD,psaI-ycf4,petApsbJ,rpl16,andrps15-ycfl were hypervariableregions.(3)Thesites withnucleicaciddiversitygreaterthanO.002 were located in the trnM-CAU-atpB interval,ycf4,rpl32,and rpl32-trmL-UAC interval.(4)Atotal 64codons encoding 20aminoacidsweredetected,andthere were 33 highly preferred codons,among which codons ending inA/Uaccounted forthemajority.(5)And74-76 SSRs,15-18 palindrome repeat sequences,and12-17forward repeat sequences were detected.(6)Genetic distance analysisand phylogeneticanalysis found that only GSY_MLXY hada distant genetic relationshipwithothercultivatedtypes.Inthisstudy,the genomestructure informationanddiferentsiteschloroplasts from 20 different sources P . cablin are obtained,which provides basic data for the development molecular markers and the screening superior germplasm.
Key words: Pogostemon cablin,chloroplast genome,repetitive sequence,diversity,relative synonymous codon usage
廣藿香(Pogostemoncablin)為唇形科刺蕊草屬植物,以干燥地上部分入藥,其功效為芳香化濁、開胃止嘔、發(fā)表解暑(國家藥典委員會,2020),廣泛應用在醫(yī)藥、食品和化妝品加工業(yè)等方面,具有較高的經(jīng)濟價值,亦是新型冠狀病毒肺炎防疫中的重要中藥(李浩等,2021)。廣藿香,這種具有獨特香氣的植物,根據(jù)其化學成分可劃分為兩大類別,即廣藿香酮型和廣藿香醇型。廣州和肇慶地區(qū)所產(chǎn)出的廣藿香,因其獨特的香氣,被稱為“牌香”或“肇香”。廣東湛江地區(qū)的吳川、遂溪、雷州,以及海南省的萬寧等地生產(chǎn)的廣藿香,人們習慣地稱之為“瓊香”,抑或“南香”。傳統(tǒng)上,酮型廣藿香作為藥用,而醇型廣藿香主要用于提取揮發(fā)油(羅集鵬等,2005),但廣藿香培植過程中存在引種混亂、種質(zhì)不清等問題(顧艷等,2022),影響其藥材的質(zhì)量。吳文如等(2019)通過廣藿香及其混偽品藿香等ITS序列的差異,實現(xiàn)了廣藿香特異性PCR鑒別。He等(2014)采用 等序列作為DNA條形碼對廣藿香化學型進行了鑒定,但未達到準確區(qū)分的效果。傳統(tǒng)的DNA條形碼短片段可實現(xiàn)特定物種的種間鑒定,但在同一物種的種內(nèi)差異研究中表現(xiàn)不佳。為探究廣藿香種質(zhì)的差異,篩選優(yōu)良種質(zhì),以保障臨床用藥的安全有效,對不同來源廣藿香的葉綠體基因組進行研究。
葉綠體作為一種獨特的細胞器,承載著細胞內(nèi)的自主遺傳信息,并且近年來憑借其特性成為揭示植物進化和系統(tǒng)發(fā)育關系的強大工具。其基因組的特點在于結(jié)構(gòu)簡單、分子量小、拷貝數(shù)眾多以及基因種類的保守性(Dobrogojskietal.,2020)。目前,葉綠體基因組研究已經(jīng)應用于安息香屬(Songetal.,2022)、蒼術屬(Wangetal.,2021)和桃金娘目(Zhangetal.,2021)等多種藥用植物的系統(tǒng)發(fā)育學和優(yōu)良品種選育,并且相對于傳統(tǒng)DNA條形碼短片段,葉綠體全基因組具備更為豐富的變異位點,在種間水平上提供了更高的分辨率,因此鑒定效率更高。這使得葉綠體基因組在分子標記、近緣物種辨識等領域中展現(xiàn)出巨大的潛力和應用價值。
本研究借助二代測序技術,獲得20個不同來源的廣藿香葉綠體全基因組數(shù)據(jù),對這些廣藿香葉綠體基因組進行組裝、注釋并繪制與其相關的基因組圖譜,進行基本結(jié)構(gòu)特征分析、IR/SC的邊界比較、基因組比較及共線性分析、簡單重復序列及散在重復序列、多樣性分析、同義密碼子相對使用度分析、遺傳距離和系統(tǒng)發(fā)育分析,擬探討以下問題:(1)不同來源的廣藿香葉綠體基因組序列有何特征;(2)20個不同來源廣藿香之間有何差異;(3)20個不同來源廣藿香之間的親緣關系如何。以期揭示不同來源廣藿香葉綠體基因組的差異,為其分子標記的開發(fā)及優(yōu)良種質(zhì)篩選提供基礎資料。
1材料與方法
1.1 材料
樣品采自廣東廣州、肇慶、陽江、云浮等地,經(jīng)廣州中醫(yī)藥大學吳文如教授鑒定為唇形科刺蕊草屬植物廣藿香(Pogostemoncablin)。樣品分為兩份,一份扦插,移栽于廣州中醫(yī)藥大學時珍山藥圃,另一份置于 冰箱保存。采集的20個廣藿香葉綠體基因組序列及注釋信息已上傳至NCBI數(shù)據(jù)庫,實驗樣品采集信息和GenBank登錄號見表1。
1.2方法
1.2.1基因組DNA提取及測序采用CTAB法提取廣藿香葉片總DNA,使用QubitFluorometer核酸蛋白定量儀(賽默飛世爾科技公司)和 1 % 瓊脂糖凝膠電泳檢測總DNA濃度和質(zhì)量??侱NA經(jīng)檢測合格后,交由華大基因科技有限公司,使用DNBSeq測序平臺雙末端測序策略構(gòu)建片段大小為 1 5 0 b p 的測序文庫進行測序。
1.2.2葉綠體基因組組裝及注釋測序得到原始測序數(shù)據(jù),使用SOAPnuke軟件(Chenet al.,2018)對低質(zhì)量數(shù)據(jù)進行過濾,去除帶接頭(adapter)的reads;去除長度小于 1 5 0 b p 的reads;去除N(N表示無法確定堿基信息)的比例 1 . 0 % 以上的reads;去除read中polyX(X可為A、T、C或G)長度超過 5 0 b p 的reads;去除低質(zhì)量reads(質(zhì)量值Q小于和等于20的堿基數(shù)占整條read長度的 30 % 以上的reads),將最后得到的cleandata用于后續(xù)分析。使用GetOrganelle(Jinetal.,2020)v1.7.7.0進行組裝,參考數(shù)據(jù)庫為embplant_pt(陸生植物葉綠體),最大擴充循環(huán)數(shù)為10,調(diào)用K-mer值為21、45、65、85;拼接完成后用Bandagev0 . 8 . 1 軟件可視。使用Genenious v9 . 0 . 2 檢查并調(diào)整序列。以廣藿香的葉綠體基因組(NC_042796.1)序列為參考,通過CPGAVAS2網(wǎng)站(http://47.96.249.172:16019/analyzer/home)進行基因組注釋,使用在線工具OGDRAW(https://chlorobox.mpimp-golm.mpg. de/OGDraw.html)繪制葉綠體基因組圖譜
1.2.3簡單重復序列與散在重復序列使用MISA(Beieretal.,2017)軟件的Perl腳本探索簡單重復序列(simple sequence repeats,SSR)在葉綠體全基因組序列上的分布,設置單核苷酸重復單元大于等于10個,二核昔酸重復單元大于等于5個,三核苷酸重復單元大于等于4個,四核苷酸重復單元、五核苷酸重復單元、六核苷酸重復單元均大于等于3個。應用在線軟件REPuter(Kurtzetal.,2001)(https://bibiserv.cebitec.uni-bielefeld.de/reputer)檢測葉綠體基因組中的散在重復序列,包括正向重復序列(F)、反向重復序列(R)、互補重復序列(C)和回文重復序列(P)。基因組中的散在重復序列識別參數(shù)設置:海明距離設置為3,最小重復長度不小于 1 1 b p ,其他為默認值,取e-value不超過 的重復序列。
1.2.4邊界收縮與擴張 使用JSHY-Cloud(http://cloud.genepioneer.com:9929)的CPJSdraw邊界繪制工具比較不同來源的廣藿香葉綠體基因組與參考序列NC_042796.1反向重復區(qū)與單拷貝區(qū)的邊界(Raubesonetal.,2007),可視化其結(jié)果。
1.2.5葉綠體基因組比較與共線性分析使用mVISTA(Frazeretal.,2004)在線軟件(https://genome.lbl.gov/vista/mvista/submit.shtml),參數(shù)設定中選擇shuffle-LAGAN模式對20個不同來源的廣藿香葉綠體基因組進行比較分析,以石牌廣藿香葉綠體基因組(NC_042796.1)作為參考。使用mauve(Darling et al.,2004)(version 20150226)對廣藿香葉綠體基因組進行共線性分析。
1.2.6多樣性位點分析使用MAFFTv7.490軟件(Katohamp;Standley,2013)比對20條葉綠體基因組序列,對齊后導出fasta格式文件。將所得fasta文件導入DnaSP(Rozasetal.,2017)v6.12.03軟件,計算20個廣藿香葉綠體基因組的核酸多樣性水平,設置窗口長度(windowlength)為600,步長(step size)為200。
1.2.7同義密碼子相對使用度(relativesynonymouscodonusage,RSCU)采用CodonWv1.4.4計算各基因的RSCU(Danaamp;Tuller,2014),并利用在線工具RSCU-熱圖(https://www.bioinformatics.com.cn/plot_basic_cluster_heatmap_plot_O24)繪制廣藿香葉綠體基因組的RSCU熱圖。
1.2.8遺傳距離分析使用“1.2.6”項下經(jīng)MAFFTv7.490對齊后的fasta文件,導人MEGAX軟件,形成mega文件,設置自展值Bootstrapmethod1000,選擇p-distance模式,成對計算不同來源廣藿香葉綠體基因組的遺傳距離(Kumaretal.,2018)。
1.2.9系統(tǒng)發(fā)育分析使用MAFFT" v 7 . 4 9 0 對齊20個廣藿香葉綠體基因組及外類群荊芥(Nepetacataria)的葉綠體基因組序列(MT663220.1),生成的fasta文件使用Iqtreev2.2.0.3軟件,以MFP模式,自展值1000,建立ML樹。
2 結(jié)果與分析
2.1廣藿香葉綠體基因組構(gòu)成
廣藿香葉綠體基因組為環(huán)狀雙鏈分子且呈典型的四分體結(jié)構(gòu)(圖1),該結(jié)構(gòu)包含1個大單拷貝區(qū)(largesinglecopy,LSC),2個反向重復區(qū)(invertedrepeat,IR)和1個小單拷貝區(qū)(smallsinglecopy,SSC)?;蚪M長度為152461\~152510bp,GC含量約為 3 8 . 2 % 。20個不同來源廣藿香葉綠體基因組中除GSY_MLXY的SSC長度為17 571bp 以外,其余均為 :GSY_MLXY的IR區(qū)長度為 2 5 6 6 4 b p ,其余均為25662bp;GZY、P7、SX、SZS、YC、YF2、ZQXY、ZQZC、GSY_GY、GSY_YC 的 LSC 長度均為
GSY_SP、GSY_YN、GSY_HN、P1、P3、P1O、YC2、ZQSP、GY的LSC長度均為 8 3 5 5 3 b p ; GSY_MLXY的LSC長度為83611bp(表2)。20個不同來源廣藿香的葉綠體基因組結(jié)構(gòu)特征一致,說明其葉綠體基因組結(jié)構(gòu)保守。經(jīng)DNAMAN比對,P7、GZY、SX、SZS、YC、YF2、ZQXY、ZQZC、GSY_GY、GSY_YC這10個序列完全相同,以下簡稱P7等;P1、P3、P1O、GSY_SP、GSY_YN、GSY_HN、YC2、ZQSP、GY這9個序列完全相同,以下簡稱P1等。
2.2廣藿香葉綠體基因組注釋與歸類
共注釋出132個基因,這些基因中包含87個CDS、37個tRNA基因和8個rRNA基因,其中多拷貝基因有18個,除trnM-CAU為3個拷貝外,ndhB、rpl2、rpl23、rps12、rps7、rrn16、rrn23、 r r n 4 . 5 、rrn5、trnA-UGC、trnL-CAA、trnN-GUU、trnR-ACG、trnV-GAC、ycfl5、ycf2、trnI均為2個拷貝;18個基因含有內(nèi)含子,除rps12、clpP、ycf3含2個內(nèi)含子以外,ndhA、ndhB、petB、petD、atpF、rpl16、rpl2、rps16、rpoC1、trnA-UGC、trnC-ACA、trnI、trnK-UUU、trnL-UAA、trnS-CGA均含1個內(nèi)含子(表3)。
2.3簡單重復序列與散在重復序列
利用在線工具MISA檢測廣藿香葉綠體基因組中SSR的分布情況(圖2),共檢測到74~76個SSR,以單核苷酸的重復為主,占 7 6 % 以上且以T和A為重復單元為主,與P1等、P7等不同,GSY_MLXY葉綠體基因組在 rps2和 rpo C2 間隔區(qū)處有1個以(C)15的C重復單元SSR,并且在petB內(nèi)含子處有1個以(G)11的G重復單元的SSR。在不同來源的廣藿香葉綠體基因組的SSR中, 6 3 ~ 6 4 個分布于LSC區(qū),占 84 % 以上,IR區(qū)僅有2個SSR。P1等和P7等廣藿香葉綠體基因組檢測到27個散在重復序列、15個回文重復序列、12個正向重復序列,而GSY_MLXY的葉綠體基因組檢測到35個散在重復序列、18個回文重復序列、17個正向重復序列。另外,廣藿香葉綠體基因組均在LSC區(qū),有1個 2 0 5 b p 的回文重復序列,此重復序列在葉綠體基因組拼接時解環(huán)時就被發(fā)現(xiàn),給廣藿香葉綠體基因組的拼接與解環(huán)增加了難度。
2.4邊界收縮與擴張
IR/SC區(qū)域邊界的收縮和擴張是葉綠體變化的主要原因。本研究比較了不同來源的廣藿香葉綠體基因組與參考序列NC_042796.1。LSC-IRb的邊界位于基因rps19上,IRb區(qū)距邊界最近的rpl2基因,與邊界的距離均為 ;IRb-SSC的邊界位于基因ndhF上,距離此邊界最近的基因為
等和P7等與此邊界的距離為1422bp,GSY_MLXY與此邊界的距離為 1 4 2 0 b p ;SSC-IRa的邊界均位于基因ycf1上,最靠近此邊界的也是 t r n N ,距離大小與LSC-IRb邊界的距離一致,這也體現(xiàn)了IRs區(qū)的對稱性。IRa-LSC的邊界位于非編碼區(qū),距離此邊界最近的基因分別為rpl2和 t r n H, t r n H 距離邊界1bp,rpl2距離邊界 9 7 b p ,也與LSC-IRb邊界和IRb區(qū)的 r p l 2 距離相同。廣藿香葉綠體基因組各分區(qū)邊界的差異較小,收縮與擴張范圍為 0~2 b p ,僅GSY_MLXY的IRs區(qū)有
的擴張(圖3)。
2.5葉綠體基因組比較與共線性分析
設置PX葉綠體基因組為參考(NC_042796.1),經(jīng)過全局比對發(fā)現(xiàn) r p s 1 6 - t r n Q- U U G 、atpF、atpF-a t p H? r p o B- t r n C - G C A? a c c D? p s a I- y c f 4 ? p e t A- p s b J? rpl16、rps15-ycfl、ycf1等為葉綠體基因組的高度可變區(qū)域。此外,P1等和P7等序列相比對,僅ycf3-trnS-GGA間隔區(qū)有差異位點,可為植物鑒定和系統(tǒng)發(fā)育研究提供參考(圖4)。葉綠體基因組與參考PX共線性分析結(jié)果呈單線型,廣藿香葉綠體基因組高度保守,未見倒置及重排現(xiàn)象(圖5)。
表3廣藿香葉綠體基因組基因功能注釋與分類
A、B、C分別為P1等9個廣藿香葉綠體基因組、P7等10個廣藿香葉綠體基因組與GSY_MLXY廣藿香葉綠體基因組的 SSR類型 與數(shù)量在不同區(qū)域的分布圖。
A,B,andCaretedistributionmapsSSRtypesandquantitisinnePgostemoncblinhloroplastgeoessuchasP1,tePblin chloroplast genomessuch asP7 and GSY_MLXYP.cablin chloroplast genomesin different regions.
圖2廣藿香葉綠體基因組SSR類型與數(shù)量圖及SSR分布區(qū)域圖
Fig. 2SSR type and quantity and SSR distribution area Pogostemon cablin chloroplast genome
2.6多樣性位點分析
利用 軟件計算20個廣藿香葉綠體基因組的核酸多樣性水平。共調(diào)查了152765個位點,其中總共包括760個多樣性位點。
值范圍為0~0.00283,平均值為0.000395947,序列相似度高。編碼區(qū)的可變位點多于非編碼區(qū),LSC區(qū)、SSC區(qū)的變異比IR區(qū)域的分歧更大。核酸多樣性大于0.002的位點位于 t r n M - C A U -a t p B 間隔區(qū)、ycf4、rpl32、rpl32-trnL-UAC間隔區(qū)(圖6),或可用于廣藿香栽培類型的鑒定。
2.7同義密碼子相對使用度分析
廣藿香葉綠體基因組密碼子RSCU值的統(tǒng)計結(jié)果顯示,共有64種密碼子編碼20個氨基酸(終止子不編碼氨基酸),以RSCU大于1.0為標準,獲得偏好性較強的密碼子有33個,其中以A/U結(jié)尾的密碼子占大多數(shù)(圖7),表明廣藿香葉綠體基因組主要偏好第三位堿基為A或U的密碼子,然而這些密碼子的RSCU均小于2.0,說明基因組中不存在極強偏好性的密碼子。
2.8遺傳距離分析
使用MEGAX計算20個廣藿香葉綠體基因組的遺傳距離,平均遺傳距離為0.000244142,僅GSY_MLXY與其他葉綠體基因組的成對遺傳距離為0.003975,大于平均遺傳距離,其余均為0(表4)。
2.9系統(tǒng)發(fā)育分析
表420條廣藿香葉綠體基因組遺傳距離
Table 4 Genetic distance 20 Pogostemon cablin chloroplast genomes
使用Iqtreev2.2.0.3,以唇形科植物荊芥的葉綠體基因組為外類群建立ML樹。P7、YF2、GZY、ZQXY、ZQZC、YC、SX、GSY_GY、GSY_YC、P1、P3、P10、GSY_SP、GSY_YN、GSY_HN、YC2、ZQSP、GY為一個支持率高的單系( B S= 1 0 0 % ),說明這19種來源的廣藿香親緣關系較近,這19種廣藿香之間的系統(tǒng)發(fā)育分支的支持率較低,難以區(qū)分。相比之下,它們與 親緣關系較遠,與GSY_MLXY聚為一支,均來源于刺蕊草屬,同時,這些分支同外類群荊芥屬荊芥(Nepetacataria)共同構(gòu)成唇形科(圖8)。
3討論
3.1廣藿香葉綠體基因組的結(jié)構(gòu)特征
本研究組裝并注釋了20個不同來源廣藿香的葉綠體基因組??傮w而言,與大部分陸生植物的葉綠體基因組一樣,廣藿香的葉綠體基因組也呈現(xiàn)出典型的四分體結(jié)構(gòu),并且不同來源廣藿香葉節(jié)點數(shù)值表示自展支持率。
Numbers at nodes indicate the bootstrap support value.
綠體基因組共線性結(jié)果為單線型,未見重排或倒置,說明本研究中廣藿香樣品的葉綠體基因組結(jié)構(gòu)高度保守。與以往廣藿香葉綠體基因組研究相比,He等(2016)首次報道完整的廣藿香葉綠體基因組(NCBI登錄號:KX230834),為廣東陽春廣藿香的葉綠體基因組,但經(jīng)MUMmerv3.23檢查,該序列LSC區(qū)的部分序列連接在IRa區(qū)之后,其與廣藿香參考基因組序列(NC_042796.1)共線性結(jié)果不佳。但是,與Zhang 等(2020)的研究相比,本研究樣品來源更加豐富且具有代表性。樣品來源于廣藿香不同的中國主產(chǎn)地,如云?。╕F2、P1、P3等)、肇慶(GY、ZQXY、ZQSP)、湛江遂溪(SX)、陽春(YC、YC2)、海南(GSY_HN)等,此外還涉及石牌廣藿香的保種地廣東食品藥品職業(yè)學院(GSY_SP),以及國外來源地如越南(GSY_YN)、馬來西亞(GSY_MLXY)等。這20個不同來源廣藿香的葉綠體基因組全長 1 5 2 4 6 1 ~ 1 5 2 5 1 0 b p, G C 含量約為 3 8 . 2 % ,注釋得到132個基因,這些基因中包含87個CDS37個tRNA基因和8個rRNA基因,這也與大部分葉綠體基因組研究中的功能基因結(jié)果相似。
SSR標記是基于DNA的有效分子標記,用于各種生物體的基因檢測(Beietal.,2023)。本研究檢測出74~76個SSR及 1 5 ~ 1 8 個回文重復序列、12\~17個正向重復序列,首次報道廣藿香葉綠體基因組LSC區(qū)存在1個 2 0 5 b p 的回文重復片段,這些片段還需進一步深入驗證,可能可用于廣藿香物種的分子鑒定。
同義密碼子的使用是控制基因表達的基本且保守的機制,密碼子的最優(yōu)性對個體表達具有重要性(Barringtonetal.,2023)。本研究檢測到共有64種密碼子編碼20個氨基酸,同義密碼子相對使用度分析結(jié)果表明廣藿香葉綠體基因組主要偏好第三位堿基為A或U的密碼子,這與已報道的大多數(shù)藥用植物相關分析的結(jié)果(Morton,1993;Wang et al.,2018;Wu et al.,2021;Wang et al.,2022;Guoetal.,2022)相一致。
3.2不同來源廣藿香葉綠體基因組的差異
20個不同來源廣藿香葉綠體基因組中, MLXY的基因組長度最大,為152510bp,P7等次之,P1等長度最?。籊SY_MLXY的SSC長度為1 7 5 7 1 b p ,其余均為
;GSY_MLXY的IR區(qū)長度為 2 5 6 6 4 b p ,其余均為
; GSY_MLXY的LSC長度為
,與P1等和P7等
LSC的長度(83553\~83554bp)也有較大差別。IR/SC邊界僅GSY_MLXY與其他葉綠體基因組存在2bp的收縮或擴增。本研究發(fā)現(xiàn), r p s 1 6 - t r n ( QUUG等9個間區(qū)為高變區(qū),核酸多樣性大于0.002的位點位于 t r n M - C A U -a t p B 間隔區(qū)、ycf4等4個位置,除GSY_MLXY以外,P1等和P7等葉綠體基因組序列相比對,僅 間隔區(qū)存在差異位點。這些差異位點可進一步結(jié)合核基因、線粒體基因組進行分析,獲得廣藿香物種鑒定有效的分子標記位點。
3.3不同來源廣藿香葉綠體基因組的親緣關系
遺傳距離分析與系統(tǒng)發(fā)育分析結(jié)果表明,僅GSY_MLXY與其他來源廣藿香的親緣關系較遠,回顧前面的結(jié)構(gòu)特征和差異分析,GSY_MLXY的葉綠體基因組序列與其他來源廣藿香存在明顯差異,這可能是由于GSY_MLXY來源于馬來西亞,與國內(nèi)廣藿香存在地理隔離。此外,其親緣關系較遠可能與其生長環(huán)境、遺傳背景以及物種演化等多個因素也有關。首先,廣藿香原產(chǎn)于馬來西亞,并在東南亞國家、西印度群島和巴拉圭等地廣泛種植。這些地區(qū)的氣候、土壤等環(huán)境因素可能與國內(nèi)存在顯著差異,導致廣藿香在不同地理環(huán)境下的遺傳變異和適應性演化。其次,廣藿香作為一種植物,不同地區(qū)的廣藿香可能存在著不同的遺傳變異和基因交流情況,這些差異可能導致它們在遺傳上的距離較遠。最后,在漫長的演化過程中,廣藿香可能經(jīng)歷了多種自然選擇和人工選擇的壓力,這些壓力可能導致其在不同地區(qū)的種群發(fā)生分化,進而形成不同的亞種或變種,這些亞種或變種之間的親緣關系可能較遠??偠灾?,馬來西亞廣藿香與國內(nèi)廣藿香親緣關系較遠的原因是多方面的,包括生長環(huán)境、遺傳背景以及物種演化等多個因素的綜合作用。國內(nèi)的廣藿香大多為無性繁殖,這也可能是其遺傳物質(zhì)多樣性退化的原因之一。這些發(fā)現(xiàn)可為區(qū)分馬來西亞來源的廣藿香與其他來源廣藿香提供參考依據(jù)。除GSY_MLXY以外,P1等和P7等親緣關系較近,支持率較低,難以區(qū)分,可能是親緣關系密切的種或變種之間在葉綠體特定基因上通常變異較小。
單一依靠葉綠體基因組反映物種完整的遺傳變異情況較為有限(向坤莉等,2021)。對核心基因和非核心基因的泛基因組的進一步研究有助于了解完整的物種遺傳變異情況,得到物種更全面準確的變異信息(SNP、Indel、CNV、PAV等)(Jiaetal.,2024)。因此,未來泛基因組將逐漸取代單一參考基因組,成為研究動植物進化、選擇、基因功能和育種的“新標準”。本研究為后續(xù)泛基因組在廣藿香中的應用提供了相關數(shù)據(jù)基礎。
參考文獻:
BEIERS,THIELT,MUNCHT,et al.,2017.MISA-web:A web server for microsatellite prediction [J].Bioinformatics, 33(16) : 2583-2585.
BARRINGTON CL,GALINDO G,KOCH AL,et al., 2023.Synonymous codon usage regulates translation initiation [J]. Cell Reports,42(12):113413.
BEI LX,HE C,LIUJJ,et al.,2023.Genome-wide identification and characterization microsatellite markers in Bactrian Camel[J]. Genomics,115(6):110726.
CHEN YX,CHEN YS,SHI CM,et al.,2018. SOAPnuke:A MapReduce acceleration-supported stware for integrated qualitycontrolandpreprocessinghigh-throughput sequencing data[J].Gigascience,7(1):1-6.
Pharmacopoeia Commission,2O2o.Pharmacopoeia the People's Republic China:Part1[M].Beijing:China Medical Science and Tenology Press:46-47.[國家藥典委 員會,2020.中華人民共和國藥典:一部[M].北京:中 國醫(yī)藥科技出版社:46-47.]
DOBROGOJSKI J,ADAMIEC M,LUCIISKI R,2020.The chloroplast genome:A review[J].Acta Physiologiae Plantarum,42(6) : 98.
DARLING ACE,MAU B,BLATTNER FR,et al.,2004. Mauve:Multiple alignment conserved genomic sequence with rearrangements[J].Genome Research,14(7): 1394-1403.
DANA A,TULLER T,2O14. The effect tRNA levelson decoding times mRNA codons[J]. Nucleic Acids Research,42(14):9171-9181.
FRAZER KA,PACHTER L,POLIAKOV A,et al.,2004. VISTA:Computational tools for comparativegenomics [J].Nucleic Acids Research,32(Web Server Issue): W273-W279.
GU Y,MEI Y,XU SQ,et al.,2022. Research progress on germplasmresourcesandcultivationtechniques Poaostemon cablin [J]. Journal Tropical Crops, 43(8):1595-1603.[顧艷,梅瑜,徐世強,等,2022.廣 藿香種質(zhì)資源及栽培技術研究進展[J].熱帶作物學報, 43(8):1595-1603.]
GUO S,LIAO XJ,CHEN SY,et al.,2022.A comparative analysis the chloroplast genomes four Polygonum medicinal plants [J」. Frontiers in Genetics,13:764534.
HEY,WAN F,XIONG L,et al.,2014. Identification two chemotypesPogostemon cablin(Blanco)Benth.through DNA barcodes [J]. Zeitschrift fur Naturforschung C Journal Bioscience,69(5/6):253-258.
HE Y,XIAO HT,DENG C,et al.,2016.The complete chloroplast genomesequences themedicinalplant Pogostemon cablin[J].International Journal Molecular Sciences,17(6): 820.
JIN JJ,YU WB, YANG JB,et al.,2O20.GetOrganelle:A fast andversatile toolkit for accurate de novo assembly organelle genomes [J].Genome Biology,21(1): 241.
JIA ML,WANG J,CAO DM,et al., 2024. The pan-plastome Hemerocallis citrina reveals new insights into the genetic diversity and cultivation history an economically important food plant [J]. BMC Plant Biology,24:44.
KATOH K, STANDLEY DM,2013.MAFFT multiple sequence alignment stware version 7: Improvements in performance and usability[J].Molecular Biology and Evolution,30(4): 772-780.
KUMAR S,STECHER G,LI M,et al.,2018.MEGA X: Molecular evolutionary genetics analysis across computing platforms[J].Molecular Biology and Evolution,35(6): 1547-1549.
KURTZ S,CHOUDHURI JV,OHLEBUSCH E,et al., 2001.REPuter:The manifold applications repeat analysis on a genomic scale [J]. Nucleic Acids Research,29(22) : 4633-4642.
LI H,LIU W,HOU HX,et al.,2021.Patent compound medicine prescriptions in preventing and treating COVID-19[J]. Central South Pharmacy,19(11):2426- 2431.[李浩,劉偉,侯賀祥,等,2021.中藥防治新型冠 狀病毒肺炎專利復方用藥規(guī)律分析[J].中南藥學, 19(11) : 2426-2431.]
LUO JP,F(xiàn)ENG YF,HE B,et al.,2005.A study the authenticity Pogostemon cablin[J]. Journal Medicinal Materials,28(12):1121-1125.[羅集鵬,馮毅 凡,何冰,等,2005.廣藿香的道地性研究[J].中藥材, 28(12):1121-1125.]
MORTON BR,1993. Chloroplast DNA codon use:Evidence for selection at the psb A locus based ontRNA availability [J].Journal Molecular Evolution,37:273-280.
RAUBESON LA,PEERY R,CHUMLEY TW, etal., 2007. Comparative chloroplast genomics : Analyses including Ranunculus macranthus [J]. BMC Genomics,8:174.
ROZAS J,F(xiàn)ERRER-MATA A, SANCHEZ-DELBARRIO JC, et al.,2017. DnaSP 6: DNA sequence polymorphism analysis large data sets [J].Molecular Biology and Evolution, 34(12): 3299-3302.
SONG Y,ZHAO WJ,XU J,et al., 2022. Chloroplast genome evolution and species identification styrax(Styracaceae) [J].BioMed Research International,2022:5364094.
WANG YH,WANG S,LIU YL,et al.,2021.Chloroplast genomevariationandphylogeneticrelationships Atractylodes species [J]. BMC Genomics, 22:103.
WANG S,YANG CP,ZHAO XY,et al.,2018.Complete chloroplast genome sequence Betula platyphylla:Gene organization,RNAediting,andcomparativeand phylogenetic analyses[J].BMC Genomics,19:950.
WU LW,NIE LP,WANG Q,et al.,,2021.Comparative and phylogenetic analyses the chloroplast genomes species Paeoniaceae [J]. Scientific Reports,11:14643.
WANG ZJ,CAI QW,WANG Y,et al.,2022. Comparative analysis codon bias in the chloroplast genomes Theaceae species [J]. Frontiers in Genetics,13:824610.
WU WR,AN X,LAI HL,et al.,2019.Identification Pogostemon cablin(Blanco)Benth.with the counterfeit products by allele-specific PCR based on ITS2 sequence [J].Lishizhen Medicine and Materia Medica Research,30 (4):897-900.[吳文如,安鑫,來慧麗,等,2019.基于 ITS2序列位點特異性PCR鑒別廣藿香及其混偽品 [J].時珍國醫(yī)國藥,30(4):897-900.]
XIANG KL,HE WC, ZOU Y,et al.,2021. Application pangenome in genetic diversity and functional genomics [J]. Guihaia,41(10):1674-1682.[向坤莉,賀文闖,鄒益, 等,2021.泛基因組研究在遺傳多樣性和功能基因組學中 的應用[J].廣西植物,41(10):1674-1682.]
ZHANG XF, LANDIS JB, WANG HX,et al.,2021. Comparative analysis chloroplast genome structure and molecular dating in Myrtales[J].BMCPlant Biology,, 21:219.
ZHANG CY,LIU TJ,MO XL,et al.,202O.Comparative analyses the chloroplast genomes patchouli plants and their relatives in Pogostemon(Lamiaceae)[J].Plants, 9(11) : 1497.