摘要:本文采用Illumina NovaSeq 6000平臺(tái)對(duì)螺旋果苜蓿組3個(gè)國審品種進(jìn)行葉綠體基因組測(cè)序、組裝和注釋,并與南苜蓿(Medicago polymorpha)、天藍(lán)苜蓿(M. lupulina)和小苜蓿(M. minima)進(jìn)行比較分析。結(jié)果表明:‘楚雄’南苜蓿(M. polymorpha ‘Chuxiong’)、‘淮陰’南苜蓿(M. polymorpha ‘Huaiyin’)和‘隴東’天藍(lán)苜蓿(M. lupulina ‘Longdong’)葉綠體基因組長分別為123 472 bp,124 229 bp和124 107 bp,總GC含量分別為:34.2%,34.1%和34.2%,共編碼110~111個(gè)基因。首次發(fā)現(xiàn)‘隴東’天藍(lán)苜蓿具有一個(gè)226 bp的IR(Inverted repeat lacking clade)區(qū)特征序列(含rps12基因)?!邸宪俎:汀搓帯宪俎8饔?7個(gè)內(nèi)含子,但‘隴東’天藍(lán)苜蓿只有14個(gè)內(nèi)含子。在6個(gè)材料基因組中,在替換率加快的accD和ycf1中檢測(cè)到簡(jiǎn)單重復(fù)序列,替換率加快可能與簡(jiǎn)單重復(fù)序列插入有關(guān)。系統(tǒng)進(jìn)化樹表明,‘楚雄’南苜蓿和‘淮陰’南苜蓿與南苜蓿親緣關(guān)系較近,‘隴東’天藍(lán)苜蓿與天藍(lán)苜蓿親緣關(guān)系最近。本研究為螺旋果苜蓿組分類和葉綠體基因組反向重復(fù)區(qū)研究提供理論依據(jù)。
關(guān)鍵詞:螺旋果苜蓿組;葉綠體基因組進(jìn)化;重復(fù)序列分析;系統(tǒng)發(fā)育
中圖分類號(hào):S551+.7""" 文獻(xiàn)標(biāo)識(shí)碼:A"""" 文章編號(hào):1007-0435(2024)08-2394-14
Chloroplast Genome Evolution and Phylogenetic Analysis of
Medicago sect. Spirocarpos
DENG Niao-xu1#, LUO Zhong-yuan2#, SUN Zhi-xuan1, 3, MENG Jing1, ZHAO Yan1*
(1.College of Horticulture and Landscape, Yunnan Agricultural University, Kunming, Yunnan Province 650201, China;
2.Yao’an County rural industry development center, Chuxiong, Yunnan Province 675300, China;
3.Chuxiong Dianyun Flower gardening Co., LTD, Chuxiong, Yunnan Province 675300, China)
Abstract:In this study,the whole chloroplast genome of three cultivars of Medicago sect. Spirocarpos,which approved by the national grass variety examination and approval committee,were sequenced by Illumina NovaSeq 6000 platform,and comparatived analysis was performed by comparing with the chloroplast genome of Medicago polymorpha,M. lupulina and M. minima of M. sect. Spirocarpos. The results showed that the full length of cp-DNA in M. polymorpha ‘Chuxiong’,M. polymorpha ‘Huaiyin’ and M. lupulina ‘Longdong’ were 123 472 bp,124 229 bp,and 124 107 bp,respectively. Simultaneously,the total GC content of these three cultivars were 34.2%,34.1%,and 34.2%. In this study,a total of 110—111 genes were annotated. This was first report in M. lupulina ‘Longdong’ that a 226 bp sequence with IR region characteristics was found,which including rps12. Seventeen genes in M. polymorpha ‘Chuxiong’ and M. polymorpha ‘Huaiyin’ contain introns. However,in M. lupulina ‘Longdong’ only fourteen genes contain introns. SSR repeats sequences have been detected in accD and ycf1,which were two accelerated substitution rates gene. This might be related to SSR sequence insertion. Phylogenetic analysis showed that M. polymorpha ‘Chuxiong’ and M. polymorpha ‘Huaiyin’ had a close relationship with M. polymorpha. Meanwhile, M. lupulina ‘Longdong’ had a close relationship with M. lupulina. This study provides a theoretical basis for the classification of M. sect. Spirocarpos,and the study of IR region in chloroplast genome.
Key words:Medicago sect. Spirocarpos;Chloroplast genome evolution;Repeat sequence analysis;Phylogenetic analysis
苜蓿屬(Medicago L.)植物具有較高的飼用價(jià)值,但分類較混亂,苜蓿屬下的螺旋果苜蓿組(M. sect. Spirocarpos)和天藍(lán)苜蓿組(M. sect. Lupularia )在分子系統(tǒng)發(fā)育樹上沒有聚為一個(gè)單系支,基于形態(tài)學(xué)和單個(gè)基因序列建成的進(jìn)化樹之間存在明顯的不一致,且在不同分子進(jìn)化研究中出入非常大,存在分歧[1-2],嚴(yán)重阻礙著全球苜蓿屬植物資源的收集、整理、評(píng)價(jià)和利用[1]。螺旋果苜蓿組為苜蓿屬的第一大組,包括5個(gè)亞組35個(gè)種,截至2022年,隸屬于螺旋果苜蓿組的國審品種有‘楚雄’南苜蓿、‘淮陰’南苜蓿和‘隴東’天藍(lán)苜蓿(http://www.moa.gov.cn/)。螺旋果苜蓿組組內(nèi)進(jìn)化關(guān)系復(fù)雜,不同分子進(jìn)化結(jié)果完全不一致[3]。特別是南苜蓿(M. polymorpha)的表型多變,與多個(gè)一年生苜蓿表型非常接近,是苜蓿屬內(nèi)一個(gè)較難鑒定的物種[1],這可能是分布范圍廣泛和種內(nèi)變異大等原因所致。3個(gè)國審品種同時(shí)具有適口性好、營養(yǎng)豐富、飼用價(jià)值高、固氮能力強(qiáng)、極耐高溫、高濕和耐酸鋁等特點(diǎn),在適合的區(qū)域廣泛用作綠肥和飼草[4-6]。目前,借助分子生物學(xué)信息對(duì)這3個(gè)國審品種進(jìn)行分類的研究尚未見報(bào)道。解析螺旋果苜蓿組3個(gè)國審品種的系統(tǒng)進(jìn)化關(guān)系,對(duì)螺旋果苜蓿組植物種質(zhì)資源的分子鑒定、品種選育和農(nóng)藝經(jīng)濟(jì)性狀的遺傳分析具有重要意義,亦為苜蓿屬系統(tǒng)進(jìn)化研究提供依據(jù)。
葉綠體是植物細(xì)胞進(jìn)行光合作用的主要場(chǎng)所,具有豐富的自主遺傳信息和單親遺傳特性[7-8]。相對(duì)于核基因組而言,葉綠體基因組具有高度保守的結(jié)構(gòu),全長序列短、易測(cè)序獲得、基因結(jié)構(gòu)穩(wěn)定、進(jìn)化速率適中、便于分析等優(yōu)勢(shì)[9]。因此,廣泛應(yīng)用于植物物種的起源、系統(tǒng)發(fā)育關(guān)系、新物種和品種鑒定分析中[10]。前人通過葉綠體基因組構(gòu)建系統(tǒng)發(fā)育樹,揭示了中國食用玫瑰的遺傳關(guān)系,包括所有區(qū)段和所有亞屬,確定了中國食用玫瑰品種的起源,以及發(fā)現(xiàn)來源于湖北省十堰市丹江口市的N. tabacum 7-CX14 與來源于多米尼加的N. tabacum PilotoCubano聚為一支,表明我國栽培的雪茄煙可能存在同種異名、異名同種的現(xiàn)象[11-12]。堇菜屬由于形態(tài)特征高度相似,在分類學(xué)上存在具有一定困難,尤其是紫花地丁作為其中一種中藥材,傳統(tǒng)的形態(tài)學(xué)方法難以準(zhǔn)確區(qū)分其真?zhèn)?。然而,研究葉綠體基因組可以為這些混淆品種提供分類依據(jù)[13]。目前,‘楚雄’南苜蓿、‘淮陰’南苜蓿和‘隴東’天藍(lán)苜蓿在分子水平上與已公布的其他螺旋果苜蓿組植物的親緣關(guān)系也尚不清楚。本研究通過高通量測(cè)序技術(shù)對(duì)螺旋果苜蓿組3個(gè)國審品種植物進(jìn)行分析,探討‘楚雄’南苜蓿、‘隴東’天藍(lán)苜蓿和‘淮陰’南苜蓿的葉綠體基因組特征、密碼子偏好性以及進(jìn)一步篩選基因組高變區(qū),將本研究的螺旋果苜蓿組3個(gè)國審品與已公布葉綠體基因組的螺旋果苜蓿植物構(gòu)建系統(tǒng)發(fā)育樹,旨在闡明3個(gè)國審品種基因組進(jìn)化情況以及與其他螺旋果苜蓿組植物的進(jìn)化關(guān)系及其在系統(tǒng)發(fā)育中的地位,以期為今后螺旋果苜蓿組植物的分類和雜交育種提供參考。
1 材料與方法
1.1 試驗(yàn)材料
本研究對(duì)3個(gè)螺旋果苜蓿組國審品種進(jìn)行測(cè)序,在NCBI(https://www.ncbi.nlm.nih.gov/)數(shù)據(jù)庫中上傳數(shù)據(jù),GenBank登錄號(hào)見表1,并從NCBI下載22個(gè)螺旋果苜蓿組物種和4種苜蓿屬近緣屬物種外類群白花草木樨(Melilotus albus)、胡盧巴(Trigonella foenum-graecum)、紫雀花(Parochetus cummunis)和紅車軸草(Trifolium pratense)數(shù)據(jù),進(jìn)行系統(tǒng)發(fā)育樹分析,詳細(xì)信息見表1,中文名參照《苜??茖W(xué)》[14]和《中國植物志》[15]。
1.2 試驗(yàn)方法
1.2.1 DNA提取、葉綠體基因組測(cè)序與組裝 供試的‘楚雄’南苜蓿、‘淮陰’南苜蓿和‘隴東’天藍(lán)苜蓿分別由云南省草地動(dòng)物科學(xué)研究院薛世明研究員、揚(yáng)州大學(xué)動(dòng)物科學(xué)與技術(shù)學(xué)院魏臻武教授、甘肅農(nóng)業(yè)大學(xué)曹致中教授贈(zèng)送。選擇顆粒飽滿的種子進(jìn)行消毒后置于培養(yǎng)皿中萌發(fā)3~4天,再置于無菌泥炭土中栽培,每3天澆一次改良霍格蘭氏(Hoagland’s)溶液[16],30天后選長勢(shì)較好無病害植株新鮮葉片,采用CTAB法提取基因組DNA[17]檢測(cè)DNA質(zhì)量;DNA測(cè)序由北京諾禾致源科技股份有限公司高通量測(cè)序平臺(tái)(Illumina NovaSeq 6000)進(jìn)行,對(duì)獲得的原始數(shù)據(jù)(Raw data)進(jìn)行過濾,去除帶接頭的低質(zhì)量的reads,用于后續(xù)組裝;使用CLC Genomic Workbench v12 (CLC Bio.,Aarhus,Denmark)和Perl腳本運(yùn)行NOVOPlasty v4.2[18]進(jìn)行葉綠體基因組序列的組裝;參考NCBI已發(fā)表的紫花苜蓿(M. sativa,MK460489)使用BLAST(https://blast.ncbi.nlm.nih.gov/)確定contigs拼接順序;然后使用Geneious v8.0.2軟件進(jìn)行拼接,獲得最終的環(huán)狀葉綠體基因組并進(jìn)行手動(dòng)校準(zhǔn)。
1.2.2 葉綠體基因序列的基因組注釋和圖譜繪制 利用在線注釋軟件Annotation of Organellar Genomes[19]和Perl腳本運(yùn)行的PGA-Plastid Genome Annotator[20]對(duì)葉綠體基因組進(jìn)行注釋;利用在線服務(wù)器(http://lowelab.ucsc.edu/tRNAscan-SE/)[21]對(duì)tRNA基因進(jìn)行鑒定,將注釋好的序列,提交至NCBI數(shù)據(jù)庫得到序列號(hào);利用OGDRAW(http://ogdraw.mpimp-golm.mpg.de/)葉綠體基因組圈圖可視化工具繪制葉綠體基因組圖譜[22]。
1.2.3 密碼子偏好性分析 利用Geneious軟件將試驗(yàn)材料葉綠體基因中的蛋白編碼序列進(jìn)行提取,保存為fasta.格式,利用CodonW腳本對(duì)蛋白編碼序列的密碼子使用度(Relative synonymous codon usage,RSCU)進(jìn)行計(jì)算,RSCUgt;1的密碼子認(rèn)為具有偏好性[23]。
1.2.4 葉綠體基因組重復(fù)序列分析 利用Tandem Repeats Finder v4.09(https://tandem.bu.edu/trf/trf.html)鑒定序列的串聯(lián)重復(fù)[24]。參數(shù):Match為2,Mismatch和Delta為7,PM為80,PI為10,Minscore為50,MaxPeriod為500。利用SSR Hunter v1.3[25]鑒定序列的簡(jiǎn)單重復(fù)。
1.2.5 葉綠體基因組序列結(jié)構(gòu)變異分析 利用Geneious軟件中的共線性分析插件(Mauve Genome Alignment)進(jìn)行共線性分析;利用mVISTA基因組在線分析工具(https://genome.lbl.gov/vista/mvista/submit.shtml)[26]對(duì)葉綠體全基因組進(jìn)行比較分析;利用perl腳本將所研究的葉綠體基因組序列的編碼區(qū)、非編碼區(qū)基因分別提取出來,并使用在線工具M(jìn)AFFTv.7(https://mafft.cbrc.jp/alignment/server/index.html)[27]進(jìn)行序列比對(duì)。利用DnaSP v.6[28]計(jì)算每個(gè)編碼基因和非編碼區(qū)(即PC和PN)的核苷酸多樣性(pi)。
1.2.6 dn和ds分析 從NCBI下載苜蓿屬IRLC物種的編碼區(qū)基因:accD,clpP,ycf1和matK。利用DnaSP v.6計(jì)算4個(gè)編碼區(qū)基因的非同義(dn)和同義(ds)替代率。并利用PhyloSuite軟件中集成插件IQ-TREE[29]構(gòu)建ML樹,該樹具有通用的時(shí)間可逆模型GTR+G+I,4個(gè)基因每個(gè)都有100個(gè)bootstrap重復(fù)。利用IQ-TREE生成的ML樹作為4個(gè)基因的分支特異性dn和ds率估計(jì)的約束樹。
1.2.7 系統(tǒng)發(fā)育分析 利用在線序列比對(duì)工具M(jìn)AFFT v7(https://mafft.cbrc.jp/alignment/server/index.html)對(duì)29個(gè)植物葉綠體基因組序列數(shù)據(jù)進(jìn)行比對(duì),構(gòu)建序列矩陣;采用最大似然(Maximum likelihood,ML)進(jìn)行系統(tǒng)發(fā)育分析;ML系統(tǒng)發(fā)育樹用PhyloSuite軟件中集成插件IQ-TREE生成,利用Figtree v1.4.4 軟件可視化及美化樹。
2 結(jié)果與分析
2.1 葉綠體基因組結(jié)構(gòu)
對(duì)‘楚雄’南苜蓿、‘隴東’天藍(lán)苜蓿和‘淮陰’南苜蓿的葉綠體基因組進(jìn)行組裝和注釋,結(jié)合NCBI下載的小苜蓿、天藍(lán)苜蓿和南苜蓿質(zhì)體數(shù)據(jù),質(zhì)體基因組大小為122 770 bp(M. lupulina)~132 296 bp(M. minima)不等,葉綠體基因組中鑒定出110~117個(gè)基因,包括76~78個(gè)蛋白質(zhì)編碼基因(PCGs),30~32個(gè)轉(zhuǎn)運(yùn)RNA(tRNA)基因和4~7個(gè)核糖體RNA(rRNA)基因。所有葉綠體基因組的GC含量在34.0%~34.5%之間(表2,圖1)。‘楚雄’南苜蓿、‘淮陰’南苜蓿和南苜蓿中17個(gè)基因含有內(nèi)含子,其中天藍(lán)苜蓿和小苜蓿rpoC1基因不含內(nèi)含子;‘隴東’天藍(lán)苜蓿和天藍(lán)苜蓿葉綠體基因組中除了rpoC1基因外,atpF和clpP基因也不含有內(nèi)含子。
2.2 ‘隴東’天藍(lán)苜蓿IR區(qū)分析
對(duì)‘隴東’天藍(lán)苜蓿葉綠體基因組進(jìn)行組裝和注釋后,結(jié)果發(fā)現(xiàn)‘隴東’天藍(lán)苜蓿葉綠體基因組存在一個(gè)226 bp大小具有IR區(qū)特征的反向重復(fù)序列,包含1個(gè)編碼基因rps12基因。通過讀取定位確認(rèn)在‘隴東’天藍(lán)苜蓿中組裝出新的226 bp IR區(qū)。查找重復(fù)序列的準(zhǔn)確位置,重復(fù)的位置在65 420~65 465 bp和104 037~104 262 bp之間,如圖2所示,兩個(gè)序列的堿基方向相反,大小一致。為進(jìn)一步研究‘隴東’天藍(lán)苜蓿IR的結(jié)構(gòu)和功能提供更多的理論依據(jù)。
2.3 密碼子偏好性分析
從6個(gè)螺旋果苜蓿組植物的葉綠體全基因組中分別提取出PCGs進(jìn)行同義密碼子分析,PCGs長度范圍在65 586 bp(M. polymorpha)~67 824 bp(M. minima)之間。PCGs密碼子使用情況分析表明,所有螺旋果苜蓿的密碼子數(shù)均不相同,小苜蓿數(shù)量最多,包含22 608個(gè)密碼子,南苜蓿最少,包含21 862個(gè)密碼子;6個(gè)螺旋果苜蓿組植物的密碼子編碼所有20種氨基酸(AA),以‘楚雄’南苜蓿為例具體分析葉綠體基因組密碼子的偏好性。‘楚雄’南苜蓿含有76個(gè)PCGs,總長為65 961 bp,共有21 987個(gè)密碼子參與編碼,RSCU分析表明亮氨酸(Leu)使用最頻繁(2 320/10.55%),異亮氨酸(Ile)次之(1 982/9.01%),使用最少的氨基酸為半胱氨酸(Cys)(234/1.06%),甲硫氨酸(Met)和色氨酸(Trp)具有唯一的密碼子RSCU=1,表明Met和Trp沒有密碼子使用的偏好性。70.54%的密碼子RSCUgt;1,RSCUgt;1的密碼子中有96.98%(15,042)以A和U(T)結(jié)尾(表3)。
2.4 重復(fù)序列分析
對(duì)6個(gè)螺旋果苜蓿組植物進(jìn)行重復(fù)序列分析,共識(shí)別出59~119條串聯(lián)重復(fù)序列(T),37~45條正向重復(fù)(F)序列和5~13條回文重復(fù)(P)序列,沒有檢測(cè)到反向重復(fù)(R)序列。重復(fù)類型最多的是串聯(lián)重復(fù),其數(shù)量在59條(M. polymorpha ‘Chuxiong’)~119條(M. lupulina ‘Longdong’)之間(圖3a)。在6個(gè)螺旋果苜蓿組植物葉綠體基因組中,共識(shí)別出108~122個(gè)SSR信息位點(diǎn),其中單核苷酸74~91個(gè)、二核苷酸10~15個(gè)、三核苷酸1~3個(gè)、四核苷酸9~12個(gè)、五核苷酸0~3個(gè)、六核苷酸1~5個(gè)(圖3b)。其中只有15(M. lupulina ‘Longdong’)~18(M. polymorpha)個(gè)在編碼區(qū),其余均不在編碼區(qū)。
2.5 序列變異分析
為了更直觀地顯示6個(gè)螺旋果苜蓿組植物間的差異,以‘楚雄’南苜蓿的葉綠體基因組序列為參考,使用mVISTA軟件并生成了6個(gè)螺旋果苜蓿組植物的序列差異分析圖(圖4a)。6個(gè)螺旋果苜蓿組植物間分化程度最高的區(qū)域多出現(xiàn)在非編碼區(qū),編碼區(qū)除accD,clpP,atpF,psbN,ycf1和ycf2基因外,其余區(qū)域均表現(xiàn)出相對(duì)保守性。通過共線性分析發(fā)現(xiàn)6個(gè)螺旋果苜蓿組植物的葉綠體基因組結(jié)構(gòu)存在差異(圖4b),6個(gè)螺旋果苜蓿組植物葉綠體基因組中存在基因重排、反轉(zhuǎn)現(xiàn)象。以天藍(lán)苜蓿為參考序列,發(fā)現(xiàn)共有8個(gè)區(qū)域發(fā)生重排或反轉(zhuǎn),其中非編碼區(qū)域和編碼區(qū)域各4個(gè)。通過核酸多態(tài)性分析,最終確定了8個(gè)高度分化的編碼區(qū)(πg(shù)t;0.04)(accD,clpP,rpl32,rpoC2,trnK-UUU,trnV-GAC,ycf1,ycf2)和8個(gè)高度分化的非編碼區(qū)(πg(shù)t;0.1)(clpP-psbB,rpl33-rps18,trnS-GGA-ycf3,trnQ-UUG-psaI,trnP-UGG-psaJ,rps8-rpl14,rpl23-trnI-CAU,trnN-GUU-ycf1)(圖5),這些高變區(qū)可作為螺旋果苜蓿植物潛在的分子標(biāo)記用于物種鑒定。
2.6 accD,clpP和ycf1基因加速取代率分析
對(duì)IRLC分類群總的49個(gè)植物進(jìn)行替代率dn和ds分析,其中螺旋果苜蓿組植物22個(gè),clpP,accD和ycf1的替代率(dn和ds)均顯著高于matK(Plt;0.01)(圖6b,6c)。此外,所有被調(diào)查的IRLC物種,包括本文新測(cè)序的2個(gè)螺旋果苜蓿組國審品種,在accD,clpP和ycf1的dn和ds樹中都顯示出不同程度的分支長度跡象,但在matK沒有看到類似的模式(圖6a)。accD,clpP和ycf1的編碼序列(CDs)長度在49個(gè)物種中都表現(xiàn)出很大的差異,accD的CDS長度在999 bp(M. falcata)~3423 bp(M. trifolium strictum)不等;clpP從492 bp(M. ciliaris)增加到690 bp(M. edgeworthii);ycf1的長度在4463 bp(Caragana rosea)~6108 bp(M. arabica)不等;而matK基因的長度變化不大[1503 bp(M. soleirolii)~1533 bp(M. scutellata)]。
為了研究這4個(gè)基因CDs的長度相關(guān)突變機(jī)制,統(tǒng)計(jì)了6個(gè)螺旋果組苜蓿植物4個(gè)基因的CDs中重復(fù)元件的數(shù)量,結(jié)果表明,6個(gè)螺旋果苜蓿組植物的accD和ycf1均包含SSR重復(fù)序列,其中accD基因在天藍(lán)苜蓿、‘隴東’天藍(lán)苜蓿和小苜蓿中檢測(cè)出1個(gè)SSR重復(fù)(AAGATG/ATCTTC),在南苜蓿中沒有檢測(cè)到,而在‘楚雄’南苜蓿和‘淮陰’南苜蓿中檢測(cè)到2個(gè)SSR重復(fù)(AAGACG/CGTCTT);ycf1基因在天藍(lán)苜蓿和‘隴東’天藍(lán)苜蓿中檢測(cè)到7個(gè)(A/T)SSR重復(fù),小苜蓿中檢測(cè)到6個(gè)(A/T)SSR重復(fù),在南苜蓿中檢測(cè)到8個(gè),而在‘楚雄’南苜蓿和‘淮陰’南苜蓿中檢測(cè)到9個(gè)[A/T(8)AATGAT/ATCATTAAGACG/CGTCT T(1)]SSR重復(fù)。然而,在clpP和matK中未檢測(cè)到任何SSR重復(fù)序列(表4)。因此,這2個(gè)基因替代率的加速可能與重復(fù)序列的存在有關(guān)。此研究結(jié)果為今后研究IRLC植物的進(jìn)化機(jī)制提供一定參考依據(jù)。
2.7 系統(tǒng)發(fā)育分析
本研究以豆科蝶形花亞科車軸草族的白花草木樨、胡盧巴、紫雀花和紅車軸草作為外類群,對(duì)新測(cè)序的3個(gè)國審品種‘楚雄’南苜蓿、‘淮陰’南苜蓿和‘隴東’天藍(lán)苜蓿和已發(fā)表的22個(gè)螺旋果苜蓿組植物葉綠體全基因組構(gòu)建ML系統(tǒng)發(fā)育樹(圖7)。結(jié)果顯示,所有螺旋果苜蓿組植物聚為一枝,支持率為100%。該組中‘楚雄’南苜蓿、‘淮陰’南苜蓿和南苜蓿與螺形苜蓿聚為單系枝(支持率為100%),表明四者的親緣關(guān)系較近,其中‘楚雄’南苜蓿和‘淮陰’南苜蓿親緣關(guān)系最近,二者具有100%的支持率;盤狀苜蓿和多裂苜蓿與天藍(lán)苜蓿以及‘隴東’天藍(lán)苜蓿聚為一枝(支持率100%),其中天藍(lán)苜蓿以及‘隴東’天藍(lán)苜蓿親緣關(guān)系最近,二者具有100%的支持率。
3 討論
3.1 ‘隴東’天藍(lán)苜蓿IR區(qū)分析
前人研究發(fā)現(xiàn),溫帶的蝶形花亞科中有6個(gè)族草本植物種系中發(fā)現(xiàn)IR區(qū)丟失[30],然而,在當(dāng)前的研究中,只有小苜蓿、天藍(lán)苜蓿和細(xì)齒草木樨這3個(gè)IRLC植物中發(fā)現(xiàn)了IR區(qū)的再次出現(xiàn),且小苜蓿中的新IR區(qū)包含了祖先IR核心的一部分,表明它們的祖先可能經(jīng)歷了重復(fù)介導(dǎo)的擾動(dòng),這可能使3個(gè)物種的IR區(qū)恢復(fù)[31-32]。重復(fù)介導(dǎo)和重組依賴復(fù)制在IR區(qū)復(fù)發(fā)過程中發(fā)揮重要作用,但在細(xì)齒草木樨中未發(fā)現(xiàn)此現(xiàn)象[32]。本研究在‘隴東’天藍(lán)苜蓿也發(fā)現(xiàn)一個(gè)226 bp具有IR特征的反向重復(fù)區(qū)再次出現(xiàn),包括1個(gè)基因rpl12。前人研究推測(cè),IR區(qū)的擴(kuò)張、收縮和喪失或獲得,可能是由于分子內(nèi)和分子間的相互作用[33]。IR區(qū)邊界遷移是一個(gè)動(dòng)態(tài)過程,即使在密切相關(guān)的分類群之間,其長度和內(nèi)容也會(huì)發(fā)生變化[34]?!]東’天藍(lán)苜蓿中266 bp的IR特征區(qū)域也有可能繼續(xù)擴(kuò)大,并最終包括更多鄰近的典型IR區(qū)基因。
3.2 clpP基因內(nèi)含子缺失分析
內(nèi)含子作為真核生物基因組的組成部分與基因表達(dá)過程密切相關(guān),可在mRNA剪接過程中起著復(fù)雜的調(diào)節(jié)作用,因此內(nèi)含子的丟失可能會(huì)影響基因的功能[35-36],也可能也會(huì)影響基因的表達(dá)效應(yīng),造成表型的變化[37]。且內(nèi)含子的丟失在一定程度上也能反映物種進(jìn)化速率,進(jìn)化較快的物種保留更少的祖先內(nèi)含子[38]。本研究中螺旋果苜蓿植物都發(fā)生clpP內(nèi)含子丟失,后續(xù)可以通過內(nèi)含子多態(tài)性位點(diǎn)、物種相同基因內(nèi)含子的丟失來鑒定螺旋果苜蓿植物進(jìn)化程度。前人研究發(fā)現(xiàn)內(nèi)含子丟失的基因突變率都比較高,在內(nèi)含子水平上,高突變率的基因的內(nèi)含子更容易從基因組中被去除掉[39],本研究的結(jié)果與前人研究結(jié)果一致,clpP基因的突變率比較高,且內(nèi)含子也被去除掉。
3.3 密碼子使用偏好性分析
密碼子使用偏好性(codon usage bias,CUB)被認(rèn)為是基因組進(jìn)化的重要特征[40],在生物的進(jìn)化過程中,密碼子使用受到多種因素的影響。研究表明,自然選擇和基因突變是重要的影響因素,其中自然選擇為主要影響因素。因此,不同物種會(huì)形成其獨(dú)特的密碼子使用偏好性[41-42]。同義密碼子相對(duì)使用頻次(RSCU)通常被作為衡量密碼子偏好性的重要指標(biāo)。若RSCU=1,表示密碼子使用無偏好性;若RSCU>1,表示該密碼子使用頻率較高,反之亦然[43]。本研究的‘楚雄’南苜蓿密碼子偏好性表明,有70.54%的密碼子RSCUgt;1,只有甲硫氨酸(Met)和色氨酸(Trp)具有唯一的密碼子RSCU=1,其余的密碼子RSCU<1,其中RSCUgt;1的密碼子中有96.98%(15,042)以A和U(T)結(jié)尾,這與之前發(fā)表的蒺藜苜蓿、紫花苜蓿和雜花苜蓿研究結(jié)果一致[41,44-45],但最優(yōu)密碼子的數(shù)目在不同物種間存在差異,可能是因?yàn)檫M(jìn)化壓力導(dǎo)致。
3.4 系統(tǒng)發(fā)育分析
本研究對(duì)螺旋果苜蓿組5亞組25個(gè)植物進(jìn)行了系統(tǒng)發(fā)育樹分析,以探究它們之間的親緣關(guān)系。前人研究發(fā)現(xiàn)5個(gè)亞組內(nèi)的個(gè)別物種系統(tǒng)發(fā)育位置上出現(xiàn)混亂,纏結(jié)苜蓿亞組4個(gè)物種形成的進(jìn)化枝非常穩(wěn)定,而其他4個(gè)亞組都存在混亂現(xiàn)象[1]。本研究的螺旋果苜蓿組和厚螺旋果苜蓿亞組都分別由多個(gè)進(jìn)化枝組成,如纏結(jié)苜蓿亞組的科羅納苜蓿與厚螺旋果苜蓿亞組的特諾苜蓿聚在一起,且支持度都很高,與前人的研究結(jié)果一致[2,46-47]。同亞組的偏花苜蓿卻不屬于這一支,而是與同組的螺旋果苜蓿亞組物種聚在一起,建議在分子系統(tǒng)發(fā)育關(guān)系中將其劃分到螺旋果苜蓿亞組。南苜蓿與多裂苜蓿和纏結(jié)苜蓿聚在同一枝系,與基于70個(gè)共同基因聚類的結(jié)果相符合,但本研究小苜蓿與天藍(lán)苜蓿不是姐妹關(guān)系,與田春育[48]和尚曉嵐[49]研究中兩者為姐妹關(guān)系的結(jié)果不一致,原因可能是基于不同數(shù)據(jù)集以及不同的植物樣本使得結(jié)果不同,本文基于葉綠體基因組全序列,而前人基于70個(gè)共有基因以及采用的樣本不是同一個(gè),并且所采用的序列也不與本文相同。
4 結(jié)論
螺旋果苜蓿組‘楚雄’南苜蓿、‘淮陰’南苜蓿和‘隴東’天藍(lán)苜蓿3個(gè)國審品種的葉綠體基因組長度分別為123 472 bp,124 229 bp和124 107 bp,總GC含量分別為34.2%,34.1%和34.2%?!]東’天藍(lán)苜蓿中首次發(fā)現(xiàn)一個(gè)226 bp具有IR區(qū)特征的序列。在螺旋果苜蓿組6個(gè)植物葉綠體基因組中,共檢測(cè)出108~122個(gè)SSR信息位點(diǎn),堿基組成偏向使用A和T。在2個(gè)替換率加快的基因accD和ycf1中檢測(cè)到簡(jiǎn)單重復(fù)序列,這可能與重復(fù)序列的插入有關(guān)。系統(tǒng)發(fā)育樹分析發(fā)現(xiàn),‘楚雄’南苜蓿和‘淮陰’南苜蓿與南苜蓿的親緣關(guān)系較近;‘隴東’天藍(lán)苜蓿與天藍(lán)苜蓿的親緣關(guān)系較近。本研究為螺旋果苜蓿組分類提供新思路,為探究苜蓿屬植物葉綠體基因組反向重復(fù)區(qū)提供理論依據(jù)。
參考文獻(xiàn)
[1] 劉志鵬,任廣朋. 苜蓿屬物種分類研究進(jìn)展[J]. 草業(yè)學(xué)報(bào),2022,31(11):191-203
[2] STEELE K P,STEFANIET M,CKERT B,ZARRE S,et al. Phylogeny and character evolution in Medicago (Leguminosae):Evidence from analyses of plastid trnK/matK and nuclear GA3ox1 sequences[J]. American Journal of Botany,2010,97(7):1412-1455
[3] SMALL E. Alfalfa and relatives:evolution and classification of Medicago[M]. Ottawa:NRC Research Press,2011:95-112
[4] 黎梅杰,段正山,姜華,等. 鋁脅迫下楚雄南苜蓿的生理響應(yīng)[J]. 云南農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)),2023,38(4):615-620
[5] 李偉民. 淮陰苜蓿耐熱的蛋白質(zhì)組學(xué)研究[D]. 揚(yáng)州:揚(yáng)州大學(xué),2013:1-108
[6] 馮毓琴,曹致中. 隴東天藍(lán)苜蓿產(chǎn)量構(gòu)成因素的相關(guān)性分析[J]. 蘭州:甘肅農(nóng)業(yè)大學(xué)學(xué)報(bào),2006,41(4):76-80
[7] DANIELI H,LIN C S,YU M,et al. Chloroplast genomes:diversity,evolution,and applications in genetic engineering[J]. Genome Biology,2016,17(1):134
[8] HAGEMANN R. The sexual inheritance of plant organelles[M]. Dordrecht:Springer Netherlands,2004:93-113
[9] 洪森榮,林順來,李盈萍,等. 甜高粱葉綠體基因組特征及密碼子偏好性分析[J]. 草地學(xué)報(bào),2023,31(12):3636-3650
[10]盧政陽,于鳳揚(yáng),肖月娥,等. 北陵鳶尾葉綠體基因組及其特征分析[J]. 草地學(xué)報(bào),2023,31(6):1656-1664
[11]施友志,申民翀,王劍,等. 6種雪茄品系葉綠體基因組比較分析及系統(tǒng)發(fā)育關(guān)系研究[J/OL]. https://link.cnki.net/urlid/22.1154.S.20231025.0911.001,2023-10-25/2023-12-08
[12]WEI H C,XIN Y D,MI C Z,et al. Complex and reticulate origin of edible roses (Rosa,Rosaceae) in China[J]. Horticulture Research,2022(9):1-14
[13]CAO D L,ZHANG X J,XIE S Q,et al. Application of chloroplast genome in the identification of Traditional Chinese Medicine Viola philippica[J]. BMC Genomics,2022,23(1):1-19
[14]洪紱曾. 苜??茖W(xué)[M]. 北京:中國農(nóng)業(yè)出版社,2009:187-190
[15]中國科學(xué)院中國植物志編輯委員會(huì). 中國植物志[M]. 北京:科學(xué)出版社,1993:312-314
[16]MCELJANNON W S,MILLS H A. The influence of N concentration and NO3/NH4 ratio on the growth of lima and snap bean and southern field pea seedlings[J]. Communications in Soil Science amp; Plant Analysis,1977,8(8):677-687
[17]DOYLE J. A rapid DNA isolation procedure for small quantities of fresh leaf tissue[J]. Phytochem Bull,1987(19):11-15
[18]NICOLAS D,PATRICK M,GUILLAUME S,et al. NOVOPlasty:de novo assembly of organelle genomes from whole genome data[J]. Nucleic Acids Research,2023,45(4):e18
[19]TILLICH M L,EHWARK P,PELLIZZER T,et al. GeSeq-versatile and accurate annotation of organelle genomes[J]. Nucleic acids research,2017,45(W1):W6-W11
[20]XIAO J Q,MICHAEL J,MOOR E,et al. PGA:a software package for rapid,accurate,and flexible batch annotation of plastomes[J]. Plant Methods,2019,15(1):1-12
[21]CHAN P P,OWELT M. tRNAscan-SE:Searching for tRNA Genes in Genomic Sequences[J]. Methods in Molecular Biology (Clifton,N.J.),2019,1962:1-14
[22]MARC L O. OrganellarGenomeDRAW-a suite of tools for generating physical maps of plastid and mitochondrial genomes and visualizing expression data sets[J]. Nucleic acids research,2013,41(W1):W575-W581
[23]SHARPL P M,LI W H. The codon Adaptation Index--a measure of directional synonymous codon usage bias,and its potential applications[J]. Nucleic Acids Research,1987,15(3):1281-1295
[24]GARY B.Tandem repeats finder:a program to analyze DNA sequences[J]. Nucleic Acids Research,1999,(2):573-580
[25]LI Q,WAN J M. SSRHunter:Development of a local searching software for SSR sites[J]. Heredity,2005,27(5):3
[26]FRAZER K A,PACHTER L,POLIAKOV A,et al.VISTA:computational tools for comparative genomics[J]. Nucleic Acids Research,2004,(32):273-239
[27]KATOH K,ROZEWICKI J,YAMAADA K D. MAFFT online service:multiple sequence alignment,interactive sequence choice and visualization[J]. Briefings in Bioinformatics,2019,20(4):1160-1166
[28]ROZAS J,F(xiàn)ERRZR M A,SANCHEZ D B J C,et al. DnaSP 6:DNA sequence polymorphism analysis of large data sets[J]. Molecular Biology and Evolution,2017,34(12):3299-3302
[29]LAM T N,SCHMIDT H A,ARNDT V H,et al. IQ-TREE:A fast and effective stochastic algorithm for estimating maximum-likelihood phylogenies[J]. Molecular Biology amp; Evolution,2015(1):268-274
[30]JAMAL S,ERIKA S,NICHOLAS E,et al. Evolutionary and biotechnology implications of plastid genome variation in the inverted-repeat-lacking clade of legumes[J]. Plant Biotechnology Journal,2014,12(6):743-754
[31]SHUANG W,JIN Y C,YING L,et al. Extensive genomic rearrangements mediated by repetitive sequences in plastomes of Medicago and its relatives[J]. BMC Plant Biology,2021,21(1):421
[32]IN S C,ROBERT J,TRACEY R. Lost and found:Return of the inverted repeat in the legume clade defined by its absence[J]. Genome Biology and Evolution,2019,11(4):1321-1333
[33]LI X Q. Somatic genome variation in animals,plants,and microorganisms[M]. Hoboken,NJ:John Wiley amp; Sons Inc.,2017:119-163
[34]ZHU A D,GUO W H,GUPTA S,et al. Evolutionary dynamics of the plastid inverted repeat:the effects of expansion,contraction,and loss on substitution rates[J]. The New Phytologist,2016,209(4):1747-1756
[35]陳東明. 禾谷鐮孢菌β-微管蛋白基因內(nèi)含子對(duì)多菌靈藥敏性的調(diào)控研究[D]. 南京:南京農(nóng)業(yè)大學(xué),2019:1-74
[36]高穎. 基于比較基因組學(xué)的植物內(nèi)含子特征特性分析及其在煙草中的解析[D]. 泰安:山東農(nóng)業(yè)大學(xué),2021:1-60
[37]SCOTT W R,DAVID P. Patterns of intron loss and gain in plants:intron loss-dominated evolution and genome-wide comparison of O. sativa and A. thaliana[J]. Molecular Biology and Evolution,2007,24(1):171-181
[38]張尚宏,屈良鵠. 基因組的進(jìn)化與內(nèi)含子中的基因的進(jìn)化[J]. 中山大學(xué)學(xué)報(bào):自然科學(xué)版,1999,38(1):1-15
[39]楊宇飛. 擬南芥和琴葉擬南芥中內(nèi)含子丟失和突變率關(guān)系[D]. 北京:北京師范大學(xué),2013:1-80
[40]MAYA B,HANAH M. Variation in global codon usage bias among prokaryotic organisms is associated with their lifestyles[J]. Genome Biology,2011,12(10):R109
[41]郝新艷,劉嘉偉,米福貴. 雜花苜蓿葉綠體基因組密碼子使用偏好性分析[J/OL]. https://kns.cnki.net/kcms2/detail/46.1068.S.20230524.1400.012.html,2023-05-25/2023-12-08
[42]HUABO L,YI Z L,BAO L L,et al. Codon usage by chloroplast gene is bias in Hemiptelea davidii[J]. Journal of Genetics,2020,99(1):1-11
[43]杜明川,王偉,鮑海娟,等. 葫蘆巴葉綠體基因組密碼子偏好性分析[J]. 草地學(xué)報(bào),2024,32(2):409-418
[44]喻鳳,韓明. 紫花苜蓿葉綠體基因組密碼子偏好性分析[J]. 廣西植物,2021,41(12):2069-2076
[45]楊國鋒,蘇昆龍,趙怡然,等. 蒺藜苜蓿葉綠體密碼子偏好性分析[J]. 草業(yè)學(xué)報(bào),2015,24(12):171-179
[46]MAUREIRA I J,PFERI B E,AMORNTIP M,et al. The reticulate history of Medicago (Fabaceae)[J]. Systematic biology,2008,57(3):466-482
[47]BENA G. Molecular phylogeny supports the morphologically based taxonomic transfer of the ‘medicagoid’ Trigonella species to the genus Medicago L.[J]. Plant Systematics and Evolution,2001,229(3-4):217-236
[48]田春育,李志勇,劉倩,等. 苜蓿屬不同物種葉綠體基因組結(jié)構(gòu)比較及親緣關(guān)系分析[J]. 中國草地學(xué)報(bào),2021,43(10):1-8
[49]尚曉嵐. ‘太行’扁蓿豆葉綠體基因組結(jié)構(gòu)及系統(tǒng)發(fā)育研究[D]. 太谷:山西農(nóng)業(yè)大學(xué),2022:1-56
(責(zé)任編輯 閔芝智)