摘 要:【目的】分析懸鉤子屬植物葉綠體基因組結(jié)構(gòu)特征和系統(tǒng)演化機(jī)制,為懸鉤子屬物種的分類(lèi)及演化提供分類(lèi)依據(jù),并為DNA條形碼的編制和懸鉤子屬植物的保護(hù)提供理論支持?!痉椒ā坷蒙镄畔W(xué)及比較基因組學(xué)的方法對(duì)16種懸鉤子屬植物葉綠體基因組的大小、結(jié)構(gòu)、組成、重復(fù)序列、邊界擴(kuò)張、基因組共線性、正向選擇作用及系統(tǒng)發(fā)育進(jìn)行了分析?!窘Y(jié)果】16種植物的葉綠體基因組都具有典型的四聯(lián)體結(jié)構(gòu),長(zhǎng)度為155 286~156 668 bp,平均GC含量為37.15%,基因組大小變異整體較小,其中SSC區(qū)域和IR區(qū)域的長(zhǎng)度更為穩(wěn)定。在編碼基因的功能分類(lèi)中發(fā)現(xiàn)僅8種懸鉤子屬植物具有2個(gè)完整拷貝的ycf1基因且一些基因在部分植物中只有單個(gè)拷貝。邊界擴(kuò)張分析結(jié)果顯示,反向重復(fù)區(qū)邊界不存在明顯的收縮或擴(kuò)張現(xiàn)象。共線性與系統(tǒng)發(fā)育分析結(jié)果顯示,太平莓與其余15種植物具較高的相似度,有良好的共線性關(guān)系;太平莓與柔毛梨葉懸鉤子、竹葉雞爪茶的親緣關(guān)系較近,但太平莓與竹葉雞爪茶的相似度最低。對(duì)懸鉤子屬植物進(jìn)行Taijima’ test分析發(fā)現(xiàn)懸鉤子屬植物有群體擴(kuò)張的趨勢(shì),且蛋白質(zhì)編碼基因具有一定程度的純化選擇或中性選擇作用。【結(jié)論】懸鉤子屬植物葉綠體基因組高度保守,物種間親緣關(guān)系越近,葉綠體基因組相似性越高,反之并不成立。根據(jù)葉綠體基因組的序列,可以定位它們?cè)谙到y(tǒng)發(fā)育樹(shù)中的位置,并分析它們之間的親緣關(guān)系。
關(guān)鍵詞:懸鉤子屬;葉綠體基因組;重復(fù)序列;變異位點(diǎn);系統(tǒng)發(fā)育關(guān)系
中圖分類(lèi)號(hào):S792.95 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1673-923X(2024)04-0148-11
基金項(xiàng)目:國(guó)家自然科學(xué)基金項(xiàng)目(32301126);安徽省高等學(xué)??茖W(xué)研究項(xiàng)目(2022AH051034);安徽省大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練項(xiàng)目(S202310372079)。
Structural characteristics and phylogenetic evolution of chloroplast genomes in Rubus genus
JIANG Zhuanzhuan, CHEN Shuna, BAO Hongyan, YE Longyu
(a. College of Life Science; b. The Province Key laboratory of the Biodiversity Study and Ecology Conservation in Southwest College, Anqing Normal University, Anqing 246133, Anhui, China)
Abstract:【Objective】The study provides a basis for the classification and evolution of Rubus, which provides theoretical support for DNA barcoding and protection of Rubus species.【Method】Using bioinformatics and comparative genomics methods to analyze the chloroplast genome size, structure, composition, repeats, boundary extension, genomic collinearity, forward selection and phylogeny of 16 Rubus.【Result】The chloroplast genome of 16 plants had a typical tetrad structure, length of 155 286 bp to 156 668 bp, 37.15% of average GC content. The variation of genome size was small and the length of SSC region and IR region was more stable. In the functional classification of coding genes, it was found that only eight Rubus species had two full copies of ycf1 gene and some genes had only a single copy in some plats. The results of boundary expansion analysis showed that there was no obvious contraction or expansion in the boundary of the reverse repetition region. The results of collinearity and phylogenetic analysis showed that there was a high similarity between R. pacificus and the other 15 plants. R. pacificus and R. pyrifolius var. Permollis, R. bambusarum were close relatives, but had the lowest similarity with R. bambusarum. The Taijima’ test analysis showed that there was a tendency of population expansion in Rubus, and protein-coding genes had a certain degree of purification selection or neutral selection.【Conclusion】The chloroplast genome of Rubus is highly conserved, the closer the relationship between species, the higher the chloroplast genome similarity, but the reverse is not true. Based on the sequence of chloroplast genomes, we can locate them in the phylogenetic tree and analyze their relationship.
Keywords: Rubus; chloroplast genome; repetitive sequence; mutation site; phylogenetic relationship
懸鉤子屬Rubus為落葉系常綠灌木、半灌木或是多年生匍匐草本植物,種類(lèi)眾多且分布非常廣泛,除了南極洲以外所有大洲均有分布,北溫帶分布最為廣泛,我國(guó)是該屬植物的種類(lèi)多樣性中心,共有204種100變種,特有種138種,占亞洲種數(shù)的97%,全國(guó)各地均有分布,西南地區(qū)是主要分布地區(qū),占全國(guó)總數(shù)的69.4%[1]。懸鉤子屬果實(shí)營(yíng)養(yǎng)價(jià)值高,超氧化物歧化酶(Superoxide dismutase,SOD)含量比絕大多數(shù)水果都高,因此被譽(yù)為“生命之果”[2]。懸鉤子屬是開(kāi)花植物的系統(tǒng)發(fā)育研究中極具挑戰(zhàn)性的屬之一,也是研究植物生殖進(jìn)化的良好材料。懸鉤子屬物種界限較模糊,形態(tài)變異豐富且存在趨同進(jìn)化,多倍化、雜交及無(wú)融合生殖現(xiàn)象也較為普遍[3]。
隨著生物信息學(xué)分析技術(shù)的不斷完善,基因組信息已廣泛應(yīng)用于系統(tǒng)發(fā)育等方面的研究。葉綠體是一種半自主復(fù)制的細(xì)胞器,擁有一套獨(dú)立且完整的基因組,其是植物進(jìn)行光合作用的場(chǎng)所,植物光能利用效率取決于其葉的葉綠素含量[4],故葉綠體在植物的生命活動(dòng)中承擔(dān)著重要的角色。懸鉤子屬植物不僅具有重要的食用價(jià)值還有非常高的經(jīng)濟(jì)價(jià)值,研究該屬屬內(nèi)系統(tǒng)演化關(guān)系對(duì)于種質(zhì)資源的保護(hù)有著十分重要的意義。葉綠體單親遺傳比雙親遺傳的現(xiàn)象在種子植物中更為常見(jiàn),其中,大多數(shù)被子植物和部分裸子植物的主要遺傳方式是母系遺傳[5]。在大多數(shù)被子植物中,葉綠體基因組分成四個(gè)部分:一個(gè)小單拷貝(Small single copy,SSC)區(qū)域、一個(gè)大單拷貝(Large single copy,LSC)區(qū)域和兩個(gè)長(zhǎng)度相同的反向重復(fù)(Inverted repeat region,IRs)區(qū)域[6],有結(jié)構(gòu)穩(wěn)定,高度保守,分子進(jìn)化速率慢以及分子量較小的特點(diǎn),可作為分子標(biāo)記技術(shù)[7]。葉綠體基因組中的簡(jiǎn)單重復(fù)序列(SSR)會(huì)影響染色體的空間構(gòu)象和編碼序列的表達(dá)。因此,此方面的研究有利于開(kāi)發(fā)新的SSR標(biāo)記用于遺傳多樣性的分析及物種的鑒定[8]。在基因的組成和結(jié)構(gòu)方面,葉綠體基因組比核基因組以及線粒體基因組更加保守,但在某些被子植物中也出現(xiàn)過(guò)葉綠體基因組中基因的丟失、增加或轉(zhuǎn)移的現(xiàn)象[9-10]。如今測(cè)序技術(shù)取得進(jìn)步,葉綠體基因組數(shù)據(jù)庫(kù)也迅速增加,但目前仍缺乏統(tǒng)一的懸鉤子屬分類(lèi)系統(tǒng),且現(xiàn)有的大量孢粉學(xué)、細(xì)胞學(xué)及分子分類(lèi)學(xué)等研究結(jié)果與分類(lèi)系統(tǒng)的屬下劃分存在不少分歧,因此,懸鉤子屬的分類(lèi)研究仍有待完善[11]。
本研究基于系統(tǒng)的比較基因組學(xué)研究方法對(duì)16種懸鉤子屬植物的葉綠體基因組的結(jié)構(gòu)特征進(jìn)行分析,并通過(guò)系統(tǒng)發(fā)育分析確定它們的親緣關(guān)系及其在懸鉤子屬中的發(fā)育地位,進(jìn)而為確定它們之間的物種界限和物種的分類(lèi)及演化提供依據(jù)。植物葉綠體全基因組序列攜帶的遺傳信息,可為物種分類(lèi)鑒定和種間遺傳進(jìn)化關(guān)系提供有效的手段,故本研究可為更為廣泛的懸鉤子屬植物的系統(tǒng)進(jìn)化提供優(yōu)良的潛在分子標(biāo)記位點(diǎn),同時(shí)為懸鉤子屬種內(nèi)的關(guān)系重建提供更好的指導(dǎo),幫助探索其在薔薇科內(nèi)的系統(tǒng)發(fā)育位置。
1 材料與方法
1.1 懸鉤子屬植物葉綠體基因組序列
從NCBI的基因組數(shù)據(jù)庫(kù)中(www.ncbi.nlm. nih.gov\genome)下載了16種懸鉤子屬植物的葉綠體基因組序列,具體的物種信息和序列編號(hào)如表1所示。
1.2 葉綠體基因組序列組成及重復(fù)序列
葉綠體基因組的重復(fù)結(jié)構(gòu)有正向、回文、互補(bǔ)和反向共4種,利用REPuter(https://bibiserv. cebitec.uni-bielefeld.de/reputer/)進(jìn)行長(zhǎng)重復(fù)序列(LSC)分析[12],漢明距離設(shè)置為3,最小重復(fù)單元為30 bp,最大重復(fù)大小為1 000 bp。利用MISA對(duì)16種植物葉綠體基因組中的簡(jiǎn)單重復(fù)序列(Simple sequence repeat,SSR)進(jìn)行分析[13],單核苷酸(Mono-nucleotide)SSR、二核苷酸(Di-nucleotide)SSR、三核苷酸(Tri-nucleotide)SSR、四核苷酸(Tetra-nucleotide)SSR、五核苷酸(Penta-nucleotide)SSR和六核苷酸(Hexanucleotide)SSR的最小重復(fù)值分別設(shè)置為10、5、4、3、3和3,每2個(gè)SSR最小間隔100 bp。
1.3 懸鉤子屬植物的編碼基因的統(tǒng)計(jì)與分析
利用在線工具Geseq(https://chlorobox.mpimpgolm.mpg.de/geseq.html)和Geneious Prime軟件完成編碼基因的統(tǒng)計(jì)[14],并使用Excel 2013軟件對(duì)統(tǒng)計(jì)的編碼基因進(jìn)行差異分析,了解懸鉤子屬植物葉綠體基因組的特征。并以太平莓(NC-064142.1)的葉綠體基因組作為參考序列,使用mVISTA在線工具對(duì)16個(gè)懸鉤子屬物種葉綠體基因組序列進(jìn)行分析[15]。
1.4 葉綠體基因組LSC、SSC和IR邊界擴(kuò)張
通過(guò)RStudio和IRscope軟件進(jìn)行16種懸鉤子屬植物葉綠體基因組的LSC、SSC和IR區(qū)域邊界的可視化[16],了解LSC、SSC和IR區(qū)域大小的收縮與擴(kuò)張現(xiàn)象并定位在邊界上的基因差異。
1.5 構(gòu)建系統(tǒng)發(fā)育樹(shù)及共線性分析
以太平莓(NC-064142.1)作為外群,基于16種懸鉤子屬植物葉綠體全基因組序列,使用MAFFT v 5.0軟件進(jìn)行多重序列對(duì)比[17]。將序列兩端對(duì)齊,并保存為fasta格式待用。將16種懸鉤子屬植物的葉綠體基因組文件分為兩個(gè)文件,一個(gè)是單獨(dú)的太平莓葉綠體基因組文件,另一個(gè)是其余15種植物的葉綠體基因組文件。利用Circoletto(http://tools.bat.infspire.org/circoletto/)在線工具對(duì)16種懸鉤子屬植物進(jìn)行共線性分析[18],重建懸鉤子屬植物的系統(tǒng)發(fā)育關(guān)系。通過(guò)MEGA 11軟件,采用鄰接法(Neighbor-Joining)構(gòu)建系統(tǒng)發(fā)育樹(shù)[19]。
1.6 分子鑒定標(biāo)記與蛋白質(zhì)編碼基因的純化選擇
作用
對(duì)16種懸鉤子屬植物的葉綠體編碼蛋白進(jìn)行進(jìn)化速率分析,了解蛋白編碼序列的親緣關(guān)系。使用DNAsp6軟件進(jìn)行Ka/Ks分析[20],參數(shù)調(diào)整為:核苷酸序列(Nucleotide Sequence)選擇DNA,基因組倍型(Genomic State)選擇二倍體(Diploid),染色體的位置選擇葉綠體(Chloroplast),選擇使用的密碼子并為數(shù)據(jù)選擇一種密碼子表(Nuclear universal),多樣性分析時(shí)Window length設(shè)置為 600,Step size值設(shè)置為200,其余設(shè)置系統(tǒng)默認(rèn),點(diǎn)Syonymous and Non-Synonymous Substitutions后得到Ka與Ks的值再進(jìn)行計(jì)算Ka/Ks值,統(tǒng)計(jì)數(shù)據(jù)后使用ChiPlot(https://www.chiplot.online)在線繪圖工具繪制Ka/Ks熱圖。通過(guò)計(jì)算Ka/Ks預(yù)測(cè)懸鉤子屬植物的整體發(fā)展趨勢(shì),判斷選擇壓力在非同義替換的過(guò)程中所起的作用。進(jìn)行中性檢驗(yàn)選擇Taijima’test,為正值時(shí)說(shuō)明序列進(jìn)化方式為平衡選擇或群體收縮;負(fù)值時(shí)說(shuō)明負(fù)向選擇或群體擴(kuò)張。如果差異顯著,則認(rèn)為目標(biāo)序列的進(jìn)化不遵循中性模型,反之遵循。值為0時(shí)為中性選擇。
2 結(jié)果與分析
2.1 懸鉤子屬植物的葉綠體基因組結(jié)構(gòu)特征
從NCBI的Genome數(shù)據(jù)庫(kù)中共下載了16種懸鉤子屬植物的葉綠體基因組,對(duì)其葉綠體基因組序列和編碼基因進(jìn)行了統(tǒng)計(jì)與比較(表1)。如表1所示十六種植物葉綠體基因組的大小為155 286 bp(紫色懸鉤子R. irritans)~156 668 bp(北懸鉤子R. arcticus)。16種懸鉤子屬植物GC含量無(wú)明顯差異,介于36.9%和37.3%之間,平均值為37.15%。由可視化分析可知,16種懸鉤子屬植物的每個(gè)基因組都包括一個(gè)大單拷貝區(qū)域(LSC)、一個(gè)小單拷貝區(qū)域(SSC)和兩個(gè)分開(kāi)的反向重復(fù)區(qū)域(IRa/b),其中LSC區(qū)域長(zhǎng)度為84 613 bp(紫色懸鉤子R. irritans)~85 958 bp(北懸鉤子R. arcticus),占總長(zhǎng)度的54.49%~54.87%,SSC區(qū)域長(zhǎng)度為18 623 bp(菰帽懸鉤子R. pileatus)~18,867 bp(柔毛梨葉懸鉤子R. pyrifolius var. Permollis),占總長(zhǎng)度的11.93%~12.04%,和兩者之間的IR區(qū)域25 369 bp(蓬蘽R. hirsutus)~25 997 bp(菰帽懸鉤子R. pileatus),占總長(zhǎng)度的16.34%~16.59%。3個(gè)結(jié)構(gòu)區(qū)長(zhǎng)度占葉綠體基因組總長(zhǎng)度的比例較穩(wěn)定,基因組大小變異整體較小,其中SSC區(qū)域和IR區(qū)域的長(zhǎng)度更為穩(wěn)定,平均長(zhǎng)度分別為18 684、25 821 bp,LSC區(qū)域的平均長(zhǎng)度為85 544 bp。
2.2 懸鉤子屬植物葉綠體基因組具有高度保守性
16種植物長(zhǎng)重復(fù)序列總數(shù)平均為78.4,平均長(zhǎng)重復(fù)序列數(shù)目大小為2 675,正向重復(fù)數(shù)目和回文重復(fù)數(shù)目接近,平均重復(fù)數(shù)分別為1 231和1 170,平均分別占重復(fù)序列總數(shù)44.8%和42.6%。互補(bǔ)重復(fù)數(shù)目最少,占17.6%。紫色懸鉤子的重復(fù)序列數(shù)量含量最少,僅含30個(gè)正向重復(fù),30個(gè)回文重復(fù)和2個(gè)反向重復(fù)。其中插田泡、牛疊肚、蓬蘽、柔毛梨葉懸鉤子和小葉懸鉤子所含的長(zhǎng)重復(fù)序列較高(圖1)。在16個(gè)懸鉤子葉綠體基因組中共檢測(cè)到了1 262條重復(fù)序列及826個(gè)SSR位點(diǎn)。
簡(jiǎn)單重復(fù)序列的重復(fù)次數(shù)決定重復(fù)堿基序列的長(zhǎng)度,從而影響著簡(jiǎn)單重復(fù)序列的多態(tài)性[21]。在16個(gè)物種的葉綠體基因組中只發(fā)現(xiàn)了重復(fù)基序分別為1、2和3個(gè)堿基的SSR序列,其中重復(fù)基序?yàn)?個(gè)堿基的只在北懸鉤子R. arcticus、紫色懸鉤子R. irritans、白花懸鉤子R. leucanthus和白葉莓R .innominatus四種葉綠體基因組中存在。重復(fù)基序?yàn)?個(gè)堿基的占比最多,約占總SSR大小的86.2%,其中山莓R. corchorifolius的1個(gè)重復(fù)基序類(lèi)型大小最大,為670 bp;北懸鉤子R. arcticus的1個(gè)重復(fù)基序類(lèi)型大小最小,為455 bp(表2、圖1)。
2.3 編碼基因的功能分類(lèi)
根據(jù)基因功能將懸鉤子屬葉綠體基因組的基因分為自我復(fù)制的基因、光合作用有關(guān)的基因、其他功能的基因和未知功能的基因共4大類(lèi)。由編碼基因列表(表3)可知,自我復(fù)制的基因?yàn)?9種,光合作用相關(guān)的基因?yàn)?8種,其他功能的基因?yàn)?個(gè),未知功能的基因?yàn)?種(ycf1和ycf2)。已知功能的基因組成如下:1)與自我復(fù)制有關(guān)的基因包括核糖體rna,轉(zhuǎn)運(yùn)rna,和編碼蛋白質(zhì)基因,它們都位于反向重復(fù)區(qū),其中核糖體rna與DNA依賴性RNA聚合酶有關(guān),trnA與核糖體大小亞基有關(guān);2)與光合作用有關(guān)的基因與細(xì)胞色素亞基,ATP合酶NADH氧化還原酶蛋白等有關(guān),還有一個(gè)編碼rbcL基因;3)其他基因共6個(gè):matK、clpP、cemA、accD、ccsA、infA。
16種植物中僅牛疊肚、蓬蘽、紫色懸鉤子、小葉懸鉤子、山莓、盾葉莓、白花懸鉤子、菰帽懸鉤子等8種懸鉤子屬植物具有2個(gè)完整拷貝的ycf1基因,另外的8種植物的葉綠體基因組ycf1基因發(fā)生了單個(gè)拷貝隨機(jī)丟失現(xiàn)象。一些基因在部分植物中只有單個(gè)拷貝,僅trnA-UAC、trnR-ACG、trnV-GAC、rps、rpl2、ndhB和ycf2共7種基因在16種植物中均存在2個(gè)完整的拷貝。湖南懸鉤子比其他15種植物多2種基因ycf15和rps18,ycf15基因位于IRB區(qū),其高度保守,rps18基因位于LSC區(qū)。
2.4 懸鉤子屬植物葉綠體基因組的結(jié)構(gòu)變異
由LSC、SSC和IR區(qū)邊界擴(kuò)張圖(圖2)可知,懸鉤子屬的反向重復(fù)區(qū)邊界較穩(wěn)定,僅發(fā)生了小幅度的變異。LCS-IRB邊界除了白花懸鉤子,其余均位于rps19和rpl12之間,rps19距離邊界13~24 bp。大多數(shù)物種的IRB-SSC邊界邊界靠近SSC區(qū)域的ndhF,僅插田泡、蓬蘽、小葉懸鉤子、盾葉莓、白花懸鉤子和菰帽懸鉤子位于ycf1內(nèi),并超出了IRB-SSC邊界5~26 bp。除灰白毛莓、紫色懸鉤子和山莓三種植物,SSC-IRA邊界均位于ycf1內(nèi)部。
2.5 共線性分析與系統(tǒng)發(fā)育樹(shù)的構(gòu)建
由共線性分析結(jié)果(圖3)可知,本研究的16種懸鉤子屬內(nèi)部無(wú)葉綠體基因組重排現(xiàn)象及明顯的倒位現(xiàn)象,葉綠體基因排列順序較為一致。以太平莓為參照物種,其與另外15種懸鉤子屬植物具較高的相似度,有良好的共線性關(guān)系。其中,太平莓R. pacificus與柔毛梨葉懸鉤子R. pyrifolius var. Permollis相似度最高,與竹葉雞爪茶R. bambusarum相似度最低。由系統(tǒng)進(jìn)化樹(shù)(圖4)知,太平莓與柔毛梨葉懸鉤子親緣關(guān)系十分接近,而與竹葉雞爪茶也較為親近,與小葉懸鉤子R. taiwanicola的相似度最低。結(jié)合系統(tǒng)發(fā)育樹(shù)比較分析知,物種間親緣關(guān)系越近,葉綠體基因組相似性越高,反之并不成立。系統(tǒng)發(fā)育樹(shù)分支的檢驗(yàn)值與物種關(guān)系可信度成正比,圖4顯示分支的檢驗(yàn)值均不低于95,由此可見(jiàn)物種關(guān)系的可信度較高。但不可忽視葉綠體基因組在系統(tǒng)發(fā)育研究中存在的一些問(wèn)題,比如,系統(tǒng)誤差或隨機(jī)誤差可能會(huì)導(dǎo)致基于不同序列的系統(tǒng)發(fā)育結(jié)果不一致,或基因樹(shù)與物種樹(shù)不一致,或基因樹(shù)有很高的支持率卻無(wú)法反應(yīng)其相應(yīng)的系統(tǒng)發(fā)育關(guān)系,以及葉綠體的單親遺傳性質(zhì)引起的僅能反應(yīng)父系或母系的進(jìn)化歷程等[22]。
2.6 懸鉤子屬植物的蛋白質(zhì)編碼基因有一定的純化或中性選擇作用
將懸鉤子屬植物進(jìn)行Taijima’test分析,結(jié)果為負(fù)值(-1.36 088),說(shuō)明懸鉤子屬植物有群體擴(kuò)張的趨勢(shì)。Ka/Ks分析結(jié)果(圖5)顯示,16種懸鉤子屬植物的Ka/Ks值整體較低,范圍是0.86~1.60,最大值為灰白毛莓與柔毛梨葉懸鉤子和湖南懸鉤子與梨葉懸鉤子的比較結(jié)果,最小值為山莓與菰帽懸鉤子的比較結(jié)果。大部分值小于1或接近1,表明懸鉤子屬植物的蛋白質(zhì)編碼基因具有一定程度的純化選擇或中性選擇作用。
3 討論與結(jié)論
3.1 討 論
在過(guò)去的幾十年中,少量基因廣泛應(yīng)用于分子系統(tǒng)發(fā)育研究,但發(fā)現(xiàn)基于不同DNA片段對(duì)同一類(lèi)群的研究結(jié)果之間存在差異,部分類(lèi)群存在序列片段缺失等問(wèn)題[23]。懸鉤子屬是薔薇科的一個(gè)的重要的屬,但前人研究的懸鉤子屬植物數(shù)目有限,并未得到很好的研究。本研究對(duì)懸鉤子屬16種植物進(jìn)行葉綠體基因組的組裝及注釋,對(duì)懸鉤子屬葉綠體基因組的大小、結(jié)構(gòu)及組成、重復(fù)序列與SSR以及正向選擇進(jìn)行比較分析,初步揭示了懸鉤子屬葉綠體基因組大小、結(jié)構(gòu)進(jìn)化的特點(diǎn),奠定了懸鉤子屬葉綠體系統(tǒng)發(fā)育基因組學(xué)的研究基礎(chǔ)。16種懸鉤子屬植物的葉綠體基因組均為大單拷貝區(qū)、小單拷貝區(qū)和兩個(gè)反向重復(fù)區(qū)組成的典型四分結(jié)構(gòu)。全基因組序列整體變異程度較低,變異主要發(fā)生在LSC區(qū)域,IR區(qū)域最為保守。包含129~132個(gè)總基因,84~88個(gè)蛋白質(zhì)編碼基因,35~37個(gè)tRNA和8個(gè)rRNA。葉綠體基因組大小為155 286~156 668 bp,平均GC含量為37.15%。重復(fù)序列分析結(jié)果表明懸鉤子屬植物葉綠體基因組具有高度保守性。陸地植物葉綠體基因組的基因含量較為保守,一般包含100~120個(gè)獨(dú)立基因[24]。重復(fù)序列是基因調(diào)控的重要組成部分,不同類(lèi)型重復(fù)序列的組成會(huì)影響植物的遺傳與進(jìn)化[25]。ycf1基因在大部分的被子植物中具有兩個(gè)拷貝,一個(gè)拷貝為完整基因,另一個(gè)拷貝則被反向重復(fù)區(qū)與小單拷貝區(qū)的邊界截?cái)?,成為了一個(gè)假基因[26]。ycf1基因被認(rèn)為是陸地植物葉綠體基因組變化最大的區(qū)域之一,可作為核心條形碼[27]。目前普遍認(rèn)為,IR區(qū)域的收縮與擴(kuò)張是導(dǎo)致被子植物葉綠體基因組大小變化、基因變異和缺失、偽基因產(chǎn)生的主要原因,因此葉綠體基因組在不同植物中的大小各不相同[28]。反向重復(fù)區(qū)邊界不存在明顯的收縮或擴(kuò)張,葉綠體基因組的重排檢驗(yàn)結(jié)果表現(xiàn)為良好的共線性。結(jié)合系統(tǒng)發(fā)育關(guān)系和共線性分析可知,葉綠體基因組相似性越高,物種間親緣關(guān)系越近,反之并不成立。對(duì)懸鉤子屬植物進(jìn)行Taijima’ test分析發(fā)現(xiàn)懸鉤子屬植物有群體擴(kuò)張的趨勢(shì),由Ka/Ks值大部分小于1或接近1可見(jiàn)此屬植物的蛋白質(zhì)編碼基因具有一定程度的純化選擇或中性選擇作用。葉綠體基因組序列矩陣,最大程度地保留原始數(shù)據(jù),信息丟失少,包含的基因數(shù)目多,能夠彌補(bǔ)少數(shù)葉綠體片段聯(lián)合分析中信息位點(diǎn)不足而導(dǎo)致分辨率及支持率低的問(wèn)題,能較全面地反映系統(tǒng)發(fā)育關(guān)系[29]。本研究雖了解了懸鉤子屬內(nèi)組間的關(guān)系,但懸鉤子屬亞種及其他物種之間的系統(tǒng)發(fā)育關(guān)系未能很好地分析,因此在下一步研究中需要擴(kuò)大樣本的數(shù)量,加強(qiáng)形態(tài)學(xué)分類(lèi)學(xué)以及分子系統(tǒng)學(xué)的結(jié)合,利用更豐富的核基因組數(shù)據(jù),完善懸鉤子屬的分類(lèi)研究,揭示更真實(shí)可靠的物種樹(shù)面貌。
3.2 結(jié) 論
本研究對(duì)懸鉤子屬葉綠體基因組的結(jié)構(gòu)、大小及基因組成、重復(fù)序列與SSR序列變異進(jìn)行了比較分析,揭示了葉綠體基因組大小、結(jié)構(gòu)進(jìn)化的特點(diǎn)。結(jié)果表明,16種懸鉤子屬在結(jié)構(gòu)、大小、基因組成以及GC含量上都較為保守,葉綠體基因組在種內(nèi)出現(xiàn)序列重排現(xiàn)象且重排發(fā)生在SSC與IR區(qū)域內(nèi),如今仍有大量懸鉤子屬植物的葉綠體基因組尚未測(cè)序,因此需要進(jìn)行更豐富的測(cè)序與分析,全面揭示懸鉤子屬葉綠體基因組演化的真實(shí)面貌。本研究可為懸鉤子屬植物的系統(tǒng)進(jìn)化分析和物種鑒定等相關(guān)研究提供理論參考。
參考文獻(xiàn):
[1] 徐玉芬.中國(guó)懸鉤子屬葉綠體系統(tǒng)發(fā)育基因組學(xué)研究[D].廣州:仲愷農(nóng)業(yè)工程學(xué)院,2020,33:1-40. XU Y F. Phylogenetic genomics of chloroplasts of Rubus form China[D]. Guangzhou: Zhongkai University of Agriculture and Engineering,2020,33:1-40.
[2] 司旭,陳芹芹,畢金峰,等.樹(shù)莓主要功能性成分研究進(jìn)展[J].食品工業(yè)科技,2015,36(4):376-381. SI X, CHEN Q Q, BI J F, et al. Research progress in main functional compounds in raspberry[J]. Science and Technology of Food Industry,2015,36(4):376-381.
[3] SOCHOR M, VA?UT R J, SHARBEL T F, et al. How just a few makes a lot: speciation via reticulation and apomixis on example of European brambles (Rubus subgen. Rubus, Rosaceae)[J]. Molecular Phylogenetics and Evolution,2015,89:13-27.
[4] 陳夢(mèng)秋,張日清,蔡婭,等.香花油菜不同無(wú)性系葉表型性狀及葉綠素含量的差異[J].經(jīng)濟(jì)林研究,2023,41(2):102-109. CHEN M Q, ZHANG R Q, CAI Y, et al. Analysis of leaf phenotypic characters and leaf phenotypic character of different clones in Camellia osmantha[J]. Non-wood Forest Research,2023,41(2): 102-109.
[5] SODMERGEN Q Z. Why does biparental plastid inheritance revive in angiosperms?[J]. Journal of Plant Research,2010,123(2): 201-206.
[6] LIANG H, ZHANG Y, DENG J B, et al. The complete chloroplast genome sequences of 14 curcuma species: insights into genome evolution and phylogenetic relationships within zingiberales[J]. Frontiers in Genetics,2020,11:802-819.
[7] DANIEL H, LIN C S, YU M, et al. Chloroplast genomes: Diversity, evolution, and applications in genetic engineering[J]. GenomeBiology,2016,17(1):132-134.
[8] 趙文植,楊琳懿,曹正英,等.無(wú)毛青藤葉綠體基因組解析及系統(tǒng)發(fā)育分析[J].中南林業(yè)科技大學(xué)學(xué)報(bào),2023,43(5):149-157. ZHAO W Z, YANG L Y, CAO Z Y, et al. Genome analysis and phylogenetic study on Illigera glabra chloroplasts[J]. Journal of Central South University of Forestry Technology,2023,43(5): 149-157.
[9] HADARIOVA L, VESTEG M, HAMPL V, et al. Reductive evolution of chloroplasts in non-photosynthetic plants, algae and protists[J]. Current Genetics,2018,64(2):365-387.
[10] NI Z X, YE Y J, BAI T D, et al. Complete chloroplast genome of Pinus massoniana: gene rearrangements, loss of ndh genes, and short inverted repeats contraction, expansion[J]. Molecules,2017,22(9): 1-13.
[11] YANG J Y, PAK J H. Phylogeny of Korean Rubus (Rosaceae) based on its (nrDNA) and trn L/F intergenic region (cpDNA)[J]. Journal of Plant Biology,2006,49(1):44-54.
[12] KURTZ S, CHOUDHUN J V, OHLEBUSCH E, et al. REPuter: the manifold applications of repeat analysis on a genomic scale[J]. Nucleic Acids Research,2001,29(22):4633-4642.
[13] BEIER S, THIEL T, SCHOLZ U, et al. MISA-web: a web server for microsatellite prediction[J]. Bioinformatics,2017,33(16): 2583-2585.
[14] 賈守,張穎敏,趙國(guó)福,等.頭花杜鵑,隴蜀杜鵑及杜鵑屬植物葉綠體基因組比較分析[J].廣西植物,2023,43(10):1907-1920. JIA S, ZHANG Y M, ZHAO G F, et al. Comparative analysis of chloroplast genomes Rhododendron capitis, Rhododendron longshu and Rhododendron[J]. Guihaia,2023,43(10):1907-1920.
[15] MAYOR C, BRUDNO M, SCHWARTZ J R, et al. VISTA: visualizing global DNA sequence alignments of arbitrary length[J]. Bioinformatics,2000,16(11):1046-1047.
[16] 張珂,孟秀娟.RStudio環(huán)境下數(shù)值變量的可視化方法[J].南方農(nóng)機(jī),2020,51(15):194-195. ZHANG K, MENG X J. Visualization of numerical variables in RStudio environment[J]. Nanfang Agricultural Machinery, 2020,51(15):194-195.
[17] KATOH K, KUMA K I, TOH H, et al. MAFFT version 5: improvement in accuracy of multiple sequence alignment[J].Nucleic Acids Research,2005,33:511-518.
[18] 郭麗麗,盧世雄,乃國(guó)潔,等.草莓PYL基因家族的鑒定與非生物脅迫下的表達(dá)分析[J].農(nóng)業(yè)生物技術(shù)學(xué)報(bào),2020,30(12): 2312-2332. GUO L L, LU S X, NAI G J, et al. Identification and expression analysis of PYL gene family in strawberry under abiotic stress[J]. Journal of Agricultural Biotechnology,2020,30(12):2312-2332.
[19] TAMURA K, STECHER G, KUMAR S. Molecular evolutionary genetics analysis version 11[J]. Molecular Biology and Evolution, 2021,38(7):3022.
[20] 馬孟莉,張薇,孟衡玲,等.草果葉綠體基因組特征及系統(tǒng)發(fā)育分析[J].中草藥,2021,52(19):6023-6031. MA M L, ZHANG W, MENG H L, et al. Characterization and phylogenetic analysis of the complete chloroplast genome of Amomum tsao-ko[J]. Chinese Traditional and Herbal Drugs,2021,52(19): 6023-6031.
[21] 吳林世,廖菊陽(yáng),劉艷,等.基于高通量測(cè)序的羊躑躅葉綠體基因組及SSR序列分析[J].經(jīng)濟(jì)林研究,2022,40(1):123-131. WU L S, LIAO J Y, LIU Y, et al. Analysis of chloroplast genome and SSR sequence of Rhododendron azalea based on highthroughput sequencing[J]. Non-wood Forest Research,2022,40(1): 123-131.
[22] 張韻潔,李德銖.葉綠體系統(tǒng)發(fā)育基因組學(xué)的研究進(jìn)展[J].植物分類(lèi)與資源學(xué)報(bào),2011,33(4):365-375. ZHANG Y J, LI D Z. Advances in phylogenetic genomics of chloroplasts[J]. Plant Diversity and Resources,2011,33(4):365-375.
[23] 王章群,解增言,蔡應(yīng)繁,等.系統(tǒng)發(fā)育基因組學(xué)研究進(jìn)展[J].遺傳,2014(7):669-678. WANG Z Q, XIE Z Y, CAI Y F, et al. Advances in phylogenetic genomics[J]. Heredity,2014(7):669-678.
[24] GUISINGER M M, KUEHL J V, BOORE J L, et al. Extreme reconfiguration of plastid genomes in the angiosperm family geraniaceae: rearrangements, repeats, and codon usage[J]. Molecular Biology and Evolution,2010,28(1):583-600.
[25] KELLER J, ROUSSEAU-GUEUTIN M, MARTIN G E, et al. The evolutionary fate of the chloroplast and nuclear rps16 genes as revealed through the sequencing and comparative analyses of four novel legume chloroplast genomes from Lupinus[J]. DNA Research, 2017,24(4):343-358.
[26] 張妍彤,黃劍,宋菊,等.殼斗科植物葉綠體基因組結(jié)構(gòu)及變異分析[J].植物研究,2018,38(5):757-765. ZHANG Y T, HUANG J, SONG J, et al. Analysis of chloroplast genome structure and variation in Fagaceae Dumort[J]. Botanical Studies,2018,38(5):757-765.
[27] DONG W P, XU C, LI C H, et al. Ycf1, the most promising plastid DNA barcode of land plants[J]. Scientific Reports,2015,5:8348.
[28] ABDULLAH, MEHMOOD F, SHAHZADI I, et al. Chloroplast genome of Hibiscus rosa-sinensis: comparative analyses and identification of mutational hotspots[J]. Genomics,2020,112(1): 581-591.
[29] MA P F, ZHANG Y X, ZENG C X, et al. Chloroplast phylogenomic analyses resolve deep-level relationships of an intractable bamboo tribe Arundinarieae (Poaceae)[J]. Systematic Biology, 2014,63(6):933-950.
[本文編校:羅 列]