鄧永彪 張進 藍倫禮 趙博
摘 要: ???越南小花金花茶(Camellia minima) 是一種珍稀瀕危的金花茶組植物,目前尚未有其葉綠體基因組的相關(guān)研究。該研究利用Illumina HiSeq 2000平臺對越南小花金花茶進行了葉綠體基因組序列的測序、組裝、注釋和分析。結(jié)果表明:(1) 越南小花金花茶葉綠體基因組全長156 961 bp,為典型的四分體結(jié)構(gòu),共注釋到136個基因,其中包含87個蛋白編碼基因、41個tRNA基因和8個rRNA基因。(2) 分析鑒定出66個SSR位點和39個重復(fù)序列。(3) 密碼子偏好使用以A/U結(jié)尾的密碼子,綜合有效密碼數(shù)(ENC)繪圖、PR2-plot和中性分析推測自然選擇是影響密碼子使用模式的主導(dǎo)因素。(4) 邊界分析顯示ycf1基因的長度和位置在不同金花茶組植物間存在差異。(5) 對已發(fā)表的金花茶組植物葉綠體基因組的系統(tǒng)發(fā)育分析發(fā)現(xiàn)越南小花金花茶與小花金花茶聚為一支,親緣關(guān)系最近。該研究結(jié)果為探索物種進化和提高外源基因表達提供了重要的參考信息,同時為后續(xù)的金花茶組植物的保護和利用提供了理論基礎(chǔ)。
關(guān)鍵詞: ?越南小花金花茶, 葉綠體基因組, 特征分析, 系統(tǒng)發(fā)育分析, 密碼子偏好性
中圖分類號: ??Q943
文獻標識碼: ???A
文章編號: ??1000-3142(2024)01-0030-13
Analysis of chloroplast genome features of endangered
and rare plant Camellia minima
DENG Yongbiao, ZHANG Jin, LAN Lunli, ZHAO Bo*
( Pharmacy School, Guilin Medical University, ?Guilin 541199, Guangxi, China )
Abstract: ??Camellia minima, a rare and endangered species of sect. Chrysantha, has not been previously explored in terms of its chloroplast genome. Utilizing the Illumina HiSeq 2000 platform, the chloroplast genome sequence of C. minima was sequenced, assembled, annotated, and analysed. The results were as follows: (1) The chloroplast genome of C. minima was 156 961 bp in length, embodied a typical tetrad structure, and contained 136 annotated genes, including 87 protein-coding genes, 41 tRNA genes, and 8 rRNA genes. (2) The analysis identified 66 SSR loci and 39 repetitive sequences. (3) Codons prefered to use codons ending in A/U. Comprehensive effective number of codons (ENC) mapping, PR2-plot, and neutral analyses suggested natural selection as a primary factor shaping codon usage patterns. (4) Boundary analysis showed ?variation in the length and position of the ycf1 gene among different species of yellow Camellia. (5) Phylogenetic analysis of the chloroplast genomes of published sect. Chrysantha species ?revealed that C. minima was most closely related to C. micrantha. This study provides crucial references for exploring species evolution and enhancing exogenous gene expression, establishing a theoretical foundation for the conservation and utilization of species of sect. Chrysantha in the future.
Key words: ?Camellia minima, chloroplast genome, characteristic analysis, phylogenetic analysis, codon preference
金花茶組(Sect. Chrysantha )隸屬于山茶科(Theaceae)山茶屬(Camellia L.),主要分布在我國的廣西、云南以及越南部分地區(qū)(賽璇,2018)。其生長環(huán)境為人類活動蹤跡較少的喀斯特地貌和潮濕山地等(李桂娥等,2022)。所有金花茶組植物都被列入我國國家重點保護野生植物名錄,保護等級為二級(國家林業(yè)和草原局 農(nóng)業(yè)農(nóng)村部,2021)。金花茶組植物被稱為“植物界的大熊貓”“茶中皇后”,因為該組植物是山茶屬唯一擁有金黃色花瓣的類群(張蕾等,2019; 吳麗君等,2020)。金花茶組植物的花瓣和葉片中含有豐富的黃酮,常被用作保健食品與飲品(劉青等,2021; 賽璇,2018)。金花茶植物由于頻繁的種間雜交和多倍化導(dǎo)致其分類研究十分困難(Zhang et al., 2019)。Wei等(2022)基于雙酶切位點相關(guān)的簡化基因組測序(ddRAD)、轉(zhuǎn)錄組和核糖體內(nèi)部轉(zhuǎn)錄間隔區(qū)(nrITS)等數(shù)據(jù)對20個中國金花茶物種進行系統(tǒng)發(fā)育重建,結(jié)合形態(tài)學(xué)證據(jù)確定了物種之間的親緣關(guān)系。研究表明,強烈的雜交/滲入信號表明網(wǎng)狀進化是造成核基因數(shù)據(jù)和葉綠體基因組數(shù)據(jù)構(gòu)建的系統(tǒng)發(fā)育樹不一致的主要原因。本研究利用基因內(nèi)容較少的葉綠體基因組進行有關(guān)信息的研究,更多完整的葉綠體基因組數(shù)據(jù)的積累將為今后金花茶屬植物的系統(tǒng)發(fā)育和網(wǎng)狀進化關(guān)系的研究提供更多的分子證據(jù),也可以為金花茶組植物的保護與綜合利用提供基礎(chǔ)理論支持。
四分體結(jié)構(gòu)是葉綠體基因組的典型特征,由一個大單拷貝(large single-copy, LSC)區(qū)、一個小單拷貝(small single-copy, SSC)區(qū)和兩個倒置重復(fù)序列(inverted repeats, IRs)顯示和編碼110~130個基因,大小范圍為120~180 kb(Li DM et al., 2021)。相較于核基因組,葉綠體基因組在基因結(jié)構(gòu)、基因內(nèi)容、基因序列方面更加穩(wěn)定,較慢的進化速率,因此被廣泛應(yīng)用于系統(tǒng)發(fā)育、DNA條形碼、基因工程和種群間親緣關(guān)系等研究中(Dong et al., 2018)。近年來葉綠體基因組測序的成本大大降低,越來越多的葉綠體基因組數(shù)據(jù)被成功應(yīng)用于植物系統(tǒng)發(fā)育和進化研究。同時,葉綠體基因組中包含大量的重復(fù)序列是研究物種進化進程以及遺傳特征的重要依據(jù)(Hui et al., 2014),其中簡單重復(fù)序列(SSRs)又稱微衛(wèi)星序列可以作為有效的分子標記來檢測種群多態(tài)性,廣泛應(yīng)用于分子輔助育種和物種保護等方面 (Cavalier, 2002)。密碼子是連接核酸和蛋白質(zhì)的紐帶,在遺傳信息的傳遞過程中具有重要作用(Liu et al., 2012)。研究物種密碼子使用模式并確定最優(yōu)密碼子,有助于設(shè)計基因表達載體來提高目的基因的表達量,在品種改良方面具有重要應(yīng)用價值(Qi et al., 2015; 胡曉艷等,2019)。
越南小花金花茶(C. minima)為金花茶組植物之一,可做觀賞植物和嫁接砧木(George & Anthony, 2015)。目前,尚未有關(guān)于越南小花金花茶葉綠體基因組的相關(guān)研究,限制了對其遺傳特征和系統(tǒng)發(fā)育關(guān)系的理解。為此,本研究利用高通量測序技術(shù)對越南小花金花茶進行了葉綠體全基因組測序組裝,擬探討以下科學(xué)問題:(1) 越南小花金花茶葉綠體基因組圖譜和序列特征;(2)越南小花金花茶葉綠體基因組密碼子使用的偏好性及影響密碼子使用模式主導(dǎo)因素;(3)越南小花金花茶與其近緣物種在IR和SC邊界區(qū)域堿基分布的差異;(4)越南小花金花茶在金花茶組植物系統(tǒng)發(fā)育中的位置。本研究不僅為后續(xù)開展越南小花金花茶物種鑒定、遺傳多樣性分析、葉綠體基因工程以及分子育種等研究提供了重要的理論基礎(chǔ),也為金花茶組植物的系統(tǒng)發(fā)育研究提供了豐富的葉綠體基因組數(shù)據(jù)。
1 材料與方法
1.1 植物材料
越南小花金花茶采集于中國廣西壯族自治區(qū)南寧市金花茶公園(108°21′43″ E、 22°49′30″ N),采集單株新鮮幼嫩的葉片,裝進有硅膠的自封袋內(nèi)低溫保存,用于后續(xù)提取總DNA,標本保存在廣西壯族自治區(qū)中國科學(xué)院廣西植物研究所標本館,標本憑證為CSF2020003。
1.2 DNA提取和測序
使用改良的CTAB法從越南小花金花茶干燥的葉片中提取總DNA,葉綠體基因組測序服務(wù)由北京格致博雅生物科技有限公司提供。使用Fastp軟件處理測序獲得的原始數(shù)據(jù),除去過多的N序列、接頭序列和過短序列,輸出大小為1 005.18 Mb的clean data,用于后續(xù)的葉綠體基因組組裝(Gu et al., 2018)。
1.3 基因組組裝注釋和序列表征
使用getOrganelle v1.7.6.1組裝clean data,參考數(shù)據(jù)庫為embplant_pt(陸生植物葉綠體),最大擴充循環(huán)數(shù)為20,調(diào)用Spedas的K-mer值為21、45、65、85、105、127;拼接完成后用Bandage 軟件可視化(Jian et al., 2018)。使用葉綠體基因組在線注釋網(wǎng)站CPGAVAS2 (http://47.96.249.172:16019/analyzer/home),以C. parvipetala (NC_067089.1)為參照基因組進行注釋。使用GB2sequin檢查序列分區(qū)是否存在顛倒并手動調(diào)整準確位置,得到完整的注釋結(jié)果(Pascal & Stephan, 2018; Shi et al., 2019)。最后使用在線網(wǎng)站CPGview (http://www.1kmpg.cn/cpgview/)繪制了葉綠體基因組圈圖(Liu et al., 2023)。注釋完成的葉綠體基因組提交至GenBank數(shù)據(jù)庫,登錄號為NC_069310.1,相應(yīng)的SRA、BioProject和BioSample編號分別為SRR20648317、PRJNA861872和SAMN29930849。
1.4 密碼子使用偏好性分析
1.4.1 密碼子相關(guān)參數(shù)計算[HTSS] 在剔除重復(fù)基因、含有終止密碼子和長度小于300 bp的編碼序列(coding sequence, CDS)后,選取52條CDS序列進行密碼子分析。使用Codon W 1.4.2軟件對相對同義密碼子使用度(relative synonymous codon usage,RSCU)進行分析。利用EMBOSS工具包中的CUSP程序分析總GC含量以及第1、第2和第3個堿基位置(GC1、GC2、GC3)的GC含量,CHIPS程序用于分析有效密碼子數(shù)(effective number of codons,ENC)(朱偉垚等,2022)。采用R軟件中的cor()函數(shù)計算相關(guān)性。
1.4.2 密碼子中性繪圖、ENC-plot及PR2-plot繪圖[HTSS] 在中性繪圖分析中,以GC12和GC3做散點圖,研究密碼子3個位置堿基之間的相關(guān)性,從而分析突變壓力和自然選擇對于密碼子偏好性的影響(Wei et al., 2014)。GC12為GC1和GC2的平均值。如果GC12和GC3之間顯著相關(guān),即R2越大且趨于1時,GC12與GC3的相關(guān)程度越高,表明突變壓力是密碼子使用偏向的決定因素;相反,如果相關(guān)性不顯著,則回歸曲線斜率偏低甚至接近于零,表明密碼子偏好性由自然選擇主導(dǎo)(Sueoka, 1988)。
ENC-plot繪圖進一步分析了密碼子偏好性受堿基組成對的影響,以GC3為橫坐標、有效密碼子數(shù)為縱坐標進行繪制散點圖,根據(jù)下式計算:ENC =2+ GC3+29/ [GC32+(1-GC3)2] (楊祥燕等,2021;辛雅萱等,2021)。當(dāng)密碼子偏好性僅受突變影響時,基因?qū)⒀刂蚪咏鼧藴是€分布,而當(dāng)基因落在標準曲線以下時則說明自然選擇等因素是影響密碼子偏好性的主要因素(Chakraborty et al., 2020)。
奇偶偏好性分析(parity rule 2 plot, PR2-plot)用于計算各密碼子第3位A、T、C、G的含量,通常用于估計突變壓力和自然選擇對密碼子偏好性的影響(Xiang et al., 2015)。以A3 /(A3+T3)為y軸,G3 /(G3+C3)為x軸繪制PR2-plot圖。中心點(A=T, G=C)意味著自然選擇和突變壓力之間沒有偏差。如果基因均勻分布在中心點周圍,則認為密碼子偏好性可能完全是由突變壓力造成的,否則,密碼子的使用可能受到自然選擇和其他因素的影響(Xiang et al., 2015)。
1.5 重復(fù)序列分析
使用在線網(wǎng)站REPuter對散在重復(fù)序列進行計算。參數(shù)設(shè)置:最大計算重復(fù)次數(shù)=200; 最小重復(fù)序列>30 bp;重復(fù)序列相似度>90%;漢明距離(Hamming Distance)= 3 (Kurtz et al., 2001)。簡單重復(fù)序列使用在線網(wǎng)站MISA進行鑒定和統(tǒng)計分析。各重復(fù)單元(unit size) 對應(yīng)的最少重復(fù)次數(shù)分別為1~10、2~5、3~4、4~3、5~3、6~3,相鄰SSR之間的最小單位間隔距離設(shè)置為100 bp (Beier et al., 2017)。
1.6 葉綠體基因組IR邊界分析
基于系統(tǒng)發(fā)育分析的結(jié)果,以簇蕊金花茶(C. fascicularis)葉綠體基因組為參考,使用本地部署的IRscope對越南小花金花茶及其近緣物種葉綠體基因組的LSC/IRb/SSC/IRa邊界進行可視化分析(Amiryousefi et al., 2018)。
1.7 系統(tǒng)發(fā)育分析
將測序組裝得到的越南小花金花茶以及從NCBI數(shù)據(jù)庫中獲得的23個為金花茶組植物的葉綠體基因組全長序列,以Polyspora penangensis為外類群,構(gòu)建系統(tǒng)發(fā)育樹。具體流程:使用MAFFT(version 7.505)進行多序列比對,使用trimAI(V1.4)去除多序列比對結(jié)果中的低質(zhì)量區(qū)域,以提高比對結(jié)果的質(zhì)量和準確性;使用IQ-TREE2軟件在TVM+F+I+I+R6模型下,以最大似然法(Maximum Likelihood, ML)構(gòu)建系統(tǒng)發(fā)育樹(Katoh & Standley, 2013; Minh et al., 2021)。
2 結(jié)果與分析
2.1 葉綠體基因組特征
越南小花金花茶葉綠體基因組包含136個功能基因(表1),包括87個蛋白質(zhì)編碼基因,41個tRNA基因和8個rRNA基因,在這些基因中,與自我復(fù)制相關(guān)的基因有78個,與光合作用有關(guān)的基因有45個,其他功能未知的基因共有13個?;蚪M中有16個雙拷貝基因 (ndhB、rpl2、rpl23、rps7、rps12、rrn4.5S、rrn5S、rrn16S、rrn23S、trnI-CAU、trnL-CAA、trnN-GUU、trnR-ACG、trnV-GAC、ycf2、ycf15), 2個四拷貝基因(trnI-GAU, trnA-UGC)。在越南小花金花茶的葉綠體基因組中共有10個基因含有內(nèi)含子,分別是petB、petD、rps16、rpl16、rpl12、atpF、rpoC1、clpP、ndhB、ndhA,其中rpl12和ndhB基因都含有2個內(nèi)含子。
越南小花金花茶葉綠體基因組為環(huán)狀雙鏈四分體結(jié)構(gòu)(圖1),長度為156 961 bp,其中有兩個長度為26 047 bp的反向重復(fù)(IR)區(qū)域被一個86 600 bp的大單拷貝(LSC)區(qū)域和一個18 267 bp的小單拷貝(SSC)區(qū)域分開。葉綠體基因組的GC總含量為37.32%,其中LSC區(qū)為35.33%,SSC區(qū)為30.60%,IR區(qū)為42.98%。
2.2 重復(fù)序列分析
通過MISA在線網(wǎng)站分析,發(fā)現(xiàn)越南小花金花茶的葉綠體基因組中含有的SSR位點數(shù)目為66個,類型包括單核苷酸、二核苷酸、三核苷酸、四核苷酸和六核苷酸且大多數(shù)為單核苷酸重復(fù)(圖2:A,C)。這些類型的SSR有17個分布在蛋白編碼區(qū)、40個分布在基因間隔區(qū)、9個分布在內(nèi)含子區(qū)(圖2:B)。通過REPuter軟件分析了越南小花金花茶葉綠體基因組中的散在重復(fù)序列,共檢測到39個散在重復(fù)序列,分別是16個正向重復(fù)序列(forward)和23個回文重復(fù)序列(palindromic),但沒有檢測到反向(reverse)和互補(complement)重復(fù)序列的存在。這些散在重復(fù)序列的長度在30~64 bp之間,且大部分位于IR區(qū)的ycf2基因中(圖2:D)。
2.3 密碼子偏好性分析
2.3.1 同義密碼子相對使用度分析[HTSS] 對越南小花金花茶葉綠體基因組的52個大于300 bp的蛋白質(zhì)編碼序列進行密碼子偏好性分析發(fā)現(xiàn),其中相對同義密碼子使用度(RSCU)值大于1的密碼子有30個,其中13個以A (30個中13個)或U (30個中16個)結(jié)尾,以G結(jié)尾的數(shù)目僅有1個;RSCU值小于1的32個密碼子多以C (32個中16個)或G (32個中13個)結(jié)尾 ,表明密碼子偏好使用以A/U結(jié)尾的密碼子(圖3)。
2.3.2 密碼子中性繪圖、ENc-plot及PR2-plot分析[HTSS] 對越南小花金花茶葉綠體基因進行中性圖(GC12 vs GC3)分析。由圖4:A可知,葉綠體基因分布相對集中,但并不密集。GC12和GC3的平均值分別為43.10%和27.49%。GC12和GC3的相關(guān)系數(shù)為r=0.118(R2=0.014),回歸曲線斜率為0.107,表明GC12與GC3無顯著相關(guān)性。由此推斷密碼子使用偏好性受突變壓力影響較小,而自然選擇等因素的貢獻更大。
為了評估越南金花茶葉綠體基因組中蛋白編碼基因的密碼子偏好程度,計算并分析了ENC值。如圖4:B所示,大部分基因的ENC值低于預(yù)期值,位于標準曲線下方,表明密碼子使用偏好性主要受自然選擇等因素的影響,而突變壓力僅起次要作用。為了進一步反映差異,分析了越南小花金花茶葉綠體基因的ENC頻數(shù)分布(表2)。ENC比值在-0.05~0.45之間,其中9個(17.00% )基因分布在-0.05~0.05范圍內(nèi),表明這部分基因分布在標準曲線周圍,而剩余的大部分基因都距離標準曲線較遠,以上結(jié)果說明了自然選擇對越南小花金花茶葉綠體基因組密碼子偏好的影響更大。
如果密碼子偏好性完全受突變影響,則密碼子第3位核苷酸A、T、C、G的使用頻率相同。在本研究中,PR2平面的4個區(qū)域并非均勻分布。由圖4:C可知,大部分基因位于平面的下半部分,尤其是右下方。因此,從堿基的使用頻率來看,T>A,G>C,表明葉綠體基因組中A/T和G/C的密碼子使用偏好性不平衡,推斷越南小花金花茶葉綠體基因組的密碼子偏好性同時受到突變壓力和自然選擇等因素的影響。
2.4 IR邊界分析
葉綠體基因組在LSC、IRb、IRa和SSC之間有4個邊界,即LSC/IRb邊界、IRb/SSC邊界、SSC/IRa邊界和IRa/LSC邊界。本研究對越南小花金花茶及6個近緣金花茶組植物的葉綠體基因組邊界進行了比較分析。由圖5可知,在所有比較的葉綠體基因組中,IR區(qū)僅有輕微的擴張和收縮,長度從25 996 bp(四季花金花茶)到26 096 bp(毛瓣金花茶)。在LSC/IRb邊界處,所有物種的rps19基因都跨越了LSC/IRb邊界,向IRb區(qū)域延伸了46 bp。在IRb/SSC邊界處,7個金花茶組植物的邊界均位于ycf1假基因和ndhF基因的重疊處,在越南金花茶和毛瓣金花茶中,ndhF基因跨越IRb/SSC邊界,分別有39、25 bp位于IRb區(qū)域中。在SSC/IRa邊界處,ycf1基因跨越該邊界,包含在IRa 1 034~1 055 bp區(qū)域內(nèi)。在IRa/LSC邊界處,所有物種的邊界均位于rps19拷貝基因和trnH基因之間,trnH距離IRa/LSC邊界1 bp。
2.5 系統(tǒng)發(fā)育分析
基于25種山茶科植物(包括24種金花茶組植物和1種大頭茶屬物種)葉綠體全基因組序列構(gòu)建系統(tǒng)發(fā)育樹,以P. penangensis 作為外類群,利用最大似然法構(gòu)建系統(tǒng)發(fā)育樹。由圖6可知,24種金花茶組植物主要分為2個分支,即Clade Ⅰ分支和Clade Ⅱ分支。Clade Ⅰ分支中,越南小花金花茶(C. minima)與小花金花茶(C. micrantha)以100%的支持率聚為了一個單支,表明這兩個物種的親緣關(guān)系最近。
3 討論與結(jié)論
金花茶組植物均為國家二級保護植物(國家林業(yè)和草原局 農(nóng)業(yè)農(nóng)村部,2021),具有較高的觀賞和藥用價值。其中,越南小花金花茶是一種原產(chǎn)于越南北部的金花茶組植物,生長于潮濕蔭蔽的山谷,具有較強的適應(yīng)能力,被視為優(yōu)良的嫁接砧木,近年來受到了園藝界的廣泛關(guān)注(李桂娥等,2022)。越南小花金花茶葉綠體基因組為典型的環(huán)狀雙鏈四分體結(jié)構(gòu),長度為156 961 bp,GC含量為37.32%,葉綠體全基因組注釋到了136個基因,包括87個蛋白編碼基因,41個轉(zhuǎn)運RNA基因和8個核糖體RNA基因, 共有10個基因含有內(nèi)含子,其中rpl12和ndhB基因含有2個內(nèi)含子,與金花茶組其他植物的特征一致,可能與葉綠體基因組的特殊結(jié)構(gòu)和復(fù)制方式有關(guān)(Henry et al., 2016)。此外,越南小花金花茶的葉綠體基因組長度、基因的類型和排列順序、GC含量等與山茶屬的其他已發(fā)表物種 (如山茶、油茶、凹脈金花茶等) 相似(Li et al., 2019)。這表明越南小花金花茶葉綠體基因組的進化可能保守而緩慢(Sophiarani et al., 2019; 丁祥青等,2022a)。
簡單重復(fù)序列(SSRs)是由DNA鏈的滑移而產(chǎn)生,在基因組和葉綠體基因組中都有較廣分布。與其他中性DNA區(qū)域相比,SSRs通常具有更高的突變率(Li et al., 2018; Zhang, 2019)。由于其具有非重組、單倍體和單親遺傳的特性,因此常被用作遺傳標記,為植物群體遺傳學(xué)和生態(tài)學(xué)及進化研究提供有價值的信息(Aii et al., 1997; Gui et al, 2020)。本研究在越南小花金花茶葉綠體基因組中共鑒定了66個SSR位點,主要位于大單拷貝區(qū)(LSC),其中所有的單核苷酸重復(fù)都是由A/T組成,類似的結(jié)果在金花茶組葉綠體基因組(丁祥青等,2022b)和其他被子植物中均有發(fā)現(xiàn)(Hui et al., 2014),可能歸因于polyA和polyT相比polyC和polyG具有更高的結(jié)構(gòu)穩(wěn)定性(Jin et al., 2023)。然而,我們檢測到的SSR位點數(shù)量與Hui等(2014)的結(jié)果存在差異,可能是由于檢索 SSR 位點的參數(shù)設(shè)定不同,導(dǎo)致輸出的結(jié)果不同。在越南小花金花茶的葉綠體基因組中,cp-SSRs含量豐富,可用于檢測群體的遺傳多態(tài)性。此外,在越南小花金花茶葉綠體基因組中鑒定出的散在重復(fù)序列主要以正向和回文重復(fù)為主,與抱莖金花茶葉綠體基因組序列特征類似(丁祥青等,2022b)。這些重復(fù)序列是重要的遺傳資源,在系統(tǒng)發(fā)育研究中具有重要作用(Wei et al., 2022)。
密碼子使用偏好性對于研究基因的分子進化和外源表達具有重要意義(Li et al., 2022)。本研究首次系統(tǒng)分析了越南小花金花茶葉綠體基因組的密碼子使用模式,發(fā)現(xiàn)精氨酸、異亮氨酸、甘氨酸是密碼子編碼的最豐富的氨基酸,由6個密碼子編碼,相比之下,色氨酸、甲硫氨酸僅有一個密碼子編碼,葉綠體基因傾向于使用A/U密碼子,與耿曉姍等(2022)對金花茶的密碼子分析研究結(jié)果一致。通過進行中性繪圖分析,本研究發(fā)現(xiàn)GC12和GC3之間并無顯著相關(guān)性且基因分布相對集中,表明自然選擇是影響密碼子偏好的主要因素(Zhang et al., 2012)。進一步結(jié)合ENC繪圖、PR2-plot分析結(jié)果,表明越南小花金花茶的密碼子使用偏好性受多個因素影響,包括突變壓力、堿基組成和基因長度,其中自然選擇是主導(dǎo)影響因素,這與丁祥青等(2023)和李清等(2022)的研究結(jié)果一致。自然選擇是葉綠體基因組進化的主要驅(qū)動力,這一發(fā)現(xiàn)加深了我們對越南小花金花茶進化歷史的理解,特別是與自然選擇有關(guān)的進化歷史。對密碼子偏好性的分析結(jié)果有利于密碼子優(yōu)化,可為今后金花茶組植物轉(zhuǎn)基因技術(shù)提供理論依據(jù)(段義忠和張凱,2020; Zhao et al., 2016)。
在葉綠體基因組中,IR的收縮和擴張時常發(fā)生,這些差異會導(dǎo)致假基因的產(chǎn)生、基因重復(fù)和基因缺失,進一步造成IR/SC連接處的位置變化,高等植物葉綠體基因組長度變異就是由這種位置變化而造成(Li DM et al., 2021)。本研究對越南小花金花茶及6個近緣金花茶組植物的葉綠體基因組邊界進行比較分析,結(jié)果表明7個物種IR區(qū)長度(25 996~26 096 bp)基本一致,未檢測到基因丟失,表明IR區(qū)的高度保守可能對于維持其長度和結(jié)構(gòu)穩(wěn)定至關(guān)重要。通過邊界收縮和擴張分析,本研究發(fā)現(xiàn)ycf1基因的長度和位置在不同金花茶組植物間存在差異,可能是潛在的突變熱點區(qū)域。Li L等(2021)研究表明,ycf1基因因其高度的多態(tài)性而被推薦作為植物的核心DNA條形碼,然而這一潛在的高變區(qū)是否可以作為金花茶組植物有效的DNA條形碼還需要進一步的驗證。此外,越南小花金花茶及6個近緣金花茶組植物的葉綠體基因組邊界相對保守,表明其親緣關(guān)系較近,之后的系統(tǒng)發(fā)育研究也支持這一推論。
迄今為止,許多學(xué)者已經(jīng)采用諸如隨機擴增多態(tài)性DNA (random amplified polymorphic DNA, RAPD )、葉綠體DNA trnL-trnF、擴增片段長度多態(tài)性(amplified fragment length polymorphism, AFLP)、ISSR以及核糖體內(nèi)轉(zhuǎn)錄間隔區(qū)(nuclear ribsomal internal transcribe spacer, nrITS )等多樣化的分子標記,以闡明山茶屬之間的親緣關(guān)系(Ju et al., 2021)。 Wei等(2022)整合了ddRAD、轉(zhuǎn)錄組、nrITS和SSC等分子標記研究金花茶組系統(tǒng)發(fā)育關(guān)系,但基于葉綠體基因組SSC區(qū)的系統(tǒng)發(fā)育樹支持率極低。本研究基于葉綠體全基因組序列,對越南小花金花茶和其余23種金花茶組植物的系統(tǒng)發(fā)育關(guān)系進行了分析。結(jié)果表明,依據(jù)系統(tǒng)發(fā)育的結(jié)果可將系統(tǒng)發(fā)育樹分為兩個大的分支,其中越南小花金花茶與小花金花茶聚為高支持率的分支,親緣關(guān)系最近。各分支支持率較高,表明完整的葉綠體基因組數(shù)據(jù)可為重建金花茶組系統(tǒng)發(fā)育關(guān)系提供重要的數(shù)據(jù)支持。
綜上所述,本文首次完成了越南小花金花茶葉綠體基因組的序列測序、組裝注釋和基礎(chǔ)信息分析,揭示了越南小花金花茶葉綠體基因組基本特征。在此基礎(chǔ)上,通過剖析密碼子使用模式以及影響密碼子偏好的各類因素,確定了越南小花金花茶葉綠體基因組的高頻密碼子,為后續(xù)山茶屬金花茶組植物的轉(zhuǎn)基因研究提供了理論支持。此外,基于全葉綠體基因組構(gòu)建的系統(tǒng)發(fā)育樹明確了越南小花金花茶在金花茶組植物中的系統(tǒng)位置。本研究為后續(xù)越南小花金花茶和其他金花茶組植物的保護和合理開發(fā)利用研究提供了理論基礎(chǔ)。
參考文獻:
AI I J, KISHIMA Y, MIKAMI T, et al., 1997. Expansion of the IR in the chloroplast genomes of buckwheat species is due to incorporation of an SSC sequence that could be mediated by an inversion [J]. Curr Genet, 31: 276-279.
AMIRYOUSEFI A, HYVNEN J, POCZAI P, 2018. IRscope: an online program to visualize the junction sites of chloroplast genomes [J]. Bioinformatics, 34(17): 3030-3031.
BEIER S, THIEL T, MNCH T, et al., 2017. MISA-web: a web server for microsatellite prediction [J]. Bioinformatics, 33(16): 2583-2585.
CAVALIER ST, 2002. Chloroplast evolution:secondary symbiogenesis and multiple losses [J]. Curr Biol, 12: 62-64.
CHAKRABORTY S, YENGKHOM S, UDDIN A, 2020. Analysis of codon usage bias of chloroplast genes in Oryza species [J]. Planta, 252: 1-20.
DING XQ, CHEN SY, CHEN JT, et al., 2023. Codon bias analysis of 11 yellow Camellia chloroplast genome [J]. J Fujian Agric For Univ (Nat Sci Ed), 52(4): 1-9. ?[丁祥青, 陳絲雨, 陳佳婷, 等, 2023. 11種金花茶葉綠體基因組密碼子偏好性分析 [J]. 福建農(nóng)林大學(xué)學(xué)報(自然科學(xué)版), 52(4): 1-9.]
DING XQ, LI WF, WU JL, et al., 2022a. Chloroplast genome characteristics and genetic relationship of yellow Camellia [J]. J Fujian Agric For Univ (Nat Sci Ed), 52(3): 1-11. ?[丁祥青, 李文芳, 吳麗君, 等, 2022a. 4種金花茶葉綠體基因組的比較分析 [J]. 福建農(nóng)林大學(xué)學(xué)報(自然科學(xué)版), 52(3): 1-11.]
DING XQ, BI YY, CHEN JT, et al., 2022b. Analysis of the chloroplast genome characteristics of Camellia tienii [J]. Agric Sci Jiangsu, 50(23): 33-40. ?[丁祥青, 畢遠洋, 陳佳婷, 等, 2022b. 抱莖金花茶(Camellia tienii)的葉綠體基因組特征分析 [J]. 江蘇農(nóng)業(yè)科學(xué), 50(23): 33-40.]
DONG W, XU C, WU P, et al., 2018. Resolving the systematic positions of enigmatic taxa: Manipulating the chloroplast genome data of Saxifragales [J]. Mol Phylogenet Evol, 126: 321-330.
DUAN YZ, ZHANG K, 2020. Comparative analysis and phylogenetic evolution of the complete chloroplast genome of Ammopiptanthus [J]. Acta Bot Boreal-Occident Sin, 40(8): 1323-1332. ?[段義忠, 張凱, 2020. 沙冬青屬植物葉綠體基因組對比和系統(tǒng)發(fā)育分析 [J]. 西北植物學(xué)報, 40(8): 1323-1332.]
GENG XS, JIA W, CHEN JN, et al., 2022. Codon usage bias analysis of chloroplast genome in Camellia nitidissima ?[J]. Mol Plant Breed, 20(7): 2196-2203. ?[耿曉姍, 賈魏, 陳佳寧, 等, 2022. 金花茶葉綠體基因組密碼子偏好性分析 [J]. 分子植物育種, 20(7): 2196-2203.]
GEORGE O, ANTHONY SC, 2015. In pursuit of hidden camellias 32 new Camellia species from Vietnam and China ?[M]. 2nd ed. Sydney: Theaceae Exploration Associates.
GUI L, JIANG S, XIE D, et al., 2020. Analysis of complete chloroplast genomes of curcuma and the contribution to phylogeny and adaptive evolution [J]. Gene, 732: 144355.
GU J, CHEN S, ZHOU Y, et al., 2018. Fastp: an ultra-fast all-in-one FASTQ preprocessor [J]. Bioinformatics, 34(17): i884-i890.
HENRY D, LIN CS, YU M,et al., 2016. Chloroplast genomes: diversity, evolution, and applications in genetic engineering [J]. Genome Biol, 17(134): 1-29.
HU XY, XU YQ, HAN YZ, et al., 2019. Codon usage bias analysis of the chloroplast genome of Ziziphus jujuba var. spinosa [J]. J For Environ, 39(6): 621-628. [胡曉艷, 許艷秋, 韓有志, 等, 2019. 酸棗葉綠體基因組密碼子使用偏性分析 [J]. 森林與環(huán)境學(xué)報, 39(6): 621-628.]
HUI H, CHAO S, YUAN L, et al., 2014. Thirteen Camellia chloroplast genome sequences determined by high-throughput sequencing: genome structure and phylogenetic relationships [J]. BMC Evol Biol, 14(1): 151-168.
JIAN JJ, YU WB, YANG JB, et al., 2018. GetOrganelle: a fast and versatile toolkit for accurate de novo assembly of organelle genomes [J]. Genome Biol, 21(1): 241.
JIN GZ, LI WJ, SONG F, et al., 2023. Comparative analysis of complete Artemisia subgenus Seriphidium (Asteraceae: Anthemideae) chloroplast genomes: insights into structural divergence and phylogenetic relationships [J]. BMC Plant Biol, 136: l-23.
JU NG, HOANG DKD, KIM CK, et al., 2021. Complete chloroplast genomes shed light on phylogenetic relationships, divergence time, and biogeography of Allioideae (Amaryllidaceae) [J]. Sci Rep, 11(1): 3262
KATOH K, STANDLEY DM, 2013. MAFFT mutiple sequence alignment software version 7:improvements in performance and usability [J]. Mol Biol Evol, 30(4): 772-780.
KURTZ JV, CHOUDHURI, OHLEBUSCH E, et al., 2001. REPuter: the manifold applications of repeat analysis on a genomic scale [J]. Nucl Acids Res, 29(22): 4633-4642.
LI DM, LI J, WANG DR, et al., 2021. Molecular evolution of chloroplast genomes in subfamily Zingiberoideae (Zingiberaceae) [J]. BMC Plant Biol, 21: 1-24.
LI GE, JIANG CJ, QI Y, et al., 2022. Morphological characteristics and identification points of Camellia minima and Camellia cucphuongensis from Vietnam [J]. S Hortic, 33(1): 54-60. ?[李桂娥, 蔣昌杰, 漆婭, 等, 2022. 越南小花金花茶和菊芳金花茶的形態(tài)特征及識別要點 [J]. 南方園藝, 33(1): 54-60.]
LI L, HU YF, HE M, et al., 2021. Comparative chloroplast genomes: insightsinto the evolution of the chloroplast genome of Camellia sinensis and the phylogeny of Camellia [J]. BMC Genomics, 22(138): 471-493.
LI Q, LUO RJ, GE R, et al., 2022. Analysis on codon usage bias of chloroplast genomein Ampelopsis grossedentata [J]. Guangdong Agric Sci, 49(11): 162-169. [李清, 羅永堅, 葛蓉, 等, 2022. 顯齒蛇葡萄葉綠體基因組密碼子使用偏好性分析 [J]. 廣東農(nóng)業(yè)科學(xué), 49(11): 162-169.]
LI W, ZHANG CP, GUO XP, et al., 2019. Complete chloroplast genome of Camellia japonica genome structures, comparative andphylogenetic analysis [J]. PLoS ONE, 14(5): e0216645.
LI XP, MENG J, ZHANG N, et al., 2018. Comparative analysis of chloroplast genomes of Aconitum vilmorinianum and Aconitum vilmorinianum var. patentipilum [J]. J Chin Med Mat, 41(8): 1812-1820. ?[李雪佩, 孟靜, 張琳娜, 等, 2018. 黃草烏與展毛黃草烏葉綠體全基因組結(jié)構(gòu)的比較分析 [J]. 中藥材, 41(8): 1812-1820.]
LIU H, HUANG Y, DU X, et al., 2012. Patterns of synonymous codon usage bias in the model grass Brachypodium distachyon [J]. Genet Mol Res, 11(4): 4695-4706.
LIU Q, LI Y, YANG RM, et al., 2021. Yellow Camellia: resource status and research progress in modern studies [J]. Mod Chin Med, 23(4): 727-733. ?[劉青, 李月, 楊潤梅, 等, 2021. 金花茶組植物資源現(xiàn)狀與現(xiàn)代研究進展 [J]. 中國現(xiàn)代中藥, 23(4): 727-733.]
LIU S, NI Y, LI J, et al., 2023. CPGView: A package for visualizing detailed chloroplast genome structures [J]. Mol Ecol Resour, 23(3): 694-704.
MINH BQ, SCHMIDT HA, CHERNOMOR O, et al., 2021. IQ-TREE 2: New models and efficient methods for phylogenetic inference in the genomic era [J]. Mol Biol Evol, 37(5): 1530-1534.
National Forestry and Grassland Administration, Ministry of Agriculture and Rural Affairs, 2021. List of National Key Protected Wild Plants ?[EB/OL]. 2021(15). ?https://www.gov.cn/zhengce/zhengceku/2021-09/09/content_5636409.htm. [國家林業(yè)和草原局 農(nóng)業(yè)農(nóng)村部, 2021. 國家重點保護野生植物名錄 ?[EB/OL] 2021年第15號. https://www.gov.cn/zhengce/zhengceku/2021-09/09/content_5636409.htm.]
PASCAL L, STEPHAN G, 2018. GB2sequin — A file converter preparing custom GenBank files for database submission [J]. Genomics, 111(4): 759-761.
QI YY, XU WJ, XING T, et al., 2015. Synonymous codon usage bias in the plastid genome is unrelated to gene structure and shows evolutionary heterogeneity [J]. Evol Biol Online, 11: 65-77.
SAI X, 2018. Anti-lung cancer effect of Camellia euphlbia flowers extract and its potential mechanism of action [D]. Dalian: Dalian University of Technology. ?[賽璇, 2018. 金花茶花提取物的肺癌防治作用及其機理初探 [D]. 大連: 大連理工大學(xué).]
SHI L, CHEN H, JIANG M, et al., 2019. CPGAVAS2, an integrated plastome sequence annotator and analyzer [J]. Nucl Acids Res, 7(W1): W65-W73.
SOPHIARANI Y, ARIF U, SUPRIYO C, 2019. Deciphering codon usage patterns and evolutionary forces in chloroplast genes of Camellia sinensis var. assamica and Camellia sinensis var. sinensis in comparison to Camellia pubicosta [J]. J Inte Agric, 18(12): 2771-2785.
SUEOKA N, 1988. Directional mutation pressure and neutral molecular evolution [J]. Proc Natl Acad Sci USA, 85(8): 2653-2657.
WEI L, HE J, JIA X, et al., 2014. Analysis of codon usage bias of mitochondrial genome in Bombyx mori and its relation to evolution [J]. BMC Evol Biol, 14: 262.
WEI SJ, LIUFU YQ, ZHENG HE, et al., 2022. Using phylogenomics to untangle the taxonomic incongruence of yellow-flowered Camellia species (Theaceae) in China [J]. J Syst Evol, 61(5): 1-16.
WU LJ, ZHENG HC, CHEN WR, et al., 2020. Performance and thinking on introduction and cultivation of Camellia Sect.Chrysantha Chang in Fujian [J]. Fujian For Sci Technol, 47(2): 109-115. ?[吳麗君, 鄭惠成, 陳文榮, 等, 2020. 福建金花茶組植物引種栽培現(xiàn)狀與思考 [J]. 福建林業(yè)科技, 47(2): 109-115.]
XIANG H, ZHANG RZ, BUTLER RR,et al., 2015. Comparative analysis of codon usage bias patterns in Microsporidian genomes [J]. PLoS ONE, 10: e0129223.
XIN YX, LI RZ, LI X, et al., 2021. Analysis on codon usage bias of chloroplast genome in Mangifera indica [J]. J Centr S Univ For Technol, 41(9): 145-157. [辛雅萱, 黎若竹, 李鑫, 等, 2021. 杧果葉綠體基因組密碼子使用偏好性分析 [J]. 中南林業(yè)科技大學(xué)學(xué)報, 41(9): 145-157.]
YANG XY, CAI YB, TAN QL, et al., 2021. Analysis of codon usage bias in the chloroplast genome of Ananas comosus [J]. J Trop Crop, 43(3): 439-446 [楊祥燕, 蔡元保, 譚秦亮, 等, 2021. 菠蘿葉綠體基因組密碼子偏好性分析 [J]. 熱帶作物學(xué)報, 43(3): 439-446.]
ZHANG L, NI S, LI JY, et al., 2019. Analysis of petal nutrition and bioactive components in different periods of Camellia nitidissima [J]. For Res, 32(2): 32-38. [張蕾, 倪穗, 李紀元, 等, 2019. 金花茶不同時期花瓣營養(yǎng)與生物活性成分分析 [J]. 林業(yè)科學(xué)研究, 32(2): 32-38.]
ZHANG JW, 2019. The complete chloroplast genome and phylogenetic analysis of the endangered species Syringa pinnatifolia (Oleaceae) [D]. Yangling: Northwest A & F University. ?[張靖雯, 2019. 瀕危植物羽葉丁香葉綠體全基因組及系統(tǒng)發(fā)育研究 [D]. 楊凌: 西北農(nóng)林科技大學(xué).]
ZHANG W, ZHAO Y, YANG G, et al., 2019. Determination of the evolutionary pressure on Camellia oleifera on Hainan Island using the complete chloroplast genome sequence [J]. PeerJ, 7: e7210.
ZHANG Y, NIE X, JIA X, et al., 2012. Analysis of codon usage patterns of the chloroplast genomes in the Poaceae family [J]. Aust J Bot, 60: 461-470.
ZHAO YC, ZHENG H, XU AX, et al., 2016. Analysis of codon usage bias of envelope glycoprotein genes in nuclear polyhedrosis virus (NPV) and its relation to evolution [J]. BMC Genom, 17: 677-677.
ZHU WY, LONG Y, ZHENG S, et al., 2022. Chloroplast genome structure and characterization of Melaleuca bracteata [J/OL]. Mol Plant Breed: 1-14 [2023-08-12]. ??[朱偉垚, 龍宇, 鄭叔召, 等, 2022. 黃金寶樹葉綠體基因組測序與特征分析 [J]. 分子植物育種: ?1-14 [2023-08-12]. http://ifgfy2b08d79e045e4fd4hpu0ow5n56x966nfnficg.res.gxlib.org.cn/kcms/detail/46.1068.S.20220428.1423.017.html.]
( 責(zé)任編輯 李 莉 )
收稿日期: ??2023-08-12
基金項目: ??國家自然科學(xué)基金(32060090); 廣西科技基地和人才專項(桂科AD19110089); 廣西自然科學(xué)基金(2021JJA130119)。
第一作者: ?鄧永彪(2000-),碩士研究生,研究方向為中藥資源,(E-mail)dengyongbiao1@gmail.com。
* 通信作者: ??趙博,博士,教授,研究方向為藥用植物資源學(xué),(E-mail)122017017@glmc.edu.cn。