摘 要:為了豐富對(duì)紫葉苔屬遺傳基礎(chǔ)的認(rèn)識(shí),探究了紫葉苔(Pleurozia purpurea)線粒體基因組密碼子使用的偏好性及其影響因素。首先,基于完整紫葉苔線粒體基因組篩選蛋白編碼序列;然后,利用CodonW、EMBOSS explorer計(jì)算各基因的GC含量、有效密碼子數(shù)(ENC)、密碼子適應(yīng)指數(shù)(CAI)和同義密碼子相對(duì)使用度(RSCU)等指標(biāo);最后,采用R軟件進(jìn)行參數(shù)間的相關(guān)性分析并繪圖。結(jié)果表明:1) 從紫葉苔線粒體基因組中篩選出31條蛋白編碼序列,平均GC含量和密碼子第 3 位堿基的 GC 含量分別為38.17%和32.28%,ENC和CAI平均值為50.29、0.17,表明密碼子偏好使用以A/U結(jié)尾的堿基,且密碼子偏好性較弱;2) ENC分別與GCall、GC3以及基因編碼氨基酸的長(zhǎng)度呈極顯著正相關(guān),表明GC含量和基因的長(zhǎng)度對(duì)密碼子的偏好有顯著影響;3) 中性繪圖、ENC-plot和PR2-plot分析表明,突變壓力和自然選擇等因素共同塑造了密碼子的使用偏好性,其中突變是最主要的影響因素;4) 篩選出23個(gè)最優(yōu)密碼子,多數(shù)以 A/U 結(jié)尾。因此,紫葉苔線粒體基因組密碼子偏好性較弱,除了主要受突變壓力影響外,還受到自然選擇、堿基組成和基因長(zhǎng)度等因素的影響,研究結(jié)果可為苔蘚植物線粒體基因組的進(jìn)化研究提供參考。
關(guān)鍵詞:分子遺傳學(xué);紫葉苔屬;密碼子偏好性;線粒體基因組;最優(yōu)密碼子
中圖分類(lèi)號(hào):Q949.35;Q755
文獻(xiàn)標(biāo)識(shí)碼:A"" DOI:10.7535/hbkd.2025yx01010
收稿日期:2024-04-27;修回日期:2024-08-21;責(zé)任編輯:張士瑩
基金項(xiàng)目:
國(guó)家自然科學(xué)基金(3216031" 31760054);海南大學(xué)科研啟動(dòng)項(xiàng)目 (KYQD(ZR)-22105)
第一作者簡(jiǎn)介:
杜夢(mèng)雪(1994—),女,河南平頂山人,碩士研究生,主要從事苔蘚植物基因組和系統(tǒng)進(jìn)化方面的研究。
通信作者:
張莉娜,副教授。E-mail:zhanglina@hainanu.edu.cn
Analysis of codon usage bias in the mitochondrial
genome of Pleurozia purpurea
DU Mengxue ZHANG Xin" GAO Jie" BI Sheng" HAO Jiewei """ZHANG Lina "2
(1. Ministry of Education Key Laboratory for Genetics and Germplasm Innovation of Tropical Special Forest
Trees and Ornamental Plants,Hainan University,Haikou,Hainan 570228,China;
2. International Joint Center for Terrestrial Biodiversity Around South China Sea of Hainan Province,
Hainan University,Haikou,Hainan 570228,China)
Abstract:In order to enrich the understanding of the genetic basis of the genus Pleurozia purpurea, the codon usage bias (CUB) in the mitochondrial genome of Pleurozia purpurea and its main influencing factors were investigated. Firstly, protein-coding sequences were screened based on the complete mitochondrial genome of Pleurozia purpurea. Then, CodonW and EMBOSS explorer were utilized to calculate various metrics for each gene, including GC content, effective number of codons (ENC), codon adaptation index (CAI), and relative synonymous codon usage (RSCU). Finally, correlation analysis between parameters was analyzed and plotted using R software." The results show that: 1) A total of 31 protein-coding sequences are identified from the mitochondrial genome of Pleurozia purpurea, with an average GC content of 38.17% and a GC content of 32.28% for the third base of codons, respectively. The average values for ENC and CAI are 50.29 and 0.17, indicating a preference for codons ending with A/U bases and a relatively weak CUB; 2) ENC exhibits significantly positive correlations with GCall, GC" and the length of amino acid encoding genes, indicating significant influences of GC content and gene length on CUB; 3) Analyses including neutrality plot, ENC-plot and PR2-plot indicate that mutation pressure and natural selection jointly shaped the CUB, with mutation being the most important influencing factor; 4) A total of 23 optimal codons are selected, most of which end with A/U. Therefore, the CUB in the mitochondrial genome of Pleurozia purpurea is relatively weak, influenced primarily by mutational pressure, and by factors such as natural selection, base composition, and gene length. The research results can provide reference for evolutionary studies of mitochondrial genomes in bryophytes.
Keywords:molecular genetics; the genus Pleurozia purpurea; codon usage bias; mitochondrial genomes; optimal codon
植物線粒體是關(guān)鍵細(xì)胞器,負(fù)責(zé)代謝、呼吸和能量轉(zhuǎn)換等重要細(xì)胞過(guò)程[1]。和葉綠體一樣,線粒體是半自主性細(xì)胞器,有自己的基因組,具有獨(dú)立復(fù)制表達(dá)及母系遺傳等特點(diǎn)。線粒體基因組編碼與呼吸作用等代謝過(guò)程有關(guān)的蛋白質(zhì)中含有豐富的遺傳信息。在遺傳信息的解讀過(guò)程中,密碼子扮演著至關(guān)重要的角色,是基因與蛋白質(zhì)之間聯(lián)系的基礎(chǔ)。已知構(gòu)成天然蛋白質(zhì)的20種基本氨基酸中,除了色氨酸和甲硫氨酸各由1個(gè)密碼子編碼外,其他18種氨基酸由2~6個(gè)不同的密碼子進(jìn)行翻譯,這種現(xiàn)象被稱(chēng)為密碼子簡(jiǎn)并性[3],而編碼同一種氨基酸的不同密碼子被定義為同義密碼子。同義密碼子在蛋白質(zhì)合成中的使用并不均勻,一些同義密碼子被優(yōu)先使用,這種對(duì)特定密碼子的偏倚,即為密碼子使用偏好(codon usage bias,CUB)[4]。CUB信息的獲得可以為基因表達(dá)水平的預(yù)測(cè)和優(yōu)化、基因功能預(yù)測(cè)、遺傳分歧評(píng)估和生物進(jìn)化探索等提供重要的見(jiàn)解[5-7],并有助于解釋物種對(duì)環(huán)境適應(yīng)的分子機(jī)制[8]。
苔蘚植物是由水生到陸生過(guò)渡的高等植物類(lèi)群,大多生活在潮濕的陸地環(huán)境中,包含地錢(qián)門(mén)(Marchantiophyta)、真蘚門(mén)(Bryophyta)和角苔門(mén)(Anthocerotophyta)3個(gè)門(mén)類(lèi)。紫葉苔屬隸屬于地錢(qián)門(mén),在最新的世界苔類(lèi)名錄中共記錄12種[9],其中中國(guó)記錄5種。紫葉苔屬是唯一具有兩面體頂細(xì)胞結(jié)構(gòu)的莖葉體苔類(lèi)[10],被視為苔類(lèi)植物中由簡(jiǎn)單葉狀體向莖葉體過(guò)渡的關(guān)鍵類(lèi)群[11-12]。同時(shí),紫葉苔屬具有形態(tài)獨(dú)特且變異較大的葉型和生殖結(jié)構(gòu),如囊狀葉、不育蒴萼等[13],使得這一類(lèi)群在苔類(lèi)系統(tǒng)發(fā)育與進(jìn)化研究中具有非常重要的科學(xué)意義。此外,紫葉苔屬多為樹(shù)附生類(lèi)型,主要分布于熱帶和亞熱帶山地高海拔、多云霧的雨林中[13],對(duì)于氣候等環(huán)境因子的變化十分敏感。因此,紫葉苔屬不僅是高海拔雨林或云霧林生態(tài)系統(tǒng)動(dòng)態(tài)變化潛在的指示植物,而且極易成為受威脅物種。在《中國(guó)生物多樣性紅色名錄——高等植物卷(2020)》中,紫葉苔(Pleurozia purpurea)和狹尖紫葉苔被列為近危物種。
地錢(qián)門(mén)是現(xiàn)存陸生植物最早分化的系群之一[14-15],開(kāi)展紫葉苔屬基因組的研究有助于揭示陸生植物起源和早期進(jìn)化過(guò)程中基因組的演化。已有研究表明,紫葉苔線粒體基因組在苔蘚植物中具有較高的進(jìn)化保守性和代表性[16]。然而,盡管測(cè)序技術(shù)不斷進(jìn)步,對(duì)維管植物細(xì)胞器基因組的研究日益增多,但關(guān)于苔蘚植物線粒體基因組的研究仍然較少[1 17-18],特別是關(guān)于密碼子使用偏好性較為全面的分析更是寥寥無(wú)幾[19-20]。本研究深入分析紫葉苔線粒體基因組的密碼子使用模式,探討其偏好性形成的潛在機(jī)制,并篩選出最優(yōu)密碼子。通過(guò)研究,期望能夠豐富對(duì)紫葉苔屬這一進(jìn)化和生態(tài)關(guān)鍵類(lèi)群遺傳基礎(chǔ)的認(rèn)識(shí),為理解該屬的生物學(xué)特性及其在苔蘚植物系統(tǒng)發(fā)育、進(jìn)化和物種保護(hù)中的關(guān)系提供新的視角和科學(xué)依據(jù)。
1 材料和方法
1.1 紫葉苔線粒體基因組序列的獲取
紫葉苔線粒體基因組序列從GenBank數(shù)據(jù)庫(kù)下載,登錄號(hào)為NC_013444.1。該基因組總長(zhǎng)為168 526個(gè)堿基,含有41條蛋白編碼序列(coding sequence,CDS)。為了提高后續(xù)密碼子偏好分析的準(zhǔn)確性,本文依照長(zhǎng)度大于300 bp,起始密碼子為ATG,終止密碼子為T(mén)GA、TAA和TAG的標(biāo)準(zhǔn),最終選取了31條CDS序列用于后續(xù)數(shù)據(jù)分析。
1.2 密碼子使用特征參數(shù)分析
運(yùn)用CodonW (版本號(hào)v1.4.2) 對(duì)紫葉苔線粒體基因組CDS序列的密碼子使用指標(biāo)進(jìn)行分析,包括有效密碼子數(shù)(effective number of codon,ENC)、密碼子適應(yīng)指數(shù)(codon adaptation index,CAI)、同義密碼子相對(duì)使用度(relative synonymous codon usage,RSCU)、GC3s、A3s、T3s、C3s和G3s。其中A3s、T3s、C3s和G3s代表了同義密碼子第3堿基位置分別使用A/T/C/G的頻率;GC3s指同義密碼子第3位置的平均GC含量。EMBOSS explorer (http://www.bioinformatics.nl/emboss-explorer/) 被用來(lái)計(jì)算密碼子的平均GC含量(GCall)以及密碼子的第1、2和3位置的GC含量(分別表示為GC1、GC2和GC3),GC12為GC1和GC2的平均值。
1.3 中性繪圖分析
中性繪圖分析是一種用于研究突變壓力和自然選擇對(duì)密碼子使用偏好影響的方法[21]。利用R語(yǔ)言中的ggplot2包,以GC3作為橫坐標(biāo),GC12作為縱坐標(biāo),構(gòu)建一個(gè)二維散點(diǎn)分布圖以表征之前篩選出來(lái)的31條序列。此外,使用SPSS 18.0,基于皮爾遜相關(guān)性分析,繪制GC12和GC3的線性關(guān)系回歸線。該回歸曲線的斜率大小表示密碼子使用偏好的主導(dǎo)原因。如果回歸曲線接近對(duì)角線(斜率=1.0),GC12 和 GC3 之間存在顯著相關(guān)性,表示突變壓力是密碼子偏好的主要驅(qū)動(dòng)因素,自然選擇壓力無(wú)或較弱;相反,如果回歸曲線偏離對(duì)角線,斜率趨近于0,且GC12 和 GC3 之間沒(méi)有顯著相關(guān)性,則表明自然選擇是塑造密碼子使用的主要力量[22]。
1.4 ENC-plot分析
ENC是評(píng)估同義密碼子使用不均衡度的重要指標(biāo)[23],其范圍通常在20~61之間,與密碼子的偏好性呈負(fù)相關(guān)。ENC值為20表示極端偏倚,每個(gè)氨基酸僅使用1個(gè)密碼子;而ENC值接近61時(shí),可以認(rèn)為基本沒(méi)有偏好性。較低的ENC值(≤35)表示基因具有較強(qiáng)的密碼子偏好,即傾向于使用特定的密碼子來(lái)編碼每個(gè)氨基酸;較高的ENC值則表明密碼子使用偏好較弱[24]。ENC-plot常用于探究影響特定基因密碼子偏好性的決定性因素,將各基因沒(méi)有密碼子使用偏好的期望ENC值[23]作為縱坐標(biāo),其GC3s值作為橫坐標(biāo)來(lái)繪制期望曲線。如果基因分布在預(yù)期曲線上或接近曲線,可以認(rèn)為突變壓力對(duì)密碼子使用偏好產(chǎn)生了顯著影響;反之,如果這些點(diǎn)落在標(biāo)準(zhǔn)曲線下方且顯著偏離預(yù)期曲線,則可能是自然選擇等因素在密碼子偏好的形成中發(fā)揮了主要作用[22]。為了更準(zhǔn)確地評(píng)估期望ENC值與實(shí)際ENC值之間的差異,可以使用公式:ENC比率=(ENC期望-ENC實(shí)際)/ENC期望來(lái)計(jì)算,并通過(guò)直方圖將這些ENC比率的分布情況呈現(xiàn)出來(lái)。
1.5 PR2-plot分析
Parity rule 2 (PR2)-plot分析應(yīng)用于評(píng)估具有4個(gè)同義密碼子氨基酸的密碼子偏好,并進(jìn)一步確定突變壓力和自然選擇對(duì)密碼子使用的影響[25]。本研究選擇了具有4個(gè)同義密碼子的氨基酸(如纈氨酸(Val)、脯氨酸(Pro)、蘇氨酸(Thr)、丙氨酸(Ala)、甘氨酸(Gly))來(lái)計(jì)算每個(gè)基因第3個(gè)堿基位置的組成頻率。散點(diǎn)圖的構(gòu)建以A3s/(A3s+T3s)作為縱坐標(biāo),以G3s/(G3s + C3s)作為橫坐標(biāo)。圖的中心點(diǎn)代表鏈內(nèi)核苷酸組成遵循PR2 (A代表T,G代表C),表示DNA 2條互補(bǔ)鏈間的突變和選擇壓力沒(méi)有偏差,距中心的距離和方向表示偏離PR2的程度和方向。如果在密碼子的第3位置上,AT的頻率等于GC的頻率,圖中的點(diǎn)將沿坐標(biāo)軸成比例分布,則表明基因的密碼子使用偏好僅受到突變壓力的影響;否則,說(shuō)明自然選擇或兩者共同作用影響了密碼子的不均等使用[26]。
1.6 RSCU分析和最優(yōu)密碼子篩選
當(dāng)RSCU等于1時(shí),表示密碼子使用是無(wú)偏的,即在 RNA 轉(zhuǎn)錄中密碼子被隨機(jī)或平等地選擇;當(dāng)RSCU值大于1時(shí),表示該密碼子的使用頻率高于預(yù)期,為高頻密碼子;RSCU 值小于" 則表示該密碼子的使用頻率較低[27-28]。
已知較低的 ENC 值代表較高的密碼子使用偏倚,而高表達(dá)基因通常具有較大程度的密碼子偏好,因此具有較小的 ENC 值。最優(yōu)密碼子的確定是將基因按其ENC值降序排列,選擇排在ENC值高低兩端基因中的10%分別建立低表達(dá)和高表達(dá)基因庫(kù)。根據(jù) CodonW 軟件計(jì)算2個(gè)基因庫(kù)中密碼子的RSCU值以及二者的差異值(ΔRSCU)。滿(mǎn)足RSCUgt;1且ΔRSCUgt;0.08的密碼子被定義為基因的最優(yōu)密碼子[29]。
2 結(jié)果與分析
2.1 密碼子偏好相關(guān)指標(biāo)分析
紫葉苔線粒體基因組 CDS 序列的堿基組成分析顯示,A3s、T3s、C3s和G3s分 別 為 40.93%、45.44%、18.51%和19.80%,A3s和 T3s遠(yuǎn)高于C3s和 G3s,表明紫葉苔線粒體基因組密碼子的第 3 位置堿基以 A/U 結(jié)尾為主。在密碼子不同位置的堿基GC含量分布如圖1 a)所示,GC1、GC2、GC3和GCall的分布區(qū)間分別為29.29%~61.36%、27.18%~52.91%、21.57%~54.57%和30.46%~56.28%。不同位置堿基GC含量的平均值大小如下:GC1(43.35%) gt; GC2(38.90%)gt;GCall(38.17%)gt; GC3(32.28%)。結(jié)果表明,紫葉苔線粒體基因組密碼子不同位置的GC含量分布不均衡,且偏好使用A/U堿基,在密碼子的第3位置上表現(xiàn)尤為明顯。不同編碼基因的ENC值分布在39.80~57.79之間,平均值為50.29。此外,CAI集中在0.13~0.21之間,平均值為0.17,遠(yuǎn)小于1。上述結(jié)果表明,紫葉苔線粒體基因組存在密碼子使用偏好性,但整體偏倚程度較弱,基因表達(dá)水平較低。
紫葉苔線粒體密碼子偏好性主要指標(biāo)的相關(guān)性分析如圖1 b)所示,密碼子的GCall和其他不同位置的GC含量及ENC均呈極顯著正相關(guān),GC3與ENC呈極顯著正相關(guān)(r=0.66,plt;0.01),且二者的相關(guān)系數(shù)在不同位置堿基的GC含量與ENC的相關(guān)系數(shù)中最大。該結(jié)果表明GC含量,尤其是密碼子第3位置的GC含量對(duì)密碼子的偏好使用存在顯著影響。此外,ENC與基因編碼氨基酸的長(zhǎng)度L_aa有極顯著正相關(guān)(r=0.56,plt;0.01),表明在紫葉苔線粒體中,基因的長(zhǎng)度影響密碼子偏好性。
紫葉苔線粒體基因組蛋白編碼區(qū)密碼子的RSCU值分布如圖2所示,不同密碼子的RSCU值差異較大,其中編碼亮氨酸的密碼子UUA的RSCU值最高,為1.9 而另一個(gè)同樣編碼亮氨酸的密碼子CUC的RSCU值僅為0.41。此外,共鑒定出27個(gè)高頻密碼子,其RSCU值大于1。在這27個(gè)密碼子中,以U、A、G和C結(jié)尾的密碼子數(shù)分別為16、10、1和0,這表明紫葉苔線粒體基因組的高頻密碼子在使用偏好上多以A或U結(jié)尾。
2.2 中性圖分析
GC3和GC12之間的關(guān)系用中性圖(neutrality plot)分析(見(jiàn)圖3)。GC3的范圍為0.215 7~0.545 7,GC12的范圍為0.330 6~0.571" 平均值分別為0.322 8和0.411 2。GC12和GC3之間存在顯著的相關(guān)性(r= 0.620" plt;0.01),說(shuō)明基因組中大多數(shù)編碼基因的前2個(gè)密碼子堿基與第3個(gè)堿基在組成上不存在顯著差異,定向突變壓力作用于所有密碼子位置?;貧w直線的斜率(回歸系數(shù))為0.534 0,表明突變壓力對(duì)密碼子偏好效應(yīng)的貢獻(xiàn)率為53.40%,自然選擇等因素的貢獻(xiàn)率為46.60%。根據(jù)中性繪圖可知,突變壓力和自然選擇共同塑造了紫葉苔線粒體基因組的密碼子偏好,其中突變壓力占主要作用。
2.3 ENC曲線分析
圖4中ENC-plot結(jié)果表明,在紫葉苔線粒體基因組蛋白編碼序列中,基因的ENC值分布較聚集,有大量基因落在或靠近ENC標(biāo)準(zhǔn)曲線,而較少數(shù)的基因離標(biāo)準(zhǔn)曲線較遠(yuǎn)。從ENC比值頻率統(tǒng)計(jì)分布圖也可以看出:ENC比率從-0.15到0.25不等;在31個(gè)蛋白編碼基因中,靠近ENC標(biāo)準(zhǔn)曲線的區(qū)間(-0.05~0.05)內(nèi)共分布19個(gè)基因(61.29%),其實(shí)際和預(yù)期的ENC值差異較?。挥?個(gè)基因(29.03%)的ENC比率大于0.0 反映了這些基因不僅分布在標(biāo)準(zhǔn)曲線下方且離標(biāo)準(zhǔn)曲線較遠(yuǎn)。以上結(jié)果進(jìn)一步表明,紫葉苔線粒體基因組的密碼子偏好性更多地受到突變壓力的作用,自然選擇的影響次之。
2.4 PR2-plot分析
為進(jìn)一步評(píng)估紫葉苔線粒體基因4種堿基的偏倚關(guān)系,并了解突變和選擇壓力對(duì)密碼子使用的影響,對(duì)同義密碼子的第3位堿基進(jìn)行了PR2-plot分析。如圖5所示,PR2水平4個(gè)區(qū)域的基因分布不均勻。在垂直方向上,大部分基因集中在平面的下半?yún)^(qū)域,表明在密碼子的同義位置上T的使用頻率高于A;在水平方向上,更多的基因分布在平面的右側(cè),說(shuō)明G的使用頻率高于C。因此,紫葉苔線粒體基因組同義密碼子的第 3 位置堿基在選擇上具有偏好性。根據(jù)堿基的不均衡使用,以及少數(shù)基因顯示出接近中心的位置,可以推測(cè)自然選擇與突變壓力可能共同影響了紫葉苔線粒體基因的密碼子使用偏好。
2.5 最優(yōu)密碼子篩選
按照ENC值的大小順序,分別選取3個(gè)基因(rps14、rpl6、cox2)作為高表達(dá)基因庫(kù),3個(gè)基因(ccmFC、rpl2、rtl)作為低表達(dá)基因庫(kù)。按照最優(yōu)密碼子的標(biāo)準(zhǔn)(RSCU gt;1且ΔRSCUgt;0.08),共篩選出23個(gè)最優(yōu)密碼子(見(jiàn)表1),其中以U結(jié)尾的密碼子有14個(gè),以A結(jié)尾的密碼子有8個(gè),以G結(jié)尾的密碼子有1個(gè),而以C結(jié)尾的密碼子有0個(gè)。該結(jié)果進(jìn)一步表明了紫葉苔線粒體基因的最優(yōu)密碼子偏好以A或U結(jié)尾。
3 討 論
在基因編碼中,生物體傾向于選擇某些特定的密碼子,即CUB,對(duì)CUB的解析有助于理解基因調(diào)控和進(jìn)化過(guò)程。CUB在不同基因組、基因之間以及同一基因內(nèi)部都存在差異[30],同一物種的核基因組和細(xì)胞器基因組的CUB往往也有較大差別。植物具有較高的GC含量,其中單子葉植物的核基因編碼區(qū)富含以C/G結(jié)尾的密碼子,雙子葉植物則有較高比例的以A/U結(jié)尾的密碼子[24],葉綠體和線粒體基因組在密碼子使用上更傾向于使用A/U結(jié)尾的密碼子。在對(duì)多種植物的葉綠體基因組進(jìn)行的研究中,如水稻屬[26]、胡頹子屬[31]、柏科[32]、枸杞[33]等,都發(fā)現(xiàn)了這種密碼子偏好性。目前,對(duì)植物線粒體基因組CUB模式的研究還相對(duì)有限,但已有研究[19,34-35]也揭示了相似的規(guī)律,為理解植物基因組的進(jìn)化提供了寶貴信息。
本文對(duì)紫葉苔線粒體基因組蛋白編碼序列進(jìn)行了全面的密碼子使用偏好性分析。密碼子組成計(jì)算結(jié)果顯示,紫葉苔線粒體基因組的平均GC含量和密碼子不同位置的GC含量均低于50%,表明紫葉苔線粒體基因組傾向于富含A/T的核苷酸,偏好以A/U結(jié)尾的密碼子,且基因組中的高頻密碼子和最優(yōu)密碼子也主要以A/U結(jié)尾。通過(guò)對(duì)維管植物、苔蘚植物和藻類(lèi)線粒體基因組的密碼子偏好進(jìn)行初步比較[19-20,34],發(fā)現(xiàn)綠色植物各類(lèi)群在密碼子偏好上既表現(xiàn)出共性特征,也存在動(dòng)態(tài)變化。其中大多數(shù)物種偏好以A/U結(jié)尾的密碼子,但這種偏好的程度在不同類(lèi)群之間以及類(lèi)群內(nèi)部又表現(xiàn)出一定的變異性??傮w來(lái)看,苔蘚植物對(duì)A/U結(jié)尾密碼子的偏好低于水生輪藻類(lèi),高于在陸地繁盛的維管植物,這似乎也暗示了苔蘚植物在植物界中從水生到陸生過(guò)渡的進(jìn)化地位。地錢(qián)門(mén)、真蘚門(mén)和角苔門(mén)在線粒體基因組的密碼子偏好上也存在一定差異,其中地錢(qián)門(mén)在密碼子末端位點(diǎn)對(duì)A/U的偏好最弱,而真蘚門(mén)的偏好性較強(qiáng)[34]。本文的結(jié)果同樣顯示,紫葉苔線粒體基因組密碼子對(duì)A/U具有較弱的偏好性,為陸生植物早期分化類(lèi)群在基因組組成上的共性特
征提供了又一證據(jù)。植物在線粒體基因組密碼子偏好上的相似性可能與植物線粒體的共同起源有關(guān),而偏好性強(qiáng)度的變化可能與不同植物類(lèi)群對(duì)陸生環(huán)境變化的適應(yīng)性密切相關(guān)。例如,在陸生植物譜系的進(jìn)化過(guò)程中,線粒體基因組中的密碼子使用逐漸從強(qiáng)烈的AT偏好轉(zhuǎn)變?yōu)樵絹?lái)越多的GC積累,這可能有助于減少DNA在強(qiáng)紫外線輻射下的損傷[20],從而更好地適應(yīng)干燥的環(huán)境。
在基因組學(xué)研究領(lǐng)域,人們對(duì)CUB的形成機(jī)制進(jìn)行了廣泛探討,其中自然選擇理論與中性理論得到了學(xué)術(shù)界的普遍認(rèn)可[36]。在研究密碼子使用偏好的成因時(shí),中性圖是一種重要的分析工具,它能夠揭示自然選擇和突變壓力對(duì)CUB的相對(duì)影響[37]。紫葉苔線粒體基因組密碼子中性繪圖結(jié)果顯示,GC3與GC12顯著相關(guān),表明定向突變壓力在整體密碼子組成上發(fā)揮了重要作用;同時(shí)回歸直線的斜率(回歸系數(shù))為0.534 0,進(jìn)一步表明,相較于自然選擇等因素,突變壓力對(duì)于密碼子的組成成分發(fā)揮了更為重要的作用。為了進(jìn)一步說(shuō)明同義密碼子的使用偏好性,基于同義密碼子第3位置的GC含量(GC3s)繪制ENC-plot圖,結(jié)果顯示大部分基因接近預(yù)期曲線,表明這些基因的密碼子偏好性主要受突變壓力的制約,自然選擇的作用次之。在PR2-plot分析中,只有少量基因位于或接近中心坐標(biāo)(0. 0.5),大部分基因散落在A3/(A3+T3)lt;0.5和G3/(G3+C3)gt;0.5的區(qū)域范圍內(nèi),顯示在同義位點(diǎn)上不同堿基的使用頻率存在差異。這也表明,在形成紫葉苔線粒體基因組的CUB時(shí),除了受到中性突變壓力的影響外,還受到自然選擇及其他因素的影響。植物線粒體基因組密碼子的偏好性可能以突變或自然選擇作為主要的驅(qū)動(dòng)力,或同時(shí)受到其他多種因素的共同作用[30]。然而目前針對(duì)苔蘚植物的相關(guān)研究極少,有待加大對(duì)該植物類(lèi)群線粒體基因組的探討,尋找更廣泛的密碼子偏好規(guī)律,為揭示植物類(lèi)群的系統(tǒng)發(fā)育關(guān)系,以及理解其進(jìn)化歷程等提供更全面、深入的見(jiàn)解。
此外,本研究從紫葉苔線粒體基因組中共篩選出23個(gè)最優(yōu)密碼子。這些密碼子的大多數(shù)在第3位置堿基上或以U結(jié)尾,或以A結(jié)尾,更進(jìn)一步表明紫葉苔線粒體基因組對(duì)于A/U結(jié)尾密碼子的偏好,NNA或NNU密碼子的使用模式也與之前其他植物細(xì)胞器基因組最優(yōu)密碼子的篩選結(jié)果一致[38-39]。基于紫葉苔線粒體基因組密碼子使用模式進(jìn)行外源序列優(yōu)化,可以在后續(xù)以基因工程為手段的紫葉苔屬遺傳發(fā)育、物種保護(hù)等研究工作中,用于改善基因表達(dá)。
4 結(jié) 語(yǔ)
基于紫葉苔線粒體基因組CDS序列,對(duì)紫葉苔線粒體基因組的密碼子組成、中性繪圖、ENC-plot繪圖、PR2-plot繪圖等進(jìn)行了分析,主要結(jié)論如下:紫葉苔線粒體基因組CDS序列傾向于富含A/T的核苷酸和以A/U結(jié)尾的密碼子,但偏倚程度較弱;其同義密碼子的使用偏好性除主要受到突變壓力的影響外,還受到自然選擇、堿基組成和基因長(zhǎng)度等因素的影響;篩選出了23個(gè)最優(yōu)密碼子,可用于紫葉苔分子發(fā)育和遺傳保護(hù)等方面的研究。
本文僅針對(duì)紫葉苔線粒體基因組的蛋白編碼序列進(jìn)行了密碼子偏好分析,后續(xù)將進(jìn)一步研究非編碼序列如內(nèi)含子數(shù)量等因素對(duì)密碼子偏好性的影響,并增加苔蘚及其他不同植物類(lèi)群的物種作為線粒體基因組密碼子偏好性的研究對(duì)象,結(jié)合系統(tǒng)發(fā)育樹(shù)深入探討密碼子偏好與進(jìn)化的關(guān)系。
參考文獻(xiàn)/References:
[1] CHEN Xinjie,BUTOW R A.The organization and inheritance of the mitochondrial genome[J].Nature Reviews Genetics,200 6(11):815-825.
TAANMAN J W.The mitochondrial genome: Structure, transcription, translation and replication[J].Biochimica Et Biophysica Acta,1999,1410(2):103-123.
[3] MCCLELLAN D A.The codon-degeneracy model of molecular evolution[J].Journal of Molecular Evolution,2000,50(2):131-140.
[4] BIRO J C.Does codon bias have an evolutionary origin?[J].Theoretical Biology and Medical Modelling,2008.DOI:10.1186/1742-4682-5-16.
[5] SHARP P M,BAILES E,GROCOCK R J,et al.Variation in the strength of selected codon usage bias among bacteria[J].Nucleic Acids Research,200 33(4):1141-1153.
[6] LIN K,KUANG Y Y,JOSEPH J S,et al.Conserved codon composition of ribosomal protein coding genes in Escherichia coli, Mycobacterium tuberculosis and Saccharomyces cerevisiae:Lessons from supervised machine learning in functional genomics[J].Nucleic Acids Research,200 30(11):2599-2607.
[7] NOVEMBRE J A.Accounting for background nucleotide composition when measuring codon usage bias[J].Molecular Biology and Evolution,200 19(8):1390-1394.
[8] BARBHUIYA P A,UDDIN A,CHAKRABORTY S.Genome-wide comparison of codon usage dynamics in mitochondrial genes across different species of amphibian genus Bombina[J].Journal of Experimental Zoology. Part B, Molecular and Developmental Evolution,2019,332(3/4):99-112.
[9] SDERSTRM L,HAGBORG A,VON KONRAT M,et al.World checklist of hornworts and liverworts[J].PhytoKeys,2016(59):1-828.
[10]CRANDALL-STOTLER B.The apical cell and early development of Pleurozia purpurea Lindb[J].Lindbergia,1976,3(3/4):197-208.
[11]FORREST L L,DAVIS E C,LONG D G,et al.Unraveling the evolutionary history of the liverworts(Marchantiophyta):Multiple taxa,genomes and analyses[J].The Bryologist,2006,109(3):303-334.
[12]LI Yunfeng,LUO Lian,LIU Yang,et al.The bryophyte phylogeny group:A revised familial classification system based on plastid phylogenomic data[J].Journal of Systematics and Evolution,202 62(4):577-588.
[13]THIERS B M.A monograph of Pleurozia (Hepaticae;Pleuroziaceae)[J].The Bryologist,199 96(4):517-554.
[14]DONG Shanshan,LIU Yang.The mitochondrial genomes of bryophytes[J].Bryophyte Diversity and Evolution,202 43(1):112-126.
[15]PUTTICK M N,MORRIS J L,WILLIAMS T A,et al.The interrelationships of land plants and the Nature of the ancestral embryophyte[J].Current Biology,2018,28(5):733-745.
[16]WANG Bin,XUE Jiayu,LI Libo,et al.The complete mitochondrial genome sequence of the liverwort Pleurozia purpurea reveals extremely conservative mitochondrial genome evolution in liverworts[J].Current Genetics,2009,55(6):601-609.
[17]LIU Y,MEDINA R,GOFFINET B.350 my of mitochondrial genome stasis in mosses,an early land plant lineage[J].Molecular Biology and Evolution,201 31(10):2586-2591.
[18]DONG Shanshan,ZHAO Chaoxian,ZHANG Shouzhou,et al.Mitochondrial genomes of the early land plant lineage liverworts (Marchantiophyta):Conserved genome structure, and ongoing low frequency recombination[J].BMC Genomics,2019.DOI:10.1186/s12864-019-6365-y.
[19]ZHOU Meng,LI Xia.Analysis of synonymous codon usage patterns in different plant mitochondrial genomes[J].Molecular Biology Reports,2009,36(8):2039-2046.
[20]WANG Bin,YUAN Jing,LIU Jing,et al.Codon usage bias and determining forces in green plant mitochondrial genomes[J].Journal of Integrative Plant Biology,201 53(4):324-334.
[21]SUEOKA N.Directional mutation pressure and neutral molecular evolution[J].Proceedings of the National Academy of Sciences of the United States of America,1988,85(5):2653-2657.
[22]ZHANG Kun,WANG Yiheng,ZHANG Yue,et al.Codon usage characterization and phylogenetic analysis of the mitochondrial genome in Hemerocallis citrina[J].BMC Genomic Data,2024.DOI:10.1186/s12863-024-01191-4.
[23]WRIGHT F.The 'effective number of codons' used in a gene[J].Gene,1990,87(1):23-29.
[24]PARVATHY S T,UDAYASURIYAN V,BHADANA V.Codon usage bias[J].Molecular Biology Reports,202 49(1):539-565.
[25]SUEOKA N.Translation-coupled violation of Parity Rule 2 in human genes is not the cause of heterogeneity of the DNA G+C content of third codon position[J].Gene,1999,238(1):53-58.
[26]CHAKRABORTY S,YENGKHOM S,UDDIN A.Analysis of codon usage bias of chloroplast genes in Oryza species:codon usage of chloroplast genes in Oryza species [J].Planta,2020.DOI:10.1007/s00425-020-03470-7.
[27]SHIELDS D C,SHARP P M,HIGGINS D G,et al.\"Silent\" sites in Drosophila genes are not neutral: Evidence of selection among synonymous codons[J].Molecular Biology and Evolution,1988,5(6):704-716.
[28]WANG Hongju,MENG Tao,WEI Wenqiang.Analysis of synonymous codon usage bias in helicase gene from Autographa californica multiple nucleopolyhedrovirus[J].Genes amp; Genomics,2018,40(7):767-780.
[29]WU Peng,XIAO Wenqi,LUO Yingyong,et al.Comprehensive analysis of codon bias in 13 Ganoderma mitochondrial genomes[J].Frontiers in Microbiology,2023.DOI:10.3389/fmicb.2023.1170790.
[30]SALIM H M W,CAVALCANTI A R O.Factors influencing codon usage bias in genomes[J].Journal of the Brazilian Chemical Society,2008,19(2):257-262.
[31]LI Changle,ZHOU Ling,NIE Jiangbo,et al.Codon usage bias and genetic diversity in chloroplast genomes of Elaeagnus species (Myrtiflorae: Elaeagnaceae)[J].Physiology and Molecular Biology of Plants,202 29(2):239-251.
[32]黃思琦,張麒功,葉澤霖,等.5種柏科植物葉綠體基因組密碼子偏好性分析[J].福建農(nóng)林大學(xué)學(xué)報(bào)(自然科學(xué)版),202 53(2):214-220.
HUANG Siqi,ZHANG Qigong,YE Zelin,et al.Codon bias analysis of chloroplast genomes of 5 Cupressaceae plants[J].Journal of Fujian Agriculture and Forestry University(Natural Science Edition),202 53(2):214-220.
[33]杜雨,李效雄,賈西貝,等.枸杞葉綠體基因組密碼子偏好性分析[J].中草藥,202 55(4):1316-1325.
DU Yu,LI XiaoxiongX,JIA Xibei,et al.Codon preference analysis of chloroplast genome of Chinese wolfberry[J].Chinese traditional and herbal drugs,202 55(4):1316-1325.
[34]XU Wenjing,XING Tian,ZHAO Mingming,et al.Synonymous codon usage bias in plant mitochondrial genes is associated with intron number and mirrors species evolution[J].PLoS One,2015.DOI:10.1371/journal.pone.0131508.
[35]LIU Qingpo,F(xiàn)ENG Ying,XUE Qingzhong.Analysis of factors shaping codon usage in the mitochondrion genome of Oryza sativa[J].Mitochondrion,200 4(4):313-320.
[36]SHARP P M,LI W H.The codon Adaptation Index:A measure of directional synonymous codon usage bias, and its potential applications[J].Nucleic Acids Research,1987,15(3):1281-1295.
[37]LI Tingting,MA Zheng,DING Tiemei,et al.Codon usage bias and phylogenetic analysis of chloroplast genome in 36 gracilariaceae species[J].Functional amp; Integrative Genomics,2024.DOI:10.1007/s10142-024-01316-z.
[38]耿曉?shī)櫍Z魏,陳佳寧,等.金花茶葉綠體基因組密碼子偏好性分析[J].分子植物育種,202 20(7):2196-2203.
GENG Xiaoshan,JIA Wei,CHEN Jianning,et al.Codon usage bias analysis of chloroplast genome in Camellia nitidissima[J].Molecular plant breeding,202 20(7):2196-2203.
[39]羅永堅(jiān),王茹,趙仁菲,等.珙桐葉綠體基因組同義密碼子使用偏好性分析[J].北京林業(yè)大學(xué)學(xué)報(bào),202 46(3):8-16.
LUO Yongjian,WANG Ru,ZHAO Renfei,et al.Analysis of synonymous codon usage bias in the chloroplast genome of Davidia involucrata[J].Journal of Beijing Forestry University,202 46(3):8-16.