Analysis ofcodonusagebiasinchloroplast genomeof Phellodendron amurense
LU Mengyue ZHOU MengmengYANG JunWU ZhenyuWANG Bowen ZOU YuYANG Hongsheng (College of Biologyand Agriculture,Jiamusi University, Jiamusi 1540o7,China)
AbstractTo explore thecodonusage biasand its major influencingfactors in thechloroplast genomeof Phellodendron amurense, the coding sequences (CDS) of the chloroplast genome of P .amurensewere utilized.Fragments shorter than 30O bp,containing stop codons,or repetitive sequences were excluded,ultimately retaining 52 valid sequences.The GC content and efective number of codons (ENC)of these sequences were calculated using Codon W and CUSP software,and the influencing factors of codon preference were further discussed by correlation analysis of codon preference parameters.The findings indicated thatthe average GC content within thechloroplast genome of P .amurense was 39.34% ,with the GC content at the three positions ranked as follows: (2號(hào)
The codon preference parameter correlation analysis revealed a preference for A and U as the third base of the codon,withan average ENCvalueof 49.13,indicating a weak codon usage bias.Natural selection pressure was identifiedas theprimary factor affecting codon usage bias.Tenoptimizedcodons were identified,which showed a significant preferenceforthe Aand U types.This research lays a data foundation and provides a referencefor gene engineering and the optimization of codons in the chloroplast genome of P amurense.
Keywords Phelldendron amurense; chloroplast genome; codon usage bias; optimal codons
葉綠體基因組的遺傳方式為單親遺傳,并具備一定程度的半自主性。這些特征賦予葉綠體基因組在植物學(xué)研究領(lǐng)域,特別是植物多樣性和系統(tǒng)發(fā)育研究中廣泛的應(yīng)用潛力[2。此外,葉綠體基因組在植物適應(yīng)性研究中也占有重要部分,通過分析其在不同環(huán)境條件下的變異和適應(yīng)性進(jìn)化,有助于揭示植物對(duì)環(huán)境變化的響應(yīng)機(jī)制[3]。密碼子作為遺傳信息的基本單位,通過不同的編碼方式對(duì)氨基酸進(jìn)行編碼[4。由于遺傳密碼的簡(jiǎn)并性,同一氨基酸可由多種密碼子編碼,這些同義密碼子在遺傳信息的傳遞過程中發(fā)揮重要作用5。密碼子使用偏好性是指不同物種或同一物種不同基因組區(qū)域在使用同義密碼子時(shí)的選擇傾向性,該偏好性的形成受多種因素影響,包括基因組背景、轉(zhuǎn)錄和翻譯效率、密碼子與反密碼子配對(duì)的適應(yīng)性等
黃檗(Phellodendronamurense)是蕓香科黃檗屬多年生落葉喬木,廣泛分布于中國(guó)東北及華北地區(qū)。該植物在中醫(yī)藥領(lǐng)域應(yīng)用廣泛,據(jù)現(xiàn)代藥理學(xué)研究,其含有主要活性成分小檗堿及少量的巴馬亭等,具有顯著的抗菌和抑菌功能8。通過優(yōu)化密碼子,不僅有助于理解黃檗的遺傳機(jī)制,還可為基因組的改良和目的基因的優(yōu)化提供重要依據(jù),以提高黃檗中目標(biāo)基因的表達(dá)效率和穩(wěn)定性,從而提高黃檗的經(jīng)濟(jì)價(jià)值和藥用價(jià)值。本研究選取黃葉綠體基因組編碼區(qū)序列為研究對(duì)象,分析其基因組中密碼子的使用偏好及主要影響因素,為該植物的葉綠體基因組研究和遺傳改良提供參考。
1材料與方法
1.1數(shù)據(jù)來源
本研究所使用的黃檗葉綠體基因組數(shù)據(jù)(登錄號(hào):KY707335.1)從NCBI數(shù)據(jù)庫(kù)中獲得。該基因組的總長(zhǎng)度為 158442bp ,包含88個(gè)編碼序列(CodingDNAsequence,CDS)。在使用MEGA6軟件進(jìn)行CDS篩選時(shí),排除了重復(fù)序列以及長(zhǎng)度不足 300bp 的序列,最終篩選出52個(gè)CDS,用于后續(xù)分析。
1.2分析方法
使用CodonW1.4.2軟件分析有效密碼子數(shù)(Effectivenumberofcodons,ENC)相對(duì)同義密碼子使用度(Relative synonymous codon usage,RSCU)密碼子數(shù)量(N)以及8種氨基酸密碼子第三位堿基腺嘌呤 、胸腺嘧啶
)、胞嘧啶
和鳥嘌呤
的含量。ENC值的高低可以推斷密碼子偏好性的強(qiáng)弱。ENC理論取值在 20~61 ,越靠近20,密碼子偏好性越強(qiáng);越靠近61,密碼子偏好性較弱,將45作為判斷密碼子偏好性強(qiáng)弱的標(biāo)準(zhǔn)。此外,利用CUSP軟件評(píng)估密碼子第一、第二和第三位的GC含量
,以及基因組總體GC含量(
;進(jìn)一步采用SPSS27.0軟件分析密碼子偏好參數(shù)的相關(guān)性。使用Excel軟件用于繪制中性圖表,分析影響密碼子使用偏好性的因素。為揭示密碼子使用偏好性的潛在影響因素,進(jìn)行ENC-plot和PR2-plot分析。同時(shí),選擇RSCU值 ?1 的密碼子作為高頻密碼子,計(jì)算高表達(dá)與低表達(dá)密碼子的△RSCU(兩者之間的差值),通過設(shè)定 RSCUgt;0.08的標(biāo)準(zhǔn),篩選出高表達(dá)密碼子,結(jié)合RSCU值 ?1 確定黃葉綠體基因組中的最優(yōu)密碼子[10]
2結(jié)果與分析
2.1黃檗葉綠體基因組的密碼子組成
經(jīng)分析,黃檗葉綠體基因組中52個(gè)CDS密碼子的GC平均含量為 39.34% ,密碼子第一、第二和第三位的GC含量分別為 47.63% 、 40.07% 和 30.32% 。這些數(shù)據(jù)揭示出黃檗葉綠體基因組中的密碼子的堿基在不同位置上對(duì)堿基A或尿嘧啶(U)存在偏好,而非均勻分布。此外,52個(gè)CDS的ENC值在 37.79~ 61.00,平均值為49.13,ENC值 gt;45 的基因數(shù)有44個(gè),表明黃檗葉綠體基因組密碼子使用偏好性較弱。
由表1可知, 與
間的相關(guān)性具有統(tǒng)計(jì)學(xué)意義
),
與
之間的相關(guān)性較高( Plt;0.05 ),
與
之間的相關(guān)性無統(tǒng)計(jì)學(xué)意義( Pgt;0.05 )。這表明
與
的堿基序列具有較高的一致性。進(jìn)一步分析顯示,ENC值與
相關(guān)性具有統(tǒng)計(jì)學(xué)意義(Plt;0.01,說明密碼子使用偏好受第三位堿基影響較大。N值與ENC值之間相關(guān)性無統(tǒng)計(jì)學(xué)意義( Pgt;0.05 ,表明基因編碼序列的長(zhǎng)度對(duì)密碼子使用偏好的影響較小[]。此外,N與
及
之間的相關(guān)性無統(tǒng)計(jì)學(xué)意義( Pgt;0.05) ,這說明密碼子的堿基組成對(duì)密碼子數(shù)量的影響不大。
RSCU分析結(jié)果顯示,有30個(gè)密碼子的RSCU值gt;1。以U為末端堿基的有16個(gè),以A為末端堿基的有13個(gè),僅有1個(gè)密碼子以G作為末端堿基。表明黃檗葉綠體基因密碼子在選擇末端堿基時(shí),更傾向A和U。
2.2 中性繪圖分析結(jié)果
中性繪圖分析結(jié)果顯示,黃葉綠體基因組52個(gè)CDS的 值
和
的平均值)在 0.34395~ 0.58275,而
的值在
與
的相關(guān)性分析顯示,二者的相關(guān)系數(shù)為0.214,未達(dá)到統(tǒng)計(jì)學(xué)顯著性水平(Pgt;0.05) (圖1)。這一結(jié)果表明黃檗密碼子的偏好主要受到選擇壓力的影響。
2.3 ENC-plot分析結(jié)果
ENC-plot分析結(jié)果顯示(圖2),位于標(biāo)準(zhǔn)曲線下方的基因數(shù)量更多,表明大多數(shù)基因的密碼子偏好性受到自然選擇的影響[12。ENC比值頻數(shù)分布結(jié)果顯示,ENC比值分布在 -0.05~0.05 的基因有20個(gè),而另外32個(gè)基因的ENC比值則超出該范圍(表2)。大部分基因的ENC實(shí)際值與期望值之間的差距揭示了黃檗葉綠體基因組的密碼子偏好性主要受到選擇壓力的影響。
2.4PR2-plot分析結(jié)果
PR2-plot分析結(jié)果顯示(圖3),散點(diǎn)在各象限內(nèi)分布不均,大多數(shù)分布在象限下方,表明具有顯著偏好性的是密碼子的第三位堿基,且4種堿基的使用頻率差異顯著。表明黃檗葉綠體基因組密碼子使用偏好主要受自然選擇的影響。
2.5 最優(yōu)密碼子確定
據(jù)RSCU分析結(jié)果,在黃檗葉綠體基因組中鑒定出33個(gè)高頻密碼子,這些密碼子的RSCU值 gt;1。其中,29個(gè)密碼子的 RSCUgt;0.08 ,將這些密碼子定義為高表達(dá)密碼子。以RSCUgt;0.08且RSCU值 ?1 為標(biāo)準(zhǔn),最終篩選出10個(gè)最優(yōu)密碼子,即UUU、CUU、CCC、ACA、UAU、CAU、AAU、UGA、AGA和GGA。
3結(jié)論與討論
針對(duì)植物葉綠體基因組中的密碼子使用偏好進(jìn)行系統(tǒng)分析,可探究突變壓力和自然選擇對(duì)其密碼子偏好性的影響,并進(jìn)一步分析堿基組成等其他因素,有助于全面評(píng)估這些因素對(duì)其密碼子使用偏好的潛在影響。研究表明,不同物種在同義密碼子使用上的差異,是植物在長(zhǎng)期的環(huán)境適應(yīng)和進(jìn)化過程中形成的特征[13]。該現(xiàn)象主要?dú)w因于突變壓力和自然選擇的雙重作用[14-15]。在同義密碼子的使用中,主要差別存在于密碼子的第三位堿基。
本研究中,有30個(gè)密碼子的RSCU值 gt;1 ,其中以U為末端堿基的有16個(gè),以A為終止堿基的有13個(gè),以G為末端堿基的僅1個(gè)。這表明黃檗葉綠體基因組的密碼子末位堿基偏好使用A或U。ENC值 gt;45 的基因有44個(gè),表明黃檗葉綠體基因組密碼子使用偏好性較弱。這一結(jié)果與蕁麻和栽培型向日葵等植物葉綠體基因組的研究結(jié)果一致[,表明不同植物在葉綠體基因組的密碼子使用偏好性上存在一定的共性,這與葉綠體基因組的進(jìn)化和適應(yīng)性有關(guān)。此外,黃檗葉綠體基因組中GC平均含量39.34% ,且密碼子第一、二位的GC含量高于第三位,這一特征與北沙參等雙子葉植物的研究結(jié)果相似[7,顯示不同植物類別在密碼子使用模式上存在一定的相似性,與基因組的結(jié)構(gòu)和穩(wěn)定性有關(guān)。黃檗葉綠體基因組中密碼子的末位堿基偏好A或U,這一模式與某些單子葉植物的密碼子使用模式類似,說明在不同植物中,密碼子的末位堿基偏好受到相似的進(jìn)化壓力和選擇機(jī)制的影響。然而,盡管存在這些共性,不同植物在密碼子使用偏好性和基因組結(jié)構(gòu)上仍表現(xiàn)出顯著差異[18]。例如,黃檗葉綠體基因組的密碼子使用偏好性較低,而某些植物的葉綠體基因組表現(xiàn)出更高的密碼子使用偏好性和較低的ENC值。這種差異與植物的進(jìn)化歷史、環(huán)境適應(yīng)性和基因組結(jié)構(gòu)有關(guān),需進(jìn)一步試驗(yàn)驗(yàn)證和分析[9]。黃檗葉綠體基因組中GC平均含量 39.34% ,不同植物的葉綠體基因組中GC含量與基因組堿基組成存在差異,與其特定的生理和生態(tài)適應(yīng)性有關(guān)。大多數(shù)植物表現(xiàn)出不同的末位堿基偏好,這種差異與植物的翻譯效率、mRNA穩(wěn)定性以及蛋白質(zhì)合成機(jī)制有關(guān),需深入研究探究[20]。
本研究分析了黃檗葉綠體基因組水平的密碼子使用偏好,并揭示其在突變壓力和自然選擇影響下的特征。然而,該研究尚不全面,需在未來研究中進(jìn)一步完善。目前尚未探討特定基因表達(dá)水平和功能影響,以及特定基因的表達(dá)模式與其密碼子偏好性之間的直接關(guān)系。未來研究可結(jié)合轉(zhuǎn)錄組數(shù)據(jù),深入分析特定基因的表達(dá)模式及其與密碼子使用偏好的關(guān)系,以更全面地理解密碼子偏好性對(duì)基因功能的影響。此外,基因表達(dá)調(diào)控和環(huán)境因素在密碼子使用偏好中的潛在影響尚未得到充分評(píng)估[19,后續(xù)研究應(yīng)納入基因表達(dá)調(diào)控和環(huán)境因素,以更全面地評(píng)估其對(duì)黃檗葉綠體基因組密碼子使用偏好的影響。通過多因素分析模型,探討這些因素在密碼子使用偏好中的交互作用和潛在機(jī)制,將有助于更全面地理解密碼子使用偏好的形成和調(diào)控機(jī)制。還可以通過基因工程技術(shù),將篩選的最優(yōu)密碼子應(yīng)用于黃檗的遺傳改良,通過試驗(yàn)驗(yàn)證其在提升基因表達(dá)效率和改良植物特性方面的實(shí)際效果。這不僅有助于提高黃檗的經(jīng)濟(jì)和藥用價(jià)值,還可為其他藥用植物的遺傳改良提供參考。
參考文獻(xiàn)
[1]吳茜,姜梅,陳海梅,等.旋覆花、湖北旋覆花和線葉旋覆花的葉綠體基因組比較分析和系統(tǒng)發(fā)育研究[J].藥學(xué)學(xué)報(bào),2020,55(5):1042-1049.
[2]李事超,趙誠(chéng)貴,姜永成,等.黃芪屬物種葉綠體基因組蛋白編碼基因密碼子偏好性分析[J/OL].草業(yè)科學(xué),1-18(2024-11-10)[2025-4-30].http://kns.cnki.net/kcms/detail/62.1069.S.20241028.1736.002.html.
[3]何雯杰,黃華枝,張馳,等.薇甘菊葉綠體基因組密碼子偏好性分析[J].廣西林業(yè)科學(xué),2024,53(3):329-338.
[4]柳燕杰,田旭平,李倩.美國(guó)紅梣葉綠體基因組密碼子偏好性分析[J].江蘇農(nóng)業(yè)科學(xué),2020,48(15):83-88.
[5]劉起麟,李金澤,丁佳渝,等.蓼屬葉綠體基因組密碼子偏好性分析及比較特征[J/OL].中國(guó)農(nóng)業(yè)科技導(dǎo)報(bào),1-12(2024-11-10)[2025-4-30].https://doi.org/10.13304/j.nykjdb. 2024.0090.
[6] LU Y W,CHIU T S. Factors affecting synonymous Codonusage of housekeeping genes in Drosophila melanogaster[J].Acta biologica hungarica,2018,69(1) :58-71.
[7]黃治昊,周鑫,張孝然,等.我國(guó)大陸黃檗潛在分布區(qū)及分布適宜性評(píng)價(jià)[J].生態(tài)學(xué)報(bào),2018,38(20):7469-7476.
[8]高楊,劉銘,張洪文.珍稀植物黃檗的藥用價(jià)值及可持續(xù)利用[J].中國(guó)保健營(yíng)養(yǎng),2012,22(4):22-24.
[9]屈亞亞,辛靜,馮發(fā)玉,等.香花枇杷質(zhì)體基因組序列密碼子偏性分析[J].西北林學(xué)院學(xué)報(bào),2021,36(4):138-144,158.
[10]李顯煌,楊生超,辛雅萱,等.燈盞花葉綠體基因組密碼子偏好性分析[J].云南農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2021(3):384-392.
[11]秦斗文,徐庭亮,閆京艷,等.柔毛郁金香葉綠體基因組密碼子偏好性分析[J].江蘇農(nóng)業(yè)科學(xué),2023,51(22):41-47.
[12]楊秀玲,許春梅,耿曉珊,等.獨(dú)腳金葉綠體基因組密碼子偏好性分析[J].分子植物育種,2023,21(12):3889-3897.
[13]NIE XJ,DENGPC,F(xiàn)ENGKW,et al. Comparativeanalysis of codon usage patterns in chloroplast genomesof the Asteraceae family[J].Plant molecular biologyreporter,2014,32(4):828-840.
[14] SUZUKI Y. Statistical methods for detecting naturalselection from genomicdata[J]. Genesamp;geneticsystems,2010,85(6):359-376.
[15]余志偉,陳垣,郭鳳霞,等.菘藍(lán)葉綠體基因組密碼子使用偏好性分析[J].草地學(xué)報(bào),2024,32(8):2374-2385.
[16]李魁印,張海玲,張鴻,等.蕁麻葉綠體基因組密碼子偏好性分析[J].種子,2022,41(2):51-58.
[17]趙靖僑,王杰敏,石衛(wèi)紅,等.北沙參葉綠體基因組密碼子偏好性分析[J/OL].分子植物育種,1-20(2024-11-10)[2025-4-30].http://kns.cnki. net/kcms/detail/46.1068.S.20240320.1248.013.html.
[18]尹明華,李文婷,歐陽(yáng)茜,等.蘇丹草葉綠體基因組特征及系統(tǒng)發(fā)育分析[J].草業(yè)科學(xué),2025,42(1):101-118.
[19]王文斌,于歡,邱相坡.黃芩葉綠體基因組重復(fù)序列及密碼子偏好性分析[J].分子植物育種,2018,16(8):2445-2452.
[20]陸奇豐,駱文華.廣西秋海棠葉綠體基因組密碼子偏好性分析[J/OL].分子植物育種,1-20(2024-11-10)[2025-4-30]. http://kns.cnki. net/kcms/detail/46.1068.S.20230905. 0920.002.html.(青任纻輯.何)