李子菲, 蘇應(yīng)娟, 王艇*
蕨類植物葉綠體基因的分子進(jìn)化研究
李子菲1, 蘇應(yīng)娟2,3*, 王艇1*
(1. 華南農(nóng)業(yè)大學(xué)生命科學(xué)學(xué)院, 廣州 510642; 2. 中山大學(xué)生命科學(xué)學(xué)院, 廣州 510275; 3. 中山大學(xué)深圳研究院, 深圳 518057)
基因是近年來(lái)在葉綠體基因組中新發(fā)現(xiàn)的一個(gè)基因,在蕨類植物中表現(xiàn)高度保守。該研究共選取94種蕨類植物,在系統(tǒng)發(fā)育背景下,對(duì)基因的結(jié)構(gòu)特征、密碼子偏好性、進(jìn)化速率和適應(yīng)性進(jìn)化進(jìn)行分析。結(jié)果表明,基因的密碼子偏好性較弱,偏好使用以 A/U 結(jié)尾的密碼子,且不同物種間的偏好性存在一定差異。密碼子偏好性的形成主要受到突變壓的影響,同時(shí)也存在其他因素的作用;基于鳳尾蕨科和其他蕨類中基因的結(jié)構(gòu)特征存在區(qū)別,對(duì)兩者的分子替換速率進(jìn)行了比較,表明顛換率、非同義替換率和值間存在顯著差異;僅檢測(cè)出1個(gè)正選擇位點(diǎn)74A,強(qiáng)烈的負(fù)選擇作用表明基因的結(jié)構(gòu)和功能基本趨于穩(wěn)定。這為蕨類系統(tǒng)發(fā)育分析提供了新依據(jù),并提供了解析基因功能的線索。
蕨類植物;;密碼子偏好性;進(jìn)化速率;適應(yīng)性進(jìn)化
葉綠體基因組具有長(zhǎng)度短、拷貝數(shù)高、保守性強(qiáng)的特點(diǎn),長(zhǎng)期被廣泛用于植物系統(tǒng)發(fā)育和分子進(jìn)化研究[1]。葉綠體基因組作為雙鏈環(huán)狀閉合DNA,大小一般為110~116 kb,具有典型的四區(qū)結(jié)構(gòu),包含了大單拷貝區(qū)(large single copy, LSC)、小單拷貝區(qū)(small single copy, SSC)和2個(gè)反向重復(fù)區(qū)(inverted repeats, IR)。目前普遍認(rèn)為陸地植物葉綠體基因組的基因組成是大致相似的,大約有80個(gè)蛋白編碼基因(CDS, protein-coding gene)、30個(gè)tRNA基因和4個(gè)rRNA基因[2]。其中也包含一些保守的開(kāi)放閱讀框(open reading frame, ORF),其所編碼的蛋白相關(guān)功能仍在摸索中,通常稱為假定葉綠體開(kāi)放閱讀框(hypothetical chloroplast open reading frame)基因()。
蕨類作為最早脫離水體適應(yīng)陸生環(huán)境、進(jìn)化出維管組織的植物類群,在整個(gè)陸地植物的起源和演化歷史研究中有著重要的地位[3]。蕨類植物現(xiàn)存約有12 000種,它在形態(tài)上具有豐富的多樣性,廣泛分布在熱帶和亞熱帶地區(qū)。同時(shí),蕨類的質(zhì)體基因組有獨(dú)特的結(jié)構(gòu),相比于與種子植物的質(zhì)體基因組結(jié)構(gòu)基本一致的蕨類祖先類型“蓮座蕨型”,“鐵線蕨型”分別在跨IR/LSC區(qū)和LSC區(qū)中發(fā)生了約20和3 kb的兩次重疊倒位,而“鐵線蕨型”占據(jù)了蕨類90%的種類[4]。2016年發(fā)表的PPG I (the pteridophyte phylogeny group Ⅰ)系統(tǒng)是一個(gè)基本建立在分子系統(tǒng)發(fā)育研究之上的現(xiàn)代蕨類植物分類系統(tǒng)[5],其中描述的分類較為全面且被接受。目前,有關(guān)蕨類葉綠體基因組和分類系統(tǒng)等各類信息仍在不斷完善中。
Song等[6]于2018年在薄囊蕨類中發(fā)現(xiàn)1個(gè)新的假定ORF,并將其命名為。研究表明,位于K和16之間,在薄囊蕨類中表現(xiàn)高度保守。同時(shí)在蕨類、石松類和苔蘚類的質(zhì)體中都發(fā)現(xiàn)其同源性,而種子植物中不存在該序列。在陸地植物中質(zhì)體的進(jìn)化歷史是動(dòng)態(tài)的,其基因組存在基因丟失的現(xiàn)象,基因會(huì)從質(zhì)體基因組轉(zhuǎn)移到核基因組[7]?;蛟S存在于陸生植物的祖先質(zhì)體中,隨后在種子植物中發(fā)生基因丟失。
根據(jù)序列的保守程度,以及其編碼跨膜蛋白和具有多個(gè)RNA編輯位點(diǎn)的特征[6],可以表明是一個(gè)具有功能意義的蛋白編碼基因[8],但其起源和功能目前尚不明確。本研究以94種蕨類植物的基因?yàn)檠芯繉?duì)象,通過(guò)分析的堿基組成和密碼子偏好性,并在系統(tǒng)發(fā)育背景下,分析其進(jìn)化速率和選擇壓力,來(lái)探究的基因結(jié)構(gòu)特征和在蕨類植物中的進(jìn)化樣式,挖掘在葉綠體基因組系統(tǒng)發(fā)育關(guān)系分析中的可用性,為蕨類植物分類提供新的依據(jù),為進(jìn)一步研究的起源和功能等提供基礎(chǔ)信息。
根據(jù)的基因序列作為參考序列,用NCBI-BLAST在線比對(duì)(E value<1e-6)在GenBank數(shù)據(jù)庫(kù)上選取了94種蕨類植物葉綠體全基因組,涵蓋了3目19科60屬(附錄1)。采用Genious prime軟件[9]提取基因,并使用MEGA X軟件通過(guò)MUSCLE (密碼子)模塊進(jìn)行序列比對(duì)并對(duì)結(jié)果進(jìn)行手工校正。
進(jìn)行94種蕨類植物基于K+L串聯(lián)數(shù)據(jù)集的多基因系統(tǒng)發(fā)育分析,構(gòu)建3種系統(tǒng)發(fā)育樹(shù)。PhyloSuite v1.2.2軟件[10]導(dǎo)入94條序列并提取K和L基因,在MATTF插件上序列比對(duì)后進(jìn)行基因串聯(lián)。用ModelFinder插件來(lái)選擇最佳的核苷酸替代模型GTR+F+I+G4,以6種合囊蕨目作為外類群, 利用MrBayes方法重建貝葉斯(bayesian inference, BI)樹(shù)。并且用MEGA分別構(gòu)建鄰接(neighbor-joining, NJ)樹(shù)和最大似然(maximum likehood, ML)樹(shù)。綜合分析3種樹(shù),結(jié)合PPGI系統(tǒng)發(fā)育關(guān)系進(jìn)行手工調(diào)整,得出系統(tǒng)發(fā)育樹(shù)。
以94種蕨類植物的基因?yàn)閷?duì)象,使用在線軟件CUSP計(jì)算密碼子第一、第二、第三位的GC含量(分別用GC1、GC2、GC3表示)和總GC含量;CodonW v1.4.2軟件統(tǒng)計(jì)同義密碼子相對(duì)使用度(RSCU, relative synonymous codon usage)和有效密碼子(ENC, effective number of codon)。使用軟件SPSS 24對(duì)數(shù)據(jù)進(jìn)行Pearson相關(guān)性分析。
GC3-GC12分析 密碼子的使用受到堿基的突變壓和自然選擇的雙重作用[11],通過(guò)分析GC12和GC3的相關(guān)性,研究密碼子3個(gè)位置上的堿基組成是否相似和影響密碼子偏好性的主要因素。當(dāng)GC12和GC3之間顯著相關(guān),說(shuō)明密碼子3個(gè)位置上的堿基組成無(wú)差異,密碼子的使用主要受突變的影響;當(dāng)GC12和GC3之間相關(guān)性不顯著, 說(shuō)明密碼子第一、第二和第三位堿基組成不相似, 密碼子的使用主要受自然選擇的影響。
ENC-plot分析 分析GC3和ENC的相關(guān)性,研究堿基組成對(duì)密碼子偏好性的影響。以GC3為橫坐標(biāo)、ENC值為縱坐標(biāo)繪制散點(diǎn)圖,并繪制ENC期望值標(biāo)準(zhǔn)曲線(ENC=2+GC3+29/[GC32+(1–GC3)2])進(jìn)行比較。當(dāng)基因散點(diǎn)分布在標(biāo)準(zhǔn)曲線附近,說(shuō)明密碼子偏好性受突變影響較大;而散點(diǎn)位于曲線較遠(yuǎn)下方位置時(shí),密碼子偏好性受自然選擇影響較大。
最優(yōu)密碼子 ENC值反映了同義密碼子非均衡使用的偏好程度,取值范圍為20~61。通?;虮磉_(dá)量越高,密碼子偏好性越強(qiáng),ENC值越小[12]。分析94種蕨類植物基因主要偏好密碼子, 構(gòu)建以ENC值為標(biāo)準(zhǔn)的高低表達(dá)庫(kù)(選擇ENC值最低和最高的10個(gè)基因),計(jì)算RSCU值(ΔRSCU= RSCUHigh–RSCULow),選擇RSCU>0.08且RSCU>1的作為最優(yōu)密碼子。
采用HyPhy v2.2.4軟件[13]基于核苷酸模型HKY85和密碼子模型MG94×HKY85_3×4計(jì)算各物種分支基因的轉(zhuǎn)換率(transition rate, trst)、顛換率(transversion rate, trsv)、轉(zhuǎn)換率和顛換率的比值(trst/trsv)、非同義替換率(nonsynonymous substi- tution rate, dN)、同義替換率(synonymous substitu- tion rate, dS),以及非同義替換速率和同義替換速率的比值(=dN/dS)。通過(guò)軟件SPSS 24使用Mann- Whitney秩和檢驗(yàn)對(duì)數(shù)據(jù)進(jìn)行相關(guān)性分析。
使用PAML v4.9軟件[14]中的codeml程序檢測(cè)基因中是否存在氨基酸正選擇位點(diǎn)。采用檢測(cè)譜系之間選擇壓力的3種模型:分支模型(Branch model)、位點(diǎn)模型(Site model)和分支-位點(diǎn)模型(Branch-site model)。
分支模型中,單比率模型(one-ratio, M0)假定所有分支的值相同;自由比率模型(free-ratio, F)假定所有分支的值均不相同;二比率模型(two-ratio, M2)假定前景支與背景支的值不相同。通過(guò)似然比檢驗(yàn)進(jìn)行模型比較,M0和檢驗(yàn)不同分支間值的差異性,M0和M2檢驗(yàn)前景支和背景支間值的差異性。
位點(diǎn)模型假定不同位點(diǎn)的值不同,其中存在4對(duì)比較模型:M0 (one-ratio)和M3 (discrete)檢測(cè)位點(diǎn)間值是否一致;M1a (neutral)和M2a (selection), M7 (beta)和M8 (beta&),M8和M8a (beta&=1)用于檢測(cè)是否存在正選擇位點(diǎn)。
分支-位點(diǎn)模型假定了分支間和位點(diǎn)間值都存在差異。對(duì)模型Model A和零假設(shè)進(jìn)行比較,檢測(cè)前景支中的部分位點(diǎn)是否受到正選擇作用。
取樣的94種蕨類植物基因長(zhǎng)度為222~156 bp。其中可以大致分為2種類型:以起始密碼子為T(ACG)開(kāi)頭發(fā)生C to U RNA編輯的序列共28條,其中包括全部的鳳尾蕨科27條,大多為219 bp (共20條);起始密碼子為M(AUG)的序列共66條, 包含除鳳尾蕨科外的18科,大多為216 bp (共50條),其中6條合囊蕨目的大小均為177 bp。
利用K+L串聯(lián)基因構(gòu)建NJ、ML和BI3種系統(tǒng)發(fā)育樹(shù)并對(duì)其進(jìn)行比較,用蕨類分類系統(tǒng)PPGI進(jìn)行修正。
在ML和BI中水龍骨亞目和鐵角蕨亞目為姐妹群且都是單系,與PPGI系統(tǒng)一致;而NJ中水龍骨亞目屬于多系。BI支持鐵角蕨科和腸蕨科為姐妹群, ML支持鐵角蕨科位于鐵角蕨亞目的基部位置。BI與PPGI系統(tǒng)最為接近,所以最后以BI為標(biāo)準(zhǔn)。構(gòu)建出的系統(tǒng)發(fā)育樹(shù)(附錄2)主要為后續(xù)研究分析提供系統(tǒng)發(fā)育背景。
2.3.1 密碼子堿基組成分析
附錄3為94種蕨類基因的密碼子堿基組成,其中GC含量為23.73%~47.75%,GC1、GC2和GC3分別為19.72%~47.22%、23.94%~47.22%和20.34%~56.94%,說(shuō)明密碼子總體的堿基組成偏向A/U。ENC值為61~34.89,在近緣物種中基因的密碼子偏好性存在差異。其中有19條序列的ENC=61即每個(gè)密碼子都被均衡使用。ENC值以35作為判斷密碼子偏好性強(qiáng)弱的標(biāo)準(zhǔn)[15],大部分的密碼子偏好性較弱。
對(duì)基因的密碼子相關(guān)參數(shù)進(jìn)行熱圖統(tǒng)計(jì),大多數(shù)的GC3要高于GC1、GC2和GC值;合囊蕨目的GC各項(xiàng)數(shù)值要低于其他蕨類,鳳尾蕨科的GC1和GC2總體上也低于其他蕨類(圖1)。
由表1可見(jiàn),GC1、GC2、GC3和GC相互間均為極顯著相關(guān),表明基因密碼子三位的堿基組成相似;而ENC值與各項(xiàng)GC值相關(guān)性不顯著,堿基組成對(duì)密碼子偏好性的影響較小。
表1 ycf94密碼子各參數(shù)的相關(guān)性分析
*:<0.05; **:<0.01
圖1 ycf94基因的密碼子相關(guān)參數(shù)熱圖統(tǒng)計(jì)
2.3.2 GC3-GC12分析
由圖2可見(jiàn),大部分散點(diǎn)位于對(duì)角線之下,除天星蕨()外,大部分物種的基因的GC3值大于GC12。相關(guān)性分析結(jié)果表明,雙尾檢驗(yàn)=0.00 (<0.01),相關(guān)系數(shù)為0.739, GC3和GC12相關(guān)性極顯著,說(shuō)明密碼子偏好性主要受到突變的影響。
2.3.3 ENC-plot分析
由圖3可見(jiàn),散點(diǎn)的分布較為分散,且一部分落在距離曲線較遠(yuǎn)的位置,則該部分基因密碼子偏好性受選擇影響較大。有40條序列的ENC比值為–0.1~0.1,表明ENC值與期望值相差較小,該部分基因的密碼子偏好性受突變影響較大。
圖2 中性繪圖
圖3 ENC-plot繪圖
2.3.4最優(yōu)密碼子
從表2可見(jiàn),共篩選出高頻密碼子(RSCU>1) 26個(gè),高表達(dá)密碼子(△RSCU>0.08) 24個(gè),而同時(shí)滿足這兩個(gè)條件的最優(yōu)密碼子有14個(gè):UUU、GUU、GUA、GUG、UCU、CCC、ACC、GCC、UAU、AAA、GAU、AGG、GGC、GGA。其中8個(gè)以A/U結(jié)尾,6個(gè)以G/C結(jié)尾。
對(duì)鳳尾蕨科和其余蕨類的替換速率進(jìn)行差異顯著性分析,數(shù)據(jù)表明(附錄4),鳳尾蕨科除了同義替換率外的進(jìn)化速率均值都大于其他蕨類(圖4),秩和檢驗(yàn)中顛換率,非同義替換率和的值分別是0.011、0.017和0.036 (<0.05),說(shuō)明鳳尾蕨科和其他蕨類基因的trsv、dN和存在顯著差異, 而trst、trsv/trst和dS無(wú)顯著差異。
表2 ycf94基因的密碼子RSCU統(tǒng)計(jì)以及最優(yōu)密碼子
*: 最優(yōu)密碼子; **: 高表達(dá)密碼子; ***: 高頻密碼子。
*: Optimal codon; **: High expression codon; ***: High frequency codon.
圖4 鳳尾蕨科與其他蕨類ycf94進(jìn)化速率均值比較及Mann-Whitney檢驗(yàn)
表3和4是PAML得出的基因適應(yīng)性進(jìn)化分析的結(jié)果。對(duì)各模型下計(jì)算出的對(duì)數(shù)似然值進(jìn)行模型間的似然比檢驗(yàn),分析顯著性選擇更為適合的模型。結(jié)果表明,分支模型下M0和檢驗(yàn)結(jié)果顯著(=0.024),表明不同分支間值存在顯著差異。二比率模型中設(shè)定了以鳳尾蕨科為前景支,其他蕨類為背景支,M0和M2檢驗(yàn)結(jié)果極顯著(=6.188× 10–6),表明鳳尾蕨科和其他蕨類的值存在極顯著差異。
位點(diǎn)模型下,結(jié)果顯示位點(diǎn)間值存在顯著差異(=0.000),且3對(duì)模型比較都顯示基因中存在正選擇位點(diǎn)。以BEB后驗(yàn)概率大于95%為標(biāo)準(zhǔn),模型M2a和M8均鑒定出1個(gè)正選擇位點(diǎn)74A。
在分支-位點(diǎn)模型中,同樣以鳳尾蕨科為前景支,似然比檢測(cè)結(jié)果顯示零假設(shè)模型和Model A間不存在差異(=1.000),故不接受模型A的結(jié)果。
表3 不同模型下的參數(shù)估計(jì)值和對(duì)數(shù)似然值
**: 后驗(yàn)概率<99%
**: Posterior probability <99%
表4 似然比檢驗(yàn)
*:<0.05; **:<0.01
基因在蕨類中表現(xiàn)出高度保守性,但在種子植物中沒(méi)有發(fā)現(xiàn)同源序列這個(gè)重要特征,可能成為系統(tǒng)發(fā)育分析中的一個(gè)新的分子標(biāo)記。同時(shí),研究發(fā)現(xiàn)在蕨類中存在2種結(jié)構(gòu)樣式:起始密碼子ACG發(fā)生RNA編輯的、基因長(zhǎng)度多為219 bp的序列和以起始密碼子為AUG、基因長(zhǎng)度多為216 bp的序列。其中全部的鳳尾蕨科基因序列都表現(xiàn)為前一種模式,以及三叉蕨科的也屬于同一結(jié)構(gòu),其余的序列均為后者。因此,的起始密碼子發(fā)生C to U RNA編輯雖然不屬于鳳尾蕨科的獨(dú)有結(jié)構(gòu),但RNA編輯作為表觀遺傳現(xiàn)象之一擁有可遺傳性,推測(cè)鳳尾蕨科的共同祖先中基因起始密碼子存在RNA編輯,該基因結(jié)構(gòu)是鳳尾蕨科的共衍征。
編譯氨基酸過(guò)程中同義密碼子的使用是存在偏好性的,而物種在進(jìn)化中會(huì)形成特有的密碼子使用模式,不同物種間的密碼子偏好性不同,而近緣物種間的密碼子使用模式有可能相似[16]。這種偏好性的差異對(duì)揭示物種間的進(jìn)化關(guān)系,探究基因特征和蛋白質(zhì)功能有重要意義。本研究中,基因的密碼子偏好性較弱,同義密碼子的使用傾向平均,其中有19條序列密碼子沒(méi)有使用偏好,說(shuō)明的表達(dá)水平可能相對(duì)較低,非高表達(dá)基因。統(tǒng)計(jì)表明堿基組成整體偏向A/T,密碼子第三位也以A/U為主,這與葉綠體基因組中密碼子大多偏好A/U結(jié)尾這一特征相符合[17],且GC3大多高于GC1和GC2。研究結(jié)果中94種蕨類的基因ENC值從34到61不等,其密碼子偏好性存在一定差異。通常,在沒(méi)有其他壓力作用下,同義密碼子的使用概率可能因?yàn)榛蜷L(zhǎng)度的限制而造成統(tǒng)計(jì)上的誤差,這種物種間的差異性可能與之相關(guān)。同時(shí),GC3與GC12表現(xiàn)出顯著的相關(guān)性,密碼子不同位置下堿基組成的差異較小。而ENC與GC各項(xiàng)數(shù)值都不相關(guān), 說(shuō)明堿基組成對(duì)密碼子偏好性的影響較小。通過(guò)GC3-GC12和ENC-plot分析得出結(jié)論,基因的密碼子偏好性主要受突變影響,同時(shí)也受到選擇壓力和基因長(zhǎng)度等其他因素的作用。
基于鳳尾蕨科和其他蕨類中基因的結(jié)構(gòu)特征存在區(qū)別,對(duì)兩者的分子替換速率進(jìn)行比較, 研究表明,鳳尾蕨科除了同義替換率外的進(jìn)化速率均值都大于其他蕨類,且顛換率、非同義替換率和值間兩者存在顯著差異。鳳尾蕨科具有陸生、水生、旱生和附生等多個(gè)生態(tài)位[18],有可能是生境的差異使在某一生態(tài)位上受到較高的選擇壓力,導(dǎo)致鳳尾蕨科的進(jìn)化速率升高。
在基因的適應(yīng)性進(jìn)化分析中,分支模型下似然比檢驗(yàn)支持的自由比率模型中檢測(cè)出15條>1的分支,說(shuō)明該部分分支可能有正選擇存在,其中有7條分支屬于鳳尾蕨科,其余分支包括了蹄蓋蕨科、鱗毛蕨科、水龍骨科和合囊蕨科。同時(shí)似然比檢驗(yàn)表示二比率模型優(yōu)于單比率模型,鳳尾蕨科和其他蕨類的值存在極顯著差異,這與HyPhy的分子進(jìn)化速率計(jì)算結(jié)果一致。但是前景支值(= 0.578 8)并不高于1,尚不能認(rèn)為它是受正選擇作用的,選擇壓力約束放松可能是較為合理的解釋?;蚬簿幋a80個(gè)氨基酸位點(diǎn),位點(diǎn)模型M2a和M8均檢測(cè)出一個(gè)正選擇位點(diǎn)74A,占總序列1.25%; 基于M8模型檢測(cè)負(fù)選擇位點(diǎn)63個(gè)(<0.05), 占總序列78.75%。當(dāng)一個(gè)基因受到正選擇壓力時(shí),蛋白功能可能發(fā)生改變來(lái)適應(yīng)外界環(huán)境變化;而當(dāng)一個(gè)基因受到負(fù)選擇壓力,則說(shuō)明該基因傾向保持原有的功能[19]??偟膩?lái)說(shuō)基因大部分位點(diǎn)受到負(fù)選擇作用,推斷其進(jìn)化高度保守,在蕨類中基因的結(jié)構(gòu)和功能基本趨于穩(wěn)定。下一步分析氨基酸位點(diǎn)在蛋白質(zhì)結(jié)構(gòu)域中的分布,對(duì)正選擇位點(diǎn)的定位可以探究基因功能,進(jìn)一步了解適應(yīng)性進(jìn)化發(fā)生的原因和作用。
本研究以94種蕨類植物的基因?yàn)閷?duì)象,揭示了基因的基本結(jié)構(gòu)特征,為葉綠體基因組的基因組成補(bǔ)充信息。在探討的堿基組成與密碼子偏好性的研究中,基因的密碼子偏好較弱,偏好使用A和U結(jié)尾的密碼子,其密碼子偏好性主要受到突變的影響,并且不同物種之間密碼子偏好性具有一定差異。同時(shí),通過(guò)對(duì)基因的進(jìn)化分析,發(fā)現(xiàn)該基因表現(xiàn)高度保守,為基因的功能研究提供參考。
[1] RAUBESON L A, JANSEN R K. Chloroplast genomes of plants [M]// HENRY R. Plant Diversity and Evolution: Genotypic and Phenotypic Variation in Higher Plants. Cambridge: CABI, 2005: 45–68. doi: 10. 079/9780851999043.0045.
[2] JANSEN R K, RUHLMAN T A. Plastid genomes of seed plants [M]// Genomics of Chloroplasts and Mitochondria: Advances in Photosyn- thesis and Respiration. New York: Springer, 2012: 103–126. doi: 10. 1007/978-94-007-2920-9_5.
[3] ZHANG X C, WEI R, LIU H M, et al. Phylogeny and classification of the extant lycophytes and ferns from China [J]. Chin Bull Bot, 2013, 48(2): 119–137. [張憲春, 衛(wèi)然, 劉紅梅, 等. 中國(guó)現(xiàn)代石松類和蕨類的系統(tǒng)發(fā)育與分類系統(tǒng)[J]. 植物學(xué)報(bào), 2013, 48(2): 119–137. doi: 10.3724/SP.J.1259.2013.00119.]
[4] PPG Ⅰ. A community-derived classification for extant lycophytes and ferns [J]. J Syst Evol, 2016, 54(6): 563–603. doi: 10.1111/jse.12229.
[5] WOLF P G, ROPER J M, DUFFY A M. The evolution of chloroplast genome structure in ferns [J]. Genome, 2010, 53(9): 731–738. doi: 10. 1139/G10-061.
[6] SONG M, KUO L Y, HUIET L, et al. A novel chloroplast gene reported for flagellate plants [J]. Am J Bot, 2018, 105(1): 117–121. doi: 10. 1002/ajb2.1010.
[7] CULLIS C A, VORSTER B J, VAN DER VYVER C, et al. Transfer of genetic material between the chloroplast and nucleus: How is it related to stress in plants? [J]. Ann Bot, 2009, 103(4): 625–633. doi: 10.1093/ aob/mcn173.
[8] HSU P Y, BENFEY P N. Small but mighty: Functional peptides encoded by small ORFs in plants [J]. Proteomics, 2018, 18(10): 1700038. doi: 10.1002/pmic.201700038.
[9] KEARSE M, MOIR R, WILSON A, et al. Geneious Basic: An integrated and extendable desktop software platform for the organi- zation and analysis of sequence data [J]. Bioinformatics, 2012, 28(12): 1647–1649. doi: 10.1093/bioinformatics/bts199.
[10] ZHANG D, GAO F L, JAKOVLI? I, et al. PhyloSuite: An integrated and scalable desktop platform for streamlined molecular sequence data management and evolutionary phylogenetics studies [J]. Mol Ecol Resour, 2020, 20(1): 348–355. doi: 10.1111/1755-0998.13096.
[11] SUEOKA O. Total cross section measurements for positron and electron scattering on benzene molecules [J]. J Phys B: At Mol Opt Phys, 1988, 21(20): L631. doi: 10.1088/0953-4075/21/20/003.
[12] WRIGHT F. The ‘effective number of codons’ used in a gene [J]. Gene, 1990, 87(1): 23–29. doi: 10.1016/0378-1119(90)90491-9.
[13] POND S L K, FROST S D W, MUSE S V. HyPhy: Hypothesis testing using phylogenies [J]. Bioinformatics, 2005, 21(5): 676–679. doi: 10. 1093/bioinformatics/bti079.
[14] YANG Z H. PAML 4: Phylogenetic analysis by maximum likelihood [J]. Mol Biol Evol, 2007, 24(8): 1586–1591. doi: 10.1093/molbev/msm088.
[15] JIANG Y, DENG F, WANG H L, et al. An extensive analysis on the global codon usage pattern of baculoviruses [J]. Arch Virol, 2008, 153 (12): 2273–2282. doi: 10.1007/s00705-008-0260-1.
[16] ROMERO H, ZAVALA A, MUSTO H. Codon usage inis the result of strand-specific mutational biases and a complex pattern of selective forces [J]. Nucl Acids Res, 2000, 28(10): 2084–2090. doi: 10.1093/nar/28.10.2084.
[17] ZHOU M, LONG W, LI X. Patterns of synonymous codon usage bias in chloroplast genomes of seed plants [J]. For Stud China, 2008, 10(4): 235–242. doi: 10.1007/s11632-008-0047-1.
[18] SCHUETTPELZ E, SCHNEIDER H, HUIET L, et al. A molecular phylogeny of the fern family Pteridaceae: Assessing overall relation- ships and the affinities of previously unsampled genera [J]. Mol Phylo- genet Evol, 2007, 44(3): 1172–1185. doi: 10.1016/j.ympev.2007.04.011.
[19] PRINCE V E, PICKETT F B. Splitting pairs: The diverging fates of duplicated genes [J]. Nat Rev Genet, 2002, 3(11): 827–837. doi: 10. 1038/nrg928.
附錄1 蕨類物種信息
附錄2 94種蕨類植物的系統(tǒng)發(fā)育樹(shù)
附錄3基因的密碼子堿基組成與ENC值
附錄4基因分子進(jìn)化速率
http://jtsb.ijournals.cn/ajax/common/download_attache_file.aspx?seq_id=20230218234211003&file_no
Molecular Evolution of Chloroplast Genein Ferns
LI Zifei1, SU Yingjuan2,3*, WANG Ting1*
(1. College of Life Sciences, South China Agricultural University, Guangzhou 510642, China; 2. School of Life Sciences, Sun Yat-Sen University,Guangzhou 510275, China; 3. Research Institute of Sun Yat-Sen University in Shenzhen, Shenzhen 518057, Guangdong, China)
As a newly discovered chloroplast gene in recent years,gene, with length of about 200 bp, is conserved among ferns. However, the origin and function ofrequire further investigation. The study was performed on thegene sequence of 94 species of ferns, in the phylogenetic background, analyzing codon usage bias, evolution rate and selection pressure. Results showed that the codon bias was weak ingene which the 3rd position of codon prefers A/U, variously in closely species. The codon bias was mainly produced by gene mutation. In addition, based on the differences in the structural characteristics ofbetween Pteridaceae and other ferns, their evolution rate was compared, suggesting that there were significant difference in transversion rate, nonsynonymous substitution rate and omega. Besides, only one position selection site 74A was detected. The strong negative selection pressure indicated that the function and structure ofwere mostly stabilized. The results provide a new clue of phylogenetic analysis in ferns and functional studies ofgene.
Fern;gene; Codon usage bias; Evolutionary rate; Adaptive evolution
10.11926/jtsb.4780
2023-02-18
2023-03-13
國(guó)家自然科學(xué)基金項(xiàng)目(31770587)資助
This work was supported by the National Natural Science Foundation of China (Grant No. 31770587).
李子菲(1998年生),女,碩士研究生,研究方向?yàn)橹参锵到y(tǒng)發(fā)育與分子進(jìn)化。E-mail: fuyjun420@qq.com
通訊作者 Corresponding author.E-mail: suyj@mail.sysu.edu.cn; tingwang@scau.edu.cn