• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    甘蔗屬種及其近緣屬種蔗茅的全基因組密碼子偏好性分析

    2024-04-17 06:48:34田春艷李旭娟李純佳毛鈞劉新龍
    生物技術(shù)通報(bào) 2024年3期
    關(guān)鍵詞:近緣同義密碼子

    田春艷 李旭娟 李純佳 毛鈞 劉新龍

    (1.熱帶作物生物育種全國重點(diǎn)實(shí)驗(yàn)室,昆明 650205;2.云南省農(nóng)業(yè)科學(xué)院甘蔗研究所 云南省甘蔗遺傳改良重點(diǎn)實(shí)驗(yàn)室,開遠(yuǎn) 661699;3.農(nóng)業(yè)農(nóng)村部甘蔗生物學(xué)與遺傳育種重點(diǎn)實(shí)驗(yàn)室,開遠(yuǎn) 661699)

    遺傳密碼子是生命信息的基本遺傳單位,核酸攜帶的遺傳信息向蛋白質(zhì)轉(zhuǎn)化的過程是以三聯(lián)體密碼子形式傳遞的。每種氨基酸可由1-6 個(gè)密碼子編碼,這些編碼同一種氨基酸的所有密碼子被稱為同義密碼子[1]。不同生物甚至是同一基因組的不同基因,對同義密碼子的使用并不是均衡的, 而是優(yōu)先或傾向于使用一種或幾種特定的同義密碼子, 這稱為密碼子使用偏好性[2-4]。密碼子使用偏好性是在長期的生物進(jìn)化過程中形成的,在真核生物、原核生物以及病毒中都存在,是一種普遍現(xiàn)象[5-6]。其受自然選擇、堿基突變、tRNA 豐度、氨基酸序列組成、基因組大小等多種因素的影響,其中自然選擇和突變被認(rèn)為是關(guān)鍵因素[7-8]。生物的密碼子使用偏好性能在一定程度上反映出物種或基因的起源,對基因表達(dá)、目的基因修飾、基因家族分化等問題具有重要研究意義[9]。研究表明,生物體內(nèi)普遍存在的這種密碼子使用偏好性會導(dǎo)致外源基因在宿主細(xì)胞中的表達(dá)量降低。使用轉(zhuǎn)基因受體系統(tǒng)偏愛的密碼子進(jìn)行目的基因序列優(yōu)化是提高外源基因表達(dá)水平的一種有效手段[10]。周宗梁等[11]根據(jù)水稻偏好密碼子對來源于蘇云菌芽孢桿菌的cry1Ah1 基因進(jìn)行密碼子優(yōu)化,結(jié)果表明全部采用最高頻密碼子的優(yōu)化方案效果最好,cry1Ah 蛋白平均表達(dá)量占可溶性蛋白的0.104%。陳惠等[12]根據(jù)畢赤酵母密碼子使用偏好性, 將來源于黑曲霉N25 的植酸酶基因phyA 進(jìn)行改造, 結(jié)果密碼子優(yōu)化的酵母轉(zhuǎn)化子中植酸酶活性為對照的2 倍。利用密碼子優(yōu)化的外源基因已在某些植物中獲得了重組蛋白高表達(dá)的轉(zhuǎn)基因植株[13-15]。

    甘蔗(Saccharum spp.)是世界上最主要的糖料作物,供應(yīng)了全世界近80%的食糖,因其具有十分高的生物量,也是重要的能源材料。在我國,甘蔗糖占據(jù)了近90%的食糖供應(yīng),是保障我國食糖安全的重要經(jīng)濟(jì)作物?,F(xiàn)代甘蔗栽培品種主要來源于熱帶種和割手密兩個(gè)同源多倍體的甘蔗屬原始種間的雜交,其中70%-80%的染色體來源于熱帶種,10%-20%來源于割手密,10%屬于二者的重組染色體[16]。因其基因組高度復(fù)雜且十分龐大,至今尚未完成基因組的測序工作,嚴(yán)重制約了甘蔗分子生物學(xué)和生物技術(shù)相關(guān)研究的發(fā)展。近幾年,福建農(nóng)林大學(xué)和廣西大學(xué)亞熱帶農(nóng)業(yè)生物資源保護(hù)與利用國家重點(diǎn)實(shí)驗(yàn)室先后完成了甘蔗屬割手密(S.spontaneum),熱帶種(S.officinarum)以及甘蔗近緣屬植物蔗茅(Erianthus fulvus)的基因組測序和組裝工作,快速推動了甘蔗重要性狀的分子機(jī)制解析,優(yōu)異基因挖掘及生物技術(shù)育種的研究[17-19]。近年來,隨著作物生物技術(shù)的快速發(fā)展,甘蔗種業(yè)對甘蔗重要性狀的改良需求越來越迫切,亟需挖掘優(yōu)異外源基因用于甘蔗品種性狀的改良。為了提高這些外源基因在甘蔗轉(zhuǎn)化體中的高效表達(dá),解析甘蔗密碼子偏好性特征十分重要。至今尚沒有系統(tǒng)分析甘蔗密碼子使用模式的研究報(bào)道。鑒于此,本研究擬基于前人已公布的4 個(gè)甘蔗屬及其近緣屬種基因組數(shù)據(jù),研究其密碼子使用模式并分析其影響因素,篩選出最優(yōu)密碼子,以期為利用基因工程實(shí)現(xiàn)優(yōu)異外源基因在甘蔗中的高表達(dá)提供科學(xué)指導(dǎo),為開展甘蔗抗蟲、抗病轉(zhuǎn)基因育種奠定重要的基礎(chǔ)。

    1 材料與方法

    1.1 甘蔗屬及其近緣屬蔗茅的基因組數(shù)據(jù)來源及篩選

    從甘蔗基因組數(shù)據(jù)庫(http://sugarcane.zhang?jisenlab.cn/SugarcaneDB/#/downloads)下載甘蔗屬的熱帶種(LA?purple)和割手密(NP?X 和AP85?441)及其近緣屬種蔗茅(Yunnan2009?3)共4 個(gè)材料的CDS 序列。為提高密碼子偏好性分析準(zhǔn)確性,利用Python 工具根據(jù)以下條件篩選符合密碼子偏好性分析的CDS 序列:序列長度大于或等于300 bp 且序列堿基數(shù)是3 的整倍數(shù);具有正確的起始密碼子和終止密碼子,且序列中間不具有終止密碼子[20]。最終從熱帶種LA?purple、割手密NP?X 和AP85?441 以及蔗茅Yunnan2009?3 中獲得符合條件的CDS 序列分別為242 904 條、131 179 條、60 604 條、35 616 條用于后續(xù)分析。

    1.2 密碼子組分分析

    利用Python 編寫代碼分別計(jì)算CDS 序列的GC含量、密碼子第1 位、第2 位和第3 位的GC 堿基含量(分別用GC1、GC2、GC3 表示)。利用Co?donW1.4.2 計(jì)算同義密碼子第3 位GC 含量(GC3s)、同義密碼子第3 位4 種堿基的含量(分別用A3s、T3s、C3s、G3s 表示)、有效密碼子數(shù)(ENC)、同義密碼子使用度(RSCU)、CAI(密碼子適應(yīng)指數(shù))、Fop(最優(yōu)密碼子頻率)等參數(shù)。

    1.3 基因表達(dá)水平與密碼子偏性參數(shù)間相關(guān)性分析

    從甘蔗基因組數(shù)據(jù)庫(http://sugarcane.zhang?jisenlab.cn/SugarcaneDB/#/downloads) 下 載 割 手 密AP85?441 和蔗茅Yunnan2009?3 的基因表達(dá)數(shù)據(jù),并利用廣西大學(xué)亞熱帶農(nóng)業(yè)生物資源保護(hù)與利用國家重點(diǎn)實(shí)驗(yàn)室張積森教授團(tuán)隊(duì)提供的熱帶種LA?purple的基因轉(zhuǎn)錄表達(dá)數(shù)據(jù)。利用SPSS 軟件進(jìn)行基因表達(dá)水平TPM(transcripts per million)值與密碼子偏好性參數(shù)間的相關(guān)性分析,并利用R 語言繪制相關(guān)系數(shù)圖。分析密碼子偏好性參數(shù)與基因轉(zhuǎn)錄表達(dá)水平間的相互關(guān)系。

    1.4 中性繪圖分析

    同義密碼子的突變通常發(fā)生于密碼子的第3 位堿基上,而非同義密碼子的突變位點(diǎn)通常發(fā)生在第1 位或第2 位堿基[21]。以每條CDS 序列的GC1 和GC2 的平均值(用GC12 表示)為縱坐標(biāo),GC3 為橫坐標(biāo)利用Microsoft Excel 繪制中性對比散點(diǎn)圖,分析GC3 與GC12 的相關(guān)性。若二者顯著相關(guān),則回歸曲線斜率接近1,說明密碼子3 個(gè)位置的堿基組成無明顯差異,其偏好性主要受突變因素影響。若二者相關(guān)性不顯著,則表明其密碼子偏好性的主要影響因素是自然選擇[22]。

    1.5 ENC?plot分析

    有效密碼子數(shù)是衡量同義密碼子使用偏好的常用參數(shù),ENC 取值范圍從20-61,ENC 值為20表示每個(gè)氨基酸只用一個(gè)密碼子,具有極強(qiáng)的偏好性,ENC 值為61 表示每個(gè)氨基酸均勻使用所有同義密碼子,無偏好性[21]。前人研究提出可將ENC=35.0 作為判斷密碼子偏好性強(qiáng)弱的分界點(diǎn),若ENC ≤35,則說明有較強(qiáng)的密碼子使用偏好性[22-23]。以ENC 實(shí)際值為縱坐標(biāo),GC3s 為橫坐標(biāo)繪制散點(diǎn)圖,并根據(jù)公式計(jì)算ENC 期望值(ENC 期望值=2+GC3s+29/[GC3s2+(1?GC3s)2]),在 散 點(diǎn) 圖 中繪制ENC 期望值的標(biāo)準(zhǔn)曲線。若密碼子使用偏好性主要受到突變壓力的影響,則散點(diǎn)將位于標(biāo)準(zhǔn)曲線上或略低于標(biāo)準(zhǔn)曲線,相反,若散點(diǎn)低于標(biāo)準(zhǔn)曲線,則主要受到選擇和其他因素的影響[24]。

    1.6 PR2?plot分析

    PR2?plot 分析是對密碼子第3 位堿基(分別用A3、T3、G3、C3 表示)組成的偏差對密碼子偏好性產(chǎn)生的影響進(jìn)行分析。以A3/(A3+T3)為縱坐標(biāo),G3/(G3+C3)為橫坐標(biāo)繪制散點(diǎn)圖,坐標(biāo)的中心點(diǎn)位置表示A=T 且G=C,通過中心點(diǎn)到某散點(diǎn)的矢量距離來判斷堿基偏移的程度和方向。

    1.7 最優(yōu)密碼子確定及密碼子偏好性差異分析

    根據(jù)ENC 值對CDS 序列進(jìn)行排序,取ENC 值最高和最低的10%基因序列分別作為低表達(dá)庫和高表達(dá)庫,利用CodonW 1.4.2 軟件分別計(jì)算2 個(gè)表達(dá)庫的RSCU 值,并計(jì)算ΔRSCU 值(ΔRSCU =RSCU高表達(dá)庫-RSCU 低表達(dá)庫)。其中,RSCU>1 的密碼子為高頻密碼子,ΔRSCU ≥0.08 的密碼子為高表達(dá)密碼子,同時(shí)滿足2 個(gè)條件的密碼子為最優(yōu)密碼子[25]。此外,由于甘蔗基因組復(fù)雜,染色體數(shù)目眾多,本研究進(jìn)一步根據(jù)研究材料的倍性和染色體基數(shù)進(jìn)行分組,計(jì)算密碼子的RSCU 值,從全基因組和染色體組水平探討了4 個(gè)材料的密碼子使用偏好性差異。

    1.8 不同生物密碼子偏好性比較

    利用在線的密碼子使用數(shù)據(jù)庫(http://www.kazusa.or.jp/codon/)下載甘蔗近緣作物玉米、高粱及其他模式生物如水稻、擬南芥、煙草、大腸桿菌、酵母等的密碼子使用數(shù)據(jù),分析這些主要模式生物與甘蔗屬及其近緣屬種在基因組堿基組成差異、密碼子偏好模式等方面的差異。參照雷佳欣等[26]的方法,以本研究甘蔗屬種及其近緣屬種蔗茅4 個(gè)材料的基因組RSCU 均值作為甘蔗的RSCU 值(這是由于現(xiàn)在甘蔗栽培品種絕大部分都含有熱帶種和割手密血緣,且本研究結(jié)果分析表明這兩個(gè)種與其近緣屬種蔗茅的密碼子使用偏好性高度相似),若甘蔗RSCU 值與其他物種RSCU 的比值≥2 或≤0.5 時(shí),表明與甘蔗的密碼子使用偏倚差異顯著。

    2 結(jié)果

    2.1 甘蔗屬種及其近緣屬種基因組密碼子堿基組成分析

    甘蔗屬種及其近緣屬種蔗茅4 個(gè)材料的基因組CDS 序列的核苷酸組成分析結(jié)果見表1。4 個(gè)材料基因組CDS 序列的同義密碼子第3 位的堿基組成都是C 堿基含量最高,G 次之,A 含量最低。平均GC 含量為56.30%,其中割手密AP85?441的最高(57.53%),蔗茅Yunnan2009?3 的最低(55.02%)。密碼子3 個(gè)位點(diǎn)的GC 含量都是GC3>GC1>GC2, 同義密碼子第3 位的GC 含量(GC3s)介于61.06%-64.91%之間,且C3s>G3s>T3s>A3s。說明甘蔗基因組富含GC, 且偏好于使用以G 或C 結(jié)尾的密碼子。

    表1 甘蔗屬種及其近緣屬種蔗茅基因組CDS 序列的核苷酸組成和ENCTable 1 Nucleotide composition and ENC of CDS sequences in Saccharum species and its phylogenetically related species E.fulvus

    2.2 密碼子偏好性相關(guān)參數(shù)及基因轉(zhuǎn)錄表達(dá)水平的相關(guān)性分析

    有效密碼子數(shù)是衡量基因密碼子偏好性強(qiáng)弱的重要指標(biāo),為了解甘蔗全基因組水平基因間的密碼子偏好性差異,本研究分析了4 個(gè)材料全基因組的ENC 頻數(shù)分布及其百分比,結(jié)果見表2。由表2 可知,4 個(gè)材料基因組的ENC 值頻數(shù)分布及百分比極其相似,ENC ≤35 的CDS 序列占總數(shù)的比例在12.05%-14.23%之間,ENC 值在35?45 之間的占16.72%-19.32%,ENC 值 大 于45 的 占66.53%-71.23%,表明全基因組內(nèi)具有較強(qiáng)密碼子使用偏好的基因約占13%、而約69%的基因密碼子使用偏好性較弱。因此,在轉(zhuǎn)化異源基因到甘蔗材料中時(shí)不僅需考慮甘蔗的密碼子偏好性問題,對于少數(shù)基因而言,可能還需要關(guān)注基因本身的密碼子使用特性。

    為進(jìn)一步了解基因表達(dá)與基因密碼子使用偏好性參數(shù)間的相互關(guān)系,本研究利用熱帶種LA?purple、割手密AP85?441 和蔗茅Yunnan2009?3 的基因表達(dá)數(shù)據(jù),分析了12 個(gè)密碼子偏好性參數(shù)與基因轉(zhuǎn)錄表達(dá)水平間的相關(guān)性,相關(guān)系數(shù)見圖1,如圖所示,12 個(gè)密碼子偏性參數(shù)間的相關(guān)性在甘蔗這3個(gè)材料基因組中的表現(xiàn)是一致的。其中,GC 含量與GC1、GC2、GC3 含量顯著正相關(guān)(P<0.01),GC3與GC1 與GC2 顯著正相關(guān)(P<0.01)。ENC 與GC1、GC3 為顯著負(fù)相關(guān)(P<0.01),說明第1 位、第3 位堿基對密碼子偏好性的影響較大。ENC、CAI 和Fop都與序列長度無顯著相關(guān)性,CAI 和最優(yōu)密碼子頻率(Fop)與GC3 正相關(guān)(P<0.01),這與其基因組核苷酸組成分析的結(jié)果相吻合,都表明了甘蔗偏愛使用以G 或C 結(jié)尾的密碼子?;虮磉_(dá)水平(TPM)與基因的CDS 長度、A3s、T3s 及ENC 為負(fù)相關(guān)(P<0.01),與GC、GC3、C3s、G3s、CAI 及Fop 為正相關(guān)(P<0.01),但相關(guān)系數(shù)較小,說明這些參數(shù)與基因?qū)嶋H的轉(zhuǎn)錄表達(dá)水平存在相關(guān)性,但相關(guān)性并不是很強(qiáng),可能受到基因復(fù)雜的調(diào)控機(jī)制影響。

    圖1 基因表達(dá)水平與密碼子偏好性參數(shù)的相關(guān)系數(shù)Fig.1 Correlation coefficients between gene expressions and codon usage bias parameters

    2.3 中性繪圖分析

    中性繪圖分析結(jié)果見圖2,圖中黑色直線為擬合的線性回歸線,該直線的斜率越大,說明密碼子第1、2、3 位的堿基組成越相似,其偏好主要是受突變的影響,反之說明選擇的影響越強(qiáng)。由圖2 可以看出,LA?purple、NP?X、AP85?441、Yun?nan2009?3 的GC3 含量主要分布在20%-99%之間,GC12 含量主要分布在30%-75%之間?;貧w系數(shù)分別為0.241 7、0.218 7、0.213 5、0.233 6,說明密碼子使用模式的突變壓力占 21.35%-24.17%,自然選擇是影響密碼子偏好性的主要因素。

    圖2 四個(gè)材料的中性繪圖分析Fig.2 Neutrality-plot analysis of four materials

    2.4 ENC?plot分析

    ENC?plot 分析結(jié)果見圖3,從圖中可以看出,一部分基因分布在標(biāo)準(zhǔn)曲線上或周圍,而大部分基因落在標(biāo)準(zhǔn)曲線的下方,表明突變和自然選擇都影響著甘蔗屬種及蔗茅的密碼子使用偏好性,但自然選擇在其中起著主導(dǎo)作用。

    圖3 四個(gè)材料的ENC-plot 分析Fig.3 ENC-plot analysis of four materials

    2.5 PR2?plot分析

    PR2?plot 分析結(jié)果見圖4,中心點(diǎn)(0.5,0.5)位置為A=T 且G=C。如圖所示,大部分基因都遠(yuǎn)離中心點(diǎn),在4 個(gè)平面的分布呈現(xiàn)不均勻,說明大部分基因的密碼子第3 位對4 種堿基的使用頻率存在差異,表明甘蔗熱帶種、割手密和蔗茅的基因組密碼子使用模式不僅受自然選擇的影響,也受到包括突變壓力等其他因素的影響。

    圖4 甘蔗4 個(gè)材料的PR2-plot 分析Fig.4 PR2-plot analysis of four materials of Saccharum

    2.6 最優(yōu)密碼子確定及密碼子偏好性差異分析

    根據(jù)全基因組密碼子的RSCU 值,將RSCU 大于根據(jù)同時(shí)滿足2 個(gè)條件即:高表達(dá)庫和低表達(dá)庫的RSCU>1 且ΔRSCU ≥0.08 的密碼子為最優(yōu)密碼子的標(biāo)準(zhǔn),根據(jù)高、低表達(dá)庫的RSCU 值和兩個(gè)表達(dá)庫之間的ΔRSCU 值,最終在4 個(gè)材料中都被確定為最優(yōu)密碼子的密碼子共有13 個(gè)(表3),它們分別 為UUC、CUC、CUG、AUC、GUG、UCC、AGC、GCC、UAC、AAG、UGC、CGC 和GGC。 這13 個(gè)密碼子中以C 結(jié)尾的有10 個(gè),以G 結(jié)尾的有3 個(gè),說明偏愛以G 或C 結(jié)尾的密碼子。此外,密碼子CAG 和GAG 在熱帶種LA?purple、割手密NP?X 以及蔗茅Yunnan2009?3 這3 個(gè)材料中也被確定為最優(yōu)密碼子,而在割手密AP85?441 中雖不是最優(yōu)密碼子,但也是對應(yīng)氨基酸同義密碼子中偏好使用的密碼 子。由 此 可 知,LA?purple、NP?X、AP85?441 和Yunnan2009?3 的密碼子使用模式在全基因組水平上高度相似。

    然而,甘蔗基因組高度復(fù)雜,染色體數(shù)目類型豐富。如,LA?purple 為X=10 的同源八倍體,NP?X為X=10 的同源四倍體,AP85?441 為X=8 的同源四倍體,蔗茅Yunnan2009?3 為X=10 的同源二倍體。為深入探討這4 個(gè)材料的密碼子使用模式是否存在差異,本研究進(jìn)一步從染色體組水平計(jì)算了密碼子的RSCU 值,如LA?purple(X=10, 各染色體組命名即從Chr1 到Chr10)。結(jié)果見圖5,圖中RSCU 值在虛線以上的密碼子為編碼相同氨基酸中偏好使用的同義密碼子。從圖中可以看出,4 個(gè)材料在染色體和全基因組水平的密碼子RSCU 值無明顯差異(同一密碼子堆積柱上各顏色的直方柱高度幾乎完全相等),各氨基酸偏好使用的同義密碼子相同。表明4個(gè)材料的密碼子使用模式在染色體組水平上也是高度相似的。

    圖5 四個(gè)材料全基因組和染色體組水平的密碼子RSCU 值分析Fig.5 Analysis of codon RSCU on genome-wide and chromosome set level in four materials

    2.7 甘蔗屬種及其近緣屬種蔗茅與主要模式生物的密碼子使用模式比較

    上述甘蔗屬種及其蔗茅的密碼子偏好性主要參數(shù)的相關(guān)性研究表明,有效密碼子數(shù)與基因組GC含量以及密碼子3 個(gè)位點(diǎn)的GC 含量呈顯著負(fù)相關(guān)關(guān)系,ENC 值也是評價(jià)密碼子偏好的重要參數(shù)之一。因此,我們分析了甘蔗4 個(gè)材料與其近緣作物玉米、高粱以及一些模式生物的堿基組成差異。結(jié)果如圖6,從圖中可以看出,甘蔗熱帶種LA?purple、割手密NP?X 和AP85?441 及蔗茅Yunnan2009?3 與玉米、高粱和水稻的基因組GC 含量差異不大,介于50%-60%之間,密碼子3 個(gè)位點(diǎn)的GC 含量都表現(xiàn)為GC3>GC1>GC2,偏好于使用以G 或C 結(jié)尾的密碼子,符合單子葉植物的密碼子使用特征。而擬南芥、煙草、大腸桿菌、酵母的GC 含量分布在40%-50%之間,含量最低的是酵母,密碼子3 個(gè)位點(diǎn)的GC 含量為GC1>GC3>GC2,偏向于使用A 或U 結(jié)尾的密碼子,與甘蔗屬種及其近緣屬種蔗茅的密碼子使用模式具有明顯差異。

    圖6 甘蔗與其他生物的基因組堿基組成比較Fig.6 Comparison analysis of genome base composition between sugarcane and other organisms

    此外,為探究不同生物的密碼子偏好性差異,分別以熱帶種、割手密和蔗茅的RSCU 平均值作為甘蔗的RSCU 值,分別與其他7 種主要模式生物的密碼子RSCU 進(jìn)行比較分析,結(jié)果見圖7。從圖中可以看出,甘蔗與玉米、高粱和水稻的RSCU 比值范圍分別為0.88-1.19, 0.84-1.37, 0.82-1.12,與擬南芥、煙草、大腸桿菌、釀酒酵母的RSCU 比值范圍分別為0.46-3.40,0.43-3.15,0.35-3.34,0.23-4.67,表明甘蔗的密碼子使用模式與玉米、高粱和水稻等單子葉植物的密碼子使用偏好性非常相似,而與擬南芥、煙草等雙子葉植物的密碼子使用偏好性差異較大,因此,玉米、高粱、水稻這些作物比較適合作為甘蔗優(yōu)異基因驗(yàn)證時(shí)的異源遺傳轉(zhuǎn)化載體。與常用的大腸桿菌、釀酒酵母等異源表達(dá)宿主相比,釀酒酵母與甘蔗屬及其近緣屬種的密碼子偏好性差異更大,因此,在做甘蔗相關(guān)基因的原核表達(dá)系統(tǒng)研究時(shí),更適合選擇在大腸桿菌中進(jìn)行。

    3 討論

    密碼子偏好性廣泛存在于生物中,是其在特定自然選擇壓力及突變壓力下的進(jìn)化模式,體現(xiàn)了物種對基因組環(huán)境和自然進(jìn)化壓力的適應(yīng)性選擇[27]。本研究對甘蔗屬熱帶種、割手密及其近緣屬種蔗茅的全基因組進(jìn)行了密碼子使用模式及其影響因素分析,結(jié)果表明甘蔗屬種和蔗茅在密碼子使用模式上高度相似。核苷酸組成成分上,4 個(gè)材料的GC 含量范圍為55.02%-57.53%,同義密碼子第3 位的GC含量范圍為62.46%-66.09%,說明基因組GC 含量較高,而AT 含量較低,且都傾向于使用以G 或C 結(jié)尾的密碼子,這與水稻[28]、玉米[29]、小麥[20]等單子葉植物的密碼子使用特征一致。而與擬南芥[30]等雙子葉植物基因組GC 含量較低,偏好使用以A或T 結(jié)尾的密碼子有所差異[31]。此外,ENC 值是反映基因編碼時(shí)對密碼子選擇性強(qiáng)弱的指標(biāo)之一,前人研究提出可將ENC=35.0 作為判斷密碼子偏好性強(qiáng)弱的分界點(diǎn),若ENC ≤35,則說明有較強(qiáng)的密碼子使用偏好性[22,32]。本研究中,4 個(gè)材料的全基因組CDS 序列的ENC 值范圍在47.97-48.89,均值為48.45,表明甘蔗屬及其近緣屬種蔗茅密碼子使用偏好性較弱。這種較弱的密碼子使用偏好性在擬南芥[30]、芒果[33]、菠蘿[34]等多種作物中都被觀察到。然而,本研究通過進(jìn)一步對ENC 值的分布進(jìn)行分析發(fā)現(xiàn),密碼子偏好性還與基因本身有關(guān),甘蔗4 個(gè)材料的基因組中,具有較強(qiáng)密碼子偏好性的基因占12.05%-14.23%(ENC ≤35),偏好性中等的基因占16.72%-19.32%(35<ENC ≤45),而約69%的基因密碼子使用偏好性較弱(ENC>45)。因此,在研究基因異源表達(dá)效率時(shí),除了考慮宿主的密碼子使用偏好性外,少數(shù)基因可能還需要考慮基因本身的密碼子使用特性。同時(shí),為深入掌握這些密碼子偏好性參數(shù)與基因表達(dá)的相互關(guān)系,本研究進(jìn)一步結(jié)合轉(zhuǎn)錄組測序數(shù)據(jù)進(jìn)行了基因轉(zhuǎn)錄表達(dá)水平與這些參數(shù)的相關(guān)性分析,結(jié)果表明基因表達(dá)水平與基因序列長度、A3s、T3s 和ENC 等顯著負(fù)相關(guān),與GC、GC3、C3s、G3s、CAI、Fop 等參數(shù)顯著正相關(guān),這與Wen 等[35]對川桑的研究結(jié)果一致。但相關(guān)系數(shù)較小,相關(guān)性很弱。可能的原因是基因的轉(zhuǎn)錄調(diào)控受到多種因素及調(diào)控元件的影響,是一個(gè)十分復(fù)雜的過程。依靠基因序列的密碼子使用偏好性參數(shù)只能初步從理論上預(yù)測基因的表達(dá)水平,并不能精準(zhǔn)預(yù)測基因的實(shí)際表達(dá)水平。

    生物密碼子使用模式的形成并不是單一因素作用引起的,而是多種因素綜合作用的結(jié)果,為更好地了解影響密碼子偏好性形成的影響因素,我們進(jìn)行了中性繪圖分析、ENC?plot 及PR2?plot 分析。結(jié)果均表明它們的密碼子使用模式均同時(shí)受到自然選擇和其他因素如突變壓力的影響,但自然選擇在其中起著主導(dǎo)作用。這與擬南芥[30]、木薯[36]、睡蓮[37]等物種的研究結(jié)果相似,自然選擇在這些物種的密碼子使用模式形成中占據(jù)著主導(dǎo)作用。而在其他如籽粒莧[38]、乳油木[39]等作物中則表現(xiàn)為突變?yōu)橹饕绊懸蛩?,這說明影響生物密碼子使用模式形成的主導(dǎo)因素在物種間是有差異的。以上多種作物的研究結(jié)果皆表明同義密碼子使用偏愛特征是在自然選擇、突變及其他多種因素的共同作用下形成的。研究發(fā)現(xiàn),受到的正向選擇和突變壓力越大,在基因組中形成的最優(yōu)密碼子就越多,反之則較少[40]。根據(jù)RSCU 值及高、低表達(dá)基因組二者的ΔRSCU 值,本 研 究在LA?purple、NP?X、AP85?441和Yunnan2009?3 中篩選出了13 個(gè)最優(yōu)密碼子,這些最優(yōu)密碼子都以G 或C 結(jié)尾,證明了甘蔗屬及其近緣屬種蔗茅與其他單子葉植物密碼子使用特征一致,皆偏愛以G 或C 結(jié)尾的同義密碼子[31]。同時(shí),經(jīng)過對密碼子的RSCU 值對比分析,我們明確了本研究的熱帶種、割手密和蔗茅的密碼子使用偏好特征不管在全基因組水平還是染色體水平都是高度相似的。

    經(jīng)對比分析,本研究篩選出的最優(yōu)密碼子與玉米[29]、小麥[20]等禾本科作物偏好使用的密碼子具有非常高的相似性,這暗示著物種間親緣關(guān)系越近,其密碼子使用模式可能越相似。此外,Zhang 等[20]分析了小麥的線粒體基因組、葉綠體基因組以及核基因組的密碼子使用模式,結(jié)果表明3 個(gè)基因組間的密碼子使用特征也存在一定的差異。本研究利用甘蔗屬種及其近緣種蔗茅的全基因組進(jìn)行密碼子使用偏好特性分析,盡管屬于不同的種,但結(jié)果表明其密碼子使用模式高度相似,這些共同的密碼子使用偏好特征對提高外源基因在甘蔗中的表達(dá)效率具有重要意義。

    4 結(jié)論

    甘蔗屬種與其近緣屬種蔗茅的基因組都富含GC,且偏好使用G/C 結(jié)尾的密碼子,密碼子使用偏好性高度相似。其密碼子使用模式的形成受到了自然選擇、突變壓力等因素的共同作用,其中自然選擇占主導(dǎo)作用。相關(guān)性分析表明密碼子偏好性參數(shù)與基因轉(zhuǎn)錄表達(dá)水平相關(guān)性較弱。通過比較發(fā)現(xiàn),甘蔗與玉米、水稻和高效的密碼子偏好性較為相似,在甘蔗基因功能異源驗(yàn)證時(shí)可優(yōu)先選擇利用這些作物作為異源表達(dá)系統(tǒng)。

    致謝:

    衷心感謝廣西大學(xué)張積森教授及華秀婷博士、汪柏宇博士為本研究提供了基因組數(shù)據(jù)和基因表達(dá)數(shù)據(jù);感謝楊紹林同事及西北民族大學(xué)劉珊珊博士在本研究Python 代碼編寫上給予的幫助和指導(dǎo)。

    猜你喜歡
    近緣同義密碼子
    Dale Carnegie
    谷子近緣野生種的親緣關(guān)系及其利用研究
    密碼子與反密碼子的本質(zhì)與拓展
    西夏文《同義》重復(fù)字研究
    西夏學(xué)(2019年1期)2019-02-10 06:22:08
    10種藏藥材ccmFN基因片段密碼子偏好性分析
    中成藥(2018年7期)2018-08-04 06:04:10
    西夏文《同義》考釋三則
    西夏學(xué)(2018年2期)2018-05-15 11:25:30
    北細(xì)辛及其近緣植物葉片顯微結(jié)構(gòu)比較研究
    檢疫性雜草假高粱與近緣植物種子的波譜鑒別方法
    HPLC測定滇紫草及其兩個(gè)近緣種中乙酰紫草素的含量
    嗜酸熱古菌病毒STSV2密碼子偏嗜性及其對dUTPase外源表達(dá)的影響
    农安县| 石城县| 天等县| 莱阳市| 永清县| 易门县| 黎城县| 榆社县| 陆良县| 宜兴市| 镇原县| 石家庄市| 邵东县| 台东县| 泗洪县| 理塘县| 和平县| 班玛县| 永年县| 繁昌县| 荔浦县| 宣汉县| 民勤县| 上高县| 张家界市| 定结县| 平利县| 加查县| 波密县| 永胜县| 南溪县| 金沙县| 仁寿县| 崇左市| 曲阜市| 景德镇市| 南平市| 巨鹿县| 灵台县| 阳江市| 双辽市|