肖明昆聶愷宏沈紹斌劉 倩段春芳李月仙張林輝
(1. 云南省農(nóng)業(yè)科學(xué)院熱帶亞熱帶經(jīng)濟(jì)作物研究所,云南 保山 678000;2. 四川省廣元市昭化區(qū)林業(yè)局,四川 廣元 628000)
葉綠體是具有完整母系遺傳信息的細(xì)胞器,其基因組序列信息可以探究物種起源進(jìn)化,判定物種間親緣關(guān)系[1-2],對(duì)植物基因組學(xué)、生物信息學(xué)等學(xué)科的發(fā)展也起著重要作用[3]。根據(jù)最優(yōu)密碼子設(shè)計(jì)的葉綠體基因表達(dá)載體,有助于選擇與目的基因契合度高的葉綠體基因進(jìn)行轉(zhuǎn)化,從而提高葉綠體基因組中基因表達(dá)量[4-5]。因此,開(kāi)展葉綠體基因組密碼子使用模式研究,有助于了解物種進(jìn)化歷程,提高葉綠體外源基因的表達(dá)量[6]。
密碼子是信使核糖核酸上編碼氨基酸的三聯(lián)體核苷酸序列。通常編碼同一個(gè)氨基酸的幾個(gè)同義密碼子在無(wú)選擇壓力和中性突變的情況下,使用頻率應(yīng)該相同。但實(shí)際上它們是非隨機(jī)使用的,往往傾向于使用某一種密碼子,這種現(xiàn)象稱(chēng)為密碼子偏好性[7-9]。密碼子偏好性是生物在長(zhǎng)期進(jìn)化演變中逐漸形成的,借助密碼子偏性分析可以更好地理解分子進(jìn)化、基因調(diào)控等生命過(guò)程,對(duì)探究物種進(jìn)化和提高外源基因的表達(dá)具有重要意義[10]。
復(fù)羽葉欒樹(shù)(Koelreuteria bipinnata)為無(wú)患子科欒樹(shù)屬喬木,野生種群分布于云南、四川、貴州、湖南、湖北等省區(qū)[11],該植物具有樹(shù)干通直、枝葉茂密、花果艷麗、季相色彩變化明顯的特征,是園林綠化中觀花和觀果的優(yōu)良樹(shù)種[12]。此外該物種還對(duì)石灰?guī)r山地具有很好的適應(yīng)性,是石漠化地區(qū)植被恢復(fù)和重建的優(yōu)選物種,有極高的生態(tài)價(jià)值[13]。還有研究表明,復(fù)羽葉欒樹(shù)種仁含有多種脂肪酸及氨基酸,具有開(kāi)發(fā)成營(yíng)養(yǎng)品、保健品或者飼料添加劑的廣闊前景,是一種具有很高開(kāi)發(fā)價(jià)值的植物資源[14]。目前,有關(guān)復(fù)羽葉欒樹(shù)的研究多集中于種苗培育[15]、逆境脅迫[13]、種子生理生化[14,16]等方面。隨著基因測(cè)序技術(shù)的發(fā)展,雖已完成對(duì)復(fù)羽葉欒樹(shù)葉綠體基因組的測(cè)序、拼裝和注釋[17],但是關(guān)于復(fù)羽葉欒樹(shù)葉綠體密碼子使用偏好性的研究還未見(jiàn)報(bào)道。本研究以復(fù)羽葉欒樹(shù)葉綠體基因組全序列為研究對(duì)象,通過(guò)對(duì)葉綠體基因組密碼子的使用偏性的影響因素分析,確定復(fù)羽葉欒樹(shù)葉綠體基因組密碼子的使用偏好性,并篩選出最優(yōu)密碼子,可為復(fù)羽葉欒樹(shù)葉綠體基因組在基因工程的應(yīng)用和研究提供理論依據(jù)。此外有助于從基因水平分析物種間的親緣關(guān)系及物種的進(jìn)化發(fā)展,為揭示葉綠體的起源與進(jìn)化提供參考依據(jù)[18]。
在云南省保山市隆陽(yáng)區(qū)采集新鮮幼嫩、完整的復(fù)羽葉欒樹(shù)葉片,樣品保存于干冰中。葉綠體基因組測(cè)序由浙江安諾優(yōu)達(dá)生物科技有限公司完成,后將測(cè)序結(jié)果提交至美國(guó)國(guó)立生物技術(shù)中心(NCBI)(登錄號(hào):MW387267)。對(duì)復(fù)羽葉欒樹(shù)葉綠體基因組進(jìn)行分析時(shí),從87 條CDS(coding DNA sequence)中剔除序列長(zhǎng)度不足300 bp、存在終止密碼子的序列及重復(fù)基因,篩選出52 條基因序列用于最終數(shù)據(jù)分析。
1.2.1 相對(duì)同義密碼子使用度分析
運(yùn)用Codon W 1.4.2 軟件分析復(fù)羽葉欒樹(shù)葉綠體基因組中篩選到的52 條CDS,獲取各CDS 的有效密碼子數(shù)(ENC)、同義密碼子相對(duì)使用度(RSCU)。通過(guò)在線(xiàn)軟件CUSP 分析獲得不同基因的GC 總含量(GC)及各個(gè)密碼子第1 位(GC1)、第2 位(GC2)、第3 位堿基的GC(GC3)含量,并根據(jù)獲得的參數(shù)繪制相關(guān)性熱圖[19-20]。
1.2.2 中性繪圖分析
以GC3為橫坐標(biāo)、GC12(GC1和GC2的平均值)為縱坐標(biāo)繪制散點(diǎn)圖,對(duì)兩者相關(guān)性進(jìn)行分析。若GC12與GC3之間的相關(guān)關(guān)系不顯著,說(shuō)明第 1、2 位與第3 位的密碼子堿基組成具有差異,選擇為偏好性的主要影響因素。反之,則突變是密碼子偏好性的主要影響因素[21-22]。
1.2.3 ENC-plot 繪圖分析
以ENC 值為縱坐標(biāo),GC3為橫坐標(biāo)進(jìn)行二維散點(diǎn)圖的繪制。若散點(diǎn)在標(biāo)準(zhǔn)曲線(xiàn)附近,則突變是該基因密碼子偏性的主要影響因素。若散點(diǎn)距離標(biāo)準(zhǔn)曲線(xiàn)較遠(yuǎn),則選擇是該基因密碼子偏性的主要影響因素[23]。ENC 的理論取值為20~61,其值越接近20 偏性越強(qiáng),其值越接近61 偏性越弱[24-25]。一般當(dāng) ENC 值> 35 時(shí),表明密碼子的偏性較弱,反之,則強(qiáng)[21]。
顧名思義,人生價(jià)值觀是指關(guān)于人生價(jià)值的根本觀點(diǎn)和看法,說(shuō)到底就是對(duì)人生目的和人生意義的認(rèn)識(shí)。人生價(jià)值觀決定人生態(tài)度。而人生價(jià)值觀又是由人生的理想和信念所決定。有了偉大的理想和信念才能樹(shù)立正確的人生價(jià)值觀。因此,我們論及方志敏的人生價(jià)值觀,首先必須了解方志敏的人生理想和信念。
標(biāo)準(zhǔn)曲線(xiàn)公式:
1.2.4 PR2-plot 分析
PR2-plot 繪圖分析時(shí)將A3/(A3+ T3)作為縱坐標(biāo),G3/(G3+ C3)作為橫坐標(biāo)。圖的中心點(diǎn)值為A=T 且C=G,其余點(diǎn)與中心點(diǎn)的矢量距離表示偏性程度和方向[26-28]。
1.2.5 最優(yōu)密碼子的確定
以復(fù)羽葉欒樹(shù)葉綠體基因52 條CDS 的ENC值為偏好性標(biāo)準(zhǔn),對(duì)其52 條CDS 的ENC 值進(jìn)行排序,由低到高對(duì)其進(jìn)行排序,分別選出兩端10%的基因,構(gòu)建高低偏性基因庫(kù)[29],ENC 值小的為高表達(dá)庫(kù),ENC 值大的為低表達(dá)庫(kù)[30]。將同時(shí)滿(mǎn)足高頻密碼子( RSCU>1)和高表達(dá)密碼子(ΔRSCU≥0.08)的密碼子定為復(fù)羽葉欒樹(shù)葉綠體基因組的最優(yōu)密碼子[31-32]。
利用Codon W 1.4.2 和在線(xiàn)軟件CUSP 對(duì)符合要求的CDS 的堿基組成及ENC 值進(jìn)行分析(圖1)。結(jié)果顯示,所有CDS 序列的GC1、GC2、GC3分別為47.27%、39.49%、29.84%,平均GC含量為38.87%。3 個(gè)密碼子位置的GC 含量由高到低表現(xiàn)為GC1>GC2>GC3,說(shuō)明復(fù)羽葉欒樹(shù)密碼子3 個(gè)位置的堿基組成不均衡,葉綠體基因密碼子偏好AU 堿基。對(duì)復(fù)羽葉欒樹(shù)的ENC 值進(jìn)行分析,發(fā)現(xiàn)復(fù)羽葉欒樹(shù)各 CDS 的ENC 值在36~61 之間,52 條CDS 序列的ENC 值均大于35,說(shuō)明復(fù)羽葉欒樹(shù)葉綠體基因組密碼子偏好性弱。
圖 1 復(fù)羽葉欒樹(shù)葉綠體基因組不同位置的GC 含量Fig. 1 GC content of different positions in the chloroplast genome of K. bipinnata
圖 2 葉綠體基因組密碼子各參數(shù)的相關(guān)性分析Fig. 2 Correlation analysis of each codon parameters ofchloroplast genome
表 1 復(fù)羽葉欒樹(shù)各氨基酸的RSCU 分析Table 1 RSCU analysis of each amino acid in K. bipinnata
中性繪圖分析表明(圖3),GC12在0.220~0.379 之間,GC3在0.187~0.568 之間,相關(guān)分析顯示,GC12與GC3的相關(guān)系數(shù)為0.198,相關(guān)性不顯著,回歸系數(shù)為0.265 2。說(shuō)明GC1、GC2、GC3的堿基組成存在差異,因此,推論復(fù)羽葉欒樹(shù)葉綠體基密碼子的使用偏性主要受到選擇的影響。
圖 3 復(fù)羽葉欒樹(shù)葉綠體基因組中性繪圖分析Fig. 3 Neutrality plot analysis in the chloroplast genome of K. bipinnata
ENC-plot 分析顯示(圖4),復(fù)羽葉欒樹(shù)的部分基因在標(biāo)準(zhǔn)曲線(xiàn)周?chē)植?,而大部分基因落在?biāo)準(zhǔn)曲線(xiàn)下方,離標(biāo)準(zhǔn)曲線(xiàn)較遠(yuǎn)。進(jìn)一步確定基因與標(biāo)準(zhǔn)曲線(xiàn)的距離,對(duì)ENC 比值進(jìn)行計(jì)算(表2),發(fā)現(xiàn)ENC 比值在-0.05~0.05 區(qū)間的有18 個(gè),與預(yù)期ENC 值較為接近,而約65.4%的基因與預(yù)期ENC 值差距較大。因此,選擇是復(fù)羽葉欒樹(shù)葉綠體基因組密碼子使用偏好性關(guān)鍵影響因素,其他因素的影響較弱。
圖 4 復(fù)羽葉欒樹(shù)葉綠體基因組ENC-plot繪圖分析Fig. 4 ENC-plot analysis in the chloroplast genome ofK. bipinnata
表 2 復(fù)羽葉欒樹(shù)葉綠體基因組有效密碼子數(shù)比值頻數(shù)分布Table 2 Distribution of ENC ratio in the chloroplast genome of K. bipinnata
通過(guò) PR2-plot 繪圖分析(圖5),發(fā)現(xiàn)圖中4 個(gè)區(qū)域中的基因位點(diǎn)呈現(xiàn)不均勻分布,多數(shù)處在中心點(diǎn)稍右下位置,說(shuō)明在第3 位堿基的選擇上密碼子具有偏好性,且堿基的使用頻率表現(xiàn)為T(mén)>A、G>C。因此,復(fù)羽葉欒樹(shù)葉綠體基因組密碼子偏好性主要受到選擇的影響,還可能受到突變等其他因素的影響。
圖 5 復(fù)羽葉欒樹(shù)密碼子奇偶偏好性分析Fig. 5 Analysis of PR2-plot of codon bias ofK. bipinnata
根據(jù)表3,將同時(shí)滿(mǎn)足RSCU>1、ΔRSCU≥0.08 兩個(gè)條件的密碼子確定為最優(yōu)密碼子,最終篩選出了12 個(gè)最優(yōu)密碼子(CUU、GUU、AGU、GCA、CAA、CAU、AAA、GAU、CGU、CGA、GGU、GGA),其中7 個(gè)以U 結(jié)尾,5 個(gè)以A結(jié)尾。
表 3 復(fù)羽葉欒樹(shù)葉綠體基因組最優(yōu)密碼子的確定Table 3 Determination of optimal codons in the chloroplast genome of K. bipinnata
自然界常見(jiàn)的20 種氨基酸,除蛋氨酸(Met)和色氨酸(Trp)由 1 個(gè)密碼子編碼外,其余18 種均由2~6 個(gè)密碼子編碼。編碼同一種氨基酸的密碼子稱(chēng)為同義密碼子。理論上在沒(méi)有突變和進(jìn)化壓力等因素下,mRNA 翻譯時(shí)同義密碼子的使用頻率應(yīng)相等[33],但在實(shí)際情況中,同義密碼子的使用頻率表現(xiàn)出很大差異,由此造成了同義密碼子使用偏性。本研究依托復(fù)羽葉欒樹(shù)葉綠體基因組數(shù)據(jù),以篩選出的52 條完整CDS 序列為研究對(duì)象,對(duì)其密碼子的堿基構(gòu)成及偏好性進(jìn)行分析,發(fā)現(xiàn)復(fù)羽葉欒樹(shù)葉綠體基因組的密碼子使用頻率AU>CG,總體上偏好使用堿基為A/U的密碼子。在燈盞花(Erigeron breviscapus)[5]、秋茄(Kandelia obovata)[34]、蒺藜苜蓿(Medicago truncatula)[35]等物種的研究中也得出類(lèi)似結(jié)論,這些研究均指出葉綠體基因組密碼子使用模式中偏好使用A/U 堿基。而對(duì)芒果(Mangifera indica)[31]等的研究發(fā)現(xiàn),葉綠體基因組偏好使用G/C 堿基,這與本研究結(jié)果不一致。
研究表明,影響氨基酸密碼子偏好性的原因除了突變和自然選擇外,還與堿基的組成差異、基因編碼結(jié)構(gòu)和 tRNA 豐度、GC 含量、基因長(zhǎng)度等因素有關(guān)[8]。綜合分析發(fā)現(xiàn),復(fù)羽葉欒樹(shù)葉綠體基因組密碼子偏好性關(guān)鍵受到自然選擇的影響,在對(duì)藿香(Agastache rugosa)[36]、紫苜蓿(Medicago sativa)[37]、灰毛漿果楝(Cipadessa baccifera)[32]、抽筒竹(Gelidocalamus tessellatus)[22]等植物的研究中也得到了相似結(jié)果。但在對(duì)蒺藜苜蓿[35]、薔薇科果樹(shù)[38]、乳油木(Vitellaria paradoxa)[39]、籽粒莧(Amaranthus hypochondriacus)[40]等植物的研究中指出,突變是影響葉綠體基因組密碼子偏好性的因素。由此可見(jiàn),影響不同植物葉綠體密碼子偏好性的主要因素不同,植物葉綠體密碼子偏好性受到多種因素影響。從進(jìn)化學(xué)角度上看這種差異很可能與不同物種對(duì)自然環(huán)境的適應(yīng)性調(diào)節(jié)相關(guān)。本研究中GC3、ENC 與基因長(zhǎng)度無(wú)顯著相關(guān)關(guān)系,說(shuō)明基因長(zhǎng)度對(duì)密碼子偏好影響并不大,這與梁曉靜等[41]的研究結(jié)果相似,說(shuō)明密碼子偏好性影響因素具有一定的相似性。但也有研究表明基因長(zhǎng)度對(duì)密碼子偏性有影響,可見(jiàn)密碼子偏性的影響因素不僅因物種而異還受多種未知因素影響。
本研究將RSCU>1 且ΔRSCU≥0.08 的密碼子確定為高表達(dá)密碼子,最終篩選出了復(fù)羽葉欒樹(shù)葉綠體基因組的12 個(gè)最優(yōu)密碼子(CUU、GUU、AGU、GCA、CAA、CAU、AAA、GAU、CGU、CGA、GGU、GGA),其中7 個(gè)以U 結(jié)尾,5 個(gè)以A 結(jié)尾,這與上述復(fù)羽葉欒樹(shù)葉綠體基因組密碼子偏好使用A 或U 結(jié)尾密碼子的結(jié)論相一致。