賴瑞聯(lián) 馮新 高敏霞 鐘春水 胡藝賢 吳如健 陳義挺
摘 要 為了解美味獼猴桃過氧化物酶基因AdPOD27的密碼子偏好特征,本研究采用CodonW1.4.2、SPSS19.0、MEGA5.2和EMBOSS等軟件分析AdPOD27的密碼子偏好性參數(shù),同時(shí)對(duì)單子葉植物和雙子葉植物間POD27的密碼子使用規(guī)律進(jìn)行比較。結(jié)果表明,AdPOD27有效密碼子數(shù)(ENc)、密碼子G和C含量(GC)、密碼子第3位G或C的含量(GC3s)分別為50.65、0.443和0.429,意示著AdPOD27密碼子偏好性較弱但偏好使用含有較多A和T并以A或T結(jié)尾的密碼子;單子葉植物和雙子葉植物平均ENc值分別為36.93和52.25,單子葉植物POD27密碼子偏好性普遍強(qiáng)于雙子葉植物;聚類分析結(jié)果表明,物種間具有嚴(yán)格的密碼子偏好性規(guī)律。此外,AdPOD27與獼猴桃基因組密碼子使用頻率存在一定差異。本研究結(jié)果為進(jìn)一步開展AdPOD27基因功能和分子進(jìn)化研究提供了科學(xué)依據(jù)。
關(guān)鍵詞 美味獼猴桃;過氧化物酶;密碼子偏好性;聚類分析
中圖分類號(hào) S663.4 文獻(xiàn)標(biāo)識(shí)碼 A
Abstract To explore codon usage bias (CUB) characteristic of one peroxidase gene of Actinidia deliciosa (AdPOD27), CUB parameters were analyzed by CodonW1.4.2, SPSS19.0, MEGA5.2 and EMBOSS in this study, and the CUB patterns between dicotyledon and monocotyledon were compared. The results showed that the effective number of codon (ENc), GC content (GC) and GC content on the 3 rd site (GC3s) was 50.65, 0.443 and 0.429, which indicated that CUB level of AdPOD27 was low, but it was bias toward the synonymous codons with A or T on the 3rd site. The average value of ENc in dicotyledon and monocotyledon was 36.93 and 52.25 respectively, meaning the CUB level of POD27 in monocotyledon was higher than that in dicotyledon. Based on phylogeny tree analysis, there were strict codon usage rules in different plants. In addition, there were some differences of codon usage frequency between AdPOD27 and kiwifruit genome. This study would provide a scientific basis for further research of gene function and molecular evolution of AdPOD27.
Keywords Actinidia deliciosa; peroxidase; codon bias; cluster analysis
DOI 10.3969/j.issn.1000-2561.2018.07.013
密碼子是生物體遺傳信息的基本載體,自然界中20種氨基酸由61個(gè)密碼子編碼而成,即一種氨基酸可能存在多個(gè)對(duì)應(yīng)密碼子,稱為同義密碼子(synonym codons)。生物體編碼氨基酸時(shí)對(duì)密碼子的選擇并非完全隨機(jī),可能偏好使用特定密碼子而產(chǎn)生密碼子偏好性(codon bias),其中具有物種偏好性的密碼子稱為最優(yōu)密碼子。密碼子偏好性是生物遺傳的基本特征,往往能夠反映物種的起源和進(jìn)化規(guī)律,物種之間、基因之間甚至基因家族成員之間均存在特異的密碼子偏好性[1-3]。物種對(duì)同義密碼子的選擇不會(huì)改變氨基酸的種類,但會(huì)影響基因的轉(zhuǎn)錄水平和翻譯效率,因此物種往往在高表達(dá)基因或重要功能基因中保留最優(yōu)密碼子[4]。密碼子偏好性往往還與基因長(zhǎng)度、tRNA豐度、堿基組成、內(nèi)含子數(shù)量和蛋白質(zhì)二級(jí)結(jié)構(gòu)等有關(guān),且近緣物種通常保持相對(duì)一致的密碼子偏好性[5-8]。因此,開展密碼子偏好性研究對(duì)揭示物種或基因的起源和進(jìn)化規(guī)律具有重要意義。此外,物種間密碼子偏好性差異也會(huì)影響基因的遺傳轉(zhuǎn)化和異源表達(dá)效率,甚至導(dǎo)致表達(dá)沉默,基于目標(biāo)基因和轉(zhuǎn)化受體基因組密碼子偏好性對(duì)目標(biāo)基因進(jìn)行定向改造也是提高異源轉(zhuǎn)化效率的關(guān)鍵[9]。
獼猴桃是獼猴桃科獼猴桃屬落葉藤本果樹,被認(rèn)為是20世紀(jì)野生果樹人工馴化栽培最成功的四大果種之一,其果實(shí)中富含維生素c、氨基酸、亞麻酸、亞油酸、葉酸和礦質(zhì)元素等營(yíng)養(yǎng)和功效成分,是一種廣受歡迎的水果[10]。然而,獼猴桃果實(shí)不耐貯藏,果實(shí)成熟后極易軟化和腐爛,影響獼猴桃的可食性和商品價(jià)值。過氧化物酶(peroxidase,POD)是由單一肽鏈與卟啉組成的一種血紅素蛋白,能夠以H2O2為受體催化底物氧化,是植物響應(yīng)逆境脅迫的關(guān)鍵酶之一。目前獼猴桃POD基因研究較少,遺傳背景較不明確,開展POD密碼子研究有助于進(jìn)一步揭示該基因的遺傳特征和分子功能。此外,課題組以廣泛栽培的美味獼猴桃‘米良1號(hào)為材料研究發(fā)現(xiàn),過氧化物酶基因成員AdPOD27在果實(shí)貯藏軟化過程中發(fā)揮重要的調(diào)控作用。鑒于此,本實(shí)驗(yàn)采用CodonW1.4.2、SPSS19.0、MEGA5.2和在線軟件EMBOSS等分析美味獼猴桃AdPOD27的密碼子偏好性,同時(shí)對(duì)單子葉植物和雙子葉植物間POD27的密碼子使用規(guī)律進(jìn)行比較,以期為進(jìn)一步開展基因功能和分子進(jìn)化研究提供科學(xué)依據(jù)。
1 材料與方法
1.1 數(shù)據(jù)來源
本研究采用的獼猴桃過氧化物酶基因AdPOD27為課題組從美味獼猴桃‘米良1號(hào)(Actinidia deliciosa cv. Miliang-1)果實(shí)中克隆獲得,包含開放閱讀框(open reading frame,ORF)984 bp,編碼327個(gè)氨基酸,GenBank登錄號(hào)為MF774100。以“Peroxidase 27”為檢索名從NCBI數(shù)據(jù)庫(kù)中查找并下載葡萄、胡楊、番茄、水稻、玉米和高粱等單雙子葉植物POD27基因,所篩選的基因均符合以下條件:編碼區(qū)大于300 bp且包含完整的ORF序列,不含有內(nèi)含子。獼猴桃基因組密碼子使用頻率數(shù)據(jù)來源于Codon Usage Database(http://www.kazusa.or.jp /codon/)。
1.2 方法
1.2.1 密碼子偏好性參數(shù)分析 采用CodonW1.4.2分析POD27有效密碼子數(shù)(Effective number of codons,ENc)、密碼子G和C總含量(GC)、密碼子末位堿基G或C的含量(GC3s)、密碼子適應(yīng)指數(shù)(Codon adaptation index,CAI)、密碼子偏愛指數(shù)(Codon bias index,CBI)和同義密碼子使用度(Relative synonymous codon usage,RSCU)等密碼子偏好性參數(shù)。采用EMBOSS在線軟件的CUSP模塊(http://emboss.toulouse.inra. fr/cgi-bin/emboss/cusp)分析POD27的密碼子使用頻率。
1.2.2 聚類分析 去除終止密碼子TAA、TAG、TGA,編碼色氨酸Trp和甲硫氨酸Met的TGG和ATG,將具有同義密碼子的59個(gè)密碼子RSCU值視為多維空間的一個(gè)變量,每個(gè)基因或物種均可視為由59個(gè)變量構(gòu)成的空間向量?;诖?,采用SPSS19.0歐式平方距離的離差平方和法(Ward法)構(gòu)建物種間密碼子偏好性系統(tǒng)發(fā)育樹。采用MEGA5.2基于物種間POD27核酸序列相似性構(gòu)建進(jìn)化樹,比較二者之間的差異。
2 結(jié)果與分析
2.1 AdPOD27密碼子偏好性
2.1.1 密碼子偏好性參數(shù) 有效密碼子數(shù)ENc是密碼子偏好性的重要參考依據(jù),根據(jù)編碼密碼子個(gè)數(shù)ENc值介于20.00~61.00,該值越小,密碼子偏好性越強(qiáng),反之越弱。當(dāng)ENc值為61.00時(shí)表示基因編碼過程中對(duì)密碼子的選擇完全隨機(jī);其中,35.00往往作為衡量偏好性強(qiáng)弱的參考標(biāo)準(zhǔn)。美味獼猴桃AdPOD27的ENc值為50.65,遠(yuǎn)大于35.00而接近61.00,表明其密碼子偏好性可能相對(duì)較弱。而AdPOD27的GC和GC3s分別為0.443和0.429,可見,該基因偏好使用含有較多A和T并以A或T結(jié)尾的密碼子,尤其是以T結(jié)尾的密碼子(T3s=0.391)。此外,AdPOD27的密碼子適應(yīng)指數(shù)CAI僅為0.222,密碼子偏愛指數(shù)CBI為0,進(jìn)一步驗(yàn)證其密碼子偏好性較弱。
2.1.2 同義密碼子相對(duì)使用度 同義密碼子相對(duì)使用度RSCU是一個(gè)密碼子使用的觀測(cè)頻率和期望頻率的比值,反映了每個(gè)同義密碼子偏離隨機(jī)的程度。通常,RSCU值為1時(shí)表示密碼子觀測(cè)值和實(shí)際值出現(xiàn)的概率一致,而RSCU值大于1時(shí),表示基因?qū)υ撁艽a子的偏好性較強(qiáng)。AdPOD27的RSCU分析結(jié)果如表1所示。RSCU值大于1的個(gè)數(shù)為28,其中以A或T結(jié)尾的密碼子數(shù)為19,占總數(shù)67.9%,表明其對(duì)這些密碼子可能具有較強(qiáng)的偏好性。而除了GCT和AGA外,其余密碼子RSCU值均小于2.0,說明AdPOD27中極強(qiáng)偏好性的密碼子較少,也反映了該基因整體密碼子偏好性較弱。值得注意的是,編碼Ala的GCG,編碼Arg的CGC、CGA、CGG以及編碼Val的GTA均為0,表明這些密碼子不參與AdPOD27的翻譯過程。
2.2 物種間POD27密碼子偏好性
2.2.1 密碼子偏好性參數(shù) 物種間POD27密碼子偏好性分析結(jié)果如表2所示。有效密碼子數(shù)ENc值介于32.54~57.78,其中玉米(ENc=32.54)和粟米(ENc=32.83)POD27的ENc值均小于35.00,表明二者具有極強(qiáng)的密碼子偏好性,而胡蘿卜的密碼子偏好性最弱(ENc=57.78),從整體上看,單子葉植物和雙子葉植物POD27的平均ENc值分別為36.93和52.25,單子葉植物POD27密碼子偏好性普遍強(qiáng)于雙子葉植物。而在密碼子組成方面,單子葉植物GC和GC3s均值分別為0.656和0.893,可見,單子葉植物普遍使用G和C且以G或C結(jié)尾的密碼子;而雙子葉植物中,除蓮、醉蝶花和桉樹對(duì)G或C具有不明顯的偏好外,其余物種均偏好使用A或T,平均GC和GC3s分別為0.450和0.420,說明大部分雙子葉植物POD27密碼子的組成仍以A或T為主,尤其以同屬茄科的煙草(GC=0.369)、番茄(GC=0.357)和辣椒(GC=0.387)對(duì)A或T的選擇偏好最為明顯。
2.2.2 聚類分析 基于密碼子偏好性和核酸序列相似性的物種間POD27的聚類結(jié)果如圖1所示。密碼子偏好性聚類將29個(gè)物種分為兩大類群,分別為單子葉植物類群和雙子葉植物類群,預(yù)示著單雙子葉植物間嚴(yán)格的密碼子偏好性規(guī)律。雙子葉植物類群中,取一定的閾值時(shí)又可以進(jìn)一步分為6個(gè)亞類群,分別包含樣本數(shù)4、5、4、3、3和6,其中亞類群1和亞類群4分別為十字花科和茄科植物,進(jìn)一步說明不同科植物之間同樣具有特異的密碼子使用準(zhǔn)則(圖1-A)。此外,美味獼猴桃AdPOD27與葡萄、桑樹、番木瓜和向日葵同屬亞類群2,預(yù)示著這些物種的密碼子使用規(guī)律較為相似。
在核酸序列同源性比較中,同樣可以分為單子葉植物類群和雙子葉植物類群,可見2種類型植物之間親緣關(guān)系較遠(yuǎn)。而雙子葉植物可進(jìn)一步分為2個(gè)亞類群,分別包含樣本數(shù)24和5,亞類群2中包含4種十字花科植物和醉蝶花,其余雙子葉植物可聚為同一個(gè)亞類群(圖1-B)。在基因同源性上,美味獼猴桃AdPOD27主要與蓮保持較近的親緣關(guān)系。研究結(jié)果可見,物種間具有嚴(yán)格的密碼子使用規(guī)律,在較大范圍內(nèi)POD27密碼子偏好性分類結(jié)果與核酸序列聚類較為一致,然而亞類群分類仍需結(jié)合2種分析結(jié)果以提高分類的準(zhǔn)確性。
2.3 AdPOD27密碼子使用頻率
密碼子使用頻率可以用于比較物種對(duì)特定密碼子的偏好性,通常二者比值大于2.0或小于0.5則認(rèn)為密碼子偏好性差異較大。AdPOD27與獼猴桃基因組的密碼子使用頻率比值如圖2所示。密碼子使用頻率比值大于2.0或小于0.5的密碼子個(gè)數(shù)為15個(gè),表明AdPOD27與獼猴桃基因組密碼子使用頻率仍有一定的差異,尤其是GCG、CGC、CGG和GTA在AdPOD27中并不參與氨基酸編碼過程。
3 討論
密碼子偏好性是物種長(zhǎng)期進(jìn)化的結(jié)果,能夠反映物種或基因的起源和進(jìn)化規(guī)律,也是基因功能研究的重要手段之一。實(shí)驗(yàn)中,美味獼猴桃AdPOD27有效密碼子數(shù)為50.65,遠(yuǎn)遠(yuǎn)高于35.00[11-12]接近61.00,表明AdPOD27密碼子偏好性較弱。而在密碼子堿基的選擇上,AdPOD27偏好使用富含A和T并以A或T結(jié)尾的密碼子,符合大部分雙子葉植物[13]密碼子組成特征。然而在長(zhǎng)期的進(jìn)化過程中,AdPOD27也篩選出了GCT和AGA等偏好性較強(qiáng)的密碼子,可能作為該基因的最優(yōu)密碼子群,而GCG、CGC、CGA、CGG和GTA等不參與其編碼過程,可見AdPOD27存在著復(fù)雜的密碼子進(jìn)化過程。
Novembre[14]、楊惠娟等[15]和Jiang等[12]研究認(rèn)為,通常密碼子中GC含量越高則偏好性越強(qiáng),且單子葉植物密碼子組成主要由AT向GC突變,而雙子葉植物相反。本研究中,單子葉植物POD27有效密碼子數(shù)遠(yuǎn)遠(yuǎn)低于雙子葉植物,而GC含量遠(yuǎn)多于雙子葉植物,可見GC含量與密碼子偏好性呈正相關(guān)性,與前人研究結(jié)果一致。而前期研究發(fā)現(xiàn)ARF[16]和CHI[17]基因在單雙子葉植物間表現(xiàn)出了嚴(yán)格的密碼子偏好性規(guī)律,且基于密碼子偏好性聚類在較小的分類單元中準(zhǔn)確性較好,在分歧較大的分類單元中只能作為補(bǔ)充和參考,密碼子偏好性很可能在一定程度上反映基因特殊的個(gè)體進(jìn)化方式[18-19]。本研究聚類結(jié)果進(jìn)一步驗(yàn)證了單雙子葉植物間嚴(yán)格的密碼子使用準(zhǔn)則,而且在較大范圍內(nèi)POD27密碼子偏好性分類結(jié)果與核酸序列聚類較為一致,然而亞類群分類仍需結(jié)合2種分析結(jié)果以提高分類的準(zhǔn)確性,結(jié)果也進(jìn)一步說明密碼子偏好性分析在物種起源、進(jìn)化和親緣關(guān)系鑒定等研究中的科學(xué)參考價(jià)值。此外,突變壓力[20]和自然選擇[21]兩種關(guān)鍵作用力在物種間POD27密碼子偏好模式形成過程中所發(fā)揮的作用也有待進(jìn)一步深入研究。
參考文獻(xiàn)
[1] Shokri E. Codon bias patterns in photosynthetic genes of halophytic grass Aeluropus littoralis[J]. Journal of Plant Molecular Breeding, 2014, 3(1): 12-20.
[2] Liu Q. Mutational bias and translational selection shaping the codon usage pattern of tissue-specific genes in rice[J]. PLoS ONE, 2012, 7(7): e48295.
[3] Nie X, Deng P, Feng K, et al. Comparative analysis of codon usage patterns in chloroplast genomes of the Asteraceae family[J]. Plant Molecular Biology Reporter, 2014, 32(4): 828-840.
[4] Supek F. The code of silENce: Widespread associations between synonymous codon biases and gene function[J]. Journal of Molecular Evolution, 2016, 82(1): 65.
[5] Qin Z, Cai Z, Xia G, et al. Synonymous codon usage bias is correlative to intron number and shows disequilibrium among exons in plants[J]. BMC Genomics, 2013, 14(1): 1-11.
[6] Camiolo S, Melito S, Porceddu A. New insights into the interplay between codon bias determinants in plants[J]. DNA Research an International Journal for Rapid Publication of Reports on Genes & Genomes, 2015, 22(6): 461-470.
[7] 吳憲明, 吳松鋒, 任大明, 等. 密碼子偏性的分析方法及相關(guān)研究進(jìn)展[J]. 遺傳, 2007, 29(4): 420-426.
[8] 黃 寧, 李國(guó)印, 郭晉隆, 等. 植物MYB轉(zhuǎn)錄因子的同義密碼子使用偏好性分析[J]. 熱帶作物學(xué)報(bào), 2013, 34(8): 1 513-1 518.
[9] Raiford D W, Krane D E, Doom T E, et al. A genetic optimization approach for isolating translational efficiENcy bias[J]. IEEE/ACM Transactions on Computational Biology & Bioinformatics, 2011, 8(2): 342.
[10] Rice C S, Xu H, Yang N, et al. The wondrous kiwifruit—origin, cultivation and utilization[J]. International Journal of Horticulture, 2017, 7(1): 1-6.
[11] Sharp P M, Li W H. An evolutionary perspective on synonymous codon usage in unicellular organisms[J]. Journal of Molecular Evolution, 1986, 24(1-2): 28.
[12] Jiang Y, Deng F, Wang H, et al. An extensive analysis on the global codon usage pattern of baculoviruses[J]. Archives of virology, 2008, 153(12): 2 273.
[13] Murray E E, Lotzer J, Eberle M. Codon usage in plant genes[J]. Nucleic Acids Research, 1989, 17(2): 477-498.
[14] Novembre J A. Accounting for background nucleotide composition when measuring codon usage bias[J]. Molecular Biology & Evolution, 2002, 19(8): 1 390-1 394.
[15] 楊惠娟, 劉國(guó)順, 張松濤, 等. 煙草葉綠體密碼子的偏好性及聚類分析[J]. 中國(guó)煙草學(xué)報(bào), 2012, 18(2): 37-43.
[16] 賴瑞聯(lián), 林玉玲, 林夢(mèng)樺, 等. 龍眼生長(zhǎng)素響應(yīng)因子ARF3密碼子偏好性分析[EB/OL]. 北京: 中國(guó)科技論文在線[2016-04-30]. http://www.paper.edu.cn/releasepaper/content/ 201605-108.
[17] 賴瑞聯(lián), 馮 新, 陳 瑾, 等. 橄欖查爾酮異構(gòu)酶基因 CHI 的密碼子偏好模式[J]. 應(yīng)用與環(huán)境生物學(xué)報(bào), 2017, 23(5): 945-951.
[18] Christianson M. Codon usage patterns distort phylogenies from or of DNA sequENces[J]. American Journal of Botany, 2005, 92(8): 1 221-1 233.
[19] 賴瑞聯(lián), 林玉玲, 鐘春水, 等. 龍眼生長(zhǎng)素受體基因TIR1密碼子偏好性分析[J]. 園藝學(xué)報(bào), 2016, 43(4): 771-780.
[20] Li W H. Models of nearly neutral mutations with particular implications for nonrandom usage of synonymous codons[J]. Journal of Molecular Evolution, 1987, 24(4): 337.
[21] Kimura M. Possibility of extensive neutral evolution under stabilizing selection with special referENce to nonrandom usage of synonymous codons[J]. Proceedings of the National Academy of Sciences of the United States of America, 1981, 78(9): 5 773-5 777.