姜 艷, 張全星, 管德龍, 許升全
(秦巴山區(qū)可持續(xù)發(fā)展協(xié)同創(chuàng)新中心, 陜西師范大學(xué) 生命科學(xué)學(xué)院, 陜西 西安 710119)
?
小鯢科動(dòng)物Cytb基因密碼子偏好性分析
姜艷, 張全星, 管德龍, 許升全*
(秦巴山區(qū)可持續(xù)發(fā)展協(xié)同創(chuàng)新中心, 陜西師范大學(xué) 生命科學(xué)學(xué)院, 陜西 西安 710119)
利用Mobyle在線工具的 CUSP 程序以及CodonW、Cluster3.0軟件對(duì)NCBI數(shù)據(jù)庫(kù)中16種小鯢科動(dòng)物的細(xì)胞色素b(Cytochromeb,Cytb)基因密碼子偏好性進(jìn)行了分析,并探討密碼子偏好性對(duì)系統(tǒng)發(fā)育分析的影響。結(jié)果表明:16種小鯢科動(dòng)物Cytb基因的有效密碼子數(shù)范圍為34.45~47.18,平均值為41.01,該基因有密碼子使用偏好。該基因在組成上偏好使用以A或T堿基結(jié)尾的密碼子。通過(guò)計(jì)算各物種每個(gè)密碼子的同義密碼子相對(duì)使用度值并做密碼子和物種的分層聚類(lèi)發(fā)現(xiàn),在不同屬間密碼子使用的模式明顯不同?;贑ytb基因密碼子偏好性的物種聚類(lèi)結(jié)果與基于Cytb基因序列構(gòu)建的最大似然法和貝葉斯系統(tǒng)發(fā)育樹(shù)結(jié)果不完全一致。
小鯢科; 細(xì)胞色素b基因; 密碼子偏好性; 系統(tǒng)發(fā)育
密碼子是指DNA或RNA的堿基序列與編碼蛋白質(zhì)的氨基酸序列間的對(duì)應(yīng)關(guān)系[1]。密碼子偏好性是指在蛋白質(zhì)合成過(guò)程中,翻譯為同一氨基酸的各同義密碼子使用頻率不相同,在某一物種或基因中存在傾向于使用某一種或幾種特定密碼子的現(xiàn)象[2]。密碼子偏好性在生物界中廣泛存在[3],不同的偏好模式可能由多種因素誘導(dǎo),如基因的堿基組成[4]、基因長(zhǎng)度[5]、tRNA豐度[6]、mRNA二級(jí)結(jié)構(gòu)[7]、蛋白質(zhì)的親疏水性[8]以及密碼子-反密碼子間結(jié)合強(qiáng)度[9]等。這些因素在不同物種中具有一定的特異性,因此對(duì)密碼子偏好的研究有助于揭示物種間或某一物種基因家族間的基因進(jìn)化規(guī)律[10]。
大多數(shù)動(dòng)物的線粒體DNA包括37個(gè)基因(2個(gè)rRNA基因、22個(gè)tRNA基因、13個(gè)蛋白質(zhì)基因)和1個(gè)包含復(fù)制起點(diǎn)的控制區(qū)[11-12]。線粒體DNA具有拷貝數(shù)多、分子量小、容易擴(kuò)增、高度保守、母系遺傳、進(jìn)化速度快和非組織特異性等優(yōu)點(diǎn)[13-15],被廣泛應(yīng)用于動(dòng)物系統(tǒng)進(jìn)化及遺傳多樣性研究中。細(xì)胞色素b(Cytochromeb,Cytb)基因是線粒體13個(gè)蛋白編碼基因中結(jié)構(gòu)和功能了解最清楚的基因之一[16],其進(jìn)化速度適中,是系統(tǒng)發(fā)育和遺傳學(xué)研究最常用的分子標(biāo)記之一[17]。對(duì)Cytb基因的密碼子偏好性進(jìn)行研究將有助于揭示密碼子偏好在系統(tǒng)分類(lèi)研究中的有效性。
小鯢科(Hynobiidae)是環(huán)青藏高原分布于亞洲東部地區(qū)的珍稀特有有尾兩棲動(dòng)物。目前,小鯢科已報(bào)道的分子系統(tǒng)學(xué)和分類(lèi)學(xué)研究工作比較豐富,分類(lèi)關(guān)系也較為清楚,但還未見(jiàn)對(duì)其密碼子偏好性的研究[18-21]。因此,本文選取16種小鯢科動(dòng)物的線粒體Cytb基因?yàn)檠芯繉?duì)象,通過(guò)計(jì)算各個(gè)物種之間堿基組成以及密碼子的偏好性特點(diǎn),初步分析小鯢科Cytb基因密碼子的使用模式及進(jìn)化規(guī)律,以期對(duì)小鯢科物種進(jìn)化和分類(lèi)研究提供一些參考。
1.1Cytb基因序列的來(lái)源
本研究使用的Cytb基因全長(zhǎng)區(qū)編碼序列(coding DNA sequence,CDS)均下載于GenBank,不同物種的Cytb基因在NCBI數(shù)據(jù)庫(kù)(http://www.ncbi.nlm.nih.gov)中的登錄號(hào)見(jiàn)表1。
1.2分析方法
1.2.1堿基組成及偏好性分析(1)有效密碼子數(shù)(effective number of codons,ENC)是指一個(gè)基因的密碼子使用頻率與同義密碼子平均使用頻率偏差的量化值,反映基因密碼子使用的偏愛(ài)程度[22],取值范圍為20(每個(gè)氨基酸只使用一種密碼子)~61(全部種類(lèi)的密碼子被均衡使用),其值越小,表明該基因的密碼子使用偏好性越強(qiáng)[23]。本研究應(yīng)用CodonW軟件計(jì)算各物種Cytb基因ENC值。(2)全長(zhǎng)基因GC含量及密碼子三個(gè)位置的GC含量(GC1、GC2、GC3),利用Mobyle在線工具中的create a codon usage table(CUSP)計(jì)算獲得。(3)同義密碼子第 3 位上的各個(gè)堿基含量(A3s、C3s、G3s、T3s),使用CodonW軟件進(jìn)行計(jì)算。(4)同義密碼子相對(duì)使用度(relative synonymous codon usage,RSCU)定義為某一同義密碼子使用次數(shù)的觀察值為分子,以該密碼子出現(xiàn)次數(shù)的期望值為分母。如果密碼子的使用無(wú)偏好性,則RSCU值為1;如果該密碼子使用頻繁,則RSCU值大于1[24]。用CodonW軟件計(jì)算16種小鯢科動(dòng)物Cytb基因的RSCU值。
表1 16種小鯢Cytb基因序列在NCBI中的登錄號(hào)
1.2.2基于密碼子偏好性的16種小鯢科物種聚類(lèi)分析將16種小鯢Cytb基因序列對(duì)應(yīng)的各密碼子的RSCU值進(jìn)行統(tǒng)計(jì)后轉(zhuǎn)換為*.txt格式,導(dǎo)入Cluster 3.0軟件中。對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化后,對(duì)密碼子(橫軸)及物種(縱軸)同時(shí)進(jìn)行聚類(lèi),應(yīng)用斯皮爾曼等級(jí)聚類(lèi)方法(Spearman rank correlation)進(jìn)行平均連接(average linkage),最終輸出結(jié)果為*.cdt格式。將cdt文件導(dǎo)入JAVATreeView軟件[24]進(jìn)行查看并編輯,灰度值由黑到白代表其值的大小,之后調(diào)整橫縱軸由隱藏為顯示狀態(tài),調(diào)整字體后,輸出為熱譜圖(heat map)。
1.2.3基于蛋白質(zhì)編碼序列構(gòu)建系統(tǒng)發(fā)育樹(shù)將16種小鯢Cytb基因的蛋白質(zhì)編碼序列導(dǎo)入mega 6.0中進(jìn)行比對(duì)分析。比對(duì)后的數(shù)據(jù)輸出為數(shù)據(jù)包并導(dǎo)入Raxml及Mrbayes中,采用最大似然法和貝葉斯法構(gòu)建系統(tǒng)發(fā)育樹(shù)。
2.1有效密碼子數(shù)及堿基組成分析
16種動(dòng)物Cytb基因 ENC值范圍為34.45~47.18,平均值為41.01,表明它們的Cytb基因在密碼子使用上具有偏好性,但為一般偏好性基因。使用Mobyle在線工具分析這16種動(dòng)物Cytb基因的GC及密碼子各個(gè)位置的GC含量,結(jié)果顯示(圖1):16種小鯢科動(dòng)物Cytb基因的GC含量小于0.5,低于AT含量;密碼子3個(gè)位置的GC含量為不均衡分布,且都呈現(xiàn)出GC1>GC2>GC3這一規(guī)律,表明密碼子第3位的GC含量小于第1、第2位。進(jìn)一步分析同義密碼子第3位4種堿基的含量(A3s、C3s、G3s、 T3s),如圖2可知,A3s含量最高,G3s含量最低。這16種小鯢科動(dòng)物Cytb基因在編碼時(shí)可能都偏好使用 A結(jié)尾的密碼子,避免使用G結(jié)尾的密碼子。
圖1小鯢科動(dòng)物Cytb基因密碼子不同位置GC堿基含量
Fig.1GC contents at different codon positions in hynobiidae species′Cytbgenes
GC、GC1、GC2、GC3分別代表序列全長(zhǎng)、密碼子各位點(diǎn)的GC堿基含量。
圖2 小鯢科動(dòng)物Cytb基因密碼子第三位堿基含量
2.2基于Cytb基因密碼子偏好性的物種及密碼子聚類(lèi)分析及熱譜圖
為了探究各物種Cytb基因密碼子使用偏好性的差異及規(guī)律,采用Cluster 3.0軟件對(duì)物種和密碼子分別進(jìn)行分層聚類(lèi)(圖3)。
橫軸將所有密碼子依據(jù)RSCU值的大小聚為兩大分支:高頻密碼子多分布在左側(cè),低頻密碼子則多分布在右側(cè)。進(jìn)一步對(duì)兩個(gè)分支的密碼子進(jìn)行比較,發(fā)現(xiàn):兩個(gè)分支中大部分以A或T 結(jié)尾的密碼子被聚為一類(lèi),多數(shù)以G或C結(jié)尾的密碼子聚為一類(lèi),而且以A或T結(jié)尾的密碼子色階明顯高于使用G或C結(jié)尾的密碼子,說(shuō)明小鯢科動(dòng)物Cytb基因中以AT結(jié)尾的密碼子出現(xiàn)頻率更高,為基因偏愛(ài)使用的密碼子。此外,有部分氨基酸表現(xiàn)出在物種間較大的密碼子使用偏性差異,如天冬氨酸Asn,聚類(lèi)結(jié)果顯示其與其他所有的密碼子關(guān)聯(lián)均不密切,還有一些不常用的密碼子其RSCU值較低,如TTG。
縱軸的聚類(lèi)結(jié)果反映了小鯢科16個(gè)物種中Cytb基因密碼子偏好性模式的相似程度,結(jié)果將16種動(dòng)物分成為兩大類(lèi):第一大類(lèi)共包含5個(gè)物種,均隸屬于小鯢屬,其分類(lèi)關(guān)系為((((中國(guó)小鯢+掛榜山小鯢)+貓兒山小鯢)+安吉小鯢)+東北小鯢);第二大類(lèi)包含其余的物種,其中山溪鯢屬的3個(gè)物種被聚為一個(gè)分支,具體的分類(lèi)關(guān)系為((商城肥鯢+爪鯢)+(((極北鯢+水城擬小鯢)+施氏巴鯢)+(黃斑擬小鯢+((((鹽源山溪鯢+山溪鯢)+西藏山溪鯢)+新疆北鯢)+秦巴巴鯢))))。這些結(jié)果顯示至少在同屬物種間,其密碼子偏好模式是相似的,具有一定的分類(lèi)學(xué)意義。
圖3基于Cytb基因同義密碼子相對(duì)使用度16種小鯢及密碼子的分層聚類(lèi)和熱譜圖
Fig.3 The heat map and Hierarchal cluster analysis of 16 species and codons based on RSCU values of differentCytbgenes
行表示對(duì)應(yīng)物種列代表對(duì)應(yīng)密碼子RSCU值,顏色從灰色到黑色,分別代表RSCU值的高低。
2.3基于Cytb基因蛋白質(zhì)編碼序列的系統(tǒng)發(fā)育關(guān)系分析
基于比對(duì)后的Cytb基因蛋白質(zhì)編碼基因列,以大鯢作為外群,利用最大似然法及貝葉斯法構(gòu)建系統(tǒng)發(fā)育樹(shù)(圖4)。結(jié)果將16種動(dòng)物分成三大類(lèi):第一大類(lèi)的分類(lèi)關(guān)系中,山溪鯢屬雖然仍聚為一小支,但山溪鯢與西藏山溪鯢親緣關(guān)系較近而與鹽源山溪鯢關(guān)系較遠(yuǎn),與密碼子聚類(lèi)存在不同,新疆北鯢與極北鯢的分類(lèi)地位與密碼子聚類(lèi)較為接近,都位于山溪鯢屬的外側(cè),與根部直接相連;其余物種如施氏巴鯢、秦巴巴鯢等也與聚類(lèi)結(jié)果存在較大區(qū)別。第二大類(lèi)為小鯢屬的((((中國(guó)小鯢+掛榜山小鯢)+貓兒山小鯢)+安吉小鯢)+東北小鯢),該結(jié)果與基于Cytb基因密碼子偏好性的聚類(lèi)結(jié)果完全一致。
本研究所選小鯢科16種動(dòng)物Cytb基因有效密碼子使用數(shù)的范圍為34.45~47.18,密碼子使用上具有偏好性;在堿基組成方面,AT含量大于GC含量,且同義密碼子第3位AT含量也大于GC含量,說(shuō)明小鯢科動(dòng)物Cytb基因在編碼時(shí)都偏好使用 A或T結(jié)尾的密碼子。因此推測(cè)堿基組成可能是引起該基因密碼子偏好性的原因之一。
基于Cytb基因的同義密碼子相對(duì)使用度對(duì)物種和密碼子的聚類(lèi)結(jié)果顯示在小鯢科不同物種中使用偏好性差異變化,表明線粒體Cytb基因密碼子使用模式在進(jìn)化過(guò)程中具有保守性。這一現(xiàn)象符合Grantham[25]提出的基因組假說(shuō)(genome hypothesis),即密碼子偏好性具有物種特異性,同一物種內(nèi)或系統(tǒng)發(fā)育關(guān)系相近的物種間一般表現(xiàn)出相似的密碼子使用模式。
圖4 基于Cytb基因編碼序列的系統(tǒng)發(fā)育樹(shù)
Fig.4 A Phylogenetic tree of CDS of differentCytbgenes
基于Cytb基因密碼子偏好性的聚類(lèi)結(jié)果與基于Cytb基因CDS構(gòu)建的小鯢科系統(tǒng)發(fā)育樹(shù)不完全一致,這種聚類(lèi)分析和系統(tǒng)發(fā)育關(guān)系不一致的現(xiàn)象在馮慧穎等[26]、劉漢梅等[27]的研究中也出現(xiàn)過(guò)。其原因可能是單基因在進(jìn)化上存在較大的突變,導(dǎo)致其密碼子使用偏好性發(fā)生較大變化,因而表現(xiàn)出與真實(shí)的分類(lèi)地位不同;另一種可能的原因是二者分析的對(duì)象和采用的方法不同,前者是針對(duì)各物種Cytb基因的密碼子,采用分層聚類(lèi)中的平均聯(lián)接法進(jìn)行聚類(lèi),后者是針對(duì)單個(gè)堿基,應(yīng)用最大似然法和貝葉斯法構(gòu)建發(fā)育樹(shù)。我們也不能排除是其他原因影響了密碼子偏好性參數(shù)的聚類(lèi)結(jié)果。但密碼子偏好性作為生物遺傳信息改變的基礎(chǔ),其在系統(tǒng)發(fā)育關(guān)系構(gòu)建中的作用不應(yīng)該被忽視。
[1] 劉慶坡,薛慶中. 遺傳密碼子及其應(yīng)用[J]. 中國(guó)生物化學(xué)與分子生物學(xué)報(bào), 2006, 22(11): 851-855.
[2] 朱孝軒,朱英杰,宋經(jīng)元,等. 基于全基因組和轉(zhuǎn)錄組分析的赤芝密碼子使用偏好性比較研究[J]. 藥學(xué)學(xué)報(bào), 2014, 49(9): 1340-1345.
[3] CAMPOS J L, ZENG K, PARKER D J, et al. Codon usage bias and effective population sizes on the X chromosome versus the autosomes in Drosophila melanogaster[J]. Molecular Biology and Evolution, 2013, 30(4): 811-823.
[4] CARLINI D B, CHEN Y, STEPHAN W. The relationship between third-codon position nucleotide content, codon bias, mRNA secondary structure and gene expression in the drosophilid alcohol dehydrogenase genes Adh and Adhr [J]. Genetics, 2001, 159(2): 623-633.
[5] 孫錚,馬亮,張憲省,等.WolbachiapipientiswMel基因組水平上的密碼子[J]. 中國(guó)科學(xué) C 輯,2009,39(10): 948-953.
[6] OLEJNICZAK M, UHLENBECK O C. tRNA residues that have coevolved with their anticodon to ensure uniform and accurate codon recognition[J]. Biochimie, 2006, 88(8): 943-950.
[7] GU W, ZHOU T, MA J, et al. The relationship between synonymous codon usage and protein structure inEscherichiacoliandHomosapiens[J]. Biosystems, 2004, 73(2): 89-97.
[8] RODRIGUEZ-TRELLES F, TARRIO R, AYALA F J. Switch in codon bias and increased rates of amino acid substitution in theDrosophilasaltansspecies group[J]. Genetics, 1999, 153(1): 339-350.
[9] 石秀麗,黃京飛. 人類(lèi)基因中同義密碼子的偏好與密碼子-反密碼子間的結(jié)合強(qiáng)度密切相關(guān)嗎?[J]. 科學(xué)通報(bào), 2000, 45(23): 2520-2525.
[10] 吳憲明,吳松鋒,任大明,等. 密碼子偏性的分析方法及相關(guān)研究進(jìn)展[J]. 遺傳, 2007, 29(4): 420-426.
[11] CLARY D. The mitochondrial DNA molecule ofDrosophilayakuba: nucleotide sequence, gene organization, and genetic code[J]. Journal of Molecular Evolution, 1985, 22(3):252-271.
[12] FAURON C M R, WOLSTENHOLME D R. Intraspecific diversity of nucleotide sequences within the adenine+ thymine-rich region of mitochondrial DNA molecules ofDrosophilamauritiana,DrosophilamelanogasterandDrosophilasimulans[J]. Nucleic Acids Research, 1980, 8(22): 5391-5410.
[13] GISSI C, IANNELLI F, PESOLE G. Evolution of the mitochondrial genome of Metazoa as exemplified by comparison of congeneric species[J]. Heredity, 2008, 101(4): 301-320.
[14] CUROLE J. Mitogenomics: digging deeper with complete mitochondrial genomes[J]. Trends in Ecology & Evolution, 1999, 14(10): 394-398.
[15] HARRISON R G. Animal mitochondrial DNA as a genetic marker in population and evolutionary biology [J]. Trends in Ecology & Evolution, 1989, 4(1): 6-11.
[16] GRAY M W. Origin and evolution of mitochondrial DNA [J]. Annual Review of Cell Biology, 1989, 5(1): 25-50.
[17] MEYER A. Shortcomings of theCytochromebgene as a molecular marker [J]. Trends in Ecology & Evolution, 1994, 9(8):278-280.
[18] BAEK H J, LEE M Y, LEE H, et al. Mitochondrial DNA data unveil highly divergent populations within the genusHynobius(Caudata: Hynobiidae)in South Korea[J]. Molecules and Cells, 2011, 31(2): 105-112.
[19] YOSHIKAWA N, MATSUI M, NISHIKAWA K. Genetic structure and cryptic diversity ofOnychodactylusjaponicus(Amphibia, Caudata, Hynobiidae) in northeastern Honshu, Japan, as revealed by allozymic analysis[J]. Zoological Science, 2012, 29(4): 229-237.
[20] MATSUI M, YOSHIKAWA N, TOMINAGA A, et al. Phylogenetic relationships of two Salamandrella species as revealed by mitochondrial DNA and allozyme variation (Amphibia: Caudata: Hynobiidae)[J]. Molecular Phylogenetics and Evolution, 2008, 48(1): 84-93.
[21] CHEN M Y, MAO R L, LIANG D, et al. A reinvestigation of phylogeny and divergence times of Hynobiidae(Amphibia, Caudata) based on 29 nuclear genes [J]. Molecular Phylogenetics & Evolution, 2015, 83: 1-6.
[22] WRIGHT F. The ‘effective number of codons’ used in a gene [J]. Gene, 1990, 87(1): 23-29.
[23] GUPTA S K, BHATTACHARYYA T K, GHOSH T C. Synonymous codon usage in Lactococcuslactis: mutational bias versus translational selection[J]. Journal of Biomolecular Structure and Dynamics, 2004, 21(4): 527-535.
[24] SHARP P M, LI W H. An evolutionary perspective on synonymous codon usage in unicellular organisms [J]. Journal of Molecular Evolution, 1986, 24(1/2): 28-38.
[25] GRANTHAM R, GAUTIER C, GOUY M, et al. Codon catalog usage and the genome hypothesis [J]. Nucleic Acids Research, 1980, 8(1): 197-197.
[26] 馮慧穎,梁云,徐雷鋒,等. 百合甘油-3-磷酸?;D(zhuǎn)移酶(GPAT)基因密碼子偏性分析及其表達(dá)受體選擇[J]. 分子植物育種, 2014, 12(1): 127-137.
[27] 劉漢梅,趙耀,顧勇,等. 幾種植物waxy基因的密碼子用法特性分析[J]. 核農(nóng)學(xué)報(bào), 2010, 24(3): 476-481.
〔責(zé)任編輯王勇〕
Codon bias ofCytbgenes in Hynobiidae
JIANG Yan, ZHANG Quanxing, GUAN Delong, XU Shengquan*
(Co-Innovation Center for Qinba Regions Sustainable Development,College of Life sciences,Shaanxi Normal University, Xi′an 710119, Shaanxi, China)
The codon bias of HynobiidaeCytochromebgenes among 16 species were analyzed by using the software Mobyle online tool CUSP program, CodonW, and Cluster3.0, and a further discussion on the Codon bias effection on phylogenetic analysis was done. The results showed that the ENC(effective number of codons) of these 16 HynobiidaeCytbgenes range from 34.45 to 47.18, with average value at 41.01, which shown a preference on codon bias. The nucleotide base composition analysis at each locus showed HynobiidaeCytochromebprefers to codes end by A or T bases. The hierarchical clustering of RSCU values and species showed obvious codon usage patterns among genera. The clustering results slightly deviated from the Maximum-likelihood and the Bayes phylogenetic trees.Keywords: Hynobiidae animals;Cytbgene; codon bias; phylogeny
1672-4291(2016)04-0077-06
10.15983/j.cnki.jsnu.2016.04.345
2016-01-08
陜西省自然科學(xué)基礎(chǔ)研究計(jì)劃(2013JC2-04, 2013JC2-05);陜西省科學(xué)院重點(diǎn)基金(2012k-01)
許升全,男,教授,博士生導(dǎo)師。E-mail:xushengquan@snnu.edu.cn
Q953
A