孫蓉蓉,孫虎芝,張 燦,任慧英
(青島農(nóng)業(yè)大學(xué)動(dòng)物科技學(xué)院,山東青島 266109)
?
噬菌體vB-EcoP-Bp4尾部蛋白基因的密碼子使用偏性分析
孫蓉蓉,孫虎芝,張燦,任慧英*
(青島農(nóng)業(yè)大學(xué)動(dòng)物科技學(xué)院,山東青島 266109)
摘要:為了解噬菌體vB-EcoP-Bp4(簡稱Bp4)尾部蛋白基因的密碼子使用特性,利用生物信息學(xué)方法對(duì)N4類噬菌體Bp4的3個(gè)尾部蛋白基因 gp10、gp11、gp13與其他5株同源性較高的噬菌體進(jìn)行密碼子偏性分析。結(jié)果表明,噬菌體Bp4尾部蛋白基因與其他5株噬菌體尾部蛋白基因密碼子使用模式基本一致,偏愛以A或U的密碼子結(jié)尾;除了AUG(M)和UGG(W)外,針對(duì)Bp4的3個(gè)尾部蛋白基因gp10、gp11、gp13分別確定了14種、17種及16種高頻密碼子。通過6株噬菌體尾部蛋白基因密碼子偏性比較和聚類分析發(fā)現(xiàn),Bp4可預(yù)測蛋白gp10與ECBP1最相近,尾絲蛋白gp11與EC1-UPM、PhAPEC5較相近,而尾刺蛋白gp13與ECBP1、EC1-UPM最相近。本研究發(fā)現(xiàn)噬菌體Bp4尾部蛋白基因密碼子使用的偏性結(jié)果與同源性高低相一致,將為進(jìn)一步研究噬菌體Bp4提供依據(jù)。
關(guān)鍵詞:噬菌體;尾部蛋白;密碼子偏性
生物體中編碼20種氨基酸的密碼子有61種,每種氨基酸至少由1種密碼子編碼。編碼同種氨基酸的各同義密碼子存在使用偏性[1-2],即同種密碼子在不同物種中具有不同的使用頻率,而且其密碼子的使用方式也存在差別[3]。密碼子的偏好性主要是由于基因突變和自然選擇的結(jié)果,密碼子使用偏性的研究有助于了解物種的起源與進(jìn)化、基因的表達(dá)調(diào)控機(jī)制,并且能夠提高轉(zhuǎn)錄及翻譯的效率[1]。通過分析同義密碼子的使用頻率,可以推測出未知基因的表達(dá)水平,從而了解基因的表達(dá)調(diào)控機(jī)制;可以根據(jù)密碼子使用的偏好性,對(duì)密碼子進(jìn)行改造,選擇合適的密碼子,可以提高轉(zhuǎn)錄、翻譯效率,從而提高基因的表達(dá)量[4]。
噬菌體vB-EcoP-Bp4(以下簡稱Bp4)是一種烈性大腸埃希菌噬菌體,為短尾噬菌體科N4類噬菌體,分離自雞場,具有寬宿主譜。噬菌體Bp4感染宿主菌的潛伏期為13 min,暴發(fā)量為32,寬噬率為33.3%[5],在預(yù)防和治療大腸埃希菌感染方面具有開發(fā)前景。由于密碼子使用偏性與噬菌體增殖效率及噬菌體蛋白的基因表達(dá)關(guān)系密切,而關(guān)于N4類噬菌體密碼子偏性的報(bào)道很少,本文選擇與噬菌體Bp4同源性較高并同時(shí)為腸桿菌科的5株噬菌體,分別對(duì)Bp4尾部蛋白基因進(jìn)行密碼子偏性分析,以了解尾部蛋白基因的密碼子使用特點(diǎn),為進(jìn)一步開發(fā)利用噬菌體奠定基礎(chǔ)。
1.1材料
多價(jià)噬菌體Bp4(GenBank:KJ135004.2)由青島農(nóng)業(yè)大學(xué)獸醫(yī)微生物實(shí)驗(yàn)室分離并保存,Bp4的3個(gè)尾部蛋白分別是可預(yù)測尾部蛋白gp10(putative tail protein,237codons)、尾絲蛋白gp11(tail fiber protein,601 codons)和尾刺蛋白gp13(tail spike protein,705 codons)。與3個(gè)尾部蛋白基因有同源性的N4類腸桿菌科噬菌體分別是ECBP1(GenBank:JX415535.1)、EC1-UPM(GenBank:KC206276.2)、pSb-1(GenBank:KF620435.1)、PhAPEC5(GenBank:KF192075.1)及vB-Ecop-G7C(GenBank:HQ259105.1)。各個(gè)噬菌體尾部蛋白的基因序列均從NCBI下載獲得。
ECBP1(GenBank:JX415535.1)、EC1-UPM(GenBank:KC206276.2)、pSb-1(GenBank:KF620435.1)、PhAPEC5(GenBank:KF192075.1)、vB-Ecop-G7C(GenBank:HQ259105.1)
1.2方法
利用Mobyle中的Codonw 1.4.4及Cusp程序計(jì)算密碼子偏性的各種指標(biāo)進(jìn)行分析,包括相對(duì)同義密碼子相對(duì)使用頻率(RSCU)、密碼子使用頻率(Fraction)及高頻密碼子(HFC)、密碼子適應(yīng)指數(shù) (CAI)、密碼子偏愛指數(shù)(CBI)、有效密碼子數(shù)(ENC)[6-7]。分別對(duì)6個(gè)噬菌體各個(gè)尾部蛋白基因序列中的總GC含量、密碼子第1、2位GC含量平均值和第3位的GC含量進(jìn)行分析,分別以GC、GC12和GC3表示,對(duì)分析的數(shù)據(jù)運(yùn)用Excel進(jìn)行做圖分析。
利用MegAlign軟件對(duì)6株噬菌體各個(gè)尾部蛋白基因進(jìn)行氨基酸序列分析,構(gòu)建系統(tǒng)發(fā)育樹。運(yùn)用SPSS軟件對(duì)密碼子偏性進(jìn)行聚類分析[8],對(duì)2個(gè)結(jié)果進(jìn)行比較。
2.1噬菌體Bp4與其同源性噬菌體尾部蛋白基因密碼子偏好性指標(biāo)確定
2.1.1RSCU值分析RSCU值是指氨基酸的某一密碼子的使用頻次與其在同義密碼子家族中的期望頻次的比值。當(dāng)RSCU>1時(shí),該密碼子使用頻率高;RSCU<1時(shí),則密碼子使用頻率低[9]。通過計(jì)算RSCU值,分別分析噬菌體Bp4的3個(gè)尾部蛋白與其余5株噬菌體的尾部蛋白基因的密碼子用法(圖1)。gp10基因的密碼子使用情況和其他5株噬菌體尾部蛋白使用情況基本一致(圖1),且所偏愛的密碼子基本相同,其偏愛的共同密碼子有CUU、AUU、AUG、CUU、UCA、AGU、CCU、ACU、GCU、GCA、UAU、CAU、AAU、GAU、GAA、UGU、UGG、CGU、CGA及GGU。gp10中有35個(gè)密碼子RSCU值大于1,多以A和U結(jié)尾,而整個(gè)基因中以C和G結(jié)尾的密碼子使用顯著偏低。除噬菌體pSb-1的尾部蛋白基因以UGA或UAG為終止密碼子外,gp10和其他4株噬菌體尾部蛋白基因都以UGA作為終止密碼子。
gp11基因的密碼子使用與其他5株噬菌體尾部蛋白基因類似(圖2),gp11中有28個(gè)密碼子RSCU值大于1,多以U結(jié)尾,而以C結(jié)尾的密碼子顯著偏低。gp11基因密碼子偏性與vB-Ecop-G7C最相近,都以UGA為終止密碼子。而PhAPEC5、EC1-UPM及ECBP1尾部蛋白基因終止密碼子都是UAA,pSb-1則以UAG或UGA為終止密碼子。
gp13基因的偏愛密碼子與其他5株噬菌體尾部蛋白基本相同(圖3),gp13中有30個(gè)密碼子RSCU值大于1,多以A和U結(jié)尾,而以C和G結(jié)尾的密碼子較低。除了噬菌體pSb-1尾部蛋白基因以UAG為終止密碼子外,gp13與其他4株噬菌體尾部蛋白基因都以UAA為終止密碼子。
3個(gè)尾部蛋白基因RSCU值都大于1的共同密碼子有UUA、AUU、AUG、GUU、GUA、UCA、CCU、CCA、ACU、GCU、GCA、CAU、AAU、GAU、GAA、UGG、CGU及GGU;而3個(gè)尾部蛋白基因的終止密碼子是不同的,分別是UGA、UAG、UAA。
2.1.2密碼子使用頻率分析通過密碼子使用頻率(Fraction)反映密碼子使用的高頻與低頻。根據(jù)得到的Fraction值,利用高頻密碼子分析法進(jìn)行分析。通過密碼子使用頻率分析發(fā)現(xiàn),除AUG(M)和UGG(W)外,gp10基因確定了14種高頻密碼子:GCA、GCU、UGU、GAA、UUC、GGU、AUU、CUU、AAU、CCU、CGA、CGU、AGU及ACU。此外,GCC、GCG、GGC、AUA、CUC、CCC、CCG、AGG、CGC、CGG、UCU、ACG及GUC使用頻率極低,其中GCC、GCG、CUC、CCC、AGG及UCU更是未被使用(圖1)。將gp10基因與其他5株噬菌體比較,GAU(D)使用頻率明顯低于其他5株噬菌體,UUC(F)使用頻率明顯高于ECBP1和EC1-UPM,與pSb-1、PhAPEC5和vB-Ecop-G7C一致。
圖1 6株噬菌體gp10基因密碼子使用模式分析
圖2 6株噬菌體gp11基因密碼子使用模式分析
圖3 6株噬菌體gp13基因密碼子使用模式分析
gp11基因確定了17種高頻密碼子:GCU、UGC、GAA、UUU、GGU、AUU、AAA、CUG、CUU、AAU、CCU、CAG、CGU、UCA、UCU、ACU及GUA。此外,GCC、GCG、GGA、GGC、CUA、CUC、AGA、AGG、CGA、CGC、CGG、AGC、UCG、ACG及GUC使用頻率極低,其中AGG未被使用(圖2)。將Bp4尾絲蛋白基因與其他5株噬菌體相比,AGA(R)使用頻率明顯低于其他5株噬菌體,而CUG(L)和UCA(S)使用頻率明顯高于其他。
gp13基因確定了16種高頻密碼子:GCU、UGC、GAU、GAA、UUU、GGU、CAU、AUU、UUA、UUG、AAU、CGU、AGU、UCU、ACU及GUA。此外,GCG、GAC、CUA、CUC、CCG、AGG、CGG、AGC、UCC、UCG、GUC及GUG使用頻率極低,其中AGG和CGG未被使用(圖3)。將gp13基因與其他5株噬菌體比較,CUA(L)與PhAPEC5基本一致,但明顯低于其他4株噬菌體。而UUG(L)明顯高于其他。
2.2噬菌體Bp4與其同源性噬菌體尾部蛋白基因密碼子頻率比較
分別對(duì)Bp4、ECBP1、EC1-UPM、pSb-1、PhAPEC5及vB-Ecop-G7C的尾部蛋白基因密碼子的Frequency(1/1 000)值進(jìn)行統(tǒng)計(jì)并進(jìn)行比較(圖4~圖6)。Bp4尾部蛋白基因的密碼子頻率與其他5株噬菌體的比值在0.5~2.0,說明密碼子偏好性相近,若比值大于2.0或小于0.5,說明密碼子偏好性較遠(yuǎn)。結(jié)果顯示gp10基因大部分密碼子使用偏好性與其他5株噬菌體相近(圖4),gp10與ECBP1、EC1-UPM、PhAPEC5及vB-Ecop-G7C的比值小于0.5或大于2.0的密碼子數(shù)都有3種,而與pSb-1、相比有18種(CUU、CUC、CUA等),這表明gp10基因密碼子使用和pSb-1偏好性較遠(yuǎn),而與其他4株噬菌體偏好性相近。
在gp11基因中(圖5),gp11與PhAPEC5的比值小于0.5或大于2.0的密碼子數(shù)有6種,分別是CUC、AUA、UCA、CCC、AGA及GGG,與EC1-UPM、pSb-1、PhAPEC5和vB-Ecop-G7C相比分別有12種(UUC、AGU、CCC等)、9種(UUC、GUC、ACG等)、10種(CUU、AUA、AGC等)和12種(UUU、UUC、CUC等), 這表明gp10基因密碼子使用和PhAPEC5相對(duì)較近,與其他的4株相對(duì)較遠(yuǎn)。
gp13與ECBP1、EC1-UPM、PhAPEC5、pSb-1及vB-Ecop-G7C的比值小于0.5或大于2.0的密碼子分別有1種(CCC)、2種(UCG、AGG)、9種(GUG、CCG、ACC等)、15種(UUU、CUU、CUA等)、14種(UUG、AUU、CCG等)(圖6),表明gp13密碼子使用和ECBP1、EC1-UPM最相近, 與PhAPEC5、pSb-1及vB-Ecop-G7C相對(duì)較遠(yuǎn)。
2.3CAI、CBI、ENC、GC3s、GC、GC12計(jì)算及相關(guān)性分析
利用Codonw 1.4.4軟件分析6株噬菌體3個(gè)尾部蛋白基因的CAI、CBI、ENC、GC3s及GC數(shù)值(表1)。由表1可見,gp10基因的CAI(0.187~0.259)、CBI(0.007~0.112),gp11基因的CAI(0.249~0.327)、CBI(0.016~0.133),gp13基因的CAI(0.245~0.351)、CBI(0.013~0.168)均偏小,Bp4和其他5株噬菌體3個(gè)尾部蛋白基因的ENC值均較高(均大于42),說明Bp4尾部蛋白基因密碼子的偏好性較低。軟件分析Bp4的3個(gè)尾部蛋白基因的第3位堿基中G+C含量均明顯低于基因中的G+C含量,gp10、gp11、gp13第3位堿基中G+C含量(0.320、0.319、0.301)均小于基因中G+C含量(0.424、0.433、0.420),表明Bp4與其他5株噬菌體尾部蛋白基因在密碼子的使用特性上并不存在顯著的偏好性。
圖4 噬菌體Bp4 gp10基因密碼子頻率比較
圖5 噬菌體Bp4 gp11基因密碼子頻率比較
圖6 噬菌體Bp4 gp13基因密碼子頻率比較
蛋白Protein毒株StrainCAICBIENCGC3sGCGC12Bp4-gp100.2550.02253.230.3200.4240.464ECBP10.248-0.00753.280.3110.4220.466gp10EC1-UPM0.243-0.02947.820.2850.4150.468pSb-10.187-0.11251.160.3370.4120.448PhAPEC50.2590.02252.670.3510.4380.470vB-Ecop-G7C0.2520.01453.780.3380.4320.468Bp4-gp110.3050.10944.980.3190.4330.482PhAPEC50.3270.13342.140.3020.4200.467gp11EC1-UPM0.2940.09752.190.3460.4430.483vB-Ecop-G7C0.3050.13352.220.4010.4600.479pSb-10.2960.07746.040.2920.4220.475ECBP10.2490.01647.890.3200.3960.426Bp4-gp130.2450.04549.390.3010.4200.470ECBP10.2560.01949.320.3100.4230.472gp13EC1-UPM0.2620.01348.530.3020.4220.474PhAPEC50.2550.02551.580.3570.4310.462pSb-10.2560.09744.670.2140.4090.496vB-Ecop-G7C0.3510.16843.460.3130.4350.479
注:CAI:密碼子適應(yīng)指數(shù);CBI:密碼子偏愛指數(shù);ENC:有效密碼子數(shù);GC3s為密碼子第3位上G+C含量;GC:尾部基因中的G+C含量;GC12:密碼子第一、二位上G+C含量。
Note:CAI,Codon adaptation index; CBI,Codon preference index; ENC,Effective number of codon; GC3s,G+C content in third position of codon; GC,tail protein gene G+C content; GC12,G+C content in first and second position of codon.
圖7A和圖7B分別為gp10基因中性繪圖分析(GC12-GC3s)、ENC-GC3s相關(guān)分析。由圖7A可知GC12和GC3s的變化范圍均很小,回歸系數(shù)為負(fù)值,表明GC12和GC3s的變異模式不同。由圖7B可見6株噬菌體均靠近于趨勢線,噬菌體尾部蛋白基因密碼子的偏性可能受突變的影響較大。
圖8A和圖8B分別為gp11基因中性繪圖分析(GC12-GC3s)、ENC-GC3s相關(guān)分析。由圖8A可知除ECBP1外, gp11與其他4株噬菌體較為相近。由圖8B可見6株噬菌體也均靠近于趨勢線,說明噬菌體尾部蛋白基因密碼子的偏性可能受突變和堿基組成的影響。
圖9A和圖9B分別為gp13基因中性繪圖分析(GC12-GC3s)、ENC-GC3s相關(guān)分析。由圖9A可知Bp4、ECBP1、EC1-UPM、vB-Ecop-G7C 4株噬菌體相近,與pSb-1和PhAPEC5有少許差異。由圖9B可見GC3s與ENC相關(guān)性較好,除了PhAPEC5在趨勢線的下方,但仍靠近于趨勢線,說明其基因密碼子的偏好可能受堿基組成的影響。
圖7 gp10基因密碼子GC3s、GC12及ENC相關(guān)性分析
圖8 gp11基因密碼子GC3s、GC12及ENC相關(guān)性分析
圖9 gp13基因密碼子GC3s、GC12及ENC相關(guān)性分析
2.46株噬菌體尾部蛋白基因進(jìn)化樹的構(gòu)建及其密碼子聚類分析
利用MegAlign對(duì)6株噬菌體3個(gè)尾部蛋白全基因核苷酸序列分析,構(gòu)建系統(tǒng)發(fā)生樹(圖10)。分別對(duì)6株噬菌體尾部蛋白基因根據(jù)RSCU值進(jìn)行聚類分析(圖11)
A.gp10基因核苷酸序列系統(tǒng)進(jìn)化樹;B.gp11基因核苷酸序列系統(tǒng)進(jìn)化樹;C.gp13基因核苷酸序列系統(tǒng)進(jìn)化樹
A.gp10與其他5株噬菌體基因密碼子聚類分析;B.gp11與其他5株噬菌體基因密碼子聚類分析;C.gp13與其他5株噬菌體基因密碼子聚類分析A.Cluster analysis of gp10 codons of six phages;B.Cluster analysis of gp11 codons of six phages;C.Cluster analysis of gp13 codons of six phages
圖116株噬菌體尾部蛋白基因密碼子聚類分析
Fig.11Cluster analysis of tail protein gene codons of six phages
噬菌體根據(jù)外殼結(jié)構(gòu),可分為無尾部結(jié)構(gòu)的二十面體、有尾部結(jié)構(gòu)的二十面體及絲狀噬菌體。不同形態(tài)噬菌體之間親緣關(guān)系相距較遠(yuǎn)。有尾噬菌體通過其尾部結(jié)構(gòu)吸附到宿主細(xì)胞表面,進(jìn)一步介導(dǎo)噬菌體基因組的注入及噬菌體的增殖,最終導(dǎo)致細(xì)菌細(xì)胞裂解。N4類噬菌體的尾鞘蛋白gp65通過與宿主菌的外膜蛋白發(fā)生直接相互作用,是噬菌體N4吸附到宿主細(xì)胞表面所必需的蛋白[10],但該蛋白在噬菌體Bp4中不存在,表明噬菌體Bp4雖然為N4類噬菌體,但其感染過程中的吸附機(jī)制明顯不同于N4類噬菌體。所以對(duì)Bp4的3個(gè)尾部蛋白基因進(jìn)行密碼子偏性分析,為更好地研究噬菌體Bp4與宿主菌之間的相互關(guān)系奠定了基礎(chǔ)。
密碼子使用的相對(duì)概率(relative synonymous codon usage,RSCU)能比較直觀地反映密碼子使用的偏好性。密碼子偏性可以揭示相關(guān)物種之間或同一物種基因家族間的進(jìn)化規(guī)律,密碼子的偏性主要體現(xiàn)在第3位堿基上,Bp4尾部蛋白基因第3位堿基上的GC含量不超過40%,含量較低,說明噬菌體Bp4尾部蛋白基因偏愛以A或U結(jié)尾的密碼子,而使用以C或G結(jié)尾的密碼子相對(duì)較少,這與噬菌體Bp4尾部蛋白基因相對(duì)較低的GC含量基本一致,這與王世峰等[11]對(duì)痘苗病毒基因組密碼使用頻率的分析結(jié)果相類似。Levin D B等[12]對(duì)NPVs基因密碼子偏性研究認(rèn)為病毒之間密碼子的偏好性非常保守,與系統(tǒng)發(fā)生的關(guān)系也很接近,編碼基因的GC含量直接由密碼子使用的種類來體現(xiàn)。這一論斷符合Grantham R等提出的基因組假說,即密碼子應(yīng)用的偏好性具有物種特異性。噬菌體Bp4的3個(gè)尾部蛋白基因的高頻密碼子比較多,而密碼子AGG等未被使用,可能是因?yàn)檫@些密碼子與宿主細(xì)胞中豐富的tRNA有關(guān)或與tRNA存在某種不利于翻譯的關(guān)系,所以噬菌體盡量避免使用這些密碼子。
無論是真核生物還是原核生物,其基因編碼序列中的密碼子用法在分子進(jìn)化過程中是一種重要的進(jìn)化現(xiàn)象。對(duì)于密碼子使用偏好性的產(chǎn)生,Kimura M[13]的中性理論和Sueoka N[14-15]的選擇學(xué)說是兩種主要的理論模型。同一密碼子的使用頻率的影響因素有許多,例如GC的含量及施加于基因序列上的突變的壓力[16]。評(píng)價(jià)密碼子偏性的指標(biāo)包括許多種,本文利用了CAI、CBI、ENC、GC3s和GC含量反映密碼子的偏好性,由結(jié)果可看出,這些指標(biāo)的變化范圍都比較小,CAI和CBI可以直接反映密碼子的偏性情況,也與外源基因的表達(dá)水平有一定的相關(guān)性。ENC值可以反映密碼子家族中同義密碼子使用不均的偏好程度,ENC值越大,其偏性越低,對(duì)應(yīng)的內(nèi)源基因表達(dá)量越低[17-18]。從6株噬菌體尾部蛋白基因的ENC值可看出,Bp4的3個(gè)尾部蛋白基因的ENC值大小居于中等位置,可以推斷出其內(nèi)源基因的表達(dá)較正常。
利用6株噬菌體的3個(gè)尾部蛋白基因的進(jìn)化樹分析,其同源性結(jié)果基本一致,說明親緣關(guān)系較近的噬菌體常表現(xiàn)出相似的密碼子使用頻率[19]。gp10基因與ECBP1的同源性最近, gp13基因與EC1-UPM最近,說明不同噬菌體編碼蛋白的基因親緣關(guān)系越近,密碼子的偏好性越小,反之則越大。密碼子使用頻率的聚類樹狀圖常可用于推測不同物種、不同基因以及物種和基因之間在密碼子使用方面的相似度或親緣性,也可推測不同物種之間的進(jìn)化關(guān)系。由聚類結(jié)果(圖11)可看出,gp11基因單獨(dú)聚成一類,這可能與兩者分析的對(duì)象及所用的算法不同有關(guān),原因也有待于進(jìn)一步研究。
噬菌體一方面能夠殺死宿主菌,另一方面還需要依賴宿主菌來增殖。對(duì)于病毒而言,由于它的蛋白質(zhì)合成過程依賴宿主,宿主tRNA豐富的變化在理論上會(huì)影響著病毒的有效感染和復(fù)制,對(duì)病毒密碼子的偏性起著決定性的作用。目前對(duì)噬菌體與其宿主菌之間密碼子的相關(guān)性研究報(bào)道不多,江月[19]在桿狀病毒的分子進(jìn)化及密碼子偏性研究中,在總G+C%上,桿狀病毒(BmNPV)為41%,其昆蟲宿主(家蠶)為48.3%,這個(gè)結(jié)果顯示桿狀病毒與其宿主昆蟲在密碼子使用上,在總編碼序列的水平存在著對(duì)應(yīng)性。我們從Codon Usage Bias Database(CUBDB)數(shù)據(jù)庫中查到大腸埃希菌基因的G+C%含量都在50%左右,而本文分析的Bp4的3個(gè)尾部蛋白基因密碼子的G+C%含量都在42%~44%之間,說明噬菌體Bp4與其宿主菌在密碼子使用上也存在著對(duì)應(yīng)性,這一結(jié)果與江月的研究結(jié)果相似,這也可能對(duì)以后研究噬菌體與宿主菌之間的進(jìn)化關(guān)系提供依據(jù)。
本文分別比較了噬菌體Bp4的3個(gè)尾部蛋白基因與其他5株噬菌體尾部蛋白基因的密碼子偏好性,噬菌體Bp4尾部蛋白基因與其他5株噬菌體尾部蛋白基因密碼子使用模式基本一致,除了AUG(M)和UGG(W)外,Bp4的3個(gè)尾部蛋白gp10、gp11、gp13分別確定了14、17、16種高頻密碼子,6株噬菌體尾部蛋白基因密碼子偏性比較和聚類分析發(fā)現(xiàn),Bp4可預(yù)測蛋白gp10與ECBP1最相近,尾絲蛋白gp11與EC1-UPM、PhAPEC5較相近,而尾刺蛋白gp13與ECBP1、EC1-UPM最相近。通過對(duì)尾部蛋白基因密碼子偏好性的分析,我們能更好了解噬菌體Bp4尾部蛋白基因密碼子的使用與噬菌體增殖效率及噬菌體蛋白的基因表達(dá)等方面的關(guān)系,為開發(fā)利用該噬菌體奠定了基礎(chǔ)。
參考文獻(xiàn):
[1]吳憲明,吳松鋒,任大明,等.密碼子偏性的分析方法及相關(guān)研究進(jìn)展[J].遺傳,2007(4):420-426.
[2]尚明照,劉方,華金平, 等.陸地棉葉綠體基因組密碼子使用偏性的分析 [J].中國農(nóng)業(yè)科學(xué),2011,44(2):245-253.
[3]武志娟,鐘金城.密碼子偏性及其應(yīng)用[J].生物學(xué)通報(bào),2012(4):9-11.
[4]黃賽花,袁瑗,王成坤,等.大豆花葉病毒CP基因密碼子使用偏性分析[J].中國油料作物學(xué)報(bào),2015,37(2):148-153.
[5]馬艷香.多價(jià)噬菌體Bp4生物學(xué)特性及全基因組測序分析[D].山東青島:青島農(nóng)業(yè)大學(xué),2014
[6]Fualsang A.The ‘effective number of codons’ revisited [J].Biochem Biophys Res Commun,2004,317(3):957-964.
[7]Grantham R,Gautier C,Gouy M,et al.Codon catalog usage and the genome hypothesis[J].Nucl Acids Res,1980,8(1):49-62.
[8]Weinstein J N,Myers T G,Oconnor P M,et al.An information-intensive approach to the molecular pharmacology of cancer [J].Science,1997,275(5298):343-349.
[9]唐曉芬,陳莉,馬玉韜.密碼子使用偏性量化方法研究綜述[J].基因組學(xué)與應(yīng)用生物學(xué),2013(5):660-666.
[10]McPartland J,Rothman-Denes L B.The tail sheath of bacteriophage N4 interacts with theEscherichiacolireceptor.[J].Bacteriology,2009,191(2):525-532.
[11]王世峰,許洪林,陸柔劍,等.痘苗病毒基因組密碼子使用頻率分析[J].病毒學(xué)報(bào),2002,18(3):227-234.
[12]Levin D B,Whittome B.Codon usage in nucleopolyhedroviruses[J].J Gen Virol,2000,81(9):2313-2325.
[13]Kimura M.The neutral theory of molecular evolution[J].Sci Am,1979,241(5):98-100,102,108.
[14]Sueoka N.On the genetic basis of variation and heterogeneity of DNA base composition [J].Proc Natl Acad Sci USA,1962,48:582-592
[15]Sueoka N.Directional mutation pressure and neutral molecular evolution [J].Proc Natl Acad Sci USA,1988,85(8):2653-2657.
[16]趙興華.微生物基因組序列分析及相關(guān)網(wǎng)絡(luò)資源的整合[D].天津:河北工業(yè)大學(xué),2012
[17]吳正常,王靖,趙喬輝,等.豬脂多糖結(jié)合蛋白基因(LBP)的密碼子偏好性分析[J].農(nóng)業(yè)生物技術(shù)學(xué)報(bào),2013,21(10):1135-1144
[18]Sahoo S,Das S.Analyzing gene expression and codon usage bias in diverse genomes using variety of models [J].Current Bioinformatics,2014,9(2):102-112.
[19]江月.桿狀病毒的分子進(jìn)化及密碼子偏性研究[D].北京:中國科學(xué)院研究生院,2007.
收稿日期:2016-02-24
基金項(xiàng)目:山東省自然科學(xué)基金項(xiàng)目(ZR2015CM020,ZR2013CQ024)
作者簡介:孫蓉蓉(1991-),女,山東威海人,碩士研究生,主要從事獸醫(yī)微生物學(xué)與免疫學(xué)研究。*通訊作者
中圖分類號(hào):S855.3
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1007-5038(2016)07-0021-09
Analysis of Codon Bias on Tail Protein Genes of Phage vB-EcoP-Bp4
SUN Rong-rong,SUN Hu-zhi,ZHANG Can,REN Hui-ying
(CollegeofAnimalScienceandTechnology,QingdaoAgriculturalUniversity,Qingdao,Shandong,266109,China)
Abstract:To understand the characteristics of codon usage in tail protein genes of phage vB-EcoP-Bp4 (i.e.Bp4).Genes gp10,gp11 and gp13 were analyzed for the codon usages among N4-like phage Bp4 and other five phages by bioinformatics softwares.The results showed that the patterns of codon usage in tail protein genes of phage Bp4 were substantially consistent with other 5 phages,A or U- ended codons were prefered.In the genes gp10,gp11 and gp13 of phage Bp4,14,17,and 16 kinds of high-frequency codons were identified respectively except AUG(M) and UGG(W).The bias comparison and cluster analysis on tail protein genes among phage Bp4 and other 5 phages demonstrated that putative tail protein gene gp10 of Bp4 was most similar to ECBP1,tail fiber protein gene gp11 was most similar to EC1-UPM and PhAPEC5,while tail spike protein gp13 was most similar to ECBP1 and EC1-UPM.The codon usages of tail proteins were substantially consistent with the levels of homology,and the results will provide further guidance for the study of phage Bp4.
Key words:phage;tail protein;codon bias