郎大田,劉松菊,郎啟雄
(1.昭通學(xué)院 農(nóng)學(xué)與生命科學(xué)學(xué)院,云南 昭通 657000;2.昭通學(xué)院 醫(yī)務(wù)室,云南 昭通 657000)
分子進化研究一直是科學(xué)界的焦點問題之一[1-2].生物形態(tài)結(jié)構(gòu)和生理機能與其賴以生存的環(huán)境緊密相關(guān),自身基因改變?yōu)檫M化提供了原始材料[3].隨著基因測序技術(shù)迅速發(fā)展,一個個物種基因組相繼公布,為利用更多物種基因組探究生物的分子進化成為可能[4-8].
核糖核酸酶基因超家族(Ribonuclease A,簡稱RNASE A)僅存在于脊椎動物,是生物學(xué)者研究分子進化的最佳模型之一[9-13],因基因復(fù)制和功能分化在該基因超家族頻繁發(fā)生.截至目前,哺乳動物多數(shù)物種的RNASE A擁有15個成員(RNase1—15),RNase1—8具有核糖核酸酶基因超家族的典型特征(6~8個結(jié)構(gòu)半胱氨酸、催化活性氨基酸殘基和功能區(qū)“CKXXNTF”)并擁有不同的生理功能,如消化[14-17]、血管生成[18-19]、抗菌、抗病毒[20]及宿主防御[21-23]等.而在RNASE A的非典型成員RNase9—15中,RNase9—10在睪丸中檢測到表達,其功能與雄性生殖有關(guān);RNase13—15因丟失該基因超家族的催化活性氨基酸或者功能區(qū)而喪失了核糖核酸酶的活性[10].
基于基因組水平開展RNASE A研究,Cho等[9-10]以7個物種(人、小鼠、大鼠、雞、狗、牛和負鼠)為研究對象,發(fā)現(xiàn)該基因超家族起源于RNase5并在胎盤類和有袋動物分歧之前發(fā)生擴張.2012年,Wheeler等[11]對牛的RNASE A成員做了基因表達分析,在多個組織中檢測到該基因超家族成員的表達.隨后, Goo等[12]基于20個哺乳動物基因組,發(fā)現(xiàn)該基因超家族中的成員在一些物種發(fā)生多次基因復(fù)制.
作為始新世早期發(fā)現(xiàn)并現(xiàn)存的哺乳動物(奇蹄目、偶蹄目和靈長目)[24-25],偶蹄目和靈長目RNASE A的研究已有許多報道[14,16,26-27],但在奇蹄目(包含進化最成功的家養(yǎng)動物家馬和全球重要的牲畜驢)中[28-30], RNASE A的分子進化研究還未有深入系統(tǒng)的報道,急需開展奇蹄目RNASE A的分子進化研究,為更深入認識RNASE A奠定堅實基礎(chǔ).因此,筆者通過分析NCBI(http://www.ncbi.nlm.nih.gov/)上已公布的4個奇蹄目物種基因組,鑒定RNASE A成員、拷貝數(shù)、氨基酸結(jié)構(gòu)及系統(tǒng)發(fā)育樹等,探討奇蹄目中RNASE A的分子進化.
NCBI(http://www.ncbi.nlm.nih.gov/)上已公布的奇蹄目2科4個物種基因組:家馬(Equuscaballus)、白犀牛(Ceratotheriumsimum)、驢(Equusasinus)和野馬(Equusprzewalskii),包含了Goo等研究中的家馬[12,28,30].
1.2.1 鑒定RNASE A成員
在NCBI上下載白犀牛、驢和野馬的基因組數(shù)據(jù),并對其解壓.以2013年Goo等[12]研究家馬RNASE A成員基因的核酸和氨基酸作為查詢序列,利用過去對RNASE A研究常用的本地blastn與tblastn方法對每個基因組進行分析,E值為10-10[9-10,12].對blastn和tblastn分析的結(jié)果以Scaffold進行分類排序,根據(jù)查詢序列比對在Scaffold上的序列長度和序列相似度對其進行取舍,鑒定出每個物種RNASE A成員的基因序列.
1.2.2 翻譯比對氨基酸序列
利用MEGA7軟件翻譯出RNASE A功能基因的氨基酸序列, Clustal X軟件對氨基酸序列比對并人工矯正,在其序列上標(biāo)注出該超基因家族序列典型特征及變異位點[31-32].
1.2.3 預(yù)測等電點
基于在線預(yù)測的等電點網(wǎng)站http://web.expasy.org/compute_pi,對RNASE A中功能基因的氨基酸序列進行等電點計算[33-34].
1.2.4 構(gòu)建系統(tǒng)發(fā)育樹
若RNASE A開放閱讀框中存在非三聯(lián)體的插入、缺失或者堿基突變致使終止密碼子提前,則該基因為假基因,反之為功能基因[20].使用Clustal X軟件比對RNASE A功能基因和假基因,MEGA7軟件構(gòu)建鄰接樹(neighbor-joining,簡稱NJ).構(gòu)建NJ時,選用Kimura雙參數(shù)模型為核苷酸替代模型,對于缺失性狀(Gap)采用成對刪除(pairwise deletion),并進行2 000次自展重抽樣分析[31-32].
對奇蹄目的4個物種基因組質(zhì)量進行統(tǒng)計,如測序平臺、基因組覆蓋度及基因組的ContigN50、Scaffold N50.基于第一代測序技術(shù)的家馬的基因組覆蓋度是6.8x,另外以高通量、低成本的二代測序的3個物種基因組覆蓋度分別是42.4x、85.63x和91x,揭示研究的4個物種基因組覆蓋度均滿足過去基于基因組研究覆蓋度不低于6x的要求[12].組裝的ContigN50、Scaffold N50分別是9 906~112 381 bp和513 800~46 749 900 bp,揭示該研究的4個物種的基因組覆蓋度高、組裝質(zhì)量好,為進一步分析RNASE A奠定了堅實基礎(chǔ).
鑒定出的4個奇蹄目物種RNASE A(RNase1—15)序列共58條,包含2013年Goo等[12]對家馬研究的12條和該研究對白犀牛、驢和野馬分析新獲得的46條(見表1).這58條序列由43條功能基因和15條假基因(開放閱讀框中存在非三聯(lián)體的插入或者缺失,翻譯提前終止)組成,其假基因主要是RNase2/3(4條)、RNase4(2條)、RNase7/8(2條)、RNase14/15(7條).RNASE A序列長度416~642 bp,比對后是861 bp;功能基因的長度是435~642 bp,比對后是729 bp,包括完整的信號肽(1~207 bp)及成熟肽(208~729 bp),翻譯后是242個氨基酸.圖1是奇蹄目RNASE A氨基酸序列,從圖1可以看出,典型的RNASE A序列特征(6~8個結(jié)構(gòu)半胱氨酸、催化活性氨基酸殘基和功能區(qū)“CKXXNTF”)在該基因超家族典型成員(RNase1—8)中非常保守,第4、第5結(jié)構(gòu)半胱氨酸(C)在RNase5中被蘇氨酸(T)、脯氨酸(P)或者異亮氨酸(I)替代,使RNase5與RNASE A的其他典型成員相比,僅有6個結(jié)構(gòu)半胱氨酸形成二硫鍵維持蛋白的結(jié)構(gòu)穩(wěn)定.與RNASE A典型成員(RNase1—8)相比,RNase9—13的氨基酸序列插入缺失及變異位點多,典型的RNASE A序列特征也非常不保守.維持結(jié)構(gòu)穩(wěn)定的4個半胱氨酸(C)在RNase11中變?yōu)楦彼?P)、甘氨酸(G)、酪氨酸(Y)和亮氨酸(L);與RNASE A活性相關(guān)的組氨酸(H)僅在RNase9中保守,而在其他幾個成員(RNase10—13)中被賴氨酸(K)、谷氨酰胺(Q)、天冬酰胺(N)、甘氨酸(G)或亮氨酸(L)替代,未發(fā)生定向改變;功能區(qū)“CKXXNTF”中具有催化活性的賴氨酸(K)、結(jié)構(gòu)相關(guān)的苯丙氨酸(F)及活性相關(guān)位點(T)也發(fā)生明顯改變(圖1和表2).
表1 奇蹄目中核糖核酸酶基因超家族的每個成員基因數(shù)
注:“R” 表示的是“RNase”,未帶括號和括號內(nèi)數(shù)字分別表示真基因數(shù)和假基因數(shù).
倒三角形:結(jié)構(gòu)半光氨酸;箭頭:催化活性氨基酸;長方形:功能區(qū)“CKXXNTF”.圖1 奇蹄目RNASE A氨基酸序列
基因名稱物種H12CK 41 XXNTFVPVH 119結(jié)構(gòu)半胱氨酸數(shù)目RNase9家馬QCKKEHFFIPDH8白犀牛QCKKEHFFIPDH8驢QCKKEHFFIPDH8野馬QCKKEHFFIPDH8RNase10家馬HCIPEYTFMKVK8白犀牛HCITQYTFMKLQ8驢HCIPEYTFMKVK8野馬HCIPEYTFMKVK8RNase11家馬HCKFSNNFMSWL5白犀牛HCKLSNNFMSWL5驢HCKFSNNFMSWL5野馬HCKFSNNFMSWL5RNase12家馬HCRKEHVFGPVN8白犀牛HCKNEHVFGPVN8驢HCRKEHIFGPVN8野馬HCRKEHVFGPVN8RNase13白犀牛HCPKIHYVEPIG8驢HCPKTHYVEPIG8野馬HCPKTHYVEPIG8
RNASE A等電點(pI)的高低與是否存在核糖核酸酶活性有密切聯(lián)系,正電荷多等電點高的成員,其功能與宿主防御相關(guān),而負電荷多、等電點低的成員可能丟失RNASE A原有的抗菌活性而獲得其他新功能[17,20,35].表3為奇蹄目RNASE等電點.從表3可以看出,各物種基因的等電點是5.48(Css_RNase12)~9.71(Ec_RNase5), 各成員平均等電點值是5.82(RNase9)~9.62(RNase5),典型成員(RNase1—8)等電點總體比非典型成員(RNase9—13)的高.在RNASE A中,等電點最高的是RNase5(9.62),顯著高于其他成員,揭示該成員功能主要與抗菌有關(guān);而與雄性生殖相關(guān)的RNase9和RNase10,等電點最低,分別是5.82和5.99,明顯低于其他成員的等電點.
表3 奇蹄目RNASE A等電點
續(xù)表3
圖2為基于奇蹄目RNASE A構(gòu)建的NJ樹.從圖2可以看出,奇蹄目RNASE A成員以簇聚集并具有較高的支持率,值得注意的是:RNase14與RNase15形成姐妹群,而RNase6與RNase7/8形成姐妹群后與RNase2/3聚在一起,這一結(jié)果揭示RNase14和RNase15是RNASE A進化中發(fā)生一次基因復(fù)制而產(chǎn)生的2個不同拷貝,而RNase2/3、RNase6和RNase7/8則是發(fā)生2次復(fù)制產(chǎn)生的3個拷貝.有趣的是,RNASE A成員的13個簇中,有3個簇(RNase2/3、RNase4和RNase7/8)經(jīng)歷了“生(基因復(fù)制)與滅(假基因化)”進化進程.RNase4中,家馬和白犀牛各有1個拷貝,而在驢和野馬中均檢測到2個拷貝(1個功能基因和1個假基因),真假基因分成2簇且支持率均高于0.9,這一結(jié)果揭示該基因在該研究物種分歧之前發(fā)生了1次基因復(fù)制產(chǎn)生2個拷貝,其中1個拷貝保留基因功能,而另外1個拷貝發(fā)生了假基因化.關(guān)于RNase2/3,家馬和白犀牛中僅有1個拷貝,而在驢和野馬中分別檢測到2個拷貝(1個功能基因和1個假基因)和3個假基因,且真假基因混合聚集,揭示該基因在該研究物種分歧之前可能發(fā)生了1~2次基因復(fù)制,而不同的物種對該基因有不同的保留和丟失,進化模式即“基因分揀”.筆者發(fā)現(xiàn)RNase7/8也經(jīng)歷了RNase2/3相同的進化模式.另外,RNASE A中的7個簇(RNase1、RNase5、RNase6、RNase9、RNase10、RNase11和RNase12)包含了每個奇蹄目物種的1個功能基因且典型的RNASE A序列特征中未有變異位點,揭示RNASE A這7個成員在奇蹄目物種中保守且重要.
基于基因組對RNASE A的進化研究,以2005年來的研究最為有趣,其研究深入揭示了RNASE A在脊椎動物中的進化歷史,并在偶蹄目的牛做了深入表達分析研究[9-12].作為始新世早期發(fā)現(xiàn)并現(xiàn)存的哺乳動物奇蹄目,其RNASE A進化分析一直未有深入系統(tǒng)的報道.
筆者對奇蹄目2科4個物種的基因組開展研究,除2013年Goo等[12]對家馬RNASE A研究的12條序列外,新獲得白犀牛、驢和野馬3個物種的46條序列,共以58條序列開展奇蹄目的分子進化研究(表1).因RNASE A一些成員發(fā)生基因復(fù)制和基因丟失,RNASE A序列數(shù)并不完全相同,從家馬的12條到野馬的17條.值得注意的是,奇蹄目中RNase4的真假基因分成2簇,顯示該成員發(fā)生復(fù)制后1個拷貝保留功能,而另外的1個復(fù)制基因發(fā)生假基因化并在不同物種中有不同程度的保留或丟失,這一進化模式是除2013年Goo等[12]對翼手目瑩鼠耳蝠中檢測到RNase4發(fā)生基因復(fù)制外的首次報道.另外,每個物種的RNase2/3和RNase7/8序列數(shù)目并不相同且基因未以物種的形式成簇聚集,揭示RNase2/3和RNase7/8經(jīng)歷了 “基因分揀”的進化模式,該進化模式在嚙齒目RNase2/3 研究中首次被提出[20].
RNASE A成員中維持結(jié)構(gòu)穩(wěn)定的6~8個結(jié)構(gòu)半胱氨酸、催化活性氨基酸殘基和功能區(qū)“CKXXNTF”等典型序列特征的保守程度與其功能是否發(fā)生改變有著密切聯(lián)系[10,17,35].典型序列特征的變異往往與基因功能的改變有關(guān),特別是催化活性氨基酸的變異,如對靈長目、食肉目、翼手目、嚙齒目RNase1及嚙齒目RNase2/3的研究,發(fā)現(xiàn)其功能改變與該基因超家族典型序列特征的一些位點發(fā)生變異密切相關(guān)[10,14,17,35].在奇蹄目的43個功能基因及其氨基酸中,該基因超家族的典型序列特征在RNase9—13發(fā)生了顯著變化(圖1),同時RNase9和RNase10等電點最低,分別是5.82和5.99,顯著低于其他成員(表3),揭示RNase9和RNase10可能丟失了核糖核酸酶活性,而具有其他新的功能.與RNASE A中非典型成員(RNase9—13)相反的是,該基因超家族的典型序列特征在RNase1—8中非常保守,且等電點未有顯著變化,揭示奇蹄目中RNase1—8未發(fā)生功能改變而保留原始的功能.
總之,以奇蹄目2科4個物種作為研究對象,從分析每個物種基因組的RNASE A序列、鑒定真假基因、分析氨基酸序列、預(yù)測等電點及構(gòu)建系統(tǒng)發(fā)育樹等方面開展RNASE A的分子進化研究,增加了該基因超家族研究的多樣性,以期為深入認識RNASE A的分子進化研究提供基礎(chǔ).