陳建興,陳海偉,畢曉丹,王銀朝,雷戰(zhàn)
(1.赤峰學(xué)院生命科學(xué)學(xué)院,內(nèi)蒙古 赤峰 024000;2.山東東阿阿膠股份有限公司,山東 聊城 252201)
驢CSN3基因序列分析
陳建興1,陳海偉1,畢曉丹1,王銀朝2,雷戰(zhàn)2
(1.赤峰學(xué)院生命科學(xué)學(xué)院,內(nèi)蒙古 赤峰 024000;2.山東東阿阿膠股份有限公司,山東 聊城 252201)
陳建興,男,1980年出生于山西省運(yùn)城市芮城縣,1999年考入西北民族大學(xué)就讀動(dòng)物科學(xué)專業(yè)。2006年考入青島農(nóng)業(yè)大學(xué)動(dòng)物科技學(xué)院攻讀動(dòng)物遺傳育種與繁殖專業(yè)碩士,2009年獲農(nóng)學(xué)碩士學(xué)位。同年考入內(nèi)蒙古農(nóng)業(yè)大學(xué)動(dòng)物科學(xué)學(xué)院攻讀動(dòng)物遺傳育種與繁殖專業(yè)博士學(xué)位,師從雙博士芒來(lái)教授。2012年獲農(nóng)學(xué)博士學(xué)位。主要研究方向?yàn)閯?dòng)物分子遺傳學(xué)。
家驢具有很大的市場(chǎng)開發(fā)潛力和價(jià)值.本研究通過(guò)生物信息學(xué)技術(shù)分析了家驢CSN 3基因的序列特征,為家驢向肉用或乳用方向選育初步提供一定的分子依據(jù).經(jīng)分析研究發(fā)現(xiàn)家驢CSN 3基因共包含五個(gè)外顯子和四個(gè)內(nèi)含子.初始轉(zhuǎn)錄物的前81nt為5'UTR區(qū),后205nt為3'UTR區(qū),中間的549nt為CDS區(qū).整個(gè)CDS區(qū)翻譯出182個(gè)氨基酸構(gòu)成的多肽.家驢的κ酪蛋白中的氨基酸以脯氨酸所占的比例最高(14.286%),其次為纈氨酸(10.989%),最低的為半胱氨酸、色氨酸和甘氨酸(所占比例都為0.5495%).各物種κ酪蛋白氨基酸序列間每個(gè)位點(diǎn)氨基酸替代數(shù)的平均值的大小能夠較好反映物種間親緣關(guān)系的遠(yuǎn)近.κ酪蛋白氨基酸序列能夠很好地反映物種之間的親緣關(guān)系,適合用于系統(tǒng)發(fā)育分析.
驢;CSN 3基因;κ酪蛋白;序列分析
家驢(Equus asinus)是人類大約6,000年前從非洲野驢(Equus africanus)的一個(gè)或者兩個(gè)亞種馴化而來(lái)的[1,2].隨后,在許多文化體系中,家驢一直作為主要的馱運(yùn)家畜為人類文明的發(fā)展做出了巨大貢獻(xiàn).時(shí)至今日,家驢和騾子在許多貧窮并且氣候干旱的地區(qū)仍是運(yùn)輸重物、人員和財(cái)物的主要馱畜[3].但隨著農(nóng)業(yè)機(jī)械化和交通運(yùn)輸業(yè)的快速發(fā)展,在發(fā)達(dá)國(guó)家以及一些國(guó)家的發(fā)達(dá)地區(qū),家驢這樣的馱運(yùn)動(dòng)物已被淘汰,這就導(dǎo)致不僅個(gè)別品種消失,而且家驢該物種整體也出現(xiàn)種質(zhì)退化和種群數(shù)量下降的趨勢(shì)[4].我國(guó)家驢的養(yǎng)殖數(shù)量一直居世界之首[4,5],家驢的種質(zhì)資源退化狀況與世界范圍內(nèi)的整體局勢(shì)相似[5].
在哺乳動(dòng)物中,CSN3基因編碼的κ酪蛋白是乳中的主要蛋白成分之一[6],并且,該蛋白成分決定乳微粒的大?。ㄈ槲⒘D茉黾拥V物質(zhì)的溶解度并協(xié)助營(yíng)養(yǎng)物質(zhì)從母體傳遞到幼體)和特定功能(κ酪蛋白被凝乳酶分解的產(chǎn)物負(fù)責(zé)乳凝結(jié))[7].一般情況下,CSN3基因包括5個(gè)外顯子,并且第4外顯子編碼成熟蛋白中的160~169個(gè)氨基酸.第四外顯子編碼的多肽鏈長(zhǎng)度占整個(gè)成熟蛋白的85%左右.趙春江等發(fā)現(xiàn)CSN3基因與中國(guó)荷斯坦牛乳蛋白率含量有顯著相關(guān)[8].藍(lán)賢勇等的研究發(fā)現(xiàn),CSN3基因?qū)δ躺窖虍a(chǎn)羔數(shù)有顯著影響[9].Hobor等(2006)[10]鑒定了三個(gè)家馬品種CSN3第一和第四外顯子上的各兩個(gè)SNP位點(diǎn),隨后,又對(duì)馬屬動(dòng)物該基因的啟動(dòng)子區(qū)和第四外顯子區(qū)序列進(jìn)行了比較分析[11]. Selvaggi等[12]研究了Murgese馬CSN3第一外顯子兩個(gè)位點(diǎn)的遺傳多態(tài)性.
對(duì)于家驢CSN3基因的研究,只是在Hobor(2008)的研究[11]中附帶與家馬和斑馬的部分相應(yīng)序列做了比較分析,并未見到專門的研究報(bào)道.為此,本研究通過(guò)生物信息學(xué)技術(shù)初步分析家驢CSN3基因的序列特征,為家驢向肉用或乳用方向選育提供科學(xué)參考,為我國(guó)家驢的遺傳改良提供分子依據(jù).
1.1 數(shù)據(jù)來(lái)源
所使用的CSN3基因序列,全部來(lái)自GenBank.家驢、家馬、家貓、虎鯨、駱駝、狒狒、人、豬、綿羊、牛、兔、褐鼠和家鼠的GenBank登錄號(hào)分別為:FR822990、NM_001081884、XM_003985304、XM_00 4268339、HE863813、XM_003898807、NM_005212、NM_001004026、NM_001009378、NM_174294、NM_ 001082625、NM_031562和NM_007786.
1.2 分析方法
序列間每個(gè)位點(diǎn)的氨基酸替代分析采用泊松矯正模型來(lái)進(jìn)行.各物種κ酪蛋白氨基酸組成分析、進(jìn)化分歧估計(jì)和進(jìn)化樹構(gòu)建通過(guò)MEGA5來(lái)完成.
2.1 家驢CSN3基因基本構(gòu)成
家驢CSN3基因的外顯子和內(nèi)含子的大小構(gòu)成情況參見圖1.從圖中可見,家驢CSN3基因共包含五個(gè)外顯子和四個(gè)內(nèi)含子.前三個(gè)外顯子都非常小,第四外顯子序列長(zhǎng)度占整個(gè)初始轉(zhuǎn)錄物長(zhǎng)度的59.4%.根據(jù)GenBank上登錄的信息(登錄號(hào)為FR822990),該初始轉(zhuǎn)錄物的前81nt為5'UTR區(qū),后205nt為3'UTR區(qū),中間的549nt為CDS區(qū).整個(gè)CDS區(qū)翻譯出182個(gè)氨基酸構(gòu)成的多肽.多聚腺苷酸(polyA)信號(hào)位于第五外顯子的末端.
圖1 家驢CSN3基因基本結(jié)構(gòu)模式圖白色框表示外顯子,灰色框代表內(nèi)含子.
2.2 家驢κ酪蛋白氨基酸組成分析
通過(guò)對(duì)家驢等13個(gè)物種的κ酪蛋白氨基酸組成進(jìn)行分析發(fā)現(xiàn),氨基酸序列長(zhǎng)度以褐鼠的最?。?78),綿羊的最大(192),而一半左右物種(包括驢、人、虎鯨、家貓、駱駝和狒狒)的長(zhǎng)度為182.從氨基酸組成情況來(lái)看,由于狒狒與人的親緣關(guān)系最近,固然二者應(yīng)該最為相似.但家驢與人的κ酪蛋白六種氨基酸(半胱氨酸、天冬氨酸、甘氨酸、蛋氨酸、天冬酰胺和精氨酸)的比例(依次為0.5495%、1.6484%、0.5495%、1.0989%、6.044%和4.3956%)驚人地一致,這在這些物種(除狒狒外)中是絕無(wú)僅有的.家驢的κ酪蛋白中的氨基酸以脯氨酸所占的比例最高(14.286%),其次為纈氨酸(10.989%),最低的為半胱氨酸、色氨酸和甘氨酸(所占比例都為0.5495%).
2.3 κ酪蛋白氨基酸序列進(jìn)化分歧估計(jì)
表1中顯示的是各物種κ酪蛋白氨基酸序列間每個(gè)位點(diǎn)氨基酸替代數(shù)的平均值,從中可以看出,該值的最小值為驢和馬之間的0.034±0.013,其次為人和狒狒間的0.080±0.020.綿羊和牛也比較小,為0.159±0.030.可以看出,分歧的大小能夠較好反映物種間親緣關(guān)系的遠(yuǎn)近.驢和人氨基酸序列之間的每位點(diǎn)的平均替代數(shù)為0.411±0.052. 2.4κ酪蛋白氨基酸序列系統(tǒng)發(fā)育分析
基于泊松矯正模型,采用最大似然法構(gòu)建了13個(gè)物種κ酪蛋白氨基酸序列的系統(tǒng)發(fā)育關(guān)系,結(jié)果見圖2.通過(guò)自展法(1000次重復(fù))對(duì)系統(tǒng)發(fā)育樹各分支之間的聚類關(guān)系進(jìn)行了評(píng)價(jià),自展值顯示在分支上.從圖2可以看出,嚙齒目的褐鼠和家鼠、靈長(zhǎng)類的人和狒狒以及馬屬動(dòng)物的驢和馬都分別100%地聚在了一起,綿羊和牛這兩個(gè)反芻動(dòng)物也97%都聚在了一起.另外,雖然有些分支自展值不是很高,比如,豬和駱駝聚在一起,再與綿羊和牛的分支聚在一起,這四種偶蹄動(dòng)物聚在了一起,也反映出了一定的系統(tǒng)發(fā)育關(guān)系.說(shuō)明κ酪蛋白氨基酸序列能夠很好地反映物種之間的親緣關(guān)系,適合作為系統(tǒng)發(fā)育分析的材料.
表1 序列間進(jìn)化分歧估計(jì)
圖2 最大似然法構(gòu)建的系統(tǒng)發(fā)育樹
在反芻動(dòng)物中,對(duì)于CSN3基因的研究比較多見[8,9],并且也都對(duì)該基因的多態(tài)與生產(chǎn)性狀進(jìn)行了關(guān)聯(lián)分析.而對(duì)于馬屬動(dòng)物,只是偶見對(duì)家馬CSN3基因的啟動(dòng)子區(qū)和第一、第四外顯子的遺傳多態(tài)性進(jìn)行了調(diào)查[10~12],并未見到更進(jìn)一步的研究報(bào)道.對(duì)于家驢CSN3基因的研究報(bào)道,更是接近空白.雖然CSN3主要是在乳中表達(dá)的一個(gè)基因,藍(lán)賢勇等的研究發(fā)現(xiàn),CSN3基因?qū)δ躺窖虍a(chǎn)羔數(shù)有顯著影響[9].對(duì)于家驢來(lái)說(shuō),該基因的多態(tài)有無(wú),多態(tài)對(duì)生長(zhǎng)和產(chǎn)乳有無(wú)影響,都還是未知的.可見,未來(lái)對(duì)此基因的研究具有很大的意義,有可能找到對(duì)家驢開發(fā)利用有價(jià)值的分子標(biāo)記位點(diǎn).因此,本研究通過(guò)生物信息學(xué)技術(shù)初步分析家驢CSN3基因的序列特征,為將來(lái)探尋該基因的多態(tài)性打下基礎(chǔ).
由家驢等物種的κ酪蛋白氨基酸組成分析結(jié)果可以看出,家驢與人的六種氨基酸(Cys、Asp、Gly、Met、Asn和Arg)在κ酪蛋白中所占的比例完全一致,這在除狒狒外的物種中是僅有的.可見,在該酪蛋白的組成上,驢與人比較接近.考慮到κ酪蛋白是乳中的一種主要蛋白,我們也支持張曉瑩等在對(duì)驢乳的化學(xué)成分進(jìn)行分析的基礎(chǔ)上,提出的驢乳相比牛乳或羊乳更適合作為母乳的替代物的觀點(diǎn)[13].
家驢CSN3基因共包含五個(gè)外顯子和四個(gè)內(nèi)含子.初始轉(zhuǎn)錄物的前81nt為5'UTR區(qū),后205nt為3'UTR區(qū),中間的549nt為CDS區(qū).整個(gè)CDS區(qū)翻譯出182個(gè)氨基酸構(gòu)成的多肽.家驢的κ酪蛋白中的氨基酸以脯氨酸所占的比例最高(14.286%),其次為纈氨酸(10.989%),最低的為半胱氨酸、色氨酸和甘氨酸(所占比例都為0.5495%).各物種κ酪蛋白氨基酸序列間每個(gè)位點(diǎn)氨基酸替代數(shù)的平均值的大小能夠較好反映物種間親緣關(guān)系的遠(yuǎn)近.κ酪蛋白氨基酸序列能夠很好地反映物種之間的親緣關(guān)系,適合用于系統(tǒng)發(fā)育分析.
〔1〕A.Beja-Pereira,P.R.England,N.Ferrand,et al.African origins of the domestic donkey[J].Science,2004,304(5678):1781.
〔2〕S.Rossel,F.Marshall,J.Peters,et al.Domestication of the donkey:timing,processes,and indicators[J].Proceedings of the National A-cademy of Sciences of the United States of America,2008,105(10):3715-3720.
〔3〕P.Starkey.The Origins and Development of African Livestock:Archaeology,Genetics,Linguistics and Ethnography[M].London:University College London Press,pp.478–502,2000.
〔4〕http://dad.fao.org.
〔5〕J.X.Chen,Y.J.Sun,D.Manglai,et al.Maternal genetic diversity and population structure of four Chinese donkey breeds[J].Livestock Science,2010,131:272-280.
〔6〕P.Martin,M.Szymanowska,L.Zwierzchowski,et al.The impact of genetic polymorphisms on the protein composition of ruminant milks[J]. Reproduction,Nutrition,Development,2002,42(5):433-459.
〔7〕A.A.Gutierrez,E.A.Maga,H.Meade,et al.Alterationsofthe physicalcharacteristicsof milk from transgenic mice producing bovine κ-casein[J].Journal of Dairy Science,1996,79:791-799.
〔8〕趙春江,張沅,李寧.中國(guó)荷斯坦牛乳蛋白分子遺傳多態(tài)性和產(chǎn)奶性狀相關(guān)性研究[J].黃牛雜志,1999,25(1):13~16.
〔9〕藍(lán)賢勇,陳宏,潘傳英,等.CSN3、CSN1S2 和 β-1g基因多態(tài)與西農(nóng)薩能奶山羊產(chǎn)羔數(shù)的相關(guān)性研究[J].中國(guó)農(nóng)業(yè)科學(xué),2005,38(11):2333-2338.
〔10〕S.Hobor,T.Kunej,T.Lenasi,et al.Kappa casein(CSN3)in horse:Genetic variability in exon 1 and 4[J].Acta agriculturae Slovenica,2006;88:83-89.
〔11〕Hobor S,Kunej T,Dovc P.Polymorphisms in the kappa casein (CSN3)gene in horse and comparative analysis of its promoter and coding region[J].Anim Genet.2008;39:520–530.
〔12〕M.Selvaggi,A.R.P.Delfino,C.Dario.Exon 1 polymorphisms in the equine CSN3 gene:SNPs distribution analysis in Murgese horse breed [J].Animal Biotechnology,2010,21:252-256.
〔13〕張曉瑩,趙亮,鄭倩,等.新疆疆岳驢乳理化和微生物指標(biāo)分析[J].食品科學(xué),2008,29(01):303-305.
Q523
A
1673-260X(2014)07-0011-03
本文系陳建興主持2013年度內(nèi)蒙古自治區(qū)高等學(xué)??茖W(xué)研究項(xiàng)目(NJZC13306)研究成果