黃冬麗,丁功濤,王福彬,吳柳芬
(西北民族大學(xué)生命科學(xué)與工程學(xué)院,甘肅 蘭州 730124)
肌肉生長(zhǎng)抑制素(Myostatin,MSTN)又稱轉(zhuǎn)化生長(zhǎng)因子(growth differentiation factor8,GDF-8),是轉(zhuǎn)化生長(zhǎng)因子(Transforming growth factorβ,TGF-β)超家族成員之一[1],特異性表達(dá)于動(dòng)物骨骼肌中,屬骨骼肌生長(zhǎng)的負(fù)調(diào)控因子,能抑制肌肉的生長(zhǎng)[2]。McPherron AC等[1]首先從小鼠骨骼肌cDNA文庫(kù)中克隆得到MSTN基因,并發(fā)現(xiàn)該基因缺失的小鼠體重約為正常小鼠的2倍,證明了MSTN基因的表達(dá)量與小鼠體重變化呈負(fù)相關(guān)。自1997年McPherron等[1]首先從鼠的骨骼肌文庫(kù)獲得了cDNA全長(zhǎng)序列以來(lái),人們相繼克隆了羊、豬、馬、人、魚、雞等20多種脊椎動(dòng)物的MSTN基因[3],為深入研究MSTN基因的作用機(jī)制作出了巨大貢獻(xiàn)。目前,研究大多集中在對(duì)于MSTN基因與牛、羊、豬等動(dòng)物的瘦肉率的關(guān)系上,但對(duì)編碼蛋白的性質(zhì)和功能方面的研究卻鮮有報(bào)道[4-6]。
杜泊綿羊是來(lái)自南非的肉羊品種,具有早熟、生長(zhǎng)發(fā)育快、采食能力強(qiáng)、肉用特征明顯等特點(diǎn),MSTN基因在控制綿羊產(chǎn)肉率等方面具有明顯的作用[7-8]。為深入探究杜泊綿羊MSTN基因編碼蛋白的性質(zhì)和功能,本研究借助生物信息學(xué)相關(guān)軟件和工具來(lái)對(duì)杜泊綿羊MSTN基因編碼產(chǎn)物的理化特性和蛋白質(zhì)結(jié)構(gòu)功能進(jìn)行預(yù)測(cè)與分析,以期為以后利用MSTN基因改良羊經(jīng)濟(jì)性狀提供參考。
1.1 杜泊綿羊MSTN基因序列來(lái)源杜泊綿羊的MSTN基因的全基因序列由GENEBANK進(jìn)行查找獲得(GeneBank no:NM-001009428),該DNA血樣取自于綿羊的耳緣靜脈。
1.2 試驗(yàn)方法 對(duì)羊MSTN基因CDS編碼產(chǎn)物的氨基酸序列、其蛋白質(zhì)特性及功能結(jié)構(gòu)域進(jìn)行分析與預(yù)測(cè)所用各種軟件工具及網(wǎng)址見表1。
表1 蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)軟件及相關(guān)網(wǎng)址Table 1 The software of prediction about protein structure and function and related web sites
2.1 杜泊綿羊MSTN基因編碼蛋白質(zhì)理化性質(zhì)結(jié)果闡述 杜泊綿羊的MSTN基因編碼蛋白質(zhì)理化性質(zhì)結(jié)果表明,羊的MSTN基因編碼375個(gè)氨基酸。20種氨基酸所占比例如表2所示,其中占整個(gè)氨基酸組成的比重最大的為亮氨酸(Leu),比率為9.9%;比重最小的為色氨酸(Trp),比率為1.6%。負(fù)電荷殘基總數(shù)(Asp+Glu)及正電荷殘基總數(shù)(Arg+Lys)均為48,其分子式為C1912H3018N512O561S21,分子質(zhì)量為42 827 kDa,基因編碼產(chǎn)物半衰期和不穩(wěn)定指數(shù)分別為30 h和44.87,其中不穩(wěn)定指數(shù)大于40,可判定該基因編碼產(chǎn)物屬于不穩(wěn)定蛋白[9]。
表2 杜泊綿羊MSTN基因編碼蛋白的氨基酸組成Table 2 The amino acid composition of the protein encoded by the MSTN gene of Dorper Sheep
2.2 杜泊綿羊MSTN基因編碼蛋白質(zhì)的親疏水性預(yù)測(cè)結(jié)果闡述杜泊綿羊MSTN基因編碼的蛋白質(zhì)的親疏水性預(yù)測(cè)結(jié)果表明(見圖1),氨基酸的位置和編碼氨基酸疏水性的分值分別作為橫坐標(biāo)和縱坐標(biāo)。結(jié)果表明,第14位為甲硫氨酸(Met),疏水分值為+2.811,疏水性最強(qiáng);第28位為谷氨酸(Glu),疏水分值為-3.244,親水性最強(qiáng)。整條氨基酸肽鏈中,親水性氨基酸和疏水性氨基酸分別占65.64%和34.36%,由于整條肽鏈中親水性氨基酸占比較多,總平均親水性分值為-0.490,故可推斷杜泊綿羊MSTN基因編碼的蛋白質(zhì)是一種水溶性蛋白。
圖1 杜泊綿羊MSTN基因編碼的蛋白質(zhì)疏水性/親水性預(yù)測(cè)分析Fig.1 Hydrophobicity prediction results in Dorper Sheep MSTN protein
2.3 杜泊綿羊MSTN基因編碼的蛋白質(zhì)信號(hào)肽預(yù)測(cè)結(jié)果闡述信號(hào)肽常指新合成多肽鏈中用于指導(dǎo)蛋白質(zhì)的跨膜轉(zhuǎn)移的N-末端的氨基酸序列,它是指導(dǎo)分泌性蛋白質(zhì)在糙面內(nèi)質(zhì)網(wǎng)上合成的決定性因素。杜泊綿羊MSTN基因編碼的蛋白質(zhì)信號(hào)肽進(jìn)行分析結(jié)果表明(見圖2),杜泊綿羊MSTN基因編碼產(chǎn)物的C值、Y值和S值分別為0.427、0.586和0.950。由于29~31位的氨基酸之間其發(fā)現(xiàn)切割位點(diǎn),故可以預(yù)測(cè)杜泊綿羊MSTN基因信號(hào)肽存在于編碼的蛋白質(zhì)序列中。
圖2 杜泊綿羊MSTN基因編碼蛋白質(zhì)信號(hào)肽分析結(jié)果Fig.2 Signal peptide analysis results in Dorper Sheep MSTN protein
2.4 杜泊綿羊MMSSTTNN基因編碼的蛋白質(zhì)糖基化位點(diǎn)預(yù)測(cè)結(jié)果闡述 蛋白質(zhì)糖基化是指在蛋白質(zhì)合成過(guò)程中或合成后,在酶的催化下寡糖鏈被連接在肽鏈特定的糖基化位點(diǎn),形成糖蛋白。杜泊綿羊MSTN基因編碼的蛋白質(zhì)糖基化位點(diǎn)進(jìn)行分析結(jié)果表明(見圖3),在杜泊綿羊MSTN基因編碼的蛋白質(zhì)中含有6個(gè)潛在的N-糖基化位點(diǎn),分別為Asn31、Asn96、Asn176、Asn260、Asn330、Asn369。
圖 3 杜泊綿羊MSTN基因編碼蛋白質(zhì)N-糖基化位點(diǎn)分析Fig.3 N-glycosylation site Prediction results in Dorper Sheep MSTN protein
2.5 杜泊綿羊MMSSTTNN基因編碼的蛋白質(zhì)功能預(yù)測(cè)結(jié)果闡述 杜泊綿羊MSTN基因編碼的蛋白質(zhì)功能預(yù)測(cè)分析結(jié)果表明(見表3),該蛋白作為生長(zhǎng)因子和荷爾蒙在信號(hào)轉(zhuǎn)導(dǎo)、免疫應(yīng)答、脅迫應(yīng)答過(guò)程中發(fā)揮作用幾率相對(duì)較高,分別為1.271%、1.447%和2.534%,可以預(yù)測(cè)MSTN基因在調(diào)節(jié)羊的生長(zhǎng)、免疫及代謝中發(fā)揮著重要的作用。
2.6 杜泊綿羊MMSSTTNN基因編碼的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)結(jié)果闡述
2.6.1 杜泊綿羊MSTN基因編碼蛋白質(zhì)二級(jí)結(jié)構(gòu)分析 如圖4所示,二級(jí)結(jié)構(gòu)組分中α-螺旋(Hh)、β-折疊(Ee)、β-轉(zhuǎn)角(Tt)和無(wú)規(guī)則卷曲(Cc)分別占21.07%、23.20%、3.20%和52.53%??梢钥闯鯩STN基因編碼的二級(jí)結(jié)構(gòu)中無(wú)規(guī)則卷曲占主導(dǎo)地位,其次是β-折疊。由于二級(jí)結(jié)構(gòu)中α-螺旋所占比例小于45%,但無(wú)規(guī)則卷曲比例大于20%,由此可以推斷該基因編碼的蛋白質(zhì)為混合型二級(jí)結(jié)構(gòu)[10]。
2.6.2 杜泊綿羊MSTN基因編碼蛋白質(zhì)三級(jí)結(jié)構(gòu)分析 如圖5所示,三級(jí)結(jié)構(gòu)中主要成分也是β-折疊和無(wú)規(guī)則卷曲,與二級(jí)結(jié)構(gòu)預(yù)測(cè)的結(jié)果相符。
表 3 杜泊綿羊MSTN基因編碼蛋白質(zhì)功能預(yù)測(cè)Table 3 Functional prediction and analysis in Dorper Sheep MSTN protein
圖 4 杜泊綿羊MSTN基因編碼蛋白質(zhì)的二級(jí)結(jié)構(gòu)預(yù)測(cè)Fig.4 Putative result of MSTN protein secondary structure in Dorper Sheep
圖 5 杜泊綿羊MSTN基因編碼蛋白三級(jí)結(jié)構(gòu)預(yù)測(cè)Fig.5 Putative result of MSTN protein tertiary structure in Dorper Sheep
蛋白質(zhì)是組成人體一切細(xì)胞、組織的重要成分,不僅對(duì)基因調(diào)控有較大的影響,而且參與機(jī)體所有重要部分的組成[11-12]。本研究通過(guò)生物信息學(xué)分析的方法對(duì)杜泊綿羊的MSTN基因序列進(jìn)行分析,發(fā)現(xiàn)MSTN基因的CDS區(qū)由1 127個(gè)堿基對(duì)組成,共編碼375個(gè)氨基酸,具有6個(gè)潛在的糖基化位點(diǎn)。同時(shí)具有較長(zhǎng)的半衰期和很高的不穩(wěn)定系數(shù),編碼的產(chǎn)物總體表現(xiàn)為不穩(wěn)定的水溶性蛋白。賈浩等[13]在研究中發(fā)現(xiàn)蛋白質(zhì)的半衰期越長(zhǎng)穩(wěn)定系數(shù)越高,這與研究分析結(jié)果不一致,可能是由于MSTN基因編碼產(chǎn)物的理化特性對(duì)其生物學(xué)功能的發(fā)揮影響不大造成的[14]。
氨基酸的親/疏水性影響蛋白質(zhì)的結(jié)構(gòu)和功能,是氨基酸固有的的特性,總平均分值可以體現(xiàn)氨基酸的親水性,數(shù)值越低,氨基酸的親水性越強(qiáng)。研究結(jié)果顯示,該基因編碼的產(chǎn)物中親水性氨基酸占比較大,總平均分值為-0.490,總體表現(xiàn)為親水性,因此可以預(yù)測(cè)MSTN基因編碼產(chǎn)物為可溶性蛋白。
蛋白質(zhì)的空間結(jié)構(gòu)指蛋白質(zhì)分子中所有原子在三維空間中的排布,包括二級(jí)、三級(jí)、四級(jí)結(jié)構(gòu)等,空間結(jié)構(gòu)的組成又密切影響著蛋白質(zhì)功能的發(fā)揮。蛋白質(zhì)二級(jí)結(jié)構(gòu)主要指多肽鏈主鏈折疊產(chǎn)生的由主鏈內(nèi)和主鏈間周期性氫鍵維系的有規(guī)則的構(gòu)象。該基因編碼產(chǎn)物的二級(jí)結(jié)構(gòu)中無(wú)規(guī)則卷曲(Cc)和β-折疊(Ee)比率比較大,分別為23.20%和52.53%;α-螺旋(Hh)占比較小,為21.07%。由于Cc>20%,Hh<45%,故可推斷該基因編碼產(chǎn)物的二級(jí)結(jié)構(gòu)為混合型,主要由β-折疊和無(wú)規(guī)則卷曲構(gòu)成。由于無(wú)規(guī)則卷曲易受側(cè)鏈的影響而導(dǎo)致蛋白質(zhì)功能發(fā)生變化,因此對(duì)其蛋白質(zhì)功能的研究還需進(jìn)一步深入。
在分析預(yù)測(cè)其功能的結(jié)果中顯示,該蛋白作為生長(zhǎng)因子和荷爾蒙在信號(hào)轉(zhuǎn)導(dǎo)、免疫應(yīng)答、脅迫應(yīng)答過(guò)程中發(fā)揮作用幾率相對(duì)較高,因此可以推斷該基因在杜泊綿羊的生長(zhǎng)、免疫和代謝的調(diào)節(jié)中發(fā)揮重要作用。王紅娜等[15]在研究MSTN在綿羊成肌細(xì)胞中的調(diào)控機(jī)制時(shí)發(fā)現(xiàn),若制備可有效失活MSTN基因的病毒,可通過(guò)RNA干擾技術(shù)提高綿羊產(chǎn)肉量;閔令江等[16]通過(guò)研究山羊的MSTN基因多態(tài)性后發(fā)現(xiàn),MSTN基因?qū)ι窖虻臄嗄讨?、凈肉重、后軀肉重和肝重等指標(biāo)有重要影響。本試驗(yàn)對(duì)羊MSTN基因的研究將有利于對(duì)該基因及其編碼蛋白功能的進(jìn)一步分析,為利用MSTN基因改良羊經(jīng)濟(jì)性狀提供參考。