宋雅萍 李彥霞 郭文婧 張小雪
摘要:為探討綿羊血小板糖蛋白V基因(Glycoprotein V,Platelet,GP5)編碼蛋白的結(jié)構(gòu)和功能,以NCBI網(wǎng)站的GenBank數(shù)據(jù)庫中發(fā)布的綿羊GP5基因序列(登錄號(hào)為XM_ 027965957.1)為基礎(chǔ),采用生物信息學(xué)在線工具和軟件對(duì)綿羊的GP5基因進(jìn)行生物信息學(xué)分析。結(jié)果表明,綿羊GP5基因序列中包含1個(gè)最大長度為1 620 bp的開放閱讀框,推測其編碼539個(gè)氨基酸,其中亮氨酸含量最多,為22.6%。GP5基因所編碼的蛋白其相對(duì)分子質(zhì)量約為59 305.38 KDa,理論等電點(diǎn)為9.40;亞細(xì)胞定位結(jié)果表明其主要位于內(nèi)質(zhì)網(wǎng)(44.4%)。GP5蛋白含有信號(hào)肽和跨膜螺旋結(jié)構(gòu),在二級(jí)結(jié)構(gòu)預(yù)測中,該蛋白以無規(guī)卷曲為主,為70.14%。GP5蛋白三級(jí)結(jié)構(gòu)主要由無規(guī)卷曲折疊纏繞形成,與二級(jí)結(jié)構(gòu)預(yù)測結(jié)構(gòu)一致。
關(guān)鍵詞:綿羊;GP5基因;生物信息學(xué)分析
中圖分類號(hào):S826? ? ? ?文獻(xiàn)標(biāo)志碼:A? ? ? ?文章編號(hào):1001-1463(2020)09-0054-06
doi:10.3969/j.issn.1001-1463.2020.10.012
Abstract:In order to investigate the structure and function of the protein encoded by Glycoprotein V, Platelet (GP5), this paper uses bioinformatics online tools and software to analyze the GP5 gene of sheep based on the GP5 gene sequence of sheep published in GenBank database of NCBI website(registration number: XM_027965957.1). The results showed that GP5 gene sequence of sheep contained an open reading frame with a maximum length of 1 620 bp, and it was speculated that it encoded 539 amino acids, of which leucine content was the largest(22.6%). The relative molecular weight of the protein encoded by GP5 gene is about 59 305.38 KDa, and the theoretical isoelectric point is 9.40. The results of subcellular localization showed that it was mainly located in the endoplasmic reticulum(44.4%). GP5 protein contains signal peptide and transmembrane helix structure. In the prediction of secondary structure, random crimp was dominant, which was 70.14%. The tertiary structure of GP5 protein is mainly formed by random crimp, winding and folding, which is consistent with the predicted structure of the secondary structure.
Key words:Sheep;GP5 gene;Bioinformatics
血小板糖蛋白V(Glycoprotein V,Platelet,GP5)是血小板膜表面含量最豐富的糖蛋白之一,它是血小板vWF和凝血酶受體GPIb-IX-V復(fù)合物中的一個(gè)亞單位。GP5可以促進(jìn)GPIb-IX在血小板表面的表達(dá),增強(qiáng)血小板與vWF的結(jié)合能力。用凝血酶處理血小板后會(huì)導(dǎo)致血小板膜表面GP5的缺乏,而缺乏GP5的血小板可增加血小板對(duì)凝血酶的應(yīng)答反應(yīng),從而促進(jìn)血小板纖維蛋白原結(jié)合和血小板聚集。人GP5的分子量為83.3 ku,由469個(gè)氨基酸組成,且存在一種由16個(gè)氨基酸組成的信號(hào)肽。成熟GP5是由544個(gè)氨基酸組成的跨膜糖蛋白,包括1個(gè)跨膜區(qū),1個(gè)胞漿區(qū)(16個(gè)氨基酸)和1個(gè)胞外區(qū)(504個(gè)氨基酸)。胞外區(qū)包含15個(gè)富含亮氨酸的重復(fù)序列和1個(gè)凝血酶水解識(shí)別序列和敏感位點(diǎn)[1 ]。人GP5是凝血酶的表面糖蛋白和底物[2 ]。目前,GP5基因在人、豬、鼠等中都有研究,對(duì)綿羊GP5基因卻鮮有報(bào)道。我們利用生物信息學(xué)相關(guān)軟件和在線工具,對(duì)綿羊GP5基因及其編碼蛋白的理化性質(zhì)、結(jié)構(gòu)和功能等進(jìn)行分析,旨在為今后綿羊GP5基因的進(jìn)一步研究提供信息學(xué)參考。
1? ?材料與方法
1.1? ?序列來源
基因序列來源于NCBI網(wǎng)站GenBank數(shù)據(jù)庫,包括綿羊(XM_027965957.1)的mRNA序列及8個(gè)物種的蛋白質(zhì)序列:綿羊(XP_ 027821758.1)、人(NP_004479.1)、牛(XP_024 850825.1)、家鼠(NP_036927.1)、豬(XP_020 925727.1)、兔子(XP_008265039.1)、雞(XP_ 004943385.1)、馬(XP_023479286.1)。括號(hào)內(nèi)為GenBank登錄號(hào)。
1.2? ?方法
綿羊GP5基因開放閱讀框(Open reading frame,ORF)采用NCBI的ORF Finder程序(https://www.ncbi.nlm.nih.gov/orffinder/)分析,參照Kozak法則。綿羊GP5蛋白潛在信號(hào)肽剪切位點(diǎn)預(yù)測采用在線工具SignalP 3.0(http://www.cbs.dtu.dk/services/SignalP-3.0/)。各物種GP5編碼產(chǎn)物序列同源性比對(duì)采用DNAMAN軟件分析。綿羊GP5蛋白保守結(jié)構(gòu)域分析采用Smart軟件(http://smart.embl- heidelberg.de/)[3 ]。采用Bioedit軟件及ExPASy的ProtParam(http://www.expasy.org/tools/prot param.html)在線工具對(duì)綿羊GP5蛋白理化性質(zhì)進(jìn)行分析[4 - 5 ]。采用ExPASy的ProtScale(http://ca.expasy.org/tools/protscale.html)在線工具對(duì)綿羊GP5基因編碼蛋白的親疏水性進(jìn)行預(yù)測[5 ]。綿羊GP5基因編碼產(chǎn)物亞細(xì)胞定位采用在線工具PSORTⅡ(https://psort.hgc.jp/form2.html)預(yù)測[4 ]。綿羊GP5蛋白跨膜螺旋結(jié)構(gòu)預(yù)測采用TMHMM在線軟件(http://www.cbs.dtu.dk/services/TMHMM)。綿羊GP5蛋白二級(jí)結(jié)構(gòu)采用Jpred4(http://www.compbio.dundee.ac.uk/jpred4/index.html)分析預(yù)測[6 ],三級(jí)結(jié)構(gòu)采用Swiss-model(https://www.swissmodel.expasy.org/)在線工具預(yù)測[3 ]。
2? ?結(jié)果與分析
2.1? ?綿羊GP5基因開放閱讀框分析
開放閱讀框(Open reading frame,ORF)是一段從啟動(dòng)子到終止子,中間無終止序列打斷的能編碼蛋白質(zhì)的堿基序列。通過識(shí)別ORF可以快速識(shí)別基因系列中的編碼區(qū)域[7 ]。由綿羊GP5基因ORF分析結(jié)果(圖1)可知,該序列中共識(shí)別有6個(gè)開放閱讀框,其中最大開放閱讀框的長度為1 620 bp(起始密碼子和終止密碼子分別位于1 bp處和1 620 bp處),推測其編碼539個(gè)氨基酸殘基。
2.2? ?綿羊GP5編碼產(chǎn)物理化性質(zhì)分析
蛋白基本理化性質(zhì)主要包括相對(duì)分子質(zhì)量、理論等電點(diǎn)(pI)值、氨基酸組成等[3 ]。利用ProtParam在線工具和Bioedit軟件對(duì)綿羊GP5基因編碼產(chǎn)物的理化性質(zhì)進(jìn)行分析,結(jié)果表明,綿羊GP5基因編碼539個(gè)氨基酸殘基,其分子式為C2681H4320N756O728S16,相對(duì)分子質(zhì)量為59 305.38 KDa,pI為9.40。氨基酸組成如圖2所示,其中亮氨酸(Leu)含量最多,所占比例為22.6%;含量最少為酪氨酸(Tyr),所占比例為0.2%。正電荷殘基總數(shù)(Arg+Lys)和負(fù)電荷殘基總數(shù)(Asp+Glu)分別為52、40。基因編碼產(chǎn)物半衰期為30 h。不穩(wěn)定指數(shù)為42.49,大于40.00,由此可知,GP5基因編碼的產(chǎn)物屬于不穩(wěn)定蛋白。
2.3? ?綿羊GP5蛋白親疏水性分析
利用ExPASy的ProtScale在線工具對(duì)綿羊GP5蛋白的親疏水性分析的結(jié)果(圖3)表明,綿羊GP5基因編碼蛋白疏水性最大值為2.778(509~510位),疏水性最強(qiáng);最小值為-1.800(394位),親水性最強(qiáng)。從親水性/疏水性總體來看,親水性氨基酸明顯多于疏水性氨基酸,由此推斷,GP5蛋白屬于親水性蛋白。
2.4? ?綿羊GP5蛋白潛在信號(hào)肽剪切位點(diǎn)預(yù)測
通過SignalP 3.0軟件對(duì)綿羊GP5蛋白潛在信號(hào)肽剪切位點(diǎn)進(jìn)行預(yù)測,以此推斷綿羊GP5蛋白是否存在信號(hào)肽序列及蛋白編碼產(chǎn)物是否為分泌蛋白。由圖4可知,在16和17位氨基酸之間存在剪切位點(diǎn)的可能性較大,可以推斷出GP5蛋白存在信號(hào)肽序列,且屬于分泌蛋白。綿羊GP5基因編碼產(chǎn)物的C值為0.817,Y值為0.790,S值為0.992。
2.5? ?綿羊GP5基因編碼產(chǎn)物亞細(xì)胞定位分析
蛋白質(zhì)參與正常生命活動(dòng),必須位于特定的亞細(xì)胞區(qū)域內(nèi)(如細(xì)胞核、線粒體、細(xì)胞質(zhì)、內(nèi)質(zhì)網(wǎng)、高爾基體等)[8 ]。由在線工具PSORTⅡ預(yù)測的綿羊GP5基因編碼蛋白的亞細(xì)胞定位結(jié)果見表1。綿羊GP5蛋白在內(nèi)質(zhì)網(wǎng)分布的概率為44.4%,在質(zhì)膜和高爾基體分布的概率分別為22.2%、 33.3%??梢钥闯?,綿羊GP5蛋白存在于內(nèi)質(zhì)網(wǎng)的概率最大,由此可推測出綿羊GP5基因編碼蛋白主要在內(nèi)質(zhì)網(wǎng)中發(fā)揮生物學(xué)作用,其次在高爾基體和質(zhì)膜中發(fā)揮生物學(xué)作用。
2.6? ?綿羊GP5蛋白跨膜螺旋結(jié)構(gòu)預(yù)測
利用TMHMM在線軟件對(duì)綿羊GP5蛋白跨膜螺旋結(jié)構(gòu)進(jìn)行分析預(yù)測的結(jié)果(圖5)表明,在494~516位氨基酸之間存在1段跨膜結(jié)構(gòu),其中第1~493位氨基酸在細(xì)胞膜外,第517~539位氨基酸在細(xì)胞質(zhì)內(nèi)。
2.7? ?綿羊及其他物種GP5基因編碼產(chǎn)物序列同源性比對(duì)
通過DNAMAN軟件對(duì)人、兔子、家鼠、牛、豬、綿羊、馬、雞等8個(gè)物種的GP5蛋白進(jìn)行多序列比對(duì)(圖6)及同源樹分析(圖7)的結(jié)果表明,該基因在各個(gè)物種中都有表達(dá)。綿羊與牛、豬等物種同源性較高,其中與牛的同源性高達(dá)95%,與雞同源性較低。
2.8? ?綿羊GP5蛋白保守結(jié)構(gòu)域分析
保守結(jié)構(gòu)域是在生物進(jìn)化或一個(gè)蛋白家族中具有不變或相同的結(jié)構(gòu)域,而且保守結(jié)構(gòu)域具有重要的功能,不可改變,是基因的核心。通過Smart軟件對(duì)綿羊GP5基因編碼蛋白的保守結(jié)構(gòu)域進(jìn)行分析,從圖8、表2可以看出,綿羊GP5蛋白第494~516位氨基酸殘基存在跨膜區(qū),第2~16位氨基酸殘基為低復(fù)雜性區(qū)域,第421~473位氨基酸殘基有1個(gè)LLRCT的結(jié)構(gòu)域。
2.9? ?綿羊GP5蛋白二級(jí)結(jié)構(gòu)的預(yù)測
蛋白質(zhì)結(jié)構(gòu)分析是蛋白質(zhì)組學(xué)研究的重要組成部分,通過對(duì)新發(fā)現(xiàn)的蛋白質(zhì)分子結(jié)構(gòu)等的分析,可為預(yù)測新基因的結(jié)構(gòu)和功能提供參照[8 ]。通過在線工具Jpred4分析綿羊GP5蛋白二級(jí)結(jié)構(gòu)的結(jié)果見圖9。綿羊GP5蛋白有45個(gè)α螺旋(alphahelix,Hh),所占比例為8.35%;β折疊(extendedstrand, Ee)79個(gè),占14.66%;無規(guī)卷曲(Random coil,-)415個(gè),占70.14%。可以看出,綿羊GP5蛋白的二級(jí)結(jié)構(gòu)以無規(guī)卷曲為主。
2.10? ?綿羊GP5蛋白三級(jí)結(jié)構(gòu)的預(yù)測與分析
蛋白質(zhì)的高級(jí)結(jié)構(gòu)的預(yù)測和分析對(duì)理解蛋白質(zhì)結(jié)構(gòu)和功能之間的關(guān)系有重要意義[8 ]。通過在線工具Swiss-model對(duì)綿羊GP5蛋白三級(jí)結(jié)構(gòu)的預(yù)測和分析(圖10)可知,GP5基因編碼蛋白的三級(jí)結(jié)構(gòu)主要是無規(guī)卷曲折疊纏繞形成的,與二級(jí)結(jié)構(gòu)的預(yù)測結(jié)果一致。
3? ?結(jié)論
選取NBCI數(shù)據(jù)庫中人、兔子、家鼠、牛、豬、綿羊、馬、雞等8個(gè)物種的GP5基因的蛋白質(zhì)序列及綿羊GP5基因的mRNA序列,采用生物信息學(xué)分析方法對(duì)綿羊GP5基因的功能和編碼蛋白結(jié)構(gòu)等進(jìn)行分析。結(jié)果表明,綿羊GP5基因包含一個(gè)最大的開放閱讀框,其長度為1 620 bp;編碼539個(gè)氨基酸殘基,其中,亮氨酸含量最多(22.6%),酪氨酸含量最少(0.2%)。相對(duì)分子質(zhì)量為59 305.38 KDa,理論等電點(diǎn)為9.40。綿羊GP5基因編碼產(chǎn)物屬不穩(wěn)定蛋白,其富含親水氨基酸,屬于親水性蛋白。綿羊GP5基因編碼產(chǎn)物中存在信號(hào)肽序列,屬于分泌蛋白,且存在1段跨膜區(qū),屬跨膜蛋白。綿羊GP5基因主要在內(nèi)質(zhì)網(wǎng)(44.4%)中發(fā)揮生物學(xué)作用,其次在高爾基體(33.3%)和質(zhì)膜(22.2%)中發(fā)揮生物學(xué)作用,且編碼的蛋白有1段跨膜結(jié)構(gòu)。GP5基因在牛、豬、家鼠、馬等多個(gè)物種中都有表達(dá),其中與牛的同源性高達(dá)95%,與雞的同源性較低。綿羊GP5基因編碼產(chǎn)物的二級(jí)結(jié)構(gòu)主要為無規(guī)則卷曲,三級(jí)結(jié)構(gòu)主要由無規(guī)卷曲折疊纏繞而成。
參考文獻(xiàn):
[1] 趙益明,阮長耿.? 活化血小板分子標(biāo)志物:P-選擇素、糖盞蛋白和糖蛋白V的研究進(jìn)展[J].? 血栓與止血學(xué),2005(2):85-87.
[2] ROTH GERALD J,CHURCH TODD A,MCMULLEN BRAD A,et al.? Human platelet glycoprotein V:A surface leucine-rich glycoprotein related to adhesion[J].? Academic Press,1990,170(1):153-161.
[3] 李? ?娜,王維民,張德印,等.? 綿羊ADRA1B基因生物信息學(xué)分析[J].? 甘肅農(nóng)業(yè)科技,2019(9):42-48.
[4] 張小雪,潘香羽,李發(fā)弟,等.? 綿羊GDF9基因生物信息學(xué)分析[J].? 甘肅農(nóng)業(yè)科技,2014(8):18-21.
[5] 胡? ?斐,呂慎金,金? ?一,等.? 綿羊FSHR基因生物信息學(xué)分析及其器官表達(dá)規(guī)律研究[J].? 黑龍江畜牧獸醫(yī),2019(3):24-27;31;177.
[6] 臧勝芹,陳曉勇,楊? ?凌,等.? 綿羊Cytb基因生物信息學(xué)分析[J].? 江蘇農(nóng)業(yè)科學(xué), 2018,46(18):24-27;37.
[7] 隋景巍.? 綿羊PTGER3基因生物信息學(xué)分析[J].? 鄉(xiāng)村科技,2017(11):52-55.
[8] 楊? ?文,沈? ?文,郭海英,等.? 新疆巴什拜羊BPI基因序列的生物信息學(xué)分析[J].? 畜牧與獸醫(yī),2014,46(12):19-24.
(本文責(zé)編:楊? ? 杰)