靳澤希,馮 芬,鄧曉銀,王維民,2
(1.甘肅農(nóng)業(yè)大學(xué),甘肅 蘭州 730070;2.甘肅省肉羊繁育生物技術(shù)工程實(shí)驗(yàn)室,甘肅民勤 733300)
神經(jīng)原相關(guān)的細(xì)胞粘附分子(neuro-related celladhesion molecule,NRCAM)是一種跨膜的細(xì)胞粘附分子,它有多種亞型,目前已經(jīng)鑒定出的有20多種。NRCAM屬單基因家族,其不同亞型的形成是由單個NRCAM基因通過不同的轉(zhuǎn)錄、轉(zhuǎn)錄后加工、翻譯、翻譯后加工形成的。NRCAM屬于免疫球蛋白超基因家族[1-2],它是一種能介導(dǎo)細(xì)胞之間及細(xì)胞與細(xì)胞外基質(zhì)間相互作用的糖蛋白,在細(xì)胞的識別及轉(zhuǎn)移、腫瘤的浸潤與生長、神經(jīng)再生、跨膜信號的傳導(dǎo)、學(xué)習(xí)和記憶等方面均發(fā)揮一定的作用。神經(jīng)細(xì)胞粘附分子在組織形成和細(xì)胞遷移以及神經(jīng)突長出中起著重要作用,它還可以通過胞內(nèi)區(qū)與細(xì)胞骨架蛋白或第二信使的結(jié)合參與信號傳導(dǎo)過程。例如,傳統(tǒng)的鈣粘素通過參與細(xì)胞極性建立、細(xì)胞增殖、軸突延長和聚集等基本過程,在動物細(xì)胞的形態(tài)中發(fā)揮著重要作用[3]。Zhou WB 等[4]發(fā)現(xiàn),將周圍神經(jīng)植入腦中幾天后,丘腦、紋狀體部位神經(jīng)元直接朝向周圍神經(jīng)移植物的方向生長,進(jìn)入雪旺細(xì)胞柱中,而在雪旺細(xì)胞和神經(jīng)元表面均有NRCAM的表達(dá),表明NRCAM在神經(jīng)的再生過程中擔(dān)當(dāng)著重要角色。Doherty P等[5]對雞NRCAM基因的分析發(fā)現(xiàn),NRCAM基因由內(nèi)含子和26個外顯子組成,這26個外顯子的結(jié)構(gòu)在不同的物種和屬之間是相當(dāng)恒定的,但內(nèi)含子是不同的。目前,人、家鼠、牛、狗、豬、綿羊、雞、兔子等動物的NRCAM基因序列均已經(jīng)公布,但對其結(jié)構(gòu)和功能的研究有待進(jìn)一步研究。我們以生物基因組數(shù)據(jù)庫調(diào)取的綿羊NRCAM的序列為基礎(chǔ),利用生物信息學(xué)方法對不同物種NRCAM基因及其編碼蛋白的理化性質(zhì)、二級結(jié)構(gòu)及多參數(shù)預(yù)測、蛋白質(zhì)跨膜結(jié)構(gòu)、信號肽預(yù)測、亞細(xì)胞定位和三級結(jié)構(gòu)等進(jìn)行了分析,以期為深入研究NRCAM基因及其編碼蛋白基本結(jié)構(gòu)和生物學(xué)功能提供理論基礎(chǔ)。
數(shù)據(jù)來源于NCBI網(wǎng)站的GenBank數(shù)據(jù)庫[6],包括綿羊 (XM_027968593.1)、牛(NM_001206562.1)、人(NM_001193583.1)、家鼠(XM_017594291.1)、豬(XM_021063526.1)、狗(XM_014120801.2)、兔子(XM_00825 8357.2)和雞(XM_015280741.2)等 8個物種的mRNA序列。括號內(nèi)為GenBank登錄號。
綿羊NRCAM基因開放閱讀框(Open reading frame,ORF)采用 NCBI的 ORF Finder程序分析,參照Kozak法則;NRCAM編碼產(chǎn)物的理化性質(zhì)采用Bioedit及ExPASy分析軟件預(yù)測[7];亞細(xì)胞定位采用PSORTⅡ預(yù)測[8-9];蛋白潛在信號肽剪切位點(diǎn)預(yù)測采用Signalp 3.0軟件;跨膜螺旋區(qū)域的預(yù)測采用TMHMM程序;蛋白保守結(jié)構(gòu)域分析采用Smart軟件。采用ProtScale進(jìn)行蛋白親疏水性分析。二級結(jié)構(gòu)采用Jpred分析預(yù)測。采用Swiss-model軟件分析蛋白三級結(jié)構(gòu)多序列比對,同源性分析采用DNAMAN軟件。
通過圖1可以看出,綿羊NRCAM基因序列中有1條最大長度為3 648 bp的ORF,起始密碼子位于405 bp處,終止密碼子位于4 052 bp處,推測編碼1 215個氨基酸殘基。
蛋白質(zhì)的基本性質(zhì)包括其相對分子質(zhì)量、氨基酸組成和等電點(diǎn)等[10]。對綿羊NRCAM基因編碼產(chǎn)物理化性質(zhì)的分析表明,綿羊NRCAM基因編碼1 215個氨基酸殘基,其分子式為C5995H9389N1613O1830S32,分子質(zhì)量為134 367.13 KDa,理論等電點(diǎn)pI為5.49。其氨基酸組成如圖2所示,其中含量最多的氨基酸是Leu(亮氨酸),所占比例為8.3%;含量最少的氨基酸是Cys(半胱氨酸),所占比例1.2%。負(fù)電荷殘基總數(shù)(Asp+Glu)為 148,正電荷殘基總數(shù)(Arg+Lys)為 121?;蚓幋a產(chǎn)物半衰期為30 h,不穩(wěn)定指數(shù)為40.22,不穩(wěn)定指數(shù)為40.22>40.00,可確定該基因編碼產(chǎn)物屬不穩(wěn)定蛋白。
綿羊NRCAM基因?qū)Φ鞍讈喖?xì)胞的定位結(jié)果見表1??梢钥闯?,綿羊NRCAM蛋白的亞細(xì)胞分布于細(xì)胞質(zhì)的可能性為26.1%,分布于細(xì)胞核的可能性為17.4%,分布于囊泡分泌系統(tǒng)、線粒體的可能性均為13.0%,分布于高爾基體、內(nèi)質(zhì)網(wǎng)的可能性均為8.7%,分布于細(xì)胞骨架、細(xì)胞外及細(xì)胞壁、質(zhì)膜的可能性均為4.3%。由此推斷,綿羊NRCAM基因的編碼產(chǎn)物主要在細(xì)胞質(zhì)中發(fā)揮生物學(xué)作用。
表1 NRCAM編碼產(chǎn)物的亞細(xì)胞定位預(yù)測結(jié)果
從圖3、圖4可以看出,NRCAM在很多物種中都有表達(dá),且綿羊與牛的NRCAM氨基酸序列同源性較高,這也說明它們在進(jìn)化過程具有較近的親緣關(guān)系。NRCAM基因編碼產(chǎn)物同源樹證明,該基因的編碼產(chǎn)物在綿羊和牛上的同源性最高,達(dá)99%。
信號肽序列是存在于分泌蛋白基因編碼序列中、在起始密碼子之后的1段富含疏水氨基酸多肽的序列。通過檢測綿羊NRCAM蛋白潛在信號肽的存在情況可判斷該基因編碼的產(chǎn)物是否為分泌蛋白和跨膜蛋白以及跨膜蛋白的基本信息。從圖5看出,綿羊NRCAM基因編碼產(chǎn)物的C值、Y值和S值分別為0.474、0.580和0.929。推斷NRCAM基因的編碼產(chǎn)物包含信號肽,剪切位點(diǎn)位于29、30殘基處,屬于分泌蛋白。
用TMHMM2.0軟件分析的結(jié)果顯示,該基因編碼的蛋白有1段跨膜結(jié)構(gòu)(圖6),其中1~1 074位氨基酸在細(xì)胞膜外,其余氨基酸在細(xì)胞質(zhì)內(nèi)。
由Smart軟件分析可知,綿羊NRCAM第59~130位、第283~347位、第373~439位、第467~532位和第558~623位氨基酸殘基存在IGc2區(qū),第152~239位氨基酸殘基存在于IG區(qū),第625~635位氨基酸殘基均為低復(fù)雜性區(qū)域,第647~730位、第747~830位、第846~937位和第952~1037位氨基酸殘基存在于FN3區(qū),第1075~1 097位氨基酸殘基存在于跨膜區(qū)(圖7、表2)。
表2 綿羊NRCAM蛋白保守結(jié)構(gòu)域分析數(shù)據(jù)
該基因編碼蛋白疏水性最大值為4.078(1 090位),最小值為 -3.022(790~791位),圖形的高峰值(正值)區(qū)域表示疏水的區(qū)域,而負(fù)值的“低谷”區(qū)域是親水區(qū)域。整條鏈中親水性氨基酸殘基多于疏水性氨基酸殘基。因此可推測該基因編碼的蛋白是親水性蛋白(圖8)。
通過Jpred軟件分析可知(圖9),綿羊NRCAM蛋白二級結(jié)構(gòu)如下:α螺旋(Hh)、β折疊(Ee)、無規(guī)卷曲(Cc)分別占2.96%、42.13%、54.89%??梢钥闯鯪RCAM基因編碼的二級結(jié)構(gòu)中無規(guī)卷曲占主導(dǎo)地位,其次是β折疊。
通過在線工具Swiss-model對綿羊NRCAM蛋白三級結(jié)構(gòu)的預(yù)測和分析(圖10)可知,NRCAM基因編碼蛋白的三級結(jié)構(gòu)與二級結(jié)構(gòu)預(yù)測的結(jié)果一致,主要由無規(guī)卷曲和β折疊纏繞形成。
綿羊NRCAM基因含有1個最大長度為3 648 bp的ORF,編碼1 215個氨基酸殘基;亮氨酸所占比例最多,為8.3%,分子質(zhì)量為134 367.13 KDa,理論等電點(diǎn)pI為5.49。NRCAM編碼的產(chǎn)物為不穩(wěn)定性蛋白。NRCAM蛋白的亞細(xì)胞定位在細(xì)胞質(zhì)的可能性最大,為26.1%。NRCAM基因在很多物種中都有表達(dá),綿羊和牛在同源樹中同源性達(dá)到99%。NRCAM基因的編碼產(chǎn)物中包含信號肽,該蛋白是分泌蛋白。該基因編碼的蛋白有1段跨膜結(jié)構(gòu)。NRCAM基因編碼的蛋白為親水性蛋白,親水性氨基酸殘基多于疏水性氨基酸殘基。綿羊NRCAM基因編碼產(chǎn)物的二級結(jié)構(gòu)主要以無規(guī)卷曲和β折疊為主,三級結(jié)構(gòu)主要由無規(guī)卷曲和β折疊纏繞形成。