張小雪 趙利明 劉佳 楊曉斌 李沖
摘要:極長鏈脂肪酸延伸酶蛋白家族(elongation of very-long-chain fatty acids, ELOVLs)是一類催化脂肪酸合成的限速酶,主要調(diào)控血脂、血糖及一些代謝疾病的發(fā)生。為探究綿羊ELOVL5基因的結(jié)構(gòu)和功能,本研究對該基因及其編碼產(chǎn)物進行了生物信息學分析。結(jié)果顯示,綿羊 ELOVL5 基因編碼737個氨基酸,其編碼蛋白分子式為C1656H2448N416O415S16,其分子質(zhì)量為35 335.39 Daltions,理論等電點為9.47,估計半衰期為30 h,不穩(wěn)定性指數(shù)為33.35。亞細胞定位主要位于內(nèi)質(zhì)網(wǎng)中(55.6%),ELOVL5基因編碼蛋白沒有信號肽序列,不屬于分泌蛋白。該蛋白存在多個跨膜區(qū)域,屬于跨膜蛋白,存在7個保守結(jié)構(gòu)域,并且為親水性蛋白,二級結(jié)構(gòu)主要以α螺旋和無規(guī)則卷曲為主,三級結(jié)構(gòu)主要由α螺旋纏繞折疊而成。
關(guān)鍵詞:綿羊;ELOVL5基因;生物信息學
中圖分類號:S826 ? ? ? ? ? ? ?文獻標志碼:A ? ? ? ? ? ? ?文章編號:1001-1463(2022)04-0024-06
doi:10.3969/j.issn.1001-1463.2022.04.005
Bioinformatics Analysis of Sheep ELOVL5 Gene
ZHANG Xiaoxue, ZHAO Liming, LIU Jia, YANG Xiaobin, LI Chong
(College of Animal Science and Technology, Gansu Agricultural University, Lanzhou Gansu 730070, China)
Abstract:Very long chain fatty acids extend enzyme protein family (elongation of very long-chain fatty acids, ELOVLs) is a kind of fatty acid catalytic synthesis of speed limit of enzymes. It mainly regulates the occurrence of blood lipid, blood glucose and some metabolic diseases. To explore the structure and function of ?ELOVL5 gene in sheep. ?this gene and its encoding protein were analyzed by bioinformatics. The results showed that the sheep ELOVL5 gene encoded 737 amino acids, and the formula ?was C1656H2448N416O415S16. The molecular weight of the protein was 35 335.39 Daltions, the theoretical isoelectric point was 9.47, the estimated half-life was 30h, and the instability index was 33.35. The subcellular localization was mainly located in the endoplasmic reticulum(55.6%). The protein encoded by ELOVL5 gene had no signal peptide sequence and was not ?secretory protein. This protein was ?transmembrane protein with multiple transmembrane regions. had 7 conserved domains, and was hydrophilic. The secondary structure ?mainly consist of alpha helix and random coil, the tertiary structure is mainly composed of winding and folding of α helix.
Key words:Sheep;ELOVL5 gene;Bioinformatics analysis
極長鏈脂肪酸延伸酶(Elongase of very long chain fatty acids,ELOVL)基因家族是哺乳動物中一類編碼超長鏈脂肪酸(Very long chain fatty acids,VLCFA)延伸酶的基因家族,在哺乳動物中現(xiàn)已發(fā)現(xiàn)7個ELOVL基因家族成員,分別為ELOVL1~7[1 ]。哺乳動物ELOVL基因家族與酵母ELO基因家族是垂直同源關(guān)系,ELOVL基因家族是在ELO基因家族的基礎上發(fā)現(xiàn)的。ELOVL5 與延長單不飽和脂肪酸(C16、C18)及多不飽和脂肪酸(C18、C20、C22)相關(guān)[2 ],優(yōu)先延伸C18和C20這兩類多不飽和脂肪酸,在對C22多不飽和脂肪酸作用上活性相對較弱,很難作用于C22以上的多不飽和脂肪酸[3 ]。ELOVL基因家族成員在哺乳動物很多組織中均有表達且存在組織特異性,ELOVL5基因在哺乳動物肝臟、睪丸、大腦中均有表達[2 ],其表達產(chǎn)物多為微粒體酶,在細胞液中、線粒體中和其他微粒體中參與脂肪酸鏈的延伸反應。酵母ELO基因家族及人類ELOVL5基因家族的編碼產(chǎn)物都參與超長鏈脂肪酸和神經(jīng)鞘質(zhì)的形成。ELOVL5參與哺乳動物體內(nèi)酯類合成和脂肪酸氧化,還能通過調(diào)控肝臟脂肪和碳水化合物代謝來影響血糖血脂濃度[3 ]。 ELOVL5基因全長897 bp,定位于人體6號染色體,共編碼299個氨基酸。有研究報道稱,ELOVL5基因的g-110 T > C 突變位點對日本黑牛的皮下脂肪厚度和產(chǎn)量有顯著影響[4 ]。王珍梅[5 ]利用轉(zhuǎn)錄組測序技術(shù)(RNA- seq)鑒定出ELOVL5基因為藏豬和大約克豬脂肪沉積性狀的關(guān)鍵候選基因,而且其表達水平與背膘厚呈極顯著正相關(guān)。同樣的,胡海龍[6 ]采用轉(zhuǎn)錄組測序和全長翻譯組測序(RNCseq)技術(shù)發(fā)現(xiàn),ELOVL5等基因的翻譯調(diào)控會導致陸川豬與杜洛克豬肌肉組織脂肪含量及肌肉生長速度產(chǎn)生差異。此外,ELOVL5基因與脂肪酸代謝有關(guān),而脂肪酸含量、比例及種類與肉品質(zhì)及風味有直接的關(guān)系[7 ]。因此,了解ELOVL5基因的生物學功能對畜牧業(yè)的生產(chǎn)和發(fā)展有著極其重要的作用。然而,目前有關(guān)綿羊ELOVL5基因的研究較少,其生物學功能尚不明確。我們從生物基因組數(shù)據(jù)庫(GenBank 數(shù)據(jù)庫)中查詢綿羊ELOVL5基因的序列,利用生物信息學方法對綿羊ELOVL5基因及其編碼產(chǎn)物的理化性質(zhì)、序列特征、蛋白質(zhì)結(jié)構(gòu)以及生物學功能進行預測和分析,以期為深入研究綿羊ELOVL5基因相關(guān)及其編碼產(chǎn)物的功能提供理論基礎。
1 ? 材料與方法
1.1 ? 序列來源
所有序列數(shù)據(jù)均來源于NCBI網(wǎng)站GenBank 數(shù)據(jù)庫,包括雞(XM_040697306.1)、綿羊(XM_ 012100862.3)、馬(NM_023625099.1)、貓(XM_019 80732.2)、牛(NM_001046597.1)、山羊(NM_00128 5628.1)、豬(NM_021098831.1)、人(NM_00124282 8.2)、黑猩猩(XM_024356979.1)等9個物種ELOVL5基因在NCBI網(wǎng)站GenBank 數(shù)據(jù)庫中的mRNA序列。括號內(nèi)為GenBank 數(shù)據(jù)庫登錄號。
1.2 ? 分析方法
分析綿羊ELOVL5基因開放閱讀框(Open reading frame,ORF)時,采用NCBI的在線分析程序ORF Finder;預測其編碼蛋白質(zhì)的理化性質(zhì)時,采用Bioedit軟件分析進行預測;采用PSORT預測亞細胞定位;采用分子生物學綜合應用軟件DNAMAN多序列比對及同源性分析;采用Prot Scale工具分析蛋白質(zhì)的親疏水性;采用Smart軟件對蛋白質(zhì)保守結(jié)構(gòu)域分析;采用TMHMM Serverv.2.0進行跨膜螺旋區(qū)域的預測;采用Signalp軟件進行蛋白質(zhì)潛在信號肽剪切位點預測;采用Jpred分析預測蛋白質(zhì)二級結(jié)構(gòu);采用SWISS-MODEL在線工具進行蛋白三級結(jié)構(gòu)的預測[8 - 16 ]。
2 ? 結(jié)果與分析
2.1 ? 綿羊ELOVL5基因開放閱讀框分析
由綿羊ELOVL5基因開放閱讀框分析結(jié)果(圖1)可知,綿羊ELOVL5基因序列中最大長度的ORF為900 bp,起始密碼子位于156 bp處,終止密碼子位于1 845 bp處,推測其編碼737個氨基酸殘基。
2.2 ? 綿羊ELOVL5基因編碼產(chǎn)物理化性質(zhì)分析
蛋白質(zhì)的理化性質(zhì)分析包括對其相對分子質(zhì)量、氨基酸組成以及等電點的理化性質(zhì)分析。從ELOVL5基因編碼產(chǎn)物的氨基酸組成(圖2)可以看出,共編碼299個氨基酸殘基,分子量為35 335.39 Da。其中Leu(亮氨酸)占比最高,為11.04%;Cys(半胱氨酸)占比最少,為2.01%。
2.3 ? 綿羊ELOVL5基因蛋白亞細胞定位
從綿羊ELOVL5基因蛋白亞細胞定位結(jié)果可知,ELOVL5基因編碼蛋白分布在內(nèi)質(zhì)網(wǎng)上的可能性為55.6% ;分布在漿膜上的可能性次之,為22.2%;分布于液泡膜和高爾基體的可能性均最小,均為11.1%。由此推斷,綿羊ELOVL5基因蛋白主要在內(nèi)質(zhì)網(wǎng)中發(fā)揮作用。
2.4 ? 不同物種ELOVL5基因的多序列比對及同源性分析
在NCBI數(shù)據(jù)庫中找到綿羊、雞、黑猩猩、馬、貓、牛、人、山羊以及狗共9種動物的ELOVL5基因編碼的蛋白質(zhì)序列,通過DNAMAN軟件進行分析比對,結(jié)果如圖3所示,發(fā)現(xiàn)其在9種動物中均有表達。通過9種生物ELOVL5基因編碼產(chǎn)物序列的同源樹(圖4)分析發(fā)現(xiàn),綿羊和牛、山羊的同源性較高,達到了98%;與貓、馬、雞的同源性較低,為84%。
2.5 ? 綿羊ELOVL5蛋白潛在信號肽剪切位點預測及蛋白跨膜區(qū)預測
由綿羊ELOVL5基因編碼產(chǎn)物潛在信號肽剪切位點結(jié)果(圖5)可知,編碼產(chǎn)物的C值、S值、Y值分別為0.103、0.630、0.074,且不存在信號肽序列,因此推斷該產(chǎn)物不是分泌蛋白。由跨膜區(qū)預測結(jié)果(圖6)可知,該產(chǎn)物存在7段跨膜區(qū)域,是一種跨膜蛋白。
2.6 ? 綿羊ELOVL5蛋白保守結(jié)構(gòu)域分析
由綿羊ELOVL5基因跨膜區(qū)結(jié)構(gòu)域結(jié)果(圖7、圖8)得知,該蛋白共有7段跨膜區(qū)域,分別為28~50、63~85、110~132、139~158、168~187、207~224、229~251。
2.7 ? 綿羊ELOVL5蛋白親疏水性分析
通過ProtScale工具分析綿羊ELOVL5蛋白的親疏水性可得結(jié)果(圖9),其疏水性最大值為2.878,位于第44位,最小值為-3.811,位于第265位。由此可知,綿羊ELOVL5蛋白是親水性蛋白。
2.8 ? 綿羊ELOVL5蛋白二級結(jié)構(gòu)預測
由Jpred軟件分析結(jié)果(圖10)可知,綿羊ELOVL5基因的編碼產(chǎn)物有186段α螺旋,有7段β折疊,有106段無規(guī)則卷曲。
2.9 ? 綿羊ELOVL5蛋白三級結(jié)構(gòu)預測
根據(jù)綿羊ELOVL5蛋白三級結(jié)構(gòu)預測結(jié)果(圖11)可知,該蛋白三級結(jié)構(gòu)主要由α螺旋纏繞折疊而成。
3 ? 小結(jié)與討論
隨著科技水平的日益提高,生物信息分析越來越多的應用于現(xiàn)代分子生物學研究[17 ]。ELOVL5是ELO家族的成員,是一種位于內(nèi)質(zhì)網(wǎng)的多道膜蛋白。ELOVL5對長鏈脂肪酸的延伸很重要,在花生四烯酸、油酸、硬脂酸、棕櫚酸、亞麻酸和二十碳五烯酸的延伸反應中起限制作用[18 ]。而超長鏈脂肪酸是脂質(zhì)介質(zhì)的前體,也是細胞鞘質(zhì)、甘油磷脂的組成部分。這些多不飽和脂肪酸參與多種生理過程,不可或缺,還與炎癥、過敏反應、免疫系統(tǒng)、心血管系統(tǒng)和皮膚疾病相關(guān)的病理過程相關(guān)。與超長鏈脂肪酸代謝相關(guān)酶的編碼基因發(fā)生突變后可能會導致魚鱗病、脫髓鞘、智力相關(guān)遺傳病、黃斑變性等,ELOVL5基因編碼的組織相容性復合物對免疫反應起到關(guān)鍵作用[19 ]。本研究中序列比對及同源性分析結(jié)果表明,綿羊ELOVL5基因同源性在所有分析的9種動物中與牛和山羊的關(guān)系最近,同為98%,這可能是由于同為反芻動物的原因。與雞、馬、貓同源性最低,為84%。此外,還發(fā)現(xiàn)該蛋白為親水性蛋白,且有7段跨膜區(qū),為跨膜蛋白,表明該蛋白參與信號轉(zhuǎn)導。蛋白高級結(jié)構(gòu)分析表明,其二級結(jié)構(gòu)和三級結(jié)構(gòu)組成一致,均是由α螺旋組成。許多研究表明,ELOVL5基因?qū)倚?、家禽的脂肪沉積性狀起著重要的作用[20 - 24 ],綿羊ELOVL5基因通過影響超長鏈脂肪酸的代謝進而影響著綿羊的生長發(fā)育過程中諸多方面。綿羊ELOVL5基因及其編碼蛋白具體的作用機理及作用方式在綿羊中還有待研究。本試驗僅對該基因及其編碼產(chǎn)物做了生物信息學分析,可為以后深入研究綿羊ELOVL5基因提供一定的基礎,但是其生物學功能還需要深入研究。
綿羊ELOVL5基因最長ORF長度為900 bp,起始密碼子位于156 bp處,終止密碼子位于1 845 bp處;綿羊ELOVL5基因編碼蛋白分子式為C1656H2448N416O415S16,分子質(zhì)量為35 335.39 Da。在氨基酸組成中,亮氨酸在其中所占比率最高(11.04%), 半胱氨酸所占比率最低(2.01%)。理論等電點為9.47,估計半衰期為30 h,不穩(wěn)定性指數(shù)為33.35。ELOVL5基因編碼產(chǎn)物潛在信號肽剪切位點預測最大C值為0.103,最大Y值為0.074,最大S值為0.630,無信號肽剪切位點,是一種非分泌蛋白。發(fā)現(xiàn)了7段跨膜區(qū),為跨膜蛋白,且該蛋白為親水性蛋白。其親水性最大值為2.878,位于第44位;最小值為-3.811,位于第265位。亞細胞定位分布于內(nèi)質(zhì)網(wǎng)的可能性最大,為55.6%。該蛋白二級結(jié)構(gòu)主要為α螺旋,三級結(jié)構(gòu)由α螺旋纏繞折疊形成。
參考文獻:
[1] 張 ? 娟,母 ? 童,趙 ? 平,等. ?靜原雞ELOVL5基因遺傳多樣性研究[J]. ?浙江農(nóng)業(yè)學報,2019,31(2):200-206.
[2] 唐 ? 慧,潘志雄,盧立志,等. ?超長鏈脂肪酸延伸酶家族的功能及表達調(diào)控[J]. ?生命的化學,2009,29(6):898-901.
[3] 吳曉云,陳葉雨,劉 ? 亞,等. ?達氏鱘Elovl4、ELovl5和Elovl7克隆、組織分布及饑餓對其表達的影響[J]. ?水生生物學報,2020,44(6):1174-1181.
[4] MATSUMOTO H,SHIMIZU Y,TANAKA A,et al. The SNP in the promoter region of the bovine ELOVL5 gene influences economic traits including subcutaneous fat thickness[J]. ?Molecular Biology Reports,2013,40(4):3231-3237.
[5] 王珍梅. ?藏豬和大約克豬脂肪組織代謝模式探索分析[D]. ?拉薩:西藏農(nóng)牧學院,2021.
[6] 胡海龍. ?陸川豬與杜洛克豬背最長肌組織的轉(zhuǎn)錄組與翻譯組比較分析[D]. ?南寧:廣西大學,2021.
[7] 王 ? 瑩. ?調(diào)控黃山黑雞肌肉中多不飽和脂肪比率的關(guān)鍵基因鑒定及功能驗證[D]. ?合肥:合肥工業(yè)大學,2018.
[8] 李 ? 娜,楊健康. ?SELL基因與蛋白質(zhì)的生物信息學分析[J]. ?生物技術(shù),2020,30(6):549-554;583.
[9] 母 ? 童. ?靜原雞ELOVL2和ELOVL5基因組織表達特性及生物信息學分析[D]. ?銀川:寧夏大學,2019.
[10] 張司龍,張小雪,宋其志,等. ?綿羊RXRG基因的生物信息學分析[J]. ?甘肅農(nóng)業(yè)科技,2020(2~3):31-37.
[11] 靳澤希,馮 ? 芬,鄧曉銀,等. ?綿羊NRCAM基因的生物信息學分析[J]. ?甘肅農(nóng)業(yè)科技,2020(12):19-24.
[12] 劉 ? 佳,王 ? 禎,代友超,等. ?綿羊HTR4基因的生物信息學分析[J]. ?甘肅農(nóng)業(yè)科技,2020(10):35-40.
[13] 宋雅萍,李彥霞,郭文婧,等. ?綿羊GP5基因的生物信息學分析[J]. ?甘肅農(nóng)業(yè)科技,2020(10):54-59.
[14] 王 ? 晨,楊 ? 娟,袁肇方,等. ?綿羊ERβ基因的生物信息學分析[J]. ?西北民族大學學報(自然科學版),2020,41(1):33-40.
[15] 翟 ? 剛,杜天寧,張?zhí)旌?,? ?綿羊KAP1.1基因編碼蛋白生物信息學分析[J]. ?河北科技師范學院學報,2019,33(4):36-41.
[16] 郭麗榮,韓高鏈,張楓惠,等. ?綿羊HADHB基因生物信息學分析及營養(yǎng)應激狀態(tài)下的表達變化[J]. ?中國畜牧雜志,2019,55(5):94-98;162.
[17] 易繼財. ?生物類專業(yè)生物信息學課程教學探索:華南農(nóng)業(yè)大學生物類專業(yè)生物信息學課程的教改實踐與思考[J]. ?安徽農(nóng)業(yè)科學,2018,46(26):231-233.
[18] JAKOBSSON A,WESTERBERG R,JACOBSSON A. Fatty acid elongases in mammals:their regulation and roles in metabolism[J]. ?Progress in Lipid Research, 2006, 45(3):237-249.
[19] 王海燕,蘇玉虹. ?編碼極長鏈脂肪酸延長酶基因家族的結(jié)構(gòu)及其產(chǎn)物的功能[J]. ?生命的化學,2005(1):29-31.
[20] 張 ? 娟,母 ? 童,虎紅紅,等. ?靜原雞ELOVL5基因功能生物信息學分析[J]. ?基因組學與應用生物學,2020,39(12):5432-5441.
[21]母 ? 童,張 ? 娟,趙 ? 平,等. ?靜原雞ELOVL2和ELOVL5基因表達的組織特異性研究[J]. ?浙江農(nóng)業(yè)學報,2017,29(8):1290-1296.
[22] 郭鵬程,戴珊珊,楊浩然,等. ?ELOVL5基因遺傳變異與中國荷斯坦奶牛乳質(zhì)性狀的關(guān)聯(lián)分析及功能驗證[J]. ?中國獸醫(yī)學報,2017,37(4):741-745.
[23] 潘開源,陳建文,陳 ? 真,等. ?乳腺特異性共表達4種脂肪酸合成酶載體及其穩(wěn)轉(zhuǎn)山羊成纖維細胞系的構(gòu)建[J]. ?安徽農(nóng)業(yè)大學學報,2015,42(3):417-423.
[24] 馬小婭,龐春英,鄧廷賢,等. ?FADS2基因在奶牛乳腺細胞中的過表達和干擾研究[J]. ?中國畜牧獸醫(yī),2019,46(3):652-660.
收稿日期:2022 - 02 - 18
基金項目:國家畜禽良種聯(lián)合攻關(guān)計劃項目(19210365);甘肅農(nóng)業(yè)大學伏羲青年英才培養(yǎng)計劃項目(Gaufx-03Y11)。
作者簡介:張小雪(1984 — ),女,湖北武漢人,副教授,主要從事動物遺傳育種與繁殖研究及教學工作。聯(lián)系電話:(0931)7631225。Email:zhangxx@gsau.edu.cn。
通信作者:李 ? 沖(1986 — ),男,甘肅平?jīng)鋈耍苯淌?,主要從事反芻動物營養(yǎng)研究及教學工作。聯(lián)系電話:(0931)7631225。Email:lichong@gsau.edu.cn。