張小雪 趙利明 劉佳 楊曉斌 李沖
摘要:極長鏈脂肪酸延伸酶蛋白家族(elongation of very-long-chain fatty acids, ELOVLs)是一類催化脂肪酸合成的限速酶,主要調控血脂、血糖及一些代謝疾病的發(fā)生。為探究綿羊ELOVL5基因的結構和功能,本研究對該基因及其編碼產物進行了生物信息學分析。結果顯示,綿羊 ELOVL5 基因編碼737個氨基酸,其編碼蛋白分子式為C1656H2448N416O415S16,其分子質量為35 335.39 Daltions,理論等電點為9.47,估計半衰期為30 h,不穩(wěn)定性指數為33.35。亞細胞定位主要位于內質網中(55.6%),ELOVL5基因編碼蛋白沒有信號肽序列,不屬于分泌蛋白。該蛋白存在多個跨膜區(qū)域,屬于跨膜蛋白,存在7個保守結構域,并且為親水性蛋白,二級結構主要以α螺旋和無規(guī)則卷曲為主,三級結構主要由α螺旋纏繞折疊而成。
關鍵詞:綿羊;ELOVL5基因;生物信息學
中圖分類號:S826 ? ? ? ? ? ? ?文獻標志碼:A ? ? ? ? ? ? ?文章編號:1001-1463(2022)04-0024-06
doi:10.3969/j.issn.1001-1463.2022.04.005
Bioinformatics Analysis of Sheep ELOVL5 Gene
ZHANG Xiaoxue, ZHAO Liming, LIU Jia, YANG Xiaobin, LI Chong
(College of Animal Science and Technology, Gansu Agricultural University, Lanzhou Gansu 730070, China)
Abstract:Very long chain fatty acids extend enzyme protein family (elongation of very long-chain fatty acids, ELOVLs) is a kind of fatty acid catalytic synthesis of speed limit of enzymes. It mainly regulates the occurrence of blood lipid, blood glucose and some metabolic diseases. To explore the structure and function of ?ELOVL5 gene in sheep. ?this gene and its encoding protein were analyzed by bioinformatics. The results showed that the sheep ELOVL5 gene encoded 737 amino acids, and the formula ?was C1656H2448N416O415S16. The molecular weight of the protein was 35 335.39 Daltions, the theoretical isoelectric point was 9.47, the estimated half-life was 30h, and the instability index was 33.35. The subcellular localization was mainly located in the endoplasmic reticulum(55.6%). The protein encoded by ELOVL5 gene had no signal peptide sequence and was not ?secretory protein. This protein was ?transmembrane protein with multiple transmembrane regions. had 7 conserved domains, and was hydrophilic. The secondary structure ?mainly consist of alpha helix and random coil, the tertiary structure is mainly composed of winding and folding of α helix.
Key words:Sheep;ELOVL5 gene;Bioinformatics analysis
極長鏈脂肪酸延伸酶(Elongase of very long chain fatty acids,ELOVL)基因家族是哺乳動物中一類編碼超長鏈脂肪酸(Very long chain fatty acids,VLCFA)延伸酶的基因家族,在哺乳動物中現已發(fā)現7個ELOVL基因家族成員,分別為ELOVL1~7[1 ]。哺乳動物ELOVL基因家族與酵母ELO基因家族是垂直同源關系,ELOVL基因家族是在ELO基因家族的基礎上發(fā)現的。ELOVL5 與延長單不飽和脂肪酸(C16、C18)及多不飽和脂肪酸(C18、C20、C22)相關[2 ],優(yōu)先延伸C18和C20這兩類多不飽和脂肪酸,在對C22多不飽和脂肪酸作用上活性相對較弱,很難作用于C22以上的多不飽和脂肪酸[3 ]。ELOVL基因家族成員在哺乳動物很多組織中均有表達且存在組織特異性,ELOVL5基因在哺乳動物肝臟、睪丸、大腦中均有表達[2 ],其表達產物多為微粒體酶,在細胞液中、線粒體中和其他微粒體中參與脂肪酸鏈的延伸反應。酵母ELO基因家族及人類ELOVL5基因家族的編碼產物都參與超長鏈脂肪酸和神經鞘質的形成。ELOVL5參與哺乳動物體內酯類合成和脂肪酸氧化,還能通過調控肝臟脂肪和碳水化合物代謝來影響血糖血脂濃度[3 ]。 ELOVL5基因全長897 bp,定位于人體6號染色體,共編碼299個氨基酸。有研究報道稱,ELOVL5基因的g-110 T > C 突變位點對日本黑牛的皮下脂肪厚度和產量有顯著影響[4 ]。王珍梅[5 ]利用轉錄組測序技術(RNA- seq)鑒定出ELOVL5基因為藏豬和大約克豬脂肪沉積性狀的關鍵候選基因,而且其表達水平與背膘厚呈極顯著正相關。同樣的,胡海龍[6 ]采用轉錄組測序和全長翻譯組測序(RNCseq)技術發(fā)現,ELOVL5等基因的翻譯調控會導致陸川豬與杜洛克豬肌肉組織脂肪含量及肌肉生長速度產生差異。此外,ELOVL5基因與脂肪酸代謝有關,而脂肪酸含量、比例及種類與肉品質及風味有直接的關系[7 ]。因此,了解ELOVL5基因的生物學功能對畜牧業(yè)的生產和發(fā)展有著極其重要的作用。然而,目前有關綿羊ELOVL5基因的研究較少,其生物學功能尚不明確。我們從生物基因組數據庫(GenBank 數據庫)中查詢綿羊ELOVL5基因的序列,利用生物信息學方法對綿羊ELOVL5基因及其編碼產物的理化性質、序列特征、蛋白質結構以及生物學功能進行預測和分析,以期為深入研究綿羊ELOVL5基因相關及其編碼產物的功能提供理論基礎。
1 ? 材料與方法
1.1 ? 序列來源
所有序列數據均來源于NCBI網站GenBank 數據庫,包括雞(XM_040697306.1)、綿羊(XM_ 012100862.3)、馬(NM_023625099.1)、貓(XM_019 80732.2)、牛(NM_001046597.1)、山羊(NM_00128 5628.1)、豬(NM_021098831.1)、人(NM_00124282 8.2)、黑猩猩(XM_024356979.1)等9個物種ELOVL5基因在NCBI網站GenBank 數據庫中的mRNA序列。括號內為GenBank 數據庫登錄號。
1.2 ? 分析方法
分析綿羊ELOVL5基因開放閱讀框(Open reading frame,ORF)時,采用NCBI的在線分析程序ORF Finder;預測其編碼蛋白質的理化性質時,采用Bioedit軟件分析進行預測;采用PSORT預測亞細胞定位;采用分子生物學綜合應用軟件DNAMAN多序列比對及同源性分析;采用Prot Scale工具分析蛋白質的親疏水性;采用Smart軟件對蛋白質保守結構域分析;采用TMHMM Serverv.2.0進行跨膜螺旋區(qū)域的預測;采用Signalp軟件進行蛋白質潛在信號肽剪切位點預測;采用Jpred分析預測蛋白質二級結構;采用SWISS-MODEL在線工具進行蛋白三級結構的預測[8 - 16 ]。
2 ? 結果與分析
2.1 ? 綿羊ELOVL5基因開放閱讀框分析
由綿羊ELOVL5基因開放閱讀框分析結果(圖1)可知,綿羊ELOVL5基因序列中最大長度的ORF為900 bp,起始密碼子位于156 bp處,終止密碼子位于1 845 bp處,推測其編碼737個氨基酸殘基。
2.2 ? 綿羊ELOVL5基因編碼產物理化性質分析
蛋白質的理化性質分析包括對其相對分子質量、氨基酸組成以及等電點的理化性質分析。從ELOVL5基因編碼產物的氨基酸組成(圖2)可以看出,共編碼299個氨基酸殘基,分子量為35 335.39 Da。其中Leu(亮氨酸)占比最高,為11.04%;Cys(半胱氨酸)占比最少,為2.01%。
2.3 ? 綿羊ELOVL5基因蛋白亞細胞定位
從綿羊ELOVL5基因蛋白亞細胞定位結果可知,ELOVL5基因編碼蛋白分布在內質網上的可能性為55.6% ;分布在漿膜上的可能性次之,為22.2%;分布于液泡膜和高爾基體的可能性均最小,均為11.1%。由此推斷,綿羊ELOVL5基因蛋白主要在內質網中發(fā)揮作用。
2.4 ? 不同物種ELOVL5基因的多序列比對及同源性分析
在NCBI數據庫中找到綿羊、雞、黑猩猩、馬、貓、牛、人、山羊以及狗共9種動物的ELOVL5基因編碼的蛋白質序列,通過DNAMAN軟件進行分析比對,結果如圖3所示,發(fā)現其在9種動物中均有表達。通過9種生物ELOVL5基因編碼產物序列的同源樹(圖4)分析發(fā)現,綿羊和牛、山羊的同源性較高,達到了98%;與貓、馬、雞的同源性較低,為84%。
2.5 ? 綿羊ELOVL5蛋白潛在信號肽剪切位點預測及蛋白跨膜區(qū)預測
由綿羊ELOVL5基因編碼產物潛在信號肽剪切位點結果(圖5)可知,編碼產物的C值、S值、Y值分別為0.103、0.630、0.074,且不存在信號肽序列,因此推斷該產物不是分泌蛋白。由跨膜區(qū)預測結果(圖6)可知,該產物存在7段跨膜區(qū)域,是一種跨膜蛋白。
2.6 ? 綿羊ELOVL5蛋白保守結構域分析
由綿羊ELOVL5基因跨膜區(qū)結構域結果(圖7、圖8)得知,該蛋白共有7段跨膜區(qū)域,分別為28~50、63~85、110~132、139~158、168~187、207~224、229~251。
2.7 ? 綿羊ELOVL5蛋白親疏水性分析
通過ProtScale工具分析綿羊ELOVL5蛋白的親疏水性可得結果(圖9),其疏水性最大值為2.878,位于第44位,最小值為-3.811,位于第265位。由此可知,綿羊ELOVL5蛋白是親水性蛋白。
2.8 ? 綿羊ELOVL5蛋白二級結構預測
由Jpred軟件分析結果(圖10)可知,綿羊ELOVL5基因的編碼產物有186段α螺旋,有7段β折疊,有106段無規(guī)則卷曲。
2.9 ? 綿羊ELOVL5蛋白三級結構預測
根據綿羊ELOVL5蛋白三級結構預測結果(圖11)可知,該蛋白三級結構主要由α螺旋纏繞折疊而成。
3 ? 小結與討論
隨著科技水平的日益提高,生物信息分析越來越多的應用于現代分子生物學研究[17 ]。ELOVL5是ELO家族的成員,是一種位于內質網的多道膜蛋白。ELOVL5對長鏈脂肪酸的延伸很重要,在花生四烯酸、油酸、硬脂酸、棕櫚酸、亞麻酸和二十碳五烯酸的延伸反應中起限制作用[18 ]。而超長鏈脂肪酸是脂質介質的前體,也是細胞鞘質、甘油磷脂的組成部分。這些多不飽和脂肪酸參與多種生理過程,不可或缺,還與炎癥、過敏反應、免疫系統(tǒng)、心血管系統(tǒng)和皮膚疾病相關的病理過程相關。與超長鏈脂肪酸代謝相關酶的編碼基因發(fā)生突變后可能會導致魚鱗病、脫髓鞘、智力相關遺傳病、黃斑變性等,ELOVL5基因編碼的組織相容性復合物對免疫反應起到關鍵作用[19 ]。本研究中序列比對及同源性分析結果表明,綿羊ELOVL5基因同源性在所有分析的9種動物中與牛和山羊的關系最近,同為98%,這可能是由于同為反芻動物的原因。與雞、馬、貓同源性最低,為84%。此外,還發(fā)現該蛋白為親水性蛋白,且有7段跨膜區(qū),為跨膜蛋白,表明該蛋白參與信號轉導。蛋白高級結構分析表明,其二級結構和三級結構組成一致,均是由α螺旋組成。許多研究表明,ELOVL5基因對家畜、家禽的脂肪沉積性狀起著重要的作用[20 - 24 ],綿羊ELOVL5基因通過影響超長鏈脂肪酸的代謝進而影響著綿羊的生長發(fā)育過程中諸多方面。綿羊ELOVL5基因及其編碼蛋白具體的作用機理及作用方式在綿羊中還有待研究。本試驗僅對該基因及其編碼產物做了生物信息學分析,可為以后深入研究綿羊ELOVL5基因提供一定的基礎,但是其生物學功能還需要深入研究。
綿羊ELOVL5基因最長ORF長度為900 bp,起始密碼子位于156 bp處,終止密碼子位于1 845 bp處;綿羊ELOVL5基因編碼蛋白分子式為C1656H2448N416O415S16,分子質量為35 335.39 Da。在氨基酸組成中,亮氨酸在其中所占比率最高(11.04%), 半胱氨酸所占比率最低(2.01%)。理論等電點為9.47,估計半衰期為30 h,不穩(wěn)定性指數為33.35。ELOVL5基因編碼產物潛在信號肽剪切位點預測最大C值為0.103,最大Y值為0.074,最大S值為0.630,無信號肽剪切位點,是一種非分泌蛋白。發(fā)現了7段跨膜區(qū),為跨膜蛋白,且該蛋白為親水性蛋白。其親水性最大值為2.878,位于第44位;最小值為-3.811,位于第265位。亞細胞定位分布于內質網的可能性最大,為55.6%。該蛋白二級結構主要為α螺旋,三級結構由α螺旋纏繞折疊形成。
參考文獻:
[1] 張 ? 娟,母 ? 童,趙 ? 平,等. ?靜原雞ELOVL5基因遺傳多樣性研究[J]. ?浙江農業(yè)學報,2019,31(2):200-206.
[2] 唐 ? 慧,潘志雄,盧立志,等. ?超長鏈脂肪酸延伸酶家族的功能及表達調控[J]. ?生命的化學,2009,29(6):898-901.
[3] 吳曉云,陳葉雨,劉 ? 亞,等. ?達氏鱘Elovl4、ELovl5和Elovl7克隆、組織分布及饑餓對其表達的影響[J]. ?水生生物學報,2020,44(6):1174-1181.
[4] MATSUMOTO H,SHIMIZU Y,TANAKA A,et al. The SNP in the promoter region of the bovine ELOVL5 gene influences economic traits including subcutaneous fat thickness[J]. ?Molecular Biology Reports,2013,40(4):3231-3237.
[5] 王珍梅. ?藏豬和大約克豬脂肪組織代謝模式探索分析[D]. ?拉薩:西藏農牧學院,2021.
[6] 胡海龍. ?陸川豬與杜洛克豬背最長肌組織的轉錄組與翻譯組比較分析[D]. ?南寧:廣西大學,2021.
[7] 王 ? 瑩. ?調控黃山黑雞肌肉中多不飽和脂肪比率的關鍵基因鑒定及功能驗證[D]. ?合肥:合肥工業(yè)大學,2018.
[8] 李 ? 娜,楊健康. ?SELL基因與蛋白質的生物信息學分析[J]. ?生物技術,2020,30(6):549-554;583.
[9] 母 ? 童. ?靜原雞ELOVL2和ELOVL5基因組織表達特性及生物信息學分析[D]. ?銀川:寧夏大學,2019.
[10] 張司龍,張小雪,宋其志,等. ?綿羊RXRG基因的生物信息學分析[J]. ?甘肅農業(yè)科技,2020(2~3):31-37.
[11] 靳澤希,馮 ? 芬,鄧曉銀,等. ?綿羊NRCAM基因的生物信息學分析[J]. ?甘肅農業(yè)科技,2020(12):19-24.
[12] 劉 ? 佳,王 ? 禎,代友超,等. ?綿羊HTR4基因的生物信息學分析[J]. ?甘肅農業(yè)科技,2020(10):35-40.
[13] 宋雅萍,李彥霞,郭文婧,等. ?綿羊GP5基因的生物信息學分析[J]. ?甘肅農業(yè)科技,2020(10):54-59.
[14] 王 ? 晨,楊 ? 娟,袁肇方,等. ?綿羊ERβ基因的生物信息學分析[J]. ?西北民族大學學報(自然科學版),2020,41(1):33-40.
[15] 翟 ? 剛,杜天寧,張?zhí)旌疲? ?綿羊KAP1.1基因編碼蛋白生物信息學分析[J]. ?河北科技師范學院學報,2019,33(4):36-41.
[16] 郭麗榮,韓高鏈,張楓惠,等. ?綿羊HADHB基因生物信息學分析及營養(yǎng)應激狀態(tài)下的表達變化[J]. ?中國畜牧雜志,2019,55(5):94-98;162.
[17] 易繼財. ?生物類專業(yè)生物信息學課程教學探索:華南農業(yè)大學生物類專業(yè)生物信息學課程的教改實踐與思考[J]. ?安徽農業(yè)科學,2018,46(26):231-233.
[18] JAKOBSSON A,WESTERBERG R,JACOBSSON A. Fatty acid elongases in mammals:their regulation and roles in metabolism[J]. ?Progress in Lipid Research, 2006, 45(3):237-249.
[19] 王海燕,蘇玉虹. ?編碼極長鏈脂肪酸延長酶基因家族的結構及其產物的功能[J]. ?生命的化學,2005(1):29-31.
[20] 張 ? 娟,母 ? 童,虎紅紅,等. ?靜原雞ELOVL5基因功能生物信息學分析[J]. ?基因組學與應用生物學,2020,39(12):5432-5441.
[21]母 ? 童,張 ? 娟,趙 ? 平,等. ?靜原雞ELOVL2和ELOVL5基因表達的組織特異性研究[J]. ?浙江農業(yè)學報,2017,29(8):1290-1296.
[22] 郭鵬程,戴珊珊,楊浩然,等. ?ELOVL5基因遺傳變異與中國荷斯坦奶牛乳質性狀的關聯(lián)分析及功能驗證[J]. ?中國獸醫(yī)學報,2017,37(4):741-745.
[23] 潘開源,陳建文,陳 ? 真,等. ?乳腺特異性共表達4種脂肪酸合成酶載體及其穩(wěn)轉山羊成纖維細胞系的構建[J]. ?安徽農業(yè)大學學報,2015,42(3):417-423.
[24] 馬小婭,龐春英,鄧廷賢,等. ?FADS2基因在奶牛乳腺細胞中的過表達和干擾研究[J]. ?中國畜牧獸醫(yī),2019,46(3):652-660.
收稿日期:2022 - 02 - 18
基金項目:國家畜禽良種聯(lián)合攻關計劃項目(19210365);甘肅農業(yè)大學伏羲青年英才培養(yǎng)計劃項目(Gaufx-03Y11)。
作者簡介:張小雪(1984 — ),女,湖北武漢人,副教授,主要從事動物遺傳育種與繁殖研究及教學工作。聯(lián)系電話:(0931)7631225。Email:zhangxx@gsau.edu.cn。
通信作者:李 ? 沖(1986 — ),男,甘肅平涼人,副教授,主要從事反芻動物營養(yǎng)研究及教學工作。聯(lián)系電話:(0931)7631225。Email:lichong@gsau.edu.cn。