許廣平, 張志勇, 任忠宏, 張志偉
江蘇省海洋水產(chǎn)研究所, 江蘇省海水魚類遺傳育種重點實驗室,江蘇 南通 226007
黑鯛(Acanthopagrusschlegelii)隸屬鱸形目(Perciformes)鯛科(Sparidae),俗稱海鮒、黑加吉、海鯽、黑立等,具有營養(yǎng)價值高、抗逆性強且不作長距離洄游等特點,是我國沿海重要的海水養(yǎng)殖經(jīng)濟魚類[1],但其在長江以北無法在室外自然越冬,每年進行室內(nèi)越冬又耗時耗力[2],亟需展開耐低溫品系培育。
高不飽和脂肪酸(highly unsaturated fatty acids,HUFA)具有供應(yīng)能量、維持細(xì)胞膜結(jié)構(gòu)與功能和基因調(diào)控等功能,在生物體的生命活動中起重要作用[3],在一定范圍內(nèi),魚體中HUFA含量與機體低溫耐受呈正相關(guān),即機體HUFA含量越多,機體低溫耐受性越強[4]。脂肪酸延長酶(fatty acid elongase,ELO)是影響HUFA合成的關(guān)鍵酶之一,參與脂肪酸代謝,與膜脂代謝密切相關(guān)[5-7]。目前,ELO基因在鯛科魚類中研究報道較少,且該基因編碼的蛋白質(zhì)在理化性質(zhì)、結(jié)構(gòu)與功能等方面分析尚不全面。通過對ELO基因編碼蛋白的結(jié)構(gòu)與功能分析,對其在黑鯛體內(nèi)開展表達(dá)調(diào)控研究,有望培育黑鯛耐低溫品系。
脂肪酸延長酶以長鏈脂肪酸延長酶(elongation of very long chain fatty acids,ELOVL)或ELO分別存在于生物體內(nèi),兩者為垂直同源。一般ELO以基因家族(ELO1、ELO2和ELO3)存在于生物體內(nèi),如酵母、擬南芥等[8-9];但有時也以單獨基因存在,如鱖魚等[10]。ELOVL家族是在ELO家族的研究基礎(chǔ)上發(fā)現(xiàn)的,存在于哺乳動物體內(nèi)的不同組織中,家族共有7個成員(ELOVL1~ELOVL7)[11]。目前,在魚類研究中利用反轉(zhuǎn)錄聚合酶鏈?zhǔn)椒磻?yīng)(reverse transcription-polymerase chain reaction,RT-PCR)和cDNA末端快速擴增技術(shù)(rapid amplification of cDNA ends,RACE)克隆了鱖魚等魚類ELO基因cDNA全長,鱖魚ELO基因編碼294個氨基酸[10],鱖魚ELO基因克隆和功能解析為進一步研究其HUFA合成能力、合成途徑、調(diào)控機理及在不同魚類中的分子進化機理奠定了基礎(chǔ)。不同魚類 ELO之間有較好的蛋白同源性,均含有高度保守的氧化還原中心組氨酸簇、內(nèi)質(zhì)網(wǎng)停留信號和跨膜區(qū)等特征結(jié)構(gòu)功能區(qū)[10-12]。本研究以黑鯛、金頭鯛、鱖魚、斜帶石斑魚、鯉魚等5種魚類的ELO基因編碼蛋白的氨基酸序列作為研究對象,通過序列比對和同源性分析,探討5種魚的親源關(guān)系。再運用多種生物信息學(xué)方法,對黑鯛ELO基因編碼蛋白的理化性質(zhì)與組成結(jié)構(gòu)進行分析和預(yù)測;對該蛋白質(zhì)在細(xì)胞內(nèi)的定位、與蛋白質(zhì)功能調(diào)控和翻譯修飾相關(guān)的作用位點進行預(yù)測和分析;對蛋白質(zhì)功能預(yù)測及蛋白質(zhì)相互作用進行分析;并進行了同源建模及三維結(jié)構(gòu)預(yù)測,旨在通過研究確定黑鯛中ELO基因及其編碼蛋白的主要功能與作用途徑,從而達(dá)到對該蛋白質(zhì)表達(dá)水平的調(diào)控,為提高黑鯛低溫耐受性的研究提供理論基礎(chǔ)。
所用黑鯛ELO基因編碼蛋白的氨基酸序列為本實驗室和華大基因黑鯛全基因組測序并序列比對所得;金頭鯛(Sparusaurata,登錄號:ADD50001.1)、鱖魚(Sinipercachuatsi,登錄號: ACH53603.1)、斜帶石斑魚(Epinepheluscoioides,登錄號: ACJ26847.1)、鯉魚(Cyprinuscarpio,登錄號: AER39746.1)4種魚類ELO基因編碼的完整氨基酸序列均來源美國國立生物技術(shù)信息中心(National Center for Biotechnology Information,NCBI)GenBank 數(shù)據(jù)庫。
運用DNAman 8軟件對黑鯛、金頭鯛、鱖魚、斜帶石斑魚、鯉魚等5種魚類的ELO蛋白進行氨基酸序列比對,并開展同源性和進化關(guān)系分析。
參照王亞琪等[13-14]的方法,利用各種生物信息軟件對黑鯛ELO基因編碼蛋白進行理化性質(zhì)(氨基酸組成、等電點、原子總數(shù)、正負(fù)電荷殘基數(shù)、不穩(wěn)定指數(shù)、摩爾消光系數(shù)、脂肪族氨基酸指數(shù)和總平均親水性等)、疏水性、亞細(xì)胞定位、跨膜區(qū)、信號肽、剪切位點、蛋白磷酸化、糖基化、二級結(jié)構(gòu)、結(jié)構(gòu)域及三維結(jié)構(gòu)等方面的預(yù)測與分析。相關(guān)生物信息軟件見表1。
表1 本研究預(yù)測蛋白質(zhì)結(jié)構(gòu)與功能所應(yīng)用的軟件
將黑鯛、金頭鯛、鱖魚、斜帶石斑魚、鯉魚的ELO氨基酸序列進行比對分析,發(fā)現(xiàn)黑鯛與金頭鯛之間的序列同源性最高,在系統(tǒng)進化樹中距離最近;與鯉魚同源性最低,在系統(tǒng)進化樹中距離最遠(yuǎn)(圖1A)。進化聚類分析結(jié)果表明,與已知物種進化關(guān)系相比較,ELO基因構(gòu)建的生物進化關(guān)系圖譜基本與之相一致(圖1B)。
A:ELO氨基酸序列同源性;B:ELO氨基酸序列進化樹
基于黑鯛的ELO氨基酸序列,用ProtParam和ProtScale 工具中的Kyte &Doolittle法對ELO蛋白的理化性質(zhì)(氨基酸組成、分子質(zhì)量和理論等電點)進行分析。結(jié)果表明,黑鯛ELO蛋白由294個氨基酸殘基組成,分子式為C1669H2403N403O410S18,原子總數(shù)為4 903個,相對分子質(zhì)量為35 249.97。黑鯛ELO蛋白的氨基酸組成(圖2):亮氨酸含量最高(10.5%),苯丙氨酸與酪氨酸次之(8.2%),半胱氨酸與絲氨酸最低(1.4%)。生物體內(nèi)大部分苯丙氨酸氧化成酪氨酸,這2種氨基酸一起合成重要的神經(jīng)遞質(zhì)和激素,參與機體的糖和脂肪代謝;同時,亮氨酸和絲氨酸在促進機體正常生長發(fā)育方面也起到至關(guān)重要的作用[4]。
圖2 黑鯛ELO蛋白各種氨基酸含量
ELO蛋白的理論等電點與不穩(wěn)定系數(shù)分別為9.08和36.23,說明ELO蛋白為堿性蛋白質(zhì)且性質(zhì)穩(wěn)定。在蛋白質(zhì)疏水性分析中:正值代表疏水性,負(fù)值代表親水性,分值(絕對值)代表其疏(親)水性大小。ELO的總平均疏水指數(shù)為-0.49,整條氨基酸鏈中疏水性氨基酸殘基少于親水性氨基酸殘基(圖3),說明ELO蛋白為親水性蛋白質(zhì),由此推測其為水溶性蛋白質(zhì)。
圖3 黑鯛ELO蛋白疏水性分析結(jié)果
利用PSORT Ⅱ[15-17]工具中K-NN算法[18]對黑鯛ELO蛋白進行亞細(xì)胞定位,預(yù)測結(jié)果表明:ELO位于細(xì)胞質(zhì)的概率最大,占整體的65.23%;其次是細(xì)胞核,概率為21.74%;位于線粒體內(nèi)的概率是13.03%。說明ELO可能存在細(xì)胞質(zhì)、細(xì)胞核和線粒體中,但在細(xì)胞質(zhì)內(nèi)發(fā)揮生物學(xué)作用的可能性最大。
利用黑鯛的ELO氨基酸序列,采用SignalP 4.1 Server程序?qū)LO信號肽進行分析預(yù)測。C值(C-score)和S值(S-score)分別指原始信號肽裂解位點記分和信號肽評分,分別表示出現(xiàn)裂解位點可能性及氨基酸位于信號肽區(qū)域概率;Y值(Y-score)是最有可能的信號肽裂解位點;D值(D-score)表示S均值和最大Y值加權(quán)平均值,可以區(qū)分信號肽和非信號肽[19]。ELO蛋白預(yù)測D值為0.132(小于0.450),表明ELO蛋白不含信號肽,且不屬于分泌性蛋白(圖4)。
圖4 黑鯛ELO基因編碼蛋白的信號肽分析
使用TMHMM工具[20]在線分析發(fā)現(xiàn)黑鯛ELO有7個跨膜區(qū)(跨膜螺旋),非跨膜螺旋區(qū)(ExpAA)預(yù)測值為149.03164(大于18),說明預(yù)測蛋白為跨膜蛋白,蛋白N端位于膜內(nèi)一側(cè)的可能性是0.034 97%,總體來看該序列位于膜外,即ELO基因所編碼蛋白質(zhì)為跨膜蛋白。預(yù)測結(jié)果顯示,黑鯛ELO可能在25~47、110~132、176~198、231~250氨基酸的位置形成4個膜外到膜內(nèi)的跨膜區(qū)域;在68~90、139~161、205~227氨基酸的位置形成3個膜內(nèi)到膜外的跨膜區(qū)域,表明黑鯛ELO蛋白可能行使細(xì)胞內(nèi)外信號轉(zhuǎn)導(dǎo)的作用(圖5)。
圖5 黑鯛ELO蛋白質(zhì)跨膜區(qū)預(yù)測結(jié)果
蛋白質(zhì)翻譯后修飾一般指蛋白質(zhì)磷酸化、糖基化及賴氨酸糖化作用等。蛋白質(zhì)磷酸化是控制蛋白質(zhì)是否發(fā)揮功能的開關(guān),是細(xì)胞里面對蛋白質(zhì)功能進行調(diào)控的普遍機制。而糖基化是一種翻譯修飾,有些蛋白質(zhì)發(fā)揮作用需要糖分子、糖鏈等與別的分子相互作用,是細(xì)胞產(chǎn)生不同功能蛋白質(zhì)的一種形式。對這些修飾作用的研究,對了解蛋白質(zhì)的完整功能與功能發(fā)揮具有重要意義[21]。利用NetPhos 3.1 Server軟件[22]預(yù)測黑鯛ELO蛋白磷酸化作用位點,結(jié)果表明,該蛋白質(zhì)具有多個不同的磷酸化作用位點,其中包括4個酪氨酸(Tyr;y-52、y-201、y-233、y-250)、4個蘇氨酸(Thr;t-3、t-203、t-253、t-280)和11個絲氨酸(Ser;s-76、s-101、s-149、s-171、s-174、s-215、s-247、s-258、s-260、s-269、s-282)磷酸化作用位點(圖6)。其中,s-282的分?jǐn)?shù)為0.976,表示極有可能的磷酸化位點;而s-149(0.503)、s-171(0.503)、y-201(0.500)、t-203(0.508)、y-233(0.508)的分?jǐn)?shù)僅略高于閾值(0.500),表明該5個位點為真正的磷酸化位點的可能性極低。
圖6 黑鯛ELO基因編碼蛋白磷酸化位點預(yù)測
利用NetNGlyc 1.0 Server與NetGlycate 1.0 Server在線分別預(yù)測ELO蛋白糖基化位點和賴氨酸糖化作用,并未發(fā)現(xiàn)糖基化位點,但有9個位點(Pos.7、Pos.54、Pos.108、Pos.120、Pos.134、Pos.199、Pos.200、Pos.263、Pos.290)可能存在賴氨酸糖化作用(圖7)。
圖7 黑鯛ELO蛋白賴氨酸糖化作用預(yù)測結(jié)果
利用PeptideCutter工具預(yù)測ELO蛋白酶切位點,對該蛋白質(zhì)有剪切作用的酶和裂解作用的酸如下:精氨酸-C 蛋白水解酶(Arg-C proteinase)、Asp-N 內(nèi)切酶(Asp-N endopeptidase)、Asp-N內(nèi)切酶 + N端亮氨酸(Asp-N endopeptidase + N-terminal Glu)、BNPS糞臭素(BNPS-Skatole)、溴化氫(CNBr)、高特異性糜蛋白酶(chymotrypsin-high specificity)、低特異性糜蛋白酶(chymotrypsin-low specificity)、梭菌蛋白酶(clostripain)、甲酸(formic acid)、谷氨?;逆渻?nèi)切酶(glutamyl endopeptidase)、羥胺(hydroxylamine)、氧代苯甲酸(iodosobenzoic acid)、LysC、LysN、NTCB(2-nitro-5-thiocyanobenzoic acid)、胃蛋白酶(pepsin,pH 1.3)、胃蛋白酶(pepsin, pH>2)、脯氨酸肽鏈內(nèi)切酶(proline-endopeptidase)、蛋白水解酶K(proteinase K)、staphylococcal peptidase Ⅰ、嗜熱菌蛋白酶(thermolysin)、胰蛋白酶(trypsin)。
利用SOPMA在線程序預(yù)測ELO蛋白二級結(jié)構(gòu),發(fā)現(xiàn)該蛋白質(zhì)的二級結(jié)構(gòu)以α-螺旋為主,由137個氨基酸殘基組成,占整個二級結(jié)構(gòu)的46.6%;無規(guī)則卷曲由92個氨基酸構(gòu)成,占整體的31.29%;延伸帶和β-轉(zhuǎn)角分別由55、10個氨基酸殘基構(gòu)成,在整體中所占比例分別為18.71%和3.4%(圖8)。
注:h: α-螺旋; e: 伸展鏈; c: 無規(guī)卷曲; t: β-轉(zhuǎn)角。
應(yīng)用 NCBI 中的 CDD 數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)預(yù)測蛋白質(zhì)功能結(jié)構(gòu)域。預(yù)測結(jié)果如圖9所示,結(jié)果表明: 黑鯛ELO基因編碼蛋白的第28~256個氨基酸區(qū)域為ELO超家族(ELO superfamily)結(jié)構(gòu)域。
圖9 黑鯛ELO基因編碼蛋白結(jié)構(gòu)域預(yù)測
利用Interpro預(yù)測ELO功能,發(fā)現(xiàn)該蛋白質(zhì)在GO數(shù)據(jù)庫中的注釋信息分3個部分:生物學(xué)進程、分子功能和細(xì)胞定位(表2)。該蛋白質(zhì)主要功能為脂肪酸延伸和超長鏈脂肪酸合成,而蛋白質(zhì)行使功能不僅與自身特性有關(guān),同時還與相互作用的蛋白質(zhì)相關(guān)。利用STRING[22]分析其他蛋白質(zhì)與ELO蛋白相互作用信息,選擇比對生物為斑馬魚(Daniorerio),發(fā)現(xiàn)黑鯛ELO蛋白與斑馬魚elovl 5相似度最高(bitscore和e-value分別為417.2和1.1e-116),蛋白同源性74.83%。斑馬魚elovl 5蛋白與其他蛋白質(zhì)相互作用關(guān)系如圖10所示,10個蛋白質(zhì)與其存在直接的相互作用關(guān)系,分別為srbd1、ptplb、sycp2l、elovl2、hsd17b12b、hsdd17b12a、scd、pcyt2、srebf1和fads2。斑馬魚elovl 5蛋白在GO數(shù)據(jù)庫中的注釋信息體現(xiàn)出:elovl 5蛋白影響脂肪酸和雌激素合成,且在分子功能上與多種酶活性有關(guān)(表3)。由此推測,ELO蛋白除了合成脂肪酸,可能還影響雌激素合成,與srbd1等10種蛋白質(zhì)相互作用。
表2 ELO蛋白質(zhì)在GO數(shù)據(jù)庫中的注釋信息
表3 Elovl 5蛋白質(zhì)在GO數(shù)據(jù)庫中的注釋信息
圖10 STRING數(shù)據(jù)庫斑馬魚Elovl 5蛋白相互作用關(guān)系
一般預(yù)測蛋白質(zhì)三維結(jié)構(gòu)有3種方法: 同源建模法(homology modeling)、線串法(threading)和重頭預(yù)測法(abinitio)。其中同源建模是使用最廣泛的一種方法,該方法的優(yōu)點在于:待測蛋白與模板序列的同源性越高,預(yù)測結(jié)果越準(zhǔn),當(dāng)待測蛋白與模板序列同源性高于60%時,預(yù)測結(jié)果與實驗實際測得結(jié)果非常接近。
利用Phyre2在線工具中Normol模式對黑鯛ELO進行同源建模和三維結(jié)構(gòu)預(yù)測,預(yù)測出黑鯛ELO蛋白的三維結(jié)構(gòu)如圖11所示,該三維模型以c5xpdA為模板,覆蓋范圍(同源性)為31%,略高于30%,可信度為31.6%,一定程度上反映了黑鯛ELO蛋白結(jié)構(gòu)。
圖11 黑鯛ELO基因編碼蛋白的三級結(jié)構(gòu)
黑鯛ELO氨基酸序列與其他魚類同源性均較高,推測不同物種中該基因編碼的蛋白質(zhì)活性相似。本研究表明,與金頭鯛、鱖魚、鯉魚、斜帶石斑魚4種不同生境的魚類相比較,同源性聚類分析及系統(tǒng)樹分析均顯示黑鯛與金頭鯛親緣關(guān)系最近,與鯉魚親緣關(guān)系最遠(yuǎn),這與已有研究結(jié)論一致[24]。金頭鯛與黑鯛同屬鯛科魚類,在親緣關(guān)系上比其他3種魚類更近,該結(jié)論與傳統(tǒng)分類學(xué)相吻合,但有學(xué)者認(rèn)為魚類的生活環(huán)境可能影響ELO的進化[3]。不同物種間同種蛋白質(zhì)的同源性高,其在功能上也具有相似性[25]。這可能是由于不同物種間ELO蛋白結(jié)構(gòu)的高穩(wěn)定性和序列的強保守性所致。本課題組在通過對黑鯛、真鯛及其雜交后代CDS序列的基因密碼子偏好性進行聚類時發(fā)現(xiàn)4種魚基因編碼區(qū)在密碼子使用上呈現(xiàn)高度一致性[26]。
黑鯛因其低溫耐受性較差,在長江以北無法在室外自然越冬,每年開展室內(nèi)越冬又耗時耗力[2]。有研究發(fā)現(xiàn)魚類耐低溫可能與ELO基因表達(dá)相關(guān)[27]。本文運用生物信息學(xué)工具對黑鯛ELO蛋白理化性質(zhì)、結(jié)構(gòu)、分子功能及蛋白質(zhì)相互作用等進行了分析。結(jié)果表明:黑鯛ELO基因編碼蛋白由294個氨基酸組成,亮氨酸含量最高,存在多種二級結(jié)構(gòu),其中以α-螺旋為主,與斜帶石斑魚、擬南芥等分析結(jié)果一致[3,8]。ELO蛋白在擬南芥中亞細(xì)胞定位至細(xì)胞質(zhì)或內(nèi)質(zhì)網(wǎng),其在黑鯛亞細(xì)胞定位至細(xì)胞質(zhì)的概率最高,且無信號肽,推測該蛋白質(zhì)為一種存在于細(xì)胞質(zhì)的非分泌蛋白??傮w來說,ELO蛋白為堿性、小分子、穩(wěn)定性蛋白質(zhì),存在1個ELO超家族結(jié)構(gòu)域,與HUFA 合成的另1個關(guān)鍵酶脂肪酸去飽和酶(fatty acid desaturase,F(xiàn)AD)存在顯著差異[3]。分析表明,ELO蛋白分子中存在多個磷酸化作用位點,證明其具有合成高度不飽和氨基酸功能,可以促進細(xì)胞生長;該蛋白分子中也存在多個賴氨酸糖化位點,可用于ELO蛋白的翻譯后修飾,通過與別的分子相互作用,形成一種新的功能,賴氨酸糖化對于維持蛋白質(zhì)的結(jié)構(gòu)和功能都起到重要的作用。此外,本研究通過對黑鯛ELO結(jié)構(gòu)及功能預(yù)測分析,為探討該基因在黑鯛低溫耐受機制方面提供了相關(guān)理論基礎(chǔ)。蛋白質(zhì)相互作用關(guān)系分析中,以斑馬魚中Elovl 5基因為模板,推測srbd1等10個蛋白質(zhì)與ELO可能存在直接的相互作用關(guān)系,有可能影響雌激素合成,并在分子功能上與多種酶活性有關(guān)[28]。
本研究通過生物信息學(xué)方法對不同魚類ELO基因編碼蛋白序列進行進化聚類分析,以及對黑鯛該蛋白理化性質(zhì)、亞細(xì)胞定位、跨膜區(qū)、信號肽、酶切位點、蛋白磷酸化、糖基化、二級結(jié)構(gòu)、結(jié)構(gòu)域及三維結(jié)構(gòu)等方面進行預(yù)測與生物信息學(xué)分析,推測該蛋白質(zhì)功能與低溫耐受性相關(guān)。下一步將繼續(xù)開展該基因在不同組織和不同發(fā)育時期差異表達(dá)分析,以確定其靶標(biāo)組織和關(guān)鍵的表達(dá)時期,了解黑鯛中脂肪酸合成的途徑和機制;進一步開展黑鯛抗寒性狀相關(guān)的基因表達(dá)調(diào)控研究,最終為黑鯛耐低溫新品種的培育工作提供理論依據(jù)。