謝 勇,洪曉昆,鄢仁祥,林 娟
(福建省海洋酶工程重點(diǎn)實(shí)驗(yàn)室(福州大學(xué)),福州 350116)
重組瓊膠酶rAgaN3基因的生物信息學(xué)分析
謝 勇,洪曉昆,鄢仁祥,林 娟
(福建省海洋酶工程重點(diǎn)實(shí)驗(yàn)室(福州大學(xué)),福州 350116)
利用生物信息學(xué)軟件和數(shù)據(jù)庫(kù)對(duì)從Microbulbifersp. BN中得到的瓊膠酶rAgaN3全長(zhǎng)基因進(jìn)行預(yù)測(cè)分析,結(jié)果表明:重組瓊膠酶rAgaN3理論分子量為31.243 kDa,理論等電為4.81,不穩(wěn)定系數(shù)為26.23,脂肪系數(shù)為62.35,平均疏水性系數(shù)為-0.662,無(wú)跨膜結(jié)構(gòu)域,無(wú)信號(hào)肽;二級(jí)結(jié)構(gòu)表明該蛋白無(wú)螺旋結(jié)構(gòu),有15個(gè)折疊結(jié)構(gòu),其余均為卷曲結(jié)構(gòu);序列相似性分析表明,蛋白rAgaN3屬于糖苷水解酶GH16家族,為β-瓊膠酶;以同源蛋白3wz1A(同源性88%)為模板,通過(guò)同源建模構(gòu)建出了蛋白三級(jí)結(jié)構(gòu),并用拉式圖進(jìn)行了結(jié)構(gòu)檢驗(yàn)。瓊膠酶rAgaN3基因的生物信息學(xué)分析,為瓊膠酶的異源表達(dá)提供了指導(dǎo),為瓊膠酶的定點(diǎn)突變、深入研究其結(jié)構(gòu)和功能的關(guān)系打下良好基礎(chǔ)。
瓊膠酶;基因分析;生物信息學(xué);蛋白結(jié)構(gòu)
瓊脂存在于石花菜科和龍須菜科紅藻細(xì)胞壁中,主要由瓊脂糖和瓊脂膠組。其中瓊脂糖是由(1-3)-O-β-D-半乳糖和(1-4)-O-3,6-內(nèi)醚-α-L-半乳糖交替組成的線形鏈狀分子[1],是目前世界上應(yīng)用最廣泛的海藻多糖之一。瓊膠具有膠凝性和凝膠的穩(wěn)定性,因而在食品工業(yè)中常被用作膠凝劑、增稠劑、乳化劑、增量劑、助懸劑、水分保持劑、穩(wěn)定劑、賦形劑等。
瓊膠酶是一種能夠降解瓊膠,產(chǎn)生瓊膠寡糖的酶總稱(chēng)。根據(jù)瓊膠酶作用糖苷鍵的不同可以分為兩類(lèi):α-瓊膠酶和β-瓊膠酶[2-3]。目前已報(bào)道的瓊膠酶大多來(lái)源于海洋微生物,其中α-瓊膠酶主要來(lái)自假單胞菌屬、單胞菌屬和弧菌屬,β-瓊膠酶主要來(lái)源于弧菌屬、交替單胞菌屬[4]。在許多軟體動(dòng)物的消化液的微生物中可以分離得到瓊膠酶,比如濱螺屬(Littorinastriata)、海兔屬(Aplysiadactylomela)、冠海詹屬(Diademaantillarum)、鮑屬(Haliotiscoccinea)[5-6]。瓊膠酶可用做海藻降解的工具酶,多用于多糖結(jié)構(gòu)的研究[7],瓊膠寡糖的制備以及在分子生物學(xué)方面也多有應(yīng)用[8]。
目前關(guān)于瓊膠酶的研究主要集中在菌種選育和基因工程菌構(gòu)建上,傳統(tǒng)菌株選育出的菌株所產(chǎn)瓊膠酶常存在酶活低、穩(wěn)定性差等缺點(diǎn),通過(guò)基因克隆表達(dá)重組瓊膠酶蛋白已經(jīng)成為趨勢(shì)。從1987年Buttner等[9]首次實(shí)現(xiàn)瓊膠酶基因的異源表達(dá)開(kāi)始,已經(jīng)有一定數(shù)量的瓊膠酶基因被研究,但是國(guó)內(nèi)對(duì)瓊膠酶基因的研究還不多。課題組從福建漳江口紅樹(shù)林泥樣中分離獲得一株產(chǎn)瓊膠酶菌株,并進(jìn)行了形態(tài)學(xué)和16SrRNA鑒定,確定菌種為微球莖菌屬(Microbulbifersp.),并通過(guò)TAIL-PCR方法克隆得到基因全長(zhǎng)。目前報(bào)道的微球莖菌屬重組瓊膠酶還較少,且與此基因編碼的蛋白質(zhì)序列有高同源性的蛋白3wz1A的結(jié)構(gòu)已經(jīng)得到解析[10],為rAgaN3的后續(xù)研究提供了便利。本文利用生物信息學(xué)軟件和數(shù)據(jù)庫(kù),預(yù)測(cè)其理化性質(zhì)及結(jié)構(gòu)信息,為瓊膠酶基因的異源表達(dá)和瓊膠酶結(jié)構(gòu)與功能關(guān)系研究奠定基礎(chǔ)。
1.1 實(shí)驗(yàn)材料
菌株:Microbulbifersp. BN從福建漳江口紅樹(shù)林泥樣中分離獲得,利用 TAIL-PCR方法從中克隆得到瓊膠酶基因agaN3序列全長(zhǎng)。
1.2 分析方法
(1)利用 NCBI的 blast(http://www.ncbi.nlm.nih.gov/)和 MEGA5.2構(gòu)建系統(tǒng)進(jìn)化樹(shù);
(2)利用 ProtParam[11](http://web.expasy.org/protparam/)分析蛋白質(zhì)的理化性質(zhì),包括相對(duì)分子質(zhì)量、氨基酸組成、等電點(diǎn)、不穩(wěn)定系數(shù)、總平均親水性等;
(3)利用ProtScale[11](http://web.expasy.org/protscale/)分析蛋白質(zhì)疏水性;
(4)利用TMHMM[12](http://www.cbs.dtu.dk/services/TMHMM/)分析蛋白質(zhì)跨膜區(qū)域;
(5)利用PSIPRED[12](http://bioinf.cs.ucl.ac.uk/psipred/)分子蛋白質(zhì)二級(jí)結(jié)構(gòu),比如分螺旋、卷曲、無(wú)規(guī)則卷曲等;
(6)利用PredictProtein[13](https://www.predictprotein.org/)分析跨膜螺旋區(qū)域、二硫橋以及結(jié)合位點(diǎn)等性質(zhì);
(7)利用Signal P[14](http://www.cbs.dtu.dk/services/SignalP/)分析信號(hào)肽;
(8)利用NCBI(http://www.ncbi.nlm.nih.gov/cdd/)進(jìn)行保守結(jié)構(gòu)域搜索;
(9)利用SMART[15](http://smart.embl-heidelberg.de/)預(yù)測(cè)結(jié)構(gòu)域;
(10)利用CAZY[16]數(shù)據(jù)庫(kù)(http://www.cazy.org/GH16.html/)查詢(xún)糖苷水解酶信息;
(11)利用TargetP 1.1[13](http://www.cbs.dtu.dk/services/TargetP/)分析亞細(xì)胞定位及導(dǎo)肽;
(12)利用 SWISS-MODEL[17](http://www.swissmodel.expasy.org/)進(jìn)行同源建模;
(13)利用SAVES[18]服務(wù)器 (http://services.mbi.ucla.edu/SAVES/) 對(duì)蛋白結(jié)構(gòu)殘基角度檢驗(yàn);
(14)利用PROSA[19]程序(https://prosa.services.came.sbg.ac.at/prosa.php)對(duì)蛋白結(jié)構(gòu)能量進(jìn)行檢驗(yàn)。
2.1 基因序列分析
rAgaN3的 DNA序列共有 834 bp,其中第 831~834位為終止密碼子TAA,該蛋白含有 277個(gè)氨基酸?;蚣暗鞍仔蛄腥鐖D1。
從 NCBI的 BLASTp的序列比對(duì)結(jié)果中選擇12條Identity比較高的序列,與rAgaN3的序列在Clustal X 上進(jìn)行序列比對(duì),然后利用MEGA5.2構(gòu)建系統(tǒng)進(jìn)化樹(shù)。系統(tǒng)進(jìn)化樹(shù)構(gòu)建結(jié)果如圖2所示。
NCBI數(shù)據(jù)庫(kù)中BLASTp同源性分析表明,rAgaN3序列與已知瓊膠酶序列agaraseMicrobulbiferthermotolerans(BAD29947.1)、agaraseMicrobulbiferthermotolerans(3WZ1A)以及agaraseMicrobulbifersp. AG1(ALN70307.2)都有88%的序列相似性。
系統(tǒng)進(jìn)化樹(shù)節(jié)點(diǎn)上的數(shù)字是自展值,用來(lái)分析進(jìn)化樹(shù)分支可信度。0.05代表每100個(gè)氨基酸中5個(gè)氨基酸替換。由經(jīng)過(guò)給定的repetitions(500次)重排構(gòu)樹(shù)打分后,每個(gè)分支對(duì)應(yīng)一個(gè)數(shù)值。數(shù)值越高,表示分支的可信度越高,由此來(lái)確定進(jìn)化遠(yuǎn)近程度。rAgaN3與Microbulbiferthermotolerans(3WZ1A)、Microbulbiferthermotolerans(BAD29947.1)的自展值均為 100。結(jié)合BLASTp同源性分析,基本可以確定該蛋白來(lái)自Microbulbiferthermotolerans。
2.2 蛋白質(zhì)一級(jí)結(jié)構(gòu)預(yù)測(cè)
2.2.1 蛋白質(zhì)理化性質(zhì)分析
通過(guò)ProtParam預(yù)測(cè)蛋白rAgaN3的理化性質(zhì),結(jié)果見(jiàn)表1。
圖 1 rAgaN3 基因序列和氨基酸序列Fig.1 rAgaN3 gene sequence and amino acid sequence
圖 2 系統(tǒng)進(jìn)化樹(shù)Fig.2 Phylogenetic tree
2.2.2 親疏水性分析
蛋白質(zhì)內(nèi)部親疏水性氨基酸的組成影響蛋白質(zhì)折疊的程度,蛋白質(zhì)的折疊情況可利用親水性分布圖來(lái)反映。用ProtScale 計(jì)算出蛋白質(zhì)親疏水性分布圖,用Hphob. / Kyte & Doolittle 標(biāo)度,各個(gè)氨基酸打分分值見(jiàn)表2。
表 1 rAgaN3 理化性質(zhì)分析表Table 1 Physical and chemical property analysis of rAgaN3
表 2 氨基酸分值表Table 2 Amino acid score
分析親水區(qū)和疏水區(qū),如圖3所示。
圖 3 瓊膠酶氨基酸序列疏水性親水性預(yù)測(cè)Fig.3 Predicted hydrophobicity/hydrophilicity of the amino acid sequence of agarase
橫坐標(biāo)表示氨基酸位置,縱坐標(biāo)表示標(biāo)度得分,Score小于0表示親水,大于0表示疏水。圖中顯示親水性值峰明顯多于疏水性值峰,這些親水性值峰區(qū)域常富集富集親水性氨基酸,同時(shí)也是蛋白質(zhì)進(jìn)化中氨基酸插入的主要位點(diǎn)[20],推測(cè)此蛋白為親水性蛋白,蛋白可溶于水。
2.2.3 跨膜區(qū)預(yù)結(jié)構(gòu)預(yù)測(cè)與信號(hào)肽分析
蛋白質(zhì)的跨膜區(qū)域是指蛋白在膜內(nèi)與細(xì)胞膜膜脂相結(jié)合的部分,TMHMM是一種基于隱馬爾可夫模型的跨膜螺旋預(yù)測(cè)算法,TMHMM的預(yù)測(cè)結(jié)果如圖4所示。
圖 4 瓊膠酶跨膜區(qū)預(yù)測(cè)Fig.4 Predicted transmembrane domain of agarase
TMHMM預(yù)測(cè)rAgaN3跨膜螺旋區(qū)域?yàn)榱?,說(shuō)明該蛋白不是跨膜蛋白,推測(cè)該蛋白在細(xì)胞內(nèi)合成之后不能立即分泌到胞外行使功能。
信號(hào)肽是將細(xì)胞內(nèi)新合成的蛋白質(zhì)引導(dǎo)分泌至胞外的短肽鏈,一般長(zhǎng)度為5~30個(gè)氨基酸。SignalP是基于神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)算法,預(yù)測(cè)給定氨基酸序列中潛在的信號(hào)肽剪切位點(diǎn)[14]。SignalP 4.1預(yù)測(cè)信號(hào)肽位置,結(jié)果如圖5。
圖 5 信號(hào)肽預(yù)測(cè)Fig.5 Signal P prediction of agarase
圖中C-score是信號(hào)肽酶切位點(diǎn)值,一般剪切位點(diǎn)處的C-score最高;S-score是信號(hào)肽值,一般信號(hào)肽區(qū)域的S-score最高;Y-score是綜合得出的剪切位點(diǎn)分值。預(yù)測(cè)結(jié)果顯示mean S score為0.052,遠(yuǎn)小于分泌型蛋白標(biāo)準(zhǔn)0.5,結(jié)合圖13,可以認(rèn)為此蛋白沒(méi)有信號(hào)肽。綜合跨膜區(qū)域和信號(hào)肽預(yù)測(cè),蛋白rAgN3為胞內(nèi)蛋白,需要在菌體裂解之后才能在胞外行使其功能。
2.3 蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)
蛋白質(zhì)二級(jí)結(jié)構(gòu)包括螺旋(Helix)、折疊(Strand)、無(wú)規(guī)則卷曲(Coils)以及模體(motif)等組件。
2.3.1 PSIPRED預(yù)測(cè)蛋白二級(jí)結(jié)構(gòu)
PSIPRED通過(guò)PSI-BLAST 搜索同源序列預(yù)測(cè)蛋白質(zhì)二級(jí)結(jié)構(gòu),由于采用嚴(yán)格的交叉驗(yàn)證,使預(yù)測(cè)平均準(zhǔn)確率高達(dá)80%。PSIPRED預(yù)測(cè)蛋白rAgaN3的二級(jí)結(jié)構(gòu)結(jié)果如圖6所示。
圖 6 瓊膠酶二級(jí)結(jié)構(gòu)預(yù)測(cè)Fig.6 Predicted secondary structure of agarase
AA代表了目標(biāo)蛋白質(zhì)的氨基酸序列。Pred 代表了二級(jí)結(jié)構(gòu)以及相應(yīng)的圖例(H:Helix;C:Coil;E:Strand)。Conf 數(shù)值在1~9 變化,數(shù)值越高,置信度越高。由PSIPRED預(yù)測(cè)結(jié)果可知 :rAgaN3二級(jí)結(jié)構(gòu)主要由折疊和卷曲結(jié)構(gòu)構(gòu)成,其中含有15個(gè)折疊結(jié)構(gòu),其余為卷曲結(jié)構(gòu)。
2.3.2 模體搜索
模體(motif)表示蛋白質(zhì)中具有特定空間構(gòu)象和特定功能的結(jié)構(gòu)成分。用BLAST在默認(rèn)的情況下進(jìn)行了CD 搜索,向BLASTp提交序列后,獲得的結(jié)果如圖7所示。
圖 7 模體結(jié)構(gòu)Fig.7 Motif structure
該瓊膠酶屬于糖苷水解類(lèi)16家族(GH16),屬于LamG超家族;有11個(gè)活性位點(diǎn)分布于75~262氨基酸之間;有3個(gè)催化殘基,3個(gè)Ca2+結(jié)合位點(diǎn),但都在活性區(qū)域以外,推斷Ca2+對(duì)瓊膠酶活性可能無(wú)太大的促進(jìn)作用。
2.4 結(jié)構(gòu)域與功能分析
2.4.1 結(jié)構(gòu)域分析
結(jié)構(gòu)域是蛋白質(zhì)序列功能、結(jié)構(gòu)和進(jìn)化的單元,通常由50~300 個(gè)氨基酸組成,有空間構(gòu)象特異性。SMART預(yù)測(cè)結(jié)果如圖8:該蛋白序列56~267 位氨基酸對(duì)應(yīng)于Glyco_hydro_16 的結(jié)構(gòu)域。
圖 8 瓊膠酶結(jié)構(gòu)域Fig.8 Structural domain of agarase
Glyco_hydro_16在PFAM 數(shù)據(jù)庫(kù)的編號(hào)為PF00722,進(jìn)行查看和分析。糖苷水解酶16家族是糖苷水解酶的一個(gè)家族。糖苷水解酶(EC 3.2.1)是一類(lèi)廣泛存在的酶系,水解兩個(gè)或以上的糖類(lèi)。
查詢(xún)CAZY數(shù)據(jù)庫(kù)可知,糖苷水解酶16家族由許多具有已知活性的酶組成,包括: 葡聚糖酶、瓊膠酶、透明質(zhì)酸酶、半乳糖苷酶、卡拉膠酶、木聚糖酶等。
2.4.2 PredictProtein預(yù)測(cè)蛋白信息
歐洲分子生物學(xué)實(shí)驗(yàn)室提供的蛋白質(zhì)序列和結(jié)構(gòu)預(yù)測(cè)服務(wù)網(wǎng)站 PredictProtein,可以得到蛋白質(zhì)多序列比對(duì)、低復(fù)雜區(qū)、溶劑可及性、跨膜螺旋、卷曲螺旋區(qū)、核定位信號(hào)及二級(jí)結(jié)構(gòu)等信息。其中跨膜螺旋、二硫鍵、結(jié)合位點(diǎn)預(yù)測(cè)結(jié)果分別見(jiàn)圖9、圖10、圖11。
圖 9 跨膜螺旋區(qū)域預(yù)測(cè)Fig.9 Predicted transmembrane domain
圖 10 二硫鍵預(yù)測(cè)Fig.10 Predicted disulfide bonds
PredictProtein預(yù)測(cè)得到:rAgaN3 無(wú)跨膜螺旋區(qū)域,與TMHMM預(yù)測(cè)結(jié)果一致。
PredictProtein預(yù)測(cè)得到:rAgaN3 無(wú)二硫鍵結(jié)構(gòu)。
圖11 結(jié)合位點(diǎn)預(yù)測(cè)Fig.11 Predicted binding sites
PredictProtein預(yù)測(cè)得到:rAgaN3 存在14 個(gè)蛋白質(zhì)結(jié)合位點(diǎn)以及2 個(gè)多核苷酸結(jié)合位點(diǎn)。
PredictProtein預(yù)測(cè)分子功能本體論如表3所示。
表 3 分子功能本體論Table 3 Molecular function ontology
分子功能本體論表明:該蛋白可能具有水解酶活性,水解O-糖苷化合物(GO:0004533);水解酶活性,作用于糖苷鍵(GO:0016798);β-瓊膠酶活性(GO:0033916);催化活性(GO:0003824)??煽啃苑謩e為43%、42%、37%,28%和23%??梢酝茰y(cè)該蛋白是一種糖苷水解酶,與結(jié)構(gòu)域分析該酶屬于糖苷水解酶GH16結(jié)果一致。
PredictProtein生化過(guò)程本體論如表4所示。
表 4 生化過(guò)程本體論Table 4 Biological process ontology
生化過(guò)程本體論表明:該蛋白參與新陳代謝過(guò)程(GO:0008152),最初的新陳代謝過(guò)程(GO:0044238),糖類(lèi)代謝過(guò)程(GO:0005975)和有機(jī)物質(zhì)的代謝過(guò)程(GO:0071704)??煽啃苑謩e為35%、27%、27%和27%,可以推測(cè)該蛋白參與體內(nèi)新陳代謝。
2.4.3 亞細(xì)胞定位及導(dǎo)肽預(yù)測(cè)分析
用Target1.1進(jìn)行亞細(xì)胞定位及導(dǎo)肽分析,結(jié)果如表5。
表 5 瓊膠酶亞細(xì)胞定位Table 5 Subcellular location of agarase
Target1.1預(yù)測(cè)結(jié)果顯示:該蛋白質(zhì)氨基酸序列長(zhǎng)277 個(gè)氨基酸,存在線粒體目標(biāo)肽(mTP)的可能性為7.0%,存在信號(hào)肽(SP)的可能性為7.3%,其他導(dǎo)肽或無(wú)導(dǎo)肽的可能性為93.4%。目的蛋白rAgaN3 的分泌途徑為—型,即定位在其他細(xì)胞器,沒(méi)有剪切位點(diǎn)的序列,可靠性級(jí)別為1級(jí)。與跨膜螺旋區(qū)域、信號(hào)肽預(yù)測(cè)結(jié)果相匹配。
2.5 蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè)
2.5.1 同源建模
SWISS-MODEL是目前應(yīng)用最廣泛的在線同建模網(wǎng)站,利用同源建模的方法實(shí)現(xiàn)對(duì)未知結(jié)構(gòu)的序列的預(yù)測(cè)。在PDB數(shù)據(jù)庫(kù)中找到與瓊膠酶rAgaN3 的近同源蛋白3wz1A(MicrobulbiferthermotoleransJAMB-A94 GH16家族,β-瓊膠酶)作為模板。rAgaN3與3wz1A的蛋白序列比對(duì)如圖12所示。
圖 12 rAgaN3 與3wz1A 蛋白的序列比對(duì)Fig.12 Sequence alignment of rAgaN3 and 3wz1A protein
由圖12可以看出,rAgaN3與模板蛋白序列大部分氨基酸是極保守的,相似程度達(dá)到88%,用3wz1A作為同源建模模板準(zhǔn)確性較高。用SWISS-MODEL預(yù)測(cè)得到三維結(jié)構(gòu),序列從N 端到C 端分別用綠色到紅色表示(見(jiàn)圖13)??梢钥闯?,瓊膠酶rAgaN3的主要由β-折疊構(gòu)成,整體結(jié)構(gòu)類(lèi)似“三明治”狀,由15個(gè)折疊結(jié)構(gòu)組成,與Allouch等[21]報(bào)道過(guò)的GH16家族的瓊膠酶β-jelly-roll結(jié)構(gòu)較為類(lèi)似。
圖 13 瓊膠酶三級(jí)結(jié)構(gòu)Fig.13 Tertiary structure of agarase
2.5.2 結(jié)構(gòu)合理性評(píng)價(jià)
用SAVES服務(wù)器對(duì)結(jié)構(gòu)進(jìn)行PROCHECK評(píng)價(jià),PROCHECK程序不考慮能量,只檢測(cè)結(jié)構(gòu)中的殘基之間角度是否合理,生成Ramachandran plot。檢測(cè)結(jié)果見(jiàn)圖14。
圖14 拉式圖Fig.14 Ramachandran plot
PROCHECK顯示氨基酸殘基核心區(qū):91.3%,允許區(qū):8.3%,大致允許區(qū):0.4%,禁阻區(qū):0%,位于可接受區(qū)的達(dá)到了100%,一般位于可接受區(qū)的氨基酸殘基大于90%可以認(rèn)為蛋白結(jié)構(gòu)合理。rAgaN3建模得到的結(jié)構(gòu)符合立體化學(xué)的原則,模型各殘基之間的角度很合理。
PROSA程序是檢測(cè)蛋白結(jié)構(gòu)能量常用的工具,反映的是結(jié)構(gòu)中殘基之間的能量是否合理。得到的結(jié)果一般為負(fù)值。程序評(píng)價(jià)結(jié)果見(jiàn)圖15。
圖15 Z-score圖Fig.15 Z-score of rAgaN3
本實(shí)驗(yàn)的Z-score為-7.04(圖中黑點(diǎn)所示),藍(lán)色部分為所有已解析的晶體結(jié)構(gòu)的Z-score分布情況。由圖可知,rAgaN3的Z-score位于中心的位置,說(shuō)明該結(jié)構(gòu)在能量上是十分合理的。綜合Ramachandran plot和Z-score的結(jié)果分析,SWISS-MODEL構(gòu)建出的瓊膠酶結(jié)構(gòu)是相當(dāng)可靠的。
重組瓊膠酶rAgaN3理論分子量為31.243 kDa,理論等電點(diǎn)為4.81,脂肪系數(shù)為62.35,不穩(wěn)定系數(shù)為26.23,小于40,說(shuō)明蛋白較穩(wěn)定,總平均疏水性為-0.662,小于0,預(yù)測(cè)為親水性蛋白;二級(jí)結(jié)構(gòu)預(yù)測(cè)得到:該蛋白無(wú)螺旋結(jié)構(gòu),有15 個(gè)折疊結(jié)構(gòu),其余均為卷曲結(jié)構(gòu)。無(wú)信號(hào)肽,無(wú)跨膜區(qū)域也沒(méi)有二硫橋。根據(jù)序列分析表明,rAgaN3屬于糖苷水解酶GH16 家族,為β-瓊膠酶。采用序列比對(duì)算法搜索蛋白質(zhì)結(jié)構(gòu)PDB 數(shù)據(jù)庫(kù),找到與瓊膠酶rAgaN3的近同源蛋白3wz1A(MicrobulbiferthermotoleransJAMB-A94 GH16 家族,β-瓊膠酶),序列相似性達(dá)到88%。運(yùn)用同源建模法,使用SWISS-MODEL 構(gòu)建重組瓊膠酶rAgaN3的三維結(jié)構(gòu)模型,可以認(rèn)為此瓊膠酶是典型的GH16家族瓊膠酶結(jié)構(gòu),并用PROCHECK和PROSA進(jìn)行了結(jié)構(gòu)檢驗(yàn)。
本研究從瓊膠酶的序列出發(fā),對(duì)序列中包含的生物信息進(jìn)行了系統(tǒng)的研究,預(yù)測(cè)了瓊膠酶rAgaN3的基本理化性質(zhì),為理解瓊膠酶特性提供了參考。后續(xù)工作可以本文預(yù)測(cè)信息為基礎(chǔ),將基因在大腸桿菌表達(dá)系統(tǒng)和畢赤酵母表達(dá)系統(tǒng)中進(jìn)行異源表達(dá),并對(duì)重組瓊膠酶的酶學(xué)性質(zhì)進(jìn)行測(cè)定,以驗(yàn)證生物信息學(xué)預(yù)測(cè)結(jié)果。用高同源性的模板同源建模得到的較可靠的蛋白質(zhì)三維結(jié)構(gòu),為理解瓊膠酶的結(jié)構(gòu)特性以及催化機(jī)制打下了良好的基礎(chǔ)。并且可以從蛋白質(zhì)的三維結(jié)構(gòu)出發(fā),通過(guò)分子對(duì)接、分子動(dòng)力學(xué)模擬等方法,以提高比活力以及改善酶學(xué)性質(zhì)為目標(biāo),預(yù)測(cè)潛在的突變位點(diǎn)并進(jìn)行定點(diǎn)突變實(shí)驗(yàn),深入研究瓊膠酶結(jié)構(gòu)與功能的關(guān)系。
References)
[1]梅建鳳, 李莎, 茅鶴婷, 等. 一株產(chǎn)瓊膠酶海洋細(xì)菌的分離與鑒定[J]. 海洋科學(xué), 2014,38(2): 71-75.DOI: 10.11759/hykx20130502003.
MEI Jianfeng,LI Sha,MAO Heting,et al. Isolation and identification of a marine bacteria producing agarase[J]. Marine Sciences, 2014, 38(2): 71-75. DOI: 10.11759/hykx20130502003.
[2]POTIN P, RICHARD C, ROCHAS C, et al. Purification and characterization of the α-agarase fromAlteromonasagarlyticus(Cataldi) comb. nov., strain GJ1B[J]. European Journal of Biochemistry,1993,214(2): 599-607. DOI: 10.1111/j.1432-1033.1993.tb17959.x.
[3]KIRIMURA K, MASUDA N, IWASAKI Y, et al. Purification and characterization of a novel beta-agarase from an alkalophilic bacterium,Alteromonassp. E-1.J[J].Bioscience and Bioengineering,1999, 87(4): 436-441.DOI: 10.1016/S1389-1723(99)80091-7.
[4]USOV A I, MIROSHNIKOVA L I. Isolation of agarase fromLittorinamandshuricaby affinity chromatography on Biogel A[J]. Carbohydrate Research, 1975, 43(1): 204-207. DOI:10.1016/S0008-6215(00)83989-0.
[5]USOV A I, MARTYNOVA M D.Detection of agarase in molluscs of the genusLittorina[J]. Doklady Akademii Nauk SSSR, 1970, 194(2): 455-457.
[6]胡曉珂,江曉路,管華詩(shī).海藻多糖降解酶的性質(zhì)和作用機(jī)理[J].微生物學(xué)報(bào), 2001,41(6):762-766.
HU Xiaoke, JIANG Xiaolu, GUAN Huashi. Properties and mechanisms of marine polysaccharisases[J].Acta Microbiologica Sinica, 2001(6): 762-766.
[7]MORTICE L M, MCLEAN M W, LONG W F, et al.Porphyran primary structure. An investigation using beta-agarase I from Pseudomonas atlantica and 13C-NMR spectroscopy[J]. European Journal of Biochemistry, 1983, 133(3): 673-684. DOI: 10.1111/j.1432-1033.1983.tb07516.x.
[8]SUGANO Y, TERADA I, ARITA M, et al.Purification and characterization of a new agarase from a marine bacterium,Vibriosp. strain JT0107[J]. Applied and Environmental Microbiology,1993,59(5): 1549-1554.
[9]BUTTNER M J, FEARNLEY I M, BIBB M J.The agarase gene (dagA) of Streptomyces coelicolor A3:nucleotide sequence and transcriptional analysis[J]. Molecular and General Genetics MGG, 1987,209(1): 101-109. DOI: 10.1007/BF00329843.
[10]TAKAGI E, HATADA Y, AKITA M, et al. Crystal structure of the catalytic domain of a GH16 β-agarase from a deep-sea bacterium, microbulbifer thermotolerans JAMB-A94[J]. Bioscience, Biotechnology,s&sbiochemistry, 2014, 79(4): 1-8.DOI:10.1080/09168451.2014.988680.
[11]GASTEIGER E, HOOGLAND C, GATTIKER A, et al. Protein identification and analysis tools on the ExPASy Server[J]. Proteomics Protocols Handbook, 2005, 112(112): 571-607.DOI:10.1385/1-59259-890-0:571.
[12]熊偉, 楊勇琴, 張海洋,等.人線粒體轉(zhuǎn)錄終止因子1(hMTERF1)蛋白的生物信息學(xué)分析[J]. 生物信息學(xué), 2015, 13(1): 23-30.DOI:10.3969/j.issn.1672-5565.2015.01.01.
XIONG Wei,YANG Yongqin,ZHANG Haiyang,et al. Bioinformatic analysis of human mitochondrial transcription termination factor 1(hMTERF1)[J]. Chinese Journal of Bioinformatics,2015, 13(1): 23-30. DOI:10.3969/j.issn.1672-5565.2015.01.01.
[13]周雅, 高貝, 張道遠(yuǎn). 齒肋赤蘚早期光誘導(dǎo)蛋白ELIPs的生物信息學(xué)分析[J]. 生物信息學(xué), 2014, 12(4): 233-241.DOI:10.3969/j.issn.1672-5565.2017.04.01.
ZHOU Ya,GAO Bei,ZHANG Daoyuan. Bioinformatic analysis of early light-induced protein (ELIPs)inSyntrichiacaninervis[J]. Chinese Journal of Bioinformatics,2014, 12(4): 233-241. DOI:10.3969/j.issn.1672-5565.2017.04.01.
[14]PETERSEN T N, BRUNAK S, VON H G, et al. SIGNALP 4.0: discriminating signal peptides from transmembrane regions[J]. Nature Methods, 2010, 8(10): 785-786. DOI: 10.1038/nmeth.1701.
[15]SCHULTZ J, MILPETZ F, BORK P, et al. SMART, a simple modular architecture research tool:Identification of signaling domains[J]. Proceedings of the National Academy of Sciences, 1998,95(11): 5857-5864. DOI: 10.1073/pnas.95.11.5857.
[16]LOMBARD V, GOLACONDA R H, DRULA E, et al. The carbohydrate-active enzymes database (CAZy) in 2013.[J]. Nucleic Acids Research, 2014, 42(Database issue): 490-495. DOI: 10.1093/nar/gkt1178.
[17]ARNOLD K, BORDOLI L, KOPP J, et al.The SWISS-MODEL workspace: a web-based environment for protein structure homology modelling[J]. Bioinformatics, 2006, 22(2): 195-201. DOI: 10.1093/bioinformatics/bti770.
[18]LASKOWSKI R A, RULLMANNN J A, MACARTHUR M W, et al. AQUA and PROCHECK-NMR: programs for checking the quality of protein structures solved by NMR[J]. Journal of Biomolecular Nmr, 1996,8(4): 477-486.
[19]WIEDERSTEIN M, SIPPL M J.ProSA-web: interactive web service for the recognition of errors in three-dimensional structures of proteins[J]. Nucleic Acids Research, 2007, 35(Web Server issue): 407-410. DOI: 10.1093/nar/gkm290.
[20]王明強(qiáng), 高貝, 張道遠(yuǎn). 2個(gè)銀葉真蘚HSP70序列的生物信息學(xué)相關(guān)分析[J]. 生物信息學(xué), 2015(1): 1-8.DOI:10.3969/j.issn.1672-5565.2015.01.01.
WANG Mingqiang,GAO Bei,ZHANG Daoyuan.Bioinformatics relevant analysis of two heat shock protein 70 sequence fromBryumargenteum[J]. Chinese Journal of Bioinformatics,2015, 13(1): 1-8. DOI:10.3969/j.issn.1672-5565.2015.01.01.
[21]ALLOUCH J, JAM M, HELBERT W, et al. The three-dimensional structures of two β-agarases[J]. Journal of Biological Chemistry, 2003, 278(47): 47171-47180. DOI: 10.1074/jbc.M308313200.
Bioinformatics analysis of the recombinantrAgaN3 gene of agarase
XIE Yong,HONG Xiaokun,YAN Renxiang,LIN Juan*
(FujianProvincialKeyLaboratoryofMarineEnzymeEngineering(FuzhouUniversity),Fuzhou350116,China)
In this paper, the agarase enzyme gene namedrAgaN3 is analyzed which is cloned fromMicrobulbifersp. BN via various bioinformatics methods. The results show that the calculated molecular mass of reorganization of agaroserAgaN3 is 31.243 kDa, the theoretical isoelectric point is 4.81, 26.23 of the nstability coefficient, 62.35 of the fat index, and minus 0.662 of the average hydrophobic coefficient, and there is no transmembrane domain and no signal peptide. By analyzing the secondary structure of protein, we can find there are 15 β-sheet structures, other coiled structures, and no helical structure. According to the analysis of sequence similarities, we can know rAgaN3 is a β-agarase, belongs to glycoside hydrolase GH16 family. It is templated by a homologous protein 3wz1A (88 homology), sets up tertiary structure of protein by creating homology modeling and tests its structure by Ramachandran Plot and PROSA. The bioinformatics analysis ofrAgaN3 gene of Agarase can provide a guidance to heterologous expression of agarase and lay good foundations for the site-directed mutagenesis of agarase and comprehensive study on the relationship between structure and function.
Agarase; Gene analysis; Bioinformatics; Protein structure
2016-08-20;
2016-10-18.
福建省企業(yè)技術(shù)創(chuàng)新項(xiàng)目(閩經(jīng)信投資[2015]205號(hào));福州市科技計(jì)劃項(xiàng)目(No.2016-G-42)。
謝勇,男,碩士研究生,研究方向:微生物學(xué);E-mail:1148494580@qq.com.
*通信作者:林娟,女,教授,博士生導(dǎo)師,研究方向:微生物學(xué)及生物化學(xué)與分子生物學(xué);E-mail: ljuan@fzu.edu.cn.
10.3969/j.issn.1672-5565.2017.01.201608003
Q55
A
1672-5565(2017)01-016-11