黃海云,張 屹,萬張勇
(1.河北科技大學(xué)圖書館,河北石家莊 050018;2.河北科技大學(xué)理學(xué)院,河北石家莊 050018;3.河北科技大學(xué)研究生學(xué)院,河北石家莊 050018)
昆蟲幾丁質(zhì)酶的進(jìn)化與保守性質(zhì)的比較基因組學(xué)研究
黃海云1,張 屹2,萬張勇3
(1.河北科技大學(xué)圖書館,河北石家莊 050018;2.河北科技大學(xué)理學(xué)院,河北石家莊 050018;3.河北科技大學(xué)研究生學(xué)院,河北石家莊 050018)
昆蟲幾丁質(zhì)酶家族屬于第18家族糖苷鍵水解酶,主要參與昆蟲蛻皮、細(xì)胞增殖和免疫等生理過程。在7個物種基因組數(shù)據(jù)中通過BLASTP和PSI-BLAST的方法獲得131條chitinase和chitinase-like的同源蛋白質(zhì),利用隱馬爾科夫算法,找到了幾丁質(zhì)蛋白的保守模體區(qū)域。通過進(jìn)化樹分析,將所選的蛋白分為9組,與糖苷水解酶18催化結(jié)構(gòu)域和幾丁質(zhì)結(jié)合結(jié)構(gòu)域的特性一致。通過PAML軟件計(jì)算出幾丁質(zhì)酶的正向選擇位點(diǎn),發(fā)現(xiàn)了豌豆蚜蟲中的A.pisum xp003243674.1為一條新的幾丁質(zhì)酶蛋白。對深入研究昆蟲幾丁質(zhì)酶結(jié)構(gòu)與功能很有幫助。
幾丁質(zhì)酶;同源蛋白;進(jìn)化樹;模體;正向選擇位點(diǎn)
幾丁質(zhì)(chitin)是N-乙酞胺基葡萄糖(GluNAc)以β-l,4糖苷鍵組成的線性多聚物,通常又被稱為甲殼素或殼多糖。自然界的很多生物,特別是無脊椎動物、藻類或真菌等,其機(jī)體主要結(jié)構(gòu)性成分為幾丁質(zhì),哺乳動物體內(nèi)沒有幾丁質(zhì)[1]。昆蟲的外骨骼就是由幾丁質(zhì)骨架構(gòu)建而成,在昆蟲生長發(fā)育的各個時期,幾丁質(zhì)的含量和分布都在發(fā)生著變化[2]。昆蟲幾丁質(zhì)酶主要在表皮和中腸中表達(dá),參與昆蟲蛻皮過程中外表皮和圍食膜幾丁質(zhì)結(jié)構(gòu)的降解[3]。蛻皮腺中的幾丁質(zhì)酶可以調(diào)節(jié)昆蟲在生長發(fā)育中周期性地蛻去舊表皮并合成新表皮,毒腺中的幾丁質(zhì)酶有助于毒腺物質(zhì)在取食對象的組織中擴(kuò)散。幾丁質(zhì)酶可以降解幾丁質(zhì)為低分子質(zhì)量、可溶或不可溶的寡糖[4],通過破壞昆蟲的幾丁質(zhì),或抑制幾丁質(zhì)酶的活性,都可以影響昆蟲的生長發(fā)育。鑒于幾丁質(zhì)酶在昆蟲發(fā)育過程中的重要作用,通過擾亂幾丁質(zhì)酶的正常調(diào)控,進(jìn)而破壞幾丁質(zhì)新陳代謝過程來防治害蟲,可作為新型生物防治策略,具有極大的發(fā)展?jié)摿5]。幾丁質(zhì)酶在農(nóng)業(yè)生產(chǎn)中有著極為重要的作用,但是對于幾丁質(zhì)酶蛋白的進(jìn)化與保守功能域的系統(tǒng)研究還未見報道。另一方面,與其他物種幾丁質(zhì)酶家族相比,昆蟲幾丁質(zhì)酶家族成員最多,分化也最大。有的研究者認(rèn)為,這些昆蟲幾丁質(zhì)酶家族成員都是由最初的5個幾丁質(zhì)酶祖先基因通過基因復(fù)制和功能分化而來的[6-8]。所以,通過對這個家族蛋白質(zhì)的進(jìn)化進(jìn)行理論探討對于研究其功能是有幫助的。
圖1 典型的幾丁質(zhì)酶結(jié)構(gòu)Fig.1 Typical structure of chitinase
昆蟲幾丁質(zhì)酶基因結(jié)構(gòu)的普遍特點(diǎn)是含有多個功能區(qū),包括信號肽區(qū)、幾丁質(zhì)酶N端催化區(qū)、富含蘇氨酸和絲氨酸的糖基化位點(diǎn)區(qū)和C端富含半胱氨酸的幾丁質(zhì)結(jié)合區(qū),其中N端催化區(qū)的序列具有保守性,決定著酶的催化活性[9]。昆蟲存在典型的幾丁質(zhì)酶結(jié)構(gòu),如圖1所示,而且是具有多催化區(qū)和多結(jié)合區(qū)的結(jié)構(gòu)。根據(jù)氨基酸序列的特征,幾丁質(zhì)酶歸屬第18和第19家族糖苷鍵水解酶,昆蟲幾丁質(zhì)酶屬于第18家族糖苷鍵水解酶。
2010年,MEUSEMANN用系統(tǒng)遺傳學(xué)方法對節(jié)肢動物進(jìn)行了分析[10]。本研究參考該文獻(xiàn)對昆蟲各個目的代表性物種進(jìn)行了選擇: 膜翅目選擇意大利蜜蜂,雙翅目選擇岡比亞按蚊和黑腹果蠅,鞘翅目選擇赤擬谷盜,半翅目選擇豌豆蚜蟲,鱗翅目選擇家蠶,虱目選擇人體虱。
把模式生物果蠅中確定的chitinase蛋白質(zhì)序列作為模板,在多個數(shù)據(jù)庫中查詢同源序列。首先,在所選物種蛋白數(shù)據(jù)庫中用BLASTP篩選出同源蛋白;然后,為了防止遺漏,又采用PSI-BLAST搜索1次(閾值設(shè)置為e-08);最后,把這2次搜索的結(jié)果與文獻(xiàn)[7]和文獻(xiàn)[11]的數(shù)據(jù)相結(jié)合,就得到131條蛋白質(zhì)序列。數(shù)據(jù)的詳細(xì)情況如表1所示。
表1 幾丁質(zhì)酶在所選物種中的數(shù)量
注:昆蟲的物種簡寫說明(括號內(nèi)為物種簡寫):Triboliumcastaneum (T.castaneum);Anopheles gambiae (A.gambiae);Drosophila melanogaster (D.melanogaster);Acyrthosiphonpisum (A.pisum);Apismellifera (A.mellifera);Bombyxmori (B.mori);Pediculushumanus (Ph.corporis)。
基于隱馬爾可夫模型,將這131條幾丁質(zhì)酶氨基酸序列用MEME軟件來計(jì)算Motif圖。發(fā)現(xiàn)處于分值前3位高的Motif都是屬于后部結(jié)合區(qū)的Motif,其他分值較低的Motif才屬于中部催化區(qū)的。這說明幾丁質(zhì)酶的后部結(jié)合區(qū)擁有最大的保守性,而中部催化區(qū)的功能保守性遠(yuǎn)沒有后部結(jié)合區(qū)的保守性大,因而其序列擁有較大的可變性。圖2所示的是分值最高的Motif圖,這段Motif所對應(yīng)的氨基酸序列的正則表達(dá)式為W[IV][SG][YF][ED][DN][EP]D[ST]?[AIV]G.K[AV]E[FY][AV]K[ES].{0,1}K[GN]L[AG]G[IV][AM][IV][FW][DS][IL][DS][LT]DDFRG?.?C?.{0,8}G?E?.{0,2}K?[YNF]?P?[IL]?L?R?A[IV]?[KN]?。 其中:[]表示一個位置上有多個優(yōu)勢氨基酸;單字母則表示唯一的優(yōu)勢氨基酸;?表示沒有顯著優(yōu)勢的氨基酸;{}里面的數(shù)字是這個位置可能插入符號串的長度。
圖2 幾丁質(zhì)酶基因的Motif圖Fig.2 Motif figure of chitinase genes
選擇PAML[12]來計(jì)算進(jìn)化位點(diǎn),它的一個重要功能就是檢測基因是否受到適應(yīng)性選擇的壓力,它用dN表示核苷酸的異義突變率,用dS表示同義突變率,然后取它們的比值dN/dS作為衡量選擇壓力的參數(shù)。如果比值大于1,表示該基因序列承受正選擇壓力;若比值等于1,則表示該序列處于中性選擇壓力;如果比值小于1,就表示承受的是純化作用力。在用PAML軟件進(jìn)行計(jì)算時,選擇了6個不同的密碼子替代模型,分別是0(one)和3(discrete),1(neutral)和2(selection),7(beta)和8(beta&w)。用似然率(likelihood-ratio)檢測來比較每組的2個模型。對所搜到的131條序列進(jìn)行選擇壓力的計(jì)算,在7和8模型中,chitinase基因家族在10A,14P,19N這3個位點(diǎn)受到較弱的正向選擇壓力,因?yàn)樗鼈兊膒r(w>1)分別為0.913,0.882和0.773,只有當(dāng)這個概率大于0.950時才表明該位點(diǎn)受到較強(qiáng)的正向選擇壓力。說明這種蛋白值整體上的適應(yīng)性進(jìn)化強(qiáng)度不大,這應(yīng)該來源于它特別重要且保守的功能。
對這131條蛋白質(zhì)運(yùn)用MEGA5[13]中的鄰接法建立進(jìn)化樹,并用Bootstrap自展法檢驗(yàn)5 000次計(jì)算各個分支的可信度,得到的進(jìn)化樹如圖3所示。
圖3 幾丁質(zhì)酶進(jìn)化樹Fig.3 Chitinase evolution tree
結(jié)合用SMART在線網(wǎng)站預(yù)測的序列結(jié)構(gòu)域和用signaIP網(wǎng)站預(yù)測的信號肽,根據(jù)進(jìn)化樹的拓?fù)浣Y(jié)構(gòu),可把所選的131條昆蟲幾丁質(zhì)酶蛋白分為9組。下面對于這9組逐一進(jìn)行分析。
第1組幾丁質(zhì)酶所含的序列最多,進(jìn)化樹的分化也較大。這些蛋白主要在昆蟲的中腸表達(dá),它們N端都含有信號肽,然后是1個糖苷水解酶18結(jié)構(gòu)域;除了果蠅和赤擬谷盜的cht4和cht8,岡比亞按蚊的XP_315351.4,XP_001688641.1,XP_307732.4和XP_316448.2及意大利蜜蜂的XP_397146.3含有1個ChBD2(幾丁質(zhì)結(jié)合2域)之外,其余都沒有幾丁質(zhì)結(jié)合區(qū)。
第2組幾丁質(zhì)酶結(jié)構(gòu)域的N端有1個Glyco_18催化結(jié)構(gòu)域,2個幾丁質(zhì)結(jié)合區(qū)之間含有大量的低復(fù)雜性區(qū)域,這段序列是絲氨酸和蘇氨酸富含區(qū),而且所選每個物種都含有此類序列。其中岡比亞按蚊的XP_316142.4、意大利蜜蜂的 XP_001122144.1、家蠶的BGIBMGA009890-PA只有催化結(jié)構(gòu),并沒有幾丁質(zhì)結(jié)合區(qū)。
第3組幾丁質(zhì)酶蛋白較為原始,因?yàn)樗诓煌ハx中有1個基因編碼,并且各個目中都存在。其氨基酸序列從N端依次是1個跨膜域或2個跨膜域,2個幾丁質(zhì)酶催化區(qū)和1個幾丁質(zhì)結(jié)合區(qū)。這2個催化區(qū)氨基酸序列很相似,功能也很相似。家蠶和人體虱的該組序列沒有信號肽,其他物種N端都有信號肽。
第4組只有1個膜結(jié)合區(qū)域和1個幾丁質(zhì)酶催化區(qū),每個物種都有1條序列在內(nèi),大部分沒有信號肽,意大利蜜蜂的XP_395707.4比較特殊,它有1個信號肽、1個跨膜域,在它們之間竟有1個B561(細(xì)胞色素B-561 /鐵還原酶跨膜結(jié)構(gòu)域)結(jié)構(gòu)域,氨基酸位置為56~185,其功能尚待實(shí)驗(yàn)研究。
第5組幾丁質(zhì)酶遍布7個物種中,均有1個基因編碼,但是岡比亞按蚊除外。岡比亞按蚊的該基因出現(xiàn)復(fù)制現(xiàn)象,有5個基因編碼,分別為AEE44123.1,AEE44124.1,AEE44125.1,AEE44126.1,AEE44127.1。氨基酸結(jié)構(gòu)分布依次是信號肽(signal peptide)、1個幾丁質(zhì)酶糖苷水解酶18結(jié)構(gòu)、1段低復(fù)雜性區(qū)域序列,是絲氨酸、蘇氨酸、賴氨酸的富含區(qū);還有1個幾丁質(zhì)結(jié)合區(qū)。該組基因在蛹變?yōu)槌上x的發(fā)育時期起著重要作用。
第6組是分子質(zhì)量較大的一組,具有多個糖苷水解酶18催化結(jié)構(gòu)域和多個幾丁質(zhì)結(jié)合結(jié)構(gòu)域。這組酶的氨基酸序列長度都非常大,通常都達(dá)到2 000~3 000個氨基酸,同時功能也十分重要。經(jīng)研究發(fā)現(xiàn),對于昆蟲各個發(fā)育時期尤其是卵和幼蟲的發(fā)育是不可缺少的。
第7組是特殊的幾丁質(zhì)蛋白imaginal disk growth factors(成蟲器官生長因子蛋白,IDGFs),昆蟲的生長因子蛋白有多個基因編碼。該組基因序列的結(jié)構(gòu)為N端1個信號肽,然后是1個幾丁質(zhì)酶催化區(qū),并沒有出現(xiàn)幾丁質(zhì)結(jié)合區(qū)結(jié)構(gòu)。所有昆蟲生長因子的催化區(qū)域保守序列都有1個谷氨酸殘基,但是赤擬谷盜除外,它的谷氨酸殘基被替換為氨酚胺。這類幾丁質(zhì)酶蛋白雖然含有催化區(qū),但是卻喪失了幾丁質(zhì)酶基因的活性,可能是由于保守序列中天冬氨酸被替換為丙氨酸造成的[14]。生長因子的功能是不可或缺的,它能使新器官形成和細(xì)胞增殖,缺少生長因子則會影響昆蟲蛹向成蟲的發(fā)育。然而并不是每個IDGFs都擁有此功能,比如赤擬谷盜中有2個IDGFs,實(shí)驗(yàn)證明只有其中1個生長因子的沉默對昆蟲有影響[9]。
剩余2個組分別是endo-beta-N-acetylglucosaminidase(ENGASE)和stabilin-1interacting chitinase-like protein (SL-CLP)。ENGASE沒有糖苷水解酶18結(jié)構(gòu)域,并非18家族幾丁質(zhì)酶。在所列的7種昆蟲中,只有豌豆蚜蟲沒有SL-CLP及SL-SLP,只有1個催化結(jié)構(gòu),且沒有幾丁質(zhì)結(jié)合域。每種昆蟲中都含有1個ENGASE。果蠅的cht12、家蠶的BGIBMGA008709-PA,BGIBMGA005691-PA,BGIBMGA006989-PA以及岡比亞按蚊7條基因(旁系同源基因)、人體虱1條基因、豌豆蚜的2條基因都不能歸為以上幾類,其中BGIBMGA008709-PA的結(jié)構(gòu)域與其他GH18家族的成員相比,在N端存在一個PKD(polycystic kidney disease 1),氨基酸位置為37~124,此結(jié)構(gòu)域在微生物的膠原酶中也有發(fā)現(xiàn)。
昆蟲幾丁質(zhì)酶家族是一個復(fù)雜的多基因家族。所選物種所含幾丁質(zhì)酶都在10個以上,雙翅目物種岡比亞按蚊和黑腹果蠅的幾丁質(zhì)酶基因數(shù)目明顯多于其他物種。在已有文獻(xiàn)中,對于昆蟲幾丁質(zhì)酶較為系統(tǒng)性的研究是在赤擬谷盜中進(jìn)行的[15]。在本研究的進(jìn)化樹中,赤擬谷盜的幾丁質(zhì)酶在各個組中都有出現(xiàn)。漸變態(tài)昆蟲豌豆蚜中亦發(fā)現(xiàn)2個cht5的同源基因序列,其中A.pisum xp003243674.1是本研究新發(fā)現(xiàn)的。這些數(shù)學(xué)知識在生產(chǎn)中應(yīng)用的成果值得進(jìn)一步研究[16-17]。
/
[1] KRAMER K,MUTHUKRISHNAN S.Comprehensive molecular insect science[J].Oxford Elsevie,2005,1:111-144.
[2] KRAMER K J, MUTHUKRISHNAN S. Insect chitinases: Molecular biology and potential use as biopesticides[J].Insect Biochem Mol Biol,1997,27(11):887-900.
[3] ARAKANE Y, MUTHUKRISHNAN S. Insect chitinase and chitinase-like proteins[J]. Cell Mol Life Sci, 2010,67(2):201-216.
[4] 肖業(yè)臣, 羅曉斌, 馮佩富, 等.昆蟲幾丁質(zhì)酶的研究進(jìn)展[J].生物技術(shù), 2003,13(1):38-39.
XIAO Yechen,LUO Xiaobin,FENG Peifu,et al. Research progress of insect chitinase[J]. Biotechnology,2003,13(1):38-39.
[5] KRAMER K J, CORPUZ L, CHOI H K, et al.Sequence of a cDNA and expression of the gene encoding epidermal and qutchitinases of manduca sexta[J].Insect Biochem Mol Bio, 1993,23(6): 691-701.
[6] FUNKHOUSER J D, ARONSON N N. Chitinase family GH18: Evolutionary insights from the genomic history of a diverse protein family[J]. BMC Evol Biol, 2007, 7(1): 96-100.
[7] ZHANG J, ZHANG X, ARAKANE Y, et al. Comparative genomic analysis of chitinase and chitinase-like genes in the african malaria mosquito(Anophelesgambiae)[J].Plos One,2000,6(5):198-199.
[8] ZHU Q S, ARAKANE Y, BANERJEE D,et al. Domain organization and phylogenetic analysis of the chitinase-like family of proteins in three species of insects[J]. Insect Biochem Mol Biol, 2008,38(4):452-466.
[9] de LAVEGA H. Chitinases are a multi-gene family in aedes ,anophe-les and drosophila[J]. Insect Molecular Biology,1998,7(3):233-239.
[10] MEUSEMANN K. Phylogenomic approach to resolve the arthropod tree of life[J]. Mol Biol Evol,2010,27(11):2 451-2 464.
[11] NAKABACHI A. Chitinase-like proteins encoded in the genome of the pea aphid, Acyrthosiphonpisum[J].Insect Molecular Biology,2010,19(sup):175-185.
[12] YANG Z H. PAML 4: Phylogenetic analysis by maximum likelihood[J]. Molecular Biology and Evolution, 2007, 24: 1 586-1 591.
[13] TAMURA K, PETERSON D, PETERSON N, et al. MEGA5: Molecular evolutionary genetics analysis using maximum likelihood, evolutionary distance, and maximum parsimony methods[J]. Molecular Biology and Evolution, 2011, 28: 2 731-2 739.
[14] ZHU Q,ARAKANEY, BEEMAN R W, et al. Characterization of recombinant chitinase-like proteins of drosophila melanogaster and triboliumcastaneum[J].Insect Biochem Mol Biol, 2008,38(4):467-477.
[15] ZHU Q S,ARAKANE Y, BANERJEE D,et al.Domain organization and phylogenetic analysis of the chitinase-like family of proteins in three species of insects[J].Insect Biochem Mol Biol,2008,38:452-466.
[16] 郝莉紅,王志騰,陳 洪.基于matlabsimulink對半主動懸架的Fuzzy-PID控制仿真研究[J].河北工業(yè)科技,2013,30(1):42-46.
HAO Lihong,WANG Zhiteng,CHEN Hong.Simulation of Fuzzy-PID control of semi-active suspension based on matlabsimulink[J].Hebei Journal of Industrial Science and Technology,2013,30(1):42-46.
[17] 祁 偉,劉文芳,呂翠改,等.基于小波變換的靜態(tài)圖像數(shù)字水印研究[J].河北工業(yè)科技,2012,29(6):398-400.
QI Wei,LIU Wenfang,LYU Cuigai,et al.Research on digital watermark of static image nased on wavelet transform[J].Hebei Journal of Industrial Science and Technology,2012,29(6):398-400.
向本期載文的審稿專家致謝
本期《河北科技大學(xué)學(xué)報》共發(fā)表論文20篇。這些論文的發(fā)表是與有關(guān)專家的認(rèn)真審讀、細(xì)查資料、推敲分析、中肯評價分不開的。對此,本編輯部特向這些專家表示敬意,對他們的辛勤勞動表示感謝。本期載文的審稿專家名單如下(按姓名的漢語拼音順序排列):
安立超 蔡建平 陳建波 陳 霞 崔海亭 樊超然 高炳軍 高 凱
高 蒙 顧祝全 郭 奮 郭 欣 韓振宇 姜 瑛 李 兵 李 春
李 媛 劉成國 劉連山 劉潤靜 劉素貞 劉正捷 米據(jù)生 汪殿龍
王國棟 王 軍 王少剛 王曉君 葉 丹 岳彥芳 翟學(xué)良 張福強(qiáng)
張煥禎 張明智 張 寧 趙冬梅 鄭小琪 種道彤
(本刊編輯部)
Evolution and consensus exploration of insects' chitinase by comparative genomics
HUANG Haiyun1, ZHANG Yi2, WAN Zhangyong3
(1.Library, Hebei University of Science and Technology, Shijiazhuang Hebei 050018,China;2.School of Science, Hebei University of Science and Technology, Shijiazhuang Hebei 050018, China; 3.School of Graduate, Hebei University of Science and Technology, Shijiazhuang Hebei 050018, China)
Insects' chitinase family belongs to the 18th family glycosidic bond hydrolytic enzyme, mainly involved in the physiological processes of molting, cell proliferation and immunization. In this paper, from the seven species' genome data, 131 homologous chitinase and chitinase-like proteins are obtained by BLASTP and PSI-BLAST. The consensus motif sequences is extracted by HMM algorithm. Evolution tree analysis classifies these 131 proteins into 9 groups, which are consistent with the characteristics of glycoside hydrolase 18 ( Glyco_18) catalytic domain and chitin binding domain. Moreover, by PAML software, the positive selection sites for chitinase are calculated and a new chitinase A.pisum xp003243674.1 is found. This paper will be helpful in further research of chitinase structure and function.
chitinase; homologous proteins; evolution tree; motif; positive selection sites
1008-1542(2013)04-0350-05
10.7535/hbkd.2013yx04008
Q781
A
2013-03-01;
2013-04-15;責(zé)任編輯:張士瑩
國家自然科學(xué)基金(11171088);河北省自然科學(xué)基金(A2011208002)
黃海云(1969-),女,內(nèi)蒙古通遼人,館員,主要從事生物信息學(xué)方面的研究。
張 屹副教授。E-mail:zhaqi1972@163.com