朱 盼,陳紅兵,*,胡純秋,李 欣,羅春萍,3
(1.南昌大學 食品科學與技術國家重點實驗室,江西 南昌 330047;2.南昌大學中德聯(lián)合研究院,江西 南昌 330047;3.南昌大學環(huán)境與化學工程學院,江西 南昌 330047 )
基于表位預測的花生過敏原Arah6免疫交叉反應性研究
朱 盼1,2,陳紅兵1,2,*,胡純秋1,2,李 欣1,2,羅春萍1,2,3
(1.南昌大學 食品科學與技術國家重點實驗室,江西 南昌 330047;2.南昌大學中德聯(lián)合研究院,江西 南昌 330047;3.南昌大學環(huán)境與化學工程學院,江西 南昌 330047 )
為了探討花生過敏原Arah6與其他同源蛋白之間的交叉反應,通過各種生物信息數(shù)據庫(Genbank,DiscoTope)以及網絡工具及軟件(BLAST,NPS@和Protean,Clustal x,PyMOL),開展基于表位預測的Arah6交叉免疫反應性研究。結果表明:肽段AA10~15、45~48、53~60、116~118區(qū)域可能是Arah6的線性表位優(yōu)勢區(qū)域;Arah6的構象型表位優(yōu)勢區(qū)有4個,它們存在的區(qū)域為AA1~13、35~51、53~59、89~105;基于線性表位預測的15種蛋白質與Arah6可能具有交叉反應性,其中4種(Arai6,conglutin,Arad6和conglutin 8)發(fā)生交叉反應的概率為100%;基于構象型表位預測的17種蛋白質與Arah6可能具有交叉反應性,其中4種(Ara i 6,conglutin,Arad6和conglutin 8)發(fā)生交叉反應的概率為100%。本結果對進一步了解Arah6的過敏性以及指導開展食品中Arah6的免疫學檢測具有重要作用。
Arah6;花生過敏;表位;交叉反應;預測
Abstract:In order to explain cross-reactivity between peanut allergen Arah6 and other homologous proteins, various kinds of bioinformationcal databases, including Genbank and DiscoTope, and net tools/software, including BLAST, NPS@, Protean,Clustal x and PyMOL, were used for the epitope analysis between these proteins. It was indicated that the linear epitopes on Arah6 existed with high probability in the regions of AA10-15, 45-48, 53-60 and 116-118, and the conformational epitopes in the regions of AA1-13, 35-51, 53-59 and 89-105. According to the prediction of linear epitopes, there were fifteen proteins might cross-react with Arah6, and the possibility of cross-reactivity of four of them (Ara i 6, conglutin, Ara d 6 and conglutin 8) was 100%. However, according to the prediction of conformational epitopes, the number of proteins could cross-react with Arah6 with high probability was 17, and the possibility of cross-reactivity of four of them (Ara i 6, conglutin,Ara d 6 and conglutin 8) was 100%. These investigations will be beneficial for understanding peanut Arah6 allergy and help to develop an approach for the immunologic detection of Arah6 in foods in the future.
Key words:Arah6;peanut allergy;epitopes;cross-reactivity;prediction
花生廣泛存在于各類食品中,花生過敏是一類較普遍的食物過敏反應[1],食品中極少量的花生過敏原便會產生嚴重的變態(tài)反應,有時可引起過敏性休克并危及生命,嚴重影響了部分過敏人群的生活質量[2]。目前國際免疫聯(lián)合會命名小組委員會認可的花生過敏原有11種[3],其中,Arah6是一種主要的過敏原,屬于2S白蛋白家族,與花生中另一主要過敏原Arah 2的氨基酸序列有59%的同源性[4]。另外,抗原表位是免疫交叉反應的物質基礎[5],可分為線性表位和構象型表位。線性表位由肽鏈上連續(xù)的5~7個氨基酸組成[6],主要識別過敏原中特定的氨基酸序列。目前公認,在氨基酸數(shù)目超過80的蛋白質中,若序列同源性大于30%或有6個連續(xù)相同的氨基酸序列,則認為蛋白之間可能存在交叉反應[7]。構象型表位則是由蛋白中不連續(xù)氨基酸序列通過折疊等方式形成特定的三維空間結構而發(fā)生作用,占抗原表位中的90%[8-9]。通過蛋白質序列同源性和軟件分析,利用已知蛋白三維結構模擬未知蛋白三維結構[8],經對比分析,可以預測具有相同/相似構象結構蛋白的交叉反應性。
迄今為止,蛋白質的結構包括表位的預測使用了很多生物信息庫和軟件。如,GenBank數(shù)據庫是世界上著名的生物信息數(shù)據庫,是由美國國立生物技術信息中心(NCBI)維護的一級核酸序列數(shù)據庫[10],其中的BLAST工具主要用于序列對比和同源性分析。蛋白質結構數(shù)據庫(PDB)是目前最主要的蛋白質分子結構數(shù)據庫之一,其包含了大量的抗原抗體復合物晶體結構及相關信息[6]。而SWISS- MODEL是一個有注解的基于同源建模的蛋白質結構服務器[11],可提供蛋白質三維建模服務,任秀艷等[12]用此軟件成功完成了HrpNEa蛋白的結構和功能的預測。另外,DNAStar軟件是一種用于DNA和蛋白質分析的生物軟件,其中Protean主要用于蛋白質結構分析,黎明等[13]采用此軟件成功預測了豬傳染性胃腸炎病毒的二級結構和B細胞抗原表位。ABCpred則采用人工神經網絡來預測線性表位,預測敏感性約為67%,特異性約為64%[6,14],而且李明才等[15]采用此方案對與預測所得到的人白細胞介素-33蛋白的B細胞抗原表位結果進行最終驗證。值得關注的是,DiscoTope是通過蛋白質三級結構數(shù)據來預測構象表位的一種新功能軟件[16],紀濱等[17]采用此軟件成功預測了H5N1亞型禽流感HA蛋白抗原的非線性B細胞表位,并通過了實驗鑒定。
本研究利用生物信息學技術,將花生過敏原Arah6進行氨基酸序列分析,預測其二級結構、線性表位、構象型表位,從而預測交叉反應,對進一步了解Arah6的過敏性以及指導開展食品中Arah6的免疫學檢測具有重要作用。
通過GenBank檢索花生過敏原Arah6的基因序列,該基因在GenBank的登錄號為AAD56337。應用DNAStar軟件推導出該基因的氨基酸序列。
利用BLAST(http://blast.ncbi.nlm.nih.gov/Blast.cgi)分析Arah6氨基酸序列,預測同源性蛋白。
利用NPS@網絡服務器(http://npsa-phil.ibcp.fr/ cgibin/npsa_automat.pl? page=/NPSA/npsa_server.html)和DNAStar生物分析軟件(Gamier-Robson方法)中的protean軟件對Arah6蛋白質二級結構進行預測。Protean軟件采用Kyte-Doolittle等方案預測Arah6的親水性(hydrophilicity)[18],Emini法預測表面可及性(accessibility)[19],Jameson-Wolf法預測抗原性(antigenicity)[20],Karplus-Schulz法預測蛋白柔韌性(flexibility)[21],綜合各因素,預測Arah6可能的線性表位區(qū)。
根據已知的Arah6表位區(qū),在同源蛋白中,利用軟件Clustalx進行多序列對比分析,查找相同/相似表位區(qū)域,預測可能與目的蛋白發(fā)生交叉反應的蛋白質。
利用網絡數(shù)據庫SWISS-MODEL(http://swissmodel.expasy.org/) 模擬Arah6的PDB構象圖,并在網絡數(shù)據庫DiscoTope[22](http://www.cbs.dtu.dk/services/DiscoTope)中預測其空間構象型表位。
結合各蛋白的序列,利用網絡數(shù)據庫S W I S SMODEL模擬其PDB構象圖,并在DiscoTope中預測構象型表位,與目的蛋白對比,預測免疫交叉反應。在預測中,通過網絡數(shù)據庫DisoTope是實現(xiàn)蛋白質三維結構預測構象型表位的一種新方法[6],本工作中選定特異性表位默認閾值-7.7,此時預測的特異性為75%,敏感性為47%。
根據GenBank中登錄號位AAD56337(Arah6)的DNA序列推導出的氨基酸序列如下:AHASAMRRERGR QGDSSSCERQVDGVNLKPCEQHIMQRIMGEQEQYDSYNFGS TRSSDQQQRCCDELNEMENTQRCMCEALQQIMENQCD GLQDRQMVQHFKRELMNLPQQCNFGAPQRCDLDVSGGRC。
利用GenBank網絡數(shù)據庫對Arah6進行BLAST分析,具體結果見表1。
表1 Arah6的同源序列BALST分析結果Table 1 Homology sequences comparison of Arah6 using BALST
通過BLAST分析得知:能與Arah6發(fā)生交叉反應的蛋白主要來自于不同花生種屬以及大豆、羽扇豆、大麥、黑麥、蓖麻等,共34種,見表1。表中1~3號蛋白與目的蛋白的相似度高達90%以上,且4~17號蛋白的相似度均在40%以上,它們均來自于花生,而花生是羽扇豆制品中的主要組成成分,這就大大增加了花生過敏的嚴重性和普遍性。
2.3.1.1 蛋白二級結構和特性分析
用NPS@網絡服務器對該基因的二級結構進行預測,結果如圖1所示,對應相關數(shù)據見表2。
圖1 NPS@預測Arah6二級結構Fig.1 Prediction analysis for secondary structure of Arah6 using NPS@
表2 NPS@預測Arah6二級結構結果Table 2 Location of four secondary structural classes of Arah6 predicted using NPS@
利用Protean軟件對該蛋白的二級結構及蛋白特性再次進行預測,結果如圖2所示,對應相關數(shù)據見表3。
圖2 Protean法預測的Arah6二級結構參數(shù)及蛋白特性Fig.2 Prediction analysis for secondary structure, antigenicity, hydrophilicity,surface prodability and flexibility of Arah6 using Protean appraoch
表3 Protean法預測的Arah6二級結構及相關預測指數(shù)的區(qū)域定位Table 3 Predicted location of four secondary structural classes and regions corresponding to 4 specific indexes of Arah6 using Protean approach
2.3.1.2 預測的Arah6線性表位
通過比較,用網絡服務器NPS@預測得到的結果與Protean軟件預測得到的結果基本相似,具有一定的可行性。當肽段位于β-轉角和無規(guī)則卷曲區(qū)域[23-24],且親水性>0,抗原指數(shù)>0,表面可及性>1時,即預測為優(yōu)勢B細胞抗原表位[25];且線性表位至少應由3~5個氨基酸組成。綜合各參數(shù)可推導出Arah6的線性抗原表位優(yōu)勢區(qū)域為AA10~15,45~48,53~60,116~118(圖3深色方框區(qū)域)。
利用Clustal X對BLAST分析的結果進行多序列對比分析。結果顯示:與Arah6具有完全相同的線性表位的蛋白質有4種,分別為Ara i 6、落花生conglutin、Ara d 6、conglutin 8(圖3,其余圖略),它們與目的過敏原蛋白質發(fā)生交叉反應的概率為100%;蔓花生conglutin和2S protein 1擁有2個與目的蛋白完全相同的線性表位;另外,擁有1個完全相同的線性表位的蛋白有9種,分別為表1中序號為7~15的蛋白質,它們多為不同花生亞種、羽扇豆科和大豆中的部分蛋白質,它們在很大程度上與目的蛋白可能發(fā)生交叉反應。
圖3 線性表位(方框標示區(qū)域)對比分析Fig.3 Comparisons of linear epitopes between different proteins
利用DiscoTope網絡數(shù)據庫預測得Arah6的構象型表位區(qū)有6個,用PyMOL軟件繪制出來,如圖4(彩色區(qū)域)所示,這6個表位區(qū)域在氨基酸序列中的位置分別為 AA1~13(紅色)、16~17(綠色)、35~51(藍色)、53~59(黃色)、86(紫色)、89~105(青色)。由于 AA16~17、86區(qū)域所含的氨基酸數(shù)目太少,無法構成構象型表位,故應剔除。綜合考慮,Arah6的構象型表位區(qū)只有4個。
圖4 Arah6的空間構象(灰色區(qū)域)和構象性表位區(qū)域(深色區(qū)域)Fig.4 Conformational epitopes on Arah6
相同方法分別預測各蛋白質的空間構象型表位所在區(qū)域,并用PyMOL繪圖,與目的蛋白進行對比分析。具有相同或相似的構象,即可發(fā)生交叉反應。
圖5 不同蛋白相同/相似構象型表位對比圖Fig.5 Conformational epitope comparison among different proteins
結果顯示:與Arah6(圖5R)具有相同的構象型表位(青色區(qū)域)的蛋白只有4種,分別為Ara i 6、落花生 conglutin、Ara d 6、conglutin 8(圖 5A~D),它們與目的過敏原蛋白質發(fā)生交叉免疫反應的概率為100%;與目的蛋白具有相似構象型表位區(qū)域的蛋白有13種,分別為表1中序號分別為5~15(圖5E~O)、17(圖5P)和21(圖5Q)的蛋白,它們在一定程度上也可能與Arah6發(fā)生交叉反應。
近年來,隨著生物信息學的迅速發(fā)展,已有許多分子生物學軟件用于蛋白質的分析,線性表位和構象型表位的預測則是其中主要部分。關于線性表位的預測,目前被認可有效的方法主要包括二級結構方案、親水性方案、可及性方案、可塑性方案、抗原性方案[23,26-27],但一般采用多種參數(shù)綜合分析的方法。研究表明,在進行抗原線性表位預測時,運用生物信息軟件和互聯(lián)網服務器,采用多種方案綜合分析可提高實驗的成功率,增強實驗的目的性[26,28]。本研究采用Protean軟件和NPS@服務器預測了Arah6的線性表位,并用ABCpred對結果進行了驗證,此法預測所得的B細胞線性表位區(qū)準確率達到73.9%。
由于已知晶體結構的抗原-抗體復合物數(shù)量較少、抗原-抗體結合機理研究不夠清楚以及預測算法設計的困難性等方面原因,構象型表位預測的研究一直比較緩慢,遠遠落后于線性表位預測的研究[29]。但生物信息學軟件DiscTope是目前新開發(fā)出的一種用于預測B細胞構象型表位的Web軟件,它在95%特異度條件下,可正確識別構象型表位中的15.5%的殘基,而普通線性表位預測方法在同等特異度條件下,只能識別約11%的殘基[22]。本研究中采用DiscTope軟件對目的蛋白進行了預測,得到了它的構象型表位分布優(yōu)勢區(qū)域。并通過繪圖軟件PyMOL對各相關蛋白的相關區(qū)域進行對比分析,結果表明擁有相同/相似的構象型表位優(yōu)勢區(qū)域即可與Arah6發(fā)生交叉反應。盡管如此,該結論最好通過抗體篩選噬菌體肽庫等工作來進行實驗驗證[22]。
本研究基于生物信息學和網絡數(shù)據庫,分別從序列同源性分析、線性表位預測對比分析、構象型表位預測對比分析三個不同層次上對Arah6的交叉反應進行了預測。結果顯示:Ara i 6、落花生conglutin、Ara d 6和落花生conglutin 8在序列同源性、線性表位和構象型表位上都與Arah6有很高的相似性,它們與目的蛋白發(fā)生交叉反應的概率為100%;構象型表位相似且線性表位相同的蛋白質,如Ara d 2.01、Arah 2.01、seed storage protein SSP2、白羽扇豆conglutin delta seed storage protein等,它們在理論上也能與目的蛋白發(fā)生交叉反應。另外,線性表位相同而構象型表位不同的蛋白也可能與目的蛋白發(fā)生交叉反應,如羽扇豆科conglutin delta、大豆napin-type 2S albumin 1、大豆2S albumin pre-propeptide等。
總之,本實驗利用生物信息學方法,結合網絡數(shù)據庫,對花生蛋白質過敏原Arah6的交叉反應性進行了預測,從理論上闡述了Arah6與其他同源蛋白的免疫交叉反應性。
[1] 羅春萍, 高金燕, 胡純秋, 等. 花生交叉過敏反應的研究進展[J]. 食品科學, 2009, 30(21):384-388.
[2] PARK C W, KIM G I, LEE C H. A comparison study on allergen components between Korean (Arachis fastigiataShinpung) and American peanut (Arachis hypogaeaRunner)[J]. KoreanMed Sci, 2000, 15(4):387-392.
[3] JIN Tengchuan, GUO Feng, CHEN Yuwei et al. Crystal structure of Arah 3, a major allergen in peanut[J]. Mol Immunol, 2009, 46(8/9):1796-1804.
[4] KLEBER J K, CRAMERI R, APPENZELLER U, et al. Selective cloning of peanut allergens including profilin and 2S albumins by phage disply technology[J]. Allergy Immunology, 1999, 119(4):265-274.
[5] 吳玉章, 朱錫華. 研究蛋白質抗原表位的方法學評述[J]. 國際免疫學雜志, 1991(5):245-249.
[6] 梁瑾. 一種B細胞構象表位預測方法的建立及初步應用[D]. 北京:中國農業(yè)科學院, 2009:13-16.
[7] GODMAN R. Practical and predictive bioinformatics methods for the identification of potentially cross-reactive protein matches[J]. Molecular Nutrition and Food Research, 2006, 50:655-660.
[8]HUANG Jian, HONDA W. “CED:a conformational epitope database”[DB]. BMC Immunol, 2006, 7:7. [2010-05-01](http://www.biomed central.com/1471-2172/717)
[9] SHARMA S, KUMAR P, BETZEL C, et al. Structure and function of proteins involved in milk allergies[J]. J Chromatogr B Biomed Sci Appl, 2001, 756(1/2):183-187.
[10] 李軼. GenBank數(shù)據庫檢索及其應用-Entrez檢索功能[J]. 中華醫(yī)學圖書情報雜志, 2008,17(5):49-51.
[11] 諶容, 陳敏, 楊春賢, 等. 基于SWISS-MODEL的蛋白質三維結構建模[J]. 生命的化學, 2006, 26(1):54-56.
[12] 任秀艷, 高永闖, 李美茹, 等. HrpNEa蛋白的結構與功能分析[J]. 安徽農業(yè)科學, 2010(9):2254-2256.
[13] 黎明, 于天飛. DNAStar軟件在動物病毒研究中的應用實例[J]. 高師理科學刊, 2010, 30(3):61-63.
[14] SAHA S, RAGHAVA G P S. Bcepred:prediction of continuous B-cell epitopes in antigenic sequences using physico-chemical properties[J].Lect Notes Comput Sci, 2004, 3239:197-2045.
[15] 李明才, 柳曉金, 蘇紹波. 人白細胞介素-33蛋白的二級結構及B細胞抗原表位預測[J]. 汕頭大學醫(yī)學院學報, 2008, 21(1):1-3.
[16] ANDERSEN P H, NIELSEN M, LUND O. Prediction of residues in discontinuous B-cell epitopes using protein 3D structures[J]. Protein Sci, 2006, 15(11):2558-2567.
[17] 紀濱. H5V1亞型禽流感病HA蛋白抗原表位預測與篩選[D]. 長春:吉林大學, 2009.
[18] KVTE J, DOOLITTLE R F. A simple method for displaying the hydropathic character of a protein[J]. Mol Biol, 1982, 157:105-132.
[19] EMINI E A, HUGHES J V, PERLOW D S, et al. Induction of hepatitis a virus -neutralizing antibody by a virus - specific synthetic peptide[J]. J Viorol, 1985, 55:836-839.
[20] JAMESON B A, WOLF H. The antigenic index:a novel algorithmfor predicing antigenic determinants[J]. Comput Appl Biosci, 1988, 4(1):181-186.
[21] KARPLUS P A, SCHULZ G E. Prediction of chain flexibility in proteins [J]. Naturwissenschaften, 1985, 72(4):212-213.
[22] HASTA A P, NIELSEN M, LUND O. Prediction of residues in discontinuous B cell epitopes using protein 3D structures[J]. Protein Science,2006, 15:2558-2567.
[23] 呂燕波, 萬瑛, 吳玉章, 等. SARS病毒基因組所編碼的E蛋白的二級結構和B細胞表位預測[J]. 免疫學雜志, 2003, 19(6):407-410.
[24] 李海俠, 毛旭虎. 蛋白質抗原表位研究進展[J]. 微生物學免疫學進展, 2007, 35(1):54-58.
[25] 肖治軍, 張改平, 喬松林. Ⅰ型與Ⅱ型IBDV前體多聚蛋白B細胞抗原表位的預測與比較[J]. 中國家禽, 2009, 31(21):22-25.
[26] MAEDA K, MIZUKOSHI F, HAMANO M, et al. Development of an equine heipesvirus type 4-specific enzyme-linked immunosorbent assay using a B-cell epitope as an antigen[J]. J Clin Microbiol, 2004, 42(3):1095-1098.
[27] MAHLER M, BLUTHNER M, POLLARD K M. Advances in B-cell epitope analysis of autoantigens in connective tissue diseases[J]. Clin Immunol, 2003, 107(2):65-79.
[28] ANANDARAO R, SWAMINATHAN S, KHANNA N. The identification of immunodominant linear epitopes of dengue type 2 virus capsid and NS4 a proteins using pin-bound peptides[J]. Vinus Res, 2005, 112(1/2):60-68.
[29] 黃艷新, 飽永利, 李玉新. 抗原表位預測的免疫信息學方法研究進展[J]. 中國免疫學雜志, 2008, 24(9):857-861.
Immunologic Cross-reactivity of Peanut Allergen Arah6 on the Basis of Epitope Prediction
ZHU Pan1,2,CHEN Hong-bing1,2,*,HU Chun-qiu1,2,LI Xin1,2,LUO Chun-ping1,2,3
(1. State Key Laboratory of Food Science and Technology, Nanchang University, Nanchang 330047, China;2. Sino-German Joint Research Institute, Nanchang University, Nanchang 330047, China;3. School of Environmental and Chemical Engineering,Nanchang University, Nanchang 330047, China)
Q517
A
1002-6630(2010)17-0318-05
2010-06-10
南昌大學食品科學與技術國家重點實驗室目標導向項目(SKLF-MB-200807);江西省主要學科學術和技術帶頭人培養(yǎng)項目([2004]234號);教育部新世紀優(yōu)秀人才支持計劃項目(NCET-08-07-04)
朱盼(1987—),女,碩士研究生,研究方向為食品質量與安全。E-mail:xingmeng903@163.com
*通信作者:陳紅兵(1967—),男,教授,博士,研究方向為食品營養(yǎng)與安全。E-mail:chbgjy@hotmail.com