摘要:利用在線軟件和線下軟件對來源于刀額新對蝦(Metapenaeusensis)的過敏原Met el的B細胞抗原表位和T細胞抗原表位進行預測、篩選以及輔助計算,首先,通過uniprot蛋白數(shù)據(jù)庫獲取Met el蛋白質(zhì)氨基酸序列;其次,用ExPASY ProtParam,SignalP-5.0 Server和TMHMM Server v.2.0在線工具對Met el的理化性質(zhì)、信號肽與跨膜區(qū)域進行分析,用PSIPRED在線工具、SOPMA在線工具和DNAstar軟件聯(lián)合預測計算Met el二級結構,用Swiss model在線軟件預測計算Met e1三級結構;再次,用DNAStar線下軟件和IEDB在線軟件綜合預測計算線性B細胞表位,用IEDB在線軟件預測計算CD4+T細胞表位和CD8+T細胞表位;最后將所得結果進行B細胞表位和T細胞表的篩選,結果表明:Metel蛋白的B細胞表位為15~28,45~49,92~95,125~130,150~153,255~258位氨基酸;T細胞表位為78~84,223~232位氨基酸.
關鍵詞:Metel蛋白質(zhì);B細胞表位;T細胞表位;抗原表位篩選
中圖分類號:R392文獻標志碼:A文章編號:1671-5489(2024)05-1267-07
Computer-Aided Calculation of Antigen Epitopeof Tropomyosin in Shrimp
SHI Yueming',ZHANG Zhel2,LIU Jianlan3,LIU Minghao3
(1.The Fourth Affiliated Hospital of China Medical University,Shenyang 110032,China;2.Medical Humanities Sciences,China Medical University,Shenyang 110122,China;3.School of Life Sciences,JilinUniversity,Changchun 130012,China)
Abstract:Online and offline software were used to predict,screen and assist in the calculation of the B-cell and T-cell epitopes of the allergen Met el from Metapenaeusensis.Firstly,the amino acid sequence of Met el protein was retrieved from the uniprot protein database.Secondly,the physicochemical properties,signalpeptides,andtransmem brane regions of Met el were analyzed by using online tools ExPASY ProtParam,SignalP-5.0 Server,and TMHMM Server v.2.0.The secondary structure of Met el was jointly predicted and calculated by using the PSIPRED online tool,SOPMA online tool,andDNAstarsoftware,while the tertiary structure of Met el was predicted and calculated by using Swiss model online software.Thirdly,the linear B-cell epitopes were comprehensively predicted and calculated by using DNAStar offline software and IEDB onlinesoftware,CD4+T and CD8+T-cell epitopes were predicted and calculated by using the IEDB online software.Finally,the obtained results were screened for B-cell and T-cell epitopes.The results show that the B-cell epitopes of Met el protein are located at amino acids 15-28,45-49,92-95,125-130,150-153 and 255-258,and T-cell epitopes are located at amino acids 78-84 and 223-232.
Keywords:Metelprotein;B-cellepitope;T-cellepitope;antigen epitope screening
蝦類過敏原是導致食物過敏的一個重要類別,攝入蝦可能導致嚴重的超敏反應.原肌球蛋白(Tropomyosin)是主要的熱穩(wěn)定蝦過敏原.Daul等1研究表明,各品種蝦的主要過敏原都是一種原肌球蛋白.蝦原肌球蛋白是一種肌纖維蛋白,天然含有2個亞基(相對分子質(zhì)量分別為38500,36600),其比例為1:1,可通過三磷酸腺苷(ATP)誘導的高離子強度組裝成納米纖維[2.蝦原肌球蛋白作為主要的食物過敏原已被證明具有極高的熱穩(wěn)定性,并能承受食品加工活動,可見蝦原肌球蛋白的致敏性較強.在棕色蝦(Penaeus aztecus)中鑒定出13種不同的過敏原,主要有Met el,Penal,Pan s1和Hom al等種類[3.鑒定蝦源肌球蛋白抗原中的表位,對去除蝦類食品中的過敏原,開發(fā)蝦源肌球蛋白疫苗,進行免疫診斷和臨床治療等方面具有重要意義,目前有許多方法可用于研究和確認抗原表位,如抗原-單克隆抗體復合物、蛋白水解或化學切割片段方法等.但這些方法大多較復雜,難以執(zhí)行或效率低下,需對大批潛在的表位候選物進行實驗篩選。而現(xiàn)在的計算機模擬預測計算可減少潛在表位候選者列表,使實驗精簡.生物信息學和計算機方法在抗原表位預測分析方面發(fā)揮了關鍵作用.
B細胞表位可分為連續(xù)型和不連續(xù)型兩類,對不連續(xù)的B細胞表位已開發(fā)出的預測計算方法較少.線性B細胞表位由肽組成,用于替換抗原以進行免疫和抗體生產(chǎn).因此,盡管線性B細胞數(shù)量較少,但其表位預測已受到廣泛關注,線性B細胞表位預測主要是基于氨基酸性質(zhì)如親水性、電荷、暴露表面積和二級結構等,目前主要有6種預測方案:親水性方案、可及性方案、抗原性方案、可塑性方案、電源分布方案和二級結構預測方案.T細胞在其表面上存在一種稱為T細胞受體(TCR)的特異性受體,特定情況下能識別抗原.由于T細胞表位以線性形式與MHC分子結合,因此配體和T細胞之間的界面可精確建模.而表位通過R基團側鏈與位于MHC底部的囊袋相互作用,連接到MHCI類和Ⅱ類分子的結合槽中.基于此,人們建立了大量的T細胞表位映射算法,并利用這些算法開發(fā)工具快速識別T細胞表位.常用分析網(wǎng)站有NetMHCII,NetMHCpan,NetMHCIIpan,nHLApred,SVMHC,IEDB,SVRMHC和NetCTL等.
本文用在線軟件和線下軟件對來源于刀額新對蝦(Metapenaeusensis)的過敏原Met el5]抗原表位進行預測、篩選與輔助計算.首先,通過uniprot蛋白數(shù)據(jù)庫獲取Metel蛋白質(zhì)氨基酸序列,然后用ExPASY ProtParam,SignalP-5.0 Server和TMHMM Server v.2.0在線工具對Met el的理化性質(zhì)、信號肽與跨膜區(qū)域進行分析,用PSIPRED在線工具、SOPMA在線工具和DNAstar軟件聯(lián)合預測計算Met el二級結構,用Swiss model在線軟件預測計算Met el三級結構.在此基礎上,用DNAStar線下軟件和IEDB在線軟件綜合預測計算線性B細胞表位,用IEDB在線軟件預測計算CD8+T細胞表位和CD4+T細胞表位.最后將所得結果進行B細胞表位和T細胞表位篩選.
1Met el蛋白基本性質(zhì)和結構1.1Met el蛋白理化性質(zhì)
利用ExPASYProtParam在線工具(http:∥web.expasy.org/protparam/)分析Met el蛋白的相對分子質(zhì)量(Mm)、理論等電點(pI)、半衰期、不穩(wěn)定系數(shù)、親水性平均系數(shù)和其他理化參數(shù),結果列于表1.由表1可見,蛋白質(zhì)原子組成為C1336H2210N398O479S6,相對分子質(zhì)量31704.98,理論等電點4.66,不穩(wěn)定系數(shù)37.58(lt;40),為穩(wěn)定蛋白質(zhì),脂肪系數(shù)78.43,親水性平均系數(shù)-1.138,為親水性蛋白.帶負電荷殘基數(shù)(Asp+Glu)總數(shù)為71,帶正電荷的殘基(Arg+Lys)總數(shù)為46.Metel蛋白質(zhì)最多的氨基酸為Glu,占比19.7%;其次是Leu,占比12.0%.
1.2 Met el蛋白的二級結構預測
用PSIPRED在線工具(http://bioinf.cs.ucl.ac.uk/psipred/)[8]和SOPMA在線工具(http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)預測計算蛋白質(zhì)二級結構.結果表明,Metel蛋白最主要的二級結構為a螺旋,同時還有少量無規(guī)則卷曲.通過DNAstar軟件中的Protean模塊,導入氨基酸序列,分別采用Chou-Fasman方法及Garnier-Robson方法分析Met el蛋白二級結構.結果表明,除Metel蛋白最主要的二級結構為a螺旋,同時還有少量無規(guī)則卷曲外,Garnie-Robson方法顯示存在一小部分β轉(zhuǎn)角.綜合以上3種預測計算工具顯示的結果,選擇Metel蛋白以α螺旋結構為主體.以PSIPRED,SOPMA和DNAstar中的全部預測計算方法中的重疊區(qū)域作為預測計算結果,顯示a螺旋結構最有可能在氨基酸序列7~17,23~56,62~70,75~124,127~150,154~193,198~218,224~260.以PSIPRED,SOPMA和DNAstar中的全部預測計算方法中的重疊區(qū)域作為預測結果,蛋白質(zhì)無轉(zhuǎn)角.以PSIPRED和DNAstar中的全部預測計算方法中的重疊區(qū)域作為預測結果,顯示無規(guī)則卷曲存在于氨基酸序列271~274.a螺旋難以成為B細胞表位,β轉(zhuǎn)角的無規(guī)則卷曲更容易成為B細胞表位.由于存在β轉(zhuǎn)角,無規(guī)則卷曲在Metel蛋白中極少,所以二級結構預測計算方案不能很好發(fā)揮作用,僅能根據(jù)無規(guī)則卷曲預測結果推測蛋白質(zhì)末端可能存在抗原表位.
1.3Met el蛋白同源建模
用Swiss model在線軟件(https:/swissmodel.expasy.org/)進行同源建模結果如圖1所示.由圖1可見,Metel蛋白三級結構是兩條纏繞的a螺旋體形成的超螺旋結構,與二級結構預測計算結果相符.
2 Met el蛋白的B細胞表位預測計算
2.1親水性分析
用DNAstar軟件中的Protean,Protscale和IEDB模塊分別預測計算蛋白親水性及疏水性.Protean模塊顯示Met el蛋白親水性較強.Protscale模塊也顯示Met el蛋白親水性較強,親水性區(qū)域主要集中在氨基酸序列1~50,66~71,73~76,92~108,118~153,158~168,176~189,216~237,249~253,255~266,268~272.其中通過IEDB預測計算的Mete1蛋白親水性與疏水性結果如圖2(A)所示,其中黃色區(qū)域為親水性較強區(qū)域,主要集中在氨基酸序列1~33,45~50,62~75,88~96,110~116,125~130,145~155,198~210,250~260.綜合以上3種方法,選擇重疊部分作為預測計算結果.結果表明,Metel蛋白親水性較強的區(qū)域為1~33,45~50,62~71,92~96,125~130,145~153,250~253,255~260.
2.2表面可及性分析
用DNAstar軟件中的Protean和IEDB模塊預測計算蛋白可及性.Protean模塊顯示Met el蛋白可及性較強.蛋白質(zhì)表面可及性較大的區(qū)域主要集中在1~50,54~58,82~96,107~137,140~160,191~196,220~244,251~270.IEDB預測計算的Mete1蛋白可及性結果如圖2(B)所示,其中黃色區(qū)域為可及性較強區(qū)域,主要集中在氨基酸序列為15~30,36~41,88~95,147~182,167~174,202~211,253~258.綜合以上兩種預測計算工具的結果,得到可及性較大的區(qū)域為15~30,36~41,88~95,147~161,167~174,253~258.
2.3可塑性分析
用DNAstar軟件中的Protean,Protscale和IEDB模塊預測計算蛋白可塑性.Protean模塊顯示Met el蛋白可塑性較強.Protscale模塊預測計算的可塑性較大區(qū)域為氨基酸序列4~6,8~28,34~74,87~104,109~132,136~142,147~156,168~181,185~188,192~195,199~227,235~249,255~277.IEDB預測計算的Metel蛋白可塑性結果如圖2(C)所示,其中黃色區(qū)域為可塑性較強區(qū)域,主要集中在氨基酸序列10~35,45~53,85~102,112~115,120~130,170~179,200~208,212~222,235~245,255~273.綜合以上3種預測計算工具的結果,得到可塑性較大的區(qū)域為10~28,45~53,87~102,112~115,120~130,170~179,200~208,212~222,235~245,255~273.
2.4抗原性分析
用DNAstar軟件中的Protean和IEDB模塊預測計算蛋白抗原性.Protean模塊顯示Met el蛋白抗原性較強.IEDB預測計算的Metel蛋白抗原性結果如圖2(D)所示,其中黃色區(qū)域為抗原性較強區(qū)域,主要集中在氨基酸序列為47~65,74~87,101~109,140~146,152~165,178~184,186~193,196~201,212~217,233~246.綜合以上兩種預測計算工具的結果,得到抗原性較大的區(qū)域為47~65,74~87,101~109,140~146,152~165,178~184,186~193,196~201,212~217,233~246.
2.5β轉(zhuǎn)角分析
用DNAstar軟件中的Protean和IEDB模塊預測計算Met el蛋白β轉(zhuǎn)角.Protean模塊預測計算出現(xiàn)蛋白β轉(zhuǎn)角可能性較大的氨基酸序列為257~259.IEDB預測計算的Metel蛋白β轉(zhuǎn)角區(qū)域如圖2(E)所示,其中黃色區(qū)域為可能出現(xiàn)轉(zhuǎn)角的區(qū)域,主要集中在氨基酸序列為1~28,42~50,55~62,67~72,110~115,120~130,150~155,175~178,255~274.綜合以上兩種預測計算工具的結果,得到出現(xiàn)3轉(zhuǎn)角可能性較大的區(qū)域為257~259.
2.6Bepipred-1.0線性表位預測計算分析
通過Bepipred-1.0線性表位預測計算B細胞表位,結果如圖2(F)所示,其中得分高于閾值(默認值為0.35)的殘基被預測為表位的一部分,在圖上用黃色表示.由圖2(F)可見,IEDBBepipred-1.0線性表位預測計算表明,B細胞表位存在于6~33,45~49,61~63,66~75,89~98,101~115,124~133,148~154,166~178,199~213,223~224,226~231,244~245,251~266,269~269.2.7Bepipred-2.0線性表位預測計算分析
2.7BepiPred-2.0服務器根據(jù)蛋白質(zhì)序列預測B細胞表位,之后執(zhí)行順序預測計算,結果如圖2(G)所示,其中得分高于閾值(默認值為0.5)的殘基被預測計算為表位的一部分,在圖上用黃色表示.由圖2(G)可見,BepiPred-2.0預測計算結果表明,B細胞表位存在于5~270.
綜合分析以上7種預測方案,篩選出15~28,45~49,92~95,125~130,150~153,255~258為最終優(yōu)勢肽段.
3Met el蛋白的T細胞表位預測計算
3.1CD8+T細胞表位預測計算結果
用IEDB在線軟件進行CD8+T細胞表位預測計算,結果列于表2.對于HLA-I類等位基因,選擇百分等級小于1作為表位預測計算結果,百分等級越小則親和力越強,且只選取前5名.由表2可見,預測計算得到了人類常見HLA-A*11:01,HLA-A*02:01,HLA-A*24:02,HLA-B*40:01,HLA-B*46:01,HLA-C*01:02和HLA-C*03:04等位基因結果.
選擇至少2個等位基因預測計算的重疊部分作為對CD8+T細胞表位預測計算的最終結果,CD8+T細胞表位可能存在于序列7~15,56~61,76~84,151~159,179~183,213~218,223~239,241~246,256~264,266~268.
3.2CD4+T細胞表位預測計算結果
用IEDB在線軟件進行CD4+T細胞表位預測計算,結果列于表3.對于HLA-Ⅱ類等位基因,選擇百分等級小于5作為表位預測計算結果,百分等級越小則親和力越強,且只選取前5名.由表3可見,預測計算得到了HLA-DRB1*03:01,HLA-DRB1*07:01,HLA-DRB1*15:01,HLA-DRB3*01:01,HLA-DRB3*02:02,HLA-DRB4*01:01,HLA-DRB5*01:01人類等位基因結果.CD4+T細胞表位可能存在于序列210~224,213~227,212~226,211~225,209~223,141~155,140~154,50~64,139~153,138~152,184~198,185~199,183~197,186~200,51~65,182~196,181~195,184~198,52~66,1~15,49~63,183~197,215~229,214~228.
表3列出了對人類等位基因 HLA-DQA1*01∶01/DQB1*02∶01,HLA-DQA1*01∶01/DQB1 *03∶01和 HLA-DPA1*01∶03/DPB1*03∶01的預測計算結果.
由表3可見,HLA-DQA1*01∶01/DQB1*02∶01等位基因預測 CD4+T 細胞表位可能存在于序列155~169,156~170,154~168,157~171,153~167;HLA-DQA1*01∶01/DQB1*03∶01等位基因預測CD4+T細胞表位可能存在于序列219~233,218~232,220~234,221~235;HLA-DPA1*01:03/DPB1*03:01等位基因預測CD4+T細胞表位可能存在于序列218~232;HLA-DPA1*01/DPB1*04:01,HLA-DPA1*01:03/DPB1*40:01的預測計算結果百分等級均大于5,故不予考慮.
選擇重疊部分作為對CD4+T細胞表位預測計算的最終結果,CD4+T細胞表位可能存在于序列78~91,158~167,221~232位.
綜合分析7條CD8+T細胞優(yōu)勢表位和12條CD4+T細胞優(yōu)勢表位,78~84和223~232為篩選出的最終優(yōu)勢肽段.
綜上所述,本文對蝦源肌球蛋白Met el的抗原表位進行預測計算分析.綜合分析多種預測方案,篩選出15~28,45~49,92~95,125~130,150~153,255~258為最終優(yōu)勢線性B細胞抗原表位肽段,綜合分析7條CD8+T細胞優(yōu)勢表位和12條CD4+T細胞優(yōu)勢表位,篩選出78~84和223~232為最終優(yōu)勢T細胞抗原表位肽段.
通過對蝦源肌球蛋白Met el的抗原表位的精確預測計算,增強了對蝦引起過敏反應的分子機制的理解,特定抗原表位的鑒定,為過敏診斷提供了一種更準確和敏感的方法,在食物過敏日益普遍的背景下,對于區(qū)分引起相似癥狀的不同過敏原尤為關鍵.對Met el蛋白抗原表位的深入認識,不僅促進了更早期和更精確的過敏預警系統(tǒng)的開發(fā),而且為設計針對性免疫治療策略如過敏疫苗等提供了理論依據(jù),為過敏疾病的診斷和治療提供了新的思路和方向.
參考文獻
[1]DAUL CB,MORGANJE.LEHRER S B.Hypersensitivity Reactions to Crustacea and Mollusks[J].Clinical Reviews in Allergy,1993,11(2):201-222.
[2]BACKERT L,KOHLBACHE R.Immunoinformatics and Epitope Prediction in the Age of Genomic Medicine[J].Genome Medicine,2015,7(1):119-1-119-12.
[3]HONG J Y,GAO Q C,XIAO X J,etal.T Cell Epitope of Arginine Kinase with CpG Co-encapsulated Nanoparticles Attenuates a Shrimp Allergen-Induced Thz-Bias Food Allergy[J].Bioscience Biotechnology and Biochemistry,2019,84(4):804-814.
[4]SORIA-GUERRA R E,NIETO-GOMEZ R,GOVEA-ALONSO DO,etal.An Overview of Bioinformatics Tools for Epitope Prediction:Implications on Vaccine Development[J].Journal of Biomedical Informatics,2015,53:405-414.
[5]LEUNG PSC,CHU K H,CHOW WK,etal.Cloning,Expression,and Primary Structure of MetapenaeusensisTropomyosin,the Major Heat-Stable Shrimp Allergen[J].Journal of Allergy and Clinical Immunology,1994,94(5);882-890.
[6]BURLAND T G.DNASTAR's Lasergene Sequence Analysis Software[J].Bioinformatics Methods and Protocols,2000,132:71-91.
[7]ANDREWw,MARTINOв,STEFANB,etal.SWISS-MODEL:Homology Modelling of Protein Structures and Complexes[J].Nucleic Acids Research,2018,46:W296-W303.
[8]BUCHAN D W A,JONES D T.The PSIPRED Protein Analysis Workbench:20 Years on[J].Nucleic AcidsResearch,2019,47:W402-W407.
(責任編輯:單凝)