付楊,席俊,陳慧彬,陳陽
(河南工業(yè)大學(xué) 糧油食品學(xué)院,河南 鄭州,450001)
大豆起源于亞洲,是一種被大面積種植的油料作物,蛋白質(zhì)含量約占大豆總質(zhì)量的40%[1]。大豆富含異黃酮和葉酸,能對人體健康產(chǎn)生有益的影響[2],而被加工成各類食品,在全球范圍內(nèi)被廣泛食用。但大豆也是最容易導(dǎo)致人體過敏的八大食品之一[3],過敏患者會出現(xiàn)蕁麻疹、哮喘、腸道綜合征等反應(yīng),嚴(yán)重時還會造成休克威脅生命[4]。HELM等[5]發(fā)現(xiàn)大豆中獨(dú)特的蛋白質(zhì)可能是大豆過敏反應(yīng)的原因,尤其是大豆球蛋白和β-伴大豆球蛋白。大豆球蛋白致敏性主要取決于其單體組成亞基的過敏性,大豆球蛋白亞基在還原條件下可以解離為一條酸性多肽鏈A(30~45 kDa)和一條堿性多肽鏈B(18~20 kDa)[6],大豆球蛋白A1a(Glycinin A1a)是大豆球蛋白G1亞基中的酸性多肽,DJURTOFT等[7]也證明免疫球蛋白E可以和所有的酸性亞基結(jié)合,現(xiàn)有報道表明大豆蛋白的致敏性源自于其酸性亞基,但Glycinin A1a亞基的具體線性B細(xì)胞表位未見報道。本實(shí)驗(yàn)是對Glycinin A1a亞基上最有可能的B細(xì)胞表位進(jìn)行預(yù)測。
過敏反應(yīng)的產(chǎn)生要依靠免疫細(xì)胞對抗原分子的特定部位即抗原決定簇完成識別[8],作為抗原中的線性片段或構(gòu)象結(jié)構(gòu),B細(xì)胞表位能被抗體特異性識別,因此成為表位預(yù)測的重要部分。對于抗原表位的鑒定、預(yù)測,李俊慧等[9]總結(jié)了一些現(xiàn)有常用生物信息學(xué)方法和軟件。利用生物信息學(xué)軟件對蛋白組學(xué)和基因組學(xué)的原件進(jìn)行模型建立,同時以數(shù)據(jù)庫中已收錄的各種抗原信息為依據(jù),對待研究的過敏原線性表位進(jìn)行篩選和預(yù)測。最后使用生物學(xué)知識和免疫學(xué)實(shí)驗(yàn)來確定預(yù)測的表位是否具有功能性,這種多學(xué)科交叉的方法,不僅節(jié)約大量的人力物力,加快實(shí)驗(yàn)進(jìn)程,而且拓展了表位預(yù)測的技術(shù)平臺,為預(yù)測更多未知的抗原表位提供了可能。劉陽星月等[10]通過蛋白質(zhì)數(shù)據(jù)庫(protein data bank,PDB)和系列生物預(yù)測軟件、在線網(wǎng)站成功預(yù)測出大豆過敏原11S球蛋白G2中A2鏈的結(jié)合表位。閆慧麗等[8]利用SWISS-MODEL和Deep View 4.1完成了大豆主要過敏原Gly m Bd 28K的同源建模和評估,預(yù)測出6個構(gòu)象表位相關(guān)區(qū)段。皮江一等[11]也憑借該方法預(yù)測出了大豆主要過敏原β-伴大豆球蛋白β亞基的抗原表位,并以此為基礎(chǔ)對預(yù)測表位區(qū)域進(jìn)行了分段克隆,抗原表位的預(yù)測成為后續(xù)抗原位置鑒定的重要前提。本研究以美國國家生物信息技術(shù)中心(National Center of Biotechnology Information,NCBI)數(shù)據(jù)庫中得到的Glycinin A1a亞基氨基酸序列為原材料,以Glycinin A1a的高同源性蛋白質(zhì)結(jié)構(gòu)為模板,生成Glycinin A1a三維模型。用軟件DNAStar、SOPMA、ABCpred和BepiPred 1.0 server、DiscoTope 2.0 server分別進(jìn)行線性表位和構(gòu)象表位的預(yù)測。為后期大豆球蛋白免疫檢測提供理論參考;準(zhǔn)確定位大豆球蛋白亞基的過敏位點(diǎn),就可以有針對性的對過敏位點(diǎn)進(jìn)行加工處理,為開發(fā)降低、消除大豆過敏性的食品加工技術(shù)提供幫助。
使用NCBI GenBank數(shù)據(jù)庫查找出Glycinin A1a亞基所對應(yīng)的氨基酸序列。該序列共有287個氨基酸排列如下:
FSSREQPQQNECQIQKLNALKPDNRIESEGGLIE-TWNPNNKPFQCAGVALSRCTLNRNALRRPSYTNGPQIYIQQGKGIFGMIYPGCPSTFEEPQQPQQRGQSS-RPQDRHQKIYNFREGDLIAVPTGVAWWMYNNEDT PVVAVSIIDTNSLENQLDQMPRRFYLAGNQEQE-FLKYQQEQGGHQSQKGKHQQEEENEGGSILSGFTL-EFLEHAFSVDKQIAKNLQGENEGEDKGAIVTVKGGL-SVIKPPTDEQQQRPQEEEEEEEDEKPQCKGKDKHCQ-RPRGSQSK
查找同源蛋白的PDB在線網(wǎng)站;用于三級結(jié)構(gòu)模型建立和模型穩(wěn)定性分析的軟件SWISS-MODEL和Deep View 4.1;DNAStar軟件包中的子程序Protean;其他預(yù)測軟件:SOPMA、ABCpred、BePiPred 1.0 server和DiscoTope 2.0 server。
1.2.1 Glycinin A1a亞基線性表位預(yù)測
DNAStar中的Protean程序可以對氨基酸序列進(jìn)行分析,包括疏水性、柔韌性、抗原指數(shù)、表面可及性[12]。因?yàn)樗鶞y指標(biāo)與抗原表位密切相關(guān),準(zhǔn)確性也更強(qiáng),具有較高的參考價值。
SOPMA是在線網(wǎng)站預(yù)測工具,打開網(wǎng)站頁面直接將Glycinin A1a亞基氨基酸序列以FASTA格式粘貼在序列框內(nèi),選用默認(rèn)的預(yù)測參數(shù),提交序列可得到結(jié)果。
BepiPred 1.0預(yù)測服務(wù)器基于隱馬爾可夫模型的組合和傾向量表方法對B細(xì)胞表位預(yù)測[13]。操作方法與SOPMA相類似。
ABCpred所預(yù)測的表位氨基酸數(shù)量是相等的,排列的順序是根據(jù)表位的可能性大小,預(yù)測準(zhǔn)確性相對其他軟件較低,作為參考。使用參數(shù)參照劉陽星月等[10]的方法。
1.2.2 Glycinin A1a亞基同源建模及三維模型穩(wěn)定性評估
根據(jù)Glycinin A1a亞基的氨基酸序列在PDB網(wǎng)站上查找出相應(yīng)的同源蛋白,以同源性最高的蛋白作為模板[14],將兩者的氨基酸序列都輸入SWISS-MODEL的序列框中,采用Target-Template Alignment模式建立模型,建立的三維模型保存為PDB文件。打開Deep View4.1軟件,在“File”選項下打開模型PDB文件;在工具欄“wind”選項中點(diǎn)擊“Ramachandran Plot”即可得到建立模型的拉氏圖。
1.2.3 GlycininA1a亞基構(gòu)象表位預(yù)測
使用DiscoTope 2.0 Server在線軟件,選擇導(dǎo)入的文件為同源建模保存的模型PDB文件,參數(shù)使用默認(rèn)值-3.7,提交文件即可預(yù)測。
2.1.1 DNAStar
使用DNAStar中的子程序Protean預(yù)測Glycinin A1a亞基的親水性、柔韌性、抗原指數(shù)、表面可及性如圖1所示。由于抗原位點(diǎn)是那些被抗體識別的位點(diǎn),這些位點(diǎn)很可能是容易接觸或在蛋白質(zhì)表面的,這些區(qū)域要比內(nèi)部區(qū)域更具流動性,由此推測它們是親水的,親水性越強(qiáng),越容易和抗原表位結(jié)合。蛋白氨基酸殘基多數(shù)處于親水區(qū),且分布均勻。柔韌性體現(xiàn)在圖1中藍(lán)色矩形覆蓋區(qū),柔韌性和表面可及性較強(qiáng)時易于折疊、彎曲,能夠促進(jìn)二級結(jié)構(gòu)的形成可作為預(yù)測的重點(diǎn)區(qū)段[15]。抗原指數(shù)是直接就其抗原可能性預(yù)測,選擇抗原指數(shù)>0的區(qū)域作為預(yù)測的表位。預(yù)測時將這4種指標(biāo)中可能性較高區(qū)段進(jìn)行綜合比對,同時符合4種指標(biāo)要求的序列,更有機(jī)會被視為表位。以上預(yù)測結(jié)果如表1所示。
圖1 DNAStar分析結(jié)果Fig.1 DNAStar analysis results
2.1.2 SOPMA
SOPMA可以計算出蛋白質(zhì)二級結(jié)構(gòu)中的α-螺旋、β-折疊、β-轉(zhuǎn)角和無規(guī)則卷曲所占的百分比,如圖2所示。Glycinin A1a亞基中無規(guī)則卷曲氨基酸殘基含量最高占50.52%,α-螺旋是由24.74%氨基酸殘基構(gòu)成,β-轉(zhuǎn)角和β-折疊所含的氨基酸殘基分別占16.72%和8.01%。在蛋白質(zhì)的二級結(jié)構(gòu)中α螺旋和β折疊一般不作為抗原表位[16-19],因?yàn)闅滏I的存在結(jié)構(gòu)穩(wěn)定不易變形,而且α螺旋和β折疊通常位于蛋白內(nèi)部,不易與受體接觸。而β-轉(zhuǎn)角和無規(guī)則卷曲一般位于蛋白質(zhì)表面,為了滿足蛋白質(zhì)的功能需要,表面結(jié)構(gòu)必須進(jìn)行適當(dāng)?shù)母淖円哺菀妆蛔R別與抗原表位結(jié)合,是致敏表位的幾率更大。由此結(jié)果預(yù)測的表位如表2所示。
表1 DNAStar 預(yù)測的抗原表位Table 1 Predicted antigen epitope by DNAStar
圖2 SOPMA分析的大豆球蛋白A1a二級結(jié)構(gòu)結(jié)果Fig.2 Secondary structure of the Glycinin A1a analyzed by SOPMA
2.1.3 BepiPred
BepiPred 1.0在線網(wǎng)站預(yù)測表位得到的結(jié)果如表3所示。序列段長度差別較大,但得到的表位分布較為均勻,而且序列段與DNAStar和SOPMA預(yù)測的表位位置區(qū)域高度重合,表明預(yù)測結(jié)果具有較高可信度。
表2 SOPMA 預(yù)測的Glycinin A1a抗原表位Table 2 Predicted antigen epitope by SOPMA
表3 BepriPred預(yù)測的Glycinin A1a抗原表位Table 3 Predicted antigen epitope by BepriPred
2.1.4 ABC pripred
ABC pripred對Glycinin A1a亞基預(yù)測了18個線性表位,按照可能性大小如表4排列,最有可能的線性表位處于氨基酸序列的24~33位,在綜合評價時更側(cè)重于排名前4的預(yù)測表位。通過分析發(fā)現(xiàn)排名靠前的表位大部分靠近蛋白的N端。
表4 ABC pripred預(yù)測的Glycinin A1a抗原表位Table 4 Predicted antigen epitope by ABC pripred
線性構(gòu)象表位預(yù)測結(jié)果,按照劉陽星月等[10]提出的方法對4種軟件預(yù)測結(jié)果進(jìn)行整合,結(jié)果如圖3所示,預(yù)測出10個可能的Glycinin A1a抗原線性表位EQPQQN、KPDNRI、NPNNK、RRPSYTNG、PQQPQQRGQS、QEQGGHQSQKGKHQQEEENE、NEGED、PPTDEQQQRP、DEKPQCKGK、RPRGS。
同源建模是按未知結(jié)構(gòu)蛋白氨基酸序列在蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫中查找出已有的相似的蛋白質(zhì)的結(jié)構(gòu),然后將此蛋白結(jié)構(gòu)進(jìn)行優(yōu)化,進(jìn)而建立出未知結(jié)構(gòu)蛋白的模型[14]。SWISS-Model對大豆球蛋白A1a亞基建立模型找出大豆球蛋白A1a亞基的同源蛋白,結(jié)果顯示1FXZ(大豆球蛋白A1aB1b同源三聚體)與Glycinin A1a亞基同源性高達(dá)71%。以1FXZ為模板對大豆球蛋白A1a亞基完成同源建模,模型顯示如圖4所示。此模型符合大豆蛋白六聚體復(fù)合物結(jié)構(gòu)。利用Deep view 4.1對建立出來的Glycinin A1a亞基模型進(jìn)行穩(wěn)定性分析,得到的拉氏圖如圖5所示。
圖4 Glycinin A1a亞基預(yù)測模型Fig.4 Prediction model of the Glycinin A1a subunits
圖5 Glycinin A1a亞基Ramachandran plotFig.5 Ramachandran plot of the Glycinin A1a subunits
以Φ和Ψ為坐標(biāo)軸所組成的二維圖,來表示α碳原子和肽平面間單鍵的旋轉(zhuǎn)形成的兩面角[20],并不是所有Φ和Ψ形成的角都適合多肽骨架,不同的氨基酸殘基能夠穩(wěn)定存在時對Φ和Ψ值是有范圍的,根據(jù)這個范圍可將二維圖分為允許區(qū)(黃色線內(nèi)區(qū)域)、最大允許區(qū)(藍(lán)色色線內(nèi)區(qū)域)和不允許區(qū)[21]。由圖5計算得到Glycinin A1a亞基的氨基酸殘基超過90%落在允許區(qū)內(nèi),即建立的A1a亞基模型是可以穩(wěn)定存在的。
使用PyMOL軟件將DiscoTope 2.0 Server預(yù)測的Glycinin A1a亞基構(gòu)象表位在模型中表示出來如圖6所示。發(fā)現(xiàn)預(yù)測的構(gòu)象表位均處于模型的表面,而且較多表位處在無規(guī)則卷曲處,符合李雪嬌等[15]的實(shí)驗(yàn)結(jié)果,也正是無規(guī)則卷曲部位的獨(dú)特結(jié)構(gòu)使得預(yù)測的線性表位和構(gòu)象表位有部分重合。經(jīng)過對線性表位和構(gòu)象表位的對比發(fā)現(xiàn):兩者雖然不是完全相同的,但是在線性表位當(dāng)中包含了部分構(gòu)象表位。表明預(yù)測結(jié)果符合已有研究:線性表位和構(gòu)象表位之間是密切相關(guān)的[22]。
a-正面;b-反面圖6 Glycinin A1a亞基構(gòu)象表位Fig.6 Glycinin A1a sub-base conformation epitope 注:紅色部分表示氨基酸數(shù)量>5個的表位,黃色部分表示 氨基酸數(shù)量≤5個的表位
抗原表位的預(yù)測方法多種多樣,但都是基于蛋白質(zhì)的結(jié)構(gòu)組成和物理化學(xué)性質(zhì),在本研究中DNAStar分析了Glycinin A1a亞基的親水性、柔韌性、表面可及性、抗原指數(shù),因?yàn)檫@些性質(zhì)的不同是抗原表位區(qū)別于普通位點(diǎn)的關(guān)鍵。由于α螺旋和β折疊結(jié)構(gòu)不易改變且大多位于蛋白內(nèi)部難以與抗體接觸結(jié)合,不作為表位處理,相反,β轉(zhuǎn)角和無規(guī)則卷曲憑借良好的柔韌性、處于表面的優(yōu)勢可以較好的被識別,也成為表位預(yù)測的重要指標(biāo)。最終得到了10個可能性較高的線性表位:24EQPQQN29、40KPDNRI45、56NPNNK60、80RRPSYTNG87、114PQQPQQRGQS123、197QEQGGHQSQKGKHQQEEENE216、247NEGED251、267PPTDEQQQRP276、285DEKPQCKGK293、299RPRGS303。本研究還對Glycinin A1a進(jìn)行了構(gòu)象表位的預(yù)測。預(yù)測結(jié)果與SAEED等[23]的實(shí)驗(yàn)結(jié)果相符合,即抗原構(gòu)象表位位于3D模型的表面。符合一般表位預(yù)測原則,處于表面的位點(diǎn)可以更好的與抗體嵌合。
此實(shí)驗(yàn)為接下來的Glycinin A1a過敏性表位的篩選和鑒定提供了數(shù)據(jù)支持,能更有針對性的去驗(yàn)證各個表位的免疫原性。也為改善加工條件,降低大豆致敏性提供理論支持。此研究借助機(jī)器預(yù)測抗原表位,避免了大量時間,人力和濕實(shí)驗(yàn)的耗費(fèi)[24]。更重要的是并在沒有人為干預(yù)的情況下對未知數(shù)據(jù)進(jìn)行預(yù)測。大大降低了實(shí)驗(yàn)的誤差。