宋曉蕊 劉玉春 丁聰 賈蕊 李瑞靜 馬嘉悅 李利鋒
摘要:目的? 用生物信息學(xué)方法預(yù)測(cè)分析沙門菌PipD蛋白的結(jié)構(gòu)和抗原表位,為沙門菌相關(guān)疾病的診療和疫苗的研發(fā)提供理論依據(jù)。方法? 通過NCBI數(shù)據(jù)庫獲得沙門菌典型致病血清型:鼠傷寒沙門菌(Salmonella typhimurium)ATCC 14028S標(biāo)準(zhǔn)菌株STM14_1240基因的核苷酸序列及其編碼蛋白PipD 的氨基酸序列,運(yùn)用ProtParam、ProtScale、SignalP 4.1 Server、TMHMM Serverv.2.0、Netphos 3.1 Server、NetNGlyc-1.0、NCBI BLAST、SOMPA、SWISSMODEL、ABCpred、SYFPEITHI和UniProt等生物信息學(xué)工具分別對(duì)鼠傷寒沙門菌PipD蛋白的理化性質(zhì)、親疏水特性、信號(hào)肽、跨膜區(qū)、磷酸化位點(diǎn)、糖基化位點(diǎn)、結(jié)構(gòu)域、二級(jí)結(jié)構(gòu)、三級(jí)結(jié)構(gòu)、B細(xì)胞抗原表位、T細(xì)胞抗原表位及蛋白同源性進(jìn)行預(yù)測(cè)分析。結(jié)果? PipD是由520個(gè)氨基酸組成的親水蛋白,分子式為C2608H3963N721O780S16,理論相對(duì)分子質(zhì)量為58.4 kDa,理論等電點(diǎn)為7.34,脂溶指數(shù)為67.81,平均親水系數(shù)為-0.508。PipD蛋白無信號(hào)肽序列,在其35~57氨基酸殘基位置含1個(gè)長(zhǎng)度為23個(gè)氨基酸的跨膜螺旋,屬于跨膜蛋白。預(yù)測(cè)PipD蛋白含有 57個(gè)磷酸化位點(diǎn)和1個(gè)糖基化位點(diǎn)。PipD蛋白二級(jí)結(jié)構(gòu)以無規(guī)則卷曲居多,占36.35%,其次為α螺旋、β折疊、β轉(zhuǎn)角分別占15.77%、3.27%、44.62%。預(yù)測(cè)PipD蛋白可形成22個(gè)B細(xì)胞優(yōu)勢(shì)抗原表位,17個(gè)CTL細(xì)胞優(yōu)勢(shì)表位和30個(gè)Th細(xì)胞優(yōu)勢(shì)表位。PipD蛋白與人類基因BCLA3、SCRN2和MRPL4的編碼蛋白同源性分別為29%、24.6%和31.8%,同源性較低。結(jié)論? PipD蛋白為親水蛋白,熱穩(wěn)定性好;存在多個(gè)B細(xì)胞和T細(xì)胞抗原表位,與人類宿主蛋白同源性低,不易發(fā)生交叉免疫反應(yīng),可作為鼠傷寒沙門菌血清學(xué)診斷和疫苗候選蛋白。
關(guān)鍵詞:鼠傷寒沙門菌;PipD;生物信息;蛋白結(jié)構(gòu);抗原表位
中圖分類號(hào):S852.6? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?DOI:10.3969/j.issn.1006-1959.2024.04.001
文章編號(hào):1006-1959(2024)04-0001-07
Bioinformatics Analysis of PipD Protein Structure and Epitope of Salmonella Typhimurium PipD
SONG Xiao-rui1,2,LIU Yu-chun1,DING Cong1,JIA Rui1,LI Rui-jing1,MA Jia-yue1,LI Li-feng1
(Henan International Joint Laboratory of Children's Infectious Diseases1,Department of Otorhinolaryngology Head and Neck Surgery2,Children's Hospital Affiliated to Zhengzhou University,Zhengzhou 450000,Henan,China)
Abstract:Objective? To predict and analyze the structure and antigenic epitopes of Salmonella PipD protein by bioinformatics methods, and to provide a theoretical basis for the diagnosis and treatment of Salmonella-related diseases and the development of vaccines.Methods? The nucleotide sequence of Salmonella typhimurium ATCC 14028S standard strain STM14_1240 gene and the amino acid sequence of its encoded protein PipD were obtained by NCBI database. Bioinformatics tools such as ProtParam, ProtScale, SignalP 4.1 Server, TMHMM Serverv.2.0, Netphos 3.1 Server, NetNGlyc-1.0, NCBI BLAST, SOMPA, SWISSMODEL, ABCpred, SYFPEITHI and UniProt were used to predict and analyze the physicochemical properties, hydrophilicity and hydrophobicity, signal peptide, transmembrane region, phosphorylation site, glycosylation site, domain, secondary structure, tertiary structure, B cell epitope, T cell epitope and protein homology of Salmonella typhimurium PipD protein.Results? PipD was a hydrophilic protein composed of 520 amino acids, the molecular formula was C2608H3963N721O780S16, the theoretical relative molecular mass was 58.4 kDa, the theoretical isoelectric point was 7.34, the fat solubility index was 67.81, and the average hydrophilic coefficient was -0.508. PipD protein had no signal peptide sequence, and contained a transmembrane helix with a length of 23 amino acids at its 35-57 amino acid residues, which belonged to transmembrane protein. It was predicted that PipD protein contained 57 phosphorylation sites and 1 glycosylation site. The secondary structure of PipD protein was mostly random coil, accounting for 36.35%, followed by α-helix, β-sheet and β-turn, accounting for 15.77%, 3.27% and 44.62%, respectively. It was predicted that PipD protein could form 22 B cell dominant epitopes, 17 CTL cell dominant epitopes and 30 Th cell dominant epitopes. The homology of PipD protein with human genes BCLA3, SCRN2 and MRPL4 was 29%, 24.6% and 31.8%, respectively.Conclusion? PipD protein is a hydrophilic protein with good thermal stability. There are multiple B cell and T cell epitopes, which have low homology with human host proteins and are not prone to cross-immune reactions. It can be used as a candidate protein for serological diagnosis and vaccine of Salmonella typhimurium.
Key words:Salmonella typhimurium;PipD;Bioinformatics;Protein structure;Antigenic epitope
沙門菌(Salmonella)是一種重要的人畜共患革蘭氏陰性腸道病原菌,主要通過污染的水源和食物傳播,可感染人和豬、牛等多種哺乳動(dòng)物,在宿主中引起自限性腸胃炎和菌血癥等多種疾病。有關(guān)沙門菌感染的報(bào)道逐年增多,加重了預(yù)防和控制的負(fù)擔(dān)[1,2]。沙門菌引起系統(tǒng)性疾病的兩個(gè)關(guān)鍵階段包括侵襲腸上皮細(xì)胞和在巨噬細(xì)胞內(nèi)生存復(fù)制。沙門菌的致病能力主要依賴于沙門致病島(Salmonella pathogenicity islands,SPI)編碼的毒力基因,SPI-1和SPI-2是沙門菌兩個(gè)最重要的致病島[3,4]。由SPI-1編碼的三型分泌系統(tǒng)(type three secretion system,T3SS)-1 是沙門菌入侵腸道上皮細(xì)胞所必需的[5,6];由SPI-2編碼的三型分泌系統(tǒng)T3SS-2是沙門菌在巨噬細(xì)胞中復(fù)制和系統(tǒng)性感染所必需的[7,8]?;谏抽T致病島編碼基因在沙門菌致病性中的重要作用,本研究以沙門菌典型致病血清型:鼠傷寒沙門菌ATCC 14028S菌株為材料,應(yīng)用多種生物信息學(xué)工具對(duì)鼠傷寒沙門菌SPI-5[9]上一個(gè)與鼠傷寒沙門菌引起的腸道炎癥相關(guān)的毒力基因STM14_1240的編碼蛋白PipD[10-12]進(jìn)行預(yù)測(cè)分析,進(jìn)一步明確其結(jié)構(gòu)、抗原表位以及在鼠傷寒沙門菌致病過程中的可能功能,為沙門菌相關(guān)疾病的診療和疫苗研發(fā)提供理論依。
1資料與方法
1.1 PipD蛋白的基因組信息? 通過NCBI GeneBank數(shù)據(jù)庫獲取鼠傷寒沙門菌(Salmonella enterica subsp. enterica serovar typhimurium)ATCC14028S標(biāo)準(zhǔn)菌株STM14_1240基因的核苷酸序列及其編碼蛋白PipD 的氨基酸序列。PipD蛋白在GenBank數(shù)據(jù)庫中的基因序列登錄號(hào)為NC_016856.1,蛋白氨基酸序列登錄號(hào)為WP_000760228.1。PipD蛋白編碼基因STM14_1240全長(zhǎng)1563 bp,位于鼠傷寒沙門菌14028S菌株基因組的3729722~3731284位置,編碼520個(gè)氨基酸,GenBank數(shù)據(jù)庫中PipD蛋白的FASTA格式氨基酸序列如下:
1.2 PipD蛋白的基本理化性質(zhì)分析? 運(yùn)用Expasy-ProParam工具分析PipD蛋白的基本理化學(xué)性質(zhì);使用Expasy-ProScale工具分析PipD蛋白的親疏水特性。
1.3 PipD蛋白的信號(hào)肽、跨膜區(qū)、磷酸化位點(diǎn)、糖基化位點(diǎn)和保守域分析? 使用SignalP4.1 Server工具預(yù)測(cè)分析PipD蛋白的信號(hào)肽序列;使用TMHMM Serverv.2.0工具預(yù)測(cè)PipD蛋白的跨膜區(qū);使用Netphos 3.1 Server工具預(yù)測(cè)PipD蛋白的翻譯后磷酸化修飾位點(diǎn);使用NetNGlyc -1.0工具預(yù)測(cè)PipD蛋白的糖基化位點(diǎn);應(yīng)用NCBI BLAST軟件預(yù)測(cè)PipD蛋白的保守域。
1.4 PipD蛋白的結(jié)構(gòu)預(yù)測(cè)? 使用SOPMA工具分析PipD蛋白的二級(jí)結(jié)構(gòu)及組成;使用SWISS MODEL工具對(duì)PipD蛋白的三級(jí)結(jié)構(gòu)進(jìn)行分析和建模。
1.5 PipD蛋白的抗原表位預(yù)測(cè)? 使用ABCpred和SYFPEITHI工具預(yù)測(cè)PipD蛋白的B細(xì)胞和T細(xì)胞抗原表位。
1.6 PipD蛋白的同源性分析? 使用UniProt網(wǎng)站分析PipD蛋白的同源性。
2結(jié)果
2.1 PipD蛋白的基本理化性質(zhì)分析? 使用Expasy-ProParam工具對(duì)PipD蛋白的基本理化性質(zhì)進(jìn)行預(yù)測(cè)分析,結(jié)果顯示PipD蛋白的分子式為C2608H3963N721O780S16,由8088個(gè)原子組成,理論相對(duì)分子質(zhì)量為58.4 kDa,理論等電點(diǎn)為7.34。在PipD蛋白的氨基酸組成中,丙氨酸(Ala)、蘇氨酸(Thr)、絲氨酸(Ser)占比較高,分別占9.8%、7.5%和6.5%;其中帶負(fù)電荷的氨基酸(天冬氨酸+谷氨酸)和帶正電荷的氨基酸(精氨酸+賴氨酸)數(shù)量均為47個(gè)。PipD蛋白在哺乳動(dòng)物網(wǎng)織紅細(xì)胞體外實(shí)驗(yàn)中的半衰期為30 h,脂肪族指數(shù)為67.81,不穩(wěn)定指數(shù)為43.37,為不穩(wěn)定蛋白。通過Expasy-ProScale工具對(duì)PipD蛋白的親疏水特性進(jìn)行分析顯示,PipD蛋白總平均親水性為-0.508,氨基酸得分最大值為2.6,最小值為-2.822,屬于具有良好親水性的蛋白,見圖1。
2.2 PipD蛋白的信號(hào)肽、跨膜區(qū)、磷酸化位點(diǎn)、糖基化位點(diǎn)和保守域分析? 使用SignalP 4.1 Server對(duì)PipD蛋白進(jìn)行分析得到D值為0.192,表明PipD蛋白不含信號(hào)肽序列(圖2)。使用TMHMM Serverv.2.0工具預(yù)測(cè)在PipD蛋白第35~57位氨基酸處含有1個(gè)長(zhǎng)度為23的跨膜螺旋(圖3)。Netphos 3.1 Server預(yù)測(cè)PipD蛋白有22個(gè)絲氨酸磷酸化位點(diǎn)、22個(gè)蘇氨酸磷酸化位點(diǎn)和13個(gè)酪氨酸磷酸化位點(diǎn)(圖4)。NetNGlyc-1.0預(yù)測(cè)PipD蛋白含有1個(gè)糖基化位點(diǎn),位于第101位,概率為63.49%(圖5)。應(yīng)用NCBI BLAST預(yù)測(cè)PipD蛋白包含PepD超家族、Ntn-hydrolase超家族結(jié)構(gòu)域,屬于PepD家族蛋白(圖6)。
2.3 PipD蛋白的結(jié)構(gòu)預(yù)測(cè)? 使用SOPMA工具分析顯示PipD蛋白含α螺旋(Hh)189個(gè),占36.35%;β折疊(Ee)82個(gè),占15.77%;β轉(zhuǎn)角(Tt)17個(gè),占3.27%;無規(guī)則卷曲(Cc)232個(gè),占44.62%(圖7)。運(yùn)用Expasy-SWISS MODEL工具預(yù)測(cè)PipD蛋白三級(jí)結(jié)構(gòu)并進(jìn)行同源建模,模型GMQE評(píng)分為0.65,QMEAN值為0.68,表明該模型預(yù)測(cè)效果較好(圖8)。
2.4 PipD蛋白的抗原表位預(yù)測(cè)? 使用ABCpred軟件預(yù)測(cè)PipD蛋白中存在22個(gè)潛在的B細(xì)胞抗原表位(分值>0.8),見表1。使用SYFPEITHI軟件預(yù)測(cè)PipD蛋白含有17個(gè)限制性CTL表位(分值>20)和30個(gè)限制性Th表位(分值>20),見表2、表3。
2.5 PipD蛋白的同源性分析? 在 UniProt網(wǎng)站中輸入PipD蛋白的FASTA格式氨基酸序列,物種選擇 Homo sapiens對(duì)PipD蛋白的同源性進(jìn)行分析發(fā)現(xiàn)PipD蛋白與人類基因BCLA3、SCRN2和MRPL4編碼的蛋白同源性分別為29%、24.6%和31.8%(圖9),同源性較低,不易發(fā)生交叉免疫反應(yīng),表明其免疫原性較好,可作為設(shè)計(jì)疫苗的潛在蛋白。
3討論
沙門菌是威脅人類健康的一個(gè)重要公共衛(wèi)生問題,每年引起約9300萬例感染[13],導(dǎo)致約15萬人死亡[14],其中,鼠傷寒沙門菌是引發(fā)感染的最常見血清型[1]。毒力因子是近年來沙門菌研究的熱點(diǎn)問題,探究沙門菌毒力蛋白的功能,提高沙門菌感染相關(guān)疾病的防治水平具有重要的公共衛(wèi)生意義。
沙門菌的致病性與沙門致病島編碼的毒力基因有關(guān)[15],STM14_1240(pipD)是鼠傷寒沙門菌SPI-5上一個(gè)重要的毒力基因,編碼T3SS-1的效應(yīng)蛋白PipD,與鼠傷寒沙門菌引起腸道炎癥相關(guān)[10]。通過檢測(cè)pipD等毒力基因在鼠傷寒沙門菌分離株中的存在情況可評(píng)估沙門菌的潛在毒力及其導(dǎo)致持續(xù)感染的風(fēng)險(xiǎn)[16,17]。生物信息學(xué)分析通常基于生物信息數(shù)據(jù)庫,通過生物信息學(xué)工具對(duì)目標(biāo)基因和蛋白的結(jié)構(gòu)和功能進(jìn)行預(yù)測(cè)和分析,為致病機(jī)制研究和疫苗研發(fā)提供理論依據(jù)[18]。
本研究通過NCBI GeneBank數(shù)據(jù)庫獲取PipD蛋白的氨基酸序列及其編碼基因的核苷酸序列,應(yīng)用生物信息學(xué)工具預(yù)測(cè)和分析PipD蛋白的結(jié)構(gòu)特性和功能,結(jié)果顯示該蛋白理論相對(duì)分子質(zhì)量為58.4 kDa,理論等電點(diǎn)為7.34。在PipD蛋白的氨基酸組成中,脂肪族氨基酸如丙氨酸、蘇氨酸和絲氨酸等所占比例較高,分別為9.8%、7.5%和6.5%,提示該蛋白蛋白熱穩(wěn)定性較好。PipD蛋白的半衰期為30 h,提示該蛋白作為免疫抗原可在體內(nèi)發(fā)揮穩(wěn)定持久作用。親疏水性分析顯示PipD蛋白有多個(gè)較強(qiáng)的親水區(qū),有利于抗原表位的形成[19]。
生物信息學(xué)分析顯示,PipD蛋白不含信號(hào)肽,在該蛋白第35~57氨基酸位置含1個(gè)長(zhǎng)度為23個(gè)氨基酸的跨膜螺旋,其跨膜轉(zhuǎn)運(yùn)機(jī)制還不清楚。PipD蛋白存在多個(gè)潛在磷酸化位點(diǎn),提示PipD蛋白可能受到磷酸化調(diào)控,參與細(xì)胞信號(hào)轉(zhuǎn)導(dǎo)過程。預(yù)測(cè)PipD蛋白含有1個(gè)糖基化位點(diǎn),提示該蛋白可作潛在標(biāo)志物用于鼠傷寒沙門菌感染的診斷。
二級(jí)結(jié)構(gòu)分析顯示,PipD蛋白中無規(guī)則卷曲所占比例較大,其次為α-螺旋、β-折疊和β-轉(zhuǎn)角,表明該蛋白具有良好的抗體嵌合性,易形成抗原表位。三級(jí)結(jié)構(gòu)分析顯示PipD蛋白的無規(guī)則卷曲大多位于蛋白質(zhì)外層區(qū)域,提示PipD蛋白易在空間構(gòu)象上形成抗原表位,有利于抗原和抗體相結(jié)合??乖砦皇强乖肿由夏芘c相應(yīng)抗體或淋巴細(xì)胞的表面受體結(jié)合從而激活機(jī)體免疫應(yīng)答反應(yīng)的特殊化學(xué)集團(tuán)[20]。ABCpred軟件和SYFPEITHI軟件預(yù)測(cè)顯示PipD蛋白共有22個(gè)B細(xì)胞優(yōu)勢(shì)表位,17個(gè) CTL細(xì)胞優(yōu)勢(shì)表位和30個(gè)Th細(xì)胞優(yōu)勢(shì)表位,且與人類宿主蛋白同源性較低,不易發(fā)生交叉免疫反應(yīng),表明該蛋白免疫原性好,可作為潛在的鼠傷寒沙門菌疫苗候選蛋白,也可用于血清學(xué)診斷以提高沙門菌感染檢查的靈敏度和特異性。
綜上所述,PipD蛋白為親水性蛋白,含有B、T細(xì)胞抗原表位,即具有抗原性。本研究通過多種生物信息學(xué)工具對(duì)PipD蛋白的理化性質(zhì)和結(jié)構(gòu)功能進(jìn)行預(yù)測(cè)和分析,可為pipD在鼠傷寒沙門菌致病過程中的可能功能提供更為深入的信息,為研發(fā)有效的鼠傷寒沙門菌疫苗提供新的靶點(diǎn),也為研究鼠傷寒沙門菌的致病機(jī)理提供理論參考。
參考文獻(xiàn):
[1]Fierer J.Invasive Non-typhoidal Salmonella (iNTS) Infections[J].Clin Infect Dis,2022,75(4):732-738.
[2]Sun H,Wan Y,Du P,et al.The Epidemiology of Monophasic Salmonella Typhimurium[J].Foodborne Pathog Dis,2020,17(2):87-97.
[3]Dos SA,F(xiàn)errari RG,Conte-Junior CA.Virulence Factors in Salmonella Typhimurium: The Sagacity of a Bacterium[J].Curr Microbiol,2019,76(6):762-773.
[4]Hume PJ,Singh V,Davidson AC,et al.Swiss Army Pathogen: The Salmonella Entry Toolkit[J].Front Cell Infect Microbiol,2017,7:348.
[5]Lou L,Zhang P,Piao R,et al.Salmonella Pathogenicity Island 1 (SPI-1) and Its Complex Regulatory Network[J].Front Cell Infect Microbiol,2019,9:270.
[6]Egan F,Barret M,O'Gara F.The SPI-1-like Type III secretion system: more roles than you think[J].Front Plant Sci,2014,5:34.
[7]Cerny O,Holden DW.Salmonella SPI-2 type III secretion system-dependent inhibition of antigen? presentation and T cell function[J].Immunol Lett,2019,215:35-39.
[8]Jennings E,Thurston T,Holden DW.Salmonella SPI-2 Type III Secretion System Effectors: Molecular Mechanisms And Physiological Consequences[J].Cell Host Microbe,2017,22(2):217-231.
[9]呂雪蓮,周薇,劉松艷,等.腸炎沙門氏菌三種主要毒力島基因缺失株的構(gòu)建及其免疫效力研究[C]//第十屆全國(guó)免疫學(xué)學(xué)術(shù)大會(huì)匯編.2015.
[10]Hughes LA,Shopland S,Wigley P,et al.Characterisation of Salmonella enterica serotype Typhimurium isolates from wild birds in northern England from 2005-2006[J].BMC Vet Res,2008,4:4.
[11]Chen Z,Bai J,Wang S,et al.Prevalence, Antimicrobial Resistance, Virulence Genes and Genetic Diversity of Salmonella Isolated from Retail Duck Meat in Southern China[J].Microorganisms,2020,8(3):444.
[12]Soubeiga AP,Kpoda DS,Compaoré MKA,et al.Molecular Characterization and the Antimicrobial Resistance Profile of Salmonella spp. Isolated from Ready-to-Eat Foods in Ouagadougou, Burkina Faso[J].International Journal of Microbiology,2022,2022:1-10.
[13]Stanaway JD,Parisi A,Sarkar K,et al.The global burden of non-typhoidal Salmonella invasive disease: a systematic analysis for the Global Burden of Disease Study 2017[J].The Lancet Infectious Diseases,2019,19(12):1312-1324.
[14]Haselbeck AH,Panzner U,Im J,et al.Current perspectives on invasive nontyphoidal Salmonella disease[J].Curr Opin Infect Dis,2017,30(5):498-503.
[15]Azimi T,Zamirnasta M,Sani MA,et al.Molecular Mechanisms of Salmonella Effector Proteins: A Comprehensive Review[J].Infect Drug Resist,2020,13:11-26.
[16]Thung TY,Radu S,Mahyudin NA,et al.Prevalence, Virulence Genes and Antimicrobial Resistance Profiles of Salmonella Serovars from Retail Beef in Selangor, Malaysia[J].Front Microbiol,2017,8:2697.
[17]Ramtahal MA,Somboro AM,Amoako DG,et al.Molecular Epidemiology of Salmonella enterica in Poultry in South Africa Using the Farm-to-Fork Approach[J].International Journal of Microbiology,2022,2022:1-12.
[18]Canzoneri R,Lacunza E,Abba MC.Genomics and bioinformatics as pillars of precision medicine in oncology[J].Medicina (B Aires),2019,79(Spec 6/1):587-592.
[19]Polasa A,Tabari SH,Moradi M.Developing Efficient Transfer Free Energy Calculation Methods for Hydrophobicity Predictions[J].Biophysical Journal,2021,120(3):115a.
[20]El-Manzalawy Y,Dobbs D,Honavar VG.In Silico Prediction of Linear B-Cell Epitopes on Proteins[J].Methods Mol Biol,2017,1484:255-264.
收稿日期:2023-04-06;修回日期:2023-05-10
編輯/成森