王 也,凌志婷,徐 堯,張 琴,殷月蘭,焦新安
單核細胞增生李斯特菌(L.monocytogenes, LM)可導致動物和人李斯特菌病,是一種重要的食源性致病菌,可分為4個系統(tǒng)發(fā)育譜系(Linage I~IV)[1]。LM易感染孕婦、老年人、兒童等免疫力低下人群,引起患者敗血癥、腦膜炎、孕婦流產(chǎn)等癥狀,感染后的病死率可達20%~30%[2]。LM對低溫、高鹽等條件有較強的抵抗力,在自然環(huán)境中廣泛分布。LM可污染飼料和農(nóng)場并通過養(yǎng)殖、屠宰、加工、存儲等環(huán)節(jié)傳播,增加了人和動物李斯特菌病暴發(fā)的風險,引起了世界各國的高度關注[3]。
微生物的分型方法可分為基于表型的分型方法和基于微生物基因的分型方法[4]。表型分型方法包括傳統(tǒng)細菌分類學的種屬鑒定、血清分型、噬菌體分型等?;谖⑸锘虻姆中头椒▌t是運用生物信息學技術,對基因組高通量測序數(shù)據(jù)進行比較分析,包括多位點序列分型、核心基因/全基因組多位點序列分型、單核苷酸多態(tài)性分析和CRISPR分型等[5]。分子分型技術在流行病學調(diào)查和溯源分析中具有重要作用。
隨著分子流行病學的發(fā)展,比較基因組學分析方法已被廣泛應用于病原菌的分子分型、溯源調(diào)查,以及對細菌耐藥特性、致病機制、分子進化速率等方面的研究[6]。本文重點對目前應用于LM研究領域的各種基于基因組學的分子分型方法進行綜述,以期為李斯特菌病的預防控制提供參考。
2.1 多位點序列分型 多位點序列分型(MLST)是一種基于基因組多位點序列分析的細菌分型方法,最初是通過PCR擴增7個LM管家基因(abcZ、bglA、cat、dapE、dat、ldh、lhkA)特定區(qū)段并進行序列測定,根據(jù)多個等位基因序列的差異進行分型[7]。隨著基因組測序技術的發(fā)展,目前可直接根據(jù)基因組測序數(shù)據(jù)進行MLST分型。MLST分型方法對菌株型別的定義易于標準化,可通過網(wǎng)絡數(shù)據(jù)庫進行數(shù)據(jù)交換和比對,已成為LM 流行病學研究中應用最廣泛的分子分型方法[8]。
利用MLST不僅可將菌株分為不同ST型,還能將不同的ST型進一步聚類分析,目前各不同ST型的LM菌株可聚類成至少48種不同的克隆群(CCs)。從臨床感染病例分離的CCs主要為高毒力菌株,包括CC1、CC2、CC4和CC6等;從環(huán)境、食品分離的CCs,包括CC9和CC121等;同時還有一些中間CCs,包括CC8、CC87等,既有臨床感染分離株也有環(huán)境、食品分離株[9-10]。國外LM暴發(fā)相關的CCs型主要為CC1、CC2、CC4和CC6,而我國感染病例與食品中檢出的主要CCs型為CC8、CC9、CC87[11]。與傳統(tǒng)分型方法相比,MLST操作簡單、耗時短,能夠進行簡單的溯源以及菌株系統(tǒng)發(fā)育分析。但MLST對菌株基因組信息的挖掘不夠深入,對親緣關系較近的分離株難以進行準確有效的溯源和系統(tǒng)發(fā)育分析。
2.2 CRISPR分型 CRISPR分型是利用WGS數(shù)據(jù)直接進行分型的一種分型方法。CRISPR (Clustered Regularly Inter-spaced Short Palindromic Repeats) 是由間隔子(spacers)和定向重復序列(DR)組成的DNA片段,和Cas蛋白組成完整的CRISPR-Cas系統(tǒng),該系統(tǒng)是一種原核適應性免疫系統(tǒng),通過將外源DNA片段整合到CRISPR陣列中而發(fā)揮功能[12]。CRISPR陣列中的間隔子夾在DR之間,是細菌噬菌體感染微生物的記錄,同時也是CRISPR-Cas系統(tǒng)這種獲得性免疫的標志。具有相似間隔子或間隔子樣式的分離菌株具有較高的同源性,這就是基于CRISPR進行分子分型的理論基礎[13]。
20世紀90年代中期,前人對結核分枝桿菌的CRISPR基因座進行了廣泛的研究,并利用其間隔子的高度多態(tài)性首次開發(fā)了一種稱為間隔區(qū)寡核苷酸分型(Spoligotyping)的分析方法[14]。隨后又陸續(xù)開發(fā)出了基于其他致病菌間隔子的亞型分析方法,如用于鼠疫耶爾森菌、白喉棒狀桿菌、彎曲菌、沙門菌的CRISPR分型方法[15-18]。近年來,關于LM的CRISPR分型開展了一些研究,Di等發(fā)現(xiàn)LM血清型1/2a和1/2b菌株的CRISPR序列多樣性程度較高,可利用CRISPR序列差異進行分型,且其分辨能力較PFGE更強[19]。Wang等結合Cas蛋白和CRISPR的結構及序列特征,建立了CRISPR-Cas分型技術,對64株LM分離株進行CRISPR-Cas系統(tǒng)分析,發(fā)現(xiàn)其能區(qū)分13株無SNP差異的菌株[20]。此外,CRISPR分型用于LM分子流行病學研究仍有一些局限,例如不容易區(qū)分間隔區(qū)高度保守的大部分譜系Ⅰ、Ⅲ菌株,同時一些LM菌株沒有完整的CRISPR系統(tǒng),這些均影響了CRISPR分子分型方法的發(fā)展。
2.3 核心基因/全基因組多位點序列分型 近年來,基于基因組高通量測序數(shù)據(jù)建立了核心基因/全基因組多位點序列分型 (cg/wgMLST)用于LM的分子流行病學監(jiān)測[21]。其中cgMLST通過對數(shù)據(jù)庫中全部菌株的基因組分析,篩選出菌株代表性的共有基因位點,LM的cgMLST分型方案通常包含了1 700個左右相對保守的基因位點即核心基因組位點。而wgMLST則包含了數(shù)據(jù)庫中菌株共有的全部基因位點即全基因組位點,用于分析LM的wgMLST分型方案包含的全基因組位點數(shù)一般為2 800至3 000個。Ruppitsch等開發(fā)的cgMLST分型方案將等位基因數(shù)差異≤10的LM菌株聚類在一起從而區(qū)分暴發(fā)菌株和無關菌株,成功地對一起由受污染的酸凝乳奶酪引發(fā)的李斯特菌病暴發(fā)進行溯源,確定暴發(fā)菌株為2株1/2a 型LM分離株[22]。Cabal等對1 960株LM菌株進行cgMLST聚類分析,對多起LM感染暴發(fā)成功進行了溯源和菌株的系統(tǒng)發(fā)育分析[23];Papic’B等人首次利用基于WGS數(shù)據(jù)的幾種分型方法,對反芻動物李斯特菌病暴發(fā)進行溯源分析,結果表明wgMLST可明確區(qū)分使用PFGE無法區(qū)分的LM分離株[24]。cgMLST和wgMLST分析的結果大致相同,由于cgMLST分析考慮的基因組位點數(shù)少,對數(shù)據(jù)質(zhì)量、閾值的要求相對較低,能夠滿足大多數(shù)情況下對菌株的溯源及系統(tǒng)發(fā)育分析要求,因而更常用于LM的分子流行病學研究[25]。
雖然cg/wgMLST已廣泛應用于多起LM暴發(fā)的溯源分析以及菌株的系統(tǒng)發(fā)育分析,但其只能評估核心基因組數(shù)據(jù)中存在的差異,沒有涉及基因組其他部分數(shù)據(jù),可能遺漏一些基因信息,如在基因間區(qū)域或非常罕見的輔助基因中的多態(tài)性差異,這些都會影響分析結果準確性[26]。此外,cg/wgMLST分析需要具備對數(shù)據(jù)進行生物信息學處理的專業(yè)能力,因而限制了其更廣泛的應用。同時cg/wgMLST分析中閾值與等位基因數(shù)量之間的平衡是能否正確有效分析的關鍵因素之一,等位基因閾值設置的改變也會導致分析結果的不同[27]。盡管如此,分型能力強大的cg/wgMLST將會逐步取代傳統(tǒng)的MLST分析在LM的分子流行病學研究中得以廣泛應用。
2.4 單核苷酸多態(tài)性分析 單核苷酸多態(tài)性(Single nucleotide polymorphism,SNP)分析是另一種基于細菌WGS數(shù)據(jù)的分型方法。SNP主要指在基因組水平上由單個核苷酸變異所產(chǎn)生的DNA序列多態(tài)性。SNP具有分辨率高、覆蓋基因組范圍大等特點,已被廣泛應用于系統(tǒng)發(fā)育分析、群體遺傳學研究和疾病相關基因等研究[28]。通過將目標菌株的基因組數(shù)據(jù)與參考基因組進行SNP比較并記錄變化的核苷酸,能夠揭示細菌群體的進化并發(fā)現(xiàn)和追蹤暴發(fā)感染的來源[29]。Gilmour等首次對一起李斯特菌病暴發(fā)期間分離菌株的WGS數(shù)據(jù)進行SNP分析,確定了暴發(fā)菌株屬于譜系II、CC8,并發(fā)現(xiàn)其非同義突變率較高的特點[30]。2017年1月1日至2018年7月17日南非發(fā)生了共1 060例病例的李斯特菌病暴發(fā),Smith等利用SNP分析對病人和食品分離菌株進行系統(tǒng)發(fā)育分析,證實這次暴發(fā)的源頭是Enterprise Foods公司生產(chǎn)的被LM污染的豬肉腸[31]。除此之外,Lüth等對德國十幾年間發(fā)生的83例侵襲性李斯特菌病病例的LM分離株進行SNP聚類分析,推測這幾起暴發(fā)感染的病例很有可能是由牲畜攜帶的LM所導致的[32]。
SNP分析需要較強的生物信息學分析能力,同時對菌株的WGS數(shù)據(jù)質(zhì)量要求更高,需采用嚴格的質(zhì)量標準,包括最小覆蓋范圍和SNP之間允許的距離等,以確保基因組數(shù)據(jù)的準確性和一致性。這些要求和標準會因基因組裝方法的不同而有所差別,導致測序數(shù)據(jù)結果的差異,因而很難建立一致的命名法,由此給不同實驗室間SNP分析的標準化帶來了困難[33]。同時,在分離株分離和培養(yǎng)過程中產(chǎn)生的少量SNP的積累也會影響SNP分析時對菌株同源性的判斷[34]。SNP分析具有對基因組數(shù)據(jù)精準至單個堿基的強大分析能力,因而在LM的分子流行病學研究中具備廣闊的應用前景。
由LM引起的人和動物李斯特菌病致死率高、危害性大,盡管已采取相關的預防措施如建立食品安全監(jiān)測網(wǎng)絡對其進行防控,但仍有散發(fā)甚至暴發(fā)的李斯特菌病在各個國家和地區(qū)出現(xiàn)。近年來國內(nèi)外對LM分子分型、流行病學、致病機制等的研究不斷深入,為李斯特菌病的預防和控制提供了參考依據(jù)?;赪GS數(shù)據(jù)的cg/wgMLST和SNP分析方法具有分辨率高、可重復性強、高通量等特點,為病原菌的分子流行病學研究提供了有效手段,將會在LM的監(jiān)測和預防控制中發(fā)揮重要作用。
利益沖突:無
引用本文格式:王 也,凌志婷,徐 堯,等. 單核細胞增生李斯特菌基于基因組學的分型和溯源技術研究[J].中國人獸共患病學報,2022,38(4):327-330,340. DOI:10.3969/j.issn.1002-2694.2022.00.033