于丹 栗東芳 袁林 馮欣 史偉 姚開虎★
百日咳鮑特菌(Bordetella pertussis,B.pertussis)又稱為百日咳桿菌,是百日咳的病原菌。20世紀(jì)40年代開始推廣接種百日咳疫苗后,百日咳發(fā)病率明顯下降。但20世紀(jì)末,一些高疫苗接種率國家陸續(xù)報(bào)道百日咳發(fā)病率再度升高,稱為百日咳再現(xiàn)(pertussis re-emerge),引起全球廣泛關(guān)注[1]。百日咳再現(xiàn)涉及多方面的原因,其中百日咳鮑特菌的適應(yīng)性變化是重要原因之一,包括對(duì)疫苗免疫選擇壓力和抗生素選擇壓力的適應(yīng)性變化[1]。從不同國家報(bào)道數(shù)據(jù)看,盡管1994年第一例紅霉素耐藥百日咳鮑特菌出現(xiàn)在美國,但至今只有中國內(nèi)地報(bào)道了紅霉素耐藥百日咳鮑特菌的廣泛流行[2]。前期,本課題組研究結(jié)果提示紅霉素耐藥百日咳鮑特菌大多具有相同的抗原基因型,均為ptxA1/ptxP1/prn1型,與之前的研究結(jié)果相一致[3],提示耐藥菌株具有相似遺傳背景。為進(jìn)一步明確耐藥菌株的基因組特征,本研究對(duì)紅霉素耐藥株P(guān)2013109 進(jìn)行了完整基因組測序,并與我國疫苗株CS 等已公開的完整基因組數(shù)據(jù)比較,為疫苗研究等提供參考。
菌株P(guān)2013109 為本實(shí)驗(yàn)室從百日咳患兒鼻咽拭子標(biāo)本中分離。菌株的特點(diǎn):藥物敏感性檢測顯示該菌株紅霉素最低抑菌濃度(Minimum inhibitory concentration,MIC)>256 mg/L,紅霉素KB 紙片(15 μg/片)擴(kuò)散法檢測藥物敏感性未見抑菌環(huán),前期研究確定其疫苗相關(guān)抗原基因型為ptxA1/ptxC1/ptxP1/prn1/fim2-1/fim3-1/tcfA2[3]。
硅膠模型TM 基因組DNA 提取試劑盒(北京賽百盛公司),碳瓊脂培養(yǎng)基(CM0119,英國OXOID 公司),培養(yǎng)箱,4℃冰箱,-80℃冰箱,離心機(jī)。
凍存菌株標(biāo)本接種于含10%羊血的碳瓊脂培養(yǎng)基。培養(yǎng)基置于溫度為35℃的培養(yǎng)箱中孵育3天后觀察菌落特征和純度,轉(zhuǎn)種一次。刮取瓊脂上的菌落,采用試劑盒提取細(xì)菌基因組DNA。
將P2013109 的基因組DNA 委托上海美吉生物醫(yī)藥公司分別利用二代Illumina Hiseq 2000 平臺(tái)和三代Pacbio 平臺(tái)進(jìn)行全基因組測序。采用SOAPdenovo v2.04 軟件對(duì)二代測序數(shù)據(jù)進(jìn)行初步組裝;利用blasR 將三代測序數(shù)據(jù)比對(duì)到初步組裝結(jié)果上,并對(duì)其進(jìn)行矯正與糾錯(cuò);然后利用糾正后的三代測序數(shù)據(jù)進(jìn)行組裝,使用的軟件為Celera Assembler8.0。最后再次利用二代測序數(shù)據(jù)進(jìn)行校驗(yàn),同時(shí)進(jìn)行局部內(nèi)洞填充和堿基校正。
對(duì)組裝得到的基因組序列,利用Glimmer 3.02軟件進(jìn)行開放閱讀框(open reading frame,ORF)預(yù)測,并與數(shù)據(jù)庫比對(duì)獲得蛋白功能注釋。利用Barrnap 0.4.2 和tRNAscan-SE v1.3.1 軟件對(duì)基因組中包含的rRNA 和tRNA 進(jìn)行預(yù)測。
從NCBI 下載已完成全基因組測序的15 株百日咳桿菌及其注釋信息(見下表1),包括中國百日咳疫苗株CS[4]、該菌種最早完成測序的Tohama I菌株[5],以及歐美發(fā)達(dá)國家已經(jīng)發(fā)表的當(dāng)前流行的ptxP3型菌株的基因組序列[6-7]。利用MUMmer3.23 軟件將其他基因組序列與參考基因組序列Tohama I 進(jìn)行比對(duì),得到每個(gè)基因組的單核苷酸多態(tài)性(SNPs)信息,去除落在重復(fù)序列區(qū)域的SNP 后,將在所有樣本中都出現(xiàn)的SNP 位點(diǎn)來構(gòu)建系統(tǒng)發(fā)育樹,采用TreeBeST 軟件中的最大似然法,迭代1 000 次。用blast v2.5.0 比對(duì)軟件將其他菌株比對(duì)到菌株P(guān)2013109 上,得到每株菌在P2013109 的比對(duì)上的區(qū)域,然后將所有菌的比對(duì)結(jié)果用circos 軟件做圖。
對(duì)測序得到的百日咳桿菌P2013109 二代和三代數(shù)據(jù)進(jìn)行質(zhì)控和組裝后,得到一個(gè)完整的基因組序列,總長度4 126 010 bp,GC 含量為67.72%,預(yù)測P2013109 的基因共有4 085 個(gè),基因的總長度為3 571 551 bp,占全基因組的86.6%,平均基因長度為874 bp。基因區(qū)GC 含量為68.4%,基因間區(qū)GC 含量為62.8%。共找到61 個(gè)tRNA 和3 組rRNA。P2013109 基因組序列已經(jīng)提交到NCBI 的Genbank 數(shù)據(jù)庫,其登錄號(hào)為CP038790。與其他15 株菌的基因組信息見下表1。
表1 百日咳桿菌P2013109 與其他15 個(gè)菌株基因組的基本特征Table 1 The genome characteristics of B.pertussis P2013109 and the others
通過與String 數(shù)據(jù)庫比對(duì),在P2013109 基因組上,共有3 388 個(gè)CDS 獲得COG 和NOG 功能注釋,根據(jù)注釋結(jié)果可以將這些功能歸為4 大類,23小類。如表2 所示。在這些注釋結(jié)果中,與代謝相關(guān)的功能最多,主要以氨基酸、無機(jī)離子、脂類和碳水化合物的轉(zhuǎn)運(yùn)和代謝為主;其次是細(xì)胞過程與信號(hào)傳導(dǎo)類的功能,主要以細(xì)胞壁/膜/包體的生物合成、翻譯后修飾等為主;在信息儲(chǔ)存和處理類的功能中,以轉(zhuǎn)錄和翻譯為主。
通過與KEGG 數(shù)據(jù)庫比對(duì),在P2013109 基因組中共找到代謝通路相關(guān)的基因2 160 個(gè)。共注釋上41 個(gè)類型,歸屬6 個(gè)大類,即細(xì)胞過程、環(huán)境信息處理、遺傳信息處理、人類疾病,代謝和有機(jī)體系統(tǒng)相關(guān)的功能。
2.4.1 抗原基因型和耐藥基因型確定
比對(duì)百日咳鮑特菌P2013109 抗原基因ptxA、ptxP、fim3和prn的核苷酸序列,得到P2013109 的基因組的抗原基因型結(jié)果,與前期抗原基因型測序結(jié)果一致。其他15 株菌通過搜集文獻(xiàn)和比對(duì)結(jié)果相結(jié)合的方式得到這些抗原基因型的分析結(jié)果,見表1 所示。細(xì)菌染色體23s rRNA 基因有3個(gè)拷貝,每個(gè)拷貝中均具有A2047G 變異。
2.4.2 全基因組比對(duì)
將其他所有菌株與P2013109 比對(duì)結(jié)果如下圖1 所示。與P2013109 相比,其他基因組主要有3 個(gè)比較大的缺失區(qū)域,R1 約4kb,編碼轉(zhuǎn)座酶;R2 是菌株H321 和I979 缺失的一個(gè)大約27 kb 的區(qū)域,是編碼百日咳毒素和IV 型分泌系統(tǒng)的區(qū)域;R3 區(qū)域主要包含R3-1 和R3-2 兩個(gè)子區(qū)域,除了CS 和Tohama I 菌株外,其他菌株均缺失。R3-1 主要包含BP1948-1951、BP1953 和BP1954 等6 個(gè)基因,前4個(gè)基因涉及支鏈氨基酸轉(zhuǎn)運(yùn)底物結(jié)合蛋白、轉(zhuǎn)運(yùn)系統(tǒng)滲透酶、APC 轉(zhuǎn)運(yùn)體ATP 結(jié)合蛋白;BP1953 和BP1954,分別編碼氧化還原酶和單氧酶。R3-2 區(qū)域也包含4 個(gè)基因,BP1959 是IS1663 的轉(zhuǎn)座酶基因,BP1961 編碼一種細(xì)胞色素flavocytochrome,bfrI和BP1965 分別與鐵載體受體和跨膜蛋白有關(guān)。
2.4.3 系統(tǒng)發(fā)育分析
將這16 株菌與廣東報(bào)道的一株百日咳全基因序列一起做系統(tǒng)發(fā)育分析,共得到326 個(gè)SNPs。基于這些SNPs 構(gòu)建系統(tǒng)發(fā)育樹如圖2 所示,由圖可知,這16 株菌可以分成3 個(gè)型別,TohamaⅠ和CS 這兩個(gè)疫苗株作為I 型,分別于1951年和1952年分離,與其他2 個(gè)型別有76 個(gè)SNP 的差異(23.3%),此外,TohamaⅠ與其他所有菌株比較呈現(xiàn)54 個(gè)SNPs(16.5%)。P2013109 自成一個(gè)分支,并且與其他所有菌株相比,呈現(xiàn)25 個(gè)SNPs(7.7%)。其他在2000年之后采集自國外的菌株自成一個(gè)型別,與另外兩個(gè)型別有21 個(gè)SNP 的差異(6.4%),其中這14 株菌又可以分為兩個(gè)亞型,主要區(qū)別是Ⅲa 亞型的fim3基因是2 型,而Ⅲb 型菌株是1 型。
分支旁的數(shù)字為自展1 000 次的置信值;標(biāo)尺代表7%的序列差異。系統(tǒng)發(fā)育樹分析時(shí)納入了廣東分離株BP_GD2017,見參考文獻(xiàn)[8]。
圖1 P2013109 與其他15 株菌的全基因組比較結(jié)果Figure 1 The whole genome comparison analysis of B.pertussis P2013109 and the other 15 genomes
圖2 百日咳桿菌P2013109 與其他百日咳桿菌的的全基因組進(jìn)化樹Figure 2 Genome-wide phylogenetic tree of Genome-wide phylogenetic tree of Bordetella pertussis P2013109 and the other genomes(including the BP_GD2017 isolated from Gangdong)
表2 百日咳桿菌P2013109 基因組的COG 功能分類Table 2 Gene distribution based on COG and NOG functional classification of B.pertussis P2013109
本研究顯示百日咳鮑特菌P2013109 株基因組4,126,010 bp,與已經(jīng)報(bào)道的百日咳鮑特菌全基因組[9-10]大小相當(dāng)。該紅霉素耐藥株表型明確,全基因組序列也表明,細(xì)菌染色體23S rRNA 基因有3個(gè)拷貝,3 個(gè)拷貝中均具有A2047G 變異。23S rRNA 是核糖體RNA,核糖體是細(xì)胞內(nèi)蛋白質(zhì)合成的場所,紅霉素可以通過與位于23S rRNA 區(qū)域的肽鏈形成的部位(肽酰轉(zhuǎn)移酶區(qū)域)結(jié)合進(jìn)而抑制蛋白質(zhì)合成。23S rRNA 突變是目前百日咳鮑特菌耐藥的主要機(jī)制[11],基因型與表型相互應(yīng)證。與P2013109 株全基因組比較,其他菌株主要有3 個(gè)缺失區(qū),尤其R1 區(qū)涉及轉(zhuǎn)座酶。這些基因區(qū)在耐藥變異過程中是否發(fā)揮作用,需要深入研究?;谕暾蚪MSNPs 構(gòu)建系統(tǒng)發(fā)育樹發(fā)現(xiàn),納入分析的菌株明確分為3 支。分離于20世紀(jì)50年代的百日咳流行菌株CS 株[4]和Tohama I 株形成獨(dú)立的進(jìn)化分支,與當(dāng)前流行菌株在進(jìn)化分支上存在較大差異。
近期,廣東李柏生等[8]對(duì)廣東分離到的1 株百日咳鮑特菌BP-GD2017 進(jìn)行全基因組分析報(bào)道,該菌株的基因組草圖序列數(shù)據(jù)納入基因組比較分析發(fā)現(xiàn),該菌株處于國外菌株分支Ⅲ中(見圖3),它們的抗原基因型也完全相同,為ptxA1/ptxP3。P2013109 獨(dú)屬一支,抗原基因型為ptxA1/ptxP1。課題組前期檢測了99 株百日咳鮑特菌的疫苗相關(guān)基因型,ptxA1/ptxP1占91.9%(91/99)[3]。這些數(shù)據(jù)明確提示長期疫苗使用之后,百日咳致病菌株百日咳毒素相關(guān)基因型發(fā)生了明顯變化,與既往研究報(bào)告[12-13]相符。提示近年來流行的百日咳菌株的基因改變除了疫苗壓力造成相關(guān)抗原性發(fā)生適應(yīng)進(jìn)化,也有可能在進(jìn)化分支上出現(xiàn)改變。本課題組前期研究表明,臨床分離菌株耐藥株抗原基因型均為ptxA1/ptxP1,而基因型ptxA1/ptxP3的分離株全部對(duì)紅霉素敏感,這提示國內(nèi)外臨床分離菌株耐藥性的差異,與流行菌株的遺傳背景不同相關(guān)。
當(dāng)前百日咳疫苗生產(chǎn)用菌株基本上都是分離自上個(gè)世紀(jì)。研究已經(jīng)發(fā)現(xiàn),百日咳疫苗長期使用以后,臨床分離菌株的抗原基因型與疫苗株明顯不同[12-13]。尤其在無細(xì)胞疫苗使用國家,一些毒力抗原缺失的菌株,如缺失PRN、FIM 和PTX 的菌株逐漸被發(fā)現(xiàn),甚至出現(xiàn)流行的情況,菌株疫苗抗原的變異和缺失等適應(yīng)性變化可能是百日咳再現(xiàn)的重要因素[14]。但課題組在前期研究中沒有發(fā)現(xiàn)國內(nèi)百日咳鮑特菌分離株有抗原缺失,與疫苗株比較主要是抗原基因變異[3]。本研究從基因組序列證明P2013109 有抗原基因變異,無缺失,同時(shí)與疫苗株比較遺傳進(jìn)化分支明顯不同。近期,Xu 等[15]分析了71 株中國分離的ptxP1菌株(其中包括46 株紅霉素耐藥株)的基因組重測序結(jié)果,基于2 744 個(gè)SNPs 位點(diǎn)構(gòu)建遺傳進(jìn)化樹,結(jié)果發(fā)現(xiàn)耐藥株只出現(xiàn)在3 個(gè)遺傳分支中,這些耐藥株只分離自中國內(nèi)地,包括香港、臺(tái)灣在內(nèi)的其他地區(qū)和國家公開的菌株基因組,均沒有處于同一遺傳支的分離株。
本研究第一次呈現(xiàn)了耐紅霉素百日咳鮑特菌ptxP1型菌株的完整基因組序列,序列分析明確顯示其在遺傳學(xué)關(guān)系上與疫苗株和國外當(dāng)前主要流行的ptxP3型菌株遺傳關(guān)系較遠(yuǎn),屬于特有的一個(gè)遺傳分支。已有基因組重測序研究提示還需要對(duì)其他耐藥菌株進(jìn)行完整基因組的構(gòu)建和研究,才能反映紅霉素耐藥鮑特菌基因組的全貌,為國內(nèi)將來新型百日咳疫苗的研發(fā)提供基礎(chǔ)信息。
致謝:廣東省疾病預(yù)防控制中心李柏生提供其課題組發(fā)表的1 株百日咳鮑特菌分離株的全基因組序列數(shù)據(jù)。