張磊,鄭敏玲,王亞,柴海云,鄧光遠(yuǎn),朱慶義,陳茶,屈平華
(1.廣州金域醫(yī)學(xué)檢驗(yàn)中心有限公司微生物室,廣州 510330;2.廣州中醫(yī)藥大學(xué)第二附屬醫(yī)院/廣東省中醫(yī)院檢驗(yàn)醫(yī)學(xué)部,廣州 510006;3.澤塔生物科技(上海)有限公司,上海 201203)
·臨床實(shí)驗(yàn)研究·
基于高通量測(cè)序的平均核苷酸一致性在1株弗朗西斯菌鑒定中的應(yīng)用
張磊1,鄭敏玲2,王亞3,柴海云1,鄧光遠(yuǎn)2,朱慶義1,陳茶2,屈平華2
(1.廣州金域醫(yī)學(xué)檢驗(yàn)中心有限公司微生物室,廣州 510330;2.廣州中醫(yī)藥大學(xué)第二附屬醫(yī)院/廣東省中醫(yī)院檢驗(yàn)醫(yī)學(xué)部,廣州 510006;3.澤塔生物科技(上海)有限公司,上海 201203)
目的 對(duì)一溺水性肺炎患者血液標(biāo)本中分離的弗朗西斯菌(編號(hào)Wenzhou1)進(jìn)行菌種鑒定。方法 采用Illumina二代測(cè)序平臺(tái)2000/miSeq系統(tǒng)對(duì)實(shí)驗(yàn)菌株進(jìn)行高通量測(cè)序,MicrobeTrakr Plus軟件對(duì)測(cè)得的全基因組草圖進(jìn)行序列拼接。在GenBank數(shù)據(jù)庫(kù)中,對(duì)實(shí)驗(yàn)菌株的16S rRNA基因、mdh基因、rpoB基因和sdhA基因序列進(jìn)行NCBI BLAST分析,獲得與實(shí)驗(yàn)菌株遺傳關(guān)系接近的近緣菌種信息。Java 8運(yùn)行環(huán)境,OrthoANI軟件對(duì)實(shí)驗(yàn)菌株和近緣菌種進(jìn)行全基因組序列NCBI BLAST搜索和全基因組平均核苷酸一致性(average nucleotide identity,ANI)分析。結(jié)果 測(cè)得的弗朗西斯菌Wenzhou1的基因組大小為1.96×106bp,含74個(gè)重疊群(contigs)?;蚪MG+C mol%為32.1%,與其他弗朗西斯菌和另弗朗西斯菌一致。GenBank數(shù)據(jù)庫(kù)NCBI BLAST分析結(jié)果顯示,Wenzhou1的16S rRNA基因、mdh基因、rpoB基因和sdhA基因序列與西班牙弗朗西斯菌FSC454和“土拉弗朗西斯菌新兇手亞種”3523最為近緣。ANI分析顯示,實(shí)驗(yàn)菌株Wenzhou1與西班牙弗朗西斯菌FSC454的ANI為97.8%,與“土拉弗朗西斯菌新兇手亞種”3523的ANI在97.5%~97.6%之間,而與土拉弗朗西斯菌的4個(gè)亞種的ANI在91.3%~91.5%之間。結(jié)論 基于全基因組序列的ANI分析是一種準(zhǔn)確和有效的菌種鑒定方法。Wenzhou1可明確鑒定為西班牙弗朗西斯菌。
西班牙弗朗西斯菌;平均核苷酸一致性分析;菌種鑒定
近年來,隨著后基因組計(jì)劃的執(zhí)行和高通量測(cè)序(high-throughput sequencing)技術(shù)的進(jìn)步,已測(cè)序的全基因組數(shù)量正在快速增長(zhǎng),其中大多數(shù)與人類疾病相關(guān)的病原微生物均完成了全基因組測(cè)序。雖然合格發(fā)表(valid-published)的菌種數(shù)量不多,但就弗朗西斯菌(Francisella)而言,截至2017年4月,在GenBank數(shù)據(jù)庫(kù)中存放的基因組仍達(dá)139個(gè),其中以土拉弗朗西斯菌(F.tularensis)為主,為109個(gè);其他包括蜃樓弗朗西斯菌(F.philomiragia)9個(gè)、船城弗朗西斯菌(F.noatunensis)8個(gè)、波斯弗朗西斯菌(F.persica)和西班牙弗朗西斯菌(F.hispaniensis)各2個(gè)、弗朗西斯菌內(nèi)生體(F.endosymbiont)和廣州另弗朗西斯菌(Allofrancisellaguangzhouensis)各1個(gè)。上述已測(cè)序的全基因組數(shù)據(jù)為系統(tǒng)評(píng)價(jià)弗朗西斯菌和相關(guān)菌種的種內(nèi)、種間差異奠定了堅(jiān)實(shí)的基礎(chǔ)。本研究采用高通量基因組測(cè)序技術(shù)和基于全基因組平均核苷酸一致性(average nucleotide identity,ANI)分析,最終鑒定了1株從溺水性肺炎患者血液標(biāo)本中分離的西班牙弗朗西斯菌,報(bào)道如下。
1.1 菌株 實(shí)驗(yàn)菌株由溫州醫(yī)科大學(xué)第一附屬醫(yī)院饋贈(zèng),其來源于1例溺水性肺炎患者血液標(biāo)本,菌株編號(hào)為Wenzhou 1,前期已測(cè)序其16S rRNA基因、蘋果酸脫氫酶(malate dehydrogenase, mdh)基因、RNA指導(dǎo)的RNA聚合酶亞單位β(DNA-directed RNA polymerase subunit beta, rpoB)基因和琥珀酸脫氫酶亞單位α(succinate dehydrogenase subunit alpha, sdhA)基因,遞交GenBank數(shù)據(jù)庫(kù)后獲得的登錄號(hào)(accession numbers)分別為KU507069、KU507070、KU507071和KU507072。
1.2 細(xì)菌的全基因組測(cè)序和組裝 按細(xì)菌基因組試劑盒(大連TaKaRa公司)說明書提取實(shí)驗(yàn)菌株的基因組DNA,隨機(jī)霰彈式打斷構(gòu)建DNA文庫(kù),采用2000/miSeq系統(tǒng)(Illumina公司)二代測(cè)序平臺(tái)進(jìn)行測(cè)序。取1 μg的基因組DNA,利用噴霧法(Nebulization)打斷成約800 bp的片段,純化后接上PE接頭,然后進(jìn)行雙向測(cè)序。全基因組測(cè)序由軍事醫(yī)學(xué)科院微生物流行病研究所完成。在去除接頭以及一些質(zhì)量值較低的讀碼序列后,用MicrobeTrakr Plus軟件(上海澤塔生物科技公司)進(jìn)行從頭拼裝(de novo)[1]。
1.3 核酸序列的NCBI BLAST搜索 在GenBank數(shù)據(jù)庫(kù)中運(yùn)用在線的NCBI BLAST搜索(http://blast.ncbi.nhn.nih.gov/Blast.cgi),對(duì)實(shí)驗(yàn)菌株的16S rRNA基因、mdh基因、rpoB基因和sdhA基因進(jìn)行分析,以獲得實(shí)驗(yàn)菌株的屬的地位和親緣關(guān)系臨近的相關(guān)菌種信息。
1.4 全基因組ANI分析 根據(jù)核酸序列的NCBI BLAST搜索結(jié)果,下載相關(guān)菌種的全基因組序列,F(xiàn)asta格式保存。Java 8運(yùn)行環(huán)境中下載ncbi-blast-2.2.30+程序和對(duì)應(yīng)操作系統(tǒng)的OAT程序(http://www.ezbiocloud.net/tools/orthoani),加載實(shí)驗(yàn)菌株和相關(guān)菌種的全基因組序列信息,并進(jìn)行全基因組ANI分析[2]。
2.1 核酸序列的NCBI BLAST搜索 16S rRNA基因全序列比對(duì)結(jié)果顯示,實(shí)驗(yàn)菌株與西班牙弗朗西斯菌、土拉弗朗西斯菌和波斯弗朗西斯菌等均高度近緣,其16S rRNA基因序列相似度均大于99.0%,其中與“土拉弗朗西斯菌新兇手亞種”3523的序列相似度為100%。mdh基因、rpoB基因和sdhA基因等3個(gè)管家基因序列比對(duì)結(jié)果亦顯示,該實(shí)驗(yàn)菌株最近緣的菌種為西班牙弗朗西斯菌FSC454和“土拉弗朗西斯菌新兇手亞種”3523。見表1。
2.2 基因組序列的基本信息 實(shí)驗(yàn)菌株和相關(guān)菌種的全基因組序列基本信息見表2。從組裝結(jié)果來看,實(shí)驗(yàn)菌株Wenzhou1的重疊群數(shù)達(dá)74個(gè),其基因組的完整性一般。
2.3 基因組ANI分析結(jié)果 實(shí)驗(yàn)菌株和相關(guān)菌種的ANI分析結(jié)果見表2。從分析結(jié)果來看,基于全基因組共有序列ANI和直系同源基因ANI(Orthologous average nucleotide identity, OrthoANI)基本一致。按全基因組ANI > 96%作為同一菌種的判定依據(jù)[3],實(shí)驗(yàn)菌株Wenzhou1與西班牙弗朗西斯菌FSC454(CP018093)和“土拉弗朗西斯菌新兇手亞種”(Francisellacf.novicida)3523(NC_017449)為同一個(gè)種?;谥毕低椿虻腛rthoANI距離構(gòu)建的系統(tǒng)發(fā)育樹亦顯示,菌株Wenzhou1、“土拉弗朗西斯菌新兇手亞種”3523和西班牙弗朗西斯菌在同一個(gè)進(jìn)化枝內(nèi)(見圖1),即Wenzhou1可鑒定為西班牙弗朗西斯菌,而“土拉弗朗西斯菌新兇手亞種”3523(NC_017449)的分類信息則應(yīng)該更正為西班牙弗朗西斯菌。
表1 實(shí)驗(yàn)菌株的NCBI BLAST核酸序列搜索的相似度結(jié)果(%)
表2 實(shí)驗(yàn)菌株與相關(guān)菌種的基因組ANI分析結(jié)果
注:除實(shí)驗(yàn)菌株Wenzhou1外,其余的相關(guān)菌種均為完整的基因組序列。
注:線段大小代表2%的基因組OrthoANI距離。
圖1 基于直系同源基因的OrthoANI距離構(gòu)建的系統(tǒng)發(fā)育樹
基因組學(xué)在細(xì)菌分類學(xué)研究中的一個(gè)重要應(yīng)用是建立了細(xì)菌基因組DNA的電腦模擬雜交方法。研究發(fā)現(xiàn),95%ANI值與經(jīng)典的70%DNA-DNA雜交關(guān)聯(lián)度的種鑒定標(biāo)準(zhǔn)具有良好的相關(guān)性[4]。從原理上說,ANI分析是一種電腦模擬的雜交實(shí)驗(yàn)方法,需要將基因組打斷為1 020 bp大小的片段后,再進(jìn)行兩兩比對(duì),因此,基因組的完整性對(duì)于ANI分析結(jié)果沒有影響,從而大大地降低了高通量測(cè)序后續(xù)序列組裝和信息分析難度。故與傳統(tǒng)的細(xì)菌DNA-DNA雜交實(shí)驗(yàn)相比較,ANI分析的數(shù)據(jù)結(jié)果客觀、穩(wěn)定,且不需要基因組注解步驟,被認(rèn)為是菌種界定的一個(gè)新的“金標(biāo)準(zhǔn)”[5],且可以提供基因組G+C含量(%)的鑒定信息。
本研究采用高通量測(cè)序技術(shù)以及基于全基因組ANI分析,最終將我國(guó)溫州一溺水性肺炎患者血液標(biāo)本中分離的病原菌Wenzhou1和2003年Whipp等[6]在澳大利亞一患者腿部傷口中分離的“土拉弗朗西斯菌新兇手亞種”3523(NC_017449)鑒定為西班牙弗朗西斯菌,這也是2010年西班牙弗朗西斯菌命名[7]以來,全球僅有的3株鑒定明確的臨床分離株。就鑒定結(jié)果來看,基于全基因組序列的ANI分析非常適用于特定的新發(fā)現(xiàn)的病原菌,尤其是菌株數(shù)量少、生化反應(yīng)不活潑和不明確的新發(fā)現(xiàn)病原菌的快速鑒定。
基于高通量測(cè)序和全基因組序列ANI分析方法,能克服傳統(tǒng)的核糖體RNA基因序列分析分辨力不足的缺陷,甚至直接將菌株鑒定到種、亞種甚至亞群的水平[8]。在本研究中,實(shí)驗(yàn)菌株Wenzhou1的16S rRNA基因與西班牙弗朗西斯菌、土拉弗朗西斯菌和波斯弗朗西斯菌等菌種的序列相似度均大于99.0%,且與“土拉弗朗西斯菌新兇手亞種”3523(NC_017449)的16S rRNA基因序列相似度為100%;故采用16S rRNA基因序列分析,無法對(duì)上述菌種進(jìn)行有效鑒別。而用mdh基因、ropB基因和sdhA基因等管家基因序列分析的方法,則可能由于“土拉弗朗西斯菌新兇手亞種”3523(NC_017449)分類信息錯(cuò)誤而被錯(cuò)誤鑒定為土拉弗朗西斯菌新兇手亞種。而3523被錯(cuò)誤分類為土拉弗朗西斯菌新兇手亞種,可能與兩菌的表型特征相近且16S rRNA基因高度同源等特性有關(guān)。然而,基于全基因組ANI>96%作為同一菌種的判定依據(jù),可將Wenzhou1和3523準(zhǔn)確鑒定為西班牙弗朗西斯菌,并明確排除土拉弗朗西斯菌。
基于高通量測(cè)序和全基因組序列ANI分析方法,還能指導(dǎo)建立新的菌種鑒定方法。鑒于16S rRNA基因推導(dǎo)的系統(tǒng)發(fā)育樹僅僅為“百分之一”進(jìn)化樹[7],且與其他單個(gè)基因推斷的系統(tǒng)發(fā)育關(guān)系可能存在沖突,故建議基于全基因組的多基因系統(tǒng)發(fā)育趨勢(shì),尋找能夠代表全基因組的系統(tǒng)發(fā)育趨勢(shì)且分辨力高于16S rRNA基因的單基因標(biāo)志物[8-11]。就本研究中的弗朗西斯菌鑒定而言,mdh基因序列相似度與基于直系同源基因的OrthoANI值在總體上是一致的,且菌種的鑒別能力明顯優(yōu)于16S rRNA基因,故可以作為弗朗西斯菌及相關(guān)菌種的鑒定的一個(gè)重要的靶基因??傊?,隨著高通量測(cè)序技術(shù)的進(jìn)一步成熟,基于全基因組測(cè)序的分析方法,將在病原微生物的鑒定、分類和流行病學(xué)研究中發(fā)揮更大的應(yīng)用價(jià)值。
[1]Li B, Yang X, Tan H,etal.Vibrioparahaemolyticus, O4:K8 forms a potential predominant clone in southern China as detected by whole-genome sequence analysis[J]. Int J Food Microbiol, 2017, 244:90-95.
[2]Lee I, Kim YO, Park SC,etal. OrthoANI: An improved algorithm and software for calculating average nucleotide identity[J]. Int J Syst Evol Microbiol, 2016, 66:1100-1103.
[3]Konstantinidis KT, Tiedje JM. Genomic insights that advance the species definition for prokaryotes[J]. Proc Natl Acad Sci U S A, 2005, 102(7): 2567-2572.
[4]Goris J, Konstantinidis KT, Klappenbach JA,etal. DNA-DNA hybridization values and their relationship to whole-genome sequence similarities[J]. Int J Syst Evol Microbiol, 2007, 57(Pt1): 81-91.
[5]Richter M, Rosselló-Móra R. Shifting the genomic gold standard for the prokaryotic species definition[J]. Proc Natl Acad Sci U S A, 2009, 106(45):19126-19131.
[6]Whipp MJ, Davis JM, Gary L,etal. Characterization of a novicida-like subspecies ofFrancisellatularensisisolated in Australia[J]. J Med Microbiol, 2003, 52(Pt9):839-842.
[7]Huber B, Escudero R, Busse HJ,etal. Description ofFrancisellahispaniensissp. nov., isolated from human blood, reclassification ofFrancisellanovicida(Larsonetal. 1955) Olsufievetal. 1959 asFrancisellatularensissubsp.novicidacomb. nov., and emended description of the genusFrancisella[J]. Int J Syst Evol Microbiol, 2010, 60(Pt 8): 1887-1896.
[8]Zeigler DR. Gene sequences useful for predicting relatedness of whole genomes in bacteria[J]. Int J Syst Evol Microbiol, 2003, 53(Pt6):1893-1900.
[9]Dagan T, Martin W. The tree of one percent[J]. Genome Biol, 2006, 7(10):118.
[10]Puigbò P, Wolf YI, Koonin EV. Seeing the tree of life behind the phylogenetic forest[J]. BMC Biol, 2013, 11:46.
[11]Delsuc F, Brinkmann H, Philippe H. Phylogenomics and the reconstruction of the tree of life[J]. Nat Rev Genet, 2005, 6(5): 361-375.
(本文編輯:劉群)
Identification of a newly reportedFrancisellaspecies by average nucleotide identity based on high-throughput whole genome sequencing technology
ZHANGLei1,ZHENGMin-ling2,WANGYa3,CAIHai-yun1,DENGGuang-yuan2,ZHUQing-yi1,CHENCha2,QUPing-hua2
(1.MicrobiologyLaboratory,GuangzhouKingmedCenterforClinicalLaboratoryCompanyLimited,Guangzhou510330,Guangdong; 2.DepartmentofLaboratoryMedicine,theSecondAffiliatedHospitalofGuangzhouUniversityofChineseMedicine,GuangdongProvincialHospitalofTraditionalChineseMedicine,Guangzhou510006,Guangdong; 3.ZetaBiosciense(Shanghai)CompanyLimited,Shanghai201203,China)
Objectives To identify theFrancisellastrain isolated from blood of a patient with drowning-associated pneumonia. Methods The whole genome of the strain, designated Wenzhou1, was sequenced using the high throughput sequencing technology by 2000/miSeq system of Illumina platform, and the obtained genome draft was assembled by MicrobeTrakr Plus software. The phylogenetic neighbors of Wenzhou1 were obtained by NCBI BLAST analysis from GenBank database for the gene sequences of 16S rRNA, malate dehydrogenase(mdh), DNA-directed RNA polymerase subunit beta(rpoB) and succinate dehydrogenase subunit alpha(sdhA). The average nucleotide identity(ANI) between Wenzhou1 and its phylogenetic neighbors was analyzed by the software OrthoANI using NCBI BLAST search under the Java Runtime Environment Version 8. Results The genome size of Wenzhou1 was 1.96×106bp, containing 74 contigs. The genomic G+C mol% of Wenzhou1 was 32.1%, which was similar to the other species of genusFrancisellaandAllofranicella. Based on the analysis of NCBI BLAST of GenBank for the similarities of 16S rRNA gene,mdhgene,rpoBgene andsdhAgene sequences, Wenzhou1 was most closely related toF.hispaniensisFSC454 andFrancisellacf.novicida3523. The ANI of Wenzhou1 was 97.8% toF.hispaniensisFSC454, 97.5% to 97.6% toFrancisellacf.novicida3523, but only 91.3% to 91.5% to the four subspecies ofF.tularensis. Conclusion ANI analysis based on whole genome sequence should be an accurate, effective method for bacterial identification. Wenzhou1 could be identified asF.hispaniensisby ANI with high-throughput whole genome sequencing technology.
Francisellahispaniensis; average nucleotide identity; bacterial identification
10.13602/j.cnki.jcls.2017.07.05
國(guó)家自然科學(xué)基金(31300004)。
張磊,1982年生,女,主管技師,大學(xué)本科,主要從事臨床微生物檢驗(yàn)工作。
屈平華,副主任技師,碩士研究生導(dǎo)師,E-mail:ququtdr@163.com。
R446.5
A
2017-04-07)