甘明宇 李 剛 俞 惠 吳冰冰 周文浩,3
呼吸道感染是導(dǎo)致5歲以下兒童死亡的重要原因[1, 2]。呼吸道感染病原的快速、準確鑒定對于制定有效的抗生素治療方案具有重要意義[3]。傳統(tǒng)病原檢測方法具有檢測周期長、檢測范圍窄、陽性率低的缺點[4]。
宏基因組測序?qū)颖局械乃形⑸锖怂徇M行測序,這種非靶向的策略可以檢測所有潛在的病原,包括罕見病原或新發(fā)病原[4-6],故被廣泛應(yīng)用于臨床各類感染性疾病的診斷中[7-9]。宏基因組測序的平臺包括Illumina(二代)和Nanopore(三代)測序。二代測序的建庫步驟繁瑣,測序時間長,數(shù)據(jù)不能實時分析[9-11]。三代測序具有建庫時間短、測序系列長、實時數(shù)據(jù)分析的特點[8, 12, 13],對于病情危重,需要盡快明確病原、疑似新發(fā)病原或者特殊病原的診斷具有重要意義[14, 15]。Charalampons等[8]利用三代測序的這些特點,通過去宿主反向富集微生物核酸的方式,實現(xiàn)了對成人呼吸道病原6 h的快速診斷。本研究以1例重癥肺炎患兒的肺泡灌洗液標本為例,比較三代測序、二代測序和傳統(tǒng)檢測方法在檢測結(jié)果、時間和成本等方面的優(yōu)、缺點。
1.1 傳統(tǒng)方法病原檢測 培養(yǎng)和菌株鑒定使用VITEK2自動分析儀完成,PCR熒光定量檢測試劑盒(達安基因)檢測肺炎支原體、巨細胞病毒、EB病毒,直接免疫熒光法檢測腺病毒(美國Diagnostic Hybrids),按照說明書進行操作。
1.2 宏基因組測序 宏基因檢測得到復(fù)旦大學(xué)附屬兒科醫(yī)院(我院)倫理委員會批準(編號:2019-300)。利用患兒肺泡灌洗液樣本傳統(tǒng)檢測后剩余標本(2 mL)行宏基因組測序。
1.2.1 DNA提取 肺泡灌洗液樣本顛倒混勻后,使用QIAamp UCP Pathogen Mini Kit試劑盒提取DNA,50 μL純水洗脫。利用Qubit定量,DNA濃度106 ng·μL-1,通過電泳質(zhì)控DNA。
1.2.2 三代測序 利用Nanopore SQK-LSK0109試劑盒進行建庫,取1 μg DNA直接進行DNA末端修復(fù)和接頭連接,將建好的文庫加入SpotON芯片,然后將芯片放入Nanopore GridION測序儀進行測序,實時進行basecalling,設(shè)置每40 000條序列導(dǎo)出測序fastq文件。
1.2.3 二代測序 使用covaris ME220將DNA打斷為350 bp左右的片段。使用KAPA Hyper Prep試劑盒構(gòu)建Illumina測序文庫,文庫擴增循環(huán)數(shù)為6個循環(huán)。文庫經(jīng)Qubit質(zhì)控濃度、Agilent 2200 Bioanalyzer質(zhì)控片段大小后,在Illumina Novaseq S4 flow cell上進行150 bp雙端測序。單個樣本至少產(chǎn)出3千萬條雙端150 bp測序序列。
1.2.4 微生物數(shù)據(jù)庫構(gòu)建 從NCBI genome數(shù)據(jù)庫下載微生物(包括細菌、病毒、真菌、寄生蟲)物種水平的基因組參考序列(refseq level)。使用dustmasker標記序列的低復(fù)雜度區(qū)域。刪除長度<150 bp的參考序列。使用Centrifuge v1.0.3構(gòu)建比對數(shù)據(jù)庫。數(shù)據(jù)庫共包含12 000種細菌、7 312種病毒、515種真菌、168種寄生蟲。
1.2.5 數(shù)據(jù)分析
1.2.5.1 三代測序數(shù)據(jù)實時分析 為了實時分析測序數(shù)據(jù),搭建的流程持續(xù)掃描三代測序輸出文件夾,檢測到新的fastq文件后,即啟動數(shù)據(jù)分析流程。流程主要包括:①利用minimap2將序列比對到人類參考基因組上(GRCh38);②將比對到參考基因組上的序列去除;③利用centrifuge(v1.0.3)將剩余的序列比對到微生物數(shù)據(jù)庫中;④去除比對到不同物種的序列。為了排除常見實驗及試劑污染,對空白樣本進行了測序和分析,鑒定實驗室以及試劑污染微生物。
1.2.5.2 二代測序數(shù)據(jù)分析 首先對Illumina測序序列進行過濾,利用軟件Trimmomatic v0.39設(shè)置滑動窗口為10 bp,過濾平均測序質(zhì)量值<15 bp的序列,以及序列長度<40 bp的序列。過濾后的序列使用軟件Bowtie v2.3.4比對到人參考基因組上(GRCh38)。去除比對到人參考基因組上的序列,使用軟件centrifuge v1.0.3將剩余序列比對到微生物參考基因組數(shù)據(jù)庫。去除比對到多個物種的序列,保留序列比對比例>70%的序列。
1.3 統(tǒng)計學(xué)方法 采用軟件R 3.5.1進行統(tǒng)計學(xué)分析,對序列長度、測序深度以及錯誤率進行統(tǒng)計。
2.1 病例報告 男,3歲6個月,因“發(fā)熱10 d,咳嗽3 d”入我院感染科。入院前予鹽酸伐昔洛韋治療3 d,阿昔洛韋、頭孢唑肟鈉靜滴治療1 d,療效不佳。入院后血常規(guī):WBC 10.9×109·L-1,N 0.47,L 0.30。入院后根據(jù)EB病毒檢測陽性結(jié)果于第1 ~15 d予阿昔洛韋;第2 ~5 d予干擾素霧化;第2 ~9 d予頭孢曲松;甲強龍第3 ~4 d 1 mg·kg-1·d-1,~11 d 2 mg·kg-1·d-1,以后逐漸減量,第15~18 d 0.5 mg·kg-1·d-1。第4 ~8 d經(jīng)驗性予阿奇霉素、第9 ~11 d予美羅培南。入院7 d后仍有發(fā)熱,咳嗽加重,X線胸片提示左側(cè)肺炎,胸部CT提示肺炎肺實變,呼吸科會診后行支氣管鏡檢查術(shù)和肺泡灌洗術(shù),收集肺泡灌洗液,行傳統(tǒng)方法病原檢測,發(fā)現(xiàn)肺炎支原體檢測陽性,第11 ~19 d調(diào)整為左氧氟沙星。治療19 d后,體溫正常,咳嗽減少,X 線胸片、炎癥指標好轉(zhuǎn)出院,門診隨訪。
2.2 傳統(tǒng)方法病原學(xué)檢測結(jié)果 肺泡灌洗液2 d普通培養(yǎng)陰性,腺病毒抗原檢測陽性,肺炎支原體PCR定量檢測陽性(1.21×104拷貝數(shù)·mL-1)。血漿PCR檢測顯示EB病毒陽性(4.53×103拷貝數(shù)·mL-1)。
2.3 三代測序結(jié)果 從收到樣本起,DNA提取用時1.5 h,三代測序文庫構(gòu)建用時1.5 h(圖1A)。三代測序平臺允許實時分析測序數(shù)據(jù),在測序開始12 min后,輸出的第1個fastq文件中即檢出腺病毒1 083條序列(圖1B),從收到樣本到檢出腺病毒共用時約3.2 h。測序結(jié)束后,共得到4 920 000條序列,檢出99 284條腺病毒序列,占比2.02% (圖2A)。圖1C顯示,腺病毒序列平均長度736(IQR:405~915)bp,圖1D顯示,宿主序列平均長度2 674(IQR:579~3 310)bp。除腺病毒外,還檢出EB病毒、肺炎支原體各1條序列(圖2B)。
圖3A顯示,三代測序序列比對到腺病毒參考基因組(NC_011203.1)上后,覆蓋度達100%,96.69%的基因組被>1 000 bp序列覆蓋,平均測序深度3 165×(IQR:2 408~3 837)。
2.4 二代測序結(jié)果 測序文庫構(gòu)建用時4 h,從上機到測序完成用時44 h,數(shù)據(jù)拆分用時4 h。在二代測序完成后進行數(shù)據(jù)分析,數(shù)據(jù)分析耗時約2 h,從收到樣本到檢出腺病毒序列共用時55.5 h(包括DNA提取1.5 h)。二代測序共得到15 789 245條序列,其中檢出腺病毒序列共236 410條,占比1.50%(圖2C)。除腺病毒外,還檢出19條EB病毒序列,2條肺炎支原體序列(圖2D)。
圖1 三代宏基因組測序檢測腺病毒
圖3B顯示,二代測序序列比對到腺病毒參考基因組(NC_011203.1)上后,覆蓋度達到96.62%,96.07%的基因組被>100 bp序列覆蓋,平均測序深度2 214×(IQR:1 865~2 557)。
2.5 3種方法間的比較 表1顯示,三代和二代測序均一次性檢出3種病原(腺病毒、EB病毒以及肺炎支原體),還檢出普雷沃菌等定植菌。三代測序檢出腺病毒周期最短,為3.2 h。測序成本從高到低依次為三代測序、二代測序和傳統(tǒng)檢測方法,其中傳統(tǒng)方法肺泡灌洗液培養(yǎng)為人民幣410元,呼吸道常規(guī)病原檢測(呼吸道合胞病毒、腺病毒、偏肺病毒、副流感病毒、流感病毒的抗原檢測,以及支原體、衣原體、巨細胞病毒PCR)為人民幣910元,EB病毒檢測(病毒抗體和PCR)為人民幣470元。
圖2 三代和二代宏基因組測序檢出結(jié)果比較
圖3 腺病毒基因組范圍三代和二代測序覆蓋度
表1 三代測序、二代測序和傳統(tǒng)檢測方法的檢測結(jié)果、成本及周期比較
2.6 三代測序序列錯誤率 為了評估三代測序的錯誤率,以二代測序序列作為標準,組裝腺病毒參考序列。組裝完成共得到14條contig,總長36 434 bp,最長的contig長度為35 177 bp。以最長的contig為參考序列,使用blast將三代測序序列比對到參考序列后,發(fā)現(xiàn)三代測序序列與參考序列的平均相似度為92.8%(IQR:91.1%~95.2%),對應(yīng)三代測序序列的平均錯誤率為7.3%(IQR:4.8%~8.9%)。
本研究探索了三代測序在1例重癥肺炎患兒呼吸道感染病原快速檢測中的應(yīng)用。該患兒住院治療7 d后仍有發(fā)熱,咳嗽加重,X線胸片提示左側(cè)肺炎,胸部CT提示肺炎肺實變,急需盡快明確病原以對癥治療,多種傳統(tǒng)病原檢測方法在48 h后明確病原。本研究利用三代測序在3.2 h可實現(xiàn)對腺病毒感染的快速診斷,并一次性檢出EB病毒、肺炎支原體合并感染。體現(xiàn)了三代測序檢測范圍廣、檢測周期短的特點。
三代與二代測序可以檢出相同病原微生物,腺病毒和EB病毒在樣本中的占比有差異,該差異可能是由于2種測序平臺不同的建庫方法以及測序原理導(dǎo)致的。此外,2種測序方法的污染菌株組成也不同,例如三代測序的污染菌株中存在大量的比對到大腸桿菌基因組上的序列(6 286條),而在二代測序結(jié)果中并未發(fā)現(xiàn),這些序列的長度分布(平均長度3 469 bp,IQR:3 547~3 592 bp)顯著區(qū)別于腺病毒的序列(平均長度736 bp,IQR:405~915 bp),提示該污染可能是在DNA提取步驟之后引入的。該結(jié)果為利用三代測序區(qū)分污染菌提供了新的思路。二代、三代測序較傳統(tǒng)方法有更多的病原微生物發(fā)現(xiàn)。
三代(3.2 h)較二代測序(55.5 h)和傳統(tǒng)檢測方法(48 h)用時更短,便于更早行合理的、有針對性的用藥。三代檢測費用高,但二代測序和傳統(tǒng)檢測方法在結(jié)果未報告前(45 h)的經(jīng)驗性用藥風(fēng)險大,經(jīng)驗性用藥同樣產(chǎn)生費用。
如果能提高病原微生物的核酸在樣本中的占比,可以降低測序數(shù)據(jù)量,從而降低測序成本。此外,對病原的富集對于提高檢測敏感性和降低檢測周期具有重要作用[8, 16]。常用的富集方法包括正向富集,例如雜交捕獲、多重PCR擴增、spiked-primer擴增目標病原等,這類方法的優(yōu)點是對目標病原的富集效率高,但是只能檢測數(shù)量有限的特定病原[17-19]。反向富集技術(shù)是指去除宿主核酸從而提高病原核酸的占比,是目前應(yīng)用最廣的方法,主要步驟包括裂解宿主細胞,釋放宿主核酸,用核酸酶處理宿主核酸,隨后再提取病原核酸[8, 20]。在臨床呼吸道病原檢測中應(yīng)用該項技術(shù),病原序列數(shù)量最多提高了100倍[8]。
三代測序?qū)嶒炇铱臻g、配套設(shè)備的要求較低,隨著技術(shù)的不斷發(fā)展以及成本的降低,其有望成為新的快速臨床檢測方法。