葉福強(qiáng) 李鵬 韓一芳 張琪 林彥鋒 王凱英 王太武 宋宏彬 王長(zhǎng)軍 汪春暉 張錦?!?/p>
近年暴發(fā)的西非埃博拉出血熱(2014年)、巴西寨卡病毒?。?015年)和尼日利亞拉薩熱疫情(2018年)等新發(fā)傳染病對(duì)疫區(qū)民眾的生命健康造成巨大威脅[1-6]。為了有效遏制傳染病蔓延,亟需快速有效的病原體檢測(cè)確認(rèn)技術(shù)。常用的聚合酶鏈?zhǔn)椒磻?yīng)(polymerase chain reaction,PCR)擴(kuò)增技術(shù)對(duì)未知病原或高突變率病原檢測(cè)能力有限。現(xiàn)有的二代高通量測(cè)序平臺(tái)雖然具備鑒別病原微生物的能力[1,7-11],但對(duì)實(shí)驗(yàn)室環(huán)境要求苛刻,文庫制備流程復(fù)雜,也限制其大規(guī)模的現(xiàn)場(chǎng)快速檢測(cè)應(yīng)用。
由Oxford Nanopore Technologies(ONT)開發(fā)的三代測(cè)序平臺(tái)MinION,通過捕捉DNA/RNA 經(jīng)過納米孔時(shí)引起的電流變化來鑒別核苷酸[12-13]。其在病原體現(xiàn)場(chǎng)快速檢測(cè)方面具有諸多優(yōu)勢(shì):①便攜。總質(zhì)量?jī)H為87 g,可應(yīng)用于現(xiàn)場(chǎng)檢測(cè)[14-17]。②供電方式簡(jiǎn)單。USB 3.0 接口即可保證測(cè)序儀穩(wěn)定運(yùn)行。③測(cè)序數(shù)據(jù)實(shí)時(shí)產(chǎn)出即時(shí)分析。④讀長(zhǎng)長(zhǎng)?,F(xiàn)有報(bào)道的最長(zhǎng)測(cè)序讀長(zhǎng)~2.3 Mb[12]。當(dāng)前該平臺(tái)已用于人類血液、尿液和呼吸道樣本里的病毒和細(xì)菌病原體檢測(cè)[7,18-19],也為西非埃博拉病毒病以及巴西寨卡病毒暴發(fā)疫情的病原確認(rèn)和流行病學(xué)調(diào)查提供了關(guān)鍵線索[5,20-22]。為了驗(yàn)證納米孔測(cè)序技術(shù)在呼吸道病毒病原體應(yīng)急檢測(cè)中的可行性,筆者使用MinION 對(duì)上呼吸道感染患者的咽拭子標(biāo)本進(jìn)行快速測(cè)序及病原學(xué)分析,并采用PCR 實(shí)驗(yàn)驗(yàn)證測(cè)序結(jié)果。
咽拭子標(biāo)本由東部戰(zhàn)區(qū)疾病預(yù)防控制中心于2019年3月在流感網(wǎng)絡(luò)實(shí)驗(yàn)室運(yùn)行期間采集于某部1 名士兵,該患者因出現(xiàn)發(fā)熱、咳嗽、流涕等癥狀就醫(yī),初步診斷為上呼吸道感染,病原不明。
病毒核酸抽提試劑盒Qiagen QIAamp Min-Elute Virus Spin Kit 購自德國Qiagen 公司,Qubit 3及配套定量試劑耗材、磁力架購自美國Invitrogen公司,cDNA 合成試劑盒NEBNext Ultra II RNA First Strand Synthesis Module 和NEBNext Ultra II Non-Directional RNA Second Strand Synthesis Module 購自美國NEB 公司,AMPure XP 磁珠購自于美國Beckman 公司,快速建庫測(cè)序試劑盒(SQKRADSP4)、測(cè)序芯片制備試劑盒(EXP-FLP001)、測(cè)序芯片(FLO-MIN106,R9.4)、測(cè)序儀MinION Mk1B 購自英國ONT 公司,核酸抽提試劑盒TaKa-Ra MiniBEST Viral RNA/DNA Extraction Kit 及實(shí)時(shí)熒光定量PCR 檢測(cè)試劑盒One Step Prime-ScriptTMRT-PCR Kit(Perfect Real Time)購自日本Takara 公司。
1.2.1 病毒總核酸抽提及定量
對(duì)用于MinION 測(cè)序的樣本病毒總核酸(DNA/RNA),除不進(jìn)行離心過濾、不加入核酸酶和溶菌酶外,其余實(shí)驗(yàn)步驟均按說明書操作進(jìn)行。收集核酸后,取2 μL 樣本核酸按儀器說明書測(cè)定dsDNA 和RNA 濃度。
1.2.2 逆轉(zhuǎn)錄合成cDNA 及定量
首先使用NEBNext Ultra II RNA First Strand Synthesis Module 合成cDNA 的第一鏈,然后使用NEBNext Ultra II Non-Directional RNA Second Strand Synthesis Module 合成cDNA 的第二鏈。使用Beckman AMPure XP 磁珠按說明書的方法對(duì)cDNA 產(chǎn)物進(jìn)行純化收集。取1 μL 產(chǎn)物,使用Qubit 3 對(duì)dsDNA 濃度進(jìn)行測(cè)量,測(cè)量過程按儀器說明書進(jìn)行。
1.2.3 MinION 文庫構(gòu)建及測(cè)序
測(cè)序在MinION Mk1B 測(cè)序儀上進(jìn)行。首先按說明書要求進(jìn)行測(cè)序芯片質(zhì)檢,質(zhì)檢通過后依照快速建庫測(cè)序試劑盒及測(cè)序芯片引發(fā)試劑盒操作流程構(gòu)建測(cè)序文庫并加樣至測(cè)序芯片中,在加樣過程中避免將氣泡引入加樣孔中。在測(cè)序儀控制軟 件MinKNOW(v 3.1.19,ONT 官 網(wǎng)https://nanoporetech.com/下載)上對(duì)測(cè)序參數(shù)進(jìn)行設(shè)置,測(cè)序運(yùn)行時(shí)間設(shè)為”48 h”。
1.2.4 MinION 測(cè)序數(shù)據(jù)生物信息學(xué)分析
使用MinKNOW 實(shí)時(shí)讀取測(cè)序儀產(chǎn)生的fast5文件,使用Albacore 軟件(v 2.3.4,ONT 官網(wǎng)下載)將fast5 文件轉(zhuǎn)換成fastq 文件,堿基質(zhì)量分?jǐn)?shù)低于7的序列將被剔除。使用Nanoplot 軟件(v 1.22.0)[23]查看測(cè)序數(shù)據(jù)質(zhì)量及讀長(zhǎng)分布。使用Centrifuge(v 1.0.4)[24]對(duì)測(cè)序數(shù)據(jù)進(jìn)行初步比對(duì)分析:將所有通過質(zhì)控的序列與人(Grch38.p12)和病毒參考基因組(NCBI Refseq 數(shù)據(jù)庫ftp://ftp.ncbi.nlm.nih.gov/genomes/refseq/,2019年3月21日下載,共計(jì)8 588 個(gè)病毒全基因組序列)進(jìn)行快速比對(duì),參數(shù)設(shè)置為“--min-hitlen 15-k 5”,3 min 內(nèi)即完成比對(duì)過程。
為進(jìn)一步了解物種構(gòu)成,采取“先比對(duì)后剔除”的策略,先使用Minimap2 軟件(v 2.16)[25]將所有質(zhì)控后序列與人參考基因組比對(duì),參數(shù)設(shè)置為“-ax map-ont-k 15”,使用samtools(v 1.9)[26]對(duì)比對(duì)產(chǎn)生的sam 文件進(jìn)行處理,得到的未匹配序列用于下一步操作。然后將上步獲得的序列與NCBI病毒參考數(shù)據(jù)庫進(jìn)行比對(duì),參數(shù)為“-ax map-ont -k 7”,獲得的未匹配序列用于下步比對(duì)。最后,將上步未匹配序列使用BLASTN(v 2.8.1)與NCBI 細(xì)菌和古細(xì)菌參考基因組比對(duì)(包括12 668 個(gè)細(xì)菌和283 個(gè)古細(xì)菌全基因組序列,2019年3月21日下載),參數(shù)為“-perc_identity 90-word_size 16-evalue 0.000 001”,未匹配的序列定義為“未分類序列”。
為進(jìn)一步了解比對(duì)詳情,將匹配到NCBI 病毒Refseq 參考數(shù)據(jù)庫的序列提取出來,進(jìn)行在線BLAST 比對(duì),參數(shù)設(shè)置同上,并挑選出比對(duì)一致性較好的基因組,用于下游分析并統(tǒng)計(jì)比對(duì)情況,包括比對(duì)一致性、查詢序列覆蓋度等信息。使用samtools 及Qualimap(v 2.2.2)[27]計(jì)算參考基因組覆蓋度。使用自有Perl(v 5.22.1)腳本查看序列的產(chǎn)出時(shí)間并進(jìn)行統(tǒng)計(jì)排序。
1.2.5 實(shí)時(shí)熒光定量PCR
使用實(shí)時(shí)熒光定量PCR 來驗(yàn)證MinION 測(cè)序獲取的病原陽性結(jié)果。Adv7 引物序列:HAdV7-F:5′-GAGGAGCCAGATATTGATATGGAATT-3′,HAdV7-R:5′-AATTGACATTTTCCGTGTAAAGCA-3′ ,探針序列為FAM-AAGCTGCTGACGCTTTTTCGCCTGA-BHQ1。H3N2 引物:H3F:ACCCTCAGTGTGATGGCTTCCAAA,H3R:TAAGGGAGGCATAATCCGGCACAT,探針序列為FAM-ACGCAGCAAAGCCTA CAGCAACTGT -BHQ1。使用無核酸酶的水作為陰性對(duì)照。使用的總核酸從咽拭子病毒保存液中抽提,使用試劑盒配制PCR 反應(yīng)體系。反應(yīng)條件為42℃5 min,95℃10 s,95℃5 s(40 個(gè)循環(huán)),60℃34 s。Ct 值<35 時(shí),認(rèn)為PCR 檢測(cè)陽性。
樣本抽提后RNA 濃度為20.8 ng/μL,dsDNA濃度為52.0 ng/μL。逆轉(zhuǎn)錄合成cDNA 后的定量結(jié)果為77.2 ng/μL,以cDNA 作為模板建立MinION文庫并測(cè)序。MinION 運(yùn)行15 h,共產(chǎn)生236 764 條序列(圖1),其中188 063 條序列(占比79.43%)通過數(shù)據(jù)質(zhì)控(高質(zhì)量序列,堿基質(zhì)量分?jǐn)?shù)均不低于7),其余序列未通過質(zhì)控(低質(zhì)量序列)。
圖1 MinION 測(cè)序通量Figure 1 The sequencing throughput of MinION
通過質(zhì)控的測(cè)序數(shù)據(jù)用于下游生物信息學(xué)分析。其中最長(zhǎng)讀長(zhǎng)為102 326 bp,最短讀長(zhǎng)為23 bp,總堿基數(shù)為246.7 M。平均讀長(zhǎng)為1 311.8 bp,平均質(zhì)量分?jǐn)?shù)為9.1,讀長(zhǎng)中位數(shù)為3 281 bp。
快速比對(duì)分析結(jié)果表明樣本中同時(shí)存在兩種呼吸道病原體:人呼吸道腺病毒7 型(DNA 病毒)和甲型流感病毒H3N2 亞型(RNA 病毒)。僅2 min 50 s 即完成比對(duì)過程,獲得初步鑒定結(jié)果。
質(zhì)控后的數(shù)據(jù)中共有145 861 條序列(占比77.56%)來自于人,病毒序列數(shù)為6 876(占比3.66%),細(xì)菌/古細(xì)菌比對(duì)數(shù)為6 057(占比3.22%,主要包括來自口動(dòng)菌屬、奈瑟氏菌屬、鏈球菌屬、普氏菌屬、克雷伯菌屬、梭菌屬、嗜血桿菌屬、韋榮球菌屬等口咽部細(xì)菌),未分類序列數(shù)為29 269(占比15.56%),分類結(jié)果見圖2。
圖2 測(cè)序數(shù)據(jù)構(gòu)成Figure 2 The composition of sequencing data
進(jìn)一步的生物信息學(xué)分析同樣在樣本中同時(shí)鑒別出兩種呼吸道病原體:人呼吸道腺病毒7 型和甲型流感病毒H3N2 亞型,分別有19 條和4 條序列比對(duì)到參考基因組。進(jìn)行在線BLAST 比對(duì)后,選取比對(duì)一致性較好的人呼吸道腺病毒7 型(Adv7,Genbank 序列號(hào):MG696128.1,基因組大小為35 233 bp)和甲型流感病毒H3N2 亞型(H3N2,Genbank 序列號(hào):MK633737.1-MK633744.1,共8 個(gè)基因區(qū)段,基因組大小分別為1 701 bp、982 bp、1 410 bp、1 497 bp、838 bp、2 151 bp、2 274 bp 和2 280 bp)基因組進(jìn)行下一步分析。
19 條Adv7 序列與參考基因組的比對(duì)一致性介于84.83%和96.55%之間,查詢序列覆蓋度介于70.63%和99.58%之間(表1)。19 條序列中,讀長(zhǎng)排名前三的分別為14 910 bp,14 720 bp 和12 097 bp。對(duì)Adv7 參考基因組覆蓋度為87.65%,覆蓋深度介于1X 和5X 之間(圖3)。4 條H3N2 序列比對(duì)到參考基因組的3 個(gè)區(qū)段上,分別是區(qū)段2(PB1和PB1-F2基因,MK633743.1),區(qū)段3(PA和PA-X基因,MK633742.1)和區(qū)段6(NA 基因,MK633739.1),比對(duì)一致性介于91.43%和94.74%之間,對(duì)3 個(gè)區(qū)段的覆蓋度分別為32.81%,6.79%和7.02%。
至此,鑒定出該患者為呼吸道腺病毒7 型和甲型流感病毒H3N2 亞型混合感染。
MinION 的文庫制備具有簡(jiǎn)易快速的優(yōu)點(diǎn),從獲得樣本到建立文庫并上機(jī)測(cè)序,僅用時(shí)約3.5 h(215 min)(圖4)。納米孔測(cè)序技術(shù)還具有實(shí)時(shí)產(chǎn)出數(shù)據(jù)的優(yōu)勢(shì),測(cè)序開始僅9 s 后即有可用于下游分析的原始數(shù)據(jù)產(chǎn)生。測(cè)序1 h 內(nèi),共計(jì)產(chǎn)生18 151 條序列,占總產(chǎn)出數(shù)據(jù)的比重為7.67%,其中通過質(zhì)控的序列數(shù)為15 559,占所有可用數(shù)據(jù)的比重為8.27%。測(cè)序開始僅8 min 后,MinION 即產(chǎn)出第1 條Adv7 序列,讀長(zhǎng)為12 097 bp,與MG696128.1 參考序列一致性為90.80%,比對(duì)覆蓋度高達(dá)99.58%(表1)。測(cè)序開始后的9 h 內(nèi),78.95%的Adv7 序列均已產(chǎn)出,讀長(zhǎng)最長(zhǎng)為14 910 bp。14 h 以后,所有Adv7 序列均已產(chǎn)出。對(duì)于H3N2 數(shù)據(jù)而言,測(cè)序開始69 min 后即產(chǎn)生第1 條序列,9 h 內(nèi)產(chǎn)出所有H3N2 序列。測(cè)序進(jìn)行15 h后終止,進(jìn)行快速宏基因組比對(duì)分析,僅需3 min即獲得微生物初步分類結(jié)果。綜上,從拿到樣本到獲得初步鑒定結(jié)果,共耗時(shí)約18.6 h,低于當(dāng)前二代臺(tái)式測(cè)序平臺(tái)所需時(shí)長(zhǎng)。值得注意的是,測(cè)序開始9 h 內(nèi),匹配到Adv7 和H3N2 參考基因組的絕大部分序列已經(jīng)產(chǎn)生。此時(shí)終止測(cè)序亦可獲得類似鑒定結(jié)果,因此實(shí)際流轉(zhuǎn)時(shí)間可控制在13 h以內(nèi)。
圖4 MinION 測(cè)序流轉(zhuǎn)時(shí)間Figure 4 The sequencing turnaround time of MinION
擴(kuò)增曲線表明,Adv7 和H3N2 均為PCR 陽性(圖5)。PCR 結(jié)果與測(cè)序結(jié)果吻合。同時(shí),對(duì)該份送檢標(biāo)本,未檢出流感網(wǎng)絡(luò)實(shí)驗(yàn)室監(jiān)測(cè)的其它呼吸道病原(包括其它亞型甲型流感病毒、乙型流感病毒、支原體、衣原體、冠狀病毒等,數(shù)據(jù)未顯示)。
圖5 實(shí)時(shí)熒光定量PCR 結(jié)果Figure 5 The results of real-time fluorescence quantitative PCR
作為經(jīng)典、常見的微生物快速檢測(cè)方法,PCR技術(shù)靈敏度和準(zhǔn)確度高,在目標(biāo)微生物參考序列已知的情況下,能在4 個(gè)小時(shí)左右獲得對(duì)單一病原的鑒定結(jié)果。但對(duì)于新發(fā)、未知病原體,由于缺乏病原序列先驗(yàn)知識(shí),通常需要針對(duì)多種潛在病原設(shè)計(jì)多對(duì)引物,進(jìn)行多輪PCR 進(jìn)行篩查,工作量大且仍有可能無法獲得病原檢測(cè)結(jié)果。當(dāng)前主流二代測(cè)序平臺(tái)文庫制備流程一般較為繁瑣,測(cè)序周期長(zhǎng),同時(shí)數(shù)據(jù)分析必須在測(cè)序完成后進(jìn)行,限制其在病原體快速檢測(cè)方面的應(yīng)用。基于納米孔測(cè)序技術(shù)的MinION 能有效解決以上不足,已應(yīng)用于埃博拉病毒病、寨卡病毒病的病原體現(xiàn)場(chǎng)快速檢測(cè)中。
呼吸道病毒病原體包括DNA 病毒和RNA 病毒,為了全面捕獲咽拭子保存液里的病毒序列,在病毒種類不明確時(shí),必須采取病毒DNA 和RNA 同時(shí)測(cè)序的策略,所以,對(duì)于應(yīng)急檢測(cè)的樣本而言,逆轉(zhuǎn)錄合成cDNA 這一步必不可少,其耗時(shí)一般在2~3 h。對(duì)于病原體快速測(cè)序而言,逆轉(zhuǎn)錄合成cDNA 會(huì)是限速步驟之一,在今后的檢測(cè)過程中,還需探索快速合成cDNA 的實(shí)驗(yàn)方法。
從獲得樣本到建立文庫并上機(jī)測(cè)序,僅用時(shí)約3.5 h,遠(yuǎn)低于當(dāng)前主流二代臺(tái)式測(cè)序平臺(tái)所需的至少6 h 的建庫時(shí)間[28]。從取樣到獲得初步鑒定結(jié)果,MinION 測(cè)序流轉(zhuǎn)時(shí)間約為18.6 h,其中測(cè)序時(shí)長(zhǎng)15 h。對(duì)于培養(yǎng)樣本或者具有病原先驗(yàn)知識(shí)的樣本而言,可以針對(duì)性選擇核酸富集(核酸含量符合建庫要求無需富集、PCR 擴(kuò)增富集DNA 樣本、逆轉(zhuǎn)錄合成cDNA)或文庫制備流程(快速建庫、連接建庫、RNA 直接測(cè)序、cDNA 直接測(cè)序等),測(cè)序儀運(yùn)行時(shí)長(zhǎng)也可針對(duì)性進(jìn)行調(diào)整。當(dāng)前單個(gè)R9測(cè)序芯片總數(shù)據(jù)產(chǎn)量可達(dá)到10~15 Gb,單個(gè)細(xì)菌或病毒的培養(yǎng)樣本一般測(cè)序數(shù)據(jù)產(chǎn)量達(dá)到1Gb(細(xì)菌基因組的覆蓋度此時(shí)一般可達(dá)100X-200X)時(shí),即可考慮終止測(cè)序,測(cè)序耗時(shí)一般不超過5 h,遠(yuǎn)低于本研究中的15 h。而對(duì)于非培養(yǎng)樣本而言,則需要?jiǎng)討B(tài)監(jiān)測(cè)產(chǎn)出數(shù)據(jù),測(cè)序時(shí)長(zhǎng)也會(huì)相應(yīng)增加。本研究中,測(cè)序開始9 h 內(nèi),匹配到Adv7 和H3N2 參考基因組的絕大部分序列已經(jīng)產(chǎn)生。測(cè)序開始5 h內(nèi),至少有50%的Adv7 和H3N2 序列已產(chǎn)生。因此,應(yīng)急檢測(cè)的流轉(zhuǎn)時(shí)間還有望進(jìn)一步減少。
本文使用一步法RT-PCR 對(duì)測(cè)序結(jié)果進(jìn)行驗(yàn)證??梢园l(fā)現(xiàn)Ct 值與匹配序列數(shù)目和數(shù)據(jù)產(chǎn)出時(shí)間具有一定相關(guān)性。Ct 值越小,核酸含量相對(duì)越高,匹配到參考基因組的序列就越多,其數(shù)據(jù)產(chǎn)生的時(shí)間越早;反之,匹配到參考基因組的序列則越少,數(shù)據(jù)產(chǎn)出時(shí)間越晚。
本文的研究結(jié)果表明,MinION 用于呼吸道病原體的快速檢測(cè)具有可行性,且具備同時(shí)檢測(cè)多種病原體并對(duì)病原分型的能力,但仍有一些技術(shù)問題需要解決,如在快速檢測(cè)背景下,人的臨床樣本,尤其是咽拭子、血液、尿液等樣本,其宿主核酸含量占比一般較高,病原體核酸含量極低,這就導(dǎo)致測(cè)序數(shù)據(jù)中宿主相關(guān)序列占絕大部分。如何有效地富集病原體核酸將會(huì)是該技術(shù)應(yīng)用于現(xiàn)場(chǎng)快速檢測(cè)需要解決的重難點(diǎn)問題。筆者相信,隨著納米孔測(cè)序技術(shù)及相關(guān)試劑的升級(jí)完善,MinION 有潛力成為病原體快速檢測(cè)和臨床診斷的常規(guī)工具。