閆曉敏,任照文,涂長(zhǎng)春,何 彪
(1.福建農(nóng)林大學(xué)動(dòng)物科學(xué)學(xué)院蜂學(xué)學(xué)院,福州350002;2.軍事醫(yī)學(xué)研究院軍事獸醫(yī)研究所,長(zhǎng)春130122)
近年來(lái),新發(fā)、突發(fā)傳染病以及外來(lái)病給我國(guó)畜禽養(yǎng)殖與公共衛(wèi)生帶來(lái)嚴(yán)重挑戰(zhàn),準(zhǔn)確而快速確診是有效防控和阻止疫情擴(kuò)散的重要前提。傳統(tǒng)病原分離鑒定、抗原抗體反應(yīng)以及以PCR為基礎(chǔ)的核酸檢測(cè)雖然在疫病診斷中發(fā)揮了不可或缺的重要作用,但是上述方法只能針對(duì)已知病原體,而且通常需要嚴(yán)格的實(shí)驗(yàn)室條件,對(duì)新發(fā)未知病原的檢測(cè)存在技術(shù)局限性。隨著Illumina測(cè)序和PacBio單分子高通量測(cè)序技術(shù)的發(fā)展,病原診斷策略得以極大改進(jìn),但由于儀器昂貴,樣品前期制備周期長(zhǎng)、建庫(kù)起始核酸量要求嚴(yán)格,且存在擴(kuò)增偏好性,缺乏本地測(cè)序能力,加上將樣本運(yùn)送到遠(yuǎn)程測(cè)序設(shè)施的實(shí)際困難,無(wú)法短時(shí)間內(nèi)完成檢測(cè)。納米孔測(cè)序作為新興三代測(cè)序技術(shù)在臨床病原檢測(cè)中展示出了較強(qiáng)的應(yīng)用前景,由于該技術(shù)具有單分子測(cè)序、長(zhǎng)讀長(zhǎng)及實(shí)時(shí)數(shù)據(jù)分析等優(yōu)點(diǎn),在基因組和轉(zhuǎn)錄組研究中得到越來(lái)越廣泛的應(yīng)用,顛覆了人們對(duì)高通量測(cè)序和疾病診斷的理解[1]。牛津納米孔技術(shù)公司(oxford nanopore technologies,ONT)MinIONTM測(cè)序儀,重量?jī)H90 g,攜帶方便,文庫(kù)構(gòu)建簡(jiǎn)單快速,適用于疫情現(xiàn)場(chǎng)實(shí)時(shí)診斷和數(shù)據(jù)分析[2]。2017年,F(xiàn)aria等[3]利用MinION在資源有限的巴西疫區(qū)對(duì)寨卡病毒和黃熱病毒進(jìn)行了全基因組多重?cái)U(kuò)增子測(cè)序,成功地建立了實(shí)時(shí)監(jiān)測(cè)平臺(tái)。2018年,尼日利亞暴發(fā)拉沙熱疫情。由于拉沙熱病毒的高度變異,很難通過(guò)特異性PCR擴(kuò)增病毒的全基因組,英國(guó)科學(xué)家通過(guò)隨機(jī)PCR擴(kuò)增結(jié)合納米孔測(cè)序在疫區(qū)現(xiàn)場(chǎng)實(shí)時(shí)完成了病毒的檢測(cè)和全基因組測(cè)序分析[4]。
作為全球最大的生豬養(yǎng)殖和消費(fèi)國(guó),2018年8月份ASF入侵了我國(guó),隨后快速蔓延至全國(guó)[5],并于當(dāng)年11月傳播到了東北地區(qū)。ASFV一旦在野豬群流行傳播,將為我國(guó)ASF防控和消滅帶來(lái)新的困難,因此,開(kāi)展野豬疫情監(jiān)測(cè)與防控對(duì)阻止病毒在野豬群的流行十分必要。為開(kāi)發(fā)準(zhǔn)確可靠的快速實(shí)時(shí)檢測(cè)技術(shù),及時(shí)獲取病原的基因信息,本研究采用先進(jìn)的納米孔快速測(cè)序技術(shù)對(duì)未知病原的臨床樣品直接進(jìn)行高通量測(cè)序,基于在線(xiàn)分析平臺(tái)實(shí)時(shí)分析成功地診斷了一起野豬ASF疫情。建立的方法在新發(fā)或突發(fā)疫情的快速診斷以及未知病原的快速鑒定中具有重要的應(yīng)用前景。
1.1 樣品信息和核酸提取 2019年2月,內(nèi)蒙古自治區(qū)阿爾山市大興安嶺重點(diǎn)國(guó)有林管局桑都爾林場(chǎng)散養(yǎng)野豬發(fā)生不明原因疫情,222頭野豬中210頭死亡,解剖發(fā)現(xiàn)病死豬脾臟顯著腫大至正常脾臟的5~6倍且易碎,呈暗紅發(fā)紫狀態(tài),疑似ASF。該養(yǎng)殖場(chǎng)采集一份脾臟樣品送檢,在P2+生物安全實(shí)驗(yàn)室條件下,在樣品中加入裂解液滅活病原,隨后加入MEM研磨,4℃、8000×g離心10 min后取上清液,用病毒基因組DNA/RNA提取試劑盒(TIANGEN,DP315)提取總核酸,50 μL無(wú)酶水洗脫后,RNA核酸分子通過(guò)Maxima H Minus Double-Stranded cDNA Synthesis Kit(Thermo Fisher Scientific K2561)合成雙鏈cDNA,通過(guò)普通DNA產(chǎn)物純化試劑盒(TIANGEN,DP204)完成DNA與cDNA的產(chǎn)物純化,采用Qubit dsDNA HS分析試劑盒在Qubit4.0核酸定量?jī)x中完成核酸定量,NanoDrop1000測(cè)定核酸純度,然后分裝儲(chǔ)存于-80℃超低溫冰箱待用。
1.2 Nanopore建庫(kù)測(cè)序
1.2.1 快速建庫(kù)測(cè)序 純化后的DNA與cDNA等量混合,參照納米孔快速建庫(kù)測(cè)序(RAD004,ONT)流程在10 min內(nèi)完成文庫(kù)構(gòu)建。將測(cè)序芯片(FLOMIN106,R9.4.1)組裝至MinION測(cè)序儀中,通過(guò)USB 3.0接口將MinIONTM與電腦(Intel(R) core(TM) i7-7700 @3.60 GHz;16.0 GB內(nèi)存;1 TB SSD)連接。將測(cè)序文庫(kù)通過(guò)Spot-ON樣品端口加入到芯片后,啟動(dòng)離線(xiàn)版本MinKNOW,并實(shí)時(shí)開(kāi)啟EPI2ME云分析平臺(tái)(https://epi2nanoporetech.com)。17 h 20 min后終止此次測(cè)序,使用Wash kit(WSH003,ONT)清洗芯片后,儲(chǔ)存于4℃冰箱。
1.2.2 連接法建庫(kù)測(cè)序 為驗(yàn)證不同建庫(kù)方案對(duì)病原體檢測(cè)的時(shí)效性與準(zhǔn)確性,進(jìn)一步參照連接法測(cè)序(LSK109, ONT)說(shuō)明構(gòu)建測(cè)序文庫(kù),并將制備好的文庫(kù)加載到R9芯片上進(jìn)行1D測(cè)序,文庫(kù)制備流程耗時(shí)90 min。此外,由于單張芯片測(cè)序通量限制,采用3張測(cè)序芯片并行完成連接測(cè)序,單次測(cè)序運(yùn)行24 h。
1.3 非洲豬瘟病毒的定性與定量檢測(cè) 通過(guò)世界衛(wèi)生組織(Office International dés Epizooties,OIE)推薦的引物與特異性實(shí)時(shí)熒光定量PCR檢測(cè)技術(shù)[6],對(duì)野豬源ASFV做進(jìn)一步驗(yàn)證與定量檢測(cè)。特異性PCR產(chǎn)物經(jīng)瓊脂糖凝膠分析,膠回收目的片段,構(gòu)建標(biāo)準(zhǔn)質(zhì)粒,并按照101~108copies/μL稀釋8個(gè)梯度。熒光定量PCR程序設(shè)定:95℃預(yù)變性5 min;95℃變性10 s,55℃退火 10 s收集熒光,45個(gè)循環(huán)。
1.4 Sanger全基因組測(cè)序 參照ASFV Georgia 2007毒株[7](GenBank登錄號(hào):NC044959.1)的全基因組序列設(shè)計(jì)329對(duì)引物序列,采用一代Sanger技術(shù)進(jìn)行基因組測(cè)序,根據(jù)擴(kuò)增片段的重疊區(qū)域進(jìn)行SeqMan全基因組拼接,該部分測(cè)序與拼接工作由吉林省庫(kù)美生物科技有限公司完成。
1.5 生物信息學(xué)分析
1.5.1 Nanopore數(shù)據(jù)分析 通過(guò)cd-hit軟件的默認(rèn)參數(shù)對(duì)原始數(shù)據(jù)(Raw data)去除接頭,F(xiàn)iltlong軟件過(guò)濾小于300 bp的短片段和平均質(zhì)量值小于7的低質(zhì)量的序列,得到總的Clean data用于后續(xù)分析,并通過(guò)NanoPlot進(jìn)行數(shù)據(jù)統(tǒng)計(jì)分析。BWA-MEM[8]采用默認(rèn)參數(shù)將過(guò)濾后的數(shù)據(jù)映射到本地核苷酸序列數(shù)據(jù)庫(kù),并對(duì)得到的病毒序列進(jìn)行在線(xiàn)BLAST驗(yàn)證。
1.5.2 ASFV有參組裝與可視化分析 利用Minimap2[9]將測(cè)序數(shù)據(jù)比對(duì)到Sanger全基因組,Miniasm進(jìn)行基因組拼接。Samtools[10]進(jìn)行數(shù)據(jù)排序,并建立索引。通過(guò)Integrative Genomics Viewer(IGV)可視化序列覆蓋度,以及序列的插入缺失情況。
1.5.3 多序列比對(duì)與系統(tǒng)發(fā)育分析 對(duì)Sanger測(cè)序及Nanopore測(cè)序獲得的序列進(jìn)行隨機(jī)篩選,得到ASFV D345L基因的603 bp部分重合片段,采用MEGA 7.0[11]進(jìn)行多序列比較及系統(tǒng)發(fā)育分析,并利用最大似然法中的Tamura3-parameter模型以及Bootstrap1000構(gòu)建系統(tǒng)發(fā)生樹(shù)。
2.1 未知病原的快速檢測(cè) 臨床研究中,在短期內(nèi)實(shí)現(xiàn)新發(fā)突發(fā)病原體的快速檢測(cè)與鑒定對(duì)于重大突發(fā)疫情的應(yīng)急處置與防控工作至關(guān)重要。牛津納米孔公司的MinIONTM測(cè)序儀小巧便攜,可快速布防于條件受限的疫區(qū),在疫情現(xiàn)場(chǎng)與筆記本電腦和無(wú)線(xiàn)WiFi連接,即可實(shí)時(shí)讀取數(shù)據(jù)完成病原體的快速檢測(cè)。美國(guó)農(nóng)業(yè)部在2019年借助MinIONTM測(cè)序儀對(duì)于實(shí)驗(yàn)室分離培養(yǎng)的ASFV毒株以及實(shí)驗(yàn)感染豬的全血樣本進(jìn)行富集后在短期內(nèi)快速檢測(cè)到了ASFV的特異序列[12]。本研究直接針對(duì)疑似野豬臨床脾臟樣本,在樣本送達(dá)實(shí)驗(yàn)室后150 min內(nèi)即完成了樣品的前期制備,經(jīng)10 min快速構(gòu)建文庫(kù),結(jié)果在測(cè)序4 min時(shí)首批獲得1.25 kb的序列讀數(shù)(reads),實(shí)時(shí)數(shù)據(jù)量806.98 kb,同步EPI2ME數(shù)據(jù)時(shí)分析比對(duì)得到了有效覆蓋ASFV全基因組的特異性序列,在獲取序列的時(shí)效性上遠(yuǎn)優(yōu)于其他測(cè)序平臺(tái)。測(cè)序運(yùn)行17 h 20 min后共計(jì)獲得1.06 GB原始測(cè)序數(shù)據(jù),共計(jì)553 071條reads。通過(guò)生物信息分析流程比對(duì)得到367條病毒reads,其中213條(58.04%)比對(duì)為ASFV基因序列,其余為豬內(nèi)源性逆轉(zhuǎn)錄病毒(16.89%)、豬巨細(xì)胞病毒(25.07%)。此外還獲得103 020條噬菌體序列,由于樣品處理前期未去除宿主基因組,因而宿主基因組序列占據(jù)全部reads的81.31%。對(duì)于復(fù)雜稀缺的臨床樣本類(lèi)型,可根據(jù)實(shí)際需求去除宿主基因組,實(shí)現(xiàn)樣本富集從而節(jié)約測(cè)序成本獲取更多有效數(shù)據(jù)。另一方面,將Nanopore測(cè)序技術(shù)與病毒宏基因組研究手段相結(jié)合可滿(mǎn)足于疫情突發(fā)時(shí)對(duì)未知病原快速檢測(cè)需求。
2.2 ASFV的熒光定量檢測(cè) 為驗(yàn)證上述結(jié)果,采用ASFV P72基因特異PCR對(duì)野豬脾臟組織樣本進(jìn)行了檢測(cè),結(jié)果成功地?cái)U(kuò)增出了250 bp目的片段(圖1),確診野豬樣品為ASFV陽(yáng)性,與納米孔測(cè)序結(jié)果完全一致。進(jìn)一步熒光定量PCR方法對(duì)該樣品進(jìn)行ASFV基因定量檢測(cè),結(jié)果顯示病毒載量為2.1E+6 copies/200 mg。該樣品中的病毒量相對(duì)較高,且ASFV基因組較大,Nanopore測(cè)序技術(shù)針對(duì)此類(lèi)臨床樣本無(wú)需PCR擴(kuò)增直接建庫(kù)測(cè)序,由此表明,Nano pore測(cè)序技術(shù)非常適用于ASF的臨床快檢應(yīng)用。
2.3 Sanger全基因組測(cè)序結(jié)果 經(jīng)Sanger測(cè)序技術(shù)最終獲得該樣品ASFV毒株基因組全長(zhǎng)189 403 bp,命名為InnerMongolia-AES01。截取其P72基因在NCBI網(wǎng)站進(jìn)行在線(xiàn)BLAST分析,結(jié)果顯示,該序列與ASFV Georgia 2007株、中國(guó)流行毒株同源性為100%,同屬于基因Ⅱ型。該毒株全基因組包含188個(gè)ORFs,序列已上傳至GenBank數(shù)據(jù)庫(kù),登錄號(hào)為MK940252。
圖1 非洲豬瘟病毒P72基因的PCR擴(kuò)增Fig.1 PCR amplified P72 gene from ASFV
2.4 納米孔測(cè)序結(jié)果
2.4.1 測(cè)序數(shù)據(jù)統(tǒng)計(jì)分析 將原始測(cè)序數(shù)據(jù)過(guò)濾后進(jìn)行NanoPlot統(tǒng)計(jì)分析,結(jié)果見(jiàn)表1。從表中可以看出通過(guò)連接法(LSK)測(cè)序獲得的數(shù)據(jù),無(wú)論在測(cè)序通量或者是測(cè)序讀長(zhǎng)與序列質(zhì)量方面,均優(yōu)于快速測(cè)序方案,對(duì)3次連接測(cè)序結(jié)果進(jìn)行分析,原始數(shù)據(jù)過(guò)濾后獲得9.0 GB過(guò)濾后數(shù)據(jù),與核苷酸數(shù)據(jù)庫(kù)比對(duì)后獲得到1826條ASFV序列,最快得到ASFV序列耗時(shí)3 h。本研究通過(guò)比較分析快速測(cè)序和連接法發(fā)現(xiàn),連接法獲取病原微生物的時(shí)效性較差,但是序列質(zhì)量更高,適用于病原基因組特征的研究。
表1 過(guò)濾后測(cè)序數(shù)據(jù)統(tǒng)計(jì)Table 1 Statistics of Nanopore clean data
2.4.2 ASFV序列統(tǒng)計(jì) 圖2表明,經(jīng)Nanopore快速測(cè)序與連接測(cè)序方案共同獲得的2039條ASFV序列與Sanger測(cè)序獲得的全基因組數(shù)據(jù)(GeneBank登錄號(hào):MK940252)相比較,同源性為74.32%~100%,最短讀長(zhǎng)僅116 bp,最長(zhǎng)讀長(zhǎng)19 821 bp,覆蓋ASFV基因組的10.46%,大多數(shù)序列讀長(zhǎng)在500~5000 bp,在序列讀長(zhǎng)方面遠(yuǎn)優(yōu)于二代illumina測(cè)序,但是序列準(zhǔn)確度僅為77.78%與85.64%,不及其他測(cè)序平臺(tái)得到的數(shù)據(jù)準(zhǔn)確高。
圖2 ASFV序列讀長(zhǎng)與同源性分布圖Fig.2 ASFV sequence read length and identity
2.4.3 ASFV序列的可視化 本研究通過(guò)Minimap2軟件將Nanopore測(cè)序數(shù)據(jù)比對(duì)到ASFV參考基因組,并借助IGV軟件將比對(duì)結(jié)果進(jìn)行可視化。從圖3可以看出測(cè)序所得序列對(duì)ASFV全基因組序列覆蓋度良好,單位點(diǎn)平均測(cè)序深度5.02,最大測(cè)序深度14,整體ASFV序列覆蓋率達(dá)99%。圖3、圖4顯示,Nanopore測(cè)序數(shù)據(jù)存在大量的插入與缺失。圖4中紅色標(biāo)記的SQK-RAD04與SQK-LSK109序列中能直觀觀察到多個(gè)位點(diǎn)存在1~2個(gè)堿基的插入與缺失,由此,導(dǎo)致兩者與Sanger測(cè)序獲得的AES01株親緣關(guān)系偏離,但是所得到的序列仍與ASFV基因Ⅱ型株序列處于同一進(jìn)化分支,表明Nanopore測(cè)序所得數(shù)據(jù)雖能判定病毒種類(lèi)但其準(zhǔn)確度仍存在較大改進(jìn)空間。對(duì)于Nanopore測(cè)序得到的reads非偶然的片段插入與缺失,需要提高測(cè)序深度或者采用2+3的組裝策略才能獲得高質(zhì)量的全基因組序列。因而將兩種建庫(kù)策略獲得的ASFV特異性序列進(jìn)行初步組裝后覆蓋了99%的全基因組序列,但是由于測(cè)序深度的限制,導(dǎo)致拼接后的序列仍存在個(gè)別位點(diǎn)的插入與缺失。下一代測(cè)序(next generation sequencing,NGS)技術(shù)能夠獲得良好的基因組覆蓋深度,但是短讀長(zhǎng)的技術(shù)特點(diǎn)以及測(cè)序中引入的擴(kuò)增會(huì)使得組裝結(jié)果的片段化。ASFV基因組兩端為反向重復(fù)序列,因而需要利用Nanopore測(cè)序產(chǎn)生的長(zhǎng)讀長(zhǎng)序列構(gòu)建基因組框架,進(jìn)一步借助NGS平臺(tái)填補(bǔ)框架,從而在短期內(nèi)完成基因組拼接工作。劉翟等[13]借助通量更高的Nanopore PromethION平臺(tái)以及NGS測(cè)序平臺(tái)采用2代+3代測(cè)序組裝策略完成了ASFV病毒分離株的測(cè)序與全基因組拼接工作,對(duì)于大基因組精準(zhǔn)組裝方面具有重要參考意義[13]。但是PromethION測(cè)序儀相對(duì)于掌上MinIONTM測(cè)序儀可移動(dòng)性較差,不利于疫情暴發(fā)現(xiàn)場(chǎng)測(cè)序平臺(tái)的快速布置,因而對(duì)于新發(fā)突發(fā)與再發(fā)病原體的快速識(shí)別與鑒定方面,Nanopore MinION測(cè)序平臺(tái)仍有不可比擬的應(yīng)用優(yōu)勢(shì)。
綜上,本研究基于先進(jìn)的Nanopore測(cè)序與便攜式高性能計(jì)算機(jī)平臺(tái)在4 min內(nèi)于一起發(fā)病的家養(yǎng)野豬體內(nèi)實(shí)時(shí)檢測(cè)到了ASFV的特異性序列,一方面,實(shí)現(xiàn)了對(duì)臨床樣品ASFV的快速檢測(cè),表明 Nanopore測(cè)序技術(shù)在新發(fā)或突發(fā)傳染病的快速診斷以及未知病原的快速鑒定中具有重要的應(yīng)用價(jià)值;另一方面,本研究明確了ASF在家養(yǎng)野豬群中的傳播與流行,進(jìn)而擴(kuò)大了ASF的宿主與地理分布范圍,提示在ASF疫情的消滅戰(zhàn)役中應(yīng)注意加強(qiáng)對(duì)野豬群的監(jiān)測(cè)與防控。
圖3 IGV ASFV序列的可視化比對(duì)Fig.3 Visual aligment ASFV sequence by IGV
圖4 基于重合片段構(gòu)建的系統(tǒng)發(fā)育樹(shù)及相關(guān)序列的可視化結(jié)果Fig.4 Visualization of phylogenetic trees and related sequences based on coincidence fragments