彭司華 江守文 孫丹 吳智超 陳潔
摘要:近年來水產(chǎn)養(yǎng)殖生產(chǎn)中病毒性疾病的發(fā)生越來越嚴(yán)重,所以對(duì)水產(chǎn)動(dòng)物病毒的深入研究成為水產(chǎn)研究者的一個(gè)重要課題。隨著宏基因組學(xué)技術(shù)的不斷發(fā)展,以及測(cè)序成本的快速下降,基于宏基因組學(xué)技術(shù)的水產(chǎn)動(dòng)物病毒鑒定技術(shù)逐漸成為水產(chǎn)動(dòng)物病毒鑒定的主要技術(shù)之一。本文總結(jié)了基于宏基因組學(xué)的水產(chǎn)動(dòng)物病毒鑒定技術(shù)的主要方法,詳細(xì)綜述了鑒定技術(shù)的實(shí)現(xiàn)流程,評(píng)述了幾種基于宏基因組學(xué)的水產(chǎn)動(dòng)物病毒鑒定技術(shù)的優(yōu)缺點(diǎn),并對(duì)基于宏基因組學(xué)的水產(chǎn)動(dòng)物病毒鑒定技術(shù)的未來發(fā)展方向進(jìn)行了展望。
關(guān)鍵詞:水產(chǎn)動(dòng)物病毒;宏基因組學(xué);病毒鑒定;二代測(cè)序
中圖分類號(hào):s941.41 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1000-4440(2019)01-0229-09
中國水產(chǎn)養(yǎng)殖產(chǎn)業(yè)飛速發(fā)展,最近29年產(chǎn)量一直居世界第一。據(jù)《2016年全國漁業(yè)經(jīng)濟(jì)統(tǒng)計(jì)公報(bào)》顯示,2016年中國水產(chǎn)品總產(chǎn)量達(dá)到6.9x10(7)t,其中養(yǎng)殖水產(chǎn)品產(chǎn)量5.1×10(7)t,,占水產(chǎn)品總產(chǎn)量的74.5%。據(jù)聯(lián)合國糧食及農(nóng)業(yè)組織《世界漁業(yè)和水產(chǎn)養(yǎng)殖2016》報(bào)道,中國的水產(chǎn)養(yǎng)殖產(chǎn)量占全球水產(chǎn)養(yǎng)殖產(chǎn)量的60%以上。然而,近些年來世界各國都遭遇到一個(gè)制約水產(chǎn)品產(chǎn)業(yè)發(fā)展的嚴(yán)重問題,即水產(chǎn)養(yǎng)殖生產(chǎn)中病毒性疾病的發(fā)生越來越嚴(yán)重。針對(duì)這一挑戰(zhàn),世界各國病毒學(xué)家都對(duì)水產(chǎn)動(dòng)物病毒的研究給予了高度重視,并獲得了大量的研究成果。目前已從養(yǎng)殖和野生水生動(dòng)物中鑒定出包括虹彩病毒、呼腸孤病毒、彈狀病毒、皰疹病毒和雙RNA病毒等不同病毒。尤其是近年來,隨著二代和三代測(cè)序組測(cè)序技術(shù)的發(fā)展,已經(jīng)獲得了許多水產(chǎn)動(dòng)物病毒的全基因組序列,這給水產(chǎn)動(dòng)物病毒的深入研究打下了良好的基礎(chǔ)。
宏基因組學(xué)(Metagenomics)是通過直接從環(huán)境樣品中提取全部微生物的DNA,構(gòu)建宏基因組文庫,利用基因組學(xué)的研究策略研究樣品所包含的全部微生物的基因組,并可刻畫其中包含的微生物的群落功能。隨著宏基因組學(xué)技術(shù)的深入發(fā)展,給水產(chǎn)動(dòng)物病毒的鑒定與發(fā)現(xiàn)帶來了很多便利?;诤昊蚪M學(xué)發(fā)現(xiàn)病毒,過去10年來發(fā)表了很多十分有見地的綜述,但隨著宏基因組學(xué)技術(shù)的進(jìn)步,需要介紹最近幾年來新的技術(shù)進(jìn)展。2018年Greninger發(fā)表了關(guān)于基于宏基因組學(xué)發(fā)現(xiàn)RNA病毒的很深刻的綜述,但對(duì)于水產(chǎn)病毒領(lǐng)域的學(xué)者,更希望看到關(guān)于針對(duì)水產(chǎn)動(dòng)物病毒更詳盡的綜述。盡管在水產(chǎn)動(dòng)物病毒鑒定方面,Munang'andu最近發(fā)表了一篇較為詳盡的綜述,但文章著重點(diǎn)在病毒發(fā)現(xiàn)的結(jié)果描述方面,而在介紹病毒鑒定的實(shí)現(xiàn)流程方面,則較少涉及。為彌補(bǔ)以上綜述文獻(xiàn)的不足,我們以水產(chǎn)動(dòng)物中的魚類為重點(diǎn),著重介紹基于宏基因組的水產(chǎn)動(dòng)物病毒鑒定實(shí)現(xiàn)流程的最新進(jìn)展,并展望未來技術(shù)的發(fā)展方向。
本文按測(cè)序平臺(tái)推出的先后順序介紹6種測(cè)序平臺(tái),包括二代和三代測(cè)序技術(shù)。簡(jiǎn)要介紹各種測(cè)序平臺(tái)在病毒鑒定中的應(yīng)用。并介紹了利用新一代測(cè)序技術(shù)(Next generation sequencing,NGS。含二代和三代測(cè)序技術(shù))用于水產(chǎn)動(dòng)物病毒的鑒定案例,其中以養(yǎng)殖和野生的魚類病毒鑒定為重點(diǎn)。詳細(xì)總結(jié)基于新一代測(cè)序技術(shù)發(fā)現(xiàn)的魚類病毒的種類,所屬病毒家族,宿主來源等信息。對(duì)基于新一代測(cè)序技術(shù)和宏基因組學(xué)技術(shù)進(jìn)行水產(chǎn)動(dòng)物病毒鑒定的詳細(xì)操作流程進(jìn)行綜述。
1基于宏基因組學(xué)水產(chǎn)養(yǎng)殖病毒鑒定的產(chǎn)生背景
傳統(tǒng)的病毒鑒定方法主要有病毒培養(yǎng)、電鏡觀察、血清學(xué)反應(yīng)和PCR方法等,操作繁瑣,費(fèi)時(shí)費(fèi)力,且鑒定的效率較低。傳統(tǒng)的方法在鑒定新病毒方面主要缺陷有:(1)很多病毒缺乏特異的細(xì)胞系,使得至少60%以上的病毒無法獲得;(2)用電鏡來觀察病毒其靈敏性較低,許多情況下根本無法觀察到;(3)由于高效的特異性抗體很難獲得,用血清學(xué)反應(yīng)來鑒定病毒也不理想;(4)而基于PCR法的病毒鑒定,必須首先得到病毒的DNA序列,這對(duì)于未知序列的病毒,以及變異性大的病毒的鑒定事實(shí)上很難實(shí)現(xiàn)。
而基于二代測(cè)序的病毒宏基因組學(xué)方法直接利用魚類樣本中的病毒DNA序列作為研究對(duì)象。能夠快速,有效地發(fā)現(xiàn)各種未知魚類病毒,而且能直觀地顯示各種魚類樣本中病毒的種類與豐度。這樣就可以方便地了解病毒的分布情況,對(duì)某些病原和潛在致病病毒的變化進(jìn)行實(shí)時(shí)監(jiān)測(cè)。同時(shí)有望診斷由新的或未知病原體引起的魚類疾病。
2二代與三代測(cè)序技術(shù)簡(jiǎn)介
2.1 454測(cè)序或焦磷酸測(cè)序技術(shù)
這是基于宏基因組學(xué)病毒發(fā)現(xiàn)的第一種高通量測(cè)序技術(shù)。焦磷酸測(cè)序技術(shù)的原理是:引物與模板DNA退火后,在ATP硫酸化酶,DNA聚合酶,雙磷酸酶和熒光素酶4種酶的共同作用下,將引物上每一個(gè)dNTP的聚合與一次熒光信號(hào)的釋放偶聯(lián)起來,實(shí)現(xiàn)實(shí)時(shí)測(cè)定DNA序列。454測(cè)序被廣泛用于鑒定來自人和動(dòng)物的新病毒,例如蟲媒病毒(Or-biviruses),冠狀病毒,y乳頭瘤病毒(Gamma-papillomavirus)和蝙蝠肝炎病毒和Pegivillls等。雖然這種技術(shù)比Sanger測(cè)序有更高的通量,但是由于其成本高,錯(cuò)誤率較高,且在測(cè)序通量方面比不上Illumina等技術(shù),因此,該技術(shù)已被其他NGS技術(shù)所取代。
2.2 Ion torrent測(cè)序技術(shù)
這是Life Technologies/Thermo Fisher Scientific開發(fā)的一種基于半導(dǎo)體測(cè)序技術(shù)的測(cè)序平臺(tái),這種技術(shù)最早在2012發(fā)布,這個(gè)測(cè)序平臺(tái)在基本原理上與454焦磷酸測(cè)序平臺(tái)基本相似。這些快速的測(cè)序技術(shù)很快被應(yīng)用到病毒的臨床檢測(cè)中,例如乙型肝炎病毒_24],HIV病毒,HCV。采用Ion tor-rent測(cè)序技術(shù),對(duì)許多病毒進(jìn)行了病毒基因組測(cè)序,例如正交病毒、豬繁殖與呼吸綜合征病毒、多瘤病毒、托斯卡納病毒、藍(lán)舌病病毒、輪狀病毒和流感病毒等。
2.3 ABI SOLID測(cè)序技術(shù)
SOLID使用了連接法測(cè)序的策略,該測(cè)序平臺(tái)通過檢測(cè)“雙堿基編碼原理”的顏色編碼序列的原理,實(shí)現(xiàn)了DNA序列的檢測(cè)。在得到原始數(shù)據(jù)后的的數(shù)據(jù)分析流程中,把原始顏色序列和轉(zhuǎn)換成顏色編碼的參考序列進(jìn)行對(duì)比,從而實(shí)現(xiàn)把SOLID顏色序列準(zhǔn)確定位到參考序列上,從而實(shí)現(xiàn)測(cè)序的目的。連接測(cè)序所采用的底物是8個(gè)堿基熒光探針的混合物,只根據(jù)序列的位置,所測(cè)DNA就可以被探針準(zhǔn)確標(biāo)記。Solid的缺點(diǎn)是讀長(zhǎng)只有50~75 bp,但測(cè)序的精確度較高,可達(dá)99.99%[34-35]。由于讀長(zhǎng)太短,現(xiàn)在在病毒鑒定中已經(jīng)不采用這種測(cè)序技術(shù)。
2.4 mumina測(cè)序技術(shù)
這是Solexa/Illumina開發(fā)出的一個(gè)高通量測(cè)序平臺(tái),Illumina測(cè)序技術(shù)采用邊合成邊測(cè)序的策略來實(shí)現(xiàn)測(cè)序。首先,在DNA片段兩端加上通用接頭來構(gòu)建文庫,然后把文庫加載到Flowcell芯片上,經(jīng)過橋式PCR反應(yīng)后,對(duì)每一條文庫片段都進(jìn)行擴(kuò)增,結(jié)果形成一個(gè)簇,通過邊合成邊測(cè)序反應(yīng),在經(jīng)過多次循環(huán)后,最后獲得完整的核酸序列。采用這種測(cè)序技術(shù)發(fā)現(xiàn)的病毒有血小板減少癥病毒,猿猴腺病毒,原病毒屬病毒等。
2.5PacBio測(cè)序技術(shù)
PacBio測(cè)序技術(shù)是第三代基因測(cè)序技術(shù),又被稱為單分子實(shí)時(shí)DNA測(cè)序技術(shù)Single mole-cule real time(SMRTT-TM)DNA sequencing]。該方法基于納米孔的單分子讀取技術(shù),不需要擴(kuò)增即可快速讀取序列。Pacific Biosciences的SMRT測(cè)序平臺(tái),被稱為RS II,該技術(shù)可產(chǎn)生長(zhǎng)序列PacBio測(cè)序技術(shù)非常適合病毒宏基因組學(xué)研究,因?yàn)闇y(cè)序讀長(zhǎng)可以達(dá)到10 kb以上。但是PacBio測(cè)序成本較高,且測(cè)序的錯(cuò)誤率較高,測(cè)序精確度只能達(dá)到86%左右。但是由于測(cè)序讀長(zhǎng)較長(zhǎng),這種技術(shù)將成為未來最主要的病毒鑒定測(cè)序技術(shù)之一。
2.6 Nanopore測(cè)序技術(shù)
Nanopore是一種單分子實(shí)時(shí)測(cè)序的新一代測(cè)序方法,其以單分子DNA(RNA)通過生物納米孔的電流變化推測(cè)堿基組成來進(jìn)行測(cè)序。Nanopore測(cè)序準(zhǔn)確率和PacBio持平,為86%左右。目前Nanopore的長(zhǎng)序列主要應(yīng)用于高質(zhì)量基因組的組裝,尤其是對(duì)于高雜合,高重復(fù),大基因組等復(fù)雜基因組。2016年前,主要用于一些小基因組如大腸桿菌,酵母,線蟲等,目前已經(jīng)應(yīng)用在人、野生番茄、香蕉、歐洲鰻等多個(gè)復(fù)雜基因組組裝上。由于測(cè)序讀長(zhǎng)較長(zhǎng),這種技術(shù)也會(huì)成為未來病毒鑒定最重要的測(cè)序技術(shù)之一。
3新一代測(cè)序技術(shù)和宏基因組學(xué)在水產(chǎn)新病毒發(fā)現(xiàn)上的應(yīng)用
病毒宏基因組學(xué)已經(jīng)成功用于新的水生動(dòng)物病毒發(fā)現(xiàn)研究,包括魚類、甲殼類動(dòng)物、軟體動(dòng)物、海龜和海洋哺乳動(dòng)物,本文以魚類新病毒發(fā)現(xiàn)研究成果為重點(diǎn)進(jìn)行評(píng)述。
2011年以來,應(yīng)用二代測(cè)序和宏基因組學(xué)技術(shù),鑒定了許多養(yǎng)殖和野生魚類病毒,例如虹彩病毒科病毒。在大西洋三文魚、淡水鯉魚和金體美洲鳊魚體內(nèi)鑒定了呼腸孤病毒,在歐洲鯰魚體內(nèi)鑒定了圓環(huán)病毒,在鯉魚和金體美洲鳊魚體內(nèi)發(fā)現(xiàn)了小RNA病毒科病毒,在鯉魚體內(nèi)鑒定了微小核糖核酸病毒屬病毒,在白亞口魚和大太陽魚體內(nèi)鑒定了嗜肝DNA病毒,在金體美洲鳊魚體內(nèi)鑒定了整體病毒科病毒,在釣餌魚體內(nèi)鑒定了黑頭豆科杯狀病毒1。這些基于二代測(cè)序和宏基因組學(xué)鑒定的魚類病毒案例的詳細(xì)信息見表1。
此外,二代測(cè)序技術(shù)和宏基因組學(xué)在甲殼動(dòng)物蝦、貝類、海星、佛羅里達(dá)綠海龜以及加利福尼亞海獅、太平洋海豹、白喙海豚、海狗等水產(chǎn)動(dòng)物為宿主的病毒發(fā)現(xiàn)中也得到廣泛應(yīng)用。
4病毒鑒定流程
僅僅采用二代測(cè)序技術(shù)鑒定病毒是一個(gè)費(fèi)時(shí)費(fèi)力的工作,且要耗費(fèi)較多的資金,現(xiàn)在已經(jīng)較少采用這種方法來鑒定病毒了。隨著宏基因組學(xué)技術(shù)的成熟,二代測(cè)序加上宏基因組學(xué)技術(shù)成為鑒定病毒的主流技術(shù)。由于絕大多數(shù)微生物無法人工培養(yǎng),造成僅基于二代測(cè)序的方法鑒定病毒有很大的局限性。而基于宏基因組學(xué)技術(shù)可以克服大多數(shù)微生物不能培養(yǎng)的缺點(diǎn),使得基于宏基因組學(xué)的病毒鑒定得到廣泛采用。
一些研究者開發(fā)了一些基于宏基因組學(xué)的病毒鑒定流程軟件(Pipeline for virus identification anddiscovery),例如中國疾控中心IJi等開發(fā)的VIP病毒鑒定集成軟件系統(tǒng),如圖1所示。
Lin等則開發(fā)了另一種集成軟件系統(tǒng)drVM。但這些集成軟件系統(tǒng)雖然使得系統(tǒng)容易使用,但它們往往只集成固定的幾種軟件。而實(shí)際上宏基因組學(xué)分析軟件更新?lián)Q代非常快,這就使得現(xiàn)有的集成軟件系統(tǒng)的性能不一定是最好的。因此選擇當(dāng)時(shí)最好的軟件來構(gòu)建自己的分析流程是最好的選擇。當(dāng)然這需要較多的生物信息學(xué)軟件使用經(jīng)驗(yàn)。Tengs等在大西洋三文魚的病毒鑒定中提出了一個(gè)魚類病毒的鑒定流程,根據(jù)文中的描述,我們繪制出該病毒鑒定流程示意圖(圖2)。在基本分析框架不變的情況下,我們可以更換分析流程中的任何軟件。例如該文作者采用了Velvet軟件來做宏基因組拼裝,實(shí)際上我們可以把Velvet用其他宏基因組拼接軟件來代替,例如MEGAHIT、Spades、SOAPdenov02等。質(zhì)量控制工具PRINSEQ也可以用TRIMOMMATIC、NGS 9c Toolkit等軟件來代替。在對(duì)數(shù)據(jù)進(jìn)行微生物分類學(xué)鑒定時(shí)采用的METAXA2軟件也可以換成普遍采用的同類型軟件QIIME。
我們課題組在研究青藏高原土壤與水體宏基因組研究中,采用Torstein Tengs等使用的Pipeline流程,成功地鑒定了一種病毒。此外,我們還開始了鯉魚腸道宏基因組學(xué)研究,目前做的項(xiàng)目有鯉魚16S RNA測(cè)序,鯉魚腸道宏基因組測(cè)序。雖然目前我們測(cè)序的鯉魚樣本是健康的鯉魚,但我們?nèi)匀婚_始了鯉魚腸道病毒篩選工作。后續(xù)還打算對(duì)發(fā)病的鯉魚樣本進(jìn)行深度測(cè)序,并初步打算增加三代測(cè)序方法,這樣既可以拼接到更多的鯉魚腸道微生物全長(zhǎng)基因組,又可能篩選到鯉魚腸道中的病毒。
Rampelli等開發(fā)的ViromeScan,其實(shí)現(xiàn)流程如3所示。這個(gè)軟件只要輸入二代測(cè)序fastq格式的原始數(shù)據(jù)(Raw data),不需要拼接宏基因組,經(jīng)過多步運(yùn)算后就可以得到病毒組分類結(jié)果。其中采用的病毒組數(shù)據(jù)庫可以在NCBI病毒基因組數(shù)據(jù)庫下載。在過濾宿主基因組和細(xì)菌Reads時(shí),均采用了BMTagger。
最新報(bào)道的幾種Pipeline病毒鑒定方法值得關(guān)注,Ren等推出了VirFinder。Lin等開發(fā)了基于web的鑒定流程Vipie,另外一種新方法是Tithi等提出的基于單機(jī)版的病毒鑒定流程FastVirome-Explorer。這幾種方法和上面介紹的3種方法實(shí)現(xiàn)流程雖有差別,但也基本相似,讀者可以參考原文了解詳細(xì)實(shí)現(xiàn)流程。
5展望
本文綜述了基于新一代測(cè)序和宏基因組學(xué)進(jìn)行水產(chǎn)動(dòng)物病毒鑒定和發(fā)現(xiàn)的基本原理和主要技術(shù)。尤其是隨著近年來宏基因組學(xué)技術(shù)的完善以及測(cè)序成本的持續(xù)大幅度下降,使得宏基因組學(xué)技術(shù)已經(jīng)成為水產(chǎn)動(dòng)物疾病診斷和水產(chǎn)養(yǎng)殖新病原發(fā)現(xiàn)的一種重要工具。就新型病毒的發(fā)現(xiàn)而言,從裝配方法(De novo assemblies)與生物信息學(xué)注釋工具相結(jié)合,簡(jiǎn)化了鑒定與獲得完整病毒基因組的步驟。因此,病毒宏基因組學(xué)可以用作新型病毒鑒定,病毒系統(tǒng)發(fā)育分析,病毒感染診斷,以及疾病監(jiān)測(cè)的工具。在病毒宏基因組學(xué)分析中面臨的一個(gè)重要挑戰(zhàn)是,使用宏基因組學(xué)技術(shù)得到的大部分病毒序列仍然未被注釋,這主要是因?yàn)樗鼈兣c普通數(shù)據(jù)庫中的任何已知序列沒有相似性_。Mokili等認(rèn)為,目前注釋未知病毒序列不完善的主要原因還是缺乏合適的生物信息學(xué)分析工具。IJi等指出,病毒序列在裝配中的問題之一是它們有時(shí)會(huì)形成嵌合重疊群,這些嵌合重疊群在拼接時(shí)很難識(shí)別。
病毒宏基因組學(xué)分析面臨的另一個(gè)重要挑戰(zhàn)是,裝配的病毒基因組的準(zhǔn)確性還有待提高。使用宏基因組學(xué)分析鑒定新型病毒的注釋方法應(yīng)力求避免出現(xiàn)假陽性。鑒于大多數(shù)感染水生動(dòng)物的病毒都沒有被鑒定,而且在數(shù)據(jù)庫中也沒有發(fā)現(xiàn)這種病毒,所以新感染水生動(dòng)物病毒的這種不準(zhǔn)確性可能更高。盡管如此,我們認(rèn)為基于基因組學(xué)的水產(chǎn)動(dòng)物病毒鑒定將隨著宏基因組學(xué)技術(shù)的不斷成熟,測(cè)序成本的不斷下降,以及已知病毒數(shù)據(jù)庫的不斷完善而得到更廣泛的采用。
新型納米孔測(cè)序技術(shù)Nanopore測(cè)序是一種非常有前途的測(cè)序技術(shù)。由于該測(cè)序儀的小型化以及樣品準(zhǔn)備極其簡(jiǎn)單,且不需要借助堿基、多聚酶、連接酶等就能進(jìn)行測(cè)序,尤其適合野外攜帶。所以,Nanopore測(cè)序技術(shù)有望在水產(chǎn)動(dòng)物病毒鑒定方面得到更廣泛的采用。
我們?cè)诒?中可以發(fā)現(xiàn),一種病毒可能感染多種魚類,例如呼腸孤病毒可以感染大西洋三文魚、淡水鯉魚、金體美洲鳊魚等,但感染的分子機(jī)制仍未揭示。隨著宏基因組學(xué)的發(fā)展和完善,更多的病毒序列全長(zhǎng)將會(huì)得到。這將給揭示病毒感染的機(jī)制帶來很多方便,并將有力促進(jìn)魚病藥物的研發(fā),為更好地控制魚病疫情打下基礎(chǔ)。