張擁軍
高通量測序技術在臨床病毒學領域的應用
張擁軍
本文總結(jié)了近幾年高通量測序平臺的發(fā)展現(xiàn)狀,比較了不同測序平臺的性能及特點。同時還對目前高通量測序平臺在近兩年臨床病毒學領域的應用,包括病原學診斷、分子流行病學、宏基因組學和臨床治療轉(zhuǎn)歸等幾個方面,逐一舉例進行了闡述。籍此加深專業(yè)人員對高通量測序平臺的認識,促進該技術在臨床病毒學的轉(zhuǎn)化與應用。
高通量測序;宏基因組學;病毒學
2004年454生命科學公司率先推出商品化的GS-20測序儀,宣告了高通量測序(NGS)時代的到來。經(jīng)過近10年的不斷更新,從技術層面看,各種NGS平臺日新月異,儀器試劑逐漸成熟,測序速度、讀長及通量得到了大幅度提升,相對測序成本則急劇下降。在應用方面,NGS技術愈來愈多地運用于全基因組測序、宏基因組學(metagenomics)、轉(zhuǎn)錄組(transcriptome)測序、目標序列再測序(resequencing)、從頭測序(denovosequencing)、染色體免疫共沉淀測序(ChIP-Seq)、外顯子組測序(exome sequencing)以及各種RNA測序等方面,已經(jīng)滲透到生命科學多種領域如臨床醫(yī)學、農(nóng)業(yè)、生態(tài)學、法醫(yī)、微生物學、癌癥研究等。本文擬簡要介紹目前NGS平臺的發(fā)展現(xiàn)狀,并對近兩年NGS平臺在臨床病毒學方面的部分應用進行概述。
近10年里各種NGS平臺不斷推陳出新,按時間先后順序,主要出現(xiàn)了以下主流NGS平臺。首先,454生命科學公司于2004年開始銷售基于焦磷酸測序的GS-20測序儀,首次實現(xiàn)了大規(guī)模并行測序,能夠同時測定約20萬個片段,平均讀長為110 bp。在被羅氏公司并購之后,454公司又將GS-FLX、GS-Junior等機型推向市場,平均讀長達到700~1 000 bp; 2005年Solexa公司研制了基因組分析儀(Genome Analyzer),被 Illumina公司收購后,又在此基礎上陸續(xù)發(fā)展出HiSeq2000、HiSeq2500、NextSeq500、MiSeq、HiSeq X Ten等系列測序儀,滿足了不同層次測序的需求,最大讀長已經(jīng)能夠達到600 bp;2007年應用生物系統(tǒng)公司(ABI)推出第一款SOLiD測序系統(tǒng);而生命技術公司( Life Technologies)收購ABI之后,不僅接連推出了SOLiD3、SOLiD4、SOLiD5500等機型,還分別于2009年和2011年推出了商品化的Helicos測序儀和Ion Torrent個人基因組測序儀,近年又研制了通量更高的Ion Proton、Ion Chef測序儀;作為第三代單分子測序儀的代表,太平洋生物科學公司(Pacific Biosciences)于2011年推出了單分子實時測序儀PacBio-RS, 測序讀長達到數(shù)千個堿基; 英國的Oxford Nanopore Technologies 公司則研制成功讀長更長的GridION、MinION 測序儀[1-3]。
不同于傳統(tǒng)的以毛細管電泳為基礎的第一代測序技術,NGS平臺基本上采用邊合成邊測序(sequencing-by-synthesis, SBS)的策略,也無需預先知道測序模板的遺傳背景,就能夠同時完成數(shù)十萬到數(shù)億個片段的測序,成為真正意義上的高通量。從測序原理上,454、Ion Torrent和SOLiD體系都采用乳液PCR制備樣品文庫,每一個珠子結(jié)合一段DNA模板,并均勻分配到測序孔或者玻片,實現(xiàn)一個珠子對應一個測序片段(read)。Illumina/Solexa技術則是先將測序文庫DNA變性,一端與固定在玻片上的寡核苷酸接頭結(jié)合,每個片段的另一端與玻片上的互補接頭結(jié)合,形成橋式結(jié)構(gòu),因此將這個在玻片進行的模板擴增稱為橋式PCR。從測序反應來看,454體系采用焦磷酸測序,測序需要的酶和引物都在反應孔中,每次加入1種未標記的核苷酸,有堿基摻入時,釋放出的焦磷酸鹽產(chǎn)生發(fā)光,逐一被光學攝像頭記錄下來。Ion Torrent平臺與454體系類似,只是檢測信號為堿基摻入時釋放的H離子,不需要光學設備記錄信號,因此也稱半導體測序儀。該平臺先后提供了314、316和318芯片供用戶選擇,平均讀長為100~400 bp。Illumina/Solexa體系的試劑包括引物、DNA聚合酶及4種不同標記的可逆終止核苷酸。每摻入一個核苷酸,根據(jù)不同熒光顏色記錄下來。SOLiD體系采用的是連接反應來完成測序。通過測序引物與接頭雜交,其5′端再與相鄰序列上雜交的寡核苷酸連接,不同熒光標記的寡核苷酸混合物互相競爭與引物的連接,每次摻入2個堿基。PacBio-RS 測序儀也是采取SBS策略,不同的是,其測序文庫模板不需要擴增,實現(xiàn)了單分子實時測序。單鏈基因組DNA片段與帶發(fā)卡結(jié)構(gòu)的接頭連接,形成環(huán)狀分子,然后與固定在該儀器獨有的納米小孔——ZMW上的DNA聚合酶結(jié)合,通過記錄摻入核苷酸上不同熒光基團達到測序的目的。PacBio-RS讀長能夠達到20 kb以上,平均為5 kb。同樣,GridION和MinION體系也不涉及模板擴增過程,屬于無標記的單分子測序。當單鏈DNA分子通過一種蛋白質(zhì)納米孔,鏈上每一個堿基產(chǎn)生的電信號依次被記錄下來。這種測序方法讀長可以達到數(shù)萬個堿基,是目前讀長最長的高通量測序方法[1-3]。
為了滿足一些小實驗室的需求,并將NGS平臺運用于臨床診斷市場,這些公司還生產(chǎn)了一些通量較小的臺式NGS平臺。例如,2009年羅氏公司推出的GS Junior 測序儀,可以在10 h內(nèi)獲得35 Mb序列數(shù)據(jù),平均讀長400 bp。2011年Illumina公司的MiSeq測序儀投放市場,27 h可以得到1.5 Gb數(shù)據(jù),平均讀長為150 bp。目前升級后的試劑盒能夠產(chǎn)生2千5百萬個片段,每個片段可達2×300 bp的讀長,也就是一個反應能夠得到共計15 Gb的序列。而同年生命技術公司推出的臺式NGS平臺Ion Torrent能夠在2 h內(nèi)獲得測序結(jié)果,至今仍然是測序時間最短的臺式NGS儀器。這些平臺由于單次運行成本低,數(shù)小時內(nèi)可以獲取序列結(jié)果,特別適合一些小基因組和PCR產(chǎn)物的測序,具有臨床輔助診斷的潛力[1-3]。
以下對目前各種NGS平臺的一些性能特征進行了簡單比較,見表1 。
病毒作為一種古老的物種,廣泛存在于自然界,幾乎能夠在任何物種寄生,與人類健康息息相關。雖然大部分病毒感染沒有出現(xiàn)明顯的臨床癥狀,少數(shù)病毒能夠引起人類多種疾病,表現(xiàn)出包括發(fā)熱、腹瀉、出血、出疹、呼吸道癥狀、神經(jīng)系統(tǒng)癥狀等,甚至一些病毒感染與腫瘤的發(fā)生有關。隨著100多年來人們對病毒認識的不斷深入以及生物技術的發(fā)展,人類逐漸積累了多種病毒性疾病的鑒別診斷能力,掌握了部分病毒的致病機制及流行規(guī)律,研制出一些病毒的特異性疫苗,并設計生產(chǎn)了各種抗病毒化學藥物,極大地降低了病毒性疾病的危害性。在NGS技術日漸成熟的過程中,全球科學家也在不斷嘗試將此技術及時轉(zhuǎn)化到病毒學研究中去,特別是在未知病原學診斷、已知病毒性疾病的分子流行病學、從基因組水平探討一些病毒的致病機理以及一些疾病的治療及預后方面,利用生物技術進步促進人類健康。
2.1 發(fā)現(xiàn)未知新病原 大多數(shù)病毒性疾病都有傳染性,能夠通過各種途徑或媒介傳播,因此無論是發(fā)達國家還是發(fā)展中國家,傳染病依然是威脅人類健康的因素之一。近30年來涌現(xiàn)的各類新發(fā)再發(fā)傳染病暴發(fā)事件中,相當一部分與新病毒特別是RNA病毒的出現(xiàn)相關。傳統(tǒng)的鑒定未知新病毒的方法,包括病毒分離培養(yǎng)、血清學檢測、免疫電鏡等,都需要相當長的周期,而一些致病性病毒暫時還沒有合適的體外培養(yǎng)體系。NGS技術不依賴病原體遺傳背景和高通量的特點,具有得天獨厚的優(yōu)勢,尤其是能夠從未經(jīng)純培養(yǎng)的復雜樣品中,捕捉任何疑似病原體的蛛絲馬跡。因此近幾年一些新出現(xiàn)傳染病疫情的病因調(diào)查,時常出現(xiàn)NGS平臺的身影[4]。
首先,近幾年在以下一些重要新發(fā)病毒病的發(fā)現(xiàn)過程中,各種NGS平臺發(fā)揮了巨大作用。
1)新的蜱傳播Thogotovirus[5]2014年春,1名50多歲的美國堪薩斯州男性在戶外工作時被蜱叮咬,數(shù)日后發(fā)病,有惡心、發(fā)燒、疲勞、腹瀉等癥狀。患者血小板減少,白細胞減少,起初予以強力霉素治療,11天后死于多器官衰竭。美國CDC研究人員采用分子和血清學方法檢測10余種已知蜱相關病原體均為陰性。但用蝕斑減少中和試驗測定前幾年新發(fā)現(xiàn)的Heartland病毒抗體時發(fā)現(xiàn)一種全新的病毒,經(jīng)電鏡觀察疑似為正粘病毒。隨后用ION TORRENT高通量測序平臺,檢測到多個節(jié)段基因組序列,與Dhori病毒相似度達70%,由此建立特異的實時熒光RT-PCR檢方法,并在患者血樣中證實了相關片段的存在。因此認為發(fā)現(xiàn)了一個正粘病毒科Thogotovirus病毒屬的新成員。
2)SFTS調(diào)查[6]嚴重發(fā)熱伴血小板減少綜合征 (SFTS)是2010年首先在中國中部和東北幾個省出現(xiàn)的一種新流行性疾病,曾經(jīng)通過傳統(tǒng)的毛細管測序方法證實其病原體為一種新的布尼亞病毒(SFTSV),主要經(jīng)蜱傳播。2012年秋,日本出現(xiàn)一例SFTS病例,患者死于多器官衰竭。研究人員進行回顧性調(diào)查時,將患者樣品進行病毒分離培養(yǎng),培養(yǎng)上清采用MiSeq平臺測序,發(fā)現(xiàn)了多個與SFTSV同源的DNA序列片段。NGS測序結(jié)果為證實日本同樣存在SFTS病例提供了直接證據(jù)。
2)MERS冠狀病毒疫情[7]荷蘭研究人員2012年從1例60歲沙特急性肺炎轉(zhuǎn)腎衰的死亡病例痰液中,分離到1株未知冠狀病毒(HCoV-EMC)。通過454 GS-FLX 測序平臺,得到病毒基因組約90%的序列。序列分析顯示該毒株與蝙蝠冠狀病毒HKU4和HKU5遺傳關系接近,為一種全新的beta冠狀病毒。該病毒臨床表現(xiàn)與2003年SARS相似,后來被命名為中東呼吸綜合征(MERS)冠狀病毒。2015年5月底MERS疫情在韓國暴發(fā),中國出現(xiàn)了首例來自韓國的輸入病例。中、韓兩國研究人員分別用ION TORRENT平臺和Illumina平臺測定病毒基因組序列,用于追溯病毒來源,經(jīng)初步分析該毒株與今年2-5月沙特流行毒株最接近[8]。至今(2015年6月12日)已經(jīng)累計有1 289例實驗室確診MERS病例通報給WHO,至少455例死亡[9]
3)H7N7禽流感[10]最近一個意大利團隊報道了一起人感染高致病性禽流感H7N7病毒的事件。2013年8-9月間,意大利幾個農(nóng)場出現(xiàn)了高致病性H7N7禽流感疫情,在處理疫情過程中,先后有3名工作人員出現(xiàn)不同程度的結(jié)膜炎。調(diào)查人員采集患者樣品,通過實時熒光PCR證實了H7N7病毒感染,并用Ion Torrent PGM平臺對一株病毒進行了全基因組測序。HA和NA基因種系發(fā)生分析顯示,毒株與近3年歐洲野鳥及家禽中流行的低致病性H7毒株類似,而內(nèi)部基因序列則與該地區(qū)雞群流行的H7N7毒株高度相似,也表明此病毒由雞直接傳播到人。
除了以上新發(fā)病毒性傳染病,同樣,NGS平臺對一些常見病毒性感染病例,也能夠從背景復雜樣品中,更準確地探索相關致病因子。
4)呼吸道感染調(diào)查[11]丹麥科學家為了調(diào)查兒童急性呼吸道病毒感染的病原體,采集了500份上/下呼吸道感染樣品,對其中92份樣品采用GS-FLX平臺測序,獲得4個完整病毒基因組,分別屬于人副流感病毒4型(HPIV4)的4a和4b亞型。根據(jù)測序結(jié)果,他們設計實時熒光RT-PCR引物,對所有樣品進行篩查,發(fā)現(xiàn)HPIV4陽性率為2.6%。而后他們還利用PacBio RS平臺對代表樣品進行了測序,結(jié)果證明該平臺能夠用于復雜臨床樣品的病毒序列測定。
5)病毒性腦炎調(diào)查[12]能夠引起病毒性腦膜腦炎的病毒超過100種,包括HSV-1、流感病毒、腸道病毒以及一些蟲媒病毒等。由于涉及的病原種類繁多,只有少數(shù)病例被真正明確了實驗室診斷。美國猶他大學醫(yī)學院嘗試用NGS技術調(diào)查一些腦炎病例中病毒類型。他們選擇了7例腦炎死亡病例的腦組織,提取RNA并用隨機引物進行逆轉(zhuǎn)錄。在HiSeq 2000測序儀上,每一例患者和正常對照樣品均得到50~90 M讀長為50 bp 的片段。在排除人體組織片段以后,7例患者腦組織里發(fā)現(xiàn)有36個片段與病毒有關,分別涉及以下病毒科:皰疹病毒科(17)、副粘病毒科 (10)、痘病毒科 (6)、戊肝病毒科 (2)和 黃病毒科(1)。但序列拼接以后7例患者樣品只有5例存在66~4 019 bp的片段。經(jīng)過傳統(tǒng)PCR擴增及毛細管測序,證實2例為麻疹病毒,3例為HSV-1,另外2例未檢出致病病毒序列。上述結(jié)果證明深度測序能夠用于腦炎患者的病原體調(diào)查。
2.2 追蹤已知病原的變異及多樣性 分子流行病學是采用各種分子生物學手段,在分子或基因水平闡明疾病的病因及其相關的致病過程,并研究疾病的防治和促進健康的策略和措施的科學。NGS技術應用于病毒性疾病的分子流行病學研究,可以一次性完成一些基因組較大的病毒如皰疹病毒、冠狀病毒等的全基因組序列測定,也可以同時進行數(shù)十個甚至上百個樣本中靶基因的擴增子測序,還可以通過深度測序闡明病毒在疾病發(fā)展過程中如何進化變異以及是否出現(xiàn)準種等。要完成這些目標,依靠傳統(tǒng)的毛細管電泳測序,幾乎是不可能實現(xiàn)的,并且試劑和時間成本會高很多。
具有代表性的典型應用有:
1)2014年西非EBOV疫情[13]埃博拉病毒(EBOV)自1976年在非洲發(fā)現(xiàn),主要以非洲東部的散發(fā)病例為主。始于2014年2月的疫情,是首次出現(xiàn)在非洲西海岸幾個國家(塞拉利昂、幾內(nèi)亞、利比里亞、尼日利亞),也是迄今為止最大規(guī)模的埃博拉疫情。截至2014年8月31日,已經(jīng)報告3 685病例,死亡1 641例。哈佛大學、Broad研究所與塞拉利昂一家醫(yī)院合作,從5月底至6月中旬確診的78例EBOV感染病例中,采用高通量測序的手段,共獲得了99個完整的病毒基因組序列。他們的測序過程主要在HiSeq2500和PacBio-RS平臺完成。結(jié)果顯示,這次西非疫情毒株與以往EBOV基因組存在341個堿基變異,而塞拉利昂患者存在263個宿主間單個核苷酸變異(iSNV)。根據(jù)與以往暴發(fā)相關的20個毒株基因組進行種系發(fā)生比較,表明2014年這些西非EBOV是近10年中從非洲中部傳播過來。同時,這些毒株的遺傳相似性提示,此次暴發(fā)起因是接觸單一的EBOV天然宿主,隨后引起人與人的傳播蔓延。序列數(shù)據(jù)還顯示,塞拉利昂差不多同時傳入了兩種遺傳背景不同的EBOV,該發(fā)現(xiàn)與收集到的流行病學調(diào)查信息一致。
2)荷蘭H7N7人禽流感疫情[14]2003年2-5月,荷蘭發(fā)生高致病性禽流感H7N7病毒暴發(fā),9周內(nèi)波及255個養(yǎng)雞場,導致近3千萬只雞被撲殺。另外有89人被感染,1名獸醫(yī)死亡。調(diào)查人員起初用第一代測序技術觀察到死亡病例毒株存在 PB2-E627K和HA-K416R的突變。時隔幾年之后NGS技術成熟之時,他們又利用Illumina公司的GAIIx和HiSeq 2000平臺,對原始樣品進行了深度測序。從原來養(yǎng)雞場幾份雞樣品中并未發(fā)現(xiàn)上述突變,但意外在禽樣品中發(fā)現(xiàn)流感病毒缺陷RNA片段,表明病毒在感染禽類過程中合成了缺損的干擾病毒。在幾份人樣品中,還發(fā)現(xiàn)PB2-E627K突變隨感染過程檢出頻率增高,強烈支持人類適應標志PB2-E627K是個體感染過程中逐漸形成的,減少人類暴露于禽流感病毒的機會,對于降低病毒適應人類是非常重要的。
3)乙型流感病毒基因組[15]自1980年代以來,乙型流感病毒(IBV)同時存在兩種抗原性和遺傳背景不同譜系的毒株:B/Victoria/2/87-like和B/Yamagata/16/88-like。為了對大量乙型流感病毒進行基因組測序并建立序列數(shù)據(jù)庫,美國J. Craig Venter研究所(JCVI)建立了一套通用的基因組擴增方法,以便測序、構(gòu)建疫苗和反向遺傳學研究。他們將擴增產(chǎn)物在Ion Torrent PGM、HiSeq 2000、MiSeq以及454 (Roche)平臺進行測序。經(jīng)過1 000多個IBV臨床樣品的測試,證明該方法靈敏、有效、不依賴序列,適用于NGS測序基因組診斷以及快速克隆反向遺傳學質(zhì)粒。
4)鼻咽癌中EBV基因組[16]雖然40年前就已經(jīng)知道未分化鼻咽癌(NPC)與EB病毒感染有關,但迄今僅測定了10株EB病毒毒株全基因組序列。EBV基因組全長近200 kb,若用第一代毛細管電泳測序,成本高、耗時長。為了探索NPC樣品中EB病毒基因組變異及多樣性,香港大學團隊首先在Miseq測序儀上測試了3株參比EBV序列,而后在此基礎上利用GA IIx平臺完成了來自患者病理切片的8株EBV基因組序列。與參比毒株比較,共發(fā)現(xiàn)1 736處變異(包括1 601個堿基替換、64處堿基插入、71處堿基刪除),編碼多種蛋白的基因出現(xiàn)歧義突變。以上結(jié)果說明,從全基因組水平能夠發(fā)現(xiàn)NPC患者EBV基因組的序列多樣性,通過比較正常樣品和NPC樣品中EBV的基因組變異,有助于評價某些位點變異與NPC致病機制的聯(lián)系。
2.3 宏基因組學(病毒組) 宏基因組學是研究不同生態(tài)環(huán)境中所有微生物組成,遺傳結(jié)構(gòu)及群落功能的科學。近幾年有關人類宏基因組研究先后涉及皮膚、口腔、血液、糞便等,病毒宏基因組(viral metagenome)或者病毒組(virome)指的是人類、動物、植物或者特定環(huán)境樣品中所有病毒的集合。人類病毒組包括引起人類急性/持續(xù)性或潛伏感染的病毒,以及諸如內(nèi)源性逆轉(zhuǎn)錄病毒之類的整合在人類基因組上面的病毒,開展這類研究有助于揭示新病毒及其與已知未知疾病的聯(lián)系[17-19]。NGS平臺對于這類相對較小的基因組進行深度測序,也不需要對每一個種類一一進行分離培養(yǎng),具有與其它方法不過比擬的優(yōu)越性。
根據(jù)不同組織部位的宏基因組研究結(jié)果,健康人體組織存在的病毒很多屬于噬菌體,主要與人體胃腸道的正常菌群有關。除了噬菌體,不同組織中占優(yōu)勢的病毒種類也不一致。人體皮膚主要檢出過包括Merkel 細胞多瘤病毒(一種與皮膚癌有關的DNA病毒)在內(nèi)的一些多瘤病毒(HPyV6、7、9),以及多種β-和γ-人乳頭狀瘤病毒(HPV)和圓環(huán)病毒科(Circoviridae)的一些成員;呼吸道常見EB病毒和逆轉(zhuǎn)錄病毒;口腔和鼻咽部可以檢測到多種呼吸道病毒,如人呼吸道合胞病毒(RSV)、流感病毒和鼻病毒,健康兒童呼吸道樣品還發(fā)現(xiàn)腺病毒、小RNA病毒和冠狀病毒;健康人體糞便中檢出過單鏈RNA病毒、單鏈DNA病毒、雙鏈DNA病毒以及逆轉(zhuǎn)錄病毒等,包括多種病毒如anellovirus、picobirnavirus和parechovirus,而博卡病毒、C組和F組腺病毒、Aichi病毒、星狀病毒、輪狀病毒等則較少檢出。還有部分為植物病毒,可能與膳食來源有關。另外,70%的健康人血漿中可能有非致病性的anelloviruses,一些人皰疹病毒如EB病毒、CMV、HHV6、HHV7也經(jīng)常出現(xiàn)在血液中。疾病狀態(tài)下,血液中可能出現(xiàn)其它種類的病毒:如淋巴瘤或肉瘤 (EBV、HHV8), 腦炎 (HSV、CMV、EBV和HHV6), 消化道癥狀 (CMV、HHV6)[17-20]。
不同于上述橫斷面調(diào)查,美國賓州大學的研究團隊[21]為了研究人類腸道中病毒組的進化,在2.5年內(nèi)對一名健康人連續(xù)采樣16次,獲取了24份糞便樣品。通過Illumina公司 HiSeq2000平臺的深度宏基因組測序,得到560億病毒序列數(shù)據(jù),拼接后共有478個contigs,其中60個contigs能夠組裝成環(huán)狀,意味著得到了這些病毒全部環(huán)狀基因組。87%屬于未知病毒,13%屬于以下噬菌體科(Microviridae、Podoviridae、Myoviridae、Siphoviridae)。進一步分析還發(fā)現(xiàn),其中80%基因組在2.5年中長期穩(wěn)定存在。因此,他們認為,人體腸道中病毒的多樣性來自兩個方面,少部分是廣泛存在的病毒組,其余是快速進化的長期病毒組成員。
2.4 指導臨床治療及轉(zhuǎn)歸 一些病毒感染機體之后,病毒和宿主之間的相互作用,會導致病毒基因組部分位點發(fā)生變異,以逃逸免疫系統(tǒng)對病毒的清除。而在機體接受抗病毒藥物治療的過程中,一些病毒可能在藥物作用靶位產(chǎn)生突變,從而對這類藥物具有耐藥性。甚至有的流行毒株,本身有可能就對部分藥物耐受。這些位點如果突變頻率不高,采用傳統(tǒng)的毛細管電泳測序很難捕捉到。只有覆蓋靶基因位點達數(shù)十倍甚至上百倍的深度測序,才能清晰展現(xiàn)突變位點,為臨床治療提供及時有效的參考依據(jù)。目前這方面的應用,主要集中在HIV、HCV感染患者的抗病毒治療方面。
1)長期接受抗逆轉(zhuǎn)錄病毒藥物治療患者體內(nèi)的HIV整合 對于HIV感染患者,主要采用聯(lián)合抗逆轉(zhuǎn)錄病毒治療 (cART)來抑制病毒的復制,而患者體內(nèi)持續(xù)存在的被感染細胞是阻礙HIV感染治療的關鍵。為了探索HIV前病毒DNA 在人類基因組的整合位點,美國國家癌癥研究所(NCI)的科學家[22]對5名長期(7.2~14.5年)接受cART 治療的HIV感染者進行了觀察。通過提取患者外周血單核細胞 (PBMCs) 或 CD4+T細胞的DNA,在MiSeq平臺測定患者基因組DNA中病毒/宿主序列的連接點和突破點。他們發(fā)現(xiàn)患者治療前及剛參加cART 的時刻,體內(nèi)存在多個病毒群體;而經(jīng)過長時間的cART 治療(平均11.7年)之后,無論在DNA水平還是在RNA水平,都出現(xiàn)相同的病毒序列。5名患者中,累計發(fā)現(xiàn)的整合位點涉及985個不同基因。以上結(jié)果說明HIV的整合位點對于患者體內(nèi)感染細胞的克隆化擴散以及持續(xù)存在發(fā)揮了重要作用。
2)復雜的HCV基因型[23]HCV分為7個基因型及67個亞型,不同基因型之間存在30% 核苷酸序列差異,不同亞型之間差異達20%。目前HCV感染的治療方案取決于基因型,因此準確區(qū)分基因型至關重要。研究人員選擇了世界各地2 363例患者中,有12例INNO-LiPA分型屬于基因型2,而NS5B序列分型卻屬于基因型1的患者,首先對其中8例用傳統(tǒng)測序方法測病毒核心區(qū)序列證實為基因2型。然而,他們隨后利用MiSeq平臺測定病毒基因組序列發(fā)現(xiàn),這些病毒實際屬于重組基因型2/1。其中11株病毒重組區(qū)域發(fā)生在NS2/NS3交界處。這些患者對索非布韋/利巴韋林治療方案的應答則類似于基因1型患者。
3)HCV耐藥性評估模型[24]為了計算藥物對病毒群體的作用以及群體對個體變異的抗性,研究人員選擇了HCV和干擾素抗性作為證據(jù)。他們選擇16名未接受過任何治療的基因1型慢性HCV患者,注射IFN-α 后48 h內(nèi)采血9次。然后擴增病毒基因組E1/E2交界處包含HCV高變區(qū)1(HVR1)區(qū)域的309 nt片段,將PCR產(chǎn)物進行GS FLX平臺測序,共測定 1.7 M片段,平均每個時間點有12 332個片段。根據(jù)出現(xiàn)變異的頻率變化及病毒群體滴度改變計算出干擾素抗性系數(shù),認為病毒群體抗性在IFN-α2a/利巴韋林治療第12周和抗干擾素變異的出現(xiàn)高度相關。因此認為,該方法能夠在短時間內(nèi)準確評估因單純病毒滴度變化或者相對病毒變異頻率引起的藥物抗性。
綜上所述,經(jīng)過這10年的持續(xù)發(fā)展,NGS技術和實驗體系日臻完善,在臨床病毒學的多個領域得到了應用。盡管與10年前相比,測序成本下降了許多,但目前的NGS技術應用還主要局限于研究階段,離大規(guī)模臨床應用還有相當遠的距離。只有在進一步降低實驗成本的前提下,實驗室技術人員建立起可行的標準化操作方案,生物信息學人員及時提供合理可靠的分析結(jié)果,讓臨床醫(yī)生能夠正確理解NGS數(shù)據(jù),并充分認識到NGS技術為患者帶來的便利,NGS平臺才能真正進入臨床,早日服務于需要的患者群體。
[1]van Dijk EL, Auger H, Jaszczyszyn Y, et al. Ten years of next-generation sequencing technology[J]. Trends Genet, 2014, 30(9): 418-426. DOI: 10.1016/j.tig.2014.07.001
[2]Quinones-Mateu ME, Avila S, Reyes-Teran G, et al. Deep sequencing: Becoming a critical tool in clinical virology[J]. J Clin Virol, 2014, 61(1): 9-19. DOI: 10.1016/j.jcv.2014.06.013
[3]Buermans HP, den Dunnen JT. Next generation sequencing technology: Advances and applications[J]. Biochim Biophys Acta, 2014, pii: S0925-4439(14)00180-X. DOI: 10.1016/j.bbadis.2014.06.015
[4]Chiu CY. Viral pathogen discovery[J]. Curr Opin Microbiol, 2013, 16(4): 468-478. DOI: 10.1016/j.mib.2013.05.001
[5]Kosoy OI, Lambert AJ, Hawkinson DJ, et al. NovelThogotovirusspecies associated with febrile illness and death, United States, 2014[J]. Emerg Infect Dis, 2015. DOI: 10.3201/eid2105.150150
[6]Takahashi T, Maeda K, Suzuki T, et al. The first identification and retrospective study of Severe Fever with Thrombocytopenia Syndrome in Japan[J]. J Infect Dis, 2014, 209(6): 816-827. DOI: 10.1093/infdis/jit603
[7]Zaki AM, van Boheemen S, Bestebroer TM, et al. Isolation of a novel coronavirus from a man with pneumonia in Saudi Arabia[J]. N Engl J Med, 2012, 367: 1814-1820. DOI: 10.1056/NEJMoa1211721
[8]virological.org. MERS coronavirus[EB/OL]. (2015-06-08)[2015-07-02].http://virological.org/t/preliminary-analysis-of-middle-east-respiratory-syndrome-coronavirus-mers-cov-sequences-from-korea-and-china/143
[9]World Health Organization. Middle East respiratory syndrome coronavirus (MERS-CoV)-Republic of Korea[EB/OL]. (2015-06-12)[2015-06-18]. http://www.who.int/csr/don/12-june-2015-mers-korea/en/
[10]Puzelli S, Rossini G, Facchini M, et al. Human infection with highly pathogenic A (H7N7) avian influenza virus, Italy, 2013[J]. Emerg Infect Dis, 2014. DOI: 10.3201/eid2010.140512
[11]Alquezar-Planas DE, Mourie T, Bruhn CAW, et al. Discovery of a divergent HPIV4 from respiratory secretions using second and third generation metagenomic sequencing[J]. Sci Rep, 2013, 2468, DOI: 10.1038/srep02468
[12]Chan BK, Wilson T, Fischer KF, et al. Deep sequencing to identify the causes of viral encephalitis[J]. PLoS One, 2014, 9(4): e93993. DOI: 10.1371/journal.pone.0093993
[13]Gire SK, Goba A, Andersen KG, et al. Genomic surveillance elucidates Ebola virus origin and transmission during the 2014 outbreak[J]. Science, 2014. DOI: 10.1126/science.1259657
[14]Jonges M, Welkers MR, Jeeninga RE, et al. Emergence of the virulence-associated PB2 E627K substitution in a fatal human case of highly pathogenic avian influenza virus A(H7N7) infection as determined by Illumina ultra-deep sequencing[J]. J Virol, 2014, 88(3): 1694-1702. DOI: 10.1128/JVI.02044-13
[15]Zhou B, Lin X, Wang W, et al. Universal influenza B virus genomic amplification facilitates sequencing, diagnostics, and reverse genetics[J]. J Clin Microbiol, 2014, 52(5): 1330-1337. DOI: 10.1128/JCM.03265-13[16]Kwok H, Wu CW, Palser AL, et al. Genomic diversity of epstein-barr virus genomes isolated from primary nasopharyngeal carcinoma biopsy samples[J]. J Virol, 2014, 88(18): 10662-10672. DOI: 10.1128/JVI.01665-14
[17]Hofer U. Viral evolution: Variation in the gut virome[J]. Nat Rev Microbiol, 2013, 11(9): 596. DOI: 10.1038/nrmicro3092
[18 ]Delwart E. A roadmap to the human virome[J]. PLoS Pathog, 2013, 9(2): e1003146. DOI: 10.1371/journal.ppat.1003146
[19]Lecuit M, Eloit M. The human virome: new tools and concepts[J]. Trends Microbiol, 2013, 21(10): 510-515. DOI: 10.1016/j.tim.2013.07.001
[20]Duerkop BA, Hooper LV. Resident viruses and their interactions with the immune system[J]. Nat Immunol, 2013, 14(7): 654-659. DOI: 10.1038/ni.2614
[21]Minot S, Bryson A, Chehoud C, et al. Rapid evolution of the human gut virome[J]. Proc Natl Acad Sci U S A, 2013, 110(30): 12450-12455. DOI: 10.1073/pnas.1300833110
[22]Maldarelli F, Wu X, Su L, et al. HIV latency. Specific HIV integration sites are linked to clonal expansion and persistence of infected cells[J]. Science, 2014, 345(6193): 179-183. DOI: 10.1126/science.1254194
[23]Hedskog C, Doehle B, Chodavarapu K, et al. Characterization of hepatitis C virus inter-genotypic recombinant strains and associated virologic response to sofosbuvir/ribavirin[J]. Hepatology, 2014. DOI: 10.1002/hep.27361
[24]Campo DS, Skums P, Dimitrova Z, et al. Drug resistance of a viral population and its individual intrahost variants during the first 48 hours of therapy[J]. Clin Pharmacol Ther, 2014, 95(6): 627-635. DOI: 10.1038/clpt.2014.20
Applications of next generation sequencing technologies on clinical virology
ZHANG Yong-jun
(FujianCenterforDiseaseControlandPrevention,Fuzhou350001,China)
In this review, current status of several next generation sequencing (NGS) platforms in recent years were summarized, while features and characterization of each NGS platform were compared. Applications of NGS technologies in the field of clinical virology including etiological diagnosis, molecular epidemiology, metagenomics and progression of clinical treatment, etc., was illustrated. This review would facilitate comprehensive understanding of diverse NGS platforms for professionals, and promote the transformation and application of NGS technologies in clinical virology.
next generation sequencing; metagenomics; virology
10.3969/j.issn.1002-2694.2015.09.017
福建省疾病預防控制中心,福州 350001
R373
A
1002-2694(2015)09-0864-06
2015-02-13;
2015-07-20