袁易,王銘杰,張欣欣
上海交通大學醫(yī)學院附屬瑞金醫(yī)院臨床病毒研究室,上海 200025
·綜述·
第三代測序技術(shù)的主要特點及其在病毒基因組研究中的應(yīng)用
袁易,王銘杰,張欣欣
上海交通大學醫(yī)學院附屬瑞金醫(yī)院臨床病毒研究室,上海 200025
隨著基因測序技術(shù)的創(chuàng)新和應(yīng)用,新的高通量測序技術(shù)不斷涌現(xiàn),以Pacific Biosciences(PacBio)公司的單分子實時測序(single molecule real time sequencing)為代表的第三代測序(third generation sequencing,TGS)技術(shù)開始逐漸應(yīng)用于基因組研究,包括大型基因組拼裝、基因結(jié)構(gòu)變異和表觀遺傳研究等方面。本文主要對TGS技術(shù)的原理、特點和應(yīng)用,特別是在病毒研究中的應(yīng)用進行介紹,并與第二代測序(next generation sequencing,NGS)技術(shù)進行比較,為基因組測序技術(shù)的選擇及其臨床應(yīng)用提供一定參考。
第三代測序技術(shù);Pacific Biosciences;單分子實時測序;病毒基因組
近幾年來基因測序技術(shù)發(fā)生了重大革新,出現(xiàn)了以高通量、相對較低成本為特征的第二代測序(next generation sequencing,NGS)技術(shù),并廣泛應(yīng)用于生物醫(yī)學領(lǐng)域,如基因組重測序(genome resequencing)、從頭測序(denovoassembling)、轉(zhuǎn)錄組測序(transcriptome sequencing)、外顯子測序(exome sequencing)等方面[1]。但NGS技術(shù)在實際應(yīng)用中也存在缺陷,如讀長較短,無法跨越基因上串聯(lián)重復區(qū)域,導致其在檢測串聯(lián)重復區(qū)域時存在明顯不足[2]。與NGS技術(shù)相比,Pacific Biosciences(PacBio)公司推出的最新單分子實時測序(single molecule real time sequencing,SMRT)具有讀長較長的優(yōu)勢,平均讀長10~15 kb,最大讀長達64.5 kb[3],屬第三代測序(third generation sequencing,TGS)技術(shù)。目前,病毒基因組的測序工作主要采用NGS技術(shù),最常用的是Roche454測序平臺和Illumina測序平臺。這兩種測序平臺存在的主要問題是讀長較短,其中讀長最長的 Roche454 GS FLX+平臺的讀長也僅約700 bp[4]。因此,對讀長要求較高的特殊分析如檢測聯(lián)合變異時靈敏度較低。TGS技術(shù)的讀長優(yōu)勢可彌補NGS技術(shù)的不足,可用于病毒基因組研究,加深人類對病毒變異的了解,對病毒感染性疾病的治療和預后具有重要意義。
1.1 PacBio測序原理
PacBio測序平臺采用的檢測單位為SMRT cell,每個SMRT cell中含有15萬個零模式波導管(zero-mode waveguide,ZMW)。ZMW是一種孔徑只有100 nm的小孔,內(nèi)徑比激發(fā)光波長小得多。從ZMW底部射出的激發(fā)光無法穿過小孔進入上方的溶液中激發(fā)游離堿基產(chǎn)生熒光,可最大程度地降低背景熒光的干擾。PacBio測序的文庫是由雙鏈DNA(double-strand DNA,dsDNA)分子在兩端分別結(jié)合標記性的接頭后形成的發(fā)夾狀產(chǎn)物。
測序基本原理如圖1所示,構(gòu)建的SMRT cell擴散至ZMW底部后雙鏈打開,形成一個共價閉合環(huán)狀DNA,并與結(jié)合在ZMW底部的聚合酶結(jié)合進行新鏈合成。這種環(huán)狀結(jié)構(gòu)的設(shè)計能使聚合酶在不間斷的情況下持續(xù)進行新鏈合成,其產(chǎn)物也與天然產(chǎn)物一致,因此將產(chǎn)生的這種長讀長的序列稱為CLR(a continuous long read),這種連續(xù)測序模式稱為CCS(circular consensus sequencing)[3]。在加入4色熒光標記的4種堿基后,根據(jù)堿基互補配對的原則,將相應(yīng)堿基結(jié)合至模板鏈,不同堿基的加入會激發(fā)出不同熒光,可根據(jù)產(chǎn)生的熒光信息確定堿基類型。
A:4種不同熒光物質(zhì)標記的核苷酸分別釋放入ZMW中(A、T、G和C分別被藍色、綠色、紅色和黃色熒光物質(zhì)標記),圖中顯示藍色熒光物質(zhì)標記的A被固定于ZMW底部的聚合酶捕獲,結(jié)合于新鏈末端;B:在激發(fā)光作用下核苷酸上標記的熒光物質(zhì)發(fā)出特異性藍色熒光,代表所結(jié)合的堿基類型。
圖1 PacBio測序基本原理圖
Fig.1 The schematic diagram of PacBio sequencing
1.2 PacBio測序的特征
PacBio測序采用SMRT原理,最大特點是讀長較長,對基因組中一些串聯(lián)重復區(qū)域的檢測驗證和定位具有獨特優(yōu)勢,但出錯率較高,且具有隨機性。PacBio測序的通量不高,低于Roche454和Illumina平臺。此外,PacBio測序平臺可通過復制過程中聚合酶的動力學變化特征直接檢測堿基的修飾類型和位點信息,為表觀遺傳學研究提供了新的便捷途徑。以下介紹PacBio測序的主要優(yōu)缺點。
1.2.1 讀長較長 最新的PacBio RS Ⅱ測序平臺的平均讀長已提高至10~15 kb,最大讀長可達64.5 kb[4]。Rhoads等利用PacBio RS Ⅱ平臺對大小為20 kb的大腸埃希菌DNA進行測序,獲得大量不同長度的reads,有報道稱PacBio測序平臺的平均讀長可達10~15 kb[3]。雖然目前尚未有PacBio應(yīng)用于乙型肝炎病毒(hepatitis B virus,HBV)基因組研究的報道,但該研究表明PacBio的讀長已超過HBV基因組全長(3.2 kb),可用于HBV全基因組研究。
1.2.2 可檢測堿基修飾 PacBio測序過程中,不同堿基的加入會產(chǎn)生各自特征性的矩形脈沖波,為方便研究,將脈沖時間寬度稱為PW(pulse width),相鄰兩個脈沖波之間的時間寬度稱為IPD(interpulse duration)[5]。其中IPD的寬度與堿基修飾關(guān)系密切,研究表明存在修飾的堿基通過聚合酶的時間相應(yīng)延長,在脈沖譜上表現(xiàn)為IPD延長,借以判斷序列中堿基修飾數(shù)量和位置。此外,不同堿基的修飾類型和相同堿基的不同修飾類型如甲基化等[5]在脈沖波譜上的表示形式不同。亞硫酸氫鹽(bisulfite)法是目前最常用的檢測DNA甲基化的方法,與之相比,PacBio測序不僅可明顯提高檢測速度,還可提供不同堿基的修飾信息。
1.2.3 準確率有待提高 PacBio SMRT最明顯的缺點是單核苷酸檢測的準確率不高,為85%~89%[6]。原因可能是在測序過程中某些特異性熒光信號較弱,易被背景熒光干擾。但這種錯誤是隨機的,可通過提高檢測覆蓋度來提高測序準確率。當CCS的覆蓋度(coverage)達15×時,PacBio測序的準確率高達99.99%[4]。
由于NGS技術(shù)具有高通量、高準確率的特點,與PacBio SMRT的讀長優(yōu)勢互補,聯(lián)合使用可大大提高PacBio SMRT的準確率。Tombácz等研究假狂犬病病毒(pseudorabies virus,PRV)的DNA轉(zhuǎn)錄情況,采用Illumina和PacBio RS Ⅱ平臺分別對PRV的CTO-S(highly abundant short transcript)和CTO-L(less abundant long RNA molecule)進行測序,發(fā)現(xiàn)PacBio檢測片段長度<700 bp的CTO-S靈敏度不夠,只能對片段較長的CTO-L(>2 kb)進行檢測;而Illumina平臺對較短的CTO-S進行測序更具優(yōu)勢。因此,PacBio的長讀長可與Illumina的高通量、高準確率明顯優(yōu)勢互補[7]。
1.2.4 通量不高 與NGS技術(shù)相比,PacBio測序在通量方面明顯不足。如Roche454 GS FLX+的通量為1×106reads/run,Illumina HiSeq 2500(quick run)的通量為1.2×109reads/run(paired),而PacBio RS Ⅱ P6-C4的通量只有(3.5~7.5)×104reads/run[4]。理論上,PacBio的通量應(yīng)是目前實際通量的2~5倍,因為每個SMRT cell中含有15萬個ZMW,在所有導管均可正常測序的情況下,其通量相當可觀。但在實際運行過程中,只有3.5萬~7萬個ZMW可成功完成測序。2015年7月,PacBio公司宣布新型Sequel測序系統(tǒng)將SMRT cell中ZMW從15萬個增至100萬個,每個SMRT cell的通量提高7倍,同時每次運行的SMRT cell數(shù)量提高至16個,極大提高了PacBio測序平臺的通量。
目前對病毒基因組的研究主要采用NGS技術(shù),但該技術(shù)讀長短,無法實現(xiàn)大片段測序,同時存在錯誤率較高、數(shù)據(jù)量大、分析困難等問題,限制了其在病毒基因測序方面的應(yīng)用。TGS技術(shù)則與NGS技術(shù)形成互補,其讀長較長的特點使其在病毒全基因組測序和分析方面具有明顯優(yōu)勢。但由于TGS技術(shù)市場化較晚,目前應(yīng)用其進行病毒基因組測序的報道較少,尚有很大應(yīng)用空間。以下就TGS技術(shù)在病毒研究中的應(yīng)用及其潛在用途進行介紹。
2.1 病毒耐藥位點檢測
臨床上,HBV、丙型肝炎病毒(hepatitis C virus,HCV)和人類免疫缺陷病毒(human immunodeficiency virus,HIV)與某些慢性疾病的發(fā)生密切相關(guān),在抗病毒治療過程中易產(chǎn)生耐藥相關(guān)突變,影響治療效果,從而使病毒在宿主體內(nèi)持續(xù)存在,造成疾病慢性化。因此,對病毒耐藥突變的檢測至關(guān)重要。目前最常用的檢測方法是直接測序法,靈敏度較低,只能檢測出豐度>20%~25%的耐藥突變。新興高通量NGS技術(shù)逐漸應(yīng)用于耐藥突變檢測,對豐度<5%的突變株具有較高的靈敏度,極大提高了病毒單個位點突變和多重耐藥突變的檢出率,對研究病毒在機體內(nèi)的進化特征和指導臨床用藥具有重要作用[8]。Bergfors等利用PacBio RS Ⅱ平臺對HCV相關(guān)耐藥基因NS5A進行測序,同時對PacBio SMRT技術(shù)的性能進行驗證[9]。該研究中,Bergfors等用3份GT1a Q3OH、Y93N和GT3a Y93H陽性標本,5份GT1a陽性標本,2份GT3a陰性標本及4種不同稀釋倍數(shù)的HCV GT1a H17質(zhì)粒對PacBio SMRT進行驗證,并以測序過程的出錯率和檢測限(limit of detection,LOD)作為性能指標。結(jié)果顯示,在4種不同稀釋倍數(shù)的HCV GT1a H17質(zhì)粒中,平均錯誤率僅為0.05%~0.25%,可檢測頻率低至0.24%的NS5A耐藥相關(guān)變異(resistance-associated variant,RAV)。PacBio SMRT檢測NS5A RAV的高靈敏度,可為臨床上選擇最佳的直接抗病毒藥物(direct-acting antiviral,DAA)提供可靠依據(jù),減少因治療不當而產(chǎn)生的臨床耐藥。
2.2 病毒基因整合檢測
病毒可將自身基因組整合至宿主染色體中而逃避宿主的免疫攻擊,實現(xiàn)長期感染,給臨床上病毒感染性疾病的診斷、治療和預后判斷帶來極大困難。因此,準確檢測病毒基因整合位點及其分布特點,可為病毒感染性疾病的治療提供一定參考。腺相關(guān)病毒(adeno-associated virus,AAV)可將自身基因組整合至宿主細胞內(nèi),不僅可逃避宿主的免疫攻擊,還可導致宿主細胞的癌變。為研究AAV基因組整合的機制,Hüser等利用AAV2作為研究對象。該病毒主要通過調(diào)節(jié)蛋白Rep78/68結(jié)合AAV-ITR(AAV-inverted terminal repeat)內(nèi)部的RBS(Rep-binding site),將自身基因組整合至宿主AAV S1基因中,同時AAV-ITR也是病毒基因組復制和轉(zhuǎn)錄表達的起始位點,在病毒的生命周期中具有重要作用。Hüser等[10]利用PacBio測序平臺研究AAV基因組整合至HeLa細胞基因組中的確切位置,發(fā)現(xiàn)PacBio SMRT的CCS連續(xù)測序模式可實現(xiàn)對單個核苷酸分子多次重復檢測,且可對AAV基因組整合位點進行雙向檢測,極大提高了檢測準確率。此外,PacBio測序的長讀長不僅實現(xiàn)了AAV全基因組的覆蓋,還可延伸至目的序列以外區(qū)域,對AAV基因組整合位點的確定至關(guān)重要。
2.3 宏病毒組測序
病毒宏基因組學(metagenomics)的研究對象是特定環(huán)境中的整個病毒群體,利用基因測序技術(shù)和泛病毒芯片技術(shù)獲取并集合環(huán)境中全部病毒的基因信息,對新病毒的發(fā)現(xiàn)、病原體溯源和病毒感染預警具有重要意義[11]。病毒基因組學突破傳統(tǒng)的病毒學檢測方法〔如血清免疫學、電鏡、聚合酶鏈反應(yīng)(polymerase chain reaction,PCR)和細胞培養(yǎng)等〕,利用泛病毒芯片和基因測序技術(shù)檢測病毒。但采用泛病毒芯片技術(shù)對序列未知的、環(huán)境中豐度<5%和變異程度較大的病毒較難檢測。最近幾年NGS技術(shù)在病毒宏基因組學研究中的應(yīng)用越來越廣泛,對新病毒的發(fā)現(xiàn)和病毒變異檢測具有重要作用。2010年,Donaldson等分析蝙蝠腸道內(nèi)的病毒構(gòu)成,共獲得近60萬個片段的核酸序列,經(jīng)組裝發(fā)現(xiàn)這些片段來自3組以上新的1型冠狀病毒、不同昆蟲及2種新型細菌的質(zhì)?;蚪M序列。該研究表明,蝙蝠體內(nèi)攜帶多種不同病毒,并可傳播給自然界中其他宿主[12]。Greninger等利用超深度測序和病毒基因芯片技術(shù)研究甲型流感病毒H1N1時,獲取了大量新變異株,同時發(fā)現(xiàn)了許多未知新病毒,表明超深度測序可能取代傳統(tǒng)的病毒鑒定方法,更好地用于臨床上未知疾病的診斷和新病毒的檢測[13]。Willner等采用病毒宏基因組學對5例肺囊性纖維化患者和5例正常健康者痰液中的病毒進行差異性研究,發(fā)現(xiàn)肺囊性纖維化患者痰液中病毒群體相似度較高,而與對照組的差異較明顯;同時還發(fā)現(xiàn)在肺囊性纖維化的不同病程階段,患者體內(nèi)的芳香族氨基酸代謝方式有所不同。該研究提示,可通過改變患者機體內(nèi)的微生物群落達到治療疾病的目的[14]。這些數(shù)據(jù)均是通過NGS技術(shù)獲得。目前,新興的TGS技術(shù)尚未用于相關(guān)研究,但憑借其優(yōu)勢,相信以后也可用于病毒宏基因組學的研究并帶來新的研究策略。
2.4 病毒準種研究
病毒準種(quasispecies)的概念由Eigen和Schuster于1977年提出,是指受到遺傳變異、競爭及環(huán)境選擇作用等影響而形成的高度相關(guān)但又不完全相同的變異株和重組基因組組成的動態(tài)種群[15]。HIV、HBV和HCV等病毒的聚合酶缺乏對新合成核苷酸鏈的修飾作用,使基因在復制過程中產(chǎn)生較高的錯配率。例如,HBV的錯配率為10-4/核苷酸,每天產(chǎn)生的錯配核苷酸有1010個[16]。目前準種研究主要采用克隆-測序技術(shù),該方法費時、費力,在克隆過程中會引入偏倚,限制了病毒異質(zhì)性的分析。此外,NGS技術(shù)在文庫構(gòu)建過程中也用到PCR擴增,導致測序結(jié)果出現(xiàn)插入和缺失的假陰性結(jié)果。TGS技術(shù)可省去擴增過程,避免引入人為錯誤,從而提高對病毒微變異株的檢出率。Bull等[17]等分別利用Illumina NGS平臺和PacBio TGS平臺對122例HCV感染患者進行HCV全長準種測序,結(jié)果發(fā)現(xiàn)雖然Illumina平臺測序深度高,易檢測多種基因型的共感染,但PacBio平臺平均擴增長度達9 kb,使檢測同一病毒株中的聯(lián)合變異成為可能。Huang等[18]利用Illumina Miseq平臺和PacBio RS Ⅱ平臺對人工構(gòu)建的HIV準種進行測序比較,結(jié)果發(fā)現(xiàn)PacBio可檢測頻率低至1%的變異,特別是聯(lián)合變異,能為臨床檢測耐藥突變提供更多信息。相信TGS技術(shù)憑借其明顯的優(yōu)勢,在病毒準種研究方面可彌補NGS技術(shù)的不足。
隨著人類對基因的研究越來越深入,對基因測序技術(shù)也提出了更高的要求。以PacBio SMRT為代表的TGS技術(shù)與NGS技術(shù)相比,最明顯的優(yōu)勢是彌補了后者讀長短的缺陷,但隨之帶來的是測序錯誤率較高和成本提升。若將TGS技術(shù)廣泛用于病毒變異研究,首先要提高該技術(shù)的準確率,并降低檢測成本,這樣才能更好地用于臨床上病毒感染性疾病的監(jiān)測,為臨床抗病毒治療提供相應(yīng)參考。
除目前已商品化的NGS和TGS技術(shù),基于電子傳導技術(shù)進行堿基檢測的第四代測序技術(shù)已日漸成熟。第四代測序技術(shù)與TGS技術(shù)相比,可避免洗脫和擴增過程中造成的誤差,且具有超長讀長、高通量和更短測序時間等特點[19]??傊?,不同的測序平臺有各自優(yōu)缺點,突飛猛進的測序技術(shù)可為臨床檢測提供更多的選擇,也極大促進了臨床醫(yī)學的進步。
[1] 張擁軍.高通量測序技術(shù)在臨床病毒學領(lǐng)域的應(yīng)用 [J].中國人獸共患病學報,2015,31(9):864-869, 875.
[2] Miyamoto M, Motooka D, Gotoh K, Imai T, Yoshitake K, Goto N, Iida T, Yasunaga T, Horii T, Arakawa K, Kasahara M, Nakamura S. Performance comparison of second- and third-generation sequencers using a bacterial genome with two chromosomes [J]. BMC Genomics, 2014, 15: 699. doi: 10.1186/1471-2164-15-699.
[3] Rhoads A, Au KF. PacBio sequencing and its applications [J]. Genomics Proteomics Bioinformatics, 2015, 13(5): 278-289.
[4] Eid J, Fehr A, Gray J, Luong K, Lyle J, Otto G, Peluso P, Rank D, Baybayan P, Bettman B, Bibillo A, Bjornson K, Chaudhuri B, Christians F, Cicero R, Clark S, Dalal R, Dewinter A, Dixon J, Foquet M, Gaertner A, Hardenbol P, Heiner C, Hester K, Holden D, Kearns G, Kong X, Kuse R, Lacroix Y, Lin S, Lundquist P, Ma C, Marks P, Maxham M, Murphy D, Park I, Pham T, Phillips M, Roy J, Sebra R, Shen G, Sorenson J, Tomaney A, Travers K, Trulson M, Vieceli J, Wegener J, Wu D, Yang A, Zaccarin D, Zhao P, Zhong F, Korlach J, Turner S. Real-time DNA sequencing from single polymerase molecules [J]. Science, 2009, 323(5910): 133-138.
[5] Schadt EE, Banerjee O, Fang G, Feng Z, Wong WH, Zhang X, Kislyuk A, Clark TA, Luong K, Keren-Paz A, Chess A, Kumar V, Chen-Plotkin A, Sondheimer N, Korlach J, Kasarskis A. Modeling kinetic rate variation in third generation DNA sequencing data to detect putative modifications to DNA bases [J]. Genome Res, 2013, 23(1): 129-141.
[6] 張欣欣, 王銘杰. 新一代測序技術(shù)在HBV變異研究中的應(yīng)用 [J]. 臨床肝膽病雜志, 2015, 31(4): 514-519.
[7] Tombácz D, Csabai Z, Oláh P, Havelda Z, Sharon D, Snyder M, Boldogk?i Z. Characterization of novel transcripts in pseudorabies virus [J]. Viruses, 2015, 7(5): 2727-2744.
[8] 龔玲, 張欣欣. 高通量測序技術(shù)在病毒感染性疾病研究中的應(yīng)用 [J]. 中華傳染病雜志, 2013, 31(3): 187-189.
[9] Bergfors A, Leenheer D, Bergqvist A, Ameur A, Lennerstrand J. Analysis of hepatitis C NS5A resistance associated polymorphisms using ultra deep single molecule real time (SMRT) sequencing [J]. Antiviral Res, 2016, 126: 81-89.
[10] Hüser D, Gogol-D?ring A, Chen W, Heilbronn R. Adeno-associated virus type 2 wild-type and vector-mediated genomic integration profiles of human diploid fibroblasts analyzed by third-generation PacBio DNA sequencing [J]. J Virol, 2014, 88(19): 11253-11263.
[11] 何彪, 涂長春. 病毒宏基因組學的研究現(xiàn)狀及應(yīng)用 [J]. 畜牧獸醫(yī)學報, 2012, 43(12): 1865-1870.
[12] Donaldson EF, Haskew AN, Gates JE, Huynh J, Moore CJ, Frieman MB. Metagenomic analysis of the viromes of three North American bat species: viral diversity among different bat species that share a common habitat [J]. J Virol, 2010, 84(24): 13004-13018.
[13] Greninger AL, Chen EC, Sittler T, Scheinerman A, Roubinian N, Yu G, Kim E, Pillai DR, Guyard C, Mazzulli T, Isa P, Arias CF, Hackett J, Schochetman G, Miller S, Tang P, Chiu CY. A metagenomic analysis of pandemic influenza A (2009 H1N1) infection in patients from North America [J]. PLoS One, 2010, 5(10): e13381.
[14] Willner D, Furlan M, Haynes M, Schmieder R, Angly FE, Silva J, Tammadoni S, Nosrat B, Conrad D, Rohwer F. Metagenomic analysis of respiratory tract DNA viral communities in cystic fibrosis and non-cystic fibrosis individuals [J]. PLoS One, 2009, 4(10): e7370.
[15] Domingo E, Gomez J. Quasispecies and its impact on viral hepatitis [J]. Virus Res, 2007, 127(2): 131-150.
[16] Dahari H, Shudo E, Ribeiro RM, Perelson AS. Modeling complex decay profiles of hepatitis B virus during antiviral therapy [J]. Hepatology, 2009, 49(1): 32-38.
[17] Bull RA, Eltahla AA, Rodrigo C, Koekkoek SM, Walker M, Pirozyan MR, Betz-Stablein B, Toepfer A, Laird M, Oh S, Heiner C, Maher L, Schinkel J, Lloyd AR, Luciani F. A method for near full-length amplification and sequencing for six hepatitis C virus genotypes [J]. BMC Genomics, 2016, 17: 247.
[18] Huang DW, Raley C, Jiang MK, Zheng X, Liang D, Rehman MT, Highbarger HC, Jiao X, Sherman B, Ma L, Chen X, Skelly T, Troyer J, Stephens R, Imamichi T, Pau A, Lempicki RA, Tran B, Nissley D, Lane HC, Dewar RL. Towards better precision medicine: PacBio single-molecule long reads resolve the interpretation of HIV drug resistant mutation profiles at explicit quasispecies (haplotype) level [J]. J Data Mining Genomics Proteomics, 2016, 7(1):182.doi: 10.4172/2153-0602.1000182.
[19] Ke R, Mignardi M, Hauling T, Nilsson M. Fourth generation of next-generation sequencing technologies: promise and consequences [J/OL]. Hum Mutat, 2016 [Epub ahead of print]. http://onlinelibrary.wiley.com/doi/10.1002/humu.23051/epdf.
. ZHANG Xinxin,E-mail: zhangxinxinrj@163.com
Characteristics of the third generation sequencing technology and its application in researching of viral genomes
YUAN Yi, WANG Mingjie, ZHANG Xinxin
ResearchUnitofClinicalVirology,RuijinHospital,ShanghaiJiaoTongUniversitySchoolofMedicine,Shanghai200025,China
With the consecutive innovation and application of gene sequencing technology, the third generation sequencing (TGS) based on single molecule real time (SMRT) sequencing technology has demonstrated a potential in a variety of applications in basic and clinical studies, including whole genome assembly, detection of gene structure variation, epigenetic research, etc. This review mainly introduces the principle, characteristics and applications of the TGS technology, especially its applications in virus researches. This review also compares the differences between the next generation sequencing (NGS) and TGS, so as to provide a reference for application based selection for sequencing technology.
Third generation sequencing; Pacific Biosciences; Single molecule real time sequencing; Viral genome
國家“十二五”科技重大專項(2012ZX10002007)
張欣欣
2016-06-13)