魏軍趙志軍
?述 評(píng)?
下一代測序技術(shù)在分子診斷中的應(yīng)用
魏軍★趙志軍
DNA測序是破譯人類疾病的一種強(qiáng)大技術(shù),尤其在癌癥方面。飛速發(fā)展的下一代測序(next-generation sequencing,NGS)極大降低了測序成本,并且實(shí)現(xiàn)了高通量,這使我們可以獲得整個(gè)基因組的序列,以及那些臨床上確診病人的全部基因組信息。然而下一代測序技術(shù)帶來諸多益處的同時(shí)也帶來了挑戰(zhàn),那就是怎樣使這個(gè)技術(shù)在臨床診斷中成為常規(guī)手段。本文就目前NGS的幾大技術(shù)平臺(tái)原理,在臨床診斷中的應(yīng)用,以及目前面臨的挑戰(zhàn)等進(jìn)行綜述。
下一代測序;基因組學(xué);分子診斷
近年來,下一代測序(next-generation sequencing,NGS)技術(shù)迅猛發(fā)展,它的高通量測序技術(shù),是對(duì)傳統(tǒng)測序技術(shù)的革命性變革[1]。現(xiàn)有的技術(shù)平臺(tái)主要包括Roche Applied Science[454 Genome Sequencer FLX GS(FLX)System],Illumina(Genome Analyzer),Applied Biosystems(SOLiD?)以及Helicos BioSciences(HeliScope? Single Molecule Sequencer)。雖然對(duì)基因組的測序曾今是一個(gè)巨大的工程,但是NGS的出現(xiàn)極大地降低了成本,縮短了時(shí)間,使得DNA測序成為許多實(shí)驗(yàn)的一種低成本選擇,也使得一些研究者敢于做一些以前受技術(shù)限制和經(jīng)費(fèi)限制的實(shí)驗(yàn),例如臨床診斷方面。
在過去的30年,人類遺傳學(xué)上最偉大的研究之一莫過于Sanger測序,并且成為了迄今為止DNA測序的主流方法。但是科學(xué)的發(fā)展使得傳統(tǒng)的Sanger測序已經(jīng)不能完全滿足研究的需要,對(duì)模式生物進(jìn)行基因組重測序以及對(duì)一些非模式生物的基因組測序,都需要費(fèi)用更低、通量更高、速度更快的測序技術(shù)。為了克服Sanger測序的瓶頸,NGS做了很多技術(shù)上的突破,包括文庫的構(gòu)建、錨定橋接、預(yù)擴(kuò)增等等,使得上百萬的測序反應(yīng)同時(shí)發(fā)生在一個(gè)反應(yīng)里[2]。與第一代測序Sanger技術(shù)不同的是,NGS技術(shù)可以通過反復(fù)測序同一區(qū)域的DNA片段以達(dá)到很高的靈敏度和準(zhǔn)確度,同時(shí)高通量、自動(dòng)化,能在很短的時(shí)間內(nèi)完成對(duì)上百億堿基的測序,實(shí)現(xiàn)極短時(shí)間內(nèi)對(duì)人類轉(zhuǎn)錄組和基因組進(jìn)行細(xì)致的研究。
2005年到現(xiàn)在,NGS作為一個(gè)高通量技術(shù),它的快速發(fā)展打開了許多新的研究領(lǐng)域以及應(yīng)用方向[3]。醫(yī)學(xué)領(lǐng)域中與NGS相關(guān)的文獻(xiàn)也是飛速增長,NGS在醫(yī)學(xué)領(lǐng)域中顯示出了巨大的應(yīng)用價(jià)值[4],前進(jìn)中的NGS技術(shù)將會(huì)不斷的向減少成本、工作流程的簡易化的方向發(fā)展[5,6],而且將會(huì)越來越走向臨床診斷和個(gè)性化用藥的領(lǐng)域[7]。這篇文章中我們討論NGS對(duì)臨床診斷帶來的應(yīng)用和沖擊。
下一代測序技術(shù)的核心思想是邊合成邊測序(Sequencing by Synthesis),即通過捕捉新合成的末端的標(biāo)記來確定DNA的序列,現(xiàn)有的技術(shù)平臺(tái)主要包括Roche/454 GS FLX、Illumina/Solexa Genome Analyzer、Helicos BioSciences公司的HeliScope?Single Molecule Sequencer;以 及 連 接 法 測 序(Sequencing by Ligation),即通過引物來定位核酸信息,技術(shù)平臺(tái)有Applied Biosystems/SOLiD? system。
1.1 羅氏公司(Roche)的454測序儀測序原理
454公司首先將焦磷酸測序(pyrosequencing)應(yīng)用在測序技術(shù)上,之后便被羅氏診斷公司收購,形成了目前的Roche 454 GS FLX測序系統(tǒng)。其測序過程大致是,待測DNA樣品被打斷成300~800 bp的片段,然后3'和5'端分別加上接頭,這些接頭會(huì)使DNA片段結(jié)合到微珠上。測序PCR反應(yīng)就發(fā)生在固相的微珠上,并且整個(gè)PCR反應(yīng)和相關(guān)的酶被油包水的液滴包裹,每個(gè)油滴系統(tǒng)只包含1個(gè)DNA模板,進(jìn)行獨(dú)立的PCR擴(kuò)增。擴(kuò)增后,每個(gè)DNA分子可以得到富集,每個(gè)微珠只能形成一個(gè)克隆集落。454測序儀的測序通道體積非常狹小,只能容納一個(gè)微珠。測序過程中,GS FLX系統(tǒng)會(huì)將引物上dNTP的聚合與熒光信號(hào)釋放偶聯(lián)起來,通過檢測熒光信號(hào),就可以達(dá)到DNA測序的目的。相對(duì)于Sanger測序、Solexa和Solid測序而言,454測序儀可以提供中等的讀長和適中的價(jià)格,適合de novo測序、轉(zhuǎn)錄組測序、宏基因組研究等。
1.2 Illumina公司的Solexa基因組分析儀測序原理
Solexa測序其核心技術(shù)是DNA簇(DNA cluster)和可逆終止化學(xué)反應(yīng)(reversible terminator)。這種高通量測序芯片表面連接有一層單鏈引物,兩端連接測序接頭的單鏈DNA片段通過與芯片表面的引物堿基互補(bǔ)結(jié)合,引物擴(kuò)增成為雙鏈后,使雙鏈變性為單鏈,該單鏈DNA的一端就被固定在芯片上,而另一端隨機(jī)和附近的另外一個(gè)引物互補(bǔ),也被固定住,形成“橋”(bridge)。經(jīng)過反復(fù)30輪擴(kuò)增后,每個(gè)單分子得到約1 000倍擴(kuò)增,成為單克隆DNA簇。然后加入經(jīng)過改造的DNA聚合酶和帶有4種熒光標(biāo)記的dNTP。這些核苷酸是“可逆終止子”,其3'羥基末端帶有可化學(xué)切割的部分,每個(gè)循環(huán)只允許摻入單個(gè)堿基。去除其他多余的dNTP后,用激光掃描反應(yīng)板表面,讀取每條模板序列第一輪反應(yīng)所聚合上去的核苷酸種類。隨后將這些基因化學(xué)切割,恢復(fù)3'端粘性,繼續(xù)聚合第二個(gè)核苷酸。如此循環(huán),直到每條模板序列都完全被聚合為雙鏈。統(tǒng)計(jì)每輪收集到的熒光信號(hào),就可得知模板DNA片段的序列。Solexa的讀長在100~150 bp之間,適合小RNA鑒定、甲基化和表觀遺傳學(xué)研究。
1.3 Applied Biosystems(ABI)的SOLiD測序儀測序原理
美國ABI公司于2007年底推出了SOLiD第二代測序平臺(tái),2010年末又發(fā)布了最新產(chǎn)品SOLiD 5500xl測序平臺(tái)。從SOLiD到如今的SOLiD 5500xl,短短3年時(shí)間,連升5級(jí),發(fā)展速度驚人。SOLiD全稱為Sequencing by Oligonucleotide Ligation and Detection,它以4色熒光標(biāo)記寡核苷酸的連續(xù)連接反應(yīng)為基礎(chǔ),而沒有采用傳統(tǒng)的邊合成邊測序技術(shù)。連接反應(yīng)沒有DNA聚合酶合成過程中常有的錯(cuò)配問題,而SOLiD特有的“雙色球編碼技術(shù)”又提供了一個(gè)糾錯(cuò)機(jī)制,這種設(shè)計(jì)上的優(yōu)勢使得SOLiD在系統(tǒng)準(zhǔn)確性上大大領(lǐng)先于其他平臺(tái)。測序之前,DNA模板進(jìn)行乳化PCR擴(kuò)增,和Roche 454 GS FLX的過程基本相同,只是SOLiD的微珠更小,只有1μm。3'端修飾的微珠可以沉淀在玻片上。連接測序所用的底物是8個(gè)堿基熒光探針混合物,根據(jù)序列的位置,樣品DNA就可以被探針標(biāo)記。DNA連接酶優(yōu)先連接和模板配對(duì)的探針,并引發(fā)該位點(diǎn)熒光信號(hào)的產(chǎn)生。測序反應(yīng)完成后,可通過位置的顏色信息推斷出相應(yīng)的堿基序列。SOLiD的讀長(read)只有50~75 bp,精確度可達(dá)Q40,適于基因組重測序和SNP檢測。
1.4 Helicos BioSciences公司的單分子測序儀(Single Molecule Sequencer)測序原理
美國生命科學(xué)技術(shù)公司2010年開發(fā)的單分子測序技術(shù)號(hào)稱第三代測序技術(shù),它的技術(shù)原理是模擬DNA自然復(fù)制狀態(tài)下的邊合成邊測序,其3'端磷酸鍵堿基熒光標(biāo)記技術(shù)專利使得它可以超長讀長。測序時(shí),先將DNA打斷成大片段(3~10 kb),然后把片段粘末端變成平端,兩端分別連接環(huán)狀單鏈:單鏈兩端分別與雙鏈正負(fù)鏈連接上,得到一個(gè)類似啞鈴(“套馬環(huán)”)的結(jié)構(gòu),稱為SMRT Bell。當(dāng)引物與模板的單鏈環(huán)部位退火后,這個(gè)雙鏈部位就可以結(jié)合到已固定在ZWM底部的聚合酶上。一旦向反應(yīng)中加入正常的離子,DNA聚合反應(yīng)開始。模板雙鏈打開成環(huán)形,先合成正鏈,單鏈區(qū),跟著合成負(fù)鏈。聚合酶每合成一圈,對(duì)于定向目標(biāo)序列,就相當(dāng)于2×覆蓋度。合成過程中,每次進(jìn)入一個(gè)堿基,原始數(shù)據(jù)會(huì)實(shí)時(shí)地產(chǎn)生一個(gè)脈沖峰,每兩個(gè)相鄰的脈沖峰之間有一定的距離,也就是有一個(gè)時(shí)間段的概念。這種時(shí)間段的差距可以顯著地區(qū)分堿基的修飾狀態(tài)。因此,它也被稱作實(shí)時(shí)的測序,一能提供測序結(jié)果,即堿基的排列組合,二是可以提供基因修飾的信息。
單分子測序平臺(tái)很適合困難基因組的測序,比如GC含量很高、AT含量很高、多堿基串聯(lián)重復(fù)(如CGG重復(fù)),普通測序技術(shù)很難獲得結(jié)果。這個(gè)平臺(tái)對(duì)這類很難測序的區(qū)域都能平穩(wěn)的測序。單分子測序結(jié)果顯示這種技術(shù)覆蓋度不隨GC含量變化而變化,曲線平穩(wěn)。而且因?yàn)樽x長的優(yōu)勢,單核酸分子的測序能夠檢測到低頻率(低至1%)罕見突變[10]。
1.5 不同測序技術(shù)平臺(tái)的優(yōu)點(diǎn)
這些技術(shù)平臺(tái)各有優(yōu)點(diǎn)。454 GS FLX的測序片段比較長,高質(zhì)量的讀長能達(dá)到400 bp;Solexa測序性價(jià)比最高,不僅機(jī)器的售價(jià)比454 GS FLX和SOLiD低,而且運(yùn)行成本也低,在數(shù)據(jù)量相同的情況下,成本只有454測序的1/10;SOLiD測序的準(zhǔn)確度高,原始?jí)A基數(shù)據(jù)的準(zhǔn)確度大于99.94%,而在15×覆蓋率時(shí)的準(zhǔn)確度可以達(dá)到99.999%,是目前下一代測序技術(shù)中準(zhǔn)確度最高的;HeliScope單分子測序可以忽略模板的復(fù)雜性,實(shí)現(xiàn)堿基修飾的檢測,為第三代測序拉開了篇章。
NGS技術(shù)已經(jīng)被廣泛應(yīng)用于多個(gè)領(lǐng)域,包括細(xì)菌和病毒基因組的測序[11,12],通過全基因組重測序或目標(biāo)基因測序來尋找遺傳性突變[13],通過基因表達(dá)變化來[14]理解遺傳機(jī)制、細(xì)胞表型特征,RNA測序(RNA sequencing, RNA-seq)[15],染色體免疫共沉淀測序(ChIP-Seq)[16]等,這些應(yīng)用均已被報(bào)道[17,18]。這里我們集中于綜述在人類疾病臨床診斷中最新的NGS技術(shù)。
2.1 腫瘤基因組測序
腫瘤的形成實(shí)際上是基因組改變的一種疾病。腫瘤的發(fā)生發(fā)展是個(gè)復(fù)雜的過程,DNA、RNA和表觀修飾水平上腫瘤基因發(fā)生的改變在腫瘤的發(fā)生和發(fā)展中起著重要的作用[19]。大多數(shù)腫瘤患者都是經(jīng)過正常體細(xì)胞突變長期積累形成單個(gè)癌細(xì)胞,然后經(jīng)過多級(jí)加工,使基因序列、拷貝數(shù)等發(fā)生變化,最終導(dǎo)致腫瘤的形成。因此,所有遺傳事件都可能間接或直接導(dǎo)致腫瘤的發(fā)展,這也修訂了我們對(duì)人類腫瘤的理解,以及加速臨床診斷新方法的發(fā)現(xiàn)。
對(duì)腫瘤進(jìn)行全面、系統(tǒng)的分析,是實(shí)現(xiàn)腫瘤分子分型和個(gè)體化治療的基礎(chǔ)。個(gè)體化治療體現(xiàn)在病人腫瘤基因組的特定突變[20,21]。因此,通過NGS獲得特定的腫瘤相關(guān)基因序列信息是臨床診斷的關(guān)鍵所在。另外,隨著相關(guān)腫瘤分子診斷項(xiàng)目的推出,接下來努力的方向就是不斷更新和尋找腫瘤基因以及腫瘤基因組的突變位點(diǎn)。在2003年HGP(Human genome project)未完成之前這個(gè)工作是受到限制的,缺少正常人類基因組的序列圖譜、有限的分辨技術(shù)等等。隨著人類基因組圖譜繪制的完成,NGS帶來的高通量的的測序數(shù)據(jù),使得研究者可以更加深入的探討腫瘤基因組學(xué)。
盡管對(duì)癌癥基因組學(xué)的完整測序還比較昂貴,但是它的影響力是增加的[22,23]。在過去幾年發(fā)現(xiàn)的人類腫瘤基因突變的基礎(chǔ)上,用NGS去探索新的突變位點(diǎn)以及個(gè)體突變已經(jīng)步入臨床時(shí)代。例如,Pleasance等[23]通過對(duì)惡性黑色素瘤(Malignant Melanoma )的測序發(fā)現(xiàn)了33 345個(gè)堿基置換,680個(gè)缺失,303個(gè)插入,51個(gè)基因重排;Lee[22]通過原發(fā)性肺癌和正常癌旁組織的測序比較發(fā)現(xiàn)了50 000個(gè)SNP;Shah等[24]通過對(duì)乳腺癌測序與正?;蚪M做比較發(fā)現(xiàn)了32個(gè)同義編碼突變,這些都為相關(guān)腫瘤的形成機(jī)制研究奠定了基礎(chǔ),同時(shí)研究人員首次報(bào)道了21種乳腺癌基因組測序結(jié)果,并從中分析癌癥在發(fā)生發(fā)展過程中出現(xiàn)的突變,解析了乳腺癌通過突變發(fā)生發(fā)展的全過程[25,26]。這些前人的實(shí)驗(yàn)已經(jīng)證實(shí)NGS在追蹤DNA損傷、突變、修復(fù)等過程中顯示出強(qiáng)大的能力,可以完成對(duì)整個(gè)基因組系統(tǒng)的分析,這些研究的發(fā)現(xiàn)將會(huì)改變我們對(duì)腫瘤的發(fā)生發(fā)展的認(rèn)知,最終會(huì)成為腫瘤診斷、預(yù)后、治療的基礎(chǔ)。
2.2 外顯子測序
所有基因的蛋白編碼區(qū)稱之為全部外顯子,這些只占人類基因組的1%~2%,然而卻涵蓋了與個(gè)體表型相關(guān)的大部分功能項(xiàng)變異。外顯子測序技術(shù)能夠更快的確定致病基因及突變位點(diǎn),有助于加速篩選發(fā)現(xiàn)單基因疾病、癌癥等復(fù)雜疾病的致病基因和易感基因等[27]?;谄胀ㄈ祟惣膊〉难芯炕A(chǔ),結(jié)合NGS和DNA片段捕獲技術(shù)選擇性的對(duì)蛋白編碼區(qū)進(jìn)行測序,采用數(shù)字基因表達(dá)譜的信息分析手段,不僅能降低成本而且便于更高效率的去發(fā)現(xiàn)新的突變位點(diǎn)。
外顯子測序已經(jīng)有了許多臨床診斷實(shí)例,而且這種方法的臨床診斷實(shí)用性已經(jīng)被越來越多的研究證實(shí)。例如,美國耶魯大學(xué)一個(gè)研究小組發(fā)現(xiàn)幾種不同的大腦發(fā)育異常病癥是由同一個(gè)單基因WDR62的突變引起。研究者利用一種新的基因掃描技術(shù)——全外顯子組測序(whole exome sequencing)技術(shù)發(fā)現(xiàn)了該基因突變。該研究證實(shí)了全外顯子組測序技術(shù)是篩查遺傳病病因的一個(gè)強(qiáng)有力的新工具[28]。在黑色素瘤的研究中,Berger等[29]使用RNA-Seq技術(shù)鑒定腫瘤相關(guān)轉(zhuǎn)錄本,發(fā)現(xiàn)了11個(gè)異常的黑色素瘤基因和12個(gè)通讀的轉(zhuǎn)錄本。Lo等[30]發(fā)現(xiàn)巴特爾綜合征(Bartter syndrome)是由SCI12A3基因的錯(cuò)義突變造成的,經(jīng)過鑒定,這可以作為一個(gè)診斷的基因標(biāo)記。Chapman等[31]人使用全基因組和全外顯子組測序的組合,利用Illumina的Genome Analyzer II測序儀比較38位多發(fā)性骨髓瘤患者和幾位健康個(gè)體的基因組,他們通過外顯子組測序研究了近165 000個(gè)外顯子,分析了大約16 500個(gè)基因,還利用全基因組測序鑒定出蛋白編碼區(qū)的轉(zhuǎn)位。這種互補(bǔ)的方法既鑒定出單個(gè)核苷酸變異,又找到了橫跨編碼區(qū)和非編碼區(qū)的大缺陷,發(fā)現(xiàn)了DIS3突變、FAM46C的突變、BRAF基因突變。這些都說明NGS可以鑒定出一些對(duì)疾病很關(guān)鍵的新基因,發(fā)現(xiàn)新機(jī)制。
2.3 血清/血漿DNA的測定
血液循環(huán)中存在的游離DNA,在疾病狀態(tài)下,可作為一些疾病的診斷標(biāo)志,例如糖尿病、癌癥、心肌梗死等等[32],檢測這些游離的DNA對(duì)這些疾病的早期診斷非常重要。在臨床腫瘤學(xué)和產(chǎn)前診斷的研究領(lǐng)域,血循環(huán)的游離核酸鑒定也顯得尤為重要。傳統(tǒng)的克隆和DNA測序只發(fā)現(xiàn)了很少的一部分基因,以及對(duì)它進(jìn)行染色體的定位。NGS的出現(xiàn)對(duì)于檢測定量血循環(huán)中的核苷酸提供了一個(gè)方法。例如在最近的報(bào)告中[33,34],采用Illumina Genome Analyzer平臺(tái)檢測孕婦血漿DNA分子,結(jié)果顯示,如果這個(gè)孕婦染色體發(fā)生了非整倍體的變化,那么21號(hào)染色體上的基因在母源的血漿中比較多。這是針對(duì)染色體異常產(chǎn)前診斷的一個(gè)很好的基礎(chǔ)。盡管NGS在非入侵型產(chǎn)前診斷中的應(yīng)用仍然存在很多問題和限制[35],但是我們相信在未來的歲月,NGS一定會(huì)在非入侵型產(chǎn)前診斷中體現(xiàn)它的價(jià)值。
2.4 RNA測序
采用芯片技術(shù)發(fā)現(xiàn)RNA的表達(dá)可以作為診斷和預(yù)后的生物標(biāo)記物[36,37]。在相同的選擇標(biāo)準(zhǔn)下,RNA-seq相比于芯片技術(shù)可以檢測出更多的顯著差異表達(dá)的基因。這可能由很多因素造成,例如RNA-seq和芯片技術(shù)在檢測手段、序列長度、以及芯片歸一的算法等等上的不同所致。NGS針對(duì)RNA/cDNA直接測序提供了一個(gè)轉(zhuǎn)錄本的高通量分析方法[17],RNA-Seq可以提供精確的檢測數(shù)據(jù)[38],它相比于第一代測序和芯片技術(shù),擁有更高的分辨率,提高了轉(zhuǎn)錄本的發(fā)現(xiàn)水平,更加清晰的明確了等位基因的差別表達(dá),選擇性的剪接機(jī)制等[39]。最新的研究結(jié)果顯示RNA的調(diào)節(jié)和表達(dá)有更為復(fù)雜性的機(jī)制[40,41]。這些發(fā)現(xiàn)都擴(kuò)展了我們原來的觀點(diǎn),認(rèn)知到基因表達(dá)的復(fù)雜性[42],提高我們對(duì)于真核生物和原核生物基因組RNA調(diào)節(jié)及其機(jī)制的理解。
3.1 NGS的數(shù)據(jù)處理
NGS技術(shù)與傳統(tǒng)的Sanger測序相比較,盡管它的高通量減少了成本,但是讀取準(zhǔn)確性以及片段的長度都不及Sanger測序,這些不足都可以通過測序的覆蓋率和生物信息學(xué)的方法來克服。但在分子診斷應(yīng)用中,NGS仍必須認(rèn)識(shí)到其存在的諸多局限性,包括克服處理大量信息的障礙,開發(fā)檢查測序質(zhì)量的工具,指導(dǎo)序列的拼裝的標(biāo)準(zhǔn),生物學(xué)上的解釋和數(shù)據(jù)的引用參考等等。
NGS實(shí)驗(yàn)會(huì)產(chǎn)生海量的短片段的讀長,稱之為“Reads”,這些海量的“Reads”經(jīng)過3個(gè)階段的分析就可以用于診斷生物標(biāo)記物。第一個(gè)階段是這些海量的基本讀長被各自測序系統(tǒng)所帶的儀器自動(dòng)化的基本質(zhì)量應(yīng)用程序進(jìn)行淘汰過濾,然后按照重復(fù)序列進(jìn)行拼接,組裝成contig,經(jīng)過篩選,合格的contig進(jìn)入第二個(gè)階段。這些過了關(guān)的contig進(jìn)行基因組的組裝,或者是從頭開始的組裝,或者是參考完整的基因組、轉(zhuǎn)錄本、外顯子進(jìn)行組裝。最后一個(gè)階段則根據(jù)這些組裝好的序列去理解許多人類疾病潛在的遺傳機(jī)制,分析的基本方法有CNV,SNP,新的轉(zhuǎn)錄本,剪接變異,探測基因的功能和轉(zhuǎn)錄因子,甲基化修飾和組蛋白修飾等。在這個(gè)階段中應(yīng)用到了相當(dāng)數(shù)量的生物信息軟件,然而這些分析并沒有一個(gè)統(tǒng)一的流程,因?yàn)闆]有標(biāo)準(zhǔn),這些NGS數(shù)據(jù)可能會(huì)由于通過不同的方法得到不同的結(jié)果,因此,在臨床分子診斷中NGS必須面對(duì)這一問題。
3.2 個(gè)體基因的臨床有效性
伴隨著基因組測序成本的顯著下滑,使得越來越多的個(gè)體基因組的測序成為可能,然而,立刻出現(xiàn)的問題是怎樣有效地把整個(gè)基因組的龐大信息整合到臨床有用的信息中,包括診斷和個(gè)體化治療。一些來自斯坦福大學(xué)的研究員[43],以Helicos BioSciences單分子測序平臺(tái)進(jìn)行測序,整合了一位名叫Stephen R Quake的研究對(duì)象的完整的基因組。經(jīng)過醫(yī)學(xué)鑒定,Quake有血管疾病和猝死的家族遺傳史。研究者查詢了疾病特定的突變數(shù)據(jù)、藥物基因組學(xué)數(shù)據(jù),通過鑒定基因和突變對(duì)于已知的疾病和藥物反應(yīng)的關(guān)系,分析出了2 600 000個(gè)SNP,和752個(gè)拷貝數(shù)的變化,證明正是這些變化增加了梗死、II型糖尿病和一些癌癥的風(fēng)險(xiǎn),特別是TMEM43基因表現(xiàn)出了和臨床心臟梗死的高相關(guān)性,以及CYP2C19基因存在的SNP可能和氯吡格雷的耐藥性有關(guān)[44]。盡管許多不明確的重要的變異被發(fā)現(xiàn)出來,但是許多突變特點(diǎn)仍然保持著臨床診斷的應(yīng)用基礎(chǔ)。Bainbridge等[45]通過SOLiD測序平臺(tái),對(duì)Alexis以及她的孿生兄弟Noah進(jìn)行基因組測序從而確定引起這對(duì)患有多巴反應(yīng)性肌張力障礙(Dopa-Responsive Dystonia)疾病的SPR突變,并幫助制定了有效的治療策略。當(dāng)關(guān)于疾病的特殊突變、藥物基因組學(xué)變的越來越全面的時(shí)候,整個(gè)基因組的測序相比于傳統(tǒng)的診斷方法就顯得尤為重要。例如,Gerlinger等[46]通過全基因組測序研究依維莫司片(everolimus)對(duì)其中一位轉(zhuǎn)移性膀胱癌的女性患者有效而其他患者無效的原因,發(fā)現(xiàn)了兩個(gè)藥物靶點(diǎn),即細(xì)胞生長一種作用蛋白mTORC1途徑中的基因突變:NF2和TSC1。這些研究開拓了我們對(duì)腫瘤藥物研究的新方法。
3.3 NGS技術(shù)臨床診斷的局限性及其發(fā)展方向
目前,NGS技術(shù)還存在著單堿基的誤差,因?yàn)檫@個(gè)技術(shù)的測序來自于DNA片段,牽扯到測序文庫的構(gòu)建,邊合成邊測序以及短片段的拼接,可能會(huì)造成假陽性率的出現(xiàn)。因此,在沒有傳統(tǒng)診斷的支持下NGS技術(shù)獲得的信息不能直接應(yīng)用于分子診斷。但是NGS技術(shù)還沒有發(fā)揮出全部的潛力,仍然處于快速發(fā)展的浪潮中。伴隨著技術(shù)的不斷改良,成本的進(jìn)一步減少,技術(shù)的局限性也將會(huì)逐漸被攻克。或許在很多年之后NGS技術(shù)會(huì)變成一個(gè)通用的臨床診斷技術(shù)。但是就目前來看,從NGS技術(shù)獲得的信息毫無疑問擴(kuò)展了我們對(duì)許多人類疾病的新的理解,引導(dǎo)研究者去開發(fā)新的臨床診斷工具,以及發(fā)現(xiàn)針對(duì)某個(gè)疾病關(guān)鍵基因的靶向新型藥物。
NGS顯著的促進(jìn)了多樣性的研究領(lǐng)域,以前許多技術(shù)條件達(dá)不到的領(lǐng)域現(xiàn)在也能開展研究。新穎的領(lǐng)域表現(xiàn)在普通生物學(xué)、生命科學(xué),以及醫(yī)學(xué)上的應(yīng)用。通過簡單樣品的準(zhǔn)備就能夠提供SNP的分辨,使得NGS技術(shù)在分子診斷中滿足了敏感性高和特異性高的需求。經(jīng)過早期的研究和發(fā)展,NGS技術(shù)在臨床診斷中主要集中在基因組信息,相關(guān)基因定量以及高敏感性檢測中。
相信在不久的將來,NGS技術(shù)將會(huì)和預(yù)料的一樣進(jìn)入一個(gè)較為廣闊的應(yīng)用范圍,包括疾病病原學(xué)、藥物基因組學(xué)、分子診斷、個(gè)性化用藥以及營養(yǎng)學(xué)。基因分析是個(gè)體化醫(yī)療的前提,基因測序技術(shù)的發(fā)展在驅(qū)動(dòng)著個(gè)體化醫(yī)療的進(jìn)程。等到測序技術(shù)成本的進(jìn)一步減少,數(shù)據(jù)的精確度進(jìn)一步增加,以及以計(jì)算機(jī)為基礎(chǔ)的數(shù)據(jù)獲得、處理、確認(rèn)、分析,生物/臨床的相關(guān)解釋的成熟化和應(yīng)用化,NGS技術(shù)將會(huì)顯現(xiàn)出無可比擬的優(yōu)越性。
[1] Metzker M L. Sequencing technologies-the next generation[J]. Nat Rev Genet, 2010, 11(1): 31-46.
[2] Wheeler D A, Srinivasan M, Egholm M, et al. The complete genome of an individual by massively parallel DNA sequencing[J]. Nature, 2008, 452(7189): 872-876.
[3] Jacquier A. The complex eukaryotic transcriptome: unexpected pervasive transcription and novel small RNAs[J]. Nat Rev Genet, 2009, 10(12): 833-844.
[4] ten Bosch J R, Grody W W. Keeping up with the next generation: massively parallel sequencing in clinical diagnostics[J]. J Mol diagn, 2008, 10(6): 484-492.
[5] Walter M J, Graubert T A, DiPersio J F, et al. Next-generation sequencing of cancer genomes: back to the future[J]. Per Med, 2009, 6(6): 653-662.
[6] Aparicio S A, Huntsman D G. Does massively parallel DNA resequencing signify the end of histopathology as we know it[J]. J Pathol, 2010, 220(2): 307-315.
[7] Kingsmore S F, Saunders C J. Deep sequencing of patient genomes for disease diagnosis: when will it become routine[J]. Sci Transl Med, 2011, 3(87): 87ps23.
[8] Oostra B A, Willemsen R. FMR1: a gene with three faces[J]. Biochim Biophys Acta, 2009, 1790 (6): 467-477.
[9] Eid J, Fehr A, Gray J, et al. Real-time DNA sequencing from single polymerase molecules[J]. Science, 2009, 323(5910): 133-138.
[10] Smith C C, Wang Q, Chin C S, et al. Validation of ITD mutations in FLT3 as a therapeutic target in human acute myeloid leukaemia[J]. Nature, 2012, 485(7397): 260-263.
[11] Harris T D, Buzby P R, Babcock H, et al. Single-molecule DNA sequencing of a viral genome[J]. Science, 2008, 320(5872): 106-109.
[12] Chaisson M J, Pevzner P A. Short read fragment assembly of bacterial genomes[J]. Genome research, 2008, 18(2): 324-330.
[13] Yi X, Liang Y, Huerta-Sanchez E, et al. Sequencing of 50 human exomes reveals adaptation to high altitude[J]. Science, 2010, 329(5987): 75-78.
[14] Pickrell J K, Marioni J C, Pai A A, et al. Understanding mechanisms underlying human gene expression variation with RNA sequencing[J]. Nature, 2010, 464(7289): 768-772.
[15] Hiller D, Jiang H, Xu W, et al. Identifiability of isoform deconvolution from junction arrays and RNA-Seq[J]. Bioinformatics, 2009, 25(23): 3056-3059.
[16] Kharchenko P V, Tolstorukov M Y, Park P J. Design and analysis of ChIP-seq experiments for DNA-binding proteins[J]. Nat Biotechnol, 2008, 26(12): 1351-1359.
[17] Wang Z, Gerstein M, Snyder M. RNA-Seq: a revolutionary tool for transcriptomics[J]. Nat Rev Genet, 2009, 10(1): 57-63.
[18] Park P J. ChIP-seq: advantages and challenges of a maturing technology[J]. Nat Rev Genet, 2009, 10(10): 669-680.
[19] Ledford H. Big science: the cancer genome challenge[J]. Nature, 2010, 464(7291): 972-974.
[20] Gambacorti-Passerini C. Part I: Milestones in personalised medicine-imatinib[J]. Lancet Oncol, 2008, 9(6): 600.
[21] Gelmon K. Part II: Milestones in personalised medicinetrastuzumab[J]. Lancet Oncol, 2008, 9(7): 698.
[22] Lee W, Jiang Z, Liu J, et al. The mutation spectrum revealed by paired genome sequences from a lung cancer patient[J]. Nature, 2010, 465(7297): 473-477.
[23] Pleasance E D, Cheetham R K, Stephens P J, et al. A comprehensive catalogue of somatic mutations from a human cancer genome[J]. Nature, 2010, 463(7278): 191-196.
[24] Shah S P, Morin R D, Khattra J, et al. Mutational evolution in a lobular breast tumour profiled at single nucleotide resolution[J]. Nature, 2009, 461(7265): 809-813.
[25] Nik-Zainal S, Van Loo P, Wedge D C, et al. The life history of 21 breast cancers[J]. Cell, 2012, 149(5): 994-1007.
[26] Nik-Zainal S, Alexandrov L B, Wedge D C, et al. Mutational processes molding the genomes of 21 breast cancers[J]. Cell, 2012, 149(5): 979-993.
[27] Choi M, Scholl U I, Ji W, et al. Genetic diagnosis by whole exome capture and massively parallel DNA sequencing[J]. Proc Nat Acad Sci U S A, 2009, 106(45): 19096-19101.
[28] Bilgüvar K, Oztürk A K, Louvi A, et al. Whole-exome sequencing identi fi es recessive WDR62 mutations in severe brain malformations[J]. Nature, 2010, 467(7312): 207-210.
[29] Berger M F, Levin J Z, Vijayendran K, et al. Integrative analysis of the melanoma transcriptome[J]. Genome Res, 2010, 20(4): 413-427.
[30] Lo Y M, Chiu R W. Next-generation sequencing of plasma/ serum DNA: an emerging research and molecular diagnostic tool[J]. Clin Chem, 2009, 55(4): 607-608.
[31] Chapman M A, Lawrence M S, Keats J J, et al. Initial genome sequencing and analysis of multiple myeloma[J]. Nature, 2011, 471(7339): 467-472.
[32] Dennis Lo Y M, Chiu R W. Prenatal diagnosis: progress through plasma nucleic acids[J]. Nat Rev Genet, 2007, 8(1): 71-77.
[33] Chiu R W, Chan K C, Gao Y, et al. Noninvasive prenatal diagnosis of fetal chromosomal aneuploidy by massively parallel genomic sequencing of DNA in maternal plasma[J]. Proc Natl Acad Sci U S A, 2008, 105(51): 20458-20463.
[34] Fan H C, Blumenfeld Y J, Chitkara U, et al. Noninvasive diagnosis of fetal aneuploidy by shotgun sequencing DNA from maternal blood[J]. Proc Natl Acad Sci U S A, 2008, 105(42): 16266-16271.
[35] Voelkerding K V, Lyon E. Digital fetal aneuploidy diagnosis by next-generation sequencing[J]. Clin Chem, 2010, 56(3): 336-338.
[36] MAQC Consortium, Shi L, Reid L H, et al. The MicroArray Quality Control (MAQC) project shows inter-and intraplatform reproducibility of gene expression measurements[J]. Nat Biotechnol, 2006, 24(9): 1151-1161.
[37] Shi L, Campbell G, Jones W D, et al. The Microarray quality control (MAQC)-II study of common practices for the development and validation of microarray-based predictive models[J]. Nat Biotechnol, 2010, 28(8): 827-838.
[38] Li B, Ruotti V, Stewart R M, et al. RNA-Seq gene expression estimation with read mapping uncertainty[J]. Bioinformatics, 2010, 26(4): 493-500.
[39] Hittinger C T, Johnston M, Tossberg J T, et al. Leveraging skewed transcript abundance by RNA-Seq to increase the genomic depth of the tree of life[J]. Proc Natl Acad Sci U S A, 2010, 107(4): 1476-1481.
[40] Guttman M, Garber M, French C, et al. Chromatin signature reveals over a thousand highly conserved large non-coding RNAs in mammals[J]. Nature, 2009, 458(7235): 223-227.
[41] Li J B, Levanon E Y, Yoon J K, et al. Genome-wide identification of human RNA editing sites by parallel DNA capturing and sequencing[J]. Science, 2009, 324(5931): 1210-1213.
[42] Licatalosi D D, Darnell R B. RNA processing and its regulation: global insights into biological networks[J]. Nat Rev Genet, 2010, 11(1): 75-87.
[43] Pushkarev D, Neff N F, Quake S R. Single-molecule sequencing of an individual human genome[J]. Nat Biotechnol, 2009, 27(9): 847-850.
[44] Ashley E A, Butte A J, Wheeler M T, et al. Clinical assessment incorporating a personal genome[J]. Lancet, 2010, 375(9725): 1525-1535.
[45] Bainbridge M N, Wiszniewski W, Murdock D R, et al. Whole-genome sequencing for optimized patient management[J]. Sci Transl Med, 2011, 3(87): 87re83.
[46] Gerlinger M, Rowan A J, Horswell S, et al. Intratumor heterogeneity and branched evolution revealed by multiregion sequencing[J]. N Engl J Med, 2012, 366(10): 883-892.
Application of next-generation sequencing technologies in molecular diagnostics
WEI Jun★, ZHAO Zhijun
(Laboratory Medicine Center, General Hospital of Ningxia Medical University, Ningxia, Yinchuan 750004)
DNA sequencing is a powerful approach for decoding human diseases, including cancers. The rapid development of next-generation sequencing (NGS) greatly reduce the cost of sequencing and realize the high-throughput, which allows us to obtain the whole genome sequence, and entire genome information about those patients who are clinically diagnosed. However, the bene fi ts offered by NGS technologies come with a number of challenges, which is how to make this technology become a conventional means in the clinical diagnosis. This article reviews the principle of a few technology platform, potential applications and the challenges of NGS in the clinical diagnosis.
Next-generation sequencing; Genomics; Molecular diagnostics
國家自然科學(xué)基金(30960176);教育部春暉計(jì)劃(Z2008-1-75012);寧夏自然科學(xué)基金(NZ1245)
寧夏醫(yī)科大學(xué)總醫(yī)院醫(yī)學(xué)實(shí)驗(yàn)中心,寧夏,銀川 750004
★通訊作者:魏軍,E-mial:lydiajunwei@hotmail.com