王躍,毛開云,王恒哲,馬征遠
中國科學院上海生命科學信息中心,上海 200031
技術與市場
轉錄組學測序技術應用與市場分析
王躍,毛開云,王恒哲,馬征遠
中國科學院上海生命科學信息中心,上海 200031
轉錄組學是功能基因組學研究的重要組成部分,是一門在整體水平研究基因功能以及基因結構,揭示基因轉錄、轉錄調控規(guī)律以及疾病發(fā)生過程中的分子機理的學科。隨著分子生物學技術、高通量技術的高速發(fā)展,轉錄組學測序技術已逐漸成為轉錄組學研究中不可或缺的研究手段。從應用和市場兩個角度,對轉錄組學的現狀和未來趨勢進行調研,為我國轉錄組學測序技術產業(yè)的發(fā)展及相關政策的制定提供參考。
轉錄組學;高通量測序;RNA-seq;市場分析
廣義上,轉錄組(transcriptome)是指特定的組織或細胞在某一生長階段或功能狀態(tài)下所轉錄出來的RNA總和,包括編碼蛋白質的mRNA和各種非編碼RNA(ncRNA),如rRNA、tRNA、snoRNA、snRNA、microRNA,以及其他非編碼RNA等[1]。狹義上,通常僅以mRNA作為研究對象。
隨著人類基因組計劃的完成,研究人員逐漸認識到對基因結構序列的研究僅僅是基因組學研究的一部分,并不能揭示所有的生命奧秘,所以生物醫(yī)學研究已從結構基因組學過渡到功能基因組學。隨著后基因組時代的到來,轉錄組學、蛋白質組學、代謝組學等各種組學技術相繼出現,其中轉錄組學是率先發(fā)展起來以及應用最廣泛的技術[2]。
轉錄組學(transcriptomics)是功能基因組學研究的重要組成部分,是一門在整體水平研究基因功能以及基因結構,揭示基因轉錄、轉錄調控規(guī)律以及疾病發(fā)生過程中的分子機理的學科[3]。最近十幾年,隨著分子生物學技術以及高通量技術等的快速發(fā)展,使得真正意義上的轉錄組學的研究成為可能。尤其是隨著下一代測序(next-generation sequencing,NGS)平臺的市場化,轉錄組學測序技術已經徹底改變了轉錄組學的思維方式。目前,成熟的轉錄組學測序技術以其整體性、系統性、個體組織差異性、時間獨立性等優(yōu)勢,更好地推動轉錄組學研究。本文從技術應用和市場兩個角度,梳理了目前轉錄組學測序技術的發(fā)展現狀,并對其未來發(fā)展趨勢進行了分析。
一般來說,任何一種DNA測序技術均可用于轉錄組學測序。整體而言,隨著測序技術的不斷發(fā)展,目前主要有三代測序技術劃分(圖1)。
測序技術最早可追溯到20世紀50年代由P. R. Whitfeld發(fā)明的多聚核糖核苷酸測序技術。隨著F. Sanger在20世紀70年代發(fā)明了DNA末端終止法測序技術,以及隨后A. M. Maxam和W. Gilbert發(fā)明的化學降解法測序技術,標志著第一代測序技術的產生和建立。第一代測序技術的優(yōu)點是準確度高,但同時由于其測序通量低、成本高昂、速度慢等技術缺陷,限制了其在商業(yè)上的應用。
隨著人類基因組計劃的完成,人類進入了后基因組時代,傳統的測序方法已經不能滿足深度測序和重復測序等大規(guī)模基因組測序的需求,促使了新一代測序技術的誕生。第二代測序技術是利用一系列高通量測序技術(highthroughput sequencing)進行大規(guī)模的基因組DNA或RNA測序,能夠快速準確地獲得基因組編碼序列,滿足極短時間內對基因組進行高分辨率檢測的要求[5]。第二代測序技術的主要特征是高通量和邊合成邊測序,因此大規(guī)模、測序速度快是其相對于第一代測序技術的主要優(yōu)勢,而劣勢是較短的序列讀長和需要模板擴增過程。
圖 1 測序技術發(fā)展時間表[4]
第三代測序技術是指在單個細胞、單分子水平上對基因組進行測序的一項新技術,主要包括Helicos Biosciences單分子測序技術、Paci fi c Biosciences單分子實時(single molecule real time,SMRT)測序技術和Oxford Nanopore納米孔單分子測序技術3種[4]。第三代測序技術具有測序速度快、測序序列長等優(yōu)勢,但也存在著測序準確度不高的問題,大大限制了其商業(yè)化的應用。因此,目前測序市場仍以第二代高通量測序技術為主。
近幾年,隨著精準醫(yī)療、個性化醫(yī)療等大計劃的提出,促使以轉錄組學研究為代表的功能基因組學日益成為研究熱點。轉錄組學測序技術能有效幫助科學家在轉錄層面找到疾病的直接或者間接的病因,了解疾病的發(fā)生、發(fā)展機制,從而制定個體化的精準醫(yī)療方案,以期達到治療效果的最大化和副作用的最小化。
同時,隨著第二代測序技術高通量、高準確率、低成本等優(yōu)點的實現,轉錄組學測序技術也隨之得到了更廣泛的應用。由于測序深度的優(yōu)勢,基于NGS的轉錄組學測序技術更能全面地揭示生物個體在特定時刻和特定組織的全局基因表達情況,具有更好的整體性、系統性、個體組織差異性以及時間獨立性等優(yōu)勢。目前,轉錄組學測序技術已廣泛應用于生物學研究、臨床研究、相關疾病研究和藥物開發(fā)等[6]。據Illumina的預估,未來全球測序服務市場容量將達到200億美元,其中腫瘤學市場約占60%,達到120億美元左右;生命科學市場約占25%,規(guī)模約50億美元,具體包括生命科學工具、復雜病癥、農業(yè)基因以及影響因子和宏基因組等;生育和基因健康市場約20億美元,占比10%,具體業(yè)務包含孕婦和新生兒童的監(jiān)測,以及基因健康等;其他應用市場約10億美元[7]。
目前,轉錄組學測序技術包括表達序列標簽技術(expressed sequence tags,EST)、基因表達系列分析技術(serial analysis of gene expression,SAGE)、大規(guī)模平行測序技術(massively parallel signature sequencing,MPSS),以及RNA測序技術(RNA sequencing,RNA-seq)[8]。其中,EST是較早發(fā)展起來的先驅技術,SAGE、MPSS和RNA-seq是高通量測序條件下實現的轉錄組學研究方法(圖2),RNA-seq更是基于NGS技術發(fā)展的測序技術,具有測序通量高、速度快、價格低、信噪比高等優(yōu)勢,已超越上述其他方法,成為轉錄組學分析的主要手段。
圖2 主要轉錄組學測序技術工作流程比較
EST技術雖然可以直接檢測cDNA序列,但其檢測量較低、價格昂貴且很難達到定量分析的目的。相比之下,SAGE和MASS技術是基于EST技術的升級,克服了EST技術的缺點,采用了數字化信號技術,具有高通量、精確性高等特點。但是,上述兩種技術仍是基于Sanger測序技術,其測序成本昂貴,且短的標簽序列的有效部分不能特異性地匹配到參照物基因組上[3]。
RNA-seq,又稱為高通量RNA測序,是利用深度測序技術進行轉錄組分析的技術,其基本原理是將RNA先反轉錄成cDNA,再對cDNA全部進行測序。RNA-seq是第二代測序技術的一個重要應用領域,與其他轉錄組學技術相比,具有數字化信號、高靈敏度、任意物種的全基因組分析、更廣的檢測范圍等諸多獨特優(yōu)勢(表1),目前已成為轉錄組學研究中定量基因表達和進行轉錄組測序、分析的主流工具[9]。此外,RNA-seq具有重復性好、無需技術重復、起始樣品少等優(yōu)勢。該技術能夠在單核苷酸水平對任意物種的整體轉錄活動進行檢測,在分析轉錄本的結構和表達水平的同時,還能發(fā)現未知轉錄本和稀有轉錄本,精確地識別可變剪切位點以及編碼序列單核苷酸多態(tài)性(cSNP),提供更為全面的轉錄信息[9]。
從測序技術的原理來說,所有的高通量測序技術均可用于轉錄組測序。自2005年以來,以Roche公司的454技術、Illumina公司的Solexa技術以及ABI公司(后與Invitrogen公司合并為Life Technologies公司,Life Technologies公司于2013年被Thermo Fisher Scienti fi c公司收購)的SOLiD技術為代表的第二代測序技術逐漸成熟,并迅速成為目前市場上轉錄組測序的主流應用平臺[10]。相對于傳統的Sanger測序技術,新一代測序技術的主要特點是測序通量高,測序周期和成本顯著下降。目前,全球的轉錄組學測序業(yè)務幾乎被上述三大巨頭所壟斷(圖3)。
2.3.1 Roche公司454 Genome Sequencer
454公司在2003年推出了具有革命性意義的基于焦磷酸測序法(pyrosequencing)的超高通量基因組測序系統,是邊合成邊測序(sequencing by synthesis,SBS)技術發(fā)明的先驅。隨后,454公司被Roche公司收購,推出了第二代測序系統Genome Sequencer FLX System,該技術的核心在于 微 乳 滴PCR(emulsion PCR,emPCR)和并行焦磷酸測序法(parallelized pyrosequencing),避免了傳統測序進行熒光標記以及跑膠等繁瑣步驟,同時利用乳膠系統對DNA分子進行擴增,實現了大規(guī)模并行測序[12]。
表1 主要轉錄組學測序技術比較
圖3 2013年全球轉錄組測序市場份額[11]
2.3.2 Illumina公司Solexa Genome Analyzer
相對于454測序,Solexa測序出現較晚,是合成技術的進一步發(fā)展和延伸,由基因測序公司Solexa開發(fā)。2007年,Illumina公司以6億美元收購Solexa公司,并推出了成熟的商業(yè)產品Genome Analyzer[13]。該技術核心是“DNA簇(DNA clusters)”和“可逆性末端終結(reversible terminator)”,同樣采用邊合成邊測序的原理,同時借助高密度的DNA單分子陣列,使測序成本和效率均有了較大改善。雖然片段長度較短仍是Solexa技術的瓶頸,但與454技術相比,Solexa測序擁有更高的通量,更低的成本,使其成為第二代測序平臺的首選[14]。目前Illumina公司具有涵蓋了低、中、高端不同層次的測序產品,2011年年底推出的MiSeq以其性價比高、操作界面友好、數據產出易于分析等特點迅速打入全球市場。其中,Genome Analyzer IIx被稱為是全球應用最廣、性價比最高、產出最多的測序儀。
2.3.3 ABI公司SOLiD System似,SOLiD系統同樣采用了emPCR技術和SBS技術。同時,該系統的創(chuàng)新之處在于應用雙堿基編碼,因此大大減少了測序帶來的錯誤率,同時可以方便地區(qū)分SNP和測序錯誤[15]。具有較高的序列讀取精度和數據輸出量是SOLiD系統的主要優(yōu)勢所在,因此相同數據量的測序價格略低于Solexa測序的價格。然而從目前應用來看,SOLiD系統的測序應用范圍不及454技術和Solexa技術廣泛,主要原因是SOLiD系統沒有明顯的優(yōu)勢,其讀長不及Solexa技術,更比不上454技術,而數據產出也遠無法和Solexa技術競爭。
總之,雖然3種技術各具優(yōu)缺點,但它們都使用了反應信號的實時閱讀,即邊合成邊測序,省去了第一代基因測序中所需要的利用電泳將序列片段分離后觀察結果的步驟,降低了測序所需時間和成本(表2)[3]。
2007年,美國ABI公司研發(fā)出基于連接測序法(sequencing by ligation) 的SOLid(sequencing by oligonucleotide ligation and detection)測序技術。與454技術類
高通量測序技術的發(fā)展使得以轉錄組學為代表的功能基因組學得到了前所未有的機遇和發(fā)展。以RNA-seq為代表的轉錄組學測序技術已經顯示出了較其他轉錄組學研究技術巨大的優(yōu)勢,如為物種提供單堿基分辨率的轉錄組注釋、提供全基因組范圍的“數字化”基因表達譜、成本比芯片和Sanger測序更低等[16]。但是,不可否認的是,轉錄組測序技術仍有很多方面有待進一步完善。一是,測序技術的改進和測序費用的進一步降低。前述的三大平臺測序過程中仍存在一定的錯誤率,且讀長普遍較短,進行數據拼接時會遇到麻煩。而以單分子測序和納米孔測序為標志的第三代測序技術將有望改善上述缺陷。第三代測序技術在具有超高通量的同時,也將保證測序片段更長和出錯率更低,并將進一步降低測序的成本[17]。因此,基于第三代高通量測序技術的轉錄組學技術將是未來發(fā)展的趨勢。二是,測序上游的樣品準備。目前的高通量測序技術大多需要較多的樣品起始量,同時樣品的準備步驟繁瑣,需經過加接頭、反轉、擴增、割膠等多重步驟,這使得有限的生物樣品分析受到限制且成本巨大,因此如何對少量樣本甚至單細胞進行測序亟待解決[3]。三是,生物信息學分析軟件的再開發(fā)。轉錄組學測序技術帶來了海量的數據,如何將海量的數據轉化為有用的數據也將是轉錄組學研究的一個重要挑戰(zhàn)[18]。
表2 主要高通量測序平臺比較[3]
美國市場研究公司Grand View Research發(fā)布的報告顯示[19],2014年全球轉錄組學技術市場(包括微陣列技術市場、PCR技術市場、基因調控技術市場以及下一代測序技術市場)為22億美元,預計到2022年,這一數字將達到69.8億美元。報告還揭示,推動該市場發(fā)展的主導因素包括藥物制造商與用戶對個性化藥物的追求以及對精準醫(yī)學的追求等。如美國Cofactor Genomics公司的首席執(zhí)行官J. Glasscock表示,公司約80%的工作是與大型制藥企業(yè)合作,利用轉錄組學技術開發(fā)藥物靶標、疾病生物標志物以及確定藥物的不良反應等[20]。
同時,Grand View Research的報告還揭示[19],個性化醫(yī)療以及基因檢測等需求的增長、個人及政府對藥物研究投資的增加也是促進轉錄組學市場發(fā)展的重要因素。此外,致癌物質以及遺傳變異等因素導致慢性疾?。ǜ窝?、糖尿病、癌癥等)發(fā)病率的上升,也是另一個推動轉錄組學市場增長的因素。
2017年,全球第二大市場研究咨詢機構MarketsandMarkets?發(fā)布的最新報告顯示[21],預計到2020年,全球以RNA-seq為代表的轉錄組學測序市場將從2017年的10.5億美元達到26.5億美元,年復合增長率預計在20.2%左右。RNA-seq產品相比于微陣列技術的技術優(yōu)勢、功能基因組學研究活動數量的增加以及個性化醫(yī)藥快速增長的市場需求是促進轉錄組學市場增長的關鍵因素。另一方面,該報告還指出,診斷測試中技術專業(yè)人員的缺乏以及RNA-seq技術的標準化問題是限制該市場增長的瓶頸。
2016年,北美地區(qū)轉錄組測序市場占全球主導份額,其次是歐洲地區(qū)。促進北美市場發(fā)展的主要驅動力是政府在基因組研究方面提供的大量資金支持、RNA-seq產品的技術進步、目標疾病流行率的增加、癌癥和遺傳性稀有疾病的研究,以及有大量的轉錄組測序主要參與者[19]。如報告指出[21],以RNA-seq為例,全球該市場前十位的參與者中,有一半是位于美國的公司,如Illumina、Thermo Fisher Scienti fi c、Paci fi c Biosciences、PerkinElmer和Agilent Technologies,其余公司包括QIAGEN N. V.(德國)、華大基因(BGI,中國)、Oxford Nanopore (英國)、GATC Biotech AG(德國)以及Roche(瑞士)。
此外,報告還指出,亞太地區(qū)預計在2017~2022年將會成為轉錄組測序發(fā)展增長最快的市場[19]。與其他地區(qū)相比,亞太地區(qū)人口眾多,來自中國、印度等新興市場的研發(fā)活動日益增強,同時RNA-seq應用范圍的擴大,以及測序技術成本整體的降低,巨大的人口基數和不斷遞增的醫(yī)療需求,均是促進亞太地區(qū)轉錄組測序市場快速發(fā)展的重要因素。
整體而言,目前轉錄組測序市場的特點是競爭激烈,以及創(chuàng)新產品世代更迭快。如自2005年以來,Roche、Illumina、Life Tech(現已歸屬Thermo Fisher Scientific公司)等公司相繼推出或改良第二代測序的新技術、新儀器和新平臺(圖4)[11]。除了第二代測序技術的不斷更新與發(fā)展外,新一代和第三代測序技術與產品也在不斷被發(fā)明和完善中。Helicos Biosciences的HeliScope單分子測序技術、Pacific Biosciences的SMRT測序技術和Oxford Nanopore的納米孔單分子測序技術等正逐漸進入商業(yè)應用領域。2014年6月,Roche公司收購了Genia Technologies公司,以增強其使用納米孔技術的測序平臺功能[19]。2016年12月,Oxford Nanopore公司向少數研究人員推出了直接的RNA測序試劑盒。目前,新的測序技術還在不斷被發(fā)明,每項技術都有超過前代產品的特色。而低成本、低耗時、高通量是未來的發(fā)展趨勢,隨著序列技術的發(fā)展,其用途也將更加廣泛。
圖 4 第二代測序平臺的發(fā)展
[1] WANG Z,GERSTEIN M,SNYDER M. RNA-Seq:a revolutionary tool for transcriptomics[J]. Nature Reviews Genetics,2009,10(1):57-63.
[2] LOCKHART D J,WINZELER E A. Genomics,gene expression and DNA arrays[J]. Nature,2000,405(6788):827-836.
[3] 祁云霞,劉永斌,榮威恒. 轉錄組研究新技術:RNA-Seq及其應用[J]. 遺傳,2011,33(11):1191-1202.
[4] 上海證券研究所. 基因測序技術:精準醫(yī)療之基石[R]. 上海:上海證券研究所,2016.
[5] 解增言,林俊華,譚軍,等. DNA測序技術的發(fā)展歷史與最新進展[J]. 生物技術通報,2010,8:64-70.
[6] 東吳證券研究所. 基因測序行業(yè)分析——“這里的黎明靜悄悄”[R]. 蘇州:東吳證券研究所,2015.
[7] 長城證券. 基因測序龍頭,解讀生命密碼[R]. 深圳:長城證券,2017.
[8] 羅輝,葉華,肖世俊,等. 轉錄組學技術在水產動物研究中的運用[J]. 水產學報,2015,39(4):598-607.
[9] 王曦,汪小我,王立坤,等. 新一代高通量RNA測序數據的處理與分析[J]. 生物化學與生物物理進展,2010,37(8):834-846.
[10] 周曉光,任魯風,李運濤,等. 下一代測序技術:技術回顧與展望[J]. 中國科學:生命科學,2010,40(1):23-37.
[11] 中銀國際證券有限責任公司. 二代測序技術——精準醫(yī)療先行者[R]. 上海:中銀國際證券有限責任公司,2015.
[12] RONAGHI M,KARAMOHAMED S,PETTERSSON B,et al. Real-time DNA sequencing using detection of pyrophosphate release[J]. Analytical Biochemistry,1996,242(1):84-89.
[13] 田李,張穎,趙云峰. 新一代測序技術的發(fā)展和應用[J]. 生物技術通報,2015,31(11):1-8.
[14] 楊曉玲,施蘇華,唐恬. 新一代測序技術的發(fā)展及應用前景[J]. 生物技術通報,2010,10:76-81.
[15] 何彪,涂長春. 下一代測序技術的應用及展望[C]// 中國畜牧獸醫(yī)學會家畜傳染病學分會全國會員代表大會暨第十五次學術研討會,2013.
[16] 洪奇陽,畢行建,王大寧,等. 轉錄組測序技術研究進展[J]. 中國生化藥物雜志,2017,37(6):443-448.
[17] 李小白,向林,羅潔,等. 轉錄組測序(RNA-seq)策略及其數據在分子標記開發(fā)上的應用[J]. 中國細胞生物學學報,2013,35(5):720-726,740.
[18] 張春蘭,秦孜娟,王桂芝,等. 轉錄組與RNA-Seq技術[J]. 生物技術通報,2012,12:51-56.
[19] Grand View Research,Inc. Transcriptomics technologies market analysis by technology(microarray,PCR,gene regulation,next generation sequencing),by application(clinical diagnostics,drug discovery & research,bioinformatics,comparative transcriptomics)and segment forecasts to 2022[R]. San Francisco,CA:Grand View Research,Inc.,2015.
[20] TACHIBANA C. Transcriptomics today:microarrays,RNA-seq,and more[J]. Science,2015,349(6247):544-546.
[21] MarketsandMarkets Research Private Ltd. NGS-based RNA-seq market by products & services(sample preparation,consumables,bioinformatics),technology(SBS,SMRT),application(de novo,transcriptome epigenetics,small RNA),end user(research centers,biopharma companies)- global forecast to 2022[R]. Pune:MarketsandMarkets Research Private Ltd.,2017.
Application and market analysis of transcriptomic sequencing technologies
WANG Yue,MAO Kaiyun,WANG Hengzhe,MA Zhengyuan
Shanghai Information Center for Life Sciences, CAS, Shanghai 200031, China
Transcriptomics is one of the important part of functional genomics, which is the study of the transcriptome—the complete set of RNA transcripts that are produced by the genome, under specificcircumstances or in a specific cell—using high-throughput methods. With the development of modern molecular technologies and high-throughput technologies, sequencing technologies such as RNA-seq have become increasingly important and indispensable in transcriptomic research. This paper made a research on the development of application, the market size and trends of transcriptomic sequencing technologies. We expect this paper provides an information and perspective of future development for related research and policy-making.
transcriptomics; high throughput sequencing; RNA-seq; market analysis
10.3969/j.issn.1674-0319.2017.05.002
王躍,碩士,助理館員。主要從事生物醫(yī)藥、生物技術、生物制造等生物產業(yè)各子領域的產業(yè)與技術情報研究。E-mail:wangyue2016@sibs.ac.cn