• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      RNA測(cè)序的研究進(jìn)展

      2014-11-22 19:53:28王康宇王義孫春玉蔣世翠
      江蘇農(nóng)業(yè)科學(xué) 2014年10期
      關(guān)鍵詞:測(cè)序

      王康宇++王義++孫春玉++蔣世翠++張美萍

      摘要:RNA測(cè)序研究是基因功能及結(jié)構(gòu)研究的基礎(chǔ),能夠從整體水平研究基因功能及其結(jié)構(gòu)。隨著高通量測(cè)序和定量檢測(cè)技術(shù)的不斷發(fā)展,能夠通過(guò)RNA測(cè)序?qū)D(zhuǎn)錄組進(jìn)行更深度更完整的研究。該研究進(jìn)展包括改善轉(zhuǎn)錄起始位點(diǎn)的預(yù)測(cè)、鏈特異性測(cè)序、融合基因的檢測(cè)、microRNA定量的分析以及RNA可變剪切的識(shí)別。目前利用單分子測(cè)序技術(shù)可以實(shí)現(xiàn)RNA的直接測(cè)序,通過(guò)二代測(cè)序技術(shù)與單分子測(cè)序技術(shù)相結(jié)合的方式,能更深層次、更全面地獲得轉(zhuǎn)錄組信息。

      關(guān)鍵詞:轉(zhuǎn)錄組信息;測(cè)序;編碼RNA;非編碼RNA;高通量測(cè)序技術(shù);單分子測(cè)序技術(shù)

      中圖分類號(hào): Q75文獻(xiàn)標(biāo)志碼: A文章編號(hào):1002-1302(2014)10-0012-05

      收稿日期:2013-12-31

      基金項(xiàng)目:國(guó)家科技計(jì)劃農(nóng)村領(lǐng)域項(xiàng)目(編號(hào):2013AA102604-3)。

      作者簡(jiǎn)介:王康宇(1983—),吉林通化人,博士研究生,從事植物功能基因組學(xué)研究。E-mail:wky427@sina.com。

      通信作者:張美萍,教授,博士生導(dǎo)師,從事植物基因組學(xué)與系統(tǒng)生物學(xué)研究。E-mail:wanglaoshi0606@163.com。1995年Velculescu等首次提出了關(guān)于轉(zhuǎn)錄組的概念[1],轉(zhuǎn)錄組廣義上是指某一特定功能狀態(tài)下,細(xì)胞內(nèi)所有轉(zhuǎn)錄表達(dá)的基因總和,其中包括編碼RNA(mRNA)和非編碼RNA如tRNA、rRNA、snRNA、miRNA等,而非編碼RNA不能被轉(zhuǎn)錄識(shí)別,不能翻譯成蛋白質(zhì),但是能參與某些蛋白質(zhì)翻譯過(guò)程;狹義上是指所有mRNA的總和[2]。1995年第1個(gè)轉(zhuǎn)錄組是由Velculescu等在釀酒酵母細(xì)胞中獲得的,當(dāng)時(shí)的技術(shù)共獲得了60 633個(gè)轉(zhuǎn)錄本,揭示了4 665個(gè)基因,其中有1 981個(gè)基因是具有已知功能的,其他2 684個(gè)基因尚未被鑒定過(guò)[1]。從人類基因組計(jì)劃[3]的實(shí)施開(kāi)始,截至2013年10月已有68種植物和119種動(dòng)物的基因組文章相繼發(fā)表。高通量測(cè)序在過(guò)去十幾年中快速發(fā)展,促使關(guān)于生物的功能基因組研究日益興起,人們利用測(cè)序技術(shù)研究了從簡(jiǎn)單模式生物(如酵母、擬南芥、水稻等)到人等一些高等物種的基因組中DNA修飾和RNA的定性定量變化等動(dòng)態(tài)的基因組位點(diǎn)的特性。在對(duì)基因組測(cè)序和分析研究的同時(shí),關(guān)于復(fù)雜的轉(zhuǎn)錄組研究也廣泛發(fā)展起來(lái)。利用高通量測(cè)序技術(shù)平臺(tái)分析轉(zhuǎn)錄組的結(jié)構(gòu)和表達(dá)水平,更能挖掘未知轉(zhuǎn)錄本和稀有轉(zhuǎn)錄本,精確地識(shí)別RNA的可變剪切以及編碼序列的單核苷酸多態(tài)性(SPN),更進(jìn)一步解析復(fù)雜的轉(zhuǎn)錄組信息[4]。

      最初的轉(zhuǎn)錄組研究主要以基因芯片微陣列技術(shù)為基礎(chǔ),由于基因芯片技術(shù)的檢測(cè)范圍取決于芯上的探針信息,所以只能檢測(cè)已知序列的特征,缺少發(fā)現(xiàn)新基因的能力,而高通量測(cè)序技術(shù)可以很好地彌補(bǔ)基因芯片技術(shù)在這方面的不足。因此,現(xiàn)階段轉(zhuǎn)錄組的研究是借助于高通量的二代DNA測(cè)序技術(shù)(NGS)[5]來(lái)完成的,通過(guò)構(gòu)建cDNA文庫(kù)并對(duì)cDNA進(jìn)行高通量測(cè)序,分析測(cè)序結(jié)果進(jìn)而解析轉(zhuǎn)錄組學(xué)中的復(fù)雜變化,這使RNA測(cè)序技術(shù)對(duì)基因芯片微陣列技術(shù)是極大的挑戰(zhàn)。目前,以基因測(cè)序技術(shù)為核心的新技術(shù)平臺(tái)支撐體系已經(jīng)相對(duì)成熟和完善,例如:Illumina公司的Solexa測(cè)序技術(shù)、羅氏公司的454測(cè)序技術(shù)、ABI公司的SOLID測(cè)序技術(shù)以及美國(guó)螺旋生物科學(xué)公司的新型納米孔測(cè)序技術(shù)等[5]。RNA測(cè)序技術(shù)平臺(tái)隨著NGS技術(shù)的不斷更新和提高而日益成熟完善,如測(cè)序通量、測(cè)序長(zhǎng)度、錯(cuò)配率、堿基配對(duì)讀取能力等測(cè)序性能方面技術(shù)的提高均有利于轉(zhuǎn)錄組的研究。

      新RNA測(cè)序技術(shù)的不斷更新和創(chuàng)新,為人類逐步全面了解真核生物和原核生物的轉(zhuǎn)錄組信息提供了新的定性和定量的生物信息學(xué)方法。本文闡述了改善轉(zhuǎn)錄起始位點(diǎn)的映射、RNA特異鏈的測(cè)定、融合基因的檢測(cè)、小RNA定性的分析以及RNA可變剪切的識(shí)別的發(fā)展,綜述了利用單分子測(cè)序技術(shù)實(shí)現(xiàn)RNA的直接測(cè)序,通過(guò)二代測(cè)序技術(shù)與單分子測(cè)序技術(shù)相結(jié)合的方式更深層次、更全面的獲得轉(zhuǎn)錄組信息,并展望了RNA測(cè)序在研究轉(zhuǎn)錄組的潛能。

      1RNA測(cè)序的研究?jī)?nèi)容

      1.1轉(zhuǎn)錄起始位點(diǎn)的預(yù)測(cè)

      轉(zhuǎn)錄起始位點(diǎn)(TSSs)是指RNA聚合酶識(shí)別和結(jié)合的位點(diǎn),并且能夠識(shí)別和調(diào)控每個(gè)轉(zhuǎn)錄本表達(dá)的啟動(dòng)子。第1個(gè)高通量獲得轉(zhuǎn)錄起始位點(diǎn)預(yù)測(cè)方法是帽分析基因表達(dá)法(CAGE),該方法是由最早的Sanger測(cè)序法[6]發(fā)展而來(lái)的,并能通過(guò)cDNA克隆獲得完整的RNA帽子結(jié)構(gòu)。該方法雖然對(duì)轉(zhuǎn)錄起始位點(diǎn)的預(yù)測(cè)有效,但需要大量高質(zhì)量的RNA并且獲得的轉(zhuǎn)錄起始位點(diǎn)很短,僅是20~21個(gè)核苷酸長(zhǎng)度。

      通過(guò)NGS技術(shù)發(fā)展,CAGE方法得到了改進(jìn),經(jīng)研究發(fā)現(xiàn),通過(guò)該方法可以獲得整個(gè)基因組范圍內(nèi)復(fù)雜的轉(zhuǎn)錄起始位點(diǎn)分布和獨(dú)特的啟動(dòng)子。因此,CAGE與RNA測(cè)序技術(shù)結(jié)合后衍生出了以CAGE策略為基礎(chǔ)的DeepCAGE法[7]、nanoCAGE法[8]、CAGEscan法[8]以及PEAT法[9],同時(shí)以Sanger測(cè)序?yàn)榛A(chǔ)的分析轉(zhuǎn)錄起始位點(diǎn)預(yù)測(cè)的方法受到了RNA測(cè)序技術(shù)與CAGE結(jié)合的挑戰(zhàn)。例如,nanoCAGE法[8]解決了GAGE法需要大量RNA的缺點(diǎn),可以通過(guò)放大技術(shù)從10 ng的總RNA量獲得轉(zhuǎn)錄起始位點(diǎn)的映射;PEAT法和CAGEscan法[8-9]雙末端測(cè)序可以獲得轉(zhuǎn)錄起始位點(diǎn)映射以及轉(zhuǎn)錄起始位點(diǎn)下游區(qū)間,具有良好的連通性并能促進(jìn)識(shí)別特殊的轉(zhuǎn)錄本。此外,雙末端測(cè)序緩解了對(duì)單個(gè)短讀取重復(fù)區(qū)的校對(duì),通過(guò)RNA測(cè)序可以獲得序列的重復(fù)特性。雖然這些方法結(jié)合了NGS技術(shù),克服了一些CAGE方法的不足,但是也存在一定的弊端。例如,在檢測(cè)擴(kuò)增結(jié)果過(guò)程中的操作步驟,可能影響了轉(zhuǎn)錄起始位點(diǎn)出現(xiàn)的頻率[8];此外,在cDNA合成和測(cè)序的過(guò)程中會(huì)產(chǎn)生引物二聚體,這就減少了測(cè)序的有效結(jié)果[8]。因此,這些與RNA測(cè)序技術(shù)結(jié)合的方法,雖然在定性檢測(cè)方面很有效,但是在定量檢測(cè)方面還需要進(jìn)一步的提高和優(yōu)化。

      以RNA測(cè)序?yàn)榛A(chǔ)的轉(zhuǎn)錄起始位點(diǎn)預(yù)測(cè)研究具有依賴cDNA合成和測(cè)序技術(shù)的局限性,這個(gè)局限性主要是由RNA的結(jié)構(gòu)和序列特點(diǎn)造成的。此外,以RNA測(cè)序?yàn)榛A(chǔ)的轉(zhuǎn)錄起始位點(diǎn)映射很難捕獲那些轉(zhuǎn)錄水平高且自身能夠快速降解的轉(zhuǎn)錄本,如microRNA。解決這些限制需要RNA測(cè)序技術(shù)與其他方法相結(jié)合,如以染色體為基礎(chǔ)的轉(zhuǎn)錄起始位點(diǎn)的預(yù)測(cè),依賴于對(duì)組蛋白修飾后對(duì)轉(zhuǎn)錄本進(jìn)行有效的檢測(cè)[10-11]。轉(zhuǎn)錄后加工出現(xiàn)5′帽子結(jié)構(gòu)的RNA片段有利于被檢測(cè)[12]。因此,單單依賴于GAGE法獲得的轉(zhuǎn)錄起始位點(diǎn)具有在轉(zhuǎn)錄后加工中難分離的難題。

      1.2鏈特異性測(cè)序

      在關(guān)于轉(zhuǎn)錄組學(xué)的研究中發(fā)現(xiàn),物種中普遍存在反義轉(zhuǎn)錄現(xiàn)象。反義轉(zhuǎn)錄的生物學(xué)功能明晰,它能在生物體正常生理狀態(tài)和病理狀態(tài)下發(fā)揮各種作用[13]。因此,在更深層次研究轉(zhuǎn)錄組時(shí),對(duì)正義鏈和反義鏈的測(cè)序和分析研究成為了一個(gè)重點(diǎn)。標(biāo)準(zhǔn)的RNA測(cè)序方法一般需要合成雙鏈的cDNA,這樣會(huì)丟失RNA鏈的部分信息。此外,在cDNA第1條鏈合成后需要依賴DNA聚合酶(DDDP)反轉(zhuǎn)錄產(chǎn)生cDNA的第2條鏈,此過(guò)程會(huì)引入虛假的信息[14-15],這能混淆轉(zhuǎn)錄檢測(cè)的分辨率。作為抑制反轉(zhuǎn)錄酶DDDP活性的物質(zhì),放線菌素D的有效抑制作用尚未被報(bào)道[16]。為克服這些難題,已經(jīng)開(kāi)發(fā)了鏈特異性RNA測(cè)序的分析策略。

      對(duì)特異鏈信息的獲得依賴于3種方式:第1種方法是在RNA尾部或cDNA第1條鏈預(yù)定方向連上接頭,已知方向上的接頭被作為獲取RNA鏈信息的參考點(diǎn);第2種方法是直接對(duì)cDNA的第1條鏈進(jìn)行測(cè)序;第3種方法是在合成的cDNA第2條鏈或RNA上進(jìn)行選擇性標(biāo)記。這些方法可以讓大家更了解反義轉(zhuǎn)錄過(guò)程,包括反義RNA轉(zhuǎn)錄位點(diǎn)圖譜的建立如核糖體轉(zhuǎn)錄位點(diǎn)和識(shí)別新的反義轉(zhuǎn)錄的啟動(dòng)子。以釀酒酵母的基因組作為參考,比較這3種方法[17],結(jié)果發(fā)現(xiàn)關(guān)于鏈特異性水平、平均覆蓋率、注釋信息、建庫(kù)復(fù)雜性以及定量表達(dá)譜分析等具有差異。關(guān)于外界添加酶的添加對(duì)這些數(shù)據(jù)造成的特異性偏差依然缺乏更深入的研究,這些數(shù)據(jù)合理處理的問(wèn)題也成為日后研究的重點(diǎn)。

      首先,逆轉(zhuǎn)錄酶在合成cDNA的第1條鏈并轉(zhuǎn)錄形成 cDNA 第2條鏈時(shí)具有傾向性,目前尚不明晰這個(gè)依賴于 cDNA 第1條鏈測(cè)序的方法是否完全具有單鏈的特異性[15-16]。這些方法通過(guò)對(duì)單鏈特異性進(jìn)行比較分析獲得已知反義鏈的方向、基因注釋以及相對(duì)讀取位置。有研究表明,小部分的讀取方向是反義方向,所以這些鏈可能不完全具有單鏈特異性。此外,cDNA第1條、第2條鏈不能恰當(dāng)?shù)貙?duì)參考序列進(jìn)行定位[17]。對(duì)基因組正義和反義的轉(zhuǎn)錄給出了不完全的注釋,即使在釀酒酵母這樣模式物種中,這些方法也不能完全確定鏈的特異性。

      其次,添加接頭的方法具有序列的偏好。依賴于接頭的方法會(huì)存在不同表現(xiàn)性的偏差,這種偏差存在于轉(zhuǎn)錄組分析和核糖體分析中[18-19]。與使用3′端多聚腺嘌呤酶的獲得的文庫(kù)相比使用接頭獲得的文庫(kù)存在覆蓋率不均勻的現(xiàn)象[20]。

      最后,其中一些方法包含使用溶液或者添加步驟都會(huì)添加外來(lái)物如DNA聚合酶的使用,例如,對(duì)GC形式的偏差和重復(fù)形式的讀取。RNA模板對(duì)GC形式的存在有一定的偏差,所以應(yīng)該擁有中度的GC含量[21]。而對(duì)重復(fù)序列的讀取是特異鏈RNA測(cè)序主要解決的問(wèn)題,這些影響因素能通過(guò)鏈特異性RNA測(cè)序技術(shù)的發(fā)展或已有測(cè)序技術(shù)的改變和提高得到解決。

      1.3可變剪接的識(shí)別

      目前,已知15%~60%的突變來(lái)源于RNA可變剪接,完整的RNA可變剪接事件是分析和了解細(xì)胞分化和疾病發(fā)生的關(guān)鍵點(diǎn)[22]??勺兗艚佑?種基本形式,即內(nèi)含子保留、可變的5′端、可變的3′端、外顯子盒、互斥外顯子、可變的起始或末端外顯子(這2種形式更有可能是可變啟動(dòng)子、可變polyA位點(diǎn)造成的)。因此,可變剪切事件的識(shí)別在RNA測(cè)序中具有重要性。最早利用RNA測(cè)序方法對(duì)可變剪切位點(diǎn)識(shí)別的研究受測(cè)序讀取長(zhǎng)度的限制,因此最初的RNA測(cè)序?qū)勺兗艚拥难芯客ㄟ^(guò)使用計(jì)算機(jī)來(lái)彌補(bǔ)這一限制。在人的基因組中超過(guò)95%的外顯子基因具有可變剪切的發(fā)生,每個(gè)組織中含有110 000個(gè)新型剪接位點(diǎn),可變剪切事件改變了對(duì)人類基因組的組裝,從而獲得了人的基因,數(shù)量為35 000[23]。通過(guò)計(jì)算每個(gè)外顯子讀取基因的數(shù)量和每個(gè)剪接點(diǎn)的生成,決定每個(gè)接點(diǎn)剪接效率和不同種類亞型的水平[24]。

      通過(guò)改進(jìn)目前的RNA測(cè)序技術(shù)來(lái)增加讀取的長(zhǎng)度,能更好地映射到具有可變剪切的外顯子上。通過(guò)改進(jìn)測(cè)序技術(shù)能提高讀取區(qū)的分塊[25],調(diào)整定位基因組每個(gè)獨(dú)立的區(qū)塊。此外,通過(guò)改進(jìn)雙末端測(cè)序方法能從轉(zhuǎn)錄本的預(yù)計(jì)讀取間距離2點(diǎn)上獲得更多的測(cè)序信息?,F(xiàn)在在不需要先前已知轉(zhuǎn)錄信息的基礎(chǔ)上就能識(shí)別可變剪接事件的發(fā)生,識(shí)別可變剪接、轉(zhuǎn)錄本連通性以及基因組組裝方式需要獲得全長(zhǎng)轉(zhuǎn)錄本序列,這些在未來(lái)可能產(chǎn)生新興技術(shù)。

      1.4基因融合檢測(cè)

      基因融合技術(shù)是將不同的基因連接起來(lái),從而表達(dá)具有復(fù)合功能的融合蛋白,融合蛋白除了具有衍生因子的雙重活性外,還具有融合蛋白的活性高于衍生因子相加的活性。RNA測(cè)序技術(shù)結(jié)合計(jì)算機(jī)進(jìn)行分析不僅可以對(duì)轉(zhuǎn)錄起始位點(diǎn)進(jìn)行識(shí)別,還可以用來(lái)檢測(cè)有組織細(xì)胞中的基因融合現(xiàn)象,其中用于生物醫(yī)學(xué)方面的研究尤為重要。利用單端測(cè)序和雙末端測(cè)序相結(jié)合的策略更易檢測(cè)到基因組DNA的易位和基因組重排現(xiàn)象[26]。然而,RNA測(cè)序技術(shù)能夠更好地識(shí)別物種中產(chǎn)生異常變化的RNA種類,使檢測(cè)因功能性或互作關(guān)系引起物種基因融合導(dǎo)致病變的研究具有可能性。此外,以基因組DNA為基礎(chǔ)方法不能識(shí)別基因融合是由于非基因組因素影響,如轉(zhuǎn)移剪接或者相鄰轉(zhuǎn)錄本間通讀所引起的融合現(xiàn)象[26]。雙末端配對(duì)的RNA測(cè)序能夠提高基因覆蓋率,因此對(duì)檢測(cè)基因融合具有特別的優(yōu)勢(shì),現(xiàn)在該方法被用于病理學(xué)的研究,并為調(diào)控與治療提供潛在的可能性。

      對(duì)基因融合檢測(cè)所面臨的最大難題是與之并行存在的RNA可變剪接。此外,RNA測(cè)序分析不能檢測(cè)包括擁有編碼序列的其他基因的啟動(dòng)子融合現(xiàn)象,同時(shí)在RNA測(cè)序時(shí)含有嵌合有外界添加制品的cDNA測(cè)序模板也可能導(dǎo)致基因融合識(shí)別中假陽(yáng)性的出現(xiàn)[27]。但是,通過(guò)增加足夠RNA測(cè)序的測(cè)序通量和測(cè)序讀取片段長(zhǎng)度等技術(shù)的改進(jìn),可能會(huì)降低檢測(cè)基因融合過(guò)程中假陽(yáng)性的產(chǎn)生[5]。

      1.5microRNA定量分析

      NGS技術(shù)對(duì)sRNA的發(fā)現(xiàn)和鑒定的影響特別明顯。對(duì)miRNA的研究已經(jīng)成為目前世界上RNA測(cè)序技術(shù)研究的熱點(diǎn),miRNA最初的發(fā)現(xiàn)和研究是通過(guò)焦磷酸測(cè)序進(jìn)行的[28],后來(lái)隨著高通量NGS平臺(tái)的使用,大量的miRNA被發(fā)現(xiàn)并引起了研究的重視。但NGS樣品的準(zhǔn)備需要更長(zhǎng)的RNA(>200個(gè)核苷酸),因此二代測(cè)序?qū)iRNA研究不合適[29]。可見(jiàn)反轉(zhuǎn)錄和隨機(jī)引物測(cè)序的策略,為其提供了解決問(wèn)題的新途徑。

      目前,研究miRNA的RNA測(cè)序方法的一個(gè)重要問(wèn)題是miRNA測(cè)序數(shù)據(jù)的標(biāo)準(zhǔn)化。隨著測(cè)序技術(shù)的進(jìn)步,關(guān)于 miRNA 的研究思路逐漸變得清晰,通過(guò)以NGS為基礎(chǔ)的 miRNA 定量分析可以通過(guò)差異表達(dá)分析完成,但是還存在如何獲得每個(gè)miRNA的讀取數(shù)量不是找出其實(shí)際表達(dá)豐度的有效辦法[30],這些差異更有可能是由在樣品準(zhǔn)備和測(cè)序時(shí)的偏差所造成的。所以,新興技術(shù)能否提高sRNA定量測(cè)定與分析讓人拭目以待。

      綜上所述,高通量測(cè)序技術(shù)的不斷發(fā)展使得測(cè)序量和成本逐漸降低,但是還存在如何獲得足夠通量的測(cè)序覆蓋度和其他一些潛在的問(wèn)題。在轉(zhuǎn)錄過(guò)程中,等位基因在表達(dá)上存在差異,導(dǎo)致低豐度轉(zhuǎn)錄組本與基因型的測(cè)定和分析很難完成,這就要求獲得轉(zhuǎn)錄過(guò)程越豐富越好,優(yōu)選優(yōu)質(zhì)的轉(zhuǎn)錄組測(cè)序可以盡量減少測(cè)序的總成本并使分析樣品數(shù)最大化。

      2單分子測(cè)序技術(shù)對(duì)RNA的直接測(cè)序

      2.1RNA測(cè)序的影響因素

      目前,cDNA的合成和其他RNA操作極大地限制了RNA測(cè)序技術(shù)的應(yīng)用?,F(xiàn)今許多RNA測(cè)序方法依賴于cDNA的合成和以及一系列的合成后續(xù)操作步驟,這使得RNA測(cè)序的應(yīng)用具有一定的局限性。例如,人工條件下合成的cDNA第2條鏈在特異鏈RNA測(cè)序時(shí)相當(dāng)困難。為了在特異鏈建庫(kù)時(shí)避免這一問(wèn)題,使用RNA-RNA連接和建庫(kù)的方法費(fèi)力且難構(gòu)建,因此可以通過(guò)合成cDNA作為模版來(lái)突破這個(gè)限制[31]。在反轉(zhuǎn)錄時(shí),合成初期的cDNA有時(shí)會(huì)從RNA中分離出來(lái),通過(guò)再退火與RNA序列特異性結(jié)合到初始模板上并進(jìn)行延伸,會(huì)人工產(chǎn)生嵌合的cDNA。通過(guò)模板切換能解決在外顯子-內(nèi)含子界限的識(shí)別和嵌合轉(zhuǎn)錄上所產(chǎn)生的問(wèn)題。同時(shí),反轉(zhuǎn)錄酶在無(wú)引物條件下由于RNA的二級(jí)結(jié)構(gòu)也能自由合成cDNA,這將導(dǎo)致隨機(jī)的cDNA被合成[32],這是由于反轉(zhuǎn)錄酶與其他酶相比保真度低,缺乏校正機(jī)制[32]。所以,在RNA反轉(zhuǎn)錄成cDNA時(shí)轉(zhuǎn)化效率受試驗(yàn)條件影響。

      RNA測(cè)序技術(shù)除了cDNA影響因素外,還有其他影響因素。第一,RNA測(cè)序信號(hào)具有不均勻覆蓋性,這就可能在轉(zhuǎn)錄過(guò)程中因一些因素的影響產(chǎn)生偏差[33],如隨機(jī)引物選擇、cDNA合成以及連接等。第二,使用統(tǒng)一的RNA測(cè)序策略,導(dǎo)致在RNA或cDNA讀取長(zhǎng)度選擇的不合理,以致轉(zhuǎn)錄本長(zhǎng)度存在偏差,給下游分析造成了嚴(yán)重結(jié)果。第三,RNA測(cè)序定量分析需要考慮到不確定的讀段長(zhǎng)度和每個(gè)轉(zhuǎn)錄本讀段正常化[34]。盡管隨著轉(zhuǎn)錄方法的提高和生物信息學(xué)的發(fā)展允許轉(zhuǎn)錄組從頭合成測(cè)序,但存在的方法通常難以檢測(cè)確定的轉(zhuǎn)錄以及其覆蓋全部長(zhǎng)度。因RNA存在可變剪切,啟動(dòng)子、轉(zhuǎn)錄位點(diǎn)以及轉(zhuǎn)錄邊界和長(zhǎng)度存在不確定性,正常長(zhǎng)度是RNA測(cè)序定量分析的潛在錯(cuò)誤源。第四,RNA測(cè)序策略往往涉及到mRNA的富集,因此利用RNA轉(zhuǎn)錄聚合酶Ⅰ對(duì)mRNA的polyA進(jìn)行富集可以獲得理想的RNA產(chǎn)物。

      2.2單分子測(cè)序的研究進(jìn)展

      目前,RNA測(cè)序和分析技術(shù)發(fā)展受到諸多條件的限制,單分子測(cè)序技術(shù)的出現(xiàn)解決了現(xiàn)階段二代測(cè)序技術(shù)解決不了的問(wèn)題,因?yàn)閱畏肿訙y(cè)序技術(shù)可以不經(jīng)過(guò)反轉(zhuǎn)錄成cDNA,不改變RNA的原本特性,直接對(duì)RNA分子進(jìn)行測(cè)序。但是單分子測(cè)序也有其不足之處,使得RNA直接測(cè)序技術(shù)發(fā)展前景充滿了未知。

      二代高通量測(cè)序的讀取序列片段太短,使得后續(xù)的組裝工作困難且繁瑣。而三代高通量測(cè)序采用的是單分子測(cè)序原理,不僅可以降低測(cè)序每個(gè)堿基的費(fèi)用,簡(jiǎn)化測(cè)序樣品的制備流程,加快測(cè)序速度,縮短分析數(shù)據(jù)的過(guò)程,而且還具有讀取數(shù)百個(gè)堿基甚至更長(zhǎng)片段的優(yōu)點(diǎn),運(yùn)用在從頭測(cè)序時(shí)使數(shù)據(jù)分析過(guò)程簡(jiǎn)化了[35]。這種長(zhǎng)片段的測(cè)序技術(shù)與短片段測(cè)序相比在后續(xù)組裝中得到了簡(jiǎn)化,因而省去了不必要的麻煩,同時(shí)還增加了轉(zhuǎn)錄組數(shù)據(jù)分析的新內(nèi)容,如拷貝數(shù)變異情況、可變剪切識(shí)別、轉(zhuǎn)位情況、嵌合轉(zhuǎn)錄本識(shí)別以及基因型分期等。

      RNA直接技術(shù)是隨著Helicos公司的Heliscope并行單分子測(cè)序技術(shù)發(fā)展起來(lái)的?,F(xiàn)階段主要的單分子測(cè)序技術(shù)分為Helicos公司的Heliscope并行單分子合成測(cè)序技術(shù)、Pacific公司的SMRT單分子實(shí)時(shí)合成測(cè)序技術(shù)以及Oxford Nanopore公司的納米孔單分子測(cè)序技術(shù)。單分子測(cè)序技術(shù)具有二代測(cè)序技術(shù)不具備的優(yōu)點(diǎn),如不在需要制備測(cè)序所用的DNA文庫(kù)可以對(duì)樣品片段直接進(jìn)行單分子擴(kuò)增、測(cè)序的速度更快、測(cè)序過(guò)程具有并行度以及讀取長(zhǎng)度更長(zhǎng)等。

      Heliscope并行單分子合成測(cè)序技術(shù)的原理是該技術(shù)基于邊合成邊測(cè)序的思想,將待測(cè)的RNA樣品連接上已知序列的接頭[通常為poly(A)]并于單通道與含有poly(T)的共價(jià)引物進(jìn)行雜交,再用過(guò)精準(zhǔn)定位的成像系統(tǒng)鑒定具有標(biāo)記的測(cè)序片段,其具有以下特點(diǎn):第一,測(cè)序可以不是同步的,可以同時(shí)讀取不同長(zhǎng)度的片段,這就改善了二代測(cè)序讀取長(zhǎng)度均一的策略,讀取長(zhǎng)度不均一的測(cè)序模板可造成測(cè)序速度快慢不等。第二,在熒光標(biāo)記的核苷酸上沒(méi)有終止基團(tuán)。在二代測(cè)序時(shí),測(cè)序模板存在同聚物時(shí)帶有熒光標(biāo)記的堿基之間與同聚物結(jié)合會(huì)發(fā)生猝滅的現(xiàn)象,這樣就無(wú)法識(shí)別讀取的堿基數(shù),而Heliscope單分子測(cè)序技術(shù)能記錄所讀取的每個(gè)堿基數(shù)據(jù),這樣就避免了猝滅現(xiàn)象的發(fā)生。第三,可以通過(guò)2步測(cè)序(正向測(cè)序和反向測(cè)序)提高測(cè)序的準(zhǔn)確性。第四,測(cè)序過(guò)程中會(huì)有未標(biāo)記的堿基、不發(fā)熒光的堿基以及污染堿基的混入,會(huì)使測(cè)定缺失突變時(shí)的錯(cuò)誤率較高,2步測(cè)序2次誤差率分別為2%~7%、0.2%~1.0%,但是在測(cè)定堿基替換突變時(shí)的錯(cuò)誤率非常低,2步測(cè)序2次錯(cuò)誤率分別在0.01%~100%、0001%,這是目前測(cè)序技術(shù)中準(zhǔn)確率最高的[36]。

      SMRT單分子實(shí)時(shí)合成測(cè)序技術(shù)的原理同樣也是基于邊合成邊測(cè)序的思路,該技術(shù)以SMRT芯片作為測(cè)序載體進(jìn)行測(cè)序反應(yīng)。SMRT芯片是一種帶有需要零模波導(dǎo)孔(zero-mode waveguides,ZMW)的且孔的厚度為100 nm的金屬片。將DNA聚合酶、測(cè)序模板以及帶有不同熒光標(biāo)記的dNTP加入到ZMW孔中,進(jìn)行邊合成邊測(cè)序反應(yīng)[37]。dNTP的磷酸基團(tuán)被熒光標(biāo)記,當(dāng)dNTP被添加到合成鏈上時(shí),進(jìn)入ZMW孔的激光束會(huì)激發(fā)熒光,根據(jù)不同的熒光成像就能獲得測(cè)序結(jié)果;而添加到合成鏈上的dNTP的磷酸基團(tuán)會(huì)被剪切并釋放,這樣不再具有熒光標(biāo)記,便不會(huì)再被識(shí)別。因此,SMRT單分子實(shí)時(shí)測(cè)序技術(shù)的測(cè)序速度很快,其測(cè)定堿基的速度可以達(dá)到10個(gè)/s[38],測(cè)序過(guò)程中對(duì)每條堿基鏈的數(shù)據(jù)都會(huì)進(jìn)行評(píng)估,更易發(fā)現(xiàn)稀有變異;具有超長(zhǎng)的讀長(zhǎng)度,即平均讀長(zhǎng)度超過(guò)1 000 bp甚至更長(zhǎng)等。但是,也存在缺陷,如不能高效利用DNA聚合酶且容易在ZMW中降解失活、總體上每個(gè)堿基測(cè)序成本高、機(jī)器相當(dāng)?shù)陌嘿F等。

      納米孔單分子測(cè)序技術(shù)的原理與前兩者不同,采樣的是電信號(hào)測(cè)序技術(shù),通過(guò)借助電泳驅(qū)動(dòng)單個(gè)分子逐一通過(guò)納米孔來(lái)實(shí)現(xiàn)測(cè)序[39]。納米孔的直徑非常小,僅允許單個(gè)核苷酸通過(guò),因此可用于高通量測(cè)序。此外,納米級(jí)別的孔徑保證了測(cè)序過(guò)程中良好的檢測(cè)過(guò)程,使測(cè)序結(jié)果的準(zhǔn)確性非常高。RNA測(cè)序時(shí)省略的擴(kuò)增階段和標(biāo)記手段可直接測(cè)序,使簡(jiǎn)便快捷的測(cè)序過(guò)程更可能成為現(xiàn)實(shí)。雖然納米孔單分子測(cè)序技術(shù)具有測(cè)序成本很低和測(cè)序長(zhǎng)度很長(zhǎng)的優(yōu)點(diǎn),但是在如何控制納米孔徑、如何通過(guò)納米孔徑控制速度以及納米孔材料和制造等問(wèn)題是該技術(shù)面臨的最大問(wèn)題。納米孔徑過(guò)大會(huì)造成一次性通過(guò)的核苷酸過(guò)多,過(guò)小會(huì)造成單個(gè)核苷酸無(wú)法通過(guò);通過(guò)納米孔徑的速度會(huì)影響測(cè)序速度,通過(guò)速度過(guò)慢不能實(shí)現(xiàn)快速高通量測(cè)序,而通過(guò)過(guò)快也不能確保識(shí)別信號(hào)的穩(wěn)定性;納米孔制作的材料要求高,制造起來(lái)極其費(fèi)時(shí)且其價(jià)格很貴。這些因素影響了該技術(shù)發(fā)展的腳步,解決這些問(wèn)題對(duì)直接測(cè)序技術(shù)具有里程碑的意義。

      總之,單分子測(cè)序技術(shù)是RNA直接測(cè)序的主要技術(shù)支持。單分子測(cè)序技術(shù)在測(cè)序成本、錯(cuò)配率、讀取長(zhǎng)度以及測(cè)序通量等技術(shù)指標(biāo)上比二代測(cè)序技術(shù)有了更大的改進(jìn)和提高。用于RNA測(cè)序時(shí)也解決了反轉(zhuǎn)錄成cDNA以及RNA含量低和長(zhǎng)短不均一等造成無(wú)法測(cè)序的問(wèn)題,通過(guò)簡(jiǎn)化測(cè)序步驟和對(duì)測(cè)序樣品不需要預(yù)處理就使得RNA直接測(cè)序得以實(shí)現(xiàn)。但是單分子測(cè)序技術(shù)還存在著不足,所以利用二代測(cè)序技術(shù)和單分子測(cè)序技術(shù)相結(jié)合的方法可以解決目前研究中存在的不少問(wèn)題,如SNP位點(diǎn)識(shí)別、基因缺失研究以及基因拷貝數(shù)的變異分析等。

      3展望

      測(cè)序技術(shù)從Sanger測(cè)序技術(shù)發(fā)展到現(xiàn)階段的單分子測(cè)序技術(shù),在這個(gè)過(guò)程中RNA測(cè)序技術(shù)的發(fā)展還在繼續(xù),并且朝著更快速、更靈敏、更精準(zhǔn)、更廉價(jià)的方向發(fā)展。RNA測(cè)序研究是基因功能研究及結(jié)構(gòu)研究的基礎(chǔ),能夠從整體水平上研究基因功能以及基因結(jié)構(gòu)。單分子測(cè)序技術(shù)推動(dòng)RNA測(cè)序技術(shù)更進(jìn)一步發(fā)展,RNA直接測(cè)序技術(shù)研究轉(zhuǎn)錄組已經(jīng)逐步替代基因芯片微陣列技術(shù)成為現(xiàn)在功能基因組學(xué)研究基因表達(dá)的主流方式。

      參考文獻(xiàn):

      [1]Velculescu V E,Zhang L,Vogelstein B,et al. Serial analysis of gene expression[J]. Science,1995,207:484-487.

      [2]Berretta J,Morillon A. Pervasive transcription constitutes a new level of eukaryotic genome regulation[J]. EMBO Reports,2009,10(9):973-982.

      [3]Lander E S,Linton L M,Birren B,et al. Initial sequencing and analysis of the human genome[J]. Nature,2001,409(6822):860-921.

      [4]Denoeud F,Aury J M,da Silva C,et al. Annotating genomes with massive-scale RNA sequencing[J]. Genome Biology,2008,9(12):R175.

      [5]Metzker M L. Sequencing technologies the next generation[J]. Nature Rev Genet,2010,11:31-46.

      [6]Carninci P,Sandelin A,Lenhard B,et al. Genome-wide analysis of mammalian promoter architecture and evolution[J]. Nature Genetics,2006,38(6):626-635.

      [7]Valen E,Pascarella G,Chalk A,et al. Genome-wide detection and analysis of hippocampus core promoters using DeepCAGE[J]. Genome Research,2009,19(2):255-265.

      [8]Ni T,Corcoran D L,Rach E A,et al. A paired-end sequencing strategy to map the complex landscape of transcription initiation[J]. Nature Methods,2010,7(7):521-527.

      [9]Plessy C,Bertin N,Takahashi H,et al. Linking promoters to functional transcripts in small samples with nanoCAGE and CAGEscan[J]. Nature Methods,2010,7(7):528-534.

      [10]Marson A,Levine S S,Cole M F,et al. Connecting microRNA genes to the core transcriptional regulatory circuitry of embryonic stem cells[J]. Cell,2008,134(3):521-533.

      [11]Ozsolak F,Poling L L,Wang Z X,et al. Chromatin structure analyses identify miRNA promoters[J]. Genes & Development,2008,22(22):3172-3183.

      [12]Affymetrix ENCODE Transcriptome Project,Cold Spring Harbor Laboratory ENCODE Transcriptome Project. Post-transcriptional processing generates a diversity of 5′-modified long and short RNAs[J]. Nature,2009,457:1028-1032.

      [13]Faghihi M A,Wahlestedt C. Regulatory roles of natural antisense transcripts[J]. Nature Reviews Molecular Cell Biology,2009,10(9):637-643.

      [14]Gubler U. Second-strand cDNA synthesis:mRNA fragments as primers[J]. Meth Enzymol,1987,152:330-335.

      [15]Spiegelman S,Burny A,Das M R,et al. DNA-directed DNA polymerase activity in oncogenic RNA viruses[J]. Nature,1970,227(5262):1029-1031.

      [16]Perocchi F,Xu Z Y,Clauder-Münster S,et al. Antisense artifacts in transcriptome microarray experiments are resolved by actinomycin D[J]. Nucleic Acids Research,2007,35(19):e128.

      [17]Levin J Z,Yassour M,Adiconis X,et al. Comprehensive comparative analysis of strand-specific RNA sequencing methods[J]. Nature Methods,2010,7(9):709-715.

      [18]Faulhammer D,Lipton R J,Landweber L F. Fidelity of enzymatic ligation for DNA computing[J]. Journal of Computational Biology,2000,7(6):839-848.

      [19]Housby J N,Southern E M. Fidelity of DNA ligation:a novel experimental approach based on the polymerisation of libraries of oligonucleotides[J]. Nucleic Acids Research,1998,26(18):4259-4266.

      [20]Ingolia N T,Ghaemmaghami S,Newman J R,et al. Genome-wide analysis in vivo of translation with nucleotide resolution using ribosome profiling[J]. Science,2009,324(5924):218-223.

      [21]Kozarewa I,Ning Zemin,Quail M A,et al. Amplification-freeillumina sequencing-library preparation facilitates improved mapping and assembly of GC-biased genomes[J]. Nature Methods,2009,6(4):291-295.

      [22]Nilsen T W,Graveley B R. Expansion of the eukaryotic proteome by alternative splicing[J]. Nature,2010,463(7280):457-463.

      [23]Wang E T,Sandberg R,Luo S J,et al. Alternative isoform regulation in human tissue transcriptomes[J]. Nature,2008,456(7221):470-476.

      [24]Jiang H,Wong W H. Statistical inferences for isoform expression in RNA-Seq[J]. Bioinformatics,2009,25(8):1026-1032.

      [25]Trapnell C,Pachter L,Salzberg S L. TopHat:discovering splice junctions with RNA-Seq[J]. Bioinformatics,2009,25(9):1105-1111.

      [26]Korbel J O,Urban A E,Affourtit J P,et al. Paired-end mapping reveals extensive structural variation in the human genome[J]. Science,2007,318(5849):420-426.

      [27]McManus C J,Duff M O,Eipper-Mains J,et al. Global analysis of trans-splicing in drosophila[J]. Proceedings of the National Academy of Sciences of the United States of America,2010,107(29):12975-12979.

      [28]Rajagopalan R,Vaucheret H,Trejo J,et al. A diverse and evolutionarily fluid set of microRNAs in Arabidopsis thaliana[J]. Genes & Development,2006,20(24):3407-3425.

      [29]Taft R J,Glazov E A,Cloonan N,et al. Tiny RNAs associated with transcription start sites in animals[J]. Nature Genetics,2009,41(5):572-578.

      [30]Linsen S E,de Wit E,Janssens G,et al. Limitations and possibilities of small RNA digital gene expression profiling[J]. Nature Methods,2009,6(7):474-476.

      [31]Cocquet J,Chong A,Zhang G L,et al. Reverse transcriptase template switching and false alternative transcripts[J]. Genomics,2006,88(1):127-131.

      [32]Mader R M,Schmidt W M,Sedivy R,et al. Reverse transcriptase template switching during reverse transcriptase-polymerase chain reaction:artificial generation of deletions in ribonucleotide reductase mRNA[J]. The Journal of Laboratory and Clinical Medicine,2001,137(6):422-428.

      [33]Hansen K D,Brenner S E,Dudoit S. Biases in illumina transcriptome sequencing caused by random hexamer priming[J]. Nucleic Acids Research,2010,38(12):e131.

      [34]Li B,Ruotti V,Stewart R M,et al. RNA-Seq gene expression estimation with read mapping uncertainty[J]. Bioinformatics,2010,26(4):493-500.

      [35]邱超,孫含麗,宋超. DNA測(cè)序技術(shù)發(fā)展歷程及國(guó)際最新動(dòng)態(tài)[J]. 硅谷,2008(17):127,129.

      [36]汪正范,劉娜. Helicos公司單分子基因測(cè)序儀[J]. 現(xiàn)代儀器,2010(1):95.

      [37]Levene M J,Korlach J,Turner S W,et al. Zero-mode waveguides for single-molecule analysis at high concentrations[J]. Science,2003,299(567):682-686.

      [38]Clarke J,Wu H C,Jayasinghe L,et al. Continuous base identification for single-molecule nanopore DNA sequencing[J]. Nature Nanotechnology,2009,4(4):265-270.

      [39]Rusk N. Cheap third-generation sequencing[J]. Nature Methods,2009,6(4):244-245.

      猜你喜歡
      測(cè)序
      杰 Sir 帶你認(rèn)識(shí)宏基因二代測(cè)序(mNGS)
      新民周刊(2022年27期)2022-08-01 07:04:49
      二代測(cè)序協(xié)助診斷AIDS合并馬爾尼菲籃狀菌腦膜炎1例
      傳染病信息(2021年6期)2021-02-12 01:52:58
      外顯子組測(cè)序助力產(chǎn)前診斷胎兒骨骼發(fā)育不良
      中草藥DNA條形碼高通量基因測(cè)序一體機(jī)驗(yàn)收會(huì)在京召開(kāi)
      基因測(cè)序技術(shù)研究進(jìn)展
      中美聯(lián)合成功研發(fā)全球最準(zhǔn)三代基因測(cè)序儀
      DNA微陣列芯片法與直接測(cè)序法檢測(cè)CYP2C19基因型的比較研究
      Illumina MiSeq測(cè)序平臺(tái)測(cè)定蒙古羊瘤胃液相和固相菌群多樣性
      基因捕獲測(cè)序診斷血癌
      單細(xì)胞測(cè)序技術(shù)研究進(jìn)展
      乐清市| 青田县| 静海县| 太谷县| 姜堰市| 崇义县| 鹤壁市| 永安市| 石门县| 开江县| 阳信县| 宝丰县| 宁明县| 延长县| 广丰县| 漳州市| 珲春市| 武乡县| 鄂托克旗| 涞源县| 抚宁县| 满城县| 拉孜县| 炎陵县| 西乌珠穆沁旗| 莲花县| 历史| 邛崃市| 新巴尔虎左旗| 新津县| 台南县| 姜堰市| 尉氏县| 大同市| 苍梧县| 鄂尔多斯市| 斗六市| 塘沽区| 微山县| 盐津县| 广平县|