• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    改進的RNA-Seq數(shù)據(jù)轉(zhuǎn)錄組表達分析研究

    2015-05-04 05:28:50石新新劉學(xué)軍
    數(shù)據(jù)采集與處理 2015年5期
    關(guān)鍵詞:異構(gòu)體外顯子探針

    石新新 劉學(xué)軍 張 禮

    (南京航空航天大學(xué)計算機科學(xué)與技術(shù)學(xué)院,南京,210016)

    ?

    改進的RNA-Seq數(shù)據(jù)轉(zhuǎn)錄組表達分析研究

    石新新 劉學(xué)軍 張 禮

    (南京航空航天大學(xué)計算機科學(xué)與技術(shù)學(xué)院,南京,210016)

    基于高通量測序的RNA-Seq(RNA-sequencing)是用于轉(zhuǎn)錄組研究的一種新技術(shù),針對該技術(shù)在轉(zhuǎn)錄組表達分析研究中存在的讀段多源映射和讀段非均勻分布等難點,提出一個改進的轉(zhuǎn)錄組表達研究方法LDASeqII(Improvement of latent Dirichlet allocation for sequencing data)。模型利用剪接異構(gòu)體結(jié)構(gòu)信息對參數(shù)進行約束并進行外顯子讀段數(shù)目歸一化處理,解決了讀段非均勻分布下的多源映射問題。通過引入“偽外顯子”和“偽轉(zhuǎn)錄本”分別處理接合區(qū)讀段和噪聲讀段。將模型應(yīng)用到真實數(shù)據(jù)集上,并與原LDASeq(Latent Dirichlet allocation for sequencing data)模型和目前流行的 Cufflinks與RSEM(RNA-Seq by expectation maximization)方法進行對比。結(jié)果顯示,改進方法獲得了更為準確的轉(zhuǎn)錄本及基因表達水平計算結(jié)果。

    基因表達;RNA-Seq;轉(zhuǎn)錄組表達;多源映射;非均勻性

    引 言

    RNA-Seq(RNA sequencing)是基于高通量測序技術(shù)對轉(zhuǎn)錄組進行研究的一種新方法,具有信噪比高、分辨率高和所需樣本少等優(yōu)勢,可以用來檢測和量化任何物種的轉(zhuǎn)錄片段[1-2],近年來在轉(zhuǎn)錄組研究中得到大量應(yīng)用。RNA-Seq數(shù)據(jù)處理過程主要分為3個方面:(1) 將讀段映射到參考基因組或轉(zhuǎn)錄組上;(2) 利用匹配到的讀段對基因或轉(zhuǎn)錄組進行構(gòu)建;(3) 通過計數(shù)匹配到基因或轉(zhuǎn)錄本上的讀段數(shù)目來計算基因或轉(zhuǎn)錄本表達值[3]。本文主要針對最后一個步驟進行研究,即給定轉(zhuǎn)錄組構(gòu)建、計算基因以及異構(gòu)體的表達水平。

    RNA-Seq通過計數(shù)匹配到基因元件上讀段數(shù)目來表示相關(guān)基因的轉(zhuǎn)錄水平[4],為了保持對不同基因和不同實驗間估計的基因表達值的可比性,必須對基因長度和測序深度進行歸一化。最常用的歸一化方法是Mortazavi等人提出RPKM(Reads per kilobases per million reads)方法,即每百萬讀段中來自該基因的讀段數(shù)[5]?;蛟谵D(zhuǎn)錄過程中會形成一個或多個轉(zhuǎn)錄本,這些轉(zhuǎn)錄本共享基因的部分外顯子[6],造成讀段到異構(gòu)體的多源映射,故只有一少部分比例的讀段能夠唯一確定其來源轉(zhuǎn)錄本[7]。因此,RPKM方法不能直接應(yīng)用于轉(zhuǎn)錄本表達值計算。一種解決思路為可以根據(jù)已知外顯子組成和各外顯子長度對轉(zhuǎn)錄本建立數(shù)學(xué)模型,利用基因外顯子上讀段數(shù)求解轉(zhuǎn)錄本表達值。文獻[8]提出的轉(zhuǎn)錄本表達值計算方法和文獻[9]設(shè)計的Cufflinks模型都采用了這種思路來實現(xiàn)剪接異構(gòu)體的表達推斷。此外,還有文獻[10-11]提出的RSEM(RNA-Seq by expectation maximization)方法,文獻[12]提出的BitSeq(Bayesian inference of transcripts from sequencing data)方法,都采取了一定手段來解決讀段的多源映射問題。RNA-Seq數(shù)據(jù)的另外一個特點是讀段在參考序列上的分布有著自身的一些模式,呈現(xiàn)出不均勻性[13-16]。Cufflinks方法把位置偏差和序列偏差融入到計算中,模擬了讀段非均勻采樣的隨機性質(zhì)[9]。RSEM方法通過一個產(chǎn)生式概率模型模擬讀段產(chǎn)生過程的經(jīng)驗分布等信息,在一定程度上消除了均勻分布的假設(shè)[10]。

    針對RNA-Seq讀段的異構(gòu)體多源映射與分布不均勻兩個難點,文獻[17]提出了LDASeq(Latent Dirichilet allocation for sequencing)模型來計算異構(gòu)體表達水平。LDASeq模型通過引入隱含變量,較好模擬了讀段的非均勻分布和多源映射現(xiàn)象。后續(xù)工作中發(fā)現(xiàn),該模型存在以下缺點:首先忽視了兩類重要讀段,即接合區(qū)讀段和噪聲讀段對結(jié)果的重要影響。同時,對小外顯子沒有采取讀段數(shù)目歸一化且由于外顯子分割成探針而帶來外顯子尾部不足一個探針部分信息丟失,并且沒有考慮由于噪聲和未知轉(zhuǎn)錄本的存在對已知轉(zhuǎn)錄本表達值的推斷產(chǎn)生影響。針對LDASeq模型存在的這些問題,本文對LDASeq方法進行改進。改進的方法舍棄“偽探針”直接對外顯子進行長度歸一化,減小了探針引入所帶來的信息丟失,并且增加了對接合區(qū)讀段和噪聲讀段的處理。本文通過采用兩個真實數(shù)據(jù)集對所提出的改進方法在基因和異構(gòu)體表達水平計算精度上進行了驗證。

    1 DASeqⅡ方法設(shè)計

    1.1 LDASeq模型

    基于RNA-Seq數(shù)據(jù)和文本數(shù)據(jù)在結(jié)構(gòu)上的相似性,文獻[17]提出了LDASeq模型。LDASeq是基于LDA(Latent Dirichlet allocation)模型[18]的一個3層貝葉斯網(wǎng)絡(luò)模型,如圖1所示。LDASeq模型引入固定長度的探針,將探針和單詞概念對應(yīng),探針上讀段的匹配個數(shù)看作單詞在文檔中出現(xiàn)的頻數(shù)。單個通道下一個基因的N個探針上的讀段對應(yīng)一篇文檔,若干個異構(gòu)體看作文檔的隱含主題,α是一個超參數(shù),模型中引入隱含變量θ,θ是一個向量,符合參數(shù)為α的狄利克雷分布,θ的各個分量反映了異構(gòu)體表達的相對強弱。模型中β是K×V矩陣,其中K表示該基因形成的剪切異構(gòu)體個數(shù),V表示該基因含有的探針個數(shù),第i(1≤i≤K)行第j(1≤j≤V)個分量表示第i個剪切異構(gòu)體是否含有第j個探針,因此每個基因?qū)?yīng)一個β矩陣。將β矩陣進行歸一化作為模型的輸入,文獻[17]中描述了β矩陣的產(chǎn)生過程。

    LDASeq模型對每個基因模擬RNA-Seq數(shù)據(jù)的產(chǎn)生過程如下:(1) 根據(jù)狄利克雷分布為每個通道產(chǎn)生θl~Dirichlet(α);(2) 對于通道l,根據(jù)多項分布產(chǎn)生異構(gòu)體isoformn。isoformn~Multinomial(θl);(3) 在異構(gòu)體isoformn條件下,根據(jù)多項分布產(chǎn)生探針proben,proben~Multinomial(β)。

    圖1 LDASeq圖模型表示Fig.1 Graphic model representation of LDASeq

    文獻[17]對該模型使用變分最大期望算法(Expectation maximization,EM)來計算。模型求解得到參數(shù)θ(θ~Dirichlet(α)),每個分量代表著一個異構(gòu)體表達比重,然后將基因每個探針上映射的讀段計數(shù)按這個比重分配給對應(yīng)的異構(gòu)體。采用文獻[5]中的RPKM異構(gòu)體表達式計算每個異構(gòu)體表達值,將一個基因所對應(yīng)的所有異構(gòu)體表達值求和即可得到該基因表達值[9]。

    1.2 LDASeqⅡ模型

    針對LDASeq模型存在的一些缺點,本文對其進行了改進, 將改進后的方法記為LDASeqⅡ(Improment of latent Dirichilet allocation for sequencing data),改進后模型如圖2所示。與原有模型相比:(1) 舍棄原模型探針概念,將外顯子與單詞對應(yīng)。為了減小不同外顯子長度對讀段數(shù)目的偏好,改進方法中將讀段數(shù)目按照外顯子長度歸一化,即單位外顯子長度上讀段個數(shù)作為單詞出現(xiàn)次數(shù)。(2) 為了處理由未知轉(zhuǎn)錄本和測序錯誤等產(chǎn)生的噪聲讀段和帶有重要剪切信息的接合區(qū)讀段,對每個基因所屬異構(gòu)體結(jié)構(gòu)進行擴展,增加偽異構(gòu)體和偽外顯子。

    圖2 LDASeqⅡ圖模型表示Fig.2 Graphic model representation of LDASeqⅡ

    1.2.1 偽外顯子的設(shè)計

    圖3以基因G為例說明偽外顯子構(gòu)造過程。首先,擴充該基因的外顯子集合。對于基因G,原有外顯子集合記為F={e1,e2,e3,e4},由圖3結(jié)構(gòu)關(guān)系可知,該基因發(fā)生了選擇性剪接形成兩個轉(zhuǎn)錄本。由轉(zhuǎn)錄本1可知,基因外顯子e1與外顯子e3之間發(fā)生選擇性剪接,因此在e1與e3之間構(gòu)造一個接合區(qū)記為e1-e3,作為偽外顯子加入集合F,這樣基因G外顯子集合F={e1,e2,e3,e4,e1-e3}。由轉(zhuǎn)錄本2可知,基因在外顯子e1與外顯子e2之間、外顯子e2與外顯子e4之間發(fā)生選擇性剪接,因此分別在e1與e2之間、e2與e4之間構(gòu)造接合區(qū)e1-e2,e2-e4,集合F中不含有元素e1-e2和e2-e4,因此將這兩個元素作為偽外顯子加入集合F,這樣集合F變?yōu)閧e1,e2,e3,e4,e1-e3,e1-e2,e2-e4}。

    圖3 外顯子和讀段之間關(guān)系Fig.3 Relationship between exons and reads

    接下來構(gòu)造新的轉(zhuǎn)錄本與外顯子映射關(guān)系。擴增后的基因外顯子集合F={e1,e2,e3,e4,e1-e3,e1-e2,e2-e4}。根據(jù)注釋信息可知,轉(zhuǎn)錄本1包含外顯子子集記為f1={e1,e3,e1-e3},轉(zhuǎn)錄本2包含外顯子子集記為f2={e1,e2,e4,e1-e2,e2-e4}。這樣,改造后的基因G和轉(zhuǎn)錄本參考結(jié)構(gòu)如圖4所示。當統(tǒng)計外顯子讀段時,比如讀段1,完全落在外顯子e3上,那么將e3上讀段數(shù)目加1;而對于讀段2,落在外顯子e1與外顯子e2接合處,因此,將偽外顯子e1-e2上讀段數(shù)加1,其他讀段作類似統(tǒng)計。

    圖4 增加偽外顯子、偽異構(gòu)體后的基因結(jié)構(gòu)圖Fig.4 Gene structure of adding ″pseudo-exon″ and ″pseudo-transcript″

    1.2.2 偽轉(zhuǎn)錄本的引入

    由于現(xiàn)有基因注釋信息的不全面,沒有包含那些尚未發(fā)現(xiàn)但已經(jīng)存在的的轉(zhuǎn)錄本,另外,RNA-Seq數(shù)據(jù)中還存在由于測序錯誤等產(chǎn)生的其他噪聲讀段。考慮到這兩類噪聲讀段對于已知轉(zhuǎn)錄本表達水平的影響,試圖在建模中加以矯正。通過改變每個基因所對應(yīng)的β的初始值,即對于每個基因,嘗試增加一條特殊的轉(zhuǎn)錄本參與優(yōu)化,將那些噪聲讀段看作這條特殊轉(zhuǎn)錄本所產(chǎn)生。對于圖3中的基因G,模型中嘗試引入了一條偽異構(gòu)體帶表這條基因尚未發(fā)現(xiàn)的剪切異構(gòu)體,圖4中即為基因G引入了偽異構(gòu)體。這條異構(gòu)體含有基因外顯子集合F中所有的外顯子。文章[17]描述了β矩陣產(chǎn)生規(guī)則。在對基因結(jié)構(gòu)進行擴增即增加了偽外顯子和偽轉(zhuǎn)錄本后,β產(chǎn)生規(guī)則不變。圖4所示擴增結(jié)構(gòu)后基因?qū)?yīng)的β矩陣初始值的產(chǎn)生過程

    (1)

    1.2.3 歸一化的改進

    對于圖4中擴增結(jié)構(gòu)后的基因G′,該基因含有的7個外顯子對應(yīng)7個單詞。為了減小由于外顯子長度不同導(dǎo)致外顯子上讀段數(shù)目的偏好,將每個外顯子上讀段數(shù)目除以該外顯子長度,取單位長度上的讀段個數(shù)作為單詞出現(xiàn)頻數(shù)。對于基因G′原有的真實外顯子,即{e1,e2,e3,e4},歸一化長度取真實長度-讀段長度,對于個別讀段小于讀段長度的小外顯子,將上面的讀段統(tǒng)計到相鄰的接合區(qū),無需歸一化;對于新構(gòu)造的偽外顯子{e1-e3,e1-e2,e2-e4},歸一化長度取讀段長度。對于雙末端讀段數(shù)據(jù),由于讀段片段長度不定,實驗中取其平均長度。

    2 實驗過程及結(jié)果

    2.1 數(shù)據(jù)處理流程

    由于增加了對接合區(qū)讀段、噪聲讀段的處理,改進后方法的的數(shù)據(jù)處理過程與LDASeq方法[17]有所不同,整個處理過程如圖5所示。

    圖5 LDASeqⅡ處理流程Fig.5 Processing of LDASeqⅡ

    處理過程為:第1步,用序列比對軟件將讀段比對到轉(zhuǎn)錄組上;第2步, 根據(jù)注釋信息,擴充基因外顯子集合、轉(zhuǎn)錄本集合;第3步,根據(jù)擴充后的基因結(jié)構(gòu),寫出基因?qū)?yīng)的β矩陣并歸一化;第4步,統(tǒng)計基因各個外顯子以及偽外顯子上面的讀段數(shù);第5步,將第3步和第4步的數(shù)據(jù)作為模型輸入,計算轉(zhuǎn)錄本和基因表達值。

    2.2 實驗數(shù)據(jù)集

    本文使用兩個真實數(shù)據(jù)集對LDASeqII的計算性能進行驗證,分別為人類大腦雙末端數(shù)據(jù)集[19]和人類乳腺癌數(shù)據(jù)集(Human breast cancer, HBC)[20]。人類大腦數(shù)據(jù)集來自美國食品藥品管理局聯(lián)合全球多家研究機構(gòu)舉辦的基因芯片質(zhì)量控制(Microarray quality control, MAQC)項目[19]。該數(shù)據(jù)集包含1 000個經(jīng)過定量反轉(zhuǎn)錄聚合酶鏈式反應(yīng)(Quantificational real-time polymerase chain reaction, qRT-PCR)實驗驗證的基因,這些結(jié)果可以作為基因表達水平計算結(jié)果的判別標準。人類乳腺癌數(shù)據(jù)集[20]包含兩個實驗條件,即乳腺癌細胞(Human breast cancer cell line, MCF-7)和正常乳腺細胞(Normal cell line, HME)。文獻[21]也采用了該數(shù)據(jù)集,并提供了經(jīng)過驗證的4個多異構(gòu)體基因共8個轉(zhuǎn)錄本在不同條件下的表達調(diào)控值。這些結(jié)果可以作為驗證轉(zhuǎn)錄本表達計算性能的一個標準。

    2.3 基因水平上的驗證結(jié)果

    在人類大腦雙末端數(shù)據(jù)集上,LDASeqⅡ共計算出740個多異構(gòu)體基因的表達值,并求出了表達值與qRT-PCR結(jié)果的相關(guān)系數(shù),將結(jié)果與改進前的LDASeq, Cufflinks和RSEM這3種方法求出的相關(guān)系數(shù)作比較,各種方法的相關(guān)性如表1所示。從表中可以看出,LDASeqⅡ相比其他3種方法獲得了最高相關(guān)系數(shù),基因表達水平獲得了較準確的計算結(jié)果。

    表1 不同方法在MAQC數(shù)據(jù)集上的處理結(jié)果對比

    2.4 轉(zhuǎn)錄本水平上的驗證結(jié)果

    在人類乳腺癌數(shù)據(jù)集上,LDAseqⅡ, Cufflinks, RSEM和LDASeq這4種方法分別計算,經(jīng)過qRT-PCR實驗驗證的8個轉(zhuǎn)錄本在HME和MCF-7兩個條件下的表達水平和表達值變化方向調(diào)控值,將結(jié)果與qRT-PCR結(jié)果進行對比,如表2所示。

    表2 人類乳腺癌數(shù)據(jù)集各方法計算結(jié)果

    表2顯示了同一轉(zhuǎn)錄本在不同實驗條件、同一基因的不同轉(zhuǎn)錄本在同一實驗條件下表達值的變化方向,共16種表達調(diào)控關(guān)系。“+”表示在相應(yīng)的比較條件中轉(zhuǎn)錄本表達上調(diào),“-”表示下調(diào),括號中的數(shù)字表示調(diào)控的對數(shù)倍數(shù)。表2的最后兩行顯示了各種計算方法得到的調(diào)控方向與qRT-PCR結(jié)果不一致的比較次數(shù),以及16個對數(shù)倍數(shù)與qRT-PCR結(jié)果的相關(guān)系數(shù)。調(diào)控方向反映模型在定性計算上與qRT-PCR結(jié)果的一致性,從表中可以看出,只有LDASeqⅡ計算出的16個調(diào)控方向和qRT-PCR計算出的方向完全一致,而Cufflinks, RSEM和LDASeq方法的調(diào)控方向錯誤個數(shù)分別為4,5和1。LDASeqⅡ方法在保持調(diào)控方向與qRT-PCR結(jié)果一致的情況下,相關(guān)系數(shù)達到0.733 8。由此可以看出,改進后的方法即LDAseqⅡ,在人類乳腺癌數(shù)據(jù)集上獲得了相比其他方法更為準確的轉(zhuǎn)錄本表達水平計算結(jié)果。

    3 結(jié)束語

    本文針對已有的LDASeq模型存在的一些缺點進行改進,提出了LDASeqⅡ方法來計算基因及轉(zhuǎn)錄本表達值。模型打破了讀段在參考序列上均勻分布這一常用假設(shè),通過統(tǒng)計基因外顯子和接合區(qū)上讀段數(shù)目,利用轉(zhuǎn)錄本的結(jié)構(gòu)信息構(gòu)造初始化β矩陣對模型參數(shù)進行約束,優(yōu)化不同轉(zhuǎn)錄本下各個外顯子表達強弱,最終估計每個轉(zhuǎn)錄本的表達比重,較好地解決了轉(zhuǎn)錄本表達的計算問題。LDASeqⅡ方法在LDASeq的基礎(chǔ)上,改進了讀段數(shù)目歸一化方法,增加了對接合區(qū)讀段、噪聲讀段的處理,實驗表明,改進后的模型獲得了較優(yōu)的計算性能。相比其他大多數(shù)計算轉(zhuǎn)錄本表達值方法的創(chuàng)新之處在于模型中通過嘗試引入未知異構(gòu)體,減小了噪聲讀段對已知異構(gòu)體表達結(jié)果的影響,可以作為提高轉(zhuǎn)錄本表達研究性能的一個借鑒。本文在構(gòu)造特殊外顯子時,假設(shè)它含有基因的所有外顯子,在后續(xù)工作中,可以嘗試隨機分配外顯子或者根據(jù)基因已知的選擇性剪接信息,讓模型自學(xué)習(xí)未知的轉(zhuǎn)錄本結(jié)構(gòu)。另外,接合區(qū)讀段包含選擇性剪切的重要信息,通過對該區(qū)域讀段的處理,可以提高異構(gòu)體表達水平的計算準確性,本文方法對接合區(qū)讀段單獨處理,充分保留了該區(qū)域讀段帶有的選擇性剪接信息。對于接合區(qū)長度,實驗中采用一個讀段長度,也可以根據(jù)接合區(qū)兩端的外顯子長度按比例設(shè)定接合區(qū)的長度,在后續(xù)工作中會進一步驗證該方法的實際效果。

    [1] Wang Z, Gerstein M, Snyder M.RNA-Seq: A revolutionary tool for transcriptomics [J].Nature Reviews Genetics, 2009, 10(1): 57-63.

    [2] Denoeud F, Aury J M, Da Silva C, et al.Annotating genomes with massive scale RNA sequencing[J]. Genome Biol, 2008, 9(12):R175.

    [3] Garber M, Grabherr M G, Guttman M, et al.Computational methods for transcriptome annotation and quantification using RNA-Seq[J].Nature Methods, 2011, 8(6): 469-477.

    [4] Marguerat S, Bahler J.RNA-seq: From technology to biology[J].Cell Mol Life Sci, 2010, 67: 569-579.

    [5] Mortazavi A, Williams B A, Mccue K, et al. Mapping and quantifying mammalian transcriptomes by RNA-Seq[J]. Nature Methods, 2008, 5(7): 621-628.

    [6] Pan Q, Shai O, Lee L J, et al.Deep surveying of alternative splicing complexity in the human transcriptome by high-throughput sequencing [J].Nature Genetices, 2008, 40(12): 1413-1415.

    [7] Turro E, Su S Y, Goncalves, et al. Haplotype and isoform specific expression estimation using multi-mapping RNA-Seq reads [J]. Genome Biology, 2011, 12: R13.

    [8] Jiang Hui, Wong Winghung. Statistical inferences for isoform expression in RNA-Seq [J]. Bioinformatics, 2009, 25(8): 1026-1032.

    [9] Trapnell C, Williams B A, Pertea G, Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation[J]. Nat Biotechnol, 2010(5): 511-515.

    [10]Li B, Ruotti V, Stewart R M, et al.RNA-Seq gene expression estimation with read mapping uncertainty [J]. Bioinformatics, 2010, 26(4): 493-500.

    [11]Li B, Dewey C N.RSEM: Accurate transcript quantification from RNA-Seq data with or without a reference genome[J].BMC Bioinformatics, 2011, 12: 323.

    [12]Glaus P, Honkela A, Rattray M.Identifying differentially expressed transcripts from RNA-Seq data with biological variation[J].Bioinformatics, 2012, 28(3): 1721-1728.

    [13]Pepke S, Wold B, Mortazavi A.Computation for ChIP-Seq and RNA-Seq studies[J].Nature Methods Supplement, 2009, 6: S22-S32.

    [14]Dohm J C, Lottaz C, Borodina T, Substantial biases in ultra-short read data sets from high-throughput DNA sequencing[J].Nucleic Acids Res, 2008(16): e105.

    [15]Li J, Jiang H, Wong W H.Modeling non-uniformity inshort-read rates in RNA-Seq data[J].Genome Biol, 2010(5): R50.

    [16]Hansen K D, Brenner S E, Dudoit S.Biases in illumina transcriptome sequencing caused by random hexamer priming[J]. Nucleic Acids Research, 2010, 38(12): e131.

    [17]劉學(xué)軍,李蒙,張禮.一種針對RNA-Seq數(shù)據(jù)的基因異構(gòu)體表達水平計算方法[J].中國生物醫(yī)學(xué)工程學(xué)報,2013,7(4): 454-463.

    Liu Xuejun, Li Meng, Zhang Li.A method of isoform expression calculation for RNA-Seq data[J].Chinese Journal of Biomedical Engineering,2013,7(4): 454-463.

    [18]Blei D M, Ng A Y, Jordan M I.Latent Dirichlet allocation[J].Journal of Machine Learning Research, 2003, 3: 993-1022.

    [19]Shi L, Reid L H, Jones W D, et al. The microarry quality control(MAQC) project shows inter- and intraplatform reproducibility of gene expression measurements[J].Nat Biotechnol, 2006, 24(9): 1151-1161.

    [20]Wang E T, Sandberg R, Luo S J, et al.Alternative isoform regulation in human tissue transcriptomes[J].Nature, 2008, 456(7221): 470-476.

    [21]Kim H, Bi Y T, Pal S, et al.IsoformEx: Isoform level gene expression estimation using weighted non-negative least squares from mRNA-Seq data[J].BMC Bioinformatics, 2011, 12: 305.

    Improved Trancriptome Expression Analysis for RNA-Seq Data

    Shi Xinxin, Liu Xuejun, Zhang Li

    (College of Computer Science and Technology, Nanjing University of Aeronautics and Astronautics, Nanjing, 210016, China)

    RNA-Seq(RNA-sequencing), based on high-throughput sequencing, is a new technique for transcriptome research.Considering the difficulties in the analysis of transcript expression using RNA-Seq data, an improved method, improvement of latent dirichlet allocation for sequencing data(LDASeqⅡ) is proposed to calculate the transcript expression.To deal with multi-mappings between reads and isoforms and non-uniform distribution of reads along reference, LDASeqⅡ utilizes the known gene-isoform annotation to constrain the hyperparameters and normalizes the read counts by exon length for each individual exon.By introducing ″pseudo-exon″ and ″pseudo-transcript″, the conjunction reads and noise reads gain proper treatments.LDASeqⅡ is validated using two real datasets on gene and transcript expression calculation and compared with latent dirichlet allocation for sequencing data(LDASeq) and other two popular methods Cufflinks and RNA-Seq by expectation maximization(RSEM). The results show that LDASeqⅡ obtains more accurate transcript and gene expression measurements than other approaches.

    gene expression; RNA-Seq; transcript expression; multi-mapping; non-uniformity

    國家自然科學(xué)基金(61170152)資助項目;中央高?;究蒲袠I(yè)務(wù)費專項(CXZZ11_0217)資助項目。

    2014-05-30;

    2014-06-25

    TP391.9

    A

    石新新(1989-),女,碩士研究生,研究方向:生物信息學(xué),E-mail: shixinxin61@126.com。

    劉學(xué)軍(1976-),女,博士,教授,研究方向:機器學(xué)習(xí)與生物信息學(xué)。

    張禮(1985-),男,博士,研究方向:生物信息學(xué)。

    猜你喜歡
    異構(gòu)體外顯子探針
    跨域異構(gòu)體系對抗聯(lián)合仿真試驗平臺
    外顯子跳躍模式中組蛋白修飾的組合模式分析
    簡析旋光異構(gòu)體平面分析和構(gòu)象分析的一致性
    云南化工(2021年8期)2021-12-21 06:37:38
    外顯子組測序助力產(chǎn)前診斷胎兒骨骼發(fā)育不良
    外顯子組測序助力產(chǎn)前診斷胎兒骨骼發(fā)育不良
    多通道Taqman-探針熒光定量PCR鑒定MRSA方法的建立
    利奈唑胺原料藥中R型異構(gòu)體的手性HPLC分析
    BOPIM-dma作為BSA Site Ⅰ特異性探針的研究及其應(yīng)用
    CPU+GPU異構(gòu)體系混合編程模式研究
    透射電子顯微鏡中的掃描探針裝置
    物理實驗(2015年9期)2015-02-28 17:36:47
    麻豆国产av国片精品| 男人舔奶头视频| 国产亚洲精品久久久久久毛片| 中文亚洲av片在线观看爽| 中文字幕精品亚洲无线码一区| 欧美激情在线99| 日韩av不卡免费在线播放| 国产 一区精品| 日日摸夜夜添夜夜添小说| 看黄色毛片网站| 久久亚洲国产成人精品v| 伦理电影大哥的女人| 波多野结衣巨乳人妻| 亚洲欧美日韩高清在线视频| 日日摸夜夜添夜夜添av毛片| 一区二区三区高清视频在线| 日韩欧美一区二区三区在线观看| 日韩中字成人| 有码 亚洲区| 丰满人妻一区二区三区视频av| 国语自产精品视频在线第100页| 国产精品电影一区二区三区| 国产成人91sexporn| 亚洲中文字幕一区二区三区有码在线看| 亚洲最大成人中文| 午夜福利在线观看吧| 在线观看一区二区三区| av在线老鸭窝| 夜夜夜夜夜久久久久| 欧美精品国产亚洲| 日本黄色视频三级网站网址| 国产毛片a区久久久久| 又黄又爽又刺激的免费视频.| 日日干狠狠操夜夜爽| 激情 狠狠 欧美| 国内揄拍国产精品人妻在线| 又粗又爽又猛毛片免费看| 亚洲av五月六月丁香网| av天堂中文字幕网| 又粗又爽又猛毛片免费看| 国产三级在线视频| 国产精品,欧美在线| 免费观看人在逋| 国产欧美日韩一区二区精品| 国内久久婷婷六月综合欲色啪| 如何舔出高潮| 国产欧美日韩精品一区二区| 国产视频一区二区在线看| 高清毛片免费看| 真实男女啪啪啪动态图| .国产精品久久| 91午夜精品亚洲一区二区三区| 村上凉子中文字幕在线| 天堂动漫精品| 久久天躁狠狠躁夜夜2o2o| 国产成人影院久久av| 日本撒尿小便嘘嘘汇集6| 十八禁国产超污无遮挡网站| 如何舔出高潮| 人妻丰满熟妇av一区二区三区| 天堂av国产一区二区熟女人妻| 亚洲,欧美,日韩| 国产极品精品免费视频能看的| 2021天堂中文幕一二区在线观| 日本免费一区二区三区高清不卡| 99久久精品热视频| 亚洲18禁久久av| 露出奶头的视频| 插阴视频在线观看视频| 久久精品国产亚洲网站| 成人一区二区视频在线观看| 在线播放无遮挡| 人妻制服诱惑在线中文字幕| av天堂在线播放| eeuss影院久久| 舔av片在线| 国产成人影院久久av| 桃色一区二区三区在线观看| 亚洲性久久影院| 三级国产精品欧美在线观看| 亚洲av中文av极速乱| 久久久成人免费电影| or卡值多少钱| 天堂√8在线中文| 少妇被粗大猛烈的视频| 亚洲最大成人av| 国产欧美日韩一区二区精品| 国产综合懂色| 日本熟妇午夜| av国产免费在线观看| 欧美一区二区国产精品久久精品| 好男人在线观看高清免费视频| 国产又黄又爽又无遮挡在线| 国产精品亚洲美女久久久| 老女人水多毛片| 国产精品美女特级片免费视频播放器| 美女cb高潮喷水在线观看| 成人鲁丝片一二三区免费| 成人精品一区二区免费| 九九在线视频观看精品| 欧美三级亚洲精品| 变态另类成人亚洲欧美熟女| 成熟少妇高潮喷水视频| 1024手机看黄色片| 国模一区二区三区四区视频| 一级毛片我不卡| 国产探花极品一区二区| 久久久a久久爽久久v久久| 中文在线观看免费www的网站| 天堂av国产一区二区熟女人妻| 国产精品电影一区二区三区| 别揉我奶头 嗯啊视频| 晚上一个人看的免费电影| 18禁裸乳无遮挡免费网站照片| 一进一出好大好爽视频| 激情 狠狠 欧美| 一级毛片久久久久久久久女| 一边摸一边抽搐一进一小说| 别揉我奶头~嗯~啊~动态视频| 成年女人毛片免费观看观看9| 久久精品久久久久久噜噜老黄 | 一级毛片久久久久久久久女| 久久人人爽人人爽人人片va| 亚洲成人av在线免费| 麻豆一二三区av精品| 丝袜喷水一区| 狠狠狠狠99中文字幕| 久久亚洲精品不卡| 日韩国内少妇激情av| 亚洲av成人精品一区久久| 天堂影院成人在线观看| 日韩亚洲欧美综合| 国产精品美女特级片免费视频播放器| 免费在线观看成人毛片| 秋霞在线观看毛片| 午夜免费激情av| 欧美zozozo另类| 一边摸一边抽搐一进一小说| 午夜福利视频1000在线观看| 卡戴珊不雅视频在线播放| 搡老岳熟女国产| 午夜a级毛片| 成年女人永久免费观看视频| 国产精品一区www在线观看| 淫妇啪啪啪对白视频| 中文资源天堂在线| 精华霜和精华液先用哪个| 久久综合国产亚洲精品| 亚洲人成网站在线播| 日本熟妇午夜| 搡老岳熟女国产| 一级毛片电影观看 | 国产精品综合久久久久久久免费| 国产探花极品一区二区| 亚洲精华国产精华液的使用体验 | 成人高潮视频无遮挡免费网站| 国产成人一区二区在线| av在线亚洲专区| 日韩成人伦理影院| 国产精品99久久久久久久久| 日韩国内少妇激情av| 亚洲专区国产一区二区| 欧美日韩综合久久久久久| 三级经典国产精品| 国产老妇女一区| 精品一区二区三区人妻视频| 国产一级毛片七仙女欲春2| 精品少妇黑人巨大在线播放 | 晚上一个人看的免费电影| 亚洲一级一片aⅴ在线观看| 亚洲国产精品合色在线| 99热精品在线国产| 久久久国产成人精品二区| 人妻久久中文字幕网| 校园春色视频在线观看| 精品午夜福利视频在线观看一区| 国产av不卡久久| 我的老师免费观看完整版| 午夜免费男女啪啪视频观看 | 国产精品免费一区二区三区在线| 亚洲欧美日韩无卡精品| 久久天躁狠狠躁夜夜2o2o| 夜夜夜夜夜久久久久| 特大巨黑吊av在线直播| 熟女电影av网| 一边摸一边抽搐一进一小说| 美女cb高潮喷水在线观看| 成人美女网站在线观看视频| 亚洲无线在线观看| 久久人人爽人人爽人人片va| 波野结衣二区三区在线| 国产 一区 欧美 日韩| 国产伦精品一区二区三区四那| 国产精品99久久久久久久久| 男人和女人高潮做爰伦理| 亚洲人与动物交配视频| 晚上一个人看的免费电影| 免费av观看视频| 在线观看免费视频日本深夜| 五月伊人婷婷丁香| 美女大奶头视频| 美女黄网站色视频| 男人的好看免费观看在线视频| 欧美成人免费av一区二区三区| 日本在线视频免费播放| 久久久欧美国产精品| 免费人成在线观看视频色| 99精品在免费线老司机午夜| 伦理电影大哥的女人| 日韩一区二区视频免费看| 噜噜噜噜噜久久久久久91| 久久精品影院6| 久久这里只有精品中国| 嫩草影视91久久| 日韩一区二区视频免费看| 国内精品宾馆在线| 精品欧美国产一区二区三| 69人妻影院| 超碰av人人做人人爽久久| 国产欧美日韩精品亚洲av| 色吧在线观看| 97在线视频观看| 欧美成人a在线观看| 露出奶头的视频| 天堂动漫精品| 久久久精品94久久精品| 欧美一区二区国产精品久久精品| 亚洲av一区综合| 毛片女人毛片| 一级av片app| 男女那种视频在线观看| 久久亚洲国产成人精品v| 网址你懂的国产日韩在线| 久久热精品热| 久久99热这里只有精品18| 国产一区二区激情短视频| 欧美zozozo另类| 国产人妻一区二区三区在| 秋霞在线观看毛片| 蜜桃久久精品国产亚洲av| 波多野结衣巨乳人妻| 亚洲精品日韩av片在线观看| 一区二区三区免费毛片| a级一级毛片免费在线观看| 两个人的视频大全免费| 久久韩国三级中文字幕| 久久亚洲国产成人精品v| 国产精品一及| 久久精品国产99精品国产亚洲性色| 精品福利观看| 亚洲最大成人av| 久久草成人影院| av.在线天堂| 国产黄色小视频在线观看| 一本精品99久久精品77| 亚洲激情五月婷婷啪啪| 午夜老司机福利剧场| 精品久久久久久久人妻蜜臀av| www日本黄色视频网| 久久久色成人| 人妻制服诱惑在线中文字幕| 深夜精品福利| 日韩欧美免费精品| 日韩欧美免费精品| 国产精品爽爽va在线观看网站| 99热精品在线国产| 欧美潮喷喷水| 女人十人毛片免费观看3o分钟| 免费大片18禁| 国产一区二区三区在线臀色熟女| 国产白丝娇喘喷水9色精品| 成人美女网站在线观看视频| 日韩在线高清观看一区二区三区| 午夜福利在线观看免费完整高清在 | 国产综合懂色| 日日撸夜夜添| 亚洲av成人av| 国产男人的电影天堂91| 我的女老师完整版在线观看| 亚洲精品粉嫩美女一区| 国产黄色小视频在线观看| 国产一区二区在线av高清观看| 国产精品免费一区二区三区在线| 色在线成人网| 日韩在线高清观看一区二区三区| 亚洲中文日韩欧美视频| 99热全是精品| 久久久久精品国产欧美久久久| 国产高清三级在线| 欧美高清成人免费视频www| 黄色欧美视频在线观看| 网址你懂的国产日韩在线| 国产不卡一卡二| 久久综合国产亚洲精品| 三级毛片av免费| 观看免费一级毛片| 黄色配什么色好看| 99国产极品粉嫩在线观看| 长腿黑丝高跟| 日本一二三区视频观看| 国产久久久一区二区三区| 波多野结衣巨乳人妻| 精品人妻偷拍中文字幕| av国产免费在线观看| 搡老岳熟女国产| 成人漫画全彩无遮挡| 97热精品久久久久久| 黄色视频,在线免费观看| 欧美一区二区亚洲| 亚洲自偷自拍三级| 六月丁香七月| 极品教师在线视频| 老司机影院成人| 国产精品一区www在线观看| 久久国产乱子免费精品| 国产蜜桃级精品一区二区三区| 久久久久久伊人网av| 欧美zozozo另类| 欧美极品一区二区三区四区| 91狼人影院| 午夜福利在线在线| 一个人观看的视频www高清免费观看| 久久久a久久爽久久v久久| 国产精品永久免费网站| 免费黄网站久久成人精品| 精品一区二区三区视频在线观看免费| 久久久久久久午夜电影| 欧美成人免费av一区二区三区| 国语自产精品视频在线第100页| 亚洲综合色惰| 久久午夜亚洲精品久久| av专区在线播放| 亚洲美女黄片视频| 国产高清有码在线观看视频| 亚洲av电影不卡..在线观看| 国产黄片美女视频| 国产一区亚洲一区在线观看| 桃色一区二区三区在线观看| 久久久久国产精品人妻aⅴ院| 国产精品国产三级国产av玫瑰| 国产欧美日韩一区二区精品| 亚洲国产日韩欧美精品在线观看| 久久精品久久久久久噜噜老黄 | 搞女人的毛片| 国产私拍福利视频在线观看| 国产欧美日韩一区二区精品| 内射极品少妇av片p| 国产蜜桃级精品一区二区三区| 美女 人体艺术 gogo| 亚洲无线观看免费| 免费av毛片视频| 97碰自拍视频| 国产一区二区三区在线臀色熟女| av黄色大香蕉| 99热网站在线观看| 国产精品麻豆人妻色哟哟久久| 亚洲激情五月婷婷啪啪| 国产日韩欧美视频二区| 性色av一级| 女人久久www免费人成看片| 丰满乱子伦码专区| 夜夜爽夜夜爽视频| www.色视频.com| 亚洲av综合色区一区| 国产午夜精品久久久久久一区二区三区| 午夜老司机福利剧场| 精品一区二区三卡| 少妇人妻 视频| 久久久久国产精品人妻一区二区| 欧美激情国产日韩精品一区| 777米奇影视久久| www.色视频.com| 在线观看三级黄色| 99精国产麻豆久久婷婷| 免费高清在线观看视频在线观看| 丰满乱子伦码专区| 18禁裸乳无遮挡动漫免费视频| 国产精品福利在线免费观看| 国产极品粉嫩免费观看在线 | 18禁在线无遮挡免费观看视频| 日韩中文字幕视频在线看片| 亚洲精品日本国产第一区| 久久这里有精品视频免费| 91午夜精品亚洲一区二区三区| 精品一区在线观看国产| 青春草亚洲视频在线观看| 亚洲四区av| 国产亚洲av片在线观看秒播厂| 免费观看在线日韩| 久久久国产精品麻豆| 在线观看三级黄色| 欧美日韩亚洲高清精品| 精品一区二区三卡| 国产极品天堂在线| 亚洲欧美精品专区久久| 欧美日韩视频高清一区二区三区二| 国产成人精品一,二区| 亚洲经典国产精华液单| 99久久精品热视频| 观看美女的网站| 韩国av在线不卡| 国产高清有码在线观看视频| 麻豆精品久久久久久蜜桃| 高清在线视频一区二区三区| 日本黄大片高清| 卡戴珊不雅视频在线播放| 中文字幕亚洲精品专区| 国产精品.久久久| 男的添女的下面高潮视频| 黑人高潮一二区| 精品一区在线观看国产| 如何舔出高潮| 18+在线观看网站| 十八禁网站网址无遮挡 | 多毛熟女@视频| 国产成人a∨麻豆精品| 国产中年淑女户外野战色| 熟女av电影| 日本黄大片高清| 国产精品三级大全| 国产乱来视频区| 久久久久久久久久久免费av| 七月丁香在线播放| 免费观看性生交大片5| 亚洲精品国产av蜜桃| 十八禁网站网址无遮挡 | 日本黄色日本黄色录像| 综合色丁香网| 国产午夜精品久久久久久一区二区三区| 99九九线精品视频在线观看视频| 老熟女久久久| 一级毛片黄色毛片免费观看视频| 国产熟女午夜一区二区三区 | 亚洲激情五月婷婷啪啪| 高清黄色对白视频在线免费看 | 精品一区二区三区视频在线| 十八禁高潮呻吟视频 | 亚洲精品自拍成人| 啦啦啦中文免费视频观看日本| 在线观看人妻少妇| 黄色一级大片看看| 亚洲性久久影院| 2022亚洲国产成人精品| a级毛片免费高清观看在线播放| 人人妻人人澡人人看| av免费在线看不卡| 国产精品免费大片| 亚洲精品国产av蜜桃| 一区二区三区精品91| 国产av国产精品国产| 秋霞伦理黄片| 一级,二级,三级黄色视频| 午夜福利影视在线免费观看| 人人妻人人澡人人爽人人夜夜| 欧美精品人与动牲交sv欧美| 国产成人a∨麻豆精品| 99久久人妻综合| 久久精品熟女亚洲av麻豆精品| 99久久精品热视频| 寂寞人妻少妇视频99o| 两个人的视频大全免费| 99久久中文字幕三级久久日本| 午夜日本视频在线| 全区人妻精品视频| 久久精品国产亚洲av涩爱| 亚洲天堂av无毛| 99久久中文字幕三级久久日本| 久久久久久久久久久久大奶| 夫妻午夜视频| 2021少妇久久久久久久久久久| 国产伦精品一区二区三区四那| 日韩成人伦理影院| 男人爽女人下面视频在线观看| 三级国产精品片| 色网站视频免费| 一级二级三级毛片免费看| 中文字幕免费在线视频6| 久久女婷五月综合色啪小说| 久久久久精品久久久久真实原创| 最近2019中文字幕mv第一页| 熟女电影av网| 亚洲精品国产色婷婷电影| 又黄又爽又刺激的免费视频.| 蜜臀久久99精品久久宅男| 欧美成人午夜免费资源| 永久免费av网站大全| 国精品久久久久久国模美| 国产av一区二区精品久久| 国产欧美另类精品又又久久亚洲欧美| 女的被弄到高潮叫床怎么办| 婷婷色麻豆天堂久久| 嫩草影院入口| 人妻一区二区av| 一区二区av电影网| 国产美女午夜福利| 国产精品一区二区在线观看99| 高清av免费在线| 性色av一级| 国产伦在线观看视频一区| av天堂中文字幕网| 国产成人freesex在线| 99久久精品热视频| 亚洲无线观看免费| 高清不卡的av网站| 天堂8中文在线网| 日韩制服骚丝袜av| 一级毛片电影观看| 精品人妻一区二区三区麻豆| 亚洲精品亚洲一区二区| 国产黄片视频在线免费观看| 在线观看人妻少妇| 91精品伊人久久大香线蕉| tube8黄色片| 自拍偷自拍亚洲精品老妇| 国产成人a∨麻豆精品| 欧美另类一区| 亚洲av福利一区| 在线观看人妻少妇| 久久精品国产a三级三级三级| 国产一区二区三区综合在线观看 | 在线亚洲精品国产二区图片欧美 | 亚洲欧美精品专区久久| 久久国内精品自在自线图片| 亚洲国产精品成人久久小说| 老司机亚洲免费影院| 亚洲国产精品国产精品| 熟女电影av网| 2018国产大陆天天弄谢| 久久99热这里只频精品6学生| 女性被躁到高潮视频| 久久久久久人妻| 波野结衣二区三区在线| 成人影院久久| 老熟女久久久| 偷拍熟女少妇极品色| 久久国产亚洲av麻豆专区| 麻豆精品久久久久久蜜桃| av专区在线播放| 三级经典国产精品| 亚洲精品视频女| 女的被弄到高潮叫床怎么办| 观看免费一级毛片| 亚洲欧美精品自产自拍| 久久久午夜欧美精品| 男女边摸边吃奶| 国产黄频视频在线观看| 久久综合国产亚洲精品| 一级毛片aaaaaa免费看小| 中国美白少妇内射xxxbb| 亚洲精华国产精华液的使用体验| av在线老鸭窝| 免费观看av网站的网址| 男的添女的下面高潮视频| a级毛片免费高清观看在线播放| 亚洲va在线va天堂va国产| 99热全是精品| 男女免费视频国产| 爱豆传媒免费全集在线观看| 99热全是精品| 国产免费一级a男人的天堂| 熟女电影av网| 亚洲美女视频黄频| 亚洲av男天堂| 欧美精品国产亚洲| 中文字幕亚洲精品专区| 2022亚洲国产成人精品| 在线观看美女被高潮喷水网站| 国产在视频线精品| 国产黄片美女视频| 美女大奶头黄色视频| 国产伦精品一区二区三区视频9| 国产精品免费大片| 久久久国产一区二区| 久久人妻熟女aⅴ| 亚洲不卡免费看| 国产日韩欧美在线精品| 在线天堂最新版资源| 尾随美女入室| 一本一本综合久久| 色网站视频免费| 男人添女人高潮全过程视频| 免费观看av网站的网址| 亚洲欧美清纯卡通| 老司机亚洲免费影院| 午夜视频国产福利| 极品人妻少妇av视频| 婷婷色综合大香蕉| 又粗又硬又长又爽又黄的视频| 欧美成人午夜免费资源| 黄色一级大片看看| 啦啦啦在线观看免费高清www| 狂野欧美白嫩少妇大欣赏| 中国美白少妇内射xxxbb| 国产乱人偷精品视频| 久久久久久久久久成人| 亚洲精品色激情综合| 三级国产精品片| 国产欧美日韩精品一区二区| 精华霜和精华液先用哪个| 美女xxoo啪啪120秒动态图| 99热这里只有是精品在线观看| 黄色欧美视频在线观看| 91精品一卡2卡3卡4卡| 校园人妻丝袜中文字幕| tube8黄色片| 自拍偷自拍亚洲精品老妇| 一本大道久久a久久精品| 久久精品国产亚洲av涩爱| 高清午夜精品一区二区三区| 久久国产亚洲av麻豆专区| 欧美高清成人免费视频www| 亚洲精品,欧美精品| 精品一区二区免费观看| av一本久久久久| 日本欧美国产在线视频|