魏金川,徐添翼,吳靜,2,宋曉峰
?
真核生物基因組長內含子遞歸剪接事件的分子機制
魏金川1,徐添翼1,吳靜1,2,宋曉峰1
1. 南京航空航天大學自動化學院,南京 211106 2. 南京醫(yī)科大學生物醫(yī)學工程與信息學院,南京 211166
在高等真核生物基因組轉錄過程中,一次剪接可完成短內含子的去除,而較長內含子(>10 kb)則需通過多次剪接方可去除。多次剪接去除長內含子的過程通常被稱為遞歸性剪接。已有研究表明,遞歸性剪接事件與諸多生物學過程及疾病的發(fā)生發(fā)展有著密切的聯(lián)系。近年來,關于遞歸性剪接的研究越來越多,研究者已經在果蠅()和多種脊椎動物基因組轉錄過程中發(fā)現(xiàn)了遞歸剪接事件,通過不同的生物信息學方法找到了多個遞歸剪接位點并進行了實驗驗證。目前國際上對遞歸性剪接的研究主要集中在遞歸剪接過程、剪接位點識別及其對生物學過程的影響等方面。本文針對真核生物基因組轉錄過程中遞歸剪接事件的分子機制和國內外研究現(xiàn)狀進行了綜述,旨在為深入理解RNA剪接過程分子機制提供參考。
遞歸剪接;套索結構;RS位點;Total RNA-seq
真核生物基因組轉錄過程是以DNA雙鏈中一條鏈為模板,經堿基互補配對得到前體mRNA,后通過對內含子與外顯子的剪接加工得到成熟的mRNA。內含子是基因編碼區(qū)中的非編碼序列,在生物體內不編碼蛋白,因此在前體mRNA轉錄加工過程中會被剪接體(spliceosome)識別并去除。起初研究者認為內含子不參與基因的表達調控,但近幾年隨著二代測序技術的發(fā)展和生物信息學工具的開發(fā),人們發(fā)現(xiàn)內含子在轉錄及基因表達調控中具有重要的生物學功能,比如:有些內含子含有增強子、啟動子或者其他的順式作用元件,對基因的表達起調控作用;內含子的剪接增加了mRNA的穩(wěn)定性;內含子還可能發(fā)生選擇性剪接事件[1~5]。
前體mRNA的剪接過程中,內含子通過兩個外顯子的連接被完全切除,這個過程需要剪接體介導。前體mRNA的剪接需要兩步實現(xiàn):第一步,靠近內含子3′端分支位點的A殘基的2′-OH對5′端的磷酸基團進行親核攻擊,形成2′→5′磷酸二酯鍵連接的套索結構;第二步,被剪接的外顯子3′端核苷酸的-OH進攻內含子3′末端的磷酸基團,使得內含子3′端在剪接位點處斷開,釋放套索結構,兩個外顯子連接[6~8]。此過程是直接去除整個內含子的,屬于一步剪接[9],但是有一些較長的內含子是經過了多步剪接來去除的。1999年,Hatton等[10]在黑腹果蠅()基因中發(fā)現(xiàn),其第1個內含子分3步去除,并將這一剪接過程命名為遞歸剪接(recu-rsive splicing) (圖1)。內含子中被剪接的核酸位點稱為遞歸性剪接位點(RS-site)。近年來研究人員發(fā)現(xiàn),除果蠅以外,遞歸剪接在其他真核生物基因組中也廣泛存在,并與疾病的發(fā)生發(fā)展有重要關系。本文對真核生物基因組中長內含子遞歸剪接分子機制的國內外研究現(xiàn)狀進行了綜述,以期為RNA的剪接研究提供參考,同時為疾病的診斷和治療提供新的 思路。
圖1 遞歸剪接示意圖
含有兩個剪接位點的內含子分步去除過程。exon1與exon2分別表示兩個相鄰外顯子,中間內含子有兩個遞歸剪接位點,灰色箭頭指向剪接位點,一共經過了3步拼接在一起。
通常內含子5′端剪接位點被稱為供體位點(donor site),3′端剪接位點被稱為受體位點(acceptor site)[11,12]。研究表明,內含子起始5′端兩對堿基和結尾3′端的兩對堿基最為保守,在所有的剪接位點中有99.24%的位點為GU-AG,0.7%的位點為GC-AG,0.05%的位點為AT-AC[13]。除了這兩對保守堿基外,它們附近的堿基雖然在不同的物種之間存在差異,但在同一物種中通常具有保守性,如在脊椎動物中5′剪接端堿基通常為AG|GUAAGU[14]。由堿基序列可以看出供體與受體間不存在堿基互補配對的可能,所以它們并不是通過堿基互補的方式拼接到一起的。外顯子轉錄是從5′端到3′端進行的,遞歸剪接就是把剪接位點處默認為含有0個核苷酸的外顯子,所以遞歸剪接位點通常為AG|GU。
遞歸剪接的具體過程大致如下[15~17]:(1)首先內含子3′端上游10~50 bp處的特定腺苷的2′羥基攻擊5′剪接位點(圖2A),形成5′-2′磷酸二酯鍵,從而構成套索結構,進而釋放5′外顯子(圖2B);(2) 5′外顯子的3′羥基攻擊內含子3′端最近的遞歸剪接位點(RS sites),釋放套索結構,與此同時,5′外顯子的3′-羥基與下游外顯子的5′端連接形成新的磷酸二酯鍵(圖2C);(3)重復前面兩個步驟,直到全部內含子去除。
針對可變剪接的研究發(fā)現(xiàn)內含子5′和3′端堿基幾乎都是GU和AG,并且內含子位點為AGGU的比例高達99.24%,所以人們對遞歸剪接位點的研究主要也主要針對AGGU型。此外,遞歸剪接在形成套索結構的過程中,在剪接位點上游第5和第6位置處的堿基基本上都為“U”,這也是尋找遞歸剪接位點的主要依據(jù)。而Kelly等[18]研究發(fā)現(xiàn)在人類()全基因組中并非所有遞歸剪接位點都是AGGU,而是AGMN(M、N分別表示A、G、C、U 4種堿基中的一種),其中AGGN的概率為44%,AGGU的概率僅為14% (表1)。因此,對于非經典(剪接位點不是AGGU)遞歸剪接位點的識別已成為當前研究的熱點問題。
圖2 遞歸剪接套索結構形成與切除示意圖
A:內含子3′端上游10~50 bp處的特定腺苷的2′羥基攻擊5′剪接位點;B:構成套索結構,釋放5′外顯子;C:釋放套索結構外顯子與遞歸剪接位點相互連接。
表1 遞歸剪接位點AGMN中M、N為各堿基概率統(tǒng)計表
遞歸性剪接位點AGMN,M與N分別對應4種堿基的概率[18]。M/N分別表示剪接位點AGMN中的M/N兩個堿基;A、C、G、U為4種堿基。
Duff等[15]對黑腹果蠅進行了轉錄組測序,并將得到的Total RNA-seq數(shù)據(jù)用Tophat[19]進行了處理。從得到的reads與全基因組匹配結果中,他們發(fā)現(xiàn)基因的轉錄是多個RNA聚合酶同時進行,所以靠近5′外顯子處的轉錄酶更多(圖3A)。存在遞歸剪接現(xiàn)象的內含子在reads的分布上存在著波峰與波谷,并且整體呈現(xiàn)鋸齒狀,這種分布模式體現(xiàn)了遞歸剪接去除內含子的機理,其理想的reads密度圖為倒三角狀(圖3B)。遞歸剪接通常存在于大于10 kb的內含子中,人類基因組中此類內含子較多,長度大于24 kb的內含子有8000個以上;大于50 kb的內含子有3400多個;而超過100 kb的內含子都有1200個以上[20,21]。Sibley等[22]對人腦組織Total RNA-seq數(shù)據(jù)進行了分析,從中發(fā)現(xiàn)了8個遞歸剪接位點,這些位點所在的內含子長度都超過150 kb。Duff等[15]用Tophat將果蠅Total RNA-seq數(shù)據(jù)與果蠅全基因組(modENCODE注釋文件)相匹配,發(fā)現(xiàn)含有剪接位點的內含子長度都大于2 kb。
近來,遞歸剪接位點的識別主要基于Total RNA-Seq數(shù)據(jù),輔以對應物種的基因組注釋數(shù)據(jù)及基因組序列信息。通常,遞歸剪接位點的識別主要分為以下4步(圖4):(1) 通過FastQC、Fastx-toolkit分別對其質量檢測、控制;(2)利用Tophat進行reads映射,得到Bam文件與Junction文件;(3)依據(jù)內含子長度、剪接位點保守性對Junction位點進行篩選;(4)將Bam文件轉換成Sam文件,并與Junction文件相結合,進而通過生物信息學方法識別遞歸剪接位點。目前,常將周邊reads分布呈鋸齒狀的位點判定為潛在的遞歸剪接位點。
圖3 Total RNA-seq數(shù)據(jù)匹配全基因組統(tǒng)計得到的結果圖
A:含遞歸剪接的基因組轉錄示意圖。AG/GU為遞歸剪接位點,曲線表示RNA轉錄情況,橢圓形表示RNA聚合酶Ⅱ,代表一條DNA鏈在同時進行多次轉錄。B:Total RNA-seq的reads密度圖。
圖4 遞歸剪接位點識別流程圖
矩形框中的是數(shù)據(jù)處理過程、用到的文件、得到的結果等。
Hatton等[10]于1998年在黑腹果蠅基因中首次發(fā)現(xiàn)了遞歸性剪接現(xiàn)象,在基因的第1個外顯子和第2個外顯子之間發(fā)現(xiàn)了新的剪接位點,并且在3′剪接位點的下游的堿基序列為GTAAGA。研究者對基因進行了深入研究,發(fā)現(xiàn)該基因第1個內含子長73 kb,該內含子的去除經歷了3次遞歸剪接[24]。
Conklin等[25]于2005年通過套索結構識別遞歸剪接位點,并于基因的第一個內含子中成功識別出Hatton等[10]找到的兩個遞歸剪接位點。針對套索結構RNA分子半衰期通常較短,且轉錄的過程不能準確把握等問題,他們通過控制PCR技術對分支連接處2′→5′磷酸二酯鍵的特異性擴增,提高了RNA套索結構分析的靈敏度。
2015年,Duff 等[15]以黑腹果蠅為材料,對其進行實驗處理,通過二代測序技術得到對應的Total RNA-seq數(shù)據(jù),然后通過Tophat/Bowtie軟件比對得到Junction位點信息,結合reads在Junction位點附近的分布信息,最終篩選出197個潛在的遞歸剪接位點。這些遞歸剪接位點分布于115個基因的130個內含子中,他們挑選了其中14個基因用作實驗驗證,證實這些基因含有24個遞歸剪接位點。對存在遞歸性剪接的基因(115 個)和內含子統(tǒng)計分析發(fā)現(xiàn),其中有100個基因只存在一個遞歸性剪接內含子,剩下的15個基因含有兩個遞歸性剪接內含子。此外,這130個內含子的剪接位點個數(shù)都在1~6之間。遞歸性剪接內含子的堿基長度為11 341~132 736 bp,內含子的平均長度為45 164 bp。進一步分析發(fā)現(xiàn),存在遞歸剪接的內含子長度都相對較長,但是并不是所有的較長內含子都存在遞歸剪接,在較長的內含子中只有大約6%存在遞歸性剪接。他們還發(fā)現(xiàn)U2AF蛋白減少會導致含有遞歸剪接的Pre-mRNA加工速率降低。
Pre-mRNA在內含子轉錄完成幾秒后就會剪切掉內含子,遞歸剪接是內含子中間片段的剪接。所以,2018年Pai等[26]利用4sU對果蠅S2細胞進行標記,分別獲取轉錄5 min、10 min、20 min的Total RNA-seq數(shù)據(jù),從中發(fā)現(xiàn)了541個遞歸剪接位點,其中實驗證明的有119個,這些位點所屬內含子長度大部分都超過40 kb。
除果蠅以外,研究者還對多種脊柱動物進行了遞歸剪接的研究,包括人、大鼠()、斑馬魚()等。
2012年,Taggart 等[27]開發(fā)了一個基于RNA套索結構識別內含子3′剪接位點的生物信息學方法,其假定套索結構都位于3′剪接位點附近。利用該方法,他們對人類12個組織的轉錄組測序數(shù)據(jù)進行了處理,共篩選出861個內含子3′剪接位點。其中,2118個reads經匹配映射到這些剪接位點附近的套索結構中,而屬于遞歸性剪接套索結構的reads有70個(3%)。
2015年,Kelly等[18]對基因轉錄過程中的內含子遞歸剪接事件進行了探究。基因全長221 kb,其中第1個內含子長134 kb。研究人員用人臍靜脈內皮細胞(human umbilical vein endoth-elial cells, HUVEC)作為實驗材料,利用腫瘤壞死因子(TNFα)對HUVEC進行刺激,并通過二代測序技術(high-throughput sequencing)得到相關的Total RNA- seq數(shù)據(jù)。接著,將reads匹配到全基因組(hg19),發(fā)現(xiàn)reads匹配的位置主要分為3類情況:第一類為直接整體匹配到單一外顯子上;第二類匹配到exon-exon上,即分別匹配到上游外顯子的3′ 端部分堿基和下游外顯子的5′端部分堿基;第三類為exon-intron,即一部分匹配到上游外顯子上,而另一部分匹配到相鄰內含子的中間部分。其中第三類reads能反映出內含子存在遞歸剪接與可變剪接的可能。最后研究者用生物信息學的方法對套索結構進行篩選,從中發(fā)現(xiàn)基因的第1個內含子存在遞歸性剪接現(xiàn)象?;蛟谌四氺o脈內皮細胞中基本不表達,而TNFα對基因的轉錄有著很強的刺激作用,所以研究人員通過熒光原位雜交技術(fluorescencehybridization, FISH)對基因表達情況進行檢測,發(fā)現(xiàn)較長的內含子并不是轉錄結束后直接切除的,而是邊轉錄邊剪接的。對于基因的熒光標記發(fā)現(xiàn),剪切部分的水解時間占整個內含子轉錄時間的1/15;它每次剪切大約經歷了15 min,其平均半衰期大約為4.2 min。研究表明,在基因遞歸剪接過程中,內含子片段的水解過程與形成套索切除的過程是同步進行的;在較長的內含子中,轉錄的速度大約3 kb/min。研究人員使用CRISPR-Cas9技術[28]對遞歸剪接的分支點(branch point)進行突變與刪除,發(fā)現(xiàn)這樣會大大降低Pre-mRNA到成熟mRNA的加工速率。并且,對任意一個遞歸剪接位點(RS-site)進行基因突變或基因敲除處理,基因的表達量都會降低35%~50%,表明遞歸剪接的分支點和RS位點在對應基因的表達過程中有著重要的作用。同時研究人員還發(fā)現(xiàn),在人體靜脈細胞中含有多個剪接位點的基因在某一個剪接位點失效后,會通過下一個剪接位點或者其他的補償機制進行處理,雖然效率降低,但是還可以表達[18]。因此,遞歸剪接位點突變后,應同樣存在某種補償機制,使得基因仍能正常轉錄。
2015年,Sibley等[22]對脊椎動物神經元細胞進行了RNA深度測序,分析發(fā)現(xiàn)在脊椎動物神經元中存在大量的遞歸剪接現(xiàn)象。由此,他們基于對人類腦組織中遞歸剪接的研究建立了一個雙重剪接的模型,該模型大體對AGGU為剪接位點的現(xiàn)象進行了研究,發(fā)現(xiàn)遞歸剪接位點上游內含子去除后,供體部分的外顯子與剪接后的受體首端的GU相互連接起來,形成新的外顯子-內含子-外顯子復合物,在進行下次剪接過程中,有可能本次外顯子-內含子會保持連在一起,最終的產物會有兩種,一種是外顯子-外顯子(exon-exon),另外一種為外顯子-遞歸剪接中間小段內含子(exon-intron)這兩種產物。雖然該模型還不夠完善,但也說明了人類細胞中mRNA亞型具有多樣性。Emmett[29]發(fā)現(xiàn)在人類腦組織中,存在遞歸剪接現(xiàn)象的7個基因與神經系統(tǒng)疾病密切有關。
以上研究都是以組織的Total RNA-seq數(shù)據(jù)為材料進行分析實驗。2018年Hayashi等[30]開發(fā)了一種對單細胞Total RNA-seq進行測序的方法,即RamDA-seq。與其他方法相比,這種測序方法對non- poly(A) RNA敏感性更高。Hayashi等[30]用RamDA- seq對不同時期的小鼠胚胎干細胞進行實驗分析,在長度大于150 kb的內含子中發(fā)現(xiàn)了207個潛在的遞歸剪接位點。2018年Pai等[31]對果蠅的30 000個內含子進行研究,發(fā)現(xiàn)存在遞歸剪接的內含子也具有半衰期。此外,Srndic 等[32]在人類多個組織中檢測到12 000個遞歸剪接事件,并發(fā)現(xiàn)遞歸剪接對無義介導的RNA降解(nonsense-mediated decay)可能起著反作用。
隨著RNA測序技術的發(fā)展,越來越多的內含子被發(fā)現(xiàn)在基因表達調控中發(fā)揮著重要的作用,因此對遞歸剪接的深入研究有助于理解內含子調控功能的分子機制[33]。全基因組研究發(fā)現(xiàn)機體可以通過改變RNA聚合酶Ⅱ的合成速度來控制轉錄的速率[34],堿基突變或缺失容易造成各類疾病[35,36]。人類基因組除了必要的編碼信息外,還有許多必要的剪接序列,其內部位點的突變或者缺失經常會導致疾病的發(fā)生[37~39]。研究人員還發(fā)現(xiàn)在剪接位點發(fā)生突變或者刪除時,成熟mRNA的生成速率會大大降低。
在人類基因組中,遞歸剪接位點比其他位置更具有保守性,并且廣泛存在[18,22,29,40,41]。研究發(fā)現(xiàn),人體內的突變主要來自于不編碼蛋白的區(qū)域,占總突變事件的90%以上,且超過40%的突變來自于內含子區(qū)域[35]。剪接過程中的拼接錯誤是導致疾病的重要原因,遞歸剪接位點突變可能對某些疾病的研究具有重要意義[42]。目前,人們已對神經元[29]及內皮細胞[18]中的遞歸剪接事件進行了研究,發(fā)現(xiàn)剪接位點與神經系統(tǒng)疾病如帕金森綜合征、循環(huán)系統(tǒng)疾病如視網(wǎng)膜硬化或者高血壓等病變的關聯(lián)[43]。
遞歸性剪接對生物體的生長發(fā)育具有重要的調節(jié)作用。例如,剪接位點的選擇通過順式作用元件[44]和反式作用因子共同控制,例如SR蛋白、hnRPNs等蛋白質。這些因素通過影響U1 snRNP,U2輔助因子和U2 snRNP剪接體的裝配來調控mRNA的序列,從而控制生物體的生長發(fā)育[45]。
遞歸性剪接還有待進一步深入研究,目前尚待解決的問題有:(1)內含子遞歸剪接的機制,遞歸剪接位點間的片段是按前后順序依次切除,還是另有其他調控方式;(2)遞歸剪接事件的發(fā)生是否與生物發(fā)育的不同階段有關;(3)遞歸剪接位點突變與疾病間的關系。以上問題的研究必將有助于進一步理解RNA分子剪接機制,為疾病相關研究提供有價值的科研線索。
隨著RNA測序技術的發(fā)展與研究的深入,起初認為內含子是單步剪接,現(xiàn)在已發(fā)現(xiàn)部分長內含子存在多步遞歸剪接。目前,研究者已在人類、果蠅等多個真核生物基因組中發(fā)現(xiàn)了遞歸剪接現(xiàn)象,找到了多個遞歸剪接位點。雖然近年來對遞歸剪接的研究發(fā)展迅速,但是遞歸剪接位點突變或缺失造成的影響尚未可知,仍需要人們更進一步的探索。隨著遞歸剪接位點的不斷發(fā)現(xiàn),遞歸剪接位點突變或缺失在人類疾病發(fā)生發(fā)展中的功能作用將越來越清楚,為疾病的預防和治療提供新的科學線索。
三代測序技術的迅猛發(fā)展對真核生物遞歸剪接的研究具有重要的推動作用。與二代測序技術相比,三代測序技術具有測序速度更快、測序長度激增、可直接測RNA序列等特點[46]。三代測序技術的測序長度由二代測序的上百堿基到現(xiàn)在的幾千堿基,因此其對基因長內含子的遞歸剪接事件的識別分析提供了更好的技術手段,相信未來會有更多有價值的遞歸剪接的生物學機制被發(fā)現(xiàn)。
[1] Zhang J, Sun X, Qian Y, Maquat LE. Intron function in the nonsense-mediated decay of beta-globin mRNA: indications that pre-mRNA splicing in the nucleus can influence mRNA translation in the cytoplasm.,, 1998, 4(7): 801–815.
[2] Hoffman MM, Birney E. Estimating the neutral rate of nucleotide substitution using introns., 2007, 24(2): 522–531.
[3] Chevalier BS, Stoddard BL. Homing endonucleases: structural and functional insight into the catalysts of intron/intein mobility., 2001, 29(18): 3757–3774.
[4] Zhang KH. The functions and applications of introns., 2012, 39(7): 80–83.張開慧. 內含子的功能及應用. 中國畜牧獸醫(yī), 2012, 39(7): 80–83.
[5] Zhao JX, Wang F, Xu ZR, Fan YM. The epigenetic effect on pre-mRNA alternative splicing., 2014, 36(3): 248–255.趙金璇, 王芳, 徐崢嶸, 范怡梅. 表觀遺傳調控pre- mRNA的選擇性剪接. 遺傳, 2014, 36(3): 248–255.
[6] Newman A. RNA splicing., 1998, 8(25): R903.
[7] Yeo G, Burge CB. Maximum entropy modeling of short sequence motifs with applications to RNA splicing signals., 2004, 11(2–3): 377–394.
[8] Li YI,van de Geijn B,Raj A,Knowles DA, Petti AA,Golan D, Gilad Y, Pritchard JK. RNA splicing is a primary link between genetic variation and disease., 2016, 352(6285): 600–604.
[9] Hang J, Wan R, Yan C, Shi Y. Structural basis of pre-mRNA splicing., 2015, 349(6253): 1191– 1198.
[10] Hatton AR, Subramaniam V, Lopez AJ. Generation of alternative Ultrabithorax isoforms and stepwise removal of a large intron by resplicing at exon-exon junctions., 1998, 2(6): 787–796.
[11] Marashi SA, Goodarzi H, Sadeghi M, Eslahchi C, Pezeshk H. Importance of RNA secondary structure information for yeast donor and acceptor splice site predictions by neural networks., 2006, 30(1): 50–57.
[12] Rautmann G, Matthes HW, Gait MJ, Breathnach R. Synthetic donor and acceptor splice sites function in an RNA polymerase B (II) transcription unit., 1984, 3(9): 2021–2028.
[13] Burset M, Seledtsov IA, Solovyev VV. Analysis of canonical and non-canonical splice sites in mammalian genomes., 2000, 28(21): 4364–4375.
[14] Schreier P, Aichinger C. Splicing as target for identifying new active substances. 2003.
[15] Duff MO, Olson S, Wei X, Garrett SC, Osman A, Bolisetty M, Plocik A, Celniker SE, Graveley BR. Genome-wide identification of zero nucleotide recursive splicing in drosophila., 2015, 521(7552): 376–379.
[16] Lopez PJ, Séraphin B. Uncoupling yeast intron recognition from transcription with recursive splicing., 2000, 1(4): 334–339.
[17] Suzuki H, Kameyama T, Ohe K, Tsukahara T, Mayeda A. Nested introns in an intron: evidence of multi-step splicing in a large intron of the human dystrophin pre-mRNA., 2013, 587(6): 555–561.
[18] Kelly S, Georgomanolis T, Zirkel A, Diermeier S, O’Reilly D, Murphy S, L?ngst G, Cook PR, Papantonis A. Splicing of many human genes involves sites embedded within introns., 2015, 43(9): 4721– 4732.
[19] Trapnell C, Pachter L, Salzberg SL. TopHat: discovering splice junctions with RNA-Seq., 2009, 25(9): 1105–1111.
[20] Bradnam KR, Korf I. Longer first introns are a general property of eukaryotic gene structure., 2008, 3(8): e3093.
[21] Shepard S, Mccreary M, Fedorov A. The peculiarities of large intron splicing in animals., 2009, 4(11): e7853.
[22] Sibley CR, Emmett W, Blazquez L, Faro A, Haberman N, Briese M, Trabzuni D, Ryten M, Weale ME, Hardy J, Modic M, Curk T, Wilson SW, Plagnol V, Ule J. Recursive splicing in long vertebrate genes., 2015, 521(7552): 371.
[23] Pulyakhina I, Gazzoli I, ’tHoen PA, Verwey N, den Dunnen JT, Aartsma-Rus A, Laros JF. SplicePie: a novel analytical approach for the detection of alternative, non-sequential and recursive splicing., 2015, 43(22): 11068.
[24] Burnette JM, Miyamoto-Sato E, Schaub MA, Conklin J, Lopez AJ. Subdivision of large introns inby recursive splicing at nonexonic elements., 2005, 170(2): 661–674.
[25] Conklin JF, Goldman A, Lopez AJ. Stabilization and analysis of intron lariats., 2005, 37(4): 368–375.
[26] Pai AA, Paggi J, Adelman K, Burge CB. Numerous recursive sites contribute to accuracy of splicing of long introns in flies., 2018, 14(8): e1007588.
[27] Taggart AJ, Desimone AM, Shih JS, Filloux ME, Fairbrother WG. Large-scale mapping of branchpoints in human pre-mRNA transcripts., 2012, 19(7): 719–721.
[28] Ran FA, Hsu PD, Wright J, Agarwala V, Scott DA, Zhang F. Genome engineering using the CRISPR-Cas9 system., 2013, 8(11): 2281–2308.
[29] Emmett WA. Computational identification of regulatory features affecting splicing in the human brain. 2016.
[30] Hayashi T, Ozaki H, Sasagawa Y, Umeda M, Danno H, Nikaido I. Single-cell full-length total RNA sequencing uncovers dynamics of recursive splicing and enhancer RNAs., 2018, 9(1): 619.
[31] Pai AA, Henriques Telmo, Paggi Joseph, Burkholder Adam, Adelman Karen, Burge Christopher B. Intron length and recursive sites are major determinants of splicing efficiency in flies., 2017, February 13.
[32] Srndic, Ismet. Experimental verification and functional exploration of intrasplicing., 2016, urn:nbn:at:at-ubw: 1-10109.80624.509568-4.
[33] Irimia M, Blencowe BJ. Alternative splicing: decoding an expansive regulatory layer., 2012, 24(3): 323–332.
[34] Carrillo OF, Bieberstein N, Neugebauer KM. Pause locally, splice globally., 2011, 21(6): 328–335.
[35] Maurano MT, Humbert R, Rynes E, Thurman RE, Haugen E, Wang H, Reynolds AP, Sandstrom R, Qu H, Brody J, Shafer A, Neri F, Lee K, Kutyavin T, Stehling-Sun S, Johnson AK, Canfield TK, Giste E, Diegel M, Bates D, Hansen RS, Neph S, Sabo PJ, Heimfeld S, Raubitschek A, Ziegler S, Cotsapas C, Sotoodehnia N, Glass I, Sunyaev SR, Kaul R, Stamatoyannopoulos JA. Systematic localization of common disease-associated variation in regulatory DNA., 2012, 337(6099): 1190–1195.
[36] Luo Q, Gao C, Wang HL, Zhou JH, Gao TZ. Effect of a novel splicing mutation(IVS2-2A→C) of SEDL gene on RNA processing., 2005, 27(4): 544– 548.羅強, 高超, 王懷立, 周建華, 高鐵錚. X-連鎖遲發(fā)性脊椎骨骺發(fā)育不良基因剪接受體突變對mRNA加工的影響. 遺傳, 2005, 27(4): 544–548.
[37] Savisaar R, Hurst LD. Estimating the prevalence of functional exonic splice regulatory information., 2017, 136(9): 1059–1078.
[38] Editor T. Novel mechanism, called recursive splicing reveals how cells process large genes.,2005.
[39] Zou YX, Gong YQ. Aberrant RNA splicing as the molecular basis of some pathogenic variants., 2017, 39(3): 200–207.鄒永新, 龔瑤琴. 影響RNA剪接的基因變異. 遺傳, 2017, 39(3): 200–207.
[40] Burke JE, Longhurst AD, Merkurjev D, Sales-Lee J, Rao B, Moresco J, Yates JR 3rd, Li JJ, Madhani HD. Spliceosome profiling visualizes operations of a dynamic RNP at nucleotide resolution., 2018, 173(4): 1014– 1030.e17.
[41] Donovan PD, Schr?der MS, Higgins DG, Butler G. Identification of non-coding RNAs in the candida parapsilosis species group., 2016, 11(9): e0163235.
[42] Chabot B, Shkreta L. Defective control of pre-messenger RNA splicing in human disease., 2016, 212(1): 13–27.
[43] Georgomanolis T, Sofiadis K, Papantonis A. Cutting a long intron short: recursive splicing and its implications., 2016, 7: 598.
[44] Chen YM. Regulation and function of non-exonic recursive splicing. 2011.
[45] Hollander D, Naftelberg S, Lev-Maor G, Kornblihtt AR, Ast G. How are short exons flanked by long introns defined and committed to splicing?, 2016, 32(10): 596–606.
[46] Liu YH, Wang L, Yu L. The principle and application of the single-molecule real-time sequencing technology., 2015, 37(3): 259–268.柳延虎, 王璐, 于黎. 單分子實時測序技術的原理與應用. 遺傳, 2015, 37(3): 259–268.
Molecular mechanisms of recursive splicing events in long introns of eukaryotes
Jinchuan Wei1, Tianyi Xu1, Jing Wu1,2, Xiaofeng Song1
Recursive splicing refers to the biological process that long introns are removed in multiple steps during pre-mRNA splicing. In comparison to large introns (>10 kb), most introns in higher eukaryotic genomes are removed in one step during transcription. Previous studies have revealed that recursive splicing events play important roles in many biological processes, including the pathogenesis and development of diseases. In recent years, more researchers have focused on recursive splicing events and found that recursive splicing occurs inand many other vertebrates. Multiple recursive splicing sites have been predicted by different bioinformatics methods and verified by experiments. Current researches focus on the process of recursive splicing, recursive splicing site recognition and its influence on biological processes. In this review, we summarize the molecular mechanism of recursive splicing events in eukaryotic genomes and the present development in this field, aiming tolay the basis for further understanding of the mechanisms of RNA splicing.
recursive splicing; lariat structure; RS-sites; Total RNA-seq
2018-10-30;
2018-12-24
國家自然科學基金項目(編號:61571223)資助[Supported by the National Natural Science Foundation of China (No. 61571223)]
魏金川,碩士研究生,專業(yè)方向:生物信息學。E-mail: weijc@nuaa.edu.cn
宋曉峰,博士,教授,博士生導師,研究方向:生物信息學。E-mail: xfsong@nuaa.edu.cn
吳靜,碩士,副教授,研究方向:生物信息學。E-mail: wujing@njmu.edu.cn
10.16288/j.yczz.18-182
2019/1/16 9:14:00
URI: http://kns.cnki.net/kcms/detail/11.1913.R.20190116.0914.001.html
(責任編委: 張根發(fā))