秦少偉 陸夢(mèng)婷 周媛媛 呂建兵 王付康 溫永強(qiáng) 趙利峰,2*
(1 塔里木大學(xué)生命科學(xué)學(xué)院,新疆 阿拉爾 843300)(2 塔里木大學(xué)塔里木盆地生物資源保護(hù)利用重點(diǎn)實(shí)驗(yàn)室, 新疆 阿拉爾 843300)
?
長(zhǎng)鏈非編碼RNA在動(dòng)物和植物中的最新研究進(jìn)展
秦少偉1陸夢(mèng)婷1周媛媛1呂建兵1王付康1溫永強(qiáng)1趙利峰1,2*
(1 塔里木大學(xué)生命科學(xué)學(xué)院,新疆 阿拉爾 843300)(2 塔里木大學(xué)塔里木盆地生物資源保護(hù)利用重點(diǎn)實(shí)驗(yàn)室, 新疆 阿拉爾 843300)
摘要長(zhǎng)鏈非編碼RNA(long non-coding RNA, lncRNA)是一類轉(zhuǎn)錄本長(zhǎng)度大于200nt、不編碼或很少編碼蛋白質(zhì)的RNA。lncRNA能在轉(zhuǎn)錄、轉(zhuǎn)錄后、表觀遺傳等多個(gè)水平調(diào)控基因表達(dá),廣泛參與基因組印跡、染色體重塑、轉(zhuǎn)錄激活、轉(zhuǎn)錄干擾、細(xì)胞周期等多種生命過(guò)程的調(diào)控,影響著各種生物學(xué)過(guò)程,是當(dāng)前分子生物學(xué)和遺傳學(xué)研究的熱點(diǎn)。本文圍繞近幾年國(guó)內(nèi)外關(guān)于lncRNA的最新研究成果,就其在動(dòng)物和植物中參與的生物學(xué)過(guò)程進(jìn)行了比較,對(duì)其分子機(jī)制、功能、研究策略及目前研究中面臨的問(wèn)題等作一綜述,為進(jìn)一步在動(dòng)植物領(lǐng)域研究lncRNA的功能和分子機(jī)制提供依據(jù)和參考。
關(guān)鍵詞長(zhǎng)鏈非編碼RNA; 功能; 分子機(jī)制; 動(dòng)物; 植物; 研究進(jìn)展
在經(jīng)典中心法則中,RNA被認(rèn)為是連接DNA和蛋白質(zhì)的紐帶和橋梁。2002年在小鼠cDNA文庫(kù)測(cè)序中首次發(fā)現(xiàn)了長(zhǎng)鏈非編碼RNA(long non-coding RNA, lncRNA)的存在[1]。起初也認(rèn)為lncRNA只是RNA聚合酶II轉(zhuǎn)錄的副產(chǎn)物,并沒(méi)有生物學(xué)功能[2]。而人類DNA元件百科全書計(jì)劃(encyclopedia of DNA elements, ENCODE)發(fā)現(xiàn)只有2%的基因能編碼蛋白質(zhì),90%以上則為非編碼RNA(non-coding RNA, ncRNA),其中l(wèi)ncRNA占總RNA的比例達(dá)4%~9%[3],這一發(fā)現(xiàn)讓人們認(rèn)識(shí)到了lncRNA的重要性。所謂lncRNA是一類轉(zhuǎn)錄本長(zhǎng)度大于200 nt的RNA,其缺少完整的開放閱讀框,本身不編碼或很少編碼蛋白質(zhì),在大部分真核生物基因組被轉(zhuǎn)錄。與mRNA相比,lncRNA表達(dá)豐度一般較低,且比mRNA具有更強(qiáng)的組織和細(xì)胞表達(dá)特異性,它們通過(guò)轉(zhuǎn)錄、轉(zhuǎn)錄后、表觀遺傳等多個(gè)水平調(diào)控蛋白質(zhì)編碼基因的表達(dá),廣泛參與X染色體沉默、基因組印跡、染色體修飾、轉(zhuǎn)錄激活、轉(zhuǎn)錄干擾和核內(nèi)運(yùn)輸?shù)冗^(guò)程的調(diào)控,從而作為功能調(diào)控元件在真核生物細(xì)胞分化、個(gè)體發(fā)育等生命過(guò)程的基因表達(dá)調(diào)控中起著極其重要的作用[2,4]。
lncRNA位于細(xì)胞核內(nèi)或胞漿中,與mRNA具有類似的結(jié)構(gòu)特征,具有5′帽子、3′polyA尾巴及選擇性剪接位點(diǎn)等特點(diǎn)[5]。生物體內(nèi)lncRNA含量豐富、種類繁多,根據(jù)其與鄰近蛋白質(zhì)編碼基因在基因組上的位置和相對(duì)方向,將lncRNA分為5類:同義lncRNA、反義lncRNA、雙向lncRNA、內(nèi)含子lncRNA和基因間lncRNA[6]。目前,短鏈非編碼小RNA(如microRNA、siRNA、piRNA等)的功能和作用機(jī)制已經(jīng)比較清晰,但關(guān)于lncRNA特別是植物中l(wèi)ncRNA的研究仍然較少。因此,本文圍繞近幾年國(guó)內(nèi)外對(duì)lncRNA的最新研究成果,就其在動(dòng)物和植物中參與的生物學(xué)過(guò)程和功能進(jìn)行比較,對(duì)其作用方式、基因表達(dá)調(diào)控的分子機(jī)制、研究策略及目前研究中面臨的問(wèn)題等作一綜述,希望為后人研究提供參考。
1lncRNA參與的生物學(xué)過(guò)程和功能
1.1lncRNA參與動(dòng)物的生物學(xué)過(guò)程和功能
目前,對(duì)動(dòng)物中l(wèi)ncRNA的研究主要集中在人以及大鼠、小鼠和線蟲等模式生物上。lncRNA廣泛參與動(dòng)物的發(fā)育和疾病產(chǎn)生等生物學(xué)過(guò)程中,它們通過(guò)轉(zhuǎn)錄水平(如轉(zhuǎn)錄激活、轉(zhuǎn)錄干擾等)、轉(zhuǎn)錄后水平(如核內(nèi)運(yùn)輸、與microRNA相互作用等)和表觀遺傳水平(如X染色體沉默、基因組印跡、染色體修飾等)層次影響著細(xì)胞分化、個(gè)體發(fā)育和人類疾病發(fā)生等過(guò)程。
1.1.1lncRNA參與動(dòng)物細(xì)胞增殖、分化和個(gè)體發(fā)育
在動(dòng)物中,lncRNA可以作為激活子或者抑制子參與細(xì)胞的增殖和個(gè)體發(fā)育過(guò)程。研究表明,兩類lncRNA能在肝再生中對(duì)肝臟細(xì)胞增殖和分化發(fā)揮重要作用,其中H19-lncRNA能通過(guò)其5′端與hnRNP蛋白結(jié)合,增強(qiáng)下游c-myc mRNA的穩(wěn)定性并使之上調(diào)表達(dá),形成myc自反饋環(huán)路從而促進(jìn)肝細(xì)胞的增殖。而LALR1-lncRNA則通過(guò)激活Wnt/β-Catenin信號(hào)通路促進(jìn)肝細(xì)胞的增殖[7]。
除了參與細(xì)胞增殖外,lncRNA還在胚胎干細(xì)胞、神經(jīng)細(xì)胞、肌肉細(xì)胞、表皮細(xì)胞、成骨細(xì)胞和脂肪細(xì)胞等多種細(xì)胞的分化中起重要作用。研究人員在干細(xì)胞研究中發(fā)現(xiàn)lncRNA對(duì)維持干細(xì)胞的多潛能性有重要影響。在小鼠胚胎干細(xì)胞的分化過(guò)程中l(wèi)ncRNA呈現(xiàn)差異表達(dá),一旦它們的表達(dá)被抑制,則會(huì)影響胚胎干細(xì)胞的整體基因表達(dá)譜[8]。在表皮祖細(xì)胞向角質(zhì)細(xì)胞分化過(guò)程中,ANCR-lncRNA表達(dá)量逐漸降低,而把該lncRNA敲除后可以誘導(dǎo)皮膚特異性分化基因的表達(dá)[9]。如果抑制紅系祖細(xì)胞和神經(jīng)干細(xì)胞中l(wèi)ncRNA的表達(dá),則能夠抑制相應(yīng)紅細(xì)胞和神經(jīng)干細(xì)胞的分化[10]。在肌原細(xì)胞向肌細(xì)胞的分化過(guò)程中,MD1-lncRNA通過(guò)與micorRNA-133和micorRNA-135序列的結(jié)合,上調(diào)這兩個(gè)micorRNA的靶基因表達(dá),從而促進(jìn)肌原細(xì)胞向肌細(xì)胞的分化。同時(shí),降低MD1-lncRNA表達(dá)量也能抑制相應(yīng)細(xì)胞的分化[11]。說(shuō)明lncRNA的差異表達(dá)對(duì)維持胚胎干細(xì)胞的多功能性有重要影響。此外,在lncRNA對(duì)胚胎干細(xì)胞分化的調(diào)控網(wǎng)絡(luò)中發(fā)現(xiàn),lncRNA的表達(dá)還受轉(zhuǎn)錄因子的調(diào)節(jié),這些lncRNA進(jìn)一步與染色質(zhì)蛋白作用,再調(diào)控靶基因的表達(dá)和維持胚胎干細(xì)胞的多功能性[8]。說(shuō)明lncRNA與染色質(zhì)蛋白相互作用也有利于維持胚胎干細(xì)胞的多功能性。
lncRNA廣泛參與器官和個(gè)體發(fā)育的調(diào)節(jié)。例如大腦中l(wèi)ncRNA呈高水平表達(dá),它們一方面調(diào)控著大腦的基因表達(dá),另一方面還調(diào)控著其他神經(jīng)細(xì)胞的發(fā)育過(guò)程。腦源性神經(jīng)營(yíng)養(yǎng)因子(brain-derived neurotrophic factor,BDNF)基因在人腦中與TUG1-lncRNA結(jié)合,形成雙鏈RNA結(jié)構(gòu)。而TUG1-lncRNA對(duì)人眼睛發(fā)育過(guò)程具有重要作用,一旦其表達(dá)被抑制,則會(huì)引起視網(wǎng)膜光感受器缺失或外部畸形[12]。lncRNA的表達(dá)不但具有細(xì)胞和組織特異性,也存在發(fā)育階段特異性,僅僅在生物發(fā)育過(guò)程的特定階段表達(dá)。原位雜交分析發(fā)現(xiàn),33個(gè)mRNA-like lncRNA在黑腹果蠅胚胎發(fā)育過(guò)程中呈現(xiàn)高表達(dá)狀態(tài),其中16個(gè)lncRNA僅在中樞神經(jīng)或外周神經(jīng)系統(tǒng)中表達(dá)[13]。線蟲發(fā)育過(guò)程中l(wèi)ncRNA的表達(dá)與之類似[14]。說(shuō)明lncRNA在線蟲和果蠅發(fā)育過(guò)程中呈現(xiàn)動(dòng)態(tài)表達(dá)變化,具有精確的時(shí)間和空間表達(dá)模式。在胚胎發(fā)育研究中,發(fā)現(xiàn)一個(gè)lncRNA在中胚層向心臟發(fā)育過(guò)程中起重要的調(diào)控作用,它通過(guò)表觀遺傳方式調(diào)控和維持新生心肌細(xì)胞的正常狀態(tài)[15]。在生殖細(xì)胞的發(fā)育中,lncRNA還可通過(guò)調(diào)控特定基因的開關(guān)在復(fù)雜的表觀遺傳過(guò)程中發(fā)揮關(guān)鍵作用[16]。
1.1.2lncRNA與人類疾病
截至目前,對(duì)動(dòng)物lncRNA的研究絕大多數(shù)集中在人類疾病的相關(guān)領(lǐng)域。研究發(fā)現(xiàn),lncRNA序列結(jié)構(gòu)、表達(dá)、功能的異常與人類疾病的發(fā)生密切相關(guān),包括多種重大疾病,如癌癥、退行性神經(jīng)疾病等。β-分泌酶(β-secreatase 1, BACE1)是阿爾茨默癥發(fā)生過(guò)程中的一個(gè)關(guān)鍵酶,其反義BACE1-AS-lncRNA通過(guò)調(diào)節(jié)bace1表達(dá)水平啟動(dòng)阿爾茨默癥的發(fā)生[17]。當(dāng)與心血管疾病相關(guān)的ANRIL-lncRNA表達(dá)發(fā)生變化時(shí),人類則容易發(fā)生冠心病、顱內(nèi)動(dòng)脈瘤、2型糖尿病、腫瘤等多種疾病[18]。
lncRNA廣泛涉及很多腫瘤的發(fā)生,同一lncRNA又往往與多種腫瘤的發(fā)生有關(guān),例如,在人類lncRNA 疾病數(shù)據(jù)庫(kù)(http://202.38.126.151/hmdd/html/tools/lncrnadisease)中顯示HOTAIR-lncRNA能夠參與乳腺癌、結(jié)腸癌、肝細(xì)胞癌和胃腸間質(zhì)瘤等腫瘤的發(fā)生。一些lncRNA的作用機(jī)制也較為清楚,如印跡基因H19-lncRNA具有雙重功能,既有致癌作用,也有抑癌作用,該基因在很多癌癥(如結(jié)腸癌、肝癌、膀胱癌、乳腺癌等)都呈現(xiàn)高表達(dá)。其中,結(jié)腸癌中H19-lncRNA被原癌基因c-myc激活后,能調(diào)控c-myc下游基因的表達(dá),同時(shí)H19的第一個(gè)外顯子轉(zhuǎn)錄出microRNA-675,又可降低腫瘤抑制基因rb1的表達(dá),最終導(dǎo)致腫瘤的產(chǎn)生[19],但目前對(duì)lncRNA的這種雙重作用的產(chǎn)生機(jī)制尚不清楚,可能與自身特性或環(huán)境因素有關(guān)。在對(duì)前列腺癌的研究中,發(fā)現(xiàn)ANRIL-lncRNA的表達(dá)水平與前列腺癌發(fā)生呈正相關(guān)[20],表明ANRIL-lncRNA可能是前列腺癌產(chǎn)生的一個(gè)誘導(dǎo)因子。與之相似,HOTAIR-lncRNA在乳腺癌組織中的表達(dá)水平是正常乳腺組織的2 000倍[21],說(shuō)明該lncRNA的超高水平表達(dá)可能與乳腺癌細(xì)胞的遷移率和存活率有關(guān)。通常,MALAT1-lncRNA在人類正常組織中維持低表達(dá)水平,而在乳腺癌、前列腺癌、結(jié)腸癌、肝癌和子宮頸癌等腫瘤中均上調(diào)表達(dá)[22]。上述這些結(jié)果表明lncRNA在組織中的異常表達(dá)代表了人類疾病構(gòu)架的一個(gè)新層面,將來(lái)可能會(huì)成為疾病的診斷和治療的一個(gè)指標(biāo)和手段。
1.2lncRNA參與植物的生物學(xué)過(guò)程和功能
與動(dòng)物相比,植物lncRNA的研究目前仍然處于起步階段。迄今為止,只在擬南芥、小麥、玉米、大豆和水稻等幾種植物中發(fā)現(xiàn)了近10 000多個(gè)lncRNA,占總已發(fā)現(xiàn)lncRNA的1%,它們?cè)谥笇?dǎo)生殖發(fā)育、生長(zhǎng)發(fā)育、逆境脅迫響應(yīng)、染色體修飾以及與小RNA關(guān)系中均起著重要作用。
1.2.1lncRNA參與植物的生殖發(fā)育
lncRNA可以影響植物的生殖發(fā)育,主要表現(xiàn)在影響植物開花、雌雄分化以及花粉發(fā)育等的過(guò)程。成花轉(zhuǎn)變是植物生殖發(fā)育的關(guān)鍵階段,受春化途徑等多種因素的影響。在春化途徑中,目前研究最清楚的是開花抑制因子(flowering locus C, FLC)- lncRNA,它是了解植物lncRNA功能的主要來(lái)源。FLC能夠抑制植物開花基因的表達(dá),春化過(guò)程誘導(dǎo)該基因產(chǎn)生兩個(gè)lncRNA:COOLAIR和COLDAIR,其中,前者為flc的天然反義轉(zhuǎn)錄本,在春化初期表達(dá)迅速上升。后者則由flc基因的第一個(gè)內(nèi)含子轉(zhuǎn)錄,在春化開始后的低溫環(huán)境下表達(dá)水平持續(xù)升高。COOLAIR-lncRNA與其他蛋白(如CSTF77和CSTF64等)相互作用沉默flc正向轉(zhuǎn)錄本的轉(zhuǎn)錄,從而抑制flc的表達(dá)促進(jìn)植物開花。COLDAIR-lncRNA的作用機(jī)制與動(dòng)物中HOTAIR-lncRNA相似,能夠招募甲基轉(zhuǎn)移酶PRC2到flc,維持flc處于沉默狀態(tài),從而使光周期途徑順利進(jìn)行并誘導(dǎo)快速開花[23]。上述結(jié)果說(shuō)明COOLAIR和COLDAIR這兩個(gè)lncRNA在植物春化過(guò)程的不同階段對(duì)成花產(chǎn)生影響。同時(shí)暗示,依賴于一定條件或發(fā)育階段的作用方式中,通過(guò)基因3′端反義轉(zhuǎn)錄調(diào)控相應(yīng)的正義轉(zhuǎn)錄,可能是lncRNA一種普遍存在的作用機(jī)制。在水稻RNA-Seq數(shù)據(jù)中,前人發(fā)現(xiàn)2 063個(gè)lncRNA中的大多數(shù)在水稻生殖過(guò)程中均優(yōu)先表達(dá),部分lncRNA還能誘導(dǎo)水稻產(chǎn)生生殖缺陷[24]。黃瓜中CSM10-lncRNA只在雄株中具有表達(dá)優(yōu)勢(shì),說(shuō)明它可能在雄性分化中起作用[25]。高粱中ZM401-lncRNA主要在花藥(特別是絨氈層細(xì)胞及小孢子)中表達(dá),一旦把該基因敲除后,則能夠顯著影響花藥發(fā)育相關(guān)基因的表達(dá)[26]。
1.2.2lncRNA參與植物的生長(zhǎng)發(fā)育
研究表明,lncRNA與植物的發(fā)育過(guò)程密切相關(guān),很多l(xiāng)ncRNA在植物器官發(fā)育的特定階段產(chǎn)生,具有強(qiáng)烈的組織和細(xì)胞特異性。GMENOD40-lncRNA被發(fā)現(xiàn)在豆科植物根瘤和水稻莖中特異表達(dá),它分別參與豆科植物根瘤的形成以及水稻器官的分化和微管組織的形成[27]。CSM10-lncRNA則在黃瓜不同組織、不同發(fā)育階段和不同光照周期都有差異表達(dá),可能參與這些組織生長(zhǎng)和發(fā)育過(guò)程的調(diào)控[25]。本課題組從胡楊異形葉RNA-Seq測(cè)序數(shù)據(jù)中,發(fā)現(xiàn)并鑒定了3 013個(gè)在胡楊披針形和寬卵圓形葉發(fā)生中差異表達(dá)的lncRNA,進(jìn)一步功能分析發(fā)現(xiàn)這些lncRNA與調(diào)節(jié)葉片長(zhǎng)度和寬度相關(guān)基因的表達(dá)密切相關(guān),說(shuō)明lncRNA在胡楊異形葉發(fā)生過(guò)程中起著重要的調(diào)控作用。這些結(jié)果暗示lncRNA在植物器官的生長(zhǎng)發(fā)育過(guò)程中發(fā)揮著非常重要的調(diào)控作用。
1.2.3lncRNA與植物的脅迫響應(yīng)
在植物對(duì)不良環(huán)境因素脅迫響應(yīng)過(guò)程中,lncRNA發(fā)揮著重要作用,它參與生物脅迫(如病原體感染)和非生物脅迫響應(yīng)。在生物脅迫響應(yīng)方面,目前小麥中已經(jīng)鑒定出125個(gè)參與白粉菌感染和熱脅迫響應(yīng)相關(guān)的lncRNA,它們與擬南芥中l(wèi)ncRNA作用相似,在小麥對(duì)生物和非生物脅迫中起重要作用[28]。對(duì)擬南芥進(jìn)行干旱、寒冷、高鹽或脫落酸等處理后, 1832個(gè)lncRNA被發(fā)現(xiàn)其表達(dá)量較對(duì)照組發(fā)生了顯著改變,甚至比對(duì)照組上調(diào)22倍[29],說(shuō)明lncRNA在植物非生物脅迫應(yīng)答中起重要作用。在非生物脅迫響應(yīng)方面,目前在擬南芥中發(fā)現(xiàn)主要有IPS1、AT4和NPC536等幾個(gè)lncRNA參與非生物脅迫的應(yīng)答反應(yīng)。其中,當(dāng)磷酸鹽饑餓時(shí)能誘導(dǎo)IPS1-lncRNA和AT4-lncRNA的表達(dá),它們作為誘導(dǎo)物可以結(jié)合ath-miR399干擾ath-miR399與其靶基因pho2的結(jié)合,從而抑制該microRNA對(duì)pho2的降解作用,并調(diào)節(jié)磷酸含量的動(dòng)態(tài)平衡[30]。當(dāng)受磷酸鹽饑餓和鹽脅迫的誘導(dǎo)時(shí),根部和葉中NPC536-lncRNA的表達(dá)量都會(huì)升高,其中鹽脅迫時(shí)NPC536-lncRNA的上調(diào)表達(dá)能夠促進(jìn)擬南芥主根系和次生根長(zhǎng)度的生長(zhǎng)[31]。說(shuō)明這些lncRNA是植物非生物脅迫響應(yīng)中重要的調(diào)節(jié)因子,使植物能夠適應(yīng)不良的生存環(huán)境。
2lncRNA調(diào)控基因表達(dá)的分子機(jī)制
lncRNA能夠參與生物體各種生命活動(dòng)過(guò)程中,其通過(guò)多種作用方式調(diào)控基因的表達(dá),主要表現(xiàn)在調(diào)控網(wǎng)絡(luò)覆蓋轉(zhuǎn)錄水平、轉(zhuǎn)錄后水平、翻譯水平以及表觀遺傳水平等方面(圖1)[32]。
圖1 LncRNA功能的作用機(jī)制
2.1lncRNA對(duì)轉(zhuǎn)錄水平的調(diào)控
2.1.1lncRNA調(diào)控鄰近基因的轉(zhuǎn)錄
當(dāng)基因組中l(wèi)ncRNA在與下游基因位置鄰近時(shí),依賴其與下游基因相對(duì)位置或序列特征,當(dāng)lncRNA自身轉(zhuǎn)錄時(shí),能夠穿過(guò)下游靶基因啟動(dòng)子區(qū),干擾轉(zhuǎn)錄因子與啟動(dòng)子的結(jié)合,從而以順式作用方式調(diào)控靶基因的轉(zhuǎn)錄。例如,酵母中SRG1-lncRNA在轉(zhuǎn)錄延伸時(shí)橫跨ser3的啟動(dòng)子序列,占據(jù)啟動(dòng)子與RNA聚合酶II的結(jié)合空間,從而抑制ser3的表達(dá)[33]。
2.1.2lncRNA與轉(zhuǎn)錄因子的相互作用
生物體內(nèi)lncRNA和轉(zhuǎn)錄因子相互作用的方式有多種,它們能夠通過(guò)激活轉(zhuǎn)錄因子、招募轉(zhuǎn)錄因子至靶基因啟動(dòng)子、促進(jìn)轉(zhuǎn)錄因子寡聚成復(fù)合物或改變轉(zhuǎn)錄因子的亞細(xì)胞定位等方式調(diào)控靶基因的轉(zhuǎn)錄。例如,p21-lncRNA可以通過(guò)與p53共激活因子hnRNPK的結(jié)合,抑制其靶基因的表達(dá)[34]。活化的T細(xì)胞核因子(nuclear factor of activated T cell, NFAT)通常位于細(xì)胞質(zhì)中,當(dāng)鈣依賴信號(hào)通過(guò)NFAT的非編碼抑制因子(noncoding repressor of NFAT, NRON)-lncRNA內(nèi)高度保守的莖環(huán)結(jié)構(gòu)把NFAT從細(xì)胞質(zhì)導(dǎo)入細(xì)胞核內(nèi)后,NFAT能夠激活靶基因的轉(zhuǎn)錄[31]。
2.1.3lncRNA作為增強(qiáng)子進(jìn)行調(diào)控
在人類細(xì)胞系研究中,發(fā)現(xiàn)lncRNA還具有類似增強(qiáng)子的功能,其轉(zhuǎn)錄可以促進(jìn)相應(yīng)基因的表達(dá),這些lncRNA被稱為增強(qiáng)子RNA(enhancer RNA, eRNA)。如人類CCAT1-L-lncRNA位于myc基因上游515kb區(qū)域,當(dāng)該lncRNA被轉(zhuǎn)錄時(shí)能夠遠(yuǎn)程顯著增強(qiáng)myc的轉(zhuǎn)錄[35]。
2.2lncRNA對(duì)轉(zhuǎn)錄后水平的調(diào)控
2.2.1lncRNA作為小RNA的前體
lncRNA可以通過(guò)加工剪切產(chǎn)生非編碼小RNA(短鏈非編碼RNA)。除snRNA外所有種類的小分子RNA都富含lncRNA的外顯子,特別是snoRNA,證明lncRNA可能是功能小RNA的前體,例如H19-lncRNA是調(diào)控抑癌基因(retinoblastoma, RB)miR-675的前體[36]。
2.2.2lncRNA參與RNA的剪切加工
除作為非編碼小RNA前體外,lncRNA還影響其他RNA的加工過(guò)程,如參與mRNA前體的剪切,對(duì)mRNA加工過(guò)程進(jìn)行轉(zhuǎn)錄后調(diào)控。如MALAT1-lncRNA可以通過(guò)影響絲氨酸/精氨酸剪切因子(serine/arginine splicing factors, SR)的定位和磷酸化方式調(diào)控mRNA前體的可變剪切[37]。
2.2.3lncRNA吸附microRNA
lncRNA其中一個(gè)重要的功能是與microRNA結(jié)合,抑制后者發(fā)揮作用,從而保護(hù)相應(yīng)靶mRNA免受microRNA介導(dǎo)的抑制或降解,這類lncRNA被稱為內(nèi)源性競(jìng)爭(zhēng)RNA(endogenous competing RNA, ceRNA)。目前越來(lái)越多的lncRNA被發(fā)現(xiàn)能夠作為ceRNA對(duì)基因表達(dá)發(fā)揮調(diào)控作用。如肝癌中高表達(dá)的lncRNA可與microRNA-372結(jié)合,抑制其靶基因cAMP依賴蛋白激酶β(protein kinase, cAMP-dependent, catalytic, beta, PRKACB)的表達(dá),影響cAMP反應(yīng)元件結(jié)合蛋白(cAMP-response element binding protein, CREB)的磷酸化[38]。IPS1-lncRNA與microRNA相互作用,可競(jìng)爭(zhēng)性抑制microRNA對(duì)其靶基因的降解[39]。
2.2.4lncRNA影響mRNA的穩(wěn)定性和降解
最近研究表明,lncRNA對(duì)mRNA的穩(wěn)定性和降解起著輔助作用。細(xì)胞質(zhì)中l(wèi)ncRNA識(shí)別并影響mRNA包括半衰期和翻譯等的生命活動(dòng)周期。例如,lncRNA可以和Staufen1蛋白(STAU1)相互作用促進(jìn)mRNA的降解[40]。
2.3lncRNA對(duì)翻譯水平的調(diào)控
人們?cè)谘芯縧ncRNA對(duì)蛋白質(zhì)翻譯的影響時(shí)發(fā)現(xiàn),lncRNA可以輔助mRNA翻譯或輔助抑制翻譯。如反義UCHL1-lncRNA的表達(dá)能提高UCHL1的蛋白含量,但不改變mRNA的表達(dá)水平。p21-lncRNA被發(fā)現(xiàn)能通過(guò)抑制RNA穩(wěn)定蛋白Hu抗原R(Hu antigen R, HuR)的活性,從而抑制其靶基因jun b原癌基因(jun B proto-oncogene, JUNB)和鈣黏著相關(guān)蛋白(cadherin-associated protein, CTNNB1)mRNA的翻譯[40]。
2.4lncRNA對(duì)表觀遺傳水平的調(diào)控
lncRNA對(duì)表觀遺傳水平的調(diào)控最早是在女性X染色體隨機(jī)失活現(xiàn)象中發(fā)現(xiàn)的[33]?,F(xiàn)在研究表明,lncRNA在組蛋白修飾、DNA甲基化和染色體重塑等表觀遺傳修飾過(guò)程均起著重要作用,它們通過(guò)結(jié)合并募集特定表觀修飾酶復(fù)合物至靶基因區(qū)域,改變靶基因染色質(zhì)或DNA修飾狀態(tài)從而影響靶基因的表達(dá)。
2.4.1lncRNA參與組蛋白修飾
組蛋白修飾修飾方式有多種,如組蛋白甲基化、乙?;⒘姿峄?、糖基化和泛素化等,不同修飾方式對(duì)基因表達(dá)的影響不同。例如,父源染色體特異表達(dá)的AIR-lncRNA能夠聚集在其上游溶質(zhì)載體22家族成員3(solute carrier family 22 member 3, SLC22α3)基因的啟動(dòng)子區(qū),招募H3組蛋白第9位賴氨酸(histone H3 lysine K9, H3K9)特異性甲基轉(zhuǎn)移酶G9a,使H3K9甲基化,導(dǎo)致染色質(zhì)濃縮形成異染色質(zhì),導(dǎo)致與RNA聚合酶II的結(jié)合能力降低,使父源染色體上的等位基因slc22α3、slc22α2和ig/2r沉默[41]。又如HOTAIR-lncRNA的5′端和3′端可以分別結(jié)合不同組蛋白修飾復(fù)合物PRC2和LSC1,前者促進(jìn)組蛋白甲基化,后者則使組蛋白脫甲基化,它們分別決定著不同靶基因特異性組蛋白的修飾模式[42](圖2)。
圖2 HOTAIR-lncRNA調(diào)控組蛋白甲基化和去甲基化狀態(tài) HOTAIR表示HOTAIR-lncRNA。
2.4.2lncRNA與DNA甲基化
lncRNA在轉(zhuǎn)錄水平對(duì)表觀遺傳學(xué)的影響除了對(duì)染色質(zhì)修飾外,還表現(xiàn)在通過(guò)使DNA甲基化抑制基因的表達(dá)。如核糖體DNA(rDNA)中一些拷貝具有轉(zhuǎn)錄活性,而另一些拷貝由于DNA的甲基化則處于沉默狀態(tài)。由rRNA基因間隔區(qū)轉(zhuǎn)錄成的pRNA(promoter RNA)又結(jié)合到rDNA的啟動(dòng)子區(qū),形成RNA/DNA/DNA三聯(lián)體復(fù)合物,該復(fù)合物能夠招募DNA甲基化酶3(DNA methyltransferase 3, DNMT3),作用于lncRNA使DNA發(fā)生甲基化,從而抑制基因的表達(dá)[4]。
2.4.3 lncRNA與染色體重塑
lncRNA在轉(zhuǎn)錄水平能夠作為招募染色質(zhì)修飾物的支架,與染色體修飾復(fù)合物相互作用引起染色體重塑,導(dǎo)致表觀遺傳學(xué)沉默,這也是導(dǎo)致X-染色體失活的主要原因。目前發(fā)現(xiàn),在人類3 300個(gè)基因間lncRNA中,約20%能與染色質(zhì)修飾復(fù)合物結(jié)合,調(diào)控染色質(zhì)重塑、影響基因表達(dá)和參與體內(nèi)其他多種生命活動(dòng)過(guò)程。例如長(zhǎng)度約17kb的XIST-lncRNA,其5′端含有高度保守的repa序列,當(dāng)XIST-lncRNA表達(dá)上調(diào)時(shí),repa序列能夠招募大量的染色體重塑復(fù)合物PRC2沿X染色體擴(kuò)展,最終覆蓋整條染色體基因表達(dá)的關(guān)鍵位點(diǎn),導(dǎo)致基因表達(dá)沉默[43]。
3lncRNA的研究策略和方法
與蛋白質(zhì)和DNA相比,lncRNA的穩(wěn)定性較差、易降解,且表達(dá)豐度也遠(yuǎn)低于mRNA。而與microRNA相比,lncRNA長(zhǎng)度則更長(zhǎng),并存在二級(jí)結(jié)構(gòu),功能發(fā)揮方式更復(fù)雜。因此為了揭示lncRNA的分子作用機(jī)制,除了常規(guī)方法外,近年來(lái)逐漸發(fā)展和建立了lncRNA特有的實(shí)驗(yàn)技術(shù)和相關(guān)數(shù)據(jù)分析方法。
以目前l(fā)ncRNA研究較多的動(dòng)物和醫(yī)學(xué)領(lǐng)域?yàn)槔鋖ncRNA的基本策略有3個(gè)步驟:(1)lncRNA鑒定和表達(dá)的高通量分析。其中,微陣列芯片和RNA-seq是使用較多的兩種成熟技術(shù),依賴現(xiàn)有的lncRNA數(shù)據(jù)庫(kù)(如目前注釋最全的NONCODE數(shù)據(jù)庫(kù)),對(duì)lncRNA進(jìn)行表達(dá)差異、共表達(dá)、新lncRNA預(yù)測(cè)以及l(fā)ncRNA生物學(xué)功能預(yù)測(cè)等生物信息學(xué)分析;(2)高通量分析所得lncRNA表達(dá)結(jié)果的驗(yàn)證。利用Northern blot、實(shí)時(shí)熒光定量PCR(qRT-PCR)、RNA熒光原位雜交、RNA干擾和免疫共沉淀等常規(guī)技術(shù)對(duì)lncRNA表達(dá)進(jìn)行驗(yàn)證;(3)目標(biāo)lncRNA的生物學(xué)功能和作用機(jī)制研究,包括功能獲得性研究和功能缺失性研究。相比之下,lncRNA在植物領(lǐng)域的研究策略和方法相對(duì)較為滯后,目前只在擬南芥、蒺藜苜蓿、水稻、玉米中進(jìn)行了全基因組lncRNA的檢索、鑒定和相關(guān)研究,其中利用表達(dá)譜芯片、RNA-seq和qRT-PCR等技術(shù)在擬南芥中鑒定出成6 000多個(gè)lncRNA,并對(duì)這些lncRNA在不同環(huán)境和發(fā)育階段的表達(dá)譜進(jìn)行分析,確定了特定lncRNA在特定環(huán)境和階段的特定功能[44]。這一研究策略為在其他物種中鑒定lncRNA提供很好的借鑒。
4lncRNA目前研究中面臨的問(wèn)題
由于lncRNA在生物體內(nèi)結(jié)構(gòu)特征和作用機(jī)制的多樣性和復(fù)雜性,目前對(duì)lncRNA功能和分子機(jī)制的研究仍然只是冰山一角,特別是植物lncRNA的研究還處于探索和起步階段,面臨著許多亟待解決的問(wèn)題,主要表現(xiàn)以下幾個(gè)方面:(1)lncRNA的定義仍存在爭(zhēng)議。一般認(rèn)為長(zhǎng)度大于200nt的非編碼RNA即為lncRNA,但有學(xué)者認(rèn)為生物體內(nèi)小于200nt的非編碼RNA有很多,它們既不屬于小RNA,也不屬于結(jié)構(gòu)RNA,對(duì)其歸類仍不清楚[45];(2)對(duì)lncRNA生物學(xué)功能的闡明并非易事。由于lncRNA種類和功能的多樣性,使得不同lncRNA的研究結(jié)果相互借鑒的可能性較小。另外功能性和非功能性lncRNA的區(qū)分也存在困難,而且對(duì)功能研究的思路尚不成熟;(3)lncRNA尚無(wú)統(tǒng)一的命名原則。對(duì)目前發(fā)現(xiàn)的lncRNA只是根據(jù)其功能、結(jié)構(gòu)特征、作用方式等進(jìn)行命名?,F(xiàn)在lncRNA仍然沒(méi)有一個(gè)國(guó)際規(guī)范的命名方法和原則;(4)lncRNA數(shù)據(jù)庫(kù)不夠完善。對(duì)lncRNA的研究相比其他非編碼RNA研究相對(duì)較晚,目前l(fā)ncRNA相關(guān)數(shù)據(jù)庫(kù)內(nèi)容和注釋尚不健全,特別是植物lncRNA相關(guān)數(shù)據(jù)更是寥寥無(wú)幾;(5)目前開發(fā)的lncRNA功能預(yù)測(cè)工具不多,特別是針對(duì)其二級(jí)結(jié)構(gòu)和靶基因預(yù)測(cè)的工具極少;(6)針對(duì)lncRNA研究的新技術(shù)和獨(dú)特技術(shù)較少,極大限制了目前l(fā)ncRNA的研究;(7)對(duì)lncRNA的研究領(lǐng)域有待拓展。如前所述,目前對(duì)lncRNA的研究主要集中在動(dòng)物的腫瘤和發(fā)育領(lǐng)域,植物的生長(zhǎng)發(fā)育及抗逆性等領(lǐng)域,其中腫瘤領(lǐng)域更是占全部lncRNA研究的60%以上,而在其他領(lǐng)域的研究極少。因此,針對(duì)不同lncRNA的結(jié)構(gòu)特征和作用機(jī)制,建立更多、更有效的技術(shù)體系是今后一段時(shí)間系統(tǒng)研究lncRNA的一個(gè)重要研究方向。
參考文獻(xiàn)
[1]Okazaki Y, Furuno M, Kasukawa T, et al. Analysis of the mouse transcriptome based on functional annotation of 60,770 full-length cDNAs[J]. Nature, 2003, 420(6915): 563-573.
[2]Rinn J L, Chang H Y. Genome regulation by long noncoding RNA[J]. Annual Review of Biochemstry, 2012, 81: 145-166.
[3]Birney E, Stamatoyannopoulos J A, Dutta A, et al. Indentification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project [J]. Nature, 2007, 447(7146): 799-816.
[4]Batista P J, Chang H Y. Long noncoding RNA: cellular address codes in development and disease [J]. Cell, 2013, 152(6): 1298-1307.
[5]Krell J, Frampton A E, Mirnezami R, et al. Growth arrest-specific transcript 5 associated snoRNA levels are related to p53 expression and DNA damage in colorectal cancers[J]. PLoS One, 2014, 9(6): e98561.
[6]Ponting C P, Oliver P L, Reik W. Evolution and functions of long noncoding RNA [J]. Cell, 2009, 136(4): 629-641.
[7]徐丹. 肝再生過(guò)程中LncRNA調(diào)控肝細(xì)胞增殖的機(jī)制研究[D]. 上海: 第二軍醫(yī)大學(xué)基礎(chǔ)部, 2013.
[8]Guttman M, Donaghey J, Carey B W, et al. lincRNA act in the circuitry controlling pluripotency and differentiation[J]. Nature, 2011, 477(7364): 295-300.
[9]Kretz M, Siprashvili Z, Chu C, et al. Control of somatic tissue differentiation by the long non-coding RNA TINCR[J]. Nature, 2013, 493(7431): 231-235.
[10]Ng S Y, Johnson R, Stanton L W. Human long non-coding RNA promote pluripotency and neuronal differentiation by association with chromation modifiers and transcription factor[J]. EMBO J, 2012, 31(3): 522-533.
[11]Cesana M, Cacchiarelli D, Legnini I, et al. A long noncoding RNA controls muscle differentiation by functioning as a competing endogenous RNA[J]. Cell, 2011, 147(2): 358-369.
[12]Pruunsild P, Kazantseva A, Aid T, et al. Dissecting the human BDNF locus: bidirectional transcription, complex splicing, and multiple promoters[J]. Genomics, 2007, 90(3): 397-406.
[13]Inagaki S, Numata K, Kondo T, et al. Identification and expression analysis of putative mRNA-like non-coding RNA in Drosophila[J]. Genes Cells, 2005, 10(12): 1163-1173.
[14]Deng X X, Meller V H. Non-coding RNA in fly dosage compensation[J]. Trends Biochem Sci, 2006, 31(9): 526-532.
[15]Klattenhoff C A, Scheuermann J C, Surface L E, et al. Braveheart, a long noncoding RNA required for cardiovascular lineage commitment[J]. Cell, 2013, 152(3): 570-583.
[16]Sasaki H, Matsui Y. Epigentic events in mammalian germ-cell development: reprogramming and beyond[J]. Nat Rev Genet, 2008, 9(2): 129-140.
[17]Faghihi M A, Modarresi F, Khalil A M, et al. Expression of noncoding RNA is elevated in Alzheimer’s disease and drives rapid feed-forward regulation of β-secretase[J]. Nat Med, 2008, 14(7): 723-730.
[18]Ahmed W, Ali I S, Riaz M, et al. Association of ANRIL polymorphism (rs1333049:C﹥G) with myocardial infarction and its pharmacogenomic role in hypercholesterolemia[J]. Gene, 2013, 515(2): 416-420.
[19]Gibb E A, Brown C J, Lam W L. The functional role of long non-coding RNA in human carcinomas[J]. Mol Cancer, 2011, 10(1): 38.
[20]Yap K L, Li S D, Munoz-Cabello A M, et al. Molecular interplay of the noncoding RNA ANRIL and methylated histone H3 lysine 27 by polycomb CBX7 in transcriptional silencing of INK4α[J]. Mol Cell, 2010, 38(5): 662-674.
[21]Gupta R A, Shah N, Wang K C, et al. Long non-coding RNA HOTAIR reprograms chromatin state to promote cancer metastasis[J]. Nature, 2010, 464(7291): 1071-1076.
[22]Tano K, Mizuno R, Okada T, et al. MALAT-1 enhances cell motility of lung adenocarcimoma cells by influencing the expression of motility-related genes[J]. FEBS Lett, 2010, 584(22): 4575-4580.
[23]Kim D H, Sung S. Environmentally coordinated epigenetic silencing of FLC by protein and long noncoding RNA components[J]. Current Opinion in Plant Biology, 2012, 15(1): 51-56.
[24]Zhang Y C, Chen Y Q. Long noncoding RNA: new regulators in plant development[J]. Biochem Biophys Res Commun, 2013, 436(2): 111-114.
[25]Cho J, Koo D H, Nam Y W, et al. Isolation and characterization of cDNA clones expressed under male sex expression conditions in a monoecious cucumber plant (Cucumis sativus L. cv. Winter Long) [J]. Euphytica, 2005, 146(3): 271-281.
[26]Ma J, Yan B, Qu Y, et al. Zm401, a short-open reading-frame mRNA or noncoding RNA, is essential for tapetum and microspore development and can regulate the floret formation in maize[J]. J Cell Biochem, 2008, 105(1): 136-146.
[27]Heo J B, Lee Y S, Sung S. Epigenetic regulation by long noncoding RNA in plant[J]. Chromosome Research, 2013, 21(6-7): 685-693.
[28]Xin M, Wang Y, Yao Y, et al. Identification and characterization of wheat long non-protein coding RNA responsive to powdery mildew infection and heat stress by using microarray analysis and SBS sequencing[J]. BMC Plant Biol, 2011, 11: 61.
[29]Liu J, Jung C, Xu J, et al. Genome-wide analysis uncovers regulation of long intergenic noncoding RNA in Arabidopsis[J]. The Plant Cell Online, 2012, 24(11): 4333-4345.
[30]Li L, Eichten S T, Shimizu R, et al. Genome-wide discovery and characterization of maize long non-coding RNA[J]. Genome Biology, 2014, 15(2): R40.
[31]Willingham A T, Orth A P, Batalov S, et al. A strategy for probing the function of noncoding RNA finds a repressor of NFAT[J]. Science, 2005, 309(5740): 1570-1573.
[32]Ogawa Y, Sun B K, Lee, J T. Intersection of the RNA interference and X-inactivation pathways[J]. Science, 2008, 320: 1336-1341.
[33]Pruneski J A, Hainer S J, Petrov K O, et al. The Pafl complex represses SER3 transcription in Saccharomyces cerevisiae by facilitating intergenic transcription-dependent nuclesosome occupancy of the SER3 promoter[J]. Eukaryot Cell, 2011, 10(10): 1283-1294.
[34]Huarte M, Guttman M, Feldser D, et al. A large intergenic noncoding RNA induced by p53 mediates global gene repression in the p53 response[J]. Cell, 2010, 142(3): 409-419.
[35]Xiang J F, Yin Q F, Chen T, et al. Human colorectal cancer-specific CCAT1-L lncRNA regulates long-range chromatin interactions at the MYC locus[J]. Cell Res, 2014, 24(5): 513-531.
[36]Tsang W P, Ng E K, Ng S S, et al. Oncofetal H19-derived miR-675 regulates tumor suppressor RB in human colorectal cancer[J]. Carcinogenesis, 2010, 31(3): 350-358.
[37]Tripathi V, Ellis J D, Shen Z, et al. The nuclear-retained noncoding RNA MALAT1 regulates alternative splicing by modulating SR splicing factor phosphorylation[J]. Mol Cell, 2010, 39(6): 925-938.
[38]Wang J, Liu X, Wu H, et al. CREB up-regulated long non-coding RNA, HULC expression through interaction with microRNA-372 in liver cancer[J]. Nucleic Acids Res, 2010, 38(16): 5366-5383.
[39]Fatica A, Bozzoni I. Long non-coding RNA: new player in cell differentiation and development[J]. Nature Reviews Genetics, 2014, 15(1): 7-21.
[40]Hadjiargyrou M, Delihas N. The intertwining of transposable elements and non-coding RNA[J]. Int J Mol Sci, 2013, 14(7): 13307-13328.
[41]Magistri M, Faghihi M A, St Laurent G 3rd, et al. Regulation of chromatin structure by long noncoding RNA: focus on natural antisense transcripts[J]. Trends Genet, 2012, 28(8): 389-396.
[42]Tsai M C, Manor O, Wan Y, et al. Long noncoding RNA as modular scaffold of histone modification complexes[J]. Science, 2010, 329(5992): 689-693.
[43]Johnsson P, Lipovich L, Grander D, et al. Evolutionary conservation of long non-coding RNA: sequence, structure, function[J]. Biochimica et Biophysica Acta(BBA) -General Subjects, 2014, 1840(3): 1063-1071.
[44]Wang H, Chung P J, Liu J, et al. Genome-wide indentification of long noncoding natural antisense transcripts and their responses to light in Arabidopsis[J]. Genome Res, 2014, 24(3): 444-453.
[45]Spizzo R, Almeida M I, Colombatti A, et al. Long non-coding RNA and cancer: a new frontier of translational research[J] Oncogene, 2012, 31(43): 4577-4587.
The Latest Research Progress of Long Non-coding RNA in Animals and Plants
Qin Shaowei1Lu Mengting1Zhou Yuanyuan1
LüJianbing1Wang Fukang1Wen Yongqiang1Zhao Lifeng1,2*(1 College of Life Sciences, Tarim University, Alar, Xinjiang 843300)(2 Key laboratory of protection and utilization of biological resources in Tarim Basin,Tarim University, Alar, Xinjiang 843300)
AbstractLong non-coding RNA (lncRNA) is an important non-coding transcript larger than 200nt in length and have extremely low protein-coding ability or without protein-coding ability. LncRNA can regulate gene expression at transcription and post-transcription, epigenetic level, and plays an important role in a wide ranges of biological processes such as genomic imprinting, chromatin remodeling, transcriptional activation, transcriptional interference and cell cycle. It become the current hot topics in the study of molecular biology and genetics. Based on the latest research progress on lncRNA in recent years, the biological processes involved in animals and plants were compared in this review. Advance are highlighted according to molecular mechanism, functions, research strategies of lncRNA and problems faced in the present study, which providing a guide for further study of functions and molecular mechanism of lncRNA in animals and plants.
Key wordslong non-coding RNA; function; molecular mechanism; animals; plants; research progress
中圖分類號(hào):Q7
文獻(xiàn)標(biāo)識(shí)碼:A
DOI:10.3969/j.issn.1009-0568.2016.02.018
文章編號(hào):①1009-0568(2016)02-0103-10
作者簡(jiǎn)介:秦少偉(1974-),男,實(shí)驗(yàn)師,研究方向?yàn)楣δ芑蚪M學(xué)、LncRNA的生物學(xué)研究。E-mail:qinshaowei@126.com*為通訊作者E-mail:lifengz2011@126.com
基金項(xiàng)目:國(guó)家自然科學(xué)基金項(xiàng)目(31260275);塔里木大學(xué)校長(zhǎng)基金博士項(xiàng)目(TDZKBS201501)。
收稿日期:①2015-10-13