蘇 越,梁琳慧*,何祥火*
1.復(fù)旦大學(xué) 生物醫(yī)學(xué)研究院,上海 200032;2.復(fù)旦大學(xué)附屬腫瘤醫(yī)院 腫瘤研究所,上海 200032
長(zhǎng)鏈非編碼RNA(long non-coding RNA,lncRNA)是指長(zhǎng)度200堿基對(duì)以上、不具備編碼蛋白質(zhì)能力的RNA。目前共有15 878個(gè)lncRNA[1]被鑒定出來。lncRNA調(diào)控許多重要的生理活動(dòng),如細(xì)胞分裂、細(xì)胞分化、細(xì)胞自噬、細(xì)胞凋亡等。大多數(shù)lncRNA分布在胞核和胞質(zhì),也有少數(shù)會(huì)分布于細(xì)胞器,如線粒體、內(nèi)質(zhì)網(wǎng)等。這些亞細(xì)胞定位的差異賦予lncRNA不同的功能。
近年來,許多新技術(shù)被用于研究lncRNA的定位。例如, 利用鏈霉素親和素特異性結(jié)合開發(fā)的抗壞血酸過氧化物酶(ascorbate peroxidase 2,APEX2)技術(shù)[2]和免疫沉淀作用的細(xì)胞器分離技術(shù)[3]等, 這些技術(shù)使得研究lncRNA的亞細(xì)胞定位更加便捷。此外,根據(jù)lncRNA定位機(jī)制,研究人員開發(fā)了強(qiáng)制改變lncRNA定位的載體,比如通過兩個(gè)小核仁RNA(small nucleolar RNA,snoRNA)的作用,使lncRNA留在胞核[4];通過病毒來源的出核元件[5]或來自lncRNA本身的出核響應(yīng)序列[6]達(dá)到將lncRNA輸出胞核的目的。
因此,通過研究lncRNA的亞細(xì)胞定位及其功能之間的聯(lián)系,有助于理解lncRNA所發(fā)揮的功能及其具體分子機(jī)制,從而豐富lncRNA的基因調(diào)控網(wǎng)絡(luò),為lncRNA的靶向治療提供堅(jiān)實(shí)的理論基礎(chǔ)。
lncRNA是非編碼RNA(non-coding RNA, ncRNA)中最普遍,功能最多樣化的一個(gè)類別。有研究者將其定義為作為初級(jí)或剪接轉(zhuǎn)錄本發(fā)揮作用的ncRNA,它們存在于多個(gè)物種中,不過lncRNA因受到的加工不同,致使其在不同物種間的定位和功能有所差別。如FAST在人類胚胎干細(xì)胞中定位于細(xì)胞質(zhì),與E40泛素連接酶β-TrCP的WD3結(jié)構(gòu)域結(jié)合,并阻斷其與磷酸化β-catenin的相互作用以防止降解,導(dǎo)致多能性所需的WNT信號(hào)激活。而FAST在小鼠胚胎干細(xì)胞中定位于細(xì)胞核,剪接因子PPIE抑制其加工,使其不能出核,不具備促進(jìn)干細(xì)胞多能性的功能[7]。
通過APEX-seq技術(shù)對(duì)RNA的亞細(xì)胞定位進(jìn)行分析,發(fā)現(xiàn)大部分lncRNA主要位于細(xì)胞核中[2],且最初的研究表明,這些核定位lncRNA為染色質(zhì)調(diào)節(jié)因子,對(duì)染色體結(jié)構(gòu)的維持具有重要作用。如包含端粒重復(fù)序列RNA(telomeric-repeat-containing RNA,TERRA),功能性基因間重復(fù)RNA元件(functional intergenic repeating RNA element,FIRRE)等。TERRA 是一種由亞端粒和端粒序列轉(zhuǎn)錄,在穩(wěn)定端粒中發(fā)揮重要作用的lncRNA。TERRA通過RAD51重組酶和自身的5′-UUAGGG-3′重復(fù)序列形成R環(huán)并靶向染色體末端[8]。RAD51相關(guān)蛋白1(RAD51-associated protein 1,RAD51AP1)結(jié)合并穩(wěn)定R環(huán)結(jié)構(gòu),并催化DNA鏈侵入端粒序列,促進(jìn)端粒的選擇性延伸(alternative lengthening of telomeres,ALT)相關(guān)的同源修復(fù)[9]。除了與染色質(zhì)相互作用之外,細(xì)胞核中的lncRNA還能參與調(diào)控基因轉(zhuǎn)錄,例如巨噬細(xì)胞特異性的lncRNA MAARS通過與HuR結(jié)合,阻止HuR從細(xì)胞核轉(zhuǎn)移至細(xì)胞質(zhì),調(diào)節(jié)HuR靶標(biāo)如p53、p27、caspase-9和BCL2的表達(dá),從而引起動(dòng)脈粥樣硬化[10];特異性生長(zhǎng)抑制基因5(growth arrest-specific 5,GAS5)在存在絲氨酸/精氨酸剪接因子4(serine and arginine rich splicing factor 4,SRSF4)時(shí),與糖皮質(zhì)激素受體結(jié)合并抑制其與靶基因中GRE區(qū)域的結(jié)合,抑制心肌肥大的發(fā)生[11]。此外,核中的lncRNA還可以參與調(diào)控mRNA的可變剪接,例如在低氧刺激下腸癌細(xì)胞中的Lucat1可以結(jié)合多聚嘧啶區(qū)結(jié)合蛋白1(polypyrimidine tract binding protein 1,PTBP1),增強(qiáng)PTBP1下游轉(zhuǎn)錄本如CD44、CLSTN1等與PTBP1的結(jié)合,進(jìn)而調(diào)節(jié)這些分子的可變剪接,促進(jìn)腸癌的發(fā)生發(fā)展[12]。
定位于胞質(zhì)的lncRNA發(fā)揮與胞核lncRNA不同的功能。目前研究表明,它們可參與以下細(xì)胞活動(dòng):1)信號(hào)傳導(dǎo)。如RP11-295G20.2與磷酸酶和張力蛋白同源物(phosphatase and tensin homolog,PTEN)的N端結(jié)合,促進(jìn)p62與PTEN的相互作用。因此,PTEN易位到溶酶體中并被降解。RP11-295G20.2通過影響PTEN穩(wěn)定進(jìn)而調(diào)控AKT磷酸化,抑制叉頭盒轉(zhuǎn)錄因子3a(forkhead box transcrip-tion factor 3a,FOXO3a)轉(zhuǎn)運(yùn)進(jìn)入細(xì)胞核,抑制調(diào)節(jié)自噬相關(guān)基因的轉(zhuǎn)錄[13]。2)轉(zhuǎn)錄后調(diào)控。NORAD在食管鱗狀細(xì)胞癌(esophageal squamous cell carcinoma,ESCC)細(xì)胞中充當(dāng)miR-224-3p的分子海綿,調(diào)節(jié)ESCC細(xì)胞中間黏蛋白(MTDH)的表達(dá),進(jìn)而促進(jìn)β-連環(huán)蛋白在體外和體內(nèi)的核積累,促進(jìn)了ESCC細(xì)胞的順鉑抗性和進(jìn)展[14]。3)翻譯及翻譯后修飾。Caren會(huì)阻礙組氨酸三聯(lián)體核苷酸結(jié)合蛋白1(histidine triad nucleotide binding protein 1,Hint1) mRNA的翻譯,進(jìn)而抑制共濟(jì)失調(diào)毛細(xì)血管擴(kuò)張癥突變-DNA損傷反應(yīng)(ataxia telangiectasia mutated-DNA damage response,ATM-DDR)途徑,并穩(wěn)定心肌細(xì)胞中的線粒體呼吸能力,發(fā)揮心臟保護(hù)作用[15]。
有些lncRNA的核質(zhì)分布在不同疾病中不同,這種定位的差異導(dǎo)致了同一個(gè)lncRNA在不同疾病中功能的差異。如小核仁RNA宿主基因11(small nucleolar RNA host gene 11,SNHG11)位于胞質(zhì)時(shí),通過SNHG11/miR-7-5p/磷脂酶C-β1(phospholipase C Beta 1,PLCB1)軸參與p38MAPK信號(hào)通路,抑制急性胰腺炎進(jìn)展,從而為急性胰腺炎治療提供潛在的靶點(diǎn)和方向[16]。位于胞核時(shí)SNHG11則與低氧誘導(dǎo)因子1α(hypoxia inducible factor 1 subunit alpha,HIF-1α)上的pVHL識(shí)別位點(diǎn)結(jié)合,阻斷pVHL與HIF-1α的相互作用并阻止其泛素化和降解,促進(jìn)腸癌的侵襲和轉(zhuǎn)移[17]。
少部分lncRNA會(huì)被運(yùn)輸至細(xì)胞器中,發(fā)揮相應(yīng)的功能。在核糖體中l(wèi)ncRNA ZNFX1反義RNA1(ZNFX1 antisense RNA 1,ZFAS1)可以與核糖體的40s亞基結(jié)合發(fā)揮調(diào)控作用[18];利用APEX-seq檢測(cè)到28條lncRNA定位在內(nèi)質(zhì)網(wǎng)。其中DNA損傷激活的非編碼RNA(NORAD)、TUG1是研究較多的lncRNA,但這些lncRNA與內(nèi)質(zhì)網(wǎng)的功能有無關(guān)系尚未確定[2]。非編碼RNA在線粒體的正常運(yùn)轉(zhuǎn)中發(fā)揮著重要作用。例如GAS5可以轉(zhuǎn)位至線粒體中維持細(xì)胞能量穩(wěn)態(tài)[3]。此外,一些溶酶體定位的lncRNA被篩選出來[3],但這些lncRNA的功能尚不清楚。總的來說,細(xì)胞器中包含了哪些lncRNA,這些lncRNA發(fā)揮什么樣的功能還有待進(jìn)一步探究。
盡管lncRNA的亞細(xì)胞定位和其功能之間存在聯(lián)系,但是lncRNA是如何實(shí)現(xiàn)其亞細(xì)胞分布的分子機(jī)制尚不清楚,目前有少部分研究對(duì)lncRNA定位機(jī)制進(jìn)行了初步探索。
通常lncRNA的剪接效率低于mRNA,有些lncRNA是通過異常的RNA聚合酶Ⅱ轉(zhuǎn)錄產(chǎn)生的低聚腺苷化和不穩(wěn)定的轉(zhuǎn)錄本,而轉(zhuǎn)錄和加工是高效的mRNA輸出的前提,因此這種lncRNA轉(zhuǎn)錄和加工的改變可能會(huì)導(dǎo)致lncRNA的低效核輸出。其次,lncRNA內(nèi)部的一些順式元件也會(huì)促進(jìn)自身的核滯留,如形成R環(huán)結(jié)構(gòu)、Malat1的區(qū)域E(nt:1 961~3 040)和M(nt:6 387~7 011)、SLERT含H/ACA框的snoRNA兩端(SNORA5A和SNORA5C)、骨形蛋白2(bone morphogenetic protein 2,BMP2)/OP1響應(yīng)基因(BMP2/OP1-responsive gene,BORG)的五聚體序列AGCCC、Alu重復(fù)序列等都會(huì)促進(jìn)lncRNA的核滯留。此外,反式因子也可以調(diào)控lncRNA促進(jìn)其核滯留,如異質(zhì)核糖核蛋白K(heterogeneous nuclear ribonucleoprotein K,hnRNPK)與Malat1中的短的分散的核元件B1相互作用以確保Malat1核斑定位[19]等等。
細(xì)胞內(nèi)RNA的核輸出機(jī)制大體分為3類,雖然對(duì)lncRNA的相關(guān)核輸出機(jī)制沒有特別充分的研究,但總體上和其他RNA一樣:1)利用TREX-TAP途徑進(jìn)行核輸出。TREX由保守的核心亞基如ALY、UAP56和THO亞復(fù)合物組成,TREX主要通過剪接復(fù)合物招募,以ATP依賴的方式組裝,并與mRNA的5′端結(jié)合將其轉(zhuǎn)運(yùn)給NXF1-p15二聚體等轉(zhuǎn)運(yùn)因子,SRSF家族參與此過程,通過與核孔蛋白相互作用,完成出核。這個(gè)過程中NXF1優(yōu)先輸出具有長(zhǎng)外顯子或高A/U含量的單外顯子或少數(shù)外顯子轉(zhuǎn)錄本[20]。例如SRSF1和SRSF7識(shí)別與NF-κB作用的lncRNA(NF-κB interacting lncRNA,NKILA)的胞質(zhì)積聚區(qū)域元件(cytoplasmic accumulation region in NIKLA,CARN)(251~450 nt),通過與UAP56和Aly/Ref輸出因子(Aly/REF export factor,ALYREF)的相互作用促進(jìn)TREX的募集,并通過TREX-TAP通路介導(dǎo)NKILA的輸出[6]。2)通過染色體維持蛋白1(chromosome region maintenance 1,CRM1)途徑輸出。含有NES的適配器蛋白直接與RNA或其他RNA結(jié)合蛋白結(jié)合,招募CRM1通過核孔輸出到核。lncRNA線粒體加工RNA的內(nèi)切酶復(fù)合物中RNA組分(RNA component of mitochon-drial RNA processing endoribonuc-lease,RMRP)與人抗原R(HUR)相互作用,通過CRM1促進(jìn)其核輸出[21]。3)與核輸出蛋白結(jié)合共同出核。如在葡萄糖刺激下,蛋白Pinin介導(dǎo)核旁斑點(diǎn)組裝轉(zhuǎn)錄本1(nuclear paraspeckle assembly transcript 1,NEAT1)的核輸出[22]。
目前關(guān)于lncRNA亞細(xì)胞器定位的研究較少,主要聚焦于線粒體。lncRNA精確定位于線粒體的機(jī)制主要有兩種:1)與定位在線粒體的蛋白形成復(fù)合物,進(jìn)而共同定位線粒體。lncRNA RMRP經(jīng)CRM1介導(dǎo)出核后,結(jié)合富集G基序結(jié)合因子1(G-rich RNA sequence binding factor 1,GRSF1),在線粒體基質(zhì)中表達(dá)增加[21]。2)借由細(xì)胞通訊定位在線粒體發(fā)揮功能。Linc00473與脂滴包被蛋白(perilipin 1,PLIN1)交聯(lián)實(shí)現(xiàn)脂滴和線粒體的共定位,激活脂解與線粒體呼吸作用[23]。
在細(xì)胞受到外界刺激時(shí),lncRNA的胞內(nèi)分布發(fā)生改變。比如在糖刺激下,NEAT1和Pinin蛋白結(jié)合從胞核轉(zhuǎn)移到胞質(zhì)后,作為支架組裝形成磷酸甘油酸激酶1(PGK1) /磷酸甘油酸突變酶1(PGAM1)/烯醇化酶1復(fù)合物(ENO1),促進(jìn)糖酵解的高效發(fā)生,進(jìn)而促進(jìn)乳腺癌的發(fā)生發(fā)展[22]。此外,借由真核表達(dá)載體進(jìn)行l(wèi)ncRNA的功能研究時(shí),常受到載體本身含有的轉(zhuǎn)錄元件、翻譯元件以及核輸出元件的影響,使得外源表達(dá)的lncRNA的核質(zhì)分布與期望產(chǎn)生差異[4]。因此研究者嘗試對(duì)外源表達(dá)的lncRNA進(jìn)行強(qiáng)制定位,以精確地揭示定位和功能之間的關(guān)系。
有研究者利用SLERT的核滯留機(jī)制開發(fā)了相應(yīng)的Snovector,幫助lncRNA強(qiáng)制定位胞核[4]。而lncRNA的出核可以通過增加一段病毒出核序列元件比如胞質(zhì)積聚元件(cytoplasmic accumulation element,CAE)、持續(xù)性輸出元件(constitutive transport element,CTE)、胞質(zhì)積聚區(qū)域元件(cytoplasmic accumulation region element,CARE)以及NKILA的出核序列CARN實(shí)現(xiàn)強(qiáng)制出核。目前本實(shí)驗(yàn)室正在尋找其他的胞質(zhì)定位序列,并嘗試將已發(fā)現(xiàn)的胞質(zhì)定位元件與不同亞細(xì)胞定位的lncRNA進(jìn)行組合,尋找核輸出組合的最佳方式。
為了研究細(xì)胞內(nèi)各結(jié)構(gòu)中是否存在及存在哪些lncRNA,研究者開發(fā)應(yīng)用了一些新技術(shù)。1)APEX-seq: APEX2是大豆抗壞血酸過氧化物酶的進(jìn)化突變體,苯酚是一種膜透性小分子,APEX2可催化生物素-苯酚的單電子氧化,產(chǎn)生半衰期<1ms 生物素-苯酚自由基,共價(jià)偶聯(lián)到蛋白質(zhì)側(cè)鏈上,使得以該蛋白為中心,周圍幾納米范圍內(nèi)的物質(zhì)都被生物素標(biāo)記,通過鏈霉親和素-生物素結(jié)合富集生物素標(biāo)記的RNA進(jìn)行測(cè)序[2]。2)通過細(xì)胞器標(biāo)志蛋白免疫共沉淀,得到特異的細(xì)胞器組分從而測(cè)序。譬如通過線粒體、溶酶體、內(nèi)質(zhì)網(wǎng)的代表蛋白Tom20、 LAMP2、 Calnexin篩選出線粒體定位的GAS5并研究其在能量代謝中作用[3]。
lncRNA是目前的研究熱點(diǎn)之一,越來越多有功能的lncRNA被發(fā)現(xiàn),但也存在許多尚未解決的問題,尤其是其定位與功能的關(guān)系,亟需更多研究來探索。lncRNA在不同癌種之間的亞細(xì)胞定位是否固定?同一種細(xì)胞中,lncRNA是否出現(xiàn)不同的定位?這些不同的定位是否有功能差異?什么分子機(jī)制造成了這樣的定位分布?定位在線粒體的GAS5是如何準(zhǔn)確定位到線粒體?這些問題正逐漸成為下一階段lncRNA研究的熱點(diǎn)。鑒于lncRNA在細(xì)胞中發(fā)揮著重要作用,通過靶向lncRNA來治療疾病被認(rèn)為是一種非常有前景的方法。有研究發(fā)現(xiàn)針對(duì)NATs的反義寡核苷酸(anti-sense oligonucleotide,ASOs)在中樞神經(jīng)系統(tǒng)的基因再活化方面顯示出了非常有希望的臨床前結(jié)果[24]。