王海濤 閔建平 蘇海翔
甘肅省醫(yī)學(xué)科學(xué)研究院/甘肅省腫瘤醫(yī)院,甘肅 蘭州730050
RNA編輯(RNA editing)是指在轉(zhuǎn)錄后水平上發(fā)生的核苷酸插入、缺失或替代,導(dǎo)致核苷酸序列發(fā)生改變,使其翻譯的蛋白質(zhì)氨基酸序列、結(jié)構(gòu)、功能或表達(dá)水平等不同于原基因序列所攜帶遺傳信息的生物學(xué)現(xiàn)象。1986年,Benne等描述錐蟲線粒體細(xì)胞色素C氧化酶亞基Ⅱ(cytochrome C oxidase subunitⅡ,coxⅡ)轉(zhuǎn)錄后修飾時首次提出這一概念,coxⅡ基因包含一個移碼突變,后者經(jīng)RNA編輯插入一個尿苷酸得以修復(fù)[1]。RNA編輯增大了轉(zhuǎn)錄多樣性,進(jìn)而增加了蛋白質(zhì)的種類,使生物體能夠更好地適應(yīng)環(huán)境,其不僅擴(kuò)充了遺傳信息,也進(jìn)一步補(bǔ)充和擴(kuò)展了中心法則,使人們對基因表達(dá)調(diào)控有了更進(jìn)一步的認(rèn)識[2]。RNA編輯廣泛存在于物種中,是機(jī)體維持正常代謝活動和穩(wěn)態(tài)的重要基礎(chǔ)。
迄今為止,已經(jīng)發(fā)現(xiàn)了多種不同類型的RNA編輯現(xiàn)象,包括C-to-U、U-to-C、A-to-Ⅰ等。
1.1 C-to-U編輯 哺乳動物中首次發(fā)現(xiàn)RNA編輯現(xiàn)象是在小腸上皮細(xì)胞中,該細(xì)胞合成一種載脂蛋白ApoB-48,能夠結(jié)合并運(yùn)輸血脂到機(jī)體各組織進(jìn)行代謝及利用。人類肝臟細(xì)胞也表達(dá)同一基因ApoB,但合成更大的蛋白ApoB-100,廣泛存在于另一種脂質(zhì)載體LDL顆粒中。ApoB-48和ApoB-100 N末端的序列是一致的,但前者長度只有后者的48%。ApoB-100基因第6666位核苷酸是谷氨酰胺密碼子CAA中的C,而在ApoB-48中相應(yīng)的核苷酸是U,從而形成了一個終止密碼子UAA,導(dǎo)致了開放讀碼框的中斷。C-to-U編輯由載脂蛋白B編輯酶催化多肽(apolipoprotein B mRNA editing enzyme,catalytic polypeptide,APOBEC)催化完成[3]。
1.2 U-to-C編輯 研究發(fā)現(xiàn),在腎母細(xì)胞瘤基因(wilms tumor 1,WT1)mRNA的一個位置有兩種不同的核苷酸形式,與基因序列比對發(fā)現(xiàn)該mRNA發(fā)生了Uto-C的轉(zhuǎn)變,這說明存在一種在嘧啶上酶促結(jié)合一個氨基的編輯形式[4]。
1.3 A-to-Ⅰ編輯 高等真核生物中最常見的一種RNA編輯類型是A-to-Ⅰ編輯,在這種類型的編輯中,腺苷(A)被脫氨基形成次黃苷(Ⅰ),后者在mRNA中極少出現(xiàn)。次黃苷跟鳥苷一樣,優(yōu)先同胞苷配對,以同樣的方式與核糖體互相作用。因此,在反轉(zhuǎn)錄和翻譯中,發(fā)生A-to-Ⅰ改變就如同將A替換為G[5]。
谷氨酸受體是由GluR-A、-B、-C和-D基因編碼的不同亞基形成的異聚體,包含GluR-B亞基的受體對Ca2+是不可滲透的。序列分析表明,不同受體亞基之間Ca2+通透性的差異是由于跨膜結(jié)構(gòu)域中一個氨基酸的不同造成的—在GluR-B中是精氨酸,而其他亞基中相應(yīng)位置卻是谷氨酰胺。在蛋白和mRNA水平上這一差異是顯而易見的,但在編碼各亞基的基因上相應(yīng)位置卻完全一致[6]。GluR-B mRNA的編輯將一個谷氨酰胺密碼子(CAG)改變?yōu)镃IG,后者在翻譯過程中被識別為精氨酸密碼子(CGG),這一編輯位點(diǎn)被稱為Q/R位點(diǎn)[7]。據(jù)推測,GluR-B前體mRNA序列在Q/R位點(diǎn)與下游內(nèi)含子序列間配對形成了一個頸環(huán)結(jié)構(gòu)。通常認(rèn)為,雙鏈RNA是編輯發(fā)生的必要條件,而依賴雙鏈RNA的腺苷脫氨酶(adenosine deaminase acting on RNA,ADAR)就是催化編輯發(fā)生的酶[8]。
2.1 ADAR家族ADAR在哺乳動物多種組織中廣泛表達(dá),而在中樞神經(jīng)系統(tǒng)中表達(dá)量最高,ADAR家族包括三個成員:ADAR1、ADAR2和ADAR3,這三者在蛋白結(jié)構(gòu)和生物功能方面有一定的相似性,也有較大的差異。
2.1.1 ADAR1。ADAR1是首個被發(fā)現(xiàn)并克隆的雙鏈RNA腺苷脫氨酶[9]。這種酶在脊椎動物中高度保守,其包含3個雙鏈RNA結(jié)合結(jié)構(gòu)域(double strands RNA bindingdomains,dsRBD)和一個C端催化脫氨結(jié)構(gòu)域[10]。ADAR1是由ADAR基因編碼的,在哺乳動物絕大多數(shù)組織中都有表達(dá),一般有兩種亞型—ADAR1 p150和ADAR1 p110,前者是從一個干擾素(interferon,IFN)-誘導(dǎo)型啟動子開始表達(dá)的,在核內(nèi)和胞質(zhì)都有表達(dá);而后者主要在核內(nèi)基礎(chǔ)性表達(dá)[11]。ADAR1是生命活動所必需的,ADAR1基因敲除小鼠在胚胎期死于異常的細(xì)胞凋亡和造血功能缺陷[12-13]。ADAR1也是一種干擾素信號抑制劑,可以保護(hù)機(jī)體免遭疾病相關(guān)的干擾素激活[14]。研究表明,ADAR1發(fā)生錯義突變在易感兒童中會引起一種致命的自身炎癥性疾病—Aicardi-Goutières綜合征,這是一種罕見的以神經(jīng)系統(tǒng)及皮膚受累為主的遺傳性疾病,主要臨床特征包括顱內(nèi)多發(fā)鈣化灶、腦白質(zhì)病變、腦脊液慢性淋巴細(xì)胞增多癥和凍瘡樣皮損[15]。
2.1.2 ADAR2。由ADARB1基因編碼的ADAR2在大腦中高表達(dá),心臟、肺、肝和腎中也有少量表達(dá)。如同ADAR1一樣,ADAR2的兩個N端dsRBD和一個近C端脫氨基結(jié)構(gòu)域也是高度保守的。ADAR2主要存在于核仁中,但在未成熟的神經(jīng)元中則集中于胞質(zhì)中,表明隨著發(fā)育調(diào)控,酶的分布有所變化。與ADAR1相比,在編輯底物的選擇上,二者既有相似性,也存在差異。ADAR2與多種腫瘤、炎癥、紅斑狼瘡、肌萎縮側(cè)索硬化癥、阿爾茨海默癥等疾病相關(guān)[16-17]。
2.1.3 ADAR3。ADAR3同ADAR1、ADAR2在序列和結(jié)構(gòu)上有很大的相似性,包括核酸定位、脫氨酶、dsRBD等結(jié)構(gòu)域[18]。迄今為止,還沒有研究顯示ADAR3具有可以影響生理功能的脫氨酶活性。最近一項(xiàng)研究表明,ADAR3可能作為其他ADAR蛋白的顯性失活形式發(fā)揮作用。相比正常腦組織,ADAR3在多形性成膠質(zhì)細(xì)胞瘤中是高表達(dá)的,其通過RNA結(jié)合結(jié)構(gòu)域與ADAR2競爭同GluR-B的結(jié)合[19]。鑒于ADAR3主要在大腦中表達(dá),推測其可能通過調(diào)節(jié)ADAR2/ADAR1介導(dǎo)的RNA編輯來調(diào)控腦部腫瘤的發(fā)生[20]。
2.2 APOBEC家族 在人類基因組中,有11個基因?qū)儆贏POBEC家族,包括APOBEC-1、-2、-3A、-3B、-3C、-3D、-3E、-3F、-3G、-3H、-4等[21]。APOBEC蛋白是胞苷脫氨酶,在脊椎動物中高度保守。研究發(fā)現(xiàn)這些蛋白能夠催化高頻突變,驅(qū)動腫瘤發(fā)生并產(chǎn)生治療抗性[22]。
RNA編輯受到高度精準(zhǔn)的調(diào)控,RNA編輯酶定位與表達(dá)的相關(guān)調(diào)控機(jī)制已經(jīng)得到廣泛研究[23-24]。根據(jù)組織來源和疾病狀態(tài),不同癌癥與總RNA編輯水平的增加或減少相關(guān)。在一些具有清晰的總編輯水平(過編輯vs低編輯)或RNA編輯酶表達(dá)水平明顯改變的疾病中,許多靶基因以相反的方式被編輯[25-26]。
同樣的編輯事件可以導(dǎo)致完全不同的功能或表型,例如在腫瘤發(fā)生過程中ADAR1介導(dǎo)的膠質(zhì)瘤相關(guān)致癌基因1(glioma-associated oncogene 1,GLI1)的編輯和ADAR2介導(dǎo)的衣被蛋白復(fù)合體亞基α(coatomer protein complex subunit alpha,COPA)的編輯[27-28]。APOBEC1編輯生成的apoB48和其對應(yīng)的全長蛋白apoB100促進(jìn)了動脈粥樣硬化和肥胖癥的發(fā)展,其程度與周圍的環(huán)境調(diào)控有關(guān)[29-30]。在兩種不同的動物模型中,同一靶基因上完全相同的編輯事件(如5-HT2CR的編輯)也可能會導(dǎo)致相反的表型(肥胖vs.瘦)[31-32]。
RNA編輯的幾個調(diào)控機(jī)制最近已得到鑒定,在諸如三陰性乳腺癌、化生性乳腺癌等惡性乳腺癌中,ADAR1的存在對腫瘤形成非常重要。研究發(fā)現(xiàn),在這些癌癥中,ADAR1的表達(dá)和活性受到腫瘤促進(jìn)蛋白CPSF6(cleavage and polyadenylation factor-6)和突變的核糖體蛋白RPL39(ribosomal protein L39,A14V)的調(diào)控。CPSF6和ADAR1相互作用,穩(wěn)定其定位并增強(qiáng)其RNA編輯能力[33]。另外,CPSF6介導(dǎo)的ADAR1的活化可被催乳素抑制,后者是一種乳腺分化因子。致癌突變體RPL39(A14V)通過與誘生型一氧化氮合酶iNOS和激活的信號轉(zhuǎn)導(dǎo)與轉(zhuǎn)錄活化因子STAT3作用誘導(dǎo)ADAR1的表達(dá),從而促進(jìn)了腫瘤的生長和藥物抗性[34]。
ADAR2在大腦中的功能得到廣泛研究,據(jù)報道一種剪接因子SRSF9(serine and arginine rich splicing factor 9)對ADAR2介導(dǎo)的RNA編輯有抑制作用。SRSF9同ADAR2及其編輯底物相互作用,干擾了ADAR2二聚體的形成,這對控制細(xì)胞生存相關(guān)基因的編輯至關(guān)重要,證實(shí)了剪接在RNA編輯調(diào)控機(jī)制中的重要性[35-36]。在結(jié)直腸癌中,PKCζ(protein kinase C zeta)對ADAR2進(jìn)行磷酸化,激活了其RNA編輯活性,磷酸化的ADAR2可能通過對COPA和其他底物的編輯促進(jìn)miR-200的累積,抑制了結(jié)直腸癌的肝轉(zhuǎn)移[37]。
鑒于ADAR1和ADAR2介導(dǎo)的RNA編輯之間的復(fù)雜關(guān)系,可能存在同時調(diào)控二者RNA編輯的機(jī)制,最新的一個例子是RNA解旋酶DHX9(DEAH box helicase 9),通過利用一種食管癌細(xì)胞系(EC109)中的過表達(dá)系統(tǒng),發(fā)現(xiàn)DHX9促進(jìn)ADAR1介導(dǎo)的RNA編輯而抑制ADAR2介導(dǎo)的RNA編輯[38],這一結(jié)果是DHX9表達(dá)與腫瘤發(fā)生具有緊密聯(lián)系的一個力證。高通量篩選技術(shù)被用于鑒定ADAR介導(dǎo)的RNA編輯的內(nèi)源性調(diào)節(jié)因子[39],目前,研究人員正不斷嘗試鑒定關(guān)于RNA編輯的其他內(nèi)源或外源的強(qiáng)化因子和抑制因子。
APOBEC1介導(dǎo)的C-to-U RNA編輯是在多個蛋白質(zhì)組成的編輯體中完成的[40]。迄今為止,這一編輯體中與其功能有關(guān)的許多組分已經(jīng)得到鑒定,包括ACF(APOBEC1 complementation factor)、HNRNPAB(heterogeneous nuclear ribonucleoprotein A/B),DNAJB11(DnaJ heat shock protein family member B11)、KSRP(KH-type splicing regulatory protein)、CELF2(CUGBP Elav-like family member 2)、SYNCRIP(synaptotagmin binding cytoplasmic RNA interacting protein)和RBM47(RNA binding motif protein 47)[41-47]。BAG4(Bcl2-associated Athanogene-4)是這一編輯體中一個罕見的負(fù)調(diào)控因子,研究發(fā)現(xiàn)這一調(diào)控因子通過將APOBEC1協(xié)助轉(zhuǎn)運(yùn)到細(xì)胞質(zhì)中,從而抑制了APOBEC1介導(dǎo)的RNA編輯[48]。除ACF和RBM47外,其他調(diào)控因子的生理學(xué)意義仍需要進(jìn)一步的驗(yàn)證[49]。
為證實(shí)APOBEC1調(diào)控癌癥發(fā)展的過程中這些“搭檔”的角色,一個利用睪丸生殖細(xì)胞腫瘤(testicular germ cell tumor,TGCT)小鼠模型完成的實(shí)驗(yàn)有力地揭示了這一聯(lián)系。利用自然發(fā)生TCGT的129/Sv同系交配小鼠,發(fā)現(xiàn)Apobec1缺陷會影響TGCT的易感性。更有意思的是,Apobec1缺陷在TGCT易感性中的作用受到種系的影響(母系vs.父系),而且以隔代遺傳的方式顯現(xiàn),表明APOBEC1可能通過RNA編輯調(diào)控可遺傳的表觀改變,影響了諸如睪丸癌等疾病的發(fā)展[50]。
一種代謝調(diào)控因子PPARα(peroxisome proliferatoractivated receptor alpha)在體內(nèi)影響了APOBEC1介導(dǎo)的RNA編輯。在缺乏低密度脂蛋白(LDL)受體的小鼠中,PPARα激活劑ciprofibrate(一種常見的降膽固醇藥物)通過減少Acf的表達(dá)降低了apoB在肝臟中的RNA編輯,結(jié)果導(dǎo)致apoB100相關(guān)的超低密度脂蛋白(very low density lipoprotein,VLDL)的不斷累積和動脈粥樣硬化[51],進(jìn)一步證實(shí)RNA編輯能夠通過影響對治療的應(yīng)答從而影響人類疾病。
由于RNA編輯在癌癥發(fā)展中起著顯著的作用,腫瘤發(fā)生相關(guān)通路和因子可能是這一機(jī)制重要的調(diào)控因素。例如,腫瘤抑制蛋白TP53參與腫瘤發(fā)生過程中的各個方面,但TP53與RNA編輯之間幾乎無關(guān)系[52]。目前,構(gòu)建了僅刪除TP53的活細(xì)胞模型,以研究先天性免疫應(yīng)答中ADAR1介導(dǎo)的RNA編輯[53]。TP53狀態(tài)影響ADAR1相關(guān)表型,這一事實(shí)表明其在RNA編輯中具有重要的作用。最近一項(xiàng)研究確證IFI16(interferon gamma inducible protein 16)是ADAR1和TP53共同的“互動合作伙伴”,進(jìn)一步證實(shí)了這一推測[54]。
對于另一個TP53相關(guān)蛋白ARF(alternative reading frame,或CDKN2A/p14),有證據(jù)暗示其在RNA編輯中發(fā)揮的角色。已知ARF通過抑制MDM2(mouse double minute 2)從而激活TP53,但迄今已經(jīng)鑒定了ARF的許多不依賴TP53的功能[55],其中之一便是最近在三陰性乳腺癌中證實(shí)的—ARF同TP53協(xié)作抑制了涉及干擾素β和STAT1的腫瘤促進(jìn)炎癥通路,而后兩者均為ADAR介導(dǎo)的RNA編輯重要的因子[53,56-58]。ARF和ADAR都將細(xì)胞核作為一個關(guān)鍵的中心,結(jié)合這一事實(shí),ARF似乎處于非常接近RNA編輯世界的中心位置[59-60]。
隨著對RNA編輯在癌癥和代謝性疾病中作用的理解不斷深入,RNA編輯和許多人類疾病相關(guān)因子之間的聯(lián)系會不斷被發(fā)現(xiàn)。不同腫瘤中編輯位點(diǎn)的分析有望為癌癥的診斷和預(yù)后提供新的標(biāo)記,有助于腫瘤的早期檢測,也有助于治療反應(yīng)的監(jiān)控及微小殘留病灶的發(fā)現(xiàn)。