劉珈璇,陳燕,許波群,3
(1.南京醫(yī)科大學(xué)第二附屬醫(yī)院婦產(chǎn)科,南京 210003; 2.南京醫(yī)科大學(xué)第四附屬醫(yī)院婦產(chǎn)科,南京 210031;3.南京醫(yī)科大學(xué)附屬逸夫醫(yī)院婦產(chǎn)科,南京 210000)
環(huán)狀RNA(circular RNA,circRNA)是RNA剪接過(guò)程中產(chǎn)生的具有環(huán)狀結(jié)構(gòu)的RNA,由前體信使RNA通過(guò)套索驅(qū)動(dòng)環(huán)化或內(nèi)含子配對(duì)驅(qū)動(dòng)環(huán)化形成。circRNA結(jié)構(gòu)穩(wěn)定、保守表達(dá),具有組織特異性,不易受核酸外切酶的干擾,半衰期比線性RNA高10倍[1]。既往研究顯示,circRNA在真核細(xì)胞中發(fā)揮關(guān)鍵作用[2],如作為微RNA(microRNA,miRNA)海綿[3],解除miRNA對(duì)其靶基因的抑制作用。circRNA的編碼功能已成為近年研究的熱點(diǎn)。研究表明,circRNA編碼蛋白產(chǎn)物可調(diào)控多種癌基因的轉(zhuǎn)錄延伸,發(fā)揮一定的促癌或抑癌作用,被認(rèn)為是某些腫瘤潛在的預(yù)后標(biāo)志物,如人類表皮生長(zhǎng)因子受體2(human epidermal growth factor receptor 2,HER2)-103aa在乳腺癌組織中高表達(dá),可能是乳腺癌形成的重要標(biāo)志物;含F(xiàn)-框WD重復(fù)域蛋白7(F-box and WD repeat domain containing protein 7,F(xiàn)BXW7)-185aa和SHPRH-146aa等均被證實(shí)可調(diào)控惡性膠質(zhì)瘤的形成和發(fā)展[4-8]。circRNA編碼功能的驗(yàn)證首先需要進(jìn)行全長(zhǎng)翻譯組測(cè)序,傳統(tǒng)的核糖體印跡測(cè)序檢測(cè)可編碼circRNA的效率較低,且具有一定局限性。其他工具也可協(xié)助預(yù)測(cè)circRNA的編碼功能。內(nèi)部核糖體進(jìn)入位點(diǎn)(internal ribosome entry site,IRES)和N6-甲基腺嘌呤(N6-methyladenosine,m6A)均可啟動(dòng)蛋白質(zhì)翻譯[9],誘導(dǎo)腫瘤等疾病的形成?,F(xiàn)就circRNA的蛋白編碼功能研究進(jìn)展予以綜述。
circRNA的翻譯需要兩個(gè)基本要素,即翻譯啟動(dòng)元件和開放閱讀框(open reading frame,ORF)。傳統(tǒng)的真核生物信使RNA的翻譯啟動(dòng)依賴于5′端7-甲基鳥嘌呤帽結(jié)構(gòu)的核糖體結(jié)構(gòu)。由于circRNA具有共價(jià)環(huán)狀結(jié)構(gòu),因此需要特殊的翻譯啟動(dòng)元件[10]。目前circRNA的翻譯方式主要包括IRES介導(dǎo)的翻譯和非IRES介導(dǎo)的翻譯,非IRES介導(dǎo)的翻譯又分為m6A修飾啟動(dòng)的翻譯、滾環(huán)擴(kuò)增翻譯以及由非翻譯區(qū)或其他啟動(dòng)元件介導(dǎo)的翻譯。
1.1IRES介導(dǎo)的翻譯 IRES是一個(gè)長(zhǎng)為數(shù)百個(gè)堿基對(duì)的基因工程元件,最早在脊髓灰質(zhì)炎病毒和腦心肌炎病毒中被發(fā)現(xiàn)[11-12]。IRES可直接招募核糖體的40S亞基,啟動(dòng)3′方向ORF的翻譯。有學(xué)者設(shè)計(jì)構(gòu)建一個(gè)包含IRES和一種綠色熒光蛋白(green fluorescent protein,GFP)的迷你報(bào)告基因,其中GFP的ORF序列被分為兩部分且反向排列,IRES被插入到起始密碼子的上游以啟動(dòng)蛋白質(zhì)合成,結(jié)果顯示,前體信使RNA可通過(guò)在人和果蠅細(xì)胞中的有效反向剪接產(chǎn)生circRNA,并通過(guò)IRES翻譯生成功能性GFP[13]。Perriman和Ares[14]將含有IRES和GFP序列的circRNA轉(zhuǎn)染大腸埃希菌,結(jié)果檢測(cè)到完整的GFP。此外,F(xiàn)LAG標(biāo)簽抗體也被廣泛應(yīng)用。如Li等[4]研究發(fā)現(xiàn),circ-FBXW7中的IRES具有相對(duì)活性,且具有引導(dǎo) 5′帽非依賴性翻譯的能力,F(xiàn)LAG標(biāo)簽序列被插入到ORF序列前IRES引導(dǎo)該段ORF的翻譯,并通過(guò)FLAG抗體的免疫印跡結(jié)果顯示出來(lái),表明circ-FBXW7可在人類細(xì)胞中翻譯相關(guān)蛋白。Xia等[15]設(shè)計(jì)IRES突變序列組以驗(yàn)證circ-蛋白激酶B(protein kinase B,PKB/Akt)3編碼蛋白的能力,結(jié)果發(fā)現(xiàn),若IRES序列發(fā)生突變,circ-Akt3則不能翻譯蛋白,表明circ-Akt3的翻譯功能由IRES介導(dǎo)。
1.2m6A修飾介導(dǎo)的翻譯 RNA的m6A修飾是在RNA分子A堿基的第六位N元素上加上一個(gè)甲基基團(tuán),其過(guò)程依賴于一個(gè)公認(rèn)的motif基序“RRm6ACH”(R=G或A;H=A,C或U)[16]。研究表明,腺苷的甲基化受甲基轉(zhuǎn)移酶復(fù)合物、去甲基化酶和m6A修飾結(jié)合蛋白閱讀器共同調(diào)控[17-18]。近年來(lái),m6A也被發(fā)現(xiàn)可啟動(dòng)蛋白質(zhì)的翻譯。如Yang等[9]通過(guò)構(gòu)建迷你報(bào)告基因發(fā)現(xiàn),包括陰性對(duì)照在內(nèi)的所有插入序列均可有效起始GFP翻譯,這是因?yàn)殛幮詫?duì)照在起始密碼子附近均含有1個(gè)RRACH motif基序,該序列突變導(dǎo)致GFP水平顯著降低。此外,Zhao等[19]研究發(fā)現(xiàn),高風(fēng)險(xiǎn)人乳頭瘤病毒(human papilloma virus,HPV)可產(chǎn)生很多circRNA,如circE7可翻譯E7蛋白,并促進(jìn)宮頸癌細(xì)胞發(fā)生轉(zhuǎn)化,其中HPV16 circE7具有多個(gè)潛在m6A修飾位點(diǎn),沉默m6A RNA甲基化修飾酶——甲基轉(zhuǎn)移酶樣蛋白3/14的表達(dá)可顯著抑制circE7的表達(dá);同時(shí),circE7非翻譯區(qū)的潛在m6A基序突變也可顯著抑制circE7和E7蛋白的表達(dá),但并不會(huì)抑制線性E6/E7信使RNA的表達(dá),提示m6A修飾對(duì)于circE7翻譯表達(dá)非常重要。
1.3滾環(huán)擴(kuò)增翻譯 滾環(huán)擴(kuò)增是一種快速、靈敏且恒溫的單鏈DNA擴(kuò)增技術(shù)[20]。既往有研究表明,有些circRNA因終止密碼子的缺失而具有無(wú)限ORF,使其像真核生物一樣進(jìn)行滾環(huán)擴(kuò)增方式的翻譯。如Abe等[21]構(gòu)建了一種含有無(wú)限ORF的circRNA,結(jié)果發(fā)現(xiàn)不含終止密碼子的circRNA蛋白表達(dá)顯著升高,表明其可模擬滾環(huán)擴(kuò)增在大腸埃希菌內(nèi)進(jìn)行翻譯。Abe等[22]合成4×FLAG(129 nt)、8×FLAG(258 nt)和16×FLAG(387 nt)的小circRNA,并測(cè)試其編碼能力,結(jié)果發(fā)現(xiàn),與線性RNA相比,8×FLAG表達(dá)的蛋白分子量更大,證實(shí)circRNA可以在無(wú)啟動(dòng)元件的條件下通過(guò)滾環(huán)擴(kuò)增翻譯蛋白。
2.1預(yù)測(cè)circRNA翻譯能力的工具 circRNA的翻譯需要啟動(dòng)元件和ORF,在獲得circRNA全長(zhǎng)序列信息后,還需要利用生物信息學(xué)工具對(duì)其翻譯能力進(jìn)行初步預(yù)測(cè)。目前常用的預(yù)測(cè)工具主要包括:①ORF預(yù)測(cè)。ORF Finder通過(guò)對(duì)用戶提供的完整circRNA序列進(jìn)行檢索得到所有可能的ORF,并推導(dǎo)出對(duì)應(yīng)氨基酸序列;circPrimer軟件不僅有分析引物序列的功能,還可以圖示注解一段完整的circRNA序列,判斷其是否是可編碼序列,并對(duì)可能存在的ORF和IRES進(jìn)行預(yù)測(cè)(表1)。②circRNA翻譯能力預(yù)測(cè)。CPC(coding potential calculator)[24]和CPAT(coding-potential assessment tool)[25]可從眾多的候選轉(zhuǎn)錄本中篩選出編碼和非編碼轉(zhuǎn)錄本,同時(shí)評(píng)估circRNA的翻譯能力,評(píng)估得分越接近1,越有可能翻譯蛋白;riboCIRC[26]數(shù)據(jù)庫(kù)則可提供經(jīng)過(guò)實(shí)驗(yàn)驗(yàn)證的翻譯的circRNA集合、可翻譯的 circRNA的跨物種保護(hù)評(píng)估、推定的circRNA編碼肽注釋。③circRNA翻譯啟動(dòng)序列預(yù)測(cè),預(yù)測(cè)circRNA序列是否含有IRES或m6A基序或其他。IRESite通過(guò)收錄已被驗(yàn)證的實(shí)驗(yàn)數(shù)據(jù)總結(jié)出具有IRES的基因[27];用戶輸入circRNA序列后,IRESite和IRES Finder[28]即會(huì)對(duì)circRNA上潛在的IRES進(jìn)行預(yù)測(cè);SRAMP軟件可基于序列特征對(duì)哺乳動(dòng)物circRNA的m6A基序進(jìn)行預(yù)測(cè)[29]。circRNADB數(shù)據(jù)庫(kù)首次將人類可編碼蛋白的circRNA信息進(jìn)行詳盡匯總,搜索基因名稱即可查詢相應(yīng)circRNA的ORF、IRES、m6A基序以及編碼蛋白產(chǎn)物等信息[30]。
2.2驗(yàn)證circRNA的翻譯能力 初步通過(guò)生物信息學(xué)工具預(yù)測(cè)circRNA的翻譯潛能后,還需要進(jìn)行驗(yàn)證。①判斷該circRNA是否與核糖體相關(guān)。多聚核糖體圖譜技術(shù)是較為經(jīng)典的研究翻譯組的技術(shù)[31]。核糖體印跡測(cè)序是一種分子方法,首先通過(guò)核糖核酸酶R處理使不受保護(hù)的RNA降解,剩余的RNA片段即與核糖體相關(guān),將其回收至原始RNA中進(jìn)行二代測(cè)序,即可得到翻譯核糖體的位置信息[32]。而全長(zhǎng)翻譯組測(cè)序是指提取與核糖體結(jié)合的信使RNA并進(jìn)行測(cè)序,此種方法更簡(jiǎn)便,且RNA回收效率高。②檢測(cè)IRES或m6A motif基序活性。通過(guò)構(gòu)建不同的海腎熒光素酶-熒光素酶串聯(lián)報(bào)告基因質(zhì)粒,分別測(cè)定每個(gè)質(zhì)粒中熒光素酶相對(duì)于海腎熒光素酶的熒光素酶活性,完整IRES序列的熒光素酶活性最高;而對(duì)于m6A motif基序,通過(guò)在circRNA報(bào)告的起始密碼子之前插入1個(gè)包含突變類型或不同m6A基序副本的短片段,測(cè)量轉(zhuǎn)染細(xì)胞中GFP或E7蛋白的產(chǎn)量實(shí)現(xiàn)其活性檢測(cè)[19]。③circRNA的ORF功能驗(yàn)證。設(shè)計(jì)含有該circRNA ORF和FLAG標(biāo)簽的質(zhì)粒,在體外系統(tǒng)進(jìn)行轉(zhuǎn)染,使用FLAG標(biāo)簽抗體通過(guò)免疫印跡法檢測(cè)是否有與預(yù)測(cè)蛋白分子量一致的蛋白生成,從而證實(shí)ORF是否具有翻譯功能。④根據(jù)ORF蛋白產(chǎn)物序列推測(cè)特異性抗體,并通過(guò)免疫印跡法進(jìn)一步檢測(cè)蛋白翻譯的可靠性,此后還可通過(guò)質(zhì)譜分析驗(yàn)證產(chǎn)物序列是否符合預(yù)測(cè)。⑤驗(yàn)證特定刺激或蛋白對(duì)circRNA翻譯的影響,檢測(cè)circRNA的翻譯產(chǎn)物是否受到影響。
3.1circRNA編碼蛋白與宮頸癌 宮頸癌是常見的女性生殖系統(tǒng)惡性腫瘤之一,其發(fā)生與HPV密切相關(guān)。E6和E7蛋白是HPV感染細(xì)胞后早期階段產(chǎn)生的具有致癌作用的兩種蛋白[33]。Zhao等[19]選擇高危型HPV16和HPV35并通過(guò)RNA-seq數(shù)據(jù)篩選其前向或反向剪接位點(diǎn),結(jié)果發(fā)現(xiàn),其反向剪接位點(diǎn)可以產(chǎn)生circE7,長(zhǎng)度472 nt,且包含完整的E7 ORF,circE7可被m6A修飾,主要定位于細(xì)胞質(zhì),其與多核糖體密切相關(guān),可被翻譯為E7癌蛋白,腫瘤細(xì)胞中的circE7表達(dá)上調(diào)可導(dǎo)致E7癌蛋白產(chǎn)生增加,從而促進(jìn)宮頸癌細(xì)胞的增殖和轉(zhuǎn)化。目前關(guān)于circRNA編碼功能與其他女性生殖系統(tǒng)腫瘤的關(guān)系尚不清楚,還需未來(lái)進(jìn)一步研究探索。
表1 circRNA編碼情況與軟件預(yù)測(cè)間的對(duì)比
3.2circRNA編碼蛋白與乳腺癌 HER2存在于細(xì)胞膜表面,參與導(dǎo)致細(xì)胞生長(zhǎng)、分化的信號(hào)轉(zhuǎn)導(dǎo)通路。三陰性乳腺癌(triple negative breast cancer,TNBC)以缺乏HER2基因、雌激素受體、孕激素受體為特征[34]。Li等[4]選取5例TNBC樣本及其配對(duì)的對(duì)照樣本鑒定差異表達(dá)的circ-HER2,并通過(guò)Flag標(biāo)簽抗體驗(yàn)證circ-HER2編碼蛋白產(chǎn)物HER2-103aa,結(jié)果發(fā)現(xiàn),與circ-HER2/HER2-103aa陰性的患者相比,circ-HER2/HER2-103aa陽(yáng)性的TNBC患者總體預(yù)后較差;此外,在體外和體內(nèi)敲低circ-HER2可抑制TNBC細(xì)胞增殖、侵襲,提示circ-HER2/HER2-103aa在TNBC致瘤性中發(fā)揮重要作用。
3.3circRNA編碼蛋白與膠質(zhì)母細(xì)胞瘤 膠質(zhì)母細(xì)胞瘤是成人中樞神經(jīng)系統(tǒng)最常見的原發(fā)性惡性腫瘤,約占所有惡性腦腫瘤的80%[35]。在神經(jīng)系統(tǒng)惡性膠質(zhì)瘤中,可編碼的circRNA較多,對(duì)惡性膠質(zhì)瘤的發(fā)生發(fā)展具有一定抑制作用。如Yang等[5]研究發(fā)現(xiàn),在惡性膠質(zhì)瘤組織中高表達(dá)的circFBXW7通過(guò)IRES介導(dǎo)編碼一個(gè)未命名的多肽FBXW7-185aa;FBXW7-185aa可與FBXW7蛋白共同調(diào)控原癌基因C-Myc的穩(wěn)定性,從而抑制惡性膠質(zhì)瘤的形成[36]。此外,Akt是受體酪氨酸激酶/磷脂酰肌醇-3-激酶信號(hào)通路的關(guān)鍵下游因子,可介導(dǎo)腫瘤細(xì)胞增殖、存活和惡性轉(zhuǎn)化。Xia等[15]發(fā)現(xiàn),膠質(zhì)母細(xì)胞瘤中的circ-Akt3表達(dá)降低,且過(guò)表達(dá)Akt3-174aa可降低膠質(zhì)母細(xì)胞瘤的細(xì)胞增殖、抗輻射和體內(nèi)致瘤能力。既往研究顯示,SHPRH(SNF2 histone linker PHD RING helicase)的環(huán)化形式circ-SHPRH是一種新型腫瘤相關(guān)circRNA,與多種腫瘤相關(guān),包括肝細(xì)胞癌[37-38]、胃癌[39-40]、膽管癌[41]、胰腺導(dǎo)管腺癌[42]、視網(wǎng)膜母細(xì)胞瘤[43]和惡性膠質(zhì)瘤[44]等。Zhang等[6]發(fā)現(xiàn),circ-SHPRH可以編碼146個(gè)氨基酸的蛋白質(zhì)(SHPRH-146aa),并在腫瘤發(fā)生過(guò)程中表現(xiàn)出抑癌活性;正常人腦中的circ-SHPRH和SHPRH-146aa表達(dá)高于膠質(zhì)母細(xì)胞瘤;在U251和U373膠質(zhì)母細(xì)胞瘤細(xì)胞中過(guò)表達(dá)SHPRH-146aa可減少其體內(nèi)外惡性行為和降低致瘤性,且SHPRH-146aa可保護(hù)全長(zhǎng)SHPRH不被泛素蛋白酶體降解。因此,circ-SHPRH及其編碼產(chǎn)物SHPRH-146aa可作為膠質(zhì)母細(xì)胞瘤相關(guān)的生物標(biāo)志物。此外,Hedgehog通路激活也在膠質(zhì)母細(xì)胞瘤中發(fā)揮作用,但其致敏機(jī)制目前尚未明確。Hedgehog基因可通過(guò)增強(qiáng)SMO(smoothened)膽固醇修飾抑制跨膜受體釋放SMO,從而誘導(dǎo)SMO激活[45]。Wu等[46]通過(guò)數(shù)據(jù)庫(kù)篩選Hedgehog基因表達(dá)豐富的circ-SMO(hsa_circ_0001742)發(fā)現(xiàn),其可編碼一種新的SMO-193aa;進(jìn)一步通過(guò)體外實(shí)驗(yàn)證實(shí),SMO-193aa可減弱腦腫瘤干細(xì)胞的Hedgehog信號(hào)強(qiáng)度,抑制其自我更新、增殖和體內(nèi)致瘤性,導(dǎo)致膠質(zhì)母細(xì)胞瘤的形成。
3.4circRNA編碼蛋白與肝癌 Wnt/β聯(lián)蛋白(β-catenin)信號(hào)通路在肝細(xì)胞癌的發(fā)病機(jī)制中發(fā)揮重要作用。既往研究表明,40%~70%的肝癌患者存在β-catenin異常激活,而β-catenin過(guò)度激活與預(yù)后不良有關(guān)[47]。Liang等[23]研究發(fā)現(xiàn),circβ-catenin可編碼產(chǎn)生β-catenin-370aa,從而促進(jìn)肝細(xì)胞癌細(xì)胞生長(zhǎng)。糖原合酶激酶(glycogen synthase kinase,GSK)-3β是一種多功能絲氨酸/蘇氨酸蛋白激酶,GSK-3β失調(diào)參與腫瘤細(xì)胞存活、凋亡、增殖和侵襲以及維持腫瘤干性和誘導(dǎo)治療抗性,抑制GSK-3β則可保護(hù)正常細(xì)胞和組織免受與傳統(tǒng)腫瘤治療相關(guān)的有害影響,且這種治療效果已在25種腫瘤中得到證實(shí)[48]。此外,β-catenin-370aa還可充當(dāng)GSK-3β的誘餌,逃避GSK-3β誘導(dǎo)的β-catenin降解,從而穩(wěn)定全長(zhǎng)β-catenin,激活Wnt通路[23]。以上研究表明,circRNA可通過(guò)Wnt/β-catenin通路調(diào)控肝癌細(xì)胞的非典型功能,為研究肝細(xì)胞癌形成機(jī)制提供了新思路。
3.5circRNA編碼蛋白與胃癌 促分裂原活化的蛋白激酶(mitogen-activated protein kinase,MAPK)通路廣泛參與細(xì)胞增殖、炎癥和凋亡,對(duì)胃癌細(xì)胞生長(zhǎng)也具有一定調(diào)控作用,circMAPK1低表達(dá)預(yù)示胃癌患者的低生存率。如Jiang等[49]通過(guò)circBase數(shù)據(jù)庫(kù)檢索MAPK通路相關(guān)的circRNA,發(fā)現(xiàn)胃癌組織中的hsa_circ_0004872表達(dá)顯著下調(diào),并將其命名為circMAPK1;circMAPK1編碼的MAPK1-109aa過(guò)表達(dá)可顯著抑制細(xì)胞增殖、遷移和侵襲;circMAPK1-109aa還可通過(guò)競(jìng)爭(zhēng)性結(jié)合MAPK激酶1抑制MAPK1的磷酸化,發(fā)揮抑癌作用。以上研究表明,MAPK1-109aa可作為胃癌的有效診斷工具和治療靶點(diǎn)。此外,Zhang等[50]通過(guò)生物信息學(xué)分析鑒定出胃癌組織中差異表達(dá)的hsa_circ_0061137(circDIDO1),circDIDO1在胃癌組織中下調(diào)并編碼circDIDO1-529aa,而circDIDO1-529aa可通過(guò)抑制聚腺苷酸二磷酸核糖轉(zhuǎn)移酶-1活性并與過(guò)氧化物還原酶2蛋白結(jié)合促進(jìn)其降解,發(fā)揮腫瘤抑制作用。
3.6circRNA編碼蛋白與結(jié)腸癌 Hippo信號(hào)通路可調(diào)控細(xì)胞增殖、凋亡及干細(xì)胞自我更新能力,其失調(diào)可導(dǎo)致結(jié)腸癌發(fā)展。Yes相關(guān)蛋白(Yes-associated protein,YAP)是Hippo信號(hào)通路磷酸化下游效應(yīng)因子,Hippo-YAP信號(hào)通路可抑制細(xì)胞生長(zhǎng),調(diào)控細(xì)胞分化。如Zheng等[7]發(fā)現(xiàn),circPPP1R12A(protein phosphatase 1 regulatory subunit 12A)在結(jié)腸癌組織中顯著上調(diào),且circPPP1R12A高表達(dá)的結(jié)腸癌患者總生存期顯著縮短;circPPP1R12A可編碼circPPP1R12A-73aa,并通過(guò)激活結(jié)腸癌中的Hippo-YAP信號(hào)通路促進(jìn)結(jié)腸癌細(xì)胞增殖、遷移和侵襲。
circRNA翻譯的蛋白產(chǎn)物可以在不同組織和疾病中發(fā)揮生物學(xué)功能,其中大多通過(guò)不同的信號(hào)轉(zhuǎn)導(dǎo)通路發(fā)揮抑瘤或促瘤作用。但目前關(guān)于circRNA翻譯功能的研究尚未完全成熟,如circRNA是否存在其他的翻譯方式、circRNA 翻譯蛋白除了可影響腫瘤發(fā)生是否還可調(diào)控其他生物學(xué)行為以及目前預(yù)測(cè)工具的算法尚不成熟、相關(guān)實(shí)驗(yàn)技術(shù)也有待精進(jìn)等??傊?,對(duì)circRNA翻譯功能的探索為RNA研究提供了新方向,也為臨床治療帶來(lái)新思路。相信隨著研究的不斷深入,一定會(huì)推動(dòng)生命科學(xué)、醫(yī)學(xué)和蛋白質(zhì)工程等領(lǐng)域共同發(fā)展。