林樂(lè)成,陳伶俐,陳志鴻
(右江民族醫(yī)學(xué)院,廣西 百色 530000)
腎細(xì)胞癌(renal cell carcinoma,RCC)常稱為腎癌,是泌尿系統(tǒng)中惡性度較高的腫瘤,也是最常見(jiàn)的腫瘤之一,起源于腎小管上皮細(xì)胞,可發(fā)生于腎實(shí)質(zhì)的任何部位。原發(fā)性腎癌占原發(fā)性腎臟腫瘤的90%~95%,按細(xì)胞類型可分為多種型,其中腎透明細(xì)胞癌(kidney renal clear cell carcinoma,KIRC)較多見(jiàn)(占70%~80%)[1]。近年來(lái),原發(fā)性腎癌的發(fā)病率逐漸升高,但腎癌的發(fā)病機(jī)制目前未完全明確,針對(duì)腎癌的早期診斷及靶向治療手段依然缺乏。因此,從分子水平闡明腎癌發(fā)生、發(fā)展機(jī)制,發(fā)現(xiàn)新的腎癌標(biāo)記物及有效的生物治療靶點(diǎn)是進(jìn)一步提高腎癌防治水平的關(guān)鍵[1-3]。TGF-β信號(hào)通路在腫瘤的發(fā)生、發(fā)展進(jìn)程中發(fā)揮重要的作用。RNF111基因編碼的Arkadia蛋白,由994個(gè)氨基酸開(kāi)放閱讀框架構(gòu)成的蛋白,具有泛素結(jié)合酶的RING結(jié)構(gòu)域及靶蛋白識(shí)別結(jié)構(gòu)。已有研究表明,Arkadia可通過(guò)降解TGF-β信號(hào)通路中的負(fù)調(diào)控因子Smad7、SnoN和Ski來(lái)增強(qiáng)TGF-β信號(hào)通路,作為抑癌基因抑制結(jié)腸癌、肺癌等惡性腫瘤的發(fā)生發(fā)展,但具體機(jī)制仍有待深入闡明[4-7]。目前,關(guān)于RNF111在KIRC組織中的表達(dá)、臨床意義和生物學(xué)功能的研究少見(jiàn)報(bào)道。因此,本研究通過(guò)對(duì)癌癥基因圖譜(the cancer genome atlus,TCGA)數(shù)據(jù)庫(kù)進(jìn)行挖掘分析,研究RNF111在KIRC中的表達(dá)情況,分析其與KIRC臨床病理特征的關(guān)系,并探討其潛在的預(yù)后價(jià)值。
1.1 利用在線數(shù)據(jù)庫(kù)分析RNF111在KIRC中的表達(dá) 利用TIMER數(shù)據(jù)庫(kù)(https://cistrome.shinyapps.io/timer/)分析RNF111在不同癌癥類型中的表達(dá)水平。利用UALCAN數(shù)據(jù)庫(kù)(http://gepia.cancer-pku.cn/index.htmlml)進(jìn)一步驗(yàn)證TCGA數(shù)據(jù)庫(kù)中KIRC與其正常組織相比RNF111的表達(dá)差異。利用人類蛋白圖譜項(xiàng)目(human protein atlas project)數(shù)據(jù)庫(kù)(https://www.proteinatlas.org/)進(jìn)一步挖掘RNF111在正常腎臟組織、KIRC組織中的蛋白表達(dá)情況。
1.2 GO和KEGG通路富集分析 利用LinkedOmics在線數(shù)據(jù)庫(kù)(http://www.linkedomics.org/login.php)下載RNF111相關(guān)基因。通過(guò)DAVID在線工具(https://david.ncifcrf.gov)進(jìn)行基因本體論(gene ontology,GO)和京都基因與基因組百科全書(shū)(kyoto encyclopedia of genes and genomes,KEGG)通路富集分析。以P<0.05為檢驗(yàn)水準(zhǔn),獲得RNF111共表達(dá)基因所參與的分子功能(molecular function,MF)、生物過(guò)程(biological process,BP)、細(xì)胞組分(cellular component,CC)和KEGG通路信息。
1.3 利用UALCAN數(shù)據(jù)庫(kù)分析RNF111表達(dá)與臨床病理特征的相關(guān)性 利用UALCAN平臺(tái)分析RNF111表達(dá)與患者臨床病理特征(腫瘤分期、分級(jí)、種族和淋巴結(jié)轉(zhuǎn)移)之間的關(guān)系。
1.4 利用GEPIA和HPA數(shù)據(jù)庫(kù)分析RNF111表達(dá)與臨床病理特征的相關(guān)性 利用GEPIA數(shù)據(jù)庫(kù)(http://gepia.cancer-pku.cn/)分析RNF111表達(dá)與KIRC患者預(yù)后之間的關(guān)系,并利用HPA和UALCAN數(shù)據(jù)庫(kù)進(jìn)一步驗(yàn)證。
1.5 應(yīng)用GeneMANIA數(shù)據(jù)庫(kù)分析與RNF111相互作用的基因 通過(guò)GeneMANIA數(shù)據(jù)庫(kù)(http://genemania.org/)獲取與RNF111可能存在相互作用的基因并進(jìn)一步確定共表達(dá)網(wǎng)絡(luò)。
1.6 統(tǒng)計(jì)學(xué)方法 在UALCAN、DAVID和TIMER在線數(shù)據(jù)庫(kù)中生成KIRC與其正常組織RNF111表達(dá)差異及RNF111相關(guān)基因GO、KEGG通路富集的P值。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
2.1 RNF111在KIRC組織中表達(dá)情況 TIMER數(shù)據(jù)庫(kù)分析結(jié)果顯示,RNF111在KIRC、乳腺浸潤(rùn)癌(BRCA)、前列腺癌(PRAD)、皮膚黑色素瘤(SKCM)、甲狀腺癌(THCA)和子宮內(nèi)膜癌(UCEC)等癌組織低表達(dá)(見(jiàn)圖1A)。應(yīng)用UALCAN數(shù)據(jù)庫(kù)分析RNF111在TCGA數(shù)據(jù)庫(kù)中正常腎臟組織(72例)和ESRP1腫瘤組織(533例)中ESRP1 mRNA的表達(dá),結(jié)果顯示,KIRC腫瘤組織中的ESRP1 mRNA表達(dá)水平低于腎臟正常組織,差異具有統(tǒng)計(jì)學(xué)意義(見(jiàn)圖1B)。進(jìn)一步利用人類蛋白(human protein atlas,HPA)數(shù)據(jù)庫(kù)進(jìn)一步挖掘RNF111在正常組織、腫瘤組織中的蛋白表達(dá)情況,結(jié)果顯示,KIRC腫瘤組織中的RNF111蛋白表達(dá)水平總體低于腎臟正常組織,典型的免疫組化結(jié)果(見(jiàn)圖1C)。
注:A.利用TIMER數(shù)據(jù)庫(kù)分析RNF111在各腫瘤組織中的表達(dá)情況,其中KIRC為腎透明細(xì)胞癌。紅色為腫瘤組織, 藍(lán)色為正常組織。**P<0.01,***P<0.001;B.利用UALCAN數(shù)據(jù)庫(kù)分析RNF111 mRNA在KIRC和正常 腎組織中的表達(dá)情況;C.利用HPA數(shù)據(jù)庫(kù)分析RNF111蛋白在KIRC和正常腎組織中的表達(dá)。圖1 RNF111在腫瘤組織中的表達(dá)情況
2.2 RNF111表達(dá)水平與KIRC患者臨床病理特征的相關(guān)性 利用UALCAN在線數(shù)據(jù)庫(kù)分析RNF111表達(dá)水平與KIRC患者臨床病理特征的關(guān)聯(lián)。結(jié)果表明,RNF111表達(dá)水平與KIRC病理分期、分級(jí)和種族存在相關(guān)性,差異具有統(tǒng)計(jì)學(xué)意義(P<0.05),但與淋巴結(jié)轉(zhuǎn)移無(wú)相關(guān)性,差異無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05),見(jiàn)圖2。這些分析結(jié)果提示,RNF111的表達(dá)與KIRC的進(jìn)展高度相關(guān)。
注:A.不同病理分期中RNF111的表達(dá)水平;B.不同病理分級(jí)中RNF111的表達(dá)水平;C.不同種族中RNF111的表達(dá)水平; D.不同程度淋巴結(jié)轉(zhuǎn)移患者中RNF111的表達(dá)水平。*P<0.05,**P<0.01,***P<0.001。圖2 RNF111表達(dá)水平與KIRC患者臨床病理特征的關(guān)系
2.3 RNF111表達(dá)水平與KIRC患者預(yù)后的關(guān)系 利用GEPIA數(shù)據(jù)庫(kù)分析RNF111表達(dá)水平與KIRC患者預(yù)后的相關(guān)性,結(jié)果表明,RNF111的表達(dá)水平與KIRC患者的總體生存率(LogrankP=0.00024,n=258)和無(wú)病生存率(LogrankP=0.00072,n=258)顯著相關(guān)。RNF111高表達(dá)組患者總體生存率和無(wú)病生存率明顯高于RNF111低表達(dá)組患者(見(jiàn)圖3A、圖3B)。UALCAN數(shù)據(jù)庫(kù)分析也顯示,RNF111的高表達(dá)對(duì)KIRC患者的生存率產(chǎn)生有利影響,差異具有統(tǒng)計(jì)學(xué)意義(P=0.00072)。為了對(duì)上述結(jié)果進(jìn)行驗(yàn)證,通過(guò)HPA數(shù)據(jù)庫(kù)分析得到更為詳細(xì)的數(shù)據(jù)結(jié)果,顯示RNF111高表達(dá)組KIRC患者5年生存率為74.00%,低表達(dá)組5年存活率為55.00%,差異有統(tǒng)計(jì)學(xué)意義(P<0.001),見(jiàn)圖3C,進(jìn)一步證明結(jié)果的可靠性。
注:A、 B.GEPIA數(shù)據(jù)庫(kù)分析RNF111表達(dá)與KIRC患者生存率的相關(guān)性。A.總體生存率(overall survival); B.無(wú)病生存率(disease free survival);C.HPA數(shù)據(jù)庫(kù)分析患者的5年生存率。圖3 RNF111表達(dá)水平對(duì)KIRC患者預(yù)后的影響
2.4 RNF111共表達(dá)基因的富集通路分析 利用LinkedOmics數(shù)據(jù)庫(kù)對(duì)RNF111進(jìn)行相關(guān)基因分析,以P<0.01為界限,共檢測(cè)出10 980個(gè)相關(guān)基因。利用DAVID在線數(shù)據(jù)庫(kù)對(duì)RNF111正相關(guān)和負(fù)相關(guān)前100個(gè)基因進(jìn)行富集分析。生物學(xué)過(guò)程富集分析結(jié)果顯示,RNF111表達(dá)相關(guān)基因顯著富集到RNA聚合酶Ⅱ啟動(dòng)子的轉(zhuǎn)錄延伸(transcription elongation from RNA polymerase Ⅱ promoter)、蛋白酶體介導(dǎo)的泛素依賴性蛋白質(zhì)分解代謝過(guò)程(proteasome-mediated ubiquitin-dependent protein catabolic process)及蛋白質(zhì)多聚泛素化(protein polyubiquitination)等生物過(guò)程。分子功能富集分析結(jié)果顯示,RNF111與蛋白結(jié)合(protein binding)、泛素-蛋白連接酶活性(ubiquitin protein ligase activity)及泛素-蛋白酶轉(zhuǎn)移活性(ubiquitin-protein transferase activity)等顯著相關(guān)。細(xì)胞組分富集分析顯示,RNF111相關(guān)基因主要位于細(xì)胞核(nucleus)、細(xì)胞質(zhì)(cytoplasm)和核膜等。KEGG分析結(jié)果顯示,RNF111表達(dá)相關(guān)基因與胞吞作用(endocytosis)、腎細(xì)胞癌(renal cell carcinoma)及泛素介導(dǎo)的蛋白水解(ubiquitin mediated proteolysis)等相關(guān)。見(jiàn)圖4。
注:A.RNF111表達(dá)相關(guān)基因分布散點(diǎn)圖,其中深紅色為與RNF111正相關(guān)基因,深綠色為與RNF111負(fù)相 關(guān)基因;B、C.RNF111相關(guān)性前50的基因熱圖,B為正相關(guān)基因,C為負(fù)相關(guān)基因;D~G:基因本 體(gene ontology, GO)分析,D.生物學(xué)過(guò)程,E.分子功能,F(xiàn).細(xì)胞組分,G.KEGG信號(hào)通路。圖4 基于TCGA數(shù)據(jù)庫(kù)的RNF111在KIRC中的GO 富集分析
2.5 RNF111共表達(dá)網(wǎng)絡(luò)的構(gòu)建 為明確與RNF111編碼產(chǎn)物Arkadia相互作用的蛋白,在GeneMANIA數(shù)據(jù)庫(kù)中利用物理學(xué)相互作用(physical interactions)、共表達(dá)(co-expression)、預(yù)測(cè)(predicted)、共定位(co-localization)、通路(pathway)、基因相互作用(genetic interactions)和共享蛋白結(jié)構(gòu)域(shared protein domains)等方案篩選到了ESRP1/2、UBB、UBC及SMAD7等多個(gè)蛋白,提示Arkadia可能與這些蛋白存在相互作用,具體作用及相關(guān)分子機(jī)制有待進(jìn)一步探討。見(jiàn)圖5。
生物信息學(xué)技術(shù)是隨著生命科學(xué)及信息學(xué)的發(fā)展形成的一種新興技術(shù),其在闡明疾病發(fā)生機(jī)制、篩選藥物候選靶點(diǎn)以及分析生物大分子結(jié)構(gòu)和功能研究領(lǐng)域中發(fā)揮了重要作用[8-10]。在此背景下以TCGA為代表的生物信息學(xué)數(shù)據(jù)庫(kù)應(yīng)運(yùn)而生。TCGA是一個(gè)非常重要的癌癥數(shù)據(jù)庫(kù),主要收錄各種人類癌癥(包括亞型在內(nèi)的腫瘤)的臨床數(shù)據(jù)、基因組變異、mRNA表達(dá)、miRNA表達(dá)及甲基化等數(shù)據(jù),是腫瘤相關(guān)研究重要的
圖5 RNF111蛋白相互作用網(wǎng)絡(luò)圖
數(shù)據(jù)來(lái)源[11-13]。本研究基于TCGA數(shù)據(jù)庫(kù),通過(guò)多個(gè)TCGA可視化在線工具進(jìn)行數(shù)據(jù)挖掘分析,為防止單一數(shù)據(jù)庫(kù)造成的分析誤差,利用不同在線工具相互驗(yàn)證從而保證分析結(jié)果的可靠性。
眾所周知,泛素化降解是真核細(xì)胞內(nèi)蛋白質(zhì)降解的主要途徑,可參與細(xì)胞凋亡、轉(zhuǎn)錄調(diào)控、細(xì)胞周期及DNA損傷修復(fù)等多種細(xì)胞內(nèi)分子事件[14]。泛素化途徑降解蛋白質(zhì)過(guò)程中,涉及3種酶:泛素激活酶、泛素結(jié)合酶和泛素連接酶,其中,E3泛素連接酶決定了靶蛋白底物的特異性,是泛素化過(guò)程中起決定作用的關(guān)鍵酶。目前,已知的E3泛素連接酶有600多種。RNF111所編碼的Arkadia是一種環(huán)形E3泛素連接酶,廣泛表達(dá)于成年哺乳動(dòng)物組織中,如包括脾臟、胰腺、肺臟、腎臟、肝臟及心臟等器官[4,15]。研究表明,在腫瘤發(fā)生、發(fā)展過(guò)程中,一方面RNF111具有抗腫瘤作用,SHARMA V等[16]發(fā)現(xiàn)Arkadia可以通過(guò)增強(qiáng)TGF-β信號(hào)傳導(dǎo)來(lái)抑制結(jié)直腸癌的發(fā)生發(fā)展,主要是通過(guò)泛素化降解TGF-β通路的抑制因子,如Smad7、C-ski及SnoN,來(lái)放大TGF-β信號(hào)。另一方面RNF
111具有促進(jìn)腫瘤轉(zhuǎn)移的作用,LE SCOLAN E等[17]發(fā)現(xiàn),在小鼠的乳腺癌和肺癌細(xì)胞中,Arkadia通過(guò)降解ski來(lái)促進(jìn)腫瘤的轉(zhuǎn)移,這些可能與腫瘤被誘導(dǎo)出現(xiàn)EMT現(xiàn)象有關(guān)。
目前RNF111在腎癌中的作用尚不明確。本研究中,首先通過(guò)TIMER在線數(shù)據(jù)庫(kù)分析發(fā)現(xiàn),RFN111低表達(dá)于多種惡性腫瘤中,例如KIRC等。進(jìn)一步應(yīng)用UALCAN數(shù)據(jù)庫(kù)和HPA數(shù)據(jù)庫(kù)分析也證實(shí)上述結(jié)果,提示RFN111可能在癌癥發(fā)生和進(jìn)展中扮演重要角色。接下來(lái),利用UALCAN在線數(shù)據(jù)庫(kù)分析RNF111表達(dá)水平與KIRC患者臨床病理特征的關(guān)聯(lián)。結(jié)果表明,RNF111表達(dá)水平與KIRC病理分期、臨床分級(jí)和種族存在相關(guān)性,但與淋巴結(jié)轉(zhuǎn)移無(wú)相關(guān)性,這些結(jié)果提示RNF111與KIRC的進(jìn)展高度相關(guān)。為了進(jìn)一步確定RNF11表達(dá)對(duì)患者預(yù)后的作用,利用GEPIA數(shù)據(jù)庫(kù)進(jìn)行預(yù)后分析,發(fā)現(xiàn)RNF111表達(dá)量越高,患者生存時(shí)間會(huì)越長(zhǎng),差異具有統(tǒng)計(jì)學(xué)意義。為了進(jìn)一步確定該結(jié)果的可靠性,本研究同時(shí)也利用HPA和UALCAN數(shù)據(jù)庫(kù)對(duì)上述結(jié)果進(jìn)行了確認(rèn),通過(guò)這些權(quán)威數(shù)據(jù)庫(kù)的相互驗(yàn)證,證實(shí)了研究結(jié)果的可靠性。為了分析RNF111在腎癌細(xì)胞中的生物學(xué)功能,利用LinkedOmics在線數(shù)據(jù)庫(kù)下載RNF111相關(guān)基因,并通過(guò)DAVID在線工具進(jìn)行GO富集分析。結(jié)果表明,在KIRC中RFN111基因與蛋白泛素降解密切相關(guān),這與已報(bào)道的其在其它腫瘤細(xì)胞中的功能是一致的[4]。最后,本研究利用GeneMANIA數(shù)據(jù)庫(kù)構(gòu)建了RNF111基因蛋白互做網(wǎng)絡(luò)圖,獲得了包括UBB、UBA52、UBC、ESRP1/2和Smad7在內(nèi)的共20個(gè)與RNF111存在相互作用的蛋白。其中,Smad7已被報(bào)道與RNF111存在相互作用[16]。UBB和UBA52為編碼泛素基因,UBC為編碼泛素結(jié)合酶基因,這幾種基因與RFN111均為編碼泛素蛋白酶降解體系蛋白重要基因,提示這些分子是腎癌細(xì)胞內(nèi)泛素蛋白酶體降解系統(tǒng)重要成員。ESRP1/2是近年來(lái)發(fā)現(xiàn)的一種上皮細(xì)胞特異性剪接因子,主要通過(guò)選擇性剪接在轉(zhuǎn)錄后水平調(diào)節(jié)基因的表達(dá),在腫瘤發(fā)生、發(fā)展過(guò)程中扮演重要角色[18]。ESRP1/2是否為RNF111降解底物或參與其對(duì)其它底物的降解需進(jìn)一步的實(shí)驗(yàn)加以證實(shí)。
綜上所述,TCGA數(shù)據(jù)庫(kù)具有樣本量大,可信度高的優(yōu)點(diǎn),在癌癥研究領(lǐng)域發(fā)揮著重要作用。本研究基于TCGA數(shù)據(jù)庫(kù),利用多個(gè)生物信息學(xué)可視化工具分析RNF111在KIRC中的表達(dá)及臨床意義,發(fā)現(xiàn)在KIRC中RNF111的表達(dá)顯著降低,其表達(dá)水平與患者的臨床分期、分級(jí)和預(yù)后具有相關(guān)性,有望作為潛在的生物標(biāo)記物,用于評(píng)估KIRC患者的預(yù)后。