袁 霜, 王麗華
(上海交通大學(xué)醫(yī)學(xué)院附屬國(guó)際和平婦幼保健院上海市胚胎源性疾病重點(diǎn)實(shí)驗(yàn)室,上海 200030)
子宮內(nèi)膜癌(endometrial carcinoma,EC)發(fā)生于子宮內(nèi)膜,是常見的婦科腫瘤之一。統(tǒng)計(jì)資料顯示,2018年全球約有38萬名女性患EC,約有9萬人死于EC[1]。EC通?;谄鋵?duì)雌激素的依賴性分為2種類型:Ⅰ型和Ⅱ型。Ⅰ型EC對(duì)雌激素的依賴性增加,而且預(yù)后良好,占EC的70%~80%。相比之下,Ⅱ型EC通常預(yù)后較差,經(jīng)手術(shù)治療后,5年內(nèi)復(fù)發(fā)率仍有10%~15%,預(yù)后差且生存期短[2]。因此,EC分型相關(guān)的潛在分子標(biāo)志物的鑒定對(duì)于臨床決策至關(guān)重要。
在非編碼RNA中,目前最受關(guān)注的是微小RNA(microRNA,miRNA)和長(zhǎng)非編碼RNA(long noncoding RNA,lncRNA)。有研究表明,miRNA通過反應(yīng)元件(microRNA response element,MRE)促進(jìn)降解并抑制靶標(biāo)mRNA的翻譯[4],lncRNA可以參與mRNA的轉(zhuǎn)錄和轉(zhuǎn)錄后調(diào)控[5]。miRNA和lncRNA在癌癥的發(fā)生和發(fā)展中相互作用,影響腫瘤轉(zhuǎn)歸,并表現(xiàn)出一定的診斷和預(yù)后價(jià)值。2011年,SALMENA等[16]率先提出了內(nèi)源性競(jìng)爭(zhēng)性RNA(competitive endogenous RNA,ceRNA)的假設(shè),認(rèn)為在轉(zhuǎn)錄后水平上存在一個(gè)復(fù)雜的調(diào)控網(wǎng)絡(luò),并且所有類型的RNA轉(zhuǎn)錄本都可作為天然海綿通過共享至少1個(gè)MRE限制miRNA的功能。先前的研究已經(jīng)證實(shí),lncRNA-miRNA-mRNA調(diào)控網(wǎng)絡(luò)在EC的發(fā)生和發(fā)展中具有至關(guān)重要的作用[7]。為此,本研究擬探討lncRNA、miRNA和ceRNA網(wǎng)絡(luò)在EC分型中的作用。
從TCGA數(shù)據(jù)庫(kù)(https://portal.gdc.cancer.gov/)獲得lncRNA、mRNA(407份Ⅰ型EC組織和136份Ⅱ型EC組織)和miRNA(407名Ⅰ型EC組織和131份Ⅱ型EC組織)表達(dá)譜以及臨床數(shù)據(jù)。從GEO數(shù)據(jù)集GSE17025(79例Ⅰ型EC和12例Ⅱ型EC)和GSE25405(20例Ⅰ型EC和21例Ⅱ型EC)中下載lncRNA、mRNA和miRNA相關(guān)數(shù)據(jù)。
為了分析Ⅰ型與Ⅱ型EC之間差異性表達(dá)的mRNA、lncRNA和miRNA,本研究通過R包GDCRNATools v1.2.0對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,過濾掉低表達(dá)基因(超過一半的樣本中l(wèi)og2CPM<1),閾值設(shè)置為|log2倍數(shù)變化(log2fold change,log2FC)|>1.0,錯(cuò)誤發(fā)現(xiàn)率(false discovery rate,F(xiàn)DR)作為校正、P<0.05[8]。
為了鑒定Ⅰ型和Ⅱ型EC差異性表達(dá)的lncRNA、mRNA和miRNA構(gòu)成的ceRNA網(wǎng)絡(luò),本研究使用StarBase數(shù)據(jù)庫(kù)[9]、miRcode數(shù)據(jù)庫(kù)[10]和miRTarBase數(shù)據(jù)庫(kù)[11]鑒定了相互作用的miRNA-mRNA對(duì);使用StarBase數(shù)據(jù)庫(kù)[9]、miRcode數(shù)據(jù)庫(kù)[10]和spongeScan數(shù)據(jù)庫(kù)[12]鑒定了相互作用的miRNA-lncRNA對(duì)。此外,還使用R包GDCRNATools對(duì)ceRNA網(wǎng)絡(luò)中相互作用的lncRNA和mRNA進(jìn)行超幾何分布檢驗(yàn)以測(cè)試其是否顯著共享許多miRNA,繼而檢測(cè)共享miRNA對(duì)lncRNA和mRNA的調(diào)控相似性來驗(yàn)證其是否介導(dǎo)lncRNA和mRNA之間的相互作用。剩下的mRNA-lncRNA對(duì)通過Pearson相關(guān)分析進(jìn)一步篩選。最后,使用Cytoscape v 3.7.0對(duì)ceRNA進(jìn)行可視化。使用GDCRNA工具包的3個(gè)標(biāo)準(zhǔn)來確定lncRNA-mRNA之間競(jìng)爭(zhēng)性內(nèi)源性的相互作用:(1)lncRNA和mRNA必須共享大量miRNA;(2)lncRNA和mRNA的表達(dá)水平必須正相關(guān);(3)miRNA在調(diào)節(jié)lncRNA和mRNA的表達(dá)中應(yīng)發(fā)揮相似的作用。
為了深入探究ceRNA網(wǎng)絡(luò)的生物學(xué)功能和代謝途徑,通過clusterProfiler包對(duì)ceRNA網(wǎng)絡(luò)中的差異表達(dá)mRNA進(jìn)行了基因本體論(Gene Ontology,GO)和京都基因與基因組數(shù)據(jù)庫(kù)(Kyoto Encyclopedia of Genes and Genomes,KEGG)富集分析[13]。富集顯著性的閾值為P<0.05。
采用Kaplan-Meier生存分析(http://kmplot.com/analysis/)用于評(píng)估ceRNA網(wǎng)絡(luò)中關(guān)鍵基因的表達(dá)水平與患者總體生存率之間的關(guān)系。網(wǎng)站根據(jù)基因表達(dá)值自動(dòng)將EC患者分為高表達(dá)組和低表達(dá)組,從而評(píng)估差異表達(dá)基因與EC患者預(yù)后之間的關(guān)系。
采用SPSS 25.0軟件進(jìn)行統(tǒng)計(jì)分析。呈正態(tài)分布的數(shù)據(jù)以±s表示,2個(gè)組間比較采用t檢驗(yàn)。采用超幾何分布檢驗(yàn)評(píng)估lncRNA和mRNA是否顯著共享許多miRNA。采用Pearson相關(guān)分析評(píng)估m(xù)RNA與lncRNA的相關(guān)性。采用Kaplan-Meier生存分析和對(duì)數(shù)秩檢驗(yàn)對(duì)不同ceRNA水平EC患者的總體生存時(shí)間(overall survival,OS)進(jìn)行比較。計(jì)數(shù)資料以率表示,組間比較采用χ2檢驗(yàn)。以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
TCGA的標(biāo)準(zhǔn)化數(shù)據(jù)標(biāo)注為蛋白質(zhì)編碼RNA、lncRNA、假基因、免疫球蛋白和其他非編碼RNA。根據(jù)閾值|log2FC|>1且P<0.05,在TCGA數(shù)據(jù)庫(kù)中鑒定出953個(gè)Ⅰ型EC與Ⅱ型EC有差異性表達(dá)的基因,其中l(wèi)ncRNA 59個(gè)(26個(gè)上調(diào)、33個(gè)下調(diào))、miRNA 51個(gè)(22個(gè)上調(diào)、29個(gè)下調(diào))、mRNA 843個(gè)(413個(gè)上調(diào)、430個(gè)下調(diào))。見圖1。
圖1 差異基因的分布和火山圖
篩選出2個(gè)lncRNA、19個(gè)miRNA和11個(gè)mRNA并構(gòu)建了19對(duì)lncRNA-miRNA和45對(duì)miRNA-mRNA一起參與ceRNA網(wǎng)絡(luò),見圖2。其中,具有豐富連接的lncRNA分別為L(zhǎng)INC00667(有11個(gè)節(jié)點(diǎn),與11個(gè)miRNA相互作用)和H19(有8個(gè)節(jié)點(diǎn),與8個(gè)miRNA相互作用)。
圖2 由lncRNA-miRNA-mRNA構(gòu)成的ceRNA網(wǎng)絡(luò)
采用GO和KEGG富集分析進(jìn)一步預(yù)測(cè)差異基因功能。GO分析由生物過程(biological process,BP)、分子功能(molecular function,MF)和細(xì)胞成分(cellular component,CC)組成。BP分析結(jié)果表明,大多數(shù)差異表達(dá)的mRNA參與 “軸突生成、糖蛋白代謝、糖蛋白生物合成、軸突導(dǎo)向和神經(jīng)元凸起導(dǎo)向”,見圖3(a)。MF富集的前5個(gè)術(shù)語(yǔ)是“金屬離子跨膜轉(zhuǎn)運(yùn)活性、DNA結(jié)合轉(zhuǎn)錄激活因子活性、RNA聚合酶Ⅱ特異性、門控通道活性、G蛋白偶聯(lián)受體結(jié)合”,見圖3(b)。最顯著富集的CC條目是細(xì)胞頂端,見圖3(c)。在KEGG富集分析中,差異表達(dá)的mRNA豐富了283條KEGG通路,包括人乳頭瘤病毒感染、軸突導(dǎo)向、Hippo信號(hào)通路、蛋白質(zhì)消化吸收和谷氨酸能突觸等,見圖3(d)。
圖3 差異基因的功能富集分析
根據(jù)ceRNA網(wǎng)絡(luò)的分析結(jié)果,篩選出2個(gè)lncRNA、19個(gè)miRNA和11個(gè)mRNA進(jìn)行了EC患者生存分析。Kaplan-Meier 生存曲線分析結(jié)果顯示,2個(gè)lncRNA(LINC00667和H19)均與EC患者生存率相關(guān),其表達(dá)越高,生存率越低。在11個(gè)mRNA中,除FKBP1B外,其他mRNA(TMCC3、HOXA3、HOXA5、PXDN、WNT10A、Nr6A1、KIrrEL1、MAP7D2、WNK3和PLXNA4)均與預(yù)后密切相關(guān),見圖4。19個(gè)miRNA中的10個(gè)miRNA與EC患者總生存時(shí)間密切相關(guān),見圖5。
圖4 lncRNA、mRNA高表達(dá)和低表達(dá)的EC患者的生存曲線Kaplan-Meier生存曲線
圖5 miRNA高表達(dá)和低表達(dá)的EC患者的生存曲線
根據(jù)差異基因的表達(dá)方式和ceRNA網(wǎng)絡(luò),共獲得了2對(duì)(LINC00667-hsa-miR-181a/hsamiR-181d-Nr6A1和LINC00667-hsa-miR-34a/hsa-miR-34c/hsa-miR-449a/hsa-miR-449b-TMCC3),并且這些差異基因均和EC的預(yù)后密切相關(guān)(r=0.200,P<0.05;r=0.266,P<0.05)。見圖6。
圖6 配對(duì)的lncRNA和mRNA的相關(guān)性
采用GEO2R分析2個(gè)GEO數(shù)據(jù)集GSE17025(79例Ⅰ型EC和12例Ⅱ型EC)和GSE25405(20例Ⅰ型EC和21例Ⅱ型EC),以驗(yàn)證ceRNA網(wǎng)絡(luò)的有效性。結(jié)果顯示,僅LINC00667-TMCC3對(duì)的表達(dá)與TCGA數(shù)據(jù)庫(kù)中的表達(dá)一致,關(guān)于lncRNA和mRNA共享的miRNA表達(dá)中,hsa-miR-34a在GSE25405數(shù)據(jù)集中的表達(dá)差異無統(tǒng)計(jì)學(xué)意義(P>0.05),其他miRNA(miR-34c、miR-449a、miR-449b)的表達(dá)均與TCGA數(shù)據(jù)庫(kù)中的表達(dá)一致。見表1。
表1 驗(yàn)證GSE17025和GSE25405中選定的lncRNA、mRNA、miRNA
對(duì)TCGA數(shù)據(jù)庫(kù)中EC患者的臨床資料[病理分型、年齡、分化程度和國(guó)際婦產(chǎn)科聯(lián)盟(the International Federation of Gynecology and Obstetrics,F(xiàn)IGO)分期]進(jìn)行整理,剔除臨床資料不完整的病例。LINC00667、TMCC3、miR-34c和miR-449a相對(duì)表達(dá)量的中位數(shù)分別為2.27、3.94、3.47和4.00。以>中位數(shù)為高表達(dá),≤中位數(shù)為低表達(dá)。結(jié)果顯示,LINC00667高表達(dá)與EC的病理分型、分化程度和FIGO分期有關(guān)(P<0.05),與年齡無關(guān)(P>0.05)。TMCC3高表達(dá)與EC的病理分型、年齡和分化程度有關(guān)(P<0.05),與FIGO分期無關(guān)(P>0.05)。miR-34c、miR-449a低表達(dá)與EC的病理分型、分化和FIGO分期有關(guān)(P<0.05),與年齡無關(guān)(P>0.05)。見表2、表3。
表2 LINC00667和TMCC3的表達(dá)與EC臨床病理特征的關(guān)系 例(%)
表3 miR-34c和miR-449a的表達(dá)與EC臨床病理特征的關(guān)系 例(%)
續(xù)表3
EC是女性常見的惡性腫瘤之一,術(shù)后確定腫瘤組織學(xué)類型對(duì)EC患者的生存和預(yù)后至關(guān)重要。Ⅰ型EC以子宮內(nèi)膜樣腺癌為主,預(yù)后良好,5年生存率較高。Ⅱ型EC以漿液性和透明細(xì)胞癌為主,是高度惡性腫瘤,通常在晚期才被確診,預(yù)后較差,且具有較高的復(fù)發(fā)風(fēng)險(xiǎn)[2]。目前,ceRNA網(wǎng)絡(luò)在EC分型中的確切作用尚未明確。因此,全面研究ceRNA網(wǎng)絡(luò)對(duì)EC分型的影響至關(guān)重要。本研究首先從TCGA數(shù)據(jù)庫(kù)中鑒定了Ⅰ型EC與Ⅱ型EC表達(dá)有差異的lncRNA、miRNA和mRNA,以提供lncRNA-miRNA-mRNA調(diào)控網(wǎng)絡(luò),并對(duì)差異表達(dá)的基因進(jìn)行了功能富集分析、相關(guān)性分析和生存分析。本研究確定了1組與EC相關(guān)的ceRNA(LINC00667-miR-34c/miR-449a/miR-449b-TMCC3),可用于闡明該疾病的潛在調(diào)控機(jī)制,為EC的分型和預(yù)后評(píng)估提供依據(jù)。
有研究結(jié)果顯示,lncRNA在EC中表達(dá)失調(diào),并且其失調(diào)與腫瘤分級(jí)、FIGO分期、肌層浸潤(rùn)深度、淋巴結(jié)轉(zhuǎn)移及患者生存率有關(guān),被認(rèn)為是新興的生物標(biāo)志物和EC治療的潛在靶點(diǎn)[14]。本研究找到了1個(gè)關(guān)鍵的lncRNA——LINC00667。CHEN等[15]的研究結(jié)果顯示,LINC00667是卵巢癌復(fù)發(fā)的獨(dú)立危險(xiǎn)因素,且GO和KEGG富集分析表明,其參與了卵巢癌的多種發(fā)生機(jī)制。但目前尚無LINC00667與EC相關(guān)的報(bào)道。本研究結(jié)果顯示,與Ⅰ型EC相比,LINC00667在Ⅱ型EC中表達(dá)上調(diào),與EC的病理分型、分化程度和FIGO分期有關(guān),且表達(dá)越高,患者的5年生存率越低。提示LINC00667高表達(dá)與EC預(yù)后不良相關(guān),因此LINC00667或可作為EC新的分子分型和預(yù)后生物標(biāo)志物。
miRNA是體內(nèi)高度保守的調(diào)節(jié)性單鏈小RNA,不直接編碼蛋白質(zhì),但可以促進(jìn)mRNA的降解并抑制蛋白質(zhì)翻譯,進(jìn)而介導(dǎo)基因的轉(zhuǎn)錄后調(diào)控[4]。本研究發(fā)現(xiàn)了3個(gè)關(guān)鍵miRNA:hsa-miR-34c、hsa-miR-449a和hsa-miR-449b。miR-34c在EC細(xì)胞中的表達(dá)顯著降低,與順鉑聯(lián)合應(yīng)用可通過抑制白細(xì)胞介素6受體的表達(dá)來抑制人EC細(xì)胞系Ishikawa的增殖[16]。此外,在EC中,miR-34c還可作為p53蛋白的直接靶點(diǎn),通過抑制E2F3蛋白的表達(dá),抑制細(xì)胞周期阻滯相關(guān)蛋白,從而導(dǎo)致細(xì)胞周期阻滯在G1期,部分誘導(dǎo)細(xì)胞增殖抑制和凋亡[17]。本研究結(jié)果表明,miR-34c在Ⅱ型EC中表達(dá)下調(diào),與EC的病理分型、分化和FIGO分期有關(guān)。由此可見,miR-34c低表達(dá)可能促進(jìn)了EC細(xì)胞惡性增殖,抑制凋亡,這一結(jié)果與Ⅱ型EC惡性程度較Ⅰ型EC更高的事實(shí)相一致。因此,miR-34c在EC的早期診斷、分子分型和分子治療中具有潛在的應(yīng)用價(jià)值。有研究結(jié)果顯示,與Ⅱ型EC組織相比,Ⅰ型EC組織中miR-449a和miR-449b水平分別升高347倍和461倍,與本研究結(jié)果一致,這提示miR-449a和miR-449b可作為EC新的分子分型標(biāo)志物[18]。另外,miR-449a和miR-449b低表達(dá)與EC的5年生存率、病理分型、分化程度和FIGO分期有關(guān),因此兩者或許也可作為判斷EC預(yù)后的指標(biāo)。有研究發(fā)現(xiàn),miR-449a在晚期EC中下調(diào),并且可以通過下調(diào)非受體酪氨酸激酶c來抑制EC細(xì)胞中蛋白激酶B(protein kinase B,PKB;又稱AKT)/細(xì)胞外調(diào)節(jié)蛋白激酶1/2(extracellular regulated protein kinase 1 and 2,ERK1/2)途徑的激活,從而抑制腫瘤轉(zhuǎn)移[19]。這表明在EC中,miR-499a可能發(fā)揮抑癌作用。但miR-449b在EC中的具體調(diào)控機(jī)制尚不清楚,需要進(jìn)一步深入研究。
跨膜卷曲螺旋結(jié)構(gòu)域(transmembrane-coiled coil domain,TMCC)家族具有相同的結(jié)構(gòu)基序(2個(gè)跨膜結(jié)構(gòu)域和2個(gè)卷曲螺旋結(jié)構(gòu)域),由TMCC1、TMCC2和TMCC3組成。目前研究大多聚焦于TMCC1的功能,關(guān)于TMCC3蛋白的研究較少。TMCC3蛋白通過跨膜結(jié)構(gòu)域定位于內(nèi)質(zhì)網(wǎng)中。免疫沉淀和質(zhì)譜研究結(jié)果表明TMCC3蛋白與14-3-3蛋白相關(guān),14-3-3蛋白可能影響TMCC3的功能[20]。本研究發(fā)現(xiàn),TMCC3在Ⅱ型EC中表達(dá)上調(diào),與EC的病理分型、年齡和分化程度有關(guān),這提示TMCC3可能與腫瘤的發(fā)生、發(fā)展相關(guān),這一發(fā)現(xiàn)或許能為TMCC3在EC分型和預(yù)后預(yù)測(cè)中的作用提供新的解釋。
綜上所述,本研究發(fā)現(xiàn)了一些與EC分型相關(guān)的lncRNA、miRNA、mRNA,并篩選出了1組關(guān)鍵的ceRNA——LINC00667-miR-34c/miR-449a/miR-449b-TMCC3,與EC的預(yù)后密切相關(guān)。但這些結(jié)論僅基于當(dāng)前的分析工具和數(shù)據(jù)庫(kù),作為ceRNA網(wǎng)絡(luò)中挑選出的關(guān)鍵基因,LINC00667和TMCC3在EC中的具體作用機(jī)制尚未被闡明,在未來的研究中將收集更多的臨床樣本加以驗(yàn)證,并使用體外和體內(nèi)實(shí)驗(yàn)進(jìn)一步探索這些ceRNA的功能。