陸凌翔, 蔣民軍, 陳建春, 陸季成
(江蘇省蘇州市第九人民醫(yī)院, 1.泌尿外科, 2.腫瘤科, 江蘇 蘇州, 215000)
全世界每年有超過40萬(wàn)人罹患腎細(xì)胞癌(RCC), 發(fā)病年齡大多為60歲左右,其中2/3患者為男性[1]。RCC包括多種亞型,約70%為腎透明細(xì)胞癌(ccRCC)[2]。早期確診并盡早治療可以提高ccRCC的治愈率,但多達(dá)1/3的ccRCC患者確診時(shí)已出現(xiàn)轉(zhuǎn)移[3]。轉(zhuǎn)移性ccRCC惡性程度高,嚴(yán)重威脅患者的生命健康[4],因此尋找其診斷和治療靶點(diǎn)尤為重要。微小RNA(miRNA)是一類長(zhǎng)度為19~23 nt的內(nèi)源性小型非編碼類RNA,由DNA轉(zhuǎn)錄而來(lái)[5]。miRNA可通過直接與靶向信使RNA(mRNA)上的堿基進(jìn)行配對(duì),引導(dǎo)RNA誘導(dǎo)沉默復(fù)合體(RISC)間接降解所編碼的蛋白質(zhì),或通過直接抑制mRNA蛋白的翻譯而在轉(zhuǎn)錄后水平或亞轉(zhuǎn)錄階段終止后水平間接調(diào)節(jié)靶蛋白質(zhì)的表達(dá)[6]。許多特殊的miRNA在ccRCC組織和正常腎組織中存在差異表達(dá),如微小RNA-206(miR-206)、微小RNA-141-3p(miR-141-3p)、微小RNA-30a(miR-30a)和微小RNA-194-5p(miR-194-5p)[7-10]。研究[11]發(fā)現(xiàn),微小RNA-182-5p(miR-182-5p)通過靶向泛素結(jié)合酶E2T mRNA抑制泛素結(jié)合酶E2T蛋白表達(dá),進(jìn)而抑制ccRCC細(xì)胞的增殖、遷移和侵襲。另有研究[12]發(fā)現(xiàn),近80%的與ccRCC轉(zhuǎn)移相關(guān)的miRNA與ccRCC患者的復(fù)發(fā)率和生存率有關(guān)。RNA干擾可有效控制基因的表達(dá),在腫瘤治療中起著廣泛作用[13], 而miRNA與ccRCC的發(fā)生及發(fā)展密切相關(guān),故調(diào)控相關(guān)miRNA的表達(dá)有望成為治療ccRCC的新方法。本研究對(duì)數(shù)據(jù)庫(kù)樣本進(jìn)行挖掘和分析,篩選ccRCC組織的差異表達(dá)基因(DEGs), 旨在尋找ccRCC治療的潛在生物學(xué)靶點(diǎn),現(xiàn)報(bào)告如下。
從基因表達(dá)綜合(GEO)數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/geo/)的數(shù)據(jù)集中下載ccRCC樣本和正常腎組織樣本的表達(dá)譜數(shù)據(jù)。① GSE116251數(shù)據(jù)集中,從18名ccRCC患者(9名疾病復(fù)發(fā)和9名未復(fù)發(fā)患者)的配對(duì)腫瘤組織和鄰近正常組織中分離總RNA,然后進(jìn)行NanoString miRNA分析。NanoString是一種高通量的RNA表達(dá)檢測(cè)方法,其優(yōu)點(diǎn)是適用于嚴(yán)重降解的RNA樣本如福爾馬林固定石蠟包埋(FFPE)樣本,且操作簡(jiǎn)單、數(shù)據(jù)準(zhǔn)確、重現(xiàn)性好。應(yīng)用實(shí)時(shí)定量聚合酶鏈反應(yīng)(PCR)方法對(duì)腫瘤中失調(diào)的miRNA 進(jìn)行進(jìn)一步驗(yàn)證。② GSE168845數(shù)據(jù)集中,分析4個(gè)ccRCC組織和配對(duì)癌旁組織樣本(作為對(duì)照)的基因表達(dá)譜。
從GEO數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/geo/)的GSE116251、GSE168845數(shù)據(jù)集中下載ccRCC樣本和正常腎組織樣本表達(dá)譜數(shù)據(jù),利用R軟件的Limma包篩選出差異表達(dá)的miRNA和基因,設(shè)置|log2FC|≥2和錯(cuò)誤發(fā)現(xiàn)率(FDR)<0.05為篩選標(biāo)準(zhǔn)。FunRich(http://www.funrich.org/)是一個(gè)主要用于基因和蛋白質(zhì)的功能富集和相互作用網(wǎng)絡(luò)分析的獨(dú)立軟件工具,還可用于靶基因預(yù)測(cè)。本研究利用FunRich網(wǎng)站對(duì)差異表達(dá)miRNA(DEmiRNAs)進(jìn)行潛在轉(zhuǎn)錄因子及靶基因預(yù)測(cè),并進(jìn)行生物學(xué)過程(BP)、細(xì)胞成分特征(CC)和分子功能(MF)富集分析。利用R軟件的ClusterProfiler包和Cytoscape軟件對(duì)靶基因的信號(hào)通路進(jìn)行富集分析。將預(yù)測(cè)到的靶基因與DEGs取交集,獲得差異表達(dá)的靶基因,通過Cytoscape軟件繪制miRNA-mRNA調(diào)控網(wǎng)絡(luò)。以DEmiRNAs及其靶基因的中位表達(dá)值為分界,將患者分為高表達(dá)組和低表達(dá)組,通過Kaplan-Meier plotter網(wǎng)站(https://kmplot.com)判斷DEmiRNAs及其靶基因的表達(dá)水平與患者總生存期的關(guān)聯(lián),選擇P值最小的靶基因及其相互作用的miRNA與腫瘤基因組圖譜(TCGA)中616例ccRCC患者的臨床特征(年齡、性別、TNM分期和初始治療結(jié)局)進(jìn)一步分析。通過人類蛋白質(zhì)圖譜(HPA)數(shù)據(jù)庫(kù)驗(yàn)證所選基因在ccRCC組織及正常組織中的蛋白表達(dá)。
使用Wilcoxon檢驗(yàn)篩選腫瘤組織與癌旁組織的DEmiRNAs、DEGs, 采用BH法對(duì)P值進(jìn)行矯正,設(shè)置|log2FC|>2和FDR<0.05為篩選標(biāo)準(zhǔn)。采用卡方檢驗(yàn)評(píng)估各指標(biāo)在高表達(dá)組、低表達(dá)組中的分布差異。采用Kaplan-Meier分析和Log-rank檢驗(yàn)評(píng)估高風(fēng)險(xiǎn)組、低風(fēng)險(xiǎn)組患者的生存差異。應(yīng)用R軟件(版本4.0.2)對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)學(xué)分析,P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
應(yīng)用R軟件篩選GSE116251數(shù)據(jù)集中的DEmiRNAs和GSE168845數(shù)據(jù)集中的DEGs,分別篩選出3種DEmiRNAs(miR-142-3p、miR-200c-3p、miR-141-3p)和1 610種DEGs, 見圖1。
A: GSE116251中DEmiRNAs的熱圖; B: GSE116251中DEmiRNAs的火山圖; C: GSE168845中DEGs的熱圖;D: GSE168845中DEGs的火山圖。紅色代表上調(diào),藍(lán)色或綠色代表下調(diào)。
GO和KEGG富集分析結(jié)果顯示, DEmiRNAs在細(xì)胞環(huán)腺苷酸(cAMP)受體介導(dǎo)的信號(hào)傳導(dǎo)、翻譯的調(diào)節(jié)、發(fā)展、溶酶體、高爾基體、細(xì)胞表面、受體信號(hào)蛋白和絲氨酸酶/蘇氨酸肌激酶活性、磷酸二酯水解酶活性和細(xì)胞骨架蛋白等方面具有獨(dú)特的功能,見圖2; DEmiRNAs主要富集于6種途徑,即破骨細(xì)胞分化、金黃色葡萄球菌感染、細(xì)胞黏附分子、補(bǔ)體和凝血級(jí)聯(lián)、吞噬體和原發(fā)性免疫缺陷,見圖3。
A: FunRich軟件識(shí)別的DEmiRNAs的潛在轉(zhuǎn)錄因子; B、C、D: miRNA靶基因表達(dá)的前10種生物學(xué)過程、細(xì)胞成分特征和分子功能富集分析。
Osteoclast differentiation: 破骨細(xì)胞分化; Phagosome: 吞噬體;Primary immunodeficiency: 原發(fā)性免疫缺陷;Staphylococcus aureus infection: 金黃色葡萄球菌感染;complement and coagulation cascades: 補(bǔ)體和凝血級(jí)聯(lián);Cell adhesion molecules(CAMs): 細(xì)胞黏附分子。
使用預(yù)測(cè)軟件對(duì)3個(gè)DEmiRNAs的靶基因進(jìn)行預(yù)測(cè),共獲得846個(gè)靶基因,將其與GSE168845數(shù)據(jù)集的DEGs取交集,共得到49個(gè)交集靶基因,見圖4A。根據(jù)相互作用關(guān)系,篩選出miRNA-mRNA調(diào)控網(wǎng)絡(luò), miRNA包括hsa-miR-142-3p(上調(diào))、hsa-miR-200c-3p(下調(diào))和hsa-miR-141-3p(下調(diào)),其關(guān)聯(lián)的30個(gè)靶基因中包括11個(gè)下調(diào)基因和19個(gè)上調(diào)基因,見圖4B。
A: 預(yù)測(cè)的靶基因與GSE168845數(shù)據(jù)集DEGs交集的韋恩圖; B: miRNA-mRNA調(diào)控網(wǎng)絡(luò)(綠色表示下調(diào),粉色表示上調(diào))。
通過Kaplan-Meier plotter網(wǎng)站分析ccRCC患者的總生存期,結(jié)果顯示, miR-142-3p、miR-200c-3p、miR-141-3p和TNFAIP3、STAT4、P2RY1、CORO1C、MYBL1、CCNE2、BHLHE41、ANLN、BASP1均與ccRCC患者總生存期相關(guān)(P<0.05), 見圖5、圖6。各種基因中,ANLN基因的P值最小即差異最顯著,故本研究選擇ANLN基因及其相互作用的miR-200c-3p進(jìn)行后續(xù)研究。
A: hsa-miR-141-3p與總生存期的關(guān)系; B: hsa-miR-142-3p與總生存期的關(guān)系; C: hsa-miR-200c-3p與總生存期的關(guān)系。
圖6 不同基因表達(dá)水平與ccRCC患者總生存期的關(guān)系
從TCGA數(shù)據(jù)庫(kù)中下載ccRCC患者臨床診斷指標(biāo)和相關(guān)基因片段的克隆表達(dá)研究數(shù)據(jù)(例如患者的年齡、性別、TNM分期和初始治療結(jié)局?jǐn)?shù)據(jù)),結(jié)果顯示,不同TNM分期患者的ANLN、miR-200c-3p表達(dá)水平比較,差異有統(tǒng)計(jì)學(xué)意義(P<0.05), 見表1、表2。進(jìn)一步分析ccRCC患者臨床特征與預(yù)后的關(guān)系后發(fā)現(xiàn), TNM分期、初始治療結(jié)局均與ccRCC患者預(yù)后相關(guān)(P<0.05), 見表3、表4。
表1 ANLN表達(dá)水平與ccRCC患者臨床特征的關(guān)系
表2 miR-200c-3p表達(dá)水平與ccRCC患者臨床特征的關(guān)系
表3 ccRCC患者臨床特征、ANLN表達(dá)與預(yù)后關(guān)系的單因素分析和多因素分析
表4 ccRCC患者臨床特征、miR-200c-3p與預(yù)后關(guān)系的單因素分析和多因素分析
基于HPA數(shù)據(jù)庫(kù),本研究發(fā)現(xiàn),與正常腎臟組織相比, ccRCC組織中的ANLN表達(dá)顯著上調(diào),見圖7。
圖7 ANLN蛋白在正常腎臟組織(n=3)和ccRCC組織(n=3)中的表達(dá)(HE染色,放大100倍)
本研究從GEO數(shù)據(jù)庫(kù)下載GSE116251、GSE168845數(shù)據(jù)集進(jìn)行分析, KEGG分析結(jié)果顯示, DEmiRNAs主要富集于破骨細(xì)胞分化、金黃色葡萄球菌感染、細(xì)胞黏附分子、補(bǔ)體和促凝血因子級(jí)聯(lián)反應(yīng)、吞噬體和原發(fā)性免疫缺陷這6個(gè)途徑中,而這些途徑與癌癥的發(fā)生和轉(zhuǎn)移密切相關(guān)[14-16]。已有研究[17]表明,細(xì)胞黏附分子配體唾液酸Lewis(a/x)抗原可通過與E-選擇素受體結(jié)合而參與內(nèi)皮細(xì)胞壁的黏附,這一生化過程由炎癥細(xì)胞和腫瘤細(xì)胞共同參與,可以部分解釋炎癥與腫瘤發(fā)生之間的關(guān)系,進(jìn)一步闡明抗炎藥在腫瘤治療中的功效。轉(zhuǎn)錄調(diào)節(jié)因子是一種能夠以特定序列結(jié)合DNA分子并參與調(diào)節(jié)基因轉(zhuǎn)錄活動(dòng)的蛋白質(zhì)[18]。轉(zhuǎn)錄抑制因子可通過選擇性識(shí)別一些特定類型的DNA序列信息來(lái)同時(shí)調(diào)控染色質(zhì)形成和轉(zhuǎn)錄,從而形成一個(gè)可調(diào)控整個(gè)基因組信息表達(dá)活動(dòng)的復(fù)雜系統(tǒng)。此外,轉(zhuǎn)錄因子可以結(jié)合特定序列促進(jìn)或抑制下游基因,對(duì)腫瘤發(fā)生、遷移和侵襲等生物學(xué)過程產(chǎn)生重要影響[19]。
本研究使用Cytoscape軟件進(jìn)行miRNA-mRNA調(diào)控網(wǎng)絡(luò)構(gòu)建,確定了3個(gè)miRNA(miR-142-3p、miR-200c-3p和miR-141-3p), 并獲得了846個(gè)潛在靶基因,其中僅49個(gè)在GSE168845數(shù)據(jù)集中差異表達(dá),進(jìn)一步根據(jù)相互作用關(guān)系篩選miRNA-mRNA調(diào)控網(wǎng)絡(luò), 3個(gè)miRNA關(guān)聯(lián)的30個(gè)靶基因中包括11個(gè)下調(diào)基因和19個(gè)上調(diào)基因。miR-142-3p是雜合性丟失、易位和擴(kuò)增的首選位點(diǎn),可參與人體內(nèi)多種特定生物類型細(xì)胞上的某些原發(fā)細(xì)胞腫瘤分子中過氧化酶的表達(dá),包括原發(fā)性肝細(xì)胞癌、卵巢癌和胰腺癌等[20-23]。此外, miR-142-3p的過表達(dá)可以抑制血清剝奪誘導(dǎo)的細(xì)胞凋亡,當(dāng)miR-142-3p抑制劑降低miR-142-3p表達(dá)時(shí),可以逆轉(zhuǎn)對(duì)細(xì)胞凋亡的抑制,且miR-142-3p可在G1/S期加速細(xì)胞分化并促進(jìn)細(xì)胞增殖[24]。包含miR-200a、miR-200b、miR-200c、miR-141和miR-429的miR-200家族已被證明在上皮間質(zhì)轉(zhuǎn)化中發(fā)揮作用[25]。另外,越來(lái)越多的研究[26-27]表明miR-200家族成員在多種惡性腫瘤組織中下調(diào),包括RCC。因此, miR-200c是一種潛在的生物標(biāo)志物,或可為RCC替代治療方案的制訂提供參考依據(jù)。
ANLN基因編碼蛋白中含有的Anillin蛋白,是體內(nèi)一種有著高度保守性表達(dá)的肌動(dòng)蛋白結(jié)合蛋白,在胞質(zhì)的分裂及其復(fù)制形成過程中發(fā)揮著關(guān)鍵作用[28]。研究[29-31]發(fā)現(xiàn), ANLN在許多原發(fā)腫瘤組織中均有表達(dá),特別是晚期胰腺癌、乳腺癌和中晚期肺癌組織。流行病學(xué)研究[32-33]發(fā)現(xiàn),ANLN還具有一系列生物功能,包括參與調(diào)節(jié)人類腫瘤干細(xì)胞的生長(zhǎng)、增殖、轉(zhuǎn)化和腫瘤遷移,影響多種惡性腫瘤組織的發(fā)生與發(fā)展,因此其通常被認(rèn)為是對(duì)某些腫瘤患者預(yù)后具有重要意義的幾個(gè)主要特征基因之一。高ANLN表達(dá)水平的原發(fā)性乳腺癌患者預(yù)后可能較差,而ANLN水平敲低可能導(dǎo)致乳腺癌組織衰老的細(xì)胞增加、多核形態(tài)和G2/M期停滯[34]。另一項(xiàng)人類非小細(xì)胞肺癌細(xì)胞凋亡實(shí)驗(yàn)[35]發(fā)現(xiàn),敲除ANLN會(huì)顯著抑制腫瘤細(xì)胞分裂增殖速度和增加多形核細(xì)胞凋亡數(shù)量。
近年來(lái), miRNA及其靶基因在腫瘤發(fā)生發(fā)展中的作用已被廣泛研究,基因表達(dá)調(diào)控可能成為腫瘤治療的新選擇。本研究發(fā)現(xiàn), miR-200c-3p及其靶基因ANLN參與了ccRCC的發(fā)展,并可能成為ccRCC的潛在生物標(biāo)志物。ANLN可能對(duì)ccRCC患者的預(yù)后判斷具有重要價(jià)值,并可為其治療策略提供新的選擇。