韓文凱,許曉燕,李丹霞,車鎧,焦偉,牛海濤
(1 青島大學(xué)醫(yī)學(xué)部,山東 青島 266071; 2 青島大學(xué)附屬醫(yī)院泌尿外科)
膀胱癌是泌尿系統(tǒng)中最常見的腫瘤之一,也是我國(guó)老年人群中高致死率的癌癥[1-2]。膀胱癌最常見的病理類型是尿路上皮癌,其具有耐藥性強(qiáng)、轉(zhuǎn)移率高、復(fù)發(fā)率高、預(yù)后差等特點(diǎn)[3-4]。雖然手術(shù)、放療和輔助化療的應(yīng)用大大改善了膀胱癌病人的預(yù)后,但膀胱癌致死率仍居高不下[5]。因此,需要尋找新的方法來(lái)提高膀胱癌病人的診斷和預(yù)后。近年來(lái),分子標(biāo)志物已經(jīng)被證實(shí)有助于膀胱癌的診斷和治療[6]。已有研究表明,膀胱癌病人的晚期無(wú)進(jìn)展生存與某些分子標(biāo)志物高表達(dá)相關(guān)[7-8]。然而,由于研究缺乏更大的臨床研究隊(duì)列,這些潛在生物標(biāo)志物的功能以及臨床意義無(wú)法得到充分驗(yàn)證。自噬在細(xì)胞的代謝過(guò)程中具有平衡作用,正常情況下自噬可以清除功能受損的細(xì)胞器以及表達(dá)錯(cuò)誤的蛋白質(zhì)[9]。人類發(fā)展過(guò)程中的多種疾病與自噬相關(guān),并且自噬與腫瘤的發(fā)生也存在密切關(guān)系[10]。自噬對(duì)于腫瘤是一把雙刃劍,早期可以抑制腫瘤的形成,晚期可以促進(jìn)腫瘤的生長(zhǎng)和轉(zhuǎn)移[11]。近年來(lái)有研究表明,自噬基因可以通過(guò)信號(hào)通路誘導(dǎo)膀胱癌浸潤(rùn)和轉(zhuǎn)移[12-13]。因此,自噬基因可能作為膀胱癌診斷以及預(yù)后的分子標(biāo)志物。本研究從腫瘤基因組圖譜(TCGA)數(shù)據(jù)庫(kù)中獲取膀胱癌轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行分析,并且構(gòu)建自噬相關(guān)基因(DEARGs)的預(yù)后模型,評(píng)估該模型的預(yù)后預(yù)測(cè)能力。
從TCGA數(shù)據(jù)庫(kù)中獲取了430例樣本的轉(zhuǎn)錄組數(shù)據(jù)(HTSeq-FPKM),其中癌旁組織19例,膀胱癌組織411例。GSE31684數(shù)據(jù)集從基因表達(dá)綜合數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE31684)中下載獲得[14-15]。DEARGs來(lái)源于人類自噬數(shù)據(jù)庫(kù)(HADb,http://www.autophagy.lu/),從該數(shù)據(jù)庫(kù)中獲得了232個(gè)自噬基因,其中194個(gè)基因在TCGA數(shù)據(jù)庫(kù)中表達(dá)。
對(duì)瘤旁組織和膀胱癌組織的轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行分析,篩選差異表達(dá)的DEARGs。在R語(yǔ)言(版本3.6.2)環(huán)境下進(jìn)行操作,首先使用“l(fā)imma”包對(duì)數(shù)據(jù)進(jìn)行校正歸一化處理,篩選標(biāo)準(zhǔn)為|logFC|>1(實(shí)驗(yàn)組/對(duì)照組>2),錯(cuò)誤發(fā)現(xiàn)率(FDR)<0.05。采用Wilcoxon檢驗(yàn)進(jìn)行差異分析,最后使用“pheatmap”和“ggpubr”包對(duì)DEARGs進(jìn)行可視化處理。
對(duì)DEARGs進(jìn)行基因本體(GO)及京都基因與基因組百科全書(KEGG)信號(hào)通路富集分析。在R語(yǔ)言環(huán)境下,使用“colorspace”“stringi”“ggplot2”“DOSE”“clusterProfiler”和“enrichplot”等軟件包對(duì)數(shù)據(jù)進(jìn)行可視化處理(P<0.05,Q<0.05,Q值為校正后的P值)。
首先,在R語(yǔ)言環(huán)境下使用“survival”軟件包對(duì)DEARGs進(jìn)行單因素Cox回歸分析,篩選與預(yù)后生存相關(guān)的自噬基因,以P<0.05為差異有顯著意義。隨后,將以上篩選到的與生存相關(guān)的自噬基因進(jìn)行多因素Cox回歸分析。最后,構(gòu)建自噬基因的風(fēng)險(xiǎn)預(yù)測(cè)模型,根據(jù)風(fēng)險(xiǎn)模型計(jì)算每一樣本的風(fēng)險(xiǎn)評(píng)分,以風(fēng)險(xiǎn)評(píng)分中位值為界將樣本分為高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組,觀察兩組病人生存狀態(tài)。風(fēng)險(xiǎn)評(píng)分=expRNA1×βRNA1+expRNA2×βRNA2+…+expRNAn×βRNAn,其中exp是差異表達(dá)基因的表達(dá)量,RNA1~RNAn代表每一基因的名稱,β是Cox回歸模型的多元回歸系數(shù)。
在R語(yǔ)言環(huán)境下使用“survival”包對(duì)高低風(fēng)險(xiǎn)組的病人進(jìn)行預(yù)后分析,利用Kaplan-Meier(K-M)檢驗(yàn)方法和log-rank檢驗(yàn)評(píng)估高低風(fēng)險(xiǎn)組病人的生存預(yù)后。使用“survival ROC”包繪制受試者工作特征(ROC)曲線評(píng)估該模型的準(zhǔn)確性。
使用GSE31684數(shù)據(jù)集驗(yàn)證風(fēng)險(xiǎn)模型的預(yù)測(cè)性能,根據(jù)模型風(fēng)險(xiǎn)評(píng)分的中位值將樣本分為高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組,觀察兩組病人總體生存狀態(tài),繪制ROC曲線評(píng)估結(jié)果準(zhǔn)確性。
將樣本的風(fēng)險(xiǎn)評(píng)分和臨床指標(biāo)進(jìn)行單因素和多因素Cox回歸分析,綜合評(píng)估風(fēng)險(xiǎn)評(píng)分與膀胱癌病人預(yù)后的關(guān)系。以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
根據(jù)篩選標(biāo)準(zhǔn)(|logFC|>1、FDR<0.05)獲得DEARGs 37個(gè),其中19個(gè)基因表達(dá)下調(diào),18個(gè)基因表達(dá)上調(diào)(圖1A)。依據(jù)|logFC|排序,表達(dá)上調(diào)的前10個(gè)基因?yàn)椋篊DKN2A、SERPINA1、BIRC5、TP73、ATG9B、EIF4EBP1、SPHK1、ERBB2、BID和ITGA3;表達(dá)下調(diào)的前10個(gè)基因?yàn)椋篎OS、CCL2、HSPB8、PRKN、ITPR1、TP53INP2、NRG2、MYC、DLC1和BCL2。
GO富集分析的結(jié)果顯示,生物過(guò)程(BP)主要包含內(nèi)在凋亡信號(hào)通路、神經(jīng)元死亡、內(nèi)質(zhì)網(wǎng)應(yīng)激反應(yīng)、自噬和自噬信號(hào)通路等,細(xì)胞組成(CC)主要包含自噬體、內(nèi)質(zhì)網(wǎng)腔體、外膜、線粒體外膜和細(xì)胞器外膜等,分子功能(MF)主要涉及泛素蛋白連接酶的結(jié)合、磷酸酶結(jié)合、死亡結(jié)構(gòu)域結(jié)合、BH結(jié)構(gòu)域結(jié)合及蛋白酶結(jié)合等。見圖1B。KEGG分析的結(jié)果則顯示,DEARGs主要與肌萎縮性側(cè)索硬化癥(ALS)、細(xì)胞凋亡、凋亡-多物種、膀胱癌、慢性骨髓性白血病、EGFR酪氨酸激酶抑制劑抗性、內(nèi)分泌的阻力、ErbB信號(hào)通路、p53信號(hào)通路、PI3K-Akt信號(hào)通路和鉑耐藥等通路相關(guān)(圖1C)。
A為DEARGs火山圖:圖中每一點(diǎn)代表一個(gè)自噬基因,其中黑色點(diǎn)代表無(wú)差異表達(dá)基因,紅色點(diǎn)代表表達(dá)上調(diào)基因,綠色點(diǎn)則代表表達(dá)下調(diào)基因。B為GO富集分析:圖中形狀的大小代表富集基因的數(shù)量,形狀越大代表富集的基因越多;顏色代表P值的大小,P值越小顏色越紅,反之越藍(lán)(P<0.05)。C為KEGG通路富集分析:圖中每行代表一個(gè)生物功能通路,其中方格代表富集于該通路的基因,顏色則代表基因表達(dá)差異的倍數(shù),顏色越紅代表表達(dá)差異倍數(shù)越大。
對(duì)37個(gè)DEARGs進(jìn)行單因素Cox回歸分析,結(jié)果發(fā)現(xiàn)共有7個(gè)基因(SPNS1、APOL1、P4HB、DIRAS3、ITGA3、MYC、SPHK1)與膀胱癌病人的預(yù)后顯著相關(guān)(P<0.05)。將其納入多因素Cox回歸分析,最終得到了包含6個(gè)自噬基因(SPNS1、APOL1、P4HB、DIRAS3、ITGA3、MYC)的風(fēng)險(xiǎn)模型。熱圖分析結(jié)果顯示,與低風(fēng)險(xiǎn)組比較,高風(fēng)險(xiǎn)組DIRAS3、MYC、P4HB基因表達(dá)上調(diào),APOL1、ITGA3則表達(dá)下調(diào),而SPNS1的表達(dá)在兩組中并無(wú)明顯差異(圖2A)。低風(fēng)險(xiǎn)組的總體生存優(yōu)于高風(fēng)險(xiǎn)組(圖2B、C)。根據(jù)風(fēng)險(xiǎn)模型計(jì)算了每例膀胱癌病人的風(fēng)險(xiǎn)評(píng)分,高風(fēng)險(xiǎn)組201例,低風(fēng)險(xiǎn)組202例。K-M分析結(jié)果顯示,高風(fēng)險(xiǎn)組3年生存率為41.4%(95%CI=0.334~0.513),低風(fēng)險(xiǎn)組為57.7%(95%CI=0.490~0.679),高風(fēng)險(xiǎn)組的預(yù)后生存率低于低風(fēng)險(xiǎn)組(圖3A)。ROC曲線分析結(jié)果顯示,膀胱癌病人3年生存期的AUC為0.789(圖3B)。
A:模型中6個(gè)風(fēng)險(xiǎn)基因的差異表達(dá)圖;B:樣本中風(fēng)險(xiǎn)模型評(píng)分分布圖;C:風(fēng)險(xiǎn)模型評(píng)分與膀胱癌病人生存狀態(tài)分布圖。
A:風(fēng)險(xiǎn)模型對(duì)于高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組的生存預(yù)后分析;B:ROC曲線對(duì)風(fēng)險(xiǎn)模型預(yù)測(cè)準(zhǔn)確性的分析結(jié)果;C:風(fēng)險(xiǎn)模型對(duì)于GEO數(shù)據(jù)集中高低風(fēng)險(xiǎn)組的生存預(yù)后分析;D:風(fēng)險(xiǎn)模型對(duì)于GEO數(shù)據(jù)集分析結(jié)果準(zhǔn)確性分析。
使用GEO數(shù)據(jù)集中的GSE31684數(shù)據(jù)集對(duì)模型的預(yù)測(cè)能力進(jìn)行驗(yàn)證,根據(jù)風(fēng)險(xiǎn)模型的風(fēng)險(xiǎn)評(píng)分,將病人分為高風(fēng)險(xiǎn)組(46例)、低風(fēng)險(xiǎn)組(47例)。K-M生存分析結(jié)果顯示,高風(fēng)險(xiǎn)組的預(yù)后差于低風(fēng)險(xiǎn)組,高風(fēng)險(xiǎn)組的3年生存率為31.6%(95%CI=0.3167~0.499),低風(fēng)險(xiǎn)組3年生存率為64.6%(95%CI=0.436~0.665)。ROC曲線分析結(jié)果顯示,膀胱癌病人3年生存期的AUC為0.652(圖3C、D)。
單因素Cox回歸分析結(jié)果顯示,病人腫瘤分期(HR=1.763,95%CI=1.236~2.515,P<0.01)、腫瘤浸潤(rùn)深度(HR=1.695,95%CI=1.152~2.495,P<0.01)、淋巴結(jié)轉(zhuǎn)移(HR=1.531,95%CI=1.165~2.013,P<0.01)和模型風(fēng)險(xiǎn)評(píng)分(HR=1.828,95%CI=1.438~2.324,P<0.001)與膀胱癌病人預(yù)后相關(guān)。多因素Cox回歸分析結(jié)果顯示,風(fēng)險(xiǎn)評(píng)分(HR=1.933,95%CI=1.457~2.563,P<0.001)可以作為膀胱癌病人預(yù)后的獨(dú)立影響因素。見圖4。
圖4 Cox回歸分析評(píng)估風(fēng)險(xiǎn)模型評(píng)分及臨床特征對(duì)于膀胱癌病人的預(yù)后價(jià)值
一般情況下,體內(nèi)的自噬水平一直處于相對(duì)平衡的生理狀態(tài),自噬在腫瘤的發(fā)生、形成和轉(zhuǎn)移的過(guò)程中具有重要作用[16]。在腫瘤形成的初期,自噬可以抑制腫瘤的形成。但是在腫瘤形成后,自噬則會(huì)促進(jìn)腫瘤生長(zhǎng)和侵襲,此時(shí)的自噬就會(huì)成為腫瘤的促進(jìn)因素[17]。目前,對(duì)膀胱癌自噬研究比較局限、單一。本文研究篩選膀胱癌癌旁組織和膀胱癌組織中DEARGs,并探討其生物學(xué)功能。GO富集分析結(jié)果顯示,DEARGs主要與BP(主要包含內(nèi)在凋亡信號(hào)通路、神經(jīng)元死亡、內(nèi)質(zhì)網(wǎng)應(yīng)激反應(yīng)、自噬和自噬信號(hào)通路)、CC(主要包含自噬體、內(nèi)質(zhì)網(wǎng)腔體、外膜、線粒體外膜和細(xì)胞器外膜)和MF(主要涉及泛素蛋白連接酶的結(jié)合、磷酸酶結(jié)合、死亡結(jié)構(gòu)域結(jié)合、BH結(jié)構(gòu)域結(jié)合及蛋白酶結(jié)合)相關(guān);KEGG分析結(jié)果顯示,DEARGs主要與ALS、細(xì)胞凋亡、凋亡-多物種、膀胱癌、慢性骨髓性白血病、EGFR酪氨酸激酶抑制劑抗性、內(nèi)分泌的阻力、ErbB信號(hào)通路、P53信號(hào)通路、PI3K-Akt信號(hào)通路和鉑耐藥等通路相關(guān),這說(shuō)明膀胱癌DEARGs與癌癥相關(guān)通路及腫瘤耐藥相關(guān)。目前研究認(rèn)為,PI3K-Akt信號(hào)通路和鉑耐藥通路相關(guān),RrbB2可以誘導(dǎo)血管生長(zhǎng)并促進(jìn)膀胱癌的轉(zhuǎn)移[18];在膀胱癌中,3-BrPA可以通過(guò)抑制P53通路從而有效抑制膀胱癌的發(fā)生和轉(zhuǎn)移[19];PI3K-Akt信號(hào)通路可以調(diào)節(jié)上皮間質(zhì)化和侵襲,在浸潤(rùn)性膀胱癌中已發(fā)現(xiàn)了類似的FGFR3突變[20];DEARGs還與鉑類藥物耐藥相關(guān),有些膀胱癌病人應(yīng)用此類藥物治療效果不佳,可能與膀胱癌的耐藥機(jī)制相關(guān)[7]。其機(jī)制是否與DEARGs相關(guān),有待進(jìn)一步研究。
本文研究構(gòu)建了含有6個(gè)自噬基因(SPNS1、APOL1、P4HB、DIRAS3、ITGA3、MYC)的風(fēng)險(xiǎn)模型,其中DIRAS3和ITGA3可以作為膀胱癌預(yù)后的生物標(biāo)志物[7-8],MYC可以通過(guò)各種機(jī)制促進(jìn)膀胱癌的轉(zhuǎn)移和浸潤(rùn)[21]。關(guān)于SPNS1、APOL1和P4HB基因在膀胱癌中的作用尚不明確,需進(jìn)一步的研究和探索。但已有研究顯示,SPNS1與P53信號(hào)通路相關(guān)[22]。APOL1可以作為胰腺癌的腫瘤標(biāo)志物[23]。在腎透明細(xì)胞癌中P4HB可以作為預(yù)后不良的腫瘤標(biāo)志物[24]。本研究建立的模型可以有效劃分高、低風(fēng)險(xiǎn)的病人,預(yù)測(cè)結(jié)果也準(zhǔn)確有效,并且該結(jié)果在外部數(shù)據(jù)集中也得到了驗(yàn)證。該模型的風(fēng)險(xiǎn)評(píng)分也可作為預(yù)測(cè)膀胱癌病人預(yù)后的獨(dú)立因素。因此,本文構(gòu)建的自噬基因相關(guān)模型可以篩查高風(fēng)險(xiǎn)的膀胱癌病人,提前干預(yù)、治療從而改善病人的預(yù)后。
綜上所述,本文篩選并構(gòu)建了含有以下6個(gè)基因SPNS1、APOL1、P4HB、DIRAS3、ITGA3和MYC的風(fēng)險(xiǎn)模型,該模型可以很好地篩選高風(fēng)險(xiǎn)的膀胱癌病人,其風(fēng)險(xiǎn)評(píng)分還可以作為預(yù)測(cè)膀胱癌病人預(yù)后的一個(gè)獨(dú)立因素。本研究結(jié)果為后期膀胱癌的早期診斷及前期干預(yù)治療,改善病人預(yù)后提供了可靠的理論基礎(chǔ)依據(jù)。