何俊翔 張海燕 李海 張茁(吉林大學(xué)中日聯(lián)誼醫(yī)院 泌尿外科,吉林 長春 30000; 胃腸結(jié)直腸外科)
膀胱癌(BC)是全球第九大最常見惡性腫瘤,也是常見的泌尿系統(tǒng)癌癥之一,占男性惡性腫瘤的7%,其中起源于膀胱壁的尿路上皮腫瘤占90%~95%〔1〕。據(jù)報道,僅2018年,在全球范圍內(nèi)有約549 393 例新增BC 患者及199 922 例因BC 死亡的病例〔2〕。目前,臨床上針對BC 的治療手段包括手術(shù)、輔助或新輔助化療、化療、免疫治療及靶向治療等,其中70%的BC 在治療后會復(fù)發(fā)〔3〕。近年來,隨著DNA 測序及對基因表達(dá)研究的不斷深入,研究者發(fā)現(xiàn)了大量與BC 發(fā)病、進展及復(fù)發(fā)相關(guān)的DNA、RNA 和蛋白質(zhì)生物標(biāo)志物,無疑為BC 的診斷、靶向治療及預(yù)測預(yù)后方面提供了新思路〔4〕。通過篩選和識別潛在的生物標(biāo)志物,以指導(dǎo)早期檢測、預(yù)測預(yù)后和預(yù)測治療效果,極大程度上促進BC 患者精準(zhǔn)治療。早期研究證實,P53、成纖維細(xì)胞生長因子受體(FGFR)3、人類表皮生長因子受體(HER)2、表皮生長因子受體(EGFR)、磷脂酰肌醇-3 激酶編碼基因(PIK3CA)等多個基因的異常表達(dá)與BC 預(yù)后密切相關(guān)〔5〕。此外,有研究證實細(xì)胞程序性死亡配體(PDL)1 及轉(zhuǎn)化生長因子(TGF)-β 等在腫瘤發(fā)病機制中的關(guān)鍵作用,并由此衍生出一系列免疫阻斷療法在臨床已取得了可觀的療效。PD-L1 通過與其相應(yīng)的受體相互作用來抑制免疫反應(yīng)。程序性死亡受體(PD)-1 在激活的免疫細(xì)胞上表達(dá),而PD-L1 在腫瘤細(xì)胞上表達(dá)。在癌細(xì)胞上表達(dá)的PD-L1 使細(xì)胞毒性T 細(xì)胞失活并減弱腫瘤微環(huán)境中的免疫監(jiān)視〔6〕。TGF-β 通過抑制多種免疫細(xì)胞〔如細(xì)胞毒性T 細(xì)胞、樹突細(xì)胞(DC)和自然殺傷細(xì)胞(NK)細(xì)胞〕的增殖、分化,降低這些細(xì)胞的免疫能力來促進癌細(xì)胞的免疫逃逸,TGF-b 途徑的激活表明患者預(yù)后差并導(dǎo)致對免疫阻斷藥物的抗性〔7〕。多項研究均證明免疫治療在膀胱癌的治療進展中有重要作用。本文基于TCGA 公共數(shù)據(jù)庫,為了構(gòu)建更準(zhǔn)確的預(yù)后特征,采用單變量Cox 分析及最小絕對收縮和選擇算子(LASSO)和支持向量機遞歸特征消除(簡稱SVM-RFE)這兩種算法來選擇重要的候選特征RNA。推測這種RNA 特征的有效性是基于對免疫浸潤水平的患者特征的識別,并且這種特征對于臨床BC 患者具有非常準(zhǔn)確的預(yù)后價值。
1.1 數(shù)據(jù)收集和處理 BC 患者的轉(zhuǎn)錄組數(shù)據(jù)和相關(guān)臨床信息均來自 TCGA 數(shù)據(jù)庫( https:/ /portal. gdc. cancer. gov/)。使用R 包處理下載文件。不合格數(shù)據(jù)被轉(zhuǎn)換并剔除。所有數(shù)據(jù)經(jīng)過校準(zhǔn)、標(biāo)準(zhǔn)化和log2 轉(zhuǎn)換。本研究將424 個樣本(19 個正常樣本和405 個腫瘤樣本)納入研究,并將實驗分為對照組(正常組織樣本)與實驗組(BC 患者)。
1.2 差異表達(dá)基因篩選使用 使用“l(fā)imma”R 包在兩組之間進行RNA 的差異表達(dá)分析。根據(jù)調(diào)整后的P<0.05 和|Log2差異倍數(shù)(FC)|>1 的標(biāo)準(zhǔn)鑒定差異表達(dá)的基因。顯著上調(diào)或下調(diào)的基因用于后續(xù)分析。
1.3 機器學(xué)習(xí)篩選差異基因 將上述的差異基因篩選其|Log2FC|>2 的差異表達(dá)基因通過對兩種算法的綜合分析選擇候選預(yù)后RNA,這兩種算法包括LASSO 回歸分析及SVM-RFE 算法取其交集基因。在過濾差異表達(dá)的RNA 后,R 中的單變量Cox 分析用于確定差異表達(dá)RNA 的表達(dá)水平與患者總生存期(OS)之間的關(guān)聯(lián),P<0.05 被認(rèn)為具有統(tǒng)計學(xué)意義。受試者工作特征(ROC)曲線用于估計預(yù)測的準(zhǔn)確性和效率。所有生存分析和圖形在R 環(huán)境下使用特定的R 包進行。
1.4 基因功能和通路富集分析 使用R 包“clusterProfiler”進行分析,京都基因和基因組百科全書(KEGG)、基因本體論數(shù)據(jù)庫(GO)對差異表達(dá)基因的功能進行注釋。通過GSEA 基因集富集分析對實驗組與對照組樣本進行功能分析。P<0.05 表示功能注釋的顯著豐富。
1.5 免疫浸潤水平分析 為了量化BC 樣本中免疫細(xì)胞的比例,使用CIBERSORT 算法,即使用一組參考基因的反卷積算法表達(dá)值(具有547 個基因的特征)被認(rèn)為是每種細(xì)胞類型的最小表示,以使用支持向量回歸推斷來自具有混合細(xì)胞類型的大塊腫瘤樣本的數(shù)據(jù)中的細(xì)胞類型比例。使用表達(dá)數(shù)據(jù)(ESTIMATE)方法估計惡性腫瘤中的基質(zhì)和免疫細(xì)胞,以推斷腫瘤樣本中基質(zhì)和免疫細(xì)胞的比例,用于計算兩個數(shù)值變量之間的相關(guān)系數(shù)。
2.1 BC 相關(guān)RNA 的獲取 TCGA 數(shù)據(jù)庫中共提取55 141 個RNA 基質(zhì)表達(dá),使用“l(fā)imma”R 包分析差異表達(dá)基因,共獲得1 668 個顯著差異mRNA(|log2FC|>1,P<0.05)。此外,為獲取差異更顯著的基因?qū)log2FC|調(diào)整為>2,共獲得275 個基因。
2.2 BC 中具有預(yù)后作用的RNA 的篩選 為進一步驗證和選擇兩組亞型分類具有顯著特征價值的RNA,采用LASSO 算法和SVM-RFE 來識別275 個顯著差異RNA(|log2FC|>1,P<0.05)。結(jié)合LASSO和SVM-RFE 算法篩選出的RNA 后,鑒定出這兩種算法同時選擇的7 個RNA 確定為分類的候選特征基因〔人乳鐵蛋白基因(HLF)、F10、CLEC3B、LINC01082、PGM5-AS1、上皮膜蛋白(EMP)1、基質(zhì)金屬蛋白酶(MMP)11〕。通過單變量Cox 比例風(fēng)險回歸分析顯示HLF 的風(fēng)險比和95%CI分別為1.292 和1.064~1.570(P=0.010);F10 的風(fēng)險比和95%CI分別為1.302 和1.090~1.556(P=0.004);EMP1 的風(fēng)險比和95%CI分別為1.286 和1.164~1.421(P<0.001),獲得了3 個RNA(HLF、F10和EMP1)。進一步通過ROC 曲線下面積(AUC)預(yù)測其準(zhǔn)確性(圖1)HLF、F10 和EMP1 的AUC 分別為0.984,95%CI:0.968~0.995、0.989,95%CI:0.978~0.997;0.956,95%CI:0.923~0.981,最終這3 個RNA為被確定為分類和預(yù)后的候選特征RNA。將特征基因的表達(dá)量以中位值為界分為高低表達(dá)組后,研究其總生存率(OS),K-M 分析結(jié)果顯示,低風(fēng)險組OS 顯著優(yōu)于高風(fēng)險組(P<0.05),見圖1。
圖1 HLF、F10 和EMP1 的ROC 曲線和K-M 生存曲線
2.3 免疫細(xì)胞浸潤分析 基于TIMER 和CIBERSORT 算法,針對樣本中各種免疫細(xì)胞比例進行計算,結(jié)果見圖2A。同時,計算樣本中個免疫細(xì)胞的相關(guān)性見圖2B。然后,評估兩組之間免疫細(xì)胞成分的差異。初始B 細(xì)胞、記憶性靜息CD4 T 細(xì)胞和活化肥大細(xì)胞在對照組中的含量高于實驗組,而M0巨噬細(xì)胞和M1 巨噬細(xì)胞在實驗組中的含量高于對照組。此外,通過Spearman 相關(guān)分析,對篩選的特征基因研究其與免疫細(xì)胞的相關(guān)性并使用棒棒糖圖可視化相關(guān)系數(shù),見圖2C。
圖2 免疫細(xì)胞浸潤分析
2.4 識別差異基因的生物過程和途徑 為進一步研究差異基因的生物行為,根據(jù)|log2FC| >2,P<0.05 的標(biāo)準(zhǔn)進行GO 功能富集分析,KEGG 富集分析,GSEA 富集分析(圖3),結(jié)果表明,在多條通路中顯著富集。
圖3 功能分析及富集分析
近年來,臨床上針對BC 的治療僅限于手術(shù)和免疫療法或化學(xué)療法。目前,對分子改變的廣泛分析導(dǎo)致了新的治療方法〔8〕。因此,針對BC 中癌癥干細(xì)胞的治療方面可能是有希望的。本研究結(jié)果表明,特征基因存在于肌肉系統(tǒng)過程、染色體分離、染色體分離等參與了細(xì)胞膠原的細(xì)胞外基質(zhì)、收縮纖維、肌原纖維等在分子功能方面、差異基因與細(xì)胞外基質(zhì)結(jié)構(gòu)成分、糖胺聚糖結(jié)合、肌動蛋白結(jié)合等有關(guān)。同時在PI3K-蛋白激酶(Akt)信號通路、cGMPPKG 信號通路、ECM-受體相互作用、p53 信號通路、MAPK 信號通路等通路中顯著富集,DO 疾病富集也證實其與多種癌癥有關(guān)。
本研究篩選的3 個BC 預(yù)后和診斷生物標(biāo)志物(HLF、F10 和EMP1),有的已被證明是其他人類癌癥的預(yù)后生物標(biāo)志物。先前研究證實,在腎透明細(xì)胞癌中存在的晚期和高級別腫瘤中發(fā)現(xiàn)了HLF 表達(dá)下調(diào)。同時,HLF 低表達(dá)與腎細(xì)胞癌患者的無進展生存期和總生存期較短有關(guān),其高表達(dá)與腎癌患者的良好預(yù)后相關(guān),這些結(jié)果表明HLF 在腎細(xì)胞癌中的臨床相關(guān)性和潛在的保護作用〔9〕。有文獻(xiàn)報道,HLF 的失調(diào)與非小細(xì)胞肺癌(NSCLC)的復(fù)發(fā)和轉(zhuǎn)移有關(guān),在早期復(fù)發(fā)的NSCLC 組織中顯著降低的HLF 與NSCLC 患者的早期進展和遠(yuǎn)處轉(zhuǎn)移顯著相關(guān)〔10〕。F10 最早于葡萄胎及早孕絨毛的差異cDNA文庫中篩選出的基因片段,與滋養(yǎng)細(xì)胞的發(fā)生發(fā)展及轉(zhuǎn)移密切相關(guān)〔11〕。有研究指出F10 基因通過促進G1/S-特異性周期蛋白(cyclin)D1 的表達(dá)加快細(xì)胞周期的進展,促進細(xì)胞增殖〔12,13〕。蘇曉華等〔14,15〕多項研究觀察到F10 基因通過上調(diào)多種MMP,下調(diào)MMP 組織抑制物的表達(dá),促進絨癌細(xì)胞的增殖及轉(zhuǎn)移。綜上,F10 作為癌基因,通過調(diào)節(jié)細(xì)胞周期及細(xì)胞凋亡,參與了多種腫瘤細(xì)胞的增殖分化及轉(zhuǎn)移進程。EMP1 是一種小的疏水性糖蛋白,包括160 個氨基酸和4 個跨膜結(jié)構(gòu)域〔16,17〕。研究證實其參與細(xì)胞增殖,與腦膠質(zhì)細(xì)胞瘤、乳腺癌、鼻咽癌、尿路上皮癌等腫瘤的進展密切相關(guān)。研究表明,在鼻咽癌細(xì)胞中EMP1 可以誘導(dǎo)細(xì)胞凋亡并阻止血管生成,從而阻斷癌細(xì)胞的生長和遷移〔18〕。在乳腺癌中也觀察到小葉癌、高度惡性的乳腺癌與導(dǎo)管癌相比,EMP1 表達(dá)水平顯著升高〔19〕。此外,EMP1 還與NSCLC 患者的吉非替尼耐藥性相關(guān)〔20~22〕。Ahmat-Amin 等〔23〕研究發(fā)現(xiàn)EMP1 的細(xì)胞內(nèi)結(jié)構(gòu)域直接與copine-Ⅲ結(jié)合,從而觸發(fā)由蛋白酪氨酸激酶Src 和Rac 鳥嘌呤核苷酸交換因子Vav2 介導(dǎo)的細(xì)胞內(nèi)信號級聯(lián)反應(yīng),以激活小GTPase Rac1,從而增強細(xì)胞遷移和侵襲性?;谝延醒芯靠芍?HLF、F10 和EMP1 在多種癌癥的進展中均有表達(dá)。
綜上,LASSO 和SVM-RFE 算法的結(jié)合使篩選的基因更具有特征性,但本研究仍存在不足之處,如僅對數(shù)據(jù)庫的分析無法具有代表性。因此,在后續(xù)的研究中還需要對大量患者進行進一步的研究驗證。