毛 偉,張 琳,劉清釗
(1.重慶市南岸區(qū)人民醫(yī)院藥劑科,重慶 400060;2.陸軍軍醫(yī)大學第一附屬醫(yī)院藥劑科,重慶 400038;3.重慶市南岸區(qū)人民醫(yī)院腎內科,重慶 400060)
腎細胞癌(renal cell carcinoma,RCC)是最常見的惡性腫瘤之一,在男性惡性腫瘤中排名第6,在女性惡性腫瘤中排名第9[1]。腎透明細胞癌(clear cell renal cell carcinoma,ccRCC)是腎癌中最常見的亞型,其發(fā)病率占腎癌的70%~80%[2]。ccRCC 的病理生理學很復雜,除了肥胖、吸煙、高血壓和糖尿病等因素外,還有多種基因突變[3]。因此,建立可以準確預測ccRCC 患者預后的工具用于指導臨床診治至關重要。細胞焦亡(pyroptosis)又稱細胞炎性壞死,是一種程序性細胞死亡[4]。焦亡細胞以細胞腫脹和許多泡狀突起為特征,在電子顯微鏡下,可以看到其首先形成大量的囊泡,當這些囊泡形成后,細胞膜上就會形成孔洞,孔洞破裂,內容物流出[5]。細胞焦亡主要依靠caspase 家族的部分蛋白,活化caspase 后裂解gasdermin 蛋白,促進炎癥小體的轉錄和表達以及IL-1β、IL-18 等炎癥因子的分泌,最終導致細胞死亡[6]。細胞焦亡最初被發(fā)現是抵抗感染的關鍵機制,越來越多的研究表明,它在腫瘤的發(fā)展中也起著重要作用。有研究報道[7],炎性小體、gasdermin 蛋白和炎癥因子與腫瘤的發(fā)生、侵襲和轉移有關。細胞焦亡在腫瘤的發(fā)生和抗腫瘤過程中起著重要的作用,但其在ccRCC 中的具體作用研究較少。因此,本研究擬建立焦亡相關評分模型,探討ccRCC 中細胞焦亡、預后、免疫微環(huán)境以及免疫治療之間潛在的相關性。
1.1 數據來源 從TCGA 數據庫下載509 例ccRCC及71 例癌旁正常組織的轉錄組數據和臨床數據,剔除年齡、性別、生存狀態(tài)、病理分期缺失以及生存時間小于30 d 的樣本,從ICGC 數據庫中下載轉錄組數據及臨床數據進行驗證。
1.2 細胞焦亡相關基因的鑒定 利用“edgeR”包篩選ccRCC 與癌旁組織之間的差異表達基因(DEGs),篩選條件:|Log2FC|>1,FDR<0.05。從GO、MSigDB 數據庫及先前的研究[8-13]中共獲取到58 個焦亡基因,差異焦亡基因為58 個焦亡基因與DEGs 的交集。
1.3 一致性聚類 利用“ConsensusClusterPlus”包對差異焦亡基因矩陣進行一致性聚類,聚類值k 取2~6,根據聚類效果選擇具有較高聚類穩(wěn)定性的k 值。
1.4 富集分析 以“c2.cp.kegg.v7.4.symbols.gmt”為參考基因集進行基因集變異分析(GSVA)、基因集富集分析(GSEA)。FDR<0.01 表示差異有統(tǒng)計學意義。
1.5 腫瘤微環(huán)境(TME)細胞浸潤 采用“CIBERSORT”“quanTIseq”算法來定量免疫細胞的比例,應用“ESTIMATE”包評估腫瘤純度。
1.6 焦亡相關評分模型的建立與評估 利用“edgeR”包篩選ccRCC 聚類簇間的DEGs,篩選條件:|Log2FC|>1,FDR<0.05。然后對DEGs 進行單因素Cox 回歸、多因素Cox 回歸和LASSO 回歸分析篩選焦亡相關基因并構建風險評分模型:
其中Gi、βi分別代表模型中基因表達水平及系數。
根據公式計算出每個ccRCC 患者的風險評分,利用“survminer”包確認最佳截止點將患者分為高、低風險兩組并進行Kaplan-Meier 生存曲線分析,應用“timeROC 包”進行ROC 曲線分析,評估模型的穩(wěn)定性。結合臨床數據和風險評分,利用“regplot”包繪制列線圖、校準曲線評估模型的預測能力。
2.1 差異焦亡基因的鑒定 共發(fā)現4179 個DEGs,見圖1A。DEGs 與58 個細胞焦亡基因取交集篩選出了23 個上調和1 個下調的差異焦亡基因,見圖1B、圖1C;KEGG 分析結果顯示,差異焦亡基因主要富集在NOD 樣受體信號通路、TNF 信號通路等炎癥通路以及沙門氏菌感染、軍團菌病等感染性疾病相關通路,見圖1D。
圖1 差異焦亡基因的篩選
圖1 差異焦亡基因的篩選(續(xù))
2.2 基于差異焦亡基因的腫瘤分型 為研究24 個差異焦亡基因表達水平與ccRCC 亞型之間的關系,對ccRCC 患者進行一致性聚類分析,當k=2 時,組內相關性最高而組間相關性最低,確定了兩種不同的ccRCC 亞型,其中聚類簇1 包含252 例患者,聚類簇2 包含257 例患者,見圖2A;Kaplan-Meier 生存分析顯示,聚類簇1 生存優(yōu)勢顯著高于聚類簇2,見圖2B。為了探索2 種亞型間的信號通路差異,進行GSVA 分析,結果顯示:聚類簇1 在代謝相關通路中富集,主要包括丁酸代謝、丙酸代謝、氧化磷酸化、三羧酸循環(huán);聚類簇2 在免疫相關通路中富集,主要包括NOD 樣受體信號通路、Toll 樣受體信號通路、B細胞受體信號通路、T 細胞受體信號通路,見圖2C。
圖2 細胞焦亡基因相關的腫瘤亞型
2.3 兩種ccRCC 亞型在TME 細胞浸潤上的差異 通過分析兩種ccRCC 亞型在TME 細胞浸潤情況,發(fā)現M2 巨噬細胞、單核細胞、NK 細胞、幼稚B 細胞、靜息肥大細胞、靜息CD4+記憶T 細胞、激活的樹突狀細胞主要富集在聚類簇1 中,而聚類簇2 富含調節(jié)性T 細胞、B 細胞、漿細胞、激活的CD4+記憶T細胞、γδT 細胞、CD8+T 細胞,見圖3A、圖3B;基質評分、免疫評分、ESTIMATE 評分結果顯示,聚類簇1評分均低于聚類簇2,見圖3C。
圖3 兩種ccRCC 亞型在TME 上的差異
2.4 焦亡相關評分模型的建立與驗證 對兩種ccRCC 亞型的差異進行分析,確認了1096 個DEGs,通過單因素和多因素Cox 回歸,篩選出248 個可作為獨立預后特征的基因;進行LASSO 回歸,確認了10個焦亡相關基因用于構建風險評分模型,見圖4A、圖4B;預后風險評分=1.0518×C10orf90+0.0845×HS3ST3A1 +0.0407 ×SAA1 -0.324 ×MPP7 +0.2061 ×IGF2BP3 +0.0566 ×ADAMTS14 +0.2176 ×CILP -0.0119×SHOX2-0.1069×TRIM2+0.3367×HHIPL2。根據上述公式,計算每個患者的風險評分,并將患者分為高風險組和低風險組,最佳截止值為0.9562,結果顯示,低風險組較高風險組有生存優(yōu)勢,見圖4C、圖4D,其中1、3、5 年生存率的AUC 預測值分別為0.77、0.727、0.764,見圖4E。為了驗證預后模型的預測能力,從ICGC 數據庫下載ccRCC 的轉錄組數據和臨床數據,根據風險評分公式,將患者分為高低風險兩組,最佳截止值為1.9869,見圖4F、圖4H;患者1、3、5 年生存率的 AUC 預測值分別為0.774、0.747、0.762,見圖4G。
圖4 構建風險評分模型
2.5 風險評分與患者臨床病理因素的關系 結果顯示,風險評分在腫瘤負擔較重、腫瘤體積較大、淋巴結受累較重、遠端轉移、病理分期較晚、組織學分級較晚的男性患者中顯著增高,見圖5。
圖5 風險評分與臨床病理關系
2.6 風險評分與ccRCC 患者預后的關系 單因素Cox 回歸分析顯示,高齡、進展期病理分期、較大的腫瘤體積、較重淋巴結受累、遠處轉移、高風險評分是影響患者總生存期的不利因素;多因素Cox 回歸分析顯示,年齡、病理分期、風險評分是患者預后的獨立影響因素,見表1。進一步驗證風險評分對ccRCC 患者的預后價值,以年齡、病理分期、風險評分構建列線圖,見圖6A;結果顯示,預測與實際的生存概率有較好的一致性,見圖6B;預測總生存期的C 指數為0.7714(95%CI:0.7534~0.7894);患者1、3、5 年生存率的AUC 預測值分別為0.872、0.803、0.752,見圖6C。
圖6 風險評分對ccRCC 患者的預后價值
表1 單因素和多因素Cox 回歸分析
2.7 GSEA、GSVA 富集分析 GSEA、GSVA 富集分析顯示,高風險組主要富集在趨化因子信號通路、產生IGA 的腸道免疫網絡、細胞因子受體相互作用等免疫相關通路,低風險組主要富集在三羧酸循環(huán)、丙酸代謝、脂肪酸代謝、纈氨酸亮氨酸異亮氨酸降解等代謝相關通路,見圖7。
圖7 GSEA、GSVA 富集分析
2.8 高風險組與低風險組在TME 細胞浸潤上的差異 ESTIMATE、CIBERSORT 和quanTIseq 算法顯示,高風險組的基質評分、免疫評分較高,見圖8A,但高風險組含有更高水平的免疫抑制細胞如巨噬細胞、調節(jié)性T 細胞,見圖8B。
圖8 高風險組與低風險組免疫細胞浸潤差異
2.9 風險評分預測免疫治療效果的價值 高風險組體細胞突變高于低風險組,見圖9A、圖9B,通過比較高風險組與低風險組免疫檢查點(PD-1、PD-L1、CTLA4、LMTK3、LAG3、TIGIT、CD27、OX40、GITR、ICOS)的基因表達水平發(fā)現,高風險組基因表達水平普遍高于低風險組,見圖9C;通過ImmuCellAI 數據庫預測高低風險組對免疫治療的反應,結果顯示,低風險組的反應率更高,見圖9D。
圖9 風險評分預測免疫治療效果的價值
細胞焦亡是機體重要的免疫反應,在拮抗感染和內源性危險信號中發(fā)揮重要作用。研究表明[14],細胞焦亡在腫瘤的生長中起著雙向作用,一方面炎性體可以誘導腫瘤細胞發(fā)生焦亡,抑制腫瘤細胞的增殖;另一方面,炎性體的累積效應也可以形成適宜腫瘤細胞生長的微環(huán)境,起著促瘤生長的作用。然而,有關細胞焦亡與ccRCC 的預后、免疫微環(huán)境的研究較為有限,需要進一步深入研究。
本研究對TCGA 數據庫中ccRCC 的焦亡基因進行差異表達分析,獲取到24 個差異焦亡基因?;谏鲜霾町惤雇龌蜻M行一致性聚類分析得到2 個亞型,聚類簇1 生存優(yōu)勢顯著高于聚類簇2。GSVA分析表明,聚類簇1 主要富集在代謝相關通路,聚類簇2 主要富集在免疫相關通路。為了進一步評估焦亡相關基因與ccRCC 的關系,本研究基于兩個亞型的差異基因進行單因素、多因素Cox 回歸及LASSO回歸分析構建1 個風險評分模型,發(fā)現低風險組生存優(yōu)勢高于高風險組(P<0.001),并在ICGC 數據庫中進行了驗證,說明風險評分是ccRCC 預后的獨立危險因素。包含風險評分、年齡及病理分期的列線圖顯示,在預測ccRCC 生存概率方面,AUC 較高(1、3、5 年分別為0.872、0.803、0.752)。風險評分與腫瘤大小、淋巴結轉移、遠端轉移、病理分期、組織學分級呈正相關,基于這一特征,高風險組表現出更具侵襲性的生物學行為。此外,高風險組腫瘤細胞存在免疫抑制表型,巨噬細胞和調節(jié)性T 細胞浸潤較多。最后,還對免疫治療反應進行了預測,發(fā)現低風險組的反應率更高。以上結果表明,風險評分可用于ccRCC 患者預測預后。
本研究篩選出10 個焦亡相關基因(C10orf90、HS3ST3A1、SAA1、MPP7、IGF2BP3、ADAMTS14、CILP、SHOX2、TRIM2、HHIPL2),這10 個基因表達情況與ccRCC 預后相關。研究發(fā)現,TRIM2、MPP7表達越高ccRCC 患者預后越好(P<0.001),C10orf90、HS3ST3A1、SAA1、IGF2BP3、ADAMTS14、CILP、SHOX2、HHIPL2 表達越高ccRCC 患者預后越差(P<0.001)。TRIM2 作為一種抗腫瘤基因,其過度表達顯著抑制了RCC 遷移和侵襲能力,在ccRCC中起負調控作用[15]。New M 等[16]研究表明,MPP7 是一種參與細胞接觸的腳手架蛋白,其高表達引起胰腺導管腺癌細胞自噬,導致癌細胞死亡。目前在CILP 癌癥中的作用尚不清楚。SHOX2 異常表達導致上皮間質轉化(EMT),SHOX2 可能通過TGF-β信號通路調節(jié)EMT 來促進人膀胱癌細胞的遷移、侵襲[17]。TRIM 家族蛋白在發(fā)育、凋亡、自噬、炎癥、先天免疫及癌變等多種生物過程中具有廣泛的作用[18]。C10orf90 是位于DNA 損傷高敏位點的抑癌基因,可激活p53-p21 通路抑制腫瘤發(fā)生[19]。HS3ST3A1 是一種新的腫瘤調節(jié)因子,因腫瘤表型的不同可發(fā)揮抑癌或促癌作用[20]。SAA1 可能參與腫瘤的發(fā)生發(fā)展,促進胰腺癌的進展和遠處轉移[21]。Lin YM 等[22]研究結果表明,ADAMTS14 在口腔鱗狀細胞癌中低表達,并調節(jié)口腔鱗狀細胞癌中的細胞存活,且其表達是口腔鱗狀細胞癌患者的獨立預后標志物。HHIPL2是一種跨膜蛋白,HHIPL2 的表達水平與胃癌顯著相關。微陣列分析和qRT-PCR 驗證發(fā)現胃癌樣本中HHIPL2 的表達水平高出正常組織7.4 倍[23]。研究表明[24],IGF2BP3 不僅在多種腫瘤組織中表達上調,還在一些癌前病變如巴雷特食管、非典型子宮內膜異位癥中表達上調。
本研究仍然存在一些不足:首先,預后模型與ccRCC 的發(fā)生、發(fā)展的關系仍需體外和體內實驗進一步驗證,以更好地評估預后模型和ccRCC 之間的關系;其次,本研究數據來自TCGA 數據庫,對其他人群的適用性尚不明確。但建立的預后模型可有效預測ccRCC 患者的預后,可能對指導臨床治療、制定精準治療方案具有重要價值。
綜上所述,ccRCC 焦亡相關基因預后模型可用于預測ccRCC 患者的預后,可以作為免疫治療反應的預測指標,有利于進一步指導臨床治療。