巴 穎,張核子,余晨笛,盧曉萍,操利超
(深圳市核子基因科技有限公司,廣東 深圳 518071)
口腔癌(oral cancer)是頭頸部較常見的惡性腫瘤之一,已引起全球關(guān)注[1]。在國(guó)際分類定義中,口腔癌是包括嘴唇、舌頭、牙齦、口腔底部、頰粘膜、口腔前庭或磨牙后區(qū)等部位的癌癥[2]。盡管目前對(duì)口腔癌的診斷和治療方面已取得了一定的進(jìn)展,但口腔癌患者的死亡率依然很高,主要原因之一是缺乏有效的預(yù)后生物標(biāo)志物[3]。因此,探索口腔癌潛在的預(yù)后標(biāo)志物和治療靶點(diǎn)是當(dāng)前亟需解決的問題。免疫檢查點(diǎn)抑制劑(immune checkpoint inhibitors,ICIs)是一種很有前景的免疫療法,通過抑制負(fù)性調(diào)節(jié)受體發(fā)揮作用,如程序性細(xì)胞死亡受體1(programmed cell death protein 1,PD-1)和細(xì)胞毒性T淋巴細(xì)胞抗原4(cytotoxic T lymphocyte antigen 4,CTLA4),從而激活抗腫瘤免疫[4]。免疫治療在口腔癌中具有更好的療效,有關(guān)口腔癌免疫學(xué)的研究不斷增加[5,6]。然而,由于腫瘤免疫微環(huán)境的異質(zhì)性和復(fù)雜性,只有一小部分患者受益于免疫治療,持續(xù)緩解的患者仍很少。許多免疫相關(guān)生物標(biāo)志物被認(rèn)為是口腔癌患者有用的預(yù)測(cè)指標(biāo),但目前尚缺乏一種理想的生物標(biāo)志物用于臨床[7-10]。為了預(yù)測(cè)和改善口腔癌患者的預(yù)后,本研究基于癌癥基因組圖譜-頭頸部鱗狀細(xì)胞癌(the cancer genome atlas-head and neck squamous cell carcinoma,TCGA-HNSC)隊(duì)列構(gòu)建和評(píng)估了口腔癌免疫相關(guān)預(yù)后模型,分析該預(yù)后模型與口腔癌患者臨床病理特征之間的關(guān)系,探索腫瘤免疫微環(huán)境的特征,包括腫瘤浸潤(rùn)細(xì)胞構(gòu)成、腫瘤突變負(fù)荷(tumor mutational burden,TMB)、以及PD-1/PD-L1/CLTA4的mRNA 表達(dá)水平,現(xiàn)報(bào)道如下。
1.1 數(shù)據(jù)獲取 癌癥基因組圖譜(the cancer genome atlas,TCGA)中mRNA 表達(dá)數(shù)據(jù)集和對(duì)應(yīng)的臨床信息從UCSC Xena 平臺(tái)(https://xenabrowser.net/datapages/)下載,選擇隊(duì)列為癌癥基因組數(shù)據(jù)共享系統(tǒng)(genomic data commons,GDC)TCGA-HNSC,剔除非口腔癌相關(guān)部位的樣本,樣本信息見表1。從免疫學(xué)數(shù)據(jù)庫和分析平臺(tái)(the immunology database and analysis portal,ImmPort)(https://immport.niaid.nih.gov/)下載免疫相關(guān)基因列表,總計(jì)1509 個(gè)。
表1 TCGA數(shù)據(jù)集中樣本信息[n(%)]
1.2 構(gòu)建免疫相關(guān)的預(yù)后風(fēng)險(xiǎn)模型 首先,利用R包對(duì)TCGA數(shù)據(jù)集進(jìn)行差異基因分析,過濾標(biāo)準(zhǔn)為adjustedP-value<0.05 和差異倍數(shù)大于1.5 倍(|Log2FC|>0.585),然后與免疫基因列表取交集,得到免疫相關(guān)的差異基因。接著,使用R 包Survival 進(jìn)行單變量Cox 比例風(fēng)險(xiǎn)回歸模型,選取與生存預(yù)后相關(guān)的差異基因。通過多因子回歸分析確定每個(gè)預(yù)后因子的回歸系數(shù),建立預(yù)后風(fēng)險(xiǎn)評(píng)估模型,預(yù)測(cè)患者生存率。公式為:
風(fēng)險(xiǎn)分?jǐn)?shù)=∑差異基因的回歸系數(shù)χi×歸一化處理后的基因表達(dá)量βi
1.3 繪制生存曲線和ROC 曲線 為了評(píng)估構(gòu)建的風(fēng)險(xiǎn)預(yù)后模型的性能,利用R 包survivalROC 繪制受試者工作特征曲線(receiver operating characteristic curve,ROC),在ROC 曲線的轉(zhuǎn)折點(diǎn)選擇最佳風(fēng)險(xiǎn)評(píng)分臨界值,轉(zhuǎn)折點(diǎn)處真陽性和假陽性之間的差異最大。高于臨界值的患者屬于高風(fēng)險(xiǎn)評(píng)分組,低于臨界值的患者屬于低風(fēng)險(xiǎn)評(píng)分組,并使用R 包Survminer 繪制兩組的生存曲線。
1.4 構(gòu)建和驗(yàn)證列線圖 為了提高預(yù)后模型的性能,繪制列線圖,使用R 包rms,通過整合風(fēng)險(xiǎn)評(píng)分模型和臨床信息,包括年齡、性別和腫瘤分期,可視化不同患者特征的預(yù)后價(jià)值。此外,基于單因子回歸分析的森林圖分析臨床信息與總生存期(overall survival,OS)間的關(guān)系。其中,一致性指數(shù)(concordance index,C-index)可反映列線圖的預(yù)測(cè)準(zhǔn)確性。
1.5 腫瘤免疫侵潤(rùn)細(xì)胞類型的構(gòu)成比較 基于構(gòu)建的預(yù)后風(fēng)險(xiǎn)模型,將腫瘤樣本分為高風(fēng)險(xiǎn)評(píng)分組和低風(fēng)評(píng)分組,并采用CIBERSORT 算法[11],獲取22 種腫瘤浸潤(rùn)免疫細(xì)胞的比例。隨后,通過非配對(duì)t檢驗(yàn)比較高風(fēng)險(xiǎn)評(píng)分組和低風(fēng)險(xiǎn)評(píng)分組之間的免疫圖譜。
1.6 腫瘤免疫微環(huán)境的特征分析 使用R 包maftools可視化高風(fēng)險(xiǎn)評(píng)分組和低風(fēng)險(xiǎn)評(píng)分組的突變譜[12]。計(jì)算TMB 值,并通過非配對(duì)t檢驗(yàn)統(tǒng)計(jì)高風(fēng)險(xiǎn)評(píng)分組和低風(fēng)險(xiǎn)評(píng)分組間TMB的差異;使用Kaplan-Meier 方法比較高風(fēng)險(xiǎn)評(píng)分組和低風(fēng)險(xiǎn)評(píng)分組間OS的差異;采用Wilcoxon 檢驗(yàn)比較高風(fēng)險(xiǎn)評(píng)分組和低風(fēng)險(xiǎn)評(píng)分組間免疫檢查點(diǎn)及其配體的mRNA 表達(dá)水平。
2.1 構(gòu)建口腔癌的免疫相關(guān)預(yù)后模型 共得到1533個(gè)差異表達(dá)基因,其中上調(diào)差異基因數(shù)量為726 個(gè),下調(diào)基因數(shù)量為807 個(gè),見圖1A;與免疫基因列表取交集后,共得到73 個(gè)免疫相關(guān)基因,其中51 個(gè)基因下調(diào),22 個(gè)基因上調(diào)。單因子回歸和多因子回歸分析表明,有6 個(gè)免疫相關(guān)的差異基因與OS 有關(guān),見表2。其中,回歸系數(shù)見圖1B~圖1D。根據(jù)逐步回歸模型,Akaike 信息標(biāo)準(zhǔn)(Akaike information criterion,AIC)為1536.21,C-index 為0.63,見圖1E。
圖1 鑒定預(yù)后相關(guān)的差異表達(dá)基因
表2 與口腔癌預(yù)后相關(guān)的基因信息
2.2 預(yù)后模型的性能評(píng)估 基于已構(gòu)建的預(yù)后風(fēng)險(xiǎn)模型,將口腔癌患者分為高風(fēng)險(xiǎn)評(píng)分組和低風(fēng)險(xiǎn)評(píng)分組,其中,cutoff 值設(shè)為0.02??梢钥闯觯S著風(fēng)險(xiǎn)得分的增加,生存時(shí)間呈現(xiàn)縮短的趨勢(shì),并且高危組的死亡比例比低危組高,見圖2A、圖2B;基因CD40LG 和CMA1 在低風(fēng)險(xiǎn)評(píng)分組表達(dá)量高,在高風(fēng)險(xiǎn)評(píng)分組表達(dá)量低,而其余3 個(gè)基因趨勢(shì)相反,見圖2C;高風(fēng)險(xiǎn)評(píng)分患者的OS 比低評(píng)分患者預(yù)后較差,見圖2D。
圖2 預(yù)后風(fēng)險(xiǎn)評(píng)分分組和評(píng)估
2.3 預(yù)后模型的統(tǒng)計(jì)分析 繪制ROC 曲線和腫瘤分層分析進(jìn)一步評(píng)估風(fēng)險(xiǎn)模型的性能,結(jié)果顯示,ROC曲線下面積(area under the curve,AUC)在3年時(shí)為0.678,4年時(shí)為0.671,5年時(shí)為0.683,見圖3A。Wilcoxon 檢驗(yàn)表明,預(yù)后風(fēng)險(xiǎn)評(píng)分與N 分期(區(qū)域淋巴結(jié)轉(zhuǎn)移)密切相關(guān)(P=0.034),但與病理分期和T 分期無相關(guān)性(P>0.05),見圖3B、圖3C、圖3D。
圖3 預(yù)后風(fēng)險(xiǎn)評(píng)估模型性能評(píng)價(jià)
2.4 構(gòu)建和評(píng)估列線圖模型 在列線圖中,每個(gè)變量的得分可以在分?jǐn)?shù)表上找到,然后通過計(jì)算總分來估計(jì)3、4 和5年的生存概率,見圖4A;森林圖顯示,患者年齡(>60 歲)、腫瘤Ⅳ期和風(fēng)險(xiǎn)評(píng)分與OS 相關(guān)(P<0.05),見圖4B。另外,繪制校準(zhǔn)曲線來驗(yàn)證列線圖的性能,結(jié)果顯示,構(gòu)建的列線圖模型性能良好,預(yù)測(cè)曲線接近理想曲線,見圖4C~圖4E。此外,該列線圖(C-index:0.67)的預(yù)測(cè)準(zhǔn)確性高于風(fēng)險(xiǎn)評(píng)分模型(C-index:0.63)。
圖4 列線圖模型的構(gòu)建與驗(yàn)證
2.5 體細(xì)胞突變統(tǒng)計(jì)及其與口腔癌生存預(yù)后的關(guān)系基于建立的免疫預(yù)后模型,將腫瘤樣本分為高風(fēng)險(xiǎn)評(píng)分組和低風(fēng)險(xiǎn)評(píng)分組,分別統(tǒng)計(jì)體細(xì)胞突變類型、突變模式和基因突變率。結(jié)果顯示,突變以錯(cuò)義突變?yōu)橹?,主要突變類型為單核苷酸變異(single nucleotide variants,SNV),突變模式主要為C>T。在高風(fēng)險(xiǎn)評(píng)分組中,突變率排名前10的基因?yàn)門P53、TTN、MUC16、FAT1、CDKN2A、KMT2D、LRP1B、NOTCH1、DNAH5 和SYNE1,在低風(fēng)險(xiǎn)評(píng)分組中,突變率排名前10的基因?yàn)門P53、TTN、FAT1、NOTCH1、CDKN2A、PIK3CA、CASP8、SYNE1、CSMD3 和LRP1B,見圖5A,圖5B;其中基因MUC16 和NOTCH1 在高風(fēng)險(xiǎn)評(píng)分組和低風(fēng)險(xiǎn)評(píng)分組中的突變率比較,差異有統(tǒng)計(jì)學(xué)意義(P<0.05),見圖5C;對(duì)基因MUC16 和NOTCH1 分別進(jìn)行生存曲線分析,兩個(gè)基因均不能作為獨(dú)立的預(yù)后因子(P>0.05),見圖5D,圖5E;高風(fēng)險(xiǎn)評(píng)分組和低風(fēng)險(xiǎn)評(píng)分組的TMB 比較,差異無統(tǒng)計(jì)學(xué)意義(P>0.05),見圖5F;但生存曲線分析顯示,TMB 值可作為獨(dú)立的預(yù)后因子,見圖5G。
圖5 體細(xì)胞突變分析統(tǒng)計(jì)及其與OS的關(guān)系
圖5 體細(xì)胞突變分析統(tǒng)計(jì)及其與OS的關(guān)系(續(xù))
2.6 口腔癌腫瘤免疫微環(huán)境 基于CIBERSORT 算法,估算每個(gè)口腔癌患者中22 種免疫細(xì)胞的比例,并比較高風(fēng)險(xiǎn)評(píng)分組和低風(fēng)險(xiǎn)評(píng)分組之間的免疫細(xì)胞比例,結(jié)果顯示,有6 種免疫細(xì)胞類型存在差異(P<0.05),見圖6A;另外,雖然免疫細(xì)胞NK.cells.activated 在高風(fēng)險(xiǎn)評(píng)分組和低風(fēng)險(xiǎn)評(píng)分組的免疫侵潤(rùn)程度不存在差異,但其與生存預(yù)后相關(guān)(P<0.05),見圖6B。Wilcoxon 檢驗(yàn)結(jié)果表明,高風(fēng)險(xiǎn)評(píng)分組PD-L1(P=1.8×10-7)、PD-1(P=0.0079)和CTLA-4(P=9.7×10-7)的表達(dá)水平較低,見圖6C~圖6E。
圖6 口腔癌腫瘤免疫微環(huán)境
免疫細(xì)胞在腫瘤的演變中起著重要作用[4],目前ICIs 已應(yīng)用于中晚期實(shí)體瘤的治療[13]。對(duì)于口腔癌,納武利尤單抗(nivolumab)和派姆單抗(pembrolizumab)均被批準(zhǔn)用于治療復(fù)發(fā)/轉(zhuǎn)移性疾病[14]。然而,由于對(duì)腫瘤微環(huán)境特性的理解不足,這在一定程度上阻礙了免疫治療的廣泛應(yīng)用。近年來,大量研究鑒定出了與口腔癌診斷和預(yù)后相關(guān)的免疫相關(guān)生物標(biāo)志物[8,9,15,16]。但為了最大限度地發(fā)揮免疫治療的作用,還需要探索更多可靠的生物標(biāo)志物。
本研究基于5 個(gè)免疫相關(guān)差異基因構(gòu)建了口腔癌預(yù)后風(fēng)險(xiǎn)評(píng)估模型,這5 個(gè)基因?yàn)镕GF9、CD40LG、CMA1、ESRRG、ADIPOQ。已有研究表明[7,17,18],CD40LG、CMA1 和ESRRG 與口腔癌的預(yù)后顯著相關(guān)。FGF9 是一種生長(zhǎng)因子,屬于FGFs 家族,F(xiàn)GF9是許多癌癥(包括肺腺癌、前列腺癌和肝癌)腫瘤演化的關(guān)鍵因子[19]。CD40LG 是一種跨膜蛋白,屬于腫瘤壞死因子超家族,存在于CD4+T 細(xì)胞、B 細(xì)胞、單核細(xì)胞和自然殺傷細(xì)胞及癌細(xì)胞中,具有增強(qiáng)腫瘤細(xì)胞的凋亡和抗原呈遞細(xì)胞的功能[17]。CMA1 是一種乳糜蛋白酶,由肥大細(xì)胞分泌,在癌癥中還沒有明確的研究。有研究表明[20],通過增強(qiáng)ESRRG的表達(dá)和功能,可在癌細(xì)胞中發(fā)揮抑癌活性。ADIPOQ 表達(dá)的脂聯(lián)素可顯著抑制乳腺癌生長(zhǎng)并誘導(dǎo)細(xì)胞凋亡[21],但其在口腔癌中的分子機(jī)理還未見報(bào)道。
本研究結(jié)果顯示,免疫細(xì)胞NK.cells.activated的免疫侵潤(rùn)程度和TMB 是口腔癌潛在的獨(dú)立預(yù)后標(biāo)志。口腔癌高風(fēng)險(xiǎn)評(píng)分患者的免疫檢查點(diǎn)及其配體(PD-L1、PD-1 和CTLA-4)表達(dá)水平較低,這可能表明構(gòu)建的免疫相關(guān)風(fēng)險(xiǎn)評(píng)分模型能夠?yàn)槊庖咧委熖峁┮欢ǖ呐R床指導(dǎo)意義。
綜上所述,本研究成功構(gòu)建了免疫相關(guān)的口腔癌風(fēng)險(xiǎn)評(píng)估預(yù)后模型,并探索了腫瘤免疫微環(huán)境的特征,這可能有助于口腔癌患者的預(yù)后和免疫治療。