程盈盈 趙琪 魯錦志 易村犍
子宮內(nèi)膜癌(uterine corpus endometrial carcinoma,UCEC)是女性生殖系統(tǒng)三大惡性腫瘤之一[1]。UCEC發(fā)病率居女性生殖系統(tǒng)惡性腫瘤首位,其發(fā)病率逐年上升,并呈年輕化態(tài)勢。以腫瘤免疫系統(tǒng)為治療靶點(diǎn),被認(rèn)為是抗腫瘤藥物研發(fā)的一個極具潛力的方向。目前針對UCEC免疫治療的抗PD-1帕姆單抗,經(jīng)美國食品藥品監(jiān)督管理局批準(zhǔn)已上市[2]。本研究旨在通過生物信息學(xué)方法系統(tǒng)地評估UCEC的免疫環(huán)境和研究其免疫相關(guān)基因。
基于UCEC表達(dá)譜數(shù)據(jù)集評估各腫瘤浸潤免疫細(xì)胞(tumor infiltrating immune cells,TIICs)的相對比例,探究其與臨床特征之間的相關(guān)性。其次基于大量數(shù)據(jù)集,采用生物信息學(xué)方法證實UCEC免疫微環(huán)境的改變,鑒定影響微環(huán)境的核心基因并對該基因介導(dǎo)的作用通路進(jìn)行富集分析。具體實驗設(shè)計流程圖見圖1。
圖1 實驗總體設(shè)計流程圖
1.資料來源:從TCGA數(shù)據(jù)庫(https://portal.gdc.cancer.gov/cart)獲取UCEC患者的基因表達(dá)譜數(shù)據(jù)、基因突變數(shù)據(jù)和臨床數(shù)據(jù)。下載406例UCEC組織和19例正常子宮內(nèi)膜組織的RNA-Seq FPKM數(shù)據(jù),以及529例UCEC的SNV突變數(shù)據(jù)。這些數(shù)據(jù)包含患者的臨床信息,包括發(fā)病年齡、腫瘤病理組織學(xué)分級、生存狀態(tài)和以天為單位的生存時間。從GenCode平臺(http://www.gencodegenes.org/)中下載人類基因組注釋GTF文件。通過免疫學(xué)數(shù)據(jù)庫和分析網(wǎng)站(ImmPort; https://www.immport.org/shared/genelists)下載了2 498個與免疫相關(guān)的基因,該數(shù)據(jù)庫包含基于各種分子功能的17個免疫類別[3-4]。
2.基于CIBERSORT算法的腫瘤免疫細(xì)胞浸潤分析:使用R軟件CIBERSORT包(版本3.6.3)評估UCEC樣本中22種TIICs類型的相對表達(dá)水平,即:天然B細(xì)胞、記憶B細(xì)胞、漿細(xì)胞、CD8+T細(xì)胞、幼稚CD4+T細(xì)胞、CD4+靜息記憶T細(xì)胞、CD4+激活記憶T細(xì)胞、濾泡性輔助T細(xì)胞、調(diào)節(jié)性T細(xì)胞、γδT細(xì)胞、靜息自然殺傷細(xì)胞、天然殺傷細(xì)胞、單核細(xì)胞、M0巨噬細(xì)胞、M1巨噬細(xì)胞、M2巨噬細(xì)胞、靜息樹突狀細(xì)胞、活化樹突狀細(xì)胞、靜息肥大細(xì)胞、活化肥大細(xì)胞、嗜酸性粒細(xì)胞和嗜中性粒細(xì)胞。通過CIBERSORT反卷積算法,將UCEC的mRNA矩陣數(shù)據(jù)與來自CIBERSORT平臺的22種TIICs特征矩陣數(shù)據(jù)進(jìn)行比較,分別生成高、低免疫評分組的UCEC組織中的22種TIICs比例矩陣。
3.子宮內(nèi)膜癌免疫微環(huán)境分析:通過ESTIMATE算法對TCGA隊列的mRNA矩陣數(shù)據(jù)進(jìn)行腫瘤微環(huán)境評分[5,6],包括基質(zhì)細(xì)胞評分和免疫細(xì)胞評分,根據(jù)評分中位值水平將其分為高評分組和低評分組,繼而進(jìn)行差異分析,使用R軟件limma包(版本3.8)Wilcox.Test方法分析數(shù)據(jù),篩選符合標(biāo)準(zhǔn)的基因。
4.腫瘤突變負(fù)荷分析:使用Perl軟件(版本v5.30.0)計算每個樣本的腫瘤突變負(fù)荷(tumor mutation burden,TMB)值,并將UCEC的mRNA矩陣數(shù)據(jù)按TMB中位值水平分為高TMB組和低TMB組,分析TMB值與生存率的關(guān)系。使用Wilcox.Test方法對高、低TMB組的基因進(jìn)行差異分析,篩選滿足條件的基因。
5.獲取關(guān)鍵基因:首先對從腫瘤微環(huán)境評分分組和TMB分組所獲得的差異表達(dá)基因進(jìn)行Venn分析(http://bioinformatics.psb.ugent.be/webtools/Venn/)取交集基因。然后,從ImmPort數(shù)據(jù)庫(https://www.immport.org/shared/genelists)[7]檢索免疫相關(guān)基因與上述交集基因再次行Venn分析,獲得與UCEC相關(guān)的候選基因。最后,基于TCGA隊列UCEC的臨床特征對篩選的基因進(jìn)行單因素邏輯回歸分析[8],篩出關(guān)鍵基因。推測該基因最可能作為UCEC進(jìn)展中免疫相關(guān)的目標(biāo)基因。
6.基于泛癌分析的靶基因驗證:在UCSCXena網(wǎng)站下載TCGA數(shù)據(jù)庫中33種主要的腫瘤轉(zhuǎn)錄組數(shù)據(jù)(FPKM)、突變數(shù)據(jù)(varscan)和臨床數(shù)據(jù),使用perl軟件提取CXCL14表達(dá)矩陣用于下述分析。具體腫瘤見附件表S1。
提取TCGA中各腫瘤的臨床數(shù)據(jù)包括無進(jìn)展間期生存率、生存狀態(tài)和生存時間,使用R軟件survival、survminer、forestplot包(版本3.6.3)將CXCL14表達(dá)矩陣與各樣本PFI生存數(shù)據(jù)合并,根據(jù)CXCL14表達(dá)量中位水平將樣本分為高、低兩組進(jìn)行K-M分析獲得PFI生存曲線,最后基于Cox風(fēng)險比例模型描述基因?qū)ι娴挠绊懖⒗L制森林圖。
計算33種腫瘤體細(xì)胞突變樣本(n=10 114)的TMB值,并提取每個樣本(n=10 416)的微衛(wèi)星不穩(wěn)定(microsatellite instability,MSI)值,通過spearman方法對CXCL14表達(dá)量與TMB值和MSI值進(jìn)行相關(guān)性檢驗,繪制TMB和MSI相關(guān)性雷達(dá)圖。計算33種腫瘤所有樣本的免疫微環(huán)境評分,并結(jié)合CXCL14在樣本中的表達(dá)量,檢驗CXCL14表達(dá)量與免疫微環(huán)境的相關(guān)性。
7.CXCL14基因富集分析(GSEA):為研究篩選的關(guān)鍵基因潛在的分子機(jī)制,進(jìn)行基因富集分析,包括KEGG分析和GO分析。設(shè)定GSEA軟件重復(fù)排列數(shù)為1000次,P<0.05。
1. UCEC中的腫瘤免疫微環(huán)境:TCGA隊列中229例腫瘤樣本和8例正常樣本符合CIBERSORTP<0.05的篩選標(biāo)準(zhǔn)。UCEC組織中濾泡輔助T細(xì)胞(P=0.001)、調(diào)節(jié)T細(xì)胞(P<0.001)、M0巨噬細(xì)胞(P<0.001)、漿細(xì)胞(P=0.052)的比例與正常組織相比差異具有或臨界統(tǒng)計學(xué)意義,而相較于正常組織,幼稚B細(xì)胞(P=0.005)、CD4+靜息記憶T細(xì)胞(P=0.001)、γδT細(xì)胞(P<0.001)、單核細(xì)胞(P=0.01)、M2巨噬細(xì)胞(P=0.04)、靜息肥大細(xì)胞(P<0.001)在UCEC組織中低表達(dá)(圖2a)。結(jié)合患者的生存時間、生存狀態(tài)、病理組織學(xué)分級及年齡分析,發(fā)現(xiàn)調(diào)節(jié)T細(xì)胞(P=0.031)高豐度與患者生存率正相關(guān),調(diào)節(jié)T細(xì)胞(P<0.001)、CD4+靜息記憶T細(xì)胞(P<0.001)高豐度與UCEC病理組織學(xué)分級負(fù)相關(guān),靜息肥大細(xì)胞(P=0.015)豐度在年齡≤60歲患者組與年齡>60歲組中差異具有統(tǒng)計學(xué)意義,漿細(xì)胞(P=0.032)豐度與年齡的關(guān)系與靜息肥大細(xì)胞相反(圖2b、c、d、e)。此外,免疫微環(huán)境基因經(jīng)差異分析獲得549個上調(diào)基因和1個下調(diào)基因。
圖2a TIICs在子宮內(nèi)膜正常組織和癌組織中的分布和豐度差異
圖2b CD4+靜息記憶T細(xì)胞豐度與患者病理分級的相關(guān)性;圖2c 調(diào)節(jié)T細(xì)胞豐度與患者病理分級的相關(guān)性;圖2d 漿細(xì)胞豐度與患者年齡的相關(guān)性;圖2e 靜息肥大細(xì)胞豐度與患者年齡的相關(guān)性
2. UCEC腫瘤突變負(fù)荷:將UCEC的mRNA矩陣數(shù)據(jù)TMB值按中位值水平分為高TMB組(n=226)和低TMB組(n=165),結(jié)合生存時間及病理組織學(xué)分級分析發(fā)現(xiàn),高TMB值組生存率與低TMB值組相比差異具有統(tǒng)計學(xué)意義(P=0.023),且高TMB值與UCEC患者病理組織學(xué)分級呈正相關(guān)(P<0.001,圖3)。此外,對UCEC表達(dá)譜基因高、低TMB值組進(jìn)行基因差異分析獲得326個差異基因。
圖3 TMB值與患者病理分級的相關(guān)性結(jié)果示意圖
3. UCEC免疫微環(huán)境中與預(yù)后相關(guān)的關(guān)鍵基因:對腫瘤免疫微環(huán)境分組獲得的392個差異基因和TMB值分組獲得的326個差異基因以及在ImmPort數(shù)據(jù)庫檢索到的2498個免疫相關(guān)基因進(jìn)行Venn分析獲得9個重疊基因(圖4a)。最后,基于上述9個基因表達(dá)量的差異篩選出與免疫微環(huán)境關(guān)系最密切的基因CXCL14,CXCL14的表達(dá)量在腫瘤樣本中明顯高于正常樣本(P<0.001)(圖4b)。結(jié)合406例UCEC樣本的臨床特征分析發(fā)現(xiàn),CXCL14在年齡≤60歲組中表達(dá)量顯著高于年齡>60歲者,其低表達(dá)與病理組織學(xué)分級正相關(guān)(P<0.05,圖4c、d)。
圖4a 基于生物信息學(xué)網(wǎng)站獲得免疫微環(huán)境、TMB和免疫相關(guān)基因的Venn圖;圖4b CXCL14在正常樣本和腫瘤樣本中表達(dá)量示意圖;圖4c CXCL14在406例腫瘤樣本中的表達(dá)量與年齡的相關(guān)性;圖4d CXCL14在406例腫瘤樣本中的表達(dá)量與病理分級的相關(guān)性;圖4e CXCL14的表達(dá)與患者疾病特異生存率的關(guān)系;圖4f CXCL14的表達(dá)與患者無進(jìn)展間期生存率的關(guān)系。
在UCEC中CXCL14的表達(dá)量與疾病特異生存率(disease specific survival,DSS)和無進(jìn)展間期生存率(progression free interval,PFI)具有相關(guān)性?;赗語言limma包,采用Kaplan-Meier法獲得了DSS、PFI生存曲線,發(fā)現(xiàn)CXCL14低表達(dá)患者的疾病特異生存率明顯低于高表達(dá)患者(P=0.028,圖4e),并且CXCL14高表達(dá)患者無進(jìn)展間期生存率顯著高于低表達(dá)者(P=0.042,圖4f)。
4. CXCL14在33種腫瘤中的表達(dá):對33種腫瘤共11 057例樣本(T=10 327,N=730)的CXCL14表達(dá)矩陣進(jìn)行差異分析,發(fā)現(xiàn)CXCL14在子宮內(nèi)膜癌、宮頸鱗癌等16種腫瘤中的正常組織和癌組織之間的差異表達(dá)有意義(P=0.001 "***" ,P=0.01"**" ,P=0.05"*",P=1" ",圖5a)。采用COX分析方法探究CXCL14在腫瘤中的表達(dá)量與總生存時間的相關(guān)性,結(jié)果表明CXCL14在UCEC等12種腫瘤中的表達(dá)與患者總生存時間相關(guān),且CXCL14為低風(fēng)險基因(圖5b)。
圖5a CXCL14在33種腫瘤中的正常組織和癌組織之間的表達(dá)差異;圖5b CXCL14在腫瘤中的表達(dá)量與總生存時間的相關(guān)性;圖5c 33種腫瘤中CXCL14的表達(dá)量與TMB相關(guān)性示意圖;圖5d 33種腫瘤中CXCL14的表達(dá)量與MSI相關(guān)性示意圖
包括UCEC在內(nèi)的17種腫瘤的CXCL14表達(dá)量與TMB值具有相關(guān)性;包括UCEC在內(nèi)的12種腫瘤的MSI值與CXCL14的表達(dá)負(fù)相關(guān)(P=0.001 "***" ,P=0.01"**" ,P=0.05"*",P=1" ",圖5c、d)。
5.CXCL14富集生物通路:CXCL14基因集低表達(dá)富集203例,高表達(dá)富集203例。由KEGG分析可知,CXCL14低表達(dá)富集會抑制B細(xì)胞受體信號通路、錯配修復(fù)、DNA復(fù)制、泛素介導(dǎo)的蛋白水解作用等通路(圖6)。由富集分析可知,CXCL14在UCEC中是一個保護(hù)性基因,其下調(diào)會抑制體內(nèi)正常的免疫反應(yīng),從而使癌細(xì)胞逃避免疫過程。
圖6 CXCL14在UCEC有關(guān)通路中的富集示意圖
研究表明UCEC間質(zhì)中有大量免疫細(xì)胞浸潤[9-10],免疫細(xì)胞浸潤被認(rèn)為在多種惡性腫瘤的發(fā)生發(fā)展起著重要作用[5,11],目前免疫治療在抗腫瘤領(lǐng)域取得了巨大進(jìn)展。本研究發(fā)現(xiàn),UCEC中浸潤的免疫細(xì)胞比例高于正常組織,部分免疫細(xì)胞浸潤豐度與患者預(yù)后相關(guān),針對這些免疫細(xì)胞的靶向治療,有望改善患者預(yù)后。
近年來免疫系統(tǒng)療法如免疫檢查點(diǎn)抑制劑等在抗腫瘤領(lǐng)域效果顯著。研究表明腫瘤基因高度突變可誘導(dǎo)產(chǎn)生大量新抗原,從而激活免疫細(xì)胞,導(dǎo)致機(jī)體產(chǎn)生抑制腫瘤的免疫反應(yīng)[12]。MSI與腫瘤免疫治療的療效關(guān)系密切[13],多項研究已證實TMB是預(yù)估腫瘤免疫治療療效的新興生物標(biāo)志物[14]。本研究發(fā)現(xiàn)UCEC高TMB組生存率明顯高于低TMB組,而TMB值越高病理分級越高,我們推測高級別UCEC患者有望通過免疫治療獲益。
CXCL14是一種高度保守的、穩(wěn)態(tài)的趨化因子,負(fù)責(zé)免疫細(xì)胞的募集和成熟,可作為抗微生物和抗腫瘤因子發(fā)揮作用[15]。CXCL14在宮頸癌、結(jié)直腸癌、子宮內(nèi)膜癌和頭頸癌等癌癥中經(jīng)常出現(xiàn)失調(diào),其破壞被證明限制了關(guān)鍵的抗腫瘤免疫調(diào)節(jié)[16]。有研究證實,CXCL14通過抑制腫瘤血管的生成起到抑制腫瘤發(fā)展的作用[17]。本研究發(fā)現(xiàn)CXCL14在UCEC中的表達(dá)量高于正常組織,且CXCL14的表達(dá)與病理分級、患者生存率及年齡相關(guān),推測CXCL14表達(dá)失調(diào)可能與UCEC患者不良預(yù)后有關(guān)。這提示CXCL14不僅是判斷UCEC預(yù)后的重要指標(biāo),而且是一個新的潛在靶標(biāo)。在不同類型腫瘤中CXCL14的表達(dá)不一致,如在腎癌、肺癌、頭頸癌、宮頸癌等組織中幾乎不表達(dá)或低表達(dá),而在部分前列腺癌和乳腺癌中表達(dá)水平卻很高[18],這與上述泛癌分析結(jié)果一致,CXCL14在腫瘤中的表達(dá)可能受多種因素影響。
本研究通過探究UCEC相關(guān)免疫細(xì)胞浸潤狀態(tài),發(fā)現(xiàn)其在UCEC進(jìn)展中與免疫過程具有強(qiáng)烈的相關(guān)性,為研究UCEC免疫機(jī)制提供了理論支持。結(jié)合TCGA和ImmPort數(shù)據(jù)庫篩選出參與UCEC進(jìn)展的相關(guān)基因,CXCL14是其中之一。CXCL14在腫瘤中低表達(dá)會促進(jìn)原發(fā)性免疫缺陷、癌癥發(fā)展等,其可作為UCEC有效的免疫相關(guān)預(yù)后標(biāo)志物。本研究實驗數(shù)據(jù)來源于TCGA數(shù)據(jù)庫,有待進(jìn)一步實驗來證實。