謝 琛 許 晨 陳淑慧 李俊玉 張懷文
肺癌是世界上發(fā)病人數(shù)及死亡人數(shù)最多的惡性腫瘤。據(jù)估計,每年有209萬肺癌新病例和176萬肺癌死亡病例,其中肺腺癌(LUAD)及肺鱗癌(LUSC)占所有肺癌病例的70%[1-3]。目前免疫檢查點抑制劑(ICI)療法被認(rèn)為是肺腺癌(LUAD)及肺鱗癌(LUSC)患者的有效治療方法。ICI治療腫瘤的主要作用原理是針對腫瘤細(xì)胞的免疫識別和免疫反應(yīng)相關(guān)逃逸機制。腫瘤細(xì)胞上表達(dá)的PD-L1已被FDA列為篩選接受PD-1/PD-L1治療人群的肺癌患者的伴隨診斷或補充診斷[4-5]。然而研究表明,PD-L1作為生物標(biāo)志物有一定的局限性,仍需與其他生物標(biāo)志物相結(jié)合[6]。
腫瘤突變負(fù)擔(dān)(tumor mutation burden,TMB)是指腫瘤樣本中腫瘤細(xì)胞編碼區(qū)每百萬堿基的體細(xì)胞突變數(shù)。它被認(rèn)為是衡量腫瘤突變水平的一個生物學(xué)標(biāo)志[7]。腫瘤中新抗原的數(shù)量與TMB相關(guān),高 TMB的患者更有可能產(chǎn)生免疫原性新抗原[8]。一些臨床試驗表明,TMB與T淋巴細(xì)胞的抗原識別和免疫療法的有效性之間存在正相關(guān),可用于預(yù)測PD-1/PD-L1抑制劑的療效,如黑色素瘤[9]。目前,TMB被用來作為評估LUAD及LUSC患者從 ICI治療中獲益的指標(biāo)[10]。 作為評估LUAD及LUSC患者接受ICI治療后預(yù)后的一個因素,一些臨床試驗顯示TMB與T淋巴細(xì)胞識別抗原和免疫治療效果之間存在正相關(guān)[11]。在本研究中,我們打算通過探討TMB、免疫細(xì)胞浸潤與LUAD及LUSC患者預(yù)后之間的關(guān)系,進(jìn)一步研究TMB影響預(yù)后的機制。
我們使用“TCGAbiolinks”R軟件包從TCGA 數(shù)據(jù)庫(https://portal.gdc.cancer.gov/)中提取LUAD及LUSC患者的臨床信息(年齡、性別、TNM分期)、總生存期(OS)、無進(jìn)展生存期(PFS)等和突變譜。突變數(shù)據(jù)處理過程包括GDCquery和 GDCprepare(22)。我們使用“maftools”R軟件包來可視化MAF文件(23)。數(shù)據(jù)處理是由R軟件(vision4.2.2)進(jìn)行。例如,通過“dplry”(24)和“stringr”[B]。此外,我們從免疫學(xué)數(shù)據(jù)庫和分析門戶ImmPort(https://immport.niaid.nih.gov)(25)獲得IRG列表。
我們使用“maxstat”R軟件包(23)計算樣本的TMB。TMB的計算方法是:TMB=(體細(xì)胞突變的數(shù)量)/(樣本CDS區(qū)域的長度),CDS(編碼序列)指的是蛋白質(zhì)編碼區(qū)域序列。計算TMB得分的中位數(shù),將LUAD樣本分?jǐn)?shù)低于截斷值的定義為低 TMB組,而分?jǐn)?shù)高于截斷值的定義為高TMB組。
我們通過Kaplan-Meier方法評估了高、低TMB對LUAD及LUSC患者 OS和PFS的影響。此外,我們還比較了不同臨床基線特征對高、低TMB組患者預(yù)后的影響。采用Wilcoxon檢驗來分析2組之間的差異,分析中排除了缺失值的樣本。
我們選擇用“Limma”(26)檢測高、低TMB組的差異表達(dá)基因(DEGs)。我們設(shè)置差異倍數(shù)而不是對數(shù)(差異倍數(shù))>1以減少混雜因素的影響,并進(jìn)行多重檢驗校正以控制誤發(fā)現(xiàn)率(FDR<0.05)(27)。我們將DEGs與IRG列表基因進(jìn)行比較以篩選免疫相關(guān)的差異表達(dá)基因。用R軟件對樣本轉(zhuǎn)錄組數(shù)據(jù)結(jié)合臨床信息數(shù)據(jù)進(jìn)行批量生存分析,獲得生存相關(guān)基因。將生存相關(guān)基因與免疫相關(guān)差異表達(dá)基因進(jìn)行比較,篩選出生存相關(guān)的免疫基因。
使用R語言對獲取的差異表達(dá)基因進(jìn)行功能分析包括KEGG(kyoto encylopedia of genes and genomes)和GO(gene oncology)富集分析。P值及q值定義為<0.05,FDR定義為<0.01。將分析結(jié)果以柱狀圖形式呈現(xiàn)。
我們CIBERSORT反卷積算法進(jìn)行活化記憶性CD4T細(xì)胞、漿細(xì)胞、活化NK細(xì)胞、調(diào)節(jié)性T細(xì)胞等22種免疫細(xì)胞轉(zhuǎn)錄特征的模擬計算,設(shè)定模擬次數(shù)為1 000次,采用Kruskal-Wallis檢驗對P<0.05的數(shù)據(jù)進(jìn)行分析繪制了NSCLC患者免疫浸潤微環(huán)境景觀,并計算22種免疫細(xì)胞在NSCLC樣本中的比例,將其可視化。對高低TMB組之間的免疫細(xì)胞類型進(jìn)行Pearson相關(guān)系數(shù)計算,采用秩和檢驗比較其差異。使用R軟件包limma(version 3.40.6)對合并數(shù)據(jù)集按照|log2Fc|≥1,P<0.05的標(biāo)準(zhǔn)篩選差異表達(dá)基因,并繪制熱圖以及火山圖。我們提取Immport數(shù)據(jù)庫免疫相關(guān)基因與高低TMB組差異基因,使用“ggVennDiagram”包篩選出來7個差異免疫基因,單因素COX回歸分析鑒定出1個與預(yù)后相關(guān)的基因。
數(shù)據(jù)可視化和差異分析由“l(fā)imma”R包執(zhí)行。Cox回歸分析和Kaplan-Meier分析由“Survival”R包進(jìn)行。Wilcoxon秩和檢驗是一種非參數(shù)檢驗,用于檢測兩組之間的差異。單、多因素COX回歸分析差異表達(dá)的基因進(jìn)行預(yù)后分析。通過Log Rank檢驗獲得P值,分析免疫細(xì)胞浸潤水平與其生存的關(guān)系。所有統(tǒng)計學(xué)分析均在R軟件(版本4.2.2)上進(jìn)行。以P<0.05代表差異具有統(tǒng)計學(xué)意義。
我們從TCGA下載了641例LUAD和506例LUSC患者的轉(zhuǎn)錄組和樣本突變數(shù)據(jù)。刪除缺失值的臨床信息后,合并結(jié)果如表1所示。LUAD和LUSC患者的平均年齡分別為63.45歲和66.07歲。LUAD和LUSC患者的男女比例為1∶1.19,LUSC患者的男女比例為2.83∶1。同時,我們使用Quartile方法計算患者樣本信息的TMB。我們分別對LUAD和LUSC樣本的突變基因情況進(jìn)行了可視化分析(圖1、圖2)。通過比較可以發(fā)現(xiàn),在33種常見癌癥中,LUAD和LUSC的突變負(fù)荷排名較高(圖1A、圖2A)。在LUAD和LUSC中,瀑布圖顯示了樣本中突變頻率最高的基因排名,如TP53、TTN、MUC16、CSMD3、RYR2(圖1B、圖2B)。突變比例最大的是錯義突變,單核苷酸多態(tài)性明顯高于插入或缺失。在LUAD中,最常見的單核苷酸變異類型是C>A,而在LUSC中,除上述類型外,C>T也較為常見(圖1C、圖2C)。對前15個突變基因的互斥突變和并發(fā)突變的映射顯示,并發(fā)突變的基因較多,LUAD明顯高于LUSC(圖1D、圖2D)。其次,我們觀察了這些基因的克隆狀態(tài)。在理想條件下,樣本中克隆基因的平均等位基因頻率約為50%(圖1E、圖2E)。
圖1 肺腺癌突變?nèi)皥D
注:A為惡性腫瘤突變負(fù)荷排名;B為非小細(xì)胞肺癌前15個突變基因的瀑布圖;C為突變信息概況;D為互斥或共同發(fā)生的基因突變;E為非小細(xì)胞肺癌前15個突變基因克隆狀態(tài)。
表1 樣本信息的基線特征
按照中位值將8.56作為TMB高低的劃分為TMB高低組。通過繪制高TMB組和低TMB組NSCLC患者的OS生存曲線可以看出,高TMB組患者的生存率優(yōu)于低TMB組(圖3A)。我們進(jìn)一步進(jìn)行了差異分析并繪制了基因熱圖,發(fā)現(xiàn)高TMB組和低TMB組的基因表達(dá)存在顯著差異(圖3B、圖3C)。在生物學(xué)功能方面,KEGG結(jié)果表明,這些基因在神經(jīng)活性配體-受體相互作用、細(xì)胞周期、黏附、吞噬體和細(xì)胞外基質(zhì)-受體相互作用中明顯富集。GO分析表明,它們可能與區(qū)域化、姐妹染色單體聚集、含膠原的細(xì)胞外基質(zhì)、膠原修復(fù)、運動活性、微管結(jié)合等生物過程有關(guān)(圖3D、圖3E)。
注:A為高低TMB與OS相關(guān)性;B-C為高低TMB組差異表達(dá)基因火山圖及熱圖;D為GO分析;E,KEGG通路。
將差異基因與從ImmPort下載的免疫相關(guān)基因列表進(jìn)行比較,我們分析了LUAD患者高TMB組和低TMB組免疫相關(guān)基因的差異(見圖4)。可以看出,TIGIT、PDCD1、CTLA4和LAG3在高TMB組有明顯表達(dá),有統(tǒng)計學(xué)意義(P<0.05),而CD274在兩組中無明顯差異,無統(tǒng)計學(xué)意義(P>0.05)。
注:A為CLTA-4在高低TMB組表達(dá)差異;B為TiGIT在高低TMB組表達(dá)差異;C為LAG3在高低TMB組差異;D為CD274在高低TMB組表達(dá)差異;E為PDCD1在高低TMB組表達(dá)差。
根據(jù)TMB水平將LUAD及LUSC患者分為2組,通過“CIBERSORT”R包比較高TMB和低TMB組中的22個免疫細(xì)胞。每個GC患者中22個免疫細(xì)胞的比例如圖5A,可視化圖如圖5B所示,不同的顏色代表不同的免疫細(xì)胞類型。 此外,小提琴圖(圖 5C)用于可視化免疫細(xì)胞比例。Wilcoxon's rank-sum 檢驗顯示,CD8+T細(xì)胞、激活期記憶CD4+ T細(xì)胞、M1巨噬細(xì)胞在高TMB組中浸潤高于低TMB組;記憶B細(xì)胞、靜止期記憶CD4+ T細(xì)胞、靜止期樹突狀細(xì)胞、激活期靜止期樹突狀細(xì)胞在低TMB組中浸潤低于低TMB組。將DEGs和免疫相關(guān)基因取交集進(jìn)行多因素Cox回歸分析后篩選出CRABP1、CXCL17、DMBT1、PGC、SFTPA1、SFTPA2、SFTPD 7 個基因來構(gòu)建預(yù)后模型。將得到的預(yù)后模型行 Kaplan-Meier 生存分析,其結(jié)果顯示只有CXCL17基因的生存曲線中高、低表達(dá)組患者的預(yù)后存在顯著差異。
注:A為可視化免疫細(xì)胞含量柱狀圖;B為22種類型的免疫細(xì)胞浸潤狀態(tài)分布圖;C為小提琴圖 TMB-high (紅色)和TMB-low (綠色)組免疫細(xì)胞浸潤的比較;D為維恩圖,識別差異表達(dá)的免疫相關(guān)基因;E為TMB藥治療肺腺癌及肺鱗癌等非小細(xì)胞肺癌的有效率僅有差異基因與免疫浸潤基因交集CRABP1、CXCL17、DMBT1、PGC、SFTPA1、SFTPA2、SFTPD7的高、低表達(dá)組患者的生存曲線。
免疫治療成為目前最有前景的惡性腫瘤治療手段,為驅(qū)動基因陰性的非小細(xì)胞肺癌帶來了突破性的希望。免疫治療能為一部分患者帶來長期生存,其中臨床試驗提示PD-L1高表達(dá)的晚期非小細(xì)胞肺癌5年生存率可以高達(dá)29.6%[12]。盡管如此,免疫治療單不到20%,且PD-L1不能很好預(yù)測單藥維持治療的療效[13]。TMB是最近發(fā)現(xiàn)的預(yù)測免疫治療的獨立預(yù)后標(biāo)志物,其預(yù)測能力已經(jīng)在黑色素瘤[14],肺腺癌[15]等多種腫瘤被證實。同時TMB結(jié)果可以兼顧腫瘤標(biāo)本的異質(zhì)性,但其與免疫浸潤的關(guān)系研究較少。探索分析NSCLC的腫瘤突變負(fù)荷及免疫細(xì)胞浸潤等信息與預(yù)后的相關(guān)性,為提高非小細(xì)胞肺癌的臨床治療水平提供理論基礎(chǔ)。
既往研究針對高低TMB的定義有爭議,部分研究按四分法將TMB值位于前25%定義為高TMB,將位于后25%定義為低TMB[16]。也有相當(dāng)一部分RCT研究將TMB值大于10[17]或19[18]作為截斷值。T絕對值或者百分比都可以作為TMB高低的劃分方法,但考慮其臨床推廣應(yīng)用,絕對值更加適合在臨床中廣泛使用。但TMB的絕對值在不同的樣本其閾值不一樣,因此在本研究中根據(jù)數(shù)據(jù)訓(xùn)練,得出最佳的TMB高低閾值,將患者分為TMB高低組,我們認(rèn)為這種TMB分組增加了研究的精確度和結(jié)果的意義。在LUSC及LUAD患者高TMB組中TP53、TTN、MUC16屬于前3的突變基因,其中TP53是最常見的促癌基因[19],TTN是目前最長的基因,會影響心臟和骨骼肌的發(fā)育與調(diào)節(jié),已被證實與TMB水平和在實體瘤中對 ICIs的反應(yīng)高度相關(guān)[20]。MUC16是各種癌癥中最常見的突變基因之一,與癌細(xì)胞的生長和轉(zhuǎn)移增強有關(guān),與高TMB與腫瘤的良好預(yù)后有關(guān)[21]。
Biagio Ricciuti通過回顧性研究發(fā)現(xiàn)高TMB的患者免疫浸潤增加,炎性T淋巴細(xì)胞反應(yīng)增加,同時對免疫治療更加敏感,因此預(yù)后更好[18]。但在可切除的不抽煙的NSCLC中,Louis-Jacques Ruel發(fā)現(xiàn)高TMB患者的DFS明顯短于低TMB患者,其5年生存率僅有64%,而低TMB患者的5年生存率高達(dá)87%[22]。本研究中我們發(fā)現(xiàn),高TMB的LUAD及LUSC患者生存預(yù)后優(yōu)于低TMB的人群。TMB作為免疫治療的療效預(yù)測指標(biāo)之一,目前普遍認(rèn)為TMB高的NSCLC,其免疫治療療效優(yōu)于TMB低人群。Louis研究的人群中更多的是不抽煙的NSCLC,這類人群中EGFR突變患者占比高于抽煙的患者,而EGFR、ALK、ROS基因突變的患者其TMB顯著不高[23]。而這些有突變的患者隨著靶向藥物出現(xiàn),生存明顯延長,導(dǎo)致TMB低人群預(yù)后提升,在我們的研究中,覆蓋了肺腺癌及鱗癌人群,突變?nèi)巳涸谡w人群占比不高,可以更真實反映未突變?nèi)巳篢MB高表達(dá)預(yù)后更好。高錚研究發(fā)現(xiàn)TMB表達(dá)水平與EGFR突變的NSCLC預(yù)后呈負(fù)相關(guān)[24],也進(jìn)一步證實這點。本研究通過759 個 DEGs,將得到的DEGs進(jìn)行GO和KEGG富集分析,結(jié)果顯示這些DEGs主要參與神經(jīng)活性配體-受體相互作用、細(xì)胞周期、黏附、吞噬體和細(xì)胞外基質(zhì)-受體通路。通過進(jìn)一步的單變量和多變量 Cox 分析篩選出與NSCLC患者預(yù)后相關(guān)的基因CXCL17,同時還發(fā)現(xiàn)基因的突變與免疫細(xì)胞浸潤有關(guān)。CXCL1是一個與黏膜相關(guān)的內(nèi)環(huán)境穩(wěn)定趨化因子,對血管生成有調(diào)控作用以及對樹突狀細(xì)胞和單核細(xì)胞有趨化作用:其中對血管生存的調(diào)控可以改善腫瘤微環(huán)境,而對單核細(xì)胞的趨化能調(diào)控巨噬細(xì)胞極化[25]。
免疫細(xì)胞浸潤是腫瘤微環(huán)境調(diào)控免疫治療療效的主要手段之一,在本研究中,研究者探討了TMB值與NSCLC患者免疫浸潤之間的潛在關(guān)系。通過比較發(fā)現(xiàn)22個免疫細(xì)胞中CD8+T細(xì)胞、激活期記憶CD4+ T細(xì)胞、M1巨噬細(xì)胞在高TMB組中浸潤高于低TMB組;記憶B細(xì)胞、靜止期記憶CD4+ T細(xì)胞、靜止期樹突狀細(xì)胞、激活期靜止期樹突狀細(xì)胞在高TMB組中浸潤低于低TMB組。Chen等研究同樣證實了CD8+T細(xì)胞、M1巨噬細(xì)胞都是在腫瘤免疫調(diào)控中發(fā)揮正向調(diào)控的細(xì)胞[26],其中CD8+T細(xì)胞直接對腫瘤發(fā)揮殺傷作用,而M1巨噬細(xì)胞能抑制腫瘤的增殖、轉(zhuǎn)移。
本研究還存在一定的局限性:首先,研究中所有的數(shù)據(jù)來自TCGA數(shù)據(jù)庫,沒有使用外部數(shù)據(jù)庫進(jìn)行驗證;其次,目前非小細(xì)胞肺癌驅(qū)動基因突變陽性患者接受免疫治療比例很低,研究中收集的LUAD及LUSC患者并未將EGFR、ALK、ROS等常見的突變患者剔除;再次,TMB作為一個連續(xù)變量,目前尚無TMB閾值的共識,同時TMB的檢測手段沒有標(biāo)準(zhǔn)化,因此在未來的臨床推廣應(yīng)用上存在一定局限性。
總之,本研究基于TCGA數(shù)據(jù)庫發(fā)現(xiàn)高TMB與非小細(xì)胞肺癌更好的生存預(yù)后相關(guān),其中CXCL17基因是生存預(yù)后的獨立因素,其中CD8+T細(xì)胞及M1型巨噬細(xì)胞浸潤提示非小細(xì)胞肺癌預(yù)后較好。