張 嬌,黃純海*,王 釗
(1.吉首大學(xué)醫(yī)學(xué)院 湖南 吉首 416000;2.吉首大學(xué)第一附屬醫(yī)院/湘西自治州人民醫(yī)院神經(jīng)外科 湖南 吉首 416000;3.吉首大學(xué)臨床轉(zhuǎn)化醫(yī)學(xué)研究中心 湖南 吉首 416000)
膠質(zhì)瘤是顱內(nèi)最常見的、最具侵襲性的原發(fā)性腫瘤,彌漫性膠質(zhì)瘤(DGs)是最常見類型,它包括II-III級星形細胞瘤和少突細胞瘤以及IV級膠質(zhì)母細胞瘤(GBM)。膠質(zhì)瘤內(nèi)部的異質(zhì)性很復(fù)雜,即使是同一組織學(xué)分級,患者的分子和臨床特征仍然存在較大差別,例如,低級別膠質(zhì)瘤(II級)IDH野生型患者中位生存期只有20.4月;而 IDH突變型合并1p/19q 共缺失與否,其中位生存期分別為96月和76.8月;GBM的預(yù)后最差,中位生存期僅為12-15月,其中 15%的患者超過72月。因此單純的組織學(xué)分類已無法滿足膠質(zhì)瘤的分型,甚至可能在臨床上產(chǎn)生錯誤的指導(dǎo)作用。將膠質(zhì)瘤分子分型納入分型標準是大勢所趨,但是,膠質(zhì)瘤高度異質(zhì)性和預(yù)后差異性背后的分子基礎(chǔ)還不完全清楚。
IDH突變是DGS中最常見、最早可檢測到的遺傳變異之一,證據(jù)支持該突變?yōu)樯窠?jīng)膠質(zhì)瘤發(fā)生的驅(qū)動力,其突變狀態(tài)也是最早被引入膠質(zhì)瘤分子病理的。雖然IDH突變具有良好的對患者預(yù)后進行分層的能力,但還不足以解釋一切腫瘤特征。與野生型相比,IDH突變型DGs具有一些獨特的特征(如其好發(fā)于低級別膠質(zhì)瘤(LGG),具有更好的預(yù)后),但是它也對現(xiàn)有一些治療方式不敏感。IDH1/2突變和其突變產(chǎn)物D2HG可能使膠質(zhì)瘤產(chǎn)生免疫抑制,從而導(dǎo)致IDH突變型免疫應(yīng)答水平明顯低于野生型膠質(zhì)瘤[1],這也是導(dǎo)致膠質(zhì)瘤對很多治療不敏感的原因之一。所以進一步挖掘IDH突變膠質(zhì)瘤的分子遺傳學(xué)特征有助于深入了解其發(fā)病機制和發(fā)現(xiàn)新治療靶點,并聯(lián)合其它分子特征改善對患者的分層,從而指導(dǎo)治療。本研究擬開發(fā)一種反應(yīng)患者免疫浸潤相關(guān)的預(yù)后預(yù)測標簽,以便從腫瘤免疫微環(huán)境的角度闡明DGs內(nèi)部的分子異質(zhì)性。
利用R 的TCGAbiolinks包從GDC下載和處理TCGA膠質(zhì)瘤基因測序原始數(shù)據(jù),包括拷貝數(shù)變異數(shù)據(jù),突變數(shù)據(jù)及對應(yīng)的臨床信息。原始數(shù)據(jù)用DESeq2包進行數(shù)據(jù)標準化,用preprocessCore包消除系統(tǒng)偏移。從數(shù)據(jù)庫(http://cgga.org.cn)獲取CGGA數(shù)據(jù)。從GEO數(shù)據(jù)庫獲得GSE16011數(shù)據(jù)集(https://www.ncbi.nlm.nih.gov/geo)。TCGA數(shù)據(jù)集作為訓(xùn)練集,CGGA325數(shù)據(jù)集作為交叉驗證集,CGGA301和GSE16011數(shù)據(jù)集作為外部驗證集。所有數(shù)據(jù)集中的非DGs樣本不納入本研究;當(dāng)多個探針對應(yīng)同一基因名時取平均值。從nCounter? PanCancer Immune Profiling Panel (Human)(https://www.nanostring.com/)獲取了770個免疫相關(guān)癌基因。選取已經(jīng)證實的膠質(zhì)瘤突變基因,數(shù)據(jù)來源于 mutational cancer drivers database
首先,用單因素COX風(fēng)險回歸分析從這770個免疫相關(guān)基因中篩選生存相關(guān)變量,P<0.001的基因作為候選分子標簽進入(LASSO)回歸分析。用glmnet包進行LASSO回歸分析,對候選基因進行懲罰回歸,以排除相對不重要的獨立變量減少過度擬合。通過cv.glmnet函數(shù)交叉驗證篩選最優(yōu)的λ值,構(gòu)建預(yù)測模型。采用基于COX回歸線性協(xié)變量加權(quán)法和靶基因加權(quán)值計算風(fēng)險評分,每個患者均獲得免疫風(fēng)險評分(IMRS), 公式如下:
N表示預(yù)后基因的數(shù)目,expi表示基因的表達量,βi表示基因在單因素COX風(fēng)險回歸分析中的系數(shù)。得出評分后用surv_cutpoint函數(shù)計算最佳閾值將患者分成高、低風(fēng)險組。用年齡、性別、等級等臨床特征作為協(xié)變量,對聯(lián)合風(fēng)險評分用survivalanalysis包的analyse_multivariate函數(shù)進行多變量COX回歸分析,判斷其對膠質(zhì)瘤患者獨立預(yù)后作用。用survivalROC包行時間依賴性受試者工作特征(ROC)分析,比較聯(lián)合風(fēng)險評分對DGs患者1-10年的預(yù)后預(yù)測能力。隨后,將這個公式應(yīng)用于另外兩個外部驗證集來驗證IMRS的穩(wěn)定性和可靠性。采用survival 包進行風(fēng)險評分和臨床特征(P值<0.05)構(gòu)建多變量COX比例風(fēng)險回歸模型,然后用regplot包繪制諾莫圖,DynNom和rsconnect包生成動態(tài)列線圖。
建立風(fēng)險分子簽名預(yù)測模型后,我們進一步用TCGA 膠質(zhì)瘤測序表達數(shù)據(jù),針對該風(fēng)險模型包含的臨床特征、基因突變、基因拷貝數(shù)變異等的變化進行分析,以期更好的發(fā)現(xiàn)和解釋其影響患者預(yù)后的機制。按TCGAbiolinks的用戶指南進行基因突變和基因拷貝數(shù)變異的數(shù)據(jù)整理和分析,然后與患者的風(fēng)險評分進行匹配。ComplexHeatmap包用于熱圖的繪制。用PROGENy包從基因表達譜推斷每個樣本中的11個信號通路的通路活性評分,攝動反應(yīng)基因信號途徑反應(yīng)了癌癥基因表達中的信號足跡[2]。GSEA在GSEA4.0.3 (http://www.broadinstitute.org/gsea/index.jsp)中進行。基于分子簽名數(shù)據(jù)庫搜索了v7.1 H(hallmark gene sets),以確定與高危人群生存不良相關(guān)的具有代表性的明確定義的生物學(xué)過程或狀態(tài),|NES|> 2 和FDR< 0.001被認為有統(tǒng)計學(xué)意義。通過CIBERSORT算法(https://cibersort.stanford.edu/)推導(dǎo)出22個浸潤免疫細胞的絕對比例。
所有的統(tǒng)計分析均使用R進行(版本3.6.2, http://www.r-project.org)。使用survminer包的surv_cutpoint函數(shù)選取基因表達量或評分的最佳閾值對患者進行風(fēng)險分組。采用Kaplan-Meier評估法評估各組低風(fēng)險組和高風(fēng)險組之間的生存差異,并采用log-rank檢驗進行比較。除特別說明,所有統(tǒng)計檢驗均為雙面檢驗,P值<0.05,被視為有統(tǒng)計學(xué)意義。用ggstatsplot包進行IMRS 與檢查點基因的表達值等的相關(guān)性分析和作圖,用ggpubr和ggplot2包進行多組間的比較和作圖,使用Mann-Whitney U 或Kruskal-Wallis 檢驗來評估箱線圖的統(tǒng)計學(xué)意義。
共調(diào)查了770個免疫相關(guān)基因,其中運用單變量COX回歸分析進行篩選初步確定了52個基因為與IDH突變生存相關(guān)的候選標簽基因。為了減少初次篩查后過度擬合的風(fēng)險,進一步運用LASSO 回歸分析。經(jīng)過1 000次迭代后,最終有6個基因(包括TRAF3,ATG10,BID,TAB1(也叫MAP3K7IP1),MAP3K1,RPS6)被納入模型。對這6個基因進行線性加權(quán)來構(gòu)建了IMRS公式(見圖1a)。ROC分析對患者1至10年的存活預(yù)測,顯示該模型對不同時間均有較強的預(yù)測能力(AUC=0.673~0.853)(見圖1b)。用臨床特征作為協(xié)變量,對風(fēng)險評分進行COX多因素分析,發(fā)現(xiàn)聯(lián)合評分仍具有強烈的獨立預(yù)后預(yù)測能力(HR=9.59,P<0.000 1)(見圖1c)。Kaplan-Meier分析顯示,在訓(xùn)練集中,高危組患者的總生存期(OS)顯著低于低危組(見圖1d),同時在交叉驗證集中證實了這一差異。進一步分析發(fā)現(xiàn),風(fēng)險評分與患者的OS線性相關(guān),如按上下四分位法將患者分成高,中,低三個風(fēng)險組,結(jié)果發(fā)現(xiàn)組間OS亦存在顯著差異(見圖1e)。
圖1 免疫風(fēng)險評分模型(IMRS)的開發(fā)和驗證Fig.1 Development and validation of IMRS model
在另外兩個獨立的外部驗證數(shù)據(jù)集中評估IMRS的普適性能力。結(jié)果顯示,在驗證數(shù)據(jù)集中,低風(fēng)險組患者的OS均明顯延長(見圖2a,2b)。根據(jù)1p19q 雜合性丟失狀態(tài)(LOH),IDH突變膠質(zhì)瘤通常又可以分為兩種亞型:即IDH突變合并1p19q 共缺失或IDH突變合并1p19q無缺失亞型[3],每一種分型都有各自的基因組特點。IMRS按表達高低可以將不同亞型進一步進行預(yù)后預(yù)測分層(見圖2c,2d),結(jié)果表明該風(fēng)險評分的預(yù)測不依賴于膠質(zhì)瘤的上述變量,具有相對的獨立性,同時也表明該預(yù)后簽名具有良好的預(yù)后表現(xiàn)。還分析了IMRS是否對治療反應(yīng)具有預(yù)測作用,因TCGA數(shù)據(jù)中只有8例有替莫唑胺(TMZ)或放療且均屬高風(fēng)險組,故我們利用CGGA325數(shù)據(jù)(81例)進行分析。結(jié)果發(fā)現(xiàn)在TMZ治療組中,獲得更長存活時間的患者具有更低的IMRS評分(見圖2e,2f),所以該評分可以預(yù)測患者對治療的反應(yīng)性。同時在CGGA301中證實了這一結(jié)果(見圖2g,2h)。
圖2 驗證集IDH突變狀態(tài)下的生存分析Fig.2 Survival analysis of validation sets under IDH mutation state
按TMIT分類發(fā)現(xiàn)IDH突變型只有一例屬于Ⅰ型,即所謂“熱腫瘤”,其它均屬“冷腫瘤”(見圖3a)。但是它們內(nèi)部免疫狀態(tài)仍然存在很大差別,用CIBERSORT(http://cibersort.stanford.edu/)分析腫瘤免疫細胞浸潤情況,結(jié)果顯示巨噬細胞M2占據(jù)了所有樣本的最大浸潤比例(見圖3b)。為了比較腫瘤內(nèi)的抗癌和促癌免疫浸潤狀態(tài), 定義了兩個總體評分:(1)腫瘤相關(guān)巨噬細胞浸潤評分(TAM),包括單核細胞、巨噬細胞M1、巨噬細胞M2等免疫細胞;(2)腫瘤相關(guān)T細胞浸潤評分(TIS),由四個T細胞評分得到(CD8T細胞、幼稚型CD4T細胞、沉默記憶CD4+T細胞、和濾泡幫助T細胞)。刪除了信號活性小于50%的細胞類型(記憶活性的CD4T細胞,調(diào)節(jié)性T細胞,伽馬delta-T 細胞,巨噬細胞M0)后,計算兩個評分與IMRS的相關(guān)性,發(fā)現(xiàn)TIS與IMRS呈明顯的負相關(guān);而TAM與IMRS呈現(xiàn)與TIS相反的趨勢。表明IDH突變型膠質(zhì)瘤內(nèi)巨噬細胞M的高度浸潤總體效應(yīng)是發(fā)揮促癌作用的(見圖3c,3d)。風(fēng)險分組間的卡方檢驗也印證了此結(jié)果(見圖3e,3f)。以上結(jié)果說明高IMRS富集了促腫瘤免疫浸潤,而低IMRS則富集了相對較多的抗腫瘤免疫浸潤。各類型免疫細胞浸潤與IMRS密切相關(guān),主要有記憶B細胞 (r=0.36,p=2.53×10-14),幼稚型CD4T細胞 (r=0.38,p=5.51×10-16),巨噬細胞M2 (r=-0.33,p=1.88×10-12),在TIS浸潤中幼稚型CD4T細胞作出了主要貢獻,而在TAM浸潤中巨噬細胞M2作出了主要貢獻(見圖3g)。利用TCGA數(shù)據(jù)我們開發(fā)了一個諾莫圖(見圖3h),同時制作了在線(https://huangchunhai.shinyapps.io/DynNomapp/)預(yù)測App。校準曲線顯示,預(yù)測的2年、5年、10年生存率與實際觀察比值密切相關(guān)(見圖3i)。
圖3 免疫細胞浸潤景觀和臨床諾莫圖的建立Fig.3 Establishment of landscape of immune cell infiltration and clinical nomograms
DGS是一種具有不同惡性程度和異質(zhì)性的疾病,IDH突變是常見的一種類型,IDH表型與基因組穩(wěn)定性有關(guān)。IDH突變與膠質(zhì)瘤的免疫微環(huán)境顯著相關(guān),然而,IDH突變與膠質(zhì)瘤的免疫浸潤狀態(tài)之間的關(guān)系尚不完全清楚,因此,了解IDH突變與免疫微環(huán)境的關(guān)系對預(yù)測彌漫性膠質(zhì)瘤的預(yù)后有重要意義。在本文中,利用R語言算法通過對TCGA、CGGA和GEO數(shù)據(jù)庫的數(shù)據(jù)進行研究,發(fā)現(xiàn)了一些可以反應(yīng)IDH突變型膠質(zhì)瘤內(nèi)不同免疫狀態(tài)的免疫基因標簽,并證明免疫浸潤程度與患者預(yù)后密切相關(guān)。
在本研究中對IDH突變在DGs免疫浸潤狀態(tài)中的作用進行了全面研究。首先用TCGA數(shù)據(jù)庫中的膠質(zhì)瘤基因測序數(shù)據(jù)結(jié)合癌癥免疫相關(guān)基因通過LASSO回歸分析篩選出6個差異表達的基因,并建立了免疫風(fēng)險評分IMRS模型。利用分子特征和臨床特征的互補價值,并將它們整合到一個新的諾莫圖中,研究發(fā)現(xiàn)聯(lián)合評分比單一的生物標志物具有更強烈的預(yù)后預(yù)測能力。同樣在CGGA和GEO的驗證數(shù)據(jù)集中也能反映相同的結(jié)論。IMRS模型由6個基因組成,分別是TRAF3、ATG10、BID、TAB1、MAP3K1、RPS6。TRAF3作為TRAF家族的重要成員,在哺乳動物的抗病毒免疫過程中發(fā)揮著重要的作用[5],是參與RIP2誘導(dǎo)的神經(jīng)膠質(zhì)瘤細胞生長的負調(diào)節(jié)劑,有研究證實TRAF3在膠質(zhì)瘤中表達下調(diào)。ATG10是一種與自噬相關(guān)的特殊蛋白相關(guān)基因,通過編碼自噬酶E2,并與自噬相關(guān)基因7(ATG7)相互作用,招募泛素樣分子ATG12,與ATG12-ATG5產(chǎn)生共軛反應(yīng),在癌癥的增值和侵襲中發(fā)揮作用[6-7]。BID是一個只含有BH3結(jié)構(gòu)域的促凋亡bcl-2家族成員,即可以參與凋亡的外部信號轉(zhuǎn)導(dǎo),又可以介導(dǎo)DNA損傷反應(yīng)來調(diào)節(jié)細胞死亡程序[6-7]。當(dāng)細胞暴露于含凋亡因子的環(huán)境時,形成tBID , tBID在線粒體中積累,使細胞色素C釋放到細胞質(zhì)中發(fā)揮調(diào)節(jié)細胞凋亡的作用,或tBID從細胞質(zhì)轉(zhuǎn)運到線粒體外膜激活Bix和Bak,導(dǎo)致線粒體外膜通透化(MOMP),從而激活caspase-3導(dǎo)致細胞凋亡[9]。近來研究表明,在膠質(zhì)瘤細胞中小分子Mcl-1抑制劑可誘導(dǎo)細胞凋亡,為膠質(zhì)瘤的治療提供了一種新的治療策略。TAB1是一種與轉(zhuǎn)化生長因子β活化激酶1(TAK1)相互作用的特異蛋白,在應(yīng)激條件下通過增加TAK1的激活調(diào)節(jié)TAK1介導(dǎo)的體外細胞因子釋放,導(dǎo)致下游信號誘導(dǎo)TAB1的糖基化[11]。研究表明,NF-кB信號通路的激活可以自主的提高HIF-1α的活性并增強糖酵解代謝,TAB1可能通過NF-кB/HIF-1α參與巨噬細胞糖酵解和活化,是DNA發(fā)生和進化的主要環(huán)節(jié),HIF-1α被認為是DNA治療的一個新的靶點。MAP3K1[12]是MAPK家族的一個成員,具有調(diào)節(jié)細胞凋亡、生存、遷移、分化等多重作用,可以被多種刺激激活,幾乎在所有細胞中參與重要調(diào)節(jié)功能,意味著其可能是控制癌癥的靶點。近期的大量基因組學(xué)研究表明,不同類型癌癥中均發(fā)現(xiàn)MAP3K1基因拷貝數(shù)異常、染色體突變、基因無效突變。認識MAP3K1基因及其蛋白功能在不同類型癌癥中的改變,為研究腫瘤細胞藥物治療靶點提供指導(dǎo)意義。RPS6在細胞增殖和DNA修復(fù)中發(fā)揮重要作用,最近的一項研究報道[13]在高級別膠質(zhì)瘤中RPS6顯著上調(diào)。RPS6下調(diào)顯著抑制了膠質(zhì)瘤干細胞(GSCs)的特征,RPS6上調(diào)與GBM細胞中干細胞特征的誘導(dǎo)和維持有關(guān),RPS6敲除可以抑制GBM細胞的球形成電位和GSC標記物的表達,這些發(fā)現(xiàn)是靶向治療核糖體蛋白下調(diào)膠質(zhì)母細胞瘤干細胞特性的突破。這些基因有望作為新的分子靶點,為免疫浸潤在膠質(zhì)瘤研究中提供了新的方向。研究中,觀察到在高免疫評分危險組的6個基因過表達,患者的總生存期較差,提示TRAF3、ATG10、BID、TAB1、MAP3K1、RPS6的高表達與IDH突變DGS患者預(yù)后較差有關(guān)。
為了更好地了解這些IDH突變相關(guān)免疫預(yù)后基因的生物學(xué)功能,依據(jù)1p19q LOH狀態(tài)將IDH突變膠質(zhì)瘤分為IDH突變合并1p19q 缺失和未缺失兩種不同免疫狀態(tài)的亞組,進行了進一步的生物信息學(xué)分析。發(fā)現(xiàn)1p/19q未缺失組主要富集于免疫評分的高風(fēng)險組,提示1p/19q未缺失可能包含致癌基因。
在腫瘤細胞微環(huán)境中,T細胞的激活與抑制通常處于異常狀態(tài),其正常化被廣泛視為治療腫瘤的重要手段。在對CGGA325數(shù)據(jù)中的81例TMZ治療組分析發(fā)現(xiàn):IMRS評分較低的患者具有更長的存活時間,說明IMRS評分在一定程度上可以反映對化療的敏感性,同時也表明該預(yù)后簽名具有可靠的預(yù)測能力。免疫細胞浸潤分析發(fā)現(xiàn)高IMRS富集了以巨噬細胞M2為主的促腫瘤免疫浸潤細胞,而低IMRS卻富集了以幼稚型CD4+T細胞為主的抗腫瘤免疫浸潤細胞。最后開發(fā)一組反應(yīng)患者免疫浸潤相關(guān)的預(yù)后預(yù)測標簽,以便從腫瘤免疫微環(huán)境的角度闡明IDH突變膠質(zhì)瘤腫瘤內(nèi)部的分子異質(zhì)性。基因免疫標簽可以反應(yīng)IDH突變型膠質(zhì)瘤內(nèi)不同免疫浸潤狀態(tài),并表明浸潤程度影響著患者的預(yù)后,此外,該簽名將可能是識別受益于免疫療法的患者的有用預(yù)測工具。
通過分析TCGA、CGGA和GEO隊列中DGs的基因突變信息、基因表達譜和免疫浸潤情況,構(gòu)建IMRS公式,將患者分為高危組和低危組;建立免疫微環(huán)境相關(guān)基因的IDH突變DGs預(yù)后模型,證明該模型可作為IDH突變DGs患者獨立的預(yù)后因素,低風(fēng)險組患者的OS較高風(fēng)險組均明顯延長。簽名相關(guān)免疫細胞浸潤分析顯示高IMRS富集了促腫瘤免疫浸潤,而低IMRS則富集了相對較多的抗腫瘤免疫浸潤。將免疫評分與臨床因素結(jié)合構(gòu)建諾莫圖和在線預(yù)測App,可以定量預(yù)測DGs患者的OS,有利于臨床醫(yī)生(在IDH突變的彌漫性膠質(zhì)瘤的診治中)做出臨床決策。