王圓圓 義勇軍
廣州市第一人民醫(yī)院南沙醫(yī)院(廣州 511457)
星型膠質(zhì)細(xì)胞瘤約占顱內(nèi)腫瘤的24%,是顱內(nèi)最常見的膠質(zhì)瘤[1]。臨床上大多星型膠質(zhì)細(xì)胞瘤只需要手術(shù)切除,然而快速增長的星型膠質(zhì)細(xì)胞瘤會導(dǎo)致顱內(nèi)高壓、腦水腫和腦疝等嚴(yán)重的并發(fā)癥。目前,對于星型膠質(zhì)細(xì)胞瘤的干預(yù)手段非常有限,主要是由于對于星型角質(zhì)細(xì)胞瘤的發(fā)生發(fā)展機制的認(rèn)識仍然處于探索階段。相關(guān)研究表明,星形膠質(zhì)細(xì)胞瘤與遺傳有明顯的相關(guān)性[2- 3]。然而目前,關(guān)于星型膠質(zhì)細(xì)胞瘤發(fā)生發(fā)展的分子機制仍然不明確,很難為臨床治療提供指導(dǎo)。
近年來,基因芯片技術(shù)已經(jīng)廣泛應(yīng)用于疾病機制的探究,通過對基因芯片數(shù)據(jù)進行生物信息學(xué)分析,可以預(yù)測參與疾病發(fā)生發(fā)展過程中重要的分子和通路,并結(jié)合臨床預(yù)后生存資料對其預(yù)后價值和診斷價值進行評價。因此我們通過生物信息學(xué)分析探究星型膠質(zhì)細(xì)胞瘤的預(yù)后生物標(biāo)志物,從而為星型膠質(zhì)細(xì)胞瘤提供新的治療靶點和預(yù)后生物標(biāo)志物。
本文分析的星型膠質(zhì)細(xì)胞瘤基因芯片數(shù)據(jù)集均來自于GEO(gene expression omnibus,GEO)數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/)。所有數(shù)據(jù)集中的基因芯片數(shù)據(jù)均基于GPL570[HG-U133_Plus_2]Affymetrix Human Genome U133 Plus 2.0 Array。將4個數(shù)據(jù)集中的人腦組織的樣本分為星形膠質(zhì)細(xì)胞瘤組(Astroglioma組)和正常組(Normal組),包括:162個星形膠質(zhì)細(xì)胞瘤樣本和32個正常腦組織樣本。不同數(shù)據(jù)集中樣本的分布,見表1。
表1 數(shù)據(jù)集中樣本的分布
用R語言將原始基因芯片數(shù)據(jù)按照不同的分組進行合并,通過R語言中的sva包處理來自不同數(shù)據(jù)集樣本之間的批次效應(yīng)(batch effects)。利用R語言中的limma包對原始數(shù)據(jù)進行標(biāo)準(zhǔn)化處理,并用ggplot2包可視化[4- 5]。應(yīng)用limma包對處理后的基因表達數(shù)據(jù)進行差異分析,從而得到星型膠質(zhì)細(xì)胞瘤組和正常組之間的差異表達基因(differentially expressed genes,DEGs),篩選標(biāo)準(zhǔn):|log2(Fold change)|>1,P值<0.05。并用熱圖展示差異表達基因在不同組間的表達情況,用火山圖展示差異表達基因的分布情況。
GO(Gene ontology,GO)分析可從生物過程(biological process,BP)、細(xì)胞組成 (cellular component,CC) 和分子功能(molecular function,MF)三個方面對差異表達基因進行功能富集分析[6]。我們應(yīng)用R語言中的enrichplot包對差異表達基因進行GO分析,并通過ggplot 2包可視化。KEGG(kyoto encyclopedia of genes and genomes,KEGG)分析是基于KEGG數(shù)據(jù)庫對差異表達基因進行通路富集分析[7],我們應(yīng)用KEGG數(shù)據(jù)庫對差異表達基因進行通路富集分析,并用R語言進行可視化。為了彌補對差異表達基因進行富集分析的不足,我們使用clusterProfiler包對所有基因的表達數(shù)據(jù)進行了GSEA(gene set enrichment analysis,GSEA)分析。
STRING數(shù)據(jù)庫可預(yù)測蛋白質(zhì)之間的相互調(diào)控關(guān)系[8- 9]。我們應(yīng)用STRING數(shù)據(jù)庫構(gòu)建差異表達基因之間的相互調(diào)控關(guān)系,并通過Cytoscape進行可視化。利用Cytoscape中的cytoscapehubba插件分析得到20個Hub基因。
為了評價Hub基因診斷價值和預(yù)后價值,我們下載TCGA(the cancer genome atlas,TCGA)數(shù)據(jù)庫(https://cancergenome.nih.gov/)中關(guān)于星型膠質(zhì)細(xì)胞的基因表達數(shù)據(jù)和臨床預(yù)后資料,其中包含167例不同生存時間的人樣本。使用pROC包構(gòu)建Hub基因的ROC曲線,篩選Hub基因中AUC>0.8的進行展示。利用COX回歸模型對Hub基因與患者預(yù)后進行評價,篩選HR值最有意義的基因進行總生存分析(overall survival,OS)。
用R語言合并不同數(shù)據(jù)集中的基因芯片數(shù)據(jù),并且對基因芯片數(shù)據(jù)進行預(yù)處理。PCA分析結(jié)果顯示(圖1A、B),預(yù)處理后樣本聚類更加清晰,樣本可靠。密度圖結(jié)果表明(圖1C、D),預(yù)處理后兩組基因表達擬合程度高,可用于后續(xù)的生物信息學(xué)分析。我們通過R語言中的limma包總共分析得到1 043個差異表達基因,其中:526個上調(diào)基因和517個下調(diào)基因。通過熱圖展示了差異表達基因在不同組中的表達情況,可見差異表達基因在不同分組中表達差異明顯(圖2A)。應(yīng)用火山圖展示了所有基因的分布情況,并標(biāo)注了差異表達基因和Hub基因在所有基因中的位置(圖2B)。
圖1 原始數(shù)據(jù)預(yù)處理A.預(yù)處理前PCA分析;B.預(yù)處理后的PCA分析;C. 預(yù)處理前密度圖;D.預(yù)處理后密度圖
圖2 差異表達基因的情況A.差異表達基因的熱圖;B.差異表達基因分布的火山圖
為了探索差異表達基因富集的功能區(qū)域,我們對差異表達基因進行GO分析和KEGG分析。差異表達基因GO分析結(jié)果表明(圖3A):BP結(jié)果主要集中在突觸組織的調(diào)節(jié)、突觸結(jié)構(gòu)或活性的調(diào)節(jié)、突觸小泡循環(huán)、神經(jīng)遞質(zhì)轉(zhuǎn)運、調(diào)節(jié)神經(jīng)遞質(zhì)水平、囊泡介導(dǎo)運輸?shù)恼{(diào)節(jié)、突觸信號轉(zhuǎn)導(dǎo)的調(diào)控、化學(xué)突觸傳遞的調(diào)節(jié)和突觸組織等過程;CC結(jié)果表明差異表達基因主要位于轉(zhuǎn)運囊泡膜、膠原蛋白細(xì)胞外基質(zhì)、突觸后膜、軸突部分、運輸小泡和神經(jīng)細(xì)胞體;MF主要與GABA-A受體活性、GABA受體活性、配體門控離子通道活性、門控通道活動、離子門控通道活性、離子通道活性、底物特異度通道活性和被動跨膜轉(zhuǎn)運蛋白活性等功能相關(guān)。KEGG分析結(jié)果表明差異表達基因主要富集于鈣信號通路、cAMP信號通路、細(xì)胞因子-細(xì)胞因子受體相互作用、MAPK信號通路、神經(jīng)活性配體-受體相互作用、PI3K-Akt信號通路、Rap1信號通路和Ras信號通路等通路(圖3B)。通過對所有基因進行GSEA富集分析(圖3C),結(jié)果主要富集于細(xì)胞因子-細(xì)胞因子受體相互作用、JAK-STAT信號通路、逆行內(nèi)源性大麻素信號、神經(jīng)活性配體-受體相互作用、GABA能突觸和鈣信號通路等通路。
圖3 基因富集分析結(jié)果A.差異表達基因GO分析結(jié)果;B.差異表達基因KEGG分析結(jié)果;C.所有基因GSEA分析結(jié)果
將差異表達基因?qū)隨TRING數(shù)據(jù)庫得到差異表達基因之間的PPI,用Cytoscape可視化(圖4A),通過Cytoscape中的cytoHubba插件分析得到ADCY1、NPY1R、ANXA1、PENK、ADORA3、PRK1、SSTR2、APLNR、CCR1和CXCR4等20個hub基因(圖4B)。
圖4 PPI網(wǎng)絡(luò)和Hub基因
我們通過ROC曲線總共篩選得到8個診斷價值較高的基因:SST(AUC=0.863)、ADCY1(AUC=0.828)、C3AR1(AUC=0.842)、CXCL16(AUC=0.891)、GNB5(AUC=0.88)、GNG12(AUC=0.915)、GNG3(AUC=0.863)、OPRK1(AUC=0.837)、S1PR3(AUC=0.846)和SSTR2(AUC=0.839)。通過COX回歸模型和OS分析對Hub基因與預(yù)后關(guān)系評價的結(jié)果表明:STT(HR=1.63,95%CI:1.15~2.32,P=0.005)的高表達與患者較差的預(yù)后強相關(guān)。
圖5 Hub基因的診斷價值和預(yù)后價值A(chǔ). Hub基因的ROC曲線;B. SST與患者預(yù)后的關(guān)系
星型膠質(zhì)細(xì)胞瘤是一種顱內(nèi)常見的腫瘤,主要病理特點為星形細(xì)胞的胞體較小,突起很少,膠質(zhì)纖維含量很少[10]。在星型膠質(zhì)細(xì)胞瘤的分子機制中,NF1的低表達、BRAF過表達、MAPK/Erk通路等在發(fā)揮的作用早已明確[11-13]。然而星型膠質(zhì)細(xì)胞瘤發(fā)生發(fā)展的機制是一個錯綜復(fù)雜的調(diào)控過程,因此很難對其分子機制的進行全面的闡述。隨著星型膠質(zhì)細(xì)胞瘤分子機制的探究,靶向治療星型膠質(zhì)細(xì)胞瘤帶來了新的希望,然而對于分子機制認(rèn)識始終是靶向治療難以逾越的一道鴻溝。為了探究星型膠質(zhì)細(xì)胞瘤分子機制,以便探索星型膠質(zhì)細(xì)胞瘤新的治療靶點,我們結(jié)合基因芯片數(shù)據(jù)和臨床預(yù)后生存資料進行了生物信息學(xué)分析。
我們通過GO分析表明,差異表達基因主要通過影響了神經(jīng)突觸的作用而在星型膠質(zhì)細(xì)胞瘤發(fā)生發(fā)展中發(fā)揮著重要的作用。通過KEGG分析發(fā)現(xiàn)星型膠質(zhì)細(xì)胞瘤的分子機制主要與鈣信號通路、cAMP信號通路、細(xì)胞因子-細(xì)胞因子受體相互作用、MAPK信號通路、神經(jīng)活性配體-受體相互作用、PI3K-Akt信號通路、Rap1信號通路和Ras信號通路等通路相關(guān)。GSEA分析主要富集于細(xì)胞因子-細(xì)胞因子受體相互作用、JAK-STAT信號通路、逆行內(nèi)源性大麻素信號、神經(jīng)活性配體-受體相互作用、GABA能突觸和鈣信號通路等通路。PI3K-Akt 信號通路主要通過促進星型角質(zhì)細(xì)胞瘤的增殖增強腫瘤細(xì)胞的侵襲和轉(zhuǎn)移[14],與該信號通路作用類似,Ras信號通路作為細(xì)胞增殖的啟動因子,也可促進星型角質(zhì)細(xì)胞的增殖[15]。JAK-STAT信號通路主要與星型膠質(zhì)細(xì)胞瘤中的炎癥反應(yīng)相關(guān)[16]。絲裂原活化蛋白激酶(mitogen-activated protein kinase,MAPK)是細(xì)胞信號重要傳遞者,是一組能被不同的細(xì)胞外刺激激活的絲氨酸-蘇氨酸蛋白激酶。相關(guān)研究表明[17-19],MAPK信號通路與星型膠質(zhì)細(xì)胞瘤的增殖和侵襲性相關(guān),抑制該通路可抑制腫瘤的生長。與其他腫瘤類似,細(xì)胞因子-細(xì)胞因子受體相互作用在星型膠質(zhì)細(xì)胞瘤分子機制中的作用已經(jīng)有了較為詳細(xì)的闡述[20- 21]。鈣信號通路和cAMP信號通路在星型膠質(zhì)瘤中的早已有研究報道[22- 25],然而關(guān)于其具體的分子機制有待進一步的研究。以上的研究通過生物實驗說明我們生物信息學(xué)分析的結(jié)果真實可靠,具有一定的參考價值。除此之外,我們還發(fā)現(xiàn)Rap1信號通路有可能在星型膠質(zhì)細(xì)胞瘤的分子機制中發(fā)揮著重要的作用,有可能為星形膠質(zhì)細(xì)胞瘤分子機制的研究提供新的方向,值得我們進一步的研究
我們通過構(gòu)建PPI,用Cytoscape中的cytoscapehubba分析得到20個Hub基因:ADCY1、NPY1R、ANXA1、PENK、ADORA3、PRK1、SSTR2、APLNR、CCR1和CXCR4等。我們通過對這些分子的診斷價值進行評價,發(fā)現(xiàn)SST、ADCY1、C3AR1、CXCL16、GNB5、GNG12、GNG3、OPRK1、S1PR3和SSTR2具有較高的診斷價值。相關(guān)研究表明[26- 29],S1PR1、GNG12和ANXA1在星型膠質(zhì)細(xì)胞中的表達高,但是與患者臨床預(yù)后無關(guān)。神經(jīng)營養(yǎng)因子是通過表面SIP受體1(S1PR1)介導(dǎo)的,我們分析結(jié)果表明S1PR1在星型膠質(zhì)細(xì)胞瘤中高表達,S1PR1可能通過調(diào)節(jié)神經(jīng)營養(yǎng)因子而在星型膠質(zhì)細(xì)胞發(fā)生發(fā)展過程中發(fā)揮作用[28]。CXCR4可促進星型膠質(zhì)細(xì)胞瘤的增殖和侵襲,但是其與患者的預(yù)后并未明顯相關(guān)性[27]。ADCY1不僅與星型膠質(zhì)細(xì)胞侵襲,也與患者預(yù)后相關(guān)[30]。星型膠質(zhì)細(xì)胞中C3補體表達增高,該補體激活可增加星型角質(zhì)細(xì)胞瘤與其他細(xì)胞的結(jié)合力[31- 32],從而促進星型膠質(zhì)細(xì)胞瘤的侵襲和轉(zhuǎn)移。以上基因的相關(guān)研究與我們分析的結(jié)果相似,說明我們的篩選的關(guān)鍵基因有一定參考價值。我們也通過生物信息學(xué)分析結(jié)果也表明ADORA3、SST、SSTR2、NPY1R、PENK、GNG3、NPY、C3AR1、OPRK1、APLNR、CCR1和CXCL16在星型膠質(zhì)細(xì)胞瘤發(fā)生發(fā)展過程中有重要的作用,然而關(guān)于這些分子與星型膠質(zhì)細(xì)胞瘤關(guān)系仍然不清楚,這為我們進行一步探究星型膠質(zhì)細(xì)胞瘤的機制提供了新的思路。然而關(guān)于SST、ADCY1、C3AR1、CXCL16、GNB5、GNG12、GNG3、OPRK1、S1PR3和SSTR2的診斷價值目前也未涉及,這為我們篩選星型膠質(zhì)細(xì)胞瘤的早期診斷標(biāo)志物提供了參考。
我們通過對Hub基因的診斷價值和預(yù)后價值進行評估,發(fā)現(xiàn)SST不僅具有良好的診斷價值,而且與患者預(yù)后明顯相關(guān)。SST是生長抑素家族的成員,該家族成員在多種腫瘤中發(fā)揮著重要的作用[33- 35]。目前關(guān)于該家族成員在星型膠質(zhì)細(xì)胞瘤中的研究表明[27],SST2的高表達與星型膠質(zhì)細(xì)胞瘤預(yù)后差相關(guān),而SST3和SST5的高表達提示患者預(yù)后良好。因此我們大膽推測SST的表達與星型膠質(zhì)細(xì)胞瘤的預(yù)后差相關(guān),可作為其預(yù)后生物標(biāo)志物。
綜上所述,我們通過聯(lián)合分析GEO數(shù)據(jù)庫TCGA數(shù)據(jù)庫中的基因芯片數(shù)據(jù)和臨床預(yù)后資料,發(fā)現(xiàn)SST在星形膠質(zhì)細(xì)胞瘤中既有良好的診斷價值,又與患者生存預(yù)后強相關(guān),有可能成為星型膠質(zhì)細(xì)胞瘤新的預(yù)后生物標(biāo)志物,通過通路富集分析發(fā)現(xiàn)了Rap1信號通路可能在星型膠質(zhì)細(xì)胞中發(fā)揮著重要的作用。這既為星型膠質(zhì)細(xì)胞瘤分子機制的研究提供了新的思路,又有助于開發(fā)星形膠質(zhì)細(xì)胞瘤預(yù)防和治療的新策略。