趙一明, 許海洋
(吉林大學第一醫(yī)院神經外科,吉林 長春 130021)
神經膠質瘤是最常見的惡性原發(fā)性顱內腫瘤,約占原發(fā)性惡性腦腫瘤的80%[1]。根據世界衛(wèi)生組織 (World Health Organization,WHO) 分類,神 經 膠 質 瘤 分 為4 個 等 級, 為WHO 1~4[2]。WHO 1 和WHO 2 定義為低級別膠質瘤(low-grade glioma,LGG),與預后不良相關的WHO 3 和WHO 4 定義為高級別膠質瘤(high-grade glioma,HGG)。 多形性膠質母細胞瘤(glioblastoma multiforme,GBM) 為WHO 4,通常被認為是所有腦腫瘤中最具侵襲性的類型[3]。2000—2014 年的 報 道[4-5]顯 示:GBM 患 者 的1 年 和5 年 相 對 生 存率分別為41.4%和5.4%。LGG 患者預后明顯好于GBM 患者;然而,多數LGG 患者最終發(fā)展為HGG。術后,放療和替莫唑胺給藥是GBM 患者的主要治療方法[6]。但GBM 患者預后仍然較差,中位生存期約為初始診斷后15 個月[7]。因此,尋找GBM 新的生物標志物和治療靶點非常重要。
分子生物學的發(fā)展促進了GBM 的潛在機制的研究。多種分子機制和信號轉導途徑已被證實在GBM 癌變過程中發(fā)揮關鍵作用,對其進行深入分析對于改善GBM 患者預后具有重要意義[8-9]。近年來,隨著微陣列技術和生物信息學的發(fā)展及對GBM 高通量微陣列和基因芯片數據的深入研究,越來越多的GBM 相關差異表達基因(differentially expressed genes,DEGs)被發(fā)現[10-13]。這些基因的發(fā)現有望為闡明GBM 發(fā)病的分子機制和治療靶點提供新的理論指導。
本研究采用生物信息學方法對已公開發(fā)表自癌癥 基 因 組 圖 譜 (The Cancer Genome Atlas,TCGA) 數 據 庫 和 基 因 表 達 綜 合 (Gene Expression Omnibus,GEO)數據庫中的多形性膠質母細胞瘤的基因表達數據集TCGA-GBM 及GSE7696 進行聯合分析,篩選出具有高可信度的DEGs 和重要的相關信號通路,構建了DEGs 的蛋白-蛋白互作(protein-protein interation,PPI) 網絡,并篩選出關鍵基因作為分子靶標,為更好地診斷和治療多形性膠質母細胞瘤提供依據。
1.1 資料來源從TCGA 數據庫中下載GBM 患者的臨床資料和mRNA 測序數據,其中包括5 例正常對照組組織,157 例GBM 組織。在GEO 數據庫(https://www.ncbi.nlm.nih.gov/geo/) 中,以“glioblastoma”為關鍵詞進行檢索,納入標準:①樣品來自人GBM 組織標本;②研究對象包含GBM 患者和正常對照;③研究類型為Expression profiling by array。從GEO 數據庫中篩選下載數據集GSE7696,GSE7696 數據集基于GPL570 平臺。GSE7696 數據集包括80 例GBM 癌組織和4 例正常腦組織。
1.2 DEGs 篩選對于TCGA-GBM 數據,采用R 語言的Deseq2 數據包篩選正常組與GBM 組患者的DEGs,篩選條件為:倍數變換(fold change,FC) 對 數 的 絕 對 值|Log2FC|≥2,AdjustedP≤0.05。GSE7696 芯片數據采用R 語言的limma 數據包篩選GBM 與正常腦組織之間的DEGs,按照|Log10FC|≥2 且AdjustedP<0.05的標準進行篩選。
1.3 基因本體(Gene Ontology,GO)功能富集分析和京都基因與基因組百科全書(Kyoto encyclopedia of genes and genomes,KEGG)信號通路富集分析采用在線分析工具gProfiler(https://biit.cs.ut.ee/gprofiler/gost)對DEGs 進行GO 功能富集分析和KEGG 信號通路富集分析,以P<0.05 為差異有統(tǒng)計學意義。分析結果采用R 語言的tinyarray 和ggplot2 數據包進行可視化。
1.4 PPI 網絡的構建和關鍵基因的篩選
STRING 在 線 數 據 庫(https://string-db.org/)可用于檢索分子間相互作用和預測PPI 網絡關系。采用STRING 數據庫對上述77 個共同下調基因進行分析,構建PPI 網絡并采用Cytoscape 3.9.1 軟件進行可視化,采用Cytohubba 插件,基于4 種拓撲算法:最大聚集中心(maximal clique centrality, MCC)、 最 大 鄰 域 組 件(maximum neighborhood component,MNC)、度(Degree)和邊緣滲透組件(edge percolated component,EPC)分別篩選出PPI 網絡中前5 個重要節(jié)點,將上述4 種算法所獲得的結果作為關鍵基因,即hub 基因。
1.5 PPI 網絡中hub 基因的驗證從數據庫中收集 GBM 相關靶基因的信息。 DisGeNET(https://www.disgenet.org/home/) 是一個綜合疾病、基因和實驗研究的綜合性多功能數據平臺[14]。GeneCards(https://www.genecards.org/)是一個包括基因組學、蛋白質組學和轉錄組學在內的功能綜合數據庫[15]。因此,本研究在上述2 個數據庫中以“glioma”和“glioblastoma”為關鍵詞進行檢索,篩選與GBM 相關的靶點,并與上述PPI 網絡中的關鍵基因相交,從而對hub 基因進行驗證。
2.1 DEGs 的篩選結果對 TCGA-GBM 和GSE7696 數據集中的DEGs 取交集,最終篩選出90 個DEGs,包括13 個共同上調差異表達基因(upregulated differentially expressed genes,UDEGs) 和77 個共同下調差異表達基因(downregulated differentially expressed genes,DDEGs)。不同數據集的DEGs 篩選結果的火山圖和Venn 圖見圖1 和圖2 及 表1 和表2。
表1 TCGA-GBM 和GSE7696 數據集中UDEGsTab.1 UDEGs in TCGA-GBM and GSE7696 Datasets
表2 TCGA-GBM 和GSE7696 數據集中DDEGsTab.2 DDEGs in TCGA-GBM and GSE7696 Datasets
圖1 GBM 的DEGsFig.1 DEGs of GBM
圖2 TCGA-GBM 和GSE7696 數據集中共同DEGs 的Venn 圖Fig.2 Venn diagram of common DEGs in TCGA-GBM and GSE7696 Datasets
2.2 DEGs 的GO 功能富集分析和KEGG 信號通路富集分析GO 功能富集分析結果顯示:DDEGs在細胞學過程(biological processes,BP) 方面主要是參與順行突觸傳遞信號和化學突觸傳遞等生物過程(圖3A)。在細胞成分(cell component,CC)方面,主要分布于突觸和GABA-A 受體復合物等組織(圖3B)。在分子功能(molecular function,MF)方面,DDEGs 主要有氯離子通道活性和γ-氨基丁酸(gamma-aminobutyric acid,GABA) 門控氯離子通道活性等分子功能(圖3C)。DDEGs 的KEGG 信號通路富集分析結果顯示:DDEGs 在GABA 能突觸、神經活性配體-受體相互作用等通路中富集表達(圖3D)。UDEGs 的GO 功能富集分析結果顯示:UDEGs 主要在細胞核分裂等生物過程中發(fā)揮重要作用(圖4)。
圖3 DDEGs 的GO 功能富集分析和KEGG 信號通路富集分析Fig.3 GO functional enrichment analysis and KEGG signaling pathway enrichment analysis on DDEGs
圖4 UDEGs 的GO 功能富集分析Fig.4 GO functional enrichment analysis on UDEGs
2.3 PPI 網絡構建和hub 基因篩選PPI 網絡共涉及節(jié)點73 個,邊數48 個,平均節(jié)點度為1.32,PPI 富 集P值 小 于1.0E-16。 將PPI 網 絡 導 入Cytoscape 3.9.1 軟件進行可視化(圖5),并采用MCODE 插件篩選PPI 網絡中的關鍵功能模塊,包括2 個關鍵功能模塊(共12 個基因)(圖6)。通過CytoHubba 插 件,根 據MCC、MNC、Degree 和EPC 這4 種拓撲算法對模塊1(圖6A)篩選出關鍵基因為溶質載體家族17 成員6 (solute carrier family 17 member,6SLC17A6)、溶質載體家族1成員2(solute carrier family 1 member 2,SLC1A2)、前速激肽前體1(tachykinin precursor 1,TAC1)、突觸結合蛋白1(synaptotagmin 1,SYT1)、RNA結合蛋白fox1 同源物3 (RNA binding fox-1 homolog 3,RBFOX3) 和γ-氨基丁酸A 型受體亞基γ2 (gamma-aminobutyric acid type A receptor subunit gamma 2,GABRG2)(表3)。
表3 基于Cytohubba 插件篩選DDEGs 的hub 基因Tab.3 Hub genes of DDEGs screened based on Cytohubba plugin
圖5 GBM 的編碼蛋白的PPI 網絡圖Fig.5 PPI network diagram of DDEGs of GBM
圖6 MCODE 分析DDEGs 關鍵子模塊Fig.6 Key submodules of DDEGs analyzed by MCODE
2.4 PPI 網絡中hub 基因的驗證DisGeNET 和GeneCards 數據庫整合檢索結果,獲得GBM 相關疾病蛋白靶點。將PPI 網絡分析獲得的6 個關鍵基因定位至GBM 相關疾病靶基因,共獲得5 個交集靶 點(SLC1A2、 TAC1、 SYT1、 RBFOX3 和GABRG2), 進 一 步 驗 證 了SLC1A2、 TAC1、SYT1、RBFOX3 和GABRG2 蛋 白 與GBM 的 潛 在關聯性。靶點相關信息見表4。
表4 靶點相關信息Tab.4 Related informations of targets
GBM 是神經外科最難治的惡性腫瘤之一,其復發(fā)率高和預后差會給患者、家庭和社會均帶來沉重負擔[16]。目前,GBM 的傳統(tǒng)治療主要依靠手術最大限度切除,輔以放療和化療。然而,患者生存率仍然較低,5 年生存率不足5%,中位生存時間僅為15 個月[6]。因此,迫切需要尋找新的生物標志物并制定更為有效的治療策略來改善GBM 患者的預后。
本研究從TCGA-GBM 和GSE7696 數據集中共篩選出90 個DEGs,并對這些基因進行生物信息學分析,探討其在GBM 發(fā)展中的功能和信號通路。通過構建PPI 網絡,并采用Cytoscape 3.9.1 軟件分析及DisGeNET 和GeneCards 數據庫驗證,本研究最終確定了與GBM 密切相關的6 個關鍵基因,分別為GABRG2、TAC1、RBFOX3、SLC17A6、SLC1A2 和SYT1。這些關鍵基因可能在GBM 發(fā)展過程中起重要作用。
本研究的GO 功能富集和KEGG 信號通路富集分析結果顯示:在GBM 中,氯離子通道活性、GABA-A 受體活性和GABA 能突觸活性下調。GABA 作為成年哺乳動物大腦的主要抑制性神經遞質,通過激活GABA 受體在中樞神經系統(tǒng)中產生 抑 制 性 效 應[17]。GABA 受 體 由 GABA-A 和GABA-B 受 體 組 成。在GBM 中,GABA-A 受 體 的功能性表達與腫瘤的低惡性程度有關,并且其活性抑制了神經膠質瘤細胞的增殖[18]。此外,細胞中氯 離 子 通 道1 (chloride intracellular channel 1,CLIC1) 的活性在GBM 細胞增殖中起調控作用[19]。BLANCHART 等[18]研究顯示:GBM 細胞中GABA-A 受體能夠激活氯離子通道,從而調控氯離子流動,減弱腫瘤的生長并延長生存時間。上述研究結果與本研究結果一致,進一步證實了GABA-A 受體在GBM 發(fā)生發(fā)展中的重要作用。此外,PPI 網絡分析結果顯示:GABRG2 可能是影響GBM 進展的關鍵基因。GABRG2 作為GABA-A 受體的亞基,編碼的蛋白是GABA 突觸通道的主要成 分[20]。研 究[21]顯 示:GABA-A 受 體 亞 基 基 因(GABRA1、GABRB3、GABRG2 和GABRD) 與遺傳性癲癇綜合征相關。另外,有研究[22]顯示:GABRG2 在膠質瘤組織中表達降低,但其影響膠質瘤進展的潛在分子機制尚未明確。
本研究采用PPI 網絡分析確定了與GBM 密切相關的其他5 個關鍵基因,包括SYT1、TAC1、RBFOX3、SLC17A6 和SLC1A2。SYT1 是中樞神經系統(tǒng)中神經遞質釋放的重要介質。SYT1 通過高度保守的細胞質C2A 和C2B 結構域與鈣結合,觸發(fā)突觸囊泡融合,隨后上述結構域中的一系列疏水殘基穿透質膜雙層,影響神經傳遞和突觸可塑性[23]。遺 傳 學 研 究[24]顯 示SYT1 可 能 是GBM 的候選致癌基因。TAC1 編碼多種產物,包括P 物質(substance P,SP)、神經激肽A、神經肽K 和神經肽γ。TAC1 的高甲基化在包括頭頸癌在內的多種癌細胞中常被檢測到,導致TAC1 基因的表達和功能受到抑制[25-26]。本研究結果顯示:TAC1 在GBM 中表達下調,為進一步探討TAC1 在GBM 中的表觀遺傳修飾狀態(tài)提供了思路。RBFOX3 編碼的蛋白是fox1 剪接因子家族的新成員,其在有絲分裂 后 的 神 經 元 中 被 檢 測 到[27]。研 究[28]顯 示:RBFOX3 通過激活hTERT 間接調節(jié)肝細胞癌的發(fā)生發(fā)展,并被認為可能是潛在的新治療靶點。然而,RBFOX3 在GBM 中的功能目前尚不清楚。
SLC17A6 編碼囊泡谷氨酸轉運蛋白2(vesicular glutamate transporter, VGLUT),SLC1A2 編碼谷氨酸轉運體(glutamate transporter-1,GLT-1),其對谷氨酸的攝取和清除至關重要。SLC17A6 和SLC1A2 的谷氨酸功能障礙會增加細胞外谷氨酸,已被證明會導致中樞神經系統(tǒng)中毒[29-30]。谷氨酸是神經系統(tǒng)中主要的興奮性神經遞質,在腦腫瘤細胞增殖、生長和運動中起重要作用。神經膠質瘤細胞已被證明可通過谷氨酰胺酶產生大量谷氨酸,過量谷氨酸能信號可能會導致LGG 進 展 和GBM 侵 襲[31]。因 此,本 研 究 為 進 一步探討谷氨酸能突觸活性在GBM 進展中的潛在機制提供候選基因。 然而, 尚未有研究探討SLC17A6 與膠質瘤之間的關聯。
本研究對GBM 的下調差異表達基因進行了分析,證實了GABA 在GBM 發(fā)生發(fā)展中的作用。此外,本文作者還發(fā)現GABRG2、TAC1、RBFOX3、SLC17A6、SLC1A2 和SYT1 這6 個關鍵基因,為GBM 的治療提供潛在的靶點。本研究為GBM 發(fā)生發(fā)展的分子機制研究提供了初步依據。但本研究尚有局限性,仍需要結合細胞實驗和臨床樣本進一步驗證上述關鍵基因在體內外的功能和調控機制。