張震,魏媛,王雪薇,郭紫嬋,趙蓉,王秀麗,王曉霞
山西醫(yī)科大學(xué)生物化學(xué)與分子生物學(xué)教研室,山西晉中030600
食管癌(esophageal cancer)分為食管鱗癌(esophageal squamous cell carcinoma)和食管腺癌(esophageal adenocarcinoma)[1],其中90%為食管鱗癌,因其高發(fā)病率和高致死率,嚴重威脅人類的生命健康。目前,用于早期篩查的特異性生物標記物、臨床治療的特異靶點以及評價預(yù)后的相關(guān)生物標記物均有待進一步研究和發(fā)掘。
基因表達數(shù)據(jù)庫(Gene Expression Omnibus,GEO)是包含了高通量微陣列、下一代測序及其他形式的高通量功能基因組數(shù)據(jù)集的國際公共數(shù)據(jù)庫,同時,GEO還提供了幾種基于Web的工具和策略來進行數(shù)據(jù)的分析和可視化[2]。在GEO數(shù)據(jù)庫中,關(guān)于食管鱗癌的基因表達數(shù)據(jù)已被收錄。本研究利用生物信息學(xué)技術(shù)篩選食管鱗癌的差異表達基因,并進一步構(gòu)建異常表達基因的互作網(wǎng)絡(luò),篩選出核心基因,利用該癌癥相關(guān)的臨床數(shù)據(jù)庫分析核心基因的表達差異,為食管鱗癌的臨床靶向治療奠定基礎(chǔ)。
1.1數(shù)據(jù)下載及處理 從GEO(http://www.ncbi.nlm.nih.gov/geo/)中篩選出食管鱗癌相關(guān)的3個基因表達譜芯片GSE45168、GSE38129和GSE70409,篩選標準為樣本數(shù)≥10個,樣本分類明確,僅包含食管鱗癌組織和正常癌旁組織。GSE45168芯片包含5份例食管鱗癌組織和5份正常癌旁組織;GSE38129芯片包含30份食管鱗癌組織和30份正常癌旁組織;GSE70409芯片包含17份食管鱗癌組織和17份正常癌旁組織;利用平臺信息文件將表達譜芯片中的探針矩陣轉(zhuǎn)換為基因矩陣。
1.2差異表達基因的篩選 應(yīng)用GEO的在線分析軟件GEO2R對3個基因表達譜芯片分別進行差異表達基因(differentially expressed genes,DEGs)分析,篩選標準為P<0.05,差異倍數(shù)(fold change,F(xiàn)C)對數(shù)的絕對值|log(FC)|≥1.5,分別得到3組差異表達基因,運用火山圖將差異表達基因可視化。利用Draw Venn Diagram在線軟件取三者差異表達基因的交集,并作韋恩圖。
1.3基因本體(Gene Ontology,GO)功能注釋及京都基因與基因組百科全書(Kyoto Encyclopediaof Genes and Genomes,KEGG)通路富集分析 通過在線網(wǎng)絡(luò)工具DAVID(The Database for Annotation,Visualization and Integrated Discovery)6.8(https://david.ncifcrf.gov/)對差異表達基因進行GO功能注釋和KEGG通路富集分析[3],并對結(jié)果進行可視化處理。
1.4蛋白互作(protein protein interaction,PPI)網(wǎng)絡(luò)構(gòu)建 利用在線分析軟件STRING 11.0(https://string-db.org/)分析差異表達基因的蛋白互作[4],設(shè)置置信度閾值為大于0.4,將差異表達基因?qū)氩⑦\行,得到PPI網(wǎng)絡(luò)。利用生物信息學(xué)平臺Cytoscape對數(shù)據(jù)進行可視化處理[5]。利用MCODE插件對PPI進行進一步分析,篩選出PPI網(wǎng)絡(luò)中連接最緊密的部分作為樞紐基因(hub gene)[6]。
1.5核心基因的差異表達分析 利用GEPIA數(shù)據(jù)庫對hub基因進行差異表達分析[7],在GEPIA數(shù)據(jù)庫中選擇箱式圖分析,輸入hub基因,選擇對應(yīng)的癌癥,設(shè)置P<0.01,|log2(FC)|≥1。選擇TCGA和GTEx數(shù)據(jù)庫中的正常癌旁組織數(shù)據(jù)作為對照組,點擊繪制。通過對比觀察判斷hub基因的差異表達情況。
2.1食管鱗癌和癌旁正常組織的差異表達基因 在P<0.05,|log(FC)|≥1.5的篩選條件下,得到DEGs共2 529個,上調(diào)1 164個,下調(diào)1 365個,其中來自GSE45168的上調(diào)基因929個、下調(diào)基因1 091個(圖1A);來自GSE38129的上調(diào)基因179個、下調(diào)基因206個(圖1B);來自GSE70409的上調(diào)基因371個、下調(diào)基因581個(圖1C)。3個基因表達譜芯片取交集后的DEGs為191個,其中上調(diào)基因68個,下調(diào)基因123個,見圖2。
圖1 差異表達基因火山圖Fig.1 Volcanic map of DEGs
圖2 韋恩圖Fig.2 Venn diagram
2.2差異表達基因的GO功能注釋及KEGG通路富集分析 GO功能注釋結(jié)果顯示,這些差異表達基因主要參與的生物學(xué)過程包括膠原蛋白的分解代謝過程、細胞外基質(zhì)的組成與分解和膠原纖維組織;參與的細胞組成為外泌體、細胞外基質(zhì)、細胞外區(qū)域蛋白;參與的分子功能為細胞外基質(zhì)結(jié)構(gòu)的組成、金屬內(nèi)肽酶活性、絲氨酸型內(nèi)肽酶活性。見圖3。KEGG通路富集分析顯示,這些差異表達基因主要參與的通路為細胞外基質(zhì)受體相互作用、黏著斑、PI3K-AKT信號通路等,見圖4。
圖3 差異表達基因的GO功能注釋Fig.3 GO functional annotation of DEGs
圖4 差異表達基因的KEGG通路富集分析Fig.4 KEGGpathway enrichment analysis of DEGs
2.3PPI網(wǎng)絡(luò)構(gòu)建及關(guān)鍵基因篩選 利用STRING 11.0對差異表達基因進行分析得到的PPI網(wǎng)絡(luò)見圖5。進一步用MECOE篩選出PPI網(wǎng)絡(luò)中30個hub基因,見圖6。
圖5 由191個差異表達基因構(gòu)建的PPI網(wǎng)絡(luò)Fig.5 PPI network constructed by 191 DEGs
圖6 MCODE篩選的PPI網(wǎng)絡(luò)中連接最緊密的兩個模塊Fig.6 Two most closely connected modules in the PPI network filtered by MCODE
2.4核心基因在食管鱗癌和癌旁正常組織中的差異表達分析 與TCGA和GTEx數(shù)據(jù)庫中的正常癌旁組織相比,30個hub基因均有顯著的差異表達(上調(diào),下調(diào))。其中VCAN、ASPM及KIF20A基因在食管鱗癌中未見相關(guān)報道,且與癌旁正常組織相比,VCAN、ASPM及KIF20A基因在食管鱗癌組織中表達明顯上調(diào)。見圖7。
圖7 3個hub基因的差異表達分析Fig.7 Differential expression analysis of three hub genes
目前,基因芯片技術(shù)越來越多地應(yīng)用于惡性腫瘤差異基因的篩選,也使得GEO日趨完善,為腫瘤治療靶點和診斷標記物的篩選提供了更多的可能。本研究以取自GEO的3個食管鱗癌基因表達芯片GSE45168、GSE38129和GSE70409為材料,篩選得到在3個基因芯片中癌和癌旁組織均具有顯著表達差異的191個DEGs,包含68個上調(diào)基因,123個下調(diào)基因。
GO分析是一種用于解釋基因和基因產(chǎn)物、高通量基因組或轉(zhuǎn)錄組數(shù)據(jù)特征及生物學(xué)屬性的方法,包括生物學(xué)過程(biological process,BP)、細胞組成(cell component,CC)、分子功能(molecular function,MF)。GO功能注釋分析顯示,差異基因的功能主要集中在細胞外基質(zhì)、膠原蛋白、膠原纖維組織、外泌體、金屬內(nèi)肽酶、絲氨酸型內(nèi)肽酶。KEGG是一個處理基因組、生物途徑、疾病、藥物和化學(xué)物質(zhì)數(shù)據(jù)庫的集合。KEGG通路富集分析顯示,差異基因參與的主要通路為細胞外基質(zhì)受體相互作用、黏著斑、PI3K-AKT信號通路等。這些結(jié)果提示,差異基因與食管鱗癌細胞侵襲遷移以及有絲分裂有關(guān)。為進一步明確這些差異基因之間相互作用的關(guān)系,利用Cytoscape軟件的MCODE插件篩選出PPI網(wǎng)絡(luò)中連接最緊密的30個hub基因。差異表達分析顯示,這30個hub基因在食管鱗癌和癌旁正常組織中均具有顯著的表達差異。其中,VCAN、ASPM及KIF20A基因在食管鱗癌中未見相關(guān)報道。與癌旁正常組織相比,VCAN、ASPM及KIF20A基因在食管鱗癌組織中表達明顯上調(diào)。
VCAN屬于大型聚集硫酸軟骨素(chondroitin sulfate,CS)蛋白聚糖家族成員,由N-端G1域、C-端G3域以及G1和G3之間的CS鏈結(jié)合區(qū)域組成,是重要的細胞外基質(zhì)成分,在體內(nèi)的各軟組織均有表達,與腫瘤的發(fā)生密切相關(guān)。根據(jù)編碼GAG鏈結(jié)合區(qū)的mRNA的可變剪接,鑒定出4個不同的VCAN同工型,分別是V0(370 kD)、V1(263 kD)、V2(180 kD)和V3(74 kD)[8]。研究表明,V1可通過提高表皮生長因子受體(epidermal growth factor receptor,EGFR)和細胞外信號調(diào)節(jié)激酶的活性來促進腫瘤細胞的增殖[9],抑制細胞凋亡[8]。而且,V1同工型可誘導(dǎo)裸鼠的腫瘤生成,在許多惡性腫瘤組織中V1均呈過表達[10-11]。V2具有與V1截然相反的作用,研究表明,在V2轉(zhuǎn)染的細胞中,EGFR表達降低,ERK失活,細胞增殖受抑[10,12-13]。在乳腺癌模型中,VCAN在轉(zhuǎn)錄因子Snail的調(diào)控下高表達,且硫酸化修飾增加,從而促進乳腺癌細胞的侵襲和轉(zhuǎn)移[14]。但VCAN在食管鱗癌中的作用尚未見報道。
異常紡錘體微管裝配體(abnormal spindle microtubule,ASPM)是一種微管負極端部關(guān)聯(lián)蛋白,該蛋白含有大量IQ結(jié)構(gòu)域,通過結(jié)合大量鈣調(diào)蛋白募集大量鈣離子以促進微管形成[15]。研究表明,ASPM在人類癌癥中高表達,且與不良臨床預(yù)后和早期復(fù)發(fā)有關(guān)。如在卵巢癌、子宮癌、乳腺癌、結(jié)腸癌、甲狀腺癌、睪丸癌、淋巴結(jié)癌和胃癌等惡性腫瘤中均呈高表達[15]。此外,ASPM可作為預(yù)測肝細胞癌浸潤、轉(zhuǎn)移潛能,早期腫瘤復(fù)發(fā)風(fēng)險更高和預(yù)后不良的標志[16]。但ASPM在食管鱗癌中的作用尚未見報道。
KIF20是驅(qū)動蛋白超家族的一員,主要參與有絲分裂過程中紡錘體的組裝[17-19]。越來越多的研究表明,KIF20A在多種人類惡性腫瘤(包括膀胱癌、胃癌、胰腺癌、肝細胞癌、頭頸癌、肺癌、乳腺癌和黑色素瘤)中表達上調(diào)[20-26],并參與腫瘤細胞的分化、增殖、侵襲和遷移,可作為癌癥預(yù)后的生物標志物。如在胰腺導(dǎo)管腺癌中沉默KIF20A可顯著降低胰腺導(dǎo)管腺癌細胞的增殖和遷移[27]。但KIF20A在食管鱗癌中的作用尚未見報道。
綜上所述,食管鱗癌的發(fā)生、發(fā)展存在復(fù)雜的調(diào)控網(wǎng)絡(luò)。通過生物信息學(xué)方法篩選得到的食管鱗癌核心基因VCAN、ASPM、KIF20A在多種惡性腫瘤的發(fā)生發(fā)展過程中起重要作用,但它們在食管鱗癌中的作用尚未見報道。本研究表明,VCAN、ASPM、KIF20A這3個核心基因在食管鱗癌組織中表達上調(diào),提示它們可能對食管鱗癌的發(fā)生發(fā)展具有重要影響。本研究為今后進一步分析這些核心基因在食管鱗癌中的作用及其機制提供了一定的依據(jù),也為食管鱗癌的分子診斷和精準靶向治療奠定了基礎(chǔ)。