劉 菲 袁 銳 陳世龍 王永翠
(中國科學(xué)院西北高原生物研究所青海省作物分子育種重點(diǎn)實(shí)驗(yàn)室,西寧 810008)
消化系統(tǒng)癌癥(digestive cancers,DSCs)包括咽喉癌、食管癌(esophageal carcinoma,ESCA)、胃癌(stomach adenocarcinoma,STAD)等消化道癌癥和胰腺癌、膽囊癌、肝癌等消化道附屬器官癌癥,是存在于世界范圍內(nèi)的健康問題[1-2]。其中,ESCA在癌癥病死率中排名第六,直結(jié)腸癌被認(rèn)為是DSCs中發(fā)病率最高的一種癌癥,每年全球新增病例約100萬例,死亡55萬余人[3-5]。在過去的20年中,結(jié)腸癌(colon adenocarcinoma,COAD)、直腸癌(rectum adenocarcinoma,READ)、STAD均為全球發(fā)病率最高的10種癌癥類型之一。2018年,美國記錄了約319 160例DSCs新病例和160 820例與DSCs相關(guān)的病死病例,并且DSCs患者的五年生存率均低于20%[6-7]。隨著醫(yī)療水平的不斷提高,美國癌癥協(xié)會(huì)(ACS)、疾病控制與預(yù)防中心(CDC)、美國國家癌癥研究所(NCI)和北美中央癌癥登記處協(xié)會(huì)(NAACCR)在協(xié)作提供的美國癌癥發(fā)生和發(fā)展趨勢的年度報(bào)告中提出,2011年至2015年間,DSCs的病死率均呈下降趨勢,但其整體生存率依然很低[8]。
癌癥治療最終目的是根除癌細(xì)胞,同時(shí)盡量減少治療過程中對正常組織的潛在損傷[9]。傳統(tǒng)的腫瘤治療方法是依靠外界力量殺死腫瘤細(xì)胞,通常采用的手術(shù)治療方案會(huì)對正常組織產(chǎn)生損傷,并且預(yù)后效果不好,容易復(fù)發(fā),即便患者在接受手術(shù)切除前后進(jìn)行放射治療或者化學(xué)藥物治療,預(yù)后仍然很差[10-12]。由于常規(guī)治療方案對轉(zhuǎn)移或復(fù)發(fā)的DSCs治療效果很差,尋找其他新型治療方法必然成為癌癥治療的新趨勢[13-16]。近年來,靶向治療和免疫治療等腫瘤生物治療方法已經(jīng)是相對比較前沿的癌癥治療手段[16]。依據(jù)理論,人體正常細(xì)胞和腫瘤細(xì)胞的分子特征存在很大不同,這些差異可以作為靶點(diǎn),從而針對已經(jīng)明確的分子靶點(diǎn)進(jìn)行靶向治療[17]。已有大量研究通過機(jī)器學(xué)習(xí)或差異分析的方法揭示一些基因的異常表達(dá)或甲基化會(huì)影響癌癥的發(fā)展,并得到一些潛在的癌癥預(yù)后基因及其通路[18-19]。比如DAVID等[20]同時(shí)采用差異分析和機(jī)器學(xué)習(xí)的方法鑒定出多種與腫瘤發(fā)展相關(guān)的分泌途徑有關(guān)基因,SAGHALEYNI等[21]則將隨機(jī)森林的方法用于癌癥基因組圖譜(cancer genome atlas,TCGA)、基因型組織表達(dá)數(shù)據(jù)(genotype-tissue expression,GTEx)、法國肉瘤組織這3種基因表達(dá)數(shù)據(jù)庫中,用以識(shí)別新型診斷標(biāo)志物,并通過實(shí)驗(yàn)對其結(jié)果進(jìn)行驗(yàn)證。
盡管之前已有大量的工作對癌癥相關(guān)的分子數(shù)據(jù)進(jìn)行了廣泛的研究,但大多數(shù)研究都集中于單一分子特征或單個(gè)癌癥類型之間的關(guān)聯(lián)上。因此,一些學(xué)者開始基于癌癥集群進(jìn)行綜合分析(泛癌分析),以期發(fā)現(xiàn)更系統(tǒng)、更可靠的生物標(biāo)志物,從而提高預(yù)后能力。如HOADLEY[22]等將12種癌癥類型進(jìn)行多平臺(tái)綜合分析,基于基因突變、DNA拷貝數(shù)、DNA甲基化、mRNA多組學(xué)數(shù)據(jù),根據(jù)分子特征綜合比較12種癌癥類型的異同,從而為根據(jù)分子亞型對癌癥進(jìn)行分類奠定了基礎(chǔ)。此外,BASS等[23]基于體細(xì)胞拷貝數(shù)分析、外顯子分析、DNA甲基化分析、mRNA測序、miRNA測序等方法對295個(gè)原發(fā)性胃腺癌進(jìn)行綜合分子評(píng)估并創(chuàng)建決策樹,定義了STAD的4種主要基因組亞型,表現(xiàn)出明顯突出的基因組特征,為不同STAD患者相應(yīng)靶向藥物的開發(fā)提供指導(dǎo)。不論是在全國還是在全球發(fā)布的癌癥死亡順位分布中,人類高發(fā)病率和高病死率的惡性腫瘤中均包括READ、肝癌、STAD及ESCA 4種癌癥[24]。但目前采用泛癌分析的方法綜合分析不同DSCs的多種分子數(shù)據(jù)的研究依然很少,4種DSCs依然存在一些臨床信息及分子特征差異有待于進(jìn)一步挖掘[25]。
TCGA數(shù)據(jù)庫為癌癥研究提供了豐富的資源[26]。利用TCGA數(shù)據(jù)庫的20 000多種原發(fā)癌的分子特征和33種癌癥類型的正常樣本,結(jié)合臨床數(shù)據(jù)挖掘不同DSCs的分子特征并加以比較分析,對DSCs的預(yù)后具有重要研究價(jià)值。因此,本文通過TCGA分析DSCs(ESCA、STAD、READ、COAD)分子數(shù)據(jù)和臨床信息,從而挖掘DSCs分子特征的異同以及臨床基本特征的關(guān)系。其中,分子數(shù)據(jù)包括基因突變數(shù)據(jù)、基因拷貝數(shù)變異數(shù)據(jù)、基因表達(dá)數(shù)據(jù)、基因甲基化數(shù)據(jù),所采用的分析方法主要有差異分析、富集分析、生存分析以及相關(guān)性分析。本文關(guān)于4種DSCs類型異同點(diǎn)的提出可以為深入理解DSCs的分子特征及相應(yīng)分子靶向治療方案的設(shè)計(jì)提供有效依據(jù)。
1.1 資料 通過TCGAbiolinks包從TCGA公共數(shù)據(jù) 庫 官 網(wǎng) 接 口 獲 得DSCs(ESCA、STAD、READ、COAD)分子和樣本臨床數(shù)據(jù),分子數(shù)據(jù)包括基因突變數(shù)據(jù)、拷貝數(shù)變異數(shù)據(jù)、基因表達(dá)數(shù)據(jù)以及甲基化數(shù)據(jù),樣本分為癌癥樣本和正常樣本,正常樣本即癌旁組織樣本。此外,在TCGA數(shù)據(jù)庫中4種癌癥類型患者的臨床資料,包括患者的年齡、性別、生存時(shí)間、生存狀態(tài)、癌癥階段分期、發(fā)病位置、存活時(shí)間。刪除生存狀態(tài)缺失和生存時(shí)間不明確的患者數(shù)據(jù),臨床信息數(shù)據(jù)最終包括ESCA患者信息185例、STAD患 者434例、READ患者169例、COAD患者458例。
1.2 方法
1.2.1 單一數(shù)據(jù)類型分析 對每種癌癥類型的不同分子數(shù)據(jù)分別進(jìn)行數(shù)據(jù)處理。將基因突變數(shù)據(jù)采用MaxMIF算法進(jìn)行篩選,挑選每種癌癥類型中30個(gè)最大的突變影響函數(shù)值(MIF)所對應(yīng)的基因作為癌癥驅(qū)動(dòng)基因[27]??截悢?shù)變異數(shù)據(jù)則通過文獻(xiàn)報(bào)道的顯著基因和由COSMIC數(shù)據(jù)庫公布的致癌基因進(jìn)行篩選,從而分析拷貝數(shù)變異情況[16,23,28]。
甲基化數(shù)據(jù)與基因表達(dá)數(shù)據(jù)做相似處理,對采用log2標(biāo)準(zhǔn)化處理后的基因表達(dá)數(shù)據(jù)通過R Limma包做數(shù)據(jù)差異分析,為得到包含顯著的癌癥驅(qū)動(dòng)基因在內(nèi)的差異表達(dá)基因(differential expression gene,DEGs),對數(shù)據(jù)差異分析采用不同的標(biāo)準(zhǔn)[ESCA:|logFC|>1.2,矯正P值(FDR)<0.05;STAD:|logFC|>1.2,F(xiàn)DR<0.001;READ:|logFC|>1.5,F(xiàn)DR<0.001;COAD:|logFC|>1.5,F(xiàn)DR<0.001],而后將差異分析篩選出的DEGs通過DAVID數(shù)據(jù)庫(https://david.ncifcrf.gov)進(jìn)行GO和KEGG通路富集分析,-log10P值>2差異具有統(tǒng)計(jì)學(xué)意義。其中GO分析包括生物學(xué)過程(biological process,BP)、細(xì)胞組成(cell composition,CC)和分子功能(molecular function,MF)3種注釋。對完成在編碼區(qū)內(nèi)篩選的甲基化位點(diǎn)數(shù)據(jù)通過R Limma包做數(shù)據(jù)差異分析,篩選|logFC|>0.5,F(xiàn)DR<0.001的位點(diǎn)基因?yàn)椴町惣谆颍╠ifferential methylation gene,DMGs),為得到其GO和KEGG通路,通過DAVID數(shù)據(jù)庫對DMGs進(jìn)行GO和KEGG通路富集分析,GO分析同樣包括生物學(xué)過程、細(xì)胞組成和分子功能3種注釋。
1.2.2 不同數(shù)據(jù)類型聯(lián)合分析 將癌癥驅(qū)動(dòng)基因的突變數(shù)據(jù)和基因表達(dá)數(shù)據(jù)分別結(jié)合臨床信息做生存分析,分析預(yù)后基因的預(yù)后價(jià)值。根據(jù)基因在癌癥患者中是否發(fā)生突變,將癌癥患者劃分為突變組和未突變組,采用Kaplan-Meier方法,分析癌癥驅(qū)動(dòng)基因的突變與4種癌癥類型發(fā)病之間的關(guān)系,從而找到預(yù)后效果良好的癌癥驅(qū)動(dòng)基因,在對4種癌癥類型的癌癥驅(qū)動(dòng)基因表達(dá)數(shù)據(jù)結(jié)合臨床信息生存分析中,將劃分組別的標(biāo)準(zhǔn)改為根據(jù)基因在癌癥患者中表達(dá)水平的上下四分位數(shù)劃分,癌癥患者被劃分為高表達(dá)組和低表達(dá)組,分析癌癥驅(qū)動(dòng)基因的表達(dá)與4種癌癥類型發(fā)病之間的關(guān)系,并采用Survival軟件包對結(jié)果進(jìn)行圖形可視化,找到具有預(yù)后效果的癌癥驅(qū)動(dòng)基因。
將突變數(shù)據(jù)分別與基因表達(dá)數(shù)據(jù)、甲基化數(shù)據(jù)做聯(lián)合分析,得到突變與基因表達(dá)、DNA甲基化之間的關(guān)系。引用皮爾遜相關(guān)系數(shù)法,利用R軟件“cor”函數(shù)計(jì)算不同癌癥類型中癌癥驅(qū)動(dòng)基因的突變率,分別與癌癥驅(qū)動(dòng)基因的最大表達(dá)量、癌癥驅(qū)動(dòng)基因甲基化數(shù)據(jù)最大β值的相關(guān)性,并采用ggplot2軟件包對結(jié)果進(jìn)行圖形可視化。
1.2.3 驗(yàn)證 從TCGA官方發(fā)布的文獻(xiàn)中找到通過Mutsig計(jì)算得到的顯著基因[16,23,28],將已報(bào)道的顯著基因與臨床數(shù)據(jù)結(jié)合做生存分析,根據(jù)基因在患者中是否發(fā)生突變,將癌癥患者劃分為突變組和未突變組,采用KM方法,分析顯著基因的突變與4種癌癥類型發(fā)病之間的關(guān)系,從而找到預(yù)后效果良好的顯著基因。并將已報(bào)道的顯著基因突變數(shù)據(jù)分別與基因表達(dá)數(shù)據(jù)以及甲基化數(shù)據(jù)利用R軟件“cor”函數(shù)做相關(guān)性分析。將顯著基因的一系列分析結(jié)果與癌癥驅(qū)動(dòng)基因的分析結(jié)果做比較。
2.1 單一數(shù)據(jù)類型分析結(jié)果 在對ESCA突變數(shù)據(jù)的篩選中,采用MaxMIF算法計(jì)算分別得到4種癌癥類型的30個(gè)癌癥驅(qū)動(dòng)基因,并得到癌癥驅(qū)動(dòng)基因在癌癥的突變數(shù)據(jù)中的大體分布(圖1)。利用t檢驗(yàn)法計(jì)算不同癌癥類型中每種癌癥驅(qū)動(dòng)基因的突變頻率,判斷每兩種癌癥類型之間突變頻率的差異顯著性,經(jīng)計(jì)算得出,兩兩癌癥類型之間P值均<0.001,具有極顯著性差異。另外,對各種癌癥類型的癌癥驅(qū)動(dòng)基因分別做預(yù)后分析,得到預(yù)后效果顯著的癌癥驅(qū)動(dòng)基因,其中,ESCA中通過突變數(shù)據(jù)得到具有預(yù)后效果癌癥驅(qū)動(dòng)基因?yàn)镮SG20、IL1R1,SATD癌癥驅(qū)動(dòng)基因中具有預(yù)后效果的癌癥驅(qū)動(dòng)基因?yàn)镽AB13、SELL,READ癌癥驅(qū)動(dòng)基因中預(yù)后效果良好的癌癥驅(qū)動(dòng)基因?yàn)镃5,COAD癌癥驅(qū)動(dòng)基因中預(yù)后效果良好的癌癥驅(qū)動(dòng)基因?yàn)镃D226(圖2)。
圖1 癌癥驅(qū)動(dòng)基因突變信息分布及樣本信息分布Fig.1 Distribution of sample informations and mutation informations based on cancer driver genes
圖2 4種癌癥類型的癌癥驅(qū)動(dòng)基因預(yù)后分析Fig.2 Prognosis analysis of cancer driver genes from four types of cancer
通過癌癥驅(qū)動(dòng)基因篩選拷貝數(shù)變異數(shù)據(jù),觀察癌癥驅(qū)動(dòng)基因的拷貝數(shù)變異情況。將樣本分為腫瘤組織樣本與正常組織樣本,再按基因拷貝數(shù)的正負(fù)將癌癥驅(qū)動(dòng)基因分別分為拷貝數(shù)增加和減少2種,以此得到驅(qū)動(dòng)基因拷貝數(shù)的4種類型:腫瘤樣本中增加、腫瘤樣本中減少、正常樣本中增加、正常樣本中減少。在4種癌癥類型中,癌癥組織樣本和正常組織樣本的個(gè)數(shù)占總樣本量的比值均接近于50%,而每種基因在癌癥組織樣本和正常組織樣本中的增加和減少的樣本分布并不均勻。針對文獻(xiàn)報(bào)道的顯著基因以及COSMIC數(shù)據(jù)庫公布的常見致癌基因(BRAF、CDKN2A、CTNNB1、EGFR、ERBB2、KIT、KRAS、MYC、PIK3CA、RB1、RET、SMAD4、TP53)統(tǒng)計(jì)拷貝數(shù)變異的情況(圖3)[16,23,28]??梢钥闯?,在不同癌癥類型中關(guān)鍵基因的拷貝數(shù)變化在癌癥組織樣本和正常組織樣本中的分布并不均勻。
圖3 癌癥驅(qū)動(dòng)基因的拷貝數(shù)變異數(shù)據(jù)分布情況Fig.3 Distribution of copy number variation data of cancer driver genes
癌癥基因表達(dá)數(shù)據(jù)和癌癥甲基化基因數(shù)據(jù)分別通過差異分析篩選,在癌癥基因表達(dá)數(shù)據(jù)中篩選到829個(gè)ESCA DEGs、394個(gè)STAD DEGs、606個(gè)READ DEGs、591個(gè)COAD DEGs。在癌癥甲基化數(shù)據(jù)中篩選到88個(gè)ESCA DMGs、36個(gè)STAD DMGs、515個(gè)READ DMGs、127個(gè)COAD DMGs。對所得到的不同癌癥類型DEGs通過DAVID進(jìn)行KEGG功能富集分析,進(jìn)一步了解DEGs的富集通路。KEGG富集通路顯示,與基因表達(dá)相關(guān)的差異基因顯著富集在神經(jīng)活性配體與受體相互作用方面(圖4)。另外,通過上下四分位數(shù)將表達(dá)數(shù)據(jù)分為高表達(dá)組和低表達(dá)組,并以此為分組做預(yù)后分析,得到ESCA中具有預(yù)后效果的基因有29個(gè),STAD中具有預(yù)后效果的基因有70個(gè),READ中具有預(yù)后效果的基因有71個(gè),COAD中具有預(yù)后效果的基因有50個(gè)。
圖4 DEGs KEGG功能富集分析Fig.4 KEGG functional enrichment analysis of DEGs
2.2 利用不同數(shù)據(jù)類型聯(lián)合分析的結(jié)果 將突變數(shù)據(jù)分別與基因表達(dá)數(shù)據(jù)做相關(guān)性分析,以不同的癌癥類型中癌癥驅(qū)動(dòng)基因的突變率分別與癌癥驅(qū)動(dòng)基因的最大表達(dá)量以及甲基化最大Beta值做相關(guān)性分析,其中ESCA基因突變率與基因表達(dá)量、甲基化Beta值的相關(guān)系數(shù)r為0.110、0.091,STAD基因突變率與基因表達(dá)量、與甲基化Beta值的相關(guān)系數(shù)r為-0.062、0.057,READ基因突變率與基因表達(dá)量、甲基化Beta值的相關(guān)系數(shù)r為0.200、0.110,COAD基因突變率與基因表達(dá)量、甲基化Beta值的相關(guān)系數(shù)r為0.065、0.018。相關(guān)系數(shù)的絕對值均<0.300。
通過突變數(shù)據(jù)做預(yù)后分析從TCGA官方發(fā)布的文獻(xiàn)中找到的顯著基因,并將顯著基因的突變率分別與基因表達(dá)數(shù)據(jù)、甲基化數(shù)據(jù)做相關(guān)性分析,以此驗(yàn)證MaxMIF算法找到的癌癥驅(qū)動(dòng)基因預(yù)后率與其他分子數(shù)據(jù)相關(guān)性分析的準(zhǔn)確性。ESCA中顯著基因32個(gè),STAD中顯著基因23個(gè),READ中顯著基因28個(gè),COAD中顯著基因個(gè)數(shù)28個(gè),具有預(yù)后效果的顯著基因所占的比例分別為9.375%、13.043%、0、7.143%,而具有預(yù)后效果的癌癥驅(qū)動(dòng)基因所占的比例分別為3.333%、6.667%、3.333%、6.667%。預(yù)后基因比率差別不大,但通過癌癥驅(qū)動(dòng)基因分析得到的潛在預(yù)后基因個(gè)數(shù)穩(wěn)定一些。顯著基因的突變率與基因表達(dá)數(shù)據(jù)相關(guān)系數(shù)分別為0.008、0.172、-0.031、-0.130,顯著基因的突變率與甲基化數(shù)據(jù)相關(guān)系數(shù)分別為-0.232、-0.187、0.081、0.220。同樣的,顯著基因與其他分子數(shù)據(jù)的相關(guān)系數(shù)也均<0.300。
DSCs是常見的惡性腫瘤,由于早期無明顯不良狀況,診斷率低,發(fā)現(xiàn)時(shí)多瀕臨或處于中晚期,診斷費(fèi)用高、治療療效差,并伴有易轉(zhuǎn)移、易復(fù)發(fā)的危險(xiǎn),因此發(fā)病率、病死率高,另外,我國DSCs的發(fā)病人群也日趨年輕化[28-31]。在最近的10年,隨著高通量測序技術(shù)的出現(xiàn)、測序成本的大幅度降低以及基因組學(xué)、轉(zhuǎn)錄組學(xué)、蛋白組學(xué)、表觀組學(xué)等技術(shù)的進(jìn)步,醫(yī)療大數(shù)據(jù)得以迅速發(fā)展。大規(guī)模的研究已經(jīng)繪制了基因組調(diào)控網(wǎng)絡(luò),并極大地增進(jìn)了對包括癌癥發(fā)生和癌癥轉(zhuǎn)移在內(nèi)的多種生物學(xué)過程的分子機(jī)制的理解[32]。
已有證據(jù)表明,有些基因在多種癌癥組織中起著相似作用。例如,基因TP53通過影響NOX4表達(dá)與多種癌癥的進(jìn)展建立關(guān)系,包括ESCA、甲狀腺癌、膀胱尿道癌等,并可調(diào)節(jié)胰腺癌細(xì)胞對化療藥物、信號(hào)轉(zhuǎn)導(dǎo)抑制劑以及營養(yǎng)素的敏感性[33-34]。此外,癌癥分析還發(fā)現(xiàn)不同癌癥之間類似的分子特征變化,例如MCM8基因在STAD、READ、肝癌、肺癌、宮頸癌、卵巢癌、淋巴瘤、頭頸部和中樞神經(jīng)系統(tǒng)腫瘤中過度表達(dá),ESM1基因在12種癌癥類型中過度表達(dá)并與宮頸鱗癌和腺癌、ESCA、腎透明細(xì)胞癌和腎乳頭狀細(xì)胞癌4種癌癥患者的總生存期顯著相關(guān)[35-37]。
本研究通過檢索TCGA數(shù)據(jù)庫發(fā)現(xiàn),每種癌癥類型都具有特有的潛在預(yù)后基因,如ESCA中的ISG20、IL1R1,STAD中的RAB13、SELL,READ中的C5、GPC6、EDNRB,以及COAD中的CD226。ISG20基因是由GONGORA等[38]作為早幼粒細(xì)胞白血病核體(PML-NB)相關(guān)蛋白首先引入的。ISG20的上調(diào)表達(dá)可以促進(jìn)腫瘤轉(zhuǎn)移和血管生成,并與肝細(xì)胞癌患者的無疾病復(fù)發(fā)存活期較短呈顯著相關(guān),另外,ISG20可以促進(jìn)局部腫瘤免疫,可能成為人類神經(jīng)膠質(zhì)瘤的潛在治療靶點(diǎn)[39-40]。由IL1R1編碼的具有中繼信號(hào)作用的IL-1Rα與IL-1結(jié)合,后IL-1Rα與IL-1受體輔助蛋白形成復(fù)合物,誘導(dǎo)了多種通路的激活,并且這些通路都是腸道腫瘤發(fā)生的關(guān)鍵[41-43]。RAB13通過多種機(jī)制影響細(xì)胞遷移,在集體遷移潛在部位也存在豐富的RAB13 RNA,從而為針對集體癌細(xì)胞入侵提供有效的打擊機(jī)會(huì)[44]。SELL基因翻譯產(chǎn)生L-選擇蛋白,是一種細(xì)胞黏附分子,在調(diào)節(jié)免疫細(xì)胞運(yùn)輸中起重要作用,并且已經(jīng)被發(fā)現(xiàn)其表達(dá)在幾種人類癌癥中被上調(diào),如SELL上調(diào)表達(dá)與炎癥性微環(huán)境以及乳腺癌的良好預(yù)后有關(guān)[45]。補(bǔ)體系統(tǒng)是先天免疫系統(tǒng)的重要組成部分,在適應(yīng)性免疫的激活和調(diào)節(jié)中起著關(guān)鍵作用,而C5是末端補(bǔ)體途徑中補(bǔ)體級(jí)聯(lián)的一個(gè)組分,補(bǔ)體激活導(dǎo)致C5裂解成小C5a分子和大C5b分子,C5a分子具有免疫刺激作用,而C5b分子是膜攻擊復(fù)合物(MAC)的初始成分[46-47]。CD226是在各種免疫細(xì)胞上表達(dá)的激活受體,充當(dāng)共刺激物,增強(qiáng)T細(xì)胞或自然殺傷細(xì)胞的活化,并在先天性和適應(yīng)性免疫調(diào)節(jié)網(wǎng)絡(luò)中顯示出重要意義[48-49]。可見不同癌癥類型中的預(yù)后效果良好的基因大多可能與腫瘤免疫方向有關(guān)。
對DEGs進(jìn)行KEGG富集通路分析,得到在神經(jīng)活性配體與受體相互作用方面顯著富集的結(jié)果,表明DEGs可能通過神經(jīng)活性配體-受體相互作用途徑在4種DSCs中發(fā)揮作用。先前有研究表明,該途徑似乎在同為DSCs的肝癌進(jìn)展中起關(guān)鍵作用,在肝癌的每個(gè)階段都能觀察到神經(jīng)活性的配體-受體相互作用[50-51]。另一項(xiàng)研究說明,神經(jīng)活性配體-受體相互作用途徑參與了腫瘤微環(huán)境和細(xì)胞間的通訊,其失調(diào)可能促進(jìn)了癌癥的發(fā)展[52]。
綜上所述,本研究報(bào)告了ESCA、STAD、READ、COAD 4種DSCs在多組學(xué)層面的綜合分析。4種癌癥類型具有相似的分子特征,包括:4種癌癥類型的突變頻率與基因表達(dá)、甲基化水平無明顯相關(guān)性;MaxMIF軟件獲得的癌癥驅(qū)動(dòng)基因中均僅有少數(shù)幾個(gè)基因具有良好的預(yù)后特征,如ESCA癌癥驅(qū)動(dòng)基因中的ISG20、IL1R1,STAD癌癥驅(qū)動(dòng)基因中的RAB13、SELL,READ癌癥驅(qū)動(dòng)基因中的C5,以及COAD癌癥驅(qū)動(dòng)基因中的CD226;拷貝數(shù)變化在癌癥組織樣本和正常組織樣本中的分布并不均勻;DEGs中均僅有少部分基因具有良好的預(yù)后特征,且KEGG通路都富集在“神經(jīng)活性的配體-受體相互作用”這條通路上。同時(shí),獲得4種癌癥類型不同的分子特征,即4種癌癥類型的癌癥驅(qū)動(dòng)基因、預(yù)后良好的DEGs、DMGs均不同??傊?,以上結(jié)果的提出有助于了解整個(gè)DSCs的異同,并有望為深入理解DSCs的分子特征及相應(yīng)的分子靶向治療方案的設(shè)計(jì)提供有效的依據(jù)。