郭躍 王少波 曾昊 龐志剛
潰瘍性結(jié)腸炎(UC)是一種慢性復(fù)發(fā)性腸道炎癥性疾病,其病因及發(fā)病機(jī)制尚不完全清楚。UC最嚴(yán)重的并發(fā)癥是潰瘍性結(jié)腸炎相關(guān)性結(jié)腸癌。結(jié)直腸癌是全球第三大常見癌癥,2020年全球共診斷結(jié)直腸癌1 931 590例,935 173例死于結(jié)直腸癌,死亡率位居第二[1]。據(jù)統(tǒng)計(jì)潰瘍性結(jié)腸炎相關(guān)性結(jié)腸癌發(fā)病率雖然只占結(jié)直腸癌的1%~2%,但卻占UC患者死亡原因的10%~15%[2]。研究顯示,UC所致的結(jié)腸癌惡性程度更高,預(yù)后更差[3]。研究表明,潰瘍性結(jié)腸炎相關(guān)性結(jié)腸癌與偶發(fā)性結(jié)直腸癌的臨床特點(diǎn)和發(fā)病機(jī)制不同[4]。
本研究以生物信息學(xué)方法分析基因數(shù)據(jù)集,探尋兩種腫瘤在分子水平的差異,并對得到的差異性表達(dá)基因進(jìn)行功能聚類、京都基因和基因組百科全書(KEGG)途徑富集分析及基因本體(GO)功能注釋分析。構(gòu)建蛋白質(zhì)相互作用網(wǎng)絡(luò),選擇與癌癥發(fā)病相關(guān)的中樞基因,使用網(wǎng)絡(luò)數(shù)據(jù)庫對所篩選的中樞基因進(jìn)行生存分析,探討兩種腫瘤的差異基因及對預(yù)后的影響,以期為潰瘍性結(jié)腸炎相關(guān)性結(jié)腸癌的個體化臨床治療提供相應(yīng)指導(dǎo)。
1.1 數(shù)據(jù)預(yù)處理 基因表達(dá)數(shù)據(jù)集來自在線Gene Expression Omnibus(GEO)數(shù)據(jù)庫(https://www.NCBI.NLM.NIH.gov/GEO/)。從數(shù)據(jù)庫中共提取100個關(guān)于炎癥性腸病的系列。檢索詞:炎癥性腸病、結(jié)腸癌。通過添加條件選擇人類基因,檢索結(jié)果69條。經(jīng)過仔細(xì)對比,選擇數(shù)據(jù)集GSE39582[5]和GSE37283[6],其中GSE37283為潰瘍性結(jié)腸炎相關(guān)性結(jié)腸癌與正常組織的數(shù)據(jù)集,GSE39582為偶發(fā)性結(jié)直腸癌與正常組織的數(shù)據(jù)集。
1.2 差異基因分析 在R 4.0.3軟件中使用GEOqury包[7]獲得GSE39582和GSE37283數(shù)據(jù)集的表達(dá)矩陣,在NCBI下載GPL570平臺的注釋文件進(jìn)行基因注釋。根據(jù)數(shù)據(jù)集的臨床信息分組分為癌癥組和正常組。對兩個數(shù)據(jù)集分別進(jìn)行l(wèi)imma包[8]數(shù)據(jù)標(biāo)準(zhǔn)化處理,設(shè)置P<0.05和│log2FC│>1,選出兩個數(shù)據(jù)集中與正常組織相比表達(dá)上調(diào)或下調(diào)的基因。韋恩圖選出兩個數(shù)據(jù)集不相同的上調(diào)和下調(diào)基因進(jìn)行后續(xù)分析。
1.3 富集分析 對篩選出的差異基因,采用clusterProfiler包[9]進(jìn)行GO富集分析[10]及KEGG途徑分析[11]。GO富集分析主要描述與差異表達(dá)基因相關(guān)的生物學(xué)過程、細(xì)胞成分和分子功能,KEGG途徑分析揭示與差異表達(dá)基因相關(guān)的生物學(xué)途徑,以P<0.05為界值。
1.4 蛋白質(zhì)相互作用網(wǎng)絡(luò)的構(gòu)建及模塊選擇 使用STRING在線數(shù)據(jù)庫(http://string-db.org)[12]確定蛋白質(zhì)相互作用網(wǎng)絡(luò)。單獨(dú)的點(diǎn)被去除,置信度得分≥0.4的交互作用被認(rèn)為顯著并被保留。蛋白質(zhì)相互作用網(wǎng)絡(luò)信息進(jìn)一步導(dǎo)入Cytoscape 3.82軟件[13]用于后續(xù)分析。使用軟件中的分子復(fù)合物檢測(MCODE)應(yīng)用程序進(jìn)行模塊分析,以檢測聚類模塊,檢測到聚類最明顯的模塊后應(yīng)用cytoHubb程序進(jìn)行中樞基因篩選,選出排名靠前的中樞基因,顏色較深的模塊具有更強(qiáng)的匯聚性。
1.5 GEPIA數(shù)據(jù)庫中樞基因的驗(yàn)證及生存分析 通過GEPIA數(shù)據(jù)庫(http://gepia.cancer.pku.cn/)進(jìn)行腫瘤和正常組織差異基因表達(dá)分析、生存分析及基因相關(guān)性分析[14]。臨界條件設(shè)置為|Log2FC|=1,P<0.01,腫瘤為紅色模塊,正常組織為灰色模塊。
2.1 差異基因 GSE39582數(shù)據(jù)集中包含566例偶發(fā)性結(jié)直腸癌和19例正常組織樣本,GSE37283數(shù)據(jù)集中包含11例潰瘍性結(jié)腸炎相關(guān)性結(jié)腸癌和5例正常組織樣本。根據(jù)篩選標(biāo)準(zhǔn)在數(shù)據(jù)集中篩選潰瘍性結(jié)腸炎相關(guān)性結(jié)腸癌和偶發(fā)性結(jié)直腸癌差異表達(dá)基因,在GSE39582數(shù)據(jù)集中得到上調(diào)基因115個,下調(diào)基因328個;在GSE37283數(shù)據(jù)集中得到上調(diào)基因222個,下調(diào)基因444個,通過分析獲得兩個數(shù)據(jù)集中不相同的下調(diào)基因141個,上調(diào)基因396個。
2.2 差異基因的功能和途徑富集分析 為探索差異基因功能和途徑的豐富性,進(jìn)行GO和KEGG分析。KEGG分析表明,代謝通路主要富集于補(bǔ)體途徑、細(xì)胞因子受體相互作用、利什曼原蟲相關(guān)通路、NK-κB信號通路等,見圖1。GO分析顯示,改變的細(xì)胞功能為代謝過程、細(xì)胞外泌體蛋白質(zhì)異源二聚體活性、蛋白結(jié)合、信號轉(zhuǎn)導(dǎo)、質(zhì)膜相關(guān)的分子功能等,見圖2。
圖1 KEGG富集分析
圖2 GO富集分析
2.3 蛋白質(zhì)相互作用網(wǎng)絡(luò)構(gòu)建與中樞基因識別 通過STRING在線數(shù)據(jù)庫,為重疊的差異表達(dá)基因構(gòu)建蛋白質(zhì)相互作用網(wǎng)絡(luò),使用Cytoscape中的MCODE程序,分析基因之間的內(nèi)在聯(lián)系網(wǎng)絡(luò)蛋白質(zhì)。最重要的集群得分為26分,篩選出10個關(guān)聯(lián)性最高的基因,得分為26分,這10個中樞基因均為上調(diào)基因,見圖3。
圖3 聚類最明顯模塊及中樞基因
2.4 GEPIA數(shù)據(jù)庫中驗(yàn)證中樞基因在腫瘤與正常組織表達(dá)水平差異及生存分析 在GEPIA數(shù)據(jù)庫中,再次驗(yàn)證了潰瘍性結(jié)腸炎相關(guān)性結(jié)腸癌和偶發(fā)性結(jié)直腸癌組織之間中樞基因表達(dá)差異,見圖4。生存分析顯示,CCL4、CCL2、ITGAM基因?qū)︻A(yù)后影響明顯,IL1B基因與預(yù)后相關(guān),見圖5。
圖4 中樞基因在GEPIA數(shù)據(jù)庫中與正常組織的表達(dá)差異
圖5 GEPIA數(shù)據(jù)庫中樞基因生存分析
潰瘍性結(jié)腸炎相關(guān)性結(jié)腸癌與偶發(fā)性結(jié)直腸癌的臨床特點(diǎn)和發(fā)病機(jī)制不同。本研究基于基因數(shù)據(jù)集篩選出潰瘍性結(jié)腸炎相關(guān)性結(jié)腸癌和偶發(fā)性結(jié)直腸癌的差異表達(dá)基因,包括下調(diào)基因141個,上調(diào)基因396個。KEGG途徑分析顯示差異基因主要富集在補(bǔ)體途徑、細(xì)胞因子受體相互作用、利什曼原蟲相關(guān)通路、NK-κB信號通路,這些通路在細(xì)胞的代謝中具有重要作用。GO富集分析顯示下調(diào)基因富集于代謝過程、細(xì)胞外泌體蛋白質(zhì)異源二聚體活性的細(xì)胞功能,上調(diào)基因富集于與蛋白質(zhì)結(jié)合、信號轉(zhuǎn)導(dǎo)和質(zhì)膜相關(guān)的分子功能。
通過STRING在線數(shù)據(jù)庫,構(gòu)建了差異基因蛋白質(zhì)相互作用網(wǎng)絡(luò),將蛋白共作用網(wǎng)絡(luò)導(dǎo)入Cytospace軟件中的MCODE,分析兩個基因之間的內(nèi)在網(wǎng)絡(luò)蛋白關(guān)系。最佳模塊得分為26分,采用cytoHubba軟件篩選出聚類程度排名前10的中樞基因PTPRC、TLR4、ITGAM、CD40、CD86、IL1B、CCL4、CXCL9、TLR2、CCL2,這些中樞基因均為上調(diào)基因。在GEPIA數(shù)據(jù)庫中驗(yàn)證中樞基因,與正常組織表達(dá)差異明顯的基因?yàn)镻TPRC、CXCL9、CD86、ITGAM、IL1B,其中在GEPIA數(shù)據(jù)庫的結(jié)腸癌中表達(dá)上調(diào)的基因有CXCL9、IL1B,下調(diào)基因有PTPRC、ITGAM、CD86。生存分析顯示,CCL4、CCL2、ITGAM基因?qū)︻A(yù)后影響明顯,IL1B基因的表達(dá)與預(yù)后相關(guān),其中ITGAM、CCL2在潰瘍性結(jié)腸炎相關(guān)性結(jié)腸癌中表達(dá)下降,CCL4、IL1B表達(dá)上升。
ITGAM參與單核細(xì)胞、巨噬細(xì)胞和粒細(xì)胞的各種粘附相互作用,研究報(bào)道,ITGAM與腫瘤轉(zhuǎn)移有明顯關(guān)系[15,16],該基因在結(jié)腸癌中下調(diào)可能與結(jié)腸癌的轉(zhuǎn)移有關(guān)。CCL2是一種趨化因子,其結(jié)合同源受體CCR2,具有多種促腫瘤發(fā)生作用,介導(dǎo)腫瘤生長和血管生成,促進(jìn)腫瘤進(jìn)展[17]。CCL4在結(jié)腸癌中的高表達(dá)可誘導(dǎo)腫瘤相關(guān)巨噬細(xì)胞,尤其是促腫瘤巨噬細(xì)胞的浸潤,CCL4的高表達(dá)與結(jié)腸癌患者的不良預(yù)后相關(guān)[18]。IL1B是一種抗感染促炎細(xì)胞因子,研究表明其突變增加了炎癥性腸病相關(guān)結(jié)腸癌在人群中的比例[19]。這些基因的改變將會對腫瘤的發(fā)生發(fā)展產(chǎn)生影響,篩選差異性基因有助于對腫瘤的發(fā)病機(jī)制有更深入的了解,也會為腫瘤的治療提供新思路。
綜上所述,本研究通過生物信息學(xué)對GEO數(shù)據(jù)集進(jìn)行差異基因分析,通過蛋白質(zhì)相互作用網(wǎng)絡(luò)確定了10個偶發(fā)性結(jié)直腸癌和潰瘍性結(jié)腸炎相關(guān)性結(jié)腸癌的差異基因,并通過在線數(shù)據(jù)庫驗(yàn)證與正常組織的表達(dá)差異,選出對預(yù)后影響較大的基因,為潰瘍性結(jié)腸炎相關(guān)性結(jié)腸癌的臨床治療提供新的靶點(diǎn)及治療方向,為腫瘤的個體化治療提供指導(dǎo)。然而本研究通過公共數(shù)據(jù)庫的數(shù)據(jù)分析完成,相關(guān)結(jié)果需要進(jìn)一步的實(shí)驗(yàn)研究加以驗(yàn)證。