陸 飛,史維俊,溫賀新,吳華彰,劉牧林
(1.蚌埠醫(yī)學(xué)院第一附屬醫(yī)院胃腸外科;2.蚌埠醫(yī)學(xué)院生命科學(xué)學(xué)院 癌癥轉(zhuǎn)化醫(yī)學(xué)安徽省重點(diǎn)實(shí)驗(yàn)室,安徽 蚌埠 233030)
結(jié)直腸癌是全球第2 大致死癌癥和第3 大常見(jiàn)惡性腫瘤。2018年,結(jié)直腸癌新增病例180萬(wàn),報(bào)告死亡病例88.1萬(wàn)人,占全球新增癌癥病例和死亡人數(shù)的近10%[1]。盡管在治療上有顯著改善,但晚期患者死亡率仍然較高[2],局部復(fù)發(fā)和遠(yuǎn)處轉(zhuǎn)移是結(jié)直腸癌患者死亡的主要原因[3]。因此,研究結(jié)直腸癌發(fā)生發(fā)展及預(yù)后相關(guān)機(jī)制及探索新的關(guān)鍵分子可以改善結(jié)直腸癌的預(yù)防、診斷和治療。
與正常細(xì)胞相比,在不同氧濃度下,癌細(xì)胞將攝取更多的葡萄糖,大部分葡萄糖被分解成乳酸,這種現(xiàn)象被稱(chēng)作為“Warburg effect”或稱(chēng)“有氧糖酵解”[4]。癌細(xì)胞代謝需要更多的葡萄糖,相比正常細(xì)胞卻產(chǎn)生了較少的ATP,抑制癌細(xì)胞有氧糖酵解成為治療癌癥的一種新策略。癌細(xì)胞有許多特性,包括高增殖、侵襲、轉(zhuǎn)移和生存[5],與這些特性相關(guān)的癌癥信號(hào)通路可能會(huì)被“Warburg effect”增強(qiáng)[6]。例如,PGAM1 受miR3614-5p 調(diào)控,通過(guò)激活轉(zhuǎn)化生長(zhǎng)因子-β(TGF-β)信號(hào)通路,在非小細(xì)胞肺癌的發(fā)生發(fā)展過(guò)程中發(fā)揮癌基因的作用[7]。
Glypican-1(GPC1)是磷脂酰肌醇家族(GPC1-6)的成員,也是一種硫酸乙酰肝素糖蛋白,通過(guò)與糖基磷脂酰醇的C 末端結(jié)合而錨定在細(xì)胞外膜上[8]。其在診斷早期胰腺癌中的特異性和敏感性達(dá)到100%,表明它是理想的胰腺癌早期標(biāo)志物,且有研究表明它在其他類(lèi)型的腫瘤中表達(dá)上調(diào)[9-11]。本研究通過(guò)TCGA數(shù)據(jù)庫(kù),利用GSEA富集糖酵解相關(guān)通路,獲得GPC1在COAD中的表達(dá)信息及與臨床數(shù)據(jù)的相關(guān)性,并應(yīng)用R 軟件分析GPC1 與結(jié)直腸癌臨床進(jìn)展的相關(guān)性及其對(duì)患者生存預(yù)后的影響。最后進(jìn)一步通過(guò)KEGG通路富集,研究GPC1在調(diào)控結(jié)直腸癌中的機(jī)制,為研究結(jié)直腸癌分子機(jī)制提供新思路。
1.1 基 因 芯 片 數(shù) 據(jù)從 TCGA(https://cancergenome.nih.gov)數(shù)據(jù)庫(kù)中下載完整的轉(zhuǎn)錄組數(shù)據(jù)和臨床病理信息數(shù)據(jù)[12],其中有473 個(gè)結(jié)腸腺癌(Colon adenocarcinoma,COAD)樣本和41 個(gè)相鄰的非癌組織樣本。
1.2 糖酵解相關(guān)通路基因富集及識(shí)別差異基因利用Perl 軟件提取TCGA 數(shù)據(jù)庫(kù)中的轉(zhuǎn)錄組數(shù)據(jù),下載安裝GSEA(http://software.broad-institute.org/gsea)。通過(guò)GSEA 軟件進(jìn)行糖酵解相關(guān)通路富集,將富集得到的基因通過(guò)R 軟件的limma 包篩選出糖酵解相關(guān)差異表達(dá)基因[13]。
1.3 差異表達(dá)基因的生存分析及生存與臨床病理信息的相關(guān)性分析從TCGA 數(shù)據(jù)庫(kù)中提取相應(yīng)的臨床病理信息,包括年齡、性別、生存狀態(tài)、生存時(shí)間、臨床病理分期等。除去臨床信息缺失的患者,利用單因素Cox 回歸分析差異基因與COAD 患者總體生存相關(guān)的糖酵解相關(guān)基因,進(jìn)一步利用多因素Cox 回歸分析進(jìn)行篩選。然后依據(jù)多因素Cox 回歸分析得到的回歸系數(shù)加權(quán),通過(guò)風(fēng)險(xiǎn)評(píng)分中位值將COAD 患者分為低風(fēng)險(xiǎn)組和高風(fēng)險(xiǎn)組。通過(guò)Kaplan-Meier 曲線分析高低風(fēng)險(xiǎn)組的預(yù)后,且對(duì)數(shù)秩檢驗(yàn)評(píng)估差異。最后進(jìn)行生存與臨床病理信息的相關(guān)性分析[14]。
1.4 預(yù)后相關(guān)基因的獨(dú)立預(yù)后分析及驗(yàn)證通過(guò)Perl 軟件將預(yù)后相關(guān)基因與臨床病理信息進(jìn)行整合,再利用R 軟件進(jìn)行單因素及多因素Cox 回歸分析并對(duì)結(jié)果做森林圖。將TCGA 轉(zhuǎn)錄數(shù)據(jù)重新分組,形成內(nèi)部驗(yàn)證集,驗(yàn)證預(yù)后相關(guān)基因的可靠性。
1.5 預(yù)后相關(guān)基因與臨床病理信息的相關(guān)性分析通過(guò)Perl 軟件將預(yù)后相關(guān)基因表達(dá)數(shù)據(jù)與COAD 患者的年齡、性別、病理分級(jí)、TNM 分期及生存時(shí)間整合。并進(jìn)一步利用R軟件對(duì)臨床病理特征進(jìn)行Wilcox 秩和檢驗(yàn)并作箱式圖[15]。
1.6 目標(biāo)基因臨床病理特征的獨(dú)立預(yù)后分析通過(guò)Perl 軟件將目標(biāo)基因與臨床病理信息進(jìn)行整合,再利用R 軟件進(jìn)行單因素及多因素Cox 回歸分析并對(duì)結(jié)果做森林圖。
1.7 目標(biāo)基因的KEGG 富集分析通過(guò)Perl 軟件將TCGA 轉(zhuǎn)錄數(shù)據(jù)組按照目標(biāo)基因表達(dá)量分為高低兩組,通過(guò)GSEA 軟件進(jìn)行KEGG 主要癌癥信號(hào)通路富集分析,結(jié)果利用R軟件進(jìn)行可視化。
1.8 目標(biāo)基因與潛在靶基因的相關(guān)性分析通過(guò)Perl軟件獲取目標(biāo)基因相關(guān)信號(hào)通路分子的表達(dá)數(shù)據(jù)[16],然后通過(guò)R軟件分析目標(biāo)基因與其的相關(guān)性。結(jié)果以線性相關(guān)系數(shù)(R)及P 值表示,0.1≤|R|≤1 時(shí)表示目標(biāo)基因與潛在靶基因具有相關(guān)性。
1.9 統(tǒng)計(jì)學(xué)處理本研究所有統(tǒng)計(jì)分析皆使用R 4.0.1(www.r-project.org)[17],P<0.05 為差異有統(tǒng)計(jì)學(xué)意義。
2.1 篩選差異基因通過(guò)Perl 軟件提取TCGA 數(shù)據(jù)庫(kù)中的473 例COAD 患者樣本基因表達(dá)量,并利用GSEA 軟件進(jìn)行5 個(gè)糖酵解相關(guān)通路富集(表1),其中HALLMARK_GLYCOLYSIS 和REACTOME_GLYCOLYSIS 通路有統(tǒng)計(jì)學(xué)意義(P<0.05)(圖1A和圖1B),基因集中共含294 個(gè)基因(圖1C),其中256 個(gè)基因差異表達(dá)(FDR<0.05,|log2FC|>0),145個(gè)基因表達(dá)上調(diào)和111 個(gè)基因下調(diào)(圖1D)。以上結(jié)果說(shuō)明大多數(shù)糖酵解相關(guān)基因在COAD組織中表達(dá)差異。
表1 在473例COAD樣本中糖酵解相關(guān)通路富集的基因集
圖1 TCGA數(shù)據(jù)庫(kù)中糖酵解相關(guān)基因在COAD的差異表達(dá)分析
2.2 篩選預(yù)后相關(guān)基因及驗(yàn)證利用單因素及多因素Cox 回歸分析(P<0.05,|log2FC|>0),篩選出基 因ANKZF1、ENO3、G6PC2、GPC1、PPARGC1 和STC2 與患者預(yù)后相關(guān),依據(jù)6 個(gè)預(yù)后相關(guān)基因構(gòu)建風(fēng)險(xiǎn)評(píng)分系統(tǒng),并進(jìn)行Kaplan-Meier 檢驗(yàn)(P<0.001)(圖2A)及ROC 曲線(圖2B)驗(yàn)證其準(zhǔn)確性(AUC=0.712);獨(dú)立預(yù)后分析結(jié)果顯示6 個(gè)預(yù)后相關(guān)基因構(gòu)建的風(fēng)險(xiǎn)評(píng)分系統(tǒng)可以作為影響患者預(yù)后的獨(dú)立因素(P<0.001)(圖2C 和圖2D);生存與臨床病理信息相關(guān)性分析結(jié)果顯示,患者的性別與預(yù)后無(wú)相關(guān)性(圖2C 和圖2D),進(jìn)而通過(guò)性別分組驗(yàn)證評(píng)分系統(tǒng)的準(zhǔn)確性。通過(guò)將患者的基因表達(dá)量依照性別分成2 組構(gòu)建驗(yàn)證集,結(jié)果顯示男性組低風(fēng)險(xiǎn)組患者預(yù)后好于高風(fēng)險(xiǎn)組(P<0.001)(圖2E),女性組低風(fēng)險(xiǎn)組患者預(yù)后好于高風(fēng)險(xiǎn)組(P=0.027)(圖2F)。以上結(jié)果說(shuō)明ANKZF1、ENO3、G6PC2、GPC1、PPARGC1 和STC2 與患者預(yù)后相關(guān),且與驗(yàn)證結(jié)果一致。
圖2 預(yù)后相關(guān)基因的篩選及驗(yàn)證
2.3 預(yù)后相關(guān)基因與臨床病理信息相關(guān)性分析預(yù)后相關(guān)基因與臨床病理信息相關(guān)性分析結(jié)果顯示(表2),GPC1 與患者(TCGA 數(shù)據(jù)庫(kù)來(lái)源,除去部分信息缺失的患者)的腫瘤分級(jí)、TNM 分期均具有相關(guān)性(P 均<0.05)。推測(cè)GPC1 可能是參與結(jié)直腸癌發(fā)生發(fā)展的關(guān)鍵糖酵解相關(guān)基因。
表2 預(yù)后相關(guān)基因的生存分析及臨床病理特征相關(guān)性
2.4 基因GPC1 在結(jié)直腸癌中差異表達(dá)情況進(jìn)一步研究基因GPC1在TCGA數(shù)據(jù)庫(kù)中的表達(dá),分析發(fā)現(xiàn)GPC1 在COAD 組織中高表達(dá)(P=1.216e?05)(圖3A);分析GPC1 在TCGA 數(shù)據(jù)庫(kù)中82 例(41 例癌組織,41 例癌旁組織)配對(duì)COAD 癌組織及癌旁組織中的表達(dá),發(fā)現(xiàn)GPC1在COAD癌組織中也顯著的高表達(dá)(P=1.792e?05)(圖3B)。推測(cè)GPC1 可能參與結(jié)直腸癌的發(fā)生發(fā)展。
圖3 GPC1在COAD中的表達(dá)差異分析
2.5 基因GPC1 與臨床病理信息的相關(guān)性分析基因GPC1 與臨床病理信息相關(guān)性分析結(jié)果顯示,GPC1與腫瘤分級(jí)和N分期具有極顯著相關(guān)性(圖4C和圖4E),與T 分期、M 分期具有顯著相關(guān)性(圖4D和圖4F),與年齡和性別無(wú)相關(guān)性(圖4A和圖4B)。
2.6 GPC1 生存分析及其與臨床病理信息獨(dú)立預(yù)后分析基因GPC1 的生存KM 分析結(jié)果顯示基因GPC1 高表達(dá)與患者患者不良預(yù)后相關(guān)(P=0.018)(圖5A),即GPC1 高表達(dá)縮短COAD 患者的生存時(shí)間;單因素及多因素Cox 回歸分析獨(dú)立預(yù)后結(jié)果顯示(圖5B 和圖5C),GPC1 不是患者的獨(dú)立預(yù)后影響因子。以上結(jié)果提示,基因GPC1 可能參與患者不良預(yù)后的生物學(xué)過(guò)程。
2.7 基因GPC1 的KEGG 通路富集分析KEGG通路富集結(jié)果是以主要癌癥相關(guān)信號(hào)通路為篩選條件,按照P 值從小到大的順序排列,基因GPC1 主要 影 響NOTCH、WNT、MAPK、VEGF、TGF- β、MTOR、ERBB和P53信號(hào)通路(表3,圖6)。
2.8 基因GPC1 與潛在靶基因的相關(guān)性分析通過(guò)皮爾森檢驗(yàn)基因GPC1 與各信號(hào)通路主要分子的相關(guān)性(圖7),基因GPC1 與TGF 信號(hào)通路和VEGF信號(hào)通路中關(guān)鍵分子比爾森檢驗(yàn)成中等程度相關(guān)(圖7A 和圖7B)。推測(cè)GPC1 可能通過(guò)TGF 信號(hào)通路和VEGF 信號(hào)通路影響結(jié)直腸癌細(xì)胞的增殖、侵襲及結(jié)直腸癌的預(yù)后。
圖4 GPC1與臨床病理信息的相關(guān)性分析
圖5 GPC1基因表達(dá)與生存及臨床病理信息的相關(guān)性分析
表3 基因GPC1單基因GSEA通路富集結(jié)果
圖6 GPC1在主要癌癥相關(guān)信號(hào)通路中的富集分析
圖7 GPC1基因表達(dá)量與主要癌癥信號(hào)中的關(guān)鍵分子皮爾森檢驗(yàn)
葡萄糖是細(xì)胞的主要能源物質(zhì)之一,細(xì)胞依靠葡萄糖的能量代謝進(jìn)行細(xì)胞的生長(zhǎng)和分裂。癌細(xì)胞比正常細(xì)胞消耗更多的葡萄糖,即使在有足夠的氧氣情況下,它們也會(huì)將大多數(shù)葡萄糖代謝為乳酸,此過(guò)程被稱(chēng)作為“Warburg effect”或稱(chēng)“有氧糖酵解”[4],這種行為確實(shí)為癌細(xì)胞提供了一些明顯的優(yōu)勢(shì)。首先,有氧糖酵解與氧化磷酸化相比實(shí)現(xiàn)了更高的ATP 產(chǎn)生率[18]。其次,通過(guò)有氧糖酵解途徑可以提供大量生物合成所需的中間體。第三,有氧糖酵解在維持氧化還原平衡和調(diào)節(jié)染色質(zhì)狀態(tài)中起重要作用。第四,細(xì)胞的有氧糖酵解過(guò)程給細(xì)胞帶來(lái)了低免疫力的微環(huán)境,并增強(qiáng)癌細(xì)胞的侵襲[19]。癌細(xì)胞的糖代謝異常越來(lái)越受到了人們的關(guān)注,大量的研究發(fā)現(xiàn),癌基因通過(guò)糖酵解途徑驅(qū)動(dòng)癌細(xì)胞的發(fā)生發(fā)展[20-22]。然而,糖酵解相關(guān)基因在結(jié)直腸癌中的研究較少,因此,探索糖酵解相關(guān)基因在結(jié)直腸癌發(fā)生發(fā)展的機(jī)制可能是治療結(jié)直腸癌的新途徑。
本研究利用生物信息學(xué)方法,分析糖酵解相關(guān)基因在TCGA 數(shù)據(jù)庫(kù)結(jié)直腸癌樣本中表達(dá)差異,并通過(guò)生存分析獲得預(yù)后相關(guān)基因,最后利用臨床病理信息相關(guān)性分析得到基因GPC1?;騁PC1 是硫酸乙酰肝素蛋白聚糖的編碼基因,在多種癌癥中表達(dá)上調(diào)[23-25],參與多種重要細(xì)胞信號(hào)通路[26]。GPC1 是參與多種重要細(xì)胞信號(hào)通路的多功能表面蛋白聚糖[27],例如生長(zhǎng)因子(FGF2),病毒蛋白,細(xì)胞因子和多胺[28],在人類(lèi)的神經(jīng)膠質(zhì)瘤,胰腺癌和乳腺癌中GPC1 表達(dá)上調(diào)[29-30]。目前,關(guān)于GPC1 通過(guò)糖酵解途徑影響結(jié)直腸癌的功能和機(jī)制缺乏相關(guān)的研究,且除糖酵解途徑外GPC1 如何影響結(jié)直腸癌腫瘤發(fā)生發(fā)展機(jī)制也未清楚。本研究根據(jù)TCGA樣本分析發(fā)現(xiàn),基因GPC1 在COAD 中高表達(dá),且與患者的預(yù)后不良相關(guān)。進(jìn)一步分析發(fā)現(xiàn)GPC1 與COAD 生物學(xué)行為有關(guān),例如GPC1表達(dá)量與患者腫瘤轉(zhuǎn)移相關(guān)。有研究報(bào)道,GPC1 在結(jié)直腸癌腫瘤組織中高表達(dá)[31],miR-96-5p 和miR-149 的過(guò)表達(dá)抑制HT-29 和HCT-116 細(xì)胞中的GPC1 表達(dá)導(dǎo)致促進(jìn)細(xì)胞凋亡并抑制細(xì)胞增殖[32]。為探索GPC1 在結(jié)直腸癌發(fā)生發(fā)展的具體分子機(jī)制,本研究按照GPC1在腫瘤中表達(dá)水平分中位值為界限,分為高、低表達(dá)兩組進(jìn)行GSEA 癌癥主要相關(guān)信號(hào)通路富集。結(jié)果顯示,基因GPC1在TGF信號(hào)通路和VEGF信號(hào)通路中富集(P<0.05),且GPC1 與TGF 信號(hào)通路和VEGF 信號(hào)通路中的關(guān)鍵基因TGF-β1、VEGFB 皮爾森檢驗(yàn)呈中等程度相關(guān)關(guān)系。TGF-β1(轉(zhuǎn)化生長(zhǎng)因子β1)在癌癥中的增殖、分化和凋亡中起著關(guān)鍵的調(diào)節(jié)作用[33-34]。它的上調(diào)抑制了腫瘤的早期生長(zhǎng),但促進(jìn)了腫瘤的晚期生長(zhǎng),從而增強(qiáng)了腫瘤的惡性表 型[33-34]。VEGFB 屬 于VEGF 蛋 白 家 族 成 員 之一[35],與VEGFR1 結(jié)合[35]。VEGF mRNA 在大多數(shù)人類(lèi)腫瘤中過(guò)表達(dá),且與浸潤(rùn)性、血管密度、轉(zhuǎn)移、復(fù)發(fā)和預(yù)后相關(guān)[36]?;谝陨辖Y(jié)果推測(cè)基因GPC1可能通過(guò)TGF-β1增強(qiáng)TGF 信號(hào)通路,通過(guò)VEGFB增強(qiáng)VEGF信號(hào)通路在癌癥中的作用。
在本研究中,通過(guò)TCGA 數(shù)據(jù)庫(kù)中的COAD 樣本分析,發(fā)現(xiàn)糖酵解相關(guān)基因在腫瘤組織與正常組織中表達(dá)差異,利用單因素及多因素Cox 回歸分析得到預(yù)后相關(guān)基因,并進(jìn)一步分析預(yù)后相關(guān)基因與臨床病理信息的相關(guān)性,進(jìn)而得到目的基因GPC1。最后通過(guò)GSEA 富集分析及皮爾森檢驗(yàn)得到GPC1在結(jié)直腸癌作用的可能分子通路。本研究通過(guò)生物信息學(xué)方法對(duì)基因GPC1 進(jìn)行深入的研究,在結(jié)直腸癌中的生物學(xué)行為及分子作用機(jī)制未得到實(shí)驗(yàn)驗(yàn)證。本研究的分析結(jié)果可能會(huì)對(duì)在結(jié)直腸癌的細(xì)胞糖酵解實(shí)驗(yàn)研究提供理論方向,也可能會(huì)成為治療結(jié)直腸癌的新策略。