成天瓊,陳學(xué)農(nóng)
(1.遵義醫(yī)科大學(xué) 研究生院,貴州 遵義 563099;2.遵義醫(yī)科大學(xué)附屬醫(yī)院 針灸科,貴州 遵義 563099)
結(jié)腸癌(Colon cancer,CC)是世界上常見(jiàn)的侵襲性消化道腫瘤,隨著中國(guó)經(jīng)濟(jì)和生活方式的改善,中國(guó)的結(jié)腸癌發(fā)病率近年來(lái)總體呈上升趨勢(shì)[1-2]。盡管對(duì)治療方案的改進(jìn)如靶向治療等已大大改善了結(jié)腸癌患者的臨床結(jié)局,但大多數(shù)患者由于局部復(fù)發(fā)和遠(yuǎn)處轉(zhuǎn)移而使治療失敗。因此,預(yù)測(cè)遠(yuǎn)處轉(zhuǎn)移和不良預(yù)后的風(fēng)險(xiǎn)對(duì)結(jié)腸癌的治療至關(guān)重要。最近,越來(lái)越多的證據(jù)表明癌細(xì)胞的代謝與其來(lái)源的正常細(xì)胞有很大不同[3]。癌細(xì)胞中的葡萄糖代謝主要特征是葡萄糖攝取增加和有氧糖酵解增強(qiáng)[4]。糖酵解增強(qiáng)和谷氨酰胺分解是癌癥代謝重編程的主要標(biāo)志,代謝重編程和低氧導(dǎo)致多種癌癥對(duì)傳統(tǒng)化療藥物的抵抗,這使癌細(xì)胞能夠維持較高的增殖速率并抵抗某些細(xì)胞死亡信號(hào)[5-6],這種現(xiàn)象是發(fā)現(xiàn)新的治療靶標(biāo)和新的抗癌藥物的焦點(diǎn)。除了提供細(xì)胞能量外,糖酵解的代謝中間體在大分子生物合成中也起著關(guān)鍵作用,因此在營(yíng)養(yǎng)供應(yīng)減少的情況下賦予了癌細(xì)胞更多的優(yōu)勢(shì)[4]。糖酵解的致癌調(diào)控和糖酵解成分的多方面作用表明了腫瘤糖酵解的生物學(xué)意義,有必要闡明結(jié)腸癌糖酵解的潛在機(jī)制?;诖吮尘?,本研究用來(lái)自TCGA的結(jié)腸癌mRNA表達(dá)數(shù)據(jù)鑒定出與糖酵解顯著相關(guān)的231個(gè)mRNA,并開(kāi)發(fā)了一個(gè)4糖酵解基因風(fēng)險(xiǎn)譜來(lái)有效地預(yù)測(cè)CC患者的預(yù)后,為CC的診斷和治療提供了新的靶標(biāo),可促進(jìn)人類(lèi)對(duì)CC發(fā)病機(jī)理的認(rèn)識(shí)并提高診斷和治療水平。
1.1 臨床信息和mRNA表達(dá)數(shù)據(jù)收集 從TCGA(https://cancergenome.nih.gov/)中下載結(jié)腸癌患者的臨床數(shù)據(jù)和mRNA表達(dá)譜。一共包括473個(gè)CC樣本和41個(gè)相鄰的正常組織樣本。提取具有完整臨床信息的444例結(jié)腸癌患者資料,包括性別、年齡、TNM分期、生存時(shí)間和生存狀態(tài)等。
1.2 數(shù)據(jù)處理和風(fēng)險(xiǎn)參數(shù)計(jì)算進(jìn)行基因富集分析 確定CC和正常組之間所鑒定的糖酵解相關(guān)基因集是否存在顯著差異。接下來(lái),分析CC樣品和鄰近的非癌性組織中mRNA的表達(dá)水平,借助R語(yǔ)言limma包,以|log2|>1且P<0.05為篩選標(biāo)準(zhǔn),提取差異表達(dá)的糖酵解基因。使用單變量Cox回歸分析確定與總體生存率(Overall survival,OS)相關(guān)的糖酵解相關(guān)基因,然后對(duì)其進(jìn)行多變量Cox回歸以篩選與預(yù)后有關(guān)的糖酵解基因并獲得風(fēng)險(xiǎn)比(Hazard ratio,HR)。然后將篩選的糖酵解基因分為危險(xiǎn)型(HR> 1)和保護(hù)型(0
1.3 統(tǒng)計(jì)學(xué)分析 使用Kaplan-Meier生存曲線和對(duì)數(shù)秩方法(Log-rank)估計(jì)風(fēng)險(xiǎn)參數(shù)的準(zhǔn)確性。然后進(jìn)行多變量Cox分析以檢測(cè)風(fēng)險(xiǎn)參數(shù)是否獨(dú)立于其它臨床特征,以上所有統(tǒng)計(jì)分析均使用R 3.6.1(www.r-project.org)進(jìn)行,P<0.05具有統(tǒng)計(jì)學(xué)意義。
2.1 篩選預(yù)后相關(guān)糖酵解基因 首先,我們獲得了473例CC患者的臨床數(shù)據(jù)和mRNA的表達(dá)數(shù)據(jù)集。GSEA確定glycolytic process、hallmark glycolysis、reactome glycolysis三個(gè)糖酵解相關(guān)基因集在CC中上調(diào)(見(jiàn)圖1)。使用Wilcoxon秩和檢驗(yàn)分析了473個(gè)CC和41個(gè)正常癌旁樣品中326個(gè)糖酵解相關(guān)基因的表達(dá),并鑒定了231個(gè)差異表達(dá)的糖酵解相關(guān)基因(FDR<0.05,|log2FC|>1)。
A:glycolytic process;B:hallmark glycolysis;C:reactome glycolysis。圖1 正常組織和結(jié)腸癌組織3個(gè)糖酵解基因集的GSEA富集
對(duì)CC中326個(gè)差異表達(dá)的糖酵解相關(guān)基因的表達(dá)進(jìn)行單變量Cox回歸分析,以鑒定預(yù)后相關(guān)的糖酵解差異表達(dá)基因。數(shù)據(jù)顯示,6個(gè)差異表達(dá)的糖酵解相關(guān)基因的表達(dá)與CC患者的OS相關(guān)(P<0.05)。接下來(lái),進(jìn)行多變量Cox回歸分析進(jìn)一步確定STC2、ANKZF1、GPC1、PPARGC1A四個(gè)糖酵解相關(guān)基因?yàn)镃C的獨(dú)立預(yù)后標(biāo)志物。STC2,ANKZF1 和 GPC1是高風(fēng)險(xiǎn)基因,HR> 1是危險(xiǎn)因素,患者生存率較低;PPARGC1A是保護(hù)性基因,HR <1是保護(hù)因素,患者生存率較高(見(jiàn)表1)。
表1 結(jié)腸癌中4個(gè)OS相關(guān)糖酵解基因
我們通過(guò)分析cBioPortal數(shù)據(jù)庫(kù)(http://cbioportal.org)中的526個(gè)CC樣品,評(píng)估了4個(gè)風(fēng)險(xiǎn)基因的改變。結(jié)果顯示,共42例(8%)的樣品查詢(xún)的風(fēng)險(xiǎn)基因發(fā)生突變。STC2基因、ANKZF1基因各在1.3%的病例發(fā)生錯(cuò)義突變;GPC1基因在2.3%的病例中發(fā)生改變,表現(xiàn)為截?cái)嗤蛔儭㈠e(cuò)義突變和深度刪除;PPARGC1A基因在4%的病例中發(fā)生了改變(見(jiàn)圖2A)。相鄰的正常組織和CC組織之間的4個(gè)基因的表達(dá)差異的比較發(fā)現(xiàn)在結(jié)腸癌組織中4個(gè)糖酵解基因中STC2(見(jiàn)圖2B)、ANKZF1(見(jiàn)圖2C)、GPC1(見(jiàn)圖2D)顯著上調(diào);PPARGC1A(見(jiàn)圖2E)顯著下調(diào)。
A:526個(gè)結(jié)腸癌臨床樣本中選定糖酵解基因的改變;B-E:4種選定糖酵解基因的表達(dá)。圖2 鑒定與患者生存有關(guān)的mRNA
2.2 基于糖酵解基因標(biāo)簽的預(yù)后風(fēng)險(xiǎn)評(píng)分模型的建立與驗(yàn)證 通過(guò)線性組合所選基因的表達(dá)值,這些基因的權(quán)重由多變量Cox回歸分析的系數(shù)加權(quán)而來(lái),我們建立了以下預(yù)后風(fēng)險(xiǎn)參數(shù)公式。風(fēng)險(xiǎn)參數(shù)= 0.0511×SCT2的表達(dá)+0.0806×ANKZF1的表達(dá)+ 0.0328×GPC1的表達(dá)+ (-0.2469)×PPARGC1A的表達(dá)。計(jì)算每個(gè)患者的風(fēng)險(xiǎn)參數(shù),并使用中位數(shù)將患者分為高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組?;颊叩娘L(fēng)險(xiǎn)評(píng)分分布(見(jiàn)圖3A)和生存狀況(見(jiàn)圖3B)如圖所示。Kaplan -Meier曲線顯示,高風(fēng)險(xiǎn)分組的患者預(yù)后較差,而低風(fēng)險(xiǎn)參數(shù)組的患者死亡率較低(對(duì)數(shù)秩檢驗(yàn):P<0.001,見(jiàn)圖3C)。此外,熱圖顯示了4種mRNA的表達(dá)譜(見(jiàn)圖3D),與低風(fēng)險(xiǎn)組相比,高風(fēng)險(xiǎn)組中風(fēng)險(xiǎn)型mRNA(STC2,ANKZF1和 GPC1)的表達(dá)水平更高。相反,高風(fēng)險(xiǎn)組中保護(hù)型mRNA(PPARGC1A)的表達(dá)水平低于低風(fēng)險(xiǎn)組。使用ROC曲線測(cè)量了5年OS的預(yù)后風(fēng)險(xiǎn)模型的預(yù)測(cè)性能,AUC值為0.704(見(jiàn)圖3E)。
A:患者的mRNA風(fēng)險(xiǎn)參數(shù)分布;B:結(jié)腸癌患者的生存狀況(紅點(diǎn)表示死亡的患者,藍(lán)點(diǎn)表示存活的患者;C:高風(fēng)險(xiǎn)分(紅線)和低風(fēng)險(xiǎn)分(藍(lán)線)患者的 OS 的 Kaplan-Meier 生存曲線;D:四個(gè)糖酵解基因表達(dá)譜的熱圖;E:ROC 曲線顯示結(jié)腸癌患者在5年 OS 時(shí)的 AUC 值,AUC=0.704。圖3 與風(fēng)險(xiǎn)參數(shù)相關(guān)的4糖酵解基因可預(yù)測(cè)結(jié)腸癌患者的OS
通過(guò)單因素和多因素分析將風(fēng)險(xiǎn)參數(shù)的預(yù)后價(jià)值與臨床病理參數(shù)進(jìn)行比較。選擇具有完整臨床數(shù)據(jù)的樣品(見(jiàn)表2),444名CC患者的中位年齡為69歲。在441例患者中,有76例(17.2%)患有Ⅰ期腫瘤,有178例(40.3%)患有Ⅱ期腫瘤,125例(28.3%)患有Ⅲ期腫瘤, 62例(14.0%)患有Ⅳ期腫瘤。我們將風(fēng)險(xiǎn)評(píng)分、TNM分期、年齡作為獨(dú)立的預(yù)后指標(biāo),因?yàn)檫@些因素在單變量(見(jiàn)圖4A)和多變量(見(jiàn)圖4B)分析中均有差異。值得注意的是,風(fēng)險(xiǎn)參數(shù)顯示出顯著的預(yù)后價(jià)值(P<0.001)。
表2 結(jié)腸癌患者臨床病理資料
Kaplan-Meier生存曲線和對(duì)數(shù)秩檢驗(yàn)顯示高危組的患者預(yù)后較差,OS的單變量Cox回歸分析顯示了一些可預(yù)測(cè)CC生存的臨床病理參數(shù),包括年齡,TNM分期和風(fēng)險(xiǎn)評(píng)分。然后,我們使用Kaplan-Meier生存曲線來(lái)驗(yàn)證上述結(jié)論,該結(jié)論顯示出一致的結(jié)果,年齡大于65歲(見(jiàn)圖4C),T3-4期(見(jiàn)圖4D),M1期(見(jiàn)圖4E),N1-2期(見(jiàn)圖4F)與預(yù)后不良相關(guān)。這些結(jié)果進(jìn)一步證實(shí)了分析的可靠性。經(jīng)過(guò)進(jìn)一步的數(shù)據(jù)挖掘和分層分析后,生存曲線未受年齡(≤65或者>65歲)的影響,可認(rèn)為4個(gè)糖酵解基因是CC患者的可靠預(yù)后指標(biāo),其中高危組的患者預(yù)后較差(見(jiàn)圖5A)。在男女兩個(gè)亞組高風(fēng)險(xiǎn)評(píng)分組患者預(yù)后較差,基于糖酵解基因標(biāo)簽的風(fēng)險(xiǎn)參數(shù)可用于預(yù)測(cè)CC患者的預(yù)后(見(jiàn)圖5B)。但是,當(dāng)我們根據(jù)TNM將CC患者分為不同亞組時(shí),風(fēng)險(xiǎn)參數(shù)不再可以單獨(dú)用作T1-2、N0和M1亞組的預(yù)后指標(biāo)(見(jiàn)圖5C),表明該風(fēng)險(xiǎn)參數(shù)受CC患者TNM分期的影響,這一點(diǎn)需要進(jìn)一步探索。
A:?jiǎn)我蛩谻ox;B:多因素Cox;C-F:風(fēng)險(xiǎn)評(píng)分分布與臨床參數(shù)之間的關(guān)系。圖4 CC患者OS的Cox回歸分析
A:年齡;B:性別;C:TNM分期。圖5 Kaplan-Meier曲線評(píng)估臨床特征分組患者的風(fēng)險(xiǎn)參數(shù)的預(yù)后價(jià)值
最近的研究表明,年齡和轉(zhuǎn)移、分期等臨床病理特征不足以精確地預(yù)測(cè)癌癥患者的預(yù)后,于是越來(lái)越多的mRNA被鑒定為腫瘤進(jìn)展或預(yù)后的生物標(biāo)志物。例如Deepankar Chakroborty等[7]的研究表明L1TD1是結(jié)腸癌的預(yù)后標(biāo)志;Piero Dalerba等[8]認(rèn)為CDX2可作為II期和III期結(jié)腸癌的預(yù)后生物標(biāo)志物;鄭紅等[9]的研究表明USP6不僅可作為結(jié)腸癌獨(dú)立預(yù)后因素,還促進(jìn)結(jié)腸癌的侵襲和轉(zhuǎn)移。然而,這些生物標(biāo)記物,特別是單個(gè)基因表達(dá)水平可能受到多種因素的影響,不足以準(zhǔn)確獨(dú)立地預(yù)測(cè)患者的預(yù)后,從而阻止了這些標(biāo)記物被用作可靠和獨(dú)立的預(yù)后指標(biāo)。因此,本研究使用由多個(gè)預(yù)后相關(guān)標(biāo)志物組成的統(tǒng)計(jì)模型,結(jié)合每個(gè)組成糖酵解基因的預(yù)測(cè)效果以改善預(yù)測(cè)能力。在評(píng)估腫瘤患者的預(yù)后方面,該類(lèi)模型比使用單一生物標(biāo)志物準(zhǔn)確[10- 11],故這種模型得以廣泛應(yīng)用。
高通量基因測(cè)序技術(shù)的飛速發(fā)展為大型生物數(shù)據(jù)研究奠定了基礎(chǔ)[12-13],從單個(gè)標(biāo)本中提取大量的基因組數(shù)據(jù),可以鑒定新的診斷、預(yù)后或藥理生物標(biāo)志物[14]。在最近的研究中,常常通過(guò)使用微陣列和RNA測(cè)序數(shù)據(jù)構(gòu)建基因表達(dá)水平或突變新的預(yù)后標(biāo)志,然后使用Cox比例風(fēng)險(xiǎn)回歸模型進(jìn)行識(shí)別和驗(yàn)證[15-16]。在當(dāng)前的研究中,我們確定了3個(gè)在GSEA中顯示出顯著差異的糖酵解基因集。進(jìn)行單因素和多因素Cox回歸分析最終確定出4種糖酵解基因組合對(duì)CC患者有預(yù)后預(yù)測(cè)價(jià)值。我們使用TCGA中的CC數(shù)據(jù)集收集糖酵解相關(guān)基因并比較正常和CC組織的數(shù)據(jù)。Kaplan-Meier生存估計(jì)顯示低風(fēng)險(xiǎn)參數(shù)的患者預(yù)后較好。但是,由于TCGA數(shù)據(jù)庫(kù)中缺乏患者的轉(zhuǎn)移和復(fù)發(fā)信息,我們只能使用OS評(píng)估患者的預(yù)后,這是我們研究的局限性之一。此外,在分層分析中,當(dāng)我們根據(jù)TNM將CC患者分為不同亞組時(shí),風(fēng)險(xiǎn)參數(shù)不再可以單獨(dú)用作T1-2、N0和M1亞組的預(yù)后指標(biāo),表明該風(fēng)險(xiǎn)參數(shù)受CC患者TNM分期的影響,這一點(diǎn)需要進(jìn)一步探索。在這項(xiàng)研究中,用生物信息學(xué)方法探索mRNA危險(xiǎn)因素的特征及其臨床意義,并探索了一種新的挖掘潛在預(yù)后標(biāo)志物的方法。
腫瘤的特征在于不受控制的細(xì)胞增殖,這不僅消除了對(duì)細(xì)胞周期的控制,而且還促進(jìn)了細(xì)胞能量代謝,最終導(dǎo)致腫瘤細(xì)胞的生長(zhǎng)和分化[17]。早在1920年,德國(guó)生物學(xué)家?jiàn)W托·沃伯格(Otto Warburg)發(fā)現(xiàn)了癌細(xì)胞中能量代謝的異常[18]。細(xì)胞能量主要來(lái)自糖代謝,大部分能量由ATP提供,盡管有氧氣,但腫瘤細(xì)胞主要依靠糖酵解來(lái)進(jìn)行代謝,并消耗大量葡萄糖且伴有乳酸的產(chǎn)生。葡萄糖代謝異常的這種現(xiàn)象被稱(chēng)為有氧糖酵解或Warburg效應(yīng)[19]。很多惡性腫瘤中糖酵解增強(qiáng),包括CC,其促進(jìn)合成代謝,與腫瘤的發(fā)生發(fā)展息息相關(guān)[20]。研究表明,腫瘤細(xì)胞能量異常,可以通過(guò)調(diào)節(jié)底物的攝取和與糖酵解相關(guān)的酶來(lái)精確調(diào)節(jié)ATP的合成,使其適應(yīng)營(yíng)養(yǎng)微環(huán)境,滿(mǎn)足惡性增殖所需的能量和營(yíng)養(yǎng),并迅速增殖[21]。Sun等[22]的研究表明二氯乙酸逆轉(zhuǎn)糖酵解表型可在體內(nèi)外抑制轉(zhuǎn)移性乳腺癌細(xì)胞的生長(zhǎng)。Xu等[23]報(bào)道了抑制癌細(xì)胞中糖酵解作用是克服與線粒體呼吸缺陷和缺氧有關(guān)耐藥性的新策略。最近的研究表明,有氧糖酵解在CC中起重要作用,白介素22通過(guò)靶向調(diào)控己糖激酶-2促進(jìn)人結(jié)腸癌細(xì)胞有氧糖酵解和CC的進(jìn)展[24]。NDRG2通過(guò)抑制糖酵解和谷氨酰胺分解抑制大腸癌細(xì)胞的生長(zhǎng)和增殖[25]。有研究表明,酪蛋白激酶1δ(CK1δ)和酪蛋白激酶1ε(CK1ε)參與DNA復(fù)制、分化和凋亡,從而參與腫瘤發(fā)生發(fā)展的調(diào)節(jié)。CK1δ/ε的特異性抑制劑IC261可以抑制結(jié)腸癌細(xì)胞的生長(zhǎng),并增加有氧糖酵解的水平,這是由p53依賴(lài)性方式調(diào)節(jié)的,表明靶向調(diào)控CK1δ/ε和糖酵解可能是結(jié)腸癌的另一治療方向[26]。但是,尚未建立基于糖酵解相關(guān)基因標(biāo)簽的結(jié)腸癌預(yù)后評(píng)分系統(tǒng)。故我們使用生物信息學(xué)方法,確定了與細(xì)胞有氧糖酵解相關(guān)的基因(STC2、ANKZF1、GPC1和PPARGC1A),并證明了其在CC中的預(yù)后價(jià)值。該風(fēng)險(xiǎn)評(píng)分模型還需要在多中心臨床試驗(yàn)和前瞻性研究中進(jìn)一步驗(yàn)證。
STC2是一種分泌型糖蛋白激素,可調(diào)節(jié)許多生物學(xué)過(guò)程,包括細(xì)胞增殖、凋亡、腫瘤發(fā)生和動(dòng)脈粥樣硬化[27]。最近的研究表明,STC2表達(dá)在多種腫瘤中上調(diào),包括結(jié)腸癌, STC2過(guò)表達(dá)與晚期腫瘤分級(jí)、腫瘤浸潤(rùn)、轉(zhuǎn)移和不良預(yù)后相關(guān)[28]。沉默STC2后,大腸癌細(xì)胞的生存能力、遷移和侵襲顯著降低[29]。ANKZF1促進(jìn)結(jié)腸癌的血管生成,這可能解釋為什么ANKZF1上調(diào)與結(jié)腸癌的不良OS相關(guān),ANKZF1可能是特異性的結(jié)腸癌的標(biāo)志物,將來(lái)可能會(huì)用于個(gè)性化藥物[30]。GPC1外泌體及其調(diào)控性miRNA是檢測(cè)和靶向治療結(jié)直腸癌的特異性標(biāo)志物[31]。PPARGC1A調(diào)節(jié)線粒體的生物發(fā)生,減少血管平滑肌細(xì)胞的衰老,通過(guò)協(xié)調(diào)參與葡萄糖和脂肪酸代謝的多種基因的表達(dá),在代謝重編程中起著至關(guān)重要的作用[32],葡萄糖代謝和缺氧可以促進(jìn)腫瘤進(jìn)展。使用Kaplan-Meier分析和Cox回歸分析,我們發(fā)現(xiàn)高STC2、ANKZF1、GPC1表達(dá)結(jié)腸癌患者的OS較差。STC2、ANKZF1、GPC1、PPARGC1A可能是診斷和評(píng)估結(jié)腸癌患者預(yù)后的潛在腫瘤生物標(biāo)志物。
總之,本研究基于4個(gè)糖酵解相關(guān)基因的表達(dá)水平構(gòu)建了新的結(jié)腸癌預(yù)測(cè)風(fēng)險(xiǎn)評(píng)分模型,可預(yù)測(cè)CC患者的預(yù)后,較高的風(fēng)險(xiǎn)參數(shù)表明CC預(yù)后較差。這些結(jié)果為開(kāi)發(fā)結(jié)腸癌細(xì)胞能量代謝為靶點(diǎn)的藥物及為結(jié)腸癌的臨床治療提供了新的思路和方法。