張思嘉,蔡 挺,張 順
(中國(guó)科學(xué)院大學(xué) 寧波華美醫(yī)院醫(yī)學(xué)實(shí)驗(yàn)部,浙江 寧波 315100)
肝癌是目前我國(guó)第4位常見(jiàn)惡性腫瘤及第2位腫瘤致死病因,全世界每年近一半的新發(fā)和死亡病例發(fā)生在中國(guó)[1]。目前原發(fā)性肝癌的治療方法雖然很多,但腫瘤治療的預(yù)后效果仍不理想:HCC首選方法是手術(shù)切除,但由于其起病隱蔽,確診時(shí)患者多已中晚期,失去手術(shù)切除機(jī)會(huì)[2]。而傳統(tǒng)的放化療等手段預(yù)后較差,不良反應(yīng)較多,這使目前我國(guó)HCC的臨床治療充滿挑戰(zhàn),急需新的治療策略來(lái)改善肝癌患者的生存質(zhì)量。
肝癌發(fā)生是多因素、多步驟和受多種機(jī)制調(diào)控的復(fù)雜過(guò)程,具有高度異質(zhì)性。目前針對(duì)肝癌的大體分型和組織病理學(xué)分型是制定臨床治療方案,預(yù)測(cè)判斷患者的預(yù)后與轉(zhuǎn)歸的重要依據(jù)。但實(shí)踐表明許多具有相同類型和相同分期的肝癌的患者應(yīng)用相似的臨床治療手段,其預(yù)后的差別很大,這與肝癌極其復(fù)雜的腫瘤異質(zhì)性密切相關(guān)。因此迫切需要新的分期分型指標(biāo)以助力肝癌精準(zhǔn)診斷與治療,以提高患者生存率。隨著二代測(cè)序(Next-generation Sequencing,NGS)技術(shù),基因組、轉(zhuǎn)錄組、單細(xì)胞測(cè)序等多組學(xué)的發(fā)展,這些技術(shù)逐漸被應(yīng)用于腫瘤的發(fā)病機(jī)制的研究以及分子分型的判斷中,并為診治手段及預(yù)后分析提供重要信息[3-4]。而基于腫瘤分子異質(zhì)性的個(gè)體化精準(zhǔn)診療已成為未來(lái)惡性腫瘤診療的發(fā)展方向:該診療方式將傳統(tǒng)的肝癌臨床病理分型和分期與肝癌的分子表型相結(jié)合,對(duì)肝癌患者進(jìn)行更加細(xì)致的亞群劃分,并在這一基礎(chǔ)上將手術(shù)、放療、化療、免疫治療、分子靶向治療等手段,按照患者的個(gè)體化特征定制精準(zhǔn)治療方案,從而大幅度提高治療手段的針對(duì)性和治療效果[5-6]。
單核苷酸多態(tài)性(SNPs)是指基因組DNA序列中由于單個(gè)核苷酸替換而引起的多態(tài)性,是最普遍的遺傳變異形式。絕大多數(shù)SNP并不影響蛋白序列,而是通過(guò)對(duì)基因表達(dá)的調(diào)控對(duì)生物個(gè)體產(chǎn)生影響[7]。越來(lái)越多的臨床研究證實(shí),通過(guò)監(jiān)測(cè)腫瘤患者中生物標(biāo)志物的SNP突變、mRNA及蛋白的表達(dá)水平的異常變化,來(lái)評(píng)價(jià)預(yù)后并指導(dǎo)臨床個(gè)體化治療,可提高療效果,減輕不良反應(yīng),促進(jìn)醫(yī)療資源的合理利用[8-10]。本研究利用肝癌患者的轉(zhuǎn)錄組和SNP突變數(shù)據(jù),對(duì)樣本進(jìn)行分子分型并分析不同分型間的生物學(xué)差異,有利于進(jìn)一步認(rèn)識(shí)肝癌發(fā)生和進(jìn)展的過(guò)程,并對(duì)肝癌的臨床診斷和治療選擇以及預(yù)后預(yù)測(cè)具有一定的參考價(jià)值。
本研究涉及的359例肝細(xì)胞癌患者的mRNA表達(dá)數(shù)據(jù)、單核苷酸突變數(shù)據(jù)及臨床數(shù)據(jù)下載于TCGA在線公共數(shù)據(jù)庫(kù)(https://portal.gdc.cancer.gov)。
1.2.1 SNP突變與mRNA表達(dá)譜聯(lián)合分析
單核苷酸突變(SNP)可以通過(guò)影響基因編碼和剪接影響基因表達(dá)[11]。本研究通過(guò)對(duì)肝癌患者SNP突變數(shù)據(jù)和mRNA表達(dá)譜的聯(lián)合分析,篩選出因單核苷酸突變引起表達(dá)水平變化的差異基因,具體實(shí)施方式如下:首先根據(jù)SNP突變數(shù)據(jù)中基因是否發(fā)生突變,將肝癌患者劃分為野生型和突變型兩組,再通過(guò)wilcoxon秩和檢驗(yàn)比較野生型和突變型肝癌患者中的表達(dá)水平,其中表達(dá)水平存在存在顯著差異的基因作為單核苷酸突變差異表達(dá)基因(取P<0.01為差異具有統(tǒng)計(jì)學(xué)意義)。最后運(yùn)用KEGG數(shù)據(jù)庫(kù)通路富集和基因功能注釋的信息,對(duì)單核苷酸突變表達(dá)差異基因進(jìn)行功能聚類分析和代謝途徑分析,并選取與癌癥相關(guān)的單核苷酸突變差異表達(dá)基因進(jìn)行后續(xù)分析。
1.2.2 蛋白互作網(wǎng)絡(luò)的構(gòu)建與樞紐基因的篩選
將與癌癥相關(guān)的單核苷酸突變差異表達(dá)基因?qū)隨TRING數(shù)據(jù)庫(kù)(https://www.string-db.org),得到相互作用的網(wǎng)絡(luò)節(jié)點(diǎn)文件,再通過(guò)Cytoscape軟件對(duì)蛋白-蛋白相互作用網(wǎng)絡(luò)PPI(Protein-protein Interaction)進(jìn)行可視化處理,同時(shí)用插件CytoHubba對(duì)PPI網(wǎng)絡(luò)進(jìn)行模塊分析,選取出10個(gè)連接度最高的Hub 基因作為肝癌分子分型的潛在特征和重要依據(jù)。
1.2.3 肝癌患者分子分型與預(yù)后分析
非負(fù)矩陣分解(Nonnegative Matrix Factorization,NMF)屬于雙向聚類,具有良好的可解釋性和數(shù)值結(jié)果,該方法已廣泛用于基因表達(dá)譜數(shù)據(jù)的癌癥分類[12-14]。本研究利用R語(yǔ)言中的“Consensus ClusterPlus”分析包,根據(jù)肝癌患者10個(gè)hub基因的mRNA表達(dá)量構(gòu)建NMF分子分型模型,聚類數(shù)k值取2~8,根據(jù)聚類效果選取具有較好聚類穩(wěn)定性的k值用于分子分型的劃分,并進(jìn)一步將樣本的基因表達(dá)數(shù)據(jù)和臨床預(yù)后信息整合,去除生存時(shí)間小于30天的樣本,再利用R軟件中的"Survival"包,對(duì)不同分子分型的肝癌患者進(jìn)行Kaplan-Meier 生存分析及l(fā)og-rank檢驗(yàn),判斷不同分子分型患者的生存預(yù)后是否具有顯著性差異。
1.2.4 不同分子分型肝癌患者轉(zhuǎn)錄組特征對(duì)比
首先采用R軟件的DESeq2軟件包,對(duì)不同分子分型患者的基因轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行差異表達(dá)分析,差異基因的篩選標(biāo)準(zhǔn)為:算法矯正假發(fā)現(xiàn)率(FDR)<0.05,差異倍數(shù)(Fold change)> 1。再結(jié)合樣本的分子分型分組,針對(duì)差異表達(dá)基因利用R軟件的WGCNA 軟件包進(jìn)行加權(quán)共表達(dá)網(wǎng)絡(luò)分析,具體步驟如下:1)構(gòu)建基因共表達(dá)相似性矩陣,確定軟閾值后再將相似性矩陣轉(zhuǎn)換為鄰接矩陣。2)將鄰接矩陣轉(zhuǎn)換成拓?fù)渚仃嚕⒉捎猛負(fù)涓采w法對(duì)差異基因進(jìn)行層次聚類,按照混合動(dòng)態(tài)剪切樹(shù)的方法確定基因模塊,同時(shí)繪制樹(shù)狀圖并對(duì)基因模塊進(jìn)行可視化,其中每個(gè)模塊的最小基因數(shù)目為30。3)將基因模塊與分子分型進(jìn)行關(guān)聯(lián),尋找與2種分子分型最顯著相關(guān)的基因模塊[15]。并對(duì)與分子分型相關(guān)的基因模塊中的基因利用R軟件“Cluster Profiler”包進(jìn)行KEGG富集分析,預(yù)測(cè)與2種肝癌分子分型相關(guān)的功能和信號(hào)通路。
通過(guò)對(duì)癌癥基因組圖譜(TCGA)數(shù)據(jù)庫(kù)中獲得肝癌患者SNP突變數(shù)據(jù)的統(tǒng)計(jì)分析,共發(fā)現(xiàn)1 932種突變率大于5%的突變基因。根據(jù)基因是否發(fā)生突變,并通過(guò)對(duì)突變基因在突變型和野生型兩組患者mRNA表達(dá)譜的差異分析,確定561種在突變前后的表達(dá)水平發(fā)生顯著性變化的基因作為單核苷酸突變差異表達(dá)基因,進(jìn)一步通過(guò)Gene ontology (GO)富集分析進(jìn)行篩選,最終共得到64種與癌癥發(fā)生發(fā)展相關(guān)的單核苷酸突變差異表達(dá)基因。將上述基因輸入STRING網(wǎng)站,導(dǎo)入Cytoscape軟件得到可視化PPI網(wǎng)絡(luò)圖,顯示有58個(gè)節(jié)點(diǎn)和220個(gè)邊(見(jiàn)圖1)。運(yùn)用CytoHubba插件,計(jì)算每個(gè)基因得連接度,得分最高的前10個(gè)基因作為hub基因(見(jiàn)表1)。其中大多數(shù)核心基因的SNP突變與多種腫瘤有關(guān),比如單核苷酸突變引起的KRAS激活可導(dǎo)致多種惡性腫瘤,包括肺腺癌、粘液腺瘤、胰腺導(dǎo)管癌和大腸癌;SMAD4作為一種腫瘤抑制基因,其突變失活引起的TGF-β信號(hào)轉(zhuǎn)導(dǎo)紊亂導(dǎo)致對(duì)腫瘤細(xì)胞生長(zhǎng)抑制作用的逃逸[16]。TSC2是常染色體基因,在體內(nèi)作為抑癌基因廣泛表達(dá)[17]。STK11突變導(dǎo)致的表達(dá)缺失已被證明是腸道息肉綜合征(PJS)重要致病原因并與散發(fā)性的結(jié)直腸癌直接相關(guān)[18]。TP53基因(編碼p53蛋白)作為一個(gè)重要的抑瘤癌基因,通過(guò)調(diào)控一系列信號(hào)轉(zhuǎn)導(dǎo)通路廣泛參與了多種惡性腫瘤的發(fā)生發(fā)展,TP53突變?cè)诟伟┲杏兄^為明顯的特征[19]。CTNNB1是Wnt通路的關(guān)鍵成員,參與細(xì)胞間黏附以及細(xì)胞間信號(hào)傳遞,與腫瘤的形成和浸潤(rùn),轉(zhuǎn)移密不可分[20]。mTOR控制蛋白質(zhì)合成、細(xì)胞生長(zhǎng)和增殖,是PI3K—Akt—mTOR信號(hào)通路的核心基因[21]。對(duì)10種hub基因進(jìn)行進(jìn)一步生存分析,發(fā)現(xiàn)共有7種hub基因與肝癌患者生存預(yù)后顯著相關(guān)。其中高表達(dá)的CDKN2A、KARS是預(yù)后的危險(xiǎn)因素,低表達(dá)的FOXO1、CDKN1A、MTOR、STK11、TP53是預(yù)后的危險(xiǎn)因素。由此可見(jiàn)Hub基因的表達(dá)異常與肝癌患者的預(yù)后關(guān)系密切,這些Hub基因有望成為肝癌患者早期診斷、治療及預(yù)后判斷的重要靶點(diǎn)。
表1 蛋白質(zhì)互作網(wǎng)絡(luò)中連接度排名前 10 核心基因及生存分析結(jié)果4Table 1 Ten hub genes in PPI networkand survival analysis(top ten in connectivity)
圖1 突變后表達(dá)顯著差異的癌癥相關(guān)基因構(gòu)建的PPI網(wǎng)絡(luò)和hub基因模塊Fig.1 PPI network and hub gene module of cancer-associated genes which are significant differentially expressed after mutation
基于2.1篩選出的10個(gè)hub基因的表達(dá)量,運(yùn)用非負(fù)矩陣因子分解(NMF)算法對(duì)肝癌患者進(jìn)行分子分型。綜合判斷聚類穩(wěn)定性,發(fā)現(xiàn)當(dāng)k=2時(shí),即肝癌樣本分為2種分子分型時(shí),模型的穩(wěn)定性較好且樣本分布均勻。生存曲線(見(jiàn)圖2)以及l(fā)og-rank檢驗(yàn)結(jié)果顯示2種肝癌分子分型患者的預(yù)后情況具有顯著性差異,其中cluster1的5年生存率顯著低于cluster2(P=0.039)。因此本研究按照2種肝癌分子分型患者生存率的高低將cluster1作為高危組,cluster2作為低危組。由于NMF算法無(wú)法直接對(duì)因子的貢獻(xiàn)度進(jìn)行統(tǒng)計(jì),為進(jìn)一步尋找對(duì)肝癌分子分型的影響最為顯著的Hub基因,本文以Heatmap的形式對(duì)比10個(gè)Hub基因在高危組(Cluster1)和低危組(Cluster2)的表達(dá)趨勢(shì),其中基因表達(dá)趨勢(shì)與樣本分子分型相關(guān)性最為明顯的Hub基因?qū)⒆鳛楹罄m(xù)研究重點(diǎn)。突變基因CDKN2A和FOXO1表達(dá)量與樣本分子分型的分布最具有明顯的趨勢(shì)性(見(jiàn)圖3)。具體表現(xiàn)為CDKN2A在高危組(Cluster1)中的表達(dá)量明顯高于低危組(Cluster2),F(xiàn)OXO1在低危組(Cluster2)中的表達(dá)量明顯高于高危組(Cluster1)。并且進(jìn)一步研究發(fā)現(xiàn),在不考慮分子分型對(duì)全部肝細(xì)胞癌患者進(jìn)行生存分析,CDKN2A基因高表達(dá)和FOXO1基因低表達(dá)的患者生存時(shí)間顯著降低(見(jiàn)圖4)。這與高、低危組兩種分子分型組間的生存率高低差異相一致。由此可以初步推測(cè):由突變導(dǎo)致的CDKN2A與FOXO1表達(dá)量變化對(duì)肝癌樣本分子分型貢獻(xiàn)較大,其中CDKN2A為預(yù)后不良基因(Unfavorable gene),F(xiàn)OXO1為預(yù)后良好基因(Favorable gene),因此以CDKN2A、FOXO1突變?yōu)榛A(chǔ)的分子分型方法具有較大的研究潛力。
圖2 2個(gè)肝細(xì)胞癌分子分型的生存曲線Fig.2 Survival analysis of two HCC molecular typing
圖3 基于NMF模型構(gòu)建肝細(xì)胞癌分子分型Fig.3 Molecular classification of HCC based on NMF model
圖4 10種hub基因在不同肝細(xì)胞癌分子分型表達(dá)水平Fig.4 Expression level of ten hub genes in different molecular typing of HCC
由以上分析表明,基于10種hub基因表達(dá)水平預(yù)測(cè)的分子分型有望成為潛在肝癌的有效預(yù)后指標(biāo)。本研究通過(guò)進(jìn)一步構(gòu)建肝癌1~5年死亡概率預(yù)測(cè)列線圖,比較肝癌分子分型與其它臨床預(yù)后變量的關(guān)系,從而為肝癌患者的預(yù)后情況提供個(gè)體化預(yù)測(cè)。其中臨床預(yù)后變量均為分類變量,包括肝癌的TNM分期變量、性別、年齡分層,以及治療方法等,并按照臨床預(yù)后變量的重要性由下至上進(jìn)行排列,每一個(gè)預(yù)后變量均包括若干個(gè)變量取值,每一個(gè)變量取值對(duì)應(yīng)分值標(biāo)尺上的一個(gè)分值,總分值標(biāo)尺和患者死亡概率變量均為連續(xù)性變量?;颊吒伟┓肿臃中驮陬A(yù)測(cè)模型中的重要程度僅次于T分期,且優(yōu)于M、N分期以及性別年齡分層(見(jiàn)圖5)。該列線圖模型的預(yù)測(cè)準(zhǔn)確性較高,1年生存率的AUC為0.762,3年生存率的AUC為0.749,5年生存率的AUC為0.732。由此可以看出基于10中hub基因構(gòu)建的肝癌分子分型方法在對(duì)肝癌患者的病情評(píng)估和預(yù)后判斷具有一定的臨床指導(dǎo)意義。
圖5 包含年齡(age)、性別(gender)、腫瘤分期(TMN)、治療方法(treatment type)和分子分型(cluster)等預(yù)測(cè)因素的肝癌患者1年、3年、5年死亡率的列線圖預(yù)測(cè)模型Fig.5 Nomogram including age, gender,TMN stage, treatment type,and molecular cluster for 1-,3-, and 5-year overall death rate in patients with HCC
為進(jìn)一步驗(yàn)證分子分型方法的可靠性和穩(wěn)定性,基于GEO(Gene Expression Omnibus)數(shù)據(jù)庫(kù)的GSE76427數(shù)據(jù)集測(cè)序數(shù)據(jù)及臨床信息,采用相同分子分型方法對(duì)該數(shù)據(jù)集中的115例肝癌患者進(jìn)行預(yù)測(cè),并對(duì)預(yù)測(cè)結(jié)果中的不同分型患者進(jìn)行生存分析,同時(shí)針對(duì)分子分型方法中的關(guān)鍵基因CDKN2A和FOXO的表達(dá)水平進(jìn)行差異分析。如圖5所示驗(yàn)證集GSE76427與TCGA數(shù)據(jù)庫(kù)的結(jié)論相似:生存分析結(jié)果均提示cluster2(低危險(xiǎn)組)的預(yù)后顯著優(yōu)于cluster1(高危險(xiǎn)組),且關(guān)鍵基因CDKN2A和FOXO1的表達(dá)水平也分別符合在cluster2(低危組)和cluster1(高危組)高表達(dá)。
為進(jìn)一步分析影響2種分子分型的肝癌患者分子分型生存率差異的原因,探究高、低危組患者的分子遺傳調(diào)控機(jī)制的不同。本研究首先在轉(zhuǎn)錄組水平上,對(duì)高危組(Cluster1)和低危組(Cluster2)肝癌患者的轉(zhuǎn)錄組表達(dá)譜進(jìn)行差異分析,共篩選出顯著差異表達(dá)的mRNA共186個(gè)(差異倍數(shù)變化值大于2或小于0.50且P<0.05),其中高危組(Cluster1)相較于低危組(Cluster2)共有120個(gè)下調(diào)基因及17個(gè)上調(diào)基因(見(jiàn)圖5),10種hub基因表達(dá)在高危組,低危組中均具有統(tǒng)計(jì)學(xué)差異,其中CDKN1A和FOXO1在高危組的表達(dá)顯著低于低危組,KARS和CDKN2A在高危組的表達(dá)顯著高于低危組,這些hub基因的在高、低危組的表達(dá)趨勢(shì)與生存分析結(jié)果相一致(見(jiàn)表1)。其次利用加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析算法(WGCNA),針對(duì)差異表達(dá)基因構(gòu)建共表達(dá)模塊,并分別對(duì)模塊進(jìn)行富集分析,重點(diǎn)挖掘和癌癥發(fā)生發(fā)展相關(guān)的通路,并展開(kāi)更深層次的探索。
通過(guò)WGCNA分析共鑒定出5個(gè)共表達(dá)模塊,由于灰色模塊(MEgrey)由沒(méi)有共表達(dá)的游離基因組成,因此最終確定的有效模塊數(shù)目為4個(gè)(見(jiàn)圖6),每個(gè)模塊包含基因數(shù)目大于30。為確定與分子分型顯著相關(guān)的特異性基因模塊,將基因模塊與肝癌分子分型進(jìn)行關(guān)聯(lián)分析,并計(jì)算基因模塊與高、低危兩種分型的相關(guān)性系數(shù)和P值。結(jié)果顯示(見(jiàn)圖7) MEblue模塊與高危組(Cluster1)具有顯著正相關(guān)性(r=0.34,P=3×10-11),而MEbrown、MEgreen模塊與高危組(Cluster1)具有顯著的負(fù)相關(guān)性(r=-0.4,P=2×10-15)。此外不同基因模塊具有特異性的代謝通路及生物學(xué)過(guò)程,其中MEblue模塊基因在TECM-受體相互作用、PI3K-Akt信號(hào)通路、黏附信號(hào)等3個(gè)通路上顯著富集,而MEgreen、MEyellow模塊則分別與胰腺分泌、糖胺聚糖生物合成-硫酸乙酰肝素/肝素等通路密切相關(guān),MEbrown模塊中的基因則主要參與細(xì)胞周期的調(diào)控(見(jiàn)圖8)。結(jié)合WGCNA分析和KEGG富集結(jié)果,推測(cè)高危組富集多種與腫瘤發(fā)生發(fā)展相關(guān)的基因與通路,其中包括ECM-受體相互作用,黏附信號(hào)通路,以及與腫瘤細(xì)胞增殖相關(guān)的PI3K-Akt信號(hào)通路,而低危組中主要是與細(xì)胞周期的改變相關(guān)。類似結(jié)果在曹穎穎等人在對(duì)比高危組和中低危病胃癌患者分析也有所提及(見(jiàn)圖9)[22]。
圖6 GSE76427數(shù)據(jù)集對(duì)肝癌分子分型方法的驗(yàn)證Fig.6 Validation for molecular classification method of HCC by GSE76427 dataset
表2 主要基因模塊的KEGG通路富集結(jié)果Table 2 KEGG analysis of genes in major gene modules
圖7 肝癌分子分型差異表達(dá)基因的火山圖Fig.7 Volcanic map of differentially expressed genes ofdifferent molecular typing of HCC注:左側(cè)藍(lán)點(diǎn)為高危組表達(dá)水平顯著高于低危組的基因,右側(cè)紅點(diǎn)為高危組表達(dá)水平顯著低于低危組的基因;10種Hub基因具有文字標(biāo)注.
圖8 聯(lián)合加權(quán)共表達(dá)網(wǎng)絡(luò):基因?qū)哟尉垲悩?shù)及基因模塊Fig.8 WGCNA: clustering dendrogram of genes with assigned modules
圖9 基因模塊與肝細(xì)胞癌不同分子分型的相關(guān)分析Fig.9 Associations between gene modules and different molecular typing of HCC
通過(guò)SNP和mRNA表達(dá)譜關(guān)聯(lián)分析及分子分型模型的構(gòu)建,本研究基于10種核心基因的表達(dá)水平將患者分為高危組和低危組兩類,二者的生存率存在顯著差異。其中核心基因CDKN2A和FOXO1在肝癌分子分型中起到?jīng)Q定性作用,因此我們推測(cè)由突變導(dǎo)致的CDKN2A高表達(dá)和FOXO1低表達(dá)可能與肝癌患者的不良預(yù)后密切相關(guān)。CDKN2A即細(xì)胞周期依賴性激酶抑制基因(Cyclin-dependentkinase inhibitor) ,是一種直接參與細(xì)胞周期調(diào)控的抑癌基因,由Kamb等于1994年首次報(bào)道[23],并以其在腫瘤細(xì)胞中的高突變率和抑癌作用而在腫瘤遺傳學(xué)和腫瘤分子生物學(xué)的研究中受到了廣泛關(guān)注。研究表明CDKN2A的缺失、突變和甲基化可導(dǎo)致其編碼兩種細(xì)胞周期抑制蛋白p16INK4a和p14ARF異常,其中p16INK4a不能與CDKN2A和CDK6結(jié)合,使pRb蛋白磷酸化和轉(zhuǎn)錄調(diào)節(jié)因子E2F釋放,誘導(dǎo)G1期停滯,有助于腫瘤的發(fā)生[24],而p14ARF功能的分子機(jī)制比較復(fù)雜,可能是通過(guò)P14AFP-MDM2-p53途徑起作用[25-26],這兩條途徑的異常普遍存在于各種腫瘤。但本研究基于TCGA數(shù)據(jù)庫(kù)的分析結(jié)果顯示,CDKN2A在肝癌中屬于不良預(yù)后因子并在高危組中高表達(dá)。此外通過(guò)對(duì)TCGA數(shù)據(jù)庫(kù)中其它癌癥類型的數(shù)據(jù)分析結(jié)果,發(fā)現(xiàn)在子宮內(nèi)膜癌、腎癌中CDKN2A同樣屬于不良預(yù)后因子,類似的結(jié)果在Larque A B等[27]關(guān)于hpv陰性的喉部鱗狀細(xì)胞癌的研究中也有所提及??偠灾瓹DKN2A作為一種重要的抑癌基因,其純合缺失、啟動(dòng)子甲基化或基因點(diǎn)突變與腫瘤的發(fā)生密切相關(guān),但其mRNA表達(dá)水平作為肝癌患者預(yù)后因子的研究還不充分,CDKN2A是否為肝癌的不良預(yù)后因子還需更加系統(tǒng)、深入的研究和驗(yàn)證。FOXO又名叉頭蛋白(Forkhead box protein)是一類轉(zhuǎn)錄因子,廣泛參與到細(xì)胞新陳代謝、分化、凋亡、增殖等生命活動(dòng)中,尤其在細(xì)胞周期進(jìn)程的調(diào)控和程序化死亡中起到重要作用。許多研究表明,F(xiàn)OXO的失活與腫瘤的發(fā)生發(fā)展顯著相關(guān),是哺乳動(dòng)物細(xì)胞最重要的一類抑癌基因,并且在多種腫瘤中都可觀察到FOXO轉(zhuǎn)錄因子的異常表達(dá)。FOXO1是叉頭轉(zhuǎn)錄因子FOXO家族的一個(gè)重要成員,F(xiàn)OXO1在肝癌組織中低表達(dá),導(dǎo)致肝癌細(xì)胞的細(xì)胞周期失控和凋亡異常抵抗,進(jìn)而加速腫瘤的進(jìn)展。提高FOXO1的活性,可影響上調(diào)細(xì)胞周期抑制蛋白p21、p27和下調(diào)細(xì)胞周期蛋白cyclinD1的表達(dá)從而抑制肝癌細(xì)胞增殖,并通過(guò)激活促凋亡蛋白Bim,誘導(dǎo)肝癌細(xì)胞凋亡[28-30]。研究發(fā)現(xiàn),由FOXO1突變引發(fā)的mRNA表達(dá)水平的變化,對(duì)肝癌患者的分子分型起到重要作用同時(shí)與預(yù)后存在較強(qiáng)的相關(guān)性?;谝陨辖Y(jié)果我們推斷,F(xiàn)OXO1可能是肝癌的腫瘤抑制基因,該基因突變導(dǎo)致的表達(dá)水平降低可導(dǎo)致肝癌患者生存期縮短。
此外本研究還發(fā)現(xiàn),兩種分子分型的差異表達(dá)基因功能,與腫瘤細(xì)胞侵蝕、轉(zhuǎn)移、復(fù)發(fā)過(guò)程相關(guān)的信號(hào)通路相關(guān),包括與高危組顯著相關(guān)的信號(hào)通路包括:ECM-受體相互作用,黏附信號(hào)通路[31-32],以及與腫瘤細(xì)胞增殖相關(guān)的PI3K-Akt信號(hào)通路[33-34];而低危組中異常通路信號(hào)則主要與細(xì)胞周期、胰液分泌異常有關(guān)。研究表明,肝癌的發(fā)病早期往往就出現(xiàn)門靜脈侵襲、肝內(nèi)轉(zhuǎn)移以及肝外肺臟和骨組織的轉(zhuǎn)移,而肝癌的侵襲、轉(zhuǎn)移和術(shù)后復(fù)發(fā)是影響患者預(yù)后的主要因素。惡性腫瘤發(fā)生發(fā)展常常伴有細(xì)胞外基質(zhì)(Extracellular Matrix,ECM)及其細(xì)胞表面受體表達(dá)的變化[35-36];而黏附信號(hào)通路的激活則在細(xì)胞分化,發(fā)育以及增殖,凋亡方面起重要作用,并參與腫瘤的侵襲,運(yùn)動(dòng)和轉(zhuǎn)移過(guò)程[37];PI3K/Akt/mTOR信號(hào)通路則作為細(xì)胞內(nèi)重要信號(hào)傳導(dǎo)通路之一,可通過(guò)影響下游多種效應(yīng)分子的活化狀態(tài),維持腫瘤細(xì)胞惡性增殖的生物學(xué)特性[32]。由此可以看出高危組腫瘤的惡性程度高,侵襲性強(qiáng),極易復(fù)發(fā)和轉(zhuǎn)移,是造成患者預(yù)后較差、生存率較低的主要原因。
利用TCGA數(shù)據(jù)庫(kù)中肝癌患者SNP突變數(shù)據(jù)和轉(zhuǎn)錄組芯片數(shù)據(jù)的聯(lián)合分析,通過(guò)蛋白互作網(wǎng)絡(luò)篩選出核心基因,并構(gòu)建肝癌分子分型方法。在沒(méi)有任何先驗(yàn)信息的情況下對(duì)肝癌患者進(jìn)行分子分型,分析結(jié)果表明這種分子分型方法對(duì)肝癌患者的預(yù)后評(píng)估具有一定的作用。另外通過(guò) WGCNA和KEGG富集分析探尋了高危、低危兩種分型間的基因表達(dá)和異常代謝通路的差異,對(duì)造成不同肝癌分子分型患者生存率差異的原因進(jìn)行進(jìn)一步研究,同時(shí)篩選出的核心基因CDKN2A、FOXO1也可作為肝癌早期診斷,預(yù)后監(jiān)測(cè)的新型分子標(biāo)志物以及分子治療的新靶點(diǎn)。
1)CDKN2A和FOXO1在肝癌分子分型中起到?jīng)Q定性作用,且CDKN2A高表達(dá)和FOXO1低表達(dá)可能與肝癌患者的不良預(yù)后密切相關(guān)。
2)高危組異常信號(hào)通路ECM-受體相互作用,黏附信號(hào)通路,PI3K-Akt信號(hào)通路可能與惡性程度高,侵襲性強(qiáng),極易復(fù)發(fā)和轉(zhuǎn)移,預(yù)后較差有關(guān)。