周艷琳 劉 俊 李勇莉 李林玉 趙 冰 (新鄉(xiāng)醫(yī)學(xué)院三全學(xué)院,新鄉(xiāng) 453003)
肝細胞癌(liver hepatocellular carcinoma,LIHC)是全球最常見的惡性腫瘤之一[1]。LIHC 的病死率在所有癌癥中排名第二,接受切除手術(shù)或消融術(shù)后五年內(nèi)約有70%的復(fù)發(fā)率[2]。導(dǎo)致不良預(yù)后的主要原因是腫瘤轉(zhuǎn)移和術(shù)后復(fù)發(fā)[3]。越來越多的研究表明,mRNA 可作為癌癥預(yù)后的潛在生物標志[4-5]。有證據(jù)顯示,ANLN、ECT2、HMMR、KIF20A、NCAPG、PBK、RACGAP1 和 ZWINT 等 mRNA 均可作為肝癌診斷和治療的候選靶點,通過基因的異常表達或改變參與LIHC 的發(fā)生發(fā)展[6]。隨著生物信息技術(shù)的成熟,現(xiàn)已被廣泛用于分析LIHC 相關(guān)的差異表達基因和相關(guān)信號通路,以此提高LIHC 篩查和治療的概率[7]。然而,LIHC 具有較高的分子異質(zhì)性,篩選出新的潛在LIHC 預(yù)后生物標志,對降低LIHC 患者病死率、改善預(yù)后和實現(xiàn)個體化靶向治療均有重要意義。著絲粒蛋白N(centromere protein N,CENPN)是著絲粒核小體相關(guān)復(fù)合物的成分,在激核蛋白組裝、有絲分裂進展和染色體分離中發(fā)揮核心作用[8]。然而,CENPN 在 LIHC 中的作用及機制研究尚不完全明確。本研究通過生物信息學(xué)方法分析CENPN 在LIHC 中的表達及其與預(yù)后的關(guān)系,并探討其調(diào)控LIHC 的可能機制,為LIHC 的臨床診治和預(yù)后提供新思路。
1.1 數(shù)據(jù)的獲取和篩選 基于TIMER2.0 數(shù)據(jù)庫(http://timer. cistrome. org/)[9]通 過 Exploration 模塊下的Gene-DE 檢索CENPN 在TCGA 數(shù)據(jù)庫所有腫瘤組織和癌旁正常組織中的表達。利用GEPIA2 數(shù)據(jù)庫(http://gepia2. cancer-pku. cn/#index)[10]進一步驗證CENPN 在TCGA-GTEx-LIHC 中的表達。設(shè)定篩選條件為|Log2FC| Cutoff:1、P-value Cutoff:0.05、LIHC,Match TCGA normal and GTEx data,包括369例肝癌組織樣本和160例正常對照組織樣本。
1.2 CENPN 的表達與肝癌患者病理分期和預(yù)后相關(guān)性分析 基于GEPIA2.0數(shù)據(jù)庫分析了CENPN的表達與LIHC 患者病理分期和預(yù)后的相關(guān)性。通過CENPN 表達值的中位數(shù)將LIHC 患者分為高表達組與低表達組,根據(jù)CoxPH 模型,計算危險比(HR)和P值,并繪制生存曲線,包括總體生存期(overall survival,OS)曲線和無病生存期(disease free survival,RFS)曲線。利用Logistic回歸分析檢測CENPN表達與LIHC 患者臨床分期的相關(guān)性,P<0.05 為差異具有統(tǒng)計學(xué)意義。
1.3 LIHC 中與CENPN 共表達基因的篩選及功能富集分析 基于LinkedOmics 數(shù)據(jù)庫(http://www.Linkedomics.org)[11]分析 CENPN 在 TCGA LIHC 患者組織共表達基因情況,包括371 例肝癌患者,檢索LIHC 中CENPN 相關(guān)的上調(diào)基因和下調(diào)基因。篩選條件為:LIHC、RNAseq、CENPN、RNAseq,Spearman檢驗進行數(shù)據(jù)處理,P<0.05 為差異具有統(tǒng)計學(xué)意義,選擇共表達差異基因最緊密的前50個基因制作熱圖。將篩選的與CENPN 共表達差異基因最緊密的前 500 個基因載入 DAVID 數(shù)據(jù)庫(https://david.ncifcrf. gov/)[12],以 人 源 基 因 為 背 景 ,進 行 GO 和KEGG 通路富集分析。GO 分析主要用于基因注釋,包括生物過程(biological process,BP)、細胞成分(cellular component,CC)和分子功能(molecular func?tion,MF)?;?KEGG 數(shù)據(jù)庫(https://www. kegg.jp/)[13],在 KEGG Maper 模塊下的 Search&Color Path?way 中進行檢索,將Top 500 關(guān)聯(lián)緊密的基因載入對應(yīng)框,生成路線圖,關(guān)鍵共表達基因在細胞周期中的位置顯示為紅色。
1.4 CENPN表達與甲基化的關(guān)系 通過cBioPortal數(shù)據(jù)庫(http://www. cbioportal. org/)[14]分析 CENPN表達在5 組LIHC 樣本中基因組水平的變化。共1 070 例肝癌患者,篩選條件為:拷貝數(shù)變異(copy number alterations,CNA)和突變(mutations,Mut),在Plot 模塊通過Spearman 和Pearson 檢驗分析CENPN表達與甲基化的相關(guān)性。
1.5 CENPN 與腫瘤免疫細胞浸潤的關(guān)系 利用TIMER 數(shù) 據(jù) 庫(https://cistrome. shinyapps. io/tim?er/)[15],通過 Gene 模塊檢索分析 CENPN 表達與各種腫瘤浸潤免疫細胞的相關(guān)性,包括B 細胞、CD8+T 細胞、CD4+T 細胞、單核細胞、中性粒細胞和樹突狀細胞,Spearman 檢驗處理數(shù)據(jù),P<0.05 為差異具有統(tǒng)計學(xué)意義。
2.1 CENPN 在泛癌中的表達 基于TIMER2.0 數(shù)據(jù)庫分析CENPN 在TCGA 39種腫瘤中的表達情況,結(jié)果顯示,CENPN 在乳腺癌、食道癌、宮頸癌、LIHC等20 種腫瘤中均顯著高表達。在TCGA-LIHC 中,相較于癌旁組織(n=50),CENPN 在 LIHC 組織(n=371)中的表達量顯著增多,差異有統(tǒng)計學(xué)意義(P<0.001)。
2.2 CENPN 在LIHC 組織中的表達及病理分期分析 基于GEPIA2 數(shù)據(jù)庫進一步驗證CENPN 在TCGA-GTEx 529 例 LIHC 中 的 表 達 ,包 括 369 例LIHC 樣本和160 例正常對照樣本,比較LIHC 癌組織和正常組織中CENPN 的表達情況,結(jié)果顯示,CENPN 在LIHC 中的表達量顯著高于正常組織(圖2A),差異具有統(tǒng)計學(xué)意義(P<0.05)。進一步基于GEPIA2 數(shù)據(jù)庫分析CENPN 與LIHC 腫瘤分期的關(guān)系,結(jié)果顯示,隨著腫瘤分期的進展,CENPN 表達量明顯升高[F=6.98,Pr(>F)=0.000 143],差異具有統(tǒng)計學(xué)意義(圖2B)。提示CENPN 在LIHC 中高表達,可作為LIHC患者晚期預(yù)后不良指標之一。
圖1 CENPN在TCGA 各種腫瘤組織中的表達Fig.1 Expressions of CENPN in various tumor tissues in TCGA
圖2 CENPN 在TCGA-GTEx 肝癌組織表達及病理分期的分析Fig.2 Analysis of expression and pathological stage of CENPN in TCGA-GTEx LIHC tissue
2.3 CENPN 表達與LIHC 患者生存期的關(guān)系 基于GEPIA2數(shù)據(jù)庫,可得到各182例CENPN高表達與低表達患者的OS 曲線和RFS曲線。結(jié)果顯示,LIHC患者中CENPN 高表達的患者[logrankP=0.003 1,HR(high)=1.7,P(HR)=0.003 5]總體生存期明顯低于低表達患者(圖3A);在LIHC 患者中CENPN 高表達患者[logrankP=0.000 45,HR(high)=1.7,P(HR)=5e-04]RFS 明顯低于低表達患者(圖3B)。表明CENPN 高表達與 LIHC 患者 OS 和 RFS 均存在相關(guān)性,提示CENPN 可作為肝癌患者的預(yù)后不良指標之一。
圖3 CENPN的表達與肝癌患者生存期的關(guān)系Fig.3 Relationship between CENPN expression and sur?vival in LIHC patients
2.4 CENPN 在LIHC 中的共表達基因篩選及功能富集分析 基于LinkedOmics數(shù)據(jù)庫分析CENPN 在LIHC 中的共表達基因,篩選出差異顯著(P<0.05)且關(guān)聯(lián)最緊密的Top 50 基因繪制熱圖(圖4)。結(jié)果顯示,在LIHC 中與CENPN 表達關(guān)聯(lián)緊密的基因有TK1、C16orf61、KARS、COX4NB、COG4 等。將差異顯著且關(guān)聯(lián)最緊密的Top 500基因載入DAVID 數(shù)據(jù)庫進行GO 分析和KEGG 分析,結(jié)果顯示,這些關(guān)聯(lián)基因主要富集于細胞裂解、DNA 復(fù)制、G1/S 期、G2/M期、核質(zhì)、蛋白質(zhì)結(jié)合等生物過程(表1),KEGG分析主要富集于細胞周期、DNA 復(fù)制、P53 信號等通路(表2),以細胞周期通路的關(guān)聯(lián)度(count=26)和差異性(P=1.02E-15,F(xiàn)DR=1.79E-13)最明顯。為進一步探究CENPN 及關(guān)聯(lián)基因在細胞周期通路中的作用和相關(guān)基因在細胞周期中的位置關(guān)系,將細胞周期通路中的CENPN 相關(guān)基因帶入與KEGG 通路相關(guān)的網(wǎng)站生成路線圖(圖5),并標出通路中對應(yīng)基因的相關(guān)位置(紅色標記),大部分基因與細胞周期的 G1/S 期和 G2/M 期有關(guān)。提示 CENPN 在 LIHC 中可能通過調(diào)控相關(guān)分子影響生物合成,改變細胞周期等相關(guān)通路,進而調(diào)控LIHC的發(fā)生、發(fā)展。
圖4 CENPN在肝癌中差異共表達Top 50基因Fig.4 CENPN differently co-expressed Top 50 genes in LIHC
圖5 CENPN共表達基因在細胞周期中的位置關(guān)系Fig.5 Location relationship of CENPN co-expression genes in cell cycle
表1 CENPN差異性共表達基因的GO分析Tab.1 GO analysis of CENPN differently co-expressed genes
表2 CENPN差異共表達基因的KEGG分析Tab.2 KEGG analysis of CENPN differently co-expressed genes
2.5 CENPN 的表達與甲基化的關(guān)系 通過cBio?Portal 數(shù)據(jù)庫分析CENPN 的基因組水平變化,結(jié)果顯示,在選取的5 組LIHC 研究中,包括1 070 例LIHC樣本,CENPN的表達與甲基化呈負相關(guān)(圖6),差異有統(tǒng)計學(xué)意義(Spearmanr=?0.28,P=3.23e-8;Pearsonr=?0.23,P=9.395e-6)。提示CENPN 在LIHC中的高表達可能受甲基化修飾調(diào)控。
圖6 CENPN的表達與甲基化的關(guān)系Fig.6 Relationship between CENPN expression and methylation
2.6 CENPN的表達與免疫細胞浸潤的關(guān)系 TIMER數(shù)據(jù)庫分析發(fā)現(xiàn),TCGA-肝癌中CENPN 表達水平與6種免疫細胞浸潤水平均呈顯著正相關(guān)(圖7),包括B細胞(r=0.362,P=4.11e-12)、CD8+T細胞(r=0.291,P=4.09e-08)、CD4+T 細胞(r=0.13,P=1.58e-02)、巨噬細胞(r=0.291,P=4.28e-08)、中性粒細胞(r=0.275,P=2.04e-07)和樹突狀細胞(r=0.288,P=6.70e-08),差異均有統(tǒng)計學(xué)意義。其中與B 細胞關(guān)系最密切,差異性最顯著。表明CENPN 可能通過影響免疫細胞浸潤調(diào)控LIHC的發(fā)生和發(fā)展。
圖7 在TCGA-肝癌中CENPN表達與免疫細胞浸潤的關(guān)系Fig.7 Relationship between CENPN expression and immune cell infiltration in TCGA-LIHC
LIHC是全球最常見的惡性腫瘤之一,病死率排名第二,篩選出新的LIHC 預(yù)后標志物對降低LIHC患者病死率,改善預(yù)后和實現(xiàn)個體化靶向治療均有重要意義。著絲粒蛋白(centromere protein,CENP)包含 18 個亞型,有 CENP-A/C/H/I/K/M/T/W/N/L 等,通過紡錘體微管調(diào)節(jié)染色體DNA 分離,因此,CENP在細胞周期調(diào)控和染色體分離過程中極為重要[16-17]。LIU 等[18]研究發(fā)現(xiàn) TK1、CCNB2 和 NUSAP1在LIHC中過表達,與LIHC的侵襲、轉(zhuǎn)移及預(yù)后等密切相關(guān)。ZHANG 等[19]研究顯示,KARS 通過細胞周期阻滯和誘導(dǎo)細胞凋亡機制介導(dǎo)LIHC 的發(fā)展。SHI 等[20]研究顯示,CDC20 通過介導(dǎo) PHD3 的降解,穩(wěn)定HIF-1α 的表達,以此促進LIHC 的發(fā)生與發(fā)展。本研究發(fā)現(xiàn),CENPN 在LIHC 中的表達與TK1、CCNB2、KARS、CDC20 等均顯著相關(guān),推測 CENPN可能也參與了LIHC 的發(fā)生發(fā)展。然而CENPN 在LIHC中的調(diào)控機制尚不清楚。
本研究通過生物信息學(xué)對LIHC 的多個數(shù)據(jù)庫數(shù)據(jù)進行分析?;赥IMER2.0 數(shù)據(jù)庫,分析CENPN 在TCGA 各種腫瘤中的表達情況,結(jié)果顯示,CENPN 在TCGA 20 種腫瘤中均高表達,在LIHC中的表達差異具有統(tǒng)計學(xué)意義(P<0.001)?;贕EPIA2 數(shù)據(jù)庫進一步驗證CENPN 在LIHC 中的表達,CENPN 在369 例LIHC 中的表達量顯著高于正常組織,與TIMER2.0數(shù)據(jù)相符。隨后,基于GEPIA2數(shù)據(jù)庫分析CENPN 表達與LIHC患者病理分期及預(yù)后的相關(guān)性,結(jié)果顯示CENPN 低表達患者OS 和RFS 均較高,CENPN 可作為判斷LIHC 預(yù)后的指標;CENPN 隨著腫瘤分期的進展表現(xiàn)為升高趨勢,由于StageⅣ的患者只有4 例,因此StageⅣ的數(shù)據(jù)可能存在一定的統(tǒng)計學(xué)偏差。以上結(jié)果均提示,CENPN 在LIHC 中高表達,可能作為LIHC 預(yù)后不良的標志物之一,為LIHC的個體化診療提供了新的靶點。
為了進一步探究CENPN 在LIHC 發(fā)生發(fā)展中的下游調(diào)控機制。課題組基于LinkedOmics 數(shù)據(jù)庫分析CENPN 在TCGA-LIHC 表達的互作基因,結(jié)果顯示,與CENPN 存在互作的差異表達基因有TK1、C16orf61、KARS、CDC20 等,這些基因均參與 LIHC的發(fā)展,與既往研究部分相符[18-20],提示 CENPN 在LIHC 發(fā)展中存在復(fù)雜的分子互作關(guān)系。本研究基于DAVID 數(shù)據(jù)庫對Top 500的差異性共表達基因進行GO 和KEGG 富集分析,結(jié)果顯示,這些共表達基因主要富集于細胞周期、DNA 復(fù)制、P53信號通路等過程,可視化參與細胞周期調(diào)控LIHC 發(fā)展的互作基因位置關(guān)系發(fā)現(xiàn),大部分差異基因與細胞周期的S 期和G2/M 期有關(guān),提示CENPN 主要通過細胞周期通路調(diào)控 LIHC 發(fā)展。OKA 等[21]研究發(fā)現(xiàn),CENPN在口腔鱗癌中高表達,通過阻滯細胞周期G1影響細胞增殖,參與口腔鱗癌發(fā)生。CHITTORI 等[22]研究發(fā)現(xiàn),CENPN 與 CENPA、CENPC 相互作用,影響著絲粒核小體結(jié)構(gòu),調(diào)控染色體和有絲分裂中與紡錘體微管相連的動脈管的組裝和染色體分離,進而改變細胞周期。WANG 等[23]通過 GSEA 數(shù)據(jù)庫預(yù)測CENPN 相關(guān)基因主要富集于 P53、Rb1、E2F 靶點等通路,并在 HepG2 和 Huh7 兩種 LIHC 細胞系中驗證CENPN 可靶向p21-CDK2/cyclin E、p27-CDK4/cyclin D和Rb/E2F1信號通路調(diào)控LIHC進展,然而并未顯示CENPN與腫瘤微環(huán)境的關(guān)系。本研究基于TIMER數(shù)據(jù)庫分析CENPN 表達與腫瘤浸潤免疫細胞的關(guān)系,結(jié)果顯示,CENPN 的表達與 B 細胞、CD8+T 細胞、CD4+T 細胞、巨噬細胞、中性粒細胞和樹突狀細胞6 種腫瘤免疫細胞變化均相關(guān),尤其與B 細胞的相關(guān)系數(shù)和差異性最為顯著(r=0.362,P=4.11e-12),提示調(diào)控腫瘤免疫反應(yīng)相關(guān)通路可能是CENPN 促進LIHC 進展的重要機制之一,可能與LIHC 顯著的免疫炎癥驅(qū)動有關(guān)。CENPN 在免疫調(diào)控中的具體作用,以及是否能夠作為免疫治療的生物標志物或聯(lián)合治療靶點有待進一步研究。
最后,本研究探究了CENPN 在LIHC 中高表達的上游機制。腫瘤的發(fā)生通常與基因的異常表達或改變密切相關(guān),基因擴增情況或甲基化狀態(tài)或上游非編碼RNA(non-coding RNA,ncRNA)的調(diào)控均可引起基因的異常表達,進而加速腫瘤進程。本研究通過cBioPortal 數(shù)據(jù)庫分析CENPN 在基因組水平的變化,結(jié)果顯示,在選取的1 070 例LIHC 樣本中不發(fā)生基因拷貝數(shù)擴增,只有0.3%的LIHC 患者發(fā)生CENPN 深度缺失,提示CENPN 在LIHC 中的高表達不是由基因拷貝數(shù)擴增引起的;進一步分析CENPN 在LIHC 中表達與甲基化的關(guān)系,結(jié)果顯示,CENPN 的表達與甲基化呈負相關(guān),有研究顯示DNA甲基化是一種表觀遺傳調(diào)控機制[24],通過甲基轉(zhuǎn)移酶將甲基(CH3)基團修飾到特定DNA 核酸位點,從而影響基因表達,推測CENPN 可能通過甲基化修飾改變其在LIHC 中的表達,進而參與LIHC 的發(fā)生發(fā)展。本研究只進行了CENPN 在基因拷貝數(shù)擴增和甲基化方面的研究,并未篩選其他調(diào)控CENPN 表達的原因,下一步將篩選各種ncRNA(miRNA、circ-RNA等)對CENPN表達的影響。
綜上所述,本研究明確了CENPN 在多種腫瘤中的表達情況,其高表達與LIHC 不良預(yù)后有關(guān),可作為LIHC 新的潛在預(yù)后標志物和靶向治療的潛在分子靶點。CENPN 在LIHC 中的高表達與甲基化修飾有關(guān),還可能通過調(diào)節(jié)腫瘤免疫微環(huán)境,參與細胞周期調(diào)控的相關(guān)通路從而影響LIHC 的發(fā)生、發(fā)展。為了進一步闡明CENPN 在LIHC 中的功能和作用,還需要進行分子生物學(xué)實驗以驗證和探究。