蒲俊興,何穎,陳娟娟
(1.南昌大學第二附屬醫(yī)院檢驗科 江西省檢驗醫(yī)學重點實驗室,江西 南昌 330006;2.南昌大學公共衛(wèi)生學院,江西 南昌 330031)
肝細胞癌(HCC)是世界癌癥相關死亡的第二 大常見原因[1],由于早期診斷困難,大部分患者在入院檢查時已進入中晚期[2]。 目前的治療手段包括手術切除、肝移植、介入治療和分子靶向,而首選治療方式是手術治療。 盡管肝移植和手術切除等治療可用于早期腫瘤,但只適用于少數(shù)患者。 對于晚期患者,僅適用于支持性治療,而其中大多數(shù)患者對常規(guī)化療或放療耐藥[3]。HCC 的發(fā)病率正在上升,預計在不久的將來還會繼續(xù)增長[4]。 因此,探索HCC 的預后標志物是有必要的。
近年來, 生物信息學和多組學分析廣泛應用于腫瘤發(fā)生和發(fā)展過程中基因表達變化的研究。隨著大數(shù)據(jù)時代的到來, 通過對各種生物醫(yī)學公共數(shù)據(jù)庫進行數(shù)據(jù)挖掘,可以方便、快捷地發(fā)現(xiàn)具有差異表達的基因(DEGs),從而找到疾病治療相關的潛在靶標以及預后評估的可能標志物。 本研究從GEO 數(shù)據(jù)庫下載了HCC 患者的數(shù)據(jù), 通過DEGs 構建了PPI 網(wǎng)絡。 篩選出樞紐基因并驗證其在HCC 患者中的轉錄、 翻譯和生存情況。 利用TIMER 數(shù)據(jù)庫評估樞紐基因的表達水平及其與腫瘤純度和浸潤免疫細胞的相關性。
1.1 數(shù)據(jù)來源及處理 從GEO 數(shù)據(jù)庫(https://www.NCBI.nlm.nih.gov/GEO/) 下載兩個肝細胞癌芯片數(shù)據(jù)(GSE14520[5]和GSE46408[6])。 GSE14520 基 于GPL3921 平臺, 包括225 例HCC 樣本和220 例正常肝臟樣本;GSE46408 基于GPL4133 平臺, 包括6 例HCC 樣本和6 例正常肝臟樣本。 GEO2R 軟件(https://www.ncbi.nlm.nih.gov/geo/geo2r)篩 選HCC 和正常組織之間的DEGs。 校正后P<0.05 和log2FC≥1.0 的基因被認為是DEGs。 利用Venny 2.1.0 工具(https://bioinfogp.cnb.csic.es/tools/venny/index.html)展示DEGs。
1.2 構建PPI 網(wǎng)絡及篩選樞紐基因 STRING 數(shù)據(jù)庫(http://string-db.org/)用于構建PPI 網(wǎng)絡。 將篩選出的DEGs 輸入STRING 中,提取與綜合評分>0.4配對的PPI 網(wǎng)絡。 通過Cytoscape 軟件對其進行可視化,利用CytoHubba 插件計算蛋白質節(jié)點的連接度。 連接度較高的基因被視為樞紐基因。
1.3 驗證樞紐基因在HCC 中差異表達 ONCOMINE 數(shù)據(jù)庫(http://oncomine.org)為全基因組表達分析提供了重要的生物信息學幫助[7]。 利用其分析HCC 中樞紐基因的表達情況,P<0.05 為差異有統(tǒng)計學意義。
1.4 樞紐基因的預后價值 GEPIA2(http://gepia2.cancer-pku.cn/#index)工具中共529 例肝臟樣本數(shù)據(jù)(包括HCC 樣本479 例,正常肝臟樣本50 例),對樞紐基因在低表達組和高表達組中的預后價值進行分析。
1.5 樞紐基因的變異分析 cBioPortal(https://cbioportal.org)是一個能夠可視化和分析多維癌癥基因組數(shù)據(jù)的工具[8]。 利用其評估HCC 中拷貝數(shù)變異(CNV)、 突變和基因類型并分析基因突變與HCC預后的關系。
1.6 樞紐基因共表達網(wǎng)絡的構建及功能富集分析GeneMANIA(http://www.genemania.org)是用于分析靶基因的遺傳和蛋白質相互作用、共表達、通路、共定位和結構域蛋白相似性的在線數(shù)據(jù)庫[9]。 利用該數(shù)據(jù)庫分析樞紐基因及其互作基因之間的關系。
DAVID 6.8 (https://david.ncifcrf.gov/home.jsp)能夠很好地闡明目的基因生物學功能[10]。利用其對共表達網(wǎng)絡進行GO 功能和KEGG 通路富集分析。使用R 軟件中“ggplot2”包對富集的功能和通路進行展示。
1.7 腫瘤免疫浸潤分析 TIMER(https://cistrome.shinyapps.io/timer/) 可用于系統(tǒng)評估各種免疫細胞的浸潤及其臨床影響[11]。本研究對樞紐基因在HCC中的表達水平及其與腫瘤純度和浸潤性免疫細胞的相關性進行分析。 此外,還評估了基因表達與臨床結果和免疫細胞浸潤之間的相關性。
2.1 DEGs 的鑒定 利用GEO2R 從GSE14520 中共鑒定出202 個DEGs, 其中上調(diào)基因104 個,下調(diào)基因98 個,見圖1a;從GSE46408 中鑒定出156個DEGs,其中上調(diào)基因99 個,下調(diào)基因57 個,見圖1d。 對DEGs 進行Venny 2.1.0 分析,得到DEGs的交集。 交集的DEGs 共有46 個,其中25 個表達上調(diào),21 個表達下調(diào),見圖1b—圖1e。
2.2 PPI 網(wǎng)絡構建與樞紐基因篩選 通過STRING構建DEGs 的PPI 網(wǎng)絡涉及45 個節(jié)點和280 個邊,見圖1c。 使用Cytoscape 軟件對該PPI 網(wǎng)絡進行可視化并利用CytoHubba 插件計算每個蛋白質節(jié)點的連接度。 本研究選取連接度排名前三的基因(CCNB1、ASPM 和AURKA)為樞紐基因,見圖1f。 這3 個樞紐基因在HCC 中均上調(diào)。
圖1 GEO 兩個數(shù)據(jù)集中的DEGs
2.3 HCC 患者中樞紐基因的異常表達 在ONCOMINE 和GEPIA2 數(shù)據(jù)庫中獲取CCNB1、ASPM和AURKA 在HCC 中的異常表達數(shù)據(jù)。 兩者結果均表明, 與正常樣本相比,HCC 中CCNB1、ASPM和AURKA 的表達水平或轉錄水平顯著升高 (P<0.05),見圖2a—圖2b。
圖2 樞紐基因在不同組織中的表達
2.4 HCC 患者中樞紐基因的預后分析 使用GEPIA2 數(shù)據(jù)庫評估這3 個樞紐基因與HCC 預后之間的關系。 數(shù)據(jù)顯示,CCNB1、ASPM 和AURKA的高轉錄水平與HCC 患者較短的OS 顯著相關(P<0.05),見圖3a—圖3c。 此外,還研究了樞紐基因在HCC 患者DFS 中的預后作用。結果表明CCNB1、ASPM 和AURKA 的高轉錄水平與HCC患者較短的DFS 顯著相關(P<0.05),見圖3d—圖3f。
圖3 HCC 中樞紐基因的生存分析
2.5 HCC 患者中樞紐基因的改變頻率分析 使用cBioPortal 分析HCC 患者中3 個樞紐基因的遺傳改變頻率。 如圖4a 所示,98 名(25.26%)HCC 患者的這3 個基因發(fā)生了明顯的改變,包括擴增、深度缺失、截短突變、錯義突變和轉錄上調(diào)。 具體而言,CCNB1、ASPM 和AURKA 遺傳改變的百分比變化分別為8%、16%和9%,見圖4b。 我們還比較了它們的表達變化與HCC 預后之間的關系。結果表明,HCC 患者中樞紐基因的改變與OS 顯著相關 (P=0.0229),見圖4c。 與不改變樞紐基因表達相比,改變樞紐基因表達的HCC 患者表現(xiàn)出更差的DFS(P=0.0256),見圖4d。
圖4 LIHC 中樞紐基因的改變頻率及其生存分析
2.6 樞紐基因的共表達和功能富集分析 共表達網(wǎng) 絡 顯 示CDK1、DLGAP5、FZR1、CPEB1、BORA、TPX2、CCNF、TACC3、PLK1、PTCH1、NDC80、AURKAIP1、WEE1、KIF3A、CDC25A、FOXO1、PPP6C、HMMR、BIRC5、CDC25B 這20 個 基 因 與CCNB1、ASPM 和AURKA 的調(diào)控功能相關,見圖5a。 利用DAVID 6.8 分析CCNB1、ASPM 和AURKA 及其互作基因的功能。圖5b-圖5d 結果顯示,生物學過程(BP)主要富集在有絲分裂(核分裂)、有絲分裂細胞周期的G2/M 轉變、細胞分裂、后期促進復合物依賴的分解代謝過程以及參與有絲分裂細胞周期的泛素蛋白連接酶活性調(diào)控。 細胞構成(CC)主要集中在紡錘體微管、亞體、胞質、紡錘體、濃縮核染色體外著絲粒、細胞表面、微管細胞骨架、核質、減數(shù)分裂紡錘體和著絲粒。 分子功能(MF)與蛋白激酶結合、 磷酸蛋白磷酸酶活性和蛋白結合方面有關。 KEGG 主要富集在孕激素介導的卵母細胞成熟、細胞周期、卵母細胞減數(shù)分裂和FoxO 信號等通路,見圖5e。
圖5 樞紐基因的共表達網(wǎng)絡及功能富集分析
2.7 HCC 患者中樞紐基因的免疫細胞浸潤分析利用TIMER 數(shù)據(jù)庫評估了CCNB1、ASPM 和AURKA 與免疫細胞浸潤之間的關系。 如圖6a 所示,CCNB1 表達與浸潤性B 細胞、巨噬細胞、中性粒細胞和樹突狀細胞呈顯著正相關。ASPM 表達與浸潤性B 細胞、CD4+T 細胞、巨噬細胞、中性粒細胞和樹突狀細胞呈顯著正相關(P<0.05),見圖6b。AURKA表達與浸潤性B 細胞和樹突狀細胞呈顯著正相關(P<0.05),見圖6c。
圖6 不同表達的樞紐基因與免疫細胞浸潤之間的相關性
本研究的結果表明CCNB1、ASPM 和AURKA在HCC 中高表達且與HCC 患者不良的OS 和DFS 相關。 目前,有許多證據(jù)表明這3 個樞紐基因在HCC 的發(fā)生發(fā)展中具有重要作用。有研究發(fā)現(xiàn),在HCC 患者中AURKA 的表達與腫瘤大小、OS 和DFS 長短密切相關[12-13]。 也有研究表明CCNB1、ASPM 和AURKA 在HCC 中過度表達, 可能是潛在的HCC 早期診斷生物標志物[14-17]。 最近的一項研究顯示,CCNB1 基因的敲除可顯著抑制HCC 中的細胞增殖、遷移和侵襲[18]。 本研究對于CCNB1、ASPM 和AURKA 在HCC 中的分析結果與之前的研究所報道的一致[19-21]。 因此,這3 個基因具有作為HCC 預后標志物的潛力。然而,當前還沒有相關研究闡明其在HCC 發(fā)生、 發(fā)展以及轉移中的具體作用機制。
有研究表明,CCNB1、ASPM 和AURKA 是 參與細胞分裂和增殖的重要因素[22-24]。 一些研究還表明, 這3 個樞紐基因在其他疾病中的機制主要歸因于其對多種信號通路的調(diào)節(jié)[25-27]。 本研究探索了20 個可能與CCNB1、ASPM 和AURKA 功能相關的基因,其中一些已被確定為其重要的調(diào)節(jié)因子。據(jù)Krause 等[28]報道,PLK1 與腫瘤蛋白p53(TP53)的DNA 結合域結合以阻斷其轉錄活性可上調(diào)CCNB1 的表達。 此外,TPX2 是一種重要的輔助因子, 參與將AURKA 定位到紡錘微管并直接激活AURKA[29]。 有研究表示,AURKA 通過調(diào)節(jié)HCC 的上皮—間質轉化和腫瘤干細胞特性促進腫瘤轉移,這不利于HCC 患者的預后[30]。 我們的研究進一步對這3 個樞紐基因進行功能富集分析, 以了解其在HCC 中的生物學功能。結果表明這3 個樞紐基因主要參與PID-PLK1 通路、G2/M 轉換和有絲分裂的細胞周期蛋白A/B1/B2 的相關調(diào)節(jié)。CCNB1是細胞周期中的關鍵因子, 由STAT3 通過E2F 調(diào)節(jié)G2/M 期檢查點進行調(diào)節(jié)[31]。
近年來,大量研究表明,系統(tǒng)評價腫瘤浸潤免疫細胞對預測臨床預后和發(fā)展免疫治療具有重要意義[32]。Nataliya 等[33]應用CIBERSORT 評估健康人肝臟與HCC 或其鄰近組織中免疫細胞的相對比例, 發(fā)現(xiàn)HCC 中未活化的肥大細胞、 總B 細胞、CD4+和CD8+T 細胞均增加,而與健康肝臟相比,活化的肥大細胞、單核細胞和漿細胞減少。 目前,很少有研究表明腫瘤相關巨噬細胞、自然殺傷細胞、樹突狀細胞、TIM3、PD-L1、PD-L2 等在HCC 患者預后中的重要性[34-37]。 因此,我們分析了B 細胞、CD8+T 細胞、CD4+T 細胞、巨噬細胞、中性粒細胞和樹突狀細胞在CCNB1、ASPM 和AURKA 不同表達水平下的浸潤率并且觀察到它們的表達水平均與這些免疫細胞浸潤有關, 這對進一步了解HCC 的免疫狀況有一定的幫助。
本研究仍存在幾個局限性。 首先,我們使用了來自多個不同數(shù)據(jù)庫的數(shù)據(jù), 很難確保不同數(shù)據(jù)庫之間的一致性。 其次,未對這些數(shù)據(jù)庫中的數(shù)據(jù)進行驗證。 最后,沒有進一步研究和驗證這3 個樞紐基因在HCC 患者中的確切機制。
綜上所述,我們的研究表明CCNB1、ASPM 和AURKA 的高表達與HCC 的預后和免疫微環(huán)境顯著相關。 因此,我們希望本研究能夠有助于臨床醫(yī)生為肝癌患者選擇合適的預后標志物。