尹清臣, 王 磊, 王景梅, 侯麗艷, 賈如江
(邯鄲市中心醫(yī)院普一科, 邯鄲 056102)
肝癌是惡性程度最高的腫瘤之一, 發(fā)病率和死亡率均較高[1], 預(yù)后差, 5年生存率低至30%[2-3]。到2030年, 預(yù)計(jì)肝癌將成為癌癥相關(guān)死亡的第三大原因[4]。腫瘤細(xì)胞失控性的無(wú)限增殖是惡性腫瘤發(fā)生的本質(zhì), DNA 復(fù)制過(guò)程異常改變, 細(xì)胞周期的調(diào)控機(jī)制失常均與腫瘤細(xì)胞無(wú)限增殖密切相關(guān)[5]。微小染色體家族(minichromosome maintenance, MCMs)廣泛存在于真核生物細(xì)胞中, 參與DNA復(fù)制前復(fù)合物的形成、DNA復(fù)制的起始及DNA的延長(zhǎng)。MCM2~7這6個(gè)保守且高度同源的蛋白組成的環(huán)形結(jié)構(gòu)的親水性六聚體復(fù)合物, 是真核細(xì)胞DNA復(fù)制前復(fù)合體的關(guān)鍵組分, 與DNA復(fù)制的穩(wěn)定性和準(zhǔn)確性存在密切聯(lián)系, 是DNA復(fù)制與延伸所必需的重要組分[6]。許多研究闡明了MCMs家族基因在轉(zhuǎn)錄調(diào)控、染色質(zhì)重塑以及檢測(cè)點(diǎn)反應(yīng)等基因穩(wěn)定性等多個(gè)方面發(fā)揮重要作用[7-8]。其功能失調(diào)可導(dǎo)致染色體缺陷, 進(jìn)而可能導(dǎo)致腫瘤的形成[9-10]。本研究基于生物信息學(xué)方法, 分析MCMs在肝癌中的表達(dá), 分析其臨床意義及其與肝癌患者預(yù)后的關(guān)系, 并探討其相關(guān)機(jī)制, 以期為肝癌的精準(zhǔn)治療提供新的靶點(diǎn)。
UALCAN數(shù)據(jù)庫(kù)[11](http://ualcan.path.uab.edu/index.html)是一個(gè)有效的在線分析和挖掘腫瘤數(shù)據(jù)的網(wǎng)站, 主要是基于TCGA數(shù)據(jù)庫(kù)(The Cancer Genome Atlas, http://cancer.gov/)中的相關(guān)腫瘤數(shù)據(jù)進(jìn)行分析, 它可以對(duì)相關(guān)基因進(jìn)行生物標(biāo)記鑒定、表達(dá)譜分析、生存分析等。GEPIA數(shù)據(jù)庫(kù)(http://gepia.cancer-pku.cn/)是由北京大學(xué)開(kāi)發(fā)的基因表達(dá)譜動(dòng)態(tài)分析數(shù)據(jù)庫(kù), 該數(shù)據(jù)庫(kù)結(jié)合TCGA和GTEx數(shù)據(jù)庫(kù)(https://gtexportal.org)的數(shù)據(jù), 分析基因在不同腫瘤中的表達(dá)情況。本研究利用在線數(shù)據(jù)庫(kù)UALCAN統(tǒng)計(jì)MCMs的MCM2、MCM3、MCM4、MCM5、MCM6、MCM7基因在肝癌組織和正常組織中的表達(dá)量, 進(jìn)一步利用GEPIA數(shù)據(jù)庫(kù)擴(kuò)大分析這6個(gè)基因在肝癌與正常肝臟組織中的表達(dá)差異。
進(jìn)一步利用GEPIA數(shù)據(jù)庫(kù), 在線分析MCM2、MCM3、MCM4、MCM5、MCM6、MCM7基因表達(dá)與肝癌患者臨床分期的關(guān)系。
利用在線數(shù)據(jù)庫(kù)UALCAN分析MCMs家族中的MCM2、MCM3、MCM4、MCM5、MCM6、MCM7蛋白在肝癌組織和正常組織中的表達(dá)差異。
利用HPA數(shù)據(jù)庫(kù)檢索MCM2、MCM3、MCM4、MCM5、MCM6、MCM7基因在TCGA 標(biāo)本庫(kù)中的表達(dá)量, 分析這6個(gè)基因的表達(dá)與肝癌患者生存的關(guān)系。利用GEPIA數(shù)據(jù)庫(kù)分析MCM2、MCM3、MCM4、MCM5、MCM6、MCM7基因表達(dá)與肝癌患者無(wú)病生存率(disease-free survival, DFS)、總生存率(overall survival, OS)的關(guān)系。
利用GEPIA數(shù)據(jù)庫(kù)分析MCM2、MCM3、MCM4、MCM5、MCM6、MCM7基因在肝癌中表達(dá)的相關(guān)性。
String-DB數(shù)據(jù)庫(kù)[13](https://string-db.org)是生物基因和蛋白質(zhì)相互作用分析的檢索平臺(tái), 包含了已證實(shí)和可預(yù)測(cè)的蛋白-蛋白相互作用生物數(shù)據(jù)庫(kù), 也包括蛋白質(zhì)之間的間接功能相關(guān)性。本研究中輸入“MCM2”, 物種選擇“Homo sapiens”, 置信度選擇“Medium0.4”, 最大數(shù)相互作用選擇連接數(shù)不超過(guò)20, 進(jìn)行檢索、數(shù)據(jù)分析, 并進(jìn)行KEGG信號(hào)通路富集分析。
進(jìn)一步采用Metascape數(shù)據(jù)庫(kù)[14](https://metascape.org/)對(duì)MCM2、MCM3、MCM4、MCM5、MCM6、MCM7及相關(guān)作用基因進(jìn)行基因本體(gene ontology, GO)富集分析。
應(yīng)用UALCAN數(shù)據(jù)庫(kù)分析371例肝癌組織和50例正常肝組織中基因的表達(dá), 使用每千個(gè)堿基的轉(zhuǎn)錄每百萬(wàn)映射讀取的轉(zhuǎn)錄本數(shù)(transcripts per kilobase of exon model per million mapped reads, TPM)作為均一化后的基因表達(dá)單位, 結(jié)果顯示, MCMs基因家族中MCM2(0.927 TPMvs8.501 TPM)、MCM3(5.918 TPMvs23.652 TPM)、MCM4(2.443 TPMvs8.259 TPM)、MCM5(5.343 TPMvs23.254 TPM)、MCM6(1.625 TPMvs8.205 TPM)、MCM7(8.631 TPMvs30.707 TPM)基因在肝癌中表達(dá)明顯升高, 表達(dá)差異有統(tǒng)計(jì)學(xué)意義(P<0.05)(圖1)。應(yīng)用在線GEPIA數(shù)據(jù)庫(kù)分析369例肝癌組織和160例正常肝組織中MCM2、MCM3、MCM4、MCM5、MCM6、MCM7基因的表達(dá)差異, 發(fā)現(xiàn)差異有統(tǒng)計(jì)學(xué)意義(P<0.05)(圖2)。
利用GEPIA數(shù)據(jù)庫(kù)在線分析MCMs基因表達(dá)與肝癌臨床分期的關(guān)系, 結(jié)果顯示, 369例肝癌中Ⅰ期170例、Ⅱ期84例、Ⅲ期83例、Ⅳ期4例, 分期不明確的28例, 除外分期不明確的28例患者外, 分析結(jié)果顯示,MCM2、MCM3、MCM4、MCM5、MCM6、MCM7與患者臨床分期差異有統(tǒng)計(jì)學(xué)意義(P<0.05), 在Ⅰ期、Ⅱ期、Ⅲ期中, 隨著分期升高, MCMs基因表達(dá)明顯升高, 在Ⅳ期患者中, MCMs基因表達(dá)明顯降低(圖3)。
在線數(shù)據(jù)庫(kù)UALCAN統(tǒng)計(jì)結(jié)果顯示, MCMs蛋白在165例肝癌組織和165例正常組織中的表達(dá)差異明顯, 在肝癌組織中MCM2、MCM3、MCM4、MCM5、MCM6、MCM7蛋白表達(dá)明顯升高, 差異有統(tǒng)計(jì)學(xué)意義(P<0.05)(圖4)。
在GEPIA數(shù)據(jù)庫(kù)中利用Kaplan-Meier法分析MCMS基因與肝癌預(yù)后的關(guān)系, 結(jié)果提示,MCM2、MCM3、MCM5、MCM6、MCM7基因高表達(dá)組的肝癌患者OS、DFS(P<0.05)明顯差于低表達(dá)組, 只有MCM4基因高表達(dá)組差于與低表達(dá)組, 但是無(wú)統(tǒng)計(jì)學(xué)意義(圖5)。進(jìn)一步利用HPA數(shù)據(jù)庫(kù)共分析365例患者的肝癌組織基因表達(dá), 使用每千個(gè)堿基的轉(zhuǎn)錄每百萬(wàn)映射讀取的基因片段數(shù)(fragments per kilobase of exon model per million mapped fragments, FPKM)作為均一化后的基因表達(dá)單位, 結(jié)果顯示,MCM2、MCM3、MCM4、MCM5、MCM6、MCM7基因平均表達(dá)數(shù)值為4.7、15.6、5.2、6.4、6.0、16.1 FPKM。依據(jù)Kaplan-Meier預(yù)后分析結(jié)果, 選擇MCM2、MCM3、MCM4、MCM5、MCM6、MCM7基因表達(dá)的最佳臨界值, 其表達(dá)數(shù)值分別為12.36、14.32、8.72、12.04、12.41、17.13 FPKM, 此時(shí)顯示, MCMs基因表達(dá)與肝癌患者預(yù)后存在明顯相關(guān)性。5年生存率MCM2、MCM3、MCM4、MCM5、MCM6、MCM7高表達(dá)組預(yù)后較差(P<0.05)。
利用G E P I A數(shù)據(jù)庫(kù)分析肝癌中M C M 2、MCM3、MCM4、MCM5、MCM6、MCM7基因表達(dá)相關(guān)性, 結(jié)果顯示,MCM2與MCM3(r=0.81)、MCM2和MCM4(r=0.81)、MCM2和MCM5(r=0.84)、MCM2與MCM6(r=0.92)、MCM2與MCM7(r=0.67)、MCM3和MCM4(r=0.73)、MCM3和MCM5(r=0.71)、MCM3和MCM6(r=0.81)、MCM3和MCM7(r=0.63)、MCM4和MCM5(r=0.71)、MCM4和MCM6(r=0.81)、MCM4和MCM7(r=0.65)、MCM5和MCM6(r=0.81)、MCM5和MCM7(r=0.63)、MCM6和MCM7(r=0.65)表達(dá)關(guān)系密切, 具有明顯相關(guān)性,差異有統(tǒng)計(jì)學(xué)意義(P<0.05)(圖6)。
利用String-DB數(shù)據(jù)庫(kù)檢索得到如下結(jié)果(圖7):蛋白質(zhì)相互作用網(wǎng)絡(luò)(protein-protein interaction networks, PPI)富集分析結(jié)果顯示, 與MCM2、MCM3、MCM4、MCM5、MCM6、MCM7具有密切相互作用的蛋白有MCM10、ORC1、ORC2、ORC4、ORC5、GINS1、GINS2、GINS3、GINS4、CDC6、CDC7、CDC45、ASF1B、CDT1、WDHD1等(P<1.0e-16)。
圖7 與MCM2、MCM3、MCM4、MCM5、MCM6、MCM7相關(guān)蛋白網(wǎng)絡(luò)分析Fig. 7 Analysis of the protein network associated with MCM2, MCM3, MCM4, MCM5, MCM6, MCM7
利用Metascape數(shù)據(jù)庫(kù)對(duì)MCM2、MCM3、MCM4、MCM5、MCM6、MCM7及相關(guān)作用基因進(jìn)行GO富集分析, 結(jié)果顯示,MCM2、MCM3、MCM4、MCM5、MCM6、MCM7主要富集在DNA依賴的DNA復(fù)制、復(fù)制前體復(fù)合物的活化、DNA解螺旋、核基因的復(fù)制、DNA調(diào)控的復(fù)制、CDC6相關(guān)的起始識(shí)別復(fù)合物的調(diào)節(jié)、DNA復(fù)制檢查點(diǎn)的調(diào)控、蛋白-DNA復(fù)合物的組裝等信號(hào)通路(表1)。
表1 GO 富集分析結(jié)果Tab.1 GO results of enrichment analysis
MCM家族包括MCM2~7, 在DNA復(fù)制過(guò)程中起主要作用, 控制細(xì)胞周期從G1期向S期進(jìn)展[15-16], 且MCM4、MCM6和MCM10的表達(dá)水平與腫瘤進(jìn)展呈正相關(guān)關(guān)系[17-19]。Samad 等[20]研究發(fā)現(xiàn), MCM2可作為乳腺癌的預(yù)后標(biāo)志物。有研究表明, 胃癌組織中MCM8表達(dá)顯著升高, MCM8高表達(dá)的胃癌患者總體生存率顯著降低[21];MCM2、MCM6高表達(dá)可導(dǎo)致肝內(nèi)膽管癌的預(yù)后不良[22];MCM7基因在肝癌組織和細(xì)胞中高表達(dá), 且與肝癌患者預(yù)后不良有關(guān),MCM7基因沉默抑制細(xì)胞活性, 促進(jìn)細(xì)胞凋亡, 阻滯肝癌細(xì)胞周期從G1期向S期進(jìn)展[23]。MCMs家族在DNA 復(fù)制與細(xì)胞周期進(jìn)程和檢查點(diǎn)調(diào)控結(jié)合等方面具有重要作用, 有望成為肝癌治療中的重要靶點(diǎn)[24]。
本研究對(duì)TCGA和GTEx數(shù)據(jù)庫(kù)的數(shù)據(jù)分析表明,MCM2、MCM3、MCM4、MCM5、MCM6、MCM7基因在肝癌中高表達(dá), MCM2、MCM3、MCM4、MCM5、MCM6、MCM7蛋白在肝癌組織表達(dá)升高。這些結(jié)果充分表明, MCMs家族基因水平和蛋白水平在肝癌中表達(dá)較正常肝組織均明顯升高。MCM2、MCM3、MCM4、MCM5、MCM6、MCM7基因表達(dá)在Ⅰ期、Ⅱ期、Ⅲ期中隨著分期升高表達(dá)明顯升高, 在Ⅳ期患者中MCMs基因表達(dá)明顯降低, 分析原因可能與患者Ⅳ期病例數(shù)目過(guò)少有關(guān)。
HPA數(shù)據(jù)庫(kù)預(yù)后分析顯示,MCM2、MCM3、MCM4、MCM5、MCM6、MCM7基因高表達(dá)組預(yù)后較差。GEPIA數(shù)據(jù)庫(kù)提示,MCM2、MCM3、MCM4、MCM5、MCM6、MCM7基因高表達(dá)組肝癌患者的OS、DFS明顯差于低表達(dá)組, 只有MCM4高表達(dá)組差于與低表達(dá)組, 但是無(wú)統(tǒng)計(jì)學(xué)意義。這些結(jié)果充分表明, MCMs家族在肝癌中高表達(dá)與患者不良預(yù)后有關(guān), 可以作為肝癌預(yù)后預(yù)測(cè)的重要分子標(biāo)記。
本研究通過(guò)String-DB數(shù)據(jù)庫(kù)在PPI網(wǎng)絡(luò)中預(yù)測(cè)的與MCM2、MCM3、MCM4、MCM5、MCM6、MCM7具有相互作用的蛋白如下:MCM10、ORC1、ORC2、ORC4、ORC5、GINS1、GINS2、GINS3、GINS4、CDC6、CDC7、CDC45、ASF1B、CDT1、WDHD1等。GO 富集分析發(fā)現(xiàn), MCMs主要富集在DNA依賴的DNA復(fù)制、復(fù)制前體復(fù)合物的活化、DNA解螺旋、核基因的復(fù)制、DNA調(diào)控的復(fù)制、CDC6相關(guān)的起始識(shí)別復(fù)合物的調(diào)節(jié)、DNA復(fù)制檢查點(diǎn)的調(diào)控、蛋白-DNA復(fù)合物的組成等信號(hào)通路上。結(jié)合以往對(duì)MCMs功能研究的成果, 可以預(yù)測(cè)MCMs家族在肝癌中的高表達(dá), 主要通過(guò)參與DNA合成、復(fù)制的相關(guān)具體環(huán)節(jié), 進(jìn)而干擾了DNA合成、復(fù)制的過(guò)程, 導(dǎo)致肝癌的發(fā)生發(fā)展。
本研究認(rèn)為, MCMs家族在肝癌中高表達(dá), 并且表達(dá)具有明顯的相關(guān)性, 構(gòu)成MCMs家族在肝癌中的功能模塊, 通過(guò)參與DNA合成、復(fù)制的具體生物過(guò)程, 導(dǎo)致肝癌的發(fā)生與發(fā)展。MCMs家族在肝癌中表達(dá)升高, 可能是肝癌發(fā)生的早期事件, 并且還能夠直接反應(yīng)肝癌細(xì)胞的增殖水平, 從而影響肝癌患者的預(yù)后, 是肝癌早期發(fā)生和預(yù)后的重要生物學(xué)指標(biāo)。本研究對(duì)MCMs家族成員在肝癌中的作用研究具有重要的參考價(jià)值。MCMs家族在肝癌中功能模塊的發(fā)現(xiàn), 有望為肝癌的早期篩查和靶向治療提供新的方向。但是本研究以生物信息學(xué)為主要研究工具, 仍需要進(jìn)一步試驗(yàn)研究證實(shí), 以期為肝癌的早期診斷和臨床治療提供新的靶點(diǎn)。