劉 珍 羅永金,2 胡曉霞
(1 廣西壯族自治區(qū)人民醫(yī)院婦科,廣西南寧市 530000; 2 廣西醫(yī)科大學(xué)臨床醫(yī)學(xué)院,廣西南寧市 530021)
宮頸癌是一種常見的婦科惡性腫瘤,高危型人乳頭瘤病毒感染已明確是其病因之一。盡管在過去幾十年里,宮頸癌的診斷和治療技術(shù)有很大進步,但其發(fā)病率和死亡率仍高居女性癌癥發(fā)病率的第四位,僅2020年全世界就有新發(fā)宮頸癌604 127例,有341 831人因?qū)m頸癌死亡[1]。手術(shù)和放化療是治療宮頸癌的主要手段,分期較晚、腫瘤復(fù)發(fā)和轉(zhuǎn)移是影響宮頸癌患者預(yù)后的主要因素[2],早發(fā)現(xiàn)、早治療對于改善宮頸癌患者的預(yù)后至關(guān)重要。因此,進一步探索宮頸癌診斷和治療的靶點有重要意義。細胞周期蛋白依賴性激酶抑制因子2A(cyclin-dependent kinase inhibitor 2A,CDKN2A)基因的缺失可通過負反饋導(dǎo)致細胞周期蛋白依賴性激酶(cyclin-dependent kinase,CDK)4、CDK6的活性增加,從而促進細胞周期進程[3]。CDKN2A基因異常表達或啟動子區(qū)過度甲基化在腫瘤的發(fā)生、發(fā)展中可能起著至關(guān)重要的作用[4-6]。本研究采用生物信息學(xué)技術(shù)分析CDKN2A基因在宮頸癌組織中的表達情況及其與宮頸癌患者臨床病理特征、預(yù)后、腫瘤免疫細胞浸潤的關(guān)系,并通過繪制蛋白-蛋白相互作用(protein-protein interaction,PPI)網(wǎng)絡(luò)、京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路富集分析、分析CDKN2A基因啟動子的甲基化水平和上游miRNA,來探討CDKN2A基因在宮頸癌中的可能作用機制,為進一步研究宮頸癌的診斷和治療方法提供新思路。
1.1 數(shù)據(jù)來源 從GEO數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/)中下載同時含有宮頸癌組織與正常宮頸組織基因表達的芯片GSE7803、GSE64217和GSE63514用于篩選差異性表達基因,然后分別采用GPL96、GPL10558和GPL570平臺采集芯片數(shù)據(jù)。
1.2 基因篩選及驗證 利用GEO數(shù)據(jù)庫自帶軟件包GEO2R對芯片(GSE7803、GSE64217和GSE63514)數(shù)據(jù)進行差異性表達基因的篩選,基因篩選標準為|log2FC|>1且adj.P值<0.01;再利用Venn Diagram在線工具(http://bioinformatics.psb.ugent.be/webtools/Venn/)繪制韋恩圖,對篩選出的差異性表達基因取交集,獲得共同的差異性表達基因。利用GEPIA數(shù)據(jù)庫(http://gepia.cancer-pku.cn/)驗證CDKN2A基因在宮頸鱗狀細胞癌組織中的表達水平。
1.3 差異性表達基因的通路富集分析 針對共同的差異性表達基因,利用DAVID 在線工具( https://david.ncifcrf.gov/)分析差異性表達基因的KEGG的通路富集情況。
1.4 構(gòu)建PPI網(wǎng)絡(luò) 將3個芯片的差異性表達基因?qū)隨TRING數(shù)據(jù)庫 (www.string-db.org/),提取含有差異性表達基因的文件;再將獲得的文件導(dǎo)入Cytoscape軟件(Vision 3.8.2),通過軟件中的Cytohubba插件預(yù)測和查找基因的重要節(jié)點和子網(wǎng)絡(luò),利用其中的MCC算法,在差異性表達基因編碼蛋白中篩選與CDKN2A基因編碼蛋白相互作用密切的蛋白,得到PPI網(wǎng)絡(luò)。
1.5 CDKN2A基因表達與宮頸癌患者臨床病理特征、預(yù)后的關(guān)系及宮頸癌組織中 CDKN2A基因啟動子甲基化水平 利用 UALCAN在線工具( http://ualcan.path.uab.edu/cgi-bin/ualcan-res.pl)下載TCGA數(shù)據(jù)庫中宮頸癌鱗狀細胞癌患者基因的表達數(shù)據(jù), 分析CDKN2A基因在不同臨床病理特征宮頸癌患者中的表達情況,其中臨床病理特征包括患者體重、年齡、腫瘤分期、腫瘤分化程度、淋巴結(jié)轉(zhuǎn)移情況;分析不同CDKN2A基因表達水平宮頸癌患者的生存期差異;分析宮頸癌組織中CDKN2A基因啟動子區(qū)域甲基化水平。以P<0.05為差異具有統(tǒng)計學(xué)意義。
1.6 CDKN2A基因表達水平與免疫細胞浸潤的關(guān)系 利用TIMER數(shù)據(jù)庫(https://cistrome.shinyapps.io/timer/)分析宮頸癌中CDKN2A基因表達水平與各類型免疫細胞浸潤水平的相關(guān)性,包括B淋巴細胞、CD8+T淋巴細胞、CD4+T淋巴細胞、巨噬細胞、中性粒細胞和樹突狀細胞。
1.7 上游miRNA的篩選 利用在線軟件ENCORI(https://starbase.sysu.edu.cn)和mirDIP(http://ophid.utoronto.ca/mirDIP)分析與CDKN2A基因有結(jié)合靶點的miRNA,利用Venn Diagram在線工具繪制韋恩圖,獲取兩個軟件均能預(yù)測到的miRNA交集。
2.1 CDKN2A基因在宮頸癌組織中的表達情況 從數(shù)據(jù)集GSE7803、GSE64217和GSE63514中分別得到差異性表達基因919個、4 324個和3 845個,經(jīng)過Venn Diagram在線工具取交集后獲得347個共同差異性表達基因 ,其中CDKN2A基因在3個基因芯片數(shù)據(jù)中均顯示為上調(diào)基因,見圖1。經(jīng)GEPIA數(shù)據(jù)庫驗證,CDKN2A基因在宮頸鱗狀細胞癌組織組織中呈高表達水平(P<0.05),見圖2。
圖1 3個數(shù)據(jù)集篩選出的差異性表達基因的交集
圖2 GEPIA數(shù)據(jù)庫驗證結(jié)果
2.2 KEGG通路富集分析結(jié)果 針對347個差異性表達基因進行KEGG通路富集分析,發(fā)現(xiàn)CDKN2A基因參與了細胞周期信號通路、p53信號通路及膀胱癌信號通路,見表1。
表1 CDKN2A基因參與的KEGG信號通路及其他參與基因
2.3 PPI網(wǎng)絡(luò)分析結(jié)果 利用Cytoscape軟件中Cytohubba程序進行分析,發(fā)現(xiàn)共有22個蛋白與CDKN2A基因編碼蛋白存在密切的相互作用,見圖3。
圖3 CDKN2A基因編碼蛋白與其他差異性表達基因編碼蛋白的相互作用
2.4 CDKN2A基因表達情況與宮頸癌患者臨床病理特征、預(yù)后的關(guān)系 與淋巴結(jié)轉(zhuǎn)移陰性宮頸癌患者相比,淋巴結(jié)轉(zhuǎn)移陽性宮頸癌患者的CDKN2A基因表達水平更高(P=0.035),但在不同腫瘤分期、體重、年齡及腫瘤分化程度患者之間,CDKN2A基因表達水平差異均無統(tǒng)計學(xué)意義(均P>0.05),見圖4。CDKN2A基因高表達水平的宮頸癌患者的生存期短于低表達者(P=0.024),見圖5。
圖4 圖4 不同臨床病理特征宮頸癌患者之間 CDKN2A基因的表達情況
圖5 CDKN2A基因高表達水平與低表達水平宮頸癌患者的生存曲線比較
2.5 宮頸癌組織的CDKN2A基因啟動子區(qū)域甲基化水平 宮頸癌組織中CDKN2A基因啟動子區(qū)域甲基化水平較正常宮頸組織升高(P=0.008),見圖6。
圖6 宮頸癌組織的CDKN2A基因啟動子區(qū)域甲基化水平
2.6 CDKN2A基因與腫瘤免疫細胞浸潤的相關(guān)性 CDKN2A基因的表達水平與巨噬細胞浸潤水平呈負相關(guān),與中性粒細胞、樹突狀細胞浸潤水平均呈正相關(guān)(均P<0.05),見圖7。
圖7 CDKN2A基因表達水平與巨噬細胞、中性粒細胞、樹突狀細胞浸潤水平的相關(guān)性注:橫坐標代表浸潤水平,縱坐標代表CDKN2A表達水平
2.7 上游miRNA的篩選結(jié)果 通過ENCORI和mirDIP軟件分析,分別得到90個和318個可能與CDKN2A基因有結(jié)合靶點的miRNA,取交集后獲得9個miRNA,分別為hsa-miR-4436a、hsa-miR-449a、hsa-miR-125a-5p、hsa-miR-125b-5p、hsa-miR-124-3p、hsa-miR-1286、hsa-miR-331-3p、hsa-miR-4319、hsa-miR-506-3p。
雖然近幾年宮頸癌的篩查和治療手段不斷發(fā)展,但宮頸癌仍是發(fā)病率最高的女性生殖道惡性腫瘤[7],嚴重威脅女性的生命健康,宮頸癌新的診斷和治療方法仍有待進一步研究。與根治性手術(shù)、放射治療、化學(xué)治療等傳統(tǒng)的治療方法相比,宮頸癌基因靶向治療是一種新的治療方法,通過對宮頸癌患者實施基因治療能夠有效抑制宮頸癌細胞的生長[8]。因此,尋找與宮頸癌發(fā)生和發(fā)展相關(guān)的關(guān)鍵基因具有重要意義。我們根據(jù)GEO數(shù)據(jù)庫的3個宮頸癌基因芯片信息整合結(jié)果及GEPIA軟件的驗證結(jié)果,發(fā)現(xiàn)CDKN2A基因在宮頸癌組織中呈高表達;通過UALCAN在線工具對TCGA數(shù)據(jù)庫提供的數(shù)據(jù)進行分析后發(fā)現(xiàn),宮頸癌組織中CDKN2A基因表達水平升高時宮頸癌患者淋巴結(jié)轉(zhuǎn)移可能性大,且患者的預(yù)后更差,這表明CDKN2A基因可能在宮頸癌的發(fā)生及發(fā)展過程中起著重要作用,是宮頸癌患者預(yù)后評估的潛在分子標志物。
研究表明,免疫細胞的浸潤與腫瘤的發(fā)生、發(fā)展息息相關(guān),許多腫瘤不良預(yù)后相關(guān)基因的表達水平與腫瘤免疫細胞的浸潤有關(guān)[9-10]。免疫治療已成為宮頸癌治療的新手段。因此,我們利用TIMER數(shù)據(jù)庫進行分析,發(fā)現(xiàn)CDKN2A基因表達水平與腫瘤免疫細胞浸潤相關(guān),其中與巨噬細胞浸潤水平呈負相關(guān),與中性粒細胞、樹突狀細胞浸潤水平均呈正相關(guān)(均P<0.05),這或可為研究宮頸癌的免疫治療提供新的線索。
本研究中,我們從多方面進一步探討CDKN2A基因的作用機制。蛋白質(zhì)的功能主要是通過與其他蛋白質(zhì)相互作用來實現(xiàn)的,因此我們構(gòu)建了CDKN2A基因編碼蛋白的PPI網(wǎng)絡(luò),發(fā)現(xiàn)CDKN2A基因編碼蛋白與多個基因編碼蛋白之間存在相互作用,其中已有研究報告CCNE1可以促進宮頸癌的進展[11]。通過研究此網(wǎng)絡(luò)中與CDKN2A關(guān)系密切的關(guān)鍵蛋白,或可為探索CDKN2A在宮頸癌中的作用機制提供新線索。同時,我們進行了KEGG信號通路分析,結(jié)果顯示CDKN2A基因參與了細胞周期信號通路、p53信號通路及膀胱癌信號通路。研究表明,CDKN2A基因是一個細胞周期依賴的蛋白,編碼細胞周期抑制劑蛋白p16和p14,可與 CDK4、CDK6 結(jié)合,形成具有激酶活性的復(fù)合物,從而阻斷該復(fù)合物對Rb蛋白磷酸化,導(dǎo)致細胞周期停止在G期,從而抑制細胞的增殖[12]。此外,DNA甲基化是癌癥發(fā)生和發(fā)展過程中常見的早期分子遺傳學(xué)變化。已有研究表明在多種腫瘤細胞中CDKN2A基因啟動子過度甲基化導(dǎo)致CDKN2A基因突變,從而影響腫瘤的進展,如胰腺癌、胃癌、食管癌等[3,5,13-15],但在宮頸癌中暫無此類研究。因此,我們利用UALCAN在線工具提取TCGA數(shù)據(jù)庫中的數(shù)據(jù)進行分析,發(fā)現(xiàn)宮頸癌組織中CDKN2A基因的啟動子區(qū)域甲基化水平升高。這提示宮頸癌的發(fā)展可能受CDKN2A基因的啟動子區(qū)域甲基化水平的影響,但具體調(diào)控機制仍需進一步研究。
miRNA廣泛參與基因轉(zhuǎn)錄后水平的調(diào)控,是腫瘤領(lǐng)域研究的熱點,其主要通過靶向調(diào)控靶基因mRNA的3′末端非翻譯區(qū)參與細胞增殖、侵襲、遷移和凋亡等重要生物學(xué)過程[16]。本研究結(jié)果顯示,CDKN2A基因可能與9個miRNA存在結(jié)合靶點,推測CDKN2A基因可能受上游miRNA的調(diào)控發(fā)揮生物學(xué)功能。但這些miRNA與CDKN2A基因表達的相關(guān)性及結(jié)合靶點仍需進一步實驗研究驗證。
綜上所述,宮頸癌組織中 CDKN2A基因呈高表達水平,且與患者淋巴結(jié)轉(zhuǎn)移、疾病預(yù)后、腫瘤免疫細胞浸潤有關(guān),其可作為宮頸癌診斷及預(yù)后評估的潛在分子標記物,并可為研究宮頸癌的免疫治療提供新線索;此外,CDKN2A基因可能通過啟動子區(qū)域甲基化和上游miRNA調(diào)控發(fā)揮生物學(xué)功能,這為進一步研究宮頸癌的診斷和治療方法提供了新思路。