饒玉梅,張微微,張 穎,趙 倩,李留霞,郭瑞霞
鄭州大學(xué)第一附屬醫(yī)院婦科 鄭州 450052
卵巢癌病死率位居女性生殖系統(tǒng)惡性腫瘤之首[1]。 卵巢癌確診時(shí)往往期別較晚,預(yù)后差,5 a生存率約為47%[2]。因此,研究卵巢癌的發(fā)病機(jī)制,能為該疾病的診治提供理論和實(shí)踐依據(jù),具有重要意義。本研究從GEO數(shù)據(jù)庫(kù)中,獲取漿液性卵巢癌與正常卵巢組織基因芯片數(shù)據(jù),經(jīng)過(guò)分析獲得二者間差異表達(dá)基因(differentially expressed gene,DEG),通過(guò)對(duì)DEG進(jìn)一步分析,得到與卵巢癌患者生存期相關(guān)的關(guān)鍵基因,有助于我們更好地探索卵巢癌發(fā)病機(jī)制。
1.1 數(shù)據(jù)提取從GEO數(shù)據(jù)庫(kù)(http://www.ncbi.nlm.nih.gov/geo)中篩選下載數(shù)據(jù)集GSE54388、GSE105437,數(shù)據(jù)集分析平臺(tái)均為GPL(gene platform)570。GSE54388包含16例漿液性卵巢癌和6例正常卵巢組織,GSE105437包含10例高級(jí)別漿液性卵巢癌和 5例正常卵巢組織。
1.2 DEG篩選利用GEO分析工具GEO2R(http://www.ncbi.nlm.nih.gov/geo/geo2r)分別篩選出兩個(gè)數(shù)據(jù)集中兩組之間的DEG。篩選標(biāo)準(zhǔn)為校正后P<0.05,|lgFC|>1。下載所得原始DEG數(shù)據(jù),去除沒(méi)有對(duì)應(yīng)基因符號(hào)的探針組或同一基因?qū)?yīng)多個(gè)探針等情況。然后應(yīng)用Venn軟件(http://bioinformatics.psb.ugent.be/webtools/Venn/)分析并作圖,得出交集。
1.3 GO和KEGG富集分析用DAVID 6.8數(shù)據(jù)庫(kù)(http://david.ncifcrf.gov/)對(duì)篩選出的DEG進(jìn)行功能富集,主要包括GO和KEGG富集分析。設(shè)P<0.05為富集差異有統(tǒng)計(jì)學(xué)意義。
1.4 蛋白質(zhì)-蛋白質(zhì)相互作用(protein-protein interaction,PPI)網(wǎng)絡(luò)及模塊分析用String 11.0數(shù)據(jù)庫(kù)(http://string-db.org)構(gòu)建DEG的PPI網(wǎng)絡(luò)。利用String檢索DEG中的交互基因。然后用Cytoscape 3.7.1軟件中的MCODE 1.5.1對(duì)篩選基因進(jìn)行重塑,構(gòu)建調(diào)控網(wǎng)絡(luò)模塊[3]。
1.5 關(guān)鍵基因篩選分析應(yīng)用Kaplan Meier plotter(http://kmplot.com/analysis)網(wǎng)站分析關(guān)鍵基因,進(jìn)一步篩選出在卵巢癌組織中表達(dá)與總生存率有關(guān)的關(guān)鍵基因(P<0.05)。再利用GEPIA 數(shù)據(jù)庫(kù)(http://gepia.cancer-pku.cn)分析所獲得的關(guān)鍵基因,再一次篩選出表達(dá)異常的基因(P<0.05)。
2.1 DEG的篩選從GSE105437、GSE54388兩個(gè)數(shù)據(jù)集分別得到1 959個(gè)(上調(diào)1 399個(gè)、下調(diào)560個(gè))、3 147個(gè)(上調(diào)1 881個(gè)、下調(diào)1 266個(gè))DEG。Venn軟件對(duì)二者取交集獲得322個(gè)DEG,包括174個(gè)上調(diào)和 148個(gè)下調(diào)基因(圖1)。
左:上調(diào)基因;右:下調(diào)基因
2.2 GO和KEGG富集分析結(jié)果對(duì)322個(gè)DEG進(jìn)行GO和KEGG富集分析。GO分析結(jié)果見(jiàn)表1,表內(nèi)基因數(shù)為對(duì)應(yīng)GO的DEG數(shù)目,結(jié)果分為生物學(xué)過(guò)程、細(xì)胞組分和分子功能3個(gè)方面。DEG的生物學(xué)過(guò)程:上調(diào)基因主要集中在染色體分離、血管平滑肌發(fā)育、上皮細(xì)胞分化等方面(僅列出前3位);下調(diào)基因主要集中在平滑肌細(xì)胞增殖負(fù)調(diào)節(jié)、蛋白分泌正調(diào)節(jié)、RNA聚合酶Ⅱ啟動(dòng)子轉(zhuǎn)錄負(fù)調(diào)控等方面。細(xì)胞組分:上調(diào)基因主要集中在染色體、膜結(jié)合細(xì)胞器、膜封閉管腔等部位;下調(diào)基因主要集中在Z盤(pán)、膜的外部成分、高爾基管腔等部位。分子功能:上調(diào)基因涉及蛋白質(zhì)結(jié)合;下調(diào)基因涉及氧化還原酶活性、核酸結(jié)合、肌動(dòng)蛋白絲結(jié)合等方面。KEGG富集分析結(jié)果見(jiàn)表2:上調(diào)基因富集于細(xì)胞周期、癌癥通路、ECM作用受體3條信號(hào)通路;下調(diào)基因富集于干細(xì)胞多能性的信號(hào)通路調(diào)節(jié)、酪氨酸代謝、癌癥蛋白多糖等信號(hào)通路。
表1 卵巢癌DEG的GO分析結(jié)果
表2 卵巢癌DEG的KEGG富集分析結(jié)果
2.3 PPI網(wǎng)絡(luò)構(gòu)建及關(guān)鍵基因選擇的結(jié)果對(duì)322個(gè)DEG分析后制作的PPI網(wǎng)絡(luò)圖見(jiàn)圖2。對(duì)篩選的關(guān)鍵基因進(jìn)行網(wǎng)絡(luò)模塊構(gòu)建,得到MCM10、 MCM4、GINS2、BRCA1、FANCD2、TOP2A、KIF4A、MKI67、ESPL1、CDCA3、NEK2、KPNA2、ASF1B、ESCO2 14個(gè)關(guān)鍵基因,均為上調(diào)基因(圖3)。
紅色:上調(diào)基因;綠色:下調(diào)基因
圖3 關(guān)鍵基因的模塊圖
2.4 關(guān)鍵基因分析結(jié)果用Kaplan Meier plotter網(wǎng)站分析14個(gè)關(guān)鍵基因表達(dá)與卵巢癌患者總生存率之間關(guān)系,其中MCM10、FANCD2、TOP2A、ESPL1、CDCA3、NEK2、ESCO2等7個(gè)基因高表達(dá)及BRCA1低表達(dá)與患者總生存率不良有關(guān)(圖4)。用GEPIA數(shù)據(jù)庫(kù)分析這8個(gè)關(guān)鍵基因在卵巢癌和正常卵巢組織中表達(dá)情況,結(jié)果顯示卵巢癌組織中MCM10、TOP2A、ESPL1、CDCA3、NEK2、ESCO2等6個(gè)基因的表達(dá)水平高于正常卵巢組織中的表達(dá)水平(圖5)。
圖4 卵巢癌組織中8個(gè)關(guān)鍵基因表達(dá)水平與患者總生存曲線關(guān)系
圖5 6個(gè)關(guān)鍵基因在卵巢癌與正常卵巢組織中的表達(dá)情況
我國(guó)每年死于卵巢癌的女性約為2.5萬(wàn),而且呈上升趨勢(shì)[4]。漿液性卵巢癌早期診斷困難,患者就診時(shí)往往已發(fā)生盆腹腔廣泛轉(zhuǎn)移[5]。因此,尋找能早期診斷、預(yù)后預(yù)測(cè)、靶向治療的分子靶標(biāo),成為目前分子腫瘤學(xué)研究重點(diǎn)之一。為此,本研究提取GSE105437、GSE54388兩個(gè)數(shù)據(jù)集中卵巢癌和正常卵巢組織資料,運(yùn)用生物信息學(xué)分析方法,最終獲取了MCM10、TOP2A、ESPL1、CDCA3、NEK2、ESCO2等6個(gè)關(guān)鍵基因。
MCM10高表達(dá)與前列腺癌[6]、乳腺癌[7]等腫瘤預(yù)后不良或惡性行為有關(guān)。MCM10在染色體復(fù)制的S期使DNA松解,其核心序列含有進(jìn)化保守的結(jié)構(gòu)域,由寡核苷酸-糖和相鄰的鋅指結(jié)構(gòu)組成。其異常表達(dá)致腫瘤患者預(yù)后不良機(jī)制未明。ESCO2對(duì)細(xì)胞染色體凝聚及基因組穩(wěn)定性有重要作用,其在腎細(xì)胞癌[8]、乳腺癌[9]組織或細(xì)胞中高表達(dá)。ESCO2表達(dá)失調(diào)能夠抑制基質(zhì)金屬蛋白酶2表達(dá),從而影響結(jié)腸癌的轉(zhuǎn)移[10]。在胃癌細(xì)胞中抑制ESCO2的表達(dá),能通過(guò)影響AMPK信號(hào)通路而抑制腫瘤細(xì)胞的增殖并誘導(dǎo)腫瘤細(xì)胞凋亡[11]。而CDCA3高表達(dá)與結(jié)腸癌預(yù)后不良有關(guān),在結(jié)腸癌細(xì)胞SW480中降低CDCA3表達(dá),能影響P21通路使腫瘤細(xì)胞阻滯在G1/S期,導(dǎo)致細(xì)胞增殖受抑[12]。同樣在胃癌組織中CDCA3高表達(dá)也促進(jìn)腫瘤惡性行為[13]。ESPL1編碼一種分離酶,在細(xì)胞有絲分裂過(guò)程中切割染色體,其高表達(dá)不僅使乳腺癌細(xì)胞容易受到因染色體錯(cuò)聚,而致染色體非整倍體出現(xiàn),而且還使細(xì)胞容易受到其他不穩(wěn)定性遺傳因素的影響,包括DNA損傷和關(guān)鍵抑癌基因位點(diǎn)的丟失。這些變化疊加起來(lái),能導(dǎo)致腫瘤發(fā)生發(fā)展[14]。MCM10、ESPL1、CDCA3、ESCO2在多種惡性腫瘤發(fā)生發(fā)展中有重要作用,但其在卵巢癌中的研究鮮有報(bào)道。我們的研究顯示這4種基因在卵巢癌組織中都是高表達(dá),且高表達(dá)的患者生存期縮短。
有研究顯示:NEK2在卵巢癌組織中高表達(dá)[15],且與卵巢癌的紫杉醇耐藥有關(guān)[16]。抑制卵巢癌細(xì)胞中NEK2表達(dá),能抑制腫瘤細(xì)胞的侵襲和增殖[17]。TOP2A在細(xì)胞有絲分裂中集聚于染色質(zhì),作用于著絲點(diǎn),在DNA穩(wěn)定性中發(fā)揮作用。它也是化療藥蒽環(huán)類(lèi)和依托泊苷類(lèi)藥物的作用靶點(diǎn)之一[18]。研究[19]發(fā)現(xiàn)TOP2A在漿液性卵巢癌組織中表達(dá)上調(diào),并通過(guò)TGF-β/Smad途徑加速卵巢癌進(jìn)展。復(fù)發(fā)性上皮性卵巢癌組織中TOP2A表達(dá)升高,患者對(duì)脂質(zhì)體阿霉素的敏感性更高[20]。表明TOP2A在預(yù)測(cè)卵巢癌患者對(duì)脂質(zhì)體阿霉素敏感性方面有良好的價(jià)值。
總之,雖然本研究發(fā)現(xiàn)了一些有意義的結(jié)果,但也有一些局限性。比如缺乏實(shí)驗(yàn)驗(yàn)證,以及這6個(gè)基因如何影響卵巢癌的發(fā)生發(fā)展,尚需進(jìn)一步研究。