董婧婷,衡立,康紹叁,劉健,田志崇,張立國(guó),張金存,李治國(guó),沈宏,曹鳳宏*
本研究?jī)r(jià)值:
本研究從基因、通路到預(yù)后的角度深入挖掘了與去勢(shì)抵抗性前列腺癌相關(guān)的基因,并發(fā)現(xiàn)CDC20、MAD2L1 和NUSAP1 與去勢(shì)抵抗性前列腺癌的發(fā)生、發(fā)展密切相關(guān),為去勢(shì)抵抗性前列腺癌的預(yù)防和治療提供了新的研究方向。
前列腺癌(prostate cancer,PCa)是癌癥相關(guān)死亡率第二高的惡性疾病[1],目前主要采取雄激素剝奪療法(androgen-deprivation therapy,ADT)進(jìn)行治療[2]。據(jù)報(bào)道,10%~20%的PCa 患者對(duì)ADT 產(chǎn)生抵抗,最終演變?yōu)槿?shì)抵抗性前列腺癌(castration-resistant prostate cancer,CRPC),且中位生存期僅為14 個(gè)月[3],預(yù)后不良,死亡率極高[4]。已有研究發(fā)現(xiàn)在去勢(shì)狀態(tài)下雄激素受體(androgen receptor,AR)信號(hào)的傳導(dǎo)與CRPC潛在分子機(jī)制有關(guān)[5],但具體機(jī)制仍不十分清楚,且目前臨床上尚無(wú)有效治療CRPC 的方法。因此亟須尋找新的關(guān)鍵基因,為臨床診療提供新思路。
生物信息學(xué)是一門(mén)分析理解生物數(shù)據(jù)的學(xué)科,其可以在生物體表達(dá)的不同位置、不同通路中進(jìn)行富集,從而發(fā)現(xiàn)與疾病相關(guān)聯(lián)的生物信息,還可根據(jù)基因本體論(GO)、京都基因和基因組百科全書(shū)(KEGG)和蛋白質(zhì)-蛋白質(zhì)相互作用(PPI)綜合分析,獲取在癌癥相關(guān)疾病中較為穩(wěn)定的差異表達(dá)基因(differentially expressed genes,DEGs),是一種能有效發(fā)掘癌癥相關(guān)疾病基因表達(dá)譜的重要工具[6]。已有研究應(yīng)用生物信息學(xué)方法找到與PCa 相關(guān)的關(guān)鍵基因。SUN 等[7]通過(guò)生物信息學(xué)分析鑒定出ARHGEF38 等關(guān)鍵基因和PCa 進(jìn)展相關(guān);SHEN 等[8]運(yùn)用基因表達(dá)分析揭示了與PCa 預(yù)后相關(guān)的關(guān)鍵基因并提出靶向細(xì)胞周期通路可能與PCa 的預(yù)后和治療相關(guān);GU 等[9]采用生物信息學(xué)方法確定了TOP2A、CCNB2 等關(guān)鍵基因可促進(jìn)PCa 的發(fā)展和轉(zhuǎn)移。為進(jìn)一步找到和CRPC 發(fā)展密切的候選基因,本研究通過(guò)生物信息學(xué)方法挖掘與CRPC 進(jìn)展相關(guān)的關(guān)鍵基因。
本研究結(jié)合CRPC 和PCa 樣本的基因表達(dá)譜,首先對(duì)數(shù)據(jù)集進(jìn)行處理,篩選DEGs,分析DEGs 的功能和途徑以及疾病的信號(hào)通路。然后構(gòu)建PPI 網(wǎng)絡(luò),對(duì)重要模塊進(jìn)行分析并篩選出具有生存意義的關(guān)鍵基因,本研究結(jié)果可為CRPC 發(fā)病機(jī)制、治療和預(yù)后的相關(guān)研究提供新思路。
1.1 數(shù)據(jù)收集 從國(guó)家生物技術(shù)信息中心(National Center for Biotechnology Information,NCBI)(http://www.ncbi.nlm.nih.gov/) 的GEO(http://www.ncbi.nlm.nih.gov/geo/)數(shù)據(jù)庫(kù)中下載微陣列數(shù)據(jù)集GSE32269。GSE32269 芯片由Affymetrix 公司GPL96 平臺(tái)檢測(cè),包括29 例CRPC 樣本和22 例原發(fā)性PCa 樣本。
1.2 篩選DEGs 使用R 語(yǔ)言4.0.3 中的Affy 包[10],將normalize.method 設(shè) 置 為“quantiles”,bgcorrect.method 設(shè)置為“rma”,pmcorrect.method 設(shè)置為“pmonly”,summary.method 設(shè)置為“l(fā)iwong”,提取基因的表達(dá)量。然后采用t 檢驗(yàn)得到兩組樣本基因表達(dá)量的P 值,利用Benjamini-Hochberg 錯(cuò)誤發(fā)現(xiàn)率方法,調(diào)整P 值來(lái)降低假陽(yáng)性率[11]。采用校正后P<0.05,差異倍數(shù)(fold change,F(xiàn)C)>1.5 作為截?cái)嘀档臉?biāo)準(zhǔn),篩選CRPC 和原發(fā)性PCa 樣本之間的DEGs。
1.4 PPI 網(wǎng)絡(luò)和模塊分析 為預(yù)測(cè)蛋白質(zhì)之間物理和功能的相互作用,本研究使用STRING(https://string-db.org/)構(gòu)建DEGs 的PPI 網(wǎng)絡(luò)(互作評(píng)分>0.4)[16]。采用Cytoscape 3.7.2 版(http://cytoscape.org/download_old_versions.html)軟件進(jìn)行可視化處理[17]。利用MCODE插件[18]對(duì)網(wǎng)絡(luò)進(jìn)行模塊分析,較高分?jǐn)?shù)的模塊在疾病的發(fā)展過(guò)程中具有重要意義。
1.5 鑒定關(guān)鍵基因 選擇滿足以下2 個(gè)約束條件的DEGs 作為關(guān)鍵基因:(1)該基因位于關(guān)鍵模塊中(模塊分?jǐn)?shù)>40);(2)使用Cytoscape 軟件計(jì)算,同時(shí)符合最大鄰域分量(maximum neighborhood component,MNC)、 最 大 鄰 域 分 量 密 度(density of maximum neighborhood component,DMNC)和最大集團(tuán)中心性(maximal clique centrality,MCC)前30 位的基因。
1.6 關(guān)鍵基因的生存分析和受試者工作特征(ROC)曲線分析 癌癥基因組圖譜(The Cancer Genome Atlas,TCGA)(http://gepia.cancer-pku.cn/index.html)數(shù)據(jù)庫(kù)擁有龐大的PCa 樣本量,能提供大量的臨床信息[19]。基于TCGA 并在基因表達(dá)和生存分析的交互式網(wǎng)絡(luò)應(yīng) 用(Gene Expression Profiling Interactive Analysis 2,GEPIA2)(http://gepia2.cancer-pku.cn/#index) 下, 對(duì)這些關(guān)鍵基因采用Mantel-Cox 檢驗(yàn)進(jìn)行生存分析[20],評(píng)價(jià)患者預(yù)后,其中總生存期是指從隨機(jī)化分組開(kāi)始至因任何原因引起死亡的時(shí)間;無(wú)病生存期是指從隨機(jī)化分組開(kāi)始至疾病復(fù)發(fā)或由于疾病進(jìn)展導(dǎo)致患者死亡的時(shí)間。然后繪制關(guān)鍵基因的ROC 曲線,用R 軟件pROC包[21]計(jì)算ROC 曲線下面積(AUC),可以直觀地分析關(guān)鍵基因?qū)RPC 的診斷價(jià)值,一般認(rèn)為AUC>0.50,越接近于1 則診斷價(jià)值越高[22]。以P<0.05 為差異有統(tǒng)計(jì)學(xué)意義。
2.1 CRPC 的DEGs 篩選 通過(guò)對(duì)微陣列數(shù)據(jù)集GSE32269 分析共篩選出279 個(gè)DEGs,其中上調(diào)基因175 個(gè),下調(diào)基因104 個(gè)(圖1,彩圖掃描文章首頁(yè)二維碼)。
圖1 CRPC 的DEGs 篩選Figure 1 Identification of differentially expressed genes in castration-resistant prostate cancer
2.2 CRPC 的DEGs GO 富集分析和KEGG 信號(hào)通路分析 GO 富集分析結(jié)果顯示,CRPC 的DEGs 主要參與細(xì)胞黏附、細(xì)胞分裂、有絲分裂姐妹染色單體分離、有絲分裂核分裂和有絲分裂胞質(zhì)分裂等BP(圖2A、表1),主要分布在細(xì)胞外外泌體、細(xì)胞外基質(zhì)等CC(圖2B、表2),主要有細(xì)胞外基質(zhì)結(jié)構(gòu)成分、蛋白質(zhì)結(jié)合等MF(圖2C、表3)。KEGG 結(jié)果顯示,CRPC 的DEGs 主要參與黏著斑、PI3K-Akt信號(hào)通路和細(xì)胞周期等途徑(圖3)。
圖2 CRPC 的DEGs GO 富集分析結(jié)果Figure 2 GO enrichment results of differentially expressed genes in castration-resistant prostate cancer
表1 CRPC 的DEGs 主要參與的生物過(guò)程Table 1 Major biological processes in which differentially expressed genes in castration-resistant prostate cancer being involved
表2 CRPC 的DEGs 主要參與的細(xì)胞成分Table 2 Major cellular components of differentially expressed genes involved in castration-resistant prostate cancer development
表3 CRPC 的DEGs 主要參與的分子功能Table 3 Major molecular functions of differentially expressed genes involved in castration-resistant prostate cancer development
圖3 CRPC 的DEGs KEGG 富集分析結(jié)果Figure 3 KEGG enrichment results of differentially expressed genes involved in castration-resistant prostate cancer development
2.3 CRPC 的DEGs PPI 分析及關(guān)鍵基因篩選 應(yīng)用STRING 數(shù)據(jù)庫(kù)對(duì)篩選出的279 個(gè)DEGs 進(jìn)行PPI 分析,通過(guò)移除分離和單獨(dú)連接的節(jié)點(diǎn),應(yīng)用Cytoscape 將蛋白網(wǎng)絡(luò)可視化,得到一個(gè)由224 個(gè)節(jié)點(diǎn)和1 665 條邊組成的PPI 網(wǎng)絡(luò)(圖4A)。使用MCODE 識(shí)別出了最重要的模塊(分?jǐn)?shù)=42.093),由43 個(gè)節(jié)點(diǎn)和863 條邊組成(圖4B)。根據(jù)篩選條件共鑒定出15 個(gè)關(guān)鍵基因(圖4C), 分 別 是CDC20、CCNB2、PRC1、MAD2L1、PBK、NUSAP1、RRM2、SMC2、MELK、KIF4A、DTL、ZWINT、CEP55、RACGAP1 和CDKN3(表4)。
圖4 CRPC 的DEGs PPI 網(wǎng)絡(luò)和關(guān)鍵基因Figure 4 PPI network and key genes involved in castration-resistant prostate cancer development
表4 CRPC 的DEGs 關(guān)鍵基因詳細(xì)情況Table 4 Details of key genes of differentially expressed genes involved in castration-resistant prostate cancer development
2.4 關(guān)鍵基因與CRPC 患者預(yù)后的關(guān)系 對(duì)15 個(gè)關(guān)鍵基因進(jìn)行生存分析,結(jié)果顯示,CDC20(n=245)、MAD2L1(n=246)和NUSAP1(n=246)高表達(dá)組CRPC總生存期分別短于CDC20(n=245)、MAD2L1(n=246)和NUSAP1(n=246)低表達(dá)組,差異均有統(tǒng)計(jì)學(xué)意義(P=0.049,P=0.035,P=0.020), 見(jiàn) 圖5。CDC20、MAD2L1 和NUSAP1 高表達(dá)組CRPC 無(wú)病生存期分別短于CDC20、MAD2L1 和NUSAP1 低表達(dá)組,差異均有統(tǒng)計(jì)學(xué)意義(P=7.5E-05,P=0.043,P=0.002),見(jiàn)圖6。繪 制CDC20、MAD2L1 和NUSAP1 預(yù) 測(cè)CRPC 發(fā) 生 的ROC 曲線,結(jié)果顯示,AUC 分別為0.933、0.762、0.950(圖7)。
圖5 CDC20、MAD2L1 和NUSAP1 高表達(dá)組與低表達(dá)組總生存期比較的生存曲線Figure 5 Overall survival curves between castration-resistant prostate cancer patients with highly and low expressed CDC20,MAD2L1 and NUSAP1
圖6 CDC20、MAD2L1 和NUSAP1 高表達(dá)組與低表達(dá)組無(wú)病生存期比較的生存曲線Figure 6 Disease-free survival curves between castration-resistant prostate cancer patients with highly and low expressed CDC20,MAD2L1 and NUSAP1
圖7 CDC20、MAD2L1 和NUSAP1 預(yù)測(cè)CRPC 發(fā)生的ROC 曲線Figure 7 ROC curves of CDC20,MAD2L1 and NUSAP1 predicting castration-resistant prostate cancer
CRPC 發(fā)病機(jī)制復(fù)雜,AR 擴(kuò)增、AR 突變及AR 變異等多種機(jī)制均參與CRPC 的發(fā)生、發(fā)展[23],但具體機(jī)制仍難以明確。本研究采用生物信息學(xué)方法分析芯片數(shù)據(jù)集共篩選出279 個(gè)DEGs,通過(guò)GO 和KEGG 富集分析發(fā)現(xiàn)DEGs 主要富集于細(xì)胞分裂、有絲分裂和細(xì)胞周期。已有研究表明,有絲分裂停滯可抑制CRPC 的進(jìn)展[24]。CRPC 的發(fā)生、發(fā)展和調(diào)節(jié)細(xì)胞分裂、細(xì)胞周期的基因密切相關(guān)[25-27],提示細(xì)胞分裂、有絲分裂和細(xì)胞周期是影響CRPC 發(fā)生、發(fā)展的重要因素。
本研究在這些DEGs 中鑒定出可能參與CRPC 發(fā)生和進(jìn)展的15 個(gè)關(guān)鍵基因,對(duì)其進(jìn)一步驗(yàn)證時(shí)發(fā)現(xiàn),CDC20、MAD2L1 和NUSAP1 的高表達(dá)均與CRPC 總生存期及無(wú)病生存期呈負(fù)相關(guān),且AUC 均>0.50,表明CDC20、MAD2L1 和NUSAP1 的表達(dá)能影響CRPC 的預(yù)后,且對(duì)CRPC 有較高的診斷價(jià)值。
CDC20 不僅是一種關(guān)鍵的E3 連接酶,還是一種細(xì)胞周期檢查點(diǎn)調(diào)節(jié)劑,可與腺瘤性息肉病大腸埃希菌(APC)結(jié)合,識(shí)別D-box 或KEN 盒底物以促進(jìn)蛋白酶體的降解。CDC20 與APC 結(jié)合后,可通過(guò)破壞關(guān)鍵的細(xì)胞周期調(diào)節(jié)因子,在有絲分裂的中期到后期發(fā)揮致癌功能[28]。已有研究報(bào)道,上調(diào)的CDC20 在包括胰腺導(dǎo)管腺癌、乳腺癌、白血病、膀胱癌、膠質(zhì)母細(xì)胞瘤和胃癌[29-31]等多種惡性腫瘤發(fā)生和進(jìn)展中起著至關(guān)重要的作用,并與這些癌癥的不良預(yù)后相關(guān)。DAI 等[32]通過(guò)遷移實(shí)驗(yàn)結(jié)果表明,CDC20 可增強(qiáng)PCa 細(xì)胞的遷移能力。ZHANG 等[33]證明CDC20 可通過(guò)腫瘤干細(xì)胞樣細(xì)胞中的β-連環(huán)蛋白來(lái)驅(qū)動(dòng)PCa 發(fā)生,其表達(dá)下降可抑制CD44+PCa 干細(xì)胞的表達(dá),且與PCa 患者的不良預(yù)后相關(guān)。有研究證明,敲低CDC20 可抑制轉(zhuǎn)移性CRPC的發(fā)生并增強(qiáng)CRPC 對(duì)多西他賽的敏感性,而CDC20的過(guò)表達(dá)則可通過(guò)依賴Bim 的方式促進(jìn)CRPC 細(xì)胞系對(duì)多西紫杉醇耐藥[34]。
MAD2L1 是有絲分裂紡錘體組裝檢查點(diǎn)的一個(gè)組成部分,阻止有絲分裂后期發(fā)生,直到所有染色體在中期排列正確。已有研究表明,MAD2L1 可促進(jìn)人前列腺上皮細(xì)胞的生長(zhǎng)[35],其過(guò)表達(dá)與小細(xì)胞肺癌侵襲性和轉(zhuǎn)移有關(guān),并可通過(guò)被MiR-200c-5p 抑制而降低人肝細(xì)胞癌的增殖和轉(zhuǎn)移[36-37]。MAD2L1 和CDC20 之間可以相互作用,在調(diào)節(jié)有絲分裂中共同發(fā)揮重要功能[35]。CHOI 等[38]發(fā)現(xiàn)CDC20 和MAD2L1 共同高表達(dá)能促進(jìn)尿路上皮膀胱癌的不良預(yù)后,表明CDC20 和MAD2L1在癌癥相關(guān)疾病中可以相互影響,共同發(fā)揮作用。本研究結(jié)果顯示,CDC20 和MAD2L1 的高表達(dá)均與CRPC的不良預(yù)后相關(guān),提示CDC20 和MAD2L1 可能是影響CRPC 發(fā)生和預(yù)后的潛在基因。
NUSAP1 在紡錘體微管組織中起作用,是一種核仁-紡錘體相關(guān)蛋白。NUSAP1 在細(xì)胞增殖中特異性表達(dá),并在細(xì)胞周期和細(xì)胞質(zhì)分裂中起至關(guān)重要的作用[39]。已有研究證實(shí)NUSAP1 是PCa 進(jìn)展的生物標(biāo)志物之一,可通過(guò)調(diào)節(jié)基因表達(dá)水平來(lái)促進(jìn)PCa 的侵襲、遷移和轉(zhuǎn)移,從而推動(dòng)PCa 的進(jìn)展[40-41]。GORDON 等[42]發(fā)現(xiàn),使用慢病毒敲低NUSAP1 減少了DU145 或PC-3-RB1 細(xì)胞的增殖和侵襲,表明NUSAP1 可影響PCa 細(xì)胞增殖和侵襲。據(jù)報(bào)道,NUSAP1 在多種癌癥中過(guò)度表達(dá)且NUSAP1 的表達(dá)升高與這些癌癥的進(jìn)展密切相關(guān),包括乳腺癌、非小細(xì)胞肺癌、胃癌、卵巢癌、膀胱癌、宮頸癌、結(jié)腸癌、腎細(xì)胞癌等[43-49]。本研究結(jié)果提示,NUSAP1 的高表達(dá)與CRPC 的總生存期及無(wú)病生存期呈負(fù)相關(guān),對(duì)CRPC 有較好的診斷價(jià)值。以上研究結(jié)果表明,NUSAP1 可能是影響CRPC 早期診斷和預(yù)后的潛在因子。
綜上所述,本研究通過(guò)對(duì)CRPC 及原發(fā)性PCa 組織樣本的DEGs 分析,鑒定出3 個(gè)關(guān)鍵基因:CDC20、MAD2L1 和NUSAP1,這3 個(gè)關(guān)鍵基因與CRPC 疾病的診斷和預(yù)后密切相關(guān),為CRPC 疾病進(jìn)展的分子機(jī)制研究及預(yù)后判斷提供了新靶點(diǎn)。但由于缺乏實(shí)驗(yàn)分析,其具體機(jī)制目前尚不十分明確,需要進(jìn)一步實(shí)驗(yàn)驗(yàn)證。
作者貢獻(xiàn):董婧婷、沈宏、曹鳳宏進(jìn)行文章的構(gòu)思與設(shè)計(jì),研究的實(shí)施;董婧婷、康紹叁進(jìn)行數(shù)據(jù)收集;董婧婷、劉健、田志崇進(jìn)行數(shù)據(jù)整理;康紹叁、劉健、李治國(guó)進(jìn)行統(tǒng)計(jì)學(xué)處理;董婧婷、衡立、張金存進(jìn)行結(jié)果的分析與解釋;董婧婷撰寫(xiě)論文;衡立、張立國(guó)進(jìn)行論文的修訂;沈宏、曹鳳宏負(fù)責(zé)文章的質(zhì)量控制及審校,對(duì)文章整體負(fù)責(zé),監(jiān)督管理。
本文無(wú)利益沖突。