宋詠剛,余鵬 ,胡文慧,石玉玲,趙雪,胡祖權(quán),王赟,曾柱,3**
(1.貴州醫(yī)科大學(xué) 基礎(chǔ)醫(yī)學(xué)院,貴州 貴陽 550025;2.貴州醫(yī)科大學(xué) 貴州省免疫細(xì)胞與抗體工程研究中心 生物與醫(yī)學(xué)工程重點(diǎn)實(shí)驗(yàn)室,貴州 貴陽 550025;3.貴州醫(yī)科大學(xué) 生物與工程學(xué)院,貴州 貴陽 550025)
前列腺癌是全球第二大男性癌癥,同時(shí)也是全球第四大癌癥,有著極高的發(fā)病率和死亡率[1]。前列腺癌是一種無癥狀的腫瘤,在整個癌癥發(fā)生過程中沒有任何癥狀,通過臨床手段很難檢測。前列腺癌不斷增長時(shí),會伴隨膀胱頸梗阻、癌細(xì)胞轉(zhuǎn)移等癥狀,這時(shí)通常不可能進(jìn)行治愈性治療[2]。因此,關(guān)于前列腺癌的腫瘤標(biāo)志物的研究至關(guān)重要要。miRNA和lncRNA是基因表達(dá)調(diào)控的重要組成成分,特別是在癌細(xì)胞中表達(dá)顯著,它能幫助理解疾病發(fā)生的分子機(jī)制[3]。前列腺癌作為一種遺傳性疾病,國內(nèi)外對其基因水平的調(diào)控機(jī)制和新分子靶點(diǎn)的研究日益增加[4],例如基于自身免疫療法的Sipuleucel-T前列腺癌疫苗,通過將VISTA或PARP等分子體外激活樹突狀細(xì)胞(dendritic cells,DCs)、將激活的細(xì)胞回輸?shù)襟w內(nèi)產(chǎn)生免疫應(yīng)答而治療癌癥[5]。本研究從生物信息學(xué)角度出發(fā),通過將基因表達(dá)數(shù)據(jù)庫(gene expreesion omnibus,GEO)與癌癥和腫瘤圖譜中心(the cancer genome atlas,TCGA)數(shù)據(jù)庫關(guān)于前列腺癌的樣本數(shù)據(jù)相結(jié)合,篩選前列腺癌發(fā)生過程中的關(guān)鍵基因及其上下游的調(diào)控分子,為臨床診斷和臨床靶向藥物的研發(fā)提供理論基礎(chǔ)。
登錄美國國家生物技術(shù)信息中心(national centerfor for biotechnology information,NCBI)的GEO數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/,GEO database),檢索Affymetrix芯片數(shù)據(jù)GSE55945數(shù)據(jù)包含13例前列腺癌組織和8例正常組織的樣本數(shù)據(jù);登錄TCGA數(shù)據(jù)庫檢索前列腺癌的轉(zhuǎn)錄組數(shù)據(jù)并下載,包含504例前列腺癌組織和55例癌旁組織的樣本數(shù)據(jù)。
1.2.1差異基因的分析 使用RStudio軟件‘a(chǎn)ffy’包對GEO原始數(shù)據(jù)文件進(jìn)行標(biāo)準(zhǔn)化處理,并檢驗(yàn)歸一化處理的結(jié)果。使用‘limma’包[6]篩選表達(dá)有顯著差異的基因(differentially expressed genes,DEGenes),以|logFC|≥2(fold change,F(xiàn)C)并且P<0.05 作為標(biāo)準(zhǔn)進(jìn)行篩選[7]。通過RStudio軟件‘edgR’包對TCGA的前列腺癌數(shù)據(jù)進(jìn)行分析[8],同樣以|logFC|≥2并且P<0.05作為標(biāo)準(zhǔn)進(jìn)行篩選。
1.2.2DEGenes的GO和KEGG富集分析和蛋白質(zhì)相互作用網(wǎng)絡(luò)的構(gòu)建 登錄KOBAS(http://kobas.cbi.pku.edu.cn/):對篩選出的DEGenes的進(jìn)行GO分析和京都基因和基因組百科全書(kyoto encyclopedia of genes and genomes ,KEGG)途徑分析[9];登錄STRING在線工具(https://string-db.org/)[10]:對篩選出的DEGenes構(gòu)建蛋白質(zhì)相互作用網(wǎng)絡(luò)(protein-protein interaction network,PPI)[11]。將結(jié)果導(dǎo)入CYTOSCAP軟件,使用‘MCODE’插件[12]對該相互作用網(wǎng)絡(luò)進(jìn)行K 核解析(k-core decomposition),篩選出DEGenes的核心模塊。篩選條件為P<0.05并且基因數(shù)目>5[13]。
1.2.3核心基因相應(yīng)miRNA的預(yù)測 將篩選出的核心DEGenes導(dǎo)入mirDIP數(shù)據(jù)庫,對核心DEGenes的miRNA進(jìn)行預(yù)測[14]。
1.2.4miRNA的生存分析及l(fā)ncRNA的預(yù)測 登錄STARBASE(http://starbase.sysu.edu.cn/),使用Pan-Cancer工具對預(yù)測出的miRNA進(jìn)行生存分析,選擇與前列腺癌患者生存率相關(guān)(P<0.05)的miRNA作為核心miRNA。對符合條件的miRNA進(jìn)行下游lncRNA的預(yù)測,為提高預(yù)測結(jié)果的準(zhǔn)確性,選擇至少在一種以上的腫瘤中被證實(shí)(P<0.05)的lncRNA作為結(jié)果。
1.2.5基因mRNA-pathwang網(wǎng)絡(luò)的構(gòu)建 將符合標(biāo)準(zhǔn)的mRNA、miRNA、lncRNA以及重要的信號通路及之間的關(guān)系導(dǎo)入CYTOSCAPE軟件中進(jìn)行可視化,建立mRNA-pathwang網(wǎng)絡(luò)圖。
芯片數(shù)據(jù)(GSE55945)經(jīng)分析獲得正常組織相對于前列腺癌組織的差異表達(dá)基因共431個(|logFC|≥2,P<0.05)。TCGA數(shù)據(jù)庫關(guān)于前列腺癌的樣本經(jīng)分析,獲得癌旁組織相對于前列腺癌組織的差異表達(dá)基因共2 472個(|logFC|≥2,P<0.05),部分差異表達(dá)基因及其對應(yīng)信息見表1與表2。利用RStudio軟件‘venn’包對兩個數(shù)據(jù)庫中篩選出的差異基因使用Merge函數(shù),得到兩個數(shù)據(jù)庫共同的137個DEGenes,并構(gòu)建維恩圖(圖1)。
表1 GEO數(shù)據(jù)庫正常組織與前列腺癌組織的部分差異表達(dá)基因Tab.1 The partial DEGenes of prostate cancer tissue to normal tissue in GEO database
表2 TCGA數(shù)據(jù)庫中正常組織與前列腺癌組織的部分差異表達(dá)基因Tab.2 The partial DEGenes of prostate cancer tissue to normal tissue in TCGA database
圖1 共同差異表達(dá)基因的維恩圖Fig.1 Venn diagram of common DEGenes
使用KOBAS網(wǎng)站對篩選出的137個DEGenes進(jìn)行GO分析和KEGG分析,GO分析結(jié)果顯示有23個GO富集(表3),KEGG富集分析有20個通路被富集(表4)。
通過STRING在線分析工具繪制DEGenes的PPI(圖 2),結(jié)果用CYTOSCAPE軟件的“MCODE”工具對該P(yáng)PI進(jìn)行K 核解析,以節(jié)點(diǎn)數(shù)>5、所得分?jǐn)?shù)>0.4篩選出子網(wǎng)絡(luò),對其中最穩(wěn)定的子網(wǎng)絡(luò)作為核心模塊進(jìn)行分析,核心模塊包含7個節(jié)點(diǎn)基因和 21條相互作用關(guān)系對(圖 3)。使用mirDIO數(shù)據(jù)庫對7個核心基因預(yù)測得到12個對應(yīng)的miRNA,通過CYTOSCAPE軟件對結(jié)果進(jìn)行可視化(圖3)。
登錄STARBASE 網(wǎng)站對預(yù)測出的12個miRNA進(jìn)行生存分析,其中has-let-7a-5p和has-miR-98-5是與前列腺癌患者總體存活率相關(guān)的miRNA(P<0.05,圖4、表5);通過Pan-Cancer工具驗(yàn)證其對應(yīng)的基因在前列腺癌患者的表達(dá)量,AURKB、BUB1B和EZH2在前列腺癌患者體內(nèi)高表達(dá)(圖5)。
綜合以上結(jié)果,使用CYTOSCAPE軟件對預(yù)測出的lncRNA、與前列腺癌患者生存率有關(guān)的miRNA、核心DEGene以及相關(guān)通路構(gòu)建網(wǎng)絡(luò)圖(圖6),該網(wǎng)絡(luò)涉及3個重要的信號通路、3個核心基因、2個miRNA和4個lncRNA。見圖6。
近年來隨著分子生物學(xué)、測序和數(shù)據(jù)分析技術(shù)的發(fā)展,生物信息學(xué)被廣泛地應(yīng)用在各種腫瘤標(biāo)志物或治療靶點(diǎn)的挖掘中,它可以幫助克服癌癥的傳統(tǒng)療法中診斷延遲和主觀不可靠評估等缺點(diǎn)[15],特別在前列腺癌的診斷中,其黃金標(biāo)準(zhǔn)仍會有20%以上的假陰性率[16]。本研究通過將TCGA數(shù)據(jù)庫和GEO數(shù)據(jù)庫中前列腺癌的樣本數(shù)據(jù)相結(jié)合,挖掘出前列腺癌高度相關(guān)的差異表達(dá)基因137個。對這些基因進(jìn)行K-核解析后得到7個核心(KIF4A、AURKB、BUB1B、TPX2、NCAPG、HJURP和EZH2)基因,其中BUB1B與前列腺癌的潛在致病風(fēng)險(xiǎn)有關(guān),BUB1B主要參與細(xì)胞周期的生物過程,通過與CCNB1、CDK1等基因協(xié)同作用,影響前列腺癌患者的疾病進(jìn)展[17]。SHA等[18]發(fā)現(xiàn)PRKAR2B主要加速細(xì)胞周期生物學(xué)過程并調(diào)節(jié)多個細(xì)胞周期基因,通過過度表達(dá)促進(jìn)趨勢抵抗性前列腺癌(castration-resistant prostate cancer,CRPC)增殖和侵襲,并抑制CRPC細(xì)胞的凋亡。組蛋白甲基轉(zhuǎn)移酶EZH2d的失調(diào),會導(dǎo)致腫瘤抑制性miRNA的表觀遺傳學(xué)沉默而增強(qiáng)前列腺癌細(xì)胞增殖和轉(zhuǎn)移過程中的致癌作用[19]。
表3 差異表達(dá)基因的GO分析Tab.3 GO analysis of DEGenes
注:A為核心模塊,B為核心模塊相互作用網(wǎng)絡(luò)圖。圖2 差異表達(dá)蛋白的核心模塊與核心模塊相互作用網(wǎng)絡(luò)Fig.2 The central modules of PPI network of DEGenes constoucted by using CYTOSCAPE and core module
圖3 DEGenes 及其對應(yīng)的miRNAFig.3 DEGenes and corresponding miRNA
注:A為has-miR-21-5p,B為has-miR-98-5p。圖4 miRNA的生存分析Fig.4 Survial analysis of miRNA
miRNAlncRNA癌癥類型Phsa-let-7a-5pXISTUrothelialbladdercancer(BLCA)0.034798hsa-let-7a-5pKCNQ1OT1Headandnecksquamouscellcarcinoma(HNSC)0.0002hsa-let-7a-5pNEAT1Clearcellkidneycarcinoma(KIRC)1.21E-04hsa-miR-98-5pTTTY15Breastcancer(BRCA)0.046063hsa-miR-98-5pKCNQ1OT1Headandnecksquamouscellcarcinoma(HNSC)0.0002hsa-miR-98-5pXISTLungadenocarcinoma(LUAD)0.019418hsa-miR-98-5pNEAT1Cutaneousmelanoma(SKCM)3.06E-02
注:A為BUB1B,B為EZH2,C為MYC。圖5 差異基因在前列腺癌中的表達(dá)Fig.5 DIfferential expression of DEGenes in prostatic cancer
圖6 lncRNA-mRNA pathway 網(wǎng)絡(luò)Fig.6 Network of lncRNA-mRNA pathway
通過對篩選137個DEGenes的GO功能分析和KEGG富集分析發(fā)現(xiàn),這些DEGenes主要涉及細(xì)胞粘附,細(xì)胞周期和機(jī)體炎癥反應(yīng)。CAV1是Src激酶的重要底物,能通過與CSD之間的相互作用抑制粘著斑的形成,引起癌細(xì)胞的運(yùn)動[20]。CD40/CD40L主要參與血管生成,在前列腺腫瘤腺體組織中,CD40在激素難治性期分泌較高,能引起慢性炎癥并導(dǎo)致浸潤區(qū)組織損傷,對前列腺癌進(jìn)展至關(guān)重要[21]。TPM1是一種具有促凋亡功能的肌動蛋白結(jié)合腫瘤抑制因子,但在前列腺癌組織中,TPM1發(fā)生特異性的可變剪接,通過改變TPM1的結(jié)構(gòu)引起肌動蛋白的失調(diào),導(dǎo)致腫瘤的侵襲和轉(zhuǎn)移,這種作用在腫瘤晚期尤其明顯[22]。
非編碼RNA在體內(nèi)不能被翻譯為蛋白質(zhì),卻參與多種細(xì)胞過程,主要包括miRNA和lncRNA,由于具有時(shí)空或組織特異性,被廣泛應(yīng)用于分子靶點(diǎn)或腫瘤標(biāo)準(zhǔn)物的研究中[23]。本研究通過mirDIP數(shù)據(jù)庫預(yù)測核心DEGenes的上游miRNA,并將篩選出的miRNA通過STARBASE數(shù)據(jù)庫中結(jié)合臨床樣本進(jìn)行生存分析,結(jié)果發(fā)現(xiàn)hsa-let-7a-5p和hsa-miR-98-5p與前列腺癌患者的總體生存率相關(guān),并且它所對應(yīng)的3個下游基因AURKB、BUB1B和EZH2在前列腺癌患者體內(nèi)高表達(dá)。其中,hsa-let-7a-5p已被作為I期肺癌的潛在生物標(biāo)準(zhǔn)物之一[24]。hsa-miR-98-5p主要通過下調(diào)NEAT1的水平引起非小細(xì)胞肺癌的發(fā)生發(fā)展[25]。對以上2種miRNA進(jìn)行l(wèi)ncRNA預(yù)測,共發(fā)現(xiàn)4種lncRNA(XIST、KCNQ1OT1、NEAT1、TTTY15),其中,XIST和KCNQ1OT1能通過促進(jìn)細(xì)胞遷移和上皮-間質(zhì)細(xì)胞轉(zhuǎn)化引起腫瘤的發(fā)展[26-27]。TTTY15來定位于Y染色體上,在前列腺癌細(xì)胞中高表達(dá),臨床研究證實(shí),對TTTY15和USP9Y的測定能預(yù)測前列腺癌活檢的結(jié)果[28]。
本研究從生物信息學(xué)角度出發(fā),對前列腺癌的差異基因進(jìn)行篩選和分析,篩選出前列腺癌發(fā)生過程中的關(guān)鍵基因及其上下游的調(diào)控分子,構(gòu)建了一條包含lncRNA、miRNA以及mRNA的分子作用網(wǎng)絡(luò),為臨床診斷和臨床靶向藥物的研發(fā)提供理論基礎(chǔ)。