齊魯,丁彥青,
1. 南方醫(yī)科大學(xué)基礎(chǔ)醫(yī)學(xué)院病理學(xué)系,廣州 510515;
2. 南方醫(yī)科大學(xué)南方醫(yī)院病理科,廣州 510515
大腸癌早期癥狀不明顯,發(fā)現(xiàn)時(shí)通常已發(fā)生轉(zhuǎn)移,且轉(zhuǎn)移是影響大腸癌患者預(yù)后的重要因素,是否發(fā)生轉(zhuǎn)移與患者的生存時(shí)間密切相關(guān)。因此轉(zhuǎn)移是大腸癌主要危害之一,篩選大腸癌轉(zhuǎn)移相關(guān)信號(hào)調(diào)控網(wǎng)絡(luò)中的關(guān)鍵調(diào)控點(diǎn),對(duì)闡明大腸癌轉(zhuǎn)移分子機(jī)制、尋找有效的藥物治療靶點(diǎn)有著重要意義。
在本課題組前期研究工作中,利用 GSEA[1](Gene set enrichment analysis)工具對(duì)具有 TNM(Tumor node metastasis)分期信息的大腸癌表達(dá)譜數(shù)據(jù)進(jìn)行了功能富集分析,比較分析了早期T1、T2期和晚期M1期的大腸癌表達(dá)譜數(shù)據(jù),GSEA富集類別選擇 miRNA作用位點(diǎn)基因集以及轉(zhuǎn)錄因子結(jié)合位點(diǎn)基因集,最終篩選出了與大腸癌轉(zhuǎn)移密切相關(guān)的miRNA及轉(zhuǎn)錄因子結(jié)合位點(diǎn),對(duì)相關(guān)富集類中表達(dá)上調(diào)的基因取交集,獲得在大腸癌晚期 M1期表達(dá)上調(diào)、且上游調(diào)控區(qū)域具有較多轉(zhuǎn)移相關(guān)miRNA作用位點(diǎn)和轉(zhuǎn)錄因子結(jié)合位點(diǎn)的關(guān)鍵基因 CREB5(cAMP responsive element binding protein 5)[2]。
本課題組利用SAM3.01[3](Significance Analysis of Microarrays)對(duì)具有生存時(shí)間信息的大腸癌表達(dá)譜數(shù)據(jù)進(jìn)行分析,篩選出與大腸癌患者生存時(shí)間相關(guān)的基因共235個(gè),利用TFM-Explorer[4](The transcription factor matrix explorer)工具對(duì)235個(gè)基因進(jìn)行轉(zhuǎn)錄因子結(jié)合位點(diǎn)富集分析,獲得與大腸癌生存時(shí)間密切相關(guān)的轉(zhuǎn)錄因子結(jié)合位點(diǎn),對(duì)轉(zhuǎn)錄因子結(jié)合位點(diǎn)所對(duì)應(yīng)的基因取交集,獲得含有生存相關(guān)轉(zhuǎn)錄因子結(jié)合位點(diǎn)較多的基因,將這些基因與早期轉(zhuǎn)移大腸癌中表達(dá)上調(diào)的基因集取交集,得到與患者生存時(shí)間相關(guān)、受轉(zhuǎn)錄因子調(diào)控較多、且在大腸癌組織中表達(dá)上調(diào)的關(guān)鍵基因同樣為CREB5[5,6]。
CREB5基因受到很多轉(zhuǎn)移相關(guān)轉(zhuǎn)錄因子和miRNA以及生存相關(guān)轉(zhuǎn)錄因子的調(diào)控,且與大腸癌患者生存時(shí)間密切相關(guān),因此CREB5基因可能為大腸癌轉(zhuǎn)移相關(guān)信號(hào)調(diào)控網(wǎng)絡(luò)中的關(guān)鍵調(diào)控點(diǎn)。
CREB5又稱為CRE-BPA,屬于環(huán)磷酸腺苷反應(yīng)元件結(jié)合蛋白家族,定位于 7號(hào)染色體短臂,具有鋅指結(jié)構(gòu)和亮氨酸拉鏈結(jié)構(gòu)域,是一種轉(zhuǎn)錄激活因子。CREB5 主要包含 4 種可變剪切體: α,β,γ,δ[7],并且其在黑猩猩(Pan troglodytes)、狗(Canis lupus familiaris)、牛(Bos taurus)、鼠(Rattus norvegicus)、雞(Gallus gallus)、斑馬魚(yú)(Danio rerio)等物種中高度保守。CREB5能夠與c-Jun和 ATF2組合成為異二聚體并與基因轉(zhuǎn)錄調(diào)控區(qū)域的環(huán)磷酸腺苷反應(yīng)元件相結(jié)合,調(diào)控基因的表達(dá)[8]。CREB5基因的表達(dá)受很多因子的調(diào)控,此基因表達(dá)水平的變化對(duì)細(xì)胞信號(hào)調(diào)控網(wǎng)絡(luò)有著重要影響,其在不同物種中高度保守以及具有較多的可變剪切體進(jìn)一步說(shuō)明了其功能的重要性。因此,本研究通過(guò)生物信息學(xué)方法分析CREB5在大腸癌轉(zhuǎn)移作用中可能的調(diào)控機(jī)制,明確其可能調(diào)控的相關(guān)基因,進(jìn)一步闡明大腸癌轉(zhuǎn)移過(guò)程中細(xì)胞信號(hào)網(wǎng)絡(luò)的變化機(jī)制。
CREB5基因表達(dá)受到很多轉(zhuǎn)錄因子及 miRNA的精密調(diào)控,為了分析CREB5基因的表達(dá)對(duì)大腸癌細(xì)胞信號(hào)調(diào)控網(wǎng)絡(luò)的影響,本文對(duì) NCBI[9]網(wǎng)站中GEO(Gene expression omnibus)數(shù)據(jù)庫(kù)[10]的表達(dá)譜數(shù)據(jù)GSE2109進(jìn)行GSEA分析。由于GSE2109數(shù)據(jù)包含2158個(gè)各類腫瘤組織數(shù)據(jù),提取其中屬于大腸癌的表達(dá)譜數(shù)據(jù)共 343例,這些表達(dá)譜數(shù)據(jù)均具有TNM等分期信息且此數(shù)據(jù)樣本量較大。由于CREB5基因的表達(dá)值在不同狀態(tài)的大腸癌患者中表達(dá)情況不同,為了闡明CREB5基因表達(dá)的高低對(duì)大腸癌表達(dá)譜的影響情況,將343例表達(dá)譜數(shù)據(jù)依據(jù)CREB5基因表達(dá)情況分為高低兩組。對(duì)數(shù)據(jù)進(jìn)行以下處理:首先將表達(dá)譜數(shù)據(jù)依據(jù)CREB5基因的表達(dá)值從高到低進(jìn)行排序,然后將數(shù)據(jù)分成 3段,頭尾兩段分別包含114例大腸癌數(shù)據(jù),中間段包含115例大腸癌數(shù)據(jù),最后刪除中間段數(shù)據(jù)。因此頭段為CREB5基因高表達(dá)組,尾段為CREB5基因低表達(dá)組。使用GSEA分析工具對(duì)兩組數(shù)據(jù)依據(jù) KEGG[11](Kyoto encyclopedia of genes and genomes)通路、生物進(jìn)程、分子功能及轉(zhuǎn)錄因子結(jié)合位點(diǎn)基因集進(jìn)行富集分析,基因集版本為V4.0。
由于 CREB5能夠與 c-Jun結(jié)合成為異二聚體共同調(diào)控基因的表達(dá),而c-Jun蛋白又是AP-1的重要組成部分[12],因此CREB5的調(diào)控作用與AP-1密切相關(guān)。通過(guò)GSEA工具基于轉(zhuǎn)錄因子結(jié)合位點(diǎn)基因集進(jìn)行富集分析,將富集結(jié)果中屬于AP-1富集類的上調(diào)基因進(jìn)行提取,然后與 KEGG通路富集結(jié)果中屬于癌癥通路(Pathways in cancer)富集類的上調(diào)基因取交集,得到既在CREB5基因高表達(dá)組中表達(dá)上調(diào),又具有AP-1轉(zhuǎn)錄因子結(jié)合位點(diǎn),且屬于癌癥通路的關(guān)鍵基因,對(duì)這些關(guān)鍵基因通過(guò) GeneMANIA工具[13]進(jìn)行共表達(dá)分析,驗(yàn)證這些基因的表達(dá)情況是否與CREB5基因表達(dá)相關(guān)聯(lián),并且分析這些基因所參與的分子功能,明確CREB5基因在大腸癌轉(zhuǎn)移過(guò)程中可能的調(diào)控機(jī)制。
對(duì)343例大腸癌表達(dá)譜數(shù)據(jù)基于CREB5基因表達(dá)值而分成的高、低兩組各114例數(shù)據(jù)進(jìn)行GSEA富集分析,在生物進(jìn)程基因集中,總共有 562個(gè)基因集,而CREB5基因高表達(dá)組有385個(gè)基因集表達(dá)上調(diào),且 FDR小于 25%的基因集有 145個(gè),而CREB5基因低表達(dá)組只有 177個(gè)基因集表達(dá)上調(diào),且只有3個(gè)基因集的FDR小于25%。因此,CREB5基因高表達(dá)對(duì)大腸癌生物進(jìn)程影響較大,且高表達(dá)組所參與的生物進(jìn)程主要包括細(xì)胞遷移、血管生成、細(xì)胞增殖等與腫瘤發(fā)生和轉(zhuǎn)移密切相關(guān)的分子事件(圖1)。通過(guò)對(duì)分子功能富集分析,發(fā)現(xiàn)CREB5基因高表達(dá)組基因主要參與RHO、RAS、GTP酶、蛋白酪氨酸激酶等與腫瘤發(fā)生發(fā)展密切相關(guān)的分子功能(表 1),且 P值及錯(cuò)誤發(fā)現(xiàn)率(FDR)均很低,說(shuō)明結(jié)果可靠。而通過(guò)對(duì)兩組數(shù)據(jù)進(jìn)行轉(zhuǎn)錄因子結(jié)合位點(diǎn)基因集的富集分析可以發(fā)現(xiàn),總共 572個(gè)基因集中,CREB5基因高表達(dá)組有479個(gè)基因集表達(dá)上調(diào),且有422個(gè)基因集的FDR小于25%,而低表達(dá)組中只有93個(gè)基因集表達(dá)上調(diào),且沒(méi)有基因集的FDR小于25%,說(shuō)明CREB5基因的高表達(dá)對(duì)大腸癌細(xì)胞的轉(zhuǎn)錄調(diào)控作用影響較大。在高表達(dá)富集類中,依據(jù)標(biāo)準(zhǔn)化富集分?jǐn)?shù)排序,前20個(gè)轉(zhuǎn)錄因子結(jié)合位點(diǎn)中有7個(gè)為轉(zhuǎn)錄因子AP-1結(jié)合位點(diǎn),說(shuō)明由于CREB5基因的高表達(dá)而影響的許多基因均可能同時(shí)受到 AP-1的轉(zhuǎn)錄調(diào)控。由于c-Jun為轉(zhuǎn)錄因子AP-1的重要組成部分且能夠與 CREB5結(jié)合成為異二聚體調(diào)控基因的表達(dá),因此進(jìn)一步說(shuō)明了CREB5與AP-1在調(diào)控基因表達(dá)過(guò)程中有著密切的聯(lián)系。同樣,使用KEGG通路基因集進(jìn)行富集分析,發(fā)現(xiàn)CREB5基因高表達(dá)組所參與的信號(hào)通路主要為癌癥通路。為了驗(yàn)證上述結(jié)果的可靠性,使用另一表達(dá)譜數(shù)據(jù)GSE17536進(jìn)行同樣的分析,得出了相似的結(jié)論,因此進(jìn)一步證實(shí)了CREB5基因在大腸癌的發(fā)生發(fā)展轉(zhuǎn)移中起著重要作用。
圖1 CREB5基因高表達(dá)組主要參與的分子事件
為了驗(yàn)證7個(gè)AP-1結(jié)合位點(diǎn)富集類中上調(diào)基因的調(diào)控區(qū)域確實(shí)具有AP-1結(jié)合位點(diǎn),以及這些基因所關(guān)聯(lián)的相關(guān)疾病情況,提取7個(gè)AP-1富集類中表達(dá)上調(diào)且不重復(fù)的基因共 219個(gè),使用 WebGestalt工具[14]進(jìn)行轉(zhuǎn)錄因子結(jié)合位點(diǎn)富集以及相關(guān)疾病富集分析(表2)。結(jié)果發(fā)現(xiàn),轉(zhuǎn)錄因子結(jié)合位點(diǎn)富集結(jié)果主要為AP-1結(jié)合位點(diǎn),而相關(guān)疾病富集結(jié)果也發(fā)現(xiàn)這些基因主要參與了上皮性腫瘤的發(fā)展和侵襲,說(shuō)明這些基因與大腸癌的進(jìn)展關(guān)系密切。由于 219個(gè)基因轉(zhuǎn)錄調(diào)控區(qū)域具有 AP-1結(jié)合位點(diǎn),且在CREB5基因高表達(dá)組中表達(dá)上調(diào),因此這些基因可能為CREB5所調(diào)控的重要基因。
由于219個(gè)基因可能受CREB5調(diào)控,且這些基因參與的相關(guān)疾病主要為上皮性腫瘤的發(fā)展和侵襲。為了進(jìn)一步篩選這些基因中與大腸癌發(fā)生發(fā)展密切相關(guān)的基因,將 KEGG通路富集結(jié)果中屬于癌癥通路且起著富集作用的上調(diào)基因進(jìn)行提取,得到在CREB5基因的高表達(dá)組中表達(dá)上調(diào)且屬于癌癥通路的基因共104個(gè),然后將這些基因與具有AP-1結(jié)合位點(diǎn)的 219個(gè)基因取交集,獲得交集基因共 16個(gè),分別為 TGFBR2、TCF7、SUFU、STAT5B、PDGFRB、MMP9、MET、MAPK10、LAMC2、LAMC1、IL6、FIGF、FGF11、CSF1R、CDKN1A、AKT3。為了驗(yàn)證這些基因是否可能受 CREB5的調(diào)控,利用GeneMANIA工具將這16個(gè)基因連同CREB5基因進(jìn)行共表達(dá)分析。結(jié)果表明,網(wǎng)絡(luò)中 77.52%的基因均具有共表達(dá)關(guān)系,而 16個(gè)基因和 CREB5中,除了SUFU,其余基因均直接或者間接具有共表達(dá)關(guān)系(圖2A),進(jìn)一步驗(yàn)證了CREB5可能能夠調(diào)控16個(gè)
分子功能基因數(shù)NOM p-值FDR q-值基因的表達(dá)。通過(guò)對(duì)網(wǎng)絡(luò)中基因參與的分子功能分析可以發(fā)現(xiàn),網(wǎng)絡(luò)中得分最高的前幾個(gè)分子功能均為調(diào)控細(xì)胞的運(yùn)動(dòng)和遷移,主要涉及 CSF1R、MMP9、PDGFRB、FIGF和IL6所構(gòu)成的子網(wǎng)絡(luò)(圖2B),說(shuō)明 CREB5可能是通過(guò)調(diào)控這些基因進(jìn)而影響大腸癌細(xì)胞的遷移。
表1 CREB5基因高表達(dá)組參與的分子功能
表2 7個(gè)AP-1富集類中上調(diào)基因的轉(zhuǎn)錄因子及相關(guān)疾病富集分析
圖2 CREB5及其可能調(diào)控的16個(gè)基因的共表達(dá)分析結(jié)果
大腸癌細(xì)胞在遷移過(guò)程中細(xì)胞內(nèi)的許多信號(hào)分子均會(huì)發(fā)生一系列變化,這種變化相互影響和級(jí)聯(lián)傳遞構(gòu)成了細(xì)胞內(nèi)復(fù)雜的信號(hào)調(diào)控網(wǎng)絡(luò)。信號(hào)調(diào)控網(wǎng)絡(luò)中存在著關(guān)鍵調(diào)控節(jié)點(diǎn),調(diào)控節(jié)點(diǎn)在信號(hào)通路的收斂及放大的過(guò)程中具有十分重要的作用。明確信號(hào)調(diào)控網(wǎng)絡(luò)中關(guān)鍵調(diào)控點(diǎn)的作用機(jī)制,對(duì)理解這些信號(hào)分子變化所引起的細(xì)胞生物學(xué)行為的變化有著重要意義。通過(guò)前期研究分析篩選,獲得了可能在大腸癌轉(zhuǎn)移過(guò)程中受到調(diào)控作用較多的轉(zhuǎn)錄因子CREB5,前期的研究發(fā)現(xiàn)在CREB5基因的上游調(diào)控區(qū)域富集著許多轉(zhuǎn)錄因子結(jié)合位點(diǎn),而這些轉(zhuǎn)錄因子結(jié)合位點(diǎn)在大腸癌轉(zhuǎn)移以及患者生存時(shí)間相關(guān)基因上游調(diào)控區(qū)域中出現(xiàn)頻率較高。并且CREB5基因在進(jìn)化上高度保守,具有較多的可變剪切體以及與大腸癌患者生存時(shí)間密切相關(guān)。且其生存曲線顯示CREB5基因在低表達(dá)時(shí)患者生存率較高,但中表達(dá)時(shí)的生存曲線與高表達(dá)時(shí)相貼近,生存率均較低,說(shuō)明 CREB5基因的表達(dá)對(duì)患者生存時(shí)間影響較大。由于CREB5基因的相關(guān)文獻(xiàn)報(bào)道很少,為了闡明其在大腸癌轉(zhuǎn)移過(guò)程中可能的作用機(jī)制,本研究將大腸癌表達(dá)譜數(shù)據(jù)根據(jù)CREB5基因的表達(dá)值分為高表達(dá)組和低表達(dá)組,基于兩組數(shù)據(jù)基因表達(dá)的差異情況進(jìn)行相關(guān)分子事件的富集分析,富集結(jié)果顯示CREB5基因高表達(dá)組參與的分子事件多與腫瘤的發(fā)生發(fā)展密切相關(guān)。由于CREB5能夠與c-Jun結(jié)合成為異二聚體,且轉(zhuǎn)錄因子結(jié)合位點(diǎn)富集結(jié)果顯示AP-1結(jié)合位點(diǎn)富集程度最高,而c-Jun為AP-1的重要組成部分,因此具有AP-1結(jié)合位點(diǎn)的上調(diào)基因可能同時(shí)受CREB5所調(diào)控。為了進(jìn)一步篩選這些上調(diào)基因中參與了腫瘤相關(guān)信號(hào)通路的基因,將這些基因與在癌癥通路富集類中起著富集作用的上調(diào)基因取交集,得到了16個(gè)基因,這16個(gè)基因所構(gòu)成的分子網(wǎng)絡(luò)相關(guān)度最高的分子功能為細(xì)胞遷移,主要涉及CSF1R、MMP9、PDGFRB、FIGF和IL6這5個(gè)基因所構(gòu)成的子網(wǎng)絡(luò)。因此這 5個(gè)基因可能是CREB5在大腸癌轉(zhuǎn)移過(guò)程中所調(diào)控的關(guān)鍵基因。本研究通過(guò)了生物信息學(xué)方法分析了大腸癌表達(dá)譜數(shù)據(jù),發(fā)現(xiàn) CREB5可能通過(guò)調(diào)控 CSF1R、MMP9、PDGFRB、FIGF和IL6這5個(gè)基因影響大腸癌細(xì)胞的遷移(圖3)。因此,CREB5可能是大腸癌轉(zhuǎn)移相關(guān)信號(hào)調(diào)控網(wǎng)絡(luò)中的關(guān)鍵調(diào)控點(diǎn),靶向此蛋白的藥物有望能夠在一定程度上抑制大腸癌轉(zhuǎn)移。
圖3 CREB5調(diào)控大腸癌轉(zhuǎn)移機(jī)制模式圖
[1]Subramanian A,Kuehn H,Gould J,Tamayo P,Mesirov JP.GSEA-P: a desktop application for gene set enrichment analysis. Bioinformatics,2007,23(23): 3251–3253.
[2]齊魯,丁彥青. 大腸癌轉(zhuǎn)移相關(guān)基因表達(dá)調(diào)控的生物信息學(xué)分析. 基因組學(xué)與應(yīng)用生物學(xué),2013,(1): 83–90.
[3]Tusher VG,Tibshirani R,Chu G. Significance analysis of microarrays applied to the ionizing radiation response.Proc Natl Acad Sci USA,2001,98(9): 5116–5121.
[4]Tonon L,Touzet H,Varre JS. TFM-Explorer: mining cis-regulatory regions in genomes. Nucleic Acids Res,2010,38(S2): W286–W292.
[5]Qi L,Ding YQ. Screening and regulatory network analysis of survival-related genes of patients with colorectal cancer.Sci China Life Sci,2014,57(5): 526–531.
[6]齊魯,丁彥青. 大腸癌患者生存相關(guān)基因的篩選與網(wǎng)絡(luò)調(diào)控分析. 中國(guó)科學(xué)(生命科學(xué)),2014,44(5): 481–487.
[7]Zu YL,Maekawa T,Nomura N,Nakata T,Ishii S. Regulation of trans-activating capacity of CRE-BPa by phorbol ester tumor promoter TPA. Oncogene,1993,8(10):2749–2758.
[8]Nomura N,Zu YL,Maekawa T,Tabata S,Akiyama T,Ishii S. Isolation and characterization of a novel member of the gene family encoding the cAMP response element-binding protein CRE-BP1. J Biol Chem,1993,268(6): 4259–4266.
[9]Jenuth JP. The NCBI. Publicly available tools and resources on the Web. Methods Mol Biol,2000,132:301–312.
[10]Barrett T,Troup DB,Wilhite SE,Ledoux P,Rudnev D,Evangelista C,Kim IF,Soboleva A,Tomashevsky M,Edgar R. NCBI GEO: mining tens of millions of expression profiles--database and tools update. Nucleic Acids Res,2007,35(S1): D760–D765.
[11]Kanehisa M,Goto S. KEGG: kyoto encyclopedia of genes and genomes. Nucleic Acids Res,2000,28(1): 27–30.
[12]Hess J,Angel P,Schorpp-Kistner M. AP-1 subunits: quarrel and harmony among siblings. J Cell Sci,2004,117(Pt 25): 5965–5973.
[13]Mostafavi S,Ray D,Warde-Farley D,Grouios C,Morris Q. GeneMANIA: a real-time multiple association network integration algorithm for predicting gene function. Genome Biol,2008,9(Suppl.1): S4.
[14]Zhang B,Kirov S,Snoddy J. WebGestalt: an integrated system for exploring gene sets in various biological contexts. Nucleic Acids Res,2005,33(S2): W741–W748.