龍煥屏,李光
(中國醫(yī)科大學(xué)附屬第一醫(yī)院放射治療科,沈陽 110001)
在癌癥死亡患者中肺癌占27%,是癌癥相關(guān)死亡的主要原因[1]。肺腺癌(lung adenocarcinoma,LUAD)已經(jīng)成為近數(shù)十年來最常見的肺癌類型之一,并且LUAD傾向于早期轉(zhuǎn)移,能夠?qū)е潞芨叩乃劳雎剩?]。因此,尋找可靠的預(yù)后標(biāo)志物和治療靶點(diǎn)對提高LUAD的治療效果非常重要。隨著生物技術(shù)的發(fā)展,可以通過微陣列檢測成千上萬個基因的表達(dá)水平,進(jìn)一步促進(jìn)了癌癥的研究。本研究通過分析基因表達(dá)微陣列數(shù)據(jù)(GSE33532、GSE32863和GSE43458)探索了LUAD中差異表達(dá)基因的相互作用網(wǎng)絡(luò)以及相關(guān)的信號傳導(dǎo)途徑,最終鑒定出3個核心基因CDC45、CCNB2和CDC20可以作為LUAD的候選生物標(biāo)志,從而為LUAD的潛在生物學(xué)機(jī)制和治療靶標(biāo)提供有用的信息和方向。
從美國國立生物技術(shù)信息中心的基因表達(dá)匯編(Gene Expression Omnibus,GEO)數(shù)據(jù)庫中選 取GSE33532、GSE32863和GSE43458的芯片數(shù)據(jù),共178例LUAD和98例正常肺組織。
使用GEO2R篩選LUAD和正常肺組織之間的差異表達(dá)基因,篩選條件是|logFC|≥ 1和調(diào)整P< 0.001。然后,使用Venn diagram軟件獲得3個基因芯片的共同差異表達(dá)基因,log FC > 0定義為上調(diào)基因,log FC < 0定義為下調(diào)基因。
使用注釋、可視化和集成發(fā)現(xiàn)數(shù)據(jù)庫(The Database for Annotation,Visualization,and Integrated Discovery,DAVID)對基因進(jìn)行分子功能(molecular function,MF)、細(xì)胞成分(cellular component,CC)、生物過程(biological process,BP)和KEGG分析(P< 0.05)。
通過STRING獲取PPI信息。然后,使用Cytoscape檢查基因之間潛在的相關(guān)性,使用MCODE獲得重要模塊。
通過Kaplan-Meier Plotter在線數(shù)據(jù)庫評估基因?qū)︻A(yù)后的影響(P< 0.05)。
使用GEO2R,分別從GSE33532、GSE32863和GSE43458中篩選出3 180、1 584、1 011個差異表達(dá)基因。使用Venn diagram獲得331個共同差異表達(dá)基因,其中上調(diào)基因68個(圖1A),下調(diào)基因263個(圖1B)。
圖1 通過使用Venn diagram獲得331個共同差異表達(dá)基因Fig.1 331 common differentially expressed genes obtained by Venn diagram
使用DAVID對331個基因進(jìn)行GO分析。結(jié)果表明:(1)BP方面,上調(diào)的基因主要富集在膠原纖維組織、胞質(zhì)分裂和凋亡過程的正向調(diào)控等,下調(diào)的基因主要富集在細(xì)胞黏附和細(xì)胞對激素刺激的反應(yīng)等;(2)MF方面,上調(diào)的基因富集在細(xì)胞外基質(zhì)結(jié)構(gòu)組成和DNA結(jié)合、彎曲等,下調(diào)的基因則富集在肝素結(jié)合和碳水化合物結(jié)合等;(3)CC方面,上調(diào)的基因明顯富集在蛋白質(zhì)細(xì)胞外基質(zhì)、中體和細(xì)胞外泌體等,下調(diào)的基因富集在膜筏和蛋白質(zhì)細(xì)胞外基質(zhì)等。KEGG分析結(jié)果顯示,上調(diào)的基因主要富集在細(xì)胞外基質(zhì)受體相互作用、蛋白質(zhì)的消化吸收、黏著斑和細(xì)胞周期,下調(diào)的基因則富集在細(xì)胞黏附分子、藥物代謝-細(xì)胞色素P450、酪氨酸代謝和PPAR信號通路(圖2)。
圖2 68個上調(diào)基因和263個下調(diào)基因的GO和KEGG分析Fig.2 GO and KEGG analysis of 68 up-regulated genes and 263 down-regulated genes
通過STRING獲取331個共同差異表達(dá)基因的PPI信息。使用Cytoscape檢查基因之間潛在的相關(guān)性,共有291個節(jié)點(diǎn)和934層邊緣。此外,使用MCODE獲得了1個重要模塊。該模塊包括16個基因,且均為上調(diào)基因(圖3)。
圖3 通過STRING和模塊分析構(gòu)建PPI Fig.3 Building PPI through STRING and module analysis
使用Kaplan-Meier Plotter在線數(shù)據(jù)庫對16個基因進(jìn)行總生存分析(overall survival,OS),結(jié)果顯示,13個基因(ASPM,CCNB2,CDC20,CDC45,CENPE,KIAA0101,KIF20A,MELK,PRC1,TOP2A,TPX2,TYMS,UBE2T)的高表達(dá)與LUAD的OS更差相關(guān)(均P< 0.05)。
13個基因的KEGG分析結(jié)果表明,CDC45、CCNB2和CDC20顯著富集于細(xì)胞周期途徑中(P=0.001 929 455,F(xiàn)DR=1.234 859 464)。
使用Kaplan-Meier Plotter在線數(shù)據(jù)庫分析CDC45、CCNB2和CDC20的表達(dá)與不同臨床病理特征肺癌患者臨床預(yù)后的關(guān)系。結(jié)果顯示,CDC20的高表達(dá)與男性、女性、TNM分期中的Ⅰ期、N2期、吸煙、腺癌和手術(shù)切緣陰性患者的OS和無進(jìn)展生存期(free progression survival,F(xiàn)PS)較差顯著 相關(guān)(表1),CCNB2的高表達(dá)與男性、TNM分期中的Ⅰ期、吸煙、未吸煙、腺癌和手術(shù)切緣陰性患者的OS和FPS較差顯著相關(guān)(表2),CDC45的高表達(dá)與男性、TNM分期中的Ⅰ期、吸煙、腺癌、手術(shù)切緣陰性和未化療患者的OS和FPS較差顯著相關(guān)(表3)。這些結(jié)果表明,CDC45、CCNB2和CDC20的表達(dá)水平可能影響肺癌患者的預(yù)后,可望成為LUAD的預(yù)后標(biāo)志物。
表1 CDC20的表達(dá)與不同臨床病理特征肺癌患者臨床預(yù)后的關(guān)系Tab.1 Relationship between the expression of CDC20 and clinical prognosis of lung cancer patients with different clinicopathological factors
表2 CCNB2的表達(dá)與不同臨床病理特征肺癌患者臨床預(yù)后的關(guān)系Tab.2 Relationship between the expression of CCNB2 and clinical prognosis of lung cancer patients with different clinicopathological factors
表3 CDC45的表達(dá)與不同臨床病理特征肺癌患者臨床預(yù)后的關(guān)系Tab.3 Relationship between the expression of CDC45 and clinical prognosis of lung cancer patients with different clinicopathological factors
為了確定在LUAD中有用的預(yù)后生物標(biāo)志物,本研究使用生物信息學(xué)方法從GEO數(shù)據(jù)庫中選取了GSE33532、GSE32863和GSE43458芯片,最終得到CDC45、CCNB2和CDC20在細(xì)胞周期途徑中顯著富集,并且這3個基因的表達(dá)與不同臨床病理特征肺癌患者的預(yù)后有關(guān),表明這3個基因可能作為LUAD的預(yù)后生物標(biāo)志物和潛在治療靶點(diǎn)。
CDC20突變可導(dǎo)致有絲分裂異常停止,從而導(dǎo)致后期染色體分離異常[3]。CDC20在多種腫瘤中高表達(dá),如卵巢癌[4]、肝細(xì)胞癌[5]、胃癌[6]、乳腺癌[7],并與患者的預(yù)后有關(guān)。下調(diào)CDC20可增加癌細(xì)胞對放療和化療的敏感性[8]。CCNB2通過激活CDK1激酶來觸發(fā)細(xì)胞周期G2/M的轉(zhuǎn)變[9]。CCNB2在多種癌癥中高表達(dá),如前列腺癌[10]、乳腺癌[11]、。CCNB2mRNA在癌癥患者血清中高表達(dá),且與癌癥的分期和轉(zhuǎn)移狀態(tài)有關(guān)[12]。CDC45在啟動DNA復(fù)制中起著至關(guān)重要的作用[13],且在多種腫瘤中高表達(dá),如宮頸癌[14],并且CDC45可能是各種惡性腫瘤增殖的標(biāo)志物[15]。
大量研究證明,CDC20、CCNB2和CDC45與多種腫瘤進(jìn)展密切相關(guān)。本研究通過生物信息學(xué)分析發(fā)現(xiàn),CDC20、CCNB2和CDC45在LUAD的預(yù)后過程中可能起關(guān)鍵作用,可能是潛在的治療靶標(biāo)。但是,這些預(yù)測還需要通過一系列實(shí)驗(yàn)加以驗(yàn)證。本研究的結(jié)果為LUAD的潛在生物學(xué)機(jī)制和治療靶標(biāo)提供了一些有用的信息和方向。