董周威 王啟威 張麗萍 林麗紅 徐 丹
喉癌的發(fā)生率在呼吸道腫瘤中位居第2位,僅次于肺癌,每年新增病例超過15萬,大多數(shù)的喉癌患者處于臨床Ⅲ期和Ⅳ期才被發(fā)現(xiàn),喉癌的發(fā)生率和病死率較高,這就要求通過有針對性的篩查尋找用于喉癌早期診斷的分子標(biāo)志物和治療靶點(diǎn)[1]。喉癌的病因復(fù)雜,與環(huán)境和生活方式有關(guān),如吸煙、飲酒、接觸有毒物質(zhì)、飲食習(xí)慣、輻射、乳頭狀瘤病毒感染和咽喉返流等[2]。喉癌的治療方式在過去幾年發(fā)生了巨大的變化,放射治療和外科手術(shù)方法進(jìn)行了很大的改進(jìn),還出現(xiàn)了新的靶向治療方法,多種治療方案綜合運(yùn)用有利于提高喉癌患者的總生存率[3]。然而,如何選擇最合理的治療方案仍然是一個(gè)亟待解決的問題。盡管喉癌相關(guān)的研究很多,但分子標(biāo)志物目前還沒有用于喉癌患者的診斷、治療和管理。因此,研究喉癌發(fā)生、發(fā)展的分子機(jī)制,制定有效的診斷和治療策略尤為重要。在過去的幾十年中,微陣列技術(shù)和生物信息學(xué)分析被廣泛應(yīng)用于基因水平的癌癥研究,通過臨床大數(shù)據(jù)篩選出與腫瘤發(fā)生、發(fā)展和預(yù)后密切相關(guān)的基因,有助于識別喉癌發(fā)生、發(fā)展過程中的差異表達(dá)基因和功能途徑。本研究從GEO數(shù)據(jù)庫中下載并分析了2個(gè)微陣列數(shù)據(jù)集,以獲得喉癌組織和非癌組織之間的差異基因。隨后,進(jìn)行了GO和KEGG途徑富集分析和PPI網(wǎng)絡(luò)分析,以幫助了解喉癌發(fā)生和發(fā)展的分子機(jī)制,然后再利用TCGA數(shù)據(jù)庫驗(yàn)證結(jié)果,并對關(guān)鍵基因進(jìn)行深入分析,共鑒定出218個(gè)差異基因和8個(gè)關(guān)鍵基因,為喉癌早期診斷提供了新的分子標(biāo)志物及靶向治療提供新的靶點(diǎn)。
1.研究對象:從美國國立生物信息中心(NCBI)的GEO據(jù)庫(www.ncbi.nlm.nih.gov/geo)中搜索基因芯片數(shù)據(jù)集,篩選標(biāo)準(zhǔn):①數(shù)據(jù)集為喉鱗狀細(xì)胞癌全基因組芯片;②具有癌組織與正常組織;③樣本數(shù)≥20?;谝陨虾Y選標(biāo)準(zhǔn),基因芯片數(shù)據(jù)集GSE51985和GSE59102納入研究。GSE51985共有20例組織樣本,包括10例喉鱗狀細(xì)胞癌組織樣本和10例正常組織樣本;GSE59102共有42例組織樣本,包括29例癌組織樣本和13例正常組織樣本。
2.數(shù)據(jù)處理與基因篩選:利用GEO數(shù)據(jù)庫中GEO2R(https:∥www.ncbi.nlm.nih.gov/geo/ geo2r/)在線分析工具對數(shù)據(jù)庫中的GSE51985和GSE59102基因芯片進(jìn)行數(shù)據(jù)處理;本研究以喉鱗狀細(xì)胞癌組織為實(shí)驗(yàn)組,正常組織為對照組,以P<0.01且|log2FC|>2為標(biāo)準(zhǔn)篩選出顯著差異表達(dá)基因,2個(gè)數(shù)據(jù)集差異分析結(jié)果繪制韋恩圖取并交集。
3.差異基因GO功能注釋和KEGG通路富集分析:利用DAVID6.8數(shù)據(jù)庫(https:∥david.ncifcrf.gov) 對差異基因進(jìn)行GO和KEGG通路富集分析,分析差異基因的功能和作用途徑。GO富集分析主要從生物過程(biological process,BP)、細(xì)胞組分(cellular component,CC) 和分子功能(molecular function,MF)3個(gè)方面對差異基因進(jìn)行全面的注釋。以P<0.05為差異有統(tǒng)計(jì)學(xué)意義,利用Prism8使其結(jié)果可視化。
4.PPI網(wǎng)絡(luò)構(gòu)建與模塊分析:將差異基因?qū)隨TRING(11.0版)(http:∥string-db.org)在線數(shù)據(jù)庫預(yù)測蛋白互作網(wǎng)絡(luò),進(jìn)一步探索喉癌的發(fā)生和發(fā)展機(jī)制,置信度閾值>0.4被認(rèn)為差異有統(tǒng)計(jì)學(xué)意義。利用Cytoscape(3.7.2版)軟件將結(jié)果可視化,繪制PPI網(wǎng)絡(luò)。用MCODE插件識別PPI網(wǎng)絡(luò)中最重要的模塊。選擇標(biāo)準(zhǔn)為:MCODE評分>5,Degree Cutoff=2,Node Density Cutoff=0.1,Node Score Cutoff=0.2,K-Core=2,Max Depth=100。隨后,使用DAVID對該模塊中的基因進(jìn)行KEGG和GO分析。
5.關(guān)鍵基因的篩選與分析:利用Cystoscape軟件內(nèi)cytoHubba網(wǎng)絡(luò)分析插件篩選關(guān)鍵基因,采用親和度、貢獻(xiàn)度、最大集團(tuán)中心3種不同計(jì)算方法,每種算法中選取節(jié)點(diǎn)中排名前20個(gè)基因,取3個(gè)結(jié)果的交集,篩選關(guān)鍵基因。將關(guān)鍵基因輸入GEPIA2.0(http:∥gepia2.cancer-pku.cn)尋找相似基因,保留每個(gè)關(guān)鍵基因前20個(gè)相似基因,將所有相似基因輸入Metascape(http:∥metascape.org/)進(jìn)行富集分析,分析這些基因及共表達(dá)網(wǎng)絡(luò),P<0.05,Min Enrichment>3,Min Overlap>3被認(rèn)為差異有統(tǒng)計(jì)學(xué)意義。
6.關(guān)鍵基因與腫瘤相關(guān)性分析:利用在線數(shù)據(jù)庫Oncomine(http:∥www.Oncomine.com)分析關(guān)鍵基因與腫瘤相關(guān)性分析,比較關(guān)鍵基因在腫瘤組織與正常組織的差異,P<0.01,Fold Change>1.5,被認(rèn)為差異有統(tǒng)計(jì)學(xué)意義。從TCGA數(shù)據(jù)庫(https:∥portal.gdc.cancer.gov/)下載喉癌相關(guān)的數(shù)據(jù)的基因表達(dá)信息和臨床信息,對數(shù)據(jù)集進(jìn)行篩選,共篩選出喉癌相關(guān)樣本112例,并將臨床資料與基因表達(dá)信息整合,對關(guān)鍵基因進(jìn)行正常組織與喉癌組織比較,使用GraphPad Priserm 8.0軟件進(jìn)行t檢驗(yàn),以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。同時(shí)將關(guān)鍵基因表達(dá)從低到高排序,取中位數(shù)為節(jié)點(diǎn),將患者分為低表達(dá)組和高表達(dá)組,應(yīng)用GraphPad Priserm8.0進(jìn)行Log-RankTest生存分析,分析關(guān)鍵基因表達(dá)與喉癌預(yù)后關(guān)系,以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
1.差異表達(dá)基因篩選:利用GEO2R在線分析工具對基因芯片數(shù)據(jù)集GES51985和GSE59102進(jìn)行數(shù)據(jù)處理分析。GES51985共篩選出差異基因585個(gè),上調(diào)基因233個(gè),下調(diào)基因352個(gè);GSE59102共篩選出差異基因848個(gè),上調(diào)基因345個(gè),下調(diào)基因503個(gè);兩個(gè)數(shù)據(jù)集之間取交集,篩選出差異基因218個(gè),如韋恩圖所示(圖1),其中上調(diào)基因86個(gè),下調(diào)基因132個(gè)。
圖1 GSE59102與GSE51985差異基因韋恩圖
2.差異基因的KEGG和GO富集分析:為了分析差異基因的生物學(xué)功能,筆者使用DAVID數(shù)據(jù)庫進(jìn)行了功能和途徑富集分析。GO分析結(jié)果表明,BP變化在細(xì)胞黏附、蛋白質(zhì)分解、細(xì)胞增殖的正調(diào)控等方面顯著富集(圖2A)。CC的變化主要集中在細(xì)胞外區(qū)、胞外體、細(xì)胞外間隙等(圖2B)。MF的變化主要集中在絲氨酸型內(nèi)肽酶活性、肝素結(jié)合、結(jié)構(gòu)分子活性組成等(圖2C)。KEGG途徑分析顯示,差異基因主要富集于唾液分泌、局灶性粘連、ECM受體相互作用、細(xì)胞周期等途徑(圖2D)。
3.PPI網(wǎng)絡(luò)構(gòu)建與模塊分析:將STRING數(shù)據(jù)庫分析得到的PPI網(wǎng)絡(luò)數(shù)據(jù)文件導(dǎo)入Cytoscape軟件,構(gòu)建了可視化的差異基因PPI網(wǎng)絡(luò),并使用MCODE插件識別PPI網(wǎng)絡(luò)中最重要的模塊。使用DAVID對該模塊中涉及的基因進(jìn)行功能分析,結(jié)果顯示主要集中在在細(xì)胞周期、ATP結(jié)合、DNA復(fù)制起點(diǎn)結(jié)合等生物過程中(圖3)。
圖2 差異基因GO和KEGG功能富集分析
圖3 PPI網(wǎng)絡(luò)中重要的模塊
4.關(guān)鍵基因的選擇與分析:利用Cystoscape軟件內(nèi)cytoHubba插件篩選關(guān)鍵基因,篩選出CHEK1、SERPINE1、SPP1、COL1A1、FOXM1、MMP9、CXCL12和MMP1共8個(gè)關(guān)鍵基因。將關(guān)鍵基因輸入GEPIA尋找相似基因,將所有相似基因輸入Metascape進(jìn)行富集分析,主要富集于細(xì)胞外組織結(jié)構(gòu)、PID整合素1途徑、有絲分裂染色體分離等(圖4)。
圖4 關(guān)鍵基因Metascape富集分析
5.關(guān)鍵基因與腫瘤相關(guān)性分析:在線數(shù)據(jù)庫Oncomine分析關(guān)鍵基因與腫瘤相關(guān)性分析,8個(gè)關(guān)鍵基因均與多種腫瘤密切相關(guān),除CXCL12外,其他基因均在多數(shù)癌癥中呈高表達(dá)(圖5)。利用TCGA數(shù)據(jù)分析喉癌組織與正常組織中關(guān)鍵基因的表達(dá),僅CXCL12表達(dá)值明顯下降,其余均呈高表達(dá),結(jié)果差異均有統(tǒng)計(jì)學(xué)意義(圖6)。對關(guān)鍵基進(jìn)行生存分析,筆者研究發(fā)現(xiàn)COL1A1和MMP1的表達(dá)與總生存率顯著相關(guān)(圖7)。
圖5 關(guān)鍵基因與腫瘤相關(guān)性分析
圖6 關(guān)鍵基因腫瘤組織與正常組織表達(dá)差異分析
圖7 關(guān)鍵基因生存分析
近幾十年來對喉癌分子生物學(xué)的研究越來越多,CD14與喉癌易感性相關(guān), microRNA-203抑制喉癌細(xì)胞侵襲并誘導(dǎo)凋亡, TUG1可促進(jìn)喉癌的增殖、遷移和侵襲等[4]。然而,喉癌患者的生存率仍然沒有明顯的提高。很多患者早期沒能及時(shí)發(fā)現(xiàn),這可能是喉癌預(yù)后不良的原因之一。因此,使用分子標(biāo)志物作為預(yù)測因素來確定患者的治療方式,開發(fā)與分子標(biāo)志物相結(jié)合的新治療模式,以便在這些患者中選擇性地應(yīng)用精準(zhǔn)治療,將有可能成為提高喉癌患者生存率的有效措施之一。
在本研究中,筆者分析了2個(gè)GEO數(shù)據(jù)集,共鑒定篩選出差異基因218個(gè)。GO和KEGG富集分析用于探索差異基因之間的相互作用,發(fā)現(xiàn)了一些與喉癌發(fā)生機(jī)制有關(guān)的生物學(xué)過程,已有研究表明,細(xì)胞增殖的正調(diào)控與喉癌的發(fā)生、發(fā)展相關(guān), Beta4亞基通過EMC相互作用途徑調(diào)節(jié)喉癌的發(fā)生與發(fā)展[5]。PPI能夠幫助從蛋白互作模型以及拓?fù)鋵W(xué)的角度探究喉癌的分子機(jī)制,發(fā)現(xiàn)潛在的治療靶點(diǎn)。筆者利用Cytoscape中的插件MCODE識別PPI網(wǎng)絡(luò)中最重要的模塊。根據(jù)Cytoscape中的連接數(shù)據(jù),MCODE可以發(fā)現(xiàn)PPI網(wǎng)絡(luò)中相互作用的高密度區(qū)域,這個(gè)高密度區(qū)域有更高的概率參與到生物調(diào)節(jié)中,而那些輕度連接的節(jié)點(diǎn)不會在整個(gè)網(wǎng)絡(luò)的完整性中發(fā)揮關(guān)鍵作用,這個(gè)函數(shù)不會因高通量技術(shù)帶來高假陽性影響。筆者對MCODE中發(fā)現(xiàn)的重要模塊相關(guān)基因進(jìn)行再次富集,發(fā)現(xiàn)其信號通路主要集中在細(xì)胞周期,有研究表明細(xì)胞周期過程的失調(diào)在腫瘤的發(fā)生、發(fā)展中起著重要作用,MIR31HG通過HIF1A和p21調(diào)控喉癌細(xì)胞周期進(jìn)程,黃腐酚可以抑制喉癌細(xì)胞周期進(jìn)展和增殖, 薯蕷素通過誘導(dǎo)細(xì)胞周期阻滯從而抑制喉癌侵襲[6~9]。由此可見,細(xì)胞周期的調(diào)節(jié)在喉癌的發(fā)生、發(fā)展中同樣扮演著重要的角色,是喉癌主要的發(fā)生機(jī)制之一,這些理論與筆者的結(jié)果是一致的。
同時(shí)筆者還發(fā)現(xiàn)了一些新的途徑,如細(xì)胞外基質(zhì)分解、表皮發(fā)育、有絲分裂細(xì)胞周期G2/M轉(zhuǎn)換等。有研究報(bào)道密集的細(xì)胞外基質(zhì)往往會導(dǎo)致腫瘤對放療的抵抗, 與表皮發(fā)育有重要關(guān)系的表皮生長因子受體(EGFR)的表達(dá)可作為喉部鱗狀細(xì)胞癌的獨(dú)立預(yù)后因素,EGFR與病程的相關(guān)性及其對生存的影響使EGFR表達(dá)成為喉癌不良的預(yù)后因素, 有絲分裂細(xì)胞周期G2/M轉(zhuǎn)換在結(jié)直腸癌的發(fā)生、發(fā)展中發(fā)揮了重要的作用, 喉癌細(xì)胞存活率的下降被發(fā)現(xiàn)是由于細(xì)胞凋亡的誘導(dǎo)和G2/M細(xì)胞周期阻滯[10~13]。如果能夠識別這些途徑的具體作用過程,無論是在降低患者病死率和保護(hù)喉功能,還是在提高患者生存質(zhì)量方面都可能獲益,可能鑒定出喉癌診斷的金標(biāo)準(zhǔn),有可能成為喉癌臨床治療的轉(zhuǎn)折點(diǎn)。
Cytoscape中的cytoHubba,主要用于通過其網(wǎng)絡(luò)功能對網(wǎng)絡(luò)中的節(jié)點(diǎn)進(jìn)行排名。CytoHubba提供11種拓?fù)浞治龇椒?,包括貢獻(xiàn)度、邊緣滲透分量、最大鄰域分量、最大鄰域分量密度、最大集團(tuán)中心度和6個(gè)中心點(diǎn)(瓶頸分析、偏心率、親和度、輻射度、中間性和應(yīng)力)。在11種方法中,最大集團(tuán)中心的分析方法在從PPI網(wǎng)絡(luò)預(yù)測必需蛋白質(zhì)的精度上具有更好的性能。也有研究發(fā)現(xiàn),一個(gè)蛋白的貢獻(xiàn)度與其基因的重要性密切相關(guān),具有高貢獻(xiàn)度的蛋白更傾向于是關(guān)鍵蛋白,計(jì)算親和度的方法也是近年來預(yù)測關(guān)鍵基因經(jīng)常采用的方法。因此筆者采用親和度、貢獻(xiàn)度、最大集團(tuán)中心3種不同計(jì)算方法,每種算法中選取節(jié)點(diǎn)中排名前20個(gè)基因,取3個(gè)結(jié)果的交集,篩選關(guān)鍵基因,共篩選出CHEK1、SERPINE1、SPP1、FOXM1、MMP9、CXCL12、COL1A1和MMP1共8個(gè)關(guān)鍵基因。
CHEK1是基因組監(jiān)視途徑的核心組成部分,是細(xì)胞周期和細(xì)胞存活的關(guān)鍵調(diào)控因子,影響細(xì)胞周期的各個(gè)階段,包括S期、G2/M期和M期,還參與DNA修復(fù)過程、基因轉(zhuǎn)錄、胚胎發(fā)育,p21活化激酶-4通過CHEK1能夠抑制喉癌細(xì)胞增殖,可以作為喉癌治療的新靶點(diǎn)[14]。SPP1也是一種細(xì)胞因子,可上調(diào)干擾素γ和白細(xì)胞介素-12的表達(dá),與喉癌的放療敏感度有關(guān),在預(yù)測放射治療效果方面有重要作用[15]。FOXM1的表達(dá)與多種人類腫瘤的進(jìn)展及預(yù)后有關(guān),調(diào)節(jié)細(xì)胞周期相關(guān)基因cyclinB1、cyclinD1、cdc25的表達(dá),從而促進(jìn)宮頸癌的進(jìn)展, 同時(shí)FOXM1還可以抑制喉鱗癌生長及誘導(dǎo)凋亡[16]。 CXCL12來源于骨髓基質(zhì)細(xì)胞,其生物學(xué)功能有介導(dǎo)免疫反應(yīng),對造血干細(xì)胞增殖、分化起重要作用,促進(jìn)惡性腫瘤血管形成及轉(zhuǎn)移,有研究表明CXCL12可促進(jìn)喉鱗狀細(xì)胞癌的轉(zhuǎn)移[17]。SERPINE1作為組織纖溶酶原激活劑的誘餌,用于調(diào)節(jié)纖維蛋白溶解,許多研究表明SERPINE1可作為促腫瘤發(fā)生因子的影響因素,與結(jié)直腸癌、肺癌、口腔鱗狀細(xì)胞癌、胃癌、胰腺癌有關(guān),可作為腫瘤診斷、治療和預(yù)后的重要生物學(xué)標(biāo)志物[18]。COL1A1為Ⅰ型膠原α1,是Ⅰ型膠原的重要組成部分,近年來研究發(fā)現(xiàn)在多種腫瘤組織和細(xì)胞中有過表達(dá),COL1A1通過調(diào)節(jié)WNT/PCP通路促進(jìn)結(jié)直腸癌轉(zhuǎn)移,具有抗輻射作用,其表達(dá)水平與放射敏感度呈負(fù)相關(guān),COL1A1的激活可以抑制宮頸癌細(xì)胞的凋亡[19]。MMP1和MMP9均屬基質(zhì)金屬蛋白酶家族,可降解細(xì)胞外基質(zhì)中的膠原纖維和明膠及改變細(xì)胞的微環(huán)境,從而有利于腫瘤的侵襲和轉(zhuǎn)移,作用于腫瘤發(fā)生的初始階段有利于腫瘤形成。有研究表明,MMP1可能作為喉癌獨(dú)立的預(yù)后預(yù)測因子,也是超聲心動圖早期診斷喉癌的潛在探針,MMP9是吸煙相關(guān)性喉癌的易感基因[20,21]。
利用Oncomine數(shù)據(jù)庫數(shù)據(jù)分析關(guān)鍵基因與腫瘤相關(guān)性的過程中,筆者發(fā)現(xiàn)除CXCL12外,其他基因均在多數(shù)癌癥中呈高表達(dá),尤其是頭頸部腫瘤中,僅CXCL12呈低表達(dá),這些關(guān)鍵基因可區(qū)分喉癌和非癌組織,可以成為喉癌診斷的分子標(biāo)志物。利用TCGA數(shù)據(jù)庫對關(guān)鍵基進(jìn)行生存分析,分析關(guān)鍵基因表達(dá)與喉癌預(yù)后的關(guān)系。CHEK1、SSP1、MMP9、CXCL12、FOXM1、SERPINE1與生存無明顯關(guān)系,COL1A1和MMP1與患者總生存率相關(guān),其中COL1A1基因低表達(dá)組患者生存率明顯高于高表達(dá)組,MMP1高表達(dá)組生存率明顯高于低表達(dá)組生存率,提示這些基因可能在喉癌的發(fā)生、發(fā)展、侵襲或復(fù)發(fā)中起重要作用。已有研究表明COL1A1是一種腫瘤蛋白,可作為早期胃癌篩查的監(jiān)測因子,COL1A1和COL1A2是預(yù)測胃癌患者臨床預(yù)后的重要標(biāo)志[22]。喉癌中與COL1A1相關(guān)的功能研究未見報(bào)道,進(jìn)一步探討COL1A1在喉癌中的作用,可以作為探討膠原功能的一個(gè)起點(diǎn),使對喉癌的認(rèn)識增加一個(gè)新的維度,有助于癌癥生物學(xué)家和臨床腫瘤學(xué)家制定新的治療策略。
綜上所述,生物信息分析方法可為未來喉癌基因組個(gè)體化診斷和治療提供有力證據(jù),利用基因芯片表達(dá)譜數(shù)據(jù)分析得到的核心基因所富集的功能與通路說明喉癌的發(fā)生、發(fā)展是一個(gè)多基因參與、表達(dá)異常導(dǎo)致細(xì)胞無限增殖的復(fù)雜過程。關(guān)鍵基因有利于早期診斷喉癌,COL1A1、MMP1在喉癌組織中的表達(dá)與患者預(yù)后明顯相關(guān),未來筆者將開展深入的基礎(chǔ)實(shí)驗(yàn)及臨床研究證實(shí)其作為評判預(yù)后和分子靶向治療靶標(biāo)的價(jià)值。