趙琳 何章彪 張欣 曹翠萍
(1商丘醫(yī)學(xué)高等專(zhuān)科學(xué)校,河南 商丘 476000;2南陽(yáng)醫(yī)學(xué)高等專(zhuān)科學(xué)校)
鼻咽癌(NPC)是鼻咽上皮的惡性腫瘤,在東南亞和中國(guó)比較普遍〔1,2〕。在流行區(qū),早期NPC患者的5年生存率達(dá)95%,晚期NPC患者的生存率僅為60%,70%的初診NPC患者的病情會(huì)進(jìn)一步發(fā)展〔3〕。因此,尋找潛在的識(shí)別早期NPC患者的生物標(biāo)記物對(duì)改善患者預(yù)后具有重要意義。EB病毒(EBV)DNA檢測(cè)目前用于NPC早期患者的篩查,但其對(duì)腫瘤篩查的陽(yáng)性預(yù)測(cè)值較低(11%)〔4〕。有證據(jù)表明,基因和細(xì)胞信號(hào)通路,可能參與NPC的發(fā)生和發(fā)展,包括TGF-β信號(hào)通路和Notch信號(hào)通路〔5〕。NPC進(jìn)展的分子機(jī)制尚不清楚,目前對(duì)NPC的早期診斷和治療有限〔6〕。因此,需要進(jìn)一步研究NPC發(fā)生和發(fā)展的分子機(jī)制。
基因芯片是分析基因表達(dá)的高通量平臺(tái),可以鑒定參與各種信號(hào)通路、分子功能和生物學(xué)過(guò)程的數(shù)百個(gè)差異表達(dá)基因(DEGs)〔7〕。本研究從基因表達(dá)綜合數(shù)據(jù)庫(kù)〔GEO;www.ncbi.nlm.nih.gov/geo;GPL570(HG-U133_Plus_2)Affymetrix Human Genome U133 Plus 2.0 Array〕上下載了GSE64634數(shù)據(jù),以鑒定NPC組織中的DEGs〔8〕。隨后,進(jìn)行了基因本體論(GO;www.genontology.org)和京都基因與基因組百科全書(shū)(KEGG)信號(hào)通路富集分析,以確定關(guān)鍵基因的生物學(xué)功能和通路〔9〕。這項(xiàng)研究的結(jié)果為NPC的潛在生物標(biāo)志物提供了新的見(jiàn)解,并可能有助于對(duì)NPC發(fā)生和發(fā)展的分子機(jī)制的理解。
1.1研究工具和對(duì)象 基因表達(dá)譜GSE64634從GEO數(shù)據(jù)庫(kù)下載。GSE64634是在Affymetrix GPL570平臺(tái)〔GPL570(HG-U133_Plus_2)Affymetrix Human Genome U133 Plus 2.0 Array〕的基礎(chǔ)上提出的,由12例NPC標(biāo)本和4例正常對(duì)照(GSM1575894,GSM1575895,GSM1575896,GSM15-75897)組成。應(yīng)用在線分析工具GEO2R(https://www.ncbi.nlm.nih.gov/geo/geo2r/)對(duì)NPC及對(duì)應(yīng)的癌旁組織進(jìn)行DEGs分析。GEO2R是一個(gè)基于R語(yǔ)言程序的數(shù)據(jù)集分析工具,能夠?qū)ο嗤瑢?shí)驗(yàn)條件下的兩組樣品進(jìn)行對(duì)比,篩選DEGs?;虮磉_(dá)的差異用差異倍數(shù)(FC)表示。本研究設(shè)定的篩選標(biāo)準(zhǔn)分別為P<0.05,|logFC|≥1(篩選表達(dá)差異大于等于2倍的DEGs;或P<0.05,|logFC| ≥2 (篩選表達(dá)差異≥4倍的DEGs)。所篩選的差異顯著性基因見(jiàn)表1。
1.2基因功能和通路富集分析 Metascape (http://metascape.org/)是一種在線分析工具,用于提取與候選基因列表相關(guān)的生物信息。它不僅可以提供典型的基因功能富集分析,而且可以實(shí)現(xiàn)可視化分析,可查看差異顯著性基因的生物功能、信號(hào)通路富集等。對(duì)篩選出的DEGs進(jìn)行了GO分析和KEGG通路分析,并利用Metascape工具對(duì)篩選的DEGs進(jìn)行了GO和KEGG通路分析。以P值<0.01為界值,以富集程度評(píng)分〔-log10(P)〕進(jìn)行顯著性排列。
1.3構(gòu)建蛋白質(zhì)相互作用(PPI) 網(wǎng)絡(luò)String(http://string-db.org)是一個(gè)基于Web的資源,用于檢索基因相互作用的搜索工具,用于預(yù)測(cè)輸入基因列表的蛋白質(zhì)綜合信息。本研究使用字符串來(lái)獲取DEGs的PPI信息,并選擇組合得分大于0.4的相互作用進(jìn)行研究。在此基礎(chǔ)上,根據(jù)蛋白質(zhì)之間相互作用的信息,利用Cytoscape軟件(Version3.4.0,http://www.cytoscape.org/)構(gòu)建了PPI網(wǎng)絡(luò),并對(duì)網(wǎng)絡(luò)進(jìn)行了可視化。使用Cytoscape Plug-in Network Analyzer進(jìn)行了進(jìn)一步的分析,并計(jì)算了PPI網(wǎng)絡(luò)的拓?fù)湫再|(zhì)、節(jié)點(diǎn)度。
1.4以MCODE方法分析鼻咽癌的Hub基因 MCODE分析是檢測(cè)PPI網(wǎng)絡(luò)中緊密連接區(qū)域的一種方法。本研究使用MCODE分析從構(gòu)建的PPI網(wǎng)絡(luò)中選取最重要的模塊進(jìn)行進(jìn)一步分析。參數(shù)設(shè)置:node score cutoff=0.2,K-Core=2,degree cutoff=2。
2.1NPC差異顯著基因的篩選 從GEO公共數(shù)據(jù)庫(kù)中選取GSE64634的基因芯片數(shù)據(jù),上傳到GEO2R網(wǎng)絡(luò)工具中,篩選正常鼻咽組織和NPC組織之間的DEGs。圖1顯示了DEGs的火山圖。每個(gè)顏色點(diǎn)代表一個(gè)上調(diào)或下調(diào)的基因,其中綠色表示下調(diào)的基因,紅色表示上調(diào)的基因,黑色表示根據(jù)P值<0.05和|logFC|>1的標(biāo)準(zhǔn),沒(méi)有差異表達(dá)的基因。從GSE64634中鑒定出1 014個(gè)DEGs,包括191個(gè)上調(diào)基因和823個(gè)下調(diào)基因。圖2分別描繪了來(lái)自GSE64634的上調(diào)和下調(diào)的前10個(gè)重要基因的DEGs表達(dá)熱圖,基因表達(dá)水平用顏色表示,紅色表示高表達(dá),藍(lán)色表示低表達(dá)。聚類(lèi)分析表明,在正常鼻咽和NPC組織中,DEGs的表達(dá)存在差異。具體差異顯著性基因以表格的形式呈現(xiàn)(表1)。這193個(gè)重疊基因被確認(rèn)為候選DEGs,并用于進(jìn)一步的分析。
表1 NPC基因芯片GSE64634中篩選出193個(gè)差異表達(dá)基因
圖1 GSE64634微陣列中的DEGs火山圖
圖2 GSE64634微陣列中前10個(gè)差異表達(dá)的DEGs mRNA水平的熱圖
2.2DEGs的功能和途徑富集分析 在Metascape數(shù)據(jù)庫(kù)的基礎(chǔ)上,對(duì)篩選的NPC的候選DEGs的GO功能和KEGG通路進(jìn)行了富集分析。以P值為<0.01、最小重疊基因=3和最小富集因子>1.5作為設(shè)置標(biāo)準(zhǔn)。如圖3所示,DEGs富集分析主要集中在纖毛運(yùn)動(dòng)、體液免疫應(yīng)答、抗菌體液反應(yīng)、藥物代謝-細(xì)胞色素P450、花生四烯酸代謝過(guò)程、鞭毛的精子能動(dòng)性、化學(xué)致癌性、金屬離子運(yùn)輸、適應(yīng)性免疫反應(yīng)的負(fù)調(diào)控等方面,這些基因之間的功能彼此緊密地聯(lián)系在一起,并聚集成完整的網(wǎng)絡(luò)(圖4)。圖4顯示了KEGG途徑的富集分析。每個(gè)條帶代表一個(gè)豐富項(xiàng)或通路,根據(jù)-log 10P值著色,網(wǎng)絡(luò)的豐富條件和途徑,節(jié)點(diǎn)代表豐富的術(shù)語(yǔ)或途徑,節(jié)點(diǎn)大小表示所涉及的DEGs的數(shù)量。共享同一個(gè)集群的節(jié)點(diǎn)通常彼此靠近,顯示的邊界越粗,相似度就越高。
2.3PPI網(wǎng)絡(luò)構(gòu)建 將篩選的獲得的差異基因輸入STRING網(wǎng)站,構(gòu)建PPI網(wǎng)絡(luò)(圖5),并進(jìn)一步應(yīng)用Cytoscape軟件中的分子復(fù)合物檢測(cè)(MCODE)分析對(duì)PPI網(wǎng)絡(luò)中連接最為緊密的基因進(jìn)行分組,形成多個(gè)模塊。結(jié)果顯示共有3個(gè)模塊評(píng)分較高(圖2)。其中評(píng)分最高的模塊1中共包含了SNRPG,SNRPE,DDX42,SF3A3,DDX46,BUD31,SF3B6,U2AF2,SF3B5,SF3B3,PHF5A,SNRPD3,SF3A2,SNRPA1,SNRPB2,SF3B1,SF3B4,SNRPD2,PRPF6,SF3A1,PRPF31,SNRPA,SNRPB,SNRPD1,SF3B2等25個(gè)基因,共形成了300種相互作用關(guān)系,具有較高連接度,為中心(Hub)基因。
1~13:纖毛運(yùn)動(dòng)、體液免疫反應(yīng)、抗菌體液反應(yīng)、藥物代謝細(xì)胞色素P450、花生四烯酸代謝過(guò)程、鞭毛精子存活率、化學(xué)致癌、輔助因子轉(zhuǎn)運(yùn)、金屬離子轉(zhuǎn)運(yùn)、營(yíng)養(yǎng)水平的細(xì)胞反應(yīng)、成肌細(xì)胞融合、適應(yīng)免疫反應(yīng)的負(fù)調(diào)控、SLC介導(dǎo)的跨膜轉(zhuǎn)運(yùn);圖4同圖3 DEGs富集分析
圖4 KEGG途徑的富集分析
圖5 DEGs對(duì)應(yīng)的蛋白質(zhì)相互作用緊密連接度最高的3個(gè)模塊
NPC是頭頸部最常見(jiàn)的鱗狀細(xì)胞腫瘤之一〔5,10〕。Ⅰ期患者的5年生存率為95%。然而,Ⅳ期患者的5年存活率略高于60%〔11〕。因此,了解NPC進(jìn)展的病因和分子機(jī)制對(duì)于診斷和治療至關(guān)重要〔12〕。微陣列技術(shù)已被廣泛應(yīng)用于預(yù)測(cè)癌癥的潛在治療靶點(diǎn),包括結(jié)直腸癌〔13〕。在此之前,Wang等〔14〕分析了GSE12452數(shù)據(jù)集,發(fā)現(xiàn)細(xì)胞周期蛋白(cyclin)B1、黏蛋白1、細(xì)胞表面相關(guān)和乙醛脫氫酶1家族成員A1可能與EBV相關(guān)的NPC有關(guān)。GSE12452序列分析表明,CXC基序趨化因子配體(CXCL)9、ZIC家族成員2、前列腺素內(nèi)過(guò)氧化物合成酶2、纖維連接蛋白1、CXCL10和 ovo 樣轉(zhuǎn)錄抑制因子1可能在NPC中發(fā)揮作用。在本研究中,通過(guò)生物信息學(xué)分析篩選了20個(gè)上調(diào)和173個(gè)下調(diào)的DEGs。KEGG通路富集分析和GO功能注釋結(jié)果顯示,上調(diào)表達(dá)的DEGs主要富集于依賴DNA的DNA復(fù)制、細(xì)胞分裂、調(diào)節(jié)參與炎癥反應(yīng)的細(xì)胞因子的產(chǎn)生、抗原處理和肽抗原通過(guò)MHC Ⅱ類(lèi)遞呈和胚胎骨骼系統(tǒng)發(fā)育,而表達(dá)下調(diào)的DEGs主要參與纖毛運(yùn)動(dòng)、微管運(yùn)動(dòng)、鞭毛精子活力、纖毛或鞭毛依賴的細(xì)胞運(yùn)動(dòng)和動(dòng)脈內(nèi)皮細(xì)胞分化,膠質(zhì)細(xì)胞增殖、趨化因子介導(dǎo)的信號(hào)通路、軟骨細(xì)胞增殖、肌動(dòng)蛋白絲聚合、神經(jīng)遞質(zhì)分解代謝過(guò)程。已有研究表明,NPC細(xì)胞的侵襲、轉(zhuǎn)移、增殖和凋亡可能受特異性基因表達(dá)上調(diào)或下調(diào)的影響。這個(gè)結(jié)果與癌細(xì)胞的侵襲和轉(zhuǎn)移與異常的細(xì)胞黏附和細(xì)胞分裂密切相關(guān)的事實(shí)是一致的〔15〕。此外,癌細(xì)胞的增殖和凋亡與依賴DNA的DNA復(fù)制的異常密切相關(guān)。因此,分析所涉及的信號(hào)通路為理解腫瘤增殖提供新的見(jiàn)解。
本研究中構(gòu)建了一個(gè)PPI網(wǎng)絡(luò)來(lái)識(shí)別25個(gè)最重要的Hub基因。這25個(gè)基因形成300種相互作用關(guān)系將其緊密聯(lián)系在一起,構(gòu)成一個(gè)相對(duì)獨(dú)立的網(wǎng)絡(luò),并可能通過(guò)拮抗或協(xié)同作用起到相似的生物學(xué)功能。進(jìn)一步GO分析發(fā)現(xiàn),DDX42參與調(diào)控細(xì)胞凋亡的過(guò)程,通過(guò)與TP53BP2相互作用參與細(xì)胞存活,可以抵消TP53BP2的凋亡刺激活性。沒(méi)有白細(xì)胞介素(IL)-3的誘導(dǎo)會(huì)引起細(xì)胞凋亡,過(guò)表達(dá)DDX42可以保護(hù)Ba/F3細(xì)胞免受這種影響,過(guò)表達(dá)DDX42通過(guò)影響IL-3誘導(dǎo)細(xì)胞骨架重排來(lái)調(diào)節(jié)細(xì)胞極化〔16〕。U2AF2可以負(fù)性調(diào)控蛋白泛素化。U2AF2在原發(fā)性非小細(xì)胞肺癌組織中也顯著上調(diào),并且與腫瘤轉(zhuǎn)移,晚期腫瘤分期,腫瘤患者不良預(yù)后和復(fù)發(fā)顯著相關(guān)〔17〕。而且癌癥相關(guān)突變與U2AF2剪接因子的功能密切關(guān)聯(lián)〔18〕。U2AF2介導(dǎo)的CD44亞型會(huì)導(dǎo)致體外黑素瘤遷移,體內(nèi)黑色素瘤轉(zhuǎn)移至肺和肝〔19〕。SNRPD3、SNRPB參與蛋白質(zhì)甲基化作用〔20〕。SNRPB在非小細(xì)胞肺癌中的表達(dá)異常,并且與非小細(xì)胞肺癌不良預(yù)后相關(guān)。在小鼠前列腺癌移植模型中,SNRPB被鑒定為轉(zhuǎn)移抑制基因〔21〕。敲除SNRPB改變了與膠質(zhì)母細(xì)胞瘤發(fā)展相關(guān)的關(guān)鍵基因/途徑〔受體酪氨酸激酶(RTK),磷脂酰肌醇3-激酶(PI3K),絲裂原活化蛋白激酶(MAPK),轉(zhuǎn)化(RAS),絲氨酪/蘇氨酸激酶(AKT),成視網(wǎng)膜細(xì)胞瘤(RB),p53〕〔22〕。SNRPA1參與IL-12介導(dǎo)的信號(hào)通路。SNPRA1是一種剪接體組分,負(fù)責(zé)將前mRNA加工成mRNA,對(duì)男性生育至關(guān)重要。SNRPA1與TCF7L2(Wnt信號(hào)通路的轉(zhuǎn)錄因子)與rs386772267的等位基因結(jié)合,增加胰腺癌患病風(fēng)險(xiǎn)。SNRPA1對(duì)腎癌和卵巢癌的預(yù)后不良〔23〕。SNRPA1影響結(jié)直腸癌細(xì)胞周期,增殖和遷移。SF3B1積極調(diào)控基因表達(dá),參與表觀遺傳作用,SF3B1在鼻竇黑色素瘤中出現(xiàn)7%的突變,是鼻竇黑色素瘤潛在的致癌因子〔24〕。
綜上所述,通過(guò)GSE64634基因芯片篩查出的DDX42、U2AF2、SNRPB、SNRPA1,SF3B1等5個(gè)基因在多種腫瘤中表達(dá)異常,并已明確在某些特定腫瘤的發(fā)生發(fā)展中扮演著重要的角色。這5個(gè)基因位于NPC DEGs構(gòu)成的表達(dá)譜網(wǎng)絡(luò)中的關(guān)鍵節(jié)點(diǎn)位置,可作為NPC發(fā)生過(guò)程中的關(guān)鍵Hub基因,為進(jìn)一步研究NPC發(fā)生發(fā)展的分子機(jī)制及分子標(biāo)志物的篩選提供指導(dǎo)。