王力業(yè), 高鶯, , 田淳
1.山西醫(yī)科大學(xué)口腔醫(yī)學(xué)院·口腔醫(yī)院,山西 太原(030001); 2.山西醫(yī)科大學(xué)第一醫(yī)院口腔科,山西 太原(030001)
口腔鱗狀細(xì)胞癌(oral squamous cell carcinoma,OSCC)是常見癌癥類型,約占所有口腔惡性腫瘤的90%[1-2]。在OSCC 治療中的關(guān)鍵是探索新的可靠的分子標(biāo)志物提高癌癥患者的早期診斷,并識別和定位耐藥機制。生物信息學(xué)的發(fā)展使基因表達譜被廣泛應(yīng)用于識別生物標(biāo)志物。通過訪問不同類型的數(shù)據(jù)庫,包括大規(guī)模的臨床信息、基因測序和表達水平,可進行各種類型癌癥的標(biāo)準(zhǔn)化分析[3]。篩選腫瘤組織和正常組織中差異表達基因(differentially expressed genes,DEGs)將有助于進一步闡明OSCC 的發(fā)病機制,并可能為早期診斷和治療提供有希望的生物標(biāo)志物或靶點。影響OSCC預(yù)后的中樞基因尚未完全確定,大多數(shù)研究只針對數(shù)據(jù)庫中的單個基因,關(guān)于聯(lián)合遺傳模型預(yù)測預(yù)后的研究較少。因此,本研究嘗試?yán)寐?lián)合遺傳模型尋找OSCC 預(yù)后的關(guān)鍵基因,為在臨床預(yù)測OSCC 患者預(yù)后提供理論依據(jù)。
從美國國家生物技術(shù)信息中心創(chuàng)建并維護的基因表達數(shù)據(jù)庫(Gene Expression Omnibus,GEO)數(shù)據(jù)庫中獲取OSCC 相關(guān)的三個芯片數(shù)據(jù)GSE23558、GSE37991、GSE30784,其中包括73 例OSCC 和50 例癌旁樣本。數(shù)據(jù)集中均使用人類口腔組織樣本,均包括健康組和對照組。利用GEO 數(shù)據(jù)庫提供的GEO2R 在線工具和維恩在線軟件對芯片數(shù)據(jù)進行差異表達分析,顯著差異表達基因的判定標(biāo)準(zhǔn)為|log(差異倍數(shù))|≥1、P<0.05,并進行可視化。
為了對DEGs 進行全面的注釋,采用R/bioconductor 的“clusterProfiler”程序包進行基因本體論(gene ontology,GO)富集分析和京都基因與基因組百科全書(the kyoto encyclopedia of genes and genomes,KEGG)富集分析。篩選標(biāo)準(zhǔn)是落在單個term 上差異基因,按照富集程度的值進行排列。
DEGs 相互作用使用STRING(http://string-db.org/)在線數(shù)據(jù)庫進行分析。將數(shù)據(jù)導(dǎo)入Cytoscape軟件并繪制網(wǎng)絡(luò)圖,用MCODE 插件對蛋白互作網(wǎng)絡(luò)中的模塊進行檢測,找出蛋白互作網(wǎng)絡(luò)中的集群即高度互連的區(qū)域,找出核心基因。
使用Kaplan Meier-plotter 網(wǎng)站工具評估核心差異基因在頭頸部鱗狀細(xì)胞癌中的總生存率,隨后利用GEPIA(http://gepia.cancer-pku.cn/)網(wǎng)站對與預(yù)后相關(guān)的核心基因進行進一步驗證,P<0.05 為差異有統(tǒng)計學(xué)意義。
通過對三個數(shù)據(jù)集的分析,共篩選出212 差異性基因,與正常組織相比,OSCC 中包括74 個上調(diào)和138 個下調(diào)差異性基因(表1)。
GO 功能注釋顯示DEGs 主要參與了信號轉(zhuǎn)導(dǎo)、細(xì)胞粘附細(xì)胞增殖的正調(diào)控、炎癥反應(yīng)等生物學(xué)過程。DEGs 主要分布于細(xì)胞外來體、胞外區(qū)、蛋白質(zhì)的細(xì)胞外基質(zhì)等,參與到鈣離子結(jié)合、肝素結(jié)合、受體結(jié)合、細(xì)胞因子活性等(圖1)。DEGs 進行KEGG 通路分析,結(jié)果顯示主要富集在癌癥通路、細(xì)胞因子-細(xì)胞因子受體相互作用通路、細(xì)胞外基質(zhì)受體相互作用、精氨酸和脯氨酸代謝、組氨酸 代謝、PPAR 信號通路(圖2)。
表1 口腔鱗狀細(xì)胞癌的差異表達基因Table 1 Venn diagrams of differentially expressed genes of OSCC
Figure 1 Gene ontology enrichment analysis results of differentially expressed genes in OSCC圖1 口腔鱗狀細(xì)胞癌的差異表達基因的基因本體論分析結(jié)果
Figure 2 Differentially expressed genes in OSCC are involved in metabolic pathways圖2 口腔鱗狀細(xì)胞癌的差異表達基因參與的代謝途徑
使用STRING 在線軟件進行分析,得到蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò),將數(shù)據(jù)輸入Cytoscape 軟并獲得蛋白互作網(wǎng)絡(luò)圖,隨后使用MCODE 插件進行模塊化分析(degree cutoff = 2,node score cutoff =0.2,k-core = 2,max= 100)最終獲得16 個核心基因(圖3)。
Figure 3 Constructed protein-protein interaction network of differentially expressed genes in OSCC圖3 口腔鱗狀細(xì)胞癌的差異基因蛋白質(zhì)互作網(wǎng)絡(luò)圖
利用Kaplan-Meier 在線工具分析差異基因的預(yù)后信息,顯示16 個核心基因中有6 個基因高表達,與不良生存率顯著相關(guān)(P<0.05),這6 個基因分別是:極光激酶A(aurora kinase A,AURKA)、極光激酶B(aurora kinase B,AURKB)、細(xì)胞凋亡抑制因子5(baculoviral IAP repeat containing 5,BIRC5)、細(xì)胞分裂周期蛋白6(cell division cycle 6,CDC6)、E2F 轉(zhuǎn)錄因子7(E2F transcription factor 7,E2F7)、泛素樣含PHD 和環(huán)指域蛋白1(ubiquitin-like with PHD and ring finger domains 1,UHRF1)(圖4)。隨后,利用GEPIA 挖掘癌癥組織和正常組織之間6 個基因表達水平。結(jié)果顯示,與正常組織相比,AURKA、AURKB、BIRC5、CDC6、E2F7、UHRF1 等6 個核心基因在癌癥組中均表達較高(P<0.05)(圖5)。
隨著生物信息學(xué)發(fā)展,人們逐漸加深了對OSCC 的認(rèn)知,Zheng 等[4]通過生物信息學(xué)分析OSCC腫瘤組織和相鄰正常組織臨床樣本的微陣列,得到與OSCC 相關(guān)的15 個核心差異基因,并通過定量逆轉(zhuǎn)錄聚合酶鏈反應(yīng)進一步檢測OSCC 腫瘤與非腫瘤之間的關(guān)系。Zhang 等[5]通過生物信息學(xué)分析識別OSCC 中異常甲基化的差異基因,結(jié)果顯示這些基因在調(diào)節(jié)免疫應(yīng)答過程中被富集,主要參與PI3K-AKT 和EMT 通路。本研究整合了來自多個數(shù)據(jù)集芯片數(shù)據(jù)以識別OSCC 中生物標(biāo)志物,與單一數(shù)據(jù)集分析進行比較結(jié)果相對準(zhǔn)確可靠。
Figure 4 The prognostic information of the core genes in OSCC圖4 口腔鱗狀細(xì)胞癌核心基因的預(yù)后信息
Figure 5 Validation of the expression levels of critical genes in OSCC圖5 驗證口腔鱗狀細(xì)胞癌核心基因表達水平
本研究使用GEO 數(shù)據(jù)庫下載了三個基因芯片用于OSCC 的生物信息學(xué)分析與整合最終獲取16個核心基因,其中與口腔癌患者生存率密切相關(guān)的候選基因有6個:AURKA、AURKB、BIRC5、CDC6、E2F7、UHRF1。對以上基因進行文獻檢索,證實上述基因與OSCC 的發(fā)生、轉(zhuǎn)移及預(yù)后密切相關(guān)。BIRC5、UHRF1 主要參與細(xì)胞凋亡的抑制。BIRC5被認(rèn)為是迄今發(fā)現(xiàn)最強的凋亡抑制因子[6]。BIRC5 編碼的蛋白Survivin 可以直接抑制末端效應(yīng)酶caspase-3 和caspase-7 的活性,抵抗特定刺激引起的細(xì)胞凋亡,還可以與細(xì)胞周期蛋白依賴性激酶CDK-4 和CDK-2 相互作用抑制凋亡信號通路[7]。Troiano 等[8]對OSCC 和正??谇火つみM行生物信息學(xué)和組織學(xué)的綜合分析,發(fā)現(xiàn)Survivin 蛋白在腫瘤組織中呈高表達,與腫瘤細(xì)胞較高的增殖率以及較差的預(yù)后密切相關(guān)。UHRF1 是泛素樣含PHD 和環(huán)指域蛋白家族的主要成員之一,能夠調(diào)節(jié)DNA 甲基化和組蛋白修飾之間的相互連接,是重要的表觀遺傳學(xué)調(diào)控因子。Polepalli 等[9]研究認(rèn)為UHRF1 通過抑癌基因啟動子高甲基化,沉默抑癌基因的轉(zhuǎn)錄,從而抑制其凋亡,參與腫瘤的侵襲及轉(zhuǎn)移。UHRF1 基因的敲除可降低壞死受體相互作用激酶-3 的關(guān)鍵調(diào)節(jié)因子啟動子的甲基化水平,導(dǎo)致壞死受體相互作用激酶-3 表達增加,從而導(dǎo)致腫瘤生長下降,其潛在的分子機制有助于開發(fā)腫瘤治療藥物[10]。Baroudi 等[11]發(fā)現(xiàn)頭頸部鱗狀細(xì)胞癌中UHRF1 的過表達與腫瘤侵襲性相關(guān),不僅有助于評估患者預(yù)后,還具有對患者進行臨床分期的診斷價值。
AURKA、AURKB、CDC6、E2F7 與細(xì)胞有絲分裂密切相關(guān)。Guo 等[12]采用RNA 干擾技術(shù)靶向抑制E2F7 在腫瘤中的表達進而發(fā)揮抑癌作用,該實驗同時還發(fā)現(xiàn)在TF-target 調(diào)控網(wǎng)絡(luò)中,E2F7 可以調(diào)控CDC6 基因表達。E2F7 過表達不僅與癌癥預(yù)后相關(guān),還會引起頭頸部鱗狀細(xì)胞癌治療中蒽環(huán)類藥物的耐藥性。Hazar-Rethinam 等[13]證明E2F7定位錯誤引起RacGAPI 和Sphk1/S1P 表達下調(diào),該網(wǎng)絡(luò)與耐藥性直接相關(guān),并且觀察到E2F7 可能是通過AURKB 作用于RacGAPI 從而激發(fā)耐藥。Saen-Ponce 等[14]進一步研究發(fā)現(xiàn),E2F7 從細(xì)胞核輸出后錯誤定位于細(xì)胞質(zhì)中是通過病理激活XPO1 途徑所致,并且在頭頸部鱗狀細(xì)胞癌異種移植模型中使用XPO1 抑制劑實現(xiàn)了對蒽環(huán)類藥物耐藥性的逆轉(zhuǎn),逆轉(zhuǎn)E2F7 核輸出可能為頭頸部鱗狀細(xì)胞癌的治療及提高生存率提供機會。CDC6 是DNA 復(fù)制必不可少的蛋白,其與其他調(diào)節(jié)蛋白結(jié)合形成“復(fù)制前復(fù)合體”,與腫瘤發(fā)生發(fā)展密切相關(guān),同樣可以促進細(xì)胞的惡性轉(zhuǎn)化[15]。Feng 等[16]使用RTPCR 及免疫組化檢測發(fā)現(xiàn)CDC6 的mRNA 和蛋白在正??谇火つぶ械捅磉_,在癌前病變和OSCC 中呈高表達。研究發(fā)現(xiàn)OSCC 淋巴結(jié)轉(zhuǎn)移患者中CDC6表達明顯高于非轉(zhuǎn)移性癌,為了進一步證實與舌鱗癌細(xì)胞的關(guān)系,該研究者敲除CDC6 的基因后發(fā)現(xiàn)舌鱗癌Tca8113 細(xì)胞的增殖、遷移受到了明顯的抑制[17]。AURKA、AURKB 均屬于有絲分裂絲氨酸/蘇氨酸激酶家族,AURKA 參與維持細(xì)胞中心粒和染色體的精確分離過程,AURKB 主要參與細(xì)胞從G2期到M 期的分裂,二者的過度表達均與腫瘤不良預(yù)后相關(guān)。Huang 等[18]發(fā)現(xiàn)AURKA 基因多態(tài)性表達水平和吸煙聯(lián)合檢測可以作為OSCC 診斷和預(yù)后的重要分子標(biāo)志物,吸煙伴AURKA 基因高表達者患口腔癌風(fēng)險顯著增加,對篩選口腔癌高危人群有一定參考價值。Yang 等[19]證明AURKA的抑制劑MLN8237 一方面可以通過抑制AURKA在Thr288 的自磷酸化,導(dǎo)致細(xì)胞不能正常分裂,另一方面誘導(dǎo)細(xì)胞周期在G2/M 期停止細(xì)胞出現(xiàn)衰老,從而抑制腫瘤細(xì)胞的生長。已有學(xué)者觀察到在頭頸部腫瘤中AURKB 的高表達與細(xì)胞增殖和淋 巴 結(jié) 轉(zhuǎn) 移 相 關(guān)[20]。Bertran-Alamillo 等[21]使 用AURKB 抑制劑處理可降低pH3 水平,從而觸發(fā)G1/S 阻滯和多倍體化,在生長停滯和多倍體化之后,抑制AURKB 會引發(fā)不同類型腫瘤細(xì)胞的衰老或死亡。Togar 等[22]對OSCC 細(xì)胞的基因進行了篩選并評級,最后識別出AURKB 對OSCC 細(xì)胞增殖至關(guān)重要,進一步實驗中對AURKB 進行藥理抑制發(fā)現(xiàn)抑制癌癥細(xì)胞增殖。Boeckx 等[23]比較西妥昔單抗敏感細(xì)胞和耐藥頭頸部鱗狀細(xì)胞癌細(xì)胞系的全基因組mRNA 表達,發(fā)現(xiàn)高表達的AURKB 通過RAS-MARK 信號通路作用導(dǎo)致耐藥性的發(fā)生,因此使用AURKB 抑制劑阻斷該通路可能是在治療中克服西妥昔單抗耐藥性的新策略。AURKA、AURKB是癌癥治療中另一重要靶點。
綜上所述,本研究利用生物信息學(xué)工具分析了OSCC 組織和相鄰正常組織的基因表達差異,找出與腫瘤相關(guān)的核心基因,并對這些關(guān)鍵基因參與癌癥的發(fā)生、發(fā)展和預(yù)后的關(guān)系進行挖掘。但一些基因在OSCC 中的功能及其分子機制有待進一步研究,同樣需要用大量獨立樣本集對這些標(biāo)志物進行驗證。