王婷婷,溫凌杜,王子弘,李孔亮,古妍琪,楊宏宇
(1.北京大學(xué)深圳醫(yī)院口腔醫(yī)學(xué)中心,廣東 深圳 518000;2.深圳市寶安婦幼保健院口腔科,廣東 深圳 518000;3.南方醫(yī)科大學(xué)公衛(wèi)學(xué)院,廣東 廣州 510000)
口腔鱗狀細(xì)胞癌(oral squamous cell carcinoma,OSCC)是口腔頜面部最常見的癌癥之一,每年影響約超過40 萬人[1]。盡管近幾十年來診斷和治療方法不斷更新,但由于OSCC 具有高復(fù)發(fā)率和高頸部淋巴結(jié)轉(zhuǎn)移的風(fēng)險(xiǎn),導(dǎo)致OSCC 的預(yù)后并沒有明顯改善,5 年總生存率仍為45%~50%[2]。因此,有必要進(jìn)一步闡明OSCC 的發(fā)病機(jī)制,以挖掘潛在的生物標(biāo)志物以改善預(yù)后。DNA 甲基化是表觀遺傳修飾的重要表現(xiàn)形式,可影響血管生成、細(xì)胞周期的調(diào)控或DNA 損傷修復(fù)等多個方面[3],而異常的DNA 甲基化與腫瘤發(fā)病機(jī)制和癌癥患者的生存率顯著相關(guān)[4]。因此,本研究應(yīng)用生物信息學(xué)方法分析OSCC 樣本的DNA 甲基化高通量微陣列信息,并分別進(jìn)行基因本體論(gene ontology,GO)和京都基因和基因組百科全書(kyotoencyclopedia of genes and genomes,KEGG)通路富集分析、蛋白質(zhì)-蛋白質(zhì)相互作用(protein-protein interaction,PPI) 網(wǎng)絡(luò)和Cytoscape軟件的MCODE 模塊分析以及生存分析,以期鑒定出OSCC 差異甲基化區(qū)域(differentially Methylated Region,DMR)中與預(yù)后相關(guān)的關(guān)鍵基因,并初步探究其在OSCC 中的作用機(jī)制,現(xiàn)報(bào)道如下。
1.1 數(shù)據(jù)下載與整理 在GEO 數(shù)據(jù)庫中以“Methylation,450k,OSCC”為檢索條件,篩選并下載DNA 甲基化分析數(shù)據(jù)集GSE87053,平臺信息為GPL13534 IlluminaHumanMethylation450 BeadChip (Human-Methylation450_15017482),共包含21 個樣本,其中正常樣本10 例,OSCC 樣本11 例。
1.2 數(shù)據(jù)處理與DMRs 的篩選 應(yīng)用R 軟件(V 3.6.1)minfi、impute、wateRmelon、IlluminaHumanMethylation450kmanifest、IlluminaHumanMethylation450kanno.ilmn12.hg19 和cluster 包對數(shù)據(jù)行歸一化處理及質(zhì)控,進(jìn)一步以qvalue <0.05 作為具有統(tǒng)計(jì)學(xué)差異的閾值篩選出差異甲基化位點(diǎn)(differentially methylated position,DMP),最后以“cutoff=0.2,B=100,type=Beta”為設(shè)置條件,以fwer<0.05 作為具有統(tǒng)計(jì)學(xué)差異的閾值,將DMPs 聚類以得出DMRs。
1.3 DMRs 的基因注釋 將DMRs 數(shù)據(jù)提交至wANNOVAR,以注釋出DMRs 中所包含的基因。
1.4 GO 與KEGG 通路富集分析 為明確DMRs 中所包含基因的生物學(xué)特性,通過DAVID 數(shù)據(jù)庫行GO和KEGG 通路富集分析,其中GO 富集分析包括細(xì)胞組分(cellular component,CC)、分子功能(molecular function,MF) 和生物過程(biological process,BP)。結(jié)果均以Pvalue<0.05 為有統(tǒng)計(jì)學(xué)差異。
1.5 PPI 網(wǎng)絡(luò)的構(gòu)建與關(guān)鍵基因的鑒定 為在蛋白質(zhì)水平上進(jìn)一步探索DMRs 中所包含基因間的關(guān)聯(lián),將DMRs 中所包含的基因映射到STRING 數(shù)據(jù)庫中,并同時(shí)去除無關(guān)聯(lián)基因以及將interaction score≥0.4 作為閾值,來評估這些基因間的相互作用關(guān)系。進(jìn)一步應(yīng)用Cytoscape 軟件(V 3.6.1)中的MCODE(V 1.6.1)模塊,以“degree cutoff=2,max.Depth=100,k-core=2,node score cutoff=0.2”為設(shè)置條件,對PPI 網(wǎng)絡(luò)進(jìn)行聚類以發(fā)現(xiàn)密集的連接區(qū)域,并鑒定出PPI 網(wǎng)絡(luò)中的關(guān)鍵基因。
1.6 OSCC 關(guān)鍵基因的預(yù)后相關(guān)性分析 通過GEPIA數(shù)據(jù)庫行OSCC 關(guān)鍵基因的Kaplan-Meier 分析,明確關(guān)鍵基因表達(dá)與OSCC 患者總生存期(overall survival,OS)的相關(guān)性。以P<0.05 為差異有統(tǒng)計(jì)學(xué)意義。
2.1 DMPs 與DMRs 的篩選 由圖1 可見,GSE87053數(shù)據(jù)集經(jīng)過R 軟件minfi、impute 等包處理后Beta中位值位于同一水平,并篩選出cg05068636、cg17477990 和 cg13260377 等 93 650 個 DMPs(qvalue <0.05),見表1;聚類得出chr6(start 31696223~end 31696729)、chr2(start 54086854~end 54087343)和chr1(start 25257624~end 25258146)等168 個DMRs(fwer<0.05)見表2。
表1 差異甲基化位點(diǎn)前10 位
表2 差異甲基化區(qū)域前10 位
圖1 數(shù)據(jù)歸一化處理及質(zhì)控
2.2 DMRs 的基因注釋 將168 個DMRs 數(shù)據(jù)提交至wANNOVAR 工具中,共注釋得到194 個基因信息,見表3。
表3 其中10 位差異甲基化區(qū)域的基因注釋
2.3 GO 與KEGG 通路富集分析 為闡明DMRs 中包含的194 個基因的生物學(xué)特性,通過DAVID 數(shù)據(jù)庫行GO 與KEGG 通路富集分析。GO 分析結(jié)果表明(P<0.05),BP 的變化在轉(zhuǎn)錄、DNA 模板化和RNA 聚合酶Ⅱ啟動子轉(zhuǎn)錄的正負(fù)調(diào)控等條目顯著富集;MF 的變化主要集中在轉(zhuǎn)錄因子活性、序列特異性DNA 結(jié)合和氨基酸跨膜轉(zhuǎn)運(yùn)蛋白活性等條目;CC 的變化主要集中在轉(zhuǎn)錄抑制復(fù)合物和樹突。KEGG 通路富集分析結(jié)果表明(P<0.05),主要富集于癌癥通路、慢性粒細(xì)胞白血病、胰島素信號通路和Notch 信號通路,見圖2。
圖2 差異甲基化區(qū)域基因的GO 和KEGG 通路富集分析
2.4 PPI 網(wǎng)絡(luò)分析與關(guān)鍵基因的鑒定 DMRs 中包含的194 個基因的PPI 網(wǎng)絡(luò)在去除無關(guān)聯(lián)基因后,共由56 個節(jié)點(diǎn)和53 條邊緣組成(interaction score≥0.4),見圖3A。通過Cytoscape 軟件的MCODE 模塊聚類出具有高度連通性的連接區(qū)域(degree cutoff=2,max.Depth=100,k-core=2,node score cutoff=0.2),見圖3B,可見CTBP1、RUNX1、NCOR2、CTBP2 和HDAC4 可作為OSCC 的關(guān)鍵基因,可能在OSCC 患者的DNA 甲基化中起重要作用。
圖3 差異甲基化區(qū)域基因的PPI 網(wǎng)絡(luò)
2.5 OSCC 關(guān)鍵基因的預(yù)后相關(guān)性 通過GEPIA 數(shù)據(jù)庫行關(guān)鍵基因的Kaplan-Meier 分析,明確CTBP1、RUNX1、NCOR2、CTBP2 和HDAC4 的表達(dá)與OSCC 患者預(yù)后間的關(guān)系。結(jié)果顯示,CTBP1 和HDAC4 與OSCC 患者的OS 相關(guān)(P<0.05),見圖4。
圖4 OSCC 關(guān)鍵基因的預(yù)后分析
既往研究已發(fā)現(xiàn)多種類型的表觀遺傳修飾,包括DNA 甲基化、組蛋白修飾和染色質(zhì)重塑等,其中DNA 甲基化可通過調(diào)節(jié)細(xì)胞中基因的表達(dá)影響細(xì)胞增殖、細(xì)胞周期和細(xì)胞分化等多種生物學(xué)過程[5]??梢?,DNA 甲基化的失調(diào)可能會導(dǎo)致腫瘤抑制因子的沉默或癌基因的表達(dá),進(jìn)而導(dǎo)致腫瘤的發(fā)生和發(fā)展[6]。近年來,學(xué)者們已開始通過DNA 甲基化來不斷闡明OSCC 的發(fā)病機(jī)制,以尋找潛在的生物標(biāo)志物。在OSCC 中已證明,LATS1 和LATS2 的甲基化失調(diào)可影響細(xì)胞周期的調(diào)控以及DDR 信號的傳導(dǎo)[7],PAX1 和ZNF582 的高甲基化狀態(tài)與腫瘤細(xì)胞的侵襲性進(jìn)展相關(guān)[8]。但目前的研究尚缺乏使用數(shù)據(jù)分析來篩選和鑒定用于預(yù)測OSCC 預(yù)后的生物標(biāo)志物。因此,本研究擬通過生物信息學(xué)方法分析GEO數(shù)據(jù)庫中OSCC 患者的高通量微陣列芯片測序信息,以期鑒定出參與OSCC 表觀遺傳調(diào)控的潛在關(guān)鍵基因,并明確其在預(yù)后評估中的臨床價(jià)值。
本研究首先基于GEO 數(shù)據(jù)庫中的DNA 甲基化微陣列數(shù)據(jù)集GSE87053,分析了11 例OSCC 樣本和10 例正常樣本的DNA 甲基化信息,篩選出93 650 個DMPs 和168 個DMRs,通過基因注釋發(fā)現(xiàn)DMRs 中 的 DDAH2、GPR75 -ASB3、RUNX3 和SLC7A5 等194 個的基因。GO 和KEGG 通路富集分析結(jié)果發(fā)現(xiàn),這些基因可影響轉(zhuǎn)錄因子及其活性并參與癌癥和Notch 信號通路的調(diào)節(jié),并且已有研究表明Notch 信號可通過誘導(dǎo)上皮間質(zhì)轉(zhuǎn)化(epithelial-mesenchymal transition,EMT)從而促進(jìn)OSCC 的轉(zhuǎn)移[9]??梢姡@些基因的生物學(xué)特性與OSCC 的發(fā)病機(jī)制密切相關(guān)。進(jìn)一步PPI 網(wǎng)絡(luò)分析顯示了基因之間的功能連通性,其中CTBP1、RUNX1、NCOR2、CTBP2 和HDAC4 可作為基于DMRs 分析的OSCC關(guān)鍵基因,但在最后的預(yù)后分析中只有CTBP1 和HDAC4 顯示出與患者OS 的相關(guān)性。
羧基末端結(jié)合蛋白1(C-terminal binding protein1,CTBP1)是轉(zhuǎn)錄共阻遏蛋白CTBP 的家族成員之一,可在煙酰胺腺嘌呤二核苷酸的存在下形成同源二聚體或異源二聚體,通過將HDAC、LSD1 和G9a 等表觀遺傳修飾酶募集到靶基因特定的啟動子或增強(qiáng)子區(qū)域,以在致癌機(jī)制中發(fā)揮調(diào)控細(xì)胞遷移、細(xì)胞侵襲和EMT 等不同功能[10]。在胃癌中,CTBP1作為miR-539-3P 的直接靶標(biāo),其高表達(dá)可通過促進(jìn)EMT 和調(diào)控腫瘤細(xì)胞的增殖和侵襲以加速疾病進(jìn)展[11]。在乳腺癌中,高表達(dá)的CTBP1 還被證明可通過激活RAD51 的轉(zhuǎn)錄從而增加腫瘤細(xì)胞對順鉑的抗性[12]。但值得注意的是,在肺腺癌中過表達(dá)的CTBP1 與較差的總體存活率密切相關(guān)[13]。這與本研究基于GEPIA 數(shù)據(jù)庫研究發(fā)現(xiàn)OSCC 中高表達(dá)的CTBP1 與較長的OS 相關(guān)相悖,考慮到Takayama K等[14]的研究發(fā)現(xiàn)在雄激素受體陽性前列腺癌細(xì)胞中CTBP1 可表現(xiàn)出腫瘤抑制作用,因此,CTBP1 在OSCC 中所扮演的角色仍需進(jìn)一步研究闡明。組蛋白去乙酰化酶4(histone deacetylase 4,HDAC4)為IIa 類組蛋白去乙?;钢唬嬖谟谵D(zhuǎn)錄輔抑制因子復(fù)合物中,可與組蛋白乙酰轉(zhuǎn)移酶(histone acetyltransferases,HAT)控制組蛋白的乙酰化狀態(tài),在染色質(zhì)的維持和功能中發(fā)揮重要作用[15]。在癌癥中HAT 和HDAC4 間的平衡被改變,從而導(dǎo)致對細(xì)胞侵襲、細(xì)胞遷移和細(xì)胞增殖等方面的異常調(diào)節(jié)[16]。如HDAC4 mRNA 和蛋白質(zhì)在食管鱗狀細(xì)胞癌組織和細(xì)胞系中呈高表達(dá),通過抑制細(xì)胞周期蛋白依賴性激酶抑制劑p21 和p27 以及上調(diào)CDK2/4 和CDK依賴性Rb 磷酸化來促進(jìn)腫瘤細(xì)胞的增殖和G1/S細(xì)胞周期進(jìn)程,并與較高的腫瘤分級、晚期臨床分期和較差的生存率相關(guān)[17]。另外在Wang Z 等[18]研究中也發(fā)現(xiàn),HDAC4 蛋白在肝細(xì)胞中過度表達(dá)且與患者的不良生存率有關(guān)。但本研究發(fā)現(xiàn)HDAC4 在5 年生存率上其高表達(dá)組卻表現(xiàn)出更長的OS,與在其他類型腫瘤中的研究結(jié)果相悖,可見其在OSCC 中的調(diào)控機(jī)制仍需進(jìn)研究深入探討。
綜上所述,本研究基于公開的DNA 甲基化數(shù)據(jù)行生物信息學(xué)分析發(fā)現(xiàn),CTBP1 和HDAC4 或可作為OSCC 中潛在臨床靶標(biāo)和預(yù)后生物標(biāo)志物。但尚存在一定的局限性,研究僅基于對全球公開數(shù)據(jù)庫的部分?jǐn)?shù)據(jù)進(jìn)行分析,對于CTBP1 和HDAC4 在結(jié)合國人OSCC 患者數(shù)據(jù)中的表達(dá)以及預(yù)后情況的相關(guān)研究仍為空白區(qū)域,因此有必要進(jìn)一步進(jìn)行體外和體內(nèi)基礎(chǔ)實(shí)驗(yàn),以更好地了解在我國OSCC患者中CTBP1 和HDAC4 的DNA 甲基化改變的影響和潛在機(jī)制,以及通過病例對照研究和前瞻性試驗(yàn)評估驗(yàn)證候選的生物標(biāo)志物,但本研究中的數(shù)據(jù)或可為OSCC 潛在分子標(biāo)志物和靶點(diǎn)的研究提供新的思路。