席奕軼 施新澤 林 霖 郭文佳 劉天媛 王雨芊 林東昕 吳 晨
食管癌(esophageal cancer, EC)是原發(fā)于食管黏膜上皮的惡性腫瘤,其發(fā)生率位居惡性腫瘤第6位,在全球腫瘤相關(guān)死亡中位居第8位[1]。食管癌的組織類型主要包括鱗癌和腺癌兩種,其中食管鱗狀細(xì)胞癌(esophageal squamous cell carcinoma, ESCC)占全球食管癌病例的80%,尤其是中國,占比高達(dá)90%~95%,提示食管鱗癌相關(guān)研究的重要性[2~4]。
癌癥的發(fā)生、發(fā)展往往涉及基因變異、基因表達(dá)異常、表觀調(diào)控異常等多個(gè)層次的復(fù)雜調(diào)控機(jī)制。近年來,大規(guī)模測(cè)序研究已經(jīng)在人類癌癥中發(fā)現(xiàn)多個(gè)腫瘤驅(qū)動(dòng)基因。一項(xiàng)整合TCGA基因突變、甲基化譜和表達(dá)譜數(shù)據(jù)的泛癌分析研究揭示了腫瘤驅(qū)動(dòng)基因在表觀基因組中重要的調(diào)控作用[5]。研究者通過整合704例食管鱗癌全基因組或外顯子組測(cè)序數(shù)據(jù),鑒定了TP53、NOTCH1、MLL2、FAT1、NFE2L2、PIK3CA和EP300等20個(gè)驅(qū)動(dòng)基因,其中93%(657/704)的患者存在至少一個(gè)驅(qū)動(dòng)基因的體細(xì)胞突變[6~14]。然而尚未有研究系統(tǒng)探究驅(qū)動(dòng)基因的體細(xì)胞突變、拷貝數(shù)改變、基因表達(dá)和甲基化等多組學(xué)數(shù)據(jù),以及20個(gè)驅(qū)動(dòng)基因中各個(gè)分子層面數(shù)據(jù)間的調(diào)控關(guān)系。本研究整合了食管鱗癌驅(qū)動(dòng)基因的拷貝數(shù)變異信息、DNA甲基化和基因表達(dá)數(shù)據(jù),分別進(jìn)行突變與基因表達(dá)、拷貝數(shù)與基因表達(dá)和甲基化與基因表達(dá)的關(guān)聯(lián)分析,并結(jié)合患者的臨床資料進(jìn)行生存分析,系統(tǒng)闡述了20個(gè)驅(qū)動(dòng)基因在不同層面組學(xué)數(shù)據(jù)間的交互作用與潛在調(diào)控關(guān)系,為進(jìn)一步闡明驅(qū)動(dòng)基因在食管鱗癌發(fā)生、發(fā)展中的作用機(jī)制提供了思路。
1.研究對(duì)象:本研究所使用的91例食管鱗狀細(xì)胞癌患者的組織樣本均來自2010年~2014年在中國醫(yī)學(xué)科學(xué)院腫瘤醫(yī)院及浙江省腫瘤醫(yī)院接受手術(shù)治療的患者。所有患者未經(jīng)過放射治療或化學(xué)藥物治療,以組織病理學(xué)診斷為最終判斷依據(jù)?;颊叩娜颗R床信息及生存時(shí)間來自病歷記錄及定期隨訪。所有患者均簽署了知情同意書。本研究通過了中國醫(yī)學(xué)科學(xué)院腫瘤醫(yī)院及浙江省腫瘤醫(yī)院倫理學(xué)審查委員會(huì)的批準(zhǔn)。
2.數(shù)據(jù)來源:患者體細(xì)胞突變、拷貝數(shù)改變及基因表達(dá)數(shù)據(jù)來自本組前期研究[14]。DNA甲基化數(shù)據(jù)通過Illumina 450K甲基化芯片檢測(cè)獲取。另外,利用TCGA 數(shù)據(jù)庫(https://tcga-data.nci.nih.gov/docs/publications/tcga/)下載了95例食管鱗癌患者的體細(xì)胞突變、拷貝數(shù)改變、Illumina 450K甲基化芯片和轉(zhuǎn)錄組數(shù)據(jù)及相關(guān)臨床資料。Illumina 450K芯片的探針注釋文件來自ENCODE (http://genome.ucsc.edu/ENCODE/downloads. html)。
3. 數(shù)據(jù)分析:體細(xì)胞突變與驅(qū)動(dòng)基因表達(dá)水平的比較分析,根據(jù)某個(gè)驅(qū)動(dòng)基因在人群中是否存在突變,將患者分為突變組和非突變組,并分析20個(gè)驅(qū)動(dòng)基因的表達(dá)水平在兩組間的差異。表達(dá)差異倍數(shù)(fold change, FC)定義為突變組的表達(dá)水平比非突變組的表達(dá)水平??截悢?shù)改變與驅(qū)動(dòng)基因表達(dá)水平的關(guān)聯(lián)分析,通過Spearman秩相關(guān)分析鑒別驅(qū)動(dòng)基因拷貝數(shù)改變與基因表達(dá)水平之間的關(guān)聯(lián),當(dāng)Spearman相關(guān)系數(shù) |r|>0.3 時(shí)認(rèn)為存在相關(guān)。DNA甲基化與驅(qū)動(dòng)基因表達(dá)水平的關(guān)聯(lián)分析,通過Spearman秩相關(guān)分析,鑒別基因上甲基化位點(diǎn)的甲基化水平與基因表達(dá)之間的關(guān)聯(lián)。若甲基化位點(diǎn)位于啟動(dòng)子區(qū)域,且Spearman相關(guān)系數(shù)r<-0.3時(shí)認(rèn)為存在相關(guān);若甲基化位點(diǎn)位于基因體區(qū)域,且Spearman相關(guān)系數(shù)r>0.3時(shí)認(rèn)為存在相關(guān)。
4.統(tǒng)計(jì)學(xué)方法:應(yīng)用R軟件(3.5.1版)對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。體細(xì)胞突變與驅(qū)動(dòng)基因表達(dá)水平的關(guān)聯(lián)分析采用非配對(duì)t檢驗(yàn)??截悢?shù)改變、DNA甲基化與驅(qū)動(dòng)基因表達(dá)水平的關(guān)聯(lián)分析采用Spearman秩相關(guān)。采用KaplanMeier法繪制生存曲線,通過Log-Rank檢驗(yàn)進(jìn)行生存曲線的比較,以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
1.體細(xì)胞突變與驅(qū)動(dòng)基因表達(dá)水平的關(guān)聯(lián)分析:根據(jù)各個(gè)驅(qū)動(dòng)基因突變與否將患者分為突變組與非突變組,并對(duì)兩組患者基因表達(dá)水平進(jìn)行比較。結(jié)果顯示,CDKN2A突變組患者表達(dá)水平顯著高于非突變組(FC=7.73,P=0.002),而RB1突變組患者表達(dá)水平則顯著低于非突變組(FC=0.46,P=0.002)。另外,TCGA數(shù)據(jù)分析結(jié)果顯示,TP53(FC=1.70,P=0.018)和ZNF750(FC=2.31,P=0.026)突變組患者表達(dá)水平均顯著高于非突變組。最后,將兩部分?jǐn)?shù)據(jù)合并后進(jìn)行分析,TP53(FC=1.43,P=0.011, 圖1A)、RB1(FC=0.44,P=0.045, 圖1B)和ZNF750(FC=2.20,P=0.012, 圖1C)的表達(dá)差異有統(tǒng)計(jì)學(xué)意義,同時(shí)還發(fā)現(xiàn)PTCH1(FC=2.62,P=0.011, 圖1D)突變組表達(dá)顯著高于非突變組。
圖1 驅(qū)動(dòng)基因突變組與非突變組中基因表達(dá)水平*P<0.05
2.拷貝數(shù)改變與驅(qū)動(dòng)基因表達(dá)水平的關(guān)聯(lián)分析:對(duì)20個(gè)驅(qū)動(dòng)基因的拷貝數(shù)和表達(dá)水平進(jìn)行關(guān)聯(lián)分析,以鑒別拷貝數(shù)變異與驅(qū)動(dòng)基因轉(zhuǎn)錄水平的相關(guān)程度。10個(gè)驅(qū)動(dòng)基因的表達(dá)水平與其拷貝數(shù)改變呈顯著正相關(guān)(r>0.3,P<0.05),其中PTEN、CUL3、PIK3CA和FAT1的相關(guān)系數(shù)明顯高于其他基因(r>0.5)。在TCGA數(shù)據(jù)中進(jìn)行關(guān)聯(lián)分析,結(jié)果顯示大部分驅(qū)動(dòng)基因(n=14,表1)的表達(dá)水平與其拷貝數(shù)呈正相關(guān)(r>0.3,P<0.05),其中5個(gè)驅(qū)動(dòng)基因(CDKN2A、PIK3CA、FBXW7、CUL3、RBPJ)的相關(guān)系數(shù)明顯高于其他基因(r>0.5)。8個(gè)驅(qū)動(dòng)基因的表達(dá)水平在兩部分?jǐn)?shù)據(jù)中均與拷貝數(shù)改變呈顯著正相關(guān)。
表1 拷貝數(shù)改變與表達(dá)水平呈顯著正相關(guān)的驅(qū)動(dòng)基因
3.DNA甲基化與驅(qū)動(dòng)基因表達(dá)水平的關(guān)聯(lián)分析:共發(fā)現(xiàn)11個(gè)驅(qū)動(dòng)基因表達(dá)與其啟動(dòng)子區(qū)甲基化呈負(fù)相關(guān)(r<-0.3,P<0.05),6個(gè)驅(qū)動(dòng)基因表達(dá)與基因體甲基化呈正相關(guān)(r>0.3,P<0.05,表1)。CDKN2A、FBXW7、CUL3、FAT1和PTCH1的表達(dá)同時(shí)受到啟動(dòng)子和基因體甲基化的協(xié)同調(diào)節(jié)。另外,與本研究結(jié)果不同,TCGA數(shù)據(jù)分析結(jié)果顯示KDM6A、NOTCH3和RBPJ的基因表達(dá)受到啟動(dòng)子和基因體甲基化的共同調(diào)控(表1)。這些結(jié)果揭示了啟動(dòng)子和基因體甲基化在食管鱗癌驅(qū)動(dòng)基因轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)中可能存在協(xié)同作用。
4.驅(qū)動(dòng)基因相關(guān)生存分析:兩組患者Kaplan-Meier生存曲線比較,CREBBP突變組患者的生存時(shí)間顯著短于非突變組患者(P=0.029),中位生存時(shí)間分別為11和19個(gè)月。TCGA數(shù)據(jù)中驅(qū)動(dòng)基因生存分析的結(jié)果顯示,CREBBP突變組患者的生存時(shí)間同樣較短(中位生存時(shí)間為9和29個(gè)月,P=0.000),并且FAT1突變組患者生存情況明顯較差(中位生存時(shí)間為12和29個(gè)月,P=0.005)。為了進(jìn)一步驗(yàn)證上述結(jié)果,筆者將兩部分?jǐn)?shù)據(jù)合并進(jìn)行生存分析,結(jié)果同樣發(fā)現(xiàn)CREBBP(中位生存時(shí)間為10和25個(gè)月,P=0.000,圖2)和FAT1(中位生存時(shí)間為14和26個(gè)月,P=0.002,圖3)突變組患者的生存情況較差。
圖2 CREBBP突變組與非突變組患者生存曲線比較
圖3 FAT1突變組與非突變組患者生存曲線比較
本研究利用本組和TCGA的多組學(xué)數(shù)據(jù),將食管鱗癌驅(qū)動(dòng)基因的體細(xì)胞突變、拷貝數(shù)改變、基因表達(dá)和DNA甲基化等多個(gè)分子層面的數(shù)據(jù)整合起來進(jìn)行關(guān)聯(lián)分析。通過體細(xì)胞突變與驅(qū)動(dòng)基因表達(dá)的關(guān)聯(lián)分析,結(jié)果顯示TP53、RB1、ZNF750和PTCH1的表達(dá)水平在兩組間比較差異有統(tǒng)計(jì)學(xué)意義。為了探究食管鱗癌發(fā)生、發(fā)展過程中的異常甲基化改變對(duì)驅(qū)動(dòng)基因轉(zhuǎn)錄調(diào)控的影響,筆者對(duì)單個(gè)位點(diǎn)甲基化與對(duì)應(yīng)驅(qū)動(dòng)基因表達(dá)水平進(jìn)行關(guān)聯(lián)分析??紤]到不同區(qū)域DNA甲基化調(diào)控基因表達(dá)的差異,筆者分別針對(duì)啟動(dòng)子區(qū)域和基因體區(qū)域的關(guān)聯(lián)進(jìn)行篩選[15-17]。ZNF750是一種譜系特異的轉(zhuǎn)錄因子,與其他轉(zhuǎn)錄因子共同參與鱗狀細(xì)胞分化的調(diào)控[18, 19]。這一結(jié)果提示驅(qū)動(dòng)基因突變不僅可以通過影響編碼蛋白的功能參與異常信號(hào)網(wǎng)路的調(diào)控,而且可能通過調(diào)節(jié)其轉(zhuǎn)錄參與食管鱗癌的發(fā)生、發(fā)展。
通過拷貝數(shù)改變與基因表達(dá)的關(guān)聯(lián)分析中8個(gè)驅(qū)動(dòng)基因的表達(dá)水平均與其拷貝數(shù)改變呈顯著正相關(guān),并在兩組數(shù)據(jù)中比較差異均有統(tǒng)計(jì)學(xué)意義,其中CUL3和RBPJ的敲降可以顯著增加食管鱗癌細(xì)胞的增殖和遷移等[14]。FAT1和MLL2的拷貝數(shù)僅在本研究數(shù)據(jù)中與表達(dá)呈正相關(guān),而NFE2L2等6個(gè)驅(qū)動(dòng)基因表達(dá)水平僅在TCGA數(shù)據(jù)中與其拷貝數(shù)呈顯著正相關(guān)。NFE2L2是抗氧化信號(hào)通路的重要成員,其編碼蛋白NRF2可以激活多個(gè)控制氧化應(yīng)激基因的轉(zhuǎn)錄,該基因的突變還與食管鱗癌患者的不良預(yù)后和化療抵抗相關(guān)[20, 21]。
此外,本研究通過DNA甲基化與基因表達(dá)水平的關(guān)聯(lián)分析,探究了甲基化在驅(qū)動(dòng)基因轉(zhuǎn)錄調(diào)控中的貢獻(xiàn)。已有的食管鱗癌甲基化報(bào)道僅關(guān)注啟動(dòng)子區(qū)甲基化與基因表達(dá)間的調(diào)控關(guān)系[22, 23]。筆者同時(shí)考慮了啟動(dòng)子和基因體甲基化對(duì)基因表達(dá)的調(diào)控作用,在本研究數(shù)據(jù)中發(fā)現(xiàn)CDKN2A、FBXW7、CUL3、FAT1和PTCH1的表達(dá)與啟動(dòng)子和基因體的甲基化均顯著相關(guān),而TCGA數(shù)據(jù)中僅發(fā)現(xiàn)KDM6A、NOTCH3和RBPJ。這表明食管鱗癌驅(qū)動(dòng)基因表達(dá)可能受到啟動(dòng)子甲基化、基因體甲基化或二者的共同調(diào)控。
最后,本研究結(jié)果顯示CREBBP和FAT1突變均與患者的預(yù)后相關(guān),可能作為食管鱗癌潛在的預(yù)后標(biāo)志物。CREBBP是KAT3家族主要的賴氨酸乙酰轉(zhuǎn)移酶,可以作為許多信號(hào)通路的轉(zhuǎn)錄共激活因子[24, 25]。FAT1在多個(gè)發(fā)育過程中十分重要,其異常失活會(huì)導(dǎo)致多種腫瘤中Wnt信號(hào)通路的異常激活[26]。
綜上所述,本研究通過20個(gè)驅(qū)動(dòng)基因多組學(xué)數(shù)據(jù)的整合分析,闡明了食管鱗癌驅(qū)動(dòng)基因多個(gè)分子層面的異常改變以及它們間的交互作用。通過生存分析,本研究還鑒別了兩個(gè)潛在的食管鱗癌預(yù)后標(biāo)志物,為臨床患者的預(yù)后判斷和分層治療提供了幫助。