李 青,王 莉
癌癥是嚴(yán)重威脅人類健康的重大疾病。研究發(fā)現(xiàn),2018年全球范圍內(nèi)約有1 810萬(wàn)癌癥新發(fā)病例和960萬(wàn)癌癥死亡病例,接近一半的癌癥新發(fā)病例和超過(guò)一半的癌癥死亡病例發(fā)生在亞洲地區(qū)。尤其在中國(guó),腫瘤發(fā)病形勢(shì)十分嚴(yán)峻,中國(guó)的癌癥發(fā)病人數(shù)約占全球的22%,發(fā)病人數(shù)全球最多[1]。近年來(lái),肺癌仍然是人類最常見(jiàn)的惡性腫瘤之一,而且肺癌發(fā)病率和病死率正在呈現(xiàn)逐年上升趨勢(shì)[2-3]。肺癌有2種主要類型,分別是小細(xì)胞肺癌(small cell lung cancer,SCLC)和非小細(xì)胞肺癌(non-small cell lung cancer,NSCLC)[4-5]。而肺腺癌是NSCLC的主要亞型,發(fā)病率越來(lái)越高,在許多國(guó)家始終是對(duì)人類威脅最大的幾種癌癥之一[6]。以前的研究表明,肺腺癌患者與其他NSCLC患者相比生存時(shí)間較短[7]。作為一種常見(jiàn)的NSCLC的組織學(xué)亞型,肺腺癌的臨床治療以手術(shù)切除為主,但是治療后患者預(yù)后較差,患者術(shù)后復(fù)發(fā)率高達(dá)35%~50%[8]。因此,迫切需要建立一個(gè)敏感性高、預(yù)測(cè)能力強(qiáng)的生物標(biāo)志物模型來(lái)闡明肺腺癌的預(yù)后。
雖然癌癥的發(fā)生和發(fā)展主要依賴于腫瘤相關(guān)基因的改變,但腫瘤相關(guān)基因的DNA甲基化等表觀遺傳變化在腫瘤發(fā)生發(fā)展中發(fā)揮著重要作用[9-10]。DNA甲基化常被認(rèn)為是基因沉默的一種機(jī)制,在胚胎發(fā)育、轉(zhuǎn)錄、基因組印記和X染色體失活等許多細(xì)胞過(guò)程中發(fā)揮重要作用[11-14]。DNA甲基化生物標(biāo)志物已被用于癌癥的早期診斷和預(yù)后。已有研究發(fā)現(xiàn)肺腺癌中一些基因甲基化變化進(jìn)而影響基因表達(dá),最后影響肺腺癌患者的預(yù)后[15-16]。本研究在癌癥基因組圖譜(The Cancer Genome Atlas,TCGA)數(shù)據(jù)庫(kù)中肺腺癌甲基化數(shù)據(jù)進(jìn)行挖掘,全基因組范圍探尋與肺腺癌預(yù)后相關(guān)的甲基化基因,為開(kāi)發(fā)新的肺腺癌預(yù)后標(biāo)志物和治療靶點(diǎn)奠定基礎(chǔ)。
1.1 DNA甲基化數(shù)據(jù)檢索 在TCGA數(shù)據(jù)庫(kù)中下載美國(guó)Illumina公司Methylation 450K芯片檢測(cè)的肺腺癌全基因DNA甲基化level 3數(shù)據(jù),為了保證數(shù)據(jù)的準(zhǔn)確性,對(duì)數(shù)據(jù)進(jìn)行了預(yù)處理。
1.2 樣本資料 數(shù)據(jù)處理后,獲得了219例肺腺癌DNA甲基化樣本數(shù)據(jù)及相關(guān)的臨床信息和29例正常肺組織樣本數(shù)據(jù),肺腺癌臨床樣本信息包括生存信息、性別、年齡和TNM分期等。將219例肺腺癌樣本隨機(jī)分為驗(yàn)證組(73例)和訓(xùn)練組(146例)。本研究中,男性患者113例,女性患者106例。Ⅰ、Ⅱ、Ⅲ、Ⅳ期患者分別為111例、54例、37例、12例,患者平均年齡為64歲。
1.3 在訓(xùn)練組數(shù)據(jù)中構(gòu)建DNA甲基化生物標(biāo)志物在肺腺癌樣本和正常肺組織樣本中進(jìn)行差異甲基化基因篩選,我們認(rèn)定甲基化值(Beta value)>0.1、差異倍數(shù)在2倍以上(|Fold Change|≥2)并且校正后的P值(FDR)<0.05為差異甲基化基因。通過(guò)單因素Cox比例風(fēng)險(xiǎn)回歸分析評(píng)估訓(xùn)練組中患者總生存期(overall survival,OS)和DNA甲基化之間的關(guān)系。進(jìn)一步通過(guò)多因素比例風(fēng)險(xiǎn)回歸分析篩選出預(yù)測(cè)肺腺癌患者預(yù)后的甲基化生物標(biāo)志物。為篩選出預(yù)測(cè)肺腺癌預(yù)后最強(qiáng)大、最準(zhǔn)確的DNA甲基化基因,采用多因素Cox回歸分析建立模型,該模型能夠評(píng)估預(yù)后風(fēng)險(xiǎn),表達(dá)如下:
(1)
式(1)中,N為判斷預(yù)后的DNA甲基化基因數(shù)量;Meth代表基因DNA甲基化值;Coef為單因素Cox回歸系數(shù)。當(dāng)Coi系數(shù)<0時(shí),將其定義為預(yù)后較好的部位,而當(dāng)Coi系數(shù)>0時(shí)被認(rèn)為是預(yù)后較差的部位。風(fēng)險(xiǎn)評(píng)分(RS)是風(fēng)險(xiǎn)得分的多節(jié)點(diǎn)加權(quán)和。
1.4 生存分析與預(yù)后模型評(píng)估 采用風(fēng)險(xiǎn)平均值作為訓(xùn)練組中臨界值將訓(xùn)練組中肺腺癌患者分為高風(fēng)險(xiǎn)組與低風(fēng)險(xiǎn)組,采用Kaplan-Meier法繪制生存曲線來(lái)預(yù)測(cè)總生存率,使用時(shí)序檢驗(yàn)來(lái)檢驗(yàn)高、低風(fēng)險(xiǎn)組生存曲線是否存在差異,應(yīng)用時(shí)間依賴性受試者工作特征(receiver operating characteristic,ROC)曲線來(lái)評(píng)估該預(yù)后模型的預(yù)測(cè)能力。為評(píng)估甲基化預(yù)后生物標(biāo)志物的獨(dú)立預(yù)后價(jià)值,本研究將其與其他臨床信息共同納入多因素Cox回歸分析。為鑒定預(yù)后生物標(biāo)志物的準(zhǔn)確性,使用時(shí)間依賴性ROC曲線和Kaplan-Meier生存分析在驗(yàn)證組中驗(yàn)證了DNA甲基化基因生物標(biāo)志物的預(yù)測(cè)能力。
1.5 DNA甲基化生物標(biāo)志物基因功能注釋 為進(jìn)一步研究生存相關(guān)DNA甲基化生物標(biāo)志物基因的功能,使用基因本體論(Gene Ontology,GO)功能注釋來(lái)研究所選擇基因的功能,設(shè)定閾值P<0.05。
2.1 肺腺癌預(yù)后相關(guān)DNA甲基化基因鑒定情況 通過(guò)對(duì)219例肺腺癌患者腫瘤組織與29例正常肺組織的差異甲基化基因篩選,一共篩選到差異甲基化基因160個(gè),其中甲基化顯著增高的基因156個(gè),甲基化顯著降低的基因4個(gè)。通過(guò)單因素Cox比例風(fēng)險(xiǎn)回歸分析基因甲基化水平與生存時(shí)間的關(guān)系,以生存時(shí)間和生存狀態(tài)為因變量,共鑒定7個(gè)甲基化基因,它們與患者的OS均有顯著的相關(guān)性(P<0.05;圖1A)。為了選擇具有最大預(yù)測(cè)能力的標(biāo)志物,進(jìn)行了多因素Cox回歸分析,共鑒定出4個(gè)預(yù)后相關(guān)甲基化基因,分別是AF131215.8、AL021918.1、RP11.386G11.3和ZNF382(圖1B),并建立了肺腺癌預(yù)后標(biāo)志物模型。
圖1 單因素Cox(A)和多因素Cox(B)回歸分析訓(xùn)練組肺腺癌患者甲基化基因與生存的關(guān)系
每個(gè)肺腺癌患者的風(fēng)險(xiǎn)評(píng)分如下:
RS=(-0.31×methAF131215.8)+(-0.31×methAL021918,1)+ (0.31×methRP11.386G11.3)+(0.28×methZNF382)
(2)
每個(gè)患者從所選擇的甲基化基因生物標(biāo)志物中得到一個(gè)風(fēng)險(xiǎn)評(píng)分,以中位風(fēng)險(xiǎn)評(píng)分作為臨界點(diǎn),將訓(xùn)練組患者分為低風(fēng)險(xiǎn)組(n=73)和高風(fēng)險(xiǎn)組(n=73)。Kaplan-Meier生存分析顯示,患者OS比較低風(fēng)險(xiǎn)組(1.97年)明顯高于高風(fēng)險(xiǎn)組(0.54年),差異比較具有統(tǒng)計(jì)學(xué)意義(P<0.001;圖2A)。為了驗(yàn)證DNA甲基化標(biāo)志物的預(yù)測(cè)能力,在驗(yàn)證組中使用相同的預(yù)后風(fēng)險(xiǎn)評(píng)分模型進(jìn)行驗(yàn)證,患者OS比較高風(fēng)險(xiǎn)組(1.57年)明顯低于低風(fēng)險(xiǎn)組(2.06年),差異比較具有統(tǒng)計(jì)學(xué)意義(P=0.03;圖2B)。
2.2 DNA甲基化基因生物標(biāo)志物預(yù)測(cè)能力驗(yàn)證結(jié)果 為了檢驗(yàn)DNA甲基化基因生物標(biāo)志物的預(yù)測(cè)能力,進(jìn)行了單獨(dú)的ROC分析,通常認(rèn)為ROC曲線下面積(area under curve,AUC)越大,預(yù)測(cè)模型越好。在訓(xùn)練組中,4個(gè)DNA甲基化基因生物標(biāo)志物的預(yù)測(cè)能力較高(AUCSignature=0.793;圖2C),進(jìn)一步證明了研究中甲基化基因生物標(biāo)志物是一種新穎且高度準(zhǔn)確的預(yù)后標(biāo)志物。在驗(yàn)證組中也發(fā)現(xiàn)了類似的結(jié)果(AUCSignature=0.738;圖2D)。
圖2 甲基化基因生物標(biāo)志物預(yù)測(cè)肺腺癌患者預(yù)后
通過(guò)將鑒定的甲基化基因生物標(biāo)志物和其他臨床信息(性別、年齡、TNM分期等)結(jié)合進(jìn)行多因素Cox回歸分析,結(jié)果表明,用于預(yù)測(cè)預(yù)后的甲基化基因生物標(biāo)志物預(yù)測(cè)能力與其他臨床信息無(wú)關(guān),是獨(dú)立的預(yù)后因子[高風(fēng)險(xiǎn)組與低風(fēng)險(xiǎn)組,風(fēng)險(xiǎn)比(hazard ratio,HR)=2.76,95%可信區(qū)間(confidence intervals,CI)(1.67~4.57),P=0,n=146]。同樣的結(jié)果也在驗(yàn)證組中出現(xiàn)[高風(fēng)險(xiǎn)組與低風(fēng)險(xiǎn)組,HR=1.97,95%CI(1.17~1.91),P=0.03,n=73]。表1。
表1 4個(gè)甲基化基因與肺腺癌患者生存的單因素和多因素Cox回歸分析
2.3 DNA甲基化基因生物標(biāo)志物GO功能注釋結(jié)果 GO功能注釋顯示,預(yù)后相關(guān)的DNA甲基化生物標(biāo)志物基因顯著富集在轉(zhuǎn)錄激活活性、RNA聚合酶Ⅱ啟動(dòng)子轉(zhuǎn)錄、蛋白質(zhì)異源二聚體活性和RNA聚合酶Ⅱ啟動(dòng)子轉(zhuǎn)錄的正調(diào)控等方面(P<0.05,圖3)。表明這些預(yù)后相關(guān)基因可能從調(diào)控轉(zhuǎn)錄和蛋白質(zhì)活性等方面來(lái)調(diào)控肺腺癌的預(yù)后。
圖3 肺腺癌患者生存相關(guān)基因GO功能注釋
在NSCLC中,肺腺癌是一種常見(jiàn)的組織學(xué)亞型,不論男性和女性、吸煙者和非吸煙者死亡率都較高,預(yù)后較差[17]。目前對(duì)肺腺癌患者的治療仍以手術(shù)為主。然而,手術(shù)治療后近半數(shù)患者出現(xiàn)復(fù)發(fā)甚至死亡,導(dǎo)致5年生存率較低[18]。因此,需要一個(gè)有效的評(píng)估生存結(jié)果或預(yù)測(cè)術(shù)后復(fù)發(fā)風(fēng)險(xiǎn)的預(yù)后標(biāo)志物。
大量研究報(bào)道,許多腫瘤抑制基因通過(guò)調(diào)控作用在腫瘤預(yù)防上發(fā)揮了關(guān)鍵作用,如DNA修復(fù)、細(xì)胞粘附、細(xì)胞周期控制和細(xì)胞凋亡調(diào)控等可以調(diào)控腫瘤發(fā)生發(fā)展[19]。許多腫瘤發(fā)生是由于基因啟動(dòng)子的甲基化導(dǎo)致基因沉默引起的。因此,某些基因的DNA甲基化狀態(tài)作為一個(gè)有用的生物標(biāo)志物預(yù)測(cè)腫瘤的行為是合理的假設(shè)。此外,DNA甲基化生物標(biāo)志物與基因和血清標(biāo)志物比較是有許多優(yōu)勢(shì),如DNA甲基化譜具有比RNA或大多數(shù)蛋白質(zhì)更具化學(xué)和生物學(xué)穩(wěn)定性的分子診斷信息來(lái)源[20]。異常的DNA甲基化導(dǎo)致細(xì)胞過(guò)程的失調(diào)(如增殖、轉(zhuǎn)化和抗凋亡作用),都促進(jìn)癌癥的進(jìn)展。DNA甲基化為了解肺腺癌的惡性行為提供了有價(jià)值的信息。以往對(duì)肺腺癌的研究大多集中在一些已知癌癥相關(guān)基因上并且目前對(duì)肺腺癌生物標(biāo)志物的研究大多集中在mRNA、lncRNA和miRNA等轉(zhuǎn)錄層面,例如通過(guò)TCGA數(shù)據(jù)庫(kù)分析鑒定出hsa_circ_0000792為潛在的肺腺癌生物標(biāo)志物[21],可能應(yīng)用于肺腺癌的高危人群早期篩查和診斷。而miR-30a-3p的研究為肺腺癌的診斷和預(yù)后提供了新的潛在的生物標(biāo)志物[22]。肺腺癌中l(wèi)ncRNA相關(guān)的ceRNA網(wǎng)絡(luò)研究,發(fā)現(xiàn)了潛在的診斷和預(yù)后RNA相關(guān)生物標(biāo)志物[23]。但是,肺腺癌仍缺乏表觀遺傳方面的生物標(biāo)志物。本研究以TCGA數(shù)據(jù)庫(kù)中肺腺癌患者的甲基化數(shù)據(jù)為基礎(chǔ),利用生物信息學(xué)方法尋找新的生物標(biāo)志物,建立了一個(gè)由4個(gè)DNA甲基化基因組成的新型DNA甲基化生物標(biāo)志物模型;通過(guò)多因素Cox回歸分析,確定了所鑒定的DNA甲基化生物標(biāo)志物在預(yù)后預(yù)測(cè)中的獨(dú)立性,預(yù)測(cè)能力不依賴于其他臨床信息;ROC曲線進(jìn)一步證明了所鑒定的DNA甲基化基因生物標(biāo)志物是一個(gè)新的高精度預(yù)后標(biāo)志物,具有重要的臨床價(jià)值。
此外,本研究分析了作為生物標(biāo)志物的DNA甲基化基因的功能。GO富集主要集中在轉(zhuǎn)錄激活活性、RNA聚合酶Ⅱ啟動(dòng)子轉(zhuǎn)錄、RNA聚合酶Ⅱ啟動(dòng)子轉(zhuǎn)錄的正調(diào)控和蛋白質(zhì)異源二聚體活性等方面,表明這些甲基化基因可能通過(guò)影響基因轉(zhuǎn)錄表達(dá)進(jìn)而影響腫瘤的預(yù)后。在這些甲基化基因生物標(biāo)志物中,ZNF382編碼轉(zhuǎn)錄因子KZNF,KZNFs在細(xì)胞分化、增殖和凋亡等多種過(guò)程的調(diào)控中發(fā)揮著重要作用,并且能抑制活化蛋白1和NF-κB信號(hào)通路,在多種腫瘤中起抑癌作用。在食管鱗狀細(xì)胞癌中,經(jīng)常會(huì)發(fā)生ZNF382甲基化并且抑制Wnt/β-catenin信號(hào)通路[24]。在胃癌中,ZNF382基因啟動(dòng)子發(fā)生甲基化而沉默,而ZNF382的異位表達(dá)能誘導(dǎo)細(xì)胞凋亡,顯著抑制胃腫瘤細(xì)胞克隆性、增殖、遷移和上皮間質(zhì)轉(zhuǎn)化[25]。肝癌中,啟動(dòng)子甲基化經(jīng)常使ZNF382表達(dá)下調(diào),而ZNF382的表達(dá)降低與早期原發(fā)性肝癌患者生存不良密切相關(guān)。功能研究表明,ZNF382通過(guò)抑制裸鼠細(xì)胞增殖、集落形成、遷移、侵襲和致瘤潛能,誘導(dǎo)細(xì)胞凋亡,是肝癌細(xì)胞的有效抑癌因子[26]。并且還發(fā)現(xiàn),與本研究一致的是,ZNF382能顯著抑制多種癌基因的RNA水平,這些癌基因參與腫瘤轉(zhuǎn)化、凋亡、細(xì)胞周期和增殖,包括MYC,STAT3,ID1,IKBKE,STAT5B,MITF,HMGA2,CDK6。
AF131215.8、AL021918.1和RP11.386G11.3目前還沒(méi)有對(duì)其在腫瘤中作用的研究,但是在本研究中,這些基因表現(xiàn)出很高的預(yù)后預(yù)測(cè)能力,可能是新的腫瘤相關(guān)基因,具有潛在價(jià)值,可為以后的腫瘤研究提供更多思路,需要進(jìn)一步研究。
本研究還存在一些局限性。首先,研究樣本是完全回顧性的,數(shù)據(jù)的限制可能會(huì)影響結(jié)果;其次,還沒(méi)有進(jìn)一步研究這些DNA甲基化基因在肺腺癌中的作用機(jī)制,尤其是新發(fā)現(xiàn)的基因;最后,雖然確定了所選擇的DNA甲基化基因作為一個(gè)強(qiáng)有力的預(yù)測(cè)特征,但將其應(yīng)用于臨床需要更多的研究。盡管存在局限性,但我們已經(jīng)識(shí)別并成功驗(yàn)證了肺腺癌患者的DNA甲基化特征,并且這些甲基化基因生物標(biāo)志物具有很高的預(yù)后預(yù)測(cè)準(zhǔn)確率,具有臨床意義。