莘 華,劉 智,張潔莉
在我國(guó),肺癌位居惡性腫瘤的第一位,且發(fā)病率及病死率占全球的三分之一[1],其中以非小細(xì)胞肺癌(non-small cell lung cancer, NSCLC)最常見(jiàn),占肺癌的80%~85%。NSCLC最主要的兩種病理組織學(xué)亞型是肺腺癌(Lung adenocarcinoma,LUAD)和肺鱗癌(Lung squamous cell carcinoma,LUSC),二者在臨床表現(xiàn)上相似,但在發(fā)病機(jī)制、治療方案及患者預(yù)后等方面都存在著明顯的差異[2]。N6-甲基腺苷(N6-methyladenosine,m6A)修飾是在RNA分子上的一種表觀遺傳修飾,是一種動(dòng)態(tài)可逆的修飾模式,參與調(diào)控信使RNA(mRNA)的穩(wěn)定性、轉(zhuǎn)運(yùn)、翻譯和降解等[3]。m6A甲基化修飾過(guò)程主要依靠三種類型酶參與完成,即甲基化轉(zhuǎn)移酶(Writer)、去甲基化酶(Eraser)和甲基化識(shí)別酶(Reader)。既往研究表明,m6A甲基化修飾與NSCLC的發(fā)生發(fā)展具有密切的關(guān)系。Li等[4]發(fā)現(xiàn),m6A去甲基化酶FTO可以通過(guò)調(diào)節(jié)USP7 mRNA的m6A修飾水平進(jìn)而促進(jìn)肺癌細(xì)胞的生長(zhǎng)。Jin等[5]研究表明,m6A去甲基化酶ALKBH5通過(guò)減少YTHDFs介導(dǎo)的YAP表達(dá)和抑制miR-107/LATS2介導(dǎo)的YAP在NSCLC中的活性來(lái)抑制腫瘤的生長(zhǎng)和轉(zhuǎn)移。Du等[6]對(duì)METTL3的SUMO化的研究發(fā)現(xiàn),其可與METTL14和WTAP發(fā)生相互作用,進(jìn)而抑制甲基化轉(zhuǎn)移酶活性,從而使mRNA中m6A甲基化的修飾水平下降。同時(shí)發(fā)現(xiàn),在NSCLC細(xì)胞中將METTL3敲除時(shí),可以直接影響腫瘤細(xì)胞的增殖與轉(zhuǎn)移。METTL3在NSCLC中還可以與eIF3h發(fā)生相互作用,進(jìn)而增強(qiáng)翻譯,促使癌基因轉(zhuǎn)化形成密集的多核糖體,該發(fā)現(xiàn)可以作為NSCLC潛在的治療靶點(diǎn)[7]。除此之外,一些研究還表明m6A調(diào)節(jié)因子的表達(dá)與NSCLC預(yù)后顯著相關(guān)[8-10]。然而,對(duì)于m6A調(diào)節(jié)因子在非小細(xì)胞肺癌不同病理亞型中發(fā)揮的生物學(xué)功能的差異性的研究尚未有報(bào)道。本研究利用生物信息學(xué)的方法,基于LUAD和LUSC的表達(dá)譜數(shù)據(jù),通過(guò)比較分析26個(gè)m6A調(diào)節(jié)因子在LUAD和LUSC腫瘤與正常組織中的表達(dá)、通路活性及生存預(yù)后,明確m6A調(diào)節(jié)因子在LUAD和LUSC發(fā)揮調(diào)控功能時(shí)的差異性,為實(shí)現(xiàn)針對(duì)NSCLC具體病理組織亞型的精準(zhǔn)治療和尋找潛在靶點(diǎn)提供理論基礎(chǔ)。
1.1 材料 利用癌癥基因組圖譜(the cancer genome atlas,TCGA)數(shù)據(jù)庫(kù),檢索含有人源的LUAD和LUSC的mRNA表達(dá)譜數(shù)據(jù)集,分別選取含有LUAD和LUSC腫瘤組織和正常組織對(duì)照研究的表達(dá)譜數(shù)據(jù)作為研究對(duì)象。納入研究的LUAD表達(dá)譜數(shù)據(jù)共包含576例樣本,其中腫瘤組織樣本518例,正常組織樣本58例,58例有配對(duì)樣本,515例具有臨床信息;LUSC表達(dá)譜數(shù)據(jù)共包含554例樣本,其中腫瘤組織樣本503例,正常組織樣本51例,51例有配對(duì)樣本,501例具有臨床信息。
1.2 m6A調(diào)節(jié)因子的差異表達(dá)分析 下載的LUAD和LUSC表達(dá)譜數(shù)據(jù)經(jīng)RNA測(cè)序期望最大化(RNA-seq by expectation maximization,RSEM)方法分析,同時(shí)進(jìn)行歸一化和批次差異校正處理后,獲得研究對(duì)象的表達(dá)矩陣,篩選出26個(gè)m6A調(diào)節(jié)因子在LUAD和LUSC的表達(dá)譜數(shù)據(jù),隨后利用ggplot2包對(duì)LUAD和LUSC的腫瘤組和正常組織進(jìn)行差異表達(dá)分析26個(gè)m6A調(diào)節(jié)因子的基因信息(表1)。
表1 26個(gè)m6A調(diào)節(jié)因子基因信息
1.3 m6A調(diào)節(jié)因子參與的通路活性分析 10個(gè)腫瘤相關(guān)經(jīng)典通路包括結(jié)節(jié)性硬化癥蛋白復(fù)合物/哺乳動(dòng)物雷帕霉素靶點(diǎn)(tuberous sclerosis complex/mammalian target of rapamycin,TSC/mTOR)、受體酪氨酸激酶(receptor tyrosine kinase, RTK)、Ras蛋白/絲裂原活化蛋白激酶(ras/mitogen-activated protein kinase,RAS/MAPK)、磷脂酰肌醇-3-激酶/絲氨酸/蘇氨酸激酶(PI3K/AKT)、激素雌激素受體(estrogen receptor,ER)、雄激素受體(androgen receptor,AR)、上皮細(xì)胞-間充質(zhì)轉(zhuǎn)化(epithelial-mesenchymal transition,EMT)、DNA損失應(yīng)答(DNA damage response,DDR)、細(xì)胞周期(cell cycle)和凋亡(apoptosis)被用來(lái)進(jìn)行通路活性分析。來(lái)自于癌癥蛋白質(zhì)組圖譜(the cancer proteome atlas,TCPA)的反相蛋白微陣列(reverse phase protein array,RPPA)數(shù)據(jù)被用來(lái)計(jì)算10個(gè)腫瘤相關(guān)通路的通路活性評(píng)分(pathway activity score,PAS)[11]。以基因表達(dá)量的中位數(shù)作為閾值將樣本分為高和低兩組,當(dāng)PAS(目標(biāo)基因高表達(dá))大于PAS(目標(biāo)基因低表達(dá))時(shí),認(rèn)為目標(biāo)基因可能對(duì)某個(gè)通路有激活作用,否則對(duì)某個(gè)通路有抑制作用[12]。
1.4 m6A調(diào)節(jié)因子的預(yù)后生存分析 根據(jù)病例編號(hào)(Case_submitter_id)分別合并從TCGA數(shù)據(jù)庫(kù)中下載的LUAD和LUSC的mRNA表達(dá)譜數(shù)據(jù)和臨床生存數(shù)據(jù),篩選出26個(gè)m6A調(diào)節(jié)因子并將其表達(dá)值的中位值作為閾值,將腫瘤樣本分為高表達(dá)組和低表達(dá)組。使用R軟件中的forestplot、survival和survminer包,應(yīng)用單因素Cox分析(Univariate Cox analysis)和Kaplan-Meier 生存分析方法,逐個(gè)基因分析其對(duì)患者總生存期(Overall survival,OS)的影響,計(jì)算風(fēng)險(xiǎn)比( Hazard ratio,HR),分析m6A調(diào)節(jié)因子的表達(dá)對(duì)LUAD和LUSC患者OS的影響差異。
1.5 統(tǒng)計(jì)學(xué)處理 應(yīng)用R軟件(v 4.0.5)進(jìn)行差異表達(dá)分析和通路活性分析,并采用配對(duì)樣本秩和檢驗(yàn)(wilcoxon test)估算P-value值,預(yù)后生存分析采用時(shí)序檢驗(yàn)(logrank test)進(jìn)行統(tǒng)計(jì)學(xué)分析,P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
2.1 m6A調(diào)節(jié)因子在LUAD和LUSC的表達(dá)差異 通過(guò)配對(duì)樣本wilcoxon檢驗(yàn)比較分析26個(gè)m6A調(diào)節(jié)因子在58對(duì)LUAD和51對(duì)LUSC的腫瘤和正常組織中的表達(dá)差異情況,結(jié)果顯示,METT5、VIRMA和RBM15、YTHDF1、EIF3A、IGF2BP1、IGF2BP3、HNRNPA2B1、HNRNPC和RBMX在LUAD和LUSC的腫瘤組織中相比于正常組織均顯著上調(diào)表達(dá),METTL14、METTL16和ZC3H13和FTO在LUAD和LUSC的腫瘤組織中相比于正常組織均顯著下調(diào)表達(dá)。除此之外,ZCCHC4、ALKBH1和YTHDF2僅在LUAD的腫瘤組織和正常組織中的表達(dá)水平差異有統(tǒng)計(jì)學(xué)意義,在LUSC的腫瘤組織和正常組織中,表達(dá)水平差異無(wú)統(tǒng)計(jì)學(xué)意義。類似地,YTHDC2和IGF2BP2僅在LUSC的腫瘤組織和正常組織中表達(dá)水平存在統(tǒng)計(jì)學(xué)的意義(圖1)。
圖1 m6A調(diào)節(jié)因子在LUAD和LUSC腫瘤和正常組織的表達(dá)分析
2.2 m6A調(diào)節(jié)因子在LUAD和LUSC的通路活性差異 26個(gè)m6A調(diào)節(jié)因子在10個(gè)經(jīng)典的腫瘤相關(guān)通路活性分析發(fā)現(xiàn),有18個(gè)和16個(gè)m6A調(diào)節(jié)因子對(duì)應(yīng)地在LUAD和LUSC中參與了至少一個(gè)腫瘤相關(guān)通路的激活或抑制。其中,METTL3、METTL5、METTL14、ZC3H13、RBMX和FTO僅在LUAD中的Apoptosis、Cell cycle、EMT和RAS/MAPK等腫瘤相關(guān)通路中發(fā)揮激活或抑制功能;EIF3A、YTHDC2和RBM15B僅在LUSC中的PI3K/AKT和TSC/mTOR信號(hào)通路中發(fā)揮抑制或激活作用。除此之外,相同的基因在LUAD和LUSC中參與調(diào)控不同的通路活性,例如:YTHDF1在LUAD中參與Cell cycle的激活,在LUSC中則參與TSC/mTOR通路的激活;YTHDF2在LUAD和LUSC中均可參與TSC/mTOR通路的激活,在LUAD中該基因同時(shí)發(fā)揮對(duì)Apoptosis通路的抑制作用(圖2)。
2.3 m6A調(diào)節(jié)因子在LUAD和LUSC的生存預(yù)后價(jià)值 利用TCGA數(shù)據(jù)庫(kù)中515例LUAD和501例LUSC患者的臨床信息,結(jié)合單因素COX回歸分析和Kaplan-Meier生存分析方法預(yù)測(cè)m6A調(diào)節(jié)因子與患者OS的關(guān)系。分析結(jié)果顯示,HNRNPC、IGF2BP3、HNRNPA2B1、YTHDF2、METTL5、IGF2BP2、VIRMA和IGFBP1調(diào)節(jié)因子與LUAD的預(yù)后顯著相關(guān),僅FTO、IGF2BP1和IGF2BP3與LUSC的預(yù)后顯著相關(guān)(表2)。Kaplan-Meier生存分析結(jié)果提示,HNRNPC、IGF2BP3、HNRNPA2B1、METTL5、IGF2BP2、VIRMA和IGFBP1高表達(dá)與LUAD患者較長(zhǎng)的OS呈負(fù)相關(guān),而YTHDF2高表達(dá)與LUAD患者較長(zhǎng)的OS呈正相關(guān)(表3)。相反,在LUSC中,IGFBP1和IGF2BP3高表達(dá)與患者具有更長(zhǎng)的OS顯著正相關(guān),同時(shí),FTO低表達(dá)與LUSC患者較長(zhǎng)的OS顯著正相關(guān)(表3)。
肺鱗癌和肺腺癌是非小細(xì)胞肺癌的常見(jiàn)病理組織亞型,其中周圍型腺癌居多,鱗癌多為中央型[13]。由于兩者之間的基因組、轉(zhuǎn)錄組和免疫等特征不同,其對(duì)應(yīng)治療方案、預(yù)后也均存在較大差異[14-17],因此,針對(duì)肺癌患者不同病理亞型進(jìn)行精準(zhǔn)治療具有重要意義。同時(shí),腫瘤與正常組織中基因的異常表達(dá)與調(diào)控的差異,對(duì)腫瘤的發(fā)生、發(fā)展及生存預(yù)后也具有重要的影響。目前,m6A調(diào)節(jié)因子通過(guò)調(diào)節(jié)mRNA的甲基化水平影響腫瘤相關(guān)基因的表達(dá)影響腫瘤患者的預(yù)后已被廣泛報(bào)道[18-20]。臨床對(duì)NSCLC中關(guān)于m6A調(diào)節(jié)因子的調(diào)控功能也有很多研究,但大多沒(méi)有進(jìn)行細(xì)致的病理分型[21-23]。另外,由于各自研究中納入分析的數(shù)據(jù)集不同,數(shù)據(jù)的處理方法不同,所得到的結(jié)果存在一定差異。本研究選擇了TCGA數(shù)據(jù)庫(kù)中含有LUAD和LUSC腫瘤和正常組織的表達(dá)譜數(shù)據(jù)和臨床患者信息作為研究對(duì)象,從表達(dá)、通路活性及預(yù)后3個(gè)方面比較了26個(gè)m6A調(diào)節(jié)因子在LUAD和LUSC中發(fā)揮的生物學(xué)作用的差異性。
對(duì)m6A調(diào)節(jié)因子在NSCLC中發(fā)揮的生物學(xué)功能的研究主要目的是明確m6A調(diào)節(jié)因子的功能機(jī)制及對(duì)NSCLC預(yù)后的影響,闡釋其對(duì)相關(guān)治療方式耐藥的潛在機(jī)制,探索其成為潛在靶點(diǎn)的可能性。本研究對(duì)26個(gè)m6A調(diào)節(jié)因子的差異表達(dá)分析發(fā)現(xiàn),ZCCHC4和ALKBH1僅在LUAD的腫瘤組織中顯著上調(diào)表達(dá),而在LUSC的腫瘤組織和正常組織中,表達(dá)水平無(wú)明顯差異。既往研究提示,ZCCHC4在多個(gè)人類癌癥組織中異常高表達(dá),并與肝細(xì)胞癌(HCC)、胰腺癌和結(jié)腸癌患者的不良預(yù)后和化療耐藥相關(guān)[24]。研究[25]發(fā)現(xiàn),ALKBH1的高表達(dá)與腫瘤的發(fā)生發(fā)展密切相關(guān),ALKBH1可以通過(guò)調(diào)節(jié)m6A RNA的去甲基化進(jìn)而促進(jìn)肺癌的發(fā)展。ZCCHC4、ALKBH1及其他m6A調(diào)節(jié)因子在LUAD和LUSC中的差異,將可能成為L(zhǎng)UAD和LUSC患者區(qū)別治療或相同治療產(chǎn)生不同應(yīng)答結(jié)果潛在的靶點(diǎn)或潛在的分子機(jī)制。
m6A調(diào)節(jié)因子在LUAD和LUSC中的差異表達(dá)模式將對(duì)參與調(diào)控的腫瘤相關(guān)通路活性產(chǎn)生不同的影響。在我們的研究中,YTHDF2在LUAD的腫瘤組織中顯著上調(diào)表達(dá),而在LUSC的腫瘤組織和正常組織中,表達(dá)則無(wú)明顯差異。同時(shí),YTHDF2在LUAD和LUSC中均可參與TSC/mTOR通路的激活,但在LUAD中該基因同時(shí)發(fā)揮對(duì)凋亡通路的抑制作用,可能是導(dǎo)致LUAD在治療過(guò)程中腫瘤細(xì)胞耐藥的誘因之一。類似地,IGF2BP2僅在LUSC的腫瘤組織中顯著上調(diào)表達(dá),在LUAD的腫瘤和正常組織中則無(wú)明顯差異,而IGF2BP2在LUSC中僅參與激素雌激素受體信號(hào)通路的抑制,在LUAD中則同時(shí)參與凋亡、細(xì)胞周期和EMT信號(hào)通路的激活及PI3K/AKT和RAS/MAPK信號(hào)通路的抑制,該結(jié)果進(jìn)一步強(qiáng)調(diào)了不同病理亞型中m6A調(diào)節(jié)因子發(fā)揮功能的差異性。
對(duì)于NSCLC不同的病理亞型,相同的m6A調(diào)節(jié)因子對(duì)患者預(yù)后的影響也不相同。Kazuo等[26]發(fā)現(xiàn),YTHDF2高表達(dá)與NSCLC更好的生存預(yù)后相關(guān),而本研究發(fā)現(xiàn),YTHDF2在LUAD中高表達(dá)與較好的預(yù)后生存相關(guān),在LUSC中則表現(xiàn)為與預(yù)后無(wú)顯著相關(guān)性。除此之外,Han等[27]發(fā)現(xiàn),IGF2BP2高表達(dá)與較短的OS和較差的預(yù)后相關(guān),本研究發(fā)現(xiàn),IGF2BP2雖然在LUSC的腫瘤組織中顯著上調(diào)表達(dá),但卻與預(yù)后沒(méi)有顯著的相關(guān)性。相反IGF2BP2在LUAD的腫瘤和正常組織中的表達(dá)水平雖然無(wú)明顯差異,但其IGFBP2高表達(dá)卻與更差的預(yù)后顯著相關(guān)。本研究發(fā)現(xiàn),FTO基因高表達(dá)僅與LUSC的不良預(yù)后相關(guān),與LUAD的預(yù)后無(wú)顯著相關(guān)性。與Wang等[28]發(fā)現(xiàn),FTO基因通過(guò)誘導(dǎo)NELL2表達(dá)來(lái)抑制E2F1的m6A甲基化修飾從而加速NSCLC的進(jìn)展有一定的差異。本研究中存在一些m6A調(diào)節(jié)因子在表達(dá)水平和通路活性上無(wú)明顯差異,且與LUAD和LUSC患者的預(yù)后無(wú)相關(guān)性,如ALKBH5這類m6A調(diào)節(jié)因子可能通過(guò)其他形式,在 LUAD和LUSC的發(fā)生、發(fā)展中起到重要調(diào)控作用,通過(guò)影響PD-L1的表達(dá)和免疫微環(huán)境進(jìn)而對(duì)腫瘤的免疫治療應(yīng)答療效產(chǎn)生不同的治療結(jié)局[29],相關(guān)的結(jié)果尚待進(jìn)一步的研究證實(shí)。
本研究中存在一些不足之處,主要包括配對(duì)樣本數(shù)量相對(duì)較少,且樣本數(shù)據(jù)來(lái)源于TCGA數(shù)據(jù)庫(kù),其中包含關(guān)于中國(guó)人群的數(shù)據(jù)有限,臨床信息不夠完善,無(wú)法針對(duì)不同病理亞型臨床特征進(jìn)行更細(xì)致的分析。
綜上所述,本研究應(yīng)用生物信息學(xué)的相關(guān)分析方法對(duì)26個(gè)m6A調(diào)節(jié)因子在LUAD和LUSC的表達(dá)譜數(shù)據(jù)進(jìn)行挖掘。有助于對(duì)m6A調(diào)節(jié)因子在NSCLC的發(fā)生、發(fā)展和轉(zhuǎn)移的分子過(guò)程進(jìn)一步認(rèn)識(shí),實(shí)現(xiàn)針對(duì)LUAD和LUSC的精確分層,同時(shí)為研究LUAD和LUSC潛在的生物標(biāo)志物及靶點(diǎn)提供參考依據(jù),隨著后續(xù)數(shù)據(jù)庫(kù)的不斷完善及我們對(duì)m6A調(diào)節(jié)因子的深入研究,會(huì)針對(duì)性的開(kāi)展相關(guān)內(nèi)容的分析。