朱 進(jìn) 丁曉飛 周 軍 陳 光
腎透明細(xì)胞癌是最為常見的腎癌組織學(xué)類型,其占比高達(dá)80%~86%,且預(yù)后明顯差于其他腎癌的亞型(如乳頭狀癌和嫌色細(xì)胞癌)[1]。由于腎透明細(xì)胞癌的發(fā)生率逐年增長,已成為嚴(yán)重危害我國居民健康的疾病之一,故需要對此類腫瘤進(jìn)行深入研究來提高腎透明細(xì)胞癌的治療效果[2]。本研究通過對腫瘤基因組圖譜(The Cancer Genome Atlas,TCGA)數(shù)據(jù)庫的腎透明細(xì)胞癌組織樣本基因mRNA和拷貝數(shù)進(jìn)行整合分析,挖掘腎透明細(xì)胞癌中拷貝數(shù)變異的功能,從分子水平推測其對基因表達(dá)的影響,為腎透明細(xì)胞癌的診斷和治療提供分子標(biāo)記和靶點。
1.數(shù)據(jù)下載及篩選:從TCGA數(shù)據(jù)庫(https://tcga-data.nci.nih.gov/tcga/)下載了腎臟透明細(xì)胞癌(kidney renal clear cell carcinoma,KIRC)相關(guān)基因的拷貝數(shù)和表達(dá)數(shù)據(jù)(皆為level3數(shù)據(jù))。對樣本進(jìn)行篩選,僅分析同時具有表達(dá)和拷貝數(shù)據(jù)的癌癥樣本和具有表達(dá)數(shù)據(jù)的正常樣本,數(shù)據(jù)統(tǒng)計詳見表1。
表1 腎臟透明細(xì)胞癌樣本概況
2.拷貝數(shù)變異分析:從TCGA下載Affymetrix SNP 6.0的marker文件,用GISTIC 2.0分析拷貝數(shù)變異區(qū)域,版本號為GISTIC_2_0_22,拷貝數(shù)擴增或缺失的閾值設(shè)為0.1,顯著性閾值P值設(shè)為0.25,其他參數(shù)均為默認(rèn)。
3.差異表達(dá)基因數(shù)據(jù)分析:(1)整理差異表達(dá)基因數(shù)據(jù):將各個樣本中基因表達(dá)的原始計數(shù)整合成一個矩陣(行為基因,列為樣本),然后剔除表達(dá)量低的基因。(2)比較癌癥和正常樣本之間的差異表達(dá)基因:用R語言包edgeR對表達(dá)矩陣進(jìn)行歸一化處理和差異表達(dá)分析,該包采取的是對數(shù)表達(dá)比率的加權(quán)截斷均值(trimmed mean of M values,TMM)歸一化方法[3,4]。P值用Benjamini-Hochberg (BH)方法校正,差異顯著性的篩選閾值為log2 fold-change(logFC)≥2,F(xiàn)DR<0.01。
4.差異表達(dá)基因和染色體拷貝數(shù)變異整合分析:查看基因拷貝數(shù)的擴增和刪失與基因表達(dá)上調(diào)和下調(diào)之間的關(guān)系,并計算基因拷貝數(shù)與基因表達(dá)之間的相關(guān)系數(shù),P值用BH方法校正。
5.差異表達(dá)基因的功能富集分析:利用R包clusterProfiler(Version 3.2.11, http://www.bioconductor.org/packages/release /bioc/html/clusterProfiler.html)對差異表達(dá)mRNA數(shù)據(jù)進(jìn)行KEGG pathway及GO功能分析,并對差異表達(dá)的mRNA做氣泡圖展示GO和KEGG的P值前15位的分析結(jié)果,顯著富集的閾值為P<0.01[5,6]。
6.統(tǒng)計學(xué)方法:癌癥和正常樣本之間基因的差異表達(dá)利用R軟件Limma包的t檢驗分析,進(jìn)一步用Benjamini-Hochberg (BH)方法校正P值,差異顯著性的篩選閾值為log2 fold-change(logFC)≥2,F(xiàn)DR<0.01。基因拷貝數(shù)的擴增和刪失,與基因表達(dá)上調(diào)和下調(diào)之間的相關(guān)性采用R語言計算Pearson相關(guān)系數(shù),同樣利用BH方法校正P值,以P<0.05為差異有統(tǒng)計學(xué)意義。
1.腎臟透明細(xì)胞癌中顯著的拷貝數(shù)變異區(qū)域:對所有樣本的片段數(shù)據(jù)用GISTIC方法進(jìn)行分析,525例腎臟透明細(xì)胞癌全基因組拷貝數(shù)變異狀況見圖1A,顯著擴增和缺失區(qū)域分別單獨見圖1B和圖1C。
圖1 GISTIC分析結(jié)果
2.腎臟透明細(xì)胞癌中基因表達(dá)差異分析:R語言包分析癌癥樣本與正常組織間的基因表達(dá)差異,一共得到1738個差異表達(dá)的基因(differntially expressed genes, DEGs),其中1171個表達(dá)上調(diào),567個表達(dá)下調(diào)。對于這些差異表達(dá)基因,筆者做了聚類圖(圖2),可以看到這些基因能夠?qū)┌Y和正常樣本清晰的分開,分析結(jié)果可靠。
3.差異表達(dá)基因和染色體拷貝數(shù)變異整合分析結(jié)果:對上述差異表達(dá)基因和染色體拷貝數(shù)變異進(jìn)行整合分析,如圖3的韋恩圖所示,有30個基因的拷貝數(shù)變異和表達(dá)變化具有相同的趨勢,其中13個癌癥中拷貝數(shù)增加的基因,其表達(dá)也上調(diào);17個癌癥中拷貝數(shù)降低的基因,其表達(dá)也下調(diào)。30個拷貝數(shù)變化和表達(dá)變化一致的基因的結(jié)果詳見表2。
圖2 腎臟透明細(xì)胞癌及正常腎臟組織間差異表達(dá)基因聚類圖藍(lán)色表示正常樣本,紅色表示癌癥樣本
圖3 差異表達(dá)基因和染色體拷貝數(shù)變異整合分析的韋恩圖
4.差異表達(dá)基因的功能富集分析:(1)KEGG通路富集分析差異表達(dá)基因:KEGG通路共富集到18條通路(圖4),其中顯著富集的通路有細(xì)胞因子與細(xì)胞因子受體的相互作用通路、吞噬體作用通路、自然殺傷細(xì)胞介導(dǎo)的細(xì)胞毒性作用通路及細(xì)胞黏附分子(CAM)作用通路等。(2)GO功能富集分析差異表達(dá)基因:GO功能富集分析發(fā)現(xiàn)差異表達(dá)基因共富集到382條GO生物過程,顯著富集的GO生物過程包括細(xì)胞活化調(diào)節(jié)、T細(xì)胞聚集、淋巴細(xì)胞聚集、白細(xì)胞聚集、白細(xì)胞活化調(diào)節(jié)、白細(xì)胞與細(xì)胞黏附(圖5)。
腎癌是起源于腎實質(zhì)泌尿小管上皮系統(tǒng)的惡性腫瘤,全稱腎細(xì)胞癌,占成人腎臟惡性腫瘤的90%~95%,而腎細(xì)胞癌中又以透明細(xì)胞癌為主,其占比約為80%~86%。據(jù)《衛(wèi)生統(tǒng)計年鑒》和國家癌癥中心發(fā)布的《2017年中國腫瘤的現(xiàn)狀和趨勢》報告顯示,我國腎臟腫瘤發(fā)生率為3.8/10萬,每年新發(fā)患者約為6.7萬,發(fā)生率躍居所有惡性腫瘤的第16位。腎癌在泌尿系統(tǒng)腫瘤相關(guān)死亡中已經(jīng)超過膀胱癌位居第1位,在所有癌癥相關(guān)致死中居第14位。中國腎癌發(fā)生率在過去20年間,以平均每年6.5%的速度增長,速率遠(yuǎn)高于腎癌高發(fā)的發(fā)達(dá)國家[7, 8]。
腎細(xì)胞癌對于化療和放療不敏感,手術(shù)仍是治療腎癌的唯一可靠方法,外科手術(shù)目前仍是腎癌的首選治療方法,但由于早期腎癌常無臨床癥狀,約20%~30%腎癌被確診時既為晚期,另外約有20%~30%的患者在手術(shù)后1~2年內(nèi)出現(xiàn)遠(yuǎn)處轉(zhuǎn)移[9,10]。目前晚期腎癌的治療多采用以藥物為主的綜合治療,但效果參差不齊,有遠(yuǎn)處轉(zhuǎn)移的晚期腎癌患者5年總體生存率僅為10%[9,11]。靶向藥物治療是轉(zhuǎn)移性腎癌的一線及二線治療手段,2005年美國FDA先后批準(zhǔn)了索拉非尼、舒尼替尼、替西羅莫司、依維莫司等多種靶向方案用于轉(zhuǎn)移性腎癌的治療[12,13]。但是由于腎癌發(fā)病機制十分復(fù)雜,現(xiàn)有靶向藥物均普遍存在客觀有效率低及改善生存尚有限的問題[14]。因此,揭示腎癌治療新靶標(biāo)及發(fā)現(xiàn)腎癌早期診斷生物學(xué)標(biāo)志物,仍是腎癌基礎(chǔ)與臨床研究的重點。
筆者從TCGA腎癌數(shù)據(jù)庫下載525例腎癌及72例正常腎臟樣本的拷貝數(shù)及mRNA表達(dá)數(shù)據(jù),并進(jìn)行整合分析,希望找到差異基因。通過GISTIC對腎癌拷貝數(shù)的分析,識別腎癌拷貝數(shù)變異區(qū)域,其中包含一些公認(rèn)的致癌基因所在區(qū)域,例如MYC、PI3K、NEK9及SOX11等。隨后進(jìn)一步對這些位于變異區(qū)域內(nèi)的基因進(jìn)行正常和腫瘤兩類樣本間的比對分析,一共發(fā)現(xiàn)30個差異表達(dá)基因(P<0.01),其中有13個上調(diào)基因(包括PLK2、ADAM6、GRM8、CCL4、HLA-B、HLA-DQA2、BTNL9、KIR2DL4、MLIP、 CDH4、 NLGN1、SLC2A14、GOLGA8B)和17個下調(diào)基因(包含CHL1、SIM1、CA8、CALB1、SFRP1、DLGAP2、PHYHIP、ARC、ESRP1、C8orf4、DUSP26、GRHL2、FAM167A、PKHD1L1、MAL2、SLC26A7、FER1L6)。
表2 30個差異表達(dá)基因和染色體拷貝數(shù)變異相關(guān)性分析
Amp&Up.擴增和表達(dá)上調(diào);Del&Down.刪除和表達(dá)下調(diào)
圖4 差異基因通路富集分析氣泡圖
圖5 差異基因GO富集分析氣泡圖
雖然在拷貝數(shù)變異和mRNA差異表達(dá)分析中發(fā)現(xiàn)一些公認(rèn)的致癌或抑癌基因包含在本研究的分析結(jié)果中,但是上述30個拷貝數(shù)和mRNA表達(dá)同向變化的基因在腎癌中相關(guān)研究較少。其中ESRP1基因已被證實參與于乳腺癌上皮細(xì)胞的間質(zhì)轉(zhuǎn)化(EMT)過程并影響乳腺癌患者的生存時間,而結(jié)直腸癌患者過表達(dá)PLK2基因會導(dǎo)致化療耐藥以及較差的預(yù)后[15,16]。
殺傷細(xì)胞免疫球蛋白樣受體2DL4(killer-cell immunoglobulin-like receptor 2DL4,簡稱KIR2DL4,也稱CD158d)在臨床腎癌樣本中存在明顯的基因拷貝數(shù)擴增和RNA水平表達(dá)上調(diào)。同時,其配體——非經(jīng)典人類白細(xì)胞抗原G(human leukocyte antigen - G, HLA-G)在腎癌組織中的表達(dá)也明顯高于癌旁組織。KIR2DL4為殺傷性細(xì)胞免疫球蛋白樣受體(killer cell immunoglobulin-like receptor, KIR)基因家族中的一個功能性結(jié)構(gòu)基因,位于人染色體10q13.42,基因全長約10.4kb,其編碼蛋白KIR2DL4分子是自然殺傷性(natural killer,NK)細(xì)胞受體(NKR)的一種,主要分布在NK細(xì)胞膜,由胞外區(qū)、跨膜區(qū)和胞質(zhì)區(qū)組成[17]。KIR2DL4與經(jīng)典KIR2D家族抑制性受體不同,其胞內(nèi)區(qū)只含有一個免疫受體酪氨酸抑制基序(immunoreceptor tyrosine-based inhibitory motifs,ITIM),而跨膜區(qū)還含有一個帶正電荷的精氨酸殘基(協(xié)同激活性信號的傳遞)。同時具有胞內(nèi)“抑制性”ITIM結(jié)構(gòu)域和跨膜區(qū)“激活性”精氨酸殘基,顯示其在特定情況下可發(fā)揮抑制性或活化性受體的作用,但也提示該受體調(diào)控機制的復(fù)雜性[17, 18]。人白細(xì)胞抗原G(human leukocyte antigen G, HLA-G)是KIR2DL4的唯一配體,HLA-G在多種腫瘤細(xì)胞中呈異常高表達(dá),且其表達(dá)水平與患者的不良預(yù)后相關(guān),提示HLA-G/KIR2DL4功能軸可能參與腫瘤的免疫逃逸[19,20]。
本研究還對差異表達(dá)基因進(jìn)行了KEGG通路富集分析以及GO功能富集分析,發(fā)現(xiàn)以趨化因子/受體(CXCL/CXCR)功能軸為代表的細(xì)胞因子/受體相互作用通路及非經(jīng)典人類白細(xì)胞抗原G/殺傷細(xì)胞免疫球蛋白樣受體2DL4(HLA-G/KIR2DL4)為代表的自然殺傷細(xì)胞活性信號通路等在腎透明細(xì)胞癌中異常調(diào)控。同時發(fā)現(xiàn)除VEGF/VEGFR、VHL/HIF、mTOR或PD1/PDL1等信號通路外,趨化因子通路介導(dǎo)的癌細(xì)胞遷移、侵襲及NK細(xì)胞介導(dǎo)的腫瘤免疫逃逸在腎癌的發(fā)生、發(fā)展中也發(fā)揮重要作用,可能為腎癌靶向治療新策略。
綜上所述,通過對腎臟透明細(xì)胞癌基因拷貝數(shù)數(shù)據(jù)和表達(dá)數(shù)據(jù)的整合分析,獲取腎癌的致癌或抑癌信息,可為腎癌發(fā)生、發(fā)展機制研究、早期診斷和治療提供新的思路。