郭亞楠,陳佳雯,蔣奕斌,溫珍珍,林泱泱,朱潘嬋,錢 晶,3△
(1.湖州師范學(xué)院醫(yī)學(xué)院,浙江 湖州 313000;2.湖州學(xué)院,浙江 湖州 313000;3.浙江省媒介生物學(xué)與病原控制重點(diǎn)實(shí)驗(yàn)室,浙江 湖州313000)
腎細(xì)胞癌(RCC)是起源于腎皮質(zhì)或腎小管上皮細(xì)胞的惡性腫瘤[1],是癌癥死亡的重要原因之一[2]。根據(jù)組織學(xué)類型,RCC可分為腎透明細(xì)胞癌、乳頭狀RCC、腎嫌色細(xì)胞癌、未分類細(xì)胞癌和Bellini集合管癌等[3]?;旌闲园┮源嬖?種及以上類型的惡性細(xì)胞和多型性細(xì)胞為主要病理特點(diǎn)[4],腎透明細(xì)胞癌是混合腫瘤組織學(xué)患者最常見的病理類型,其他原發(fā)性腫瘤有腎乳頭狀細(xì)胞癌和腎嫌色細(xì)胞癌[5]。混合性腫瘤臨床較少見,混合性腎癌(KIPAN)更為罕見。由于診斷不及時(shí),治療延誤,晚期惡性程度高,分期分級(jí)高、進(jìn)展快、易轉(zhuǎn)移等特點(diǎn),患者預(yù)后較差[6]。腎癌具有多重耐藥性[7],國(guó)內(nèi)以根治性腎切除術(shù)為首選治療方式[8]。C型凝集素域家庭16成員A(CLEC16A)是最近通過全基因組關(guān)聯(lián)(GWASs)鑒定出的C型凝集素受體(CLRs)家族成員之一[9],已有多項(xiàng)研究證實(shí)CLEC16A與多發(fā)性硬化癥、1型糖尿病等多種自身免疫性疾病有密切關(guān)系。目前,國(guó)內(nèi)外關(guān)于CLEC16A的研究較少,對(duì)其在疾病中起到的確切作用機(jī)制尚不清楚[10],因此,探索發(fā)現(xiàn)CLEC16A在KIPAN發(fā)生、發(fā)展中的分子機(jī)制和基因調(diào)控網(wǎng)絡(luò),進(jìn)而在分子水平上預(yù)防或阻斷關(guān)鍵過程,以達(dá)到臨床治療、改善預(yù)后顯得尤為重要。
本研究利用多個(gè)在線數(shù)據(jù)庫(kù)分析CLEC16A在KIPAN中的表達(dá),分析CLEC16A在KIPAN中的作用及對(duì)KIPAN患者預(yù)后的影響,為進(jìn)一步研究CLEC16A在KIPAN的發(fā)生、發(fā)展及預(yù)后中的意義提供一定理論依據(jù)和參考,也為進(jìn)一步試驗(yàn)研究奠定理論基礎(chǔ)。
1.1資料 從UCSC數(shù)據(jù)庫(kù)(https://xenabrowser.net/)中下載經(jīng)統(tǒng)一標(biāo)準(zhǔn)化的泛癌數(shù)據(jù)集:TCGA Pan-Cancer(PANCAN,N=10535,G=60499),從中提取ENSG00000038532(CLEC16A)基因在各個(gè)樣本中的表達(dá)數(shù)據(jù)。從TCGA數(shù)據(jù)庫(kù)(https://portal.gdc.cancer.gov/)下載KIPAN組織和癌旁組織CLEC16A的mRNA表達(dá)數(shù)據(jù)及KIPAN患者的臨床數(shù)據(jù)。
1.2方法
1.2.1基因差異分析 從UCSC數(shù)據(jù)庫(kù)獲得樣本數(shù)據(jù),并進(jìn)一步篩選來源為Solid Tissue Normal、Primary Blood Derived Cancer-Peripheral Blood、Primary Tumor的樣本,對(duì)每一個(gè)表達(dá)值進(jìn)行了log2(X+0.001)變換。此外,剔除單個(gè)癌種中樣本個(gè)數(shù)小于3的癌種,最終獲得26個(gè)癌種的表達(dá)數(shù)據(jù)。使用R軟件(4.1.2版)計(jì)算了每個(gè)腫瘤中正常樣本和腫瘤樣本的表達(dá)差異,使用非配對(duì)的Wilcoxon Rank Sum和Signed Rank Tests進(jìn)行差異顯著性分析。
1.2.2CLEC16A表達(dá)量與多種癌種預(yù)后的關(guān)系 從UCSC數(shù)據(jù)庫(kù)中下載經(jīng)統(tǒng)一標(biāo)準(zhǔn)化的泛癌數(shù)據(jù)集:TCGA TARGET GTEx,從中提取CLEC16A基因在各個(gè)樣本中的表達(dá)數(shù)據(jù),另外從此前發(fā)表在《Cell》上的TCGA預(yù)后研究中獲得高質(zhì)量的TCGA預(yù)后數(shù)據(jù)集[11],從UCSC的癌癥瀏覽器中獲取TARGET隨訪數(shù)據(jù)作為補(bǔ)充及隨訪時(shí)間短于30 d的樣本,對(duì)每個(gè)表達(dá)值進(jìn)行了log2(X+0.001)變換,剔除單個(gè)癌種中樣本個(gè)數(shù)小于10的癌種,使用R軟件建立Cox proportional hazards regression mode,分析基因表達(dá)與每個(gè)腫瘤中的預(yù)后關(guān)系,使用Logrank test進(jìn)行統(tǒng)計(jì)檢驗(yàn)獲得預(yù)后顯著性。
1.2.3CLEC在不同組織中的表達(dá)及其臨床特征分析 從TCGA數(shù)據(jù)庫(kù)中下載原始數(shù)據(jù)和臨床相關(guān)數(shù)據(jù),選擇轉(zhuǎn)錄組分析及基因表達(dá)定量的數(shù)據(jù),方案選擇TCGA-KIRC TCGA-KIRP TCGA-KICH(TCGA Project),利用Perl腳本將count數(shù)據(jù)與人類基因組注釋文件進(jìn)行合并,生成單基因樣本的mRNA矩陣,然后利于R軟件編寫的腳本進(jìn)行散點(diǎn)差異分析和臨床特征相關(guān)分析。
1.2.4CLEC16A與KIPAN患者預(yù)后關(guān)系分析 在TCGA的Gene Expression Profiling Interactive Analysis(GEPIA)數(shù)據(jù)庫(kù)(http://gepia.cancer-pku.cn/index.html)中設(shè)定檢索條件:(1)Single Gene Analysis選項(xiàng),Enter gene name輸入基因名“CLEC16A”;(2)Dataset選擇KICH、KIRC、KIRP,其余默認(rèn);(3)在Survival欄中,選擇Overall Survival及Disease Free Survival(RFS);(4)在Datesets Selection(Cancer name)欄中,選擇KICH、KIRC、KIRP,點(diǎn)擊Plot。
1.2.5與CLEC16A相關(guān)的蛋白及功能分析 String數(shù)據(jù)庫(kù)是專門用于生物體范圍蛋白質(zhì)關(guān)聯(lián)網(wǎng)絡(luò)的在線資源之一[12],可作為分析生物學(xué)基因和蛋白質(zhì)相互作用的檢索工具,包含蛋白質(zhì)-蛋白質(zhì)相互作用(PPI)的生物數(shù)據(jù)庫(kù)和網(wǎng)絡(luò)資源,能生成有關(guān)基因功能的假設(shè),分析基因列表并進(jìn)行功能分析。本研究利用String數(shù)據(jù)庫(kù)初步探索CLEC16A信號(hào)轉(zhuǎn)導(dǎo)通路,以構(gòu)建相關(guān)蛋白網(wǎng)絡(luò)圖。
1.2.6基因富集分析(GSEA) 根據(jù)TCGA數(shù)據(jù)庫(kù)中CLEC16A表達(dá)中位值將其分為低、高表達(dá)組,隨后應(yīng)用GSEA軟件(4.2.2版)對(duì)試驗(yàn)組CLEC16A高低之間差異基因進(jìn)行KEGG富集分析,置換檢驗(yàn)設(shè)置為1000次,將FDR<0.02的基因集作為顯著富集基因集,對(duì)CLEC16A在KIPAN發(fā)展的機(jī)制進(jìn)行初步探究。
1.3統(tǒng)計(jì)學(xué)處理 采用數(shù)據(jù)庫(kù)默認(rèn)的統(tǒng)計(jì)學(xué)方法,使用R軟件進(jìn)行統(tǒng)計(jì)分析與應(yīng)用,通過非配對(duì)的Wilcoxon Rank Sum和Signed Rank Tests進(jìn)行差異顯著性分析,分析正常組織和癌癥組織中CLEC16A的表達(dá)。使用Logrank test進(jìn)行統(tǒng)計(jì)檢驗(yàn)以獲得預(yù)后顯著性。GEPIA數(shù)據(jù)庫(kù)的結(jié)果顯示為風(fēng)險(xiǎn)比(HR)。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
2.1CLEC16A基因在不同腫瘤類型中的表達(dá)情況 從UCSC數(shù)據(jù)庫(kù)獲得樣本數(shù)據(jù),挖掘處理后最終獲得了26個(gè)癌種的表達(dá)數(shù)據(jù)。在12種腫瘤中觀察到了CLEC16A基因顯著上調(diào),如宮頸鱗癌和腺癌(CESC)、乳腺浸潤(rùn)癌(BRCA)、胃和食管癌(STES)、腎乳頭狀細(xì)胞癌(KIRP)、胃癌(STAD)、子宮內(nèi)膜癌(UCEC)、頭頸鱗狀細(xì)胞癌(HNSC)、肝細(xì)胞肝癌(LIHC)、甲狀腺癌(THCA)、膀胱尿路上皮癌(BLCA)、腎嫌色細(xì)胞癌(KICH)、膽管癌(CHOL);在5種腫瘤中觀察到了顯著下調(diào)如多形成性膠質(zhì)細(xì)胞瘤(GBM)、肺腺癌(LUAD)、KIPAN、腎透明細(xì)胞癌(KIRC)、肺鱗癌(LUSC),見圖1。
2.2CLEC16A表達(dá)預(yù)后分析 在TARGET-LAML(n=142,P=0.0028,HR=1.58)、TCGA-SKCM-M(n=347,P=0.01,HR=1.45)及TCGA-LAML(n=209,P=0.000 2,HR=1.42)3個(gè)腫瘤類型中高表達(dá)的預(yù)后差,在TCGA-GBMLGG(n=619,P=2.9×10-18,HR=0.49)和TCGA-KIPAN(n=855,P=0.000 59,HR=0.74)2個(gè)腫瘤類型中低表達(dá)的預(yù)后差,見表1??偵嫫?OS)結(jié)果顯示,CLEC6A是GBMLGG和KIPAN患者的保護(hù)因子,也是SKCM和LAML患者的風(fēng)險(xiǎn)因子。此外,用同樣的方法獲得包括KIPAN在內(nèi)的多個(gè)癌種表達(dá)數(shù)據(jù)及對(duì)應(yīng)樣本的Disease-specific survival數(shù)據(jù),最終觀察到在1個(gè)腫瘤類型TCGA-SKCM-M(n=341,P=0.03,HR=1.41)中高表達(dá)的預(yù)后差,在TCGA-GBMLGG(n=598,P=1.4×10-16,HR=0.49)、TCGA-KIPAN(n=840,P=0.001 7,HR=0.71)、TCGA-HNSC(n=485,P=0.04,HR=0.73)和TCGA-SKCM-P(n=97,P=0.05,HR=0.40)4個(gè)腫瘤類型中低表達(dá)的預(yù)后差,見表2。DSS分析顯示,CLEC6A是GBMLGG、KIPAN、HNSC和SKCM患者的保護(hù)因子,也是SKCM患者的風(fēng)險(xiǎn)因子。
表1 CLEC16A在TCGA泛癌中對(duì)OS的單變量COX回歸結(jié)果
續(xù)表1 CLEC16A在TCGA泛癌中對(duì)OS的單變量COX回歸結(jié)果
表2 CLEC16A在TCGA泛癌中DSS的單變量COX回歸結(jié)果
續(xù)表2 CLEC16A在TCGA泛癌中DSS的單變量COX回歸結(jié)果
2.3CLEC16A在正常和KIPAN癌組織的差異 在TCGA數(shù)據(jù)庫(kù)中對(duì)KIPAN組織(893例)及正常組織(128例)在mRNA水平上的表達(dá)情況進(jìn)行比較,結(jié)果表明,CLEC16A在KIPAN組織中的表達(dá)水平顯著低于正常組織,差異有統(tǒng)計(jì)學(xué)意義(P<0.05),見圖2。
2.4CLEC16A表達(dá)量與KIPAN患者臨床特征的關(guān)系 在TCGA中的851個(gè)KIPAN樣本的病理分級(jí)進(jìn)行分析,結(jié)果顯示,CLEC16A在KIPAN中的表達(dá)隨著腫瘤分期的增加而增加,見圖3。
2.5CLEC16A不同表達(dá)量的KIPAN患者預(yù)后比較 在432例KIPAN患者中,CLEC16A高表達(dá)組的總生存率、無(wú)進(jìn)展生存率均高于低表達(dá)組,差異均有統(tǒng)計(jì)學(xué)意義(P<0.05)。CLEC16A表達(dá)與KIPAN患者總體生存率明顯相關(guān),低表達(dá)組相對(duì)于高表達(dá)組具有更高的生存率,見圖4、圖5。
2.6構(gòu)建CLEC16A相互作用蛋白網(wǎng)絡(luò) 通過String數(shù)據(jù)庫(kù)分析得到與CLEC16A相互作用的蛋白網(wǎng)絡(luò),見圖6。選取PPI相關(guān)且P為1.38×10-8的數(shù)個(gè)蛋白質(zhì),使平均網(wǎng)絡(luò)局部聚類系數(shù)為0.639,得到TMF1、USP8、SH2B3、ERBB3、RNF41、PTPN22等31個(gè)蛋白質(zhì),主要參與的生物學(xué)過程有肌動(dòng)蛋白皮質(zhì)補(bǔ)丁定位、自噬體成熟負(fù)調(diào)控、線粒體自噬負(fù)調(diào)控,減數(shù)分裂重組中間體拆分等。
2.7基因富集分析 為了研究CLEC16A基因?qū)τ谀I癌可能的作用機(jī)制,將試驗(yàn)組胃癌樣本CLEC16A表達(dá)量按中位值分為高表達(dá)和低表達(dá)組,將2組的表達(dá)數(shù)據(jù)進(jìn)行GSEA。結(jié)果表明,CLEC16A高表達(dá)腫瘤樣本在溶酶體和氧化磷酸化等生物學(xué)過程或通路存在富集。而CLEC16A低表達(dá)組在抗原加工及呈遞、產(chǎn)生免疫球蛋白A(IgA)腸道免疫網(wǎng)絡(luò)、白細(xì)胞跨內(nèi)皮遷移、NOD樣受體信號(hào)通路、自然殺傷細(xì)胞介導(dǎo)的細(xì)胞毒性等信號(hào)通路存在富集。
ASLAN等[13]的研究表明,早期RCC的5年生存率良好,但由于小的RCC通常無(wú)癥狀,故早期診斷較困難,等患者出現(xiàn)明顯臨床癥狀時(shí)多為晚期。其診斷效果差,導(dǎo)致患者療效不佳、預(yù)后不良。盡管診斷技術(shù)水平不斷提高,仍有1/3的患者在確診時(shí)已為晚期[14]。根治性切除術(shù)是局限性RCC患者的首選治療方式,但在根治術(shù)后仍有很大可能發(fā)生轉(zhuǎn)移。由于RCC對(duì)化療及放療均不敏感,晚期RCC術(shù)后往往還需要靶向治療或免疫治療的輔助。RCC的發(fā)生、發(fā)展與缺氧信號(hào)通路有密切關(guān)系,缺氧誘導(dǎo)轉(zhuǎn)錄因子(HIF)是由調(diào)節(jié)型亞基α和組成型亞基β構(gòu)成的異源二聚體。HIF-α水平有明顯的氧依賴性,當(dāng)氧濃度升高時(shí),HIF-α可發(fā)生羥基化進(jìn)而被泛素連接酶VHL識(shí)別而發(fā)生泛素化,從而導(dǎo)致HIF-α被蛋白酶體識(shí)別而降解。而當(dāng)?shù)脱鯐r(shí),HIF-α羥基化酶活性降低,HIF-α降解減少蛋白水平增加,VHL失活造成HIF-α持續(xù)保持在較高水平,導(dǎo)致RCC的發(fā)生[15]。同時(shí),HIF可以調(diào)節(jié)Treg細(xì)胞、T輔助細(xì)胞等多種免疫細(xì)胞的功能進(jìn)而影響腫瘤微環(huán)境調(diào)控腫瘤生長(zhǎng)[16]。腫瘤抑制基因VHL是E3泛素連接酶復(fù)合物的重要組成部分,可靶向催化羥基化修飾的HIF-α亞基泛素化和蛋白酶體降解[17-19]。此外,哺乳動(dòng)物雷帕霉素靶蛋白(mTOR)是一種重要的絲氨酸/蘇氨酸蛋白激酶,其介導(dǎo)的信號(hào)傳導(dǎo)通路參與蛋白質(zhì)翻譯、核糖體生物合成等過程,維持細(xì)胞生長(zhǎng)、繁殖與凋亡平衡,是細(xì)胞代謝、增殖、生長(zhǎng)和存活的中心調(diào)節(jié)分子[20]。在內(nèi)皮細(xì)胞中,存在與血管內(nèi)皮生長(zhǎng)因子(VEGF)結(jié)合的受體酪氨酸激酶RTK,通過激活絲裂原活化蛋白激酶(MAPK)和PI3K/AKT/mTOR信號(hào)通路[21],而解除該復(fù)合物對(duì)mTOR復(fù)合物1(mTORC1)抑制,活化的mTORC1通過調(diào)節(jié)代謝、翻譯、細(xì)胞自噬等多種過程來協(xié)調(diào)細(xì)胞生長(zhǎng),增加細(xì)胞適應(yīng)性。生理?xiàng)l件下,該通路受到嚴(yán)格控制,負(fù)調(diào)節(jié)喪失是多種癌癥發(fā)生的重要原因之一[22-23]。
位于染色體16p13的CLEC16A是C型凝集素結(jié)構(gòu)域家族的一員,編碼1 053個(gè)氨基酸的大蛋白,包含數(shù)個(gè)假定的功能域,以及C型凝集素結(jié)構(gòu)域[9],在多種代謝過程中發(fā)揮作用。CLEC16A具有E3泛素連接酶的性質(zhì),已被證明在自噬和線粒體自噬過程中發(fā)揮作用,可與NRDP1和USP85形成泛素依賴型復(fù)合物。TAM等[24]將CLEC16A基因在小鼠中全身敲除后,發(fā)現(xiàn)多種線粒體相關(guān)的蛋白被上調(diào)或下調(diào)。HUA等[25]通過異位表達(dá)和siRNA沉默,發(fā)現(xiàn)CLEC16A可能通過激活mTOR通路來調(diào)節(jié)自噬,CLEC16A的過表達(dá)導(dǎo)致mTOR活性升高,進(jìn)而降低LC3自噬活性。另一方面,CLEC16A缺乏會(huì)延遲mTOR活性,從而導(dǎo)致自噬反應(yīng)增強(qiáng)。CLEC16A可作用于TSC1/2下游,增強(qiáng)mTORC1的活性,表現(xiàn)為同時(shí)增強(qiáng)磷酸化多個(gè)直接靶標(biāo),包括ULK、4E-BP1和S6K[26]。mTOR抑制劑已經(jīng)廣泛應(yīng)用于腫瘤靶向治療、器官移植、類風(fēng)濕關(guān)節(jié)炎等疾病的研究[27],但臨床治療中癌癥對(duì)mTOR靶向抑制劑治療卻不敏感或沒有反應(yīng)[28]。因此,深入探索腎癌發(fā)病潛在的分子機(jī)制至關(guān)重要,找到新的潛在治療靶標(biāo)具有關(guān)鍵的實(shí)際臨床意義。
USCS、TCGA、GTEx、String數(shù)據(jù)庫(kù)是目前較為全面的基因芯片數(shù)據(jù)平臺(tái),從中可以獲取大量臨床樣本信息數(shù)據(jù)。由于目前尚缺乏CLEC16A與KIPAN的文獻(xiàn)報(bào)道,本研究中首先在上述數(shù)據(jù)庫(kù)中獲取了CLEC16A在各個(gè)癌癥組織中的表達(dá)數(shù)據(jù),結(jié)果顯示,在大部分癌癥中CLEC16A高表達(dá),但在包括KIPAN在內(nèi)的5種癌種中顯著低表達(dá),表明CLEC16A是KIPAN的保護(hù)因子。對(duì)CLEC16A在KIPAN中的表達(dá)水平和預(yù)后進(jìn)行深度挖掘和分析,CLEC16A在KIPAN中較正常組織低表達(dá),且CLEC16A的表達(dá)量與預(yù)后呈負(fù)相關(guān)。進(jìn)一步通過GEPIA數(shù)據(jù)庫(kù)驗(yàn)證,結(jié)果一致,即CLEC16A高表達(dá)患者的OS較CLEC16A低表達(dá)患者明顯縮短。本研究觀察到,隨著KIPAN病理分級(jí)的增加,CLEC16A表達(dá)量顯著降低,差異有統(tǒng)計(jì)學(xué)意義(P<0.05)。GESA結(jié)果顯示,CLEC16A高表達(dá)組在溶酶體和氧化磷酸化等生物學(xué)過程或通路存在富集;而CLEC16A低表達(dá)組在抗原加工及呈遞、產(chǎn)生IgA的腸道免疫網(wǎng)絡(luò)、白細(xì)胞跨內(nèi)皮遷移、NOD樣受體信號(hào)通路、自然殺傷細(xì)胞介導(dǎo)的細(xì)胞毒性等信號(hào)通路存在富集。CLEC16A很可能在KIPAN發(fā)生、發(fā)展中發(fā)揮重要作用,成為靶向治療的新方向。
本研究與既往的利用體外實(shí)驗(yàn)技術(shù)分析研究腫瘤生長(zhǎng)模式不同,通過對(duì)多個(gè)數(shù)據(jù)庫(kù)的數(shù)據(jù)挖掘分析,減小由于樣本量不足與地理環(huán)境等差異導(dǎo)致的不可控變量影響,相關(guān)結(jié)果可作為臨床試驗(yàn)的前瞻研究與重要補(bǔ)充,但CLEC16A是否在KIPAN的發(fā)生、發(fā)展中發(fā)揮作用還需進(jìn)一步試驗(yàn)驗(yàn)證。