周仁龍 鐘靖 唐丹丹
1深圳市龍華區(qū)中心醫(yī)院輸血科 518100;2邵陽(yáng)市中心醫(yī)院輸血科 422000 ;3深圳市南山區(qū)醫(yī)療集團(tuán)總部 518000
腎細(xì)胞癌(renal cell carcinoma,RCC)是最常見(jiàn)的實(shí)體腎病變之一,占腎臟惡性腫瘤的90%和所有癌癥的3%[1-2]。KIRC是最常見(jiàn)的病理分類,約占RCC的80%[3-4]。近年來(lái),由于對(duì)KIRC的分子生物學(xué)和遺傳學(xué)研究的廣泛深入,以及對(duì)其發(fā)生發(fā)展機(jī)制的認(rèn)識(shí)提高,KIRC靶向治療和免疫檢查點(diǎn)抑制劑治療取得了多項(xiàng)突破和巨大進(jìn)展[5]。然而,總體無(wú)病生存率的提高仍然非常有限,晚期KIRC仍然具有較高的死亡率[6]。因此,在KIRC進(jìn)展和病理生理過(guò)程中識(shí)別一些精確的生物標(biāo)志物對(duì)于改善KIRC的診斷和預(yù)后至關(guān)重要[7]。近年來(lái)轉(zhuǎn)錄組圖譜的長(zhǎng)足發(fā)展,提供了強(qiáng)大的數(shù)據(jù),使研究人員能夠下載癌癥數(shù)據(jù),通過(guò)生物信息學(xué)技術(shù)進(jìn)行全面分析[8]。此外,生物信息學(xué)方法的應(yīng)用能促進(jìn)潛在特異性標(biāo)記物的鑒定,以方便對(duì)特定惡性腫瘤的早期診斷[7]。例如,癌癥基因組圖譜(the cancer genome atlas,TCGA)數(shù)據(jù)庫(kù)提供了公開(kāi)的癌癥基因組學(xué)數(shù)據(jù),包括RNA序列、拷貝數(shù)變異、DNA甲基化等,這使研究人員能夠在全面了解特定癌癥之前進(jìn)行初步分析[7]。
SLC14A1基因編碼的蛋白質(zhì)是一種介導(dǎo)紅細(xì)胞尿素轉(zhuǎn)運(yùn)的膜轉(zhuǎn)運(yùn)蛋白。SLC14A1基因構(gòu)成了Kidd血型系統(tǒng)的基礎(chǔ)。Kidd血型系統(tǒng)在臨床上具有重要意義[9],JK抗原抗體可導(dǎo)致溶血性輸血反應(yīng)和新生兒溶血病[10]。它們是遲發(fā)性輸血反應(yīng)的常見(jiàn)原因。最新研究表明,Kidd血型基因SLC14A1與多種腫瘤的發(fā)展密切相關(guān)[11]。如與正常前列腺上皮細(xì)胞和癌旁組織相比,SLC14A1在前列腺癌細(xì)胞和組織中的表達(dá)明顯降低,高表達(dá)SLC14A1可延長(zhǎng)前列腺癌患者的生存時(shí)間[12]。與正常癌旁組織相比在非小細(xì)胞肺癌(nonsmall cell lung cancer,NSCLC)中SLC14A1呈低表達(dá),SLC14A1低表達(dá)提示NSCLC患者預(yù)后不良[13]。但是Kidd血型基因SLC14A1在KIRC中的表達(dá)和臨床意義并不很清楚,為此,本文采用生物信息學(xué)分析方法探討SLC14A1在KIRC中表達(dá)變化及其臨床意義。
圖1 SLC14A1基因在不同腫瘤中的表達(dá)量
基因表達(dá)譜交互分析(gene expression profiling interactive analysis,GEPIA,http://gepia.cancerpku.cn/)是基于TCGA和GTEx數(shù)據(jù)提供快速和可定制的功能[14]。GEPIA提供關(guān)鍵的交互式和可定制的功能,包括差異表達(dá)分析、譜圖繪制、相關(guān)性分析、患者生存分析、相似基因檢測(cè)和降維分析。通過(guò)GEPIA的簡(jiǎn)單點(diǎn)擊進(jìn)行全面的表達(dá)分析,極大地促進(jìn)了廣泛研究領(lǐng)域的數(shù)據(jù)挖掘、科學(xué)討論和治療發(fā)現(xiàn)過(guò)程。GEPIA填補(bǔ)了癌癥基因組大數(shù)據(jù)與向終端用戶提供綜合信息之間的空白,有助于釋放當(dāng)前數(shù)據(jù)資源的價(jià)值[15]。
Sangerbox數(shù)據(jù)庫(kù)(http://vip.sangerbox.com),一個(gè)基于網(wǎng)絡(luò)的工具平臺(tái)[16]。用戶可以在一個(gè)友好的交互頁(yè)面中進(jìn)行不同的分析,平臺(tái)提供可交互的圖形化分析工具,包括相關(guān)性分析工具,通路富集分析、WGCNA分析等常見(jiàn)的工具和功能[17]。
TIMER數(shù)據(jù)庫(kù)(http://timer.comp-genomics.org/timer/)是系統(tǒng)分析不同癌癥類型免疫細(xì)胞浸潤(rùn)水平的綜合資源[18]。該數(shù)據(jù)庫(kù)提供了多種免疫去卷積方法估計(jì)免疫浸潤(rùn)豐富度,允許用戶動(dòng)態(tài)生成高質(zhì)量的圖像,全面探索腫瘤的免疫學(xué)、臨床和基因組特征。
UALCAN數(shù)據(jù)庫(kù)是一個(gè)全面的、用戶友好的、交互式的網(wǎng)絡(luò)資源,用于分析癌癥組學(xué)數(shù)據(jù)包括差異分析、生存分析和相關(guān)分析,又能做表觀分析,還能做基因的蛋白水平差異分析和miRNA、lincRNA相關(guān)分析[19]。
STRING數(shù)據(jù)庫(kù)(網(wǎng)址為https://string-db.org/)旨在整合所有已知和預(yù)測(cè)的蛋白質(zhì)之間的關(guān)聯(lián),包括物理相互作用和功能關(guān)聯(lián)[20]。
基于TCGA數(shù)據(jù)集(https://portal.gdc.com),獲得了SLC14A1基因在KIRC組織中的RNAseq數(shù)據(jù)(level 3),以及相應(yīng)的臨床信息。使用單變量和多變量Cox回歸分析,并通過(guò)“forestplot”包顯示每個(gè)變量(P值,HR和95%CI)。根據(jù)多變量Cox比例風(fēng)險(xiǎn)分析的結(jié)果,通過(guò)與每個(gè)風(fēng)險(xiǎn)因素的相關(guān)性來(lái)計(jì)算患者的預(yù)后風(fēng)險(xiǎn)。
對(duì)于基因集功能富集分析我們使用R軟件包org.Hs.eg.db (version 3.1.0)中的基因的KEGG和GO注釋,以此作為背景,將基因映射到背景集合中,使用R軟件包聚類分析器 (clusterProfiler,version 3.14.3) 進(jìn)行富集分析,以獲得基因集富集的結(jié)果。設(shè)定最小基因集為5,最大基因集為5 000,P<0.05有統(tǒng)計(jì)學(xué)意義。
使用R軟件(version 3.6.4)計(jì)算了每個(gè)腫瘤中正常樣本和腫瘤樣本的表達(dá)差異,使用非配對(duì)的威爾科克森符號(hào)秩檢驗(yàn)和符號(hào)秩和檢驗(yàn)進(jìn)行差異顯著性分析。差異檢驗(yàn)使用配對(duì)T檢驗(yàn),離群樣本使用差值的1.5倍四分位距進(jìn)行評(píng)估,正態(tài)性檢驗(yàn)使用Shapiro-Wilk正態(tài)性檢驗(yàn)單變量和多變量Cox回歸分析并通過(guò)“forestplot”包使用森林圖來(lái)顯示每個(gè)變量(P值,HR和95%CI),當(dāng)P<0.05表示差異有統(tǒng)計(jì)學(xué)意義。
從UCSC(https://xenabrowser.net/)數(shù)據(jù)庫(kù)中下載統(tǒng)一標(biāo)準(zhǔn)化的泛癌數(shù)據(jù)集:TCGA TARGET GTEx(PANCAN,N=19 131,G=60 499),進(jìn)一步的從中提取了ENSG00000141469 (SLC14A1)基因在各個(gè)樣本中的表達(dá)數(shù)據(jù),進(jìn)一步的篩選了樣本來(lái)源為:實(shí)體組織正常樣本、原發(fā)性實(shí)體腫瘤、原發(fā)性腫瘤、正常組織、原發(fā)性血液源性癌癥-骨髓和原發(fā)性血液源性癌癥-外周血更進(jìn)一步的對(duì)每一個(gè)表達(dá)值進(jìn)行了log2(x+0.001)變換,最后我們還剔除了單個(gè)癌種中樣本個(gè)數(shù)小于3個(gè)的癌種,最終獲得了34個(gè)癌種的表達(dá)數(shù)據(jù),如圖A所示。使用R軟件(version 3.6.4)計(jì)算了每個(gè)腫瘤中正常樣本和腫瘤樣本的表達(dá)差異,使用非配對(duì)的威爾科克森符號(hào)秩檢驗(yàn)和符號(hào)秩檢驗(yàn)進(jìn)行差異顯著性分析,我們?cè)?種腫瘤中觀察到了顯著上調(diào)我們?cè)?2種腫瘤中觀察到了顯著下調(diào)(具體結(jié)果見(jiàn)圖A和表1)。其中KIRC患者中SLC14A1的mRNA低表達(dá)(如圖紅色箭頭所指,KIRC表達(dá)量1.35±1.69,正常組織中表達(dá)量3.90±2.47,P<0.05),用GEPIA數(shù)據(jù)庫(kù)、TCGA數(shù)據(jù)和168對(duì)癌與正常癌旁驗(yàn)配對(duì)T檢驗(yàn)驗(yàn)證得到了相同的結(jié)果,KIRC患者中SLC14A1的mRNA低表達(dá)如圖B、C和D所示。
表1 SLC14A1在泛癌中的表達(dá)量
在GEPIA和UALCAN數(shù)據(jù)庫(kù)中分別分析SLC14A1基因在KIRC分期(stage)、分級(jí)(grade)、啟動(dòng)子甲基化(promoter methylation)、亞型(ccA和ccB)和淋巴結(jié)的轉(zhuǎn)移(node metastasis)臨床特征(見(jiàn)圖2)。結(jié)果顯示KIRC分4期和4級(jí),在KIRC患者中隨著分期和分級(jí)越高,SLC14A1基因表達(dá)量越來(lái)越低,差異有統(tǒng)計(jì)學(xué)意義(P<0.05)。在正常組織中的啟動(dòng)子甲基化水平相比KIRC高,差異具有統(tǒng)計(jì)學(xué)意義(P<0.05)。啟動(dòng)子甲基化水平失衡可能與KIRC發(fā)生發(fā)展密切相關(guān)。在正常組織中與KIRC亞型(ccA和ccB)相比SLC14A1表達(dá)量較高,差異具有統(tǒng)計(jì)學(xué)意義(P<0.05),但是亞型ccA和ccB之間沒(méi)有統(tǒng)計(jì)學(xué)意義(P>0.05)。N0是指無(wú)區(qū)域淋巴結(jié)轉(zhuǎn)移,N1是指1~3個(gè)腋窩淋巴結(jié)轉(zhuǎn)移。在正常組織中SLC14A1表達(dá)量高于KIRC中N0和N1,差異具有統(tǒng)計(jì)學(xué)意義(P<0.05),但是N0和N1相比表達(dá)量差異沒(méi)有統(tǒng)計(jì)學(xué)意義(P>0.05)。
腫瘤與免疫是腫瘤學(xué)中一個(gè)快速發(fā)展的研究方向也是研究熱點(diǎn)[21]。本研究利用TIMER數(shù)據(jù)庫(kù)分析SLC14A1基因表達(dá)與KIRC免疫浸潤(rùn)細(xì)胞之間的相關(guān)性。腫瘤純度(purity)、B細(xì)胞、CD8+ T細(xì)胞、CD4+ T細(xì)胞、巨噬細(xì)胞(macrophage)、中性粒細(xì)胞(neutrophil)、樹(shù)突狀細(xì)胞(dendritic cell)并通過(guò)腫瘤純度進(jìn)行了校正。結(jié)果顯示(圖3和表2),SLC14A1基因表達(dá)水平與KIRC中免疫細(xì)胞CD8+ T細(xì)胞、CD4+ T細(xì)胞、巨噬細(xì)胞、中性粒細(xì)胞、樹(shù)突狀細(xì)胞呈顯著正相關(guān)(P<0.05),而與B細(xì)胞呈負(fù)相關(guān),但是無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05)。
表2 SLC14A1基因表達(dá)水平與KIRC免疫細(xì)胞浸潤(rùn)水平的關(guān)系
圖3 SLC14A1基因表達(dá)水平與KIRC免疫細(xì)胞浸潤(rùn)水平的關(guān)系
KIRC患者根據(jù)最佳截?cái)嘀岛蚐LC14A1基因表達(dá)量分成高低兩組(“L”表示低表達(dá),“H”表示高表達(dá))高表達(dá)與低表達(dá)的生存曲線(又稱Kaplan-Meier曲線),分別分析患者總體生存期(overall survival,OS)、疾病特異性生存期(disease-specific survival,DSS)、無(wú)進(jìn)展間隔期(progression free interval,PFI)和無(wú)疾病間隔期(disease free interval,DFI)。結(jié)果顯示(見(jiàn)圖4)在KIRC中SLC14A1基因高表達(dá)患者的OS、DSS和PFI百分?jǐn)?shù)顯著高于低表達(dá)患者,提示在KIRC中SLC14A1低表達(dá)者預(yù)后不良(P<0.05),但是在DFI中沒(méi)有統(tǒng)計(jì)學(xué)意義(P=0.19)。
圖4 KIRC患者中SLC14A1表達(dá)水平與預(yù)后分析
細(xì)胞生命依賴于生物分子之間復(fù)雜的功能聯(lián)系網(wǎng)絡(luò)。在這些關(guān)聯(lián)中,蛋白質(zhì)-蛋白質(zhì)相互作用因其多功能性、特異性和適應(yīng)性而尤為重要[22],蛋白質(zhì)-蛋白質(zhì)相互作用在所有生物體的細(xì)胞功能和生物過(guò)程中起著至關(guān)重要的作用[23]。因此本研究通過(guò)STRING數(shù)據(jù)庫(kù)分析了KIRC中SLC14A1蛋白上下游間的關(guān)系。結(jié)果顯示SLC14A1蛋白與UGT1A6、UGT1A8、UGT1A10、ZNF134、ATP6V1F、CFB、GATA1、SLC4A1、KEL和RHCE具有相互作用(見(jiàn)圖5)。其中UGT1A6、UGT1A8、UGT1A10這些蛋白屬于UDP-葡萄糖轉(zhuǎn)移酶家族,參與藥物代謝和解毒過(guò)程。ZNF134是一個(gè)轉(zhuǎn)錄因子,參與基因的轉(zhuǎn)錄調(diào)控。ATP6V1F是細(xì)胞質(zhì)膜上的一個(gè)亞單位,屬于ATP酶復(fù)合物,參與細(xì)胞內(nèi)物質(zhì)轉(zhuǎn)運(yùn)和酸堿平衡調(diào)節(jié)。CFB這是補(bǔ)體系統(tǒng)中的一個(gè)成分,參與免疫反應(yīng)和免疫調(diào)節(jié)。GATA1是一個(gè)轉(zhuǎn)錄因子,對(duì)血細(xì)胞發(fā)育和分化起重要作用。SLC4A1是細(xì)胞膜上的一個(gè)離子共轉(zhuǎn)運(yùn)蛋白,在維持酸堿平衡和離子穩(wěn)態(tài)中發(fā)揮重要作用。KEL和RHCE是紅細(xì)胞膜上的抗原分子,與血型相關(guān)。
圖5 SLC14A1蛋白相互作用的網(wǎng)路圖
圖6 單因素和多因素Cox回歸分析
圖7 富集分析KEGG和GO圖
單因素和多因素回歸分析是醫(yī)學(xué)研究中的重要的手段,其目的之一是探討多因素情況下,各個(gè)因素的獨(dú)立效應(yīng)。通過(guò)單變量Cox回歸結(jié)果顯示(見(jiàn)圖A)KIRC的發(fā)生發(fā)展與SLC14A1、年齡、分期(pT-stage,pN-stage 和pM-stage)、分級(jí)(Grade)相關(guān)(P<0.05)。多變量Cox回歸分析結(jié)果顯示(見(jiàn)圖B)KIRC的發(fā)生發(fā)展與年齡、分期(pM-stage)、分級(jí)(Grade)相關(guān)(P<0.05)。這些結(jié)果表明,SLC14A1可能在KIRC的發(fā)生和發(fā)展中發(fā)揮重要的作用,但其作用同時(shí)可能還受到其他因素的影響。
為了明確SLC14A1基因在KEGG和GO通路中的富集情況,進(jìn)一步理解基因的生物學(xué)功能和調(diào)控機(jī)制做了KEGG和GO富集分析,KEGG富集分析結(jié)果顯示,候選基因參與了代謝通路(metabolic pathways)、吞噬體(phagosome)、霍亂弧菌感染(vibrio cholerae infection)、幽門螺桿菌感染中的上皮細(xì)胞信號(hào)傳導(dǎo)(epithelial cell signaling in Helicobacter pylori infection)、突觸囊泡周期(synaptic vesicle cycle)、類風(fēng)濕性關(guān)節(jié)炎(rheumatoid arthritis)、氧化磷酸化(oxidative phosphorylation)、人乳頭瘤病毒感染(human papillomavirus infection)、集合管酸分泌(collecting duct acid secretion)和mTOR信號(hào)通路(mTOR signaling pathway),其中代謝途徑通路占主導(dǎo)地位(圖A)。GO富集分析結(jié)果顯示候選基因參與了吞噬體酸化(phagosome acidification)、三價(jià)鐵運(yùn)輸(ferric iron transport)、轉(zhuǎn)鐵蛋白運(yùn)輸(transferrin transport)、三價(jià)無(wú)機(jī)陽(yáng)離子轉(zhuǎn)運(yùn)(trivalent inorganic cation transport)和ATP水解偶聯(lián)質(zhì)子轉(zhuǎn)運(yùn)(ATP hydrolysis coupled ion transmembrane transport)等。其中吞噬體酸化、三價(jià)鐵運(yùn)輸、轉(zhuǎn)鐵蛋白轉(zhuǎn)運(yùn)占主導(dǎo)地位(圖B)。
在臨床診療中KIRC往往缺乏典型的早期臨床表現(xiàn),當(dāng)出現(xiàn)腎癌的典型“三聯(lián)征”(血尿、背痛和腹部包塊)時(shí),約60%的患者至少已達(dá)到T3期[11]。當(dāng)出現(xiàn)發(fā)熱、快速血沉、高鈣血癥、紅細(xì)胞增多、貧血、體重減輕、精索靜脈曲張等癥狀時(shí),約25%~30%的患者出現(xiàn)局部淋巴結(jié)轉(zhuǎn)移[11]。KIRC自然病程3年生存率不足5%,平均生存時(shí)間僅為3~33個(gè)月[11]。因此,早期診斷KIRC非常重要。目前臨床上缺乏有效的腎癌分子標(biāo)志物。因此尋找潛在的新的分子標(biāo)志物,對(duì)于提高KIRC的診療水平至關(guān)重要。
Kidd血型系統(tǒng)于1951年被發(fā)現(xiàn)[24],由Jka和Jkb兩種對(duì)立抗原,以及第3種高發(fā)抗原Jk3組成。Kidd血型有4種表型:Jk(a+b-),Jk(a-b+),Jk(a+b+)和Jk(a-b-),編碼Kidd抗原的糖蛋白是一個(gè)43kDa,389個(gè)氨基酸的蛋白,具有10個(gè)跨膜結(jié)構(gòu)域,在腎髓質(zhì)直小血管上皮細(xì)胞和紅細(xì)胞上發(fā)揮尿素轉(zhuǎn)運(yùn)蛋白的功能。編碼該糖蛋白的基因?yàn)镴K(SLC14A1) 基因定位于染色體18q12-q21[25]。其中JK(a-b-)是一種極其罕見(jiàn)的血型,在我國(guó)人口中的比例低于萬(wàn)分之一,因此被歸類為稀有血型。Kidd抗原的免疫原性相對(duì)較弱,這也意味著Kidd抗體的出現(xiàn)并不常見(jiàn)[26]。然而,Kidd抗體卻以其“惡名昭著”而聞名。它能引發(fā)嚴(yán)重的輸血反應(yīng),在產(chǎn)生后會(huì)迅速減少到非常低的水平,以至于難以檢測(cè)到,就像一個(gè)善于隱身的“忍者”。SLC14A1基因在腫瘤發(fā)生發(fā)展中的作用機(jī)制尚不清楚,其研究主要在膀胱癌上,以往關(guān)于SLC14A1基因研究多注重在其編碼的Kidd血型系統(tǒng)上,Kidd血型系統(tǒng)抗體以IgG類免疫性抗體為主,多由輸血或妊娠產(chǎn)生,在臨床上常誘發(fā)遲發(fā)性溶血反應(yīng)[26]。如對(duì)于產(chǎn)生不規(guī)則抗體Kidd血型系統(tǒng)抗體患者,交叉配血時(shí)未規(guī)避相應(yīng)抗原,會(huì)迅速引發(fā)回憶反應(yīng),抗體效價(jià)劇增,最終引起嚴(yán)重溶血反應(yīng)[27]。
本研究借助TCGA數(shù)據(jù)庫(kù),運(yùn)用生物信息學(xué)和多個(gè)獨(dú)立數(shù)據(jù)分析探討Kidd血型SLC14A1基因在KIRC中的表達(dá)水平、患者臨床病理特征的相關(guān)性、亞型ccA/ccB和預(yù)后等。結(jié)果顯示在大多數(shù)KIRC中,SLC14A1基因呈現(xiàn)低表達(dá),與KIRC的發(fā)生、進(jìn)展和不良預(yù)后相關(guān)。通過(guò)對(duì)SLC14A1基因表達(dá)與KIRC免疫浸潤(rùn)細(xì)胞之間的相關(guān)性進(jìn)行分析。分別對(duì)CD8+T細(xì)胞、B細(xì)胞、CD4+T細(xì)胞、巨噬細(xì)胞、中性粒細(xì)胞、樹(shù)突狀細(xì)胞進(jìn)行研究。這些結(jié)果暗示了SLC14A1基因在調(diào)控KIRC腫瘤微環(huán)境中的免疫反應(yīng)中的重要性。對(duì)其進(jìn)一步的研究可能有助于揭示SLC14A1基因在KIRC發(fā)展和治療中的潛在作用,并為免疫治療策略的開(kāi)發(fā)提供新的靶點(diǎn)?;蚪M啟動(dòng)子DNA甲基化組的動(dòng)態(tài)失調(diào)是癌癥的一個(gè)特征[28],本研究對(duì)啟動(dòng)子甲基化進(jìn)行了研究,KIRC是由異常的甲基化引起的,并且與患者的生存可能具有一定的相關(guān)性。根據(jù)以上分析結(jié)果提示SLC14A1在KIRC中發(fā)揮抑癌作用。SLC14A1可能是KIRC新的分子標(biāo)志物和治療的潛在靶點(diǎn)。然而本研究也存在一些不足,其數(shù)據(jù)僅來(lái)自公共數(shù)據(jù)庫(kù)TCGA數(shù)據(jù),沒(méi)有進(jìn)一步的做實(shí)驗(yàn)驗(yàn)證。期待未來(lái)有更多的研究能夠揭示更多關(guān)于Kidd血型系統(tǒng)與臨床輸血和疾病相關(guān)的生物學(xué)機(jī)制。
利益沖突所有作者均聲明不存在利益沖突