彭莉蓉,黎村艷,史楊
(1.湖南師范大學(xué)附屬第一醫(yī)院檢驗(yàn)科,湖南 長(zhǎng)沙 410005;2.人類(lèi)干細(xì)胞國(guó)家工程研究中心,湖南 長(zhǎng)沙 410000)
目前,免疫檢查點(diǎn)阻斷治療對(duì)多種類(lèi)型腫瘤具有顯著的療效,但由于肝癌免疫微環(huán)境的復(fù)雜性以及耐受狀態(tài)導(dǎo)致肝細(xì)胞癌(hepatocellular carcinoma,HCC)患者的應(yīng)答率要比其他腫瘤較低[1]。因此,深入地了解肝癌的免疫微環(huán)境和免疫調(diào)控關(guān)系有助于發(fā)掘新的治療靶點(diǎn)和提高臨床治療效果。隨著lncRNA研究的拓展,越來(lái)越多的報(bào)道開(kāi)始闡述lncRNA 在肝癌免疫調(diào)控過(guò)程中的作用。如lncRNA Lnc-Tim3通過(guò)與Tim-3 結(jié)合并誘導(dǎo)Bat3 核轉(zhuǎn)位,從而加劇HCC 中CD8+T 細(xì)胞衰竭[2]。LncRNA FENDRR 可以通過(guò)海綿作用吸附miR-423-5p 上調(diào)GADD45B,從而抑制Treg 介導(dǎo)的肝癌免疫逃逸[3]。肝癌患者移植瘤模型發(fā)現(xiàn)lnc-EGFR 在Treg 細(xì)胞中上調(diào),且與腫瘤大小、EGFR/Foxp3 表達(dá)成正比,機(jī)制上lnc-EGFR以EGFR 依賴(lài)的方式促進(jìn)Treg 細(xì)胞分化、抑制CTL的活性從而促進(jìn)肝癌生長(zhǎng)[4]。以上研究都從不同程度上揭示了lncRNA 對(duì)肝癌免疫微環(huán)境的影響,但由于lncRNA 的表達(dá)具有明顯的組織和發(fā)育階段特異性,從單個(gè)細(xì)胞水平上系統(tǒng)分析lncRNA 的表達(dá)有助于在高度復(fù)雜的肝癌微環(huán)境中更詳細(xì)地了解這些lncRNA 分子在免疫細(xì)胞中的表達(dá)特性。為此,本研究聯(lián)合單細(xì)胞轉(zhuǎn)錄組測(cè)序數(shù)據(jù)和TCGA 數(shù)據(jù)描繪了肝癌免疫細(xì)胞中l(wèi)ncRNA 的分布情況,篩選重要的lncRNA 分子并建立預(yù)后模型,為臨床免疫治療提供更為充分的理論依據(jù)和更為精準(zhǔn)的預(yù)后判斷指標(biāo)。
1.1 單細(xì)胞數(shù)據(jù)分析 單細(xì)胞數(shù)據(jù)來(lái)源于GEO 數(shù)據(jù)庫(kù)中的GSE140228[5],從該數(shù)據(jù)中挑選有腫瘤及癌旁數(shù)據(jù)的3 個(gè)患者(DSM27、DSF22 和DSN09)的腫瘤及對(duì)應(yīng)癌旁單個(gè)CD45+細(xì)胞數(shù)據(jù)進(jìn)行分析。使用Seurat 包分析測(cè)序數(shù)據(jù),篩選出檢測(cè)到超過(guò)50 個(gè)基因的細(xì)胞,聯(lián)合SingleR 包計(jì)算結(jié)果以及細(xì)胞注釋文件推斷細(xì)胞類(lèi)型,基于PC 的鄰接距離進(jìn)行TSNE聚類(lèi)分析構(gòu)建圖形。按照過(guò)濾條件cutoff 值設(shè)定為|logFC(fold-change)|>0.5,P<0.05 得到差異基因。利用網(wǎng)站HCC(http://cancer-pku.cn:3838/HCC/)分析6 位肝癌患者(DSF22、DSF27、DSM22、DSM27、DSA12 以及DSN09)中腫瘤和癌旁中免疫細(xì)胞的分布情況,并分析患者中l(wèi)ncRNA 在不同細(xì)胞類(lèi)型中的豐度以及在不同組織類(lèi)型中的分布。
1.2 TCGA 數(shù)據(jù)分析與統(tǒng)計(jì) 利用GEPIA2(http://gepia2.cancer-pku.cn/#index)數(shù)據(jù)庫(kù)[6]的生存分析模塊分析lncRNA 的表達(dá)水平和患者總生存期(overall survival,OS)、無(wú)病生存期(disease-free survival,DFS)的關(guān)系。從TCGA 數(shù)據(jù)庫(kù)下載HCC lncRNA 的表達(dá)譜數(shù)據(jù)以及臨床信息。采用單變量Cox 回歸分析的風(fēng)險(xiǎn)比(HR)確定保護(hù)性lncRNA 和風(fēng)險(xiǎn)性lncRNA。隨后,基于單個(gè)預(yù)后相關(guān)lncRNA 表達(dá)譜數(shù)據(jù)及其系數(shù)構(gòu)建lncRNA 風(fēng)險(xiǎn)評(píng)分模型來(lái)預(yù)測(cè)預(yù)后價(jià)值。對(duì)lncRNA 進(jìn)行系數(shù)加權(quán),得到相應(yīng)的多變量Cox 分析,AIC(akaike information criterion)作為最優(yōu)模型選擇標(biāo)準(zhǔn)[7],由相應(yīng)的多變量Cox 分析得出公式如下:
根據(jù)風(fēng)險(xiǎn)評(píng)分將患者相應(yīng)地分為低、高風(fēng)險(xiǎn)組。Kaplan-Meier(K-M)生存曲線進(jìn)行分析。采用該lncRNA 模型對(duì)單個(gè)臨床因素進(jìn)行單變量和多變量Cox 比例風(fēng)險(xiǎn)回歸,計(jì)算HR 和95%置信區(qū)間(CI)。使用受試者工作特征曲線(receiver operating characteristic curve,ROC)檢測(cè)風(fēng)險(xiǎn)評(píng)分模型的預(yù)測(cè)能力[8]。
2.1 肝癌組織免疫細(xì)胞浸潤(rùn)情況及l(fā)ncRNA 的富集分析 通過(guò)分析GSE140228 數(shù)據(jù)中肝癌患者的腫瘤和癌旁組織免疫細(xì)胞浸潤(rùn)狀態(tài)發(fā)現(xiàn),與癌旁組織相比,腫瘤組織中C1QA+Mφ 細(xì)胞更為富集,而CD160+NK 細(xì)胞較為貧乏(圖1A、1B)。對(duì)lncRNA 表達(dá)的分析表明,腫瘤和癌旁免疫細(xì)胞中有51 個(gè)差異表達(dá)的lncRNA(P<0.05,|log2FC|≥2,圖1C)。
圖1 肝癌與癌旁免疫細(xì)胞及l(fā)ncRNA 分布情況
2.2 lncRNA 在肝癌微環(huán)境免疫細(xì)胞中的差異分布單細(xì)胞測(cè)序數(shù)據(jù)分析結(jié)果顯示,共有42 個(gè)lncRNA在肝癌微環(huán)境的不同免疫細(xì)胞中的富集存在差異,其中大部分差異lncRNA 如C5orf58、LINC00963、ADAMTSL4-AS1、NEAT1、C5orf66、SLC8A1-AS1 等在單核細(xì)胞(0 簇)中富集程度高;LINC00998 在C1QA+Mφ 細(xì)胞(1 簇)中豐度高;APOA1-AS、DANCR、LINC01485、RUSC1 -AS1、IGFBP7 -AS1、ACTA2-AS1 在GPX3+Mφ 細(xì)胞(5 簇)中富集(圖2A、2B、2C);結(jié)合圖1 的結(jié)果,共有34 個(gè)lncRNA 既在肝癌微環(huán)境免疫細(xì)胞簇表達(dá)有差異,又在腫瘤和癌旁組織免疫細(xì)胞中差異表達(dá)(圖2D)。
圖2 腫瘤組織中l(wèi)ncRNA 在免疫細(xì)胞中的分布
2.3 關(guān)鍵lncRNA 篩選 利用GEPIA 網(wǎng)站分析存在差異表達(dá)及分布的34 個(gè)lncRNA 與肝癌患者預(yù)后的關(guān)系,發(fā)現(xiàn)LINC00861、LINC01278、THUMPD3-AS1、LINC01138 和DANCR 與HCC 的OS 有關(guān)(圖3A);分析這5 個(gè)lncRNA 在GSE140228 數(shù)據(jù)中免疫細(xì)胞中的表達(dá)豐度,發(fā)現(xiàn)LINC00861 主要富集在CD4、CD8 T 細(xì)胞以及NK 細(xì)胞中,LINC01278 主要富集在NK 細(xì)胞中,THUPPD3-AS1 多富集在DC、ILC、IL7R+Mast 和MKI67+NK 細(xì)胞中,LINC01138多富集在IL7R+CD8 T 細(xì)胞和NK 細(xì)胞,DANCR 在B-Plasma 和DC、ILC 和GPX3+Mφ 細(xì)胞中豐度較高(圖3B)。高表達(dá)LINC00861 患者具有較好的OS 和DFS;LINC01278 的高表達(dá)與較差的OS 有關(guān),與DFS 無(wú)關(guān);高表達(dá)THUMPD3-AS1、LINC01138 和DANCR 的HCC 患者具有較低的OS 和DFS(圖3C,3D)。結(jié)合TCGA 數(shù)據(jù)庫(kù)中肝癌患者的臨床特征,采用單變量Cox 回歸模型分析其與預(yù)后的關(guān)系,結(jié)果顯示LINC00861 高表達(dá)的患者風(fēng)險(xiǎn)較低(P<0.05,HR=0.843),而DANCR、THUMPD3-AS1 以及LINC01138 高表達(dá)患者的風(fēng)險(xiǎn)較高(P<0.05,HR>1),LINC01278 與預(yù)后無(wú)相關(guān)性(P=0.408),與生存分析結(jié)果一致(圖3E)。
圖3 關(guān)鍵lncRNA 篩選
2.4 構(gòu)建預(yù)后模型 按照AIC 最優(yōu)模型選擇標(biāo)準(zhǔn),構(gòu)建由多個(gè)lncRNA 組成的預(yù)后模型,其中LINC01278 在上述標(biāo)準(zhǔn)篩選過(guò)程中被淘汰,得到由4 個(gè)lncRNA(LINC00861、DANCR、THUMPD3-AS1以及LINC01138)組成的風(fēng)險(xiǎn)評(píng)分模型來(lái)預(yù)測(cè)預(yù)后價(jià)值,公式如下:
根據(jù)風(fēng)險(xiǎn)值中位值將肝癌患者分為高風(fēng)險(xiǎn)組(n=185)和低風(fēng)險(xiǎn)組(n=185)并繪制生存曲線,結(jié)果顯示,高風(fēng)險(xiǎn)組相較低風(fēng)險(xiǎn)組具有較低的生存率(P<0.05),其5 年生存率分別為0.350 和0.605(圖4A);利用ROC 曲線評(píng)估構(gòu)建的模型作為預(yù)后指標(biāo)的能力,與患者的T 分期和stage 分期相比,該模型能較好的判斷患者的預(yù)后(AUC=0.754)(圖4B)。風(fēng)險(xiǎn)評(píng)分和基因表達(dá)數(shù)據(jù)的分布顯示,肝癌患者LINC00861 表達(dá)水平降低,LINC01138、THUMPD3-AS1 和DANCR 表達(dá)水平升高、風(fēng)險(xiǎn)得分和死亡人數(shù)增加(圖4C)。單因素及多因素Cox 分析評(píng)估臨床性狀或預(yù)測(cè)模型風(fēng)險(xiǎn)值與生存預(yù)后的關(guān)系,結(jié)果表明在單因素和多因素Cox 分析中該模型的風(fēng)險(xiǎn)得分均有統(tǒng)計(jì)學(xué)意義(圖4D、4E),該模型可以作為獨(dú)立預(yù)后因子用于HCC 患者預(yù)后判斷。
圖4 lncRNA 預(yù)后模型建立與評(píng)估
圖4 lncRNA 預(yù)后模型建立與評(píng)估(續(xù))
近年來(lái),隨著測(cè)序技術(shù)的發(fā)展,尤其是單細(xì)胞轉(zhuǎn)錄組測(cè)序技術(shù)的開(kāi)發(fā),使得研究者能夠精細(xì)地對(duì)腫瘤組織的細(xì)胞類(lèi)型進(jìn)行分類(lèi)以及測(cè)量單個(gè)細(xì)胞中基因表達(dá)水平,極大的推動(dòng)了腫瘤免疫學(xué)發(fā)展[9]。目前,單細(xì)胞轉(zhuǎn)錄組測(cè)序技術(shù)已經(jīng)應(yīng)用到了肝癌免疫狀態(tài)的研究,并取得了一些重要成果。研究人員發(fā)現(xiàn)特定細(xì)胞亞群如耗竭性CD8T 細(xì)胞和Treg 細(xì)胞優(yōu)先富集在HCC 中,其中在活化的CD8T 細(xì)胞和Treg 細(xì)胞中基因layilin 上調(diào)并且抑制CD8T 細(xì)胞的功能[10]。本研究分析了GSE140228 數(shù)據(jù)中腫瘤和癌旁組織免疫細(xì)胞的組成差異,發(fā)現(xiàn)C1QA+Mφ 細(xì)胞和Foxp3+CD4 T(對(duì)應(yīng)Treg 細(xì)胞)主要富集在腫瘤組織,而CD160+NK 細(xì)胞在正常組織中的豐度高于腫瘤組織。已有研究表明[5,11],NK 細(xì)胞、巨噬細(xì)胞以及Treg 細(xì)胞均與肝癌患者預(yù)后有關(guān),是否C1QA+Mφ細(xì)胞以及CD160+NK 細(xì)胞構(gòu)成的改變也在肝癌發(fā)展中發(fā)揮重要作用值得進(jìn)一步研究。
lncRNA 的表達(dá)具有明顯的時(shí)間和空間特異性,通過(guò)單細(xì)胞全轉(zhuǎn)錄組測(cè)序,研究人員揭示了lncRNA在體細(xì)胞重編輯過(guò)程中的重要作用以及l(fā)ncRNA 表達(dá)水平與時(shí)間序列的相關(guān)性[12]。如有研究通過(guò)利用單細(xì)胞轉(zhuǎn)錄組測(cè)序技術(shù)研究了不同發(fā)育階段的腦皮層細(xì)胞,發(fā)現(xiàn)不同發(fā)育階段以及同一發(fā)育階段的不同細(xì)胞中l(wèi)ncRNA 的表達(dá)分布有所差異。進(jìn)一步分析顯示,在由不同亞細(xì)胞群組成的組織中,相比mRNA,lncRNA 的表達(dá)水平更加離散分布[13],這提示在細(xì)胞水平研究lncRNA 是必要的。聯(lián)合單細(xì)胞測(cè)序分析和生物信息學(xué)功能分析,有研究構(gòu)建了造血干細(xì)胞發(fā)展的lncRNA 表達(dá)圖譜,并發(fā)現(xiàn)H19 對(duì)胚胎造血干細(xì)胞的發(fā)育至關(guān)重要[14]。
本研究通過(guò)對(duì)單細(xì)胞測(cè)序數(shù)據(jù)分析發(fā)現(xiàn),HCC患者腫瘤和癌旁免疫細(xì)胞的lncRNA 表達(dá)譜存在差異,其中單核細(xì)胞差異表達(dá)的lncRNA 較多,C1QA+Mφ 細(xì)胞和GPX3+Mφ 細(xì)胞差異表達(dá)的lncRNA 較少。一些lncRNA 被認(rèn)為是預(yù)測(cè)HCC 患者預(yù)后的生物標(biāo)志物,如LASP1-AS,NEAT1[15-17],然而它們?cè)陬A(yù)測(cè)肝癌高復(fù)發(fā)風(fēng)險(xiǎn)患者和低復(fù)發(fā)風(fēng)險(xiǎn)患者方面仍然不夠敏感[18]。因此,目前仍需尋找高度敏感性和特異性的分子預(yù)后生物標(biāo)志物[19]。本研究進(jìn)一步聯(lián)合單細(xì)胞測(cè)序和轉(zhuǎn)錄組數(shù)據(jù)分析篩選出在腫瘤微環(huán)境免疫細(xì)胞中分布差異并與預(yù)后相關(guān)的lncRNA,共篩選出5 個(gè)與預(yù)后有關(guān)的lncRNA,其中4 個(gè)lncRNA 與HCC 患病風(fēng)險(xiǎn)有關(guān)。通過(guò)Cox 回歸分析和風(fēng)險(xiǎn)評(píng)分方法,建立了由4 個(gè)lncRNA 構(gòu)成的預(yù)測(cè)模型。ROC 分析和Kaplan-Meier 分析提示該模型能夠較好對(duì)HCC 患者的生存狀態(tài)進(jìn)行預(yù)測(cè);用于構(gòu)建模型的LINC00861[20]、DANCR[21]、LINC01138[22]和THUMPD3-AS1[23]均有報(bào)道稱(chēng)發(fā)現(xiàn)其與HCC 預(yù)后有關(guān),與本研究相一致。
本研究的局限性:本次分析的數(shù)據(jù)GEO 樣本量有限;本研究?jī)H分析了腫瘤以及癌旁中l(wèi)ncRNA 在免疫細(xì)胞中的分布情況,而血液、淋巴結(jié)以及胸腹水與肝癌組織免疫細(xì)胞的關(guān)系也十分密切,了解這些組織中l(wèi)ncRNA 的分布也很有必要。
綜上所述,本研究篩選出在腫瘤組織微環(huán)境的特定免疫細(xì)胞中富集的lncRNA,并利用這些lncRNA 建立了由4 個(gè)lncRNA 組成的預(yù)測(cè)模型,可以有效預(yù)測(cè)HCC 患者的預(yù)后。