馬甜甜 柳家翠 段怡平 陳梁玥 朱翠雯 鄒曉沨
結(jié)直腸癌(colorectal cancer,CRC)是全球第四大常見腫瘤,占全世界癌癥相關(guān)死亡人數(shù)的8.5%。腺癌為CRC 中最常見的病理類型。CRC在我國的發(fā)病率不斷上升,主要與經(jīng)濟發(fā)展帶來的生活方式和環(huán)境的改變有關(guān),如三高一低(高熱量、高脂肪、高蛋白、低纖維)的西化生活方式[1]。早期CRC 患者的五年生存率可高達90%,由于缺乏早期診斷標志物,大多數(shù)CRC 患者診斷時已處于晚期階段,其五年生存率降至70.4%[2]。因此,尋找CRC 發(fā)生發(fā)展相關(guān)的分子標志物,對于CRC的診斷、治療及預(yù)后有著重要的意義。人類基因轉(zhuǎn)錄組僅有少數(shù)RNA 可作為蛋白質(zhì)合成的模板,超過70%的RNA 為非編碼RNA,對于細胞蛋白質(zhì)的合成及增殖分化起著非常重要的作用。其中,長度超過200 個核苷酸的非編碼RNA 稱為長鏈非編碼RNA(Long non?coding RNA,lncRNA)。研究表明,許多l(xiāng)ncRNA 在各種癌癥中表達失調(diào),并與診斷和預(yù)后有關(guān),例如,lncRNA HOXA?AS2在乳腺癌、胃癌等多種惡性腫瘤中均有異常表達[3],lncRNA DDX11?AS1在肝癌、結(jié)直腸癌等多種惡性腫瘤中出現(xiàn)高表達[4]。有研究表明,LINC00634通過miR?342?3p/Bcl2L1 軸在食管鱗狀細胞癌中發(fā)揮致癌基因的作用[5],但是LINC00634在CRC 發(fā)生發(fā)展中的分子機制及與預(yù)后的關(guān)系尚未闡明。本研究通過分析TCGA 數(shù)據(jù)庫,探索LINC00634在CRC 中的表達、免疫浸潤及預(yù)后價值。
在TCGA 數(shù)據(jù)庫官方網(wǎng)站(http://portal.gdc.cancer.gov/)下載結(jié)直腸RNA ?seq(level 3,HTSeq?FPKM)數(shù)據(jù)。其中包括CRC 組織樣本473 例,正常結(jié)直腸組織樣本41 例。對基因表達數(shù)據(jù)進行歸一化處理,并Log2 轉(zhuǎn)化后用于后續(xù)分析。在TCGA 數(shù)據(jù)庫上下載并提取CRC 患者的臨床病理特征信息,刪除臨床信息缺失的樣本。
使用R 4.0.2 軟件來篩選差異基因。將得到的差異基因繪制熱圖和火山圖。
根據(jù)LINC00634在CRC 患者中表達值得中位數(shù),將患者分為兩組。利用卡方檢驗分析LINC00634與CRC 患者臨床特征的關(guān)系。利用Kaplan?Meier 法比較兩組之間總體生存的差異。使用Cox 回歸分析LINC00634的預(yù)后價值。
采用基因富集分析(gene set enrichment analy?sis,GSEA)分析LINC00634在CRC 發(fā)生發(fā)展中參與的信號通路。從Broad Institute 網(wǎng)站(http://soft?ware.broadinstitute.org/gsea/index.jsp)下載GSEA 分析軟件GSEA 4.1.0,分析通路來自Molecular Sig?nature Database(MsigDB)數(shù)據(jù)庫中的c2.cp.kegg.v7.0.symbols.gmt 數(shù)據(jù)集。采用加權(quán)富集法分析,隨機組合次數(shù)設(shè)為1 000 次,所有其他參數(shù)均按默認值設(shè)置。P值小于0.05 和錯誤發(fā)現(xiàn)率(false discovery rate,F(xiàn)DR)小于0.05 的基因集作為顯著富集的基因。
使用R 4.0.2 軟件評估LINC00634表達與腫瘤細胞免疫浸潤豐度的相關(guān)性。將473 例腫瘤樣本以中位數(shù)分為高、低表達組分析LINC00634對免疫系統(tǒng)微環(huán)境的影響。通過基于基因表達的反卷積算法CIBERSORT(http://cibersort.stanford.edu/)評估各組之間基因表達的相對變化。
采用軟件SPSS 25.0 進行數(shù)據(jù)分析;計數(shù)資料以n(%)表示,行χ2檢驗;Wilcoxon 秩和檢驗,將CRC 患者的年齡、性別、TNM 分期等臨床指標進行量化賦值,利用Cox 比例風(fēng)險回歸模型進行單因素和多因素分析;生存分析采用KM 法;P<0.05為差異有統(tǒng)計學(xué)意義。
篩選差異基因后共得到3 314 個差異表達基因(圖1),其中包含1 933 個上調(diào)基因和1 381 個下調(diào)基因。
圖1 差異表達基因Figure 1 Differentially expressed genes
CRC 中LINC00634的表達水平與正常組織相比,差異有統(tǒng)計學(xué)意義(P<0.05)。見圖2。
圖2 LINC00634 在CRC 組織中的表達分析Figure 2 Analysis of LINC00634 expression in colorectal cancer tissues
LINC00634的表達水平與患者的年齡、臨床分期和淋巴結(jié)轉(zhuǎn)移顯著相關(guān)(P<0.05),見表1。臨床Ⅱ期患者LINC00634的表達水平與Ⅲ期患者相比,差異有統(tǒng)計學(xué)意義(P<0.05)。見圖3A。發(fā)生淋巴結(jié)轉(zhuǎn)移患者組LINC00634表達水平與未發(fā)生遠處轉(zhuǎn)移組相比,差異有統(tǒng)計學(xué)意義(P<0.05),見圖3B~D。
圖3 LINC00634 表達量與CRC 患者臨床病理特征相關(guān)性分析Figure 3 Correlation analysis between LINC00634 expression and clinicopathological characteristics of colorectal cancer patients
表1 LINC00634 表達與CRC 患者臨床特征的相關(guān)性分析[n(%)]Table 1 Correlation analysis between LINC00634 expression and clinical characteristics of colorectal cancer patients[n(%)]
高表達LINC00634組中患者的總體生存率低于低表達組,差異有統(tǒng)計學(xué)意義(P<0.05)。見圖4。
圖4 LINC00634 的表達與CRC 患者預(yù)后的關(guān)系Figure 4 Expression and prognosis of LINC00634 in patients with colorectal cancer
年齡、Stage 分期、T 分期、M 分期、N 分期以及LINC00634均可作為預(yù)后因素,多因素Cox 回歸分析提示,年齡、T 分期和LINC00634可以作為CRC患者的獨立預(yù)后因素(P<0.05)。見表2。
表2 單因素和多因素Cox 回歸分析Table 2 Univariate and multivariate Cox regression analysis
使用GSEA 功能富集進一步了解LINC00634在CRC 發(fā)生發(fā)展過程中參與的信號通路,富集結(jié)果。見圖5。
圖5 GSEA 功能富集分析Figure 5 GSEA functional enrichment analysi s
LINC00634表達與CD8+T 細胞、CD4+記憶T細胞、M1 型巨噬細胞和靜止型NK 細胞正相關(guān)(R>0,P<0.05),與嗜酸性粒細胞呈負相關(guān)(R<0,P<0.05),見圖6A。調(diào)節(jié)性T 細胞在LINC00634高表達組中含量增加,而CD4+記憶T 細胞和嗜酸性粒細胞含量減少,見圖6B。相關(guān)性熱圖顯示,在CRC 中,CD8+T 細胞與M0 型巨噬細胞存在顯著的正相關(guān)性,而與CD4+記憶T 細胞存在顯著的負相關(guān)性。見圖6C。
圖6 LINC00634 表達與免疫浸潤Figure 6 Expression of LINC00634 and immune infiltration
CRC 是一種發(fā)病率和死亡率僅次于肺癌、胃癌、肝癌的惡性腫瘤,遺傳和環(huán)境因素對CRC 的發(fā)生發(fā)展有重要的影響[6]。CRC 早期無癥狀,大多數(shù)患者就診時已是晚期,治療及預(yù)后效果不佳。檢測外周血中的循環(huán)腫瘤細胞及其他與癌癥有關(guān)的腫瘤標志物成本相對較低、侵入性更少,有利于CRC 的早期診斷[7]。已有研究表明mSEPT9、環(huán)狀RNA 等在CRC 患者血漿中特異性表達,可作為腫瘤標志物用于CRC 的篩查和早期診斷[8?10]。
本研究結(jié)合多種生物信息學(xué)方法,發(fā)現(xiàn)LINC00634在CRC 組織中表達上調(diào),其表達水平與患者的年齡、臨床分期和淋巴結(jié)轉(zhuǎn)移顯著相關(guān)。KEGG 通路分析表明,上調(diào)的LINC00634主要參與了DNA 復(fù)制,核苷酸切除修復(fù),堿基切除修復(fù),嘌呤、嘧啶核苷酸代謝,磷酸戊糖途徑,TGF 信號通路,ECM 受體相互作用通路等通路。DNA 損傷修復(fù)中核苷酸切除修復(fù)與堿基切除修復(fù)為重要的修復(fù)途徑,其通路中基因表達改變及基因功能的缺失與多種腫瘤的發(fā)生發(fā)展密切相關(guān)[11]。腫瘤的發(fā)生發(fā)展涉及大量的病理生理及生化過程,異常的代謝途徑,如嘌呤核苷酸代謝可通過調(diào)節(jié)信號轉(zhuǎn)導(dǎo)通路影響基因和蛋白的表達,促進細胞惡性轉(zhuǎn)化、侵襲和轉(zhuǎn)移[12],TGF 信號通路參與多種疾病的發(fā)生,包括肝癌、乳腺癌等,ECM1 是一種分泌性糖蛋白,與腫瘤發(fā)生、血管生成和表皮分化等密切相關(guān),通過與顆粒蛋白前體(PGRN)相互作用參與多種腫瘤的發(fā)生發(fā)展[13]。上調(diào)的LINC00634可能通過上述途徑在CRC 發(fā)生發(fā)展中發(fā)揮作用,對癌癥的不良預(yù)后產(chǎn)生影響。
同時,本研究揭示了LINC00634表達與CRC免疫浸潤水平之間的聯(lián)系。不同免疫細胞的基因標志物與LINC00634表達之間的關(guān)系暗示了LINC00634在調(diào)控結(jié)直腸腫瘤免疫微環(huán)境中的重要意義。結(jié)果顯示LINC00634表達與CD8+T 細胞、CD4+記憶T 細胞、M1 型巨噬細胞和靜止型NK 細胞正相關(guān),而與嗜酸性粒細胞呈負相關(guān)。這揭示LINC00634可能通過調(diào)節(jié)T 細胞與NK 細胞進而影響CRC。研究表明腫瘤的轉(zhuǎn)移與免疫系統(tǒng)相關(guān),T 細胞免疫功能失衡的患者更容易發(fā)生轉(zhuǎn)移[14],轉(zhuǎn)移的結(jié)腸癌患者體內(nèi)Th17 細胞增加,可以促進腫瘤細胞對免疫系統(tǒng)的耐受[15]??梢酝茢?,LINC00634過表達可以促進T 細胞與NK 細胞的免疫反應(yīng)和浸潤,進而影響CRC 的轉(zhuǎn)移與預(yù)后。
綜上所述,LINC00634在CRC 組織中表達顯著上調(diào),調(diào)節(jié)了CRC 發(fā)生發(fā)展過程中免疫浸潤細胞及各種途徑中的蛋白質(zhì),并與CRC 患者的惡性進展相關(guān),提示CRC 患者的不良總體生存預(yù)后,可以作為CRC 患者的獨立預(yù)后因素。LINC00634有望成為CRC 新型分子標志物和腫瘤治療的分子靶點。