陳 乾 付 琦 王天明 李曉麗 陳全鑫 吳志航 潘海邦
甘肅中醫(yī)藥大學第一臨床醫(yī)學院,甘肅省蘭州市 730000
胃癌是世界上最常見的胃腸道惡性腫瘤之一,其死亡率和發(fā)病率均居惡性腫瘤的前五位[1-2]。近年來,胃癌的診療水平已有了很大的提高,但因其起病較隱匿,早期無癥狀或癥狀不明顯,早期易漏診,多數(shù)患者診斷時已是臨床晚期或已發(fā)生遠處轉移[3]。傳統(tǒng)的血清腫瘤標志物對胃癌診斷有一定指導意義,但靈敏度及特異度均不佳,因此尋找特異性強和靈敏性較高的生物標志物用于胃癌早期診斷、指導治療和判斷預后顯得尤為重要。
Ⅰ型膠原蛋白是膠原蛋白家族中的一個重要成員,其中Ⅰ型膠原α2鏈(COL1A2)被認為影響腫瘤的侵襲和進展,是細胞外間質的關鍵結構成分。COL1A2具有多種生物學功能,近年來發(fā)現(xiàn)可在肺癌、胰腺癌等多種組織呈高表達狀態(tài),并且可以允許癌細胞侵襲和遷移[4-5]。但關于COL1A2在胃癌中的研究相對較少,因此,本研究通過生物信息學分析,探討COL1A2在胃癌組織中的表達水平及其與免疫細胞浸潤的關系,為胃癌的臨床診治提供理論依據(jù)。
1.1 資料來源 COL1A2的數(shù)據(jù)來源于TCGA數(shù)據(jù)庫(https://portal.gdc.cancer.gov/)。TIMER數(shù)據(jù)庫(http://timer.cistrome.org/)是用于系統(tǒng)分析各種癌癥類型的免疫浸潤的綜合數(shù)據(jù)庫。Kaplan-Meier plotter數(shù)據(jù)庫(https://kmplot.com/analysis/)收錄了肺癌、胃癌、乳腺癌、肝癌、卵巢癌的生存信息,可以用來評估基因對患者生存率的影響。
1.2 COL1A2表達水平分析 通過TIMER數(shù)據(jù)庫分析不同腫瘤與鄰近正常組織中COL1A2的基因表達。從TCGA數(shù)據(jù)庫下載胃癌基因表達數(shù)據(jù)共407例,其中包含胃癌組織375例、正常胃組織32例。使用R軟件中的“l(fā)imma”包對胃癌基因表達數(shù)據(jù)及臨床數(shù)據(jù)進行分析和整理。
1.3 COL1A2預后的相關性分析 將COL1A2輸入Kaplan-Meier plotter數(shù)據(jù)庫中,得到K-M生存曲線,比較COL1A2不同表達水平患者的總生存期(OS)、首次進展生存期(FP) 和再次進展生存期(PPS)。基于TCGA數(shù)據(jù)庫通過R軟件中“timeROC”“survival”“regplot”包繪制胃癌患者預后發(fā)生風險的列線圖模型,并作受試者工作特征曲線(ROC),計算曲線下面積(AUC),繪制校準曲線檢驗評估列線圖模型準確度;采用單因素Cox回歸分析COL1A2在胃癌預后中的評估價值。
1.4 COL1A2單基因GSEA分析 根據(jù)TCGA-STAD數(shù)據(jù)集中COL1A2表達量的中位值,將基因表達數(shù)據(jù)分為高、低表達組。應用R軟件中“org.Hs.eg.db”和“enrichplot”包對COL1A2進行信號通路富集分析,以|NES|≥1.0、NOM p-val<0.05、FDR q-val<0.25為條件對COL1A2單基因富集結果進行篩選。
1.5 免疫細胞浸潤分布特點 根據(jù)TCGA-STAD數(shù)據(jù)集,使用R軟件中的“CIBERSORT”包分析22種免疫細胞與胃癌中COL1A2的關系,并揭示免疫細胞浸潤之間的關聯(lián)性,使用“vioplot”包進行預后模型可視化。
1.6 統(tǒng)計學方法 采用R軟件對數(shù)據(jù)進行處理與分析。應用Wilcoxon檢驗分析COL1A2在胃癌組織與正常組織之間的表達差異;應用Kruskal檢驗分析COL1A2表達與臨床病理參數(shù)間的相關性;應Kaplan-Meier分析COL1A2高、低表達組之間生存率的差異;應用單因素Cox回歸模型分析COL1A2在胃癌患者中的預后意義;使用Spearson函數(shù)分析COL1A2與免疫細胞浸潤之間的相關性,P<0.05表示具有統(tǒng)計學意義。
2.1 COL1A2在胃癌組織中的表達水平 通過TIMER數(shù)據(jù)庫分析COL1A2在不同腫瘤組織中的表達,結果提示COL1A2在胃癌組織中表達顯著高于正常組織。TCGA-STAD數(shù)據(jù)集分析顯示胃癌組織中COL1A2的表達量高于正常組織(P<0.001,見圖1a);對TCGA-STAD數(shù)據(jù)集中胃癌組織及相對應正常組織的分析結果表明,COL1A2在胃癌組織中的表達高于配對正常組織(P<0.001,見圖1b)。
a b
腫瘤組織及相對應正常組織中COL1A2的表達;*P<0.001
2.2 COL1A2的表達與臨床病理參數(shù)的關系 TCGA-STAD數(shù)據(jù)集的分析結果表明。COL1A2基因表達與T分期、臨床分期和組織學分級具有相關性。COL1A2表達水平在T1與T2、T3、T4具有相關性,臨床分期Stage1和Stage2、Stage3具有相關性,組織學分級Grade2和Grade3具有相關性,差異有統(tǒng)計學意義(P<0.05),見圖2。
圖2 COL1A2表達量與胃癌患者臨床病理特征相關性
2.3 COL1A2基因與胃癌患者預后的關系 運用Kaplan-Meier plotter繪制COL1A2基因與胃癌患者預后的生存曲線(見圖3)。結果顯示COL1A2基因高表達與胃癌患者更短的總生存期(OS) (HR=1.58,95%CI:1.33~1.87,Log-rankP<0.001)、首次進展生存期(FP) (HR=1.61,95%CI:1.31~1.97,Log-rankP<0.001)及再次進展生存期(PPS) (HR=1.46,95%CI:11.15~1.85,Log-rankP=0.0017)顯著相關。
圖3 不同COL1A2基因表達水平胃癌患者的生存曲線
2.4 COL1A2表達水平列線圖的構建和驗證 根據(jù)
篩選的變量構建了列線圖來評估胃癌患者的預后。將性別、年齡、T分期、M分期、N分期、臨床分期、組織學分級7個獨立預后相關因素納入構建列線圖,得到胃癌患者1、3、5年總生存率的列線圖??偟梅质歉鶕?jù)使用列線圖模型計算的單個因素得分確定的;本研究中的大多數(shù)患者的總危險得分為370~520。COL1A2表達水平預測胃癌1年不良預后的AUC為0.561;預測3年不良預后的AUC為0.577;預測5年不良預后的AUC為0.726,>0.7對于患者的預后評估有參考價值。列線圖的校準曲線分析表明,該列線圖預測的1、3、5年總生存率與實際生存率之間具有良好的一致性,見圖4。
2.5 COL1A2與臨床特征單因素Cox回歸分析 單因素Cox回歸分析結果顯示,年齡(HR=1.026,P=0.004)、腫瘤分期(HR=1.534,P<0.001)和COL1A2(HR=1.172,P=0.016)可有效預測胃癌患者的生存,見表1。
表1 COL1A2與臨床特征單因素Cox回歸分析
2.6 COL1A2基因的GSEA富集分析 GSEA結果根據(jù)校正后的富集得分(NES)選擇了最顯著的信號通路(FDR<0.05,P<0.05)。篩選出COL1A2高表達樣本主要富集于軸突引導通路、細胞黏附分子通路、細胞外基質受體相互作用通路、TGF-β信號通路。低表達樣本主要富集在嗅覺轉導通路,見表2。
表2 COL1A2功能富集分析
2.7 COL1A2表達與免疫細胞浸潤 以COL1A2表達的中位值,將375例腫瘤樣品分為高、低表達兩組,通過CIBESORT算法評估樣本中22種免疫細胞表達水平的差異(見圖5)。B細胞、漿細胞、巨噬細胞,肥大細胞和中性粒細胞是受COL1A2影響的主要細胞,其中低表達組的幼稚B細胞、記憶B細胞、漿細胞增加(P<0.05),而M2巨噬細胞、活化的肥大細胞和中性粒細胞減少(P<0.05)。M2巨噬細胞、M0巨噬細胞、γδT細胞和中性粒細胞和COL1A2正相關,幼稚B細胞、漿細胞和記憶性B細胞和COL1A2負相關。
圖5 22種免疫細胞在胃癌及正常組織中的表達差異
胃癌的發(fā)生機制復雜,是多種危險因素和保護因素相互作用的結果。胃癌的治療關鍵在于早期確診以便于患者進行有效的治療,但大部分胃癌患者都在晚期被確診。因此,探索胃癌可能的致病機制以及尋找胃癌發(fā)生發(fā)展中的分子標志物對于胃癌的診斷和治療具有重要意義。
COL1A2是編碼Ⅰ型膠原α2鏈的重要基因。COL1A2具有多種生物學功能,異常表達的甲基化的COL1A2可以引起機體內環(huán)境的改變,從而參與多種疾病的發(fā)生發(fā)展,研究人員發(fā)現(xiàn)COL1A2基因在大腸癌組織中高甲基化,其mRNA表達明顯降低,而COL1A2 mRNA在髓母細胞瘤中表達上調[6]。COL1A2在膀胱癌、食管癌、肝癌、肺癌等多種惡性腫瘤中也明顯增加[7-9]。
在本研究中,通過TIMER數(shù)據(jù)庫和TCGA數(shù)據(jù)庫發(fā)現(xiàn)COL1A2在胃癌中的表達水平高于正常組織。進一步分析顯示,COL1A2與T分期、臨床分期和組織學分級相關,并且COL1A2高表達提示胃癌患者預后不良。此外,通過K-M分析發(fā)現(xiàn)COL1A2高表達與胃癌患者更短的總生存期、首次進展生存期及再次進展生存期顯著相關。本研究所建立的列線圖模型表明COL1A2能有效預測胃癌患者預后,基于該列線圖模型預測高?;颊呔哂幸欢ㄅR床價值。單因素Cox分析顯示,COL1A2可有效預測胃癌患者的生存。為深入研究COL1A2在胃癌發(fā)生發(fā)展中的生物學功能及分子調控機制,本文對COL1A2進行GSEA富集分析,結果顯示COL1A2高表達樣本主要富集在軸突引導通路、細胞黏附分子通路、細胞外基質受體相互作用通路、TGF-β信號通路。已有研究表明軸突引導通路在乳腺癌轉移過程中起重要作用,并在胰腺癌中起作用細胞黏附分子通路主要涉及黑色素瘤的傳播、與微環(huán)境的相互作用和轉移[10]。Bao等[11]發(fā)現(xiàn)細胞外基質受體相互作用通路可能參與乳腺癌的發(fā)生與發(fā)展。Colak 等[12]強調TGF-β信號通路可以促進腫瘤的發(fā)生、轉移和耐藥。上述證據(jù)表面COL1A2可以通過這些過程和途徑對人體起作用,本研究結果有助于增進對COL1A2生物學功能的理解。
本研究進一步探索了COL1A2基因表達與胃癌免疫微環(huán)境的關系,結果顯示COL1A2基因與多種免疫細胞浸潤水平相關。我們發(fā)現(xiàn)在胃癌中,B細胞、漿細胞、巨噬細胞,肥大細胞和中性粒細胞是受COL1A2表達影響的主要細胞。M2巨噬細胞、M0巨噬細胞、γδT細胞和中性粒細胞和COL1A2正相關,幼稚B細胞、漿細胞和記憶性B細胞和COL1A2負相關。巨噬細胞是浸入腫瘤組織中主要的炎癥細胞,其釋放大量的炎癥介質,創(chuàng)造炎癥環(huán)境,促進腫瘤生長并降低抗腫瘤免疫力。既往研究發(fā)現(xiàn)中性粒細胞、B細胞、T細胞浸潤與胃癌的預后不良相關[13]。本研究提示COL1A2可能通過影響這些免疫細胞的浸潤而調控胃癌的進展,但這仍需要更多的動物實驗及臨床試驗驗證。
綜上所述,COL1A2在胃癌組織中高表達,可調節(jié)胃癌發(fā)展過程中的免疫浸潤細胞水平,并與胃癌的預后不良有關。因此,COL1A2可作為胃癌的獨立預后因子,并有望為胃癌診斷和治療策略提供一定價值。