周熒,張志存
南京醫(yī)科大學附屬淮安第一醫(yī)院耳鼻咽喉頭頸外科,江蘇淮安223300
據(jù)估算,2021年美國喉癌新增病例14 250 例,死亡4 113 例[1]。新發(fā)喉癌病例約占所有新發(fā)癌癥病例的0.8%,其死亡率約占所有癌癥死亡率的0.6%[2]。隨著煙草使用的減少,過去10年中,喉癌的發(fā)病率每年下降2.4%[2-3]。但值得注意的是,喉癌的5年生存率約為60.9%,在過去數(shù)年中幾乎沒有變化[2,4]。早期T1 和T2 腫瘤的治愈率高達80%~90%。相反,在出現(xiàn)晚期喉癌的患者中,生存率降低至40%。喉癌需要復雜的治療策略和長期的隨訪,給患者帶來嚴重的經濟負擔,顯著降低患者生活質量[5-6]。目前對喉癌患者的預后相關因素的研究多集中于性別、年齡、腫瘤分期分級和治療方案等。研究[7]表明,淋巴結轉移和治療方案是喉癌患者預后的獨立危險因素。也有研究[8]指出,術前血小板淋巴細胞的比值可用于判斷喉癌患者預后。近年來的一些研究[9-10]發(fā)現(xiàn)了一些與喉癌預后相關的基因,包括等。但是基于基因表達量精準評估患者生存率的研究相對較少。本研究旨在針對老年喉癌患者,篩選喉癌中差異表達的mRNA 以及預后相關mRNA,并構建預后風險評估模型,從而將喉癌患者預后評估量化,更加直觀的判斷患者預后。
1.1 一般資料 從 TCGA 數(shù)據(jù)庫和 GEO 下載(GSE142083, GSE117007 和GSE127165)喉癌RNASeq 和臨床信息數(shù)據(jù)集,臨床數(shù)據(jù)信息包括患者年齡、性別、腫瘤分級、腫瘤分期、生存時間和生存狀態(tài)等。本研究針對老年喉癌患者,因此篩選年齡>60 歲的樣本,其中喉癌組織163 例,正常喉組織43 例。163例喉癌患者臨床資料如表1 所示。
表1 喉癌患者一般資料
1.2 方法
1.2.1 矩陣整理 將下載的TCGA 數(shù)據(jù)集和GEO 數(shù)據(jù)集整理為行名為基因代碼,列名為樣本信息,內容為基因相對表達量的數(shù)據(jù)矩陣。將數(shù)據(jù)矩陣進行對數(shù)轉換。合并TCGA 矩陣和GEO 矩陣,并進行批次校準,去除實驗條件對基因表達量的影響。
1.2.2 差異表達基因篩選 根據(jù)Ensemble 數(shù)據(jù)庫中人源性基因信息篩選指導蛋白質合成的mRNA。使用R軟件和edge R包對喉癌組織和正常喉組織進行差異分析,計算mRNA 差異表達倍數(shù)(fold change, FC)。計算公式為FC=喉癌平均表達量/正常喉組織表達量。計算結果進行對數(shù)運算,最終以log2FC 的形式表達。本研究喉癌組織差異表達mRNA 篩選的2 個條件為(1)log2FC 絕對值>2;(2)錯誤發(fā)現(xiàn)率(false discovery rates,F(xiàn)DR)<0.05。
1.2.3 預后相關基因篩選 整理喉癌患者臨床資料中的生存狀態(tài)和生存時間。通過單因素COX 分析篩選與預后相關的差異表達mRNA。篩選標準為0.001。根據(jù)基因表達量中位數(shù)將患者分為表達組和低表達組。使用Kaplan-Meier Plotter 曲線進行生存分析,并使用Log-Rank 檢驗。
1.2.4 預后評估模型建立與評價 通過多因素COX 分析,構建預后評估模型,根據(jù)預后模型評分將喉癌患者分為高危組與低危組,使用Kaplan-Meier Plotter 曲線進行生存分析,并使用Log-Rank 檢驗。使用ROC曲線對預后評估模型進行評價。
1.2.5 統(tǒng)計學分析 本研究使用R 軟件(V3.5.1)和相關R 包對數(shù)據(jù)進行統(tǒng)計學分析0.05 為差異有統(tǒng)計學意義。
2.1 差異表達的mRNA篩選 共篩選出1 796 個mRNA在喉癌患者腫瘤組織和正常喉組織中的表達量存在明顯差異(|log2FC|>2, FDR<0.05),其中835 個mRNA表達上調,961 個mRNA 表達下調。以下是差異表達最顯著的前20 個mRNA。見表2。
表2 差異表達最顯著的前20 個基因
2.2 差異表達mRNA 預后相關性分析 基于喉癌組織和正常組織中差異表達的mRNA,同時結合樣本的生存時間和生存狀態(tài),本研究進行單因素COX 分析。以<0.001 為篩選條件,共有16 個mRNA 與患者預后相關。其中,13 個mRNA 為影響預后的危險因素,表達量越高,患者預后越差(Hazard ratio>1,<0.001);3 個mRNA 為影響預后的保護因素,表達量越高,預后越好(Hazard ratio>1,0.001)。見表3。
表3 差異免疫基因預后相關性分析
2.3 預后評估模型建立 基于單因素COX 篩選結果,進一步通過多因素COX 分析構建預后評估模型。預后評估模型計算公式為危險評分=CCR8×0.129+CDC20×0.086+TFPI-2×0.096。構建預后風險評估模型的mRNA 森林圖。見圖1。
圖1 構建預后風險評估模型的mRNA 森林圖
2.4 高風險患者與低風險患者生存分析 根據(jù)預后風險值計算公式計算所有樣本風險值。以中位值為界限,高于中位值的為高風險患者,低于中位值的為低風險患者。對高風險患者和低風險患者進行生存分析,低風險患者預后顯著優(yōu)于高風險患者<0.001)。見圖2。
圖2 高風險患者與低風險患者生存分析
2.5 預后風險評估模型評價使用ROC曲線評價預后風險評估模型。曲線下面積為0.797,大于0.6,表明預后風險評估模型效能較好。
圖3 預后風險評估模型ROC 曲線
淋巴結受累是影響生存最重要的預后因素[11-12]。淋巴結受累的喉癌患者5年存活率僅有未累及淋巴結患者生存率的一半。喉癌累及部位對患者預后也存在一定影響。聲門腫瘤比聲門上或聲門下腫瘤預后更好。原發(fā)腫瘤體積與放療獲得的局部控制率密切相關。放療時間與局部控制率和存活率均相關。氣管切開被證明降低患者存活率,可能與增加了造口復發(fā)的風險相關[11-12]。此外,一些基因(如和在喉癌中的表達量增加,BCL2 可能對喉癌的預后有影響[13-14]。TNM 分類不足以區(qū)分喉癌患者預后類別,往往忽略了一些高度惡性的因素[11-12]。本研究旨在針對老年喉癌患者,篩選喉癌差異表達的mRNA 以及預后相關的mRNA,并構建預后風險評估模型,以期為臨床決策提供依據(jù)。
本研究通過公共數(shù)據(jù)庫對喉癌組織和喉正常組織全轉錄組測序結果,相較正常組織篩選出喉癌組織中差異表達的mRNA。本研究共篩選出1 796 個mRNA在喉癌患者腫瘤組織和正常喉組織中的表達量存在明顯差異,其中表達上調的mRNA 有835 個,表達下調的mRNA 有961 個。進一步結合差異表達mRNA表達量和樣本生存信息進行了單因素COX 分析,篩選出與預后相關的16 個mRNA。值得注意的是,其中部分基因在喉癌中的作用已經得到了研究或證實。郭星等[15]通過喉癌組織和癌旁正常黏膜組織標本采用免疫組化實驗證實,BRMS1 在癌旁正常黏膜組織中高表達,而CD44v 在喉癌組織中高表達。且2 種蛋白表達量負相關。該研究還進一步發(fā)現(xiàn)CD44v 高表達患者預后差于CD44v 低表達患者。胡俊蘭等[16]通過20 例癌旁組織和12 例正常喉黏膜組織,采用流式細胞術同樣證實CD44v 在喉癌組織中高表達。鄭剛等[17]通過分析TCGA公共數(shù)據(jù)庫分析發(fā)現(xiàn)HOXA13在喉癌組織中高表達,其表達量越高,患者生存率越低。其研究還證實HOXA13 是喉癌預后獨立危險因素。何時知等[18]通過基因表達譜芯片篩選發(fā)現(xiàn)BMP1在喉癌組織中高表達,并認為是關鍵致病基因,且其表達量與腫瘤分期正相關。
預后評估模型計算公式為危險評分=CCR8×0.129+CDC20×0.086+TFPI-2×0.096。本研究采用的危險評分公式是基于COX 比例風險模型構建的。這是一種半參數(shù)回歸模型,可以用于分析一個或多個前定變量對患者生存時間的影響。使用這一模型建立了積累生存函數(shù),即本研究的危險評分公式。在構建模型的3 個基因中,早期研究[19]認為,CDC20 可以介導腫瘤細胞APC/C 檢查抑制。近年來的研究[20]證實,CDC20 在肺腺癌和食管癌中均起到促癌作用,并且與預后不良密切相關。研究[21]證實,CCR8 可以介導Akt/PRAS40/mTOR 通路參與食管鱗癌進展;CCR8 重編程乳酸脫氫酶亞型表達與腫瘤的不良臨床結局相關。還有研究發(fā)現(xiàn),在肌肉浸潤性膀胱癌中CCR8 通過腫瘤內調節(jié)性T 細胞的不穩(wěn)定引發(fā)抗腫瘤免疫。由此可見CCR8 在多種腫瘤的發(fā)生和進展中發(fā)揮重要作用[22]。有研究證實,TFPI-2 的表觀遺傳失活是與胰腺導管腺癌的生長和侵襲相關的常見機制[23]。TFPI-2 在宮頸癌、非小細胞肺癌中均發(fā)揮重要的致病作用[24-25]。近年來的一些研究發(fā)現(xiàn)了一些與喉癌預后相關的基因,包括等。但是這些研究也僅僅明確了基因表達量高低與預后的相關性,并沒有依據(jù)嚴格的統(tǒng)計學方法建立直觀預測患者生存率的模型。另外,也有研究證實臨床變量,包括淋巴結轉移、腫瘤原發(fā)灶大小、治療方案選擇等,可用于判斷患者預后。本研究構建的模型具有獨特的優(yōu)勢,一是可以基于基因表達進行計算,精準預測患者生存率;二是ROC 曲線證實模型效能較好;三是模型公式納入變量少,臨床應用便捷。
本研究發(fā)現(xiàn)通過該模型區(qū)分患者高風險與低風險,低風險患者預后較高風險患者預后好。ROC 曲線評價預后風險評估模型,曲線下面積為0.797,大于0.6,表明預后風險評估模型效能較好。
本研究篩選出了喉癌中差異表達的mRNA,并確定了與預后相關的差異表達mRNA,據(jù)此構建了預后風險評估模型,可以準確評估喉癌患者生存率,將患者預后和基因表達量進行結合,以期為臨床決策提供依據(jù)。本研究存在一些缺陷:一是缺乏外部數(shù)據(jù)對模型進行驗證;二是缺乏體內和體外實驗進行驗證,這些基因在喉癌中的致病機制尚不清楚,需要進一步的研究明確。
綜上所述,CDC20、CCR8 和TFPI-2 在喉癌組織中高表達,與預后不良相關,可能是喉癌關鍵致病基因和潛在指標靶點。本研究構建的預后風險評估模型,效能較好,可以準確預測喉癌患者預后情況。