于麗華 王宏 秦麗 王偉娜 崔東燕 趙書平★
中國人群的肺癌發(fā)病率以及死亡率也呈逐年升高的趨勢(shì),肺腺癌(Lung adenocarcinoma,LUAD)在我國最為常見[1]。早期LUAD 患者尚有手術(shù)機(jī)會(huì),而晚期患者,往往只能采用靶向治療、放化療、免疫治療等以延長生存時(shí)間[2]。盡管如此,遠(yuǎn)處轉(zhuǎn)移和耐藥問題依舊是患者不良預(yù)后的主要原因[3]。所以,進(jìn)一步尋找可用于預(yù)測(cè)LUAD 患者的預(yù)后和死亡風(fēng)險(xiǎn)的腫瘤標(biāo)志物,仍然是目前首要任務(wù)。磷酸肌醇3-激酶(Phosphoinositide 3-kinase,PI3K)信號(hào)下游包含多條信號(hào)通路,參與調(diào)節(jié)各類細(xì)胞生理過程。此外,眾多研究發(fā)現(xiàn)PI3K 通路在腫瘤的發(fā)生發(fā)展中也發(fā)揮著重要的作用[4]。例如,Heavey 等人發(fā)現(xiàn)非小細(xì)胞肺癌的侵襲和轉(zhuǎn)移與PI3K/蛋白激酶B(Protein kinase B,Akt)/哺乳動(dòng)物雷帕霉素靶蛋白(Mammalian target of rapamycin,mTOR)通路的異常激活與密切相關(guān)[5]。雖然PI3K 通路被證明與腫瘤相關(guān),但可否采用PI3K 下游基因構(gòu)建預(yù)后預(yù)測(cè)模型,用于腫瘤復(fù)發(fā)預(yù)測(cè)仍是盲點(diǎn)。本研究通過分析公共數(shù)據(jù)庫表達(dá)譜數(shù)據(jù),利用單因素和多因素Cox 回歸分析構(gòu)建了一項(xiàng)基于PI3K 通路相關(guān)基因的預(yù)后預(yù)測(cè)模型。
通過系統(tǒng)檢索PI3K 通路下游基因列表,并從The Cancer Genome Atlas(TCGA)數(shù)據(jù)庫中提取相應(yīng)基因的表達(dá)譜數(shù)據(jù)(數(shù)據(jù)下載于2020年10月1日),及相應(yīng)患者的臨床信息[主要包括總體生存率(Overall survival,OS)、生存狀態(tài)(Survival status)、年齡(Age)、性別(Gender)、腫瘤分期(Tumor stage,T 分期)等,共包括497 例LUAD 病例和54 例對(duì)照。
應(yīng)用R 統(tǒng)計(jì)軟件中的“l(fā)imma”軟件包對(duì)數(shù)據(jù)進(jìn)行差異分析,與PI3K 通路下游基因列表取交集,以log2FoldChange≥2 或≤-2,校正P-value <0.05 為條件,同時(shí)對(duì)差異基因進(jìn)行富集分析。
研究首先采用單因素Cox 回歸分析關(guān)聯(lián)差異表達(dá)的PI3K 通路基因與OS,并提取多因素Cox 回歸分析中各基因的系數(shù)用于預(yù)后模型的構(gòu)建,公式=(0.189 042 561×F2RL1 表達(dá)值)+(0.159 601 144×TWIST 表達(dá)值)-(0.289 521 135×FGR 的表達(dá)值)-(0.223 936 656×KLF4 表達(dá)值)+(0.250 520 925×CEP55 表達(dá)值),基于中位風(fēng)險(xiǎn)值,將患者分為高、低風(fēng)險(xiǎn)兩個(gè)亞組。
計(jì)數(shù)資料以n(%)表示,行χ2檢驗(yàn);利用Kaplan-Meier(K-M)和log-rank 分析檢驗(yàn)?zāi)P椭懈?、低危組的生存狀態(tài)差異;繪制受試者工作特征(ROC)曲線,計(jì)算曲線下面積(AUC),檢驗(yàn)?zāi)P蜏?zhǔn)確性;采用多因素Cox 回歸分析探究該模型預(yù)測(cè)LUAD 患者預(yù)后是否受其他因素影響。以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
分析共納入出154 個(gè)PI3K 通路相關(guān)基因,分析共篩選出34 個(gè)差異表達(dá)的PI3K 通路基因。對(duì)獲取的差異基因進(jìn)行富集分析,結(jié)果顯示這些基因多富集于PI3K 等信號(hào)通路。見表1、圖1。
圖1 差異表達(dá)基因的富集分析Figure 1 The enrichment analyses of the differentially expressed genes
表1 差異表達(dá)PI3K 通路相關(guān)基因Table 1 The differentially expressed PI3K pathway-related genes
將有配對(duì)臨床資料的LUAD 樣本與差異表達(dá)基因相結(jié)合,剔除表達(dá)量較低或?qū)Y(jié)果影響較大的樣本,最終納入436 例患者表達(dá)譜數(shù)據(jù)進(jìn)一步行單因素Cox 回歸分析,結(jié)果顯示有11 個(gè)基因與OS 相關(guān),差異有統(tǒng)計(jì)學(xué)意義(P<0.05)。將11 個(gè)基因納入多因素Cox 回歸分析,篩選出5 個(gè)基因用于建模(F2RL1、TWIST、FGR、KLF4 和CEP55),差異有統(tǒng)計(jì)學(xué)意義(P<0.05)。其中,KLF4、CEP55、F2RL1和TWIST為高風(fēng)險(xiǎn)基因,F(xiàn)GR為保護(hù)性基因。見圖2、表2。
表2 436 例LUAD 患者的臨床病理特征[n(%)]Table 2 The clinicopathological features of the enrolled 436 LUAD cases[n(%)]
圖2 單因素Cox 回歸分析結(jié)果Figure 2 The results of univariate Cox regression analysis
患者中位風(fēng)險(xiǎn)評(píng)分為0.963 667,以此為依據(jù)將患者分為低風(fēng)險(xiǎn)(218 人)和高風(fēng)險(xiǎn)組(218 人)。結(jié)果顯示,患者生存時(shí)間隨著風(fēng)險(xiǎn)評(píng)分升高逐漸縮短(圖3A),且死亡人數(shù)(圖3B)則呈上升趨勢(shì);圖3C 可見模型中KLF4、CEP55、F2RL1和TWIST的表達(dá)在高危組患者中明顯增高,F(xiàn)GR的表達(dá)在低危組患者中明顯增高;K-M 分析結(jié)果顯示,風(fēng)險(xiǎn)評(píng)分與患者不良預(yù)后呈顯著正相關(guān)(圖3D);ROC曲線分析結(jié)果發(fā)現(xiàn)預(yù)測(cè)模型的預(yù)測(cè)價(jià)值最高(圖3E,AUC=0.735)。見圖3。
圖3 建模基因分布與模型準(zhǔn)確性評(píng)估Figure 3 Modeling gene distribution and evaluation of model accuracy
單因素Cox 回歸分析表明LUAD 患者的T 分期、N 分期、臨床分期、風(fēng)險(xiǎn)評(píng)分與OS 相關(guān)(P<0.05);多因素Cox 回歸分析表明預(yù)測(cè)模型可作為患者OS 評(píng)估的獨(dú)立預(yù)測(cè)因子(P<0.05);T 分期、N 分期對(duì)患者預(yù)后的預(yù)測(cè)是獨(dú)立的(P<0.05)。見表3、表4。
表3 單因素Cox 回歸分析Table 3 Cox regression analyses of univariate
表4 多因素Cox 回歸分析Table 4 Multivariate Cox regression analysis
使用R 軟件的“beeswarm”分析參與模型構(gòu)建的基因與臨床病理特征之間的關(guān)系,結(jié)果顯示,CEP55與患者年齡(P=0.006)、生存狀態(tài)(P=0.005)、性別(P=0.007)、N 分期(P=4.128e-04)、stage 顯著相關(guān)(P=0.003),F(xiàn)2RL1 與患者年齡(P=0.005)、生存狀態(tài)(P=0.018)顯著相關(guān),F(xiàn)GR 與患者生存狀態(tài)(P=0.006)、T 分期(P=0.021)、stage(P=0.038)顯著相關(guān),見圖4。
圖4 建?;蚺c臨床參數(shù)的關(guān)系Figure 4 The correlation between modeling genes and clinicopathological factors
近年來,大量研究證實(shí)LUAD 的發(fā)生和進(jìn)展與PI3K 信號(hào)通路密切相關(guān),但有關(guān)該通路基因是否可作為LUAD 患者預(yù)后評(píng)估標(biāo)志物的研究尚處于初步階段。本研究分析了PI3K 通路基因與LUAD 患者預(yù)后的關(guān)系,篩選出了能夠獨(dú)立預(yù)測(cè)LUAD 患者預(yù)后的關(guān)鍵基因,并以此為依據(jù)構(gòu)建了預(yù)后預(yù)測(cè)模型,系列分析證實(shí)了該預(yù)測(cè)模型的預(yù)測(cè)能力。同時(shí),多因素Cox 回歸分析揭示該模型對(duì)LUAD 患者的預(yù)后評(píng)估作用不受其它臨床病理參數(shù)的干擾。
當(dāng)前模型共納入5 個(gè)PI3K 通路相關(guān)基因。F2RL1基因位于5 號(hào)染色體上,其編碼蛋白PAR2是一種G 蛋白偶聯(lián)受體,可以啟動(dòng)多種細(xì)胞內(nèi)信號(hào)轉(zhuǎn)導(dǎo)。在慢性粒細(xì)胞白血病中,PAR2 的高表達(dá)預(yù)示著患者預(yù)后不良。研究發(fā)現(xiàn),PAR2 可上調(diào)BclL12 表達(dá),而Bcl2L12 可通過抑制Mdm2 與p53蛋白啟動(dòng)子結(jié)合,抑制p53 的轉(zhuǎn)錄活性,減少肺癌細(xì)胞凋亡進(jìn)程[6]。研究還發(fā)現(xiàn),F(xiàn)2RL1 與吉非替尼耐藥密切相關(guān)。抑制PAR2 表達(dá),可以阻斷ERK通路磷酸化及上皮-間質(zhì)轉(zhuǎn)化,上調(diào)吉非替尼治療敏感性[7]。TWIST 最早在果蠅中被發(fā)現(xiàn)調(diào)節(jié)胚胎中胚層分化和肌細(xì)胞形成,現(xiàn)在更多關(guān)注的是其在上皮間充質(zhì)轉(zhuǎn)化和腫瘤侵襲中的作用。研究發(fā)現(xiàn),Twist 在肺癌組織中較癌旁組織顯著高表達(dá),且Twist 表達(dá)與肺腫瘤的分化程度密切有關(guān)。肺腺癌細(xì)胞系高表達(dá)Twist 后,上皮細(xì)胞呈梭形、紡錘體改變;此外,高表達(dá)該基因的肺腺癌細(xì)胞侵襲和遷移能力顯著增強(qiáng),但增殖能力相對(duì)減弱[8]。不僅如此,過表達(dá)TWIST 可抑制E-鈣蛋白和β-連環(huán)蛋白的表達(dá),同時(shí)增強(qiáng)AKT2 蛋白活性,促進(jìn)腫瘤的侵襲和轉(zhuǎn)移[9]。KLF4基因含有KLF 超家族的鋅指蛋白結(jié)構(gòu),參與真核細(xì)胞轉(zhuǎn)錄調(diào)控作用。據(jù)報(bào)道,KLF4基因在乳腺癌中高表達(dá)可促進(jìn)腫瘤增殖[10],但卻在胃癌、前列腺癌等腫瘤中起到抑瘤作用[11]。研究還發(fā)現(xiàn)KLF4 在肺癌組織中較癌旁組織表達(dá)降低,過表達(dá)KLF4 能夠顯著抑制肺癌細(xì)胞增殖,引起細(xì)胞G1 期阻滯;機(jī)制研究發(fā)現(xiàn),KLF4可通過激活p21 和抑制cyclin D1 表達(dá)來抑制腫瘤進(jìn)展,同時(shí)其還與Sp1 競爭結(jié)合cyclin D1,進(jìn)而抑制cyclin D1 表達(dá),發(fā)揮腫瘤抑制作用[12]。CEP55位于染色體10q23.33 內(nèi),是一個(gè)55 kDa 的中心體蛋白,在大多數(shù)腫瘤中可檢測(cè)到CEP55 的異常高表達(dá)。Jiang 等人[13]發(fā)現(xiàn)CEP55 在非小細(xì)胞肺癌腫瘤組織中表達(dá)顯著上調(diào),且與患者預(yù)后不良顯著相關(guān)。Liu 等人[14]也發(fā)現(xiàn),沉默CEP55 表達(dá)可顯著抑制肺癌細(xì)胞增殖和促進(jìn)腫瘤細(xì)胞凋亡;沉默CEP55 可顯著降低肺癌細(xì)胞中CDK4、p21 和Bcl-2表達(dá),上調(diào)凋亡前蛋白、Bad、caspase-3 和PARP 的表達(dá),這提示CEP55 可作為肺癌治療的潛在作用靶點(diǎn)。綜上,這些結(jié)果更加提示了這些預(yù)后相關(guān)基因在肺癌發(fā)生和進(jìn)展過程中的關(guān)鍵作用。
綜上,本研究通過系統(tǒng)分析構(gòu)建了一項(xiàng)由5 個(gè)PI3K 通路基因組成的LUAD 患者預(yù)后預(yù)測(cè)模型。經(jīng)過分析與驗(yàn)證,充分說明該預(yù)后模型預(yù)測(cè)效率以及準(zhǔn)確率較高,能夠有效指導(dǎo)患者預(yù)后的預(yù)測(cè),協(xié)助制定更為精準(zhǔn)的治療方案。