黃 毅, 寧春玉, 黎結(jié)初, 鄧 斌, 黃少欣, 謝雪麗
(廣西醫(yī)科大學(xué)第八附屬醫(yī)院/貴港市人民醫(yī)院, 1. 血液內(nèi)科, 2. 腫瘤科, 廣西 貴港, 537100)
彌漫性大B細(xì)胞淋巴瘤(DLBCL)是一種侵襲性惡性腫瘤,約占全世界所有淋巴瘤病例的1/3[1-2]。目前該疾病主要采取以化療、免疫治療、靶向藥物治療等為主的聯(lián)合性治療方法,以提高患者的生存率,但不同個(gè)體間存在差異,臨床表現(xiàn)也各不相同,且治療期間會(huì)出現(xiàn)不同的治療反應(yīng)[3], 導(dǎo)致患者預(yù)后差異較大。自1993年以來,國際預(yù)后指數(shù)(IPI)長期被用于DLBCL患者的危險(xiǎn)分層、預(yù)后預(yù)測(cè)及治療指導(dǎo)[4]。隨著靶向藥物利妥昔單抗的廣泛應(yīng)用, IPI對(duì)DLBCL的預(yù)測(cè)效率有所降低。因此,識(shí)別高?;颊邔?duì)于個(gè)體化監(jiān)測(cè)和優(yōu)化治療是必要的。相較于病理類型及臨床分期,個(gè)體化監(jiān)測(cè)的預(yù)后模型準(zhǔn)確性更高,其中列線圖已被廣泛用于大多數(shù)癌癥類型的預(yù)后預(yù)測(cè)[5]。本研究通過構(gòu)建預(yù)測(cè)DLBCL患者1、3、5年生存期的列線圖模型,為制訂個(gè)體化監(jiān)測(cè)和治療提供參考依據(jù),現(xiàn)將結(jié)果報(bào)告如下。
本研究通過SEER*Stat(8.4.1版本)軟件收集美國國家癌癥研究所監(jiān)測(cè)、流行病學(xué)和最終結(jié)果數(shù)據(jù)庫(SEER數(shù)據(jù)庫)2010—2015年的DLBCL病例數(shù)據(jù)進(jìn)行回顧性分析。納入標(biāo)準(zhǔn): ①《國際疾病分類腫瘤學(xué)專輯第3版(ICD-O-3)》形態(tài)學(xué)分型為DLBCL(9680/3); ② 患者臨床就診資料、隨訪資料等信息完整。排除標(biāo)準(zhǔn): ① 合并多種惡性腫瘤者; ② 總生存期為0個(gè)月或信息不完整者。最終納入9 486例DLBCL患者為研究對(duì)象,并按7∶3的比例分為SEER訓(xùn)練集和驗(yàn)證集。同時(shí)選取2013年1月—2017年12月本院血液內(nèi)科和腫瘤科的120例DLBCL患者作為外部驗(yàn)證集,納入和排除標(biāo)準(zhǔn)與SEER驗(yàn)證集相同,隨訪截止時(shí)間是2022年12月31日。病例篩選流程見圖1。
圖1 DLBCL病例篩選流程圖
從SEER數(shù)據(jù)庫以及外部驗(yàn)證集中提取了8個(gè)臨床變量數(shù)據(jù),包括年齡、性別、放療、化療、B癥狀、Ann Arbor分期、生存時(shí)間及生存狀態(tài)??偵嫫?OS)為診斷日期開始到任何原因死亡或到末次隨訪的時(shí)間。
采用SPSS統(tǒng)計(jì)軟件進(jìn)行數(shù)據(jù)分析,訓(xùn)練集和驗(yàn)證集的計(jì)數(shù)資料采用[n(%)]表示,組間比較采用卡方檢驗(yàn)。以死亡為研究終點(diǎn),采用Cox比例回歸風(fēng)險(xiǎn)模型對(duì)SEER訓(xùn)練集進(jìn)行影響因素分析,篩選出影響DLBCL預(yù)后的因素。將影響因素引入R軟件,通過“rms”、“survival”等進(jìn)行數(shù)據(jù)處理及圖表繪制,采用受試者工作特征(ROC)曲線的曲線下面積(AUC)以及一致性指數(shù)(C-index)評(píng)價(jià)模型區(qū)分度。采用Bootstrap法進(jìn)行重復(fù)抽樣,繪制校準(zhǔn)曲線用于評(píng)估實(shí)際概率與列線圖概率的一致性。采用X-tile軟件評(píng)估腫瘤風(fēng)險(xiǎn)分層的最佳截?cái)嘀?采用Kaplan-Meier曲線比較風(fēng)險(xiǎn)差異。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
最終從SEER數(shù)據(jù)庫提取了9 486例患者的基線資料,其中年齡≥60歲者占比68.64%, 男性占比56.54%; Ann Arbor分期占比最多的為Ⅳ期患者(34.67%), 其次為Ⅰ期患者(24.24%), 均高于Ⅱ期患者(21.40%)、Ⅲ期患者(19.69%); 26.81%的患者出現(xiàn)B癥狀, 23.22%的患者接受了放射治療,86.22%的患者接受過化療。
外部驗(yàn)證集為本院血液內(nèi)科及腫瘤科的120例患者,其中年齡≥60歲者占比73.33%,男性占比56.67%; Ann Arbor分期占比最多的為Ⅰ期患者(32.50%), 其次為Ⅱ期患者(25.83%),均高于Ⅲ期(21.67%)、Ⅳ期(20.00%); 15.00%的患者出現(xiàn)B癥狀, 20.00%的患者接受了放射治療, 76.67%的患者接受過化療。
在SEER訓(xùn)練集中, Cox回歸分析結(jié)果顯示,年齡≥60歲、男性、Ann Arbor分期高、有B癥狀、未接受放療、未接受化療是影響DLBCL預(yù)后的危險(xiǎn)因素(P<0.05), 見表1。
表1 SEER訓(xùn)練集DLBCL患者預(yù)后的Cox回歸分析
在外部驗(yàn)證集中, Cox回歸分析結(jié)果顯示, Ann Arbor分期高、未接受化療是影響DLBCL預(yù)后的危險(xiǎn)因素(P<0.05), 見表2。
表2 外部驗(yàn)證集DLBCL患者預(yù)后的Cox回歸分析
根據(jù)SEER訓(xùn)練集的多因素回歸分析結(jié)果,應(yīng)用年齡、性別、Ann Arbor分期、化療情況、放療情況、B癥狀等因素構(gòu)建預(yù)測(cè)1、3、5年生存率的列線圖模型。每個(gè)風(fēng)險(xiǎn)因素分別對(duì)應(yīng)特定的分?jǐn)?shù),將各個(gè)風(fēng)險(xiǎn)因素對(duì)應(yīng)的得分相加得到總分值,根據(jù)總分值投射到生存期軸的數(shù)值即可得知1、3、5年的生存率,見圖2。
圖2 DLBCL患者預(yù)后的列線圖預(yù)測(cè)模型
對(duì)列線圖進(jìn)行內(nèi)部驗(yàn)證及外部驗(yàn)證, ROC曲線顯示列線圖預(yù)測(cè)模型具有良好的預(yù)測(cè)準(zhǔn)確性。SEER訓(xùn)練集的C-index為0.681, ROC曲線預(yù)測(cè)DLBCL患者1、3、5年生存率的AUC分別為0.714、0.698、0.699; SEER驗(yàn)證集的C-index為0.669, ROC曲線預(yù)測(cè)DLBCL患者1、3、5年生存率的AUC分別為0.700、0.678、0.678; 外部驗(yàn)證集的C-index為0.817, ROC曲線預(yù)測(cè)DLBCL患者1、3、5年生存率的AUC分別為0.794、0.861、0.869,見圖3。校準(zhǔn)曲線顯示列線圖預(yù)測(cè)模型結(jié)果與實(shí)際結(jié)果具有良好的一致性,見圖4。
A: SEER訓(xùn)練集ROC曲線; B: SEER驗(yàn)證集ROC曲線; C: 外部驗(yàn)證集ROC曲線。圖3 列線圖模型預(yù)測(cè)效能的ROC曲線分析
A: SEER訓(xùn)練集校準(zhǔn)曲線; B: SEER驗(yàn)證集校準(zhǔn)曲線; C: 外部驗(yàn)證集校準(zhǔn)曲線。圖4 列線圖模型預(yù)測(cè)效果的校準(zhǔn)曲線
通過列線圖計(jì)算每例患者的風(fēng)險(xiǎn)總分值,采用X-tile軟件計(jì)算對(duì)OS影響最大的風(fēng)險(xiǎn)評(píng)分的截?cái)嘀禐?70分,根據(jù)截?cái)嘀祵⒒颊叻譃榈惋L(fēng)險(xiǎn)組(<170分)和高風(fēng)險(xiǎn)組(≥170分)。在SEER訓(xùn)練集、驗(yàn)證集以及外部驗(yàn)證集中,低風(fēng)險(xiǎn)組患者的5年生存率高于高風(fēng)險(xiǎn)組,差異有統(tǒng)計(jì)學(xué)意義(P<0.05), 見圖5。
A: SEER訓(xùn)練集風(fēng)險(xiǎn)分層組生存分析; B: SEER驗(yàn)證集風(fēng)險(xiǎn)分層組生存分析; C: 外部驗(yàn)證集風(fēng)險(xiǎn)分層組生存分析。圖5 風(fēng)險(xiǎn)分層K-M曲線圖
DLBCL是一種具有高度侵襲性的淋巴瘤,目前關(guān)于DLBCL預(yù)后的指標(biāo)中應(yīng)用較多的是IPI, 其是由年齡、Ann Arbor 分期等多種指標(biāo)相結(jié)合[6], 無法準(zhǔn)確評(píng)估部分患者的預(yù)后。本研究利用SEER數(shù)據(jù)庫獲取了9 486例DLBCL患者的臨床信息,采用了Cox比例風(fēng)險(xiǎn)回歸分析,結(jié)果顯示年齡、性別、Ann Arbor分期、放療情況、化療情況、B癥狀與DLBCL患者預(yù)后相關(guān)。本研究中,年齡是DLBCL患者預(yù)后的主要影響因素, ≥60歲患者的預(yù)后較差,此結(jié)果與CHIAPPELLA A等[7]研究指出的DLBCL高發(fā)于60歲以上患者基本一致?!?0歲患者的預(yù)后較差可能與其免疫力低下、對(duì)放化療等治療方法的耐受性差有關(guān)。男性患者的預(yù)后較女性更差,與SHAH B K等[8]提出的女性有更好的生存率一致,符合DLBCL的臨床特點(diǎn)。
Ann Arbor分期是國內(nèi)外公認(rèn)的淋巴瘤分類標(biāo)準(zhǔn),相關(guān)研究[9]表明,分期越高則預(yù)后越差。本研究結(jié)果顯示, Ann Arbor分期與DLBCL患者的預(yù)后相關(guān), Ⅳ期患者的預(yù)后更差,與翟淑丹等[10]研究一致。本研究通過列線圖風(fēng)險(xiǎn)分層模型,將患者分為低風(fēng)險(xiǎn)組和高風(fēng)險(xiǎn)組,結(jié)果表明低風(fēng)險(xiǎn)組具有更長的生存期,通過風(fēng)險(xiǎn)分層對(duì)個(gè)體生存率進(jìn)行預(yù)測(cè)效果更顯著。研究[11-13]顯示,多種臨床特征如基線資料、治療方案等在評(píng)估DLBCL患者預(yù)后時(shí)同樣起著至關(guān)重要的作用。本研究構(gòu)建的列線圖預(yù)測(cè)模型綜合了年齡、性別、Ann Arbor分期、治療方案等多個(gè)預(yù)后因素,可以更為個(gè)性化地預(yù)測(cè)DLBCL患者預(yù)后。
本研究中,化療及放療情況是影響預(yù)后的獨(dú)立危險(xiǎn)因素,化療或放療均可有效改善患者的預(yù)后。LIU P P等[14]通過對(duì)SEER數(shù)據(jù)庫的386例乳腺DLBCL進(jìn)行研究,結(jié)果表明接受放療的患者5年的OS顯著優(yōu)于未接受放療的患者。WU J Q等[15]研究指出,接受基于利妥昔單抗的化療的DLBCL患者的總緩解率為94.2%。LIN J Y等[16]通過對(duì)94例DLBCL患者進(jìn)行預(yù)后因素分析,指出治療方式對(duì)患者的預(yù)后影響較大,化療、放療等可顯著改善患者的預(yù)后。本研究以大樣本臨床數(shù)據(jù)進(jìn)行分析,結(jié)果顯示放療、化療對(duì)DLBCL患者預(yù)后有積極作用,可增加患者的生存獲益,提示對(duì)符合放療、化療條件的DLBCL患者,可以考慮進(jìn)行放療、化療以改善預(yù)后。陳雅姝等[17]指出存在B癥狀是影響DLBCL患者預(yù)后的獨(dú)立危險(xiǎn)因素。汪玉芳等[18]研究指出存在B癥狀的患者生存率低于不存在B癥狀的患者。本研究結(jié)果與上述研究基本一致,提示存在B癥狀對(duì)DLBCL患者預(yù)后有影響。
列線圖是將回歸方程轉(zhuǎn)變?yōu)榭梢暬膱D形,使預(yù)測(cè)模型的結(jié)果具有可讀性,目前在臨床實(shí)踐中廣泛應(yīng)用[19]。HAN Y等[20]對(duì)1 070例DLBCL患者進(jìn)行相關(guān)研究,構(gòu)建了基于Cox比例風(fēng)險(xiǎn)模型的列線圖,提供了DLBCL 患者存活率的準(zhǔn)確估計(jì)。WANG J等[21]通過對(duì)SEER數(shù)據(jù)庫中的7 121例原發(fā)性胃腸道DLBCL進(jìn)行分析,通過列線圖預(yù)測(cè)模型驗(yàn)證了其準(zhǔn)確性。然而,部分研究僅進(jìn)行了內(nèi)部驗(yàn)證,并未進(jìn)行外部驗(yàn)證。外部驗(yàn)證是將另外一組研究對(duì)象的數(shù)據(jù)(即外部數(shù)據(jù))去驗(yàn)證模型的預(yù)測(cè)準(zhǔn)確性[22], 本研究選取本院120例DLBCL患者進(jìn)行外部驗(yàn)證,來驗(yàn)證列線圖的準(zhǔn)確性,結(jié)果證實(shí)了列線圖的準(zhǔn)確性與可靠性。
C-index指標(biāo)是基于受試者的生存時(shí)間排序結(jié)果計(jì)算得出的,其值代表了在排除隨機(jī)因素的情況下,預(yù)測(cè)模型正確預(yù)測(cè)受試者生存時(shí)間的能力。本研究結(jié)果顯示, SEER訓(xùn)練集的C-index為0.681, 驗(yàn)證集的C-index為0.669, 外部驗(yàn)證集的C-index為0.817, 該結(jié)果說明列線圖預(yù)后預(yù)測(cè)模型在預(yù)測(cè)DLBCL患者預(yù)后方面具有較高的準(zhǔn)確性。列線圖是一種繪制分類器性能曲線的工具,能夠展現(xiàn)出預(yù)測(cè)值與實(shí)際值之間差異的大小和方向。本研究SEER訓(xùn)練集的ROC曲線預(yù)測(cè)DLBCL患者1、3、5年生存率的AUC分別為0.714、0.698、0.699; SEER驗(yàn)證集的ROC曲線預(yù)測(cè)DLBCL患者1、3、5年生存率的AUC分別為0.700、0.678、0.678; 外部驗(yàn)證集ROC曲線預(yù)測(cè)DLBCL患者1、3、5年生存率的AUC分別為0.794、0.861、0.869。該結(jié)果表明列線圖預(yù)測(cè)模型具有較好的預(yù)測(cè)精度。
本研究構(gòu)建列線圖并進(jìn)行了內(nèi)部驗(yàn)證以及外部驗(yàn)證,顯示出良好的預(yù)測(cè)效能,但仍存在一定的局限性: ① 本研究為回顧性分析,需進(jìn)一步進(jìn)行前瞻性的臨床研究進(jìn)行驗(yàn)證。② SEER數(shù)據(jù)庫中未提供如吸煙、遺傳因素、放療計(jì)劃、化療方案等因素,這可能會(huì)降低列線圖的預(yù)測(cè)準(zhǔn)確性。③ 外部驗(yàn)證集在進(jìn)行多因素分析時(shí),其性別、年齡、放療、B癥狀等因素顯示無統(tǒng)計(jì)學(xué)意義,其可能原因是研究所選取的樣本量較小,且選取的外部驗(yàn)證數(shù)據(jù)與SEER數(shù)據(jù)庫的人口數(shù)據(jù)可能存在一定差異,后續(xù)應(yīng)進(jìn)行多中心研究進(jìn)一步驗(yàn)證。
綜上所述,男性、年齡≥60歲、Ann Arbor分期高、未接受放療、未接受化療、存在B癥狀是影響DLBCL患者預(yù)后的獨(dú)立危險(xiǎn)因素。基于上述因素建立的列線圖預(yù)測(cè)模型具有良好的預(yù)測(cè)效能,可對(duì)DLBCL患者預(yù)后進(jìn)行個(gè)體化風(fēng)險(xiǎn)評(píng)估和預(yù)測(cè)。