鄧薇,冉亮,王剛,張憲
401220 重慶,重慶醫(yī)科大學(xué)附屬長壽區(qū)人民醫(yī)院/重慶市長壽區(qū)人民醫(yī)院 腎內(nèi)血液科
腎細(xì)胞癌,簡稱腎癌(renal cell carcinoma,RCC)是最常見的泌尿生殖系惡性腫瘤[1],占全部惡性腫瘤的1.8%,占泌尿系統(tǒng)惡性腫瘤的77.2%[2],發(fā)病率和死亡率分別位居泌尿系惡性腫瘤的第2位和第3位[3]。RCC的病程較為隱匿,約有20%~30%的患者在早期診斷時已發(fā)生轉(zhuǎn)移[4],有約30%的患者在行根治性手術(shù)治療后仍會出現(xiàn)復(fù)發(fā)或轉(zhuǎn)移[5],轉(zhuǎn)移性腎癌(metastatic renal cell carcinoma,mRCC)的預(yù)后更差,中位生存期僅約12個月,2年生存率低于20%,5年生存率低于10%[6-7]。mRCC預(yù)后預(yù)測模型的相關(guān)研究,可以幫助臨床醫(yī)生的治療決策。SEER數(shù)據(jù)庫是由美國國家癌癥研究所開發(fā)并供全球開放獲取分析使用,SEER數(shù)據(jù)庫在全球癌癥臨床數(shù)據(jù)庫分析中應(yīng)用廣泛[8]。因此,本文納入SEER數(shù)據(jù)庫中2 880例mRCC患者作為研究對象,構(gòu)建預(yù)后預(yù)測模型,并對該模型的診斷效能和實用性進(jìn)行驗證?,F(xiàn)將相關(guān)結(jié)果報告如下。
提取SEER(Surveillance,Epidemiology and End Results,SEER)數(shù)據(jù)庫(https://seer.cancer.gov)中2010~2015年2 880例初診RCC遠(yuǎn)處轉(zhuǎn)移患者的相關(guān)臨床資料。SEER數(shù)據(jù)庫覆蓋美國18個州和地區(qū)超過全美30%的人口數(shù),具有詳細(xì)可靠的臨床資料和比較完整的隨訪資料,SEER數(shù)據(jù)庫為公開開放獲取,不需要專門的倫理審查和知情同意。
納入標(biāo)準(zhǔn):1)病理診斷為RCC,包括透明腎細(xì)胞癌、乳頭狀腎細(xì)胞癌、嫌色腎細(xì)胞癌和其他類型;2)初診時已明確有遠(yuǎn)處轉(zhuǎn)移(包括腦、肝、肺、骨等主要器官轉(zhuǎn)移);3)臨床病理資料完整、隨訪數(shù)據(jù)完整,可評價。排除標(biāo)準(zhǔn):1)RCC原發(fā)部位不詳;2)合并有其他惡性腫瘤。
主要收集患者的臨床病理及隨訪資料,包括性別、年齡,腫瘤部位、治療方案(手術(shù)治療、放化療)、病理類型、病理分級、T分期、N分期、遠(yuǎn)處轉(zhuǎn)移的部位,生存狀況和總體生存期(overall survival,OS)。進(jìn)一步采用隨機(jī)分割樣本法(分割比為7∶3)將2 880例患者分為基本數(shù)據(jù)集(n=2 016)和驗證數(shù)據(jù)集(n=864)。
采用SPSS 22.0統(tǒng)計軟件對數(shù)據(jù)進(jìn)行統(tǒng)計學(xué)處理,對基本數(shù)據(jù)集中的計量資料采用均數(shù)±標(biāo)準(zhǔn)差進(jìn)行統(tǒng)計描述,組間比較采用t檢驗;計數(shù)資料采用例數(shù)(百分比)進(jìn)行統(tǒng)計描述,組間比較采用χ2檢驗或Fisher確切概率法;以預(yù)后生存狀況作為因變量(Y),采用單因素和多因素Cox比例風(fēng)險回歸模型篩選獨立預(yù)后因素并構(gòu)建預(yù)測模型。利用驗證數(shù)據(jù)集,采用受試者工作特征(receiver operating characteristice,ROC)曲線下面積(area under the curve,AUC)對構(gòu)建的模型的診斷效能進(jìn)行外部驗證。以P<0.05為差異具有統(tǒng)計學(xué)意義。
2 880例mRCC患者臨床病理特征分布情況見表1?;緮?shù)據(jù)集與驗證數(shù)據(jù)集中患者在性別、年齡、腫瘤位置、病理類型、病理分級、T分期、N分期、轉(zhuǎn)移情況、治療情況之間差異均無統(tǒng)計學(xué)意義(均P>0.05),說明兩組數(shù)據(jù)具有可比性。
表1 2 880例mRCC患者臨床病理特征
基于基本數(shù)據(jù)集數(shù)據(jù),以患者預(yù)后總生存作為因變量(死亡:Y=1,存活:Y=0),以患者的臨床病理資料作為自變量(X)進(jìn)行單因素和多因素Cox比例風(fēng)險回歸模型分析(變量篩選方法:Forward為LR,變量入選標(biāo)準(zhǔn)為0.05,剔除標(biāo)準(zhǔn)為0.1),單因素分析結(jié)果顯示:年齡、病理類型、T分期、N分期、腦轉(zhuǎn)移、肝轉(zhuǎn)移、肺轉(zhuǎn)移、手術(shù)治療、放射治療均與患者預(yù)后OS相關(guān)(均P<0.05)。進(jìn)一步多因素分析結(jié)果顯示,年齡≥70歲(HR=1.596)、乳頭狀細(xì)胞癌(HR=0.631)、T4分期(HR=1.669)、N1分期(HR=1.733)、腦轉(zhuǎn)移(HR=1.505)、肝轉(zhuǎn)移(HR=1.624)、肺轉(zhuǎn)移(HR=1.419)、手術(shù)治療(HR=0.361)是mRCC預(yù)后獨立影響因素(均P<0.05,表2)。
表2 mRCC預(yù)后單因素及多因素Cox比例風(fēng)險回歸分析
根據(jù)多因素Cox比例風(fēng)險回歸模型分析結(jié)果,預(yù)測指數(shù)(prognostic index,PI)為:PI=1.596X2+0.631X4+1.669X6+1.733X7+1.505X8+1.624X9+1.419X10+0.361X12。構(gòu)建Cox比例風(fēng)險回歸指數(shù)模型表達(dá)式為:h(t)=h0exp(1.596X2+0.631X4+1.669X6+1.733X7+1.505X8+1.624X9+1.419X10+0.361X12)。
ROC曲線分析顯示,預(yù)后預(yù)測模型用于預(yù)測驗證數(shù)據(jù)集mRCC患者的3年生存率和5年生存率的AUC分別為0.744和0.761,顯示該模型在預(yù)測預(yù)后方面具有較好的可靠性和重復(fù)性,見圖1、2。
圖1 模型用于預(yù)測驗證組mRCC患者3年生存率的ROC曲線
圖2 模型用于預(yù)測驗證組mRCC患者5年生存率的ROC曲線
由于RCC患者的早期臨床癥狀較為隱匿,因此,約有20%~30%的RCC患者在初次診斷時已存在遠(yuǎn)處轉(zhuǎn)移[4]。mRCC患者的預(yù)后較差,無遠(yuǎn)處轉(zhuǎn)移的RCC患者的5年生存率可達(dá)90%,而mRCC的5年生存率卻不到10%[9-10]。因此,了解mRCC患者的預(yù)后影響因素并構(gòu)建相關(guān)預(yù)后預(yù)測模型對mRCC的治療及提高預(yù)后生存至關(guān)重要。RCC患者的預(yù)后狀態(tài)具有明顯的異質(zhì)性,單一模式的預(yù)測模型對腫瘤總體生存率的預(yù)測存在明顯的不足[11-12]。因此,科學(xué)的構(gòu)建基于患者臨床病理信息的統(tǒng)計學(xué)預(yù)后預(yù)測模型,并明確各臨床指標(biāo)的權(quán)重,將有助于指導(dǎo)臨床治療和決策。本研究利用SEER數(shù)據(jù)庫的2 880例mRCC患者臨床病理及隨訪數(shù)據(jù),構(gòu)建具有實際可操作性的預(yù)后預(yù)測模型,并驗證了其實用性和可靠性。
本組基本數(shù)據(jù)集數(shù)據(jù)結(jié)果顯示,高齡,T分期越高、N分期越高、存在腦轉(zhuǎn)移、肝轉(zhuǎn)移、肺轉(zhuǎn)移,病理類型為透明RCC,未行手術(shù)治療和行放射治療與mRCC患者不良預(yù)后相關(guān)。將8個臨床指標(biāo)及年齡因素納入多因素Cox比例風(fēng)險回歸模型,發(fā)現(xiàn)年齡≥70歲(HR=1.596)、乳頭狀細(xì)胞癌(HR=0.631)、T4分期(HR=1.669)、N1分期(HR=1.733)、腦轉(zhuǎn)移(HR=1.505)、肝轉(zhuǎn)移(HR=1.624)、肺轉(zhuǎn)移(HR=1.419)、手術(shù)治療(HR=0.361)是mRCC預(yù)后獨立影響因素,并進(jìn)一步構(gòu)建了預(yù)后預(yù)測指數(shù)模型。在本研究中,我們基于基本數(shù)據(jù)集數(shù)據(jù)中的各種危險因素的組合構(gòu)建了一個較為全面的預(yù)測模型,可以更好地預(yù)測mRCC患者的預(yù)后。并通過驗證數(shù)據(jù)集的進(jìn)行了外部驗證,證實該模型對mRCC患者預(yù)后3年生存率預(yù)測的AUC為0.744,5年生存率預(yù)測的AUC為0.761,說明該曲線的擬合優(yōu)度及診斷效能均比較理想。同時我們也發(fā)現(xiàn),本研究構(gòu)建的預(yù)測模型與既往報道的mRCC預(yù)后危險因素部分一致,也存在一定差異,如本研究中的性別、種族、病理分級及是否發(fā)生骨轉(zhuǎn)移等因素為進(jìn)入到預(yù)測模型當(dāng)中[13-14],分析其原因可能與本研究的樣本來源、樣本量以及研究變量的納入等方面存在差異有關(guān)[15]。
綜上所述,本研究基于大樣本回顧性數(shù)據(jù)構(gòu)建了包括年齡、病理類型、T分期、N分期、腦轉(zhuǎn)移、肝轉(zhuǎn)移、肺轉(zhuǎn)移和手術(shù)治療等8個指標(biāo)的預(yù)后預(yù)測模型,并通過驗證數(shù)據(jù)集的數(shù)據(jù)經(jīng)ROC曲線分析證實具有較高的可靠性和實際應(yīng)用價值。
然而,本研究同時存在一定局限性,首先,研究數(shù)據(jù)為基于SEER數(shù)據(jù)庫的回顧性研究,數(shù)據(jù)可能存在一定偏差;其次,在研究變量選擇時,由于SEER數(shù)據(jù)庫未包含關(guān)于復(fù)發(fā)的相關(guān)數(shù)據(jù),同時一些手術(shù)相關(guān)的細(xì)化指標(biāo)如手術(shù)切緣、血管侵犯等指標(biāo)均未包含在里面,這些可能影響在預(yù)后預(yù)測模型構(gòu)建時指標(biāo)的全面性;最后,在納入排除標(biāo)準(zhǔn)中,我們剔除了臨床病理資料及隨訪資料不完整的患者,這也可能導(dǎo)致納入樣本的代表性產(chǎn)生一定偏倚。因此,本研究只是一種探索,還有待進(jìn)一步的前瞻性研究加以證實。
作者聲明:本文全部作者對于研究和撰寫的論文出現(xiàn)的不端行為承擔(dān)相應(yīng)責(zé)任;并承諾論文中涉及的原始圖片、數(shù)據(jù)資料等已按照有關(guān)規(guī)定保存,可接受核查。
學(xué)術(shù)不端:本文在初審、返修及出版前均通過中國知網(wǎng)(CNKI)科技期刊學(xué)術(shù)不端文獻(xiàn)檢測系統(tǒng)的學(xué)術(shù)不端檢測。
同行評議:經(jīng)同行專家雙盲外審,達(dá)到刊發(fā)要求。
利益沖突:所有作者均聲明不存在利益沖突。
文章版權(quán):本文出版前已與全體作者簽署了論文授權(quán)書等協(xié)議。