張明坤 王哲 楊柳 侯蘭 張聚良
來自美國癌癥中心的統(tǒng)計數(shù)據(jù)顯示,每年美國有271 270例新發(fā)乳腺癌病人,其中約42 260例病人死于乳腺癌[1]。根據(jù)世界衛(wèi)生組織(WHO)乳腺腫瘤組織學(xué)分類,黏液性乳腺癌(mucinous breast cancer,MBC)是一種特殊類型的乳腺癌,發(fā)病率較低,約占所有乳腺癌的1%~7%[2-3]。目前,多數(shù)研究表MBC是一種預(yù)后良好的腫瘤[4],但在中國MBC缺乏大樣本的研究數(shù)據(jù),如何對病人的危險因素進行綜合考慮并預(yù)測預(yù)后,對改善MBC病人的生存有重要意義?!氨O(jiān)測,流行病學(xué)和結(jié)果”(surveillance epidemiollgy and end results,SEER)數(shù)據(jù)庫是北美最具代表性的大型腫瘤登記注冊數(shù)據(jù)庫之一,收集了大量循證醫(yī)學(xué)的相關(guān)數(shù)據(jù),覆蓋了美國約三分之一的人口[5]。列線圖是一種廣泛用于腫瘤病人生存預(yù)測的工具,具有直觀、準(zhǔn)確可靠和實用等優(yōu)點[6],已被廣泛應(yīng)用于口咽癌、胃癌、乳腺癌和肺癌等多種癌癥的預(yù)后預(yù)測[7-10]。本研究綜合分析了我院和SEER數(shù)據(jù)庫中的數(shù)據(jù),構(gòu)建預(yù)測MBC病人總生存期(overall survival,OS)的列線圖模型,輔助臨床醫(yī)生更加精確地預(yù)測病人的預(yù)后,為病人個體化管理提供依據(jù)。
2004~2012年間我院收治的MBC病人101例,統(tǒng)計病人的臨床病理特征及預(yù)后情況,隨訪方式為電話隨訪和門診隨訪。通過SEER Stat version 8.3.5軟件對SEER數(shù)據(jù)庫中2007~2012年MBC病人的數(shù)據(jù)進行提取和篩選。納入標(biāo)準(zhǔn):(1)病理確診為乳腺癌的病人,基于ICD-O-3的惡性行為;(2)病理分型為MBC;(3)有完整的臨床病理及隨訪資料。排除標(biāo)準(zhǔn):(1)隨訪信息不完整;(2)經(jīng)過尸檢或死亡證明確診的病例;(3)分化程度、腫瘤分期、放化療情況及雌激素受體(ER)、孕激素受體(PR)狀態(tài)等重要信息缺失。根據(jù)納入排除標(biāo)準(zhǔn),逐步篩選出符合標(biāo)準(zhǔn)的病例(圖1),最終納入MBC病人5 671例。
圖1 SEER病例篩選流程圖
對比我院和SEER數(shù)據(jù)庫中的臨床病理資料,包括年齡、是否放療、是否化療、分期、分化程度、偏側(cè)性、腫瘤位置、是否第一原發(fā)腫瘤、手術(shù)情況、ER狀態(tài)、PR狀態(tài)、人類表皮生長因子受體2(Her-2)狀態(tài)以及生存狀態(tài)和時間等變量。以SEER數(shù)據(jù)庫提取的5 671例病人數(shù)據(jù)作為建模集,分析MBC預(yù)后的獨立影響因素并建立預(yù)測模型,以我院101例病人數(shù)據(jù)作為驗證集,驗證模型對于中國MBC病人的預(yù)測效果。
采用R軟件(4.0.3)分析數(shù)據(jù),采用χ2檢驗比較建模集和驗證集的基線特征,其中對于腫瘤分期等等級資料進行秩和檢驗(Mann-whitney U檢驗),Kaplan-Meier法計算總體生存率,Log-rank檢驗評價各變量不同亞組生存差異的顯著性,連續(xù)變量用中位數(shù)(范圍)表示,分類變量用例數(shù)(%)表示。使用Cox單因素分析篩選有意義的變量;將單因素分析中P<0.1的變量納入多因素Cox比例風(fēng)險模型,以防止具有獨立預(yù)測意義的變量遺漏。基于影響MBC預(yù)后的獨立危險因素,使用 R 軟件(4.0.3)中的rms、survival等程序包構(gòu)建繪制列線圖。在驗證集中進行外部驗證,并采用bootstrap法進行1 000次重抽樣對列線圖的預(yù)測性能進行內(nèi)部驗證。模型的區(qū)分度用C-index、ROC曲線及曲線下面積(AUC)進行評價,同時通過繪制校準(zhǔn)曲線檢測模型的校準(zhǔn)度,以確保模型準(zhǔn)確可靠,最后為模型繪制臨床決策曲線(DCA)來檢測模型的臨床獲益和應(yīng)用價值。
1.病人的基線特征:建模集隨訪時間0~119個月,中位隨訪時間72個月;驗證集隨訪時間6~107個月,中位隨訪時間87個月。采用χ2檢驗及Mann-whitney U檢驗對比建模集和驗證集的基線特征,結(jié)果顯示,建模集和驗證集的年齡(平均年齡67歲vs 56歲,P<0.01)有明顯差異,是否放療、是否化療、是否第一原發(fā)腫瘤、臨床分期、T分期及手術(shù)情況比較,差異有統(tǒng)計學(xué)意義(P<0.05)(表1)。
表1 MBC病人的基線特征(例,%)
2.各變量對MBC病人預(yù)后影響的分析:在建模集中對每個變量進行Cox單因素生存分析,其中年齡依據(jù)X-tile軟件最佳截斷值60歲分為二分類變量。結(jié)果顯示:年齡、是否放療、手術(shù)情況、T分期、N分期、M分期及ER狀態(tài)等7個變量是MBC預(yù)后的影響因素(P<0.1)。將單因素Cox回歸篩選的7個變量納入多因素Cox回歸模型,經(jīng)向后法逐步回歸AIC分析后結(jié)果顯示,年齡、T分期、M分期、是否放療及手術(shù)情況這5個變量是MBC預(yù)后的獨立危險因素(P<0.05)(表2)?;贙aplan-Meier和Log-rank檢驗方法,利用Cox風(fēng)險模型繪制出各主要變量的生存曲線(圖2)。
表2 影響MBC病人預(yù)后的單因素和多因素分析
圖2 篩選變量對MBC病人OS影響的生存曲線分析
3.MBC的OS預(yù)后列線圖的構(gòu)建:基于建模集Cox多因素回歸分析的結(jié)果(圖3),將篩選出的5個變量用于構(gòu)建MBC病人OS預(yù)后的列線圖模型(圖4),將所有的預(yù)測因子整合用列線圖來預(yù)測MBC病人3年、5年及8年的生存期。將各個變量所得分值相加,得到的總分可預(yù)測MBC病人的3年、5年及8年生存率。
圖3 MBC病人Cox多因素風(fēng)險模型森林圖
圖4 MBC病人預(yù)后的列線圖預(yù)測模型
4.列線圖的內(nèi)部及外部驗證建模集:建模集建立模型的C-index為0.87,驗證集進行外部驗證C-index=0.71,bootstrap法內(nèi)部驗證C-index=0.81,顯示模型無論對美國人群還是中國人群都具有良好的區(qū)分度。同時在建模集和驗證集中繪制3年、5年及8年OS的ROC曲線,通過曲線下面積(AUC)進一步驗證模型區(qū)分度(圖5)。在建模集和驗證集中,分別根據(jù)病人的3年、5年和8年生存情況繪制校準(zhǔn)曲線,用于評價模型的校準(zhǔn)度,結(jié)果顯示所有的校正曲線均與理想曲線有較好的吻合度,提示模型預(yù)測有較好的準(zhǔn)確性(圖6)。
圖5 建模集及驗證集的3年、5年及8年OS的ROC曲線
圖6 建模集及驗證集的3年、5年及8年OS校準(zhǔn)曲線(X軸為實際生存率,Y軸為預(yù)測生存率,對角線為理想曲線表示兩者完全一致)
5.臨床決策曲線分析:傳統(tǒng)的診斷實驗指標(biāo)如敏感性、特異性及AUC等僅僅只能考慮模型的準(zhǔn)確性,不能反應(yīng)在臨床實踐中模型的實際臨床效用有多少,而臨床決策曲線分析(DCA)能夠從臨床決策的實際出發(fā),將病人或決策者的偏好整合到分析中[11]。本研究針對建模集和驗證集的3年、5年及8年的生存情況分別繪制DCA曲線,其中黑色橫線代表所有樣本都是陰性,獲益為0,灰色斜線表示所有樣本都是陽性,凈獲益為負(fù)值的反斜線,虛線為模型的凈獲益情況。結(jié)果顯示,無論在建模集還是在驗證集中,模型的3年、5年及8年臨床凈獲益都較高,尤其在驗證集中國人群中獲益率更為明顯,顯示模型臨床效能較好(圖7)。
圖7 建模集及驗證集3年、5年及8年DCA曲線
乳腺癌的診斷和治療的規(guī)范化對降低乳腺癌的死亡率和改善預(yù)后、延長生存期至關(guān)重要[12]。MBC臨床上較為少見,但通常預(yù)后良好,生存率較高[13]。研究表明,MBC與非特殊類型乳腺癌相比,有獨立的臨床病理特征,但由于MBC相對少見,臨床上極易忽視[14]。如何對MBC病人的預(yù)后進行評估,對MBC的綜合治療有重要意義。列線圖是多因素預(yù)后模型的圖形表現(xiàn)形式,可用來個體化預(yù)測特點時間點病人的生存情況[15]。列線圖作為一種新型預(yù)測模型,與傳統(tǒng)預(yù)測方法相比,準(zhǔn)確性更高,適應(yīng)性更廣,并且易于推廣[16]。由于我院MBC病人樣本量較小,本研究利用SEER數(shù)據(jù)庫的大量MBC病人數(shù)據(jù)構(gòu)建列線圖模型來預(yù)測MBC病人的OS,然后在中國人群中進行外部驗證,并通過bootstrap方法(1 000次重抽樣)進行內(nèi)部驗證,采用一致性指數(shù)(C-index)、ROC曲線和校正曲線評估模型的區(qū)分度和可靠性,最后通過臨床決策曲線分析(DCA)來評價模型的臨床獲益和應(yīng)用價值。結(jié)果顯示,該列線圖能準(zhǔn)確預(yù)測MBC病人的預(yù)后,為臨床的診療提供科學(xué)依據(jù)。
本研究結(jié)果顯示,年齡、手術(shù)情況、放療情況、T分期以及M分期是MBC預(yù)后的獨立影響因素。本研究中,中國人群MBC病人的平均年齡56歲,年齡越大病人的死亡風(fēng)險越高,這與El等[4]的研究結(jié)果類似。本研究中,來自中國人群的驗證集保乳率為22.77%,遠(yuǎn)低于來自美國人群的建模集(62.07%),這與國外的報道相符合[17]。與未手術(shù)相比,無論是保乳還是乳房全切手術(shù)都能顯著改善病人預(yù)后。多項研究表明,放療能顯著降低乳腺癌病人的局部復(fù)發(fā)率并提高生存率[18-19]。本研究顯示,未接受放療是MBC病人預(yù)后的獨立危險因素。既往關(guān)于MBC的研究表明,MBC的預(yù)后與TNM分期相關(guān)[20-21],這與本研究的結(jié)果一致,本研究中,隨著TNM分期的增高,病人的預(yù)后越差,T分期和M分期是MBC預(yù)后的獨立影響因素。
綜上所述,本研究基于SEER數(shù)據(jù)庫及我院MBC病人數(shù)據(jù)建立預(yù)測模型,確立了年齡、T分期、M分期、是否放療及手術(shù)情況是MBC病人預(yù)后的獨立危險因素,預(yù)測模型能夠準(zhǔn)確有效地預(yù)測MBC病人3年、5年及8年OS,為MBC預(yù)后的預(yù)測提供有效的科學(xué)依據(jù)。但由于SEER數(shù)據(jù)庫中數(shù)據(jù)的局限性,預(yù)測模型無法納入如化療方案、放療方案、內(nèi)分泌治療方案等一些臨床中的重要因素,可能需要進一步的研究對模型進行優(yōu)化。此外,由于來自我院的MBC樣本量較少,模型對中國人群的預(yù)測能力尚需進一步驗證。