張明坤 王哲 楊柳 侯蘭 張聚良
美國癌癥中心的統(tǒng)計數(shù)據(jù)顯示,每年美國有271 270 例新發(fā)乳腺癌患者,其中約42 260 例患者死于乳腺癌[1]。浸潤性微乳頭狀癌(invasive micropapillary carcinoma,IMPC)是乳腺浸潤性導(dǎo)管癌的一種特殊類型,占乳腺癌的2%~8%[2]。乳腺IMPC 因具有更高的侵襲性,易出現(xiàn)血管侵犯及淋巴結(jié)轉(zhuǎn)移[3-4],但對其臨床病理特征和預(yù)后影響因素尚缺乏統(tǒng)一的結(jié)論[5]。如何對乳腺IMPC 患者的危險因素進行綜合考慮并預(yù)測預(yù)后,對改善患者的生存具有重要意義。本研究旨在通過分析對比中國和美國乳腺IMPC 患者數(shù)據(jù),構(gòu)建預(yù)測患者總生存(overall survival,OS)率和癌癥特異生存(cancer-specific survival,CSS)率的列線圖模型,為患者個體化治療提供依據(jù)。
回顧性分析2006年7月至2015年7月83 例中國人民解放軍空軍軍醫(yī)大學(xué)西京醫(yī)院收治的乳腺IMPC 患者臨床資料。通過SEER*Stat version 8.3.5軟件對2010年3月至2015年3月美國國立癌癥研究所的SEER 數(shù)據(jù)庫中的乳腺IMPC 患者的數(shù)據(jù)進行篩選,最終納入415 例。納入標(biāo)準(zhǔn):1)病理確診為乳腺癌的患者,病理學(xué)特征符合國際腫瘤學(xué)疾病編碼(International Classification of Diseases for Oncology)第三版(ICD-O-3);2)病理分型為IMPC;3)有完整的臨床病理及隨訪資料。排除標(biāo)準(zhǔn):1)隨訪信息不完整;2)經(jīng)過尸檢或死亡證明確診的病例;3)分化程度、腫瘤分期等重要信息缺失。
1.2.1 模型的構(gòu)建和驗證 對比本院和SEER 數(shù)據(jù)庫中的中美兩國患者的臨床病理資料,包括年齡、是否放療、是否化療、分期、分化程度、左右側(cè)、腫瘤位置、是否為第一原發(fā)腫瘤、術(shù)式、激素受體(hormone rece ptor,HR)、人類表皮生長因子受體-2(HER-2)狀態(tài)、分子分型以及生存狀態(tài)和時間等變量。以SEER 數(shù)據(jù)庫提取的415 例患者數(shù)據(jù)作為建模集,分析乳腺IMPC 預(yù)后的獨立影響因素并建立預(yù)測模型,以本院83 例患者數(shù)據(jù)作為驗證集,驗證模型對于中國患者的預(yù)測效果。
1.2.2 隨訪 使用門診和電話隨訪方式,建模集隨訪時間為0~83 個月、中位隨訪時間為59 個月,驗證集隨訪時間為19~102 個月、中位隨訪時間66 個月。隨訪截止至2020年8月。
采用R 軟件(4.0.3)進行統(tǒng)計學(xué)分析并繪制列線圖。采用χ2檢驗和Fisher 精確檢驗比較建模集和驗證集的基線特征,對于等級資料進行Mann-Whitney U秩和檢驗,連續(xù)資料進行t檢驗,采用Kaplan-Meier法計算總生存率,Log rank 法檢驗評價各變量的不同亞組生存差異。通過單因素及Cox 比例風(fēng)險回歸模型多因素和Fine-Gray 競爭風(fēng)險模型分析影響乳腺IMPC 預(yù)后的獨立危險因素,通過C-index、校準(zhǔn)曲線和臨床決策曲線分析(decision curve analysis,DCA)驗證模型的可靠性。P<0.05 為差異具有統(tǒng)計學(xué)意義。
建模集平均年齡為60 歲,驗證集平均年齡為51 歲,兩者比較差異具有統(tǒng)計學(xué)意義(P=0.013)。建模集和驗證集中的年齡、腫瘤位置、術(shù)式、是否為第一原發(fā)腫瘤和T 分期進行比較差異具有統(tǒng)計學(xué)意義(P<0.05,表1)。
表1 乳腺IMPC 患者的一般特征
表1 乳腺IMPC 患者的一般特征 (續(xù)表1)
采用單因素及Cox 比例風(fēng)險回歸模型多因素分析結(jié)果顯示,年齡、N 分期、M 分期及分子分型是乳腺IMPC 患者OS 預(yù)后的獨立危險因素(P<0.05,表2)。采用Kaplan-Meier 和Log rank 檢驗方法,使用Cox 比例風(fēng)險回歸模型繪制各主要因素的生存曲線;采用Fine-Gray 競爭風(fēng)險模型分析患者的CSS 預(yù)后影響因素,繪制累計腫瘤特異性死亡率和累計競爭風(fēng)險事件發(fā)生率(非腫瘤相關(guān)死亡率)的生存曲線(圖1)。采用Fine-Gray 競爭風(fēng)險模型分析顯示,N 分期、M 分期及分子分型是乳腺IMPC患者CSS 預(yù)后的獨立危險因素(P<0.05),HR(95%CI)分別為1.39(1.11~1.74)、11.26(6.05~20.94)、1.43(1.09 ~1.88)。
表2 影響乳腺IMPC 患者預(yù)后的單因素和Cox 比例風(fēng)險回歸模型多因素分析
圖1 篩選因素對乳腺IMPC 患者OS 和CSS 影響的生存曲線分析
基于建模集Cox 比例風(fēng)險回歸模型多因素和Fine-Gray 競爭風(fēng)險模型分析結(jié)果,分別構(gòu)建乳腺IMPC 患者OS 和 CSS 預(yù)后的列線圖預(yù)測模型(圖2)。將列線圖中各個變量所得分值相加的總分可預(yù)測乳腺IMPC 患者的生存率。
圖2 乳腺IMPC 患者OS 和CSS 預(yù)后的列線圖預(yù)測模型
OS 和CSS 模型中,建模集建立模型的C-index分別為0.85 和0.79,驗證集的外部驗證C-index 分別為0.72 和0.70,bootstrap 法經(jīng)自助重抽樣1 000 次內(nèi)部驗證C-index 分別為0.81 和0.74,均顯示模型具有良好的區(qū)分度。為評估模型是否存在過度擬合,在OS 及CSS 模型的建模集和驗證集中,分別根據(jù)患者的3年和5年生存率繪制校準(zhǔn)曲線,結(jié)果顯示所有的校正曲線均與理想曲線有較好的吻合度,提示模型預(yù)測有較好的校準(zhǔn)度和準(zhǔn)確性(圖3)。
圖3 建模集及驗證集的乳腺IMPC 患者OS 和CSS 校準(zhǔn)曲線
針對OS 列線圖模型中的建模集和驗證集的3年及5年的OS 率分別繪制DCA 曲線,其中黑色橫線代表所有樣本均為陰性、獲益為0,灰色斜線表示所有樣本均為陽性,虛線為模型的凈獲益情況,無論建模集還是驗證集模型的臨床凈獲益均較高,尤其驗證集的中國乳腺IMPC 患者獲益更為明顯,顯示模型的臨床效能較好(圖4)。
圖4 建模集及驗證集的乳腺IMPC 患者3年和5年OS 的DCA 曲線
列線圖可對特定時間點的生存情況進行個體化預(yù)測,作為一種新型預(yù)測模型,與傳統(tǒng)預(yù)測方法相比,準(zhǔn)確性更高,適應(yīng)性更廣,并且易于推廣[6]。多數(shù)研究表明,乳腺IMPC 侵襲性高,預(yù)后差[7-8],為改善乳腺IMPC 患者的預(yù)后,本研究構(gòu)建列線圖預(yù)測模型,預(yù)測乳腺IMPC 患者的OS 和CSS,再在中國乳腺IMPC患者中進行外部驗證,并通過bootstrap 方法進行內(nèi)部驗證,采用C-index、ROC 曲線和校正曲線評估模型的區(qū)分度和可靠性,最后通過DCA 評價模型的臨床獲益和應(yīng)用價值。傳統(tǒng)的敏感性、特異性及AUC 等診斷指標(biāo)只是考慮模型的準(zhǔn)確性,對臨床實踐中的實際臨床效用無法做出有效評估,而DCA 能夠從臨床決策的實際出發(fā),將患者或決策者的偏好整合到分析中[9],從而進一步評估患者是否有臨床獲益。傳統(tǒng)的Kaplan-Meier 法和Cox 比例風(fēng)險回歸模型多因素分析,對OS 進行分析往往會高估累計死亡率和風(fēng)險比值(HR)。本研究采用Fine-Gray 競爭風(fēng)險模型分析CSS,與傳統(tǒng)的Cox 比例風(fēng)險回歸模型進行互補,提高對患者預(yù)后預(yù)測的準(zhǔn)確性,結(jié)果顯示列線圖能準(zhǔn)確預(yù)測乳腺IMPC 患者的預(yù)后,為臨床的診療提供科學(xué)依據(jù)。
本研究結(jié)果顯示,年齡是OS 的獨立危險因素,而N 分期、M 分期及分子分型是乳腺IMPC 患者OS 及CSS 共同的預(yù)后的獨立危險因素,年齡與乳腺IMPC 患者的OS 相關(guān),而與CSS 無關(guān),可能是因患者高齡導(dǎo)致的死亡是CSS 的競爭風(fēng)險事件。本研究發(fā)現(xiàn),乳腺IMPC 患者的淋巴結(jié)陽性比例建模集和驗證集分別為56.14%(233/415)和57.83%(48/83),隨著N 分期增高,患者的死亡風(fēng)險不斷升高,與Yu 等[10]研究中的乳腺IMPC 患者的腋窩淋巴結(jié)轉(zhuǎn)移比例較高,同時復(fù)發(fā)風(fēng)險更高的結(jié)果相符。本研究中,M 分期是風(fēng)險度最高的獨立危險因素,M1 期的患者死亡風(fēng)險是M0 患者的19.57 倍,與臨床中的實際情況相符。本研究中,分子分型與乳腺IMPC 的預(yù)后密切相關(guān),HR 陽性/HER-2 陰性的患者預(yù)后最好,而HR 陰性/HER-2 陰性的患者預(yù)后最差,與Gamba 等[11]研究結(jié)果一致。關(guān)于乳腺IMPC 的診斷標(biāo)準(zhǔn),Middleton 等[12]認(rèn)為IMPC 成分應(yīng)占75%以上才能診斷為IMPC,Luna-Moré等[13]認(rèn)為IMPC 的腫物直徑>5 mm 就應(yīng)該診斷為IMPC,而Ide 等[14]認(rèn)為無論IMPC 成分在癌巢中占多少比例,其淋巴結(jié)轉(zhuǎn)移率和預(yù)后差異均無統(tǒng)計學(xué)意義。IMPC 成分所占比例有可能是影響乳腺癌患者預(yù)后的因素,但SEER 數(shù)據(jù)庫中因未提供IMPC成分比例相關(guān)數(shù)據(jù),所以本研究未能將IMPC 成分所占比例納入模型中。
綜上所述,本研究基于SEER 數(shù)據(jù)庫中乳腺IMPC 患者數(shù)據(jù)建立預(yù)測模型,確立了乳腺IMPC 患者預(yù)后的獨立危險因素,預(yù)測模型能夠準(zhǔn)確有效的預(yù)測IMPC 患者的預(yù)后,尤其是基于驗證集的中國乳腺IMPC 患者模型具有良好的預(yù)測能力,為乳腺IMPC預(yù)后的預(yù)測提供有效的科學(xué)依據(jù)。但由于乳腺IMPC 發(fā)病率較低,目前國內(nèi)仍缺少大樣本量的乳腺IMPC 研究數(shù)據(jù),本研究中的模型仍需進一步的優(yōu)化和驗證。