張舒妮,趙楠楠,李陽(yáng),朱蕓,楊靜茹,張澳琪,顧一泓,謝宗玉*
作者單位 1.蚌埠醫(yī)科大學(xué)第一附屬醫(yī)院放射科,蚌埠 233004;2.蚌埠醫(yī)科大學(xué)研究生院,蚌埠 233004
根據(jù)2023 年美國(guó)癌癥協(xié)會(huì)最新統(tǒng)計(jì),乳腺癌已超過(guò)肺癌成為威脅女性生命健康的第一危險(xiǎn)因素,預(yù)計(jì)2023 年新發(fā)病例超過(guò)29 萬(wàn),發(fā)病率占女性新增癌癥病例的31%[1-2]。乳腺癌是一種侵襲性很強(qiáng)的癌癥,包括多種病理類型,其中浸潤(rùn)性導(dǎo)管癌(invasive ductal carcinoma, IDC)占據(jù)大約70%[3],其生存期因診斷階段及病理類型的不同而有很大差異,腋窩淋巴結(jié)(axillary lymph node, ALN)是否轉(zhuǎn)移對(duì)乳腺癌患者的臨床分期、預(yù)后評(píng)估和個(gè)性化治療方案至關(guān)重要[4]。臨床醫(yī)生曾認(rèn)為乳腺癌的標(biāo)準(zhǔn)治療是乳房根治術(shù)加ALN 清掃術(shù)(axillary lymph node dissection, ALND),但是經(jīng)研究發(fā)現(xiàn),部分患者存在過(guò)度治療的現(xiàn)象,經(jīng)ALND 的患者會(huì)出現(xiàn)上肢水腫、肩關(guān)節(jié)疼痛、麻木及活動(dòng)障礙等并發(fā)癥,嚴(yán)重影響患者的生活質(zhì)量[5]。近年來(lái),前哨淋巴結(jié)活檢(sentinel lymph node biopsy,SLNB)憑借著侵入性小、并發(fā)癥少的優(yōu)點(diǎn),逐步取代ALND成為乳腺癌ALN評(píng)估的標(biāo)準(zhǔn)術(shù)式,但是SLNB與潛在的高假陰性率相關(guān),假陰性率在5%~10%之間,而且對(duì)血管和神經(jīng)具有一定的損害[6]。因此,現(xiàn)階段迫切需要一種安全、無(wú)創(chuàng)的方法來(lái)評(píng)估ALN 狀態(tài),并且避免在無(wú)ALN 轉(zhuǎn)移的患者中進(jìn)行侵入性的操作,改善患者的預(yù)后以及生活質(zhì)量。臨床上,常采用淋巴結(jié)觸診來(lái)初步診斷患者ALN 狀態(tài),但是該方法依賴于臨床醫(yī)師的工作經(jīng)驗(yàn)、患者皮下脂肪厚度以及配合程度,假陰性率高達(dá)45%[7]。影像學(xué)檢查常采用鉬靶(mammography, MG)、MRI 以及超聲來(lái)評(píng)估乳腺癌分期以及ALN 狀態(tài),但是根據(jù)影像學(xué)特征判斷ALN 狀態(tài)依賴于放射科醫(yī)生的工作經(jīng)驗(yàn),主觀性較強(qiáng)[8],而且這些檢查方法各有優(yōu)缺點(diǎn),MG對(duì)鈣化敏感度比較高,對(duì)部分致密型腺體的檢出率低,MRI是多方位、多參數(shù)、多序列成像,對(duì)軟組織分辨能力較高,能夠準(zhǔn)確鑒別囊性及實(shí)性病變,但是對(duì)于微小鈣化不敏感,因此將MG 與MRI 聯(lián)合能夠更加全面地獲得病灶信息。影像組學(xué)是指高通量地提取影像學(xué)特征,挖掘圖像中更深層次的信息,近年來(lái)在腫瘤學(xué)中應(yīng)用廣泛,可以提高診斷、預(yù)測(cè)的準(zhǔn)確性。既往研究[9-10]大多基于單一MG/MRI 模態(tài)或臨床病理資料,并且選擇單一的機(jī)器學(xué)習(xí)分類器構(gòu)建影像組學(xué)模型,無(wú)法篩選出效能最佳的模型,獲得的腫瘤信息有限,目前尚未發(fā)現(xiàn)將MG 及MRI 聯(lián)合并且基于多種機(jī)器學(xué)習(xí)分類器構(gòu)建的影像組學(xué)模型預(yù)測(cè)患者ALN 狀態(tài)的相關(guān)研究。本研究探討基于多種機(jī)器學(xué)習(xí)的多模態(tài)影像組學(xué)術(shù)前預(yù)測(cè)乳腺癌患者ALN轉(zhuǎn)移的價(jià)值,全面提取了每種影像方法的組學(xué)特征,并聯(lián)合臨床高危因素構(gòu)建列線圖模型,預(yù)測(cè)乳腺癌患者術(shù)前ALN 狀態(tài),可以實(shí)現(xiàn)以非侵入的方式協(xié)助臨床制訂科學(xué)有效的診療方案。
回顧性分析2019 年1 月至2023 年6 月在蚌埠醫(yī)科大學(xué)第一附屬醫(yī)院經(jīng)手術(shù)病理證實(shí)為IDC 患者的臨床及影像資料。納入標(biāo)準(zhǔn):(1)術(shù)前及穿刺前常規(guī)行乳腺M(fèi)RI 及MG 檢查且圖像清晰;(2)病理結(jié)果為IDC,并且有完整的ALN 狀態(tài)病理記錄;(3)術(shù)前未接受任何輔助性治療;(4)MG 與MRI 檢查的間隔時(shí)間不超過(guò)1 周。排除標(biāo)準(zhǔn):(1)病灶過(guò)小或者邊界顯示不清,不能進(jìn)行感興趣區(qū)勾畫;(2)隱匿性、復(fù)發(fā)性乳腺癌;(3)其他惡性腫瘤病史、全身病變明顯或合并遠(yuǎn)處轉(zhuǎn)移。最終納入224例患者資料進(jìn)行分析,所有患者均為女性。本研究遵循《赫爾辛基宣言》,經(jīng)蚌埠醫(yī)科大學(xué)第一附屬醫(yī)院醫(yī)學(xué)倫理委員會(huì)批準(zhǔn),免除受試者知情同意,批準(zhǔn)文號(hào):2023-441。
1.2.1 儀器設(shè)備
所有MG 圖像均采用德國(guó)Siemens Mammomat Inspiration 乳腺X 線攝影機(jī)檢查獲得,行頭尾位和內(nèi)外斜位標(biāo)準(zhǔn)雙體位投照。
MRI 檢查均使用荷蘭Philips Achieva 3.0 T 雙梯度超導(dǎo)型MRI 掃描儀,SENSE 7 通道乳腺專用線圈?;颊卟扇「┡P位,雙側(cè)乳房自然對(duì)稱地落入線圈,定位中心對(duì)準(zhǔn)線圈中心及兩側(cè)乳頭連線中點(diǎn)。囑咐患者盡量降低呼吸頻率,以避免呼吸和心跳引起的運(yùn)動(dòng)偽影。MRI 掃描序列和參數(shù):(1) T1WI 序列,TR 400 ms,TE 10 ms,層厚5 mm,層間距1 mm,F(xiàn)OV 350 mm×350 mm,矩陣216×194;(2)T2WI 序列,TR 5000 ms,TE 60 ms,層厚5 mm,層間距1 mm,F(xiàn)OV 350 mm×350 mm,矩陣260×274;(3)擴(kuò)散加權(quán)成像(diffusion-weighted imaging, DWI),TR 2500 ms,TE 40 ms,層厚5 mm,層間距1 mm,F(xiàn)OV 350 mm×350 mm,矩陣184×95,b=0、800 s/mm2;(4)DCE-MRI,TR 4.8 ms,TE 2.4 ms,層厚5 mm,層間距1 mm,F(xiàn)OV 350 mm×350 mm,矩陣252×339。分6 個(gè)時(shí)相采集圖像,每個(gè)時(shí)相掃描60 s,第一個(gè)時(shí)相為蒙片像,然后經(jīng)肘正中靜脈迅速注入劑量為0.2 mmol/kg的對(duì)比劑釓噴酸葡胺(拜耳先靈醫(yī)藥公司,德國(guó)),隨后以流速1.5 mL/s注射生理鹽水20 mL。
1.2.2 臨床特征分析
收集患者臨床資料,如年齡、臨床T分期、觸診及中性粒細(xì)胞絕對(duì)值(absolute neutrophil count, N)(單位:×109/L)、淋巴細(xì)胞絕對(duì)值(absolute lymphocyte count, L)(單位:×109/L)及血小板計(jì)數(shù)(platelet count, P)(單位:×109/L)等臨床指標(biāo),其中生化指標(biāo)均來(lái)源于患者治療前一周的血常規(guī)檢查結(jié)果。計(jì)算中性粒細(xì)胞-淋巴細(xì)胞比率(neutrophil lymphocyte ratio, NLR)、血小板- 淋巴細(xì)胞比率(platelet lymphocyte rate, PLR),計(jì)算公式見(jiàn)式(1)~(2)。
1.2.3 影像特征分析
影像特征由兩名分別具有5 年以上乳腺診斷經(jīng)驗(yàn)的主治醫(yī)師在Philips Extended MR Workspace 后處理工作站上進(jìn)行分析。主要評(píng)價(jià)指標(biāo)包括:病灶最大徑、病灶形態(tài)、腫塊內(nèi)部強(qiáng)化特點(diǎn)、表觀擴(kuò)散系數(shù)(apparent diffusion coefficient, ADC)、時(shí)間-信號(hào)強(qiáng)度曲線(time-signal intensity curve, TIC)類型、背景實(shí)質(zhì)強(qiáng)化(background parenchymal enhancemennt, BPE)、毛刺征、鈣化、腺體類型、BI-RADS 分類、MRI_ALN及MG_ALN 等。既往研究發(fā)現(xiàn)發(fā)生ALN 轉(zhuǎn)移的淋巴結(jié)特點(diǎn)包括:形狀飽滿、短徑明顯增大或較對(duì)側(cè)明顯增大、淋巴門結(jié)構(gòu)消失、邊緣模糊不清、密度增加等[11]。當(dāng)兩名醫(yī)師對(duì)判讀結(jié)果出現(xiàn)分歧時(shí),通過(guò)商議達(dá)成一致。
1.2.4 圖像分割和特征提取
病灶的分割與特征提取在醫(yī)準(zhǔn)智能科技有限公司的達(dá)爾文智能科研平臺(tái)(http://www.yizhun-ai.com)上完成。由兩名具有5 年以上乳腺診斷經(jīng)驗(yàn)的主治醫(yī)師在未接觸患者臨床及病理資料的情況下間隔一周時(shí)間先后在DCE-MRI 序列第二期圖像上勾畫最大層面,并復(fù)制到T2WI 圖像上,再嚴(yán)格根據(jù)病灶在不同序列的實(shí)際形態(tài)調(diào)整ROI范圍;最后在MG的頭尾位及內(nèi)外斜位圖像上對(duì)病灶進(jìn)行局部放大,勾畫病灶(圖1),統(tǒng)一勾畫標(biāo)準(zhǔn)。
圖1 女,63 歲,病理證實(shí)為乳腺浸潤(rùn)性導(dǎo)管癌,腋窩淋巴結(jié)狀態(tài)為陰性,臨床觸診未觸及腫塊,MRI及MG 示右乳外下象限不規(guī)則腫塊。1A:MG 頭尾位原始圖像及ROI勾畫圖;1B:MG內(nèi)外斜位原始圖像及ROI勾畫圖;1C: T2WI圖像病灶最大層面原始圖像及ROI勾畫圖;1D:DCE-MRI第二期病灶最大層面原始圖像及ROI勾畫圖。黃線范圍內(nèi)為病灶ROI。MG:鉬靶;ROI:感興趣區(qū);DCE-MRI:動(dòng)態(tài)對(duì)比增強(qiáng)MRI。Fig.1 A 63-year-old female is pathologically confirmed to be invasive ductal carcinoma of the breast, the axillary lymph node status is negative, the mass is not palpated on clinical palpation, and the MRI and MG show an irregular mass in the outer lower quadrant of the right breast.1A: Raw image and ROI outline of the head and tail position of the mammography target; 1B: Raw image and ROI outline of the internal and external oblique position of the mammography target; 1C:Maximal image and ROI outline of the magnetic resonance T2WI image lesion; 1D: Maximal image and ROI outline of DCE-MRI stage Ⅱ lesion.Within the yellow line is the ROI of the lesion.MG: mammography; ROI: region of interest; DCE-MRI: dynamic contrast-enhanced MRI.
1.2.5 特征篩選與機(jī)器學(xué)習(xí)
ROI 勾畫完成后對(duì)特征進(jìn)行提取及處理。首先通過(guò)最大最小值歸一化將提取的特征值預(yù)處理至(0,1)之間,計(jì)算組內(nèi)相關(guān)系數(shù)(intra-class correlation coefficient, ICC),保留ICC>0.75 的特征,然后通過(guò)樣本方差F值評(píng)估特征與乳腺癌ALN 是否轉(zhuǎn)移的線性相關(guān)性,采用最優(yōu)特征篩選-百分比進(jìn)行特征降維,多模態(tài)、MRI及MG影像組學(xué)模型的篩選閾值百分比分別為34%、19%及38%;通過(guò)最小絕對(duì)收縮和選擇算子(least absolute shrinkage and selection operator,LASSO)回歸對(duì)特征再次進(jìn)行降維,通過(guò)最優(yōu)超參數(shù)篩選得到最主要特征,并且選擇均衡準(zhǔn)確率(balanced_accuracy)作為評(píng)估特征重要性的評(píng)價(jià)標(biāo)準(zhǔn);將多模態(tài)影像組學(xué)篩選出的特征分別納入5種機(jī)器學(xué)習(xí)分類器中構(gòu)建多模態(tài)影像組學(xué)模型預(yù)測(cè)ALN狀態(tài)。分類器包括支持向量機(jī)(support vector machine, SVM)、K 近鄰(K nearest neighbors, KNN)、極端梯度提升決策樹(shù)(extreme gradient boosting,XGBoost)、邏輯回歸(logistic regression, LR)、隨機(jī)森林(randomforest, RF)。隨后,選擇篩選出的性能最佳的機(jī)器學(xué)習(xí)分類器,進(jìn)行MRI、MG 影像組學(xué)模型構(gòu)建,最終將三組模型結(jié)果轉(zhuǎn)換為影像組學(xué)評(píng)分(radiomics score, Rad-score)。繪制多模態(tài)影像組學(xué)模型、MRI 影像組學(xué)模型、MG 影像組學(xué)模型受試者工作特征(receiver operating characteristic, ROC)曲線,比較三組影像組學(xué)模型的曲線下面積(area under the curve, AUC),得到最佳的影像組學(xué)模型。
對(duì)評(píng)價(jià)的臨床及影像指標(biāo)進(jìn)行單因素分析,將篩選出的單因素指標(biāo)納入到多因素logistic 回歸分析,選擇多因素分析后P<0.05的指標(biāo)構(gòu)建臨床模型;最終,基于臨床危險(xiǎn)因素和最佳組學(xué)模型的Rad-score建立列線圖模型并將模型可視化。
統(tǒng)計(jì)學(xué)分析采用SPSS 26.0、Medcalc 19.1.3 及R 4.3.2 軟件進(jìn)行分析。符合正態(tài)分布的計(jì)量資料,使用獨(dú)立樣本t檢驗(yàn)進(jìn)行比較;不符合正態(tài)分布的計(jì)量資料用中位數(shù)(上四分位數(shù),下四分位數(shù))表示,采用Mann-WhitneyU檢驗(yàn)分析。計(jì)數(shù)資料用頻數(shù)表示,使用卡方檢驗(yàn)、連續(xù)性修正檢驗(yàn)及Fisher確切概率法進(jìn)行比較。通過(guò)單-多因素logistic回歸篩選臨床及影像特征指標(biāo)。使用ICC描述ROI勾畫結(jié)果的一致性,ICC>0.75表示一致性較好。采用Medcalc 19.1.3軟件繪制ROC 曲線,并計(jì)算AUC、敏感度和特異度評(píng)價(jià)不同模型的預(yù)測(cè)性能。使用R 4.3.2 軟件構(gòu)建列線圖模型,校準(zhǔn)曲線和決策曲線(decision curve analysis,DCA)。P<0.05表示差異有統(tǒng)計(jì)學(xué)意義。
本研究共納入224 例患者,根據(jù)7∶3 比例將樣本隨機(jī)分為訓(xùn)練集156 例和測(cè)試集68 例,其中訓(xùn)練集ALN 陰性患者81 例、陽(yáng)性患者75 例,測(cè)試集ALN 陰性患者36 例、陽(yáng)性患者32 例。經(jīng)過(guò)統(tǒng)計(jì)學(xué)分析訓(xùn)練集與測(cè)試集所有納入的臨床及影像特征分布差異均無(wú)統(tǒng)計(jì)學(xué)意義(P<0.05)(表1)。
表1 訓(xùn)練集與測(cè)試集臨床及影像特征分布比較Tab.1 Comparison of the distribution of clinical and imaging features between the training set and the test set
以病理為ALN 狀態(tài)的金標(biāo)準(zhǔn),分析21 個(gè)臨床及影像資料。根據(jù)Youden 指數(shù)計(jì)算NLR、PLR 最佳臨界值分別為1.81、208.72。最終訓(xùn)練集分別篩選出臨床因素(臨床T 分期、淋巴結(jié)觸診、PLR),MRI 因素(病灶最大徑、形態(tài)、強(qiáng)化類型、BPE、BI-RADS 分類、MRI_ALN),MG 因素(BI-RADS 分類、MG_ALN)共11 個(gè)差異有統(tǒng)計(jì)學(xué)意義的危險(xiǎn)因素(P<0.05)。測(cè)試集臨床因素(臨床T 分期、淋巴結(jié)觸診),MRI 因素(病灶最大徑、TIC、強(qiáng)化類型、BI-RADS 分類、MRI_ALN),MG因素(鈣化、MG_ALN)共9個(gè)差異有統(tǒng)計(jì)學(xué)意義的危險(xiǎn)因素(P<0.05)(表2~3)。選取訓(xùn)練集及測(cè)試集共同的7 個(gè)獨(dú)立危險(xiǎn)因素進(jìn)行多因素logistic回歸分析??紤]到獨(dú)立危險(xiǎn)因素較多,變量間可能存在嚴(yán)重多重共線性問(wèn)題,導(dǎo)致模型方程不穩(wěn)定,進(jìn)行多重共線性診斷,結(jié)果顯示每個(gè)因素的方差膨脹因子(variance inflation factor, VIF)均小于10,各因素之間不存在嚴(yán)重共線性問(wèn)題,因此不需要采取特殊措施進(jìn)行處理。經(jīng)多因素logistic回歸分析后,最終篩選出淋巴結(jié)觸診(P<0.001)及MRI_ALN(P=0.005)2 個(gè)獨(dú)立危險(xiǎn)因素構(gòu)建臨床模型(表4)。
表2 訓(xùn)練集與測(cè)試集與ALN狀態(tài)相關(guān)的臨床因素Tab.2 Clinical factors related to ALN status between the training set and the test set
表3 訓(xùn)練集與測(cè)試集與ALN狀態(tài)相關(guān)的影像特征Tab.3 Imaging features related to axillary lymph node status between the training set and the test set
表4 訓(xùn)練集多因素logistic回歸分析Tab.4 Multivariate logistic regression analysis of the training group
多模態(tài)影像組學(xué)提取4500 個(gè)特征,經(jīng)方差分析后保留1530 個(gè)影像組學(xué)特征,再通過(guò)最優(yōu)超參數(shù)篩選獲得主要特征,基于上述主要特征構(gòu)建5種機(jī)器學(xué)習(xí)分類器用于評(píng)估乳腺癌患者ALN 狀態(tài)。結(jié)果顯示,在訓(xùn)練集中5 種機(jī)器學(xué)習(xí)分類器AUC 的范圍在0.889~0.993 之間,在測(cè)試集中5 種機(jī)器學(xué)習(xí)分類器的AUC 值范圍在0.764~0.864 之間,其中SVM 訓(xùn)練集與測(cè)試集的AUC值差異最小,并且SVM 的測(cè)試集(AUC=0.864)最高,因此選擇SVM 構(gòu)建多模態(tài)最佳影像組學(xué)模型,并作為構(gòu)建MRI及MG影像組學(xué)模型的機(jī)器學(xué)習(xí)分類器。最終SVM篩選出14個(gè)與ALN相關(guān)性最大的特征(圖2)。MRI影像組學(xué)及MG影像組學(xué)分別提取2250、2250個(gè)特征,經(jīng)最大最小值歸一化及方差分析后分別保留428、855個(gè)影像組學(xué)特征,再通過(guò)最優(yōu)超參數(shù)篩選及SVM分類器最終分別篩選出12、14 個(gè)影像組學(xué)特征,構(gòu)建MRI 及MG 影像組學(xué)模型。不同機(jī)器學(xué)習(xí)分類器在訓(xùn)練集和測(cè)試集中的AUC、敏感度、特異度和準(zhǔn)確度(表5)。
表5 不同機(jī)器學(xué)習(xí)分類器在訓(xùn)練集和測(cè)試集的預(yù)測(cè)效能Tab.5 Prediction performance of different machine learning classifiers in the training set and the test set
圖2 多模態(tài)影像組學(xué)模型中SVM篩選的14個(gè)與腋窩淋巴結(jié)狀態(tài)相關(guān)性最大的影像組學(xué)特征。橫軸為每個(gè)特征對(duì)應(yīng)的權(quán)重系數(shù),縱軸為篩選出與腋窩淋巴結(jié)狀態(tài)相關(guān)的每個(gè)影像組學(xué)特征名稱。SVM:支持向量機(jī);WAVELET:小波變換;LBP:局部二值模式;GRADIENT:梯度變換;LOG:拉普拉斯變換;EXPONENTIAL:指數(shù)變換;FIRSTORDER:一階紋理特征;NGTDM:鄰域灰度差矩陣;GLDM:灰度依賴矩陣;GLCM:灰度共生矩陣;GLSZM:灰度區(qū)域大小矩陣。Fig.2 The 14 radiomics features that were most correlated with axillary lymph node status were screened by SVM in the multimodal radiomics model.The horizontal axis is the weight coefficient corresponding to each feature, and the vertical axis is the name of each radiomics feature related to the status of axillary lymph nodes screened out.SVM: support vector machine; WAVELET: wavelet transform; LBP: local binary pattern;GRADIENT: gradient transform; LOG: laplace transform; EXPONENTIAL:exponential transformation; FIRSTORDER: first-order texture features;NGTDM: neighbouring gray tone difference matrix; GLDM: gray level dependence matrix; GLCM: gray level co-occurrence matrix; GLSZM: gray level size zone matrix.
分別繪制MRI、MG、多模態(tài)影像組學(xué)模型ROC曲線(圖3),比較三個(gè)模型的AUC 值,結(jié)果顯示多模態(tài)影像組學(xué)模型最高(訓(xùn)練集AUC:0.899;測(cè)試集AUC:0.864)。最終選擇多模態(tài)影像組學(xué)模型的Rad-score 聯(lián)合臨床模型構(gòu)建列線圖模型,并將列線圖可視化。在訓(xùn)練集中,MG影像組學(xué)模型、MRI影像組學(xué)模型、多模態(tài)影像組學(xué)模型、臨床模型和列線圖模型的AUC 分別為0.821、0.832、0.899、0.837、0.941;在測(cè)試集中,MG 影像組學(xué)模型、MRI影像組學(xué)模型、多模態(tài)影像組學(xué)模型、臨床模型和列線圖模型的AUC分別為0.795、0.813、0.864、0.849、0.926(表6、圖4)。通過(guò)DeLong 檢驗(yàn)得出,列線圖模型與三種影像組學(xué)模型及臨床模型之間差異具有統(tǒng)計(jì)學(xué)意義(P<0.05),列線圖模型診斷性能較好。校準(zhǔn)曲線顯示列線圖模型的實(shí)際曲線與理論曲線接近,表示一致性較好(圖5),決策曲線顯示列線圖模型在臨床受益方面整體優(yōu)于三種影像組學(xué)模型和臨床模型(圖6)。
表6 五種模型的預(yù)測(cè)效能Tab.6 Predictive performance of five models
圖3 五種模型的預(yù)測(cè)效能。3A:訓(xùn)練集五個(gè)模型ROC 曲線;3B:測(cè)試集五個(gè)模型ROC曲線。ROC:受試者工作特征;AUC:曲線下面積。Fig.3 Prediction performance of five model.3A: ROC curves of five models in the training set; 3B: ROC curves of five models in the test set.ROC: receiver operating characteristic; AUC: area under the curve.
圖4 多模態(tài)影像組學(xué)評(píng)分及臨床特征構(gòu)建的諾莫圖。Palpation:觸診(0=陰性,1=陽(yáng)性);MRI_ALN:MRI腋窩淋巴結(jié)狀態(tài)(0=陰性,1=陽(yáng)性);根據(jù)不同指標(biāo)對(duì)應(yīng)的分?jǐn)?shù)計(jì)算腋窩淋巴結(jié)轉(zhuǎn)移的概率。Fig.4 Nomogram constructed by multimodal Rad-score and clinical features.Palpation: palpation (0=negative, 1=positive); MRI_ALN: MRI axillary lymph node status (0=negative, 1=positive).The probability of axillary lymph node metastasis is calculated according to the scores corresponding to different indicators.
圖5 訓(xùn)練集(5A)及測(cè)試集(5B)的校準(zhǔn)曲線。橫坐標(biāo)為預(yù)測(cè)概率,縱坐標(biāo)為實(shí)際發(fā)生概率;當(dāng)實(shí)際曲線與理論曲線接近時(shí),表示模型的校準(zhǔn)效果好。Fig.5 Calibration curves of the training set (5A) and the test set (5B).The abscissa is the predicted probability, and the ordinate is the actual occurrence probability.When the actual curve is close to the the oretical curve, it means that the calibration effect of the model is good.
圖6 訓(xùn)練集(6A)及測(cè)試集(6B)的決策曲線。Fig.6 Decision curves for the training set (6A) and the test set (6B).
本研究選擇IDC 為研究對(duì)象,開(kāi)發(fā)并驗(yàn)證了一種基于多種機(jī)器學(xué)習(xí)的多模態(tài)影像組學(xué)模型聯(lián)合臨床高危因素的列線圖模型,探究其對(duì)評(píng)估ALN狀態(tài)的臨床價(jià)值。研究結(jié)果表明SVM對(duì)乳腺癌ALN轉(zhuǎn)移情況的預(yù)測(cè)優(yōu)于其他機(jī)器學(xué)習(xí)分類器,列線圖模型訓(xùn)練集及測(cè)試集的AUC 值分別為0.941、0.926,具有較高的診斷性能。本研究創(chuàng)新性地將MRI 與MG 聯(lián)合起來(lái),可以充分提取病灶的影像特征,構(gòu)建出優(yōu)于單一模態(tài)的影像組學(xué)模型,為安全無(wú)創(chuàng)地預(yù)測(cè)ALN狀態(tài)提供可靠的支持,可輔助臨床制訂科學(xué)的診療方案。
乳腺癌是一種高度異質(zhì)性的腫瘤,影像組學(xué)能在一定程度上充分利用醫(yī)學(xué)成像的潛力來(lái)反映組織異質(zhì)性,進(jìn)行乳腺癌ALN 轉(zhuǎn)移的術(shù)前評(píng)估[12-13],在眾多機(jī)器學(xué)習(xí)算法中,不同算法對(duì)預(yù)測(cè)乳腺癌ALN 的性能是不同的。本研究選擇5 種機(jī)器學(xué)習(xí)分類器進(jìn)行乳腺癌ALN 狀態(tài)預(yù)測(cè),研究結(jié)果表明SVM 的訓(xùn)練集與測(cè)試集AUC 值為0.899、0.864,其預(yù)測(cè)效果優(yōu)于其他機(jī)器學(xué)習(xí)分類器。CUI 等[14]選擇三種機(jī)器學(xué)習(xí)算法預(yù)測(cè)ALN 狀態(tài),結(jié)果表明SVM 分類器對(duì)乳腺癌ALN 的預(yù)測(cè)效果顯著高于KNN 分類器和線性判別算法(linear discriminant analysis, LDA),與本研究結(jié)果一致。YAO 等[15]使用4 種機(jī)器學(xué)習(xí)分類器構(gòu)建預(yù)測(cè)SLN轉(zhuǎn)移的影像組學(xué)模型,結(jié)果顯示SVM 的AUC值最高,由此可見(jiàn)SVM 分類器在二元分類問(wèn)題中應(yīng)用較為廣泛。本研究五種機(jī)器學(xué)習(xí)分類器中LR 在二元分類問(wèn)題中應(yīng)用也較為常見(jiàn),但是其結(jié)果略低于SVM。KNN 結(jié)果最差,原因可能是KNN 是一種基于實(shí)例的學(xué)習(xí)方法,更加適用于具有相似特征的數(shù)據(jù)。SVM 算法不僅可以提高模型的魯棒性和泛化性[16],還可以通過(guò)核函數(shù)將數(shù)據(jù)映射到高維空間,解決非線性的分類問(wèn)題[17-18],進(jìn)而構(gòu)建出性能較好的模型,協(xié)助臨床評(píng)估ALN狀態(tài)指導(dǎo)后續(xù)治療。
本研究的MRI 影像組學(xué)模型診斷效能高于MAO 等[19]構(gòu)建的基于DCE-MRI 預(yù)測(cè)ALN 狀態(tài)的影像組學(xué)模型(訓(xùn)練集、測(cè)試集AUC 值分別為0.78、0.79),這可能是因?yàn)楸狙芯考尤隩2WI 序列的原因,由于惡性腫瘤易出現(xiàn)囊變壞死,因此病灶內(nèi)部及周圍含水成分在T2WI 序列上更易觀察。TAN 等[20]采用SVM 分類器在脂肪抑制T2WI序列中提取23個(gè)影像組學(xué)特征構(gòu)建影像組學(xué)模型(訓(xùn)練集、測(cè)試集AUC值分別為0.880、0.819),雖然該模型訓(xùn)練集結(jié)果高于本研究的MRI 影像組學(xué)模型,但是明顯低于本研究的多模態(tài)影像組學(xué)模型,這表明了MRI 與MG 的結(jié)合可以相互彌補(bǔ)各自的不足,提升影像組學(xué)模型的診斷性能。DONG等[21]首次使用基于脂肪抑制T2WI序列和DWI 序列的影像組學(xué)預(yù)測(cè)患者的ALN 狀態(tài),研究結(jié)果表明聯(lián)合模型的預(yù)測(cè)性能(AUC 為0.805)優(yōu)于單獨(dú)使用脂肪抑制T2WI 和DWI 的預(yù)測(cè)性能(AUC 分別為0.770 和0.787)。ZHAO 等[22]證實(shí)了基于MRI 和MG 聯(lián)合建立的鑒別乳腺良惡性的影像組學(xué)模型比單一模型具有更好的診斷準(zhǔn)確性,訓(xùn)練集和測(cè)試集的準(zhǔn)確率分別達(dá)到89.6%和83.3%。這些都表明了不同的檢查手段可以揭示病灶不同的潛在信息,MG對(duì)鈣化的敏感度較高,DCE-MRI可以評(píng)估血管生成,反映腫瘤內(nèi)部的血流情況[23],T2WI序列更易觀察囊變壞死的異常信號(hào)。因此多模態(tài)組學(xué)模型可以提高診斷的準(zhǔn)確性,可以指導(dǎo)臨床治療方案的制訂。
本研究通過(guò)SVM 構(gòu)建的多模態(tài)影像組學(xué)診斷模型最終共提取14 個(gè)特征,這些特征均是通過(guò)對(duì)原始圖像進(jìn)行小波、指數(shù)、梯度等濾波器處理后,在衍生圖像上進(jìn)行計(jì)算得出的,其中包括7個(gè)小波相關(guān)特征,經(jīng)小波變換后的紋理特征可以提供更有價(jià)值的腫瘤微環(huán)境信息,其細(xì)節(jié)和復(fù)雜度高于原始圖像[24]。MG CC 位圖像中提取的wavelet-HH-ngtdm-Contrast占比最大,與ALN 是否轉(zhuǎn)移呈負(fù)相關(guān)。相鄰灰度差異矩陣量化了圖像強(qiáng)度的總體變化,提供了整個(gè)圖像上相鄰像素之間的對(duì)比度量[25]。此外,T2WI 圖像上的一階特征占比較大,一階統(tǒng)計(jì)特征用于反映腫瘤內(nèi)灰度強(qiáng)分布,判斷腫瘤的異質(zhì)性,其值越大代表腫瘤生物學(xué)行為越活躍,轉(zhuǎn)移惡化的度的風(fēng)險(xiǎn)越高[26]。DCE-MRI圖像中提取的經(jīng)過(guò)小波變換后的二階紋理特征wavelet-HH-glcm-Correlation 占比也較大,灰度共生矩陣可以通過(guò)相鄰方向、變化間隔和變化幅度的綜合圖像表現(xiàn)出腫瘤紋理信息[27]。ZHOU等[28]構(gòu)建的基于灰度超聲的影像組學(xué)模型得出wavet- LH-glcm-Correlation 與ALN 轉(zhuǎn)移的相關(guān)性最強(qiáng),本研究也得出此特征與ALN 轉(zhuǎn)移顯著相關(guān)。既往研究表明,這些影像組學(xué)特征代表了灰度和紋理特征的細(xì)微差異,適用于評(píng)估腫瘤內(nèi)部異質(zhì)性,而腫瘤內(nèi)部異質(zhì)性與腫瘤進(jìn)展和轉(zhuǎn)移行為有關(guān)[29-30]。
MAKSIMOVIC 等[9]分析了觸診、超聲和MRI 在乳腺癌患者ALN分期中的價(jià)值,研究結(jié)果顯示觸診的假陽(yáng)性率為53%,假陰性率為36%,乳腺M(fèi)RI 預(yù)測(cè)ALN轉(zhuǎn)移假陰性率為18%,由此可見(jiàn)單獨(dú)的觸診或乳腺M(fèi)RI預(yù)測(cè)ALN轉(zhuǎn)移效果較差。本研究臨床及影像因素經(jīng)過(guò)單-多因素邏輯回歸分析后得出淋巴結(jié)觸診、MRI_ALN與ALN轉(zhuǎn)移具有相關(guān)性,臨床模型的AUC值為0.837、0.849,具有很好的預(yù)測(cè)價(jià)值,與朱蕓等[31]基于MRI、MG和病理的列線圖預(yù)測(cè)SLN狀態(tài)篩選出的臨床指標(biāo)一致。腫瘤進(jìn)展是腫瘤細(xì)胞與健康細(xì)胞相互作用的復(fù)雜過(guò)程。中性粒細(xì)胞促進(jìn)循環(huán)腫瘤細(xì)胞與遠(yuǎn)處部位的黏附并誘導(dǎo)腫瘤生長(zhǎng)[32]。血小板通過(guò)促進(jìn)腫瘤細(xì)胞與內(nèi)皮的黏附,防止細(xì)胞死亡和遠(yuǎn)處轉(zhuǎn)移,在癌癥進(jìn)展中發(fā)揮作用[33]。MORKAVUK 等[34]報(bào)道,PLR對(duì)早期乳腺癌轉(zhuǎn)移性SLN 的診斷成功率高于超聲等影像學(xué)方法。本研究臨床因素加入了PLR及NLR進(jìn)行分析,多因素分析結(jié)果顯示與ALN狀態(tài)沒(méi)有顯著差異。MA等[35]研究炎癥標(biāo)志物對(duì)新輔助化療患者的遠(yuǎn)期生存率的預(yù)測(cè)價(jià)值,多因素分析顯示淋巴細(xì)胞-單核細(xì)胞比值和ALN 轉(zhuǎn)移是獨(dú)立預(yù)測(cè)因素,而NLR 和PLR與疾病預(yù)后沒(méi)有顯著相關(guān)性。上述研究結(jié)果的差異可能是截?cái)嘀挡煌斐傻?,由此可?jiàn)炎性指標(biāo)是否是預(yù)測(cè)乳腺癌預(yù)后的有效指標(biāo)尚存在很大爭(zhēng)議,還有待后續(xù)的研究加以論證支撐。
本研究具有以下局限性:(1)本研究為單中心研究缺乏外部驗(yàn)證,并且樣本量較小,可能導(dǎo)致結(jié)果穩(wěn)定性及可復(fù)現(xiàn)性差;(2)ROI 勾畫均為2D 勾畫,缺乏病灶的三維特征信息,未來(lái)會(huì)選擇進(jìn)行3D 勾畫,并進(jìn)行比較;(3)本研究忽略了瘤周區(qū)域可能存在的一些重要的生物學(xué)信息。
綜上所述,本研究基于多模態(tài)影像組學(xué)特征及臨床特征構(gòu)建的列線圖模型能夠在術(shù)前有效預(yù)測(cè)ALN狀態(tài),有望為臨床治療方案的制訂提供科學(xué)指導(dǎo)。
作者利益沖突聲明:全體作者均聲明無(wú)利益沖突。
作者貢獻(xiàn)聲明:謝宗玉設(shè)計(jì)本研究的方案,對(duì)稿件重要內(nèi)容進(jìn)行了修改;張舒妮起草和撰寫稿件,獲取、分析及解釋本研究的數(shù)據(jù),對(duì)稿件重要內(nèi)容進(jìn)行了修改;朱蕓、趙楠楠、李陽(yáng)分析或解釋本研究的數(shù)據(jù),對(duì)稿件重要內(nèi)容進(jìn)行了修改;楊靜茹、張澳淇、顧一泓完成數(shù)據(jù)前期收集與整合,對(duì)稿件重要內(nèi)容進(jìn)行了修改;朱蕓獲得安徽省教育廳自然科學(xué)基金重點(diǎn)項(xiàng)目資助;張舒妮獲得蚌埠醫(yī)學(xué)院校級(jí)課題資助。全體作者都同意發(fā)表最后的修改稿,同意對(duì)本研究的所有方面負(fù)責(zé),確保本研究的準(zhǔn)確性和誠(chéng)信。