馬明明,崔應(yīng)譜,劉想,楊潔瑾,張耀峰,李昌欣,張曉東,秦乃姍,王霄英
乳腺X線攝影是乳腺疾病初檢篩查的首要方法,已被廣泛應(yīng)用于乳腺病變的良惡性鑒別[1]。乳腺癌在X線攝影中常見表現(xiàn)為腫塊、鈣化[2],鑒別腫塊和鈣化的良惡性是重要的影像學(xué)任務(wù),與診斷者的經(jīng)驗(yàn)相關(guān)。通常根據(jù)病灶特征給出乳腺影像報(bào)告和數(shù)據(jù)系統(tǒng)(breast imaging reporting and data system,BI-RADS)分類,對(duì)BI-RADS 4、5類乳腺病變進(jìn)行活檢[3]。由于部分病灶的影像特征不典型,可能造成診斷困難以及診斷者的不一致。因此,需要更客觀、準(zhǔn)確的方法鑒別乳腺病變的性質(zhì)。
影像組學(xué)(Radiomics)技術(shù)可用于乳腺圖像的輔助診斷[4]。有研究探討了利用影像組學(xué)特征在乳腺M(fèi)R對(duì)乳腺癌分子亞型區(qū)分[5]和乳腺X線攝影圖像上乳腺鈣化良惡性病變鑒別的應(yīng)用[6]。近年來深度學(xué)習(xí)在醫(yī)學(xué)圖像分割方面得到了廣泛應(yīng)用,尤其是病變自動(dòng)分割不僅減輕醫(yī)師工作強(qiáng)度、還能提高病變檢出的一致性[7],本單位已訓(xùn)練了基于深度學(xué)習(xí)分割乳腺X線攝影圖像中鈣化和腫塊的模型,對(duì)病變檢出的效果較好,為進(jìn)一步探索對(duì)乳腺腫塊和鈣化進(jìn)行良惡性分類奠定了基礎(chǔ)。本研究探討基于乳腺X線攝影的影像組學(xué)在乳腺腫塊和鈣化良惡性鑒別中的應(yīng)用價(jià)值,并將結(jié)果與有經(jīng)驗(yàn)的放射科醫(yī)生進(jìn)行對(duì)比。
本研究經(jīng)過倫理審查委員會(huì)的批準(zhǔn)[批件號(hào)2019(168)],研究工作按照本單位影像組學(xué)項(xiàng)目研發(fā)規(guī)范來進(jìn)行。
1.研究對(duì)象
回顧性收集本院PACS系統(tǒng)中2014年5月1日-2020年3月1日診斷性乳腺X線攝影檢查(臨床查體或超聲檢查有乳腺異常)的影像資料,從圖像中提取乳腺腫塊和鈣化的影像組學(xué)特征用于鑒別良惡性病變。所有乳腺X線攝影檢查均由Hologic Selenia數(shù)字化全視野乳腺X線機(jī)采集,采用標(biāo)準(zhǔn)內(nèi)外斜位(medial lateral oblique,MLO)和頭尾位(cranio caudal,CC)投照,選擇自動(dòng)曝光控制模式。以患者最終病理結(jié)果及臨床隨訪結(jié)果(良性檢查結(jié)果的患者)為金標(biāo)準(zhǔn)。
乳腺良惡性腫塊影像組學(xué)模型的納入標(biāo)準(zhǔn):①由兩名放射科醫(yī)師(讀者A和讀者B,分別擁有5年、15年以上乳腺X線攝影診斷經(jīng)驗(yàn))明確圖像中有乳腺腫塊、且范圍明確;②乳腺惡性腫塊有已知病理結(jié)果,良性腫塊有病理結(jié)果證實(shí)或隨訪一年期間未發(fā)現(xiàn)惡性結(jié)果。排除標(biāo)準(zhǔn):①多發(fā)性腫塊性病灶(難以確定病理穿刺病灶者);②失訪患者。共納入患者188例,均為女性,年齡29~91歲(58.9±12.1歲)。最終得到X線圖像316幅(圖1),將乳腺腫塊數(shù)據(jù)集按7:3的比例隨機(jī)分成訓(xùn)練集和測(cè)試集。
圖1 乳腺腫塊、鈣化影像組學(xué)研究對(duì)象納入流程圖。
對(duì)于乳腺良惡性鈣化影像組學(xué)模型的納入標(biāo)準(zhǔn):①由兩名放射科醫(yī)師(讀者A和讀者B)明確圖像中有乳腺鈣化、且顯示清晰;②乳腺惡性鈣化有已知病理結(jié)果,良性鈣化有病理結(jié)果證實(shí)或隨訪一年期間未發(fā)現(xiàn)惡性結(jié)果。對(duì)于同時(shí)存在乳腺良惡性鈣化、或多發(fā)不確定鈣化的情況,基于病理證實(shí)結(jié)果,通常僅取乳腺鈣化為惡性的區(qū)域入組。當(dāng)同一圖像上同時(shí)存在良性鈣化或不確定鈣化時(shí),這些區(qū)域如未能獲得病理證實(shí),則不入組,如果獲得了病理證實(shí),則可以入組。排除標(biāo)準(zhǔn):①乳腺鈣化小于4個(gè)像素;②失訪患者。共納入患者215例,均為女性,年齡31~86歲(57.8±12.9歲)。最終得到X線圖像364幅(圖1),將乳腺鈣化數(shù)據(jù)集按7:3的比例隨機(jī)分成訓(xùn)練集和測(cè)試集。
2.乳腺病變分割
采用Ronneberger等提出 U-Net算法進(jìn)行病灶分割[8],使用本院已經(jīng)訓(xùn)練好的乳腺X線攝影中腫塊和鈣化的分割模型,輸入乳腺X線攝影圖像,輸出腫塊和鈣化的分割結(jié)果。由兩名放射科醫(yī)師(讀者A和讀者B)對(duì)分割模型輸出的分割結(jié)果進(jìn)行評(píng)估及修改。乳腺腫塊分割模型預(yù)測(cè)結(jié)果合格標(biāo)準(zhǔn)如下:①模型輸出的腫塊區(qū)域?yàn)榇┐滩±斫Y(jié)果證實(shí)的腫塊,或隨訪一年以上的良性腫塊;②模型輸出的腫塊邊緣與腺體分界清晰且與人工判斷的邊緣一致。乳腺鈣化分割模型預(yù)測(cè)結(jié)果合格標(biāo)準(zhǔn):①模型輸出的鈣化區(qū)域?yàn)榇┐滩±斫Y(jié)果證實(shí)惡性或良性區(qū)域,或隨訪一年以上的良性鈣化;②模型輸出的鈣化區(qū)域?yàn)槊恳粋€(gè)鈣化點(diǎn)。
3.影像組學(xué)分析
影像組學(xué)模型構(gòu)建和測(cè)試的所有過程在Python (v 3.6.0)的FeAture Explorer Pro (FAEPro,v.0.3.4)[9]開源平臺(tái)上進(jìn)行。建立影像組學(xué)模型主要步驟包括:①特征提??;②特征降維;③特征選擇;④模型訓(xùn)練?;诜指钅P皖A(yù)測(cè)結(jié)果作為圖像分析興趣區(qū)(region of interest,ROI),使用Python的PyRadiomics package[10]提取腫塊和鈣化的組學(xué)特征,訓(xùn)練了乳腺X線攝影腫塊和鈣化的影像組學(xué)模型。
4.模型效能判斷
采用受試者操作特征(receiver operating characteristic,ROC)曲線并及計(jì)算ROC曲線下面積(area under curve,AUC)以定量評(píng)估影像組學(xué)模型對(duì)乳腺腫塊和鈣化良惡性二分類的鑒別效能。以影像組學(xué)模型鑒別乳腺病變良惡性的最佳截?cái)嘀?cutoff value)來計(jì)算符合率(accuracy,ACC),敏感度(sensitivity,SEN)和特異度(specificity,SPE)。
5.放射科醫(yī)師診斷效能
由一位高年資(7年以上乳腺X線攝影診斷經(jīng)驗(yàn))放射科醫(yī)師以第5版BI-RADS標(biāo)準(zhǔn)[11]回顧性評(píng)估腫塊及鈣化性病變并分類。乳腺X線診斷BI-RADS 2~4a類定義為良性病變,BI-RADS 4b~5類定義為惡性病變,計(jì)算放射科醫(yī)師的ACC、SEN、SPE。
6.統(tǒng)計(jì)學(xué)分析
采用SPSS 22.0進(jìn)行統(tǒng)計(jì)學(xué)分析,繪制ROC曲線并計(jì)算AUC。選擇cutoff值一般取約登指數(shù)最大時(shí)對(duì)應(yīng)的值,約登指數(shù)為敏感度+特異度-1。采用配對(duì)卡方檢驗(yàn)評(píng)估放射科醫(yī)師和影像組學(xué)模型兩種方法的診斷結(jié)果的一致性,以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
在乳腺腫塊模型預(yù)測(cè)腫塊區(qū)域絕大部分得到放射科醫(yī)師認(rèn)可,僅少數(shù)(10%)乳腺X線圖像中腫塊病變需要人工修改,而乳腺鈣化分割模型預(yù)測(cè)結(jié)果完全覆蓋乳腺X線圖像中鈣化區(qū)域。
乳腺腫塊和鈣化組學(xué)特征提取均為102個(gè),對(duì)特征向量進(jìn)行歸一化、降維后選擇模型達(dá)到最優(yōu)效能的組學(xué)特征,分別為9個(gè)、13個(gè)。本研究?jī)煞N影像組學(xué)模型建模流程見表1,描述了各自的歸一化方法、降維方法、特征選擇器、分類器。
表1 影像組學(xué)模型構(gòu)建流程
影像組學(xué)模型對(duì)乳腺腫塊和鈣化區(qū)域分割模型預(yù)測(cè)的ROI分析結(jié)果見圖2~5。影像組學(xué)模型鑒別乳腺腫塊和鈣化良惡性的ROC曲線見圖6,訓(xùn)練集的AUC均達(dá)1,測(cè)試集的AUC分別為0.84、0.88,影像組學(xué)模型對(duì)腫塊和鈣化良惡性二分類的cutoff值分別為0.644、0.676。乳腺X線攝影腫塊和鈣化的影像組學(xué)模型和高年資放射科醫(yī)師診斷能力評(píng)估見表2,影像組學(xué)模型的ACC、SPE、SEN與高年資放射科醫(yī)師類似,腫塊、鈣化組學(xué)模型分別與放射科醫(yī)師的診斷結(jié)果的一致性對(duì)比,差異無統(tǒng)計(jì)學(xué)意義(P=0.66、0.69)。
圖2~5 乳腺X線攝影中常見病變的分割模型對(duì)乳腺腫塊和鈣化區(qū)域預(yù)測(cè)的ROI(紅色區(qū)域)。 圖2 女,56歲,右乳內(nèi)上象限顯示邊界清晰、邊緣光滑的稍高密度腫塊,徑線約1.5cm×2.1cm,高年資放射科醫(yī)師診斷為BI-RADS 4a類,影像組學(xué)評(píng)分(Rad-score)為0.272,行手術(shù)切除,病理結(jié)果為纖維腺瘤。 圖3 女,48歲,左乳外上象限顯示邊緣分葉狀、短毛刺稍高密度腫塊,徑線約2.4cm×2.9cm,高年資放射科醫(yī)師診斷為BI-RADS 5類,Rad-score為0.966,行手術(shù)切除,病理結(jié)果為浸潤(rùn)性導(dǎo)管癌。 圖4 女,32歲,右乳散在點(diǎn)狀、圓形、顆粒狀鈣化影,高年資放射科醫(yī)師診斷為BI-RADS 2類,Rad-score為0.001,1年后隨訪乳腺超聲及乳腺X攝影檢查未見惡性結(jié)果。 圖5 女,38歲,右乳外上象限顯示砂礫樣、不均質(zhì)鈣化,呈區(qū)域分布,高年資放射科醫(yī)師診斷為BI-RADS 5類,Rad-score為0.997,行手術(shù)切除,病理結(jié)果為浸潤(rùn)性導(dǎo)管癌。
圖6 a)乳腺腫塊在影像組學(xué)模型在訓(xùn)練集的ROC曲線;b)乳腺腫塊在影像組學(xué)模型在測(cè)試集的ROC曲線;c)乳腺鈣化在影像組學(xué)模型在訓(xùn)練集的ROC曲線;d)乳腺鈣化在影像組學(xué)模型在測(cè)試集的ROC曲線。
表2 影像組學(xué)模型和放射科醫(yī)師在測(cè)試集中預(yù)測(cè)效能
乳腺X線攝影檢查已廣泛應(yīng)用于女性乳腺癌篩查檢查中,乳腺癌在其中最為常見且直接的征象是腫塊和鈣化[12],依據(jù)病變特征(如徑線、邊緣、形態(tài))進(jìn)行BI-RADS分類,但是特征之間存在復(fù)雜的相互作用,因此對(duì)于放射科醫(yī)師做出準(zhǔn)確診斷仍是具有挑戰(zhàn)性的?;谌斯ぶ悄艿挠跋窠M學(xué)是利用大量醫(yī)學(xué)影像數(shù)據(jù)進(jìn)行有效定量分析和預(yù)測(cè)的新興技術(shù),從臨床醫(yī)學(xué)圖像中提取肉眼無法識(shí)別的定量特征,并利用影像組學(xué)特征與病理結(jié)果之間關(guān)聯(lián),建立個(gè)性化預(yù)測(cè)模型[13]。影像組學(xué)已成功應(yīng)用于腫瘤學(xué)領(lǐng)域,包括肺癌[14]、前列腺癌[15]、乳腺[16]等,進(jìn)行相關(guān)的病理類型、分子分型、腫瘤分期、療效評(píng)估等研究。既往已有研究采用影像組學(xué)技術(shù)基于乳腺X線圖像來鑒別乳腺癌[17]、鈣化良惡性[18]以及預(yù)測(cè)淋巴結(jié)轉(zhuǎn)移[19]等。
目前較少有針對(duì)乳腺X線圖像中腫塊和鈣化良惡性鑒別的研究。Lei等[18]研發(fā)了基于乳腺X線圖像的影像組學(xué)模型對(duì)于BI-RADS 4類鈣化良惡性鑒別,在測(cè)試集中AUC為0.8。本研究探討影像組學(xué)模型鑒別乳腺腫塊和鈣化的良惡性,結(jié)果顯示,在測(cè)試集中乳腺腫塊和鈣化的影像組學(xué)特征有明確的預(yù)測(cè)價(jià)值,AUC分別為0.84、0.88;乳腺腫塊和鈣化組學(xué)模型和有經(jīng)驗(yàn)放射科醫(yī)師對(duì)比差異均沒有統(tǒng)計(jì)學(xué)意義(P>0.05)。本研究與既往研究的不同之處有兩點(diǎn):第一,本研究輸入的是全部鈣化,而非僅BI-RADS 4類。BI-RADS定義了良惡性鈣化的類型及表現(xiàn),選擇4、5類鈣化進(jìn)行分析,有可能幫助醫(yī)生提高診斷符合率。但在實(shí)際場(chǎng)景中,如果模型僅識(shí)別4、5類病灶,則需要醫(yī)生先檢出鈣化、行BI-RADS分類,如有4、5類病灶,則將這些區(qū)域輸入模型預(yù)測(cè),得到預(yù)測(cè)結(jié)果后,醫(yī)生結(jié)合模型預(yù)測(cè)結(jié)果做出最終診斷。這個(gè)流程中醫(yī)生參與了較多環(huán)節(jié)。筆者希望的場(chǎng)景是:攝片完成后,圖像自動(dòng)輸入到模型中,模型針對(duì)所有鈣化灶自動(dòng)預(yù)測(cè),全部結(jié)果返回后,醫(yī)生結(jié)合模型預(yù)測(cè)結(jié)果做出最終診斷,醫(yī)生打開報(bào)告即可見到已預(yù)測(cè)好的良惡性分類結(jié)果。在模型準(zhǔn)確性較高的前提下,這個(gè)場(chǎng)景醫(yī)生花費(fèi)的時(shí)間較短。因此,筆者目前把所有鈣化都輸入組學(xué)模型進(jìn)行訓(xùn)練。第二,本研究采用了半自動(dòng)標(biāo)注方法,這是影像組學(xué)研究的一個(gè)常用技術(shù)路線。通常人工標(biāo)注的ROI雖具有較高的準(zhǔn)確性、重復(fù)性,但也有耗時(shí)、費(fèi)力的缺點(diǎn),因此越來越多的研究試圖使用自動(dòng)或半自動(dòng)方法完成標(biāo)注。本單位既往大量研究中對(duì)乳腺鉬靶病灶的分割技術(shù)已經(jīng)非常成熟,基于AI分割病灶的精確性和可重復(fù)性高,本研究分割范圍大部分得到專業(yè)醫(yī)師的認(rèn)可,僅有一小部分(10%)的病變需要修改,因此選擇了以AI為基礎(chǔ)的半自動(dòng)標(biāo)注方法。
本研究有一定局限性。第一,作為回顧性研究,納入腫塊病例均為邊界相對(duì)明確者,存在一定選擇偏倚。而實(shí)際臨床中乳腺腫塊性病變表現(xiàn)多種多樣,如邊界不清、腫塊合并鈣化等,因此需要增加樣本量,入組復(fù)雜病例,必要時(shí)進(jìn)行更多的亞組分析,最終應(yīng)行前瞻性研究評(píng)估影像組學(xué)模型對(duì)乳腺腫塊各種病變表現(xiàn)的良惡性鑒別。第二,本研究基于病灶進(jìn)行數(shù)據(jù)分析。研究圖像選擇的原則是根據(jù)最終病理或隨訪結(jié)果:惡性病灶必須獲得病理證實(shí)才能入組,良性病灶應(yīng)隨訪至少一年以上。由于影像組學(xué)是研究病灶局部特征,因此獲得病理或隨訪證實(shí)的圖像,無論其位于CC還是MLO都可以入組,結(jié)果分析也是基于病灶,與攝片體位無關(guān)。在臨床工作中,如CC或MLO上均有可見病灶,通常醫(yī)生讀片時(shí)會(huì)判斷CC和MLO上的病灶是否為同一病灶,如為同一病灶則將二者特征綜合考慮。本研究不涉及判斷不同體位圖像中病灶是否為同一病灶的內(nèi)容,這是本研究的不足之一。第三,本研究中乳腺X線圖像中高密度鈣化病變?cè)u(píng)估有一定優(yōu)勢(shì),但是對(duì)于敏感度相對(duì)較低的腫塊病變,常聯(lián)合乳腺超聲檢查圖像,來提高診斷的符合率,今后研究中可聯(lián)合乳腺X線片及超聲圖像建立乳腺病變的組學(xué)模型,進(jìn)而增加研究結(jié)果的臨床應(yīng)用價(jià)值。最后,本研究?jī)H是對(duì)乳腺病變良惡性鑒別,而在實(shí)際工作報(bào)告中BI-RADS分類對(duì)于病變有更明確的風(fēng)險(xiǎn)分層及臨床建議,因此后續(xù)應(yīng)探討組學(xué)模型對(duì)乳腺常見病變的BI-RADS分類應(yīng)用價(jià)值的研究,并與臨床結(jié)構(gòu)式報(bào)告對(duì)接、優(yōu)化工作流程。
總之,本研究建立的影像組學(xué)模型可以提取并量化乳腺X線圖像紋理特征,在鑒別乳腺邊界清晰腫塊和鈣化的良惡性方面是可行的,有潛在的臨床應(yīng)用價(jià)值。但是,本研究依然有未完善之處,后續(xù)探索可在研究設(shè)計(jì)、圖像納入、病變分類方面更加符合臨床場(chǎng)景,成為輔助放射科醫(yī)師診斷的新技術(shù)。