陳智麗,高 皓,潘以軒,2,邢 風(fēng),3
1.沈陽(yáng)建筑大學(xué) 信息與控制工程學(xué)院,沈陽(yáng)110168
2.中國(guó)建筑第八工程局有限公司 總包協(xié)調(diào)部,江蘇 蘇州215000
3.深圳市贏時(shí)勝信息技術(shù)股份有限公司AMS事業(yè)部,北京100032
隨著人口老齡化的加劇,癌癥已逐漸成為危害人類身體健康的主要問(wèn)題。世界衛(wèi)生組織國(guó)際癌癥研究機(jī)構(gòu)(IARC)發(fā)布的GLOBOCAN2018 報(bào)告顯示:2018 年全球有1 810 萬(wàn)新發(fā)癌癥病例,其中乳腺癌排在新發(fā)病例的第二位[1]。在乳腺癌患者中,99%為女性,男性僅占1%??梢姡橄侔┦俏:ε越】档闹饕?dú)⑹?。全球乳腺癌的發(fā)病率從上世紀(jì)70年代末開始就一直呈上升趨勢(shì)且趨于年輕化。我國(guó)乳腺癌發(fā)病的高峰年齡已提前到了40~49 歲,并且30~39 歲的乳腺癌發(fā)病率已達(dá)到了每10 萬(wàn)人中有13 位患者,這一數(shù)據(jù)是美國(guó)該年齡段發(fā)病率的兩倍[2]。早發(fā)現(xiàn)、早診斷、早治療是延長(zhǎng)患者生命,提高生活質(zhì)量的重要方式,因此乳腺癌的早期篩查和及時(shí)治療十分重要。
目前,乳腺檢查主要分為病理檢查和無(wú)創(chuàng)檢查兩種。乳腺病理檢查是利用細(xì)胞病理學(xué)檢查和組織病理學(xué)檢查,對(duì)乳腺病變的良惡性實(shí)現(xiàn)最終的確診;無(wú)創(chuàng)乳腺檢查主要分為乳房觸診檢查和乳腺影像學(xué)檢查。目前主要乳腺影像學(xué)檢查包括超聲影像(ultrasound imaging)、乳腺X 線攝影(mammography)、核磁共振成像(MRI)、計(jì)算機(jī)斷層掃描(CT)、正電子發(fā)射型計(jì)算機(jī)斷層顯像(PET)等。乳腺X 線攝影檢查在醫(yī)學(xué)放射學(xué)中已經(jīng)應(yīng)用很多年[3]。雖然現(xiàn)在逐漸產(chǎn)生了很多其他先進(jìn)的技術(shù)方法,但是乳腺X 線攝影仍是目前最簡(jiǎn)單且最有效的,可以發(fā)現(xiàn)早期乳腺癌病變特征的檢查工具,也是現(xiàn)在唯一可以查出隱匿性癌癥與早期原位癌的技術(shù)方法。在臨床環(huán)境中,美國(guó)放射學(xué)會(huì)制定了BI-RADS(American College of Radiology’s Breast Imaging Reporting and Data System)[4]對(duì)乳腺X線圖像進(jìn)行主觀評(píng)估。BI-RADS分為7個(gè)等級(jí),BI-RADS 0到BI-RADS 6依次描述乳腺內(nèi)腫塊和鈣化等異常表現(xiàn)的嚴(yán)重程度,數(shù)字越大,惡性程度越大。
在早期,乳腺X 線攝影技術(shù)廣泛應(yīng)用,醫(yī)生需要在實(shí)踐中學(xué)習(xí)積累大量的臨床經(jīng)驗(yàn),進(jìn)而可以解讀患者的X光片所反映的乳腺結(jié)構(gòu)和病理信息。因此,醫(yī)生在診斷時(shí)具有主觀性,且每位醫(yī)生的經(jīng)驗(yàn)水平也不盡相同,面對(duì)變化多樣的乳腺異常結(jié)構(gòu),即使是專家也很難立刻做出準(zhǔn)確判斷,容易出現(xiàn)漏診和誤診的情況。隨著計(jì)算機(jī)的發(fā)展與普及,逐步成熟的計(jì)算機(jī)技術(shù)為醫(yī)學(xué)圖像分析與處理提供了足夠的計(jì)算能力,能夠一定程度上減少對(duì)醫(yī)生經(jīng)驗(yàn)水平的依賴。20世紀(jì)中期,以美國(guó)學(xué)者Ledley為首的研究團(tuán)隊(duì)首次將數(shù)學(xué)模型引入到臨床醫(yī)學(xué)[5],初步提出了計(jì)算機(jī)輔助診斷(computer aided diagnosis,CAD)技術(shù)的數(shù)學(xué)模型,為CAD技術(shù)在醫(yī)療領(lǐng)域的發(fā)展開創(chuàng)了先河,開始了CAD技術(shù)的初步研究,在一定程度上輔助醫(yī)生判讀醫(yī)學(xué)圖像,排除了人為主觀因素的影響,提高了診斷的準(zhǔn)確率和效率。利用自動(dòng)、精確、定量的計(jì)算機(jī)輔助圖像分析技術(shù),可以有效幫助臨床醫(yī)生和研究者高效準(zhǔn)確地處理海量醫(yī)學(xué)圖像。
乳腺X 線圖像中乳腺病變通常分為四種類型[6]:腫塊、鈣化、不對(duì)稱和結(jié)構(gòu)變形。乳腺腫塊和微鈣化是臨床中比較常見的病變。微鈣化是乳腺組織內(nèi)微小的鈣沉積異常,表現(xiàn)為高對(duì)比度的小亮點(diǎn),并以聚簇狀方式呈現(xiàn);乳腺腫塊則是灰白色的區(qū)域,其形狀通常可以描述為橢圓形、不規(guī)則或分葉狀等,邊界情況通??梢悦枋鰹檫吔缜逦?、模糊或針狀等。雖然微鈣化點(diǎn)相對(duì)于腫塊而言較小,但是由于腫塊的大小、形狀的多樣性以及個(gè)體乳腺密度的不同,腫塊可能隱藏在乳腺組織中,檢測(cè)難度更大。相較于鈣化而言,乳腺腫塊的檢測(cè)是一項(xiàng)更具有挑戰(zhàn)性的工作。
目前,受諸多因素影響,已公開的醫(yī)學(xué)圖像數(shù)據(jù)集少之又少。特別是乳腺X 線圖像的數(shù)據(jù)集更是寥寥無(wú)幾,主要原因有以下幾點(diǎn):一是乳腺X 線圖像數(shù)據(jù)集需要由專業(yè)的放射科醫(yī)生進(jìn)行標(biāo)注,對(duì)醫(yī)生的專業(yè)性要求很高;二是因?yàn)槲覈?guó)乳腺癌普查還沒(méi)有全面推廣,相對(duì)大型的數(shù)據(jù)庫(kù)都來(lái)自國(guó)外。表1是目前已公開的乳腺X線圖像數(shù)據(jù)集[7],但是對(duì)于深度學(xué)習(xí)的方法,乳腺X線圖像的采集問(wèn)題仍是需要解決的難點(diǎn)。
表1 已公開的乳腺X線圖像數(shù)據(jù)集Table 1 Public datasets of mammographic images
對(duì)于乳腺X 線圖像病變檢測(cè)、分割和分類,根據(jù)研究的重點(diǎn)不同,常采用以下幾種不同的評(píng)價(jià)指標(biāo):召回率(Recall),又稱查全率;精確度(Precision),又稱查準(zhǔn)率;靈敏度(Sensitivity,SEN),又稱真陽(yáng)性率(true positive rate,TPR);特異性(Specificity,SPE),又稱真陰性率(true negative rate,TNR);準(zhǔn)確率(Accuracy,Acc);F1 度量(F1-score)等。
對(duì)于二分類問(wèn)題,可將分類結(jié)果進(jìn)行如下劃分:真陽(yáng)性(true positive,TP)表示樣本本身為陽(yáng)性且預(yù)測(cè)結(jié)果也為陽(yáng)性;假陽(yáng)性(false positive,F(xiàn)P)表示樣本本身為陰性而預(yù)測(cè)結(jié)果為陽(yáng)性;真陰性(true negative,TN)表示樣本本身為陰性且被正確判斷為陰性;假陰性(false negative,F(xiàn)N)表示樣本本身為陽(yáng)性而預(yù)測(cè)結(jié)果為陰性。分類結(jié)果的“混淆矩陣”(confusion matrix)如表2所示。
表2 分類結(jié)果混淆矩陣Table 2 Confusion matrix of classification results
另外,經(jīng)常采用受試者工作特征(receiver operating characteristic,ROC)曲線來(lái)分析不同分類器的好壞。ROC曲線的x軸表示假陽(yáng)性率(false positive rate,F(xiàn)PR),y軸表示真陽(yáng)性率(true positive rate,TPR),ROC 曲線下面積用AUC(area under curve)表示,其面積越大代表分類器的性能越好,理想狀況下的AUC 為1。圖1 是ROC曲線與AUC的示意圖。由于ROC曲線不能解決在一張圖像上對(duì)多個(gè)異常評(píng)價(jià)的問(wèn)題,對(duì)ROC曲線進(jìn)行變形,引入自由響應(yīng)接受者操作特征曲線(free-response receiver operating characteristic curve,F(xiàn)ROC)[15],以對(duì)每張圖像的任意異常進(jìn)行評(píng)價(jià)。FROC 曲線的x軸是FP/image_num(image_num代表測(cè)試圖像張數(shù)),y軸是真陽(yáng)性率。
圖1 ROC曲線與AUC示意圖Fig.1 Examples of ROC curve and AUC
此外,還使用P-R(Precision-Recall)曲線對(duì)模型進(jìn)行分析,P-R曲線的x軸為Recall(召回率),反映分類器正確識(shí)別出的正樣本數(shù)與真實(shí)正樣本數(shù)的比例,y軸為Precision(精確度),反映分類器正確識(shí)別出的正樣本數(shù)與識(shí)別出的正樣本數(shù)的比例。圖2 是P-R 曲線示意圖。P-R 曲線下面積為平均精度(average precision,AP),反映模型在不同召回率下最高精確度的平均值,各類別AP的均值(mean AP,mAP)代表平均精度的均值。
圖2 P-R曲線示意圖Fig.2 Examples of P-R curve
在圖像分割技術(shù)中,經(jīng)常用到交并比(intersection over union,IoU)這一評(píng)價(jià)指標(biāo),見式(7),其中分子是圖像的金標(biāo)準(zhǔn)與分割結(jié)果的交集,即TP,分母是圖像的金標(biāo)準(zhǔn)與分割結(jié)果的并集,即TP+FN+FP,如圖3所示。此外,還采用Dice系數(shù)這一像素級(jí)評(píng)價(jià)指標(biāo),見式(8),其取值范圍在0~1 之間,Dice 越接近1,證明分割效果越好。式(9)為IoU和Dice系數(shù)之間的關(guān)系式。
圖3 IoU示意圖Fig.3 IoU diagram
隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,計(jì)算機(jī)輔助診斷受到醫(yī)學(xué)界的廣泛關(guān)注。圖4 為乳腺X 線圖像計(jì)算機(jī)輔助檢測(cè)與分類診斷的工作流程,主要包括乳腺X線圖像預(yù)處理、病變檢測(cè)、感興趣區(qū)域分割、特征提取和選擇、良惡性病變分類等,檢測(cè)和診斷結(jié)果將提供給放射科醫(yī)生作為參考,以得到最后的診斷結(jié)果。經(jīng)過(guò)臨床實(shí)驗(yàn)證明,乳腺X線圖像計(jì)算機(jī)輔助診斷技術(shù)可以有效地提升乳腺癌診斷的靈敏度與準(zhǔn)確率,大大減少漏診和誤診,避免貽誤患者的最佳治療時(shí)間或造成過(guò)度治療。
圖4 乳腺X線圖像計(jì)算機(jī)輔助診斷工作流程圖Fig.4 Workflow of computer aided diagnosis of mammographic images
在進(jìn)行乳腺X 線圖像分析時(shí),因?yàn)椴≡畹男螒B(tài)較小,又與乳腺腺體相連,而胸肌組織的灰度與病變的灰度相似,不易區(qū)分,所以診斷所需的乳腺X 線圖像往往需要很大的分辨率,如果直接處理原始圖像需要很長(zhǎng)的運(yùn)行時(shí)間,因此對(duì)醫(yī)學(xué)圖像進(jìn)行預(yù)處理是十分必要的。在乳腺X 線圖像的病變?cè)\斷中主要從以下幾方面對(duì)圖像進(jìn)行預(yù)處理:去除背景和胸肌組織等干擾區(qū)域、去除噪聲、圖像增強(qiáng)及圖像大小的調(diào)整等。
Akselrod-Ballin 等人[16]分割乳房組織,通過(guò)去除背景與胸肌并相應(yīng)地裁剪圖像完成對(duì)圖像的預(yù)處理。Moayedi等人[17]通過(guò)掃過(guò)圖像并剪切均值和方差小于某個(gè)閾值的水平和垂直方向的區(qū)域來(lái)刪除具有明顯結(jié)構(gòu)噪聲的深色背景區(qū)域,然后根據(jù)局部方差和諸如直方圖拉伸之類的點(diǎn)操作的差異,從背景中分離出乳腺紋理,根據(jù)垂直和水平梯度的像素能量和區(qū)域增長(zhǎng)算法,實(shí)現(xiàn)胸肌組織與乳腺組織的分割。Vikhe等人[18]基于小波的降噪以及自適應(yīng)閾值技術(shù)進(jìn)行腫塊檢測(cè)的增強(qiáng)和分割,實(shí)驗(yàn)結(jié)果表明,可疑區(qū)域的形狀可以很好地保留,并且可以與高對(duì)比度區(qū)域和背景清晰地區(qū)分,不會(huì)模糊邊緣。
由于乳腺X線攝影圖像存在一些斑點(diǎn)噪聲,導(dǎo)致圖像的對(duì)比度和分辨率較低,腫塊和鈣化點(diǎn)與噪聲點(diǎn)的邊界劃分不清晰,這就需要濾波處理來(lái)去除噪聲。目前去除噪聲的方法主要有均值濾波[19]、中值濾波[20]、各向異性擴(kuò)散濾波[21]等。Hamissi等人[22]采用2D中值濾波方法來(lái)減少噪聲,并進(jìn)行對(duì)比度調(diào)整以增加圖像的對(duì)比度。Rizzi等人[23]根據(jù)圖像統(tǒng)計(jì)參數(shù)(即平均灰度像素值和標(biāo)準(zhǔn)偏差),通過(guò)小波濾波器對(duì)乳腺X 線圖像進(jìn)行閾值化處理。值得一提的是,與其他方法不同,該方法采用了不同的子小波,以提高細(xì)節(jié)的可見性并有助于特征的檢測(cè),而不會(huì)扭曲其外觀和形狀,特別是,雙正交小波由于其在圖像去噪中的良好性能而用于預(yù)處理階段。
圖像增強(qiáng)算法在圖像預(yù)處理階段被用于改善圖像對(duì)比度和抑制噪聲,以恢復(fù)圖像大多數(shù)隱藏特征,提高圖像質(zhì)量。Papadopoulos等人[24]在檢測(cè)乳腺X線圖像中的微鈣化時(shí),在預(yù)處理階段評(píng)估了五種圖像增強(qiáng)算法,它們分別是對(duì)比受限的自適應(yīng)直方圖均衡化[25-26]、局部范圍修改[27]、冗余離散小波[28]、線性拉伸[29]和收縮算法。實(shí)驗(yàn)結(jié)果表明,局部范圍修改(AUC=0.932)和基于小波的線性拉伸(AUC=0.926)方法通過(guò)適當(dāng)?shù)膮?shù)調(diào)整,在MIAS數(shù)據(jù)庫(kù)中實(shí)現(xiàn)了最高性能。以上的圖像增強(qiáng)方法有一個(gè)普遍的現(xiàn)象,就是在圖像增強(qiáng)的同時(shí)放大噪聲,而如果先去除噪聲再進(jìn)行圖像增強(qiáng),微鈣化點(diǎn)就容易淹沒(méi)于背景和噪聲中,導(dǎo)致假陽(yáng)性過(guò)高。Jain 等人[30]通過(guò)組合的方法來(lái)抑制高密度脈沖噪聲,然后將具有多態(tài)自適應(yīng)增益的非線性增強(qiáng)算子傳遞到已經(jīng)去除噪聲的圖像上,以增強(qiáng)乳腺病變的對(duì)比度,實(shí)驗(yàn)結(jié)果顯示圖像質(zhì)量得到提高,在合理抑制背景的情況下增強(qiáng)感興趣區(qū)域。Sharma等人[31]在預(yù)處理階段,將原始數(shù)據(jù)集中的大尺寸乳腺X 線圖像通過(guò)最近鄰插值法縮小到1 024×1 024像素,然后通過(guò)二值化對(duì)圖像背景進(jìn)行處理,最后裁剪提取128×128固定大小的感興趣區(qū)域。
近年來(lái),乳腺X 線成像技術(shù)發(fā)展迅速,全域數(shù)字乳腺X線攝影如今已經(jīng)取代了傳統(tǒng)的模擬膠片時(shí)代,圖像質(zhì)量顯著提高,除個(gè)別圖像外,噪聲較少??紤]噪聲點(diǎn)與鈣化點(diǎn)相似,在執(zhí)行病變檢測(cè)任務(wù)時(shí),可不去除噪聲。但是由于胸肌與腫塊有相似的灰度特征,在病變檢測(cè)之前,一般仍要去除胸肌、標(biāo)簽等干擾,并且對(duì)圖像進(jìn)行歸一化處理,增強(qiáng)圖像的對(duì)比度。
2.2.1 腫塊病變檢測(cè)
Mudigonda等人[32]提出了一種基于密度分層的腫塊檢測(cè)方法,通過(guò)分析乳腺X線圖像定向結(jié)構(gòu)信息進(jìn)行腫塊檢測(cè)。由于不同種類腫塊的紋理密度不同,導(dǎo)致檢測(cè)效果不同。該方法對(duì)于良性腫塊的檢測(cè)成功率較低,僅為63%;而對(duì)于惡性腫塊的檢測(cè)敏感度非常高,使得整體的檢測(cè)準(zhǔn)確率達(dá)到74%。Varela等人[33]在不同尺寸下使用??诪V波器對(duì)乳腺X線圖像進(jìn)行處理,通過(guò)選擇最優(yōu)尺寸來(lái)提高腫塊檢測(cè)算法的靈敏度和特異性。在基于病變和基于病例兩種情況下對(duì)模型進(jìn)行評(píng)估,當(dāng)每幅圖像的假陽(yáng)性為1.02時(shí),靈敏度分別達(dá)到了88%和94%。
Eltonsy等人[34]提出了形態(tài)學(xué)同心層分析策略,這種方法的優(yōu)點(diǎn)是在保持假陽(yáng)性率盡可能低的同時(shí),惡性腫塊的檢出率高于95%,但是這種方法在處理低對(duì)比度圖像時(shí)漏檢率高。目前,基本所有方法使用的人工設(shè)計(jì)的特征集都是由腫塊固有特征衍生出來(lái)的。當(dāng)使用這些方法直接處理致密腺體型乳腺X線圖像時(shí),往往會(huì)出現(xiàn)誤判(假陽(yáng)性區(qū)域過(guò)多)和漏判(真陽(yáng)性率較低)的情況。Gao 等人[35]嘗試通過(guò)形態(tài)成分分析(morphological component analysis,MCA)的方式將乳腺X線圖像分解為分段平滑分量和紋理分量,提取分段平滑分量,可以抑制圖像中血管和乳腺組織的干擾,然后改進(jìn)了同心層標(biāo)準(zhǔn)的腫塊檢測(cè)方案,實(shí)現(xiàn)對(duì)隱藏在乳腺組織中對(duì)比度低的腫塊的檢測(cè),提升腫塊的檢出率。此外還引入腫塊區(qū)域的高斯特征和紋理特征,進(jìn)一步減少誤報(bào)率。
上述基于傳統(tǒng)方法的腫塊檢測(cè)技術(shù),由于主要提取圖像的底層特征,很難檢測(cè)對(duì)比度較低的腫塊。目前應(yīng)用傳統(tǒng)方法的腫塊檢測(cè)主要存在致密性腺體導(dǎo)致假陽(yáng)性過(guò)高,以及對(duì)病灶區(qū)域過(guò)度檢測(cè)等問(wèn)題。
2.2.2 微鈣化病變檢測(cè)
眾所周知,相較于腫塊,乳腺的微鈣化更小,數(shù)字乳腺X 線攝影技術(shù)由于其優(yōu)越的靈敏度可以改善微鈣化的檢測(cè)[36]。Oliver 等人[37]提出了一種基于知識(shí)的方法,可以自動(dòng)檢測(cè)乳腺X 線圖像中的單個(gè)微鈣化和團(tuán)簇。具體做法是首先創(chuàng)建單詞字典,單詞字典由包含微鈣化的圖像與一組濾波器進(jìn)行卷積得到。該字典可代替表示已知微鈣化的病例,隨后將其用于表示未知圖像,通過(guò)將含有微鈣化的正樣本與負(fù)樣本與字典中的單詞進(jìn)行卷積以生成訓(xùn)練數(shù)據(jù),并將其用作GentleBoost 分類器的輸入。最后用訓(xùn)練好的分類器進(jìn)行微鈣化檢測(cè),進(jìn)而擴(kuò)展微鈣化檢測(cè)方法用于檢測(cè)鈣化簇。實(shí)驗(yàn)評(píng)估采用ROC 曲線分析(用于微鈣化檢測(cè))和FROC 分析(用于微鈣化簇檢測(cè)),使用兩個(gè)數(shù)字化數(shù)據(jù)庫(kù)和一個(gè)全域數(shù)字?jǐn)?shù)據(jù)庫(kù),實(shí)驗(yàn)結(jié)果充分證明了該方法的有效性。Rizzi 等人[23]提出了兩階段分解小波濾波用于檢測(cè)微鈣化。第一階段根據(jù)圖像統(tǒng)計(jì)數(shù)據(jù)(平均灰度像素值和標(biāo)準(zhǔn)偏差)對(duì)乳腺X 線圖像進(jìn)行閾值化,保留所有可疑微鈣化,并降低背景噪聲。而第二階段為了定位奇異點(diǎn),重構(gòu)圖像采用另一種小波分解,每個(gè)分解層次采用硬閾值技術(shù)處理,來(lái)識(shí)別真實(shí)的微鈣化,以減少假陽(yáng)性檢測(cè)。該方法的性能在MIAS 數(shù)據(jù)庫(kù)上進(jìn)行驗(yàn)證,F(xiàn)ROC分析在假陽(yáng)性率為1的情況下,靈敏度能達(dá)到98%左右。
Yu 等人[38]結(jié)合基于模型特征和統(tǒng)計(jì)紋理特征對(duì)簇狀微鈣化進(jìn)行檢測(cè)。首先,使用小波濾波器和兩個(gè)閾值檢測(cè)可疑的微鈣化區(qū)域;然后,從可疑區(qū)域提取基于馬爾可夫隨機(jī)場(chǎng)和分形模型的紋理特征,以及統(tǒng)計(jì)紋理特征,并通過(guò)反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)對(duì)其進(jìn)行檢測(cè)。使用MIAS 數(shù)據(jù)集中的20 張包含微鈣化簇的圖像進(jìn)行測(cè)試,經(jīng)FROC曲線分析,假陽(yáng)性率是1.0時(shí)的敏感度能達(dá)到90%,結(jié)果表明了組合基于模型特征和統(tǒng)計(jì)紋理特征能夠有效地進(jìn)行微鈣化簇檢測(cè)。Malar等人[39]使用極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)對(duì)微鈣化進(jìn)行檢測(cè),并將其與使用灰度空間相關(guān)性矩陣和Gabor 濾波技術(shù)提取的不同特征向量進(jìn)行比較,對(duì)MIAS 數(shù)據(jù)庫(kù)55 張圖像中的120 個(gè)感興趣區(qū)域進(jìn)行訓(xùn)練。結(jié)果表明,與貝葉斯分類器和支持向量機(jī)(support vector machine,SVM)等其他方法相比,ELM有更好的檢測(cè)性能,準(zhǔn)確度達(dá)到94%,并且訓(xùn)練時(shí)間顯著減少。另外,ELM還避免了局部最小值、學(xué)習(xí)率不正確和過(guò)度擬合等問(wèn)題。Cheng等人[40]使用模糊邏輯技術(shù)檢測(cè)微鈣化。他們使用全局和本地信息生成模糊圖像和增強(qiáng)圖像,然后通過(guò)曲線檢測(cè)算法去除不相關(guān)的乳腺結(jié)構(gòu),最后使用迭代閾值定位微鈣化。
在臨床中,微鈣化點(diǎn)的大小、形狀、分布等特征為醫(yī)生的診斷提供重要參考信息,精準(zhǔn)的微鈣化檢測(cè)是計(jì)算機(jī)輔助診斷系統(tǒng)的關(guān)鍵步驟。然而乳腺X 線圖像組織復(fù)雜,背景不均勻,且噪聲與微鈣化相類似,使得微鈣化檢測(cè)工作仍存在一定困難。
乳腺病變區(qū)域分割是乳腺X 線圖像計(jì)算機(jī)輔助診斷技術(shù)的基礎(chǔ)工作,是后續(xù)乳腺病變特征提取和分類的前提。有關(guān)臨床資料顯示,腫塊的邊緣特征反映了其生長(zhǎng)方式和生物學(xué)特征。一般來(lái)說(shuō),形狀規(guī)則的腫塊為良性;相反,惡性腫塊往往具有不規(guī)則的邊緣。因此分割算法的準(zhǔn)確性,對(duì)后續(xù)的特征分析和分類有很大影響。已有很多研究者關(guān)注并投入到乳腺X 線圖像乳腺病變區(qū)域分割這一領(lǐng)域[41]。
基于傳統(tǒng)方法的乳腺X 線圖像腫塊檢測(cè)和分割算法主要有區(qū)域增長(zhǎng)[42-43]、主動(dòng)輪廓算法[44]、閾值分割[45]、分水嶺方法、水平集方法[46]、邊緣檢測(cè)等。Kupinski 等人[47]根據(jù)區(qū)域增長(zhǎng)算法提出了兩種新的病變分割方法,一種是徑向梯度指數(shù)(radial gradient index,RGI)算法,另一種是概率算法。這兩種方法通過(guò)利用形狀約束規(guī)范化所分析的可疑區(qū)域,以解決與常規(guī)區(qū)域增長(zhǎng)相關(guān)的問(wèn)題,并且通過(guò)使用單個(gè)基于特征或概率的效用函數(shù)來(lái)簡(jiǎn)化可疑區(qū)域選擇過(guò)程。這兩種新方法明顯優(yōu)于常規(guī)的區(qū)域增長(zhǎng)分割,在交并比為0.3時(shí),常規(guī)的區(qū)域增長(zhǎng)技術(shù)僅確定了62%的病變,而基于RGI和基于概率的分割方法分別正確地分割了92%和96%的病變。Xu 等人[48]提出使用迭代閾值法來(lái)提取可疑區(qū)域,通過(guò)Canny邊緣檢測(cè)提取粗糙的腫塊區(qū)域,最后使用主動(dòng)輪廓對(duì)腫塊進(jìn)行精準(zhǔn)分割,實(shí)驗(yàn)表明該算法比常規(guī)方法具有更好的性能。另外,Yu等人[49]結(jié)合中值濾波、形態(tài)學(xué)和Sobel邊緣檢測(cè)等操作獲得腫塊初始的粗糙邊緣,然后使用梯度矢量流(gradient vector flow snake,GVF-Snake)和梯度圖調(diào)整分割出最終腫塊。
由于乳腺X 線圖像中的惡性病變具有不規(guī)則的外觀,呈現(xiàn)針刺形狀,影響診斷,Karssemeijer 等人[50]提出了一種基于像素方向圖統(tǒng)計(jì)分析的分割方法,如果發(fā)現(xiàn)指向某個(gè)區(qū)域的像素增加,尤其是在許多方向上發(fā)現(xiàn)這種增加時(shí),則將該區(qū)域標(biāo)記為可疑,使用多尺度方法在每個(gè)像素處確定圖像強(qiáng)度圖的方向。在給定的比例下,可以從三階二階高斯導(dǎo)數(shù)運(yùn)算符的輸出獲得準(zhǔn)確的基于線的方向的估計(jì),而在其他情況下,圖像噪聲會(huì)生成隨機(jī)方向。像素方向圖用于構(gòu)造兩個(gè)對(duì)直線的徑向模式敏感的算子。使用分類器對(duì)這些運(yùn)算符的輸出進(jìn)行組合,可以檢測(cè)出針刺形狀。這種方法檢測(cè)出90%的惡性病例,但是假陽(yáng)性率較高。
為了降低病變區(qū)域背景與前景灰度分布相近帶來(lái)的影響,不少學(xué)者提出了基于無(wú)邊緣活動(dòng)輪廓模型的乳腺腫塊分割方法。Tunal? 等人[51]對(duì)圖像添加了低值像素,對(duì)采用的邊緣停止函數(shù)Chan-Vese 主動(dòng)輪廓算法進(jìn)行了改進(jìn),有效地對(duì)乳腺X線圖像中的良性和惡性腫塊進(jìn)行了分割,使用DDSM(digital database for screening mammography)數(shù)據(jù)集中的60張圖像進(jìn)行驗(yàn)證,最終的分割結(jié)果交并比達(dá)到75.1%。Dubey等人[52]比較了兩種不同的半自動(dòng)方法,即水平集方法和基于控制的分水嶺方法,應(yīng)用這兩種方法對(duì)腫塊區(qū)域進(jìn)行分割。實(shí)驗(yàn)結(jié)果表明,標(biāo)記控制的分水嶺分割方法顯示出比水平集更好的結(jié)果。Chu等人[53]使用形態(tài)學(xué)增強(qiáng)技術(shù)對(duì)乳腺X線圖像進(jìn)行預(yù)處理并消除背景,應(yīng)用簡(jiǎn)單線性迭代聚類(simple linear iterative clustering,SLIC)方法對(duì)腫塊可疑區(qū)域進(jìn)行分割,將腫塊與背景分組,利用基于規(guī)則的分類方法對(duì)可疑區(qū)域進(jìn)行預(yù)篩選,并應(yīng)用正則化水平集對(duì)潛在病變輪廓進(jìn)行細(xì)化。實(shí)驗(yàn)結(jié)果表明,該方法可以通過(guò)降低假陽(yáng)性率的方法來(lái)提高靈敏度。Jen等人[54]提出基于新型異常檢測(cè)分類器(abnormality detection classifier,ADC)的乳腺X 線圖像異常特征檢測(cè)方法,對(duì)分割后的乳腺X 線圖像使用灰度值量化的方法提取五個(gè)特征來(lái)檢測(cè)感興趣區(qū)域,應(yīng)用主成分分析(principal component analysis,PCA)來(lái)確定權(quán)重。實(shí)驗(yàn)結(jié)果表明,將該方法與特征權(quán)重調(diào)整相結(jié)合進(jìn)行檢測(cè),在MIAS 數(shù)據(jù)集和DDSM 數(shù)據(jù)集上的靈敏度分別為88%和86%。Davies等人[55]使用局部閾值化處理從圖像中正常的乳腺結(jié)構(gòu)背景中分割出鈣化層,并對(duì)分割對(duì)象進(jìn)行分析,提取出鈣化簇。
上述傳統(tǒng)的病變區(qū)域分割方法大致可以分為基于區(qū)域、基于閾值、基于邊緣、基于特征模型、基于特定理論等幾類??紤]病變區(qū)域往往形狀不規(guī)律,邊界不規(guī)則,且病變內(nèi)部存在灰度異質(zhì)等情況,單獨(dú)依靠某一類分割方法很難得到理想的結(jié)果,綜合不同方法以提高分割精度是今后研究的趨勢(shì)。此外,病變檢測(cè)方法常與分割算法相結(jié)合,在確定存在病變的同時(shí)分割出病變區(qū)域,以提升計(jì)算機(jī)輔助診斷效果。
特征提取的目的是通過(guò)一系列的運(yùn)算,從原始圖像數(shù)據(jù)中抽象出對(duì)解決分類問(wèn)題有效的特征表達(dá)。傳統(tǒng)意義上的特征提取主要包括:基于人工設(shè)計(jì)的圖像特征表達(dá)和基于淺層學(xué)習(xí)的圖像特征表達(dá)。幾種常見的人工設(shè)計(jì)的特征提取方法有顏色(灰度)特征、紋理特征和局部特征提取方法。顏色(灰度)特征對(duì)圖像大小、方向和視角變化不敏感,計(jì)算過(guò)程簡(jiǎn)單,易于獲取。紋理特征刻畫的是圖像或感興趣區(qū)域的顏色和亮度在空間上的分布規(guī)律。
2.4.1 腫塊的特征提取、選擇與分類
Rangayyan等人[56]采用邊緣銳度特征描述腫塊邊緣點(diǎn)灰度的變化程度,并與緊密度和傅里葉描述符等形狀特征相結(jié)合,實(shí)現(xiàn)腫塊良惡性分類。Yang等人[57]首先對(duì)腫塊進(jìn)行邊緣分割,然后將分形維數(shù)用于腫塊良惡性的分類,取得了較好的結(jié)果。Rashe 等人[58]提出基于多分辨率小波分解的方法將腫塊識(shí)別為良性或惡性。首先將圖像進(jìn)行多級(jí)小波分解,然后取每級(jí)變換的低頻系數(shù)作為圖像特征。Nanni等人[59]分別使用局部三值模式和局部相位量化直方圖作為圖像特征,對(duì)腫塊進(jìn)行良惡性分類。Verma等人[60]提出了基于模糊神經(jīng)網(wǎng)絡(luò)的乳腺X線圖像特征提取系統(tǒng),在基于熵、標(biāo)準(zhǔn)差和像素的特征組合的基礎(chǔ)上對(duì)乳腺微鈣化圖像進(jìn)行良惡性分類。Eltoukhy等人[61]提出一種統(tǒng)計(jì)測(cè)試的方法。首先,將分解一組乳腺X線圖像后獲得的系數(shù)用于構(gòu)建K×N矩陣,其中K是圖像數(shù)量,N是每個(gè)圖像的系數(shù)數(shù)量,根據(jù)其分類能力對(duì)要素(列)進(jìn)行排名;然后,應(yīng)用動(dòng)態(tài)閾值來(lái)優(yōu)化特征數(shù)量,從而可以有效地實(shí)現(xiàn)分類準(zhǔn)確率。該方法取決于提取可以最大程度上區(qū)分不同類別的特征。
紋理特征是識(shí)別圖像中感興趣區(qū)域的重要特征。Mudigonda等人[62]比較整個(gè)腫塊區(qū)域和僅包含腫塊邊緣的帶狀區(qū)域的紋理特征和梯度特征在腫塊良惡性分類上的性能,發(fā)現(xiàn)從僅包含腫塊邊緣的帶狀區(qū)域提取的紋理特征具有較好的分類性能,在MIAS數(shù)據(jù)和本地?cái)?shù)據(jù)組合的數(shù)據(jù)庫(kù)上準(zhǔn)確率達(dá)到了76%。Jagadeesh 等人[63]提出兩種復(fù)雜的特征提取方法,首先使用Sech 模板方法選擇乳腺中的可疑區(qū)域進(jìn)行閾值化分割,然后使用灰度共生矩陣(gray-level co-occurrence matrix,GLCM)和光密度特征提取局部強(qiáng)度關(guān)系和離散光度分布的信息。Punitha 等人[64]提出了使用優(yōu)化區(qū)域生長(zhǎng)技術(shù)的自動(dòng)檢測(cè)乳腺腫塊的方法,其中使用名為DFO(dragon fly optimization)的群體優(yōu)化技術(shù)生成初始種子點(diǎn)和閾值。使用GLCM和灰度游程矩陣(gray-level run-length matrix,GLRLM)技術(shù)從分割的圖像中提取紋理特征,并將其輸入到使用反向傳播算法訓(xùn)練的前饋神經(jīng)網(wǎng)絡(luò)(feed forward neural network,F(xiàn)FNN)分類器中,將圖像分為良性和惡性。使用DDSM數(shù)據(jù)庫(kù)評(píng)估提出的檢測(cè)技術(shù)的性能,將得到的ROC 分析結(jié)果與其他區(qū)域生長(zhǎng)方法進(jìn)行了比較,該系統(tǒng)的靈敏度高達(dá)98.1%,特異性達(dá)到97.8%。
2.4.2 微鈣化的特征提取、選擇與分類
用于乳腺X 線圖像微鈣化點(diǎn)特征提取與識(shí)別的方法很多,主要有應(yīng)用小波變換的微鈣化點(diǎn)提取技術(shù)、應(yīng)用形態(tài)學(xué)的微鈣化點(diǎn)提取技術(shù)和應(yīng)用統(tǒng)計(jì)學(xué)習(xí)的微鈣化點(diǎn)檢測(cè)技術(shù)等。萬(wàn)柏坤等人[65]首次應(yīng)用基于統(tǒng)計(jì)學(xué)習(xí)理論的支持向量機(jī)算法實(shí)現(xiàn)了乳腺X 線圖像中的微鈣化檢測(cè)。使用ANN與SVM算法對(duì)214個(gè)微鈣化點(diǎn)進(jìn)行檢測(cè),實(shí)驗(yàn)結(jié)果表明SVM 算法具有更準(zhǔn)確的檢出率。Pal 等人[66]提出了鈣化的多階段檢測(cè)系統(tǒng),利用特征選擇技術(shù)從87 個(gè)鈣化特征中挑選出一組良好的特征。使用反向傳播神經(jīng)網(wǎng)絡(luò)找到鈣化和正常區(qū)域,然后在這些圖像的每個(gè)可疑像素處計(jì)算鈣化點(diǎn)的局部密度(稱為山勢(shì)),并將山峰的峰值用于將乳腺X線圖像分類為鈣化或正常。在17 張乳腺X 線圖像上進(jìn)行了測(cè)試,結(jié)果表明該系統(tǒng)運(yùn)行良好,并且對(duì)于每張異常圖像,能夠非常準(zhǔn)確地定位鈣化區(qū)域。對(duì)于乳腺X 線圖像中的簇狀微鈣化,Kim 等人[67]采用紋理分析方法進(jìn)行檢測(cè),他們將提出的與周圍區(qū)域相關(guān)的紋理分析方法與傳統(tǒng)的紋理分析方法(如空間灰度相關(guān)方法、灰度相關(guān)方法)進(jìn)行比較,利用這些方法提取的紋理特征將感興趣區(qū)域分為包含簇狀微鈣化和正常組織。選用三層反向傳播神經(jīng)網(wǎng)絡(luò)作為分類器,用ROC曲線作為評(píng)價(jià)指標(biāo),實(shí)驗(yàn)結(jié)果表明,在分類精度和算法復(fù)雜度方面,周圍區(qū)域依賴方法優(yōu)于傳統(tǒng)的紋理分析方法。Chen 等人[68]提出一種基于拓?fù)涮卣鞯娜橄傥⑩}化簇良惡性分類方法,在不同尺度下,構(gòu)建微鈣化簇的圖形表示,進(jìn)而應(yīng)用圖形學(xué)理論提取微鈣化簇的拓?fù)涮卣鳎詈髴?yīng)用k近鄰分類器區(qū)分良性和惡性微鈣化簇,在MIAS和DDSM數(shù)據(jù)集上均取得了較好的分類結(jié)果。
綜上,可以看出乳腺病變的分類主要集中于對(duì)腫塊和微鈣化這兩類病變的良惡性分類。上文中的病變分類方法只針對(duì)某一類病變,無(wú)法對(duì)其他類病變進(jìn)行良惡性分類。但是在乳腺癌的實(shí)際臨床診斷中,往往需要綜合考慮腫塊、微鈣化等多類病變,需要同時(shí)對(duì)多類病變進(jìn)行良惡性診斷。目前面向多類病變分類方法的研究較少,分類結(jié)果也較低,是今后的研究方向。
目前,應(yīng)用傳統(tǒng)方法的乳腺X線圖像分析和計(jì)算機(jī)輔助診斷面臨兩個(gè)問(wèn)題:一是基于人工設(shè)計(jì)特征的醫(yī)學(xué)圖像分析方法具有一定的主觀性,需要具備一定的醫(yī)學(xué)診斷知識(shí),而且不能有效地提取出圖像中的高維特征,無(wú)法滿足復(fù)雜函數(shù)模型建模的要求;二是基于傳統(tǒng)方法的病變檢測(cè)和分割方法是對(duì)一種或者幾種乳腺病變的顯著特征進(jìn)行特征提取,針對(duì)特征明顯的病變有很好的檢測(cè)能力,然而實(shí)際中面對(duì)外觀多樣的乳腺病變情況泛化能力低,不能有較強(qiáng)的魯棒性,很容易造成漏檢。因此,將不同的模型提取的特征進(jìn)行融合,可以彌補(bǔ)模型自身的局限性,結(jié)合不同的特征可以更好地?cái)M合出病變特點(diǎn),能夠更好地提高檢測(cè)的精度,但是增加了算法的復(fù)雜度,容易出現(xiàn)過(guò)擬合的情況。綜上,基于傳統(tǒng)方法的乳腺X線圖像分析仍存在一些問(wèn)題,尚不能很好地應(yīng)用在實(shí)際臨床診斷中。
人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)是受到動(dòng)物視覺(jué)皮層組織的啟發(fā)而產(chǎn)生的一系列可訓(xùn)練的多層結(jié)構(gòu),而各種各樣的深度結(jié)構(gòu)則衍生于傳統(tǒng)的前饋ANN。Hirose 等人[69]提出了被用于分層結(jié)構(gòu)神經(jīng)網(wǎng)絡(luò)的人工神經(jīng)網(wǎng)絡(luò)反向傳播算法,掀起了機(jī)器學(xué)習(xí)的第一次浪潮,使基于統(tǒng)計(jì)模型的機(jī)器學(xué)習(xí)重新煥發(fā)了生機(jī),隨之而來(lái)的是淺層學(xué)習(xí)在機(jī)器學(xué)習(xí)中的廣泛應(yīng)用。這些淺層結(jié)構(gòu)雖然相比于過(guò)去基于人工規(guī)則的系統(tǒng)展現(xiàn)出很大的優(yōu)越性,但當(dāng)處理復(fù)雜問(wèn)題時(shí),則表現(xiàn)出特征學(xué)習(xí)能力不足、維數(shù)災(zāi)難、易陷入局部最優(yōu)等缺點(diǎn)。
自2006 年Hinton 等人[70]首次提出深度學(xué)習(xí)的概念以來(lái),機(jī)器學(xué)習(xí)相關(guān)的應(yīng)用迅速增長(zhǎng),解決了上述淺層結(jié)構(gòu)長(zhǎng)期對(duì)研究者的困擾。研究發(fā)現(xiàn)多隱層網(wǎng)絡(luò)具有優(yōu)異的特征學(xué)習(xí)能力,能學(xué)習(xí)得到數(shù)據(jù)中更本質(zhì)的特征[71]。深度學(xué)習(xí)利用分層結(jié)構(gòu)處理復(fù)雜的高維數(shù)據(jù),每層由包含特征檢測(cè)器的單元組成,低層檢測(cè)簡(jiǎn)單特征,并反饋給高層,從而檢測(cè)出更復(fù)雜的特征。深度學(xué)習(xí)算法可以直接從訓(xùn)練數(shù)據(jù)提取特征,使得特征提取、特征選擇及特征分類三個(gè)核心步驟可以在同一個(gè)深層結(jié)構(gòu)的最優(yōu)化中實(shí)現(xiàn),從而極大地減少特征提取的工作量以及主觀因素的影響。深度學(xué)習(xí)相關(guān)研究掀起了機(jī)器學(xué)習(xí)研究的第二次浪潮。
深度學(xué)習(xí)算法最早應(yīng)用的領(lǐng)域便是圖像處理。最初,卷積神經(jīng)網(wǎng)絡(luò)等神經(jīng)網(wǎng)絡(luò)在時(shí)間延遲網(wǎng)絡(luò)[72]、支票讀取系統(tǒng)[73]等小規(guī)模的應(yīng)用問(wèn)題上取得了當(dāng)時(shí)最好的結(jié)果。在1996 年,Sahiner 等人[74]第一次利用包含一個(gè)輸入層、兩個(gè)隱藏層和一個(gè)輸出層構(gòu)成的卷積神經(jīng)網(wǎng)絡(luò),結(jié)合反向傳播算法更新卷積神經(jīng)網(wǎng)絡(luò)權(quán)值參數(shù),實(shí)現(xiàn)了對(duì)人工標(biāo)注的乳腺腫塊區(qū)域和乳腺正常組織區(qū)域的分類。由于當(dāng)時(shí)深度學(xué)習(xí)網(wǎng)絡(luò)對(duì)像素?cái)?shù)量巨大的圖像內(nèi)容理解不理想,使其在計(jì)算機(jī)視覺(jué)領(lǐng)域的相關(guān)研究一直停滯不前。圖形處理器(graphics processing unit,GPU)和并行處理算法的發(fā)展,特別是2012年的ImageNet比賽中出現(xiàn)的AlexNet[75],使深度學(xué)習(xí)在圖像處理領(lǐng)域的應(yīng)用日益增多。隨著深度學(xué)習(xí)模型和算法的不斷發(fā)展和優(yōu)化,深度學(xué)習(xí)在乳腺X線圖像分析領(lǐng)域的應(yīng)用也愈加廣泛[76]。
目前應(yīng)用廣泛的深度學(xué)習(xí)模型有自編碼器(autoencoder,AE)[77]、深度置信網(wǎng)絡(luò)(deep belief networks,DBN)[78]、卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)[79]、深度殘差網(wǎng)絡(luò)(residual neural network,ResNet)[80]和密集連接網(wǎng)絡(luò)(dense convolutional network,DenseNet)[81]等。
3.1.1 自編碼器
自編碼器是人工神經(jīng)網(wǎng)絡(luò)的一種形式,用于無(wú)監(jiān)督學(xué)習(xí)模型,主要分為降噪自編碼器(denoising autoencoder,DAE)和稀疏自編碼器(sparse autoencoder,SAE)。自編碼器由編碼器(encoder)和解碼器(decoder)兩部分組成,通過(guò)隱藏層減少維度空間,在輸出層重構(gòu)輸入圖像以學(xué)習(xí)圖像數(shù)據(jù)的特征表示。深度自編碼器的概念是Hinton 等人[70]對(duì)單層自編碼器的結(jié)構(gòu)進(jìn)行改進(jìn)后提出的,并給出了具體的預(yù)訓(xùn)練以及參數(shù)調(diào)優(yōu)的方法。目前,自編碼器廣泛應(yīng)用于乳腺X線圖像的分割與檢測(cè)。
3.1.2 受限玻爾茲曼機(jī)與深度置信網(wǎng)絡(luò)
受限玻爾茲曼機(jī)(restricted Boltzman machines,RBM)是一個(gè)雙向圖模型,由Smolensky[82]在1986 年提出,并且被廣泛用于特征提取、特征選擇與圖像分類。Nie 等人[83]在2016 年提出了卷積受限波爾茲曼機(jī)(convolutional restricted Boltzman machines,CRBM)[84],并將其應(yīng)用到了眼周識(shí)別領(lǐng)域??蝶惼嫉热薣85]提出了稀疏受限玻爾茲曼機(jī)(sparse restricted Boltzman machine,SRBM),通過(guò)歸一化輸入數(shù)據(jù)均值決定稀疏系數(shù)及稠密數(shù)據(jù)集(稀疏系數(shù)超過(guò)閾值的數(shù)據(jù)集),自動(dòng)完成原始稠密數(shù)據(jù)集到稀疏數(shù)據(jù)集的轉(zhuǎn)化。判別式受限玻爾茲曼機(jī)(discriminative restricted Boltzmann machine,DRBM)[86]可以看作是多個(gè)受限玻爾茲曼機(jī)以級(jí)聯(lián)的方式構(gòu)成的一種深度學(xué)習(xí)框架,可以直接用于分類,相當(dāng)于深度學(xué)習(xí)的最后一層,目前已經(jīng)成功應(yīng)用在數(shù)字識(shí)別、文本識(shí)別等領(lǐng)域。
深度置信網(wǎng)絡(luò)是一個(gè)概率生成模型,建立了一個(gè)觀察數(shù)據(jù)和標(biāo)簽之間的聯(lián)合分布,具有靈活性和易拓展的優(yōu)點(diǎn)。它的核心部分在于非監(jiān)督貪心逐層訓(xùn)練算法。這種算法能夠在某種程度上避免局部最優(yōu)的問(wèn)題,而且無(wú)監(jiān)督學(xué)習(xí)的訓(xùn)練方式使其具備對(duì)未標(biāo)記數(shù)據(jù)進(jìn)行訓(xùn)練的能力,從而有效解決以誤差反向傳播為代表的淺層學(xué)習(xí)結(jié)構(gòu)的局限性(如局部最優(yōu)、過(guò)擬合和無(wú)法訓(xùn)練未標(biāo)記數(shù)據(jù)等)。
3.1.3 卷積神經(jīng)網(wǎng)絡(luò)
卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一種最成功的深度學(xué)習(xí)模型,尤其是應(yīng)用在面向分類任務(wù)的監(jiān)督學(xué)習(xí)時(shí),性能尤其突出。Litjen 等人[87]在2017 年使用CNN 實(shí)現(xiàn)了多種圖像處理任務(wù)。早在1989 年,LeCun 等人[88]就提出了CNN,其為多層感知器的變形,和ANN 類似,也是由許多基礎(chǔ)單元堆疊組成的。CNN是一種包含卷積層的深度神經(jīng)網(wǎng)絡(luò),其網(wǎng)絡(luò)架構(gòu)包括非線性卷積層、池化層和全連接層。與常規(guī)神經(jīng)網(wǎng)絡(luò)不同的是CNN的層次具有寬度、高度和深度,CNN最大的特點(diǎn)是采用了權(quán)值共享的策略,其權(quán)值共享的網(wǎng)絡(luò)結(jié)構(gòu)使之更類似于生物神經(jīng)網(wǎng)絡(luò),不僅降低了網(wǎng)絡(luò)模型的復(fù)雜度,而且減少了權(quán)值的數(shù)量[89]。將合適的輸入數(shù)據(jù)輸入到CNN中即可對(duì)其進(jìn)行訓(xùn)練,CNN 會(huì)逐層地計(jì)算參數(shù)并生成一個(gè)最終的輸出。訓(xùn)練的目的是使網(wǎng)絡(luò)的預(yù)測(cè)輸出和實(shí)際輸出之間的差異最小化,訓(xùn)練的誤差會(huì)通過(guò)反向傳播算法反向流向整個(gè)網(wǎng)絡(luò)從而更新網(wǎng)絡(luò)的參數(shù)。卷積神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)技術(shù)中最具代表性的網(wǎng)絡(luò)結(jié)構(gòu)之一,該結(jié)構(gòu)特別適用于分析、處理圖像任務(wù),并在計(jì)算機(jī)視覺(jué)領(lǐng)域取得了突破性的進(jìn)展,甚至在很多視覺(jué)分析任務(wù)(如手寫字體識(shí)別、人臉識(shí)別、物體識(shí)別等)中都取得了可以和人類認(rèn)知相比擬的結(jié)果。
3.2.1 應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)的腫塊檢測(cè)
Dhungel等人[90]提出了一種使用級(jí)聯(lián)的深度學(xué)習(xí)和隨機(jī)森林分類器(random forest,RF)檢測(cè)乳腺腫塊的方法。首先將多尺度深度置信網(wǎng)絡(luò)(multi-scale deep belief networks,m-DBN)與高斯混合模型(Gaussian mixture model,GMM)相結(jié)合,選擇可疑區(qū)域。之后將候選框輸入級(jí)聯(lián)網(wǎng)絡(luò),主要是兩個(gè)深度卷積神經(jīng)網(wǎng)絡(luò)的級(jí)聯(lián),級(jí)聯(lián)網(wǎng)絡(luò)產(chǎn)生的特征被支持向量機(jī)使用,這種特定圖像區(qū)域和SVM的組合被稱為R-CNN[91]。最后由兩級(jí)隨機(jī)森林分類器級(jí)聯(lián)處理經(jīng)過(guò)深度學(xué)習(xí)分析的區(qū)域,從級(jí)聯(lián)分類器選擇的區(qū)域提取形態(tài)和紋理特征,再使用關(guān)聯(lián)成分分析(connected component analysis,CCA)將在隨機(jī)森林分類器中獲得的區(qū)域合并在一起,產(chǎn)生新的結(jié)果。在DDSM-BCRP 數(shù)據(jù)集和INbreast 數(shù)據(jù)集上進(jìn)行測(cè)試,實(shí)驗(yàn)結(jié)果表明該方法在有效地減少假陽(yáng)性的同時(shí),可以保持較高的真陽(yáng)性檢測(cè)率。
Ren 等人[92]提出了Faster R-CNN,引入一個(gè)區(qū)域建議網(wǎng)絡(luò)(region proposal network,RPN)[93]。RPN是一種全卷積網(wǎng)絡(luò),與Fast R-CNN 共享全圖像卷積特征,對(duì)RPN 進(jìn)行端到端的訓(xùn)練,以生成高質(zhì)量的區(qū)域建議,具有更快的檢測(cè)速度和更高的檢測(cè)質(zhì)量。Akselrod-Ballin等人使用Faster R-CNN 模型進(jìn)行了一系列實(shí)驗(yàn),分別為乳腺腫塊的檢測(cè)與分類和乳腺腫塊和鈣化的檢測(cè)與分類。Akselrod-Ballin 等人[94]對(duì)Faster R-CNN 進(jìn)行了改進(jìn),首先對(duì)圖像進(jìn)行預(yù)處理,分割乳腺組織,去除背景和胸肌,并相應(yīng)地剪裁圖像;然后將多個(gè)重疊的子圖像用于訓(xùn)練和測(cè)試修改后的Faster R-CNN,將子圖像獲得的結(jié)果整合到整個(gè)圖像中;最后產(chǎn)生具有置信度概率分?jǐn)?shù)的檢測(cè)和分類結(jié)果。另外,Akselrod-Ballin 等人[16]還提出了在Faster R-CNN 基礎(chǔ)上構(gòu)建多級(jí)特征融合,將底層的特征與高級(jí)語(yǔ)義特征相結(jié)合,在DDSM數(shù)據(jù)集和INbreast 數(shù)據(jù)集上進(jìn)行訓(xùn)練,得到了AUC 為0.97 和0.91 的好結(jié)果,與之前的模型相比,具有更高的檢測(cè)速度和檢測(cè)精度。Ribli 等人[95]提出了一種無(wú)需任何人工干預(yù)即可在乳腺X 線圖像上檢測(cè)和分類良惡性病變的系統(tǒng)。該系統(tǒng)運(yùn)用遷移學(xué)習(xí)的方法,使用在ImageNet數(shù)據(jù)集上預(yù)訓(xùn)練的VGG16網(wǎng)絡(luò)參數(shù),結(jié)合Faster R-CNN在DDSM 和INbreast 數(shù)據(jù)集上進(jìn)行訓(xùn)練,得到AUC 為0.95,在數(shù)字乳腺攝影DREAM挑戰(zhàn)賽中排名第二。
大部分的CNN網(wǎng)絡(luò)模型規(guī)定輸入圖像的大小都小于乳腺X 線圖像的大小,直接對(duì)圖像進(jìn)行下采樣,會(huì)造成圖像部分信息的丟失,尤其不適合小病變檢測(cè)。Jung等人[96]使用RetinaNet作為基礎(chǔ)模型,針對(duì)乳腺病變中的小腫塊進(jìn)行檢測(cè),通過(guò)旋轉(zhuǎn)、翻轉(zhuǎn)、剪裁等方式,對(duì)數(shù)據(jù)進(jìn)行增廣,在INbreast數(shù)據(jù)集上進(jìn)行訓(xùn)練。實(shí)驗(yàn)結(jié)果證明RetinaNet能夠降低假陽(yáng)性率,提高腫塊檢測(cè)的準(zhǔn)確率,對(duì)小腫塊有比較好的檢測(cè)效果。
Redmon等人[97]提出了一種新的目標(biāo)檢測(cè)方法YOLO(you only look once)。該網(wǎng)絡(luò)使用整個(gè)圖像的特征來(lái)預(yù)測(cè)每個(gè)邊界框,同時(shí)還可以預(yù)測(cè)圖像中所有目標(biāo)類的所有邊界框,可以實(shí)現(xiàn)端到端的訓(xùn)練和實(shí)時(shí)速度,同時(shí)保持較高的平均精度。YOLO 系統(tǒng)將輸入的圖像劃分為S×S個(gè)網(wǎng)格,如果目標(biāo)的中心落入某個(gè)網(wǎng)格單元,則該網(wǎng)格單元負(fù)責(zé)檢測(cè)該目標(biāo),每個(gè)網(wǎng)格單元檢測(cè)目標(biāo)邊界框并輸出這些邊界框的目標(biāo)置信度分?jǐn)?shù)。Al-Masni等人[98-99]對(duì)YOLO 模型進(jìn)行了改進(jìn),提出一種區(qū)域深度學(xué)習(xí)技術(shù),用于腫塊的自動(dòng)檢測(cè)和分類。該系統(tǒng)主要分為4個(gè)階段:對(duì)圖像進(jìn)行預(yù)處理,使用24個(gè)卷積層(內(nèi)核大小為3×3)進(jìn)行特征提取,使用置信度模型進(jìn)行腫塊檢測(cè),最后使用全連接神經(jīng)網(wǎng)絡(luò)(fully connected neural network,F(xiàn)C-NN)進(jìn)行腫塊分類。一組帶有腫塊RoI(region of interest)及其類型信息的乳腺X線圖像用于訓(xùn)練YOLO。訓(xùn)練后的基于YOLO的CAD系統(tǒng)可以檢測(cè)腫塊并將其類型分為良性或惡性。實(shí)驗(yàn)結(jié)果顯示所提出的基于YOLO的CAD系統(tǒng)能夠以96.33%的整體精度檢測(cè)腫塊位置,良性和惡性病變分類準(zhǔn)確度為85.52%。Al-Masni 等人聲明該系統(tǒng)是能夠同時(shí)進(jìn)行檢測(cè)和分類的CAD 系統(tǒng),且能夠克服一些具有挑戰(zhàn)性的乳腺癌病例,例如存在于胸肌或密集區(qū)域的腫塊。YOLO網(wǎng)絡(luò)以其出色的檢測(cè)速度而廣受歡迎,YOLOv3[100]的速度比RCNN快1 000倍,比Faster R-CNN快100倍。Djebbar等人[101]使用YOLOv3 網(wǎng)絡(luò)對(duì)腫塊進(jìn)行檢測(cè)和分類,對(duì)DDSM數(shù)據(jù)集進(jìn)行擴(kuò)充,最后實(shí)驗(yàn)整體的檢測(cè)精度達(dá)到99.7%,良性和惡性病變分類精度達(dá)到97.0%。
有時(shí)由于高昂的成本和放射線專家的缺乏,導(dǎo)致乳腺X線圖像并不包括專業(yè)醫(yī)生標(biāo)注的病變的位置信息,輸入的數(shù)據(jù)只有圖像中病變類別的注釋信息,這樣的訓(xùn)練稱為弱監(jiān)督學(xué)習(xí)。Choukroun 等人[102]描述了一種弱監(jiān)督學(xué)習(xí)系統(tǒng)。提出的方法主要利用深層多實(shí)例學(xué)習(xí)(multiple instance learning,MIL)卷積神經(jīng)網(wǎng)絡(luò),通過(guò)全分辨率處理乳腺X 線圖像。這種方法僅需要提供整個(gè)圖像的標(biāo)簽,就可以根據(jù)評(píng)分對(duì)整個(gè)圖像進(jìn)行分類,并在弱標(biāo)簽數(shù)據(jù)集上進(jìn)行訓(xùn)練的同時(shí)以全分辨率定位病變。該方法在INbreast 數(shù)據(jù)集和不公開的數(shù)據(jù)集上進(jìn)行了驗(yàn)證,得到了理想的檢測(cè)和分類結(jié)果。Hwang等人[103]提出一種弱監(jiān)督的自遷移學(xué)習(xí)框架(self-transfer learning,STL)。該框架使用加權(quán)損失函數(shù)作為目標(biāo)函數(shù)共同學(xué)習(xí)分類器和定位器,隨著訓(xùn)練的不斷進(jìn)行,增加定位器與訓(xùn)練器的訓(xùn)練比重,防止定位器陷入局部最優(yōu)狀態(tài)。STL框架不需要在圖像上標(biāo)注位置信息,僅在圖像級(jí)標(biāo)記的數(shù)據(jù)集下即可實(shí)現(xiàn)RoI的準(zhǔn)確定位,也不需要任何類型的預(yù)訓(xùn)練網(wǎng)絡(luò),而且分類網(wǎng)絡(luò)和本地化網(wǎng)絡(luò)之間的權(quán)重共享。實(shí)驗(yàn)結(jié)果顯示STL 框架在分類與定位檢測(cè)方面,明顯優(yōu)于其他方法。
對(duì)比傳統(tǒng)的腫塊檢測(cè)方法,深度學(xué)習(xí)方法可以省略特征提取的工作,由網(wǎng)絡(luò)根據(jù)損失函數(shù)自動(dòng)優(yōu)化參數(shù),學(xué)習(xí)合適的特征,以提升檢測(cè)性能。例如一階段的YOLO網(wǎng)絡(luò)對(duì)腫塊病變進(jìn)行檢測(cè)時(shí),不但具有較高的精度,而且對(duì)比其他網(wǎng)絡(luò)檢測(cè)速度更快。但是因?yàn)獒t(yī)學(xué)影像已知數(shù)據(jù)量少,不能滿足深度學(xué)習(xí)的訓(xùn)練要求,所以遷移學(xué)習(xí)不可或缺。
3.2.2 應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)的微鈣化檢測(cè)
Mordang 等人[104]為了克服微鈣化點(diǎn)像素與其他乳腺組織像素大類不平衡(微鈣化點(diǎn)像素樣本過(guò)少)的問(wèn)題,采用了使用兩個(gè)CNN的強(qiáng)反差挖掘策略,并與當(dāng)前檢測(cè)微鈣化點(diǎn)效果最好的級(jí)聯(lián)分類器進(jìn)行了比較。考慮到CAD系統(tǒng)的性能受不同傳感器采集的乳腺X線圖像的噪聲特性和外觀的影響,他們使用了三個(gè)不同的數(shù)據(jù)庫(kù)。結(jié)果表明,使用CNN的CAD系統(tǒng)對(duì)微鈣化點(diǎn)的敏感性明顯高于使用級(jí)聯(lián)分類器的CAD系統(tǒng)。Wang等人[105]開發(fā)了一種深度神經(jīng)網(wǎng)絡(luò)(deep neural network,DNN)用于檢測(cè)乳腺X 線圖像中的微鈣化簇,該網(wǎng)絡(luò)既考慮到微鈣化的局部圖像特征,也學(xué)習(xí)到反映圖像周圍信息的上下文特征。網(wǎng)絡(luò)由兩部分組成,一部分用于提取局部特征,另一部分用于學(xué)習(xí)上下文信息。最后將兩部分提取到的特征進(jìn)行組合,對(duì)微鈣化的位置進(jìn)行定位。檢測(cè)結(jié)果說(shuō)明,深度學(xué)習(xí)提取到的特征比人工制作的特征具有更好的性能。Samala 等人[106]設(shè)計(jì)了深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)(deep learning convolution neural network,DLCNN),以區(qū)分乳腺X 線圖像中的真實(shí)鈣化和假陽(yáng)性。用DLCNN網(wǎng)絡(luò)訓(xùn)練和測(cè)試時(shí),數(shù)據(jù)集為手動(dòng)標(biāo)記的真實(shí)微鈣化,并在排除真實(shí)鈣化的可疑區(qū)域選取假陽(yáng)性,通過(guò)改變卷積層中的濾波器數(shù)量、濾波器內(nèi)核大小和梯度計(jì)算參數(shù)來(lái)選擇DLCNN 網(wǎng)絡(luò)結(jié)構(gòu)。然而選擇DLCNN網(wǎng)絡(luò)并不是簡(jiǎn)單的問(wèn)題,它的參數(shù)量眾多,因此訓(xùn)練和測(cè)試時(shí)計(jì)算時(shí)間較長(zhǎng),需要更高性能的計(jì)算機(jī)進(jìn)行操作。Cao等人[107]利用改進(jìn)的Faster R-CNN完成乳腺腫塊和鈣化的檢測(cè)。采用最新的焦點(diǎn)損失函數(shù)[108]代替Faster R-CNN 原始的損失函數(shù),以減少原始Faster R-CNN 產(chǎn)生的誤報(bào)。ResNet50 作為模型的主干網(wǎng)絡(luò),使用DDSM、INbreast和BCDR三個(gè)公共數(shù)據(jù)集和一個(gè)私人數(shù)據(jù)集中的數(shù)據(jù)隨機(jī)劃分進(jìn)行訓(xùn)練和測(cè)試。通過(guò)不同數(shù)據(jù)集之間的檢測(cè)結(jié)果的對(duì)比發(fā)現(xiàn),不同數(shù)據(jù)集之間專業(yè)醫(yī)生標(biāo)記的微鈣化的方式存在差異,會(huì)對(duì)模型的檢測(cè)準(zhǔn)確性和靈敏度有一定的影響。
由上可見,深度學(xué)習(xí)方法比傳統(tǒng)方法的特征提取能力更為顯著。由于微鈣化點(diǎn)非常小,在構(gòu)建微鈣化檢測(cè)網(wǎng)絡(luò)時(shí),要重點(diǎn)提升網(wǎng)絡(luò)對(duì)微小目標(biāo)的檢測(cè)準(zhǔn)確率,可通過(guò)多尺度特征融合、合理的錨框設(shè)計(jì)、放大小目標(biāo)特征等方法提高小目標(biāo)檢測(cè)精度。表3 綜合比較了基于深度學(xué)習(xí)的乳腺X線圖像病變檢測(cè)方法。
表3 基于深度學(xué)習(xí)的乳腺X線圖像病變檢測(cè)方法比較Table 3 Comparison of abnormality detection methods in mammograms based on deep learning
Dhungel等人[109]使用了CNN與DBN結(jié)合淺層學(xué)習(xí)模型的混合模型,成功地在淺層學(xué)習(xí)模型的基礎(chǔ)上大幅度提升了對(duì)乳腺X 線圖像病變區(qū)域分割的準(zhǔn)確率。該混合模型的Dice系數(shù)為0.90,而淺層學(xué)習(xí)模型的Dice系數(shù)只有0.86。此外,Dhungel等人[110]同樣測(cè)試了DBN結(jié)合淺層學(xué)習(xí)模型對(duì)乳腺X 線圖像的分割結(jié)果,最終的Dice系數(shù)為0.88。由此可以看出DBN作為一個(gè)在結(jié)構(gòu)上包含多層非線性運(yùn)算單元的概率模型,在處理圖像數(shù)據(jù)時(shí)具有更強(qiáng)的建模和表征能力,相比高斯混合模型的Dice系數(shù)提升了0.02。由結(jié)果可以看出,在推理和訓(xùn)練時(shí)間方面,條件隨機(jī)場(chǎng)(conditional random field,CRF)模型比結(jié)構(gòu)支持向量機(jī)(structured support vector machine,SSVM)快,這表明將CRF 模型與深度學(xué)習(xí)潛在特征結(jié)合使用時(shí),具有很強(qiáng)的優(yōu)勢(shì)。
Kallenberg等人[111]在卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上改進(jìn)形成了卷積稀疏自編碼器(convolutional sparse autoencoder,CSAE)。這是一種無(wú)監(jiān)督的學(xué)習(xí)方式,采用了種群稀疏和存在稀疏相結(jié)合的稀疏方式,可以在未被標(biāo)記的樣本中學(xué)習(xí)到多層次的特征,在乳腺密度數(shù)據(jù)集和紋理數(shù)據(jù)集上的分割結(jié)果都遠(yuǎn)遠(yuǎn)優(yōu)于傳統(tǒng)的需要大量先驗(yàn)知識(shí)的閾值分割方法,而且性能相比CNN 也有一定的提高。Petersen等人[112]提出了一種使用稀疏化激活函數(shù)的多尺度去噪自編碼器(multiscale denoising autoencoder,MS-DAE),并將其應(yīng)用于乳腺密度分割。他們通過(guò)與人工的BI-RADS 和類似Byng[113]的半自動(dòng)密度評(píng)分對(duì)比,評(píng)估其方法的臨床應(yīng)用價(jià)值。結(jié)果表明,在分割任務(wù)中,多尺度去噪自編碼器可以有效自動(dòng)地學(xué)習(xí)豐富的特征表示,且自動(dòng)密度評(píng)分優(yōu)于人工分級(jí)。
Yan等人[114]提出了基于區(qū)域的腫塊分割技術(shù),采用嵌套和密集跳躍連接的卷積編碼器-解碼器來(lái)對(duì)候選腫塊區(qū)域進(jìn)行分割,通過(guò)一系列嵌套的密集卷積塊來(lái)建立連接,增強(qiáng)特征融合,防止反向傳播期間中間部分出現(xiàn)梯度消失問(wèn)題,確保更好的分割精度。這樣的結(jié)構(gòu)遵循U-Net++實(shí)現(xiàn)了具有嵌套和跳躍連接的深度架構(gòu),與最近提出的條件殘差U-Net[115]、條件GAN[116]、級(jí)聯(lián)U-Net[117]一樣,都是標(biāo)準(zhǔn)U-Net[118]的擴(kuò)展。它們?cè)诒举|(zhì)上一樣,都是從編碼器到解碼器的快捷連接,將下采樣的特征圖與同維度上采樣的特征圖拼接,實(shí)現(xiàn)高低層次特征的融合。Min 等人[119]提出一種同時(shí)進(jìn)行乳腺X 線圖像腫塊檢測(cè)和分割的系統(tǒng),不需要人工處理。該系統(tǒng)基于多尺度形態(tài)學(xué)進(jìn)行篩選,將灰度圖轉(zhuǎn)換成偽彩色圖像,以增強(qiáng)可疑區(qū)域的對(duì)比度;然后利用Mask R-CNN進(jìn)行傳遞學(xué)習(xí),同時(shí)檢測(cè)和分割偽彩色圖像的腫塊,在INbreast數(shù)據(jù)集上進(jìn)行評(píng)估,Dice系數(shù)為0.88。
Cao等人[120]為了幫助醫(yī)生有效識(shí)別腫塊和鈣化,提出基于深度學(xué)習(xí)的綜合解決方案來(lái)進(jìn)行腫塊檢測(cè)和鈣化分割。對(duì)于腫塊和鈣化的檢測(cè),首先將Faster R-CNN與特征金字塔[121]、焦點(diǎn)損失函數(shù)和非局部神經(jīng)網(wǎng)絡(luò)[122]相結(jié)合,將該方法與同類型的方法在三個(gè)公共數(shù)據(jù)集(CBIS-DDSM、BCDR和INbreast數(shù)據(jù)庫(kù))和一個(gè)內(nèi)部數(shù)據(jù)集上進(jìn)行比較,最佳的檢測(cè)結(jié)果mAP=0.933,Recall=0.976。對(duì)于鈣化分割,首先設(shè)計(jì)了窗口調(diào)整、乳腺區(qū)域提取等預(yù)處理;然后進(jìn)行鈣化分割,將U-Net 模型[123]進(jìn)行組歸一化(group normalization,GN)[124],包括三個(gè)上采樣階段和三個(gè)具有跳躍連接的下采樣階段。每個(gè)階段都有兩個(gè)卷積層,每個(gè)卷積層后面都有一組歸一化和ReLU[125]。因?yàn)獒t(yī)生一般對(duì)鈣化的標(biāo)注區(qū)域比實(shí)際的鈣化點(diǎn)要大得多,常用的交并比并不是很好的評(píng)價(jià)指標(biāo),所以該論文使用新的實(shí)驗(yàn)指標(biāo)——預(yù)測(cè)交集(intersection over prediction,IoP)在內(nèi)部數(shù)據(jù)集上進(jìn)行驗(yàn)證。論文將組歸一化后的U-Net模型與經(jīng)過(guò)批處理歸一化(batch normalization,BN)和層歸一化(layer normalization,LN)的U-Net模型進(jìn)行對(duì)比。當(dāng)每幅圖片的假陽(yáng)性高于1 時(shí),經(jīng)過(guò)組歸一化的U-Net 的召回率高于其他兩種類型的U-Net 網(wǎng)絡(luò),為0.737。此外,論文還根據(jù)鈣化的標(biāo)簽面積和形狀對(duì)標(biāo)簽進(jìn)行劃分,“血管”形狀的鈣化檢測(cè)結(jié)果最好,當(dāng)每幅圖片的假陽(yáng)性不小于1 時(shí),“血管”形狀的鈣化召回率為0.971,其次是大面積的鈣化,最后是點(diǎn)樣鈣化。實(shí)驗(yàn)結(jié)果表明該方法解決了不同的放射科醫(yī)生之間由于鈣化標(biāo)注不一致和標(biāo)簽不完善導(dǎo)致的問(wèn)題。
上文的U-Net網(wǎng)絡(luò)盡管使用有限的數(shù)據(jù)集訓(xùn)練,卻能在乳腺X線圖像分割中取得良好的表現(xiàn)。但是,目前對(duì)U-Net模型的改進(jìn)有限,模型的準(zhǔn)確率和穩(wěn)定性還有待進(jìn)一步提高。各種分割方法的比較見表4。
傳統(tǒng)的特征提取需要靠人工設(shè)計(jì)的特征來(lái)表達(dá)圖像中的內(nèi)容,而深度神經(jīng)網(wǎng)絡(luò)則可以自動(dòng)地提取圖像中的優(yōu)質(zhì)特征,這對(duì)于乳腺X 線圖像分類來(lái)說(shuō),避免了征象不明顯和難以提取高維特征的問(wèn)題,有利于對(duì)圖像中的病變進(jìn)行良惡性分類。目前已有堆棧式自編碼器和不同結(jié)構(gòu)的CNN模型被用于乳腺X線圖像中病變的良惡性分類。此外,深度學(xué)習(xí)模型大多可以和非負(fù)矩陣分解(nonnegative matrix factor,NMF)[126]、多核學(xué)習(xí)(multiple kernel learning,MKL)[127]、Liebenberg-Marquardt 學(xué)習(xí)函數(shù)[128]、支持向量機(jī)等方法相結(jié)合,從而達(dá)到優(yōu)化分類的效果。
為了解決醫(yī)學(xué)圖像數(shù)據(jù)集樣本數(shù)量偏小的問(wèn)題,Carneiro 等人[129]利用未配準(zhǔn)的乳腺X 線圖像的多視圖(CC位和MLO位)以及分割后的微鈣化和腫塊區(qū)域,采用ImageNet 預(yù)訓(xùn)練單獨(dú)的CNN 模型,然后使用從分割后的圖像和多視圖中學(xué)習(xí)到的特征,訓(xùn)練最終的CNN分類器。最終,該分類器使用BI-RADS 評(píng)分來(lái)估計(jì)患者患乳腺癌的風(fēng)險(xiǎn),在INbreast和DDSM數(shù)據(jù)集上進(jìn)行測(cè)試,將微鈣化和腫塊病例分為良性或惡性(每個(gè)病例至少具有微鈣化或腫塊)。在INbreast數(shù)據(jù)集上的AUC=0.91±0.05,在DDSM數(shù)據(jù)集上的AUC=0.97±0.03。Arevalo等人[130]采用了CNN 結(jié)合SVM 分類器對(duì)乳腺X 線圖像中的腫塊進(jìn)行分類,得到的AUC為0.86,而利用人工提取特征結(jié)合SVM的分類方法的AUC僅僅為0.799,表明了應(yīng)用深度學(xué)習(xí)的特征提取方法,特別是CNN 的特征提取性能要優(yōu)于傳統(tǒng)的人工特征提取,其分類性能較傳統(tǒng)方法有了很大的提高。Arevalo等人[131]在他們之前工作的基礎(chǔ)上,對(duì)CNN的卷積層數(shù)進(jìn)行了調(diào)整,探索不同數(shù)量的卷積層對(duì)特征提取結(jié)果的影響,發(fā)現(xiàn)在一定程度內(nèi)加深網(wǎng)絡(luò)的深度能提升模型的分類性能。
Fonseca等人[132]采用了一種用于乳腺X線圖像的結(jié)構(gòu)搜索過(guò)程技術(shù)[133],評(píng)估了改進(jìn)型HT-L3 CNN 網(wǎng)絡(luò)的性能。網(wǎng)絡(luò)搜索空間有729個(gè)備選結(jié)構(gòu),用72小時(shí)找到了其中三種最好的結(jié)構(gòu)。使用得到的最優(yōu)結(jié)構(gòu)自動(dòng)提取特征,并用其訓(xùn)練SVM 分類器。Kooi 等人[134]與Huynh 等人[135]利用遷移學(xué)習(xí)從醫(yī)學(xué)圖像中提取腫瘤信息,使用CNN 首先通過(guò)非醫(yī)學(xué)數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練。分類過(guò)程分為兩個(gè)階段:首先,應(yīng)用隨機(jī)森林和生成似然圖像來(lái)檢測(cè)候選區(qū)域,從而進(jìn)行進(jìn)一步檢查;然后將這些圖像用作參考系統(tǒng)和CNN 的種子點(diǎn)。實(shí)驗(yàn)結(jié)果表明,添加位置、上下文信息等手動(dòng)設(shè)計(jì)的特征能提高卷積神經(jīng)網(wǎng)絡(luò)的性能。Jiao 等人[136]使用CNN 在LSVRC(large scale visual recognition competition)圖像集上訓(xùn)練,然后使用乳腺腫塊圖像進(jìn)行微調(diào)。腫塊的特征被提取于模型的不同層次,然后通過(guò)兩個(gè)SVM分類器進(jìn)行決策,最終融合不同的決策結(jié)果來(lái)完成分類。Lévy等人[137]使用經(jīng)過(guò)遷移學(xué)習(xí)的CNN 對(duì)預(yù)分割后的腫塊進(jìn)行分類,CNN模型的層數(shù)由少到多逐漸增加。并且研究了數(shù)據(jù)增強(qiáng)和數(shù)據(jù)背景信息對(duì)實(shí)驗(yàn)結(jié)果的影響,得出了加倍異常邊框?qū)δ[塊的二值分類有影響的結(jié)論。
Wang等人[138]采用堆棧去噪自編碼器分別在有腫塊的乳腺X 線圖像和無(wú)腫塊的乳腺X 線圖像上回顧性分析微鈣化點(diǎn)。使用深度學(xué)習(xí)模型對(duì)圖像進(jìn)行分割,針對(duì)腫塊和微鈣化分離或組合的這三種情況分別提取到15、26、41個(gè)微鈣化和腫塊特征。在他們的工作中輸入比較分類器的是特征而不是原始圖像,并就分類和識(shí)別乳腺病變的性能和精度與SVM、k近鄰和線性分解分析方法進(jìn)行了比較,結(jié)果表明組合的方法準(zhǔn)確度高于標(biāo)準(zhǔn)微鈣化判別方法。Bekker 等人[139]從事乳腺微鈣化簇的良惡性分類,使用CC 和MLO 兩個(gè)視圖,每個(gè)視圖的簡(jiǎn)單分類器作為其初始決策,決策結(jié)果通過(guò)一個(gè)單神經(jīng)元層,非線性組合得到全局決策。Fotin 等人[140]采用CNN模型和傳統(tǒng)的采用直方圖、梯度、紋理和形狀特征結(jié)合決策樹的方法對(duì)乳腺X線圖像分類的特異度進(jìn)行對(duì)比,應(yīng)用CNN模型的平均感興趣區(qū)域特異度對(duì)于疑似惡性腫瘤與惡性腫瘤分別為0.893和0.930,而傳統(tǒng)的分類方法的特異度對(duì)于疑似惡性腫瘤與惡性腫瘤分別為0.832和0.852。由此可見CNN 能夠在很大程度上提高病變分類的準(zhǔn)確率、靈敏度和特異度。Dubrovina 等人[141]將組織分類應(yīng)用于胸大肌、纖維腺組織等乳腺組織分割。他們將常規(guī)CNN 的全連接層轉(zhuǎn)變?yōu)榫矸e層,通過(guò)這種方式在保持了分類精度的同時(shí),極大地提高了運(yùn)算速度。
由上可見,卷積神經(jīng)網(wǎng)絡(luò)的分類能力要優(yōu)于傳統(tǒng)方法,然而融合卷積神經(jīng)網(wǎng)絡(luò)提取的深層特征與傳統(tǒng)方法提取的特征有助于提高分類結(jié)果。在進(jìn)行腫塊與鈣化病變的良惡性分類時(shí),將形狀、紋理等傳統(tǒng)特征與CNN模型進(jìn)行融合效果會(huì)更好。表5 將上述基于深度學(xué)習(xí)的各種乳腺X線圖像分類方法進(jìn)行對(duì)比。
表5 基于深度學(xué)習(xí)的乳腺X線圖像分類方法對(duì)比Table 5 Comparison of mammographic image classification methods based on deep learning
目前,隨著計(jì)算機(jī)存儲(chǔ)和數(shù)據(jù)處理能力的增強(qiáng),如何從大數(shù)據(jù)中挖掘出所需的信息成為首要的問(wèn)題。深度學(xué)習(xí)可以充分利用大數(shù)據(jù),以有監(jiān)督和無(wú)監(jiān)督的方式學(xué)習(xí)數(shù)據(jù)特征,成為大數(shù)據(jù)時(shí)代的強(qiáng)大推動(dòng)力?!按髷?shù)據(jù)+深度學(xué)習(xí)模型”目前已成為研究熱點(diǎn),未來(lái)將應(yīng)用于各個(gè)領(lǐng)域。而對(duì)于乳腺X線圖像分析而言,一個(gè)重要的問(wèn)題則是大規(guī)模數(shù)據(jù)集的收集,有限的數(shù)據(jù)量成為深度學(xué)習(xí)在乳腺X 線圖像計(jì)算機(jī)輔助診斷中的發(fā)展阻礙。許多研究者已嘗試應(yīng)用數(shù)據(jù)增廣、遷移學(xué)習(xí)、小樣本學(xué)習(xí)等方法解決數(shù)據(jù)缺乏的問(wèn)題。
此外,深度學(xué)習(xí)依賴于含有多隱藏層的人工神經(jīng)網(wǎng)絡(luò),如何衡量分析精度和網(wǎng)絡(luò)運(yùn)行復(fù)雜度之間的關(guān)系也是今后研究的一個(gè)方向。為了更好地提取特征,有效的訓(xùn)練算法和持續(xù)的優(yōu)化策略,設(shè)定和微調(diào)優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)在深度學(xué)習(xí)中對(duì)于特征學(xué)習(xí)非常重要[142]。算法自身的改進(jìn)和硬件系統(tǒng)性能的提升,結(jié)合復(fù)雜推理表示學(xué)習(xí)的系統(tǒng),引入操作大量向量的新范式來(lái)代替基于規(guī)則的表達(dá)式操作,與其他方法的融合等,都能使深度學(xué)習(xí)的能力得到提升。
醫(yī)學(xué)圖像CAD系統(tǒng)為臨床醫(yī)生提供具有參考價(jià)值的輔助信息,可以幫助臨床醫(yī)生快速、準(zhǔn)確、高效地做出診斷決策。作為機(jī)器學(xué)習(xí)領(lǐng)域的新興技術(shù),深度學(xué)習(xí)可在很大程度上改進(jìn)淺層學(xué)習(xí)中存在的問(wèn)題,大幅提高CAD 系統(tǒng)對(duì)醫(yī)學(xué)圖像特征學(xué)習(xí)的能力。因此,深度學(xué)習(xí)應(yīng)用于乳腺X 線圖像CAD 系統(tǒng),將成為乳腺X 線圖像計(jì)算機(jī)輔助診斷技術(shù)發(fā)展的新方向。
乳腺X線圖像分析作為醫(yī)學(xué)圖像分析的一個(gè)分支,有著和大多病癥相似卻又不同的處理方式。病理的復(fù)雜性和病灶X線表現(xiàn)的差異性,使得人們需要在專門的領(lǐng)域研究相關(guān)的圖像處理技術(shù)和病變?cè)\斷技術(shù)。本文從傳統(tǒng)方法和深度學(xué)習(xí)兩方面全面綜述和分析了乳腺X 線圖像計(jì)算機(jī)輔助診斷技術(shù)的發(fā)展現(xiàn)狀。首先討論了應(yīng)用傳統(tǒng)方法的乳腺X線圖像分析中的病變檢測(cè)、分割和分類方法;之后從深度學(xué)習(xí)的基本理論出發(fā),結(jié)合乳腺X線圖像分析領(lǐng)域這一應(yīng)用方向,探討深度學(xué)習(xí)在乳腺X線圖像分析方面的應(yīng)用潛力;隨后介紹了幾種常見的深度神經(jīng)網(wǎng)絡(luò),在此基礎(chǔ)上結(jié)合深度學(xué)習(xí)在乳腺X線圖像病變檢測(cè)、分割和分類等方面的應(yīng)用,闡述了深度學(xué)習(xí)的優(yōu)勢(shì)。
隨著乳腺X 線圖像計(jì)算機(jī)輔助診斷技術(shù)研究的深入,目前的研究還存在以下問(wèn)題或改進(jìn)方向:
(1)應(yīng)用傳統(tǒng)方法的乳腺X線圖像計(jì)算機(jī)輔助診斷技術(shù)在特征提取方面存在瓶頸。傳統(tǒng)方法以定義提取有效的特征為前提,不需要復(fù)雜的訓(xùn)練過(guò)程,可以快速地進(jìn)行結(jié)果預(yù)測(cè),但是傳統(tǒng)方法只提取了圖像的淺層特征,對(duì)于具有不同密度特征的乳腺組織,產(chǎn)生了大量的不確定信息。另外,傳統(tǒng)方法一般只提取一種或者幾種人工設(shè)計(jì)的特征,泛化能力低,不能應(yīng)用在其他的數(shù)據(jù)集中,模型的魯棒性差。將不同的模型提取的特征進(jìn)行融合,可以彌補(bǔ)模型自身的局限性,結(jié)合不同的特征可以更好地?cái)M合出病變特點(diǎn),但是其算法復(fù)雜度增加,還可能出現(xiàn)過(guò)擬合的情況。
(2)乳腺X 線圖像病變區(qū)域和正常組織對(duì)比度較低。乳腺病變周圍組織形式豐富(如致密組織、胸肌組織等),乳腺腫塊可能隱藏在周圍腺體中,在檢測(cè)時(shí)容易受到噪聲和周圍組織的影響。因此無(wú)論是傳統(tǒng)方法還是深度學(xué)習(xí)方法,在檢測(cè)前對(duì)圖像進(jìn)行對(duì)比度增強(qiáng)等預(yù)處理是十分必要的。在預(yù)處理過(guò)程中還要注意在減少噪聲的同時(shí),增強(qiáng)圖像的視覺(jué)效果,保留圖像中的微小病變。
(3)醫(yī)生對(duì)乳腺X 線圖像中病變的標(biāo)注習(xí)慣不同,缺乏標(biāo)準(zhǔn)的標(biāo)注信息。例如,參考已知的數(shù)據(jù)集,乳腺微鈣化標(biāo)注的信息參差不齊,微鈣化的標(biāo)注信息很大程度上取決于放射科醫(yī)生標(biāo)記的偏好,對(duì)于聚集在一起的微鈣化點(diǎn),有的醫(yī)生偏好標(biāo)成一處,有的醫(yī)生將它們標(biāo)記成小點(diǎn)。這種情況限制了模型的學(xué)習(xí),影響模型的準(zhǔn)確率和靈敏度。
(4)缺乏大型公開的、已經(jīng)標(biāo)注的高質(zhì)量乳腺X 線圖像數(shù)據(jù)庫(kù)。無(wú)論是深度學(xué)習(xí)方法還是傳統(tǒng)方法,都需要大量的標(biāo)注后的數(shù)據(jù)進(jìn)行訓(xùn)練。如何利用無(wú)監(jiān)督或者半監(jiān)督學(xué)習(xí)、小樣本學(xué)習(xí)、數(shù)據(jù)增廣以及遷移學(xué)習(xí)等方式緩解目前數(shù)據(jù)匱乏的問(wèn)題,是深度學(xué)習(xí)方法在乳腺X線圖像分析應(yīng)用中的一個(gè)研究方向。
(5)人工定義特征與深度特征的融合或有助于提高深度學(xué)習(xí)模型性能。利用傳統(tǒng)方法提取人工定義的病變的顯著特征,并將其遷移到深度學(xué)習(xí)模型進(jìn)行分析,比使用單一方法效果要好。針對(duì)醫(yī)學(xué)圖像來(lái)說(shuō),相對(duì)于速度而言,模型檢測(cè)或分類的準(zhǔn)確率和精度是非常重要的評(píng)價(jià)指標(biāo)。
對(duì)于逐年升高的乳腺癌發(fā)病率和死亡率,女性對(duì)于乳腺癌的篩查意識(shí)也在提高。乳腺X 線圖像計(jì)算機(jī)輔助診斷技術(shù)可輔助放射科醫(yī)生做出更準(zhǔn)確的診斷,結(jié)合BI-RADS分級(jí)標(biāo)準(zhǔn)對(duì)乳腺X線圖像進(jìn)行評(píng)估,有效降低醫(yī)生閱片的壓力以及不同醫(yī)生之間診斷的差異,從而提高乳腺癌診斷的效率和準(zhǔn)確率,使更多的患者得以早發(fā)現(xiàn)、早治療,進(jìn)而降低患者的死亡率。
在未來(lái),隨著深度學(xué)習(xí)理論研究的不斷深入,可以對(duì)深度學(xué)習(xí)的高級(jí)語(yǔ)義特征進(jìn)行更具體的分析,加上獲取到大規(guī)模的高質(zhì)量數(shù)據(jù)集,利用先進(jìn)的網(wǎng)絡(luò)模型對(duì)病變的檢測(cè)和分類診斷性能會(huì)有大幅度的提升。因此,應(yīng)用人工智能技術(shù)的醫(yī)學(xué)圖像分析與診斷,特別是乳腺X線計(jì)算機(jī)輔助診斷技術(shù)具有廣闊的發(fā)展空間和研究?jī)r(jià)值,需要科研人員繼續(xù)探索和努力。