陳 皓 李 廣 劉 洋 強(qiáng)永乾
①(西安郵電大學(xué)計(jì)算機(jī)學(xué)院 西安 710121)
②(陜西省網(wǎng)絡(luò)數(shù)據(jù)分析與智能處理重點(diǎn)實(shí)驗(yàn)室 西安 710121)
③(西安交通大學(xué)第一附屬醫(yī)院 西安 710061)
腦膠質(zhì)瘤是一種常見(jiàn)的,致死率較高的腦部腫瘤[1],呈彌漫、浸潤(rùn)性生長(zhǎng),腫瘤邊界不清晰。此外,腦膠質(zhì)瘤生長(zhǎng)速度快,初發(fā)時(shí)沒(méi)有明顯的臨床癥狀,但是病情進(jìn)展較快,大約只有5%的腦膠質(zhì)瘤患者具有5年以上的生存期[2],這使得對(duì)腦膠質(zhì)瘤的早期檢測(cè)及病灶形態(tài)識(shí)別在臨床診斷和治療方案的選擇中具有價(jià)值。磁共振成像(Magnetic Resonance Imaging, MRI)是目前主要的腦膠質(zhì)瘤診斷工具。MRI能夠無(wú)創(chuàng)地對(duì)腦組織進(jìn)行成像,為臨床提供病灶的定位和定性信息。目前主要依靠醫(yī)師肉眼對(duì)MR圖像中的腫瘤組織進(jìn)行識(shí)別,需時(shí)長(zhǎng)效率低,且目前國(guó)內(nèi)各大醫(yī)院影像診斷經(jīng)驗(yàn)豐富的醫(yī)師相對(duì)比較缺乏。因此,利用機(jī)器學(xué)習(xí)技術(shù)來(lái)幫助醫(yī)師降低工作強(qiáng)度,同時(shí)提高醫(yī)學(xué)影像中腫瘤的識(shí)別效率和病灶分割準(zhǔn)確率就具有了較高的臨床應(yīng)用價(jià)值。
傳統(tǒng)的腦膠質(zhì)瘤檢測(cè)方法大都采用一種基于特征進(jìn)行分類(lèi)的思想。如Sachdeva等人[3]在每個(gè)圖像的感興趣區(qū)域中選擇紋理、強(qiáng)度和局部二值模式特征,采用PCA進(jìn)行降維并使用人工神經(jīng)網(wǎng)絡(luò)進(jìn)行腦膠質(zhì)瘤檢測(cè)。Soltaninejad等人[4]將預(yù)處理后的圖像劃分成尺寸和強(qiáng)度值大致類(lèi)似的不規(guī)則補(bǔ)丁,對(duì)每個(gè)補(bǔ)丁計(jì)算特征,并采用極端隨機(jī)樹(shù)對(duì)腫瘤圖像和非腫瘤圖像進(jìn)行分類(lèi)。Song等人[5]從圖像中提取灰度共生矩陣、定向梯度直方圖、局部二值模式和強(qiáng)度等混合特征,并通過(guò)核支持向量機(jī)進(jìn)行腦膠質(zhì)瘤檢測(cè)。上述方法中往往引入了濾波器或者使用了單一的特征集合,濾波器可能導(dǎo)致分類(lèi)器分類(lèi)性能不佳[5],同時(shí)單一特征集合無(wú)法提供足夠的信息,導(dǎo)致訓(xùn)練模型存在欠擬合的風(fēng)險(xiǎn)。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,基于CNN的方法在腫瘤檢測(cè)中也得到了廣泛的應(yīng)用。Cao等人[6]采用深度學(xué)習(xí)方法在超聲圖像中進(jìn)行乳腺腫瘤的檢測(cè)。Shkolyar等人[7]提出了CystoNet用于膀胱腫瘤檢測(cè)。?zyurt等人[8]基于具有超分辨率的模糊C均值和極限學(xué)習(xí)機(jī)提出了一種卷積神經(jīng)網(wǎng)絡(luò)模型用于腦腫瘤檢測(cè)?;贑NN的腫瘤檢測(cè)方法步驟簡(jiǎn)潔,省去了手動(dòng)提取特征的步驟,結(jié)合CNN自身的優(yōu)勢(shì),相比傳統(tǒng)檢測(cè)方法提高了腫瘤檢測(cè)的效率。
與此同時(shí),基于CNN的醫(yī)學(xué)圖像分割方法也取得了顯著成果。Kumar等人[9]通過(guò)全卷積網(wǎng)絡(luò)進(jìn)行腦膠質(zhì)瘤的分割和分類(lèi)。Zhao等人[10]將全卷積網(wǎng)絡(luò)和條件隨機(jī)場(chǎng)整合到一個(gè)框架中用于腦膠質(zhì)瘤分割。Yang等人[11]提出了一種基于U-Net的自動(dòng)化腦膠質(zhì)瘤分割方法。CNN的優(yōu)勢(shì)在于它可以自然地從MR圖像中進(jìn)行特征提取,并將這些特征組合后用于腦膠質(zhì)瘤分割。雖然基于深度學(xué)習(xí)的分割方法非常有效,但是這類(lèi)方法包含大量超參數(shù)和顯著的內(nèi)存與計(jì)算需求。更重要的是CNN類(lèi)方法對(duì)圖像中一定范圍內(nèi)的紋理特征更為敏感,對(duì)紋理較模糊的組織邊界區(qū)域則不易實(shí)現(xiàn)多種組織的分類(lèi)。此外,基于集成學(xué)習(xí)(Ensemble Learning, EL)的方法也有了進(jìn)一步的發(fā)展。Amiri等人[12]提出了一種基于樹(shù)的集成分類(lèi)器用于自動(dòng)化的腦膠質(zhì)瘤分割。Mudgal等人[13]基于XGBoost模型開(kāi)發(fā)了一個(gè)自動(dòng)化腦膠質(zhì)瘤分割系統(tǒng)。隨機(jī)森林比其它常見(jiàn)的機(jī)器學(xué)習(xí)方法具有更高的預(yù)測(cè)精度[14],Rajagopal等人[15]使用優(yōu)化的蟻群特征訓(xùn)練了一個(gè)權(quán)重隨機(jī)森林分類(lèi)器用于腦膠質(zhì)瘤的檢測(cè)和分割。隨機(jī)森林等集成學(xué)習(xí)方法在處理具有高維特征的多分類(lèi)問(wèn)題時(shí)具有天然的優(yōu)勢(shì)。但這類(lèi)方法的結(jié)果與特征提取的數(shù)量和質(zhì)量密切相關(guān)。而且上述方法所使用的特征集結(jié)構(gòu)和提取方法依然單一。
顯然,特征集的質(zhì)量對(duì)組織分類(lèi)和邊界分割的結(jié)果有直接影響。在處理與醫(yī)學(xué)圖像相關(guān)的問(wèn)題時(shí),現(xiàn)有的方法大都使用影像組學(xué)特征。如Cho等人[16]基于直方圖、形狀和灰度共生矩陣提取影像組學(xué)特征進(jìn)行腦膠質(zhì)瘤的良惡性分類(lèi)。Chaddad等人[17]提出了一組新穎的影像組學(xué)特征,通過(guò)聯(lián)合強(qiáng)度矩陣將標(biāo)準(zhǔn)灰度共生矩陣推廣到多序列圖像中進(jìn)行腦膠質(zhì)瘤患者的生存期預(yù)測(cè)。影像組學(xué)特征能夠表達(dá)圖像中的隱藏信息并進(jìn)行量化,但是影像組學(xué)特征對(duì)圖像全局信息表達(dá)能力不足,同時(shí)過(guò)濾噪聲能力較弱,如在計(jì)算影像組學(xué)特征時(shí)對(duì)包含偽影、空腔和骨頭等結(jié)構(gòu)的信息需要進(jìn)行特殊處理。CNN本身就是一個(gè)性能優(yōu)良的特征提取器,并能夠獲得全局性的高階特征,如羅會(huì)蘭等人[18]利用帶擴(kuò)張卷積的深度殘差網(wǎng)絡(luò)進(jìn)行特征提取。Kido等人[19]通過(guò)局部區(qū)域的CNN特征進(jìn)行肺部異常檢測(cè)。CNN可以通過(guò)多層非線性機(jī)制自動(dòng)地獲得高階抽象特征,這類(lèi)特征對(duì)物體的位置和大小等不敏感。但是通過(guò)卷積得到的特征圖分辨率較低,且丟失了原圖中很多底層的細(xì)節(jié)信息。綜上可見(jiàn),任何一類(lèi)特征提取方式都有其優(yōu)勢(shì)和局限性。
以CNN為基礎(chǔ)的方法能夠直接從圖像中獲得信息用于決策,在處理醫(yī)學(xué)圖像時(shí),這種端到端的處理模式具有相對(duì)較高的計(jì)算效率,但是這類(lèi)方法在前向傳播時(shí)通常需要相對(duì)較大的存儲(chǔ)和計(jì)算資源;EL類(lèi)方法的可解釋性相對(duì)較強(qiáng)且基于像素分類(lèi)的分割過(guò)程具有更好的圖像細(xì)節(jié)識(shí)別能力,但對(duì)特征提取的質(zhì)量和數(shù)量依賴度高。顯然,在單一的計(jì)算模式下很難同時(shí)突出處理的效率和準(zhǔn)確率。為了更有效地平衡二者間的關(guān)系,本文提出了一種兩階段計(jì)算方法,首先采用CNN模型從海量的圖像中快速篩查出包含病灶的圖像,再通過(guò)像素級(jí)的集成分類(lèi)過(guò)程對(duì)病灶區(qū)域進(jìn)行精細(xì)化分割。本文的主要貢獻(xiàn)包括:
(1) 設(shè)計(jì)了一個(gè)輕量級(jí)的卷積神經(jīng)網(wǎng)絡(luò)(LocNet)在大量MR圖像中實(shí)現(xiàn)包含腦膠質(zhì)瘤圖像的快速篩檢和大致定位。LocNet提高了整體計(jì)算速度,輕量化的網(wǎng)絡(luò)設(shè)計(jì)降低了對(duì)計(jì)算資源的要求,為實(shí)際應(yīng)用提供了條件。此外,腫瘤的大致定位也有助于縮小腫瘤組織邊界分割的計(jì)算范圍。
(2) 嘗試從影像組學(xué)和CNN兩個(gè)角度分別提取特征,再通過(guò)特征融合來(lái)構(gòu)造表達(dá)更為豐富的特征向量集合。
(3) 針對(duì)腫瘤和正常組織相互浸潤(rùn)的邊界區(qū)域,在提取此區(qū)域中像素點(diǎn)的特征時(shí),提取以目標(biāo)像素點(diǎn)為中心的一個(gè)較小鄰域內(nèi)的信息來(lái)構(gòu)成此像素點(diǎn)的特征向量。通過(guò)考量像素點(diǎn)及其鄰域的相互關(guān)聯(lián)性,實(shí)現(xiàn)了對(duì)邊界較為模糊區(qū)域的病灶分類(lèi)及邊界分割。
本文的主要內(nèi)容組織如下:第2節(jié)詳細(xì)介紹本文提出的兩階段腦膠質(zhì)瘤檢測(cè)和分割方法;第3節(jié)進(jìn)行實(shí)驗(yàn)并對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行分析;第4節(jié)是對(duì)本文工作的總結(jié)。
本研究認(rèn)為有效解決在MR圖像中檢測(cè)腦膠質(zhì)瘤并進(jìn)行病灶組織分割的關(guān)鍵在于平衡整體計(jì)算效率和分割準(zhǔn)確率間的關(guān)系。前述相關(guān)研究顯示,基于CNN的相關(guān)方法具有更高的計(jì)算效率,而基于集成學(xué)習(xí)的相關(guān)方法則具有更佳的模糊分類(lèi)性能。針對(duì)這一規(guī)律,本文提出了一種兩階段計(jì)算方法,其主要流程如圖1所示。在第1階段中,首先對(duì)輸入的MR圖像進(jìn)行網(wǎng)格化處理,并利用一個(gè)輕量級(jí)的網(wǎng)絡(luò)(LocNet)快速檢測(cè)每個(gè)網(wǎng)格中是否存在腫瘤組織。這一過(guò)程也同時(shí)實(shí)現(xiàn)了腫瘤的大體定位;在第2階段中,首先融合影像組學(xué)特征和CNN提取的高階抽象特征構(gòu)造表達(dá)更有效的特征集,再基于該特征集通過(guò)集成學(xué)習(xí)方法來(lái)實(shí)現(xiàn)不同病灶組織邊界的分 割。
為了提高腫瘤檢測(cè)及定位速度,本文先將MR圖像進(jìn)行網(wǎng)格化處理,再依次將網(wǎng)格輸入LocNet進(jìn)行識(shí)別計(jì)算及分類(lèi)標(biāo)記。其流程如圖1中藍(lán)色虛線框所示。該方法共有3個(gè)步驟,具體步驟為:
步驟1 MR圖像包含F(xiàn)lair, T1, T1增強(qiáng)(T1+c)和T2 4個(gè)圖像序列。首先對(duì)MR圖像進(jìn)行網(wǎng)格化處理,將Flair, T1, T1+c和T2劃分成大小為gl×gl的網(wǎng)格。
步驟2 采用 gl/2為步長(zhǎng)在網(wǎng)格圖像中進(jìn)行遍歷,將每次的遍歷結(jié)果輸入LocNet,則輸入LocNet的子圖集合可表示為
其中每個(gè)子圖的大小均為 gl×gl,n為輸入LocNet的子圖集合數(shù)量。
步驟3 將 Pi輸入LocNet計(jì)算并輸出其所屬類(lèi)別 cl。 cl為1表示存在腫瘤組織,否則為0。在檢測(cè)過(guò)程中采用與MR圖像網(wǎng)格化結(jié)構(gòu)相同的矩陣Mask 記錄每個(gè)Pi的標(biāo)記信息其中, loc(Pi) 表示LocNet對(duì)Pi進(jìn)行分類(lèi)的結(jié)果。MaskPi的標(biāo)記結(jié)果將在邊界分割中使用。
圖1 兩階段計(jì)算方法
為對(duì)網(wǎng)格化的MR圖像進(jìn)行處理,LocNet采用了一種雙通道結(jié)構(gòu),如圖2所示,具體信息如下:
(1) LocNet結(jié)構(gòu)。兩個(gè)通道的輸入均為4×gl×gl。通道A由13×13的卷積核和丟棄率為0.5的Dropout層組成,使用大的卷積核保證模型具有大的感受野,獲得豐富的圖像信息。通道B由典型的網(wǎng)絡(luò)結(jié)構(gòu)組成,通道B使用了多個(gè)小的卷積核,以保證模型能夠獲得圖像的細(xì)節(jié)信息。在融合通道中,首先將通道A和通道B得到的特征圖進(jìn)行合并,然后通過(guò)卷積層和全連接層進(jìn)行特征圖融合,最終得到分類(lèi)結(jié)果。
(2) 訓(xùn)練細(xì)節(jié)。訓(xùn)練LocNet時(shí),根據(jù)訓(xùn)練數(shù)據(jù)集中的Ground-Truth將MR圖像劃分為腫瘤區(qū)域和非腫瘤區(qū)域。隨機(jī)地從腫瘤區(qū)域和非腫瘤區(qū)域中采樣4×gl×gl的矩形塊作為訓(xùn)練樣本,并給訓(xùn)練樣本加上相應(yīng)的標(biāo)簽。訓(xùn)練時(shí)取批訓(xùn)練樣本數(shù)為16,訓(xùn)練輪次為20,使用Adam優(yōu)化器,其學(xué)習(xí)率為0.005,衰減系數(shù)為0.1,動(dòng)量為0.9。在訓(xùn)練集中隨機(jī)采樣1500張大小為 4 ×gl×gl的正樣本和負(fù)樣本,在上述 參數(shù)下的訓(xùn)練準(zhǔn)確率為0.988。
在 M ask 記錄的基礎(chǔ)上,對(duì)標(biāo)記為1的網(wǎng)格區(qū)域進(jìn)行合并,并在該區(qū)域內(nèi)進(jìn)行病灶組織分類(lèi)及邊界分 割。
2.2.1 多維特征提取
為了提高特征集的有效性,本文采用了一種多層次特征提取方法。該方法主要有4個(gè)步驟,具體內(nèi)容如下:
步驟 1 在Flair, T1, T1+c和T2中分別進(jìn)行影像組學(xué)特征提取,所提取的影像組學(xué)特征包括1階統(tǒng)計(jì)特征(如均值、標(biāo)準(zhǔn)差、峰度和偏度等15維特征)和2階紋理特征(如灰度共生矩陣、局部二值模式和方向梯度直方圖等89維特征)共104維,記為fFla, fT1, fT1c和fT2。
步驟 2 將Flair, T1, T1+c和T2組合成4通道圖像,通過(guò)CNN特征提取器完成MR圖像的高階特征提取。如圖3所示,本文所采用的特征提取器使用了文獻(xiàn)[20]中的CNN結(jié)構(gòu),該特征提取器專(zhuān)為小的局部圖像區(qū)域的特征提取所設(shè)計(jì)。此步驟共提取了128維CNN特征。
步驟 3 將4個(gè)圖像序列上提取的影像組學(xué)特征進(jìn)行合并,如式(3)所示
合并影像組學(xué)特征和CNN特征形成一個(gè)544維的特征集F,可表示為
步驟 4 特征選擇。采用L1正則化Lasso對(duì) F進(jìn)行 特征處理,產(chǎn)生了一個(gè)298維的特征集F′,見(jiàn)圖4。
2.2.2 病灶組織分類(lèi)和邊界分割
在集成學(xué)習(xí)方法中,病灶組織分割問(wèn)題被轉(zhuǎn)化為像素的特征分類(lèi)問(wèn)題。針對(duì)不同組織相互浸潤(rùn)的邊界區(qū)域,確定像素點(diǎn)的歸屬是一個(gè)模糊分類(lèi)問(wèn)題。本文提出的方法是考慮目標(biāo)像素點(diǎn)與其鄰域之間的關(guān)聯(lián)性來(lái)產(chǎn)生特征向量,這種方式可產(chǎn)生信息更為豐富的特征向量,相比于單獨(dú)的像素點(diǎn)特征或針對(duì)整張圖像產(chǎn)生的特征信息,更有利于對(duì)邊界較為模糊的組織間進(jìn)行分類(lèi)和邊界分割。
圖2 LocNet模型結(jié)構(gòu)
圖3 CNN特征提取
圖4 特征的多層次融合約簡(jiǎn)
這一過(guò)程的具體流程如圖5所示。首先,合并2.1節(jié)中M ask上標(biāo)記為1的連通區(qū)域,記錄每個(gè)合并區(qū)域的邊界坐標(biāo)(腫瘤區(qū)域粗定位結(jié)果)。若M ask記錄中存在k個(gè)合并區(qū)域,則第i個(gè)區(qū)域的邊界坐標(biāo)集合可表示為
此過(guò)程中的集成分類(lèi)器采用了XGBoost。其訓(xùn)練過(guò)程為:針對(duì)腫瘤周?chē)[區(qū)域、腫瘤非增強(qiáng)區(qū)域、腫瘤增強(qiáng)區(qū)域和正常組織4種類(lèi)別各提取了1000例數(shù)據(jù),每例數(shù)據(jù)包含298維特征向量和1維類(lèi)別標(biāo)簽。訓(xùn)練后得到的模型中包含了125棵基礎(chǔ)樹(shù)模型,每棵樹(shù)的最大深度為6,葉節(jié)點(diǎn)允許的最小樣本數(shù)為10,訓(xùn)練準(zhǔn)確率為0.928。
算法1 病灶組織分類(lèi)和邊界分割
輸入:{Li}
輸出:Seg
1. 初始化已遍歷坐標(biāo)點(diǎn)集合Ω =?;
2. for待計(jì)算區(qū)域的像素點(diǎn)下標(biāo)j :=1,2,···,m do
3. 根據(jù)下標(biāo) j 從Li中獲取第j 個(gè)坐標(biāo)點(diǎn)(xi,j,yi,j);
4. for 搜索方向的下標(biāo)t :=1,2,···,8 do
5. 根據(jù)t 從 D中 獲取遍歷方向θt;
6. while 搜索的像素點(diǎn)在腦區(qū)內(nèi) do
14. 結(jié)束本次while循環(huán),從下一個(gè)方向繼續(xù)搜索;
15. end if
16. end if
17. end while
18. end for 19. end for
圖5 病灶組織分類(lèi)與邊界分割
使用Brain Tumor Segmentation Challenge 2017(BraTS2017)數(shù)據(jù)集[21]對(duì)所提出的兩階段計(jì)算方法進(jìn)行驗(yàn)證。BraTS2017數(shù)據(jù)集包含了285例經(jīng)過(guò)手術(shù)證實(shí)的腦膠質(zhì)瘤患者,每例患者包含T1, T2,Flair和T1增強(qiáng)(T1+c)4組序列的圖像,每組序列的圖像包含155張大小為 2 40×240的斷層圖像。同時(shí)針對(duì)每例患者還提供了醫(yī)師的手工標(biāo)注(Ground-Truth),每個(gè)腫瘤被標(biāo)注為腫瘤周?chē)[區(qū)域(標(biāo)簽2)、腫瘤非增強(qiáng)區(qū)域(標(biāo)簽1)和腫瘤增強(qiáng)區(qū)域(標(biāo)簽4)3個(gè)類(lèi)別。在實(shí)驗(yàn)驗(yàn)證時(shí),用3種標(biāo)簽的組合結(jié)果進(jìn)行評(píng)估,分別為整體腫瘤區(qū)(Whole Tumor,WT)(包含了標(biāo)簽1、標(biāo)簽2和標(biāo)簽4)、腫瘤核(Tumor Core, TC)(包含了標(biāo)簽1和標(biāo)簽4)和腫瘤增強(qiáng)區(qū)(Enhancing Tumor, ET)(包含了標(biāo)簽4)。
本文所采用的實(shí)驗(yàn)環(huán)境為Inter? Core(i5)2.3 GHz CPU, 8 GB RAM和英偉達(dá)DGX-1(包含了8塊Tesla V100 GPU)(128 GB RAM),搭建LocNet模型時(shí)使用的框架為Keras2.2.4,實(shí)驗(yàn)所有的代碼使用Python3.6實(shí)現(xiàn)。此外,實(shí)驗(yàn)中腫瘤檢測(cè)階段的網(wǎng)格大小為gl=26,精細(xì)化分割階段的采樣鄰域大小gs=10。
從原始數(shù)據(jù)集中生成10000組MR圖像,每組MR圖像包含F(xiàn)lair, T1, T1+c, T2和Ground-Truth等5個(gè)部分。采用5折交叉驗(yàn)證對(duì)模型效果進(jìn)行評(píng)估。為了對(duì)分割結(jié)果進(jìn)行量化評(píng)價(jià),本文使用Dice系數(shù)、靈敏度和特異性(Specificity)來(lái)衡量分割結(jié)果 的優(yōu)劣性。
表1為實(shí)驗(yàn)獲得的Dice系數(shù)、靈敏度和特異性等指標(biāo)的統(tǒng)計(jì)結(jié)果。由表1可以看出,針對(duì)WT,TC和ET區(qū)域,Dice系數(shù)、靈敏度和特異性3個(gè)指標(biāo)的平均值均在0.8以上,其中,特異性的結(jié)果最好,平均值均接近1并且其標(biāo)準(zhǔn)差都小于0.01,表明分割結(jié)果的誤檢率低。同時(shí),結(jié)合均值和標(biāo)準(zhǔn)差可以發(fā)現(xiàn)本文方法的分割結(jié)果較為穩(wěn)定,8個(gè)評(píng)價(jià)指標(biāo)的離散程低于0.1,表明本文提出的方法能夠完成精細(xì)化的腫瘤分割任務(wù)。
圖6是采用本文所提出的方法進(jìn)行腫瘤精細(xì)化分割的部分結(jié)果,圖6(a)-圖6(d)為4個(gè)典型病例,分別代表了不同大小、形狀和位置的腫瘤。圖中的第1列和第2列是原始的Flair和T1+c圖像,第3列為Ground-Truth,第4列為本文方法的分割結(jié)果。將本文方法的分割結(jié)果和Ground-Truth進(jìn)行比較,在圖6(a)-圖6(d)中可以發(fā)現(xiàn)本文方法已能較準(zhǔn)確地分割出3類(lèi)腫瘤組織和彼此的邊界,清晰地刻畫(huà)出腫瘤輪廓和位置。此外,如圖6(b)所示,本文方法可將腫瘤內(nèi)部組織的壞死區(qū)域(腫瘤中的孔洞部分)很好地分割出來(lái)??梢暬Y(jié)果表明,針對(duì)不同形態(tài)的病例,本文提出的分割方法都具有較好的效果。
將本文的方法與近些年提出的一些典型方法進(jìn)行對(duì)比,如表2所示。其中,Chen等人[22]構(gòu)建了一種基于圖像塊的13層卷積神經(jīng)網(wǎng)絡(luò)用于腦膠質(zhì)瘤分割。Wang等人[23]提出了一個(gè)級(jí)聯(lián)的全卷積網(wǎng)絡(luò),將多分類(lèi)問(wèn)題分解為3個(gè)二分類(lèi)網(wǎng)絡(luò)。Islam等人[24]將Flair, T1和T1+c輸入到VGG-16中提取像素的描述符并送入多層感知機(jī)進(jìn)行非線性優(yōu)化。Zhou等人[25]提出了一種基于補(bǔ)丁的卷積神經(jīng)網(wǎng)絡(luò)對(duì)腦區(qū)的所有像素進(jìn)行分類(lèi),并通過(guò)條件隨機(jī)場(chǎng)優(yōu)化分割結(jié)果。
從表2中可看出本方法對(duì)ET的分割結(jié)果均優(yōu)于其它方法,說(shuō)明本文提出的方法可以有效識(shí)別腫瘤增強(qiáng)區(qū)。本方法在WT和TC上的平均Dice系數(shù)分別為0.882和0.846,優(yōu)于文獻(xiàn)[22]和文獻(xiàn)[25],表明本文的方法可以較為準(zhǔn)確地分割出腫瘤輪廓。本方法在WT和TC上的平均靈敏度系數(shù)分別為0.922和0.904,優(yōu)于文獻(xiàn)[22]、文獻(xiàn)[23]和文獻(xiàn)[24],說(shuō)明本文提出的方法具有較低的漏檢率。文獻(xiàn)[24]中采用了一種像素級(jí)的分類(lèi)方法對(duì)圖像中的4種腫瘤組織進(jìn)行分類(lèi),這種方法有助于提高整體識(shí)別精度,但
是對(duì)每個(gè)像素進(jìn)行特征提取時(shí)需要較大的計(jì)算開(kāi)銷(xiāo)。本文的方法在LocNet產(chǎn)生的可疑區(qū)域中進(jìn)行像素分類(lèi),這種方法在TC和ET上取得了較好的效果。尤其當(dāng)需要處理的圖像較多時(shí),在保證一定準(zhǔn)確率的同時(shí)可以顯著提高整體效率。但代價(jià)是LocNet在僅含極少量瘤周水腫組織的邊界區(qū)域存在一定的識(shí)別誤差,導(dǎo)致疑似區(qū)域未覆蓋少量腫瘤組織的邊界區(qū)域,一定程度上影響了WT的評(píng)分結(jié)果。
表1 實(shí)驗(yàn)統(tǒng)計(jì)結(jié)果
圖6 典型病例分割結(jié)果
表2 實(shí)驗(yàn)結(jié)果對(duì)比
同時(shí),本文采用雷達(dá)圖將本文方法和文獻(xiàn)[22-25]中的方法進(jìn)行整體比較。如圖7所示,從圖中可以看出,本文提出的方法雖然在個(gè)別指標(biāo)上并沒(méi)有達(dá)到最佳,比如在Dice-WT和Dice-TC上略低于文獻(xiàn)[24],但是綜合9個(gè)指標(biāo)的評(píng)價(jià)結(jié)果來(lái)看,本文提出的方法在圖7中所占的面積最大,說(shuō)明本文提出方法的整體效果優(yōu)于上述方法。
另外,為了驗(yàn)證本方法對(duì)計(jì)算效率和準(zhǔn)確率的平衡效果,采用隨機(jī)森林(RF)、XGBoost和U-Net進(jìn)行了對(duì)比實(shí)驗(yàn),并將上述方法的計(jì)算效率和準(zhǔn)確率與本文方法進(jìn)行了比較。從表3中可以看出,基于U-Net對(duì)圖像進(jìn)行整體分割所需的計(jì)算時(shí)間最短,但是分割精度相較其它方法整體較低。相反,由于RF和XGBoost采用和本文方法相同的特征向量,其分割準(zhǔn)確率只略低于本文的方法,但其整體需時(shí)明顯更長(zhǎng)。顯然,本文的方法在分割效率和分割精度之間達(dá)到了更佳的平衡。
3.3.1 特征結(jié)構(gòu)效果分析
為了衡量影像組學(xué)特征與CNN特征的融合效果,本文分別對(duì)416維影像組學(xué)特征(Radiomics)、128維CNN特征(CNN)和298維融合特征(CNN +Radiomics)進(jìn)行聚類(lèi),并采用調(diào)整互信息(Adjusted-Mutual-Information, AMI)、均一性(Homogeneity)和V-Measure系數(shù)評(píng)價(jià)聚類(lèi)結(jié)果,其中,3種評(píng)價(jià)系數(shù)都采用真實(shí)標(biāo)簽進(jìn)行計(jì)算,評(píng)價(jià)系數(shù)的數(shù)值越大表明聚類(lèi)效果越好。如圖8所示表示3組特征集的聚類(lèi)結(jié)果,其中0, 1, 2和4分別表示正常組織、水腫、非增強(qiáng)和增強(qiáng)區(qū)域。表4表示對(duì)3組聚類(lèi)效果的評(píng)價(jià)結(jié)果。結(jié)合圖8和表4的結(jié)果可以發(fā)現(xiàn),融合后的特征集合聚類(lèi)效果更加明顯,不同類(lèi)簇之間的邊界清晰并且同一類(lèi)簇內(nèi)聚性高,同時(shí)從聚類(lèi)評(píng)價(jià)指標(biāo)中也可以看出融合特征集合的AMI、均一性和V-Measure分別為0.4796, 0.4798和0.4816,均高于其它兩個(gè)單一特征集合的聚類(lèi)結(jié)果。實(shí)驗(yàn)表明融合后的特征集合能夠提高不同病灶組織的區(qū)分性。
3.3.2 特征規(guī)模效果分析
為了觀察特征集約簡(jiǎn)效果對(duì)分類(lèi)準(zhǔn)確率的影響,本文設(shè)置了不同閾值來(lái)產(chǎn)生不同結(jié)構(gòu)的特征集。實(shí)驗(yàn)結(jié)果如圖9所示。從圖9中可以看出,在整個(gè)閾值跨度內(nèi),特征維度越高,模型分類(lèi)準(zhǔn)確率整體相對(duì)越高。但當(dāng)閾值在0~0.3范圍內(nèi)時(shí),特征維度的增加會(huì)使分類(lèi)準(zhǔn)確率略有下降。雖然,特征維度越高,特征集合包含的有效特征越多,越有利于分類(lèi)器做決策。但是,部分特征的干擾也會(huì)導(dǎo)致模型準(zhǔn)確率的降低。可見(jiàn),特征選擇對(duì)保證模型準(zhǔn)確率具有很大的積極作用。
3.3.3 網(wǎng)格大小與運(yùn)算效率和準(zhǔn)確率的關(guān)系
圖7 分割結(jié)果對(duì)比圖
表3 實(shí)驗(yàn)效率對(duì)比
圖8 3組特征集合聚類(lèi)結(jié)果
表4 3組特征聚類(lèi)結(jié)果的評(píng)價(jià)結(jié)果
在腫瘤檢查階段,網(wǎng)格的大小 gl是一個(gè)影響檢測(cè)速度和定位精度的關(guān)鍵參數(shù)。如果 gl選取過(guò)小,則整個(gè)網(wǎng)格中包含的有效信息太少,對(duì)周?chē)畔⒌母兄粔?,無(wú)法準(zhǔn)確地區(qū)分腫瘤和非腫瘤區(qū)域。相反, gl選取越大則網(wǎng)格內(nèi)包含的信息越多,混入噪聲的概率也就越大,這并不利于準(zhǔn)確識(shí)別腫瘤。同時(shí),網(wǎng)格的大小對(duì)檢測(cè)速度也有一定的影響, gl越小,整張圖像所劃分成的網(wǎng)格數(shù)量越大,計(jì)算次數(shù)也就越多,反之亦然。圖10表示網(wǎng)格大小對(duì)定位速度和準(zhǔn)確率的影響,其中定位準(zhǔn)確率采用定位框和實(shí)際腫瘤區(qū)域的Dice系數(shù)衡量。從中可以發(fā)現(xiàn),網(wǎng)格越大,需時(shí)越少,但檢查精度越低,反之亦然。通過(guò)對(duì)網(wǎng)格的大小進(jìn)行搜索,當(dāng)網(wǎng)格大小gl=26時(shí)模 型的定位速度和準(zhǔn)確率相對(duì)較優(yōu)。
3.3.4 采樣鄰域大小與運(yùn)算效率和準(zhǔn)確率的關(guān)系
采樣鄰域的大小 gs直接影響特征提取的結(jié)果,而特征決定了最終的分割結(jié)果。如果gs過(guò)大,則鄰域中包含過(guò)多其它組織,導(dǎo)致特征提取結(jié)果不準(zhǔn)確,增加分類(lèi)誤差。如果 gs過(guò)小,鄰域中提取的特征信息量不足,不具有普遍的統(tǒng)計(jì)意義。同時(shí)gs的大小也會(huì)對(duì)計(jì)算量產(chǎn)生影響。 gs越大鄰域中包含的像素點(diǎn)也就越多,提取特征時(shí)計(jì)算量也就越大,反之亦然。如圖11所示為 gs對(duì)分割結(jié)果和計(jì)算量的影響,其中分割結(jié)果為WT, TC和EC三者的平均Dice系數(shù),計(jì)算量采用針對(duì)鄰域進(jìn)行特征提取、特征組合、特征選擇和分類(lèi)所用的時(shí)間進(jìn)行衡量。從圖11可以發(fā)現(xiàn),隨著鄰域的增大,特征提取和融合所需要的時(shí)間逐步增大,分割結(jié)果的Dice系數(shù)先增大再逐漸降低,當(dāng)采樣鄰域大小在10左右時(shí)分割效果最好,既保證了鄰域中提取特征的有效性,又保證了特征提取、融合和篩選所用時(shí)間相對(duì)較優(yōu)。
圖9 不同特征數(shù)量對(duì)分類(lèi)準(zhǔn)確率的影響
圖10 網(wǎng)格大小對(duì)定位結(jié)果的影響
圖11 鄰域大小對(duì)精細(xì)化分割的影響
為了平衡腦膠質(zhì)瘤識(shí)別和病灶分割中的效率與準(zhǔn)確率,本文提出了一種兩階段計(jì)算方法。首先,對(duì)多序列MR圖像進(jìn)行網(wǎng)格化處理,再利用LocNet進(jìn)行識(shí)別運(yùn)算。相比于傳統(tǒng)方法,本文提出的方法可以顯著提高腫瘤識(shí)別效率,在處理大規(guī)模MR圖像時(shí)具有一定實(shí)用性。在組織分割階段,LocNet實(shí)現(xiàn)了腫瘤的大致定位,有效壓縮了分割計(jì)算的范圍。同時(shí)將影像組學(xué)特征和CNN特征進(jìn)行融合,生成了更為精簡(jiǎn)有效的特征集?;谠撎卣骷募蓪W(xué)習(xí)過(guò)程提高了整體的病灶組織分類(lèi)和邊界分割準(zhǔn)確率。為驗(yàn)證此方法,在BraTS2017數(shù)據(jù)集上進(jìn)行測(cè)試,同時(shí)與近年相關(guān)文獻(xiàn)中的算法進(jìn)行了對(duì)比。結(jié)果顯示,本文所提出的方法具有較高的整體準(zhǔn)確率。最后,討論了本文所采用的特征融合和選擇方法以及兩個(gè)重要參數(shù)的選取與計(jì)算效率和準(zhǔn)確率間的關(guān)系。