趙 欣,石德來,王洪凱
(1.大連大學(xué)信息工程學(xué)院,遼寧 大連 116622; 2.大連理工大學(xué)生物醫(yī)學(xué)工程學(xué)院,遼寧 大連 116024)
腦白質(zhì)病變通常在核磁共振成像(Magnetic Resonance Images, MRI)的T2液體衰減反轉(zhuǎn)恢復(fù)序列(Fluid-attenuated Inversion Recovery, FLAIR)影像上表現(xiàn)為高信號(hào),因此,又稱腦白質(zhì)高信號(hào)(White Matter Hyperintensities, WMH)。該病變常見于老年人的大腦中,并與各種神經(jīng)性疾病緊密相關(guān)。目前的研究表明,小血管疾病[1]、多發(fā)性硬化癥[2]、帕金森病[3]、中風(fēng)[4]、阿爾茲海默病[5]和癡呆癥[6]等均會(huì)導(dǎo)致WMH。因此,對(duì)WMH的研究已成為診斷和治療神經(jīng)性疾病患者的關(guān)鍵因素。
由于WMH的分布不均勻,大小不一致,導(dǎo)致很多小的病變區(qū)域很難被分割。同時(shí),在MRI成像過程中,WMH會(huì)受到信號(hào)不均勻、噪聲等的干擾導(dǎo)致分割結(jié)果不精確。因此,WMH的檢測(cè)仍然是一個(gè)困難的過程。由于數(shù)據(jù)集和評(píng)估標(biāo)準(zhǔn)的多樣性,對(duì)WMH自動(dòng)分割結(jié)果的評(píng)估比較困難,通常以DSC系數(shù)(Dice Similarity Coefficient)來衡量,當(dāng)DSC系數(shù)高于0.7時(shí),該方法被認(rèn)為是好的[7]。
目前針對(duì)WMH的分割方法主要包含以下3種:人工分割、基于機(jī)器學(xué)習(xí)的分割和基于深度學(xué)習(xí)的分割。由于大腦MRI成像包含很多切片,導(dǎo)致手動(dòng)的分割方法費(fèi)時(shí)費(fèi)力,而且容易出錯(cuò),基于機(jī)器學(xué)習(xí)的方法需要手動(dòng)地提取特征,但人們很難找到準(zhǔn)確的WMH特征,因此分割精度不高。近年來人們主要使用深度神經(jīng)網(wǎng)絡(luò)方法進(jìn)行圖像分割。
自2006年以來,Hinton等人[8]提出了深度學(xué)習(xí)方法,使得卷積神經(jīng)網(wǎng)絡(luò)在各種應(yīng)用中取得了巨大的成功,尤其是在視覺和語音處理的領(lǐng)域,引起了更多人研究深度學(xué)習(xí)的熱潮。在視覺領(lǐng)域,傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN)[9]的強(qiáng)大之處在于它的多層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)能夠自動(dòng)學(xué)習(xí)影像的深層特征,但人們?cè)谔幚韴D像時(shí)發(fā)現(xiàn)該網(wǎng)絡(luò)并不能定位空間位置信息。于是,Ghafoorian等人[10]將CNN用于WMH分割,提出了多種基于位置特征的深層CNN架構(gòu)。Akkus等人[11]對(duì)腦部MRI進(jìn)行定量分析。他們將網(wǎng)絡(luò)模型分為3類:按塊訓(xùn)練的CNN架構(gòu),按語義訓(xùn)練的CNN架構(gòu),以及級(jí)聯(lián)CNN架構(gòu)。Rachmadi等人[12]提出了一種將空間信息加入CNN網(wǎng)絡(luò)中的方法,該方法通過對(duì)MRI圖像的處理生成4個(gè)含有空間位置信息的的圖像,將4幅圖像和原始的MRI共同作為輸入,實(shí)驗(yàn)結(jié)果顯示,通過引入GSI(Global Spatial Information),解決了無法定位的問題,雖然CNN的性能相比傳統(tǒng)的機(jī)器學(xué)習(xí)算法要好很多,但其結(jié)果依然不能讓人滿意,尤其是在DSC上,只有0.5左右的結(jié)果,說明WMH分割在方法上還需要很大的改進(jìn)。
2015年Long等人[13]提出了FCN(Fully Convolutional Network)語義分割算法,通過跳躍結(jié)構(gòu)實(shí)現(xiàn)了全卷積神經(jīng)網(wǎng)絡(luò)在像素級(jí)上的端到端的訓(xùn)練,同時(shí)能還原像素在原圖中的位置,保留原始輸入圖像的空間信息,實(shí)現(xiàn)逐像素分類。同年,Ronneberger等人[14]提出了一種用于醫(yī)學(xué)圖像分割的全卷積網(wǎng)絡(luò)結(jié)構(gòu)2D U-net,它是一種對(duì)稱編碼器—解碼器的結(jié)構(gòu),該模型在實(shí)驗(yàn)中取得了較好的結(jié)果。但由于大腦圖像是三維結(jié)構(gòu),因此普遍采用2種方法分割3D數(shù)據(jù),其中一種方法是通過將3D數(shù)據(jù)拆分成多個(gè)2D切片,第二種方法是將模型改為3D模型。相比于第二種方法,使用2D切片會(huì)忽略相鄰切片的三維空間信息,降低分割精度。2016年Cicek等人[15]在U-net網(wǎng)絡(luò)中使用3D卷積核,但該網(wǎng)絡(luò)沒有高效地學(xué)習(xí)到MRI圖像的深層和淺層特征,導(dǎo)致結(jié)果不佳。2017年Xu等人[16]提出了一種基于FCN和遷移學(xué)習(xí)的腦白質(zhì)高信號(hào)的快速自動(dòng)分割方法,通過這種方法,在MRI圖像上進(jìn)行預(yù)處理并且分割WMH需要大約10 s。2018年,Wang等人[17]使用FCN的方法分割WMH,對(duì)于大的病變部位分割的DSC分?jǐn)?shù)可達(dá)0.8左右,但對(duì)于小的病變位置的DSC分?jǐn)?shù)只有0.65。2018年Zhang等人[18]提出了一種基于U-net的后處理技術(shù),對(duì)不同隨機(jī)初始化的U-net輸出進(jìn)行平均和閾值處理。這種方法與所用模型無關(guān),它可以應(yīng)用于其他的模型結(jié)構(gòu)。這種后處理方法可以提高WMH分割的準(zhǔn)確性。2019年,Wu等人[19]提出了一種新穎的跳躍連接U-net。該方法在預(yù)處理階段引入了基于圖集的方法,去除非腦組織,并在U-net模型的基礎(chǔ)之上加入跳躍連接,從而提高分割精度。2019年,Jeong等人[20]采用帶有膨脹卷積的U-net模型,通過膨脹卷積在MRI切片上學(xué)習(xí)更多的上下文信息,增強(qiáng)了網(wǎng)絡(luò)識(shí)別大塊WMH的概率。但分割精度只有0.56,說明基于深度學(xué)習(xí)的網(wǎng)絡(luò)結(jié)構(gòu)還有待進(jìn)一步的開發(fā)研究。
圖1 分割方法流程圖
本文方法的流程如圖1所示,首先對(duì)數(shù)據(jù)集進(jìn)行預(yù)處理,預(yù)處理主要包括數(shù)據(jù)增強(qiáng)、統(tǒng)一圖像大小和歸一化。將預(yù)處理后的圖像分為訓(xùn)練集、驗(yàn)證集和測(cè)試集。之后將訓(xùn)練集輸入本文的網(wǎng)絡(luò)中進(jìn)行訓(xùn)練,經(jīng)過下采樣和上采樣進(jìn)行前向傳播,得到的特征圖與標(biāo)簽數(shù)據(jù)用于計(jì)算損失函數(shù),然后反向傳播訓(xùn)練模型參數(shù),最后利用訓(xùn)練好的3D分割模型進(jìn)行模型測(cè)試,得到測(cè)試數(shù)據(jù)的分割結(jié)果。
1)存儲(chǔ)開銷很大。例如對(duì)某個(gè)像素所使用的圖像塊的大小為5×5,則所需的存儲(chǔ)空間為原來圖像的25倍。
2)由于相鄰的像素塊有大面積的重疊區(qū)域,在對(duì)每個(gè)像素塊逐個(gè)進(jìn)行卷積運(yùn)算時(shí)會(huì)多出很多重復(fù)的計(jì)算,導(dǎo)致計(jì)算效率低。
3)像素塊的大小限制了感知區(qū)域的大小。通常像素塊的大小比整幅圖像的大小小很多,因此每一個(gè)像素塊只能提取圖像的局部特征,從而導(dǎo)致分割的性能受到影響。
本文采用語義分割的網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行端到端的分割,相比于傳統(tǒng)CNN的區(qū)別在于沒有全連接層,將全連接層替換成卷積層,對(duì)圖像進(jìn)行逐像素分類,如圖2所示。本文采用的模型先進(jìn)行一次5×5×5卷積和2×2×2的池化,目的是為了降低信息維度,并擴(kuò)展感受野;之后依次連接殘差模塊、金字塔池化模塊和注意力模塊,這些模塊的整合可使網(wǎng)絡(luò)具有較強(qiáng)的學(xué)習(xí)能力,將模塊的輸出進(jìn)行2×2×2的上采樣和3×3×3的卷積;將得到的特征圖與第一次卷積池化后的特征圖進(jìn)行concat(拼接),通過拼接將低層特征和高層特征融合,使網(wǎng)絡(luò)學(xué)習(xí)上下文信息;最后通過sigmoid激活函數(shù)還原圖像大小并輸出分割圖像。
圖2 本文方法全卷積網(wǎng)絡(luò)結(jié)構(gòu)圖
隨著深度增加,網(wǎng)絡(luò)會(huì)出現(xiàn)一種退化現(xiàn)象,此時(shí)訓(xùn)練的準(zhǔn)確率會(huì)趨于平緩,但是訓(xùn)練誤差會(huì)變大。為了解決這種現(xiàn)象,殘差網(wǎng)絡(luò)(Residual Network, ResNet)[21]被提出。ResNet不再像傳統(tǒng)的CNN一樣使用多個(gè)堆疊的層直接進(jìn)行特征映射,而是引用了一種殘差映射,將輸入恒等映射到輸出,通過在殘差塊之間引入跳躍連接,使上一個(gè)殘差塊的信息沒有阻礙地流入下一個(gè)殘差塊,從而提高信息的流通,并避免梯度消失和梯度爆炸問題。
為此,本文在網(wǎng)絡(luò)中引入殘差方法,設(shè)計(jì)具有4個(gè)殘差塊的殘差網(wǎng)絡(luò),并在殘差塊的直連路徑中加入一個(gè)3D卷積,用于將輸入x調(diào)整為不同的尺寸,以便與主路徑輸出的數(shù)量和大小一致,如圖3所示。
圖3 殘差模塊圖
上述殘差塊中的卷積是在單一尺度下提取圖像特征,沒有充足的上下文信息和不同感受野下的全局信息。為了保證分割效果,需要讓網(wǎng)絡(luò)進(jìn)行多尺度的特征學(xué)習(xí)。為此,本文在殘差模塊后接入金字塔池化模塊,這一想法是受文獻(xiàn)[22]的啟發(fā),通過金字塔池化中的多個(gè)不同感受野大小的池化來提取不同尺度的圖像特征。
教師在進(jìn)行課外閱讀的引導(dǎo)時(shí),同樣也應(yīng)該注意方式方法。比如教師可以通過在課堂中帶領(lǐng)學(xué)生了解本文作者的人生經(jīng)歷,引導(dǎo)學(xué)生進(jìn)行課文的學(xué)習(xí),這樣學(xué)生會(huì)被激發(fā)起很高的學(xué)習(xí)興趣,在課下的時(shí)間,通過課下閱讀,了解該作者其他的作品,進(jìn)而通過對(duì)比,發(fā)現(xiàn)該作者的寫作風(fēng)格,拓展學(xué)生的語文知識(shí)面,讓學(xué)生對(duì)文學(xué)作品充滿興趣。或者讓學(xué)生通過讀書,舉行讀書交流會(huì),讓學(xué)生參與到其中,通過知識(shí)競(jìng)賽以及朗讀的方式,提高學(xué)生的閱讀興趣,進(jìn)一步提高學(xué)生的高中語文知識(shí)學(xué)習(xí)能力。
金字塔池化模塊的結(jié)構(gòu)如圖4所示。輸入的特征圖像首先經(jīng)過平均池化產(chǎn)生3個(gè)不同的特征圖像,池化率分別為2、4、8。采用平均池化而不采用常見的最大值池化是因?yàn)樽畲蟪鼗菫榱藴p少背景信息的影響,突出紋理特征,而本文接下來的模塊中采用的注意力機(jī)制可以起到同樣作用,因此不必在此處使用最大池化。此外,相比于最大池化,平均池化可以保留數(shù)據(jù)的整體特征,適合后續(xù)進(jìn)行進(jìn)一步的金字塔池化操作。隨后,將平均池化后產(chǎn)生的3個(gè)不同尺度的特征圖像分別送入3個(gè)并聯(lián)的卷積路徑進(jìn)行1×1×1的卷積以降低維度,然后分別進(jìn)行上采樣至原始輸入圖像大小,最后將3條路徑上的上采樣結(jié)果拼接在一起獲得多尺度融合特征。
圖4 金字塔池化模塊
注意力機(jī)制是由Bahdanau等人[23]提出的,它源于對(duì)人類視覺的研究。核心思想是,當(dāng)關(guān)注一幅圖片時(shí),人眼只會(huì)關(guān)注圖像的一部分而不是整張圖,也就是人的大腦對(duì)一幅圖片各個(gè)部分的注意力并不完全相同,而且只會(huì)關(guān)注感興趣的地方。注意力機(jī)制的提出有助于神經(jīng)網(wǎng)絡(luò)定位感興趣的目標(biāo),因此,本文在模型中加入了文獻(xiàn)[24]中提及的注意力模塊,以增強(qiáng)定位的準(zhǔn)確度,如圖5所示。該模塊包含2個(gè)并行的注意力子模塊:位置注意力模塊和通道注意力模塊。
圖5 雙路注意力模塊
位置注意力模塊通過所有位置特征的加權(quán)聚合實(shí)現(xiàn)特征更新。如圖5所示,先對(duì)A分別進(jìn)行不同大小的卷積得到B、C、D。B、C的維度為S×C×H×W,D的維度為S×C×H×W′。將B、C通過reshape變成H′×W大小(H′=S×C×H),再將B的轉(zhuǎn)置與C相乘得到H′×H′大小的矩陣,對(duì)于矩陣的每一個(gè)點(diǎn)進(jìn)行softmax,得到的矩陣圖為E,將D調(diào)整形狀變成H′×W′,再與E相乘并將形狀調(diào)整為S×C×H×W′的矩陣,再與A進(jìn)行相加得到最終的位置特征圖。這種方法的好處在于一方面可以通過不同的卷積學(xué)習(xí)不同大小的位置特征,另一方面,與B、C不同大小的特征圖D的加入可幫助網(wǎng)絡(luò)進(jìn)行反復(fù)的運(yùn)算,加強(qiáng)了位置特征的學(xué)習(xí)。如公式(1)和公式(2)所示,Sji指特征圖第j行第i列的元素,它等于B的第i列乘上C的第j列進(jìn)行softmax運(yùn)算,就是把得到的S按列求softmax運(yùn)算,再賦值給Sji;N為像素的數(shù)量;Di是D的第i列,a是訓(xùn)練參數(shù),也是自注意力參數(shù),起到自動(dòng)調(diào)節(jié)注意力機(jī)制的作用,將Sji與D的第i列相乘累加再乘以a,得到的值與A的第j列相加得到位置注意力模塊的最終結(jié)果向量PPAM。
(1)
(2)
通道注意力模塊通過注意力機(jī)制學(xué)習(xí)任意2個(gè)通道映射之間的關(guān)系,通過通道的加權(quán)求和更新通道。原文獻(xiàn)中采用RGB圖像作為網(wǎng)絡(luò)輸入,通過通道注意力機(jī)制學(xué)習(xí)RGB三通道間的映射關(guān)系。本文同樣采用通道注意力機(jī)制處理三維腦白質(zhì)病變數(shù)據(jù),該數(shù)據(jù)的每一層切片都對(duì)應(yīng)一個(gè)通道,通過通道注意力機(jī)制可加強(qiáng)通道(切片)間的上下文相互關(guān)聯(lián)。如圖5所示,將A進(jìn)行形狀調(diào)整轉(zhuǎn)換成H′×W′大小的特征圖B,將B轉(zhuǎn)置與B相乘,通過softmax再與B矩陣相乘,得到的特征圖調(diào)整到原始形狀,再與A相加得到通道特征圖。如公式(3)和公式(4)所示,Xji指特征圖第j行第i列的元素,它等于B的第i列乘上B的第j列再進(jìn)行softmax運(yùn)算,就是把得到的X按列求softmax運(yùn)算,再賦值給Xji;c為通道的數(shù)量;b是訓(xùn)練參數(shù),將Xji與B的第i列相乘累加再乘以b,得到的值與A的第j列相加得到通道注意力模塊的最終結(jié)果向量CCAM。
(3)
(4)
為了更好地利用注意力機(jī)制進(jìn)行特征的學(xué)習(xí),將子模塊的輸出分別進(jìn)行2次卷積運(yùn)算,然后將得到的特征圖逐元素相加實(shí)現(xiàn)特征的融合。
本文的數(shù)據(jù)集來自MICCAI2017挑戰(zhàn)賽,使用來自荷蘭和新加坡3家不同醫(yī)院的3臺(tái)不同掃描儀。3臺(tái)不同的掃描儀對(duì)應(yīng)3個(gè)數(shù)據(jù)集,每個(gè)數(shù)據(jù)集包含20幅MRI圖像,所有MRI圖像都經(jīng)過SPM12進(jìn)行的偏置場(chǎng)不均勻性校正。本文選擇帶有標(biāo)記信息的FLAIR圖像,其中,每個(gè)對(duì)象的FLAIR圖像都包含微小或更大的腦白質(zhì)病變區(qū)域。本文對(duì)數(shù)據(jù)集采取進(jìn)一步的預(yù)處理。首先通過數(shù)據(jù)增強(qiáng)來增加圖像的數(shù)量,數(shù)據(jù)增強(qiáng)采用旋轉(zhuǎn)變換、仿射變換和透視變換3種方法將原始的60幅圖像擴(kuò)增到240幅。考慮到不同掃描儀的FLAIR圖像大小不一致,本文對(duì)所有FLAIR圖像進(jìn)行裁剪和填充,將所有軸片統(tǒng)一為128×128的大小,這樣保證輸入網(wǎng)絡(luò)的圖像大小保持一致,并丟棄了邊緣的無用信息。其次,考慮到數(shù)據(jù)集中FLAIR圖像體素值不一樣,同時(shí)為了加快網(wǎng)絡(luò)的收斂,本文對(duì)數(shù)據(jù)集進(jìn)行歸一化,將原始數(shù)據(jù)取值轉(zhuǎn)化到[0,1]之間。為了在訓(xùn)練過程中調(diào)整參數(shù),并測(cè)試圖像分割的準(zhǔn)確率,本文將預(yù)處理后的240幅圖像分成3組:訓(xùn)練集、驗(yàn)證集和測(cè)試集。訓(xùn)練集占70%,測(cè)試集和驗(yàn)證集各占15%,因此,測(cè)試集共有168幅圖像,其中42個(gè)原始數(shù)據(jù),126個(gè)增強(qiáng)數(shù)據(jù);驗(yàn)證集和測(cè)試集一樣總共有36幅圖像,其中9個(gè)原始數(shù)據(jù),27個(gè)增強(qiáng)數(shù)據(jù)。
模型在谷歌云環(huán)境上進(jìn)行訓(xùn)練。網(wǎng)絡(luò)模型訓(xùn)練時(shí),輸入的圖像包括訓(xùn)練集、驗(yàn)證集以及由專家分割好的標(biāo)簽,模型訓(xùn)練使用Dice損失函數(shù)和Adam優(yōu)化算法,其中Adam的參數(shù)lr(學(xué)習(xí)率)=0.0001,好處是計(jì)算高效,內(nèi)存使用很小。其他參數(shù)設(shè)置為:批大小為3,迭代次數(shù)為40次,并設(shè)置當(dāng)訓(xùn)練集上的損失函數(shù)在4個(gè)迭代周期內(nèi)不再減小時(shí)停止訓(xùn)練。最后,使用測(cè)試集對(duì)訓(xùn)練好的3D網(wǎng)絡(luò)進(jìn)行測(cè)試,實(shí)現(xiàn)WMH的分割。
為驗(yàn)證分割效果,對(duì)實(shí)驗(yàn)結(jié)果計(jì)算多種評(píng)價(jià)指標(biāo)值,包括召回率(Recall)又稱敏感性(Sensitivity)、精確率(Precision)、特異性(Specificity)以及DSC系數(shù)。
召回率是指被正確預(yù)測(cè)出來的WMH區(qū)域占真實(shí)WMH區(qū)域的比例,該指標(biāo)用來評(píng)價(jià)本文方法分割出病變部位的能力;精確率是指被正確預(yù)測(cè)出來的WMH區(qū)域占本實(shí)驗(yàn)預(yù)測(cè)WMH區(qū)域的比例,該指標(biāo)用來評(píng)價(jià)本文方法正確分割WMH區(qū)域的能力;特異性是指被正確預(yù)測(cè)出來沒有病變的區(qū)域占非病變區(qū)域的比例,該指標(biāo)用來評(píng)價(jià)本方法對(duì)沒有病變區(qū)域的分割能力;DSC是指測(cè)試結(jié)果和真實(shí)標(biāo)簽的重合度,也是精確率和召回率的一種加權(quán)平均值,代表模型正確分割的能力。這些指標(biāo)計(jì)算公式如式(5)~式(8)所示:
(5)
(6)
(7)
(8)
其中,TP是真陽性(True Positive),預(yù)測(cè)為WMH時(shí),實(shí)際也是WMH;FP是假陽性(False Positive),預(yù)測(cè)為WMH時(shí),實(shí)際為非WMH;FN是假陰性(False Negative),預(yù)測(cè)為非WMH時(shí),實(shí)際為WMH;TN是真陰性(True Negative),預(yù)測(cè)為非WMH時(shí),實(shí)際也為非WMH。
本文實(shí)驗(yàn)分為2組分別進(jìn)行對(duì)比。一組是對(duì)本文模型中使用的各模塊進(jìn)行對(duì)比測(cè)試,其結(jié)果如表1所示。另一組是與其他WMH分割的文獻(xiàn)結(jié)果進(jìn)行對(duì)比,結(jié)果如表2所示。
表1 與其他方法的對(duì)比
表1展示了不同網(wǎng)絡(luò)結(jié)構(gòu)對(duì)WMH進(jìn)行分割的實(shí)驗(yàn)結(jié)果。首先對(duì)比未加入注意力機(jī)制的殘差網(wǎng)絡(luò),以及加入了注意力機(jī)制的殘差網(wǎng)絡(luò)。發(fā)現(xiàn)后者的DSC和Recall值都比前者高(DSC高0.025,Recall高0.082),但Precision和Specificity值卻比殘差要低(Precision低0.046,Specificity低0.004)。說明雙通道注意力機(jī)制的加入可以有效地捕捉全局的依賴關(guān)系和上下文信息,使得分割病變的能力略有提高,特別是小病變區(qū)域,但由于忽略了全局特征,導(dǎo)致分割的精準(zhǔn)度降低。因此,本文方法在此基礎(chǔ)之上加入金字塔池化,通過金字塔池化實(shí)現(xiàn)多個(gè)尺度上的分割信息融合,實(shí)驗(yàn)結(jié)果顯示,最終模型的DSC為0.762, Recall為0.727, Precision為0.801, Specificity為0.991,前3項(xiàng)指標(biāo)的結(jié)果都高于只加入其中一種模塊的結(jié)果,說明通過注意力機(jī)制和金字塔池化的結(jié)合可以提高語義分割模型的分割能力。本文還采用3D Unet-9層網(wǎng)絡(luò)進(jìn)行WMH分割,結(jié)果表明該方法的DSC與Precision指標(biāo)高于殘差網(wǎng)絡(luò)以及結(jié)合注意力機(jī)制的殘差網(wǎng)絡(luò),但低于本文方法??偟膩碚f,結(jié)合了雙路注意力機(jī)制和金字塔池化的語義分割模型,通過雙路注意力機(jī)制捕捉位置之間的空間依賴關(guān)系和通道之間的通道依賴關(guān)系,采用金字塔池化獲得多尺度特征信息,達(dá)到了提高分割結(jié)果的目的。
本文方法還與其他文獻(xiàn)的方法進(jìn)行了比較,如表2所示,Bento等人[25]采用的方法是傳統(tǒng)的隨機(jī)森林(Random Forests, RF);Xu等人[16]采用的方法是在FCN網(wǎng)絡(luò)的基礎(chǔ)上進(jìn)行遷移學(xué)習(xí);Jin等人[26]在U-net網(wǎng)絡(luò)中加入殘差塊;Zhang等人[18]在U-net網(wǎng)絡(luò)中加入后處理的算法;劉亞龍等人[27]則采用U-net與殘差網(wǎng)絡(luò)的融合,并在其中加入條件隨機(jī)場(chǎng),該方法的數(shù)據(jù)集與本文采用的數(shù)據(jù)集來源不同,其他文獻(xiàn)的方法與本文所采用的數(shù)據(jù)均來自于同一數(shù)據(jù)集。
從表2中可以看出,傳統(tǒng)的RF方法的DSC得分只有0.5,Recall為0.27,Precision為0.29,是所有方法中最低的,這說明傳統(tǒng)的機(jī)器學(xué)習(xí)方法相比全卷積下采樣—上采樣的網(wǎng)絡(luò)結(jié)構(gòu)在圖像分割領(lǐng)域中并不占據(jù)優(yōu)勢(shì)。本文方法的DSC得分領(lǐng)先于其他文獻(xiàn)所使用的方法,說明本文在殘差網(wǎng)絡(luò)中加入的模塊可以有效地提高分割結(jié)果。本文方法的Recall值為0.73,能預(yù)測(cè)出73%的病變區(qū)域,相比于Jin等人[26]采用的方法的Recall值為0.81,本文方法分割病變部位的能力還有待提高,下采樣—上采樣的次數(shù)過少,也是導(dǎo)致模型沒有學(xué)習(xí)到足夠多細(xì)節(jié)特征的原因。本文方法的Specificity為0.991,說明本文的模型對(duì)沒有病變區(qū)域的分割能力很強(qiáng)。Precision值為0.8,說明本文的分割結(jié)果中有80%是正確的病變,相比于其他方法,本文方法的Precision值高出很多,說明本文方法誤檢的區(qū)域相對(duì)較少。綜合所有的指標(biāo)來看,本文方法的實(shí)驗(yàn)結(jié)果在各項(xiàng)評(píng)分標(biāo)準(zhǔn)上都高于其他文獻(xiàn)的方法,分割效果更好。
表2 與其他文獻(xiàn)中方法的對(duì)比
圖6為3個(gè)病人的測(cè)試樣本經(jīng)過本文的模型分割出的結(jié)果。其中,圖6(a)為FLAIR的原始圖像,圖6(b)為專家分割的標(biāo)簽與原始圖像的結(jié)合,圖6(c)為模型的分割結(jié)果。圖6(b)中白點(diǎn)區(qū)域代表標(biāo)簽,圖6(c)中白點(diǎn)區(qū)域表示分割后的WMH區(qū)域。從結(jié)果圖可以看出,本文采用的模型分割的結(jié)果與標(biāo)簽差別不大,大面積的WMH分割效果良好,部分小面積的WMH能夠分割出來,但仍有誤判,尤其是顆粒狀病變,這將成為未來WMH分割的重點(diǎn)和難點(diǎn)。
(a) FLAIR (b) 標(biāo)簽 (c) 分割結(jié)果
為了準(zhǔn)確地分割腦白質(zhì)病變區(qū)域,本文提出了一種結(jié)合注意力機(jī)制和金字塔池化的殘差3D全卷積神經(jīng)網(wǎng)絡(luò)分割算法。通過實(shí)驗(yàn)表明,本文提出的金字塔池化與雙通道注意力相結(jié)合的3D網(wǎng)絡(luò)結(jié)構(gòu)可以準(zhǔn)確地分割腦白質(zhì)病變,但對(duì)于小的病變部位分割結(jié)果不是很好,可能的原因是本文方法沒有考慮噪聲的干擾;并且在數(shù)據(jù)上,盡管本文使用了數(shù)據(jù)增強(qiáng)的方法增加了MRI圖像的數(shù)量,但數(shù)據(jù)量過少依舊是導(dǎo)致實(shí)驗(yàn)結(jié)果精度不高的原因。后續(xù)的研究中將重點(diǎn)解決小病變區(qū)域的分割問題,以提高模型分割的準(zhǔn)確性。