張伯泉,麥海鵬,陳嘉敏,逄錦聚
(1.廣東工業(yè)大學(xué)計(jì)算機(jī)學(xué)院,廣東 廣州 510006;2.青島西海岸新區(qū)教育和體育局,山東 青島 266427)
腦小血管?。–erebral Small Vessel Disease,CSVD)是老年人常見(jiàn)的一種腦血管疾病,通常由腦內(nèi)小動(dòng)脈、毛細(xì)血管以及小靜脈血管壁等損傷引起。其臨床表現(xiàn)包括急性缺血性卒中癥狀、輕度認(rèn)知功能障礙及癡呆、步態(tài)異常、情緒或行為異常和運(yùn)動(dòng)障礙等[1]。腦小血管病的致殘率高,康復(fù)難,因其發(fā)病隱匿,易被病人及醫(yī)師忽略,嚴(yán)重危害中老年人的健康,為家庭、社會(huì)帶來(lái)沉重負(fù)擔(dān)。
腦白質(zhì)高信號(hào)(White Matter Hyperintensity,WMH),亦稱(chēng)為腦白質(zhì)疏松(Leukoaraiosis,LA),由加拿大神經(jīng)病學(xué)專(zhuān)家Hachinski 等人[2]于1987 年提出,是腦小血管病的常見(jiàn)影像標(biāo)記物之一[3]。腦白質(zhì)高信號(hào)在核磁共振成像T2 加權(quán)像(T2 Weighted Image,T2WI)或者液體衰減反轉(zhuǎn)恢復(fù)序列圖像中通常表現(xiàn)為腦白質(zhì)部位的高信號(hào)影。根據(jù)病變部位,腦白質(zhì)高信號(hào)分為側(cè)腦室旁白質(zhì)高信號(hào)(Periventricular White Matter Hyperintensity,PWMH)和深部白質(zhì)高信號(hào)(Deep White Matter Hyperintensity,DWMH)這2 大類(lèi)[4]。側(cè)腦室旁白質(zhì)高信號(hào)緊貼在腦室周?chē)盘?hào)分布均勻,具體形態(tài)包括“帽狀征”“線(xiàn)緣征”“濃暈征”以及“淡暈征”等4 種。深部白質(zhì)高信號(hào)常以斑點(diǎn)狀分布在側(cè)腦室四周,不與側(cè)腦室直接接觸[5]。
多項(xiàng)研究表明,WMH 體積變化能夠反映腦小血管病患者早期認(rèn)知功能的變化[6-8]。WMH 體積越大,全腦功能或特定區(qū)域認(rèn)知功能越低[9-11]。因此,WMH體積可以作為臨床腦小血管疾病診斷及治療的重要指標(biāo)。而精準(zhǔn)分割腦白質(zhì)高信號(hào)病灶是腦小血管病診斷的基礎(chǔ)工作,在主治醫(yī)師于腦小血管病患者臨床診斷的過(guò)程中起到重要作用。目前,腦白質(zhì)高信號(hào)病灶往往由極具臨床經(jīng)驗(yàn)的醫(yī)師進(jìn)行手工分割,非常耗費(fèi)時(shí)間與精力,也常常存在人為誤差。因此,研究高效、精準(zhǔn)、自動(dòng)化的腦白質(zhì)高信號(hào)分割方法成為了臨床醫(yī)學(xué)上的迫切需求,具有重要的理論研究意義以及臨床應(yīng)用價(jià)值。
現(xiàn)今腦白質(zhì)高信號(hào)分割算法的研究成果可分為機(jī)器學(xué)習(xí)以及深度學(xué)習(xí)2大類(lèi)。
在機(jī)器學(xué)習(xí)方法中,Samaille等人[12]提出了一種新的腦白質(zhì)高信號(hào)自動(dòng)分割算法(White Matter Hyperintensity Automated Segmentation Algorithm,WHASA),該方法增加FLAIR 和T1圖像中腦白質(zhì)高信號(hào)區(qū)域與周?chē)M織之間的對(duì)比度,交替使用非線(xiàn)性擴(kuò)散濾波模型以及分水嶺分割模型,根據(jù)受試者自動(dòng)計(jì)算出的閾值和解剖信息分割出腦白質(zhì)高信號(hào)。Dadar 等人[13]的實(shí)驗(yàn)表明,隨機(jī)森林方法相比于大多數(shù)線(xiàn)性分類(lèi)器和非線(xiàn)性分類(lèi)器,在缺乏FLAIR 掃描信息的情況下,依然可以有效地檢測(cè)出腦白質(zhì)高信號(hào)病灶區(qū)域。Griffanti 等人[14]提出了基于K-近鄰算法的腦強(qiáng)度異常分類(lèi)算法(Brain Intensity Abnormality Classification Algorithm,BIANCA)。該方法相比于其它基于K-近鄰算法的分割方法,提供了不同的空間信息加權(quán)選項(xiàng)、局部空間強(qiáng)度平均選項(xiàng)、訓(xùn)練點(diǎn)數(shù)量以及位置,有效地分割出腦白質(zhì)高信號(hào)病灶區(qū)域。針對(duì)用于圖像分割的馬爾可夫隨機(jī)場(chǎng)(Markov Random Field,MRF)算法的時(shí)間和空間復(fù)雜性隨著表示相鄰像素之間的統(tǒng)計(jì)依賴(lài)關(guān)系邊的數(shù)量增加而急劇增加的問(wèn)題,Schwarz 等人[15]在不顯著影響腦白質(zhì)高信號(hào)病灶區(qū)域分割性能的前提下,從完整的MRF 中去除邊緣,在縱向序列中對(duì)大腦的核磁共振影像(Magnetic Resonance Imaging,MRI)進(jìn)行建模,有效地降低MRF的參數(shù)量以及推理的計(jì)算復(fù)雜度。
在深度學(xué)習(xí)方法中,Moeskops 等人[16]的實(shí)驗(yàn)表明,基于卷積神經(jīng)網(wǎng)絡(luò)的分割方法能夠在MRI中將腦組織區(qū)域以及腦白質(zhì)高信號(hào)病灶區(qū)域進(jìn)行分離。Li等人[17]提出了一項(xiàng)利用深度全卷積網(wǎng)絡(luò)和集成模型,利用FLAIR 圖像以及T1 核磁共振掃描圖像來(lái)進(jìn)行腦白質(zhì)高信號(hào)分割實(shí)驗(yàn),該算法在MICCAI 2017的WMH 分割挑戰(zhàn)賽中,Dice 相似系數(shù)(Dice Similarity Coefficient,DSC)達(dá)到了0.80,獲得比賽的第一名。Gong 等人[18]提出了由UNet 分割模型和UNet 分類(lèi)模型組成的級(jí)聯(lián)UNet 模型(Cascade UNet),并使用組合損失函數(shù)對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,實(shí)現(xiàn)在二維FLAIR圖像的室周腦白質(zhì)高信號(hào)和深部腦白質(zhì)高信號(hào)的分割以及區(qū)分。Huang 等人[19]提出了一種半監(jiān)督模型V-Net,提出并使用一種半監(jiān)督損失函數(shù)水平集損失(LSLoss)進(jìn)行模型訓(xùn)練,用于FLAIR 圖像上的腦白質(zhì)高信號(hào)分割。該網(wǎng)絡(luò)模型在訓(xùn)練過(guò)程中不需要手動(dòng)標(biāo)記的WMH 標(biāo)簽,DSC 指標(biāo)達(dá)到了0.78。Wang 等人[20]提出了一種兩階段多尺寸FCNs 網(wǎng)絡(luò),用于MRI中的腦白質(zhì)高信號(hào)分割,通過(guò)集成網(wǎng)絡(luò)將不同的分割結(jié)果融合,提高了腦白質(zhì)高信號(hào)的分割精度。Sundaresan 等人[21]提出了一種集成大腦MRI 圖像3 個(gè)方向切片的神經(jīng)網(wǎng)絡(luò)模型(Triplanar Ensemble UNet),通過(guò)結(jié)合大腦MRI 的3 個(gè)不同方向切片以提高腦白質(zhì)高信號(hào)病灶分割的精準(zhǔn)度。趙欣等人[22]提出了一種融合殘差、金字塔池化和注意力機(jī)制的3D 全卷積深度神經(jīng)網(wǎng)絡(luò)模型。該模型采用殘差連接避免深層網(wǎng)絡(luò)的梯度消失;采用金字塔池化聚合更多的上下文信息;采用注意力機(jī)制定位感興趣的目標(biāo)。Liu等人[23]針對(duì)現(xiàn)行存在的腦白質(zhì)高信號(hào)分割算法不能準(zhǔn)確區(qū)分腦白質(zhì)高信號(hào)病灶區(qū)域以及缺血性卒中的病灶區(qū)域的問(wèn)題,提出了一種深度卷積神經(jīng)網(wǎng)絡(luò)(Multichannel2DConvolutional Neural Network,M2DCNN),可以準(zhǔn)確地分割腦白質(zhì)高信號(hào)病灶區(qū)域并將其與缺血性卒中病變區(qū)分開(kāi)。Zhu 等人[24]提出使用較輕量化的2D VB-Net 用于腦白質(zhì)高信號(hào)病灶區(qū)域分割,在常規(guī)臨床診斷上收集的數(shù)據(jù)集以及公開(kāi)數(shù)據(jù)集上均表現(xiàn)出良好的分割效果。Chen等人[25]提出了TransUNet 網(wǎng)絡(luò)模型,通過(guò)將Transformer 結(jié)構(gòu)融入U(xiǎn)Net 模型中,在各醫(yī)學(xué)圖像分割任務(wù)上均取得較好的效果。
目前,現(xiàn)有的腦白質(zhì)高信號(hào)病灶分割研究重心在于讓分割網(wǎng)絡(luò)模型更加精細(xì)、高效地分割腦白質(zhì)高信號(hào)病灶區(qū)域,更加貼切于臨床應(yīng)用。不少研究為了提高分割精準(zhǔn)度,使用更加深層次的網(wǎng)絡(luò)或提出級(jí)聯(lián)網(wǎng)絡(luò)模型同時(shí)對(duì)FLAIR 影像以及T1 加權(quán)像進(jìn)行檢測(cè),因網(wǎng)絡(luò)層數(shù)的增加或級(jí)聯(lián)多個(gè)UNet 網(wǎng)絡(luò),往往會(huì)帶來(lái)極高的模型參數(shù)量。且在臨床應(yīng)用上,常通過(guò)FLAIR 影像來(lái)判斷患病程度。為更貼近臨床實(shí)際應(yīng)用,本文直接使用FLAIR影像來(lái)進(jìn)行實(shí)驗(yàn)。
本文依據(jù)腦白質(zhì)高信號(hào)病灶區(qū)域在FLAIR 影像中灰度值較高的這一影像學(xué)特點(diǎn),通過(guò)將傳統(tǒng)閾值分割技術(shù)與深度學(xué)習(xí)中的注意力機(jī)制模塊結(jié)合,提出高灰度值注意力模塊(模塊1)并將其應(yīng)用到UNet 網(wǎng)絡(luò)模型中,通過(guò)對(duì)灰度值較低的區(qū)域進(jìn)行減弱或過(guò)濾,有效提高對(duì)圖像中高灰度值區(qū)域的關(guān)注。引入殘差混合注意力模塊(模塊2),其中,在空間維度、通道維度上生成相應(yīng)的注意力,提高網(wǎng)絡(luò)模型的特征提取能力;引入殘差短路連接結(jié)構(gòu),解決由網(wǎng)絡(luò)模型層數(shù)加深而造成的梯度消失、模型退化問(wèn)題。在實(shí)驗(yàn)部分中,通過(guò)進(jìn)行僅UNet、UNet+模塊1、UNet+模塊2 的消融實(shí)驗(yàn),分別驗(yàn)證2 個(gè)模塊均能提高UNet 神經(jīng)網(wǎng)絡(luò)模型對(duì)腦白質(zhì)高信號(hào)病灶區(qū)域的提取能力。通過(guò)與幾種常用的醫(yī)學(xué)圖像分割網(wǎng)絡(luò)模型以及Li 等人[17]、Zhu等人[24]所提出的模型進(jìn)行對(duì)比,本文提出的基于高灰度值注意力機(jī)制的腦白質(zhì)高信號(hào)分割算法達(dá)到了更高的分割精準(zhǔn)度,實(shí)現(xiàn)了更好的分割效果。
基于UNet 網(wǎng)絡(luò)結(jié)構(gòu),根據(jù)腦白質(zhì)高信號(hào)在FLAIR 影像中的特征,提出高灰度值注意力模塊,構(gòu)建一種腦白質(zhì)高信號(hào)分割模型,網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示。FLAIR 圖像進(jìn)入閾值分割模塊,經(jīng)過(guò)最大類(lèi)間閾值算法(Otsu)和三角閾值分割算法自動(dòng)計(jì)算出合適的分割閾值,生成用于構(gòu)建高灰度值注意力模塊的高灰度值區(qū)域掩碼。高灰度值注意力模塊可以減弱或過(guò)濾灰度值較低的區(qū)域,使模型更加關(guān)注圖像特征中灰度值較高的區(qū)域。為提升網(wǎng)絡(luò)的特征提取能力,在UNet的“編碼器”中添加殘差混合注意力模塊。經(jīng)過(guò)對(duì)比實(shí)驗(yàn)驗(yàn)證,殘差混合注意力模塊以及高灰度值注意力模塊均能提升網(wǎng)絡(luò)對(duì)腦白質(zhì)高信號(hào)分割的準(zhǔn)確率。
圖1 高灰度值注意力UNet
本文以Ronneberger 等人[26]提出的UNet 模型作為主干網(wǎng)絡(luò),在保留UNet整體結(jié)構(gòu)的基礎(chǔ)上,添加高灰度值注意力模塊、殘差混合注意力模塊對(duì)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行改進(jìn)。UNet 具備典型的“編碼器—譯碼器”左右對(duì)稱(chēng)結(jié)構(gòu)。編碼器由卷積層、最大池化層、ReLU激活函數(shù)層構(gòu)成,對(duì)圖像進(jìn)行下采樣操作,進(jìn)行特征提取。譯碼器由卷積層、反卷積層、ReLU 激活函數(shù)層構(gòu)成,對(duì)特征圖進(jìn)行上采樣操作,進(jìn)行特征信息復(fù)原。UNet 的每次下采樣操作會(huì)使得特征的尺寸縮小、通道數(shù)翻倍;相反,上采樣操作則會(huì)使得尺寸增大、通道數(shù)減少。UNet 使用了跳躍連接(Skip Connection)將下采樣和上采樣過(guò)程產(chǎn)生的特征圖進(jìn)行融合,即將編碼器和譯碼器的路徑相連接,跳躍連接能夠幫助網(wǎng)絡(luò)在解碼階段中更好地恢復(fù)圖像的細(xì)節(jié)特征。UNet 網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
圖2 UNet
本文首先對(duì)圖像進(jìn)行閾值分割操作,通過(guò)自動(dòng)計(jì)算合適的閾值來(lái)得到圖像高灰度值區(qū)域掩碼。首先,針對(duì)樣本中存在大量的背景像素點(diǎn)的問(wèn)題,采用最大類(lèi)間方差法[27]將背景與腦部組織進(jìn)行分離。在剔除背景像素點(diǎn)后,選取腦部組織直方圖的波峰所對(duì)應(yīng)的灰度級(jí)值Tpeak以及圖像中灰度級(jí)最大值Tmax,通過(guò)三角閾值分割法[28-29]找到較大一側(cè)的波谷灰度級(jí)值T。取波谷所對(duì)應(yīng)的灰度級(jí)值T對(duì)圖像進(jìn)行二值閾值分割得到高灰度值區(qū)域掩碼,如圖3所示。
圖3 閾值分割
1.2.1 Otsu閾值分割法
設(shè)灰度圖像尺寸為M×N,圖像像素點(diǎn)灰度級(jí)范圍為[0,L-1],ni為不同灰度級(jí)對(duì)應(yīng)的像素點(diǎn)個(gè)數(shù),灰度級(jí)i出現(xiàn)的概率為Pi=ni/(M×N)。設(shè)圖像中灰度級(jí)T∈[0,t]的像素點(diǎn)為C0類(lèi),灰度級(jí)T∈[t+1,L-1]的為C1類(lèi)。
設(shè)C0類(lèi)像素點(diǎn)出現(xiàn)的概率為P0(t),C0類(lèi)平均灰度級(jí)為u0(t);C1類(lèi)像素點(diǎn)出現(xiàn)的概率為P1(t),C1類(lèi)平均灰度級(jí)為u1(t)。則有:
圖像的平均灰度級(jí)u可表示為:
設(shè)圖像的兩類(lèi)間方差為δ2b(t),則有:
當(dāng)類(lèi)間方差δ2b(t)為最大時(shí),可獲得最佳灰度級(jí)值TOtsu:
根據(jù)TOtsu對(duì)圖像進(jìn)行分割,剔除圖像背景后,圖像的直方圖如圖4(b)所示。
圖4 直方圖及三角閾值分割法示意圖
1.2.2 三角閾值分割法
在經(jīng)過(guò)Otsu 算法分離背景后,使用三角閾值分割法尋找傾向高灰度級(jí)一側(cè)的波谷灰度級(jí)。選取直方圖中的波峰灰度級(jí)值Tpeak所在的點(diǎn),對(duì)應(yīng)坐標(biāo)為(Tpeak,Npeak);圖像中灰度級(jí)最大值Tmax所在的點(diǎn),對(duì)應(yīng)坐標(biāo)為(Tmax,Nmax)。Tpeak、Tmax對(duì)應(yīng)的2 點(diǎn)可構(gòu)成形式為Ax+By+C=0 的直線(xiàn)l,其中A=Tpeak-Tmax,B=Nmax-Npeak,C=NpeakTmax-NmaxTpeak。
計(jì)算腦部組織直方圖上每個(gè)點(diǎn)到直線(xiàn)l上的距離d。當(dāng)距離d達(dá)到最大時(shí),取對(duì)應(yīng)的灰度級(jí)值作為分割閾值T,對(duì)圖像進(jìn)行閾值分割得到高灰度值區(qū)域掩碼M。
在FLAIR影像中,腦白質(zhì)高信號(hào)的灰度值明顯高于腦脊液信號(hào)等的灰度值,故使用傳統(tǒng)閾值分割技術(shù)對(duì)腦白質(zhì)高信號(hào)區(qū)域進(jìn)行分割具有可行性。但使用傳統(tǒng)閾值分割技術(shù)存在閾值選取問(wèn)題。若閾值選取過(guò)高會(huì)將部分腦白質(zhì)高信號(hào)區(qū)域過(guò)濾掉,若閾值選取過(guò)低會(huì)有一部分無(wú)關(guān)區(qū)域信息殘留。目前,在腦白質(zhì)高信號(hào)分割應(yīng)用上,常使用深度學(xué)習(xí)技術(shù)來(lái)對(duì)腦白質(zhì)高信號(hào)病灶區(qū)域進(jìn)行分割,尚未有實(shí)驗(yàn)提出將傳統(tǒng)閾值分割方法與深度學(xué)習(xí)技術(shù)結(jié)合并應(yīng)用在腦白質(zhì)高信號(hào)分割上。
鑒于使用傳統(tǒng)閾值分割技術(shù)能在一定程度上將腦白質(zhì)高信號(hào)分離,本文提出高灰度值注意力機(jī)制模塊,將傳統(tǒng)閾值分割技術(shù)與深度學(xué)習(xí)技術(shù)結(jié)合。高灰度值注意力機(jī)制模塊能夠?qū)叶戎递^低的區(qū)域進(jìn)行減弱或過(guò)濾,使網(wǎng)絡(luò)更加關(guān)注圖像中灰度值較高的區(qū)域,進(jìn)一步提高分割精準(zhǔn)度。高灰度值注意力機(jī)制如圖5所示。
圖5 高灰度值注意力機(jī)制
圖像在經(jīng)過(guò)閾值分割模塊后得到高灰度值區(qū)域掩碼M,將該掩碼M與輸入特征F進(jìn)行點(diǎn)乘操作得到高灰度值特征Ft。輸入特征F與高灰度值特征Ft同時(shí)經(jīng)過(guò)一個(gè)卷積層進(jìn)行特征提取,通過(guò)批歸一化層以緩解梯度彌散問(wèn)題并加快模型的收斂速度,兩者逐元素相加以融合相同尺度的特征信息,使用ReLU 激活函數(shù)進(jìn)行非線(xiàn)性函數(shù)映射以提升模型的非線(xiàn)性表達(dá),增強(qiáng)網(wǎng)絡(luò)的擬合能力。再次通過(guò)卷積層和批歸一化層進(jìn)行降維,使用Sigmoid 激活函數(shù)將數(shù)據(jù)映射到(0,1)區(qū)間上,得到高灰度值注意力Mt(F) ∈RH×W×1。最后高灰度值注意力Mt(F)與輸入特征F相乘得到輸出特征F′∈RH×W×C。
式中,W0、W1、W2代表卷積層—BN層的參數(shù)權(quán)重。
為提高模型特征提取的能力以及解決由于網(wǎng)絡(luò)層數(shù)加深而導(dǎo)致的模型退化問(wèn)題,在網(wǎng)絡(luò)模型中添加具有殘差混合注意力機(jī)制模塊。其主要由通道注意力機(jī)制模塊、空間注意力機(jī)制模塊以及殘差短路連接結(jié)構(gòu)組成。
1.4.1 通道注意力機(jī)制
如圖6 所示,在通道注意力模塊[30](Channel Attention Module,CAM)中,輸入特征圖F∈RH×W×C首先分別通過(guò)最大值池化層(Max Pooling)和平均值池化層(Average Pooling),在通道維度上壓縮特征,得到2 個(gè)不同的通道描述Fmax,c∈R1×1×C和Favg,c∈R1×1×C。隨后將2 個(gè)通道描述輸入由多層感知機(jī)(Multilayer Perceptron,MLP)構(gòu)成的共享網(wǎng)絡(luò)來(lái)進(jìn)行降維和升維操作,然后對(duì)從共享多層感知機(jī)輸出的2 個(gè)通道描述進(jìn)行逐元素相加操作,并通過(guò)Sigmoid 激活函數(shù)處理,得到通道注意力特征圖Mc(F) ∈R1×1×C,最后將通道注意力特征圖Mc(F)與輸入特征F相乘生成通道注意力模塊的輸出特征F′c。
圖6 通道注意力
1.4.2 空間注意力機(jī)制
如圖7 所示,在空間注意力模塊[31](Spatial Attention Module,SAM)中,輸入特征圖F∈RH×W×C分別通過(guò)最大值池化層和平均值池化層,在空間維度上壓縮特征,得到2 個(gè)不同的空間描述Favg,s∈RH×W×1和Fmax,s∈RH×W×1,并對(duì)這2 個(gè)空間描述進(jìn)行空間拼接操作。隨后對(duì)一個(gè)7×7的卷積核降維到尺寸H×W×1 為的特征圖,并經(jīng)過(guò)Sigmoid 激活函數(shù)處理得到空間注意力特征圖Ms(F) ∈RH×W×1。最后將空間注意力特征圖Ms(F)與輸入特征F相乘生成輸出特征F′s。
圖7 空間注意力
1.4.3 殘差短路連接結(jié)構(gòu)
在早期深度學(xué)習(xí)技術(shù)的發(fā)展歷程中,不少學(xué)者通過(guò)堆疊神經(jīng)元或加深神經(jīng)網(wǎng)絡(luò)層數(shù)的方法來(lái)提高網(wǎng)絡(luò)模型的性能效果。但網(wǎng)絡(luò)層數(shù)增加到一定程度的時(shí)候,會(huì)發(fā)生模型退化、梯度消失或梯度爆炸等現(xiàn)象,模型的性能不僅沒(méi)有得到提升,反而急劇下降。
He 等人[32]針對(duì)這一網(wǎng)絡(luò)模型退化問(wèn)題,提出了殘差學(xué)習(xí)網(wǎng)絡(luò),通過(guò)在網(wǎng)絡(luò)模型中引入恒等映射,很好地解決了深層次網(wǎng)絡(luò)由于網(wǎng)絡(luò)層數(shù)增加,在訓(xùn)練中出現(xiàn)的梯度消失或者梯度爆炸等造成的網(wǎng)絡(luò)退化問(wèn)題,使得網(wǎng)絡(luò)模型的深度可以加深至更高層。殘差學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)廣泛應(yīng)用于深度學(xué)習(xí)中的各種神經(jīng)網(wǎng)絡(luò)模型。
1.4.4 殘差混合注意力模塊
如圖8 所示,殘差混合注意力模塊包含殘差短路連接結(jié)構(gòu),以及通道注意力與空間注意力2 個(gè)子模塊。輸入特征F先依次通過(guò)通道注意力模塊以及空間注意力模塊,獲取相應(yīng)的輸出特征F′,輸入特征F再直接與經(jīng)過(guò)混合注意力模塊處理的輸出特征F′進(jìn)行相加處理,生成輸出特征F″。在訓(xùn)練過(guò)程中低層誤差可以通過(guò)捷徑快速地向上一層進(jìn)行傳遞,保證了反向傳播過(guò)程中參數(shù)的更新,充分利用圖像上下文信息,提高網(wǎng)絡(luò)模型的對(duì)關(guān)鍵特征的提取能力,避免了由網(wǎng)絡(luò)加深而造成的梯度消失、模型退化等問(wèn)題,通過(guò)在網(wǎng)絡(luò)模型結(jié)構(gòu)中添加殘差混合注意力模塊,有效且充分地利用圖像上下文信息,提高網(wǎng)絡(luò)模型的對(duì)關(guān)鍵特征的提取能力,同時(shí)也解決了由網(wǎng)絡(luò)加深而造成的模型退化、梯度消失等問(wèn)題。
圖8 殘差混合注意力
本文采用醫(yī)學(xué)影像處理和計(jì)算機(jī)輔助介入會(huì)議(International Conference on Medical Image Computing and Computer Assisted Intervention,MICCAI)的腦白質(zhì)高信號(hào)公開(kāi)數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)[33]。該數(shù)據(jù)集來(lái)源于3家不同醫(yī)院的不同掃描儀器,共包含60例患者的頭顱MRI 影像。每個(gè)病例樣本中均包括FLAIR 模態(tài)圖像、T1WI模態(tài)圖像、腦白質(zhì)高信號(hào)病灶的金標(biāo)準(zhǔn)分割圖。由于數(shù)據(jù)集由3 臺(tái)不同儀器采集所得,所以在規(guī)格參數(shù)上有一定的差異性。數(shù)據(jù)集詳細(xì)特征如表1所示。
表1 數(shù)據(jù)集詳細(xì)情況
2.2.1 數(shù)據(jù)讀取及尺寸調(diào)整
首先,利用nibabel 庫(kù)對(duì)FLAIR 影像數(shù)據(jù)進(jìn)行讀取并將格式轉(zhuǎn)換為常用的圖像格式,獲得患者腦部軸向切片的圖像數(shù)據(jù)。
其次,由于數(shù)據(jù)集來(lái)源于3 臺(tái)不同的掃描設(shè)備,腦部組織區(qū)域在圖像中的比例有所差異,存在一部分的無(wú)關(guān)背景像素點(diǎn)。根據(jù)不同的比例對(duì)來(lái)自不同掃描設(shè)備的圖片數(shù)據(jù)進(jìn)行裁剪,以剔除部分無(wú)關(guān)背景像素點(diǎn)。
最后,因經(jīng)過(guò)裁剪后的圖像尺寸不一,需要對(duì)圖像進(jìn)行縮放操作,將各切片的圖像尺寸大小統(tǒng)一調(diào)整為224×224。
2.2.2 數(shù)據(jù)增強(qiáng)
由于原始數(shù)據(jù)集的規(guī)模較小,不足以訓(xùn)練出很好的網(wǎng)絡(luò)模型。為提高模型的泛化能力以及更好的分割效果,本文采用翻轉(zhuǎn)、旋轉(zhuǎn)以及彈性形變映射3 種方式進(jìn)行數(shù)據(jù)增強(qiáng)。如圖9所示。
圖9 數(shù)據(jù)增強(qiáng)
1)翻轉(zhuǎn):通過(guò)鏡像翻轉(zhuǎn)圖像以增大數(shù)據(jù)量規(guī)模。
2)旋轉(zhuǎn):通過(guò)將圖像隨機(jī)旋轉(zhuǎn)5°到10°以增大數(shù)據(jù)量規(guī)模。
3)彈性形變:調(diào)用Albumentations 庫(kù)中的Elastic Transform 函數(shù)來(lái)對(duì)圖像進(jìn)行彈性形變操作,以增大數(shù)據(jù)量規(guī)模。
本文實(shí)驗(yàn)使用Python3.8 進(jìn)行開(kāi)發(fā),使用Pytorch框架來(lái)進(jìn)行網(wǎng)絡(luò)結(jié)構(gòu)搭建,使用NVIDIA GeForce RTX 3070 顯卡進(jìn)行模型訓(xùn)練。具體實(shí)驗(yàn)參數(shù):批量大小設(shè)置為16,初始學(xué)習(xí)率為0.001,優(yōu)化器使用Adam,動(dòng)量衰減參數(shù)為3×10-4,總共訓(xùn)練300 輪。使用交叉驗(yàn)證法驗(yàn)證本文提出的算法。
采用以下5 種訓(xùn)練指標(biāo),設(shè)G為金標(biāo)準(zhǔn)分割圖,P為預(yù)測(cè)分割圖。
2.4.1 DSC相似系數(shù)
DSC相似系數(shù)是一種集合相似度度量函數(shù),通常用于計(jì)算2個(gè)樣本的相似度,取值范圍為[0,1]。
2.4.2 平均容積差A(yù)VD
平均容積差(Average Volume Difference,AVD)是指分割結(jié)果與金標(biāo)準(zhǔn)間的絕對(duì)體積差,即像素點(diǎn)個(gè)數(shù)的差別。其中,VG為真實(shí)標(biāo)簽的像素點(diǎn)總數(shù),VP為預(yù)測(cè)分割圖中像素點(diǎn)總數(shù)。
2.4.3 豪斯多夫距離
95% 豪斯多夫距離(95th-percentile of Hausdorff Distance,HD95)用于測(cè)量2個(gè)對(duì)象之間的相似程度,其中距離值越低代表匹配程度越好,即象征著分割效果越好。
同時(shí),為保持整體數(shù)值穩(wěn)定性,剔除一些由離群點(diǎn)造成的不合理距離,選擇從小到大排名前95%的距離作為實(shí)際豪斯多夫距離。
2.4.4 召回率
召回率(Recall)亦稱(chēng)為敏感度,定義為分割的病灶像素點(diǎn)總數(shù)除以真實(shí)病灶像素點(diǎn)總數(shù),即正確預(yù)測(cè)為正樣本像素點(diǎn)總數(shù)占實(shí)際正樣本像素點(diǎn)總數(shù)的比例。公式中,NG為標(biāo)簽中病灶的像素點(diǎn)總數(shù),NP為預(yù)測(cè)正確的病灶像素點(diǎn)總數(shù)。
2.4.5 F1-score
F1-score 是統(tǒng)計(jì)學(xué)中用來(lái)衡量二分類(lèi)模型精確度的一種指標(biāo),它同時(shí)兼顧了分類(lèi)模型的精確率和召回率。F1-score 可以看作是模型精確率和召回率的一種加權(quán)平均。公式中,NP為預(yù)測(cè)正確的病灶像素點(diǎn)總數(shù),NF為預(yù)測(cè)錯(cuò)誤的病灶像素點(diǎn)總數(shù)。
針對(duì)本文實(shí)驗(yàn)數(shù)據(jù)集存在的數(shù)據(jù)不平衡情況,即病變體素?cái)?shù)量遠(yuǎn)低于非病變體素?cái)?shù)量,實(shí)驗(yàn)使用Tversky Loss[34]作為網(wǎng)絡(luò)訓(xùn)練過(guò)程中的損失函數(shù)。在Tversky Loss 公式中,N是總像素點(diǎn)數(shù)量;P1i為第i個(gè)像素點(diǎn)被預(yù)測(cè)為陽(yáng)性樣本的概率值;P0i為第i個(gè)像素點(diǎn)被預(yù)測(cè)為陰性樣本的概率值;g1i為第i個(gè)像素點(diǎn)真實(shí)標(biāo)簽為陽(yáng)性樣本的概率值,若第i個(gè)像素點(diǎn)真實(shí)標(biāo)簽為陽(yáng)性樣本,g1i為1,否則為0;g0i為第i個(gè)像素點(diǎn)真實(shí)標(biāo)簽為陰性樣本的概率值,若第i個(gè)像素點(diǎn)真實(shí)標(biāo)簽為陰性樣本,g0i為1,否則為0。通過(guò)調(diào)整超參數(shù)α和β,控制假陽(yáng)性和假陰性之間的權(quán)衡。在本文實(shí)驗(yàn)中,設(shè)置超參數(shù)α=0.3,β=0.7。
神經(jīng)網(wǎng)絡(luò)模型的參數(shù)量主要取決于網(wǎng)絡(luò)模型的架構(gòu)、層數(shù)等。在卷積層中,參數(shù)量主要取決于輸入特征通道數(shù)量、輸出特征通道數(shù)量、卷積核的大小等。
為客觀對(duì)幾種基于UNet網(wǎng)絡(luò)模型進(jìn)行改造的神經(jīng)網(wǎng)絡(luò)模型進(jìn)行模型參數(shù)量測(cè)試,在神經(jīng)網(wǎng)絡(luò)模型中的4 次下采樣階段中,輸入特征數(shù)量及輸出特征數(shù)量分別為[32,64]、[64,128]、[128,256]、[256,512]。
結(jié)果如表2 所示,本文提出的算法模型的參數(shù)量為8.76M,與UNet 模型的參數(shù)量8.63M 對(duì)比,僅增加了0.13M。本文提出的算法在不顯著增加網(wǎng)絡(luò)模型參數(shù)量的前提下,提高了網(wǎng)絡(luò)對(duì)腦白質(zhì)高信號(hào)病灶區(qū)域的分割性能。
表2 模型參數(shù)量對(duì)比表
本文為驗(yàn)證高灰度值注意力模塊1 以及殘差混合注意力模塊2 均能有效提高網(wǎng)絡(luò)模型對(duì)腦白質(zhì)高信號(hào)病灶區(qū)域的分割能力,對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行消融實(shí)驗(yàn)。消融實(shí)驗(yàn)?zāi)P徒M如下:
1)UNet網(wǎng)絡(luò)。
2)在UNet 網(wǎng)絡(luò)模型的基礎(chǔ)上,添加高灰度值注意力模塊1。
3)在UNet 網(wǎng)絡(luò)模型的基礎(chǔ)上,添加殘差混合注意力模塊2。
4)在UNet 網(wǎng)絡(luò)模型的基礎(chǔ)上,同時(shí)添加高灰度值注意力模塊1以及殘差混合注意力模塊2。
實(shí)驗(yàn)結(jié)果如表3 所示。由表3 可知,本文提出的模型在各項(xiàng)指標(biāo)上均優(yōu)于UNet 網(wǎng)絡(luò)模型。其中,消融實(shí)驗(yàn)?zāi)P? 的DSC 指標(biāo)為0.8023,消融實(shí)驗(yàn)?zāi)P?和消融實(shí)驗(yàn)?zāi)P? 的DSC 指標(biāo)分別達(dá)到0.8213、0.8263,而消融實(shí)驗(yàn)?zāi)P?(本文算法)的DSC 指標(biāo)為0.8330。這驗(yàn)證了2個(gè)模塊均能有效提高網(wǎng)絡(luò)模型對(duì)腦白質(zhì)高信號(hào)病灶區(qū)域的分割能力。
表3 性能評(píng)價(jià)指標(biāo)結(jié)果
表3 為各網(wǎng)絡(luò)模型在腦白質(zhì)高信號(hào)病灶區(qū)域分割任務(wù)上的性能評(píng)價(jià)指標(biāo)結(jié)果。其中,Li 等人[17]使用UNet 網(wǎng)絡(luò)模型對(duì)腦白質(zhì)高信號(hào)區(qū)域進(jìn)行提取,該方法在MICCAI 2017 的WMH 分割挑戰(zhàn)賽中獲得了第一名,DSC 指標(biāo)達(dá)到了80.23%;Zhu 等人[24]提出的2DVBNet 網(wǎng)絡(luò)模型,在減少參數(shù)量模型的情況下,其AVD 指標(biāo)達(dá)到了18.28%;基于Transformer 結(jié)構(gòu)的TransUNet 模型在HD95 指標(biāo)上達(dá)到了5.47 mm。此外,使用如UNet++[35]、AttentionUNet[36]等幾種常用的醫(yī)學(xué)圖像分割網(wǎng)絡(luò)模型進(jìn)行實(shí)驗(yàn),UNet++的DSC 指標(biāo)為81.63%、AttentionUNet 的DSC 指標(biāo)為81.21%、UNet+CBAM 的DSC 指標(biāo)為81.57%。本文提出的算法在DSC 指標(biāo)、F1-score 指標(biāo)以及Recall 指標(biāo)上均達(dá)到了最優(yōu)值,分別為83.30%、87.40%、88.70%,比Li等人[17]所使用的方法在DSC 指標(biāo)上提高了3.07 個(gè)百分點(diǎn),體現(xiàn)出本文提出的算法可以更好地識(shí)別出腦白質(zhì)高信號(hào)病灶區(qū)域,具備更優(yōu)的分割性能。
圖10 為各種算法的分割結(jié)果圖,從實(shí)驗(yàn)結(jié)果中可以看出,相較于其他的網(wǎng)絡(luò)模型,本文提出的算法在腦白質(zhì)高信號(hào)病灶分割任務(wù)上表現(xiàn)出更好的分割性能。在圖像整體中,本文提出的算法通過(guò)高灰度值注意力機(jī)制能夠更好地關(guān)注圖像中的高灰度值區(qū)域,基本可以識(shí)別出全部明顯的腦白質(zhì)高信號(hào)病灶區(qū)域。此外,在圖像細(xì)節(jié)中,本文提出的算法在病灶邊緣上能夠處理得較好,比其他網(wǎng)絡(luò)模型的效果更加精細(xì)。因病灶區(qū)與非病灶區(qū)之間的灰度值相差較大,相比于傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)模型,高灰度值注意力機(jī)制為圖像中病灶區(qū)分配更高的權(quán)重,為非病灶區(qū)分配極低的權(quán)重,通過(guò)將病灶區(qū)與非病灶區(qū)的差異放大,促進(jìn)網(wǎng)絡(luò)模型能夠更好地區(qū)分病灶區(qū)與非病灶區(qū)的像素點(diǎn),在細(xì)節(jié)上更加貼切真實(shí)標(biāo)簽,獲得更好的分割效果。
圖10 不同算法的分割效果圖
根據(jù)臨床診斷采用的FLAIR影像特征,本文提出了一種基于高灰度值注意力機(jī)制的腦白質(zhì)高信號(hào)病灶分割方法。首先采用Otsu 閾值分割法以及三角閾值分割法對(duì)FLAIR影像進(jìn)行計(jì)算,得出最優(yōu)的分割閾值,根據(jù)最優(yōu)的分割閾值生成高灰度值區(qū)域掩碼,構(gòu)建高灰度值注意力機(jī)制模塊,使網(wǎng)絡(luò)模型更加關(guān)注圖像中灰度值較高的區(qū)域,提高網(wǎng)絡(luò)模型對(duì)腦白質(zhì)高信號(hào)病灶區(qū)域的分割精度。將殘差短路連接結(jié)構(gòu)與雙通道注意力機(jī)制模塊相融合構(gòu)成殘差混合注意力模塊,將其引入U(xiǎn)Net網(wǎng)絡(luò)結(jié)構(gòu)中,提高網(wǎng)絡(luò)模型對(duì)關(guān)鍵特征的提取能力。經(jīng)過(guò)消融實(shí)驗(yàn)分別驗(yàn)證了2 個(gè)模塊的有效性,均能提高網(wǎng)絡(luò)模型對(duì)腦白質(zhì)高信號(hào)病灶區(qū)域的分割效果。實(shí)驗(yàn)結(jié)果表明,本文構(gòu)建的網(wǎng)絡(luò)模型(High Gray Value Attention UNet,HGVAUNet)優(yōu)于文獻(xiàn)[17]的競(jìng)賽中第一名所使用的神經(jīng)網(wǎng)絡(luò)模型的效果,DSC 指標(biāo)達(dá)到了83.30%,提高了3.07 個(gè)百分點(diǎn)。這說(shuō)明本文提出的算法具有更好的分割效果,驗(yàn)證了模型的有效性。
由于本文直接采用臨床診斷上所用的FLAIR 圖像,研究成果可以很好地應(yīng)用在臨床診斷上。另外,本文將傳統(tǒng)閾值分割技術(shù)引入深度學(xué)習(xí)的網(wǎng)絡(luò)模型中,驗(yàn)證了傳統(tǒng)圖像處理技術(shù)能夠很好地與深度學(xué)習(xí)技術(shù)結(jié)合,針對(duì)特定的生物醫(yī)學(xué)圖像分割任務(wù)具有較好的效果。
下一步將面向臨床應(yīng)用,根據(jù)Fazekas 量表對(duì)腦白質(zhì)高信號(hào)患者進(jìn)行分級(jí)評(píng)價(jià),搭建完整的腦白質(zhì)高信號(hào)診斷軟件系統(tǒng),為醫(yī)師在臨床診斷上提供便利。