王志剛,馮云超,黃 灌
(湖南師范大學(xué) 信息科學(xué)與工程學(xué)院,長沙 410081)
近年來,腦腫瘤的發(fā)病率和死亡率正在逐年攀升,且患者多為惡性腫瘤,它對人類的生命健康造成了嚴重的危害[1]﹒利用計算機技術(shù)準確獲得腦腫瘤的尺寸和位置等信息,能夠幫助醫(yī)生作出準確的診斷[2],同時,在手術(shù)定位、創(chuàng)建病情檔案、建立腫瘤模型等方面也有重要作用[3]﹒因此,將腦腫瘤圖像從MRI影像中準確地分割出來對腦部疾病的診斷具有重要的意義﹒
在臨床中,通常由醫(yī)生手動繪制腦腫瘤邊界,這不僅需要醫(yī)生掌握較多的專業(yè)知識,還會耗費大量的時間和精力,且分割結(jié)果易受主觀因素的影響,可能會因醫(yī)生水平的不同而出現(xiàn)明顯的差異﹒因此,實現(xiàn)腦腫瘤圖像的自動分割,一直是學(xué)者們研究的熱點問題﹒
模糊C均值聚類(fuzzy c-means, FCM)算法是一種經(jīng)典的圖像分割算法,也是一種無監(jiān)督的聚類分析方法,已被廣泛應(yīng)用于醫(yī)學(xué)圖像分割領(lǐng)域[4]﹒但是,該算法對噪聲較為敏感,且初始聚類中心隨機確定,容易陷入局部極值,當(dāng)不同類別樣本特征差異較小時,聚類精度較差﹒為此,學(xué)者們進行了大量的研究和改進,祖志文等[5]使用粒子群算法初始化聚類中心,提高了算法的穩(wěn)定性;Yang等[6]提出一種基于核函數(shù)及空間鄰域信息的模糊聚類算法,擴大了不同樣本間的特征差異,提高了算法的抗噪性;王燕等[7]將核函數(shù)與馬氏距離相結(jié)合,提出了KM-FCM算法,增強了算法的噪聲魯棒性﹒
針對傳統(tǒng)模糊 C均值聚類算法對噪聲敏感,初始聚類中心不確定,聚類精度不高以及無法對腦腫瘤MRI圖像準確分割的問題,本文將馬氏距離混合高斯核函數(shù)引入到模糊C均值聚類算法中,結(jié)合 SLIC算法和粒子群算法,提出一種新的腦腫瘤圖像分割方法,研究其分割精度和有效性﹒
傳統(tǒng)消噪方法雖然能較好地去除噪聲,但卻損害了原信號的強度,模糊了圖像的邊緣,不能很好地滿足醫(yī)學(xué)圖像分割的需要﹒因此,本文采用各向異性濾波進行圖像的預(yù)處理,在去除噪聲的同時還可以把圖像的邊緣較好地保留下來﹒
各向異性濾波是把圖像看成物理學(xué)的力場或熱流場,圖像像素總是朝著跟其值差異不大的地方流動,那些差異大的地方(邊緣)得以保留﹒因此,各向異性濾波本質(zhì)上是圖像邊緣保留濾波器(EPF)[8],其在各方向上的擴散可表示為
其中Dq是擴散因子﹒不同時刻的擴散過程可以表示為
其中,I表示輸入的圖像;t表示當(dāng)前的迭代次數(shù);cNx,y,cSx,y,cEx,y和cWx,y分別表示4個方向的導(dǎo)熱系數(shù),見公式(3)﹒
為避免殘留噪聲和散點對圖像分割造成干擾,
本文首先采用 SLIC算法對圖像進行預(yù)分割﹒簡單線性迭代聚類(simple linear iterative clustering,SLIC)算法是Achanta等[9]提出的一種新的聚類算法,它能夠生成大量形狀規(guī)則、相對均勻的超像素塊,可以有效避免過分割和欠分割現(xiàn)象﹒SLIC算法的具體步驟[10]如下:
1)初始化種子點﹒假設(shè)圖像有N個像素點,首先,將其分為K個超像素塊,則超像素塊尺寸約為N/K,超像素塊間的距離可用來表示;其次,計算出所有像素點的梯度值,為避免影響后續(xù)的聚類結(jié)果,讓種子點在鄰域3×3的窗口內(nèi)移動,并且保證其移動到梯度值最小的位置上,以防止種子點被分配到影像的邊緣位置或噪聲點的位置;最后,分配對應(yīng)標簽到每個種子點上﹒
2)相似性度量﹒對每個像素點進行搜索,計算出像素點與種子點之間的相似程度(包括顏色距離和空間距離),不斷迭代直到算法收斂﹒其距離關(guān)系為
其中,lk,ak,bk,xk,yk表示種子點的 5維特征值,li,ai,bi,xi,yi為等待判斷的像素點的 5維特征值,且l表示亮度,a,b表示顏色分量,x,y表示像素坐標;dlab表示像素點間的顏色相似程度;dxy表示鄰域內(nèi)像素點的空間距離;s為間距大??;m用來衡量顏色信息與空間信息的相似比重;D代表2個像素點的相似度大小﹒
粒子群優(yōu)化(particle swarm optimization, PSO)算法是由Kennedy和Eber-hart提出的群智能優(yōu)化算法[11]﹒其具體流程如下:
在D維搜索空間中,由N個粒子匯聚成1個群落,群落中的每個粒子都在尋找自己的最佳位置,可用Xi= (xi1,xi2,…,xiD)表示第i個粒子的位置,Vi= (vi1,vi2,…,viD)表示其速度;在搜尋過程中,個體的最優(yōu)位置定義為pi= (pi1,pi2,…,piD),記為pibest;群體中的所有粒子在先前搜尋過程中的最佳位置表示為gibest;粒子的速度和位置更新公式為
其中,c1和c2為學(xué)習(xí)因子;r1和r2是2個隨機值,取值范圍為[0, 1];w是慣性權(quán)重﹒
當(dāng)慣性權(quán)重w值偏大時,算法擁有較強的全局搜索能力;其值偏小時,則擁有較強的局部搜索能力﹒因此,本文采用線性變化的權(quán)重,即
其中,wmax表示w的最大值,通常取0.9;wmin表示w的最小值,通常取0.4;t表示當(dāng)前的迭代次數(shù);tmax表示最大迭代次數(shù)﹒
2.3.1 混合核函數(shù)聚類
設(shè)X={x1,x2,x3,…,xn}是原始空間Rs經(jīng)非線性變換映射至特征空間Rp的1個樣本集,則混合核函數(shù)聚類算法在高維特征空間下的目標函數(shù)可表示為
其中,m為模糊控制指數(shù);c代表聚類數(shù)目;φ(vi)為聚類中心在相應(yīng)核空間中的像;uij為第j個數(shù)據(jù)對第i類的隸屬度;表示特征空間中φ(xj)至φ(vi)的歐氏距離﹒
在進行數(shù)據(jù)映射時,傳統(tǒng)的核模糊聚類算法(KFCM)一般采用單一的高斯核函數(shù)進行映射,其定義為
其中,σ表示數(shù)據(jù)的標準差;表示原始空間中x至y的歐氏距離﹒
由于單一高斯核函數(shù)只有唯一的可調(diào)參數(shù)σ,所以其具有很強的局部性,導(dǎo)致聚類算法的學(xué)習(xí)和泛化能力不強[12]﹒本文采用混合高斯核函數(shù)替代單一高斯核函數(shù),這樣就可以通過調(diào)整多個σ參數(shù)來優(yōu)化樣本數(shù)據(jù)在核空間中的分布,從而提高核模糊聚類算法的性能﹒混合高斯核函數(shù)的定義為
其中,σl為高斯核參數(shù);αl為各核函數(shù)的權(quán)重因子,滿足
2.3.2 馬氏距離混合核函數(shù)聚類
傳統(tǒng)高斯核函數(shù)雖具有很強的適應(yīng)性,但其對數(shù)據(jù)差異性的度量方式是歐氏距離,而歐氏距離并沒有考慮特征之間可能存在的耦合關(guān)系,因此它不能有效地描述2個樣本點之間的全局性關(guān)系,往往不能取得令人滿意的效果﹒
馬氏距離是由印度統(tǒng)計學(xué)家 Mahalanobis提出的[13],因其引入了協(xié)方差矩陣,所以可以更好地描述2個樣本點之間的全局性關(guān)系,其定義為
其中Σ為樣本的協(xié)方差矩陣﹒
基于馬氏距離的混合高斯核函數(shù)則可表示為
將數(shù)據(jù)通過馬氏距離混合核函數(shù)映射至特征空間后,φ(xj)至φ(vi)的歐氏距離可利用核函數(shù)表示為
因此,該算法的目標函數(shù)可進一步表示為
再根據(jù)拉格朗日乘數(shù)法,可以分別求得隸屬度和聚類中心的迭代公式為
本文所提算法的具體實現(xiàn)步驟如下:
1)使用各向異性濾波對圖像進行預(yù)處理,設(shè)定迭代次數(shù)t=20,導(dǎo)熱系數(shù)k=15,平滑系數(shù)λ= 0 .15﹒
2)用簡單線性迭代聚類算法對預(yù)處理后的圖像進行分割,超像素塊大小設(shè)為15個像素﹒
3)設(shè)定粒子群算法的相關(guān)參數(shù),即粒子群規(guī)模N=30,最大迭代次數(shù)tmax=30和學(xué)習(xí)因子c1=c2=2 ,并求得初始聚類中心v0﹒
4)設(shè)定聚類數(shù)目c=3,迭代終止條件ε=10-5,最大迭代次數(shù)Tmax=100,高斯核數(shù)目g=2,高斯核參數(shù)σ1=150,σ2=20,約束系數(shù)λ=0.6﹒
5)輸入由步驟3)獲得的初始聚類中心v0,再根據(jù)式(17)~式(18),不斷更新聚類中心vi和隸屬度矩陣U﹒如果或者達到最大迭代次數(shù),則停止迭代;若不滿足上述條件,則繼續(xù)執(zhí)行本步驟﹒
6)迭代停止后,根據(jù)最終得到的隸屬度矩陣把目標像素指定為相應(yīng)的最佳聚類中心的值,并輸出圖像﹒
7)結(jié)合形態(tài)學(xué)對圖像進行后處理,即平滑腦腫瘤圖像的邊緣﹒
本次實驗的腦腫瘤MRI圖像來自BraTS2018數(shù)據(jù)庫,該數(shù)據(jù)庫的MRI圖像提供了4種圖像序列,分別是T1,T1c,T2和FLAIR﹒由于FLAIR圖像序列在成像過程中水分子信號被抑制,故常被用于腫瘤診斷[14],本文亦選擇該圖像序列﹒實驗環(huán)境為Windows10、AMD Ryzen 5 3500U處理器、16 GB內(nèi)存,以及Matlab 2018a﹒
由于 MRI圖像在成像過程中經(jīng)常受到高斯噪聲的干擾,所以在圖像中分別添加方差為0.005,0.01,0.02和0.03的高斯噪聲,并用本文所提算法對MRI圖像進行分割,結(jié)果如表1所示﹒
表1 不同強度噪聲下的分割結(jié)果
由表1可知,當(dāng)噪聲方差為0.005~0.02時,分割結(jié)果相對穩(wěn)定,能較好地將腦腫瘤圖像分割出來,這說明算法具有良好的抗噪性;當(dāng)噪聲方差為0.03時,消噪后的圖像開始變得模糊,腦腫瘤圖像的邊緣部分開始出現(xiàn)誤分割的現(xiàn)象﹒
為了驗證所提算法分割腦腫瘤圖像的有效性,從BraTS2018數(shù)據(jù)庫中隨機挑選某位患者的腦腫瘤MRI圖像,抽取3個層面進行圖像分割,并且分別與FCM算法[15]和KFCM算法[16]的分割效果進行對比,結(jié)果如圖1~圖3所示﹒
圖1 切片1分割效果對比
圖2 切片2分割效果對比
圖3 切片3分割效果對比
從圖1~圖3可看出,在FCM和KFCM算法的分割結(jié)果中,腦腫瘤圖像的邊緣部分出現(xiàn)了一定程度的誤分割現(xiàn)象,且有一定的散點存在;本文算法則能較好地處理腦腫瘤圖像細節(jié),且分割后無明顯散點,其分割效果最接近于真值圖像﹒
為了避免主觀評價因素的影響,本文選擇Dice,Jaccard,Sensitivity和Accuracy共 4個評價指標對算法分割精度進行評估,其定義分別為
其中,TP為正確分割的目標區(qū)域;FP為誤分割的目標區(qū)域;FN為沒有檢測到的目標區(qū)域;TN為一定的非目標區(qū)域﹒
仍以上述3幅腦腫瘤MRI圖像為例,將本文算法與FCM算法和KFCM算法的4項評價指標進行比較,結(jié)果如表2所示﹒
表2 本文算法與其他算法的分割性能對比
由表2可以看出,本文算法相較傳統(tǒng)聚類算法在各指標上均有一定提升:Dice平均值相較傳統(tǒng)算法高出2.21%~2.69%;Jaccard平均值相較傳統(tǒng)算法高出3.97%~4.78%;Sensitivity平均值相較傳統(tǒng)算法高出5.31%~6.39%;Accuracy平均值相較傳統(tǒng)算法高出0.22%~0.26%﹒在腦腫瘤圖像分割中,通常以Dice和Jaccard作為主要指標,其值越接近 1,代表分割效果越好﹒本文所提算法從實驗中得出的Dice平均值和Jaccard平均值均較高﹒
本文所提腦腫瘤圖像分割方法,利用各向異性濾波進行圖像預(yù)處理,具有良好的抗噪性;通過粒子群算法確定初始聚類中心,提高了算法的穩(wěn)定性;利用多個馬氏距離高斯核函數(shù)進行數(shù)據(jù)映射,可以優(yōu)化算法的分割性能﹒實驗結(jié)果表明,與FCM算法和KFCM算法相比,所提算法具有較好的噪聲魯棒性,其分割精度更高,能將腦腫瘤圖像從腦MRI影像中準確地分割出來,是一種有效的腦腫瘤圖像分割算法﹒但本算法也存在一定缺陷,如高斯核的各參數(shù)和權(quán)重不能自動調(diào)節(jié),需要人為干預(yù),這將是下一步研究的重點﹒