范 虹,史肖敏,姚若俠
陜西師范大學(xué) 計(jì)算機(jī)科學(xué)學(xué)院,西安 710119
乳腺癌居女性惡性腫瘤發(fā)病率之首,已經(jīng)成為全球名列第一的“殺手”[1-2],其防治工作成為腫瘤防治工作的主要挑戰(zhàn)。據(jù)統(tǒng)計(jì),乳腺癌的發(fā)病率占女性新發(fā)惡性腫瘤的29%,致死率為14%,是女性最易罹患的癌癥[3]。雖然乳腺癌的病因尚不明確,但是其愈后恢復(fù)性很好。只要早發(fā)現(xiàn)、早診斷、早治療就能降低乳腺癌死亡率,篩查和普查一直被公認(rèn)為是早期檢查出乳腺癌最有效的方法,因此醫(yī)學(xué)影像學(xué)檢查起著重要的作用[4]。現(xiàn)有影像檢查中磁共振成像(magnetic resonance imaging,MRI)因具有良好的軟組織分辨力、較高的空間分辨率以及任意三維成像的優(yōu)勢(shì),能更準(zhǔn)確地評(píng)估腫瘤的大小、浸潤(rùn)范圍、周圍子灶情況,對(duì)乳腺檢查具有獨(dú)到的優(yōu)勢(shì)。近年來(lái),國(guó)內(nèi)外已逐漸將MRI檢查作為乳腺癌高危人群的篩查方法[5]。然而,在成像過(guò)程中,由于外部不確定性因素的影響,圖像中總是存在隨機(jī)的萊斯噪聲,并且存在一系列問(wèn)題,例如灰度不均勻和邊界模糊,給分割帶來(lái)一定難度。
模糊C均值聚類算法(fuzzy C-means,F(xiàn)CM)允許圖像像素按其成員值的比例分為一類或多類,為MR圖像分割提供了較高的分割精度,引起了諸多學(xué)者的興趣[6-7]。然而,由于圖像某些特征類簇僅與部分存在于子空間中的屬性相關(guān),需在子空間中尋找最優(yōu)。于是Agrawal 等人提出了子空間聚類(subspace clus-tering,SC)的概念[8],隨后又逐漸演變?yōu)橛沧涌臻g聚類(hard subspace clustering,HSC)和軟子空間聚類(soft subspace clustering,SSC)[9]。其中SSC算法可通過(guò)為每個(gè)維度分配權(quán)重來(lái)測(cè)量各個(gè)維度對(duì)聚類的影響以優(yōu)化最終結(jié)果,典型的算法有熵加權(quán)K-均值聚類算法(entropy weightingK-means,EWKM)、局部自適應(yīng)聚類算法(local adaptive clustering,LAC)、模糊子空間聚類算法(fuzzy subspace clustering,F(xiàn)SC)[10]、基因共表達(dá)網(wǎng)絡(luò)的模糊子空間聚類算法(fuzzy soft subspace clustering method for gene co-expression net-work,F(xiàn)SSCGCN)[11]、不平衡數(shù)據(jù)的軟子空間聚類算法(bi-weighting for imbalanced data clustering,BWIC)[12]、視圖-協(xié)同模糊軟子空間聚類(multi view collaboration based fuzzy soft subspace clustering,MVC-FSSC)[13]和加權(quán)閔可夫斯基K-means 算法(Minkowski metric weightedK-means,MWK-Means)[14]等。這些算法可擴(kuò)展性高,應(yīng)用也相對(duì)靈活,但對(duì)乳腺M(fèi)R 圖像聚類時(shí)易受初始聚類中心的影響而陷入局部最優(yōu)。2017年范虹等人提出用煙花算法優(yōu)化軟子空間聚類算法(soft subspace clustering for MR image clustering based on fireworks optimization algorithm,F(xiàn)WASSC)[15],很好地平衡了局部與全局搜索性能,且對(duì)乳腺M(fèi)R圖像具有較好的聚類效果,但FWASSC算法對(duì)MR圖像分割中仍存在邊界不精確現(xiàn)象。
與其他群體智能優(yōu)化算法如遺傳算法、粒子群算法、人工魚(yú)群算法、人工蜂群算法等進(jìn)行對(duì)比,頭腦風(fēng)暴優(yōu)化算法的優(yōu)勢(shì)在于能夠模擬人類創(chuàng)造性地解決問(wèn)題的思維過(guò)程且執(zhí)行效率較高[16-17]。鑒于此,本文借助頭腦風(fēng)暴優(yōu)化算法[15]可以較好地平衡局部與全局搜索性能,且執(zhí)行效率較高的優(yōu)勢(shì),提出了一種基于頭腦風(fēng)暴算法優(yōu)化的乳腺M(fèi)R 圖像軟子空間聚類算法,彌補(bǔ)現(xiàn)有軟子空間聚類算法易陷入局部最優(yōu)的不足,有效提高算法的聚類精度。
子空間聚類算法中控制權(quán)重分布的一個(gè)經(jīng)典策略就是采用最大熵策略,代表性的熵加權(quán)獨(dú)立軟子空間聚類算法包括EWKM 和LAC。其中EWKM 的目標(biāo)函數(shù)如式(1)所示:
目標(biāo)函數(shù)中的第二項(xiàng)是負(fù)香農(nóng)熵,λ用于平衡其對(duì)聚類過(guò)程的影響,如何設(shè)置此參數(shù)是一個(gè)重要的研究課題。EWKM通過(guò)引入熵項(xiàng),可以有效地控制所獲得的權(quán)重,已經(jīng)成為一種基準(zhǔn)的獨(dú)立軟子空間聚類算法(independent soft subspace clustering,ISSC)。
LAC 與EWKM 算法基本上具有相似的優(yōu)缺點(diǎn),為了解決算法對(duì)聚類任務(wù)的響應(yīng)程度,Amorim 和Mirkin 試圖通過(guò)采用Minkowski 度量來(lái)改進(jìn)EWKM與LAC算法,以取代傳統(tǒng)的歐幾里德距離;FSC算法能夠有效減少冗余和非相關(guān)屬性對(duì)聚類過(guò)程的擾亂,有效避免在對(duì)高維數(shù)據(jù)或數(shù)據(jù)集中的多個(gè)特征進(jìn)行聚類時(shí)數(shù)據(jù)冗余而增加計(jì)算量的缺陷[18];FWASSC算法在尋優(yōu)過(guò)程中,將搜索過(guò)程中復(fù)雜的等式約束放松為界約束且引入噪聲聚類以提高算法對(duì)噪聲數(shù)據(jù)的魯棒性。分別參見(jiàn)文獻(xiàn)[19-20],這些改進(jìn)算法為軟子空間聚類做出了較大的貢獻(xiàn)。
多數(shù)圖像聚類算法旨在根據(jù)圖像的特征信息對(duì)圖像進(jìn)行分類,卻往往忽略了聚類算法對(duì)于噪聲數(shù)據(jù)的敏感問(wèn)題。為處理噪聲數(shù)據(jù)在聚類過(guò)程中的數(shù)據(jù)敏感問(wèn)題,Davé提出了廣義噪聲聚類算法(generalized noise clustering,GNC)[21],其目標(biāo)函數(shù)如式(2)所示。
其中,Dik=||xk-vi||代表數(shù)據(jù)點(diǎn)xk到中心矢量vi的歐式距離;,且ηi參數(shù)來(lái)自可能性C-means聚類(possibilisticC-means,PCM),與FCM 計(jì)算隸屬度相同,分別為:
GNC的中心矢量vi為:
噪聲聚類算法可以有效解決實(shí)際應(yīng)用中存在的噪聲問(wèn)題,它可以管理不完整的數(shù)據(jù)以及混淆的數(shù)據(jù),給研究帶來(lái)新的突破。
頭腦風(fēng)暴優(yōu)化(brain storm optimization,BSO)算法由史玉回教授于2011 年提出,其核心是采用聚類思想搜索局部最優(yōu),通過(guò)局部最優(yōu)的比較得到全局最優(yōu);同時(shí)又采用變異思想增加多樣性,避免算法陷入局部最優(yōu)。針對(duì)特定問(wèn)題,每一個(gè)個(gè)體都具有多種方向的交互可能,其中新個(gè)體的產(chǎn)生一般有兩種方式:
方式1基于單個(gè)聚類中心的個(gè)體產(chǎn)生機(jī)制,具體實(shí)現(xiàn)如式(6)所示:
方式2基于兩個(gè)已經(jīng)存在個(gè)體xold1和xold2的產(chǎn)生機(jī)制,如式(7)所示。
其中,ω1和ω2為兩個(gè)已存在個(gè)體的權(quán)重系數(shù)。
由于隨機(jī)產(chǎn)生系數(shù)的原因,BSO 算法可能在迭代求解局部最優(yōu)解的過(guò)程中出現(xiàn)早熟收斂的現(xiàn)象,史玉回等人又提出了一種基于討論機(jī)制的頭腦風(fēng)暴優(yōu)化算法(discussion mechanism based brain storm optimization algorithm,DMBSO)[22],算法利用一種新的組內(nèi)討論與組間討論機(jī)制,分別控制全局與局部搜索能力。在開(kāi)始搜索最優(yōu)解時(shí)通過(guò)線性減少組間討論時(shí)間和增加組內(nèi)討論的時(shí)間來(lái)增強(qiáng)全局搜索效果,然后通過(guò)精細(xì)搜索得到加強(qiáng),防止過(guò)早收斂。
為降低軟子空間聚類在聚類過(guò)程中的時(shí)間復(fù)雜度且減少噪聲數(shù)據(jù)對(duì)算法的影響,改善已有算法的聚類效果,本文提出一種基于頭腦風(fēng)暴算法優(yōu)化的軟子空間聚類算法(soft subspace clustering based on brain storm optimization algorithm,BSOSSC)。
受MWK-Means、FWASSC 和GNC 算法的啟發(fā),在進(jìn)行軟子空間聚類時(shí),引入指數(shù)系數(shù)來(lái)適配給定的聚類任務(wù),在算法進(jìn)行尋優(yōu)時(shí),將目標(biāo)函數(shù)與搜索策略中的等式約束放松為界約束,從而降低了算法的時(shí)間復(fù)雜度且不影響最終的聚類效果。另外,為了降低噪聲數(shù)據(jù)對(duì)算法性能的影響,特引入了廣義噪聲聚類算法。根據(jù)上述算法思想,本文設(shè)計(jì)如式(8)所示的目標(biāo)函數(shù),以提高算法的聚類效果及對(duì)噪聲數(shù)據(jù)的魯棒性。
目標(biāo)函數(shù)融合了SSC與GNC算法以確保在軟子空間聚類的同時(shí)提高算法的抗噪性能,且保留了FWASSC 算法中將的等式約束放松為界約束的優(yōu)點(diǎn)。其隸屬計(jì)算方法如式(9)所示。
其中,t指代的當(dāng)前迭代次數(shù),α(t)為當(dāng)前迭代次數(shù)與最大迭代次數(shù)MaxIter的關(guān)系,如式(10)所示,η為其控制參數(shù)。
式中,ufuzzy和ucrisp分別表示硬隸屬度與模糊隸屬度,如式(11)和式(12)所示。
模糊隸屬度中變量dij的計(jì)算如式(13)所示,其中,聚類中心點(diǎn)zik如式(14)所示。
當(dāng)聚類個(gè)數(shù)大于等于2時(shí),算法會(huì)根據(jù)指數(shù)p來(lái)適配當(dāng)前聚類任務(wù),彌補(bǔ)FWASSC 算法在聚類任務(wù)數(shù)較多時(shí)而出現(xiàn)聚類效果不精確的缺陷。
DMBSO在初始化種群中對(duì)N個(gè)個(gè)體進(jìn)行評(píng)估,將初始化的N個(gè)個(gè)體進(jìn)行種群聚類,并根據(jù)評(píng)價(jià)結(jié)果選出每組中最優(yōu)個(gè)體作為聚類中心。產(chǎn)生一個(gè)隨機(jī)數(shù)r1來(lái)替換隨機(jī)的聚類中心,實(shí)施組內(nèi)與組間討論,并判斷是否達(dá)到最大討論次數(shù),比較新個(gè)體與對(duì)應(yīng)個(gè)體,將較優(yōu)的個(gè)體予以保留,并調(diào)整組內(nèi)與組間討論次數(shù)的上限值,達(dá)到最大迭代次數(shù)即結(jié)束。由于DMBSO算法能夠兼顧局部搜索與全局搜索,因而在軟子空間聚類中引入DMBSO進(jìn)行求解,實(shí)現(xiàn)流程圖如圖1所示。
本章利用自然圖像數(shù)據(jù)進(jìn)行實(shí)驗(yàn),驗(yàn)證本文所提算法的聚類效果,并與LAC、EWKM、FSC、FWASSC算法進(jìn)行對(duì)比。實(shí)驗(yàn)平臺(tái)及環(huán)境為:操作系統(tǒng),Windows7 旗艦版64 位;處理器,Intel?CoreTMi5-2400 CPU@3.10 GHz;編譯環(huán)境,Matlab2016a。
由于在MR 成像過(guò)程中,受環(huán)境和設(shè)備影響,使信號(hào)的實(shí)部和虛部同時(shí)被非相關(guān)零均值相同方差的高斯噪聲干擾,因而MR 圖像的噪聲常常表現(xiàn)為Rician分布[23],因此本節(jié)的實(shí)驗(yàn)采用人工合成圖像添加Rician 噪聲,如圖2(a)所示。圖2 中,第一列為無(wú)噪聲圖像,第二列的第一行和第二行分別為信噪比為10和20的圖像,其余各列(c)~(h)分別為對(duì)比算法和本文算法的聚類結(jié)果。
從實(shí)驗(yàn)中可以看出LAC、EWKM、FSC、MWK-Means算法對(duì)圖像的噪聲極其敏感,導(dǎo)致結(jié)果中背景與目標(biāo)混淆嚴(yán)重;FWASSC 算法雖基本將背景與目標(biāo)區(qū)分開(kāi)來(lái),但是仍然存在被噪聲污染的現(xiàn)象,而本文算法的結(jié)果中存在的噪點(diǎn)較少,表現(xiàn)出較好的抗噪性能。
為衡量本文算法的抗噪性能,通過(guò)峰值信噪比就對(duì)比算法及本文算法的抗噪性能進(jìn)行分析。峰值信噪比(peak signal to noise ratio,PSNR)[2]的計(jì)算如式(15)所示。
其中,MAX表示像素點(diǎn)的最大值,MSE代表原圖像與分割后的圖像的均方誤差,I為原圖像的像素值。
不同噪聲等級(jí)下抗噪性能對(duì)比如表1 所示。PSNR值越大,算法的抗噪性能越好。
Fig.1 Algorithm implementation flow diagram of this paper圖1 本文算法實(shí)現(xiàn)流程圖
Fig.2 Clustering results of noisy image圖2 含噪聲圖像的聚類結(jié)果
表1 實(shí)驗(yàn)結(jié)果直觀地表達(dá)了算法的抗噪性能。視覺(jué)效果及客觀評(píng)價(jià)指標(biāo)PSNR均表現(xiàn)出本文算法的可行性及有效性。
本節(jié)選取Berkeley計(jì)算機(jī)視覺(jué)組的標(biāo)準(zhǔn)圖庫(kù),用圖3第一列的圖像來(lái)研究分析圖像的分割精度,聚類個(gè)數(shù)分別為3、2、2,實(shí)驗(yàn)結(jié)果如圖3所示。
Table 1 PSNR results at different noise levels表1 不同噪聲水平下PSNR 值
Fig.3 Clustering results of Berkeley natural image圖3 Berkeley自然圖像聚類結(jié)果
為了對(duì)圖像分割效果進(jìn)行評(píng)估,主要從視覺(jué)評(píng)價(jià)及Dice 系數(shù)[15]來(lái)定量評(píng)價(jià)算法的分割性能。Dice系數(shù)的計(jì)算方式如式(16)所示。
其中,A代表標(biāo)準(zhǔn)結(jié)果,B代表分割結(jié)果,N為圖像像素的大小,DC值表示分割結(jié)果與標(biāo)準(zhǔn)結(jié)果的接近程度。通常,DC越接近1,表示分割結(jié)果越準(zhǔn)確,反之亦然。
從圖3 的實(shí)驗(yàn)結(jié)果可以看出,對(duì)比算法LAC、EWKM、FSC 和MWK-Means 分割效果不理想,尤其對(duì)鵝影子的錯(cuò)分現(xiàn)象比較嚴(yán)重,混淆了影子和湖面;FWASSC 和本文算法的分割相對(duì)于前四者較為精確,不但將目標(biāo)的輪廓清晰地分割出來(lái),并且保持了邊緣的完整性,細(xì)節(jié)劃分也比較理想。但因煙花爆炸產(chǎn)生火花時(shí)的隨機(jī)性,從而影響到算法的穩(wěn)定性,使FWASSC 算法的分割精度又比本文算法遜色一些。圖3 中第二行和第三行結(jié)果中目標(biāo)與背景的區(qū)分效果比較直觀。通過(guò)表2 中Dice 系數(shù)評(píng)價(jià)指標(biāo)可以表明這一點(diǎn)。
Table 2 Analysis of segmentation accuracy of algorithm表2 算法分割精度分析
BSOSSC 算法的時(shí)間復(fù)雜度與數(shù)據(jù)個(gè)數(shù)、維度、聚類個(gè)數(shù)以及種群規(guī)模均相關(guān),隸屬度計(jì)算的時(shí)間復(fù)雜度與數(shù)據(jù)個(gè)數(shù)N、聚類數(shù)C及樣本維度D相關(guān),其時(shí)間復(fù)雜度為O(NCD);維度權(quán)值計(jì)算與聚類個(gè)數(shù)及樣本維度相關(guān),其時(shí)間復(fù)雜度為O(CD);廣義噪聲聚類的時(shí)間復(fù)雜度與聚類個(gè)數(shù)N及樣本維度C相關(guān),其時(shí)間復(fù)雜度為O(NC);在聚類過(guò)程中引入BSO 算法,其時(shí)間復(fù)雜度與數(shù)據(jù)個(gè)數(shù)N及迭代次數(shù)T相關(guān),其時(shí)間復(fù)雜度為O(TN),三者在計(jì)算機(jī)執(zhí)行過(guò)程中屬同級(jí)關(guān)系,且T?CN,因此BSOSSC 的時(shí)間復(fù)雜度為O(TN)。表3為對(duì)比算法與本文算法分割圖2和圖3的運(yùn)行時(shí)間對(duì)比表。
由表3可見(jiàn),優(yōu)化算法的引入使得FWASSC和本文算法的運(yùn)行時(shí)間要比LAC、EWKM、FSC和MWK-Means 算法高。又由于頭腦風(fēng)暴優(yōu)化算法的時(shí)間復(fù)雜度低于煙花算法的時(shí)間復(fù)雜度,因此本文算法的整體運(yùn)行時(shí)間得到改善。如果對(duì)于實(shí)時(shí)性要求不是非常高的圖像分割,用相對(duì)較長(zhǎng)的時(shí)間來(lái)?yè)Q取較高的圖像分割精度也具有一定的研究意義。
上章的實(shí)驗(yàn)已驗(yàn)證本文算法在自然圖像上具有較好的聚類效果,本章將其應(yīng)用于臨床數(shù)據(jù),以驗(yàn)證算法對(duì)臨床MR圖像的分割效果。
本章選取如圖4和圖5第一行所示的DICOM格式臨床乳腺M(fèi)R圖像,其中圖4為注入造影增強(qiáng)后的三維T1加權(quán)梯度回波序列圖。圖5中第一列為未注入增強(qiáng)劑的圖像,第2到5列分別為注入增強(qiáng)劑并按時(shí)間序列采集的圖像。圖4和圖5中,紅圈代表腫瘤所在區(qū)域。數(shù)據(jù)采用德國(guó)西門子1.5T標(biāo)準(zhǔn)磁共振掃描儀采集的三維T1加權(quán)梯度回波序列圖。掃描過(guò)程中的各參數(shù)如下:TR=5.6 ms,TE=2.76 ms,層間距0.3 mm,層厚1.2 mm,F(xiàn)OV=34 cm×34 cm,圖像大小為512×512,每次掃描時(shí)間為60 s。分割結(jié)果如圖4(b)~圖4(g)和圖5第二行至第七行所示。
為了更清晰地顯示腫瘤分割結(jié)果,圖4(b)~圖4(g)中僅保存了與腫瘤相關(guān)的一側(cè)乳房的分割情況。從圖中可以看出FSC 算法和MWK-Means 算法基本沒(méi)有分出乳房的邊緣和區(qū)域,僅分出部分腫瘤(圖4中的圓點(diǎn));LAC 算法雖然把腫瘤分割出來(lái)了,但出現(xiàn)過(guò)分割,將很多正常組織和腫瘤劃為一類,分割效果也不理想;EWKM 對(duì)于腫瘤區(qū)域的分割效果相對(duì)較好,仍有大部分正常組織區(qū)域錯(cuò)分現(xiàn)象;FWASSC算法雖已基本分割出腫瘤,但仍存在過(guò)分以及邊緣錯(cuò)分現(xiàn)象;本文算法的聚類分割結(jié)果不僅劃分出了腫瘤區(qū)域,而且周圍其他區(qū)域也基本劃分正確,輪廓也較為清晰,顯然本文算法性能要好一些。
從圖5 中可以看出:由于沒(méi)有增強(qiáng)的圖像(第一列)腫瘤部位比較暗,不容易分割,除本文算法分出少量腫瘤區(qū)域外,其他五種算法都將腫瘤區(qū)域與正常組織劃分為一類,分割效果很不理想。后面四列隨著增強(qiáng)劑的注入,腫瘤區(qū)域亮度加大,分割的難度相對(duì)有所下降,但LAC 算法也依然僅分割出了少量腫瘤區(qū)域,EWKM 算法和MWK-Means 算法更是嚴(yán)重混淆了腫瘤區(qū)域與其他組織區(qū)域。相比之下,F(xiàn)SC和FWASSC 算法雖然沒(méi)有完整地分割出腫瘤區(qū)域,但已分出區(qū)域的少量輪廓,分割結(jié)果有了很大的提升。再看本文算法的分割結(jié)果,盡管還有少量腫瘤區(qū)域漏分,但有了較為清晰的輪廓,能夠有效地分辨出腫瘤區(qū)域和周圍其他組織,并且分割出了更多的細(xì)節(jié),表明本文算法對(duì)臨床MR 圖像的分割也有效。由此可見(jiàn),本文算法在臨床乳腺M(fèi)R的診斷上有一定的應(yīng)用價(jià)值。
Table 3 Running time of various algorithms to divide Fig.2 and Fig.3表3 各種算法分割圖2與圖3的運(yùn)行時(shí)間
Fig.4 Clustering results of clinical breast MR image圖4 臨床乳腺M(fèi)R圖像聚類結(jié)果
Fig.5 Segmentation results of breast MR image under different sequences圖5 不同序列下乳腺M(fèi)R圖像分割結(jié)果
本文提出了一種基于頭腦風(fēng)暴算法優(yōu)化的乳腺M(fèi)R圖像軟子空間聚類算法。為提高噪聲聚類性能,算法首先將廣義噪聲聚類函數(shù)引入到目標(biāo)函數(shù)中,并用隸屬度計(jì)算方法來(lái)尋找簇類所在子空間;然后在子空間聚類時(shí)用給定指數(shù)來(lái)適配聚類任務(wù);最后在聚類過(guò)程中運(yùn)用頭腦風(fēng)暴算法進(jìn)行優(yōu)化,有效權(quán)衡局部與全局的搜索能力,在一定程度上,聚類性能得到改善。實(shí)驗(yàn)結(jié)果表明,本文算法不僅在自然圖像聚類方面具有較高的精度與魯棒性,而且在臨床醫(yī)學(xué)MR圖像聚類方面,可以更有效地實(shí)現(xiàn)MR圖像的分割與去噪。