范懷玉,馬軍山,劉玉堂,杜彩虹
(1.上海理工大學(xué) 光電信息與計(jì)算機(jī)工程學(xué)院,上海 200093;2.濟(jì)寧醫(yī)學(xué)院 醫(yī)學(xué)信息工程學(xué)院,山東 日照 276826)
近年來(lái),乳腺癌已成為世界范圍內(nèi)導(dǎo)致女性死亡的主要原因[1],并且死亡率有逐年上升的趨勢(shì)。該病最好的預(yù)防和治療方法就是借助于乳腺X射線成像或者乳腺超聲等檢查工具,對(duì)可疑病灶早發(fā)現(xiàn)、早治療。乳腺X射線成像技術(shù)被稱為乳腺篩查的黃金標(biāo)準(zhǔn),被廣泛應(yīng)用到乳腺檢查中,但是該技術(shù)不可避免地存在一個(gè)高假陽(yáng)性率問(wèn)題。研究者已經(jīng)發(fā)現(xiàn),經(jīng)由乳腺X射線成像技術(shù)檢出的腫塊中有超過(guò)60%的實(shí)為良性腫塊[2-3]。同時(shí)檢測(cè)費(fèi)用較高并有一定的電離輻射。相比而言,乳腺超聲因其是一種費(fèi)用低、非侵襲、可攜式以及多用途的檢測(cè)儀器,在早期的乳腺篩查中被廣泛應(yīng)用[4]。
隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展和圖像處理技術(shù)的不斷完善,計(jì)算機(jī)輔助診斷( computer aided diagnosis,CAD)能夠幫助醫(yī)生提高診斷準(zhǔn)確率,使得診斷更加高效、實(shí)用、智能和自動(dòng)化[5-6]。在眾多超聲乳腺圖像處理方法中,圖像的分割是非常重要的一個(gè)關(guān)鍵環(huán)節(jié),分割結(jié)果不僅能夠提供給醫(yī)生一個(gè)更為直觀的判斷,而且為后續(xù)乳腺腫瘤的良惡性判別打下良好基礎(chǔ)。但是超聲圖像噪聲斑點(diǎn)多、對(duì)比度差、組織間的邊界模糊不清等不利因素,使得感興趣區(qū)域(the region of interests,ROI)的分割變得非常困難,經(jīng)常要借助于專家的手動(dòng)分割,這不但費(fèi)時(shí)費(fèi)力,分割結(jié)果也依賴專家的經(jīng)驗(yàn),也就失去了CAD高效、智能和自動(dòng)化的初衷。研究人員嘗試?yán)脜^(qū)域增長(zhǎng)的方法來(lái)自動(dòng)分割ROI,并取得了不錯(cuò)的結(jié)果[7-8]。區(qū)域增長(zhǎng)自動(dòng)分割的關(guān)鍵一步就是種子點(diǎn)或者種子區(qū)域的選擇,如果選擇在腫瘤的外面,則分割結(jié)果注定是失敗的。為防止分割錯(cuò)誤,在利用區(qū)域增長(zhǎng)方法進(jìn)行分割的時(shí)候,大都是提前人工手工選擇種子點(diǎn)。為使得超聲乳腺腫瘤區(qū)域分割完全的自動(dòng)化,開(kāi)展一種自動(dòng)而又準(zhǔn)確的種子點(diǎn)(或者區(qū)域)選擇的研究是很有必要的,目前在這方面開(kāi)展的工作比較少[9]。文獻(xiàn)[10]提出了用灰度共生矩陣特征和游程特征的方法自動(dòng)地選擇腫塊的種子點(diǎn),如果種子點(diǎn)的所有游程特征和它的領(lǐng)域的點(diǎn)相等,則該點(diǎn)就被認(rèn)作種子點(diǎn)。文獻(xiàn)[9]在利用超聲圖像的灰度信息的同時(shí)也利用了圖像的空間信息,計(jì)算出圖像灰度直方圖的所有局域最小值,設(shè)定閾值從最小的局域最小值開(kāi)始增大,取出病變部分和背景部分,當(dāng)目標(biāo)區(qū)域和背景區(qū)域的比值大于等于0.1時(shí),閾值不再增大,得到的連通區(qū)域在圖像中心位置的被認(rèn)為是種子區(qū)域。雖然該方法的真陽(yáng)性(true positive, TP)率達(dá)到了 9 5.24% 的良好結(jié)果,但是如果病變出現(xiàn)在圖像的其他位置,算法的魯棒性將會(huì)受到影響。本文根據(jù)超聲腫瘤圖像的結(jié)構(gòu)特點(diǎn)和灰度分布,對(duì)圖像進(jìn)行不同閾值下的四叉樹(shù)分解,利用約束條件定位初始目標(biāo)區(qū)域和臨時(shí)種子區(qū)域,當(dāng)臨時(shí)種子區(qū)域在初始目標(biāo)區(qū)域內(nèi)時(shí),臨時(shí)種子區(qū)域即為要尋找的種子區(qū)域,再對(duì)種子區(qū)域內(nèi)的各點(diǎn)的灰度值進(jìn)行排序,灰度值最小的點(diǎn)被認(rèn)為是種子點(diǎn)。
因超聲醫(yī)學(xué)圖像灰度的對(duì)比度低、局部細(xì)節(jié)上沒(méi)有明顯的灰度差別等缺點(diǎn)[11],使得以原始灰度為目標(biāo)的處理方法較為困難?;叶戎狈綀D均衡的圖像增強(qiáng)方法常用來(lái)對(duì)超聲醫(yī)學(xué)圖像進(jìn)行增強(qiáng)[12]。其基本思想是把原始圖像的直方圖變換為均勻分布的形式,增加了像素灰度值的動(dòng)態(tài)范圍從而可達(dá)到增強(qiáng)圖像整體對(duì)比度的效果。超聲乳腺圖像被直方圖均衡化后,圖像的灰度分布被歸一化到[0,1],結(jié)果如圖1所示。
正常的乳腺超聲圖像由淺至深可分五層結(jié)構(gòu):最外層為皮膚,厚2~3 mm,呈強(qiáng)回聲帶;第二層為皮下脂肪,呈低回聲,其內(nèi)可見(jiàn)三角形回聲,為CooPer韌帶聲像;第三層為腺體層,厚1.0 cm ± 3.0 cm,呈低回聲,其中夾雜有點(diǎn)狀及條狀回聲,為纖維組織、脂肪及導(dǎo)管結(jié)構(gòu);第四、五層為胸肌及肋間肌,一般易于分辨,呈條狀回聲[13]。腫瘤在超聲圖像中一般表現(xiàn)為低回聲區(qū),處于腺體層區(qū)域。
四叉樹(shù)數(shù)據(jù)結(jié)構(gòu)是一種對(duì)柵格數(shù)據(jù)的壓縮編碼方法[14]。該方法是將一幅圖像等分為四個(gè)子塊,并逐塊檢查子塊的灰度;如果某子塊內(nèi)所有的灰度值小于指定閾值,則這個(gè)子塊就不再繼續(xù)等分,否則,該子塊繼續(xù)分解為四個(gè)子塊,直到每個(gè)子塊的灰度值均小于指定閾值。在我們運(yùn)用四叉樹(shù)方法對(duì)乳腺超聲圖像進(jìn)行分解之前,先將圖像尺寸統(tǒng)一放縮為 5 12×512 ,閾值不同,圖像的分解程度不同,圖像將會(huì)被分解成 2 56×256 、128×128、 6 4×64 、 3 2×32 、 1 6×16 、 8 ×8 、 4 ×4 、2×2、 1 ×1 不同規(guī)格大小的子塊,子塊的規(guī)格、數(shù)量和位置會(huì)因圖像的灰度值分布不同而改變。在閾值一定的情況下,因腫瘤內(nèi)部、第四層和第五層的胸肌及肋間肌都屬于低回聲區(qū)域,該位置的圖像灰度值較小,并且灰度值變化相對(duì)平緩,規(guī)格較大的子塊會(huì)出現(xiàn)在此區(qū)域。而腫瘤邊緣和其他區(qū)域圖像的灰度值較大,且灰度值變化相對(duì)劇烈,該區(qū)域會(huì)出現(xiàn)規(guī)格較小的子塊。因此定位腫瘤區(qū)域就轉(zhuǎn)化為尋找規(guī)格最大的子塊。
對(duì)于不同超聲乳腺腫瘤圖像,要實(shí)現(xiàn)自動(dòng)定位腫瘤區(qū)域進(jìn)而在其內(nèi)部定位種子點(diǎn),如何指定閾值是最為關(guān)鍵的環(huán)節(jié)。閾值太大,規(guī)格最大的子塊不只是包含腫瘤區(qū)域,為定位種子點(diǎn)帶來(lái)困難;閾值太小,分解后規(guī)格最大的子塊有可能不在腫瘤區(qū)域。超聲乳腺圖像被直方圖均衡化后,圖像的灰度分布被歸一化到[0,1],根據(jù)最大類間方差法,能求出每幅圖像的最佳閾值。由實(shí)驗(yàn)結(jié)果可以得出,不同圖像的最佳閾值不同,但均處于[0.4,0.6]。為了能夠準(zhǔn)確定位腫瘤區(qū)域,必須在此區(qū)間選定一個(gè)值,通過(guò)迭代使閾值動(dòng)態(tài)變化,以滿足不同圖像定位腫瘤區(qū)域的需要。
設(shè)閾值為 T =0.5/2n-1(為自然數(shù)),算法的流程描述如下。
圖1 被均衡圖像的灰度變化Fig. 1 The grayscale changes of the equalized images
(3)如果臨時(shí)種子區(qū)域在初始目標(biāo)區(qū)域內(nèi),則臨時(shí)種子區(qū)域即為要尋找的種子區(qū)域,對(duì)種子區(qū)域內(nèi)所有的點(diǎn)的灰度值進(jìn)行大小排序,灰度值最小的點(diǎn)即為種子點(diǎn)位置。
否則,臨時(shí)種子區(qū)域變?yōu)槌跏寄繕?biāo)區(qū)域。返回步驟(2)并賦值對(duì)圖像再次進(jìn)行四叉樹(shù)分解,找到臨時(shí)種子區(qū)域。重復(fù)步驟(3)。
用105幅超聲乳腺腫瘤圖像(其中包括53幅惡性腫瘤圖像和52幅良性腫瘤圖像)來(lái)檢驗(yàn)所提出的算法是否有效,這些圖像都經(jīng)過(guò)了組織活檢,均證實(shí)了其良惡性。所有圖像的處理均采用軟件MATLAB 2010,計(jì)算機(jī)的配置為英特爾處理器2.70 GHz和8 G內(nèi)存。
通過(guò)一幅超聲乳腺腫瘤圖像尋找種子點(diǎn)的過(guò)程來(lái)進(jìn)一步說(shuō)明我們提出的算法流程。
第一次分解,取閾值 T1=0.5 ,分解后圖像如圖2(a)所示,排除與圖像邊緣相連的子塊,最大子塊規(guī)格為 6 4×64 ,如圖中標(biāo)示A的子塊,將其視為初始目標(biāo)區(qū)域。重新對(duì)圖像進(jìn)行第二次分解,閾值變?yōu)?T2=0.25 ,分解后圖像如圖2(b)所示,排除與圖像邊緣相連的子塊后,最大規(guī)格子塊( 3 2×32 )如圖中標(biāo)示的B、C、D、E和F子塊,對(duì)這五個(gè)子塊分別計(jì)算其內(nèi)部所有點(diǎn)的灰度值之和,發(fā)現(xiàn)C子塊的灰度值之和最小,將其暫定為臨時(shí)種子區(qū)域。但臨時(shí)種子區(qū)域不在初始目標(biāo)區(qū)域內(nèi)。根據(jù)算法流程的步驟(3),將臨時(shí)種子區(qū)域改為初始目標(biāo)區(qū)域,第三次對(duì)圖像進(jìn)行重新分解,閾值變?yōu)?T3=0.125 ,分解后圖像如圖2(c)所示,最大子塊共有29個(gè),規(guī)格為 1 6×16 ,對(duì)所有該規(guī)格子塊(排除與圖像邊緣相連的子塊)分別計(jì)算其內(nèi)部所有點(diǎn)的灰度值之和,發(fā)現(xiàn)標(biāo)示G的子塊的最小的灰度值之和最小,將其暫定為臨時(shí)種子區(qū)域。此時(shí)G子塊處于初始目標(biāo)區(qū)域C子塊內(nèi),所以G子塊被認(rèn)定為種子區(qū)域,對(duì)G子塊區(qū)域內(nèi)所有的點(diǎn)的灰度值進(jìn)行大小排序,灰度值最小的點(diǎn)即為種子點(diǎn)位置,如圖2(d)標(biāo)示星號(hào)的位置。在軟件MATLAB 2010環(huán)境下,每次分解后所有子塊的位置坐標(biāo)均能獲知,亦即能夠得到種子點(diǎn)在圖像中的位置。實(shí)驗(yàn)結(jié)果表明,良性腫瘤圖像因形狀規(guī)則、邊界清晰、邊緣光滑、內(nèi)部回聲均勻的特點(diǎn),種子點(diǎn)均能夠定位在腫瘤內(nèi)部,而惡性超聲腫瘤圖像因形態(tài)不規(guī)則、邊緣呈毛刺狀、邊緣有浸潤(rùn)、腫瘤內(nèi)部回聲欠均勻、后方回聲呈現(xiàn)衰減暗區(qū)等特點(diǎn),使得我們的算法在對(duì)惡性腫瘤圖像進(jìn)行種子點(diǎn)的選擇時(shí),有六幅圖像定位在了腫瘤的外部。本文的方法和文獻(xiàn)[9]方法的性能如表1所示。
將種子點(diǎn)定位于腫瘤內(nèi)部,并且所消耗的時(shí)間少,以滿足實(shí)時(shí)在線分割的需求,也是我們?cè)O(shè)計(jì)算法的初衷。從圖像預(yù)處理到定位種子點(diǎn)整個(gè)過(guò)程所用時(shí)間如表2所示。用單一圖像來(lái)比較,手動(dòng)定位更有優(yōu)勢(shì),但是在連續(xù)定位多幅圖像的種子點(diǎn)時(shí),我們提出的算法更為快捷。
在超聲乳腺腫瘤圖像中,腫瘤是單一目標(biāo),并且腫瘤內(nèi)部灰度變化較為平緩,腫瘤周?chē)叶茸兓^為劇烈。正是利用了圖像的這一特征,通過(guò)四叉樹(shù)分解的算法能夠得到:在灰度變化劇烈的區(qū)域,圖像分裂得越厲害,塊的規(guī)格越小;反之,越是灰度較為均勻的區(qū)域,灰度變化平緩,分裂的塊的規(guī)格越大,從而實(shí)現(xiàn)了種子點(diǎn)的自動(dòng)快速定位。在提出的算法中,要求腫瘤區(qū)域與圖像邊緣不相連接(無(wú)論它處在圖像的上部還是下部),其實(shí)只要是獲取超聲圖像的探頭位于腫瘤的正上方,這一要求就能得到滿足。通過(guò)對(duì)種子區(qū)域錯(cuò)選在腫瘤區(qū)域之外的六幅圖像進(jìn)行分析,我們發(fā)現(xiàn)腫瘤的下方均有明顯的、呈現(xiàn)衰減暗區(qū)的后方回聲,對(duì)于這種類型的圖像,即使種子區(qū)域選擇在腫瘤內(nèi)部,因有后方衰減暗區(qū)的存在,后續(xù)的區(qū)域增長(zhǎng)也很難將腫瘤分割出來(lái)。這既是我們的算法的不足之處,也是我們下一步努力改進(jìn)的方向。
圖2 定位種子點(diǎn)的流程示意圖Fig. 2 The process diagram of locating the seed
表1 算法的性能Tab. 1 Performance of the method
表2 定位圖像種子點(diǎn)各階段所消耗的時(shí)間Tab. 2 The consuming time in the stages for locating the seed piont in images