劉文振,傅惠南,何金彬
(廣東工業(yè)大學(xué) 機(jī)電工程學(xué)院,廣東 廣州 510006)
輪廓特征作為圖像最重要的特征之一,廣泛應(yīng)用于圖像分割、圖像分類、圖像匹配、模式識(shí)別等領(lǐng)域[1]。邊緣檢測(cè)技術(shù)是基于邊緣的輪廓提取算法的核心部分,邊緣檢測(cè)結(jié)果的好壞直接影響著輪廓提取的好壞,因此它一直都是研究熱點(diǎn)。
圖像濾波算法是以損害圖像真實(shí)信息為代價(jià)達(dá)到濾除噪聲的效果(通常稱為圖像失真),圖像失真的程度直接影響后續(xù)邊緣提取的準(zhǔn)確度。文獻(xiàn)[2]采用雙邊濾波算法,通過(guò)控制雙邊濾波器的權(quán)重系數(shù)來(lái)減少信息的丟失,以提高對(duì)原圖像估計(jì)的準(zhǔn)確性;文獻(xiàn)[3]將圖像的稀疏梯度場(chǎng)引入非局部平均算法進(jìn)行濾波來(lái)控制信息的丟失,以提高對(duì)原圖像估計(jì)的準(zhǔn)確性,然而基于局部像素灰度加權(quán)平均估計(jì)原圖像信息的方法,其準(zhǔn)確性總是差強(qiáng)人意。邊緣提取算法進(jìn)行無(wú)區(qū)分性的全局圖像梯度檢測(cè),然而基于邊緣的輪廓提取算法進(jìn)行邊緣提取時(shí),期望避免檢測(cè)到圖像中過(guò)于瑣碎的細(xì)節(jié),以減少輪廓提取的干擾信息。文獻(xiàn)[4]采用計(jì)算高斯加權(quán)距離圖的方法統(tǒng)一背景灰度從而到達(dá)抑制細(xì)節(jié)信息的目的,然而高斯加權(quán)距離圖會(huì)導(dǎo)致邊緣粗化,邊緣定位不準(zhǔn)確。
基于上述問(wèn)題,以輪廓提取為目的,提出了一種結(jié)合RPCA濾波和自適應(yīng)Mean-shift聚類的圖像邊緣檢測(cè)算法。
魯棒主成分分析法(robust principal component analysis,RPCA)是一種分析和處理數(shù)據(jù)的統(tǒng)計(jì)工具,該方法由學(xué)者Wright[5]提出,是對(duì)主成分分析法[6](PCA)的改進(jìn)。該算法原理是將一個(gè)高維數(shù)據(jù)矩陣D分解為一個(gè)相關(guān)性高的低秩矩陣A和一個(gè)稀疏矩陣E之和,其模型可以描述為:
min rank(A)+λ‖E‖0
(1)
滿足條件:A+E=D。其目標(biāo)函數(shù)是低秩矩陣A和稀疏矩陣E零范數(shù),λ表示噪聲所占的權(quán)重。問(wèn)題1是一個(gè)非確定多項(xiàng)式難題,因此需要松弛此優(yōu)化問(wèn)題的目標(biāo)函數(shù)。由于一個(gè)矩陣的秩r與它的非零奇異值的個(gè)數(shù)相等,可以用矩陣的核范數(shù)近似代替矩陣的秩,且矩陣的0范數(shù)和1范數(shù)在一定條件下等價(jià),故將問(wèn)題1松弛成如下的凸優(yōu)化問(wèn)題。
min‖A‖*+λ‖E‖1
(2)
對(duì)于凸優(yōu)化問(wèn)題2,不斷有學(xué)者提出各種優(yōu)化算法,可以參考文獻(xiàn)[7-8],文中選用非精確增廣拉格朗日乘子法(IALM)。IALM是增廣拉格朗日乘子法[9](ALM)的改進(jìn)算法,具有更加簡(jiǎn)單、收斂速度更快的特點(diǎn),且精確度較高,因而得到了廣泛的應(yīng)用。IALM算法原理如下:
構(gòu)造增廣拉格朗日函數(shù):
L(A,E,Y,u)=‖A‖*+λ‖E‖1+〈Y,D-A-
(3)
其中,u為懲罰參數(shù);Y為拉格朗日乘子。
ALM每次迭代最小化增廣拉格朗日函數(shù),得到新的Xk,通過(guò)Xk和u來(lái)更新乘子Yk,然后繼續(xù)求解下一個(gè)Xk,最后使得Xk收斂到原問(wèn)題的最優(yōu)解[10]。采用交替更新的方法來(lái)最小化函數(shù)L,先固定E和Y,求一個(gè)使函數(shù)L最小化的A,然后固定A和Y,求一個(gè)使函數(shù)L最小化的E,如此迭代就可以收斂到這個(gè)子問(wèn)題的最優(yōu)解,該算法為精確增廣拉格朗日乘子法(EALM)。但在實(shí)際應(yīng)用中,為了獲得更高的計(jì)算效率,不必每一次迭代都求出精確解,只需要更新A和E各一次得到子問(wèn)題的一個(gè)近似解,就可使得算法最終收斂到原問(wèn)題的最優(yōu)解,此算法即為IALM。
實(shí)際中圖像噪聲的比例一般不超過(guò)10%,因此可以設(shè)定噪聲權(quán)重范圍λ=0~0.1。濾波算法往往會(huì)導(dǎo)致圖像的像素信息損失但不會(huì)影響圖像的結(jié)構(gòu)信息,基于此,針對(duì)圖像濾波算法文中定義了一種圖像保真程度的度量指標(biāo)P,并采用迭代法確定RPCA算法的最優(yōu)權(quán)重因子。
圖像失真度P的定義如下:
其中,So為原圖像;Sf為濾波后圖像;N為圖像像素總數(shù)。文中設(shè)定初值λ=0,步長(zhǎng)0.01進(jìn)行循環(huán)迭代,每次迭代計(jì)算圖像保真度Pi并保存,迭代結(jié)束后求得保真度的最大值,該最大值對(duì)應(yīng)的λ即為最優(yōu)。
下面從濾波效果和圖像保真兩方面對(duì)RPCA算法進(jìn)行分析。圖1為RPCA算法的濾波效果,觀察圖(c)可知RPCA算法能很好地濾除噪聲,同時(shí)與圖(a)很接近,具有很好的保真效果。
圖1 RPCA濾波效果
文中將高斯濾波、雙邊濾波和RPCA濾波進(jìn)行比較,觀察三種算法隨椒鹽噪聲密度逐漸增加時(shí)圖像保真度(1-P)的變化趨勢(shì),如圖2所示。由圖2可知,對(duì)于不同程度的噪聲干擾,RPCA濾波算法的保真度均優(yōu)于高斯濾波和雙邊濾波算法;隨著噪聲密度的增加,高斯濾波和雙邊濾波的保真度大幅下降,而RPCA濾波算法變化平緩,即面對(duì)較大程度的噪聲干擾,RPCA算法仍具有良好的保真度。
圖2 三種算法的保真度變化趨勢(shì)
Mean-shift(MS)算法是一種非參數(shù)核密度梯度估計(jì)的高效迭代算法,由Fukunaga和Hosteler等[11]在1975年提出,后由Cheng[12]對(duì)其進(jìn)行推廣,而后由Comaniciu等[13]將其成功應(yīng)用到圖像處理領(lǐng)域。它的基本原理可以表述為:給定d維空間Rd中的n個(gè)樣本點(diǎn)xi(i=1,2,…,n),在點(diǎn)x處的Mean-shift向量的基本形式定義為:
(5)
其中,k表示落在高維球空間的樣本點(diǎn)個(gè)數(shù);Sh表示在一個(gè)半徑為h的高維球且滿足Sh(x)={y:(y-x)T(y-x)≤h2}的點(diǎn)的集合。
從式5可以發(fā)現(xiàn),無(wú)論樣本點(diǎn)xi離x的遠(yuǎn)近,對(duì)最終計(jì)算Mh(x)的貢獻(xiàn)相等??紤]到實(shí)際情況中樣本點(diǎn)xi離x越近,對(duì)估計(jì)x周圍的統(tǒng)計(jì)特性貢獻(xiàn)越大,所以在計(jì)算Mh(x)時(shí)考慮距離的影響,引入加權(quán)平均的概念[14],即引入核函數(shù);同時(shí)考慮到不同樣本點(diǎn)的重要性不一樣,對(duì)每個(gè)樣本引入一個(gè)權(quán)重,實(shí)現(xiàn)對(duì)Mean-shift的擴(kuò)展,擴(kuò)展后如下:
(6)
其中,GH(xi-x)=|H-1/2|(H-1/2(xi-x))G,G(x)是一個(gè)單位核函數(shù),w(xi)≥0為每個(gè)樣本點(diǎn)的權(quán)重系數(shù),H為帶寬矩陣。文中將帶寬矩陣H限定為一個(gè)單位矩陣,即H=h2I;認(rèn)為每個(gè)樣本點(diǎn)的重要性一樣,即w(xi)≡1;同時(shí)選取G(x)為單位高斯核函數(shù),最終表達(dá)式如下:
(7)
Mean-shift算法步驟可以描述為:
(1)設(shè)定初始中心點(diǎn)x和容許誤差ε;
(2)迭代計(jì)算以x為中心給定半徑r內(nèi)所有數(shù)據(jù)的mh(x),若mh(x)-x>ε,則以Mh(x)向量的終點(diǎn)作為新的中心點(diǎn)重新計(jì)算mh(x),否則迭代結(jié)束,把mh(x)賦值給x。
由Mean-shift算法原理可得,在二維圖像中高維球空間將投影為圓形區(qū)域,并統(tǒng)計(jì)區(qū)域中所有像素點(diǎn)信息,尋找類中心點(diǎn),將其像素值代替圓心點(diǎn)的像素值。對(duì)于邊緣區(qū)域,若區(qū)域半徑較小,則類中心的像素值主要由邊緣點(diǎn)貢獻(xiàn),此時(shí)可以很好地保留邊緣;對(duì)于細(xì)節(jié)信息豐富的區(qū)域,若區(qū)域半徑較大,則類中心的像素值主要由平滑區(qū)域點(diǎn)貢獻(xiàn)。此時(shí)可以抑制細(xì)節(jié)。
因此,文中引入均值-標(biāo)準(zhǔn)差之比對(duì)Mean-shift算法進(jìn)行改進(jìn),使其能自適應(yīng)區(qū)分邊緣區(qū)域和細(xì)節(jié)信息豐富的區(qū)域。算法流程如下:
(1)設(shè)定區(qū)域半徑的最大值rmax和半徑初值r=2;
(2)計(jì)算圖像的像素均值μ和標(biāo)準(zhǔn)差σ,得到均值-標(biāo)準(zhǔn)差之比β0=μ/σ;
(3)以半徑r為2,步長(zhǎng)為1進(jìn)行迭代,每一次迭代計(jì)算半徑r區(qū)域的均值-標(biāo)準(zhǔn)差之比βi。若βi>β0或r>rmax則迭代結(jié)束,否則區(qū)域半徑增大1繼續(xù)迭代。
截取Lena圖像帽子區(qū)域?qū)ean-shift算法性能進(jìn)行分析,圖3為算法處理前后效果圖和三維直方圖對(duì)比。與圖(a)相比,圖(b)中外輪廓線1和主要的邊緣線3仍然存在,而區(qū)域2、4的條紋狀紋理則消失不見(jiàn);通過(guò)三維直方圖(c)、(d)的對(duì)比可以更加直觀地體現(xiàn)這種特性,圖(d)中灰度變化劇烈的輪廓1、邊緣3與圖(c)相比沒(méi)有變化,而灰度變化平緩的區(qū)域2、4與圖(c)相比,尖峰和溝壑均消失,該區(qū)域顯得更加平滑。通過(guò)上述對(duì)比分析發(fā)現(xiàn),MS算法能準(zhǔn)確區(qū)分邊緣和細(xì)節(jié)信息,在抑制圖像中瑣碎細(xì)節(jié)的同時(shí)并不會(huì)破壞原有的輪廓和邊緣信息。
圖3 算法處理前后效果圖和三維直方圖對(duì)比
實(shí)驗(yàn)采用MATLAB 2014完成,選取幾種不同類型圖像,包括人物、建筑、植物、風(fēng)景。因Canny算子具有較好的信噪比和高定位性能等優(yōu)點(diǎn),是評(píng)價(jià)邊緣檢測(cè)效果優(yōu)劣與否的標(biāo)準(zhǔn)[15],將其與文中算法的邊緣檢測(cè)效果進(jìn)行對(duì)比分析。如圖4所示,每類圖從左到右為原圖、噪聲圖、文中算法邊緣圖和Canny算子邊緣圖。
在人物圖中,文中算法邊緣圖的地面紋理信息消失,而人物和攝像機(jī)的輪廓和Canny算子邊緣圖相同;在建筑圖中,文中算法邊緣圖屋頂和屋檐的細(xì)節(jié)信息消失,而房屋的整體結(jié)構(gòu)輪廓和Canny算子邊緣圖相同;在植物圖中,文中算法邊緣圖的背景和花瓣的細(xì)節(jié)信息消失,而花瓣和花蕊的輪廓和Canny算子邊緣圖相同;在風(fēng)景圖中,文中算法邊緣圖的石頭上和海面上的細(xì)節(jié)信息消失,而石頭和帆船的輪廓和Canny算子邊緣圖相同。
通過(guò)上述對(duì)比分析可得,文中算法繼承了Canny高定位性能、虛假邊緣抑制等優(yōu)點(diǎn),能準(zhǔn)確提取物體的輪廓和主要邊緣,同時(shí)在邊緣檢測(cè)時(shí)能有效抑制圖像細(xì)節(jié)信息,對(duì)各種類型的圖像均有效,具有普遍適用性。
圖4 算法對(duì)比
文中提出了一種結(jié)合RPCA和自適應(yīng)Mean-shift的圖像邊緣提取算法。該算法能有效排除噪聲干擾,實(shí)現(xiàn)對(duì)原圖像的最優(yōu)估計(jì),提高邊緣檢測(cè)準(zhǔn)確性;能有效抑制圖像細(xì)節(jié)信息,檢測(cè)圖像中主要邊緣信息;能適應(yīng)不同類型的圖像,具有普遍適用性,為目標(biāo)識(shí)別、物體檢測(cè)、尺寸測(cè)量等領(lǐng)域提供了良好的預(yù)處理算法。