王濤,徐婭萍,亢海龍,等
圖像二值化是應(yīng)用最廣泛的圖象分割技術(shù),在自動目標識別、圖象分析、文本增強以及OCR等圖像處理中得到廣泛應(yīng)用。現(xiàn)有的二值化方法大多屬于閾值化方法,主要有全局閾值法、局部閾值法及動態(tài)閾值法[1]。
(1) 全局閾值法 是指整個圖像采用單一閾值(全局閾值)T進行圖像二值化。一般由圖像的直方圖或灰度的空間分布,確定一個全局閾值T,將圖像的每個像素的灰度值與T進行比較。若大于T,則取為前景色;否則,取為背景色。
(2) 局部閾值法 由當前像素灰度值與該像素周圍點局部灰度特征來確定像素的閾值。局部閾值選取,一般將圖像劃分為若干子像,在每個子圖像區(qū)域上使用整體閾值法,從而可以構(gòu)成整幅圖像的局部閾值法。
(3) 動態(tài)閾值法 當光照不均勻、或者背景灰度變化較大等情況時,必須根據(jù)像素的坐標位置關(guān)系,自動確定不同閾值,實施動態(tài)的閾值確定。該法的閾值選擇,不僅取決于該像素及周圍像素的灰度值,而且還與該像素的坐標位置有關(guān)。
通常來說,全局閾值化方法實現(xiàn)簡單,對于具有明顯雙峰直方圖的圖像效果明顯,但對于低對比度和光照不均勻的圖像效果不佳,因而應(yīng)用范圍受到極大限制。局部閾值法則能夠適應(yīng)較為復(fù)雜的情況,比全局閾值法有更為廣泛的應(yīng)用。但它往往忽略了圖像的邊界特征信息,使得原圖像中的一些不同區(qū)域在二值化后變成了一塊大區(qū)域,造成二值化結(jié)果圖像某些重要信息的丟失。動態(tài)閾值法充分考慮了像元的鄰域特征,能夠根據(jù)圖像的不同背景情況自適應(yīng)地改變閾值,可較精確地提取出二值圖像,但它過渡地夸大了像元的鄰域灰度的變化,會把不均勻灰度分布的背景分割到目標中去,帶來許多不應(yīng)出現(xiàn)的假目標。
對于低對比度、不均勻光照圖像來說,圖像中目標物體輪廓可能是模糊的,但還可分辨出來,用邊緣檢測器還可檢測出來,此時用普通的閾值化方法可能會丟失目標的細節(jié)信息,因此本文使用了一種新的二值化圖像方法 - 基于邊緣特征的二值化方法。
本文所提出的圖像二值化算法,關(guān)鍵之一在于圖像邊緣的提取。常用的幾種用于邊緣檢測的算子,有Roberts,Sobel,Prewitt,LoG和Laplacian等。這些算子的主要缺點是對噪聲敏感,而在實際圖像中噪聲是難以避免的。
Canny邊緣提取方法是由John Canny在1986年首先提出的[2],之后迅速成為邊緣提取的一種重要方法。Canny算子充分反映了最優(yōu)邊緣檢測器的數(shù)學特性,是對信噪比與定位能力的最優(yōu)化逼近算子,廣泛應(yīng)用于圖像處理和模式識別問題中。Lee等人[3],將Canny算子用于人臉識別中,成功地實現(xiàn)了人臉下額區(qū)域同頸部的分離;Ali等人[4]將canny算子用于遠程傳感圖像的去噪聲和特征提取上;這些研究表明,Canny算子用于邊緣提取可取得較好的效果。
Canny算子的邊緣檢測最優(yōu)性與以下標準有關(guān):
(1) 好的信噪比, 即非邊緣點判為邊緣點或?qū)⑦吘夵c判為非邊緣點的概率低; 信噪比的數(shù)學表達式為:
若信噪比越大,則邊緣提取質(zhì)量越好。
(2) 好的定位性能, 即檢測出的邊緣點要盡可能在實際邊緣的中心; 定位精度的表達式為:
Location的值越大,則定位精度就越大。
(3) 對單一邊緣具有唯一響應(yīng), 并且對虛假邊緣響應(yīng)應(yīng)得到最大抑制。
本文利用鑰匙齒邊圖像(如圖1所示)對以上算子進行了對比實驗分析:
(1) Roberts算子。實驗結(jié)果。Roberts算子利用局部差分算子尋找邊緣,邊緣定位精度較高,但容易丟失一部分邊緣,同時由于沒經(jīng)過圖像平滑計算,因此不能抑制噪聲。該算子對具有陡峭的低噪聲圖像響應(yīng)最好。如圖2所示
圖1 鑰匙齒邊圖像
圖2 Roberts算子邊緣提取圖像
(2) Sobel算子和Prewitt算子。實驗結(jié)果如圖3,4所示。兩者都是對圖像進行差分和濾波運算,差別只是平滑部分的權(quán)值有些差異,因此對噪聲具有一定的抑制能力,但不能完全排除檢測結(jié)果中出現(xiàn)偽邊緣。同時這2個算子邊緣定位比較準確和完整,但容易出現(xiàn)邊緣多像素寬。該類算子對灰度漸變和具有噪聲的圖像處理得較好。
圖3 Sobel算子邊緣提取圖像
圖4 Prewitt算子邊緣提取圖像
(3) Laplacian算子。實驗結(jié)果如圖5所示。為二階微分算子,對圖像中的階躍型邊緣點定位準確,且具有旋轉(zhuǎn)不變性即無方向性,但是該算子容易丟失一部分邊緣的方向信息,造成一些不連續(xù)的檢測邊緣,同時抗噪聲能力比較差。該算子比較適用于屋頂型邊緣的檢測。
圖5 Laplacian算子邊緣提取圖像
(4) LoG算子。實驗結(jié)果如圖6所示。該算子首先通過高斯函數(shù)對圖像作平滑處理,因此對噪聲的抑制作用比較明顯,但同時也可能將原有的邊緣也平滑了,造成某些邊緣無法檢測到。
圖6 LoG算子邊緣提取圖像
(5) Canny算子。實驗結(jié)果如圖7所示。該算子同樣采用高斯函數(shù)對圖像作平滑處理,因此具有較強的去噪聲能力,但同樣存在容易平滑掉一些邊緣信息。同時其后所采用的一階微分算子的方向性較LoG算子要好,因此邊緣定位準確性較高。
圖7 Canny算子邊緣提取圖像
通過實驗可以看出,Canny算子是傳統(tǒng)邊緣算子中效果最好的算子之一,可以準確檢測出圖像目標邊緣。
本文算法結(jié)合了全局閾值法和局部閾值方法。全局閾值方法主要有:P-tile方法、大津法[5]等等。大津法(又稱類間差法)是基于整幅圖像的統(tǒng)計特性,實現(xiàn)閾值的選取。其原理是:把圖像直方圖用某一灰度值分割成2組,當被分割成的2組方差最大時,此灰度值就作為圖像二值化處理的閾值。局部閾值方法主要有鄰域均值法。若考慮到二值圖像掃描中目標邊緣的灰度值,總是小于其局部背景的灰度值(鄰域灰度的變化特征),則可以采用類似于 Musavi的局部自適應(yīng)二值化方法[6]。該方法利用各象素的n×n鄰域(n為奇數(shù),為減少運算量,一般取n=3或5),對該象素的鄰域灰度進行統(tǒng)計
其中,α為0~1之間的常數(shù),由圖像的質(zhì)量確定(當圖像質(zhì)量較好時,α取較小的值);M為某一象素鄰域內(nèi)各象素的灰度平均值;S為該鄰域內(nèi)象素灰度的標準差。T為考慮鄰域的局部自適應(yīng)閾值,該值用來對局部圖像進行二值化處理。本文研究中采用該方法,取得了較好的效果。
本文算法的基本思路是:先用邊緣檢測算子檢測獲得圖像的邊緣特征(灰度變化劇烈的地方),然后根據(jù)邊緣像素點的空間位置關(guān)系,實現(xiàn)不同像素點的二值化處理。如果圖像點是非邊界像素點,則用全局閾值法確定出最佳全局閾值,進行二值化處理;如果圖像點是邊界像素點,則采用局部閾值法來確定閾值。
算法的基本過程描述如下:(1)圖像預(yù)處理 由于攝像機的擾動或其它原因,原始圖像中會含有噪聲,所以要先對原始圖像做低通濾波處理或其他處理,以降低噪聲的影響;(2)最佳全局閾值確定 用 Ostu算法計算出整幅圖像的最佳全局閾值,用于邊緣以外的其他像素點的二值化處理;(3)邊緣檢測 采用Canny算子確定出較為準確的、符合實際的圖像邊界信息;(4)二值化處理 這步是本算法的關(guān)鍵,依據(jù)第3步,某像素若是邊緣點,則進行Musavi局部自適應(yīng)二值化方法,進行局部閾值自適應(yīng)計算,并進行相應(yīng)的二值化處理,而對非邊緣點則做Ostu法處理。
經(jīng)過上述處理,適當?shù)木C合了全局閾值和局部閾值方法的優(yōu)點,整體上降低了各自的缺陷。
根據(jù)基于邊緣信息的圖像二值化算法的基本原理和邊緣檢測算子的實驗分析,我們進行了基于 Canny算子的二值化處理。在實際的研究當中,選取了圖1所示圖像作為研究的對象。圖8為大津法獲取的二值圖像,圖9為結(jié)合邊緣信息的自適應(yīng)算法得到的二值圖像,圖10為局部閾值自適應(yīng)二值化圖像。
圖8 大津法二值化圖像
圖9 本文二值化方法圖像
圖10 局部閾值二值圖像
比較以上幾幅圖可知,用本文的方法可更好的保留圖像的細節(jié)信息,同時避免了采用單獨局部閾值法的虛假信息太多、抗噪聲能力低和時空復(fù)雜度高的缺陷。本文提出的基于邊緣信息的自適應(yīng)二值化方法,它能使二值化的過程中盡量保留圖像中的細節(jié)信息,同時抗干擾性也比較好。
[1] 陳強,朱立新,夏德深. 結(jié)合Canny算子的圖像二值化[J] .計算機輔助設(shè)計與圖形學學報,2005,17(6):1302-306.
[2] Canny J. A Computational Approach to Edge Detection[J] .IEEE Transactions on Pattern Analysis and Machine Intelligence,1986,8(6):679-698.
[3] Lee K K,Cham W K,Chen Q R. Chin Contour Estimation Using Modified Canny Edge Detector[C] // Proceedings of the 7th International Conference on Control,Automation,Robotics and Vision(ICARCV)2002:770-775.
[4] Ali M,Clausi D. Using the Canny Edge Detector for Feature Extraction and Enhancement of Remote Sensing Images[J] . International Geoscience and Remote Sensing SymPosium,2001, 5:2298-2300.
[5] 唐良瑞, 馬全明, 景曉軍. 圖像處理實用技術(shù)[M] .北京:化學工業(yè)出版社,2002:94-105.
[6] 楊治平. 基于自適應(yīng)多閾值變換編碼的圖像二值化處理[J] . 重慶師范學院學報:自然科學版,2001,18(3):77-80.
[7] 鄭浩,張洪濤,葉聲華. 基于目標邊緣的圖像二值化方法研究[J] . 計量技術(shù),2002, (4):3-5.
[8] 張慶英,岳衛(wèi)宏,肖維紅,等. 基于邊界特征的圖像二值化方法應(yīng)用研究[J] . 武漢理工大學學報,2005,27(2):55-57.
[9] 李國平. 基于莫爾技術(shù)的標牌凹凸字符圖像獲取與識別研究[D] .山東大學博士論文, 2007:5.