吳夢(mèng)怡,何家溢
(中國傳媒大學(xué) 信息工程學(xué)院,北京 100024)
?
基于Hough變換的紅外圖像的目標(biāo)分割
吳夢(mèng)怡,何家溢
(中國傳媒大學(xué) 信息工程學(xué)院,北京 100024)
紅外圖像是根據(jù)目標(biāo)與背景的溫度差異而形成,不受光照等其他條件的影響,可全天工作,被廣泛應(yīng)用在各個(gè)領(lǐng)域中。但是由于目標(biāo)和背景的熱輻射所造產(chǎn)生的紅外圖像的分辨率低,對(duì)比度差等特點(diǎn),使紅外圖像的分割變得較為困難。Hough變換具有對(duì)圖像中直線的殘缺部分、噪聲以及其他共存的非直線結(jié)構(gòu)不敏感的特性,具有較強(qiáng)的抗干擾性和魯棒性。本文提出一種基于Hough變換的紅外圖像規(guī)則目標(biāo)的檢測(cè)方法。通過觀察紅外圖像中目標(biāo)分布情況,估計(jì)出目標(biāo)邊界的曲線方程,對(duì)該方程進(jìn)行Hough變換,從而檢測(cè)出目標(biāo)并進(jìn)行分割。利用該方法避免了由于紅外圖像的目標(biāo)與背景對(duì)比度差、邊緣模糊、視覺效果較差等原因造成的不易檢測(cè)邊緣曲線的問題。經(jīng)實(shí)驗(yàn)證明,基于Hough變換的規(guī)則的紅外目標(biāo)的檢測(cè)方法具有可行性,且檢測(cè)效果好。
紅外圖像;邊緣檢測(cè);圖像分割;霍夫變換
紅外圖像的獲取是根據(jù)目標(biāo)與背景的溫度分布情況進(jìn)行的,它的采集不受光照條件的限制,并且可以克服部分視覺上的障礙而探測(cè)到目標(biāo),具有較強(qiáng)的抗干擾能力,被廣泛應(yīng)用在各個(gè)領(lǐng)域,如在視頻監(jiān)控領(lǐng)域、動(dòng)目標(biāo)跟蹤領(lǐng)域或紅外成像反艦導(dǎo)彈等。但由于紅外圖像具有像素分辨率低、對(duì)比度差、噪聲大、圖像邊緣模糊等特點(diǎn),準(zhǔn)確將紅外圖像的目標(biāo)分割是比較困難的。
圖像分割算法一般是基于圖像灰度值的不連續(xù)性或其相似性。根據(jù)圖像的不連續(xù)性進(jìn)行分割有邊緣檢測(cè)、邊界跟蹤等方法,常用的邊緣檢測(cè)算子有Roberts算子、Sobel算子、Pewitt算子、Canny算子。根據(jù)圖像的相似性將圖像分割的常用方法有閾值分割、區(qū)域生長、區(qū)域分裂與合并。
由于紅外圖像的分辨率低、灰度對(duì)比度差、邊緣不光滑等特點(diǎn),一般的基于空域?yàn)V波或灰度域值的方法很難將目標(biāo)和較強(qiáng)的背景干擾區(qū)別開來。文獻(xiàn)[4][5][6]通過利用Otus和遺傳算法相結(jié)合的方法,確定最佳閾值,對(duì)圖像進(jìn)行分割。文獻(xiàn)[1]采用基于區(qū)域增長和神經(jīng)網(wǎng)絡(luò)的方法分割和識(shí)別目標(biāo),因計(jì)算量較大而難以實(shí)際應(yīng)用。在Kass等人提出的Snakes算法[2]和OSher等人提出的水平集方法[3]的基礎(chǔ)上,文獻(xiàn)[7]提出了一種改進(jìn)的水平集模型,用于對(duì)紅外圖像進(jìn)行分割。文獻(xiàn)[8]提出一種基于Sobel算子和蟻群算法相結(jié)合的紅外圖像邊緣檢測(cè)算法。文獻(xiàn)[11]結(jié)合分水嶺變換、小波變換與形態(tài)技術(shù),實(shí)現(xiàn)紅外自動(dòng)圖像分割。文獻(xiàn)[9]介紹了一種基于紋理相似度量的圖像分割方法。文獻(xiàn)[10][12]是以模糊C均值聚類算法為基礎(chǔ),提出的改進(jìn)的紅外圖像分割的方法。文獻(xiàn)[13]提出基于期望最大化聚類的紅外熱像分割方法。
Hough提出的Hough變換[14]是一種在圖像中定位形狀的技術(shù),具有較強(qiáng)的抗干擾性和魯棒性,被廣泛應(yīng)用于各個(gè)領(lǐng)域。在生物醫(yī)學(xué)領(lǐng)域中,Hough變換已被成功應(yīng)用于基于人工智能的專家診斷系統(tǒng);X射線人體照片和CT圖像的處理和判讀;光學(xué)顯微鏡和電子顯微鏡中的細(xì)胞核自動(dòng)分析系統(tǒng)等。在自動(dòng)化、機(jī)器人視覺領(lǐng)域中,Hough變換已被用于產(chǎn)品部件的自動(dòng)監(jiān)視、缺陷診斷、生產(chǎn)過程的自動(dòng)監(jiān)控、計(jì)算機(jī)輔助制造(CAM),例如基于Hough變換的機(jī)械零件檢測(cè)和定位系統(tǒng);基于Hough變換采用直線、圓弧等作為基本特征的工業(yè)產(chǎn)品檢查系統(tǒng)。在空間技術(shù)、軍事防御領(lǐng)域中,Hough變換已被用于運(yùn)動(dòng)目標(biāo)軌跡的檢測(cè)與識(shí)別,高空偵察機(jī)、間諜衛(wèi)星和軍事雷達(dá)等目標(biāo)自動(dòng)識(shí)別系統(tǒng)的特征提取,例如應(yīng)用Hough變換對(duì)戰(zhàn)斗機(jī)的外形特征進(jìn)行提取和自動(dòng)識(shí)別。在辦公自動(dòng)化領(lǐng)域中,采用Hough變換進(jìn)行英文字符特征提取并自動(dòng)識(shí)別,其對(duì)印刷體字符識(shí)別率為99.6%,對(duì)手寫體字符的平均識(shí)別率也達(dá)到了86.9%,并已成功應(yīng)用于郵政信件的自動(dòng)分揀、文件處理等。
根據(jù)紅外圖像的特性和Hough變換在各個(gè)領(lǐng)域被廣泛應(yīng)用的趨勢(shì),本文提出一種基于Hough變換的紅外圖像中目標(biāo)分割的方法。該方法主要是根據(jù)單個(gè)目標(biāo)的形狀特點(diǎn)和所有目標(biāo)的布局情況,根據(jù)目標(biāo)邊界,選擇合適的曲線方程,利用Hough變換檢測(cè)目標(biāo)。
Hough變換是一種使用表決原理的參數(shù)估計(jì)技術(shù)。其原理是利用圖像空間和Hough參數(shù)空間的點(diǎn)—線對(duì)偶性,把圖像空間中的檢測(cè)問題轉(zhuǎn)換到參數(shù)空間。通過在參數(shù)空間里進(jìn)行簡(jiǎn)單的累加統(tǒng)計(jì),然后在Hough參數(shù)空間尋找累加器峰值的方法檢測(cè)曲線。Hough變換的實(shí)質(zhì)是將圖像空間內(nèi)具有一定關(guān)系的像元進(jìn)行聚類,尋找能把這些像元用某一解析形式聯(lián)系起來的參數(shù)空間累積對(duì)應(yīng)點(diǎn)。
直線由兩點(diǎn)A=(x1,y1)和B=(x2,y2)定義(參見圖1)。通過點(diǎn)A的所有直線由y1=kx1+q表示,k和q是某些值。這意味著同一個(gè)方程可以解釋為參數(shù)空間k和q的方程,因此通過點(diǎn)A的所有直線可以表示為方程q=-x1k+y1(參見圖2)。類似通過點(diǎn)B的直線可以表示為q=-x2k+y2。在參數(shù)空間k和q中,兩條直線的唯一公共點(diǎn)是在原圖像空間中表示連接A和B的唯一存在的直線。
圖1 圖像空間
圖2 k和q的參數(shù)空間
這意味著圖像中的每條直線在參數(shù)空間k和q中由單獨(dú)一個(gè)點(diǎn)表示,直線的任何一部分都變換為同一個(gè)點(diǎn)。直線檢測(cè)的主要思想就是確定圖像中所有的直線像素,將通過這些像素的所有直線變換到參數(shù)空間的對(duì)應(yīng)點(diǎn),在參數(shù)空間檢測(cè)點(diǎn)(a,b),該點(diǎn)是由圖像中直線y=ax+b的Hough變換的結(jié)果。
一般情況下,我們沒有任何有關(guān)圖像中直線的信息,因此任何方向的直線可以通過任何邊緣像素。在真實(shí)情況下,這些直線的數(shù)目是無限的,然而,為了實(shí)際目標(biāo),只能根據(jù)目標(biāo)特性考慮有限數(shù)目的直線方向。直線的可能方向定義了參數(shù)k的一個(gè)離散化。類似的,參數(shù)q也被采樣為有限數(shù)目的值。參數(shù)空間不再是連續(xù)的,而是被表示為矩形的單元。這個(gè)單元的陣列被稱為累計(jì)數(shù)組A,它的元素是累計(jì)單元A(k,q)。對(duì)于每個(gè)邊緣元素,確定其參數(shù)k和q,這些參數(shù)表示了通過該圖像的允許方向的直線。對(duì)于每條這樣的直線,直線參數(shù)k和q的值用來增加累計(jì)單元A(k,q)的值。顯然,如果公式y(tǒng)=ax+b,所表示的直線出現(xiàn)在圖像中,累計(jì)單元A(a,b)的值就會(huì)被增加很多次,次數(shù)等于直線y=ax+b作為可能通過某個(gè)邊緣像素的直線被檢測(cè)到的數(shù)目。對(duì)于任意像素P,通過它的直線可能是任何的方向k,但是第二個(gè)參數(shù)q受像素P的圖像坐標(biāo)和方向k所約束。因此,存在于圖像中的直線會(huì)引起圖像中適合的累加單元的值變大,而通過邊緣像素的其他直線,它們不對(duì)應(yīng)圖像中存在的直線,對(duì)于每個(gè)邊緣像素具有不同的參數(shù)k和q,所以對(duì)應(yīng)的累加單元極少被增加。換句話說,圖像中存在的直線可以作為累加數(shù)組中的高值累計(jì)單元被檢測(cè)出來,檢測(cè)到的直線參數(shù)有累積數(shù)組的坐標(biāo)給出。結(jié)果是,圖像中直線的檢測(cè)被變換為累計(jì)空間中局部極值的檢測(cè)。
由于k的取值在解析式為一般方程的情況下沒有明確的取值范圍,因此通常將直線方程表示成極坐標(biāo)的形式:
ρ=xcosθ+ysinθ
其中θ是垂直于圖像中直線的直線角度,ρ是原點(diǎn)到直線交點(diǎn)的距離,參見圖3所示。
圖3 直線的極坐標(biāo)
該解析式,提供了一種不同的映射函數(shù):在二維累加器數(shù)組根據(jù)感興趣的參數(shù)θ和ρ,按照正弦波方式投票。即圖像中的一條直線上的一個(gè)點(diǎn)映射到傳統(tǒng)霍夫空間為一條直線轉(zhuǎn)變?yōu)橛成涞綐O坐標(biāo)下的霍夫空間為一條正弦曲線。這種替代映射的優(yōu)勢(shì)在于:參數(shù)θ和ρ的值現(xiàn)在被限定在特定的范圍內(nèi),θ的取值范圍是0~180°,ρ的可能取值由圖像大小所決定。
通過將檢測(cè)過程中的直線方程替換為一元二次方程,霍夫變換可用于拋物線檢測(cè)。一般一元二次曲線解析式為:
f(x)=ax2+bx+c
由霍夫變換原理可知,其對(duì)應(yīng)的霍夫方程為c=y-ax2-bx,霍夫空間是一個(gè)坐標(biāo)分別為a、b、c的三維空間,累加器是一個(gè)三維累加器(a,b,c)。即圖像中的一元二次曲線上的任意一點(diǎn)映射到霍夫空間內(nèi)為一個(gè)平面,曲線上的多個(gè)點(diǎn)映射到霍夫空間內(nèi)為多個(gè)平面,平面的交點(diǎn)也就是圖像空間內(nèi)曲線表達(dá)式的系數(shù)值。也就是說每次像素點(diǎn)的映射結(jié)果都使累加器對(duì)應(yīng)的值增加,圖像中存在的曲線可以作為累加數(shù)組中的高值累計(jì)單元被檢測(cè)出來,檢測(cè)到的曲線系數(shù)由累積數(shù)組的坐標(biāo)給出。結(jié)果是,圖像中曲線的檢測(cè)被變換為累計(jì)空間中局部極值的檢測(cè)。選擇合適的閾值,篩選出滿足條件的曲線邊緣。
由于系數(shù)a、b、c的值沒有明確的取值范圍可以限定,因此,本文提出選用一元二次方程的頂點(diǎn)式進(jìn)行變換,其頂點(diǎn)式表達(dá)式為:
f(x)=a(x-h)2+k
其對(duì)應(yīng)的霍夫方程為k=y-a(x-h)2,霍夫空間仍是參數(shù)為k、a、h的三維空間,累加器為(a、h、k),此時(shí)圖像中邊緣曲線上一點(diǎn)映射到霍夫空間變?yōu)橐粋€(gè)曲面,多個(gè)點(diǎn)對(duì)應(yīng)多個(gè)曲面,曲面的交點(diǎn)為圖像中的曲線方程所對(duì)應(yīng)的系數(shù)值。累加器(a、h、k)中,h和k對(duì)應(yīng)為原曲線方程的頂點(diǎn)坐標(biāo),也就是說h和k的取值由圖像大小決定,h最大不能超過圖像的寬度,k最大不能超過圖像的高度。a對(duì)應(yīng)原曲線方程的系數(shù),a的值可由圖像中的曲線的開口大小決定。這種替代映射的優(yōu)勢(shì)在于:參數(shù)a、h、k的值現(xiàn)在被限定在特定的范圍內(nèi),取值與圖像有關(guān)。
本文提出的算法可以解決由于紅外圖像特點(diǎn)所引起的分辨率低,對(duì)比度差等其他原因造成的目標(biāo)檢測(cè)不準(zhǔn)確的問題,具有較強(qiáng)的抗干擾性和魯棒性。該算法的關(guān)鍵點(diǎn)是根據(jù)目標(biāo)分布情況選擇合適曲線方程作為霍夫變換的檢測(cè)方程,并選擇合適閾值篩選極值點(diǎn),檢測(cè)出目標(biāo)曲線,流程圖如圖4所示,算法步驟為:
第一步,紅外圖像的提取可以按照紅外圖像的攝取幀速來提取每一幀圖像。
第二步,對(duì)圖像進(jìn)行幾何失真校正。由于視像管攝像機(jī)及陰極射線管顯示器的掃描偏轉(zhuǎn)系統(tǒng)有一定的非線性,因此,會(huì)造成枕形失真或桶形失真。另外,由于所攝取某場(chǎng)景的圖像覆蓋面積較大,由于地球表面呈球形,這樣攝取的平面圖像也將會(huì)有較大的幾何失真。
第三步,將校正好的圖像轉(zhuǎn)化為灰度圖像。
第四步,圖像增強(qiáng),由于紅外圖像的低分辨率,對(duì)比度差等特點(diǎn),直接對(duì)圖像進(jìn)行二值化化處理,效果可能不佳,因此要先進(jìn)行圖像增強(qiáng)處理。
第五步,將灰度圖像二值化,得到灰度值只有0和255黑白圖像,是進(jìn)行邊緣檢測(cè)的基礎(chǔ)。圖像二值化過程中閾值的選擇直接關(guān)系到目標(biāo)邊緣檢測(cè)的結(jié)果,間接影響霍夫變化的檢測(cè)結(jié)果,因此選擇合適的閾值是關(guān)鍵。
第六步,圖像邊緣檢測(cè),邊緣檢測(cè)算子有很多種,對(duì)于同一種檢測(cè)算子而言,圖像不同,檢測(cè)的結(jié)果也不同。因此要根據(jù)圖像特點(diǎn)選擇合適的檢測(cè)算子。
第七步,進(jìn)行霍夫變換,根據(jù)目標(biāo)物理特點(diǎn)和目標(biāo)的分布情況,選擇合適的曲線方程,進(jìn)行霍夫變換,根據(jù)霍夫變換的結(jié)果和目標(biāo)分布情況,選擇合適閾值,篩選出目標(biāo)曲線。
圖4 算法流程圖
本文實(shí)驗(yàn)采用的是某一電影院放映某一電影的某一段觀影現(xiàn)場(chǎng)視頻,提取的單幀圖像分辨率為704*480,通過提取座位上有人和無人兩種情況的圖像,來驗(yàn)證霍夫變換在紅外圖像上的檢測(cè)性能。本文所有的算法程序均在MATLAB2014開發(fā)平臺(tái)下實(shí)現(xiàn)。
圖5為提取電影院的無人的座位圖,可以看出座位排列整齊,為一行排列方式近似一條拋物線,每一列排列方式近似一條直線,對(duì)其進(jìn)行圖像預(yù)處理得到圖6,圖7為經(jīng)過Canny算子邊緣檢測(cè)處理得到的座位邊緣圖像,可以看出該圖中的邊緣基本是連續(xù),只有少部分的邊緣是斷開的,并且座位幾乎沒有缺失情況,但是座位邊緣不光滑,圖8為經(jīng)過曲線霍夫變換檢測(cè)的座位行排列的圖像,可以看出座位的排數(shù)基本被檢測(cè)出,結(jié)合實(shí)際情況,根據(jù)曲線之間的距離,可以確定電影院座位的排數(shù)。
圖5 電影院座位圖
圖6 圖像預(yù)處理
圖7 邊緣檢測(cè)圖
圖8 曲線檢測(cè)圖
當(dāng)提取有人的座位圖像時(shí),如圖9所示,通過設(shè)置合適的二值化的閾值,選擇Roberts算子進(jìn)行邊緣檢測(cè),得到的結(jié)果如圖10所示,由于有人的存在,根據(jù)二值化圖像檢測(cè)出來座位邊緣有空缺,但是根據(jù)存在的座位可以大致估計(jì)出座位的排列方式仍為一條曲線,利用曲線霍夫變換,選擇合適的閾值,篩選出符合條件的曲線,檢測(cè)結(jié)果如圖11所示。該實(shí)驗(yàn)說明,盡管有部分邊緣的缺失,但是依照總體布局,利用曲線霍夫變換依舊可以將座位排數(shù)檢測(cè)出,進(jìn)一步驗(yàn)證了霍夫變換具有對(duì)圖像中曲線的殘缺部分、噪聲以及其他共存的非直線結(jié)構(gòu)不敏感的特性,具有較強(qiáng)的抗干擾性和魯棒性。
圖9 原始圖像
圖10 邊緣檢測(cè)圖
圖11 座位上有人的座位檢測(cè)圖像
通過座位上有人和無人的圖像的兩次檢測(cè)實(shí)驗(yàn),證明了霍夫變換的確可以解決出由于紅外圖像的目標(biāo)與背景對(duì)比度差、邊緣模糊、視覺效果較差等原因造成的目標(biāo)邊緣缺失或邊緣不清晰的問題,驗(yàn)證了霍夫變換具有對(duì)圖像中曲線的殘缺部分、噪聲以及其他共存的非直線結(jié)構(gòu)不敏感的特性,具有較強(qiáng)的抗干擾性和魯棒性。
本文提出的基于Hough變換檢測(cè)紅外圖像中的目標(biāo)的方法,通過電影院紅外圖像中座位的檢測(cè)實(shí)驗(yàn),利用目標(biāo)集合的空間分布規(guī)律和單個(gè)目標(biāo)的形狀特性,驗(yàn)證了霍夫變換具有對(duì)圖像中曲線的殘缺部分、噪聲以及其他共存的非直線結(jié)構(gòu)不敏感的特性,具有較強(qiáng)的抗干擾性和魯棒性,解決了由于紅外圖像的目標(biāo)與背景對(duì)比度差、邊緣模糊、視覺效果較差等原因造成的目標(biāo)邊緣缺失或邊緣不清晰的問題,該方法具有可行性,并且檢測(cè)結(jié)果準(zhǔn)確。
[1]Correia B,Dinis J,Davies R.Automatic detection and recognition of stationary motorized vehicles in infrared Images[J]. SPIE, 1999,37(18):140-150.
[2]Kass M,Witkin A,and Terzopoulos D. Snakes:Active Contour Models[J]. Computer Vision,1988,1(4):321-331.
[3]OSher S J and Paragios N. Geometric Level Set Methods in Imaging[M]. Vision and Graphics,Springer,New York,2003.
[4]Shunyong Zhou,Pingxian Yang,WenlingXie. Infrared Image Segmentation Based on Otsu and Genetic Algorithm[J]. Multimedia Technology (ICMT),2011,7:5421-5424.
[5]Zhang Chaofu,Ma Li-Ni,Jing Lu-Na. THRESHOLD INFRARED IMAGE SEGMENTATION BASED ON IMPROVED GENETIC ALGORITHM[J].Information Science and Control Engineering (ICISCE),IET International Conference on,2012,12:1-4.
[6]J Xia,J Sun.Infrared Image Segmentation Combining Mutual Information and Genetic Algorithm[J].International Conference on Information Engineering and Computer Science,2009,12:1-4.
[7]X Mei,J Lin,L Zhang,L Xia. Infrared Image Segmentation Algorithm Based on Improved Variational Level Set Model[J]. International Conference on Mechatronics and Automation,2007,8:1224-122.
[8]Dong Wang,Jingzhou Zhang.Infrared image edge detection algorithm based on sobel and ant colony algorithm[J]. Multimedia Technology (ICMT),2011 International Conference on,2011,7:4944-4947.
[9] W B Blanton,K E Barner.Texture-Based Infrared Image Segmentation by Combined Merging and Partitioning[J]. International Conference on Image Processing,2007,9(2):45-48.
[10]S Gupta,A Mukherjee. Infrared image segmentation using Enhanced Fuzzy C-means clustering for automatic detection systems[J]. Fuzzy Systems (FUZZ),International Conference on,2011,6:944-949.
[11]S R Neves,E A B da Silva,G V Mendonca.Wavelet-watershed automatic infrared image segmentation method[J].Electronics Letters,2003,(39):903-904.
[12]L Gang,Z Qianqian,Z Dan. Neighborhood weight fuzzy c-means kernel clustering based infrared image segmentation[J]. Information and Automation (ICIA),International Conference on,2014,(7):451-454.
[13]T J Ramírez-Rozo,J C García-álvarez,C G Castellanos-Domínguez. Infrared thermal image segmentation using expectation-maximization-based clustering[A]. 2012 XVII Symposium of Image,Signal Processing,and Artificial Vision (STSIVA)[C],2012.
[14]Hough P V C.Method and Means for Recognizing complex Patterns[P].US Patent:396954,1962.
[15]Illingworth J,and Kitter J.The Adaprtive Hough Transform[J]. IEEE Trans,PAMI,1987,9(5):690-697.
(責(zé)任編輯:馬玉鳳)
Object Segmentation of Infrared Image Based on Hough Transform
WU Meng-yi,HE Jia-yi
(Information Engineering School,Communication University of China,Beijing 10024)
Infrared image is formed according to the temperature difference between the target and the background. It is not affected by other conditions,such as light and it can work all day. So it is widely used in various fields. However,due to the low resolution and low contrast of infrared image generated by the thermal radiation of the target and background,the segmentation of infrared image becomes more difficult. Hough transform has a strong anti-interference and robustness,which is not sensitive to the incomplete part of the image,noise and other non-linear structures. In this paper,a method for the detection of regular targets in infrared image based on Hough transform is proposed. By observing the distribution of target in infrared image,the curve equation of the target boundary is estimated,then the Hough transform is carried out to detect the target and segment the target. By using this method,it is avoided that the target of infrared image is not easy to detect the edge curve due to the difference of background contrast,blurred edge and poor visual effect. The experimental results show that the infrared target detection method based on Hough transform is feasible,and the detection effect is good.
infrared image;edge detection;image segmentation;hough transform
2016-04-26
吳夢(mèng)怡(1991 -),女(漢族),河北邢臺(tái)人,中國傳媒大學(xué)碩士生.E-mail: 395272549@qq.com
TP391.41
A
1673-4793(2016)04-0020-07