鄧志豪
(廣東工業(yè)大學(xué)機(jī)電工程系,廣州510006)
我國(guó)是瓷磚生產(chǎn)大國(guó),近年來(lái)瓷磚生產(chǎn)自動(dòng)化已成為發(fā)展方向[1]。計(jì)算機(jī)視覺(jué)技術(shù)的引進(jìn),使得面向瓷磚的智能監(jiān)控能大大加強(qiáng)對(duì)瓷磚的非接觸式檢測(cè),檢測(cè)的范圍包括缺陷檢測(cè)、產(chǎn)量計(jì)數(shù)等。而這些高層分析的基礎(chǔ),是在背景中將運(yùn)動(dòng)目標(biāo)檢測(cè)出來(lái),這種技術(shù)稱為運(yùn)動(dòng)目標(biāo)檢測(cè)。其核心是有效將前景像素與背景像素進(jìn)行分類,提取出待處理目標(biāo)。目前在計(jì)算機(jī)視覺(jué)中,對(duì)于運(yùn)動(dòng)目標(biāo)的檢測(cè)有三種常用的方法:幀差法、光流法與背景差法[2]。
幀差法是利用幀間灰度值差異來(lái)檢測(cè)運(yùn)動(dòng)目標(biāo)的,利用物體運(yùn)動(dòng)產(chǎn)生的幀間灰度差異,通過(guò)鄰幀之間的差分運(yùn)算,使用高通濾波的方式將運(yùn)動(dòng)目標(biāo)區(qū)域檢測(cè)出來(lái)。幀差法算法思路簡(jiǎn)單運(yùn)行快,在目標(biāo)檢測(cè)方面得到很多應(yīng)用,但當(dāng)物體運(yùn)動(dòng)速度過(guò)快時(shí)會(huì)產(chǎn)生“空洞”效應(yīng)。光流法是利用目標(biāo)物體運(yùn)動(dòng)產(chǎn)生的光流場(chǎng)來(lái)檢測(cè)的,算法優(yōu)點(diǎn)明顯,無(wú)需背景建模的特點(diǎn)決定了能在背景不斷更新的環(huán)境下檢測(cè)出運(yùn)動(dòng)目標(biāo),但算法復(fù)雜不利于應(yīng)用在智能監(jiān)控中對(duì)圖像數(shù)據(jù)進(jìn)行實(shí)時(shí)處理,另外也要求光照不能發(fā)生很明顯的變化。背景差法可理解成特殊的幀差法,與光流法不同的是算法需要建立背景模型,與幀差法不同的是差分對(duì)象是當(dāng)前幀與學(xué)習(xí)到的背景模型。背景差法計(jì)算量小,但對(duì)環(huán)境變化很敏感。
事實(shí)上,運(yùn)動(dòng)目標(biāo)的顏色通常不會(huì)發(fā)生改變,也可用目標(biāo)與前景之間的顏色特征差異進(jìn)行區(qū)分,從而檢測(cè)出目標(biāo)。在應(yīng)用顏色區(qū)分目標(biāo)與背景時(shí),使用HSV顏色空間優(yōu)勢(shì)明顯。本文針對(duì)瓷磚出窯口采集的監(jiān)控視頻,對(duì)視頻中被運(yùn)送的成品瓷磚進(jìn)行檢測(cè)研究,在HSV 顏色空間下提取目標(biāo)區(qū)域,并提出一種基于Kmeans 聚類思想的分量閾值求取算法來(lái)檢測(cè)目標(biāo),經(jīng)檢驗(yàn),能在目標(biāo)與背景顏色相似的情況下準(zhǔn)確檢測(cè)出運(yùn)動(dòng)瓷磚目標(biāo)。
HSV(Hue、Saturation、Value)顏色空間是1978 年由A.R.Smith 根據(jù)人眼視覺(jué)感知顏色的特性提出的,該空間對(duì)應(yīng)HSV 顏色模型,模型將彩色信號(hào)分離成三種不同屬性的分通道信號(hào)。其中H 表示色調(diào),作用是描述顏色的基本顏色屬性,例如純紅色。某種顏色經(jīng)過(guò)白光的稀釋,純度會(huì)降低,使用S(飽和度)來(lái)描述顏色的純度,色調(diào)和飽和度組合起來(lái)可以反映色彩的本質(zhì)。V(亮度)反映的是圖片的亮度信息。通常使用一個(gè)六角錐來(lái)描述HSV 顏色模型,六角錐模型能清晰的描述HSV 三通道描述色彩時(shí)的組合方式。如圖1 所示,色調(diào)H 的描述方式為繞S 軸逆時(shí)針?lè)较虻男D(zhuǎn)角,例如角度為120°時(shí)為綠色。飽和度S 定義是某顏色與最純顏色的比值,故取值范圍從0 到1,用在S 軸上距離原點(diǎn)的距離來(lái)表示。在豎直亮度V 軸上,離原點(diǎn)越近,圖像上反應(yīng)為亮度越低,越接近黑色。
圖1 HSV顏色模型
實(shí)際上,RGB 顏色空間作為面向硬件的顏色空間,通常應(yīng)用于顯示設(shè)備當(dāng)中。在運(yùn)用HSV 顏色空間檢測(cè)運(yùn)動(dòng)目標(biāo)時(shí),要將RGB 顏色空間轉(zhuǎn)換到HSV 顏色空間,針對(duì)HSV 三通道即H、S、V 通道對(duì)圖像進(jìn)行分析。其中轉(zhuǎn)換轉(zhuǎn)換公式如下:
在HSV 顏色空間下,將人眼感知的具體顏色分解為不相關(guān)的三分量:色調(diào)、飽和度、亮度。在運(yùn)用該空間分離圖像序列中目標(biāo)與背景時(shí),需要找出他們的不同點(diǎn)。色調(diào)是顏色的基本屬性,在應(yīng)用HSV 顏色空間分離目標(biāo)時(shí),建立目標(biāo)特征模型常常就是基于色調(diào)分量,CamShift 算法在檢測(cè)目標(biāo)時(shí)采用的也是這種思想[3]。不選用亮度的原因有二:一是亮度與顏色本質(zhì)無(wú)關(guān),二是容易受到光照強(qiáng)度的影響。但單純的選用色調(diào)作為目標(biāo)特征參數(shù),沒(méi)有充分的利用HSV 各分量,忽略了飽和度對(duì)顏色的影響,為了充分描述目標(biāo)像素與背景像素的差異,選用色調(diào)為主要特征,飽和度為輔助特征來(lái)構(gòu)建目標(biāo)顏色特征模型,將目標(biāo)與背景分離開達(dá)到檢測(cè)目標(biāo)的目的。
在構(gòu)建目標(biāo)顏色特征模型時(shí),需要選取目標(biāo)顏色的分量特征,即準(zhǔn)確選擇H 分量與S 分量的閾值。實(shí)際確定分量閾值時(shí),常常依靠人眼觀察目標(biāo)分離程度來(lái)判斷閾值選取是否正確,此方法簡(jiǎn)單方便,缺點(diǎn)是容易受主觀因素影響,缺少可靠的閾值量化手段。為此,在研究K-means 聚類算法的基礎(chǔ)上,運(yùn)用其不斷迭代以劃分出不同簇的思想,將代表目標(biāo)與背景的像素點(diǎn)不斷的進(jìn)行劃分,最后使用劃分的結(jié)果進(jìn)行閾值提取,基于此閾值在HSV 空間下對(duì)目標(biāo)區(qū)域進(jìn)行提取,經(jīng)檢驗(yàn)此方法具有良好的效果。
K-means 算法是一種聚類算法,雜亂數(shù)據(jù)形成不同的簇,算法目的是輸出劃分得到不同的簇與對(duì)應(yīng)的聚類中心[4]。算法核心步驟為:預(yù)先設(shè)定初始聚類數(shù)目K,即形成“簇”的個(gè)數(shù),然后隨機(jī)選取K 個(gè)數(shù)據(jù)作為聚類中心,在判定某數(shù)據(jù)是否正確劃分到當(dāng)前聚類中心對(duì)應(yīng)簇時(shí),采用歐氏距離作為相似度測(cè)量標(biāo)準(zhǔn)。此時(shí)將某簇內(nèi)所有數(shù)據(jù)對(duì)象的均值作為新的聚類中心,假設(shè)此時(shí)聚類中心Ci對(duì)應(yīng)簇中有ξ個(gè)數(shù)據(jù),則當(dāng)前數(shù)據(jù)集合的誤差平方和S 用公式(4)來(lái)表示:
其中數(shù)據(jù)對(duì)象與聚類中心的歐氏距離用函數(shù)dis()計(jì)算。當(dāng)S 小于閾值T 或者不再變化時(shí),迭代結(jié)束,輸出結(jié)果。K-means 聚類算法為將雜亂數(shù)據(jù)分成不同的簇,不斷迭代,以K=2 為例,圖2 展示了迭代過(guò)程。
圖2 K-means算法迭代過(guò)程
K-means 聚類算法通過(guò)事先設(shè)置聚類數(shù)目的值,將數(shù)據(jù)集合的數(shù)據(jù)分為不同的簇并找出最能代表簇中心的值,使用迭代的方式將不同的簇分割開。結(jié)合其主要思想,在迭代的過(guò)程中將屬于目標(biāo)與背景的分通道數(shù)據(jù)集劃分開,將每次分割后分通道均值的均值作為目標(biāo)函數(shù),以H 通道分割閾值求取為例(S 通道同)算法步驟如下:
(1)圖像顏色空間由RGB 轉(zhuǎn)換至HSV,分離通道后求出H 分量圖像的色調(diào)極值,分別為:Hmax、Hmin,令初始閾值
(2)使用初始閾值在H 分量圖中分割目標(biāo)與背景部分,得出兩部分平均值Hα與Hβ,此時(shí)更新分割閾值為
(3)轉(zhuǎn)至步驟(2),并更新色調(diào)閾值為THX,直至新閾值不再變化,此時(shí)根據(jù)分割結(jié)果,統(tǒng)計(jì)H 通道圖的目標(biāo)區(qū)域部分的H 值范圍則為該通道下的最佳分割閾值。
(4)輸出閾值結(jié)果。
在計(jì)算機(jī)視覺(jué)領(lǐng)域中,針對(duì)視頻中運(yùn)動(dòng)物體的研究,對(duì)象往往是包含有目標(biāo)信息的二值圖像[5]。在二值圖像中灰度值只有0 和255,以此達(dá)到區(qū)分前景和背景的目的。對(duì)圖像進(jìn)行二值化處理時(shí),關(guān)鍵是要選取合適的灰度分割閾值T,將圖像序列中關(guān)于前景和背景的像素劃根據(jù)灰度值分為兩部分,假設(shè)在視頻中,有某幀包含運(yùn)動(dòng)目標(biāo)的圖像各像素灰度值為fα(x,y),定義1 代表前景,0 代表背景,通過(guò)逐像素計(jì)算,判定像素點(diǎn)是否屬于前景區(qū)域的方式,得到準(zhǔn)確包含目標(biāo)信息的二值圖以便接下來(lái)的視覺(jué)高層分析。分割公式如下:
本文算法中,對(duì)于包含有目標(biāo)區(qū)域信息的二值圖提取上與基于灰度圖的閾值分割方法不同?;谏闲」?jié)的分量閾值求取,在HSV 顏色空間里求取出了可靠的目標(biāo)區(qū)域分通道分割范圍。針對(duì)獲取視頻幀圖像上的像素點(diǎn),如果像素點(diǎn)色調(diào)飽和度值在對(duì)應(yīng)通道的分割閾值范圍內(nèi),那么直接設(shè)定該像素點(diǎn)灰度值為255,否則則判定為背景,灰度值為0,繞過(guò)獲取灰度圖的步驟,直接達(dá)到快速獲取檢測(cè)結(jié)果的目的。
提取到二值圖像后,由于復(fù)雜背景因素的影響,一定會(huì)產(chǎn)生對(duì)檢測(cè)系統(tǒng)不利的噪聲點(diǎn)[6]。使用圖像形態(tài)學(xué)處理可以將這些孤立的噪聲點(diǎn)去除,使得目標(biāo)檢測(cè)取得良好的效果。數(shù)學(xué)形態(tài)學(xué)(Mathematical Morpholo?gy)在圖像分析領(lǐng)域具有重要地位,是用于分析圖像幾何信息的數(shù)學(xué)方法。基于數(shù)學(xué)形態(tài)學(xué),最底層的兩種處理方式分別是膨脹、腐蝕操作。其中,膨脹操作的目的是擴(kuò)大二值圖像的高亮區(qū)域,其過(guò)程是求局部最大值的過(guò)程,而腐蝕操作是與膨脹相反的。從數(shù)學(xué)計(jì)算角度看形態(tài)學(xué)處理,是將圖像的整體或局部與設(shè)定核的卷積計(jì)算過(guò)程[7]。
對(duì)于本文提取到的運(yùn)動(dòng)目標(biāo),由于前景與背景的顏色相似,使得許多背景區(qū)域判定為前景。為消除細(xì)小噪聲,使用一次腐蝕操作,將二值圖中較小的高亮區(qū)域消除,去除噪聲。經(jīng)過(guò)腐蝕處理后,目標(biāo)區(qū)域面積小于實(shí)際面積。為消除此次操作帶來(lái)的面積變化,再進(jìn)行一次膨脹操作使得目標(biāo)區(qū)域回到原來(lái)的大小。經(jīng)過(guò)這樣一次開運(yùn)算操作,能有效去除噪聲,提升目標(biāo)檢測(cè)效果。
本實(shí)驗(yàn)仿真平臺(tái)為Microsoft Visual Studio 2013,視覺(jué)算子庫(kù)為3.4.1 版本的OpenCV,結(jié)合C++進(jìn)行仿真實(shí)驗(yàn),針對(duì)工業(yè)現(xiàn)場(chǎng)中由相機(jī)采集到的成品磚出窯視頻進(jìn)行目標(biāo)檢測(cè)操作。
圖3(a)為監(jiān)控視頻中原始幀,瓷磚由下至上運(yùn)動(dòng),可以看到目標(biāo)與背景像素顏色相似,使用本文運(yùn)動(dòng)目標(biāo)檢測(cè)算法得出包含有噪聲的二值化檢測(cè)結(jié)果如圖(b)所示,為消除噪聲,相繼對(duì)檢測(cè)結(jié)果進(jìn)行腐蝕以及膨脹的形態(tài)學(xué)操作方法,能有效排除無(wú)關(guān)噪聲,增強(qiáng)運(yùn)動(dòng)目標(biāo)檢測(cè)結(jié)果的可靠性。
圖3 實(shí)驗(yàn)仿真結(jié)果
本文首先基于對(duì)HSV 顏色空間的研究,建立目標(biāo)顏色模型采用與顏色關(guān)聯(lián)更緊密的色調(diào)和飽和度,提出一種基于K-means 聚類算法思想的分量閾值提取算法確定分通道閾值以區(qū)分目標(biāo)像素與背景像素。實(shí)際檢測(cè)結(jié)果表明算法能在目標(biāo)及背景顏色相似的情況下準(zhǔn)確分割出目標(biāo)瓷磚,最后結(jié)合形態(tài)學(xué)處理,減少噪聲,增加目標(biāo)檢測(cè)的準(zhǔn)確性。