朱晨捷 鄭靈鳳 葉煒 朱蓉
摘 要: 提出了一種針對火災(zāi)圖像進(jìn)行處理的特征提取及識別方法。首先,通過建立顏色直方圖提取火災(zāi)圖像與非火災(zāi)圖像的顏色特征;然后,利用尺度不變特征變換算法計(jì)算兩類圖像的局部特征,并利用主成分分析法對兩類圖像特征進(jìn)行降維處理,再針對降維處理后的圖像特征采用K均值聚類算法進(jìn)行計(jì)算;最后,針對測試圖像庫中的圖像數(shù)據(jù),經(jīng)過顏色直方圖初判、局部特征與聚類中心對比等步驟獲得識別結(jié)果。該方法能夠?qū)⒒馂?zāi)圖像有效、快速地識別出來,以達(dá)到及時(shí)報(bào)警的效果。
關(guān)鍵詞: 火災(zāi)圖像識別; 顏色直方圖; 特征提??; 尺度不變特征變換; 主成分分析法; K均值聚類
中圖分類號:TP39 文獻(xiàn)標(biāo)志碼:A 文章編號:1006-8228(2015)12-26-04
Research on feature extraction and recognition method for fire image
Zhu Chenjie, Zheng Lingfeng, Ye Wei, Zhu Rong
(College of Mathematics and Information Engineering, Jiaxing University, Jiaxing, Zhejiang 314001, China)
Abstract: In this paper, a method of feature extraction and recognition for fire image is presented. The color features of fire images and non-fire images are extracted respectively via the establishment of color histograms. Then, the local features of these two kinds of images are computed by using SIFT (Scale Invariant Feature Transform) algorithm, and reduce the dimension by using PCA (Principal Component Analysis) method and those processed local features are calculated by K-means clustering algorithm. The recognition results are obtained by the prejudgment of color histograms and the comparison of local features with clustering centers. It is proved by experiments that the proposed method can recognize the fire image effectively, and can achieve a good result in early-warning.
Key words: fire image recognition; color histogram; feature extraction; Scale Invariant Feature Transform (SIFT); Principal Component Analysis (PCA); K-means clustering
0 引言
由于每年發(fā)生的不同程度的火災(zāi)給人們帶來了巨大的經(jīng)濟(jì)損失,因而對火災(zāi)監(jiān)控和火災(zāi)發(fā)生后及時(shí)報(bào)警進(jìn)行研究一直是研究者關(guān)注的重點(diǎn)。傳統(tǒng)的火災(zāi)報(bào)警是通過煙霧、溫度來進(jìn)行檢測,相比基于圖像的檢測方法準(zhǔn)確率低。因此,本文提出了一種基于圖像內(nèi)容的火災(zāi)識別方法。
通常,火災(zāi)圖像上會呈現(xiàn)一些顯著的特點(diǎn),從圖1給出的這些火災(zāi)圖像中可見,火焰區(qū)域多數(shù)呈橘紅色,煙霧區(qū)域多數(shù)呈灰白色;從紋理上看,火災(zāi)區(qū)域與其他區(qū)域的區(qū)別比較明顯。
本文在深入分析火災(zāi)圖像顏色和紋理特性的基礎(chǔ)上,提出了一種基于顏色直方圖、尺度不變性特征變換(Scale Invariant Feature Transform,簡稱為SIFT)算法和K均值聚類算法的火災(zāi)圖像特征提取與識別方法。該方法能夠有效地利用火災(zāi)圖像在顏色和紋理上遠(yuǎn)勝于其他圖像視覺信息的辨識度的優(yōu)勢,將火災(zāi)圖像與非火災(zāi)圖像有效地區(qū)分開來。具體步驟為:①運(yùn)用顏色直方圖方法提取圖像的顏色特征,再利用SIFT算法計(jì)算兩類圖像的局部特征,并采用主成分分析法(Principal Component Analysis,簡稱為PCA)對特征進(jìn)行降維處理;②采用K均值聚類算法針對降維處理后的局部特征計(jì)算出兩類圖像各自的聚類中心;③在測試圖像庫中的若干幅圖像數(shù)據(jù)上進(jìn)行實(shí)驗(yàn)驗(yàn)證,經(jīng)過顏色直方圖初判、局部特征與聚類中心對比等步驟獲得較好的識別結(jié)果。
1 相關(guān)研究介紹
有關(guān)SIFT算法已有許多研究和應(yīng)用。例如,在文獻(xiàn)[1]中,作者通過劃分重疊的特征區(qū)域,計(jì)算各自對應(yīng)的SIFT特征相關(guān)度,實(shí)現(xiàn)了人耳的精確識別。在文獻(xiàn)[2]中,作者結(jié)合卡爾曼濾波算法的預(yù)測性,運(yùn)用SIFT特征加以輔助跟蹤,并充分利用SIFT特征對旋轉(zhuǎn)、縮放、亮度等變化保持不變的優(yōu)點(diǎn),對視頻不同幀的不同匹配目標(biāo)區(qū)域的位置進(jìn)行獨(dú)立預(yù)測,以達(dá)到實(shí)時(shí)跟蹤車輛的目的。在文獻(xiàn)[3]中,作者利用SIFT特征描述子表述相鄰幀的圖像像素,克服了傳統(tǒng)使用光流實(shí)現(xiàn)弱小目標(biāo)檢測和跟蹤的缺點(diǎn),為處理紅外弱小目標(biāo)提供了新的思路。
有關(guān)火災(zāi)圖像識別,近幾年的研究取得了較大進(jìn)展。在文獻(xiàn)[4]中,作者選用HSI顏色空間,通過確定色度分量H和亮度分量I的初始聚類中心,分別在直方圖特征空間進(jìn)行模糊聚類處理,從而實(shí)現(xiàn)了火災(zāi)圖像的識別處理。在文獻(xiàn)[5]中,作者采用圖像灰度化和二維熵最大閾值法對圖像進(jìn)行預(yù)分割,得到火焰疑似區(qū)域,再對火焰圖像進(jìn)行分析與決策,以達(dá)到鑒別火災(zāi)圖像的效果。
從以上研究可知,充分利用圖像視覺特征能夠較好地將火災(zāi)圖像與非火災(zāi)圖像區(qū)分開來。因此,本文在深入分析火災(zāi)圖像在顏色和紋理特征上的顯著特性基礎(chǔ)上,提出了一種基于顏色直方圖、SIFT算法和K均值聚類算法的火災(zāi)圖像特征提取與識別方法,旨在有效地對火災(zāi)圖像進(jìn)行識別,進(jìn)而做到及時(shí)報(bào)警。
2 基于SIFT算法和K均值聚類的特征提取與識別方法
2.1 HSV顏色直方圖
作為一種區(qū)分圖像內(nèi)容的主要特征,顏色特征的提取與處理在圖像識別過程中占據(jù)了重要位置。在圖像處理中,常用的圖像顏色模式有兩種:RGB顏色模型和HSV顏色模型。其中,RGB顏色空間采用物理三基色表示,適合彩色顯像管工作,但不適合彩色圖像的處理;而HSV顏色模型不僅可以清晰地將圖像中的顏色特征和亮度特征相區(qū)別,其在顏色的表示上所采用的色調(diào)及色彩飽和度更接近人眼感受顏色的方式。故HSV顏色模式在顏色特征檢測方面較RGB模式更適合。
假設(shè)一幅圖像在區(qū)間[0,I]內(nèi)共有T個(gè)灰度級,則定義其灰度直方圖為如下函數(shù):
⑴
其中,是區(qū)間[0,I]內(nèi)第m級亮度,nm是灰度級為像素總數(shù),m=1,2,…,T。
歸一化直方圖后得到:
⑵
其中,表示灰度級出現(xiàn)的頻率。
2.2 尺度不變性特征變換算法
一幅圖像的尺度空間被定義為函數(shù)C(x,y,σ),它是尺度變化的高斯函數(shù)G與圖像Im的卷積:
⑶
⑷
SIFT算法[6]是一種檢測圖像局部特征的算法,它具有尺度不變性的特點(diǎn),即在改變旋轉(zhuǎn)角度、圖像亮度或拍攝視角的狀態(tài)下,仍能得到很好的檢測效果。
SIFT算法提取圖像特征點(diǎn)主要有以下三個(gè)步驟。
步驟1 建立圖像的DOG(Difference-of-Gaussian)金字塔,在DOG尺度空間中的26個(gè)領(lǐng)域中檢測極值,D(x,y,σ)是兩個(gè)相鄰尺度圖像之差,即
⑸
如果一個(gè)點(diǎn)在DOG尺度空間本層以及上下兩層26個(gè)領(lǐng)域中是最大或最小值時(shí),就認(rèn)為該點(diǎn)是圖像在該尺度下的一個(gè)特征點(diǎn)。
步驟2 利用關(guān)鍵點(diǎn)鄰域像素的梯度方向分布特性,為每個(gè)關(guān)鍵點(diǎn)指定方向參數(shù),使算子具備旋轉(zhuǎn)不變性。
⑹
⑺
公式⑹、⑺分別為(x,y)處梯度的模值和方向公式。其中:C所用的尺度為每個(gè)關(guān)鍵點(diǎn)各自所在的尺度。
步驟3 生成SIFT特征向量,將坐標(biāo)軸旋轉(zhuǎn)到特征點(diǎn)方向以保證旋轉(zhuǎn)不變性。然后,以關(guān)鍵點(diǎn)為中心取8×8的窗口,利用公式⑹、⑺求得每個(gè)像素(i,j)的梯度幅值F(i,j)與梯度方向θ(i,j),箭頭方向代表該像素的梯度方向,箭頭長度代表梯度模值,再用高斯窗口對其進(jìn)行加權(quán)運(yùn)算,每個(gè)像素對應(yīng)一個(gè)向量,長度為F(i,j)*G(σ',i,j)。其中G(σ',i,j)為該像素點(diǎn)的高斯權(quán)值,方向?yàn)棣龋╥,j),在實(shí)際應(yīng)用中可采用4×4個(gè)小窗口,這樣每個(gè)特征點(diǎn)就可用128維向量來表征。
2.3 PCA方法
PCA方法是利用降維的思想,將多個(gè)變量轉(zhuǎn)化為少數(shù)幾個(gè)綜合變量,這些綜合變量能夠反映原始變量的絕大部分信息,且所含的信息互不重疊[7]。
PCA方法的基本步驟如下。
步驟1 原始指標(biāo)數(shù)據(jù)的標(biāo)準(zhǔn)化采集m維隨機(jī)向量L=(L1,L2,…,Lm)T,n個(gè)樣品Li=(Li1,Li2,…,Lim)T,i=1,2,…,n,(n>m),構(gòu)造樣本陣,對樣本陣元進(jìn)行標(biāo)準(zhǔn)化變換,得到標(biāo)準(zhǔn)化矩陣B:
⑻
其中:,。
步驟2 對步驟1中得到的標(biāo)準(zhǔn)化陣B求相關(guān)系數(shù)矩陣
⑼
其中:。
步驟3 求解特征方程|B-σIp|=0,得到p個(gè)特征根,用以確定主成分(g值得確定保證信息利用率達(dá)85%以上)。對每個(gè)σj(j=1,2,…,g),求解方程組Cv=σjv得到單位特征向量。
2.4 K均值聚類
K均值算法是目前最常用的聚類算法之一,其目的是使各個(gè)樣本與所在類別均值的誤差平方和達(dá)到最小。K均值算法原理簡單、具有計(jì)算速度快的特點(diǎn),故在實(shí)際應(yīng)用非常廣泛。
假設(shè)要將n個(gè)數(shù)據(jù)對象聚集為K個(gè)類別,使用K均值算法的主要步驟為:
步驟1 從n個(gè)數(shù)據(jù)對象中隨機(jī)選擇K個(gè)對象作為初始聚類中心;
步驟2 根據(jù)每個(gè)聚類對象的中心對象,計(jì)算每個(gè)對象與這些中心對象的距離,并根據(jù)最小距離重新對相應(yīng)對象進(jìn)行劃分;
步驟3 計(jì)算新的中心對象,返回步驟2,當(dāng)每個(gè)聚類不再發(fā)生變化時(shí)停止。
3 實(shí)驗(yàn)結(jié)果與分析
為驗(yàn)證本文中提出的方法的有效性,我們從互聯(lián)網(wǎng)上下載了600幅與火災(zāi)相關(guān)的圖像和1100幅非火災(zāi)圖像,其中500幅火災(zāi)圖像和1000幅非火災(zāi)圖像用于訓(xùn)練過程,余下的100幅火災(zāi)圖像和100幅非火災(zāi)圖像用于測試過程。
訓(xùn)練過程和測試過程的算法流程圖分別如圖2和圖3所示。
[開始][從訓(xùn)練庫中導(dǎo)入圖像][圖像預(yù)處理][計(jì)算圖像的HSV顏色空間特征][該圖像是否為火災(zāi)圖像?] [保存火災(zāi)類圖像的HSV顏色空間特征][找出火災(zāi)類圖像的共有顏色特征][計(jì)算局部性特征][訓(xùn)練庫圖像是否讀入完畢?] [主成分分析降維][K均值聚類][分別得到火災(zāi)類圖像的聚類中心和非火災(zāi)類圖像的聚類中心][結(jié)束] [Yes] [No] [No][Yes]
圖2 訓(xùn)練過程
[開始][從測試庫中導(dǎo)入圖像][圖像預(yù)處理][計(jì)算圖像的HSV顏色空間特征][是否與火災(zāi)類圖像的共有顏色特征存在重疊?] [計(jì)算局部性特征][主成分分析降維][設(shè)接近火災(zāi)類圖像的特征點(diǎn)數(shù)為a的初值為0,接近非火災(zāi)圖像的特征點(diǎn)數(shù)為b的初值為0][從測試圖像特征點(diǎn)中提取
一維特征點(diǎn)][計(jì)算該特征點(diǎn)與火災(zāi)類圖像聚類
中心距離L1][計(jì)算該特征點(diǎn)與非火災(zāi)類圖像聚類
中心距離L2][L1
圖3 測試過程
假設(shè)訓(xùn)練庫中訓(xùn)練圖像SIFT得到的特征點(diǎn)為200×128維,在PCA降維后的得到的特征點(diǎn)為30×12維,現(xiàn)在有一幅測試圖像I,假設(shè)其HSV顏色空間中與火災(zāi)圖像的共有顏色特征存在重疊,計(jì)算其降維后的30×12局部特征,接近火災(zāi)圖像的特征點(diǎn)數(shù)為a,接近非火災(zāi)圖像的特征點(diǎn)數(shù)為b,其某一特征點(diǎn)與火災(zāi)類圖像聚類中心距離為L1,與非火災(zāi)類圖像聚類中心距離為L2(本文中采用歐式距離公式計(jì)算距離值),則可以通過計(jì)算L1與L2之間的距離差值來獲得該特征點(diǎn)接近的圖像,最后通過計(jì)算a所占比例獲得圖像I的識別結(jié)果。若a/(a+b)>0.5,則該圖像識別為火災(zāi)類圖像,否則,該圖像識別為非火災(zāi)類圖像。
圖4-圖6分別給出了三幅示例圖像的識別結(jié)果。圖4中的圖像得到的計(jì)算結(jié)果為0.7333,其值大于0.5,判定為火災(zāi)圖像;圖5中的圖像得到的計(jì)算結(jié)果為0.2333,其值小于0.5,判定為非火災(zāi)圖像;圖6中的圖像由于其HSV顏色空間中與火災(zāi)圖像的共有顏色特征不存在重疊,所以直接判斷為非火災(zāi)圖像。表1給出了針對100幅火災(zāi)圖像和100幅非火災(zāi)圖像的測試結(jié)果。
從實(shí)驗(yàn)結(jié)果可知,本文提出的方法獲得了較高的正識率和較低的誤檢率,能夠有效地將火災(zāi)圖像和非火災(zāi)圖像區(qū)分出來。部分圖像也存在誤識,其原因可能是:有些非火災(zāi)圖像的紋理與火災(zāi)區(qū)域非常接近,而有些火災(zāi)區(qū)域的紋理比較特殊,有異于尋?;馂?zāi)區(qū)域的紋理,所以出現(xiàn)了錯(cuò)誤的識別。
4 結(jié)束語
隨著當(dāng)前智能信息系統(tǒng)在各行各業(yè)的普及,針對火災(zāi)這種具有重大危害的事件進(jìn)行早期自動報(bào)警,能夠有效地控制事態(tài)的進(jìn)一步發(fā)展。本文提出的方法能夠有效地將火災(zāi)圖像和非火災(zāi)圖像區(qū)分出來?;谠摲椒ㄑ邪l(fā)的智能火災(zāi)報(bào)警系統(tǒng)區(qū)別于傳統(tǒng)的感煙、感光火災(zāi)監(jiān)測,具有重要的科學(xué)意義與應(yīng)用價(jià)值。
參考文獻(xiàn)(References):
[1] 雷松澤,姚紅革,齊敏,郝重陽.基于SIFT特征的人耳識別[J].
計(jì)算機(jī)應(yīng)用,2009.6:1690-1693
[2] 尤優(yōu),詹智財(cái),張松松.一種基于SIFT特征的車輛跟蹤系統(tǒng)實(shí)
現(xiàn)[J].電腦知識與技術(shù),2011.23:5695-5697
[3] 牛志彬,周越.基于SIFT流紅外弱小目標(biāo)的檢測和跟蹤[J].微
型電腦應(yīng)用,2010.1:37-39
[4] 方維,王慧琴,楊娜娟,厲謹(jǐn).基于改進(jìn)FCM聚類算法的火災(zāi)
圖像分割[J].計(jì)算機(jī)仿真,2011.4:246-249
[5] 郝東東,展美寧.基于BP神經(jīng)網(wǎng)絡(luò)的火災(zāi)圖像識別技術(shù)[J].硅
谷,2011.20:109
[6] David G.Lowe. Distinctive Image Features from Scale-
Invariant Keypoints[J].International Journal of Computer Vision,Nov2004:91-110
[7] 朱星宇,陳勇強(qiáng).SPSS多元統(tǒng)計(jì)分析方法及應(yīng)用[M].清華大
學(xué)出版社,2011.