馬 也,常 青,胡謀法
?
復(fù)雜背景下紅外人體目標(biāo)檢測(cè)算法研究
馬 也,常 青,胡謀法
(國(guó)防科技大學(xué) 電子科學(xué)與工程學(xué)院ATR重點(diǎn)實(shí)驗(yàn)室,湖南 長(zhǎng)沙 410073)
紅外圖像信噪比和對(duì)比度較低、缺乏顏色紋理信息、目標(biāo)周圍有光暈效應(yīng)、邊緣模糊,這些缺點(diǎn)對(duì)紅外圖像中人體目標(biāo)檢測(cè)提出了挑戰(zhàn)。本文對(duì)復(fù)雜環(huán)境下紅外圖像序列中運(yùn)動(dòng)人體目標(biāo)檢測(cè)技術(shù)進(jìn)行研究。首先采用基于改進(jìn)的混合高斯模型(Gaussian mixture model,GMM)的背景減除法對(duì)人體目標(biāo)進(jìn)行分割,通過多個(gè)帶有權(quán)值的高斯過程來描述復(fù)雜變化的背景,對(duì)模型個(gè)數(shù)、權(quán)值、學(xué)習(xí)率進(jìn)行更新。然后對(duì)分割得到感興趣區(qū)域(Region of interest,ROI)采用融合邊緣方向累加和特性的梯度方向直方圖(Accumulation of oriented edge and histogram of oriented gradient,AOE-HOG)進(jìn)行特征描述,利用支持向量機(jī)(Support vector machine,SVM)實(shí)現(xiàn)對(duì)人體目標(biāo)分類檢測(cè)。實(shí)驗(yàn)表明,本文算法能夠在復(fù)雜場(chǎng)景下正確檢測(cè)出人體目標(biāo),對(duì)于多目標(biāo)距離較近甚至有部分粘連的情形,也具有較好效果。
紅外圖像;人體檢測(cè);混合高斯模型;邊緣方向累加和;梯度方向直方圖;支持向量機(jī)
人體目標(biāo)檢測(cè)是目前計(jì)算機(jī)視覺領(lǐng)域熱點(diǎn)研究課題,在智能視頻監(jiān)控、車載輔助駕駛、機(jī)場(chǎng)安防等領(lǐng)域都有廣泛應(yīng)用前景。人體姿態(tài)多樣、形狀大小不一,是典型的非剛體目標(biāo),并且目標(biāo)遮擋、粘連、重疊和背景干擾等狀況非常常見,再加上紅外圖像本身特性,使得快速準(zhǔn)確檢測(cè)出紅外圖像序列中人體目標(biāo)難度較大。
人體目標(biāo)檢測(cè)主要分為ROI分割過程和分類檢測(cè)過程[1]。紅外圖像序列ROI分割方法主要有光流法[2]、幀差法[3]和背景差法[4]。光流法建立各個(gè)像素點(diǎn)的速度矢量特征,根據(jù)光流矢量的連續(xù)變化情況,確定運(yùn)動(dòng)目標(biāo)的位置、數(shù)量和運(yùn)動(dòng)速度等信息。光流法對(duì)噪聲敏感、運(yùn)算量大、實(shí)時(shí)性較差,常用于理論分析。幀差法對(duì)圖像進(jìn)行時(shí)域差分,提取圖像中的運(yùn)動(dòng)目標(biāo)區(qū)域或目標(biāo)輪廓,適用于目標(biāo)運(yùn)動(dòng)速度較快或?qū)Ψ指罹纫蟛桓叩那闆r。背景差法利用當(dāng)前幀圖像與參考背景進(jìn)行差分,檢測(cè)速度依賴于背景建模,并且對(duì)光照和干擾目標(biāo)比較敏感,需要提高背景建模的實(shí)時(shí)性和魯棒性。
人體目標(biāo)分類檢測(cè)的常用方法有:基于模版匹配[5]的方法、基于目標(biāo)運(yùn)動(dòng)信息的識(shí)別[6]方法和基于目標(biāo)特征提取分類[1]的方法?;谀0嫫ヅ涞姆椒ㄓ捎谒璧哪0鍘?kù)龐大,且泛化能力較差,實(shí)現(xiàn)比較困難。而基于目標(biāo)運(yùn)動(dòng)信息的方法運(yùn)算量大,且易受噪聲和干擾目標(biāo)影響,應(yīng)用范圍有限。目標(biāo)特征提取分類的方法通過提取目標(biāo)的某些特征來對(duì)目標(biāo)進(jìn)行描述,由于泛化能力好而得到人們關(guān)注,比較經(jīng)典的目標(biāo)特征描述方法有:局部二值(LBP)特征[7]、Haar-like特征[8]和HOG特征等[9]。LBP特征是一種用于紋理分類的特征提取方法,當(dāng)圖像比較模糊或者光照變化強(qiáng)烈時(shí),LBP特征難以有效描述人體目標(biāo)紋理特征。Haar-like特征最早應(yīng)用于人臉檢測(cè),只能描述特定走向(水平、垂直、對(duì)角)結(jié)構(gòu)。但由于紅外圖像的質(zhì)量通常較差、圖像模糊,關(guān)鍵點(diǎn)并不明確,使得關(guān)鍵點(diǎn)檢測(cè)算法難以準(zhǔn)確檢測(cè)出目標(biāo)。而HOG特征通過掃描窗口對(duì)待檢測(cè)圖像進(jìn)行密集掃描并計(jì)算梯度方向,梯度特征是紅外圖像中比較穩(wěn)定的特征,對(duì)紅外人體目標(biāo)檢測(cè)準(zhǔn)確率較高,但實(shí)際應(yīng)用中還需要進(jìn)一步解決紅外圖像帶來的特異性缺陷。
紅外成像雖然使得陰影、光照突變、環(huán)境光和夜間可視性等影響傳統(tǒng)計(jì)算機(jī)視覺的關(guān)鍵問題得到有效解決,但是對(duì)比度低、邊緣模糊、信噪比低、噪聲大、缺乏色彩信息以及成分復(fù)雜等特點(diǎn)也使得其面臨特有的挑戰(zhàn)。針對(duì)復(fù)雜背景下紅外序列圖像中人體目標(biāo)檢測(cè),本文提出了一種有效的改進(jìn)算法,采用基于改進(jìn)的GMM人體目標(biāo)分割和基于AOE-HOG特征的人體檢測(cè)方法在一定程度上提高了實(shí)時(shí)性和準(zhǔn)確性。本文首先采用自適應(yīng)更新GMM個(gè)數(shù)算法,對(duì)紅外圖像序列中ROI進(jìn)行分割,得到人體候選目標(biāo);然后對(duì)候選目標(biāo)提取AOE-HOG特征;對(duì)包含人體目標(biāo)和非人體目標(biāo)的訓(xùn)練樣本進(jìn)行訓(xùn)練,得到基于核函數(shù)映射的SVM分類器,根據(jù)AOE-HOG特征對(duì)目標(biāo)進(jìn)行分類;最后根據(jù)分類結(jié)果剔除非人體目標(biāo),篩選出人體目標(biāo)。算法流程圖如圖1所示。
圖1 算法流程圖
通常情況下,人體溫度恒定且比周圍環(huán)境的溫度要高,因此紅外圖像中人體亮度比背景亮度要高,并且通常保持穩(wěn)定。對(duì)于較為單一場(chǎng)景,例如開闊地帶、空天等,可以采用幀差法和區(qū)域閾值法等較為簡(jiǎn)單直接的方法;而針對(duì)變化大、干擾目標(biāo)多的復(fù)雜場(chǎng)景,比如水面波紋、樹葉擺動(dòng)等,紅外圖像序列中對(duì)應(yīng)像素的灰度值變化范圍更大,這時(shí)常使用背景差法提取前景目標(biāo),而GMM是背景建模的經(jīng)典方法之一。GMM對(duì)存在小幅度周期運(yùn)動(dòng)的復(fù)雜背景適應(yīng)性較好,例如噴泉、搖動(dòng)的樹枝、飄動(dòng)的旗幟以及波動(dòng)的水面等情況,可以抑制動(dòng)態(tài)背景對(duì)目標(biāo)檢測(cè)的影響。
最早提出的GMM是利用多個(gè)狀態(tài)描述每個(gè)像素點(diǎn)在不同時(shí)刻的灰度值來對(duì)背景建模,將待檢測(cè)像素點(diǎn)的灰度值與多個(gè)狀態(tài)的灰度值比較,判斷待檢測(cè)像素點(diǎn)是前景目標(biāo)還是背景[10]。
定義某個(gè)高斯分布出現(xiàn)的概率與其方差的比值,作為判斷目標(biāo)像素點(diǎn)的度量,用公式表示為:
=,t/,t(3)
因?yàn)楸尘包c(diǎn)比起前景點(diǎn)更穩(wěn)定、出現(xiàn)次數(shù)更多,因此背景點(diǎn)對(duì)應(yīng)的高斯分布會(huì)有較小方差和較大權(quán)值。當(dāng)比值大時(shí),說明這個(gè)高斯分布更有可能表示背景像素點(diǎn);反之,則表示可能為目標(biāo)像素點(diǎn)。將個(gè)高斯分布按照值的大小進(jìn)行降序排列。設(shè)選取前個(gè)高斯分布描述背景,則有:
如果該點(diǎn)像素值滿足這一不等式,則判定此點(diǎn)匹配該高斯分布,將其判定為背景像素點(diǎn);如果不匹配所有的高斯分布,則判定該點(diǎn)屬于目標(biāo)像素點(diǎn)。對(duì)某一幀的所有像素點(diǎn)都進(jìn)行匹配,得到的所有目標(biāo)像素點(diǎn)構(gòu)成的集合就是可能的人體目標(biāo)。最后根據(jù)匹配結(jié)果對(duì)模型進(jìn)行更新,更新策略為:
1)如果該點(diǎn)像素匹配一個(gè)或者一個(gè)以上的高斯分布,則判定該點(diǎn)屬于背景像素點(diǎn)。模型更新用公式組表示為:
式中:∈[0, 1]為學(xué)習(xí)率,=/,t為權(quán)值更新率,表示高斯分布中各參數(shù)更新快慢程度,I表示當(dāng)前時(shí)刻任意像素點(diǎn)像素值。
2)如果該點(diǎn)像素值與所有高斯分布都不匹配,則判定該點(diǎn)屬于目標(biāo)像素點(diǎn),并按照當(dāng)前像素灰度值產(chǎn)生新的高斯模型(均值0即為像素灰度值,方差為02,并選取較小權(quán)值),替換權(quán)值最小的高斯分布。對(duì)其余-1個(gè)高斯模型僅更新權(quán)值,保持均值和方差2不變,表示為:
經(jīng)典GMM的高斯模型個(gè)數(shù)是確定的,通常取3~5。實(shí)驗(yàn)發(fā)現(xiàn),設(shè)定=3難以滿足干擾目標(biāo)較多、有多個(gè)前景目標(biāo)或者目標(biāo)運(yùn)動(dòng)較快的情況,分割結(jié)果往往帶有很多噪聲點(diǎn),甚至條狀分布的虛假目標(biāo),不利于后續(xù)分類檢測(cè);而設(shè)定=5時(shí),對(duì)較為簡(jiǎn)單的運(yùn)動(dòng)場(chǎng)景卻耗時(shí)過長(zhǎng),難以滿足實(shí)時(shí)性需求。原因在于,高斯模型個(gè)數(shù)不變時(shí),背景大部分像素點(diǎn)變化很小,每次更新都會(huì)有高斯模型與該背景像素點(diǎn)相匹配,導(dǎo)致其權(quán)值逐漸變大,而不匹配的高斯模型權(quán)值會(huì)逐漸變小。所以當(dāng)高斯模型個(gè)數(shù)固定時(shí),每個(gè)高斯模型對(duì)于沒有變化的背景像素點(diǎn)都進(jìn)行了無效的更新,更新策略冗余導(dǎo)致耗時(shí)過長(zhǎng)。因此,本文采用自適應(yīng)更新GMM個(gè)數(shù)的算法,快速高效地訓(xùn)練背景模型,提取背景圖像,保證分割效果較好的同時(shí)可以提高實(shí)時(shí)性。
自適應(yīng)更新GMM個(gè)數(shù)在初始時(shí)對(duì)每個(gè)像素點(diǎn)只分配一個(gè)高斯模型,接下來進(jìn)行模型匹配時(shí),如果能夠與該模型匹配,那么保持該高斯模型不變;如果不能與該模型匹配,則需要判斷模型個(gè)數(shù)是否達(dá)到所設(shè)定的極限值(為適應(yīng)復(fù)雜場(chǎng)景,設(shè)定極限值=5),如果未達(dá)到極限值,則新增加一個(gè)高斯模型,如果達(dá)到極限則用新的模型替換權(quán)值最小的高斯模型。更新完成之后,利用公式(3),按照的大小進(jìn)行排序,再利用公式(8)對(duì)權(quán)值進(jìn)行歸一化處理。改進(jìn)的GMM算法流程圖如圖2所示。
采用改進(jìn)算法得到的結(jié)果如圖3所示,圖a為第330幀原始灰度圖像,采用設(shè)定經(jīng)典GMM個(gè)數(shù)=3不變,得到的分割結(jié)果含有很多背景像素點(diǎn)(圖b),耗時(shí)為1.786 s/幀;而設(shè)定=5不變時(shí),得到的結(jié)果較好(圖c),但是耗時(shí)為5.436s/幀,難以滿足實(shí)時(shí)性需求。采用改進(jìn)的GMM,設(shè)定模型極限值為=5,得到的分割結(jié)果包含背景像素點(diǎn)較少,且目標(biāo)輪廓清晰準(zhǔn)確(圖d),耗時(shí)為0.782s/幀。實(shí)驗(yàn)結(jié)果證明,改進(jìn)算法能夠大大減小背景更新幅度,減少計(jì)算量。
由于復(fù)雜背景的變化,前述ROI分割得到人體候選目標(biāo)可能含有虛假目標(biāo),需要通過特征提取、分類進(jìn)一步判斷候選目標(biāo)是否為人體目標(biāo)。
HOG特征通過計(jì)算、統(tǒng)計(jì)圖像局部區(qū)域的梯度方向直方圖來構(gòu)成特征,能夠很好地描述局部目標(biāo)的形狀和表象,常結(jié)合SVM應(yīng)用于圖像識(shí)別。HOG特征構(gòu)建過程如下:
圖2 改進(jìn)的GMM算法流程圖
圖3 經(jīng)典GMM和自適應(yīng)更新GMM分割結(jié)果對(duì)比
1)計(jì)算灰度圖像梯度
首先定義圖像中像素點(diǎn)(,)的像素灰度值、水平方向梯度和垂直方向梯度分別為:(,)、G(,)和G(,),則(,)處的梯度幅值和梯度方向表示為:
式中:
2)為每個(gè)細(xì)胞單元構(gòu)建HOG
把訓(xùn)練樣本圖像分割為若干個(gè)像素的單元(cell),把梯度方向平均劃分為9個(gè)區(qū)間(bin),在每個(gè)單元里面對(duì)所有像素的梯度方向在各個(gè)方向區(qū)間進(jìn)行直方圖統(tǒng)計(jì),得到一個(gè)9維特征向量。每相鄰4個(gè)單元構(gòu)成一個(gè)塊(block),把一個(gè)塊內(nèi)的特征向量聯(lián)起來得到36維特征向量,用塊對(duì)樣本圖像進(jìn)行掃描,掃描步長(zhǎng)為一個(gè)單元。
3)特征串聯(lián)
最終得到一個(gè)高維度向量**,、、分別表示每個(gè)區(qū)間中細(xì)胞單元的數(shù)目、每個(gè)細(xì)胞單元中像素點(diǎn)的數(shù)目、每個(gè)細(xì)胞的直方圖通道數(shù)目。
4)HOG特征向量歸一化
對(duì)每一個(gè)塊內(nèi)的HOG特征向量進(jìn)行歸一化,用公式表示為:
式中:表示特征向量,||||表示范數(shù)(通常=1,2),為了避免分母為零無意義,加入一個(gè)較小的正數(shù)。
HOG特征與其他特征描述方法相比有以下優(yōu)點(diǎn):第一針對(duì)圖像局部方格即細(xì)胞單元進(jìn)行提取的HOG特征具備幾何和光學(xué)不變性;第二是經(jīng)過對(duì)各細(xì)胞單元?dú)w一化后,對(duì)人體輕微肢體動(dòng)作的包容性較強(qiáng),可以忽略而不會(huì)影響檢測(cè)效果;第三是HOG特征對(duì)空域抽樣、方向抽樣不敏感,只要人體大體上能夠保持直立的姿勢(shì),不會(huì)影響檢測(cè)結(jié)果。綜合考慮,HOG在圖像中人體目標(biāo)檢測(cè)有較強(qiáng)適用性。
本文采用1570幅128×64像素大小的灰度圖像作為訓(xùn)練樣本,其中人體目標(biāo)470個(gè),非人體目標(biāo)1100個(gè)。把每幅圖像的每8×8像素組成一個(gè)單元,每2×2個(gè)單元組成一個(gè)塊,因?yàn)槊總€(gè)單元有9維特征,所以每個(gè)塊內(nèi)有4×9=36維特征,以8個(gè)像素為步長(zhǎng),則水平方向?qū)⒂?個(gè)掃描窗口,垂直方向?qū)⒂?5個(gè)掃描窗口。也就是說,128×64像素大小的圖片總共有4×9×7×15=3780維特征。
Dalal[9]最早將HOG特征用于可見光圖像中的人體目標(biāo)檢測(cè),識(shí)別正確率較高,但對(duì)紅外圖像中目標(biāo)接近、粘黏和部分遮擋情況的適應(yīng)性較差;而對(duì)于多個(gè)人體目標(biāo)的場(chǎng)景,存在漏警現(xiàn)象,降低了識(shí)別的正確率。考慮到紅外圖像中紋理細(xì)節(jié)較少,而人體目標(biāo)邊緣特性帶來的有效信息非常重要,能夠降低局部噪聲的影響,因此本文引進(jìn)邊緣方向累加和這一統(tǒng)計(jì)特性描述邊緣信息。邊緣方向累加和是圖像邊緣在各個(gè)方向的概率統(tǒng)計(jì)累加結(jié)果,因此能夠利用ROI的邊緣信息來檢測(cè)紅外圖像中非剛性的人體目標(biāo)。經(jīng)過驗(yàn)證,本文融合邊緣方向累加和特性對(duì)HOG特征進(jìn)行改進(jìn),能夠明顯提高運(yùn)動(dòng)人體目標(biāo)識(shí)別的正確率。
邊緣方向累加和的算法具體如下:
2)卷積運(yùn)算提取邊緣信息。將每一幅訓(xùn)練圖像與5個(gè)卷積核分別進(jìn)行卷積濾波,每個(gè)卷積核對(duì)應(yīng)生成一幅濾波后圖像,因此共有5幅濾波后圖像。
3)將濾波后每幅圖像各像素灰度值進(jìn)行各自累加,得到5個(gè)標(biāo)量,作為邊緣方向累加和特性。
4)對(duì)邊緣方向值進(jìn)行歸一化。采用的歸一化因子為像素灰度值的最大值。由此生成一個(gè)5維特征向量,并與HOG特征的3780維特征向量進(jìn)行特征串聯(lián),形成一個(gè)3785維的特征向量。
利用經(jīng)典的HOG特征和AOE-HOG特征進(jìn)行人體目標(biāo)分類的結(jié)果如圖4所示。實(shí)驗(yàn)結(jié)果證明,增加邊緣方向累加和特性后能夠更好地描述紅外圖像人體目標(biāo)的特征,對(duì)邊緣特性較差的目標(biāo)有更準(zhǔn)確的分類結(jié)果,提高了分類正確率;由于改進(jìn)方法僅增加了5維特征,因此耗時(shí)沒有明顯增加。
圖4 采用經(jīng)典HOG特征和AOE-HOG特征提取人體目標(biāo)的結(jié)果對(duì)比
SVM[11]是一種有監(jiān)督的機(jī)器學(xué)習(xí)方法,通過構(gòu)建分類界面實(shí)現(xiàn)對(duì)目標(biāo)區(qū)域的分類,即采用一系列的正負(fù)訓(xùn)練樣本對(duì)分類器進(jìn)行監(jiān)督訓(xùn)練,求出最優(yōu)的分類決策函數(shù)。SVM以結(jié)構(gòu)化風(fēng)險(xiǎn)最小化為原則,在選擇分類模型和模型參數(shù)上兼顧訓(xùn)練誤差和測(cè)試誤差最小化。
而在實(shí)際問題中,很多都是非線性可分的情況,這時(shí)需要放寬約束條件,引入松弛變量≥0,=1, 2,,,此時(shí)最優(yōu)超平面的目標(biāo)函數(shù)為:
式中:定義為懲罰參數(shù)。目標(biāo)函數(shù)的第一項(xiàng)為最大化分類間隔,第二項(xiàng)為分類造成的錯(cuò)誤代價(jià),此時(shí)問題轉(zhuǎn)化為使得目標(biāo)函數(shù)最小化。
對(duì)于人體目標(biāo)檢測(cè)這一非線性可分問題,可以通過適當(dāng)?shù)暮撕瘮?shù)將多維向量映射到更高維的空間,來建立一個(gè)有最大間隔的超平面,這個(gè)最優(yōu)超平面即作為分類決策函數(shù)。核函數(shù)是一個(gè)對(duì)稱函數(shù):R×R?,將2個(gè)R空間中的維向量映射為一個(gè)實(shí)數(shù),計(jì)算高維空間中的點(diǎn)積得到:
式中::R?R。本文采用在實(shí)際應(yīng)用性能更優(yōu)的徑向基核函數(shù)作為支持向量機(jī)的內(nèi)積函數(shù)[12],公式為:
式中:為核參數(shù)。在訓(xùn)練樣本集的選取上,選取多種形態(tài)動(dòng)作的人體目標(biāo)和一些相似程度較高的干擾目標(biāo),來增加多樣性,確保分類算法健壯。
經(jīng)過以徑向基核函數(shù)為內(nèi)積函數(shù)的SVM分類后,進(jìn)行交叉驗(yàn)證(Cross validation,CV)驗(yàn)證分類器性能。本文選用K-folder CV進(jìn)行驗(yàn)證[13]:將訓(xùn)練樣本均分為個(gè)子集進(jìn)行交叉比對(duì)測(cè)試,考察其分類平均準(zhǔn)確率。將1100個(gè)非人體目標(biāo)樣本和470個(gè)人體目標(biāo)樣本隨機(jī)分成8~12組進(jìn)行驗(yàn)證,得到不同分組情況下的平均耗時(shí)和平均準(zhǔn)確率。綜合耗時(shí)和準(zhǔn)確率考慮,選取10組作為交叉驗(yàn)證組數(shù)較為合理,平均耗時(shí)為5s左右。此時(shí),確定懲罰參數(shù)C的最佳值為128,核參數(shù)最佳值為=4,交叉驗(yàn)證平均準(zhǔn)確率接近99.9%。
通過訓(xùn)練樣本建立SVM分類器,將ROI提取得到的特征向量作為SVM分類器的輸入,根據(jù)輸出判別結(jié)果判斷其是否為人體目標(biāo)。
本文選取OTCBVS測(cè)試數(shù)據(jù)庫(kù)中6個(gè)室內(nèi)外場(chǎng)景的紅外視頻源,包含多個(gè)人體、樓道、窗戶、天花板、頂燈、樹林、草地、車輛等多種目標(biāo),并且多個(gè)人體目標(biāo)有分隔距離較大、分隔距離較小、粘連、部分遮擋、目標(biāo)穿越遮擋物等多種情況。這些視頻對(duì)人工場(chǎng)景和自然場(chǎng)景具備一定代表性,貼合實(shí)際中的復(fù)雜場(chǎng)景。
在Intel Core i7-7500U CPU 2.70GHz處理器上安裝64位Windows10操作系統(tǒng),運(yùn)行Matlab R2016b版本軟件,程序讀取同一紅外圖像序列,將分割出的ROI歸一化為128×64像素大小后分別提取經(jīng)典HOG特征和AOE-HOG特征,然后使用參數(shù)為(,)=(128, 4)的徑向基核函數(shù)SVM進(jìn)行分類。得到實(shí)驗(yàn)統(tǒng)計(jì)結(jié)果如表1所示,正確率和平均耗時(shí)結(jié)果對(duì)比分別如圖5、圖6所示。部分實(shí)驗(yàn)結(jié)果例圖如圖7所示。
實(shí)驗(yàn)結(jié)果表明,對(duì)紅外圖像采用基于改進(jìn)的GMM的背景減除法對(duì)紅外圖像進(jìn)行分割,提取AOE-HOG特征后進(jìn)行分類識(shí)別,虛警率低于3.5%、漏警率低于3%,準(zhǔn)確率在97%以上,平均耗時(shí)較低。證明本文的人體目標(biāo)檢測(cè)算法能夠在復(fù)雜場(chǎng)景下正確檢測(cè)出人體,對(duì)于目標(biāo)距離較近(圖7(a))、多個(gè)目標(biāo)同時(shí)檢測(cè)(圖7(b))、部分目標(biāo)粘連(圖7(c))、部分目標(biāo)遮擋(圖7(d))和車輛行駛干擾(圖7(e))、穿越遮擋物干擾(圖7(f))的情形有較好效果。
表1 不同測(cè)試集的人體檢測(cè)結(jié)果
圖5 HOG和AOE-HOG的正確率結(jié)果對(duì)比
圖6 HOG和AOE-HOG的平均耗時(shí)結(jié)果對(duì)比
圖7 基于AOE-HOG特征的三個(gè)測(cè)試集人體目標(biāo)檢測(cè)結(jié)果例圖
本文針對(duì)紅外圖像中的人體目標(biāo)檢測(cè)技術(shù)進(jìn)行研究,采用基于改進(jìn)的GMM的背景減除法進(jìn)行人體目標(biāo)分割,取得了較好的效果。在有樹葉擺動(dòng)等微小目標(biāo)干擾的復(fù)雜環(huán)境下具備較強(qiáng)的抗干擾能力。針對(duì)人體目標(biāo)形態(tài)多變的特點(diǎn)采用AOE-HOG特征來描述人體目標(biāo),用支持向量機(jī)對(duì)人體目標(biāo)和非人體目標(biāo)進(jìn)行分類。實(shí)驗(yàn)結(jié)果表明,本文提出的人體目標(biāo)檢測(cè)方法,能夠在復(fù)雜場(chǎng)景下正確檢測(cè)出人體,且平均耗時(shí)較低。但本文算法對(duì)于人體被遮擋部分較多、異常成像導(dǎo)致圖像缺失、多個(gè)目標(biāo)發(fā)生重疊時(shí)的情況還未能有效解決。實(shí)驗(yàn)結(jié)果中虛警和漏警也集中出現(xiàn)在目標(biāo)被遮擋和多個(gè)目標(biāo)重疊的情況。
[1] 蘇松志, 李紹滋, 陳淑媛, 等. 行人檢測(cè)技術(shù)綜述[J]. 電子學(xué)報(bào), 2012, 40(4):814-820.
SU Songzhi, LI Shaozi, CHEN Shuyuan, et al. A survey on pedestrian detection[J].2012, 40(4): 814-820.
[2] Enkelmann W. Investigations of multigrid algorithms for the estimation of optical flow fields in image sequences[J]., 1988, 43(2):150-177.
[3] Lipton A J, Fujiyoshi H, Patil R S. Moving Target Classification and Tracking from Real-time Video[C]//, 1998: 8.
[4] Seki M, Fujiwara H, Sumi K. A Robust Background Subtraction Method for Changing Background[J]., 2000: 207-213.
[5] Liu T L, Chen H T. Real-Time Tracking Using Trust-Region Methods[J]., 2004, 26(3): 397-402.
[6] Hampapur A, Brown L, Connell J, et al. Smart video surveillance: exploring the concept of multiscale spatiotemporal tracking[J]., 2005, 22(2):38-51.
[7] Oren M, Papageorgiou C, Sinha P, et al. Pedestrian Detection Using Wavelet Templates[C]//, 1997: 193.
[8] Ojala T, Harwood I. A Comparative Study of Texture Measures with Classification Based on Feature Distributions[J]., 1996, 29(1): 51-59.
[9] Dalal N, Triggs B. Histograms of Oriented Gradients for Human Detection[C]//., 2005: 886-893.
[10] Stauffer C, Grimson W E L. Adaptive Background Mixture Models for Real-Time Tracking[C]//,, 1999: 252.
[11] C J. Burges. A Tutorial on Support Vector Machines for Pattern Recognition[J]., 2010, 2(2): 121-167.
[12] 王鵬, 朱小燕. 基于RBF核的SVM的模型選擇及其應(yīng)用[J]. 計(jì)算機(jī)工程與應(yīng)用, 2003, 39(24): 72-73.
WANG Peng, ZHU Xiaoyan. Model Selection of SVM with RBF Kernel and its Application[J]., 2003, 39(24): 72-73.
[13] Vapnik V, Chapelle O. Bounds on error expectation for support vector machines[J]., 2000, 12(9): 2013-2036.
Research on Infrared Human Detection from Complex Backgrounds
MA Ye,CHANG Qing,HU Moufa
(,410073,)
Infrared images have disadvantages such as low signal-to-noise ratio and contrast, a lack of color texture information, and a halo effect around target and blurry edges. These factors pose challenges for detecting humans in infrared images. This study focuses on human detection technology used for infrared image sequences in complicated environments. Specifically, we use a background subtraction method to segment a human-body target based on a modified Gaussian mixture model. First, we use multiple Gaussian processes to simulate the complex changes in the background with the appropriate weight values. These processes also update the number, weight values, and learning rate of the Gaussian model. We then use the fusion of the accumulated oriented edges and a histogram of oriented gradient characteristics to describe the region of interest. Finally, we employ a support vector machine to classify the human targets precisely. Experiments show that the algorithm can detect human targets accurately in complex backgrounds and that it generates good results on multiple objects,near in distance, and even some of havingadhesion multiple objects, near distance, and even some of the adhesion.
infrared image,human detection,GMM,AOE,HOG,SVM
TP391.4
A
1001-8891(2017)11-1038-07
2017-04-15;
2017-06-28.
馬也(1994-),男,四川西昌人,碩士研究生,主要研究方向?yàn)樾畔⑴c通信系統(tǒng)。E-mail:bigmaye@qq.com。