王彥
(武漢鐵路職業(yè)技術(shù)學(xué)院,湖北 武漢430205)
人臉檢測(cè)(face detection)指在輸入的彩色圖像中確定所包含的人臉的位置、大小、位姿的過(guò)程[1].人臉包含豐富的信息,是一種典型的生物特征,人臉檢測(cè)在個(gè)人身份鑒別、智能視頻監(jiān)控和人機(jī)交互中具有廣闊的應(yīng)用前景.隨著人工智能、機(jī)器視覺(jué)和模式識(shí)別的發(fā)展,人臉檢測(cè)在基于人臉特征的應(yīng)用中越來(lái)越重要,其快速性和準(zhǔn)確性已成為人臉檢測(cè)算法所追求的目標(biāo)[2].由于大多數(shù)圖像設(shè)備能夠獲得彩色圖像,基于彩色圖像的人臉檢測(cè)也逐漸成為研究的熱點(diǎn).
對(duì)于彩色圖像中的每個(gè)像素點(diǎn),計(jì)算其相似度,可以得知該像素點(diǎn)屬于膚色區(qū)域的可能性大?。?].根據(jù)膚色相似度,采用閾值化技術(shù)可以對(duì)輸入圖像進(jìn)行膚色分割.然而,采用固定的閾值可能存在這樣的問(wèn)題:如果閾值取得過(guò)大,許多膚色區(qū)域?qū)o(wú)法檢出,造成漏檢;如果閾值取得過(guò)小,將導(dǎo)致許多非膚色區(qū)域被誤檢成膚色區(qū)域.因此給出一種動(dòng)態(tài)閾值確定方法,將膚色相似度與求得的動(dòng)態(tài)閾值相結(jié)合,以實(shí)現(xiàn)對(duì)輸入圖像的膚色區(qū)域進(jìn)行精確分割,從而提高人臉檢測(cè)的速度與性能[4].基于人臉膚色信息在色彩空間中的聚類特性,利用Fisher準(zhǔn)則獲取動(dòng)態(tài)閾值,對(duì)人臉圖像進(jìn)行分割,并將圖像分成非膚色區(qū)域和類膚色區(qū)域,從而實(shí)現(xiàn)對(duì)人臉區(qū)域的定位和識(shí)別.
對(duì)于待檢測(cè)的彩色圖像,經(jīng)常會(huì)受到光照不均、灰度不均、噪聲等因素的干擾,同時(shí)也會(huì)對(duì)利用膚色模型計(jì)算得到的膚色似然圖像起到一定的干擾作用.在這種情況下,直方圖閾值分割法效果不太好;最大熵閾值分割法對(duì)噪聲極為敏感,同時(shí)還會(huì)使一個(gè)較為簡(jiǎn)單問(wèn)題復(fù)雜化,增加了系統(tǒng)的計(jì)算量;模糊閾值分割法在具體的實(shí)際應(yīng)用中,模板窗口的大小確定、函數(shù)的選取將對(duì)分割結(jié)果造成很大的影響[5].相比較而言,由Ostu等人研究提出的一種基于最小二乘法原理的最大類間方差閾值圖像分割法,體現(xiàn)出一定的優(yōu)越性.
基于最小二乘法原理的最大類間方差閾值圖像分割法的基本思想是:在灰度級(jí)別下,先將圖像劃分成兩部分,再計(jì)算這兩部分之間的方差,當(dāng)方差值達(dá)到最大值時(shí),所對(duì)應(yīng)的參數(shù)閾值即為最佳分割閾值[6].通過(guò)最大類間方差閾值圖像分割,實(shí)現(xiàn)動(dòng)態(tài)選取閾值的目的.膚色分割的準(zhǔn)確度直接關(guān)系到后續(xù)人臉檢測(cè)的結(jié)果,因此在膚色分割之前,要根據(jù)待檢測(cè)圖像自身特點(diǎn)選取一個(gè)最合適的閾值,引入模式識(shí)別理論中的Fisher評(píng)價(jià)準(zhǔn)則作為實(shí)現(xiàn)自動(dòng)選取閾值的最佳判斷準(zhǔn)則.
將Fisher評(píng)價(jià)準(zhǔn)則用于解決人臉圖像的分割問(wèn)題,主要是利用了Fisher函數(shù)的類間均值最大、總類內(nèi)方差最小的原則,從而可以自動(dòng)獲取某幅圖像所對(duì)應(yīng)的最佳分類閾值.
1.1 基于Fisher準(zhǔn)則動(dòng)態(tài)閾值的獲取 在模式識(shí)別中,假設(shè)m維特征x在任一直線上投影,將m維特征逐漸減小到1維,形成一維空間.但如何選取投影直線,才能使類間的距離達(dá)到最大值呢?
考慮將n維空間的樣本投影到一條直線上,形成一維空間.經(jīng)過(guò)研究發(fā)現(xiàn):即使目標(biāo)樣本能夠在n維空間里形成多個(gè)相互獨(dú)立的分散區(qū)域塊,但經(jīng)過(guò)投影變換以后,當(dāng)這些目標(biāo)樣本投影到一條直線上,最后的結(jié)果仍然會(huì)使得許多目標(biāo)樣本相互摻和起來(lái),難以識(shí)別.因此,如何在某一個(gè)方向上找到一條最適合進(jìn)行分類的投影直線,在該直線上目標(biāo)樣本能夠分離識(shí)別,是Fisher準(zhǔn)則要攻克的難題.
Fisher準(zhǔn)則函數(shù)不僅可以獲得特征向量的最佳一維投影方向,也是判定類別分離程度的有效準(zhǔn)則.圖像的閾值將圖像劃分為目標(biāo)和背景兩類,閾值取得越準(zhǔn)確,目標(biāo)和背景的分離程度越好,分割效果越好,因此將Fisher準(zhǔn)則函數(shù)應(yīng)用于圖像的分割,以不同的灰度值將圖像劃分為目標(biāo)和背景兩類,當(dāng)Fisher準(zhǔn)則函數(shù)取最大值時(shí),目標(biāo)和背景達(dá)到最佳分離程度,所取得灰度值為最佳閾值.
1.1.1 在n維x空間
1.1.2 在一維y空間以上分析可見(jiàn),引入Fisher評(píng)價(jià)準(zhǔn)則的目的是經(jīng)過(guò)投影變換后,各類目標(biāo)樣本在一維y空間中盡可能變得分散,即類別之間的均值差ˉm1-ˉm2盡可能達(dá)到最大值;同時(shí)使各個(gè)類間樣本的內(nèi)部密集程度盡可能高,使類內(nèi)離散度的取值達(dá)到最小化.
假設(shè)選取兩個(gè)樣本類,對(duì)應(yīng)的Fisher評(píng)價(jià)函數(shù)為:
從(8)式可以得出結(jié)論:欲使JF(T)取最大值,必須使兩個(gè)樣本類別平均值達(dá)到最大化,同時(shí)還需兩個(gè)樣本類別的方差達(dá)到最小化.此時(shí)所對(duì)應(yīng)的一維投影方向就是最佳投影方向.
基于Fisher評(píng)價(jià)準(zhǔn)則的基本理論和有關(guān)參量,結(jié)合具體的實(shí)際應(yīng)用,可以將在人臉檢測(cè)中的膚色似然圖像作為研究的目標(biāo)樣本類,該膚色似然圖像中存在兩個(gè)樣本類,即膚色樣本類和非膚色樣本類,分別對(duì)應(yīng)評(píng)價(jià)函數(shù)中的兩個(gè)樣本類.下面利用引入的Fisher評(píng)價(jià)函數(shù),在一維空間中找最佳的分類閾值T.具體步驟如下:
1)在一幅待檢測(cè)圖像中,將其所有像素點(diǎn)分為目標(biāo)對(duì)象和背景兩類,利用前面的公式計(jì)算得到原圖像的膚色似然圖.
2)利用經(jīng)驗(yàn)值,事先給定閾值區(qū)域,如[0.05,0.65],當(dāng)改變閾值時(shí),以0.01的幅度進(jìn)行賦值運(yùn)算,從中選取最適合分類的閾值T.
3)當(dāng)選取的閾值為最佳閾值T時(shí),F(xiàn)isher評(píng)價(jià)函數(shù)的值達(dá)到最大化,對(duì)應(yīng)的兩個(gè)類別的平均值間距離最大,且方差最小,同時(shí)也實(shí)現(xiàn)了動(dòng)態(tài)閾值的獲取.
1.2 膚色似然圖像的二值化 用最佳閾值T將膚色似然圖像中的膚色區(qū)域分離出來(lái).選取膚色似然圖像上的任一點(diǎn),該點(diǎn)在色彩空間中的色度值向量用Ⅰ(x,y)表示.定義閾值解碼器為:
其中:Ⅰ(x,y)=[Cb(x,y),Cr(x,y)]T;P(Ⅰ(x,y))為用膚色似然度公式計(jì)算得到的圖像上像素點(diǎn)的膚色概率.
根據(jù)閾值解碼器,實(shí)現(xiàn)了膚色似然圖的二值化,同時(shí)也實(shí)現(xiàn)了將膚色區(qū)域(包含類膚色區(qū)域)從背景區(qū)域中分割出來(lái),得到了膚色分割后的二值化圖像,初步檢測(cè)到包含有人臉的膚色區(qū)域.膚色似然圖像二值化后,基于Matlab的人臉識(shí)別仿真實(shí)驗(yàn)結(jié)果如圖1所示.
圖1 膚色分割圖
通過(guò)仿真實(shí)驗(yàn)可以看到,利用動(dòng)態(tài)閾值的選取,針對(duì)不同的待檢測(cè)圖像,均得到較好的膚色分割結(jié)果.同時(shí)在分割過(guò)程中也不可避免的產(chǎn)生了噪聲,會(huì)對(duì)后續(xù)的人臉檢測(cè)產(chǎn)生干擾,所以我們今后的工作需對(duì)二值圖像進(jìn)行去噪處理,消除噪聲的干擾.
本文中提出了基于Fisher判別準(zhǔn)則的自適應(yīng)閾值的選擇算法,將膚色和非膚色作為兩類樣本進(jìn)行分類,當(dāng)評(píng)價(jià)函數(shù)最優(yōu)時(shí)可確定分類閾值,對(duì)膚色似然圖進(jìn)行二值化.實(shí)驗(yàn)結(jié)果表明,本文中提出的算法能夠提高膚色的分割精度,對(duì)提高人臉檢測(cè)的速度和精度起到關(guān)鍵作用,對(duì)研究基于膚色分割與其他方法結(jié)合的人臉檢測(cè)具有一定的參考價(jià)值.
[1]趙麗紅,劉紀(jì)紅,徐心和.人臉檢測(cè)方法綜述[J].計(jì)算機(jī)應(yīng)用研究,2004,21(9):1-4.
[2]郭秀梅,劉賢喜.基于膚色的人臉檢測(cè)算法的研究[D].泰安:山東農(nóng)業(yè)大學(xué),2008.
[3]于蕾蕾.雙種群遺傳算法的改進(jìn)激起應(yīng)用研究[D].合肥:合肥工業(yè)大學(xué),2009.
[4]郭聳,顧國(guó)昌,蔡則蘇,等.膚色相似度和動(dòng)態(tài)閾值相結(jié)合的膚色分割技術(shù)[J].計(jì)算機(jī)工程與應(yīng)用,2010,46(18):1-3.
[5]梁路宏,愛(ài)海舟,肖習(xí)攀.基于模板匹配與支持矢量機(jī)的人臉檢測(cè)[J].計(jì)算機(jī)學(xué)報(bào),2002(1):22-29.
[6]Zitova B,F(xiàn)lusser J.Image registration methods:a survey[J].Image and Vision Computing,2003(21):977-1000.