寧毅 陳金龍
摘要:人臉檢測技術(shù)是多學(xué)科的課題,覆蓋了數(shù)學(xué),數(shù)字圖像處理,神經(jīng)網(wǎng)絡(luò),機器學(xué)習(xí)有等學(xué)科內(nèi)容,具有非常重要的應(yīng)用價值。互聯(lián)網(wǎng)人臉檢測是互聯(lián)網(wǎng)人臉識別系統(tǒng)的前提,找到魯棒性強,檢測效率高的人臉檢測方法非常有必要。文章通過介紹互聯(lián)網(wǎng)人臉檢測的研究背景以及研究現(xiàn)狀,指出互聯(lián)網(wǎng)人臉檢測的難點所在,并分析目前人臉檢測的主要研究方法以及方法的優(yōu)缺點,最后對人臉檢測的技術(shù)的發(fā)展進(jìn)行展望。
關(guān)鍵詞:人臉檢測;互聯(lián)網(wǎng)視頻;膚色模型
中圖分類號:TP391 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2018)03-0166-02
1 互聯(lián)網(wǎng)視頻檢測研究背景以及意義
互聯(lián)網(wǎng)視頻是已經(jīng)成為互聯(lián)網(wǎng)主要應(yīng)用領(lǐng)域之一,用戶人數(shù)高速增長,覆蓋率不斷提高。根據(jù)中國互聯(lián)網(wǎng)中心數(shù)據(jù),截至2016年12月,我國網(wǎng)民規(guī)模達(dá)7.31億,普及率達(dá)到53.2%。全年共計新增網(wǎng)民4299萬人,增長率為6.2%,其中至2016年12月底我國網(wǎng)絡(luò)視頻用戶規(guī)模接近5.5億人。對互聯(lián)網(wǎng)的視頻研究具有非常重要的意義。近年來,犯罪率上升,通過互聯(lián)網(wǎng)視頻來作為重要安全防范手段,被廣泛應(yīng)用于公安、交通、金融等諸多領(lǐng)域。其中比較典型的應(yīng)用為互聯(lián)網(wǎng)視頻的人臉檢測。
如何充分利用互聯(lián)網(wǎng)視頻中人臉時間信息和空間信息克服互聯(lián)網(wǎng)視頻噪聲明顯,分辨率低,光照、姿態(tài)變化劇烈等困難是研究的重點。美國的MIT、CMU大學(xué)和中國的自動化所、清華大學(xué)等都對基于視頻人臉檢測檢測進(jìn)行了廣泛的研究,而且目前隨著機器學(xué)習(xí)和深度學(xué)習(xí)的廣泛研究對視頻人臉檢測產(chǎn)生了重大影響,因此有必要對現(xiàn)階段基于視頻的人臉檢查方法進(jìn)行分析和總結(jié),期望更好的指導(dǎo)未來的研究。
作為互聯(lián)網(wǎng)視頻人臉識別的前提,互聯(lián)網(wǎng)視頻人臉檢測是指通過輸入互聯(lián)網(wǎng)視頻確定視頻中人臉的具體方位、姿態(tài)。隨著計算機技術(shù)的發(fā)展,在視頻人臉檢測領(lǐng)域相關(guān)的科研成果不斷涌現(xiàn),出現(xiàn)了方式,方法不一樣的檢測方法。目前主要的人臉檢測方法有:基于膚色模型的方法、幾何特征的方法、基于統(tǒng)計理論的方法、基于視頻的運動分析方法。
2 目前人臉檢測的主要方法
2.1 基于膚色模型檢測方法
膚色特征是人臉區(qū)域的重要特征,是人臉區(qū)別與其他物體的極少數(shù)特征之一。它不受人類表情變換的影響,具有相對的穩(wěn)定性,但亮度變化影響膚色檢測。經(jīng)大量的研究發(fā)現(xiàn)無論是黃種人、白種人還是黑種人,膚色在色彩空間中分布較為集中,利用人體膚色檢測可以大幅度減少檢測時間。但當(dāng)背景顏色或視頻圖像其他物體顏色與皮膚顏色接近的時候會產(chǎn)生誤差。膚色模型是指在一定的色彩空間描述膚色分布的模型。因此建立膚色模型首先先選取一定的顏色空間,目前的顏色空間有RGB、LUV、YIQ、HSV等,其次是根據(jù)選取的顏色空間建立數(shù)學(xué)模型。膚色模型的優(yōu)點是對人體姿態(tài)、面部表情不敏感,具有較強的魯棒性。但是當(dāng)光照較強時背景亮度過高與膚色接近,從而造成誤檢;當(dāng)光照不足時,膚色亮度不夠往往會造成誤檢,因此需要研究出不同光照條件下膚色分割的取值。常見的顏色空間有:
2.1.1 RGB顏色空間
RGB顏色空間也稱為紅藍(lán)綠色彩空間,能用RGB值表示的顏色,是單色光中的紅綠藍(lán)(色光三原色,波長也是嚴(yán)格規(guī)定的,R 700.0nm,G 546.1nm,B 435.8nm),按不同比例的混色光。
在RGB顏色空間中,圖像中每個像素點都在都可以用圖1像素空間點來表示。在圖1中RGB顏色空間立方體中,RGB顏色立方體的原點(0,0,0)表示該點R,G,B顏色值為零意思為該點為黑色,當(dāng)R,G,G各分量最大的時候,該點為白色。一般情況下其他顏色空間都可以由,R,G,B顏色空間轉(zhuǎn)換過來。
RGB膚色模型的優(yōu)點是對人體姿態(tài)、面部表情不敏感,具有較強的魯棒性。但是當(dāng)光照較強時背景亮度過高與膚色接近,從而造成誤檢;當(dāng)光照不足時,膚色亮度不夠往往會造成誤檢,因此RGB往往不適合直接用于膚色分割。
2.1.2 HSI顏色空間
當(dāng)人觀察一個彩色物體時,往往用色調(diào)、飽和度、亮度來描述物體的顏色, HSI(Hue-Saturation-Intensity)正是基于符合描述人類觀察而產(chǎn)生的,HSI顏色空間是由色度(HUE),飽和度(Saturation),亮度(Intensity)組成。這種色彩空間符合人類觀察色彩的方式,同時也有利于數(shù)字圖像處理。它是由R,G,B空間轉(zhuǎn)換而來。
顏色的色度指與它最接近的波普波長,色度為零時表示為紅色,色度為120為綠色,240時為藍(lán)色,色度在0-240為可見光的顏色,當(dāng)色度在240-360時為非可見光。
顏色的飽和度是指與它圖2中某一點與圓心之間的距離,在圓周圍上的飽和度為1,在圓心的飽和度為0,可以通過這樣的方式理解飽和度:一副亮度很強的綠色的飽和度為1,當(dāng)往里面添加水時,色彩慢慢稀析,飽和度變小,但是亮度不變。
HSI的優(yōu)點在與將亮度信息I與色度H,和飽和度S區(qū)分開來,當(dāng)人臉膚色檢測時,膚色的聚類性只與色度和飽和度有關(guān),與亮度無關(guān),這樣就可以通過計算色度和飽和度來區(qū)分人臉也背景出來。
HSI可以通過如下公式計算出來:
2.2 基于幾何特征的檢測方法
人臉具有明顯的幾何性質(zhì),比如耳朵的對稱性,眼睛的對稱性等。側(cè)影識別是最早的基于幾何特征的人臉檢測方法,該方法從人臉側(cè)臉輪廓線選取特征點,利用這些點組成的幾何特征來進(jìn)行識別。目前太多數(shù)證件照為人臉正面因此該檢測方法往往根據(jù)耳朵、眼睛、鼻子的形狀和五官在臉上的幾何分布。對于耳朵、眼睛等人臉部件的輪廓邊緣提取目前常用的算法有:微分算子法、拉普拉斯高斯算子法(LOG)、Canny邊緣檢測算子。
在圖像進(jìn)行邊緣特征提取前,需要對圖像進(jìn)行預(yù)處理。對于人臉檢測,首要工作就是耳朵等主要人體器官進(jìn)行定位,定位之前應(yīng)對人臉圖像進(jìn)行歸一化,圖像歸一化的運算定義為:g=f(x',y')=f[a(x,y),b(x,y)],其中f(x,y)表示輸入圖像,g(x,y)表示輸出圖像,函數(shù)a(x,y),b(x,y)描述了唯一的空間變換。
基于幾何特征的人臉檢測方法優(yōu)點有:1)符合人類的視覺識別機理,便于理解。2)相對于膚色模型來說,該方法對光照照射不敏感。但該方法的缺點有:1)人臉的表情變化、特征點遮擋時,該方法檢測效果不佳。2)從不同圖像中選點相對穩(wěn)定的特征點時不容易選取。但是由于人臉的部件提取往往都是由邊緣算子提取出來,所以這種人臉檢測方法往往對于圖像質(zhì)量的要求比較高,對于光照、背景、噪音等要求比較高,因為噪音、陰影等往往對人臉部件邊緣造成破壞,進(jìn)而影響算法的有效性。
2.3 基于統(tǒng)計理論的人臉檢測方法
隨著統(tǒng)計理論分析和機器學(xué)習(xí)以及深度學(xué)習(xí)在人臉檢測中的廣泛應(yīng)用,涌現(xiàn)出大量的研究成果。該方法是通過對大量樣本進(jìn)行訓(xùn)練,找出人臉樣本的統(tǒng)計特性,構(gòu)建出檢測分類器,使用分類器進(jìn)行人臉檢測。目前常用方法有支持向量機和Adboost。
支持向量機方法,由訓(xùn)練和檢測兩部分組成,訓(xùn)練過程由大量人臉樣本和非人臉樣本訓(xùn)練SVM分類器,使得獲得超優(yōu)分類平面。檢測的時候用訓(xùn)練好的SVM分類器來檢測圖像中的人臉。
Adboost是通過選擇少量關(guān)鍵的視覺特征,產(chǎn)生高效的強分類器,在用級聯(lián)方式將各強分類器合成更加復(fù)雜的層疊分類器。該方法在人臉檢測方面速度比較快。
通過統(tǒng)計理論的人臉檢測方法算法較為穩(wěn)定,但是樣本的采集工作繁重,采集樣本的好壞往往對檢測效果影響較大。
3 結(jié)束語
目前人臉檢測技術(shù)快速發(fā)展,在刷臉支付、刷臉考勤等新型應(yīng)用中得到快速應(yīng)用,人臉檢測的精度大大提高,檢測時間快速減少。然而,人臉具有豐富的表情特性,以及互聯(lián)網(wǎng)視頻清晰度不足,光照和環(huán)境等影響。在很多背景復(fù)雜情況下,互聯(lián)網(wǎng)視頻人臉檢測難以達(dá)到較好效果。因此在今后工作中研究的重點為:1)在實際應(yīng)用中,單一方法往往檢測效果較低,因此采用多種檢測方法的聯(lián)合使用,提高檢測精度。2)在前人研究基礎(chǔ)之上,提出新的檢測算法提高檢測效率。
參考文獻(xiàn):
[1] 陳鍛生, 劉政凱. 膚色檢測技術(shù)綜述[J]. 計算機學(xué)報, 2006(2).
[2] 陳雅茜, 雷開彬. 人臉識別技術(shù)綜述[J]. 西南民族大學(xué)學(xué)報:自然科學(xué)版, 2007(4).
[3] 肖陽. 人臉檢測算法綜述[J]. 電子技術(shù)與軟件工程, 2014(4).
[4] 艾海舟, 梁路宏, 徐光祐, 等. 基于膚色和模板的人臉檢測[J]. 軟件學(xué)報, 2001(12).
[5] 楊新權(quán). 基于膚色分割及連續(xù)Adaboost算法的人臉檢測研究[D]. 重慶: 電子科技大學(xué), 2013.
[6] 陳冠潼. 人臉檢測與識別算法的研究與應(yīng)用[D]. 大連: 大連理工大學(xué), 2013.
[7] 袁正海. 人臉識別系統(tǒng)及關(guān)鍵技術(shù)研究[D]. 南京: 南京郵電大學(xué), 2013.
[8] 段玉波, 任璐, 任偉建, 等. 基于膚色分割和改進(jìn)AdaBoost算法的人臉檢測[J]. 電子設(shè)計工程, 2014(12).
[9] 王尋, 趙懷勛. 基于改進(jìn)的膚色空間和幾何特征的快速人臉檢測研究[J]. 計算機應(yīng)用與軟件, 2015(02).