吳凌云
(河南藝術(shù)職業(yè)學(xué)院,河南 鄭州 451464)
近些年來(lái),人臉識(shí)別的要求得到了不斷的提升,需要對(duì)非限制場(chǎng)景下實(shí)現(xiàn)人臉識(shí)別,由于其光照、姿勢(shì)以及表情等多個(gè)因素的影響,因此需要提升非限制場(chǎng)景下的人臉識(shí)別。針對(duì)于此種現(xiàn)象,出現(xiàn)了一種人臉近似對(duì)稱(chēng)性預(yù)處理的人臉識(shí)別方式,根據(jù)其人臉左右的近似對(duì)稱(chēng),在梯度下降迭代算法的情況下,實(shí)現(xiàn)對(duì)半張臉的對(duì)稱(chēng)恢復(fù),提升識(shí)別率。
在本文當(dāng)中的人臉識(shí)別算法當(dāng)中,對(duì)一張人臉的圖像進(jìn)行切割,在切割當(dāng)中分為四個(gè)區(qū)域,分別為左眼、右眼、鼻子和嘴巴這四個(gè)區(qū)域,在對(duì)每一個(gè)區(qū)域的分析當(dāng)中需要對(duì)各自區(qū)域所包含的特點(diǎn)進(jìn)行分析和判斷,如果出現(xiàn)了殘缺或者遮擋的部分,可根據(jù)其區(qū)域特點(diǎn)來(lái)進(jìn)行融合,實(shí)現(xiàn)對(duì)整體人臉的得出。在分析的過(guò)程當(dāng)中可以利用到二分類(lèi)器,來(lái)對(duì)遮擋區(qū)域的特點(diǎn)進(jìn)行分析和匯總。在本文當(dāng)中主要的算法提取可以分為幾個(gè)步驟,預(yù)處理、人臉?lè)謮K、特征提取、遮擋判別、特征融合和相似度匹配[1]。
首先,在預(yù)處理當(dāng)中,包含了人臉檢測(cè)、人臉特征點(diǎn)定位、幾何歸一化、光照歸一化以及數(shù)據(jù)集擴(kuò)展。本文當(dāng)中利用一種由粗到精的自編碼網(wǎng)絡(luò)定位人臉特征點(diǎn),在人臉特征點(diǎn)定位的結(jié)果上實(shí)現(xiàn)幾何的歸一化處理,利用直方圖的方式來(lái)對(duì)人臉的圖像光照進(jìn)行均衡化的歸一。(圖1)
圖1 特征點(diǎn)定位圖
其次,對(duì)于人臉的分塊本文利用CFAN 算法來(lái)進(jìn)行定位,從人臉圖像當(dāng)中進(jìn)行裁切出四個(gè)人臉區(qū)塊當(dāng)中,對(duì)于圖像來(lái)說(shuō),需要保持在256×256 大小的范圍內(nèi)進(jìn)行切割,切割的過(guò)程當(dāng)中主要對(duì)左眼和右眼區(qū)域進(jìn)行分塊處理,在處理的過(guò)程當(dāng)中可以根據(jù)給定出的關(guān)鍵點(diǎn)來(lái)作為中心點(diǎn)的位置進(jìn)行分析切割,可以切割出64×64 大小的區(qū)塊,其中每一塊區(qū)域都有自己的區(qū)域坐標(biāo),眼睛、鼻子以及嘴巴的裁切區(qū)域分別為[(xeye-32,yeye-32),(xeye+32,yeye+32)]、[(xlmouse-8,ylmouse+32),(xrmouse+8,yrmouse+32)] 以 及[(xlmouse-8,ylmouse+32),(xrmouse+8,yrmouse+32)],在此種方式下,對(duì)于人臉圖像的切割可以實(shí)現(xiàn)完整信息的保留和分析,裁切的四個(gè)區(qū)塊可以作為分塊的人臉原圖進(jìn)行輸入到數(shù)據(jù)庫(kù)當(dāng)中,以此來(lái)當(dāng)做后續(xù)數(shù)據(jù)庫(kù)的特征提取和遮擋判別的依據(jù)[2]。
另外,在特征融合和相似度檢測(cè)的過(guò)程當(dāng)中,需要將每一個(gè)人臉區(qū)塊的特征歸一化,從而使得區(qū)域?qū)傮w特征的貢獻(xiàn)度相似。對(duì)于各部分的特點(diǎn)按照順序來(lái)實(shí)現(xiàn)有序拼接,從而可以實(shí)現(xiàn)對(duì)一個(gè)人臉特點(diǎn)的生成。在本文當(dāng)中,主要對(duì)人臉區(qū)塊當(dāng)中出現(xiàn)的被遮擋部位為主要的研究模型,對(duì)于其人臉的區(qū)塊特點(diǎn)進(jìn)行相似度的檢測(cè)和分析,在本文當(dāng)中需要利用兩邊都沒(méi)有出現(xiàn)遮擋區(qū)塊的部分來(lái)進(jìn)行特單相似度的區(qū)分和對(duì)比。
最后,在SRC 方式算法過(guò)程當(dāng)中,需要對(duì)訓(xùn)練樣本來(lái)全體進(jìn)行一個(gè)矩陣分析,矩陣用X=[X1,X2...Xc]來(lái)表示,其中矩陣當(dāng)中的Xi∈Rm×ni 可以對(duì)第i 類(lèi)別的樣本進(jìn)行表示。在測(cè)試樣本的表達(dá)過(guò)程當(dāng)中,可以利用y∈Rm 表示樣本,在矩陣表達(dá)式當(dāng)中,利用β 來(lái)對(duì)其中關(guān)聯(lián)到的系數(shù)向量做出表示。也就是說(shuō),i類(lèi)當(dāng)中的y 可以表達(dá)為y≈Xiβi。對(duì)于SRC 算法來(lái)說(shuō),需要在范數(shù)標(biāo)準(zhǔn)化的基礎(chǔ)上實(shí)現(xiàn)對(duì)虛擬圖像所有的樣本來(lái)實(shí)現(xiàn)集中獲取,對(duì)于所有的訓(xùn)練樣本在范數(shù)正則測(cè)試的過(guò)程當(dāng)中,需要對(duì)每一個(gè)類(lèi)別當(dāng)中出現(xiàn)的殘差進(jìn)行計(jì)算分析,從而對(duì)其作出結(jié)果的判斷,在此種范式規(guī)劃下可以實(shí)現(xiàn)對(duì)測(cè)試樣本的分配處理和分析。
第一,在對(duì)存在區(qū)域遮擋部分的人臉進(jìn)行判斷的過(guò)程當(dāng)中,需要充分的在數(shù)據(jù)庫(kù)當(dāng)中進(jìn)行人臉數(shù)據(jù)的抽取,在本文當(dāng)中主要對(duì)1000 張人臉圖像信息來(lái)劃分為6 個(gè)區(qū)塊,也就是六千張分塊信息,對(duì)于背景數(shù)據(jù)的采集過(guò)程,需要包含真實(shí)被遮擋的人臉區(qū)域分布圖像信息,也就是需要實(shí)現(xiàn)左眼右眼或者鼻子嘴巴等多個(gè)區(qū)塊部位的比較。在區(qū)塊比較的過(guò)程當(dāng)中存在的差距相對(duì)較小,因此對(duì)于其進(jìn)行分類(lèi)訓(xùn)練的過(guò)程當(dāng)中,需要將對(duì)稱(chēng)的圖像信息進(jìn)行合并成為一個(gè)類(lèi)別進(jìn)行區(qū)分和比較。對(duì)于真實(shí)背景圖和存在遮擋部分的人臉區(qū)塊部分一共有1000 張,在實(shí)驗(yàn)使用的圖片方面需要選擇其中的4800 張圖片和背景800 張圖片,其中每一個(gè)人臉區(qū)塊1200 張和剩余背景的200 張可以作為測(cè)試使用。在測(cè)試的過(guò)程當(dāng)中,需要借助于fine-tune 方法和Hard Negative Mining 方式在二分類(lèi)器的基礎(chǔ)上實(shí)現(xiàn)良好測(cè)試。如果人臉區(qū)塊的分辨率足夠清晰, 可以對(duì)局部的人臉區(qū)塊進(jìn)行模型的判斷,以此來(lái)實(shí)現(xiàn)對(duì)遮擋區(qū)域的精準(zhǔn)判斷分析。(圖2)
圖2 原始圖像與恢復(fù)右鼻區(qū)塊后的圖像
第二,如果區(qū)塊當(dāng)中存在遮擋的部分,需要利用局部遮擋的人臉識(shí)別方式。在本文的實(shí)驗(yàn)當(dāng)中,利用38 個(gè)人總共2432 張人臉圖像信息來(lái)進(jìn)行實(shí)驗(yàn),數(shù)據(jù)信息方面的圖像當(dāng)中包含了多個(gè)表情和多個(gè)角度的情況狀態(tài)。對(duì)于人臉信息圖像來(lái)說(shuō),可以利用每個(gè)人的36 張沒(méi)有人臉信息圖像來(lái)進(jìn)行分析。對(duì)于其沒(méi)有特征的圖像信息和原始的人臉圖像信息進(jìn)行對(duì)比分析之后,可以保證兩只眼睛保持在對(duì)準(zhǔn)狀態(tài)下,對(duì)于其人臉的面部區(qū)域可以進(jìn)行裁切成為256×256 像素圖像來(lái)進(jìn)行研究。對(duì)于標(biāo)準(zhǔn)化之后的圖像信息,需要實(shí)現(xiàn)人臉圖像的區(qū)塊遮擋分析,利用二分類(lèi)器來(lái)對(duì)人臉區(qū)域當(dāng)中的遮擋類(lèi)型進(jìn)行區(qū)分。恢復(fù)得到的人臉可以在SRC 的算法下進(jìn)行分類(lèi)實(shí)驗(yàn),其實(shí)驗(yàn)結(jié)果如表1 所示。
表1 眼睛、嘴巴、鼻子遮擋一類(lèi)區(qū)塊中的識(shí)別率對(duì)比
從表1 當(dāng)中可以看出,在本文算法當(dāng)中,遮擋眼睛區(qū)塊、嘴巴區(qū)塊、鼻子區(qū)塊的識(shí)別率分別為95.4、96.6、97.6,三種算法相比較,本文算法在識(shí)別效果方面相對(duì)良好,在SRC 算法和RSC算法基礎(chǔ)上,對(duì)于圖像識(shí)別的過(guò)程當(dāng)中會(huì)存在遮擋部位辨識(shí)度受到影響,利用近似對(duì)稱(chēng)的方式來(lái)對(duì)人臉信息進(jìn)行恢復(fù)處理,在恢復(fù)之后的人臉信息之后存在圖像失真的現(xiàn)象,在辨識(shí)度方面會(huì)受到一定程度的影響。在文本算法當(dāng)中,需要在小塊的基礎(chǔ)上實(shí)現(xiàn)人臉區(qū)域的完整性恢復(fù)。
第三,對(duì)于很多的區(qū)塊部分存在遮擋現(xiàn)象,需要從數(shù)據(jù)庫(kù)當(dāng)中篩選出單人36 張單人人臉圖像當(dāng)中的8 張來(lái)進(jìn)行實(shí)驗(yàn)分析,并且還要篩選出具備遮擋部分的圖像信息進(jìn)行分析,如表2 所示。在表2 當(dāng)中,計(jì)算的方式主要是根據(jù)MTCNN 算法方式來(lái)進(jìn)行計(jì)算,其中需要人工輔助的方式來(lái)對(duì)圖像的定位操作進(jìn)行實(shí)現(xiàn)。其最終的實(shí)驗(yàn)結(jié)果和其三種方式進(jìn)行對(duì)比的情況下,得出了表2。
表2 眼睛、嘴巴、鼻子遮擋兩類(lèi)區(qū)塊各一個(gè)的識(shí)別率對(duì)比(%)
由此可知,對(duì)于大面積的人臉區(qū)塊遮擋來(lái)說(shuō),本文算法的識(shí)別率相比較其他的算法,識(shí)別率相對(duì)較高。遮擋區(qū)域的增加,如果遮擋部分為半張人臉的情況下,其SRC 和RSC 算法下的識(shí)別準(zhǔn)確率都有所下降,且下降的速率很快,近似對(duì)稱(chēng)性的預(yù)處理方面可以對(duì)半張人臉進(jìn)行恢復(fù),因此在識(shí)別的準(zhǔn)確率方面沒(méi)有較大變化,在遮擋區(qū)塊增加的情況下其識(shí)別的準(zhǔn)確率有所下降,但是最終的算法在識(shí)別率方面相對(duì)較高。在遮擋3 個(gè)區(qū)塊的時(shí)候,類(lèi)似于近似對(duì)稱(chēng)新預(yù)處理方式,因此識(shí)別準(zhǔn)確率方面也保持相似。
綜上所述,利用特征點(diǎn)的定位來(lái)實(shí)現(xiàn)人臉?lè)謮K,實(shí)現(xiàn)對(duì)人臉遮擋之后利用區(qū)塊近似對(duì)稱(chēng)預(yù)處理的方式做出恢復(fù),此種算法在單個(gè)區(qū)塊遮擋的輕快下具備較高程度的辨識(shí)程度。但是在很多的區(qū)塊遮擋情況下,識(shí)別的準(zhǔn)確率有所下降。利用人臉?lè)謮K近似對(duì)稱(chēng)預(yù)處理的算法,可以實(shí)現(xiàn)對(duì)人臉識(shí)別技術(shù)的提升。