王志坤 黃熙 馬永振 程禹涵 朱洪江 劉帥
摘 要:本文以BJUT-3D人臉數(shù)據(jù)庫(kù)500張人臉為基本研究單元,進(jìn)行整體基本三維人臉模型的構(gòu)建。同時(shí)采用基于代數(shù)特征的方法提取照片中的特征臉,再根據(jù)構(gòu)建的基本三維人臉模型,模擬個(gè)人的三維人臉模型,為人臉識(shí)別算法的實(shí)現(xiàn)提供技術(shù)支持。
關(guān)鍵詞:特征人臉;三維建模;代數(shù)建模
中圖分類號(hào):TP391.41 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2019)02-0072-03
Abstract:In this paper,the BJUT-3D face database 500 faces are used as the basic research unit to construct the overall basic 3D face model. At the same time,the algebraic feature-based method is used to extract the feature face in the photo,and then the basic 3D face model is constructed to simulate the personal 3D face model,which provides technical support for the realization of the face recognition algorithm.
Keywords:featured face;three-dimensional modeling;algebraic modeling
0 引 言
人臉的機(jī)器識(shí)別作為生物識(shí)別的重要組成部分,一直是計(jì)算視覺(jué)和模式識(shí)別具有挑戰(zhàn)性的研究課題。人類辨認(rèn)彼此最主要的途徑就是識(shí)別彼此的面部,同樣,人類表達(dá)自我情感也是通過(guò)自我面部表情。因此,通過(guò)面部來(lái)識(shí)別人或者是讀取他人情感,對(duì)絕大多數(shù)人來(lái)說(shuō),是非常重要的,人類甚至可以用這種與生俱來(lái)的能力在各式各樣的場(chǎng)景,甚至是照片中確認(rèn)出人臉,即使照片被翻轉(zhuǎn)、扭曲、以及部分缺失,但這也只會(huì)對(duì)最終結(jié)果造成輕微影響。人類日常活動(dòng)的穩(wěn)定有序運(yùn)行得益于這種與生俱來(lái)的能力。盡管目前計(jì)算機(jī)擁有非常強(qiáng)大的運(yùn)行能力,且人臉識(shí)別功能經(jīng)過(guò)科研工作者多年研究逐漸完善,但計(jì)算機(jī)在人臉識(shí)別功能領(lǐng)域的表現(xiàn)卻遠(yuǎn)不及人類。雖然計(jì)算機(jī)在識(shí)別正面、標(biāo)準(zhǔn)的人臉時(shí)有不俗的表現(xiàn),但是在輸入被光照或者姿態(tài)改變了的人臉時(shí),即使是該領(lǐng)域最尖端的研究成果,識(shí)別率也會(huì)大打折扣,因此,人臉的機(jī)器識(shí)別遠(yuǎn)不能滿足人類對(duì)于面部識(shí)別的需求。
現(xiàn)階段主流的人臉識(shí)別產(chǎn)品主要使用二維人臉識(shí)別的方法,但這種方法存在許多缺陷,比如在光照的情況下所產(chǎn)生的變化,以及人臉表情變化的魯棒性差等。三維人臉識(shí)別有不錯(cuò)的魯棒性,但是在實(shí)際應(yīng)用中,三維圖像需要通過(guò)特定的設(shè)備進(jìn)行采集,并且這些設(shè)備獲取到的一般都是二位圖像或視頻。因此,基于單幅圖像的人臉三維重建技術(shù)成為當(dāng)今技術(shù)研究的熱門(mén),即通過(guò)輸入平面圖像構(gòu)建照片的三維模型。本文重點(diǎn)對(duì)基于單幅圖像的人臉重建算法進(jìn)行了分析,期望在原有基礎(chǔ)上實(shí)現(xiàn)單幅人臉圖像的具有真實(shí)感的三維人臉模型的構(gòu)建。
1 數(shù)據(jù)分析
從機(jī)器學(xué)習(xí)開(kāi)始,發(fā)展到今天供人們使用的人臉數(shù)據(jù)庫(kù),人臉的機(jī)器識(shí)別數(shù)據(jù)庫(kù)大部分都存在數(shù)據(jù)量?。ㄈ四樐P蛷?fù)雜,收集困難),模式單一的缺陷。而在實(shí)際應(yīng)用中,唯有足夠多的三維人臉才能使電腦構(gòu)建的三維人臉模型足夠精確。現(xiàn)今人臉提供志愿者主要是西方人,但由于東西方生活習(xí)慣以及地理環(huán)境不同,兩者在面部特征上存在一定的差異,這給我們的數(shù)據(jù)分析和相關(guān)研究帶來(lái)了諸多不便,因此我們優(yōu)先選擇亞洲人的面部圖像作為研究對(duì)象。
基于以上原因,我們決定使用BJUT-3D人臉數(shù)據(jù)庫(kù)。該數(shù)據(jù)庫(kù)是北京工業(yè)大學(xué)多媒體技術(shù)與圖形學(xué)實(shí)驗(yàn)室在國(guó)家自然科技基金的支持下構(gòu)建的規(guī)模較大的中國(guó)人三維人臉數(shù)據(jù)庫(kù)。目前該數(shù)據(jù)庫(kù)擁有500個(gè)人的三維人臉數(shù)據(jù)。每份人臉數(shù)據(jù)都包括3D形狀數(shù)據(jù)及3D人臉數(shù)據(jù),其為進(jìn)行人臉檢測(cè)和人臉識(shí)別等方面的相關(guān)算法、研究提供了數(shù)據(jù)支持。
2 主要技術(shù)方法
(1)人的面部相似而又不相同,相似在于面部都具有相同的拓?fù)浣Y(jié)構(gòu),眼睛、嘴、鼻子、耳朵,不同在于這些部位的細(xì)節(jié)各不相同,如嘴唇的厚度、鼻梁的高度、眼睛的大小等,因此,我們利用人臉結(jié)構(gòu)來(lái)構(gòu)建模型的基本結(jié)構(gòu),即人臉的眼睛、嘴、鼻子、耳朵,再利用照片中的信息來(lái)調(diào)整模型中的細(xì)節(jié),比如臉的大小。
已有的研究表明,一個(gè)完整的的標(biāo)準(zhǔn)人臉模型應(yīng)當(dāng)包含以下特征:
1)參數(shù)化:面部的一些信息應(yīng)對(duì)應(yīng)一定的參數(shù),可以利用調(diào)節(jié)參數(shù)的方式來(lái)調(diào)節(jié)面部的特征;
2)形象化:與真實(shí)的人臉十分相似,無(wú)論是形象還是表情,可以做出如真人一般的表情和動(dòng)作;
3)簡(jiǎn)單化:越多的模型頂點(diǎn)表示越高的仿真程度,但仿真程度越高實(shí)現(xiàn)越困難,計(jì)算量越大,算法越復(fù)雜,因此,應(yīng)當(dāng)平衡頂點(diǎn)數(shù)量與模型精度,使算法即具有客觀的仿真性,又可以簡(jiǎn)單快捷地實(shí)現(xiàn)功能。
(2)使用Turk和Pentland提出的基于代數(shù)特征的方法,即結(jié)合主成分分析技術(shù)提取“特征臉”法,此方法是人臉識(shí)別領(lǐng)域的基本方法。特征向量集由一批人臉圖像轉(zhuǎn)化而來(lái),被稱為“特征臉”(Eigenfaces),人臉識(shí)別過(guò)程為:將一個(gè)新的圖像投影到特征臉子空間,并對(duì)其投影向量與模擬人臉庫(kù)中的各投影向量的距離進(jìn)行判定和識(shí)別。
3 算法實(shí)現(xiàn)
3.1 求特征向量
3.2 特征向量的選取
上述創(chuàng)建用于投影的特征子空間使用了特征向量相對(duì)應(yīng)的r個(gè)非零的特征值。即使在協(xié)方差矩陣c與非零特征值的N個(gè)特征向量對(duì)應(yīng),且r≤N。然而一般情況下,r的值仍然會(huì)太大,根據(jù)要求,μi卻并不都具有保留意義。
所創(chuàng)建子空間的特征向量數(shù)目直接影響特征空間投影的計(jì)算速度,考慮計(jì)算機(jī)時(shí)間等因素,適當(dāng)刪除一些信息量少的特征向量,并不會(huì)對(duì)分類結(jié)果產(chǎn)生壞的影響,同時(shí)還能提高識(shí)別效率。如下是對(duì)幾種不同特征的選擇方法:
(1)標(biāo)準(zhǔn)的特征空間投影:用于創(chuàng)建特征臉的子空間是r個(gè)非零特征值相對(duì)應(yīng)的特征向量。r值較大時(shí),計(jì)算速度比較慢,不利于分類管理。
3.4 研究結(jié)論
本文主要介紹了人臉三維建模的基本概念、思想、理論依據(jù)以及模型的提取方式。提出了主要利用已有的人臉三維模型來(lái)構(gòu)人臉的基本三維模型,此模型具有參數(shù)化、形象化、簡(jiǎn)單化的特點(diǎn)。通過(guò)提取給定的2D人臉圖像的相關(guān)個(gè)性參數(shù),利用人臉三維模型以及給定圖片的個(gè)性參數(shù)來(lái)構(gòu)建給定圖像的基本三維人臉模型。依據(jù)此模型我們可以進(jìn)行其他相關(guān)研究,比如利用此方法獲取不同視角下的人物照片,減小視頻對(duì)話中傳輸?shù)臄?shù)據(jù)量等。但是此方法依然存在許多不足,對(duì)于人的一些細(xì)節(jié)描繪或者背面部位,比如耳朵、腦后部等,依然難以構(gòu)建。
參考文獻(xiàn):
[1] 司徒亨哥.基于圖片的三維人臉自動(dòng)生成與編輯算法研究 [D].廣州:華南理工大學(xué),2018.
[2] 耿亮.融合深度卷積網(wǎng)絡(luò)和運(yùn)動(dòng)恢復(fù)結(jié)構(gòu)方法的三維人臉建模研究 [D].合肥:合肥工業(yè)大學(xué),2017.
[3] 魏璐.基于三維形變模型的人臉替換技術(shù)研究 [D].北京:北京郵電大學(xué),2017.
[4] 張凌華.基于NRSFM算法的三維人臉建模研究 [D].合肥:合肥工業(yè)大學(xué),2016.
[5] Turk M,Pentland A. Eigenfaces for recognition [J].Journal of Cognitive Neuroscience,1991,3(1):71-86.
[6] 李想.基于單張正面圖像的三維人臉建模研究 [D].蘇州:蘇州大學(xué),2016.
[7] 袁立欣.基于三維形變模型與PCA的人臉識(shí)別研究 [D] 上海:上海師范大學(xué),2008.
作者簡(jiǎn)介:王志坤(1998-),男,漢族,河南人,本科,研究方向:計(jì)算機(jī)與科學(xué);黃熙(1998-),女,漢族,云南人,本科,研究方向:計(jì)算機(jī)與科學(xué);馬永振(1998-),男,漢族,陜西人,本科,研究方向:計(jì)算機(jī)與科學(xué);程禹涵(1999-),男,漢族,黑龍江人,本科,研究方向:計(jì)算機(jī)與科學(xué);朱洪江(1999-),男,漢族,重慶人,本科,研究方向:計(jì)算機(jī)與科學(xué);劉帥(1983-),男,漢族,河北人,計(jì)算機(jī)科學(xué)與技術(shù)教研室助教,研究生,研究方向:機(jī)器學(xué)習(xí),數(shù)字圖像處理。