林宏憶
(山東省煙臺(tái)第一中學(xué),煙臺(tái) 264000)
人臉辨別是人類的一項(xiàng)基本能力,據(jù)研究表明,人臉辨別能力在人類出生的3到4年逐漸建立起來(lái),到10歲時(shí),人類便可以辨別99%的人臉,隨著認(rèn)知的增加,人類的辨別能力還會(huì)逐漸增加,本文所介紹的人臉識(shí)別是指利用計(jì)算機(jī)模仿人類的這種能力進(jìn)行人臉的技術(shù)。人臉識(shí)別的歷史最早可以追溯到20世紀(jì)50年代,早期的科學(xué)家試圖模仿人類的這種能力,進(jìn)行自動(dòng)化的識(shí)別,但是識(shí)別方法單一,并沒(méi)有大規(guī)模推廣。進(jìn)入21世紀(jì)以來(lái),隨著計(jì)算機(jī)技術(shù)和人工智能等技術(shù)不斷發(fā)展,人臉識(shí)別迎來(lái)了蓬勃發(fā)展的時(shí)代。
人臉識(shí)別是將靜態(tài)圖像或視頻圖像中檢測(cè)出的人臉圖像與數(shù)據(jù)庫(kù)中的人臉圖像進(jìn)行對(duì)比,從中找出與之匹配的人臉的過(guò)程,以達(dá)到身份識(shí)別與鑒定的目的,它是同屬于生物特征識(shí)別領(lǐng)域和人工智能領(lǐng)域的一個(gè)課題,在商業(yè)、娛樂(lè)、安全、身份認(rèn)證、法律執(zhí)行等眾多方面也有著廣泛的應(yīng)用。
類似于人臉識(shí)別的現(xiàn)代生物識(shí)別技術(shù)眾多,例如虹膜識(shí)別、指紋識(shí)別、掌紋識(shí)別、語(yǔ)音識(shí)別、步幅識(shí)別等,人臉識(shí)別之所以脫穎而出,因其具有以下的若干特性:
(1)人工替代性高。由于人臉識(shí)別最早便是模仿人類的識(shí)別能力,與正常人類辨識(shí)他人身份的原理相同,在識(shí)別設(shè)備被破壞或者出現(xiàn)故障時(shí),人臉識(shí)別系統(tǒng)不能完成正常的識(shí)別過(guò)程,并且會(huì)出現(xiàn)較大偏差,此時(shí)完全可以由正常人來(lái)完成應(yīng)急工作,保障了識(shí)別任務(wù)的正常進(jìn)行,這是其他生物識(shí)別技術(shù)難以完成的。
(2)隱蔽性高。在傳統(tǒng)的指紋、虹膜識(shí)別中,使用者往往需要做出特定的動(dòng)作才能完成識(shí)別,而人臉識(shí)別則不需要,無(wú)論是通過(guò)圖片、視頻還是實(shí)時(shí)的在線檢測(cè),人臉識(shí)別都可以完成隱蔽性的非接觸式檢測(cè),可以有效地防止人臉識(shí)別系統(tǒng)被有意或無(wú)意的損壞。
(3)易用性和經(jīng)濟(jì)性高。人臉識(shí)別所需要的硬件組成極其簡(jiǎn)單,只需要采集圖像所需的攝像設(shè)備和圖像處理設(shè)備,外加一臺(tái)普通性能的計(jì)算機(jī)即可,如果是進(jìn)行圖片中的人臉識(shí)別,還可以節(jié)約前兩個(gè)設(shè)備。并且采集設(shè)備沒(méi)有太高的要求,分辨率達(dá)到一定的攝像頭即可,例如手機(jī)、數(shù)碼相機(jī)、攝像頭均可,而且這些設(shè)備高度靈活,易用性高,例如手機(jī)上的人臉識(shí)別系統(tǒng)學(xué)習(xí)成本低,已經(jīng)應(yīng)用到很多社交APP中完成娛樂(lè)、身份驗(yàn)證等功能。
(4)普遍性高。相比于指紋、虹膜等生物特征,人臉圖像在互聯(lián)網(wǎng)上分布很廣,數(shù)據(jù)資源有著天然的優(yōu)勢(shì),這便于機(jī)器學(xué)習(xí)等技術(shù)進(jìn)行人臉識(shí)別學(xué)習(xí),完善自身的識(shí)別過(guò)程,這使其更加適合現(xiàn)代互聯(lián)網(wǎng)社會(huì)的大環(huán)境。
相比于其它生物識(shí)別方式,人臉識(shí)別有著天然的優(yōu)勢(shì),但是由于人臉本身的若干性質(zhì)和外界因素的影響,其應(yīng)用也受到不同程度的限制。首先,人臉是一個(gè)動(dòng)態(tài)的對(duì)象, 人有喜怒哀樂(lè) 就表明同一個(gè)人的面部在不同的情況下也會(huì)呈現(xiàn)出很大差異,而且這種差異性在個(gè)體之間普遍存在;同時(shí)年齡和裝扮也是影響識(shí)別的重要因素,隨著皺紋的增多和面部肌肉的老化,一個(gè)人在少年和老年會(huì)呈現(xiàn)出不同的面部,同一個(gè)人在是否戴帽子、戴眼鏡、化妝的情況下也會(huì)有著不同的面部特征;最后,外界環(huán)境因素也會(huì)影響面部識(shí)別,人臉是一個(gè)三維圖像,從不同角度看往往對(duì)顯示出不同的特征,光照明暗的不同也會(huì)大大影響人臉識(shí)別的準(zhǔn)確度。此外,人臉識(shí)別技術(shù)的研究同時(shí)涉及到圖像處理、計(jì)算機(jī)視覺(jué)、模式識(shí)別、人工智能、神經(jīng)網(wǎng)絡(luò)、生理學(xué)、心理學(xué)等諸多學(xué)科,復(fù)雜度高,覆蓋面非常廣。除了這些主要因素之外,還有諸如雙胞胎長(zhǎng)相近似難以辨別、3D打印出來(lái)的1:1面部模型以假亂真、機(jī)器分辨真人和照片存在難度也會(huì)使人臉識(shí)別的應(yīng)用和推廣帶來(lái)很多不利因素,人臉識(shí)別要達(dá)到類似于人的準(zhǔn)確度和智能水平,還需要技術(shù)方面的不斷探索。
人臉識(shí)別技術(shù)從本質(zhì)上可以分為以下三類:
(1)局部特征人臉識(shí)別。人臉有很多局部特征,例如眼睛大小、單雙眼皮、八字眉、大豁嘴等,還有一些個(gè)人特征,例如傷疤、黑痣、酒窩、凸起的顴骨等,就算雙胞胎在局部特征上也會(huì)有細(xì)微不同?;诰植刻卣鞯娜四樧R(shí)別就是提取這些局部特征構(gòu)成識(shí)別矢量,從而做到特征比對(duì)。此類方法一般分為基于幾何特征和模型模板的識(shí)別,前者是早期一種重要的方式,主要利用各個(gè)特征中的幾何量,例如眼鏡左右眼角的距離、鼻子和嘴巴的距離、眉毛傾斜的角度等,進(jìn)而構(gòu)成人臉的識(shí)別矢量,從而完成和數(shù)據(jù)庫(kù)的比對(duì)。而后者則是將包含幾何特征在內(nèi)的整個(gè)人臉模型用來(lái)比對(duì),這樣可以獲得比前者更多的細(xì)節(jié)信息,比對(duì)成功率增加,但是計(jì)算量也有大幅增加。
(2)全局特征人臉識(shí)別。全局特征主要包括人臉的膚色特征(白皙、黝黑)、總體輪廓(瓜子臉、圓臉、鴨蛋臉、方臉、長(zhǎng)臉等)、以及面部五官的分布特征。基于全局特征的人臉識(shí)別方法通常將人臉看成是一個(gè)整體,而不需要對(duì)人臉的面部特征或局部特征點(diǎn)進(jìn)行檢測(cè),這種方法不僅保留了人臉要素之間的拓?fù)潢P(guān)系,而且還保留了各部件本身的信息。
(3)混合特征人臉識(shí)別??茖W(xué)家認(rèn)為人眼是一個(gè)優(yōu)秀的人臉識(shí)別系統(tǒng),所以探尋人眼識(shí)別的過(guò)程對(duì)研究人臉識(shí)別有著重要意義,而人眼進(jìn)行識(shí)別最基本的就是依靠混合特征,也就是先提取全局特征進(jìn)行粗略的匹配,再通過(guò)局部特征進(jìn)行更為精確的辨認(rèn),這樣的識(shí)別模式不僅高效,而且準(zhǔn)確率很高。
一個(gè)完整的人臉識(shí)別系統(tǒng)擁有很長(zhǎng)的技術(shù)鏈,但是再?gòu)?fù)雜的人臉識(shí)別技術(shù)也能夠拆分為以下幾個(gè)環(huán)節(jié):
(1)圖像采集。圖像采集是人臉識(shí)別的第一步,在識(shí)別之前需要先采集被識(shí)別者的人臉信息。圖像采集模塊負(fù)責(zé)把實(shí)際人臉信息轉(zhuǎn)換為圖像信息,相當(dāng)于我們?nèi)粘I钪械?拍照 ,由分辨率一定的攝像頭采集,成像形式為可見光成像或紅外光成像,紅外光成像可以在夜間進(jìn)行工作,保障全天候的圖像采集能力。
(2)人臉檢測(cè)定位。圖像采集過(guò)后的圖像還不能直接使用,可能存在人臉過(guò)小或者位置歪斜等情況,這時(shí)需要人工智能技術(shù)找出人臉?biāo)诘膮^(qū)域進(jìn)行圖像檢測(cè)定位,并將其調(diào)整到適合機(jī)器提取信息的位置和角度。這種定位方式一般是通過(guò)人臉中眼角、嘴角、鼻尖、下巴尖等位置來(lái)定位的,定位之后還要通過(guò)歸一化處理,將定位后的人臉圖像調(diào)整至需要比對(duì)的數(shù)據(jù)庫(kù)人臉標(biāo)準(zhǔn)大小。
(3)特征提取。人臉的特征提取模塊會(huì)提取將定位處理后的人臉中有效的信息,去除無(wú)效信息,增強(qiáng)識(shí)別效果,將這些信息轉(zhuǎn)換為特征向量,實(shí)現(xiàn)了圖形特征到數(shù)字序列的轉(zhuǎn)化,是人臉識(shí)別的關(guān)鍵一步。
(4)三維建模。提取出若干信息后,就需要將這些信息再還原出三維模型,一般是通過(guò)計(jì)算機(jī)強(qiáng)大的三維建模能力,建立樣本人臉的三維模型。
(5)模型對(duì)比。得到最終樣本的三維模型后,就需要通過(guò)信息檢索等技術(shù)來(lái)最終識(shí)別,識(shí)別是根據(jù)特征向量判斷人臉的身份。識(shí)別任務(wù)分為兩種:一種是人臉驗(yàn)證,輸入一對(duì)人臉圖像,需要判斷這對(duì)圖像是否屬于同一個(gè)人,這是一對(duì)一的匹配;另一種是人臉辨識(shí),它的輸入是一幅人臉圖像,需要判斷該人臉圖像屬于給定的人臉庫(kù)中的哪一個(gè)人,這是一對(duì)多的匹配。
人臉識(shí)別的應(yīng)用領(lǐng)域非常廣泛,主要有以下幾個(gè)方面:
(1)安全領(lǐng)域。安防是人臉識(shí)別的初衷也是人臉識(shí)別應(yīng)用最廣泛的領(lǐng)域。在民用安防中,從我們熟悉的智能門禁系統(tǒng)和考勤系統(tǒng),到火車站、機(jī)場(chǎng)的安檢系統(tǒng),再到銀行金庫(kù)的安全系統(tǒng),人臉識(shí)別都承擔(dān)著重要的作用。隨著安防技術(shù)的發(fā)展和人臉識(shí)別技術(shù)的發(fā)展,人臉識(shí)別開始應(yīng)用在視頻監(jiān)控中,用于對(duì)人物的智能檢索和行為的智能分析等。隨著智慧城市和平安城市的提出,安防領(lǐng)域的要求會(huì)不斷増長(zhǎng),并對(duì)安防系統(tǒng)的智能化提出越來(lái)越高的要求,這會(huì)給人臉識(shí)別帶來(lái)巨大的應(yīng)用需求。
(2)娛樂(lè)領(lǐng)域。我們熟悉的手機(jī)拍照軟件中,幾乎都有了人臉識(shí)別對(duì)焦功能,系統(tǒng)可以自動(dòng)識(shí)別人臉,通過(guò)方框表示出來(lái)。在當(dāng)今一些自拍APP中,例如美顏相機(jī)等,都內(nèi)置了人臉識(shí)別功能,用戶可以根據(jù)自己的喜好給自己的頭上加上各種道具,十分迎合年輕人的需求。除此之外,人臉識(shí)別也用在手機(jī)安全解鎖和安全支付中,美國(guó)蘋果公司發(fā)布的iPhone X就采用了三維人臉識(shí)別技術(shù),通過(guò)點(diǎn)陣投射和紅外成像的方式,使安全性和成功率都有很好的保證。
此外,人臉識(shí)別還用在智能辦案、檢索和有關(guān)分析之中。
人臉識(shí)別經(jīng)過(guò)幾十年的發(fā)展,雖然已經(jīng)初具智能化,但是在很多方面還有研究和進(jìn)步的空間??偨Y(jié)近幾年的發(fā)展,人臉識(shí)別將朝著以下方向持續(xù)探索:目標(biāo)建模與多特征融合;基于深度學(xué)習(xí)與在線學(xué)習(xí)的人臉檢測(cè)與識(shí)別技術(shù);基于視覺(jué)神經(jīng)機(jī)理的人臉檢測(cè)識(shí)別技術(shù)研究;基于多傳感器多信息融合人臉識(shí)別技術(shù)。另外,目前的人臉識(shí)別系統(tǒng)包括人臉簽到,人臉支付等都是針對(duì)特定場(chǎng)合進(jìn)行應(yīng)用的,對(duì)被識(shí)別者臉部照片的獲取有諸多限制條件,研究更具現(xiàn)實(shí)場(chǎng)景意義的人臉識(shí)別系統(tǒng)也是今后學(xué)者努力的一個(gè)方向,在不久的未來(lái),人臉識(shí)別將和國(guó)家構(gòu)建的 天網(wǎng) 通力合作,構(gòu)建更加安全和諧的社會(huì)。
[1] 張海旸,馬華東.基于網(wǎng)格的自適應(yīng)彈性圖人臉匹配方法[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)報(bào),2008,20(2):253-258.
[2] 徐曉艷.人臉識(shí)別技術(shù)綜述[J].電子測(cè)試,2015,32(5):885-894.
[3] 周凱汀,鄭力新.基于改進(jìn)ORB特征的多姿態(tài)人臉識(shí)別[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2015,13(2):287-295.
[4] 李文琴,曾廣樸,文俊浩.基于神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別系統(tǒng)[J].激光雜志,2015,36(3):54-57.