闞美娜 何思誼 山世光
人臉識(shí)別,就是讓計(jì)算機(jī)像人用眼睛觀察一樣,通過(guò)攝像頭拍攝人臉來(lái)判斷看到的是誰(shuí)。對(duì)計(jì)算機(jī)來(lái)說(shuō),這個(gè)“識(shí)別”過(guò)程包括兩個(gè)階段:首先要從拍攝的圖像中找到“人臉”,這個(gè)過(guò)程叫作“人臉檢測(cè)”;然后再與數(shù)據(jù)庫(kù)中存儲(chǔ)的人臉進(jìn)行比對(duì),從而判斷檢測(cè)到的人臉屬于誰(shuí),這個(gè)過(guò)程叫作“人臉識(shí)別”。
人臉檢測(cè)的任務(wù)是從圖像中標(biāo)注出每張人臉的具體位置和大小,一般用人臉矩形框(如人臉識(shí)別流程圖中的綠色矩形框)四個(gè)頂點(diǎn)的坐標(biāo)來(lái)標(biāo)示。這對(duì)于人類來(lái)說(shuō)似乎很簡(jiǎn)單(不過(guò)科學(xué)家們還不完全清楚人腦是怎么做到的),可對(duì)計(jì)算機(jī)來(lái)說(shuō)卻沒(méi)有那么容易。因?yàn)樵谟?jì)算機(jī)內(nèi)部,彩色圖像是由一個(gè)挨一個(gè)的點(diǎn)(像素)組成的,每個(gè)像素通常由紅(R)、綠(G)、藍(lán)(B)三個(gè)顏色數(shù)值來(lái)表示??上攵苯油ㄟ^(guò)這些數(shù)值的差異區(qū)分人臉和非人臉十分困難。因此,人工智能專家需要設(shè)計(jì)算法對(duì)這些數(shù)值進(jìn)行處理,找到人臉區(qū)域與非人臉區(qū)域在這些數(shù)值中蘊(yùn)藏的差異,從而區(qū)別人臉區(qū)域和非人臉區(qū)域,完成人臉檢測(cè)。
檢測(cè)出人臉后,就可以對(duì)這張臉的身份進(jìn)行判斷了。人臉識(shí)別通常有兩種應(yīng)用場(chǎng)景:一種是相對(duì)簡(jiǎn)單的1:1人臉驗(yàn)證,比如手機(jī)解鎖就是將使用手機(jī)的人和手機(jī)里儲(chǔ)存的“主人”照片進(jìn)行比對(duì);另一種是1:N人臉辨識(shí),即將一張未知身份的人臉圖像與數(shù)據(jù)庫(kù)中所有的已知人臉圖像進(jìn)行比對(duì),判斷其是否是數(shù)據(jù)庫(kù)中的某個(gè)人,如果是,則顯示此人在數(shù)據(jù)庫(kù)中的信息。
人臉識(shí)別技術(shù)始于20世紀(jì)70年代,但直到近幾年才得到廣泛應(yīng)用,這是為什么呢?因?yàn)槿四樧R(shí)別最大的難點(diǎn)就是對(duì)人臉圖像中的數(shù)值進(jìn)行處理和分析,提取可以區(qū)分不同人的關(guān)鍵特征。
在201 4年之前,人臉識(shí)別專家一直都在嘗試人工設(shè)計(jì)這樣的特征。在2014年之前的十幾年里,最為普遍的人臉識(shí)別方法是統(tǒng)計(jì)人臉局部區(qū)域(比如左眼區(qū)域)中出現(xiàn)某種“微模式”的程度或數(shù)量,這類特征一般被稱為“局部特征”。這種方法在采集條件好、被識(shí)別人主動(dòng)配合的情況下可以取得非常不錯(cuò)的效果,但在復(fù)雜多變的人臉識(shí)別場(chǎng)景中,正確率可能連90%都達(dá)不到。
2014年之后,得益于深度學(xué)習(xí)算法、強(qiáng)大GPU算力支撐和大規(guī)模人臉數(shù)據(jù)庫(kù)這三大引擎的推動(dòng),人臉識(shí)別技術(shù)取得了跨越式的進(jìn)步。深度學(xué)習(xí)算法的強(qiáng)大魅力在于人臉識(shí)別專家不需要再絞盡腦汁去自己定義“特征”,而只需要為深度學(xué)習(xí)算法準(zhǔn)備好大量“食材”(照片),剩下的就交給深度學(xué)習(xí)算法自動(dòng)完成。從此,人臉識(shí)別技術(shù)開(kāi)始廣泛應(yīng)用于我們的生活中,比如視頻偵查、嫌疑人追逃、考勤系統(tǒng)等。
未來(lái),人臉識(shí)別技術(shù)將向著“智能視頻分析”發(fā)展,即對(duì)目標(biāo)人臉進(jìn)行分析、追蹤。如果犯罪嫌疑人出現(xiàn)在攝像頭中,一個(gè)個(gè)攝像頭拍攝的視頻將會(huì)聯(lián)動(dòng)起來(lái),追蹤嫌疑人的活動(dòng)路徑。另外,還有一個(gè)有趣的方向:“讀心術(shù)”。中國(guó)科學(xué)院智能信息處理重點(diǎn)實(shí)驗(yàn)室研發(fā)的“表情識(shí)別”系統(tǒng),能即時(shí)對(duì)捕捉到的人臉做18種面部動(dòng)作單元的檢測(cè),從而判斷此人的情緒、心理狀態(tài)乃至精神狀況。這項(xiàng)技術(shù)應(yīng)用前景廣泛,比如在教室,通過(guò)對(duì)面部表情分析判斷你對(duì)課程的掌握程度,從而制訂出最適合你的學(xué)習(xí)計(jì)劃;在家里,讓你擁有一個(gè)及時(shí)感知你喜怒哀樂(lè)的機(jī)器人朋友……
如同其他科學(xué)技術(shù)一樣,人臉識(shí)別技術(shù)經(jīng)過(guò)科學(xué)家們數(shù)十年的潛心鉆研,終于厚積薄發(fā),迎來(lái)了輝煌的發(fā)展,成為我們生活中不可或缺的一部分。未來(lái),人臉識(shí)別技術(shù)還將以意想不到的方式繼續(xù)影響我們的生活,讓我們的生活更加便捷、安全。