誰是誰?世界杯折磨臉盲癥
2014巴西足球世界杯,這絕對是史上球星和明星撞臉最嚴重的一屆世界杯:厄齊爾穿越了,梅西神似達斯汀·霍夫曼,哈維變身鋼鐵俠,法布雷加斯亂入《星際迷航》……當世界杯球星撞臉歐美明星,著實讓偽球迷傻傻分不清!不靠譜的傳言說,每個地球上生活的人都會有另外3個人和自己長得一模一樣。
人一生當中能夠辨認出多少張人臉?在我們有限的大腦記憶中,能真正記住的面孔不會超過1萬個。但是科技發(fā)展速度驚人,在人工智能的幫助下,我們不但能夠“記住”更多的人臉,還能輕而易舉地檢索出他們,甚至追查兇手逃犯、幫助走失的孩子們回家……
哥瞎的不是眼睛,是臉面!
認不清人臉這個問題長期困擾著臉盲癥患者。沒聽說過臉盲癥?那要看看這篇文章,先掃掃“臉盲知識盲”。
在生活中,你是不是經常認錯人呢?在大街上,經常是看到熟人不敢認,看到生人又老懷疑是不是你認識他。
對于影視明星,你是不是也常常傻傻分不清、認不準?這是鞏俐還是章子怡?李小璐還是周迅?陶澤如還是李雪健?認錯了沒什么,更不要大驚小怪。因為生活在這個世界上的人大約有2%的人是臉盲癥,認錯人并不是什么罕見的問題。如果你的朋友在街上碰到你時沒和你打招呼,不要太在意,也許,他只是沒認出你來而已。
查一下維基百科,臉盲癥英文學名叫prosopagnosia,這個名詞源于希臘文,意思為“認不出臉面”,它還有一個通俗的名稱“Face blindness”。它的意思可套用一句流行語:哥瞎的不是眼睛,是臉面!
外國人,傻傻分不清?
湯姆、約翰、吉姆?對有些人來說,看外國電影就是一場災難,影片播了一大半,電影里面的人物還是分不清,真是一個頭兩個大。
分不清外國人的長相通常被稱為“異族效應”。這個現象早在1991年就被斯蒂芬·林德賽等人發(fā)現了:人們對于同種族面孔的記憶力比對不同種族的要好。之后研究人員一直想要找到“異族效應”產生的原因。2002年,奧利弗·帕斯卡里斯等人通過對6~10個月大的嬰兒的“其他物種效應”研究,解釋了這一現象產生的原因。原來我們在知覺發(fā)展過程中出現了“知覺窄化”。
什么是“知覺窄化”?看看帕斯卡里斯等人的實驗是如何做的吧。被試者是小嬰兒,他們不會說話,也不能像成人一樣聽懂實驗任務,所以研究人員采用“習慣化”范式來進行這類實驗。他們給嬰兒重復呈現一張面孔,直到他不主動盯著這張圖片;一段時間后,再給嬰兒同時呈現兩張面孔,其中一張是之前出現過的,另外一張則是新的。研究人員根據嬰兒對兩張圖片的注視時間長短來判斷嬰兒對面孔識別能力。如果嬰兒的注視興趣或者注視時間主要集中在新異圖片上,就表明嬰兒能夠識別或辨別兩張圖片。
進化喪失分辨能力
研究人員實驗發(fā)現,無論出現的是人臉還是猴臉,6個月大的嬰兒對新異面孔的注視時間都顯著長于熟悉的面孔,這表明6個月大的嬰兒對人臉和猴臉都能進行很好的識別。與之形成對比的是成人的實驗結果:成人對人臉有很好的識別能力,但對生熟不同的猴臉的注視時間沒有顯著差異,這表明成人不能識別猴子這一非人類的面孔。這說明,成人對人臉的識別優(yōu)于對非人臉的識別。
那么我們到底是在什么時候喪失了分辨猴臉的能力呢?9個月大的嬰兒對人臉和猴子臉的識別已經類似于成人的反應,也就是說這種對異類面孔的識別能力下降大約發(fā)生在6~9個月間。
根據這一研究,戴維·凱利等人以美國白人、中國人和非洲人的面孔作為實驗材料重復了這一實驗,并測試了中國嬰兒的識別能力。結果發(fā)現:中國嬰兒在3個月大時,對美國白人、中國人以及非洲人的面孔都能進行很好的識別;6個月大時能夠識別中國人和美國白人的面孔,不能識別非洲人面孔;9個月大時只能識別中國人的面孔,不能識別美國白人和非洲人的面孔。
類似研究結果表明,在我們知覺發(fā)展的過程中,我們普遍發(fā)生了“知覺窄化”,喪失了這種分辨異族面孔的能力。這符合進化的需要——我們平日接觸得最多的是同族,準確地分辨出同族的面孔有利于社會交往和種族生存,因此人腦自動調試以適應需要。
眾里尋臉千百度
雖然人類的面孔識別能力讓人驚嘆,但識別面孔早已不是人類的專利,若想在茫茫人海中找尋一個人,我們可就不占優(yōu)勢了。
人臉圖片能作為識別人身份的依據嗎?當然能!人從一出生就依次認識了父母、親人、朋友,這都是憑借對人臉的識別和記憶。但是,人的記憶空間畢竟有限,對那些跟自己毫無關系的人,誰都難以留下深刻的印象。
假如某天你在大街上真的遇見追捕令上的嫌疑犯,你恐怕很難一眼認出他。不過別急,計算機可以幫忙,它只要“學習”一次,就能做到“終身難忘”。那么,運用人臉識別技術真的可以揪出嫌疑犯嗎?
人臉識別,是模式識別的一種,特指利用分析、比較人臉視覺特征信息進行身份鑒別的計算機技術,屬于生物特征識別技術。人臉識別技術的實現一般有五個主要步驟:人臉檢測與定位、人臉圖像處理、特征提取、特征閃配和人臉身份判決。
當面對一幅有山有水、有物又有人的圖片時,人臉檢測器開始對整個圖像從不同的位置和尺度進行掃描,試圖找到人臉并確定其位置。首先分類器將圖片分成若干個窗口,然后由掃描器對一個一個像素進行平移,逐一判斷每個窗口中是否有人臉存在。分類器和掃描器是通過機器學習的方法訓練出來的,通過大量的案例學習,它們就能識別出一個個窗口中是否有人臉存在。
計算機找出人臉后,要按照人臉圖像處理的要求對人臉進行幾何歸一化和光照歸一化,這是為了校正人臉在尺度、光照和旋轉等方面的變化。通常人的兩眼距離和方向是相對固定的,幾何歸一化是將人臉的兩個眼睛中心固定在一個方框里的固定位置,以此才能和其他圖像進行比對。同理,如果圖片的光照、明暗情況不同,還必須進行光照歸一化,對人臉圖像進行調節(jié)。
人臉識別技術最核心的部分是特征提取,隨著技術的發(fā)展,提取人臉特征的方法在不斷推陳出新。最早人們采用提取幾何特征的方法,以人臉器官的形狀和幾何關系作為基礎的特征矢量,但這種方法準確率較低,連人的膚色差異都無法識別。
現在流行的人臉識別方法主要是利用生物統(tǒng)計學的原理分析并建立數學模型。由于人臉處于三維空間,那么用于表達人臉的向量在不同像素、各種尺寸和方向的組合,大約有千萬個特征數值。而特征提取的過程,就是通過復雜的算法,讓計算機將特征數量從幾千萬維降到幾千維,再對幾千維進行處理,得到最能區(qū)分人臉的幾百維特征。那么特征降維是如何做到的呢?其實對每個人來說,最有效的人臉特征值是不一樣的。機器通過樣本的學習,能夠知道挑選哪些最有效的特征,來表達一個人的面部信息。
舉個簡單的例子,機器在學習甲乙兩人的諸多圖像時,要表達甲的人臉特征,就必須找到幾幅甲的人臉圖像中最接近、差別最小的特征值,同時要與乙的人臉圖像差別最大的特征,這才是一組好的特征值。最終機器提取得到的特征并不是我們肉眼直接看到的人的面部特征,而是通過對大量樣本統(tǒng)計學習和計算得到的特征值。此外常用的人臉識別方法還有主成分分析、線性判別分析、彈性圖匹配等機器學習的方法。
人臉識別的最后步驟是進行特征匹配和人臉身份判決,這需要龐大的人臉數據庫。在對樣本圖像進行特征提取后,計算機程序會把這幾百個特征與數據庫中的人臉進行對比,特征值差異最小的將排在最前面,所有結果按差異從小到大值依次排列。最后通過特征匹配的結果對人臉的身份進行判決。
人臉識別的優(yōu)勢
從狹義上說,人臉識別特指的是通過人臉進行身份確認或者查找的技術和系統(tǒng)。但實際上,人臉識別是包括人臉圖像采集、人臉定位、人臉預處理、身份確認、身份查找等眾多環(huán)節(jié)技術。
人臉識別其實是生物特征識別系統(tǒng)中的一種。生物識別就是指用生物體本身的特征來區(qū)分生物體個體。例如臉、指紋、手掌紋(以后街頭算命大師完全可以換招牌為“生物識別系統(tǒng)資深科學家”)、虹膜、視網膜、語音、行為等生物特征均可以用來識別生物個體。
人臉識別的最大優(yōu)勢是自然性,因為人類本身交往就是用面部來區(qū)別他人和確定身份的。這么說聽起來讓人不明覺厲,實際上就是可能有人跟你長一樣的青蛙眼,也可能有人跟你長一樣的鷹鉤鼻,還可能有人跟你長一樣的雙下巴,但是能將這么多特征點無序組合在一起,那就非你莫屬了。
人臉識別大多是靠從臉部提取不同的點組成的模板來進行識別。Facebook之前收購的Face.com,用的人臉識別技術就是從臉上提取80多個特征點來形成直方圖,精確度可以分辨出同卵雙胞胎。那些武俠小說上所說的貼胡子等易容術基本失效。
創(chuàng)立僅半年的芬蘭公司Uniqul讓很多人的夢想成為了現實,那就是“刷臉消費”。現在只是在芬蘭赫爾辛基地區(qū)試運營,不過這不能阻礙我們的美好想象。你只用站在自動售貨機面前,它輕輕地看了你一眼,就不假思索地吐出一盒唐師傅紅燒驢肉泡面,是不是很酷?
人臉識別確定壽命
過去人臉識別技術大多用來鎖定犯罪分子,或者通過模擬長大后的樣子來尋找失蹤的小孩。但是現在人臉識別變得越來越普遍和個人化,科學家正在研究一套利用面部衰老形態(tài)的模擬,來確定個人年齡的系統(tǒng)。
伊利諾斯大學的生物人口學家喬治·奧山斯對華盛頓郵報記者說,根據已有的試驗數據我們了解到,有一些人老的比較快,而有一些人卻老的慢一點;而且研究表明,人類衰老越慢,存活時間就越長。所以通過人臉衰老速度就可以判斷出,研究對象大概會活多少年。
具體操作,科學家會利用電腦掃描研究對象的照片或者臉部特征,尋找衰老的痕跡。同時,還需要提供研究對象的種族、性別、教育背景和有無吸煙史等生活習慣資料,這些都是影響生命長度的關鍵因素。然后電腦就會開始分析研究對象的各個面部特征,包括臉頰、眼睛、眉毛、嘴巴還有顎骨,檢測色差,比如細紋、色素斑點、下垂現象還有其他一切與年齡變化有關的細節(jié)。目前這項技術還不夠成熟,處于早期試驗階段,不過,已有不少保險公司看到了它背后的商業(yè)價值,也許通過這項技術可以幫助保險公司更精確的確定保險金額。那么,這算不算作弊呢?
這項研究成果其實是將大數據與醫(yī)療結合來抗衰老的又一典型案例,之前Google曾經宣布成立醫(yī)療和保健公司Calico,主要進行人類衰老及相關疾病方面的研究。蘋果主席亞瑟·萊文森也參與了這個計劃,并擔任CEO。
另一個機構,Human Longevity和它的著名研究員克萊格·文特爾也在今年打算建造一個人類DNA排序數據庫來用于減緩人類衰老,這項技術目前得到了7 000萬美元早期融資。有人知道你能活多久,也能幫助你抗衰老,親愛的小伙伴們,你們覺得快樂嗎?
最大挑戰(zhàn)還是年齡
人臉識別技術能夠比較準確快捷地識別他人的身份,這大大節(jié)省了檢索的時間和人力,但是,人臉識別技術與人的肉眼識別還存在不小的差距,影響人臉識別準確度的因素主要包括光照、特殊表情、側臉、年齡增長等。
目前,光照的問題已經基本得到了解決。對于奇特或扭曲的表情、神態(tài)(比如哭泣、做鬼臉),科學家用三維技術可以把人的長相貼在模型上進行校正,校正之后再進行匹配。至于側臉,就是另外一個課題了。因為人的側臉與正面臉的特征值完全不同,提取特征值的方法也需要有較大的調整。
不過,人臉識別最大的挑戰(zhàn)是增長的年齡。一個人在15歲、25歲和35歲的面容會有什么不同嗎?當然!尤其是當一個人衰老之后,辨認難度更大。針對這個問題,現行的想法是,收集人在各個年齡段的人臉圖像,并將人臉的變化規(guī)律用模型描述出來,但是這需要有龐大的數據庫來支持,特別是同一個人在不同年齡段的人臉圖像,時間跨度很大,不易收集。如果一個人飽經滄桑后,人的肉眼都認不出他來,那么機器恐怕也很難區(qū)別。對于做較大整容手術的人也是如此,因為他的面孔特征已經全部改變了。這時就需要用其他的生物特征識別技術來鑒定他的身份,例如指紋、DNA等。
雖然人臉識別目前還處在研究階段,但是可以想象,未來《碟中諜4》里特工哈納韋戴上隱形眼鏡,拿著手機,在茫茫人海中尋找跟蹤對象的場景將在現實中實現。