方陵生/編譯
臉部識(shí)別系統(tǒng):個(gè)人隱私終結(jié)者
方陵生/編譯
面部識(shí)別軟件可以通過任何一張照片確認(rèn)你的身份
抗議游行隊(duì)伍里,一家同性戀酒吧里,或一家墮胎診所里的一張照片,都有可能讓你的朋友認(rèn)出你來。但機(jī)器不能,至少現(xiàn)在還不能,除非一臺(tái)配備了多張你的高質(zhì)量圖片資料的計(jì)算機(jī)一直在負(fù)責(zé)搜索你,你的隱私始終是安全的。也沒有計(jì)算機(jī)可以通過隨機(jī)的、沒有標(biāo)簽的圖片在互聯(lián)網(wǎng)上搜索找到你。但在收藏了至今為止世界上最大個(gè)人照片集的Facebook的“花園圍墻”內(nèi),這樣的前景正在開始慢慢展現(xiàn)在我們面前。
Facebook的臉部識(shí)別系統(tǒng)DeepFace在一些受限制的面部識(shí)別任務(wù)中,其準(zhǔn)確程度堪比人類。紐約大學(xué)計(jì)算機(jī)科學(xué)家、領(lǐng)導(dǎo)Facebook人工智能研究的雅安·勒存(Yann LeCun)堅(jiān)持認(rèn)為,F(xiàn)acebook并非意圖要侵犯其超過13億用戶的隱私,而是意在保護(hù)個(gè)人隱私。一旦DeepFace在每天上傳新照片的4億用戶中“認(rèn)出”了你的臉,“你會(huì)得到一個(gè)來自Facebook的警告,告訴你你出現(xiàn)在了這張照片中?!彼忉屨f,“你可以選擇模糊你在這幅圖中的臉,以保護(hù)你的隱私。”然而,很多人根本不希望被認(rèn)出來,特別是在陌生人的照片中時(shí)。Facebook已開始使用該系統(tǒng),雖然其面部標(biāo)記系統(tǒng)只向你顯示你“朋友”的身份。
DeepFace不是這場隱私保護(hù)賽中的唯一“黑馬”,美國政府為大學(xué)人臉識(shí)別研究投入了大筆資金,如谷歌等一些私營公司也在開發(fā)確定個(gè)人身份的照片和視頻自動(dòng)識(shí)別技術(shù)。
自動(dòng)面部識(shí)別技術(shù)如何付諸實(shí)際應(yīng)用,以及法律如何加以限制等,目前仍不清楚。但是一旦技術(shù)成熟,在解決許多隱私問題的同時(shí),也必將產(chǎn)生同樣多的新的隱私問題?!半[私問題這個(gè)妖魔或許很快就要破瓶而出,而我們已經(jīng)沒有退回去的路了?!睈酆扇A州立大學(xué)研究隱私問題的信息系統(tǒng)研究員布萊恩·梅尼克(Brian Mennecke)說道。
簡單的臉部識(shí)別對(duì)于計(jì)算機(jī)來說,是一件輕而易舉的事情,至少比識(shí)別一些常見物體要容易得多,如花朵、毯子和燈具等。幾乎所有的臉部都有相同的幾個(gè)特征:眼睛、耳朵、鼻子和嘴,而且都在同樣的相對(duì)位置,這種一致性為計(jì)算機(jī)識(shí)別提供了有效的途徑?!皥D片的臉部識(shí)別技術(shù)已經(jīng)存在有大約20年時(shí)間了?!崩沾嬲f道。如今即使是普通相機(jī)里的微型計(jì)算機(jī)也早就具備了臉部識(shí)別和聚焦的功能。
但是“確定一張臉比探測到一張臉要困難得多。”勒存說。你的臉代表了唯一的你,但與你的指紋不同的是,它是在不斷動(dòng)態(tài)變化著的。只是一個(gè)簡單的微笑,你的臉就會(huì)發(fā)生很多變化,你的眼角會(huì)皺起,你的鼻翼會(huì)輕輕張翕,你的牙齒會(huì)露出來。當(dāng)你仰頭大笑時(shí),你的臉型甚至?xí)黠@扭曲。即使你努力保持同樣的臉部表情,你每張照片上的頭發(fā)也不盡相同,特別是當(dāng)你進(jìn)了一趟理發(fā)店后,出來后更是形象大為改觀。但是大多數(shù)人都能在一系列照片中毫不費(fèi)力地認(rèn)出你來。
就感知周圍世界而言,面部識(shí)別可能是人類大腦做的最簡單也是最了不起的事情了。馬薩諸塞州立大學(xué)的計(jì)算機(jī)科學(xué)家埃里克·萊恩德-米勒(Erik Learned-Miller)說道,相比之下,計(jì)算機(jī)識(shí)別人臉時(shí)對(duì)于多個(gè)方面的考慮要困難得多:年齡、姿勢和表情等,這些方面的一些微妙差異都會(huì)干擾計(jì)算機(jī)對(duì)一個(gè)人臉部特征的區(qū)分辨認(rèn)。
所幸的是,如今有了一種名為“深度學(xué)習(xí)”的技術(shù),令計(jì)算機(jī)的人臉識(shí)別能力突飛猛進(jìn)。像所有其他的機(jī)器學(xué)習(xí)技術(shù)一樣,深度學(xué)習(xí)從一組訓(xùn)練數(shù)據(jù)開始,每張臉都做有標(biāo)簽的大規(guī)模數(shù)據(jù)集,最理想的是包括了每個(gè)人多張照片的數(shù)據(jù)庫。萊恩德-米勒幫助建立了一個(gè)人臉數(shù)據(jù)集,名為“戶外臉部檢測數(shù)據(jù)庫(Labeled Faces in the Wild Home,LFW)”,其中包括了從網(wǎng)絡(luò)上收集到的5 749位名人的13 000張面孔圖片,有的人只有幾張,有的人甚至多達(dá)幾十張。這是一個(gè)可以免費(fèi)使用的在線數(shù)據(jù)集,很受專門研究面部識(shí)別算法的計(jì)算機(jī)視覺研究者的歡迎。
對(duì)于計(jì)算機(jī)來說,人的面部只不過是一些或深或淡像素的集合而已,深度學(xué)習(xí)系統(tǒng)的培訓(xùn)首先讓系統(tǒng)自行對(duì)比和發(fā)現(xiàn)臉部特征,例如,眼睛和鼻子的統(tǒng)計(jì)學(xué)特性,這些對(duì)于人類來說,并沒有直觀上的意義?!白寵C(jī)器和數(shù)據(jù)說話好了。”DeepFace首席工程師雅尼夫·泰格曼(Yaniv Taigman)說道。
系統(tǒng)首先將臉部像素分成一些元素的集合,如構(gòu)勒出面部輪廓的邊緣等,然后將一些相同但足以辨別出區(qū)別的臉的元素根據(jù)非直觀的統(tǒng)計(jì)學(xué)的特性進(jìn)行層層分類組合的處理。這就是深度學(xué)習(xí)的“深度”:每個(gè)處理層次的輸入都是其下面一層的輸出,通過這種培訓(xùn),最終結(jié)果是一個(gè)具有代表性的人臉模型,統(tǒng)計(jì)機(jī)器可以將面孔圖像進(jìn)行比較,猜測它們是否屬于同一個(gè)人,系統(tǒng)訓(xùn)練的面孔越多,猜測結(jié)果就越準(zhǔn)確。
DeepFace團(tuán)隊(duì)去年3月在Facebook網(wǎng)站上發(fā)表的一篇論文描述了他們的這個(gè)創(chuàng)意,在機(jī)器視覺社區(qū)引起了很大的反響。人臉識(shí)別的一個(gè)基準(zhǔn)是確定LFW數(shù)據(jù)庫里兩張照片中的臉是否屬于同一個(gè)名人。人類的準(zhǔn)確率約為98%,DeepFace的準(zhǔn)確率為97.35%,比同領(lǐng)域的其他技術(shù)高出27%。
DeepFace的一些優(yōu)勢源自于其更靈巧的編程,例如克服和完善了臉部信息不全的問題,如果照片只顯示了人的側(cè)面,程序利用它可以看到其他一些臉部照片的優(yōu)勢,重建可能的臉部正面圖。這種“對(duì)齊”步驟可以令DeepFace的識(shí)別效率更高,泰格曼說道,“我們可以將系統(tǒng)容量的大部分集中于一些細(xì)微差別上?!?/p>
“這種技術(shù)在單核計(jì)算機(jī)上運(yùn)行只需要幾分之一秒?!碧└衤f。因此,DeepFace可以有效地運(yùn)用于智能手機(jī)上。原則上,一個(gè)拇指驅(qū)動(dòng)器就足以裝下一個(gè)10億人的面部照片識(shí)別數(shù)據(jù)庫。
但是DeepFace最大的優(yōu)勢是其訓(xùn)練數(shù)據(jù)。DeepFace論文中提到一個(gè)“社會(huì)面孔分類(SFC)”數(shù)據(jù)集,里面包括了從Facebook頁面上收集到的4 030個(gè)用戶的440萬張有標(biāo)簽的臉部照片。Facebook允許注冊(cè)用戶使用他們的個(gè)人資料庫,但論文卻未提到要得到照片主人的同意。
“這聽起來令人毛骨悚然,太可怕了。”在DeepFace現(xiàn)身一周后,發(fā)表在《赫芬頓郵報(bào)》的一篇文章如此形容道?!逗辗翌D郵報(bào)》的一位讀者在評(píng)論中寫道,“很顯然,警察和其他執(zhí)法部門將使用這種技術(shù),在我們根本沒有意識(shí)到情況下搜索我們的照片?!盕acebook承認(rèn),在法庭傳票責(zé)令下,確實(shí)為執(zhí)法部門提供了訪問用戶數(shù)據(jù)的權(quán)限。
“人們都非常害怕,”萊恩德-米勒說,但他認(rèn)為,這種擔(dān)心是多余的,“像Facebook這樣的公司,如果真的越過了社會(huì)規(guī)則能夠接受的界限……他們可能將面臨倒閉。如果他們觸犯了法律,那么他們會(huì)被勒令關(guān)閉,涉案人員將可能被逮捕?!彼J(rèn)為,人們的疑慮源自于缺乏透明度。
學(xué)術(shù)研究者要使用隱私數(shù)據(jù)進(jìn)行研究,必須得到明確的同意,那些在Facebook上點(diǎn)擊“同意”簽署帶有一些附加條件的許可協(xié)議(EULA)的用戶授予公司許可使用他們的數(shù)據(jù),這樣的在線合同“是完全違背透明度原則的,”萊恩德-米勒說道,“沒有人真正知道他們?cè)L問數(shù)據(jù)的權(quán)限有多大。”去年,該公司推出了一個(gè)尋找恐龍的卡通圖片,會(huì)不時(shí)在屏幕上彈出來,提醒用戶注意他們的隱私設(shè)置。
個(gè)人隱私數(shù)據(jù)已形成了一個(gè)繁榮的交易市場,其中一些是合法的,其他是不合法的,面部身份識(shí)別將成為另一種熱門商品,梅尼克預(yù)測道。例如,面部身份識(shí)別可以讓廣告商在有攝像頭的地方追蹤你的購物行為,迎合你對(duì)商品的喜好,甚至根據(jù)了解到的你的購物習(xí)慣或人口統(tǒng)計(jì)學(xué)特征的數(shù)據(jù),提供不同的價(jià)格標(biāo)準(zhǔn)。但“真正令人們不安的是,”梅尼克指出,“是大街上的一些陌生人,他們隨時(shí)可以在人群中將你認(rèn)出來……無處不在的面部識(shí)別讓你避無可避?!?/p>
美國的一家公司FacialNetwork利用其深度學(xué)習(xí)系統(tǒng),開發(fā)了一款名為“名簽”的應(yīng)用軟件,通過智能手機(jī)或像“谷歌眼鏡”這樣的可穿戴設(shè)備,“名簽”不僅能夠透露某個(gè)人的姓名,還有其他更多的個(gè)人隱私,如來自社交媒體、交友網(wǎng)站和犯罪數(shù)據(jù)庫等的信息。Facebook很快丑聞纏身,它給Facial-Network發(fā)出停止和阻止收集用戶信息的命令?!拔覀儾惶峁┻@種信息給其他公司,未來也沒有任何這樣的打算?!盕acebook通過電子郵件告訴《科學(xué)》雜志道。
面部識(shí)別技術(shù)潛在的商業(yè)應(yīng)用將有可能制造出更多的“麻煩”來,萊恩德-米勒說,但他更擔(dān)心的是政府可能會(huì)濫用這項(xiàng)技術(shù)。萊恩德-米勒說道,“我100%贊成斯諾登的觀點(diǎn)?!彼傅氖乔皣野踩殖邪趟怪Z登于2013年透露的美國政府大規(guī)模監(jiān)測美國公民電子郵件和電話記錄的事件,對(duì)此“我們必須保持警惕。”他說。
萊恩德-米勒語出驚人,他的分級(jí)面部識(shí)別研究項(xiàng)目是由美國情報(bào)高級(jí)研究項(xiàng)目署部分投資的,也許正因?yàn)榇?,我們有更多的理由認(rèn)真思考一下他的警告。
[資料來源:Science][責(zé)任編輯:彥隱]