□ 文/本刊記者 何遙
相比以往的人臉識(shí)別,深度學(xué)習(xí)算法推動(dòng)的人臉識(shí)別發(fā)生了巨大變化:準(zhǔn)確率更高,環(huán)境適應(yīng)性更強(qiáng),識(shí)別種類更豐富。包括人臉識(shí)別技術(shù)在內(nèi)的生物識(shí)別技術(shù)的進(jìn)步,結(jié)合紅外光、可見光技術(shù),推動(dòng)主動(dòng)安防時(shí)代的到來。本期欄目邀請(qǐng)到生物識(shí)別領(lǐng)域的幾位專家,共同探討這一主題。
本期嘉賓:
北京智慧眼科技股份有限公司董事長 邱建華
廣州像素?cái)?shù)據(jù)技術(shù)股份有限公司董事長 姚若光
深圳市威富安防有限公司算法工程師 梁先揚(yáng)
人工智能中深度學(xué)習(xí)算法的突破,使得生物識(shí)別技術(shù)極大地提高了識(shí)別率。反過來,多年積累起的海量數(shù)據(jù),為深度學(xué)習(xí)訓(xùn)練提供了燃料。公共安全中的人臉識(shí)別產(chǎn)品與應(yīng)用迎來一個(gè)新的發(fā)展期。
邱建華:智慧眼人臉識(shí)別技術(shù)采用先進(jìn)的計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)技術(shù),對(duì)輸入的圖像/視頻進(jìn)行分析,找到圖像/視頻中存在的人臉,并在器官特征點(diǎn)定位的基礎(chǔ)上,對(duì)人臉進(jìn)行幾何和光照歸一化,進(jìn)而提取人臉的鑒別特征,并將其與已知人臉進(jìn)行對(duì)比,從而識(shí)別每個(gè)人的身份。
基于千萬級(jí)人臉圖片大數(shù)據(jù)深度學(xué)習(xí)的智慧眼人臉識(shí)別算法、活體檢測算法在業(yè)內(nèi)POC測試中位列前三,已獲得國家專利,現(xiàn)已廣泛應(yīng)用于人社、金融、教育、安防、衛(wèi)生等領(lǐng)域,為1億用戶提供身份認(rèn)證服務(wù)。
邱建華
姚若光
梁先揚(yáng)
智能終端——人證合一智能終端。人證合一實(shí)名制已成為我國公民在辦理很多業(yè)務(wù)時(shí)的硬性要求。智慧眼開發(fā)出來的人證核驗(yàn)設(shè)備品類豐富、應(yīng)用廣泛。設(shè)備主要包括桌面式人證合一設(shè)備、手持式警務(wù)通設(shè)備、單雙屏人證核驗(yàn)訪客機(jī)及高端的智能閘機(jī)終端。每一類設(shè)備都針對(duì)特定場合開發(fā),目前在網(wǎng)吧、酒店、寫字樓、政府部門、治安卡口、邊防檢查站等場合都有廣泛應(yīng)用。
靜脈識(shí)別——指靜脈識(shí)別。智慧眼指靜脈識(shí)別算法在2015/2016/2017全球指靜脈挑戰(zhàn)賽上連續(xù)三次奪得冠軍,無論是識(shí)別精度還是識(shí)別速度都處于行業(yè)領(lǐng)先地位。安博會(huì)上智慧眼展出了基于指靜脈技術(shù)開發(fā)出來的指靜脈智能門鎖、指靜脈考勤門禁終端、指靜脈采集儀以及備受關(guān)注的指靜脈精密模塊。以便有項(xiàng)目需求的客戶可以在現(xiàn)場找到適合自己的指靜脈產(chǎn)品;有指靜脈產(chǎn)品開發(fā)需求的客戶則可以選擇到多款適合的指靜脈精密模塊。
身份認(rèn)證——人臉識(shí)別超大規(guī)模應(yīng)用。智慧眼在今年的深圳安博會(huì)上展示了在身份認(rèn)證大數(shù)據(jù)方面的成果,尤其是在全國社保身份認(rèn)證方面。智慧眼的身份認(rèn)證業(yè)務(wù)目前已服務(wù)超過2億人,協(xié)助人社部門完成近7億生物特征庫的建設(shè),是目前國內(nèi)最大規(guī)模的人臉識(shí)別應(yīng)用;同時(shí),智慧眼也展示了另外一個(gè)榮獲國家發(fā)改委互聯(lián)網(wǎng)+重大工程支持項(xiàng)目——老來網(wǎng),這是全國為數(shù)不多的官方認(rèn)證的第三方身份認(rèn)證機(jī)構(gòu),是智慧眼借助人社業(yè)務(wù)優(yōu)勢,借助互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、大數(shù)據(jù)技術(shù)優(yōu)勢,傾力打造的老年人社會(huì)化服務(wù)云平臺(tái)。
梁先揚(yáng):智能視頻分析的瓶頸:智能視頻分析依賴于高清視頻、大數(shù)據(jù)及高性能服務(wù)器。首先是更新?lián)Q代相對(duì)滯后:在一線城市深圳仍有不少攝像機(jī)分辨率在1080p以下,甚至還有模擬攝像機(jī)。其他二三線城市更加滯后。其次是聯(lián)網(wǎng)管理不夠集中統(tǒng)一,形成信息孤島:工業(yè)園、商場、小區(qū)的監(jiān)控自成一體,與公安市政道路監(jiān)控?zé)o法共享信息,存在漏洞。再次還有成本問題:架設(shè)光纖、更換高清攝像機(jī)、配置智能分析服務(wù)器成本相對(duì)較高,存在小區(qū)業(yè)主不愿分擔(dān)升級(jí)費(fèi)用,基層派出所建設(shè)經(jīng)費(fèi)有限等問題。需自上而下建設(shè)推廣。
智能視頻分析的機(jī)遇:國家基于長治久安、和諧發(fā)展對(duì)智慧平安城市建設(shè)的重視:習(xí)近平總書記在十九大報(bào)告指出建設(shè)平安中國,加強(qiáng)和創(chuàng)新社會(huì)治理,維護(hù)社會(huì)和諧穩(wěn)定,確保國家長治久安,人民安居樂業(yè)。
隨著社會(huì)各界對(duì)智能視頻分析,特別是人臉識(shí)別技術(shù)認(rèn)識(shí)的加深,人臉考勤門禁、人臉鎖、刷臉支付、無人超市、無人餐廳越來越普遍。
硬件的快速發(fā)展,GPU運(yùn)算能力提升,成本下降。英偉達(dá)陸續(xù)推出嵌入式GPU TX1、TX2,谷歌、蘋果、三星、英特爾、ARM等公司也在研發(fā)GPU芯片。這為人臉識(shí)別提供了技術(shù)基礎(chǔ)。
人臉識(shí)別,是基于人的臉部特征信息進(jìn)行身份識(shí)別的一種生物識(shí)別技術(shù)。用攝像機(jī)或攝像頭采集含有人臉的圖像或視頻流,并自動(dòng)在圖像中檢測和跟蹤人臉,進(jìn)而對(duì)檢測到的人臉進(jìn)行臉部的一系列相關(guān)技術(shù),通常也叫做人像識(shí)別、面部識(shí)別。與其他生物識(shí)別技術(shù)(如指紋、虹膜、掌紋等)相比,優(yōu)勢在于其自然性和不被人察覺的特點(diǎn)。
姚若光:像素?cái)?shù)據(jù)自1998年成立以來,一直專注于人像采集檢測、人臉識(shí)別技術(shù)的研究,形成了完善的人臉識(shí)別產(chǎn)品體系及應(yīng)用典范,逐步成為行業(yè)標(biāo)準(zhǔn)制定者,主編及參與了近十項(xiàng)行業(yè)標(biāo)準(zhǔn)的制定。主要針對(duì)已發(fā)布或即將發(fā)布的人臉識(shí)別技術(shù)相關(guān)的標(biāo)準(zhǔn)闡述了我司各類人臉識(shí)別產(chǎn)品及應(yīng)用在貫徹安防標(biāo)準(zhǔn)方面取得的研究成果,從研究的底層出發(fā)得出:基于規(guī)范、標(biāo)準(zhǔn)化的人臉圖像采集、準(zhǔn)確的人臉圖像檢測和提取、好的人臉比對(duì)算法、成就良好的人臉識(shí)別體驗(yàn)。
談人臉識(shí)別,首先有一些基礎(chǔ)的技術(shù)特點(diǎn)。
構(gòu)成人臉識(shí)別的5步:抓取圖像;在圖像中找到臉;提取特征(建模板);比較模板;宣布比對(duì)結(jié)果。人像采集與檢測產(chǎn)品及其關(guān)鍵點(diǎn)的源頭在采集,好圖像時(shí)拍出來的,不是修出來的。人臉圖像處理的四個(gè)屬性:圖像屬性;位置屬性;臉部屬性;背景屬性。處理要求:提倡全局處理;反對(duì)局部處理;慎用銳化或美化工具:過渡處理會(huì)改變?nèi)四槇D像的紋理結(jié)構(gòu)。背景處理的關(guān)鍵在于邊緣處理,特別是頭發(fā)和臉和服飾的邊緣。
人臉辨認(rèn)方面,我們推出了自助庫—多算法。多算法平臺(tái)除了算法有針對(duì)性,還有針對(duì)性地建立了各種案件庫。如電白、廉江、湖南邵陽等犯案集中地區(qū)的案件庫,為各警種辦案提供了有力的比對(duì)工具。該項(xiàng)目運(yùn)行以來,得到了各警種的好評(píng),在實(shí)戰(zhàn)中也出了較好的成效,特別是在占案例大頭的經(jīng)濟(jì)詐騙案、信用卡詐騙案中有較為突出的效果。
視頻人臉識(shí)別涉及到算法的選擇、攝像機(jī)及鏡頭選擇與架設(shè)。視頻人臉識(shí)別方面我們有一系列的產(chǎn)品方案:
(1)動(dòng)態(tài)人臉識(shí)別監(jiān)控分析系統(tǒng):
對(duì)監(jiān)獄、機(jī)場、港口、銀行;交通、運(yùn)輸;商場、大型超市;金融VIP等重要地點(diǎn)進(jìn)行的機(jī)動(dòng)布控。
(2)海量錄像人臉分析系統(tǒng):
支持多路錄像同時(shí)進(jìn)行人臉分析,單個(gè)主流服務(wù)器可支持32路以上人臉采集,8路以上人臉識(shí)別分析,具備強(qiáng)大的擴(kuò)展性(具體的支持路數(shù)由服務(wù)器性能決定)。
(3)人臉識(shí)別安防機(jī)器人:
在機(jī)場、港口、會(huì)場、展館、機(jī)場、火車站、汽車站等巡邏布控,在高端小區(qū)和工業(yè)園區(qū)等日常巡邏、警戒和布控。
(4)網(wǎng)格化中心布控(centralized deployment):
我們已成功實(shí)施了廣東某火車站人臉識(shí)別布控項(xiàng)目,某地鐵站人像抓拍識(shí)別租賃項(xiàng)目,某公安布控區(qū)域布控項(xiàng)目,某大型公園人臉識(shí)別布控項(xiàng)目,等等。
(5)基于人臉的人員軌跡分析—去中心化布控。
(6)訪客/迎賓機(jī)。
從技術(shù)上而言,規(guī)范的人臉圖像采集、準(zhǔn)確的人臉圖像檢測和提取,加上好的人臉比對(duì)算法,成就良好的人臉識(shí)別體驗(yàn)。
深度學(xué)習(xí)、紅外光結(jié)構(gòu)化等技術(shù)融合發(fā)展,讓安防更智能、更適應(yīng)各種不同場景。需要人工查找分析的傳統(tǒng)安防時(shí)代正在褪卻,取而代之的是一個(gè)主動(dòng)安防的時(shí)代。“人工智能+軟硬件一體化”成為趨勢。
梁先揚(yáng):人臉識(shí)別的發(fā)展必然會(huì)經(jīng)歷兩個(gè)時(shí)代:(1)模型驅(qū)動(dòng)時(shí)代,重在研究各種復(fù)雜的數(shù)學(xué)模型,利用有限的樣本進(jìn)行學(xué)習(xí),模型的好壞直接決定識(shí)別效果,局限性較大,泛化能力較弱;(2)數(shù)據(jù)驅(qū)動(dòng)時(shí)代,直接基于人工神經(jīng)網(wǎng)絡(luò)的模型,利用大數(shù)據(jù)進(jìn)行深度學(xué)習(xí),數(shù)據(jù)的重要性超過了模型本身,具有很強(qiáng)的泛化能力。
這兩種驅(qū)動(dòng)具有不同的研究范式。
模型驅(qū)動(dòng):
數(shù)據(jù)驅(qū)動(dòng):
模型驅(qū)動(dòng)VS數(shù)據(jù)驅(qū)動(dòng)
人工神經(jīng)網(wǎng)絡(luò)(ANN)系統(tǒng)是20世紀(jì)40年代后出現(xiàn)。1990年起,王守覺院士開始神經(jīng)網(wǎng)絡(luò)模式識(shí)別新理論新技術(shù)的研究,2002年取得突破性進(jìn)展,提出了“高維形象幾何仿生信息學(xué)”新理論。該理論不斷豐富和完善,獲得了13位院士極高評(píng)價(jià)和聯(lián)名推薦。
威富安防人臉識(shí)別技術(shù)創(chuàng)造了超低數(shù)據(jù)量人臉識(shí)別技術(shù) ,全球首創(chuàng)且唯一,將人臉特征有效表達(dá)為48字節(jié),存儲(chǔ)超低、傳輸更快、比對(duì)更快、準(zhǔn)確率高,可實(shí)現(xiàn)超小載體存儲(chǔ)、超大范圍應(yīng)用。
這種人臉識(shí)別技術(shù)采用高維形象幾何仿生信息學(xué)算法突破了環(huán)境的局限。在環(huán)境采集方面,新技術(shù)在動(dòng)態(tài)識(shí)別的過程中可以逐步將人的表情、姿態(tài)、光線、遮擋等干擾信息進(jìn)行排除,得到一張更準(zhǔn)確表現(xiàn)個(gè)人信息的照片,從而提升比對(duì)的成功率。
對(duì)于人臉化妝、遮擋,新技術(shù)在提取人臉特征的時(shí)候,并不是基于每一個(gè)點(diǎn)的精確匹配,而是將人臉分成不同區(qū)域?qū)ζ涮卣鬟M(jìn)行計(jì)算,因此小范圍局部遮擋(戴眼鏡或口罩)將不作為比對(duì)的內(nèi)容,而是選擇匹配最高的區(qū)域進(jìn)行綜合比對(duì),所以對(duì)比對(duì)效果不會(huì)產(chǎn)生太大影響。
對(duì)應(yīng)于兩種驅(qū)動(dòng)模式,安防的兩個(gè)時(shí)代分別是被動(dòng)安防與主動(dòng)安防。
(1)被動(dòng)安防:人眼“觀看監(jiān)控器20分鐘,人的集中力及判斷力將會(huì)下降”;人眼“觀看監(jiān)控器30分鐘以上,將會(huì)放棄畫面變動(dòng)的80%以上”;事后查看錄像回放,時(shí)效性差,無法對(duì)各種犯罪活動(dòng)形成有力打擊;人工無法完成大量的實(shí)時(shí)監(jiān)控,即使是細(xì)心的注意力集中的監(jiān)控人員,也不能有效完成監(jiān)控任務(wù)。
(2)主動(dòng)安防:機(jī)器自動(dòng)實(shí)時(shí)進(jìn)行大數(shù)據(jù)分析,自動(dòng)跟黑名單進(jìn)行人臉比對(duì),7*24小時(shí)不間斷;實(shí)現(xiàn)低投入產(chǎn)生高效率,使視頻監(jiān)控網(wǎng)絡(luò)系統(tǒng)真正成為“火眼金睛”,向科技要警力,使現(xiàn)有的警力提高20倍以上;變事后分析為事前預(yù)警,變被動(dòng)安防為主動(dòng)安防,極大提高犯罪威懾力。
人臉識(shí)別技術(shù)的發(fā)展開啟了主動(dòng)安防時(shí)代!
姚若光:傳統(tǒng)的人臉識(shí)別發(fā)展走過了一條漫長的路。最終達(dá)到的水平是在正臉、光照均勻、無遮擋、兩眼像素60pixels圖像的情況下95%@with FAT@2‰左右(FRVT 2013);用戶的總體體驗(yàn)是對(duì)圖像的要求比較高,需要用戶高度配合,應(yīng)用面比較窄。
AI使人臉識(shí)別一步踏入用戶可接受的門檻。開源的AI算法訓(xùn)練平臺(tái):通過適當(dāng)?shù)臄?shù)據(jù)訓(xùn)練,可達(dá)到應(yīng)用要求,現(xiàn)在的競爭是在萬、十萬、百萬之一錯(cuò)誤識(shí)別率下的正確識(shí)別率/錯(cuò)誤拒絕率,互聯(lián)網(wǎng)存在的海量人臉圖像,對(duì)光照、姿態(tài)、兩眼像素、年齡、圖像清晰度等要求明顯降低,人們可以不再糾結(jié)選什么算法(視頻人臉識(shí)別對(duì)算法的要求仍是首位的)。
未來的人臉識(shí)別一定是 AI+軟件+硬件,這一點(diǎn)從今年的Google Home 發(fā)布會(huì)就可以充分看出來。