文|本刊記者 姜紅德
在浩瀚的大海中,機(jī)器人塔斯趕在海嘯之前營(yíng)救了由安妮海瑟薇主演的女主角,這個(gè)看起來(lái)像個(gè)冰箱的家伙不僅能聽(tīng)懂人類(lèi)的語(yǔ)音命令,還能識(shí)別被救的對(duì)象,也能隨機(jī)改變自己的外形,以加快速度逃避海嘯的襲擊。
《星際穿越》成功地再次把人工智能(AI)搬到了熒幕,但是在現(xiàn)實(shí)生活中,人工智能和實(shí)際科學(xué)水平還差的很遠(yuǎn)。近年來(lái)在越來(lái)越多的互聯(lián)網(wǎng)公司的參與下,更多的人工智能研究和應(yīng)用被開(kāi)發(fā)出來(lái),讓機(jī)器來(lái)模擬人腦的運(yùn)作原理來(lái)識(shí)別圖片、辨別聲音和視頻等,應(yīng)該不是一件難事。
在現(xiàn)實(shí)中,機(jī)器人或其它人工智能能否識(shí)別一個(gè)障礙物或者某個(gè)具體的物品,并不像科幻電影中那么簡(jiǎn)單。舉例來(lái)說(shuō),從機(jī)器人的眼中來(lái)看一個(gè)杯子,也許只是一個(gè)圓柱體,這樣的圓柱體有很多,比如瓶子、盒子等多種容器,怎么能判定它是一個(gè)杯子,這就需要通過(guò)神經(jīng)網(wǎng)絡(luò)及深度學(xué)習(xí)來(lái)完成,這一技術(shù)目前在互聯(lián)網(wǎng)行業(yè)中非常熱門(mén)。
通常來(lái)說(shuō),通過(guò)神經(jīng)網(wǎng)絡(luò)機(jī)器能夠模仿人腦的工作來(lái)進(jìn)行各種活動(dòng),之所以能夠做到這一點(diǎn)主要是通過(guò)以下步驟來(lái)完成:把某一物品或動(dòng)作分解成上萬(wàn)億的不同參量,然后通過(guò)自主學(xué)習(xí),把這些不同的零碎化的參量重新組合到一起。
拿人臉識(shí)別來(lái)說(shuō),目前根據(jù)不同的原理在科學(xué)界及企業(yè)界誕生了不同的流派,有專(zhuān)門(mén)研究面部表情的高級(jí)語(yǔ)義信息,也有采用軟硬件結(jié)合的方法,通過(guò)紅外線(xiàn)掃描輔助人臉特征掃描來(lái)進(jìn)行人臉識(shí)別,但是這些和通過(guò)神經(jīng)網(wǎng)絡(luò)來(lái)識(shí)別人臉的技術(shù)還是天壤之別。
以深度學(xué)習(xí)為基礎(chǔ)的人臉識(shí)別技術(shù)背后有一整套的復(fù)雜技術(shù)支撐,而完成識(shí)別需要完成三部曲來(lái)完成:首先是人臉檢測(cè),在鏡頭中確定人臉在哪里?其次是關(guān)鍵點(diǎn)檢測(cè)。在上一步的基礎(chǔ)上找準(zhǔn)眼眉、耳鼻等臉部輪廓的關(guān)鍵點(diǎn);最后基于大數(shù)據(jù)的人臉識(shí)別,弄清楚“這是誰(shuí)”?
針對(duì)這三部曲,國(guó)際上有一套公認(rèn)的評(píng)測(cè)體系:FDDB評(píng)測(cè)、300-W評(píng)測(cè)和人臉識(shí)別LFW評(píng)測(cè)。在剛剛過(guò)去的2014年,人臉識(shí)別領(lǐng)域不斷推陳出新,新的技術(shù)開(kāi)發(fā)和應(yīng)用也不斷涌現(xiàn)。在國(guó)內(nèi)成立僅兩年的創(chuàng)業(yè)團(tuán)隊(duì)曠視科技在國(guó)際公認(rèn)的人臉識(shí)別LFW評(píng)測(cè)中,以0.02%的優(yōu)勢(shì)擊敗了社交巨頭Facebook摘得桂冠,而在剛剛過(guò)去的六個(gè)月內(nèi),他們已經(jīng)接連拿下分別針對(duì)這三項(xiàng)評(píng)測(cè)的國(guó)際冠軍。
據(jù)曠視科技負(fù)責(zé)人印奇介紹,公司由三個(gè)“85”后的清華學(xué)生創(chuàng)建,一直專(zhuān)注于人臉識(shí)別領(lǐng)域的應(yīng)用開(kāi)發(fā)和平臺(tái)服務(wù)。目前公司核心團(tuán)隊(duì)由清華大學(xué)、美國(guó)哥倫比亞大學(xué)、南洋理工大學(xué)等頂級(jí)技術(shù)極客組成的研發(fā)團(tuán)隊(duì),從既有的互聯(lián)網(wǎng)合作基礎(chǔ)出發(fā)(目前已與奇虎360、美圖秀秀、支付寶、Lenovo、阿里云等多家互聯(lián)網(wǎng)公司合作)進(jìn)而跨入安防領(lǐng)域,未來(lái)更好地服務(wù)金融、零售等傳統(tǒng)商業(yè)領(lǐng)域。
以美圖秀秀為例,F(xiàn)ace++為他們的App提供諸如:人臉檢測(cè)、人臉追蹤、關(guān)鍵點(diǎn)檢測(cè)技術(shù),可精準(zhǔn)定位人臉中需要美化的位置,實(shí)現(xiàn)精準(zhǔn)自動(dòng)人臉美化,但這些僅是人臉識(shí)別的初級(jí)階段。而在和世紀(jì)佳緣的合作中,用戶(hù)可根據(jù)自己對(duì)另一半長(zhǎng)相的需求去搜索相似外貌的用戶(hù),當(dāng)然這個(gè)搜索需要在數(shù)據(jù)庫(kù)中進(jìn)行,既可以是世紀(jì)佳緣的數(shù)據(jù)庫(kù)、也可以是社交網(wǎng)絡(luò)上的數(shù)據(jù)庫(kù)、更可以是在通用搜索引擎中。
“以圖搜圖”的功能自從被百度拿來(lái)“作秀”了一次之后,很快在網(wǎng)絡(luò)上形成了關(guān)注,找到更好的噱頭無(wú)疑正是一些互聯(lián)網(wǎng)企業(yè)想要做的事情。Face++也與360搜索達(dá)成了合作,在360的圖片搜索中使用到相關(guān)的技術(shù),不過(guò)目前還沒(méi)看到360搜索推出“以圖搜圖”的類(lèi)似功能。
據(jù)了解,F(xiàn)ace++的創(chuàng)始團(tuán)隊(duì)還曾獲黑馬大賽的總冠軍,并在2012年獲得聯(lián)想之星的天使投資,2013年初又獲得創(chuàng)新工場(chǎng)的A輪融資,融資規(guī)模約為百萬(wàn)美元,2014年他們宣布再次獲得2000萬(wàn)美元以上的B輪融資。在這背后,人臉識(shí)別及更加廣闊的圖像、視頻等市場(chǎng)越來(lái)越受到重視。
在越來(lái)越多的日常場(chǎng)景中,我們看到了人臉識(shí)別技術(shù)的應(yīng)用。以今年元旦開(kāi)業(yè)的深圳微眾銀行為例,作為國(guó)內(nèi)首家互聯(lián)網(wǎng)銀行,其對(duì)外宣傳的重要口號(hào)就是:“人臉識(shí)別技術(shù)加上大數(shù)據(jù)挖掘可以作為企業(yè)或個(gè)人獲得貸款的重要依據(jù)。” 不管結(jié)果是不是真的如此,都表明我們通常開(kāi)玩笑所說(shuō)的“刷臉”已進(jìn)入了行業(yè)應(yīng)用。
1月6日,在北京郵電大學(xué)舉辦的第五屆中國(guó)智慧城市大會(huì)上,曠視科技負(fù)責(zé)人宣布推出Face++系列產(chǎn)品“Face++Security ”,記者現(xiàn)場(chǎng)也被邀請(qǐng)做了一次體驗(yàn)。據(jù)了解這款產(chǎn)品具備人臉識(shí)別功能,以智慧城市為目標(biāo)市場(chǎng),讓搭載該技術(shù)的智能設(shè)備,能夠更好的感知真實(shí)的物理世界。
在智慧城市安防領(lǐng)域,人臉識(shí)別技術(shù)具有很大的市場(chǎng)需求。比如在海防及公安領(lǐng)域,執(zhí)法人員會(huì)讓被查人員出示身份證并讀取身份證信息,然后通過(guò)攝像機(jī)拍攝被查人員,再進(jìn)行照片與讀出來(lái)的身份證照片做驗(yàn)證,同樣更可以用于在人員集中場(chǎng)所通過(guò)Face++Security技術(shù)實(shí)時(shí)抓取并匹配識(shí)別公安部門(mén)公開(kāi)的危險(xiǎn)人員;該技術(shù)適應(yīng)了安防領(lǐng)域最基礎(chǔ)的兩個(gè)需求——驗(yàn)證身份與比對(duì)危險(xiǎn)人員。
曠視科技安防事業(yè)部總經(jīng)理趙軍表示,當(dāng)智慧安防和智慧交通在不斷完善公共安全綜合管理的物聯(lián)網(wǎng)平臺(tái)時(shí),需要視頻監(jiān)控設(shè)備不僅僅能“看的見(jiàn)還要識(shí)得對(duì)",視頻監(jiān)控系統(tǒng)中海量視頻數(shù)據(jù)如何深度應(yīng)用具有巨大的挑戰(zhàn),無(wú)論視頻采集、管理還是應(yīng)用,未來(lái)都將通過(guò)智能的人臉識(shí)別技術(shù)獲得廣泛應(yīng)用。
對(duì)于智能硬件來(lái)說(shuō),有了人臉識(shí)別技術(shù),就相當(dāng)于機(jī)器人能夠認(rèn)識(shí)人,不僅增加了人機(jī)交互的方式,更讓硬件變得更加智能。隨著技術(shù)的進(jìn)一步成熟和社會(huì)認(rèn)同度的提高,人臉識(shí)別技術(shù)將應(yīng)用在更多的安防領(lǐng)域,它不但可以提高社會(huì)運(yùn)行的效率,也可以大大增強(qiáng)公民日常生活的安全性。
越來(lái)越多的互聯(lián)網(wǎng)企業(yè)已經(jīng)開(kāi)始提前在人臉識(shí)別這一領(lǐng)域布局,包括百度、谷歌、Facebook等企業(yè)也都開(kāi)始小試牛刀,更多的投資者也開(kāi)始下注。
據(jù)悉,百度在人臉?biāo)阉黝I(lǐng)域早有布局,有消息人士稱(chēng),該研發(fā)團(tuán)隊(duì)現(xiàn)在硅谷就緒。在此前火爆過(guò)一段時(shí)間的軟件“百度魔圖”中,“PK大咖”的功能就使用到了“以人臉?biāo)阉魅四槨边@樣的人臉識(shí)別技術(shù)。除了上述提到的百度、奇虎360等國(guó)內(nèi)互聯(lián)網(wǎng)公司(主要是搜索領(lǐng)域)在人臉識(shí)別的布局,國(guó)外各大科技公司也都在人臉識(shí)別領(lǐng)域作了儲(chǔ)備。
在社交網(wǎng)絡(luò)領(lǐng)域,2012年6月,F(xiàn)acebook以六千萬(wàn)美元全資收購(gòu)以色列臉部識(shí)別技術(shù)公司Face.com,試圖實(shí)現(xiàn)不用標(biāo)注就能自動(dòng)識(shí)別照片中的人物,幫助用戶(hù)分類(lèi)。但令人遺憾的是,在被收購(gòu)后,F(xiàn)ace.com關(guān)閉了其面部識(shí)別API,切斷了對(duì)開(kāi)發(fā)者的接口支持。
與國(guó)內(nèi)外市場(chǎng)中其它主流的人臉識(shí)別技術(shù)提供商相比,曠視科技最大的不同就在于從一開(kāi)始就把自己定位成一家互聯(lián)網(wǎng)公司。在此之前,F(xiàn)ace++平臺(tái)允許廣大的開(kāi)發(fā)者們?cè)谝?guī)定的調(diào)用量之下免費(fèi)使用API,但在超過(guò)配額后開(kāi)發(fā)者必須支付相應(yīng)的費(fèi)用。Face++平臺(tái)的服務(wù)器在國(guó)內(nèi)架設(shè)于阿里云,在海外則另將服務(wù)器架設(shè)在亞馬遜公司的云服務(wù)中,這兩大輸出端口都需要曠視科技公司支付日常使用費(fèi)用。
但很快,團(tuán)隊(duì)發(fā)現(xiàn)他們向開(kāi)發(fā)者收費(fèi)并不利于人臉識(shí)別技術(shù)的推廣,而且同為創(chuàng)業(yè)公司,他們也最能理解創(chuàng)業(yè)初期遭遇的盈利難困局。因此團(tuán)隊(duì)最終決定不再限制開(kāi)發(fā)者對(duì)人臉識(shí)別技術(shù)API的調(diào)用請(qǐng)求,而免費(fèi)也標(biāo)志著曠視科技正式完成向互聯(lián)網(wǎng)公司的完全過(guò)渡。
截至目前,F(xiàn)ace++平臺(tái)已經(jīng)收到超過(guò)兩萬(wàn)名開(kāi)發(fā)者的調(diào)用請(qǐng)求,API累計(jì)調(diào)用次數(shù)則超過(guò)了2億次。這其中不乏一些知名產(chǎn)品和他們建立緊密的合作關(guān)系,譬如奇虎360搜索界面中的“識(shí)別美女”功能,美圖秀秀和美顏相機(jī)的人臉器官定位功能,還有世紀(jì)佳緣根據(jù)審美標(biāo)準(zhǔn)尋找近似的伴侶功能,都是基于Face++人臉識(shí)別技術(shù)開(kāi)發(fā)出來(lái)的。團(tuán)隊(duì)預(yù)期,越來(lái)越多基于人臉識(shí)別技術(shù)的創(chuàng)新應(yīng)用還會(huì)不斷顯現(xiàn)。