□ 文/本刊記者 何遙
人工智能的發(fā)展應(yīng)用
□ 文/本刊記者 何遙
回顧2016年的安防行業(yè),人工智能是無論如何都無法回避的話題。這一年可謂人工智能元年,阿爾法狗大戰(zhàn)李世石,全面引爆了人們對人工智能的關(guān)注。2017年初,在阿爾法狗基礎(chǔ)上改進的Master戰(zhàn)勝了數(shù)十位世界級選手,已遠(yuǎn)超最強大的人類棋手的認(rèn)知。這對安防行業(yè)的影響也是深遠(yuǎn)非凡。本期欄目邀請到幾位業(yè)界專業(yè)人士,共同探討人工智能技術(shù)與應(yīng)用的話題。
以深度學(xué)習(xí)和卷積神經(jīng)網(wǎng)絡(luò)為主要特點的人工智能洶涌而來,企業(yè)圍繞人工智能推出了各自的戰(zhàn)略。從底層技術(shù)、架構(gòu)以及應(yīng)用等角度看,不同的企業(yè)各有側(cè)重。
機器視覺
柳鋼:機器視覺做到識人知物,機器視覺在行業(yè)里存在的先決條件,是機器在某些特定領(lǐng)域里面超越了人的能力,這樣才能為人所用。關(guān)于垂直領(lǐng)域應(yīng)用,首先,我們以機器視覺為例,這個技術(shù)能夠在行業(yè)中快速應(yīng)用,正是說明了某些領(lǐng)域里面機器做得比人好。商湯在機器視覺領(lǐng)域,團隊成員第一次將機器識別準(zhǔn)確率超過了人眼,為技術(shù)高速發(fā)展的行業(yè)應(yīng)用奠定了基礎(chǔ)。
第二,當(dāng)我們有了技術(shù)的支撐點之后,在平安社區(qū),智慧城市,綜合布控等領(lǐng)域的解決方案中,根據(jù)實際應(yīng)用的需求進行開發(fā),這樣從技術(shù)上最高點到商業(yè)最高點差距就很小。
第三,商湯科技本身的優(yōu)越性主要體現(xiàn)在合作伙伴的培養(yǎng)和發(fā)展。商湯科技專注于產(chǎn)業(yè)鏈里垂直的部分,做最擅長的部分,不是說產(chǎn)業(yè)鏈里每一個項目每一個事情都是商湯來做。在技術(shù)領(lǐng)域,我們所做的方案是符合行業(yè)需要的,在終端用戶部署推廣的時候,注重客戶的培養(yǎng),所以具備了快速推廣的基礎(chǔ)。
吳堯:機器視覺實際上是做圖片處理的,而且是以黑白為主;它是自動化的,可以做量測、檢測、識別、定位,這是機器視覺的四個標(biāo)準(zhǔn)應(yīng)用;而安防是視頻,這四個應(yīng)用都可以做,我們在這四種應(yīng)用上都有自己的產(chǎn)品,并配合自己的算法和軟件。
柳鋼
機器視覺四種應(yīng)用,延伸到各個行業(yè)里會進行各種細(xì)化。海康的機器視覺產(chǎn)品涵蓋全系列工業(yè)相機、工業(yè)智能相機、視覺控制器、鏡頭以及算法軟件平臺,通過為機器人、自動化設(shè)備裝上視覺系統(tǒng),使之具備感知和自主判斷思考的能力,提高生產(chǎn)制造的柔性和自動化程度,保證產(chǎn)品的品質(zhì),實現(xiàn)制造業(yè)向信息化和智能化轉(zhuǎn)型升級。機器視覺的相機其實是標(biāo)準(zhǔn)化的產(chǎn)品。比如雙目攝像機可以做立體測量,可以有很多應(yīng)用。
徐飆:在人臉識別領(lǐng)域,趨視只做真實環(huán)境可應(yīng)用的人臉識別?;谡掌娜四樧R別系統(tǒng)很難滿足基于實時視頻流的人臉識別需求。傳統(tǒng)的基于隨機抽幀方式的從實時視頻流中獲取人臉照片存在很多問題。動態(tài)人臉抓拍系統(tǒng)是一種動態(tài)人臉歸一化的智能技術(shù),動態(tài)鎖定運動中的每一個人,以唯一ID標(biāo)識,這個人在運動過程中只會產(chǎn)生一張最佳人臉,系統(tǒng)能夠識別并獲取這張最佳人臉而丟棄其他的人臉圖片。趨勢的人臉識別技術(shù)已經(jīng)應(yīng)用于園區(qū)別墅、銀行AMT、海關(guān)機場、公安司法等領(lǐng)域。
徐飆
智能輔助駕駛和安防
柳鋼:安防和無人駕駛兩個領(lǐng)域有差異,也有共性。從目前來看,安防領(lǐng)域的關(guān)注點更多的是人,無人駕駛廣義來說更多關(guān)注的是路、環(huán)境等等。
關(guān)于二者差異點的成長,以商湯的技術(shù)來說,已經(jīng)處于世界領(lǐng)先水平。不僅第一次機器戰(zhàn)勝人眼是我們創(chuàng)造的,另外,近年來我們通過與合作伙伴合作,積累了大量成熟的案例和基礎(chǔ),使我們在已有精度之上,不斷提高,在業(yè)界處于很高的水平。
安防和無人駕駛這兩個領(lǐng)域共性的地方就是場景,路口有場景,街區(qū)有場景,在場景的識別里面,我們走到了行業(yè)的前列,比如視頻的結(jié)構(gòu)化,在安防里面,從單純的個體識別到一群人的識別,再到整個場景的分析,以及場景的實現(xiàn),可以看出,算法的領(lǐng)先性已經(jīng)向應(yīng)用層面的擴張。在無人駕駛應(yīng)用領(lǐng)域,我們從常規(guī)的場景識別到逆光,雨天,雪天,大霧天,甚至是傍晚等等,各應(yīng)用場景都可以鋪開。
吳堯
總的來說,人工智能里面的深度學(xué)習(xí)是用機器模仿人腦的思考的方式。對于人來說,能力的培養(yǎng)需要從多方面進行,深度學(xué)習(xí)也是如此。機器在安防領(lǐng)域能夠輔助人,應(yīng)用能力的提升會促進這種能力在各個領(lǐng)域提高,反之也一樣,相互輔佐、相互促進,也使在無人駕駛里面很好的應(yīng)用基礎(chǔ)。
徐飆:趨視科技在安防領(lǐng)域主要是2B應(yīng)用。而在智能駕駛領(lǐng)域,我們的商業(yè)應(yīng)用趨向于2C,因此在智能駕駛方面我們的算法技術(shù)主要圍繞一個核心目的:讓普通民眾也能享受智能視頻分析技術(shù)發(fā)展的成果。
首先,趨視的智能輔助駕駛系統(tǒng)是一個完全基于單個光學(xué)相機的智能系統(tǒng), 因此系統(tǒng)不存在多傳感器數(shù)據(jù)融合問題,在硬件成本及系統(tǒng)集成可靠性上有先天優(yōu)勢。
第二,趨視開發(fā)出了國際領(lǐng)先的基于移動平臺的相機自動標(biāo)定技術(shù)。不但避免了專業(yè)人員安裝和調(diào)試的要求,節(jié)省了相關(guān)的成本,還能自動檢測相機的意外移動,并做出實時系統(tǒng)調(diào)整?,F(xiàn)有智能輔助駕駛系統(tǒng)一般使用特定相機,因此默認(rèn)已知相機焦距等內(nèi)部參數(shù),另外還要通過專業(yè)人員通過專門的流程來測量相機的諸如高度,仰角等外部定標(biāo)參數(shù),并確保相機在使用中位置角度不會變化。這些高標(biāo)準(zhǔn)的安裝要求不可避免地會大大增加使用成本。趨視的全自動定標(biāo)技術(shù)通過不間斷的實時比對圖像中檢測到的目標(biāo)和他們的實際物理尺寸來反推相機的內(nèi)、外參數(shù),不但不需要使用特定相機,還能對使用中相機的位置和角度的意外變動進行自動檢測,并在系統(tǒng)內(nèi)部進行算法的自動調(diào)整。這項技術(shù)使得智能輔助駕駛系統(tǒng)可以作為智能手機的一個移動應(yīng)用,從而得到大大推廣。
第三,基于視頻的智能輔助駕駛系統(tǒng)運算量往往非常巨大,現(xiàn)在國際主流廠商都需要采用專用芯片進行相關(guān)數(shù)據(jù)處理。趨視科技致力于開發(fā)高效算法來解決問題,而不是依賴于硬件性能的提高。從這點出發(fā),趨視在智能分析模塊中大量使用樹結(jié)構(gòu)專家系統(tǒng)和深度學(xué)習(xí)相結(jié)合,利用專家系統(tǒng)來增加深度學(xué)習(xí)的針對性,利用圖像特征來降低深度學(xué)習(xí)的維數(shù),從而在得到深度學(xué)習(xí)的統(tǒng)計魯棒性同時保持系統(tǒng)的邏輯性和高效性。趨視已在通用X86芯片平臺上實現(xiàn)了基于1080P視頻的實時智能輔助駕駛系統(tǒng),現(xiàn)在正在進一步移植到通用Android和IOS移動平臺上。
最后,智能輔助駕駛系統(tǒng)最根本的一點還是系統(tǒng)可靠性。我們在智能輔助駕駛重現(xiàn)階段主要專注于防疲勞駕駛,以保護駕駛員和乘客。
人工智能還處于一個相對初級的階段,比如在開發(fā)工具、技術(shù)體系、解決方案以及硬件架構(gòu)等領(lǐng)域都存在巨大的短板。機器學(xué)習(xí)和深度學(xué)習(xí)作為人工智能的本質(zhì)特征,已經(jīng)與高性能計算結(jié)合得越來越緊密。2017年,隨著人工智能技術(shù)的優(yōu)化以及在各領(lǐng)域商業(yè)應(yīng)用的發(fā)展,人工智能產(chǎn)品將和我們有更多的直接聯(lián)系。
徐飆:人工智能技術(shù)目前主要在三個方向出現(xiàn)了商業(yè)應(yīng)用的前景:人臉識別技術(shù),行為分析技術(shù),汽車輔助駕駛/無人駕駛技術(shù)。
目前國內(nèi)外人工智能的企業(yè)都在這幾個方向上不斷投入研究及市場開拓,包括這兩年資本市場對人工智能技術(shù)也特別青睞,時不時報出人工智能廠商的高估值和高融資額,把行業(yè)的熱度進一步推高。
但是,面對當(dāng)前的技術(shù)及市場,我們必須要保持清醒的認(rèn)識,人工智能技術(shù)還遠(yuǎn)沒有達(dá)到人們想象的那種高度,也就是我們當(dāng)前還無法造出一個類似人的機器人。單從人工智能里面的智能視頻分析來看,人工智能的智能化水平遠(yuǎn)遠(yuǎn)落后于人。目前為止,我們并沒有看到哪項人工智能技術(shù)已經(jīng)廣泛應(yīng)用了,比如人臉識別,不管是人臉支付還是公安行業(yè)的在逃人臉識別,我們并沒有看到人臉識別產(chǎn)品的廣泛應(yīng)用?,F(xiàn)階段更多的是人工智能產(chǎn)品在大量的行業(yè)應(yīng)用的試點,而非廣泛應(yīng)用。
整體來看,人工智能行業(yè)還處于商業(yè)嘗試階段,但是一些子行業(yè)已經(jīng)出現(xiàn)了商業(yè)落地的景象了。上海趨視信息科技有限公司2013年推出的新一代算法的行為分析技術(shù)已經(jīng)在準(zhǔn)確率方向大幅提高了系統(tǒng)性能,經(jīng)歷兩年多的商業(yè)嘗試,在2016年進入到了商業(yè)落地的階段。趨視科技獨創(chuàng)的2D場景轉(zhuǎn)3D場景技術(shù),將普通攝像機的2D場景首先還原成3D場景,使智能視頻更符合人的場景認(rèn)知,從而進一步靠近人的思考模式,大幅提高了系統(tǒng)的準(zhǔn)確性。標(biāo)志著新一代算法的行為分析技術(shù)能夠?qū)崿F(xiàn)商業(yè)落地。
在汽車輔助駕駛方面,以色列的MOBILEYE公司成功將基于視覺的汽車輔助駕駛技術(shù)應(yīng)用在寶馬、沃爾沃等高端車型中,得到了這些車廠的認(rèn)同。MOBILEYE的智能輔助駕駛系統(tǒng)也進入了商業(yè)落地的階段,也標(biāo)志著基于視覺的輔助駕駛技術(shù)能夠?qū)崿F(xiàn)商業(yè)落地。
至于其他的人工智能視覺技術(shù)及方向,仍然在努力嘗試中,廣泛意義的人臉識別技術(shù)目前可能很難進入商業(yè)落地,但是,小范圍,局域化的人臉識別技術(shù)是有可能實現(xiàn)商業(yè)落地的,當(dāng)然,這還需要有核心技術(shù)實力的廠商不斷的努力和嘗試。
展望2017年,趨視科技美國研發(fā)中心會加大ADAS輔助汽車駕駛方面的投入,在美國邀請更多的算法專家加入,盡快完成各種道路狀況的路測評估和算法優(yōu)化演進。同時,趨視科技仍然會對行為分析算法進行一輪大幅度升級,大幅提高識別準(zhǔn)確率,滿足更多行業(yè)的應(yīng)用。人臉識別方面,趨視將拋棄傳統(tǒng)的靜態(tài)人臉照片比對模式,開創(chuàng)全動態(tài)人臉識別新思路和新算法,大幅提升動態(tài)人臉識別的準(zhǔn)確率。
吳堯:一年來,??当小耙砸曨l圖像處理為核心、以產(chǎn)品安全為基石、以智能應(yīng)用為導(dǎo)向、以滿足行業(yè)需求為目標(biāo)”的理念,由原來的單一產(chǎn)品逐步形成成熟的產(chǎn)品系列,產(chǎn)品的人性化設(shè)計、環(huán)境適應(yīng)性以及安全性等方面全面提升,智能化應(yīng)用更深入,行業(yè)應(yīng)用和解決方案更全面。
我們在人工智能領(lǐng)域的產(chǎn)品和應(yīng)用是從視頻延伸過來的,比如我們做機器人,但沒有做機械手,因為那是控制領(lǐng)域的。我們根據(jù)自己的定位,以相機,或者以視頻掃碼為核心的機器人,這些都由我們擅長的核心技術(shù)延伸而來。憑借??刀嗄陙碓诔上癫杉?、圖像處理和模式識別等領(lǐng)域的技術(shù)積淀與超前布局,2017年我們會繼續(xù)堅持圍繞核心技術(shù)及硬件優(yōu)勢,推進人工智能在不同領(lǐng)域的應(yīng)用。
柳鋼:在人工智能、大數(shù)據(jù)、硬件計算單元的強大驅(qū)動下,就像之前IP化帶來的革命一樣,未來5——10年安防行業(yè)可能將迎接新一輪更具顛覆性的革命。