李嘉文
與臺(tái)灣供應(yīng)鏈關(guān)系密切的蘋(píng)果分析師Brain White在給投資者的一份說(shuō)明中表示,因OLED顯示屏和3D傳感前置攝像頭所需復(fù)雜工藝帶來(lái)的挑戰(zhàn),下一代iPhone將會(huì)延遲幾周上市。
今年3月,美國(guó)多家媒體報(bào)道,新一代iPhone將采用“革命性”的3D深度攝像頭。普通的攝像頭只能獲取顏色信息并對(duì)其數(shù)據(jù)化,而3D深度攝像頭則不僅能感知顏色,對(duì)空間—即三維的位置和尺寸信息也有“感覺(jué)”。也就是說(shuō),如果電子設(shè)備或機(jī)器人裝上了這種攝像頭,它就可以擁有近乎于人類(lèi)的視覺(jué),能夠更好地和外界做各類(lèi)交互。
截至目前,計(jì)算機(jī)視覺(jué)技術(shù)的發(fā)展并不十分完善。2015年7月,Google的照片管理應(yīng)用Google Photos就曾犯下一個(gè)嚴(yán)重的錯(cuò)誤,它把兩名黑人標(biāo)注為“大猩猩”。當(dāng)時(shí)Google的首席社交架構(gòu)師Yonatan Zunger對(duì)此事專(zhuān)門(mén)道歉,并且表示他們正在努力改善膚色識(shí)別技術(shù)。而很多自動(dòng)駕駛汽車(chē)在路測(cè)中遇到事物,也是對(duì)迎面而來(lái)的物件識(shí)別錯(cuò)誤,甚至?xí)?dǎo)致事故。
其實(shí),很多公司已開(kāi)始投入到視覺(jué)領(lǐng)域里,特別是深度攝像領(lǐng)域。比如以色列技術(shù)公司PrimeSense,它在2006年研發(fā)出3D傳感器,隨后與微軟合作共同開(kāi)發(fā)出體感設(shè)備Kinect,最終于2013年又以3.45億美元的價(jià)格被蘋(píng)果收購(gòu)。此外,英特爾的RealSense以及Google的Project Tango項(xiàng)目也在做相關(guān)技術(shù)研究。
深度攝像頭可以捕捉人的動(dòng)作,比如你可以用手勢(shì)和動(dòng)作來(lái)控制電腦或者電視。目前,這個(gè)領(lǐng)域最成熟的技術(shù),使用的是一個(gè)單目攝像頭加上結(jié)構(gòu)光的方案,Kinect用的就是這個(gè)技術(shù)結(jié)構(gòu)。結(jié)構(gòu)光是向檢測(cè)空間內(nèi)投射經(jīng)過(guò)編碼的激光光斑陣列,標(biāo)定空間并輔助計(jì)算三維空間位置,隨后經(jīng)過(guò)一系列算法處理形成機(jī)器視 覺(jué)。
不過(guò),類(lèi)似結(jié)構(gòu)也有不足。由于它完全依賴(lài)結(jié)構(gòu)光定位,如果在戶外拍攝就容易受到干擾?!坝绕涫怯嘘?yáng)光的地方或者是多設(shè)備之間的干擾,這無(wú)法避免。”圖漾信息科技有限公司的創(chuàng)始人費(fèi)浙平對(duì)《第一財(cái)經(jīng)周刊》說(shuō)。圖漾是一家專(zhuān)業(yè)從事計(jì)算視覺(jué)的中國(guó)公司。
為了解決這個(gè)不足,以及規(guī)避專(zhuān)利侵權(quán)—這個(gè)領(lǐng)域的幾家大公司的技術(shù)大多都是封閉的,并沒(méi)有開(kāi)放給其他公司使用—圖漾正在嘗試用“結(jié)構(gòu)光+雙目攝像頭”的技術(shù)實(shí)現(xiàn)景深計(jì)算,這也被稱(chēng)為主動(dòng)雙目技術(shù)。
該技術(shù)本質(zhì)上是一個(gè)在結(jié)構(gòu)光系統(tǒng)上疊加雙攝像頭的系統(tǒng),因此對(duì)三維空間的測(cè)算可以不依賴(lài)于光,而是依靠左右兩個(gè)攝像頭形成圖像后的比較。其實(shí)這和人眼感知環(huán)境的方式相同—左右兩眼捕捉圖像,然后通過(guò)比較兩幅有細(xì)微差別的圖尋找相對(duì)應(yīng)的點(diǎn),隨后算出被攝物體在深度的距離差別,從而獲取景深信息。這樣做的精度要超過(guò)單攝像加結(jié)構(gòu)光的產(chǎn)品,可以達(dá)到毫米級(jí)別。
圖漾或許是受了硅谷公司Leap Motion的啟發(fā),這家技術(shù)公司曾受資本熱捧,其研發(fā)的手勢(shì)識(shí)別產(chǎn)品使用的就是雙目攝像頭。圖漾的區(qū)別是,它還保留了結(jié)構(gòu)光,這使設(shè)備在黑暗環(huán)境下依舊能夠保證測(cè)算的精度。
“結(jié)構(gòu)光+雙目攝像頭”需要的是一套全新的算法。單攝像頭技術(shù)基本上就是與存儲(chǔ)好的光編碼匹配,只需要不斷優(yōu)化結(jié)構(gòu)光的編碼,成像的質(zhì)量也就能優(yōu)化,而這個(gè)算法已經(jīng)有了一套相對(duì)固定的內(nèi)容。但如果采用雙攝像頭,則無(wú)法提前知道所要計(jì)算的環(huán)境如何。
除了體感游戲,深度攝像頭還有很多應(yīng)用領(lǐng)域。比如在安防領(lǐng)域,深度攝像頭可對(duì)所拍攝人作行為分析,通過(guò)這些動(dòng)作軌跡識(shí)別出人背后的意圖,從而提前預(yù)警。在物流倉(cāng)儲(chǔ)領(lǐng)域,它可以用來(lái)實(shí)時(shí)檢測(cè)包裹的大小,計(jì)算倉(cāng)庫(kù)的空間,提供最佳的擺放建議等。
而機(jī)器人領(lǐng)域則更加容易想象,可以實(shí)現(xiàn)視覺(jué)導(dǎo)航、規(guī)劃路徑、避障等功能。例如送餐機(jī)器人,它想要自由行走,就需要實(shí)時(shí)感知存在空間的環(huán)境,避免撞到人或者是其他物體,這就需要有機(jī)器視覺(jué)來(lái)幫助。而在無(wú)人駕駛領(lǐng)域,目前在這個(gè)行業(yè)大多使用超聲波雷達(dá)技術(shù)收集周?chē)h(huán)境,如果采用3D傳感器,也能為車(chē)輛提供更為精確的環(huán)境感知能力。
但不同的使用場(chǎng)景對(duì)深度攝像頭的要求并不一樣,有時(shí)甚至需要“定制”。其關(guān)鍵技術(shù)指標(biāo)主要有鏡頭視角、最大檢測(cè)距離、檢測(cè)精度和檢測(cè)速度四項(xiàng)。
有分析認(rèn)為,最為成熟的單目攝像頭結(jié)構(gòu)光方案,更適合工業(yè)化的產(chǎn)品;雙目立體成像是一種比較新的技術(shù),更適合室外強(qiáng)光條件和高分辨率應(yīng)用,目前主要應(yīng)用在機(jī)器人視覺(jué)、自動(dòng)駕駛等方面。將兩種技術(shù)做了一定結(jié)合的圖漾,則會(huì)在基礎(chǔ)平臺(tái)上根據(jù)客戶的應(yīng)用場(chǎng)景給產(chǎn)品搭載不同的光學(xué)系統(tǒng),光學(xué)系統(tǒng)決定了產(chǎn)品使用的距離、角度等。當(dāng)然,由于既保證了一定的精確度,又可在較暗的環(huán)境下拍攝,它也較適合應(yīng)用在移動(dòng)端的產(chǎn)品上,不過(guò)目前研究這種技術(shù)方案的公司并不多。
除了“結(jié)構(gòu)光+雙目攝像頭”,還有一種更成熟的技術(shù)方案也較適合移動(dòng)端,名為T(mén)OF系統(tǒng),即一種光雷達(dá)系統(tǒng),它可從發(fā)射極向?qū)ο蟀l(fā)射光脈沖,接收器則可通過(guò)計(jì)算這個(gè)過(guò)程中的光脈沖,再以像素格式返回到接收器的運(yùn)行時(shí)間來(lái)確定被測(cè)量對(duì)象的距離。TOF系統(tǒng)可確定3D范圍影像,再利用測(cè)量得到的對(duì)象坐標(biāo)創(chuàng)建3D影像。它同樣具有深度信息精度高、不容易受環(huán)境光線干擾的優(yōu)點(diǎn)。事實(shí)上,這也是微軟第二代Kinect以及Google的Project Tango遵循的技術(shù)原理。
如果下一代iPhone使用3D攝像頭,它就可以實(shí)現(xiàn)諸如3D拍攝、面部識(shí)別,甚至是虹膜識(shí)別等功能。而現(xiàn)在新一代iPhone推遲上市的消息,也反映了這種技術(shù)目前在產(chǎn)品量產(chǎn)上的一些困難,比如工藝的復(fù)雜度會(huì)增加一些制造流程,同時(shí),對(duì)于移動(dòng)端來(lái)說(shuō),搭載3D深度攝像頭后,其功耗較大,對(duì)電池也提出了新的考驗(yàn)。
當(dāng)然,如果上述功能真的能夠在智能手機(jī)上實(shí)現(xiàn),這當(dāng)然是值得等待的—畢竟,iPhone在硬件上已經(jīng)很久沒(méi)有“革命性”的創(chuàng)新了。