□本刊記者 黃耀鵬
AR世界的召喚
□本刊記者 黃耀鵬
AR技術(shù)兩大元素——延伸和交互,決定了它未來(lái)在汽車應(yīng)用中能走多遠(yuǎn)。但現(xiàn)在,AR還需要繼續(xù)坐冷板凳,直到新的計(jì)算平臺(tái)的誕生。
大多數(shù)新上市的車都配備了倒車影像和雷達(dá)。當(dāng)你掛上倒擋的時(shí)候,艙內(nèi)屏幕上顯示出車后影像。同時(shí),影像也用黃色虛線標(biāo)示出預(yù)測(cè)的輪軌跡。這兩條虛線就是AR(Augmented Reality增強(qiáng)現(xiàn)實(shí))技術(shù)。視頻拼接的“全景影像”也算AR技術(shù),但仍顯粗糙。車載裝備中的AR不但少得可憐,還很初級(jí)。貌似毫無(wú)進(jìn)展的狀況已經(jīng)持續(xù)了幾年時(shí)間,導(dǎo)致業(yè)界對(duì)AR在汽車上的應(yīng)用缺乏信心。
過(guò)去兩年,AR在和VR(Virtual Reality虛擬現(xiàn)實(shí))技術(shù)的爭(zhēng)斗中一直處于下風(fēng)。谷歌眼鏡的“探索者”項(xiàng)目被取消后,AR技術(shù)一直缺乏重量級(jí)的產(chǎn)品。谷歌眼鏡不但沒(méi)有解決技術(shù)問(wèn)題(電池續(xù)航、感官體驗(yàn)糟糕、應(yīng)用匱乏),還惹上一堆倫理麻煩(“眼鏡混蛋”的綽號(hào)打擊太大了)。谷歌不是第一次砍項(xiàng)目,他們對(duì)“止損”體會(huì)深刻,但這不是AR的錯(cuò)。
雖然AR和VR都致力于用計(jì)算機(jī)產(chǎn)生某種虛擬影像,借助特定設(shè)備讓用戶感知,但是它們之間存在著嚴(yán)肅的區(qū)別。
VR的核心價(jià)值在于“沉浸”。在完全虛擬的空間中創(chuàng)造虛擬場(chǎng)景,追求逼真的視覺(jué)效果和互動(dòng)性。而AR的核心在于“混合”。在真實(shí)的場(chǎng)景中構(gòu)建虛擬元素,目的是讓人類獲得現(xiàn)實(shí)擴(kuò)展能力,“看到”原本看不到的東西。
到目前為止,VR的核心技術(shù)是CG動(dòng)畫和“追蹤”。后者包括三自由度的方向矢量和六自由度的位置參數(shù)(3維角運(yùn)動(dòng)、3維線運(yùn)動(dòng))。而AR的核心技術(shù)則是計(jì)算機(jī)視覺(jué)和物體識(shí)別(特別重要的是生物識(shí)別)、區(qū)域識(shí)別。
語(yǔ)音識(shí)別和手勢(shì)識(shí)別技術(shù),處于AR和VR交疊的模糊地帶。有意思的是,主機(jī)廠和零部件供應(yīng)商,都對(duì)后兩者青睞有加。最新的量產(chǎn)車和幾乎所有的概念車型,都加上了這兩種技術(shù)。計(jì)算機(jī)對(duì)語(yǔ)音的識(shí)別度已經(jīng)上升到90%以上,而漢語(yǔ)普通話的識(shí)別率則高達(dá)95%以上,在大語(yǔ)種中獨(dú)占鰲頭。手勢(shì)識(shí)別則發(fā)展得磕磕絆絆,主機(jī)廠商只好嚴(yán)格限制手勢(shì)的種類和使用空間范圍。
只要識(shí)別錯(cuò)誤率沒(méi)有壓低到萬(wàn)分之一以下,制造商都不敢讓用戶通過(guò)這兩種技術(shù)觸及車輛安全有關(guān)的指令。這導(dǎo)致了語(yǔ)音識(shí)別和手勢(shì)識(shí)別只能完成在車?yán)锎虼蜥u油、播放段音樂(lè)、接個(gè)電話等小任務(wù)。
現(xiàn)階段,精明的制造商們普遍回避在汽車上安裝真正的AR設(shè)備。他們?cè)诟拍钴嚿系膰L試,遲遲沒(méi)有回報(bào)。顯然,AR技術(shù)的發(fā)展尚不支持大規(guī)模商業(yè)應(yīng)用。
AR和VR兩者對(duì)計(jì)算機(jī)的挑戰(zhàn)不盡相同。VR的構(gòu)造過(guò)程,頗像設(shè)計(jì)一款游戲。事實(shí)上,VR技術(shù)正是借助游戲推廣而風(fēng)生水起。VR概念在半個(gè)世紀(jì)前就提出來(lái),當(dāng)然那時(shí)除了在電影和小說(shuō)里演繹一番,并無(wú)真正實(shí)現(xiàn)手段。
自上世紀(jì)90年代以降,全視角的虛擬畫面就不再是難題,3D游戲引擎輕松實(shí)現(xiàn)。畫面的精美和顆粒度才是游戲公司追求的。戴著VR頭盔比早期端坐在屏幕前,看上去更有“科技感”,但兩者皆屬VR。
和幾乎所有的民用科技一樣,它脫胎于軍事發(fā)明?!疤摂M現(xiàn)實(shí)之父” 托馬斯·弗內(nèi)斯三世(Thomas A.Furness III),從1966年為美國(guó)空軍飛行員開發(fā)了駕駛模擬設(shè)備。誕生于1986年的訓(xùn)練頭盔“The SuperCockpit”達(dá)到當(dāng)時(shí)的技術(shù)巔峰:3D地圖、紅外和雷達(dá)圖像、頭部位置跟蹤、手勢(shì)控制和語(yǔ)音控制、眼動(dòng)追蹤技術(shù)。VR時(shí)代開始了。
而歷史短得多的AR則面臨更嚴(yán)肅的任務(wù):采用虛擬現(xiàn)實(shí)對(duì)現(xiàn)實(shí)進(jìn)行擴(kuò)展,則需要研發(fā)新型的計(jì)算平臺(tái)。
AR的計(jì)算量是個(gè)技術(shù)巨坑。虛擬要素與現(xiàn)實(shí)世界的疊加,比完全的虛擬環(huán)境更具挑戰(zhàn)性。
簡(jiǎn)而言之,就是要在對(duì)的位置顯示對(duì)的內(nèi)容。依靠計(jì)算機(jī)視覺(jué)算法、深度傳感器、GPS等,計(jì)算機(jī)看懂了你所看到的環(huán)境,并提取關(guān)鍵像素點(diǎn),將三維圖像轉(zhuǎn)化為二維數(shù)字點(diǎn)陣,但必須符合人類的視覺(jué)——透視原理。
谷歌眼鏡基于光學(xué)反射,混合了投影和反射式望遠(yuǎn)鏡原理,實(shí)現(xiàn)了“3米外”的小畫面,但疊加算法經(jīng)常出錯(cuò)失焦,導(dǎo)致用戶頭暈。
微軟正在探討光柵衍射技術(shù)(分割畫面后多次反射),而英偉達(dá)(nvidia)則試圖實(shí)現(xiàn)“光場(chǎng)技術(shù)”——就是計(jì)算得到不同景深圖像,用投射方式,使虛擬畫面與真實(shí)環(huán)境在視覺(jué)上看起來(lái)一致。這和昆蟲的復(fù)眼成像原理近似。但該技術(shù)目前只具備“演示”能力。誠(chéng)如所見,AR需要變態(tài)的計(jì)算量。
計(jì)算機(jī)重建場(chǎng)景、識(shí)別場(chǎng)景信息,并在合適的位置表達(dá)出預(yù)先設(shè)定的虛擬元素。如果還要支持交互,那么對(duì)運(yùn)算量和運(yùn)算結(jié)果還有更高的要求。如果AR要達(dá)到完全沉浸的效果,其運(yùn)算量更加龐大。
而隨身AR設(shè)備的尺寸和電池容量又要求輕薄。我們需要低功耗、計(jì)算能力更強(qiáng)的新平臺(tái)。當(dāng)前無(wú)論ARM架構(gòu),還是Inter M架構(gòu),都很難勝任。
如果硬要上馬怎么辦?將渲染的視場(chǎng)角度控制得很小,減少計(jì)算量。所以現(xiàn)階段只能減少支持的場(chǎng)景大小——這也是諸如戴著谷歌眼鏡可憐的家伙們,需要盯著斜上方一個(gè)模糊光點(diǎn)的原因。微軟HoloLens設(shè)備的視場(chǎng)角也好不到哪里去。
和谷歌眼鏡一樣,微軟大肆吹噓的HoloLens,同樣容易引起頭暈惡心的問(wèn)題。客戶視覺(jué)系統(tǒng)和身體感知存在巨大矛盾的時(shí)候,就能體會(huì)到類似暈船暈車的感覺(jué)。
雖然谷歌投資的Magic Leap公司高管,曾嘲笑VR是“過(guò)時(shí)的技術(shù)”,但AR尚無(wú)像樣的產(chǎn)品,豈不更糟糕。
谷歌眼鏡項(xiàng)目尚未終結(jié)的時(shí)候,美國(guó)多個(gè)州立法將其在駕駛中禁用。至少有些立法者認(rèn)為,現(xiàn)階段的AR技術(shù)在幫助駕駛者,尚不及引誘其分心的負(fù)面作用。
當(dāng)你在操縱重達(dá)1.5噸的金屬盒子、每秒移動(dòng)20米,你卻被“3米外”跳出的即時(shí)消息所吸引,或者需要盯著某物體拍照。谷歌有關(guān)“AR眼鏡有助于駕駛”的言論被大多數(shù)試戴者否定。
不過(guò),寶馬聯(lián)合高通開發(fā)過(guò)一款A(yù)R眼鏡,供MINI駕駛使用。HUD的平視顯示功能,被遷移到眼鏡上。附送離車導(dǎo)航和送人上車功能,聊勝于無(wú),此后沒(méi)有下文。
而影視作品當(dāng)然秒得現(xiàn)實(shí)連渣都不剩?!兜姓?》中寶馬i8的智慧前風(fēng)擋,就是典型的AR顯示器。像在《少數(shù)派報(bào)告》里一樣,演員用非接觸式的手勢(shì),就可以操縱。前方路面即將出現(xiàn)的行人和障礙物,并對(duì)危險(xiǎn)進(jìn)行預(yù)判,對(duì)威脅大小排序。這可能代表了AR的未來(lái),盡管我們暫時(shí)做不到。
AR不但需要延伸人的感官,還要延伸人的大腦。交互式汽車玻璃已經(jīng)被發(fā)明,它實(shí)際上是一塊透明觸摸屏。不但可以記錄一路上的風(fēng)景,還可以定位你想定位的目的地。不過(guò),顯然駕駛員不可能直接操作。
以前曾有過(guò)透明A柱、透明C柱的概念,以電子影像覆蓋通常的駕駛著盲區(qū),并將所有相鄰車道的狀況集中投射在面前(駕駛者需要區(qū)分景物的真實(shí)坐標(biāo))。而這種想法發(fā)展到極致,就是“透明汽車”。
用全息攝像頭將車外景象投射到特定位置,司機(jī)看向后方(不是真的朝后看)位置,感官上,汽車后座和后備廂等遮擋視線的實(shí)體都變成透明。人們好像浮空駕駛一樣。當(dāng)前的傳感器技術(shù)已經(jīng)能支撐這一構(gòu)想,但計(jì)算單元仍然無(wú)法低成本地可靠運(yùn)轉(zhuǎn)。
AR技術(shù)兩大元素——延伸和交互,決定了它未來(lái)在汽車應(yīng)用中能走多遠(yuǎn)。即便無(wú)人駕駛平臺(tái),乘客們也不想被小小的窗口限制視野。但現(xiàn)在,AR還需要繼續(xù)坐冷板凳,直到新的計(jì)算平臺(tái)的誕生。