技術(shù)宅
大家知道3D信息是立體數(shù)據(jù),這樣捕捉到的信息符合我們雙眼在正常世界看到的景象。顯然如果自動(dòng)駕駛系統(tǒng)浦捉到的周邊環(huán)境也是3D信息,那么在人工駕駛基礎(chǔ)上發(fā)展起來的自動(dòng)駕駛系統(tǒng)就可以更好地實(shí)現(xiàn)對(duì)周圍路障,如周邊人、其他汽車等,進(jìn)行更精準(zhǔn)的識(shí)別和避讓,從而讓駕駛系統(tǒng)更安全。
不過3D信息的捕捉并不是一件簡(jiǎn)單的事情,傳統(tǒng)的3D數(shù)據(jù)捕捉是借助“Stereo”(雙目視覺)方式獲取的。這種方式是通過布置兩個(gè)或者多個(gè)相機(jī)對(duì)同一個(gè)場(chǎng)景進(jìn)行多角度的捕捉,然后通過不同的圖像,匹配對(duì)應(yīng)的像素,并計(jì)算每個(gè)像素的位置在圖像之間的不同,從而計(jì)算出這個(gè)像素在3D空間中的位置,通過這種方式來獲得特定物體的3D數(shù)據(jù)(圖1)。
不過這個(gè)方式有個(gè)很大的不足,因?yàn)轳{駛系統(tǒng)經(jīng)常處在一個(gè)快速運(yùn)行的環(huán)境中,并且需要很精準(zhǔn)地對(duì)對(duì)象進(jìn)行識(shí)別,但是使用這個(gè)方法獲得的數(shù)據(jù),我們需要使用視覺細(xì)節(jié)來匹配相機(jī)圖像之間的對(duì)應(yīng)點(diǎn),這種計(jì)算方法數(shù)據(jù)量非常龐大,而且在缺乏紋理或視覺結(jié)構(gòu)重復(fù)的環(huán)境中容易出錯(cuò)。在自動(dòng)駕駛系統(tǒng)中,現(xiàn)在很多廠商使用的是LiDAR(激光雷達(dá))方式來捕捉3D數(shù)據(jù)。在這些自動(dòng)駕駛車頂上配備了激光雷達(dá)相機(jī),它會(huì)向周圍發(fā)射高頻激光脈沖,如果遇到物體的遮擋,這些激光脈沖就會(huì)反射返回,系統(tǒng)通過計(jì)算返回的時(shí)間來測(cè)量出物體和汽車的實(shí)際距離。比如探測(cè)到前方的信號(hào)燈,通過返回光束就可以探測(cè)車輛和紅綠燈之間的實(shí)際距離了(圖2)。
一臺(tái)自動(dòng)駕駛汽車配備多個(gè)3DLiDAR傳感器,它們能快速旋轉(zhuǎn)以觀察傳感器周圍的所有方向,這些雷達(dá)通過每秒發(fā)送數(shù)百萬光束,然后通過返回光束的時(shí)間就可以推斷出與周圍任何物體的精確測(cè)量值(最大約為60米),從而實(shí)現(xiàn)駕駛系統(tǒng)對(duì)周邊物體的精準(zhǔn)探測(cè)(圖3)。
通過上述方法,自動(dòng)駕駛系統(tǒng)捕捉到3D數(shù)據(jù)后如何讓駕駛系統(tǒng)進(jìn)行3D物體的識(shí)別?這里駕駛系統(tǒng)使用的是“點(diǎn)云模式”方法進(jìn)行識(shí)別(圖4)。駕駛系統(tǒng)根據(jù)3DLiDAR得到的三維數(shù)據(jù),包括物體的三維坐標(biāo)(XYZ)、激光反射強(qiáng)度(Intensity)和顏色信息(RGB)。這樣系統(tǒng)在獲取物體表面每個(gè)采樣點(diǎn)的空間坐標(biāo)后,得到物體在空間坐標(biāo)上的一個(gè)個(gè)數(shù)據(jù)點(diǎn),這些點(diǎn)組成點(diǎn)集合,整個(gè)集合形成一個(gè)3D物體,從而讓系統(tǒng)可以實(shí)現(xiàn)對(duì)物體的精準(zhǔn)識(shí)別。
比如激光探測(cè)到前方的路障,通過返回的信息集合點(diǎn)就可以在駕駛系統(tǒng)中形成一個(gè)周邊環(huán)境的3D地圖。3D LiDAR繪制的地圖不僅可以讓系統(tǒng)準(zhǔn)確了解你在世界的哪個(gè)位置進(jìn)而幫助你進(jìn)行導(dǎo)航。同時(shí)它還可以識(shí)別和跟蹤汽車、行人等障礙物,隨著識(shí)別技術(shù)的發(fā)展,現(xiàn)代LIDAR使你可以識(shí)別一個(gè)騎自行車的人和一個(gè)行走的人,甚至可以測(cè)量他們改變方向和行進(jìn)的速度。這樣對(duì)于自動(dòng)駕駛系統(tǒng),它就像在駕駛室里坐著很多個(gè)視力極好的駕駛員,他們分別對(duì)汽車的前后、上下、左右進(jìn)行全向觀察,從而實(shí)現(xiàn)又快又安全的自動(dòng)駕駛(圖5)。
當(dāng)然在實(shí)際駕駛環(huán)境中,每種路障的大小、位置、距離都是不同的,只是簡(jiǎn)單采集并識(shí)別3D物體,這還無法讓自動(dòng)駕駛系統(tǒng)在復(fù)雜的地理環(huán)境下安全、自動(dòng)地進(jìn)行駕駛。為此科學(xué)家引入了深度學(xué)習(xí)機(jī)制,他們首先建立一個(gè)模型,然后將3DLiDAR捕獲的不同圖形讓駕駛系統(tǒng)學(xué)習(xí),通過不斷地學(xué)習(xí),自動(dòng)駕駛系統(tǒng)可以“認(rèn)識(shí)”捕捉的不同物體。同時(shí)借助深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)讓系統(tǒng)實(shí)現(xiàn)自主學(xué)習(xí),最終生成一套復(fù)雜的算法,讓駕駛系統(tǒng)可以精準(zhǔn)識(shí)別周邊復(fù)雜環(huán)境的物體,實(shí)現(xiàn)安全的自動(dòng)駕駛(圖6)。
上述我們主要介紹了3D信息處理在自動(dòng)駕駛中的應(yīng)用,這個(gè)領(lǐng)域的應(yīng)用和我們的生活有點(diǎn)距離。不過3D信息處理還在很多領(lǐng)域有非常多的應(yīng)用,比如在醫(yī)學(xué)領(lǐng)域,配備了3D信息識(shí)別的醫(yī)療設(shè)備,通過激光探測(cè),醫(yī)生們無需在我們的身體中插入傳統(tǒng)的探測(cè)設(shè)備如胃鏡等,他們就可以非常快速且精準(zhǔn)地對(duì)病灶物體進(jìn)行詳細(xì)全面的查看,省去現(xiàn)在傳統(tǒng)檢測(cè)中的那些痛苦。
在日益火熱的VR游戲領(lǐng)域,3D信息處理技術(shù)也有很多的應(yīng)用,通過類似3D激光掃描和識(shí)別,以后的VR游戲可以非常方便地將當(dāng)前物理環(huán)境無縫融入到游戲環(huán)境中,讓我們的游戲體驗(yàn)更為真實(shí)、刺激。