潘琢金, 戴旭文 魏鑫磊 王傳云
摘? 要: 為了解決傳統(tǒng)視覺(jué)SLAM算法受動(dòng)態(tài)環(huán)境因素影響較大、對(duì)設(shè)備的算力要求高的問(wèn)題,該文提出一種融合ORB?SLAM2、語(yǔ)義標(biāo)簽以及全局性稠密光流法的視覺(jué)SLAM算法。該方法采用空洞卷積神經(jīng)網(wǎng)絡(luò)的語(yǔ)義分割模塊為雙目圖像添加語(yǔ)義標(biāo)簽,識(shí)別物體類別。再結(jié)合相鄰幀間位置信息對(duì)圖像的動(dòng)態(tài)點(diǎn)進(jìn)行剔除。最后使用Octo?map優(yōu)化定位與建圖,實(shí)現(xiàn)動(dòng)態(tài)環(huán)境下地圖的建立與實(shí)時(shí)更新。實(shí)驗(yàn)結(jié)果證明,該文提出的算法在動(dòng)態(tài)環(huán)境下的特征點(diǎn)提取速度和質(zhì)量相較傳統(tǒng)視覺(jué)SLAM算法有一定提高。
關(guān)鍵詞: 語(yǔ)義SLAM; 空洞卷積神經(jīng)網(wǎng)絡(luò); 語(yǔ)義標(biāo)簽; 動(dòng)態(tài)點(diǎn)剔除; 地圖構(gòu)建; 結(jié)果分析
中圖分類號(hào): TN911.73?34; TP301.6? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼: A? ? ? ? ? ? ? ? ? ? ?文章編號(hào): 1004?373X(2020)22?0152?05
Abstract: A visual SLAM algorithm fusing ORB?SLAM2, semantic label and global dense optical flow method is proposed to solve the problem that the traditional visual SLAM algorithm is greatly affected by dynamic environment factors and requires high computing power of equipment. In this method, the semantic segmentation module of dilated convolution neural network is used to add semantic tags to binocular images, so as to identify object categories. The dynamic points of the image are eliminated by combining the position information between adjacent frames. The octo?map is used to optimize location and map construction to realize the map establishment and real?time update under the dynamic environment. The experimental results show that, in combination with the traditional SLAM algorithm, the speed and quality of feature point extraction in dynamic environment are improved.
Keywords: semantic SLAM; dilated convolutional neural network; semantic tag; dynamic points elimination; map construction; result analysis
0? 引? 言
移動(dòng)設(shè)備在未知的環(huán)境中運(yùn)動(dòng)時(shí),通常需要采用紅外光、雷達(dá)等傳感器獲取周邊環(huán)境的位置信息[1],估算自身的位置及姿態(tài)信息。然而,傳統(tǒng)的地圖構(gòu)建方式完全依賴周邊環(huán)境的幾何特征,并不能充分地理解周邊環(huán)境。這導(dǎo)致設(shè)備上的處理器需要對(duì)比圖像上所有特征點(diǎn)的位移情況,消耗大量算力,限制了其對(duì)復(fù)雜任務(wù)的處理能力。因此,將獲取的圖像信息從像素級(jí)別上升到物體級(jí)別,已成為移動(dòng)設(shè)備在現(xiàn)實(shí)場(chǎng)景下執(zhí)行復(fù)雜任務(wù)的必要手段。
為了解決以上問(wèn)題,本文研究一種融合語(yǔ)義信息的SLAM算法。語(yǔ)義與SLAM看似獨(dú)立,實(shí)則相輔相成。一方面,語(yǔ)義信息能夠減少傳統(tǒng)SLAM對(duì)圖像特征的依賴,尤其在動(dòng)態(tài)環(huán)境下,移動(dòng)的物體會(huì)導(dǎo)致定位精度下降、誤差累積、跟蹤失敗等問(wèn)題。融入語(yǔ)義信息后,SLAM系統(tǒng)能夠在物體層面判斷動(dòng)態(tài)物體的精確位置,提高建圖和定位的精度;另一方面,借助SLAM技術(shù),充分利用幾何信息計(jì)算出的物體位置與輪廓信息也有助于提高語(yǔ)義分割的精度。
本文使用的SLAM系統(tǒng)基于ORB?SLAM2[2]算法,該算法是基于關(guān)鍵幀的稀疏SLAM算法中性能較好的算法框架。系統(tǒng)首先使用MYNT?EYE雙目攝像頭實(shí)時(shí)獲取圖像,再利用ORB?SLAM2算法實(shí)現(xiàn)相機(jī)的位姿估計(jì)并篩選關(guān)鍵幀,同時(shí),結(jié)合語(yǔ)義分割算法對(duì)獲得的二維圖像進(jìn)行語(yǔ)義分割,最后使用光流法結(jié)合語(yǔ)義信息實(shí)現(xiàn)對(duì)動(dòng)態(tài)點(diǎn)的剔除。
本文提出的語(yǔ)義SLAM在ROS系統(tǒng)下通過(guò)5個(gè)線程實(shí)現(xiàn),分別為跟蹤、本地建圖、回環(huán)檢測(cè)、語(yǔ)義分割和Octo?map建圖線程。線程之間采用ROS基于話題和服務(wù)的通信機(jī)制,將雙目矯正圖像作為輸入,分別提供給本地建圖線程和語(yǔ)義分割線程。其中,語(yǔ)義分割線程采用的神經(jīng)網(wǎng)絡(luò)基于ENet[3]網(wǎng)絡(luò)結(jié)構(gòu),將深度信息作為門控信號(hào),從而控制卷積核的大小,提高了目標(biāo)檢測(cè)的準(zhǔn)確度;跟蹤線程在負(fù)責(zé)跟蹤并計(jì)算每一幀位姿的同時(shí),通過(guò)獲取相鄰幀間的位姿變化忽略相機(jī)自身運(yùn)動(dòng),實(shí)時(shí)檢測(cè)關(guān)鍵幀中的動(dòng)態(tài)對(duì)象,并將其動(dòng)態(tài)點(diǎn)剔除;本地建圖線程通過(guò)地圖點(diǎn)匹配構(gòu)建地圖,將圖像關(guān)鍵幀按時(shí)間順序檢測(cè),可有效縮小漏檢、誤檢對(duì)整體建圖的影響;Octo?map[4]建圖線程使用稠密八叉樹(shù)地圖算法,采用log?odds方法計(jì)算出葉子節(jié)點(diǎn)的占據(jù)概率,將八叉樹(shù)按照占據(jù)概率進(jìn)行渲染,更新并繪制出點(diǎn)云圖像。系統(tǒng)運(yùn)行流程如圖1所示。
1? 基于空洞卷積的語(yǔ)義分割算法
1.1? 語(yǔ)義分割線程
經(jīng)典ORB?SLAM2算法使用特征像素點(diǎn)匹配來(lái)獲取相鄰幀間物體的位置變化,然而匹配得到的像素點(diǎn)并沒(méi)有實(shí)際意義且這種匹配方式過(guò)于依賴特征。若環(huán)境內(nèi)有較大噪聲,則匹配精度將無(wú)法保證。因此,若能將獲取到的圖像特征融入語(yǔ)義標(biāo)簽,將會(huì)降低特征點(diǎn)匹配消耗的算力并提高建圖速度。
本文提出的SLAM系統(tǒng)中融入了語(yǔ)義分割線程,用于加載網(wǎng)絡(luò)模型及權(quán)重信息、輸入原始圖像并輸出分割結(jié)果。具體來(lái)看,首先線程將待分割的圖像進(jìn)行預(yù)處理,調(diào)整其通道數(shù)及像素值并輸入到神經(jīng)網(wǎng)絡(luò)中;其次,運(yùn)行神經(jīng)網(wǎng)絡(luò)進(jìn)行推理,得到不同類別語(yǔ)義標(biāo)簽的概率,在圖像中劃分并輸出語(yǔ)義分割結(jié)果。
1.2? 語(yǔ)義分割算法
用于SLAM系統(tǒng)的語(yǔ)義分割算法要求網(wǎng)絡(luò)同時(shí)具有較高的分割精度及較快的處理速率,但在傳統(tǒng)的語(yǔ)義分割算法中,這兩者不可兼得。若希望獲得較好的分割精度,則需要提取到豐富的圖像特征,相對(duì)應(yīng)地增加網(wǎng)絡(luò)參量,擴(kuò)大卷積核并保持較大的感受野,以學(xué)習(xí)到更有區(qū)分性的特征。若希望獲得較快的運(yùn)行速度,則需要降低網(wǎng)絡(luò)的參量,減小卷積核的大小。綜合考慮分割精度和速度,本文提出的算法選擇了ENet作為基礎(chǔ)算法,并在此基礎(chǔ)上進(jìn)行改進(jìn)。
ENet算法由較大的Encoder和較小的Decoder組成,Encoder主要進(jìn)行信息處理和過(guò)濾,而Decoder主要是對(duì)Encoder的輸出做上采樣,對(duì)細(xì)節(jié)做細(xì)微調(diào)整。同時(shí),由于ENet模型未引入bias值,減少了一部分的內(nèi)核調(diào)用和存儲(chǔ)操作,分割速度在相似性能的分割算法中也處于領(lǐng)先位置。
Paszke A等提出在語(yǔ)義分割網(wǎng)絡(luò)中,最初的網(wǎng)絡(luò)層不應(yīng)該直接分類,而應(yīng)該作為很好的特征提取器并為網(wǎng)絡(luò)后續(xù)部分的輸入進(jìn)行預(yù)處理,這樣能夠大大減少輸入的尺寸,使冗余的視覺(jué)信息得到有效的壓縮,能夠降低計(jì)算資源的消耗[3]。本文提出的算法借鑒了這一思想,在data層后設(shè)計(jì)一個(gè)數(shù)據(jù)處理模塊,降低圖像中的冗余信息。
1.3? 基于深度信息的多尺度卷積門控
二維圖像中物體的大小與距攝像機(jī)的距離成反比,圖像的深度信息有利于不同尺度物體的分割。Kong S等認(rèn)為,在語(yǔ)義分割網(wǎng)絡(luò)中融合深度信息能夠提高物體尤其是遠(yuǎn)處物體的語(yǔ)義分割精度[5]。本文使用雙目視覺(jué)模塊通過(guò)雙目立體匹配得到視差圖,并利用視差和深度的關(guān)系,得到當(dāng)前圖像的深度。
由于圖像中遠(yuǎn)處的物體較大,近處的物體較小。因此,不同深度的圖像應(yīng)使用不同大小的卷積核進(jìn)行卷積。然而,增大卷積核尺寸會(huì)使參數(shù)成倍增長(zhǎng),導(dǎo)致網(wǎng)絡(luò)效率變低。本文使用空洞卷積對(duì)圖像特征進(jìn)行提取,在保證參數(shù)個(gè)數(shù)不變的同時(shí),增大了卷積核的感受野,并保持輸出的特征映射大小保持不變,使其在附近獲取更多的上下文信息。感受野與空洞步長(zhǎng)的關(guān)系如圖2所示。
為了提升語(yǔ)義分割模塊的精確度,本文使用深度信息作為門控信號(hào)自適應(yīng)地學(xué)習(xí)圖像特征。
1) 本文將深度信息根據(jù)距離遠(yuǎn)近分為5個(gè)等級(jí),并生成一張包含深度等級(jí)信息的掩模圖像;
2) 采用不同空洞步長(zhǎng)的卷積核,對(duì)圖像進(jìn)行卷積,得到5張相同尺寸的圖像;
3) 使用深度信息作為門控信號(hào),按照深度掩模圖像中每個(gè)像素點(diǎn)的深度信息,將5張圖像進(jìn)行疊加,得到其適應(yīng)深度信息的圖像,繼續(xù)后續(xù)卷積操作。
2? 動(dòng)態(tài)點(diǎn)刪除
傳統(tǒng)SLAM算法的假設(shè)環(huán)境是靜態(tài)或低動(dòng)態(tài)的,但在實(shí)際應(yīng)用環(huán)境中,無(wú)論是地圖中的物體還是無(wú)人設(shè)備本身,都處在無(wú)規(guī)則的運(yùn)動(dòng)當(dāng)中。因此動(dòng)態(tài)物體檢測(cè)的準(zhǔn)確性將會(huì)影響建圖的實(shí)際效果,如果發(fā)生漏檢、誤檢情況,將會(huì)導(dǎo)致兩個(gè)相鄰關(guān)鍵幀的特征點(diǎn)匹配存在差異,破壞SLAM系統(tǒng)的穩(wěn)定性。因此,從二維圖像中識(shí)別出動(dòng)態(tài)對(duì)象,并在構(gòu)建語(yǔ)義地圖之前丟棄它們是必要的。
語(yǔ)義分割模塊負(fù)責(zé)預(yù)測(cè)物體類別,并在圖像相應(yīng)像素點(diǎn)位置標(biāo)記類別標(biāo)簽,在跟蹤線程遍歷二維圖像后,標(biāo)記出疑似動(dòng)態(tài)物體在二維圖像上的位置信息。然而,語(yǔ)義分割網(wǎng)絡(luò)可識(shí)別的種類有限,且精確度在不同的訓(xùn)練集上略有差異,動(dòng)態(tài)物體檢測(cè)不能過(guò)分依賴于語(yǔ)義分割檢測(cè)出的動(dòng)態(tài)物體。為解決這一問(wèn)題,本文使用三幀差分法和光流法檢測(cè)動(dòng)態(tài)物體的運(yùn)行軌跡,并結(jié)合語(yǔ)義分割模塊得到的動(dòng)態(tài)對(duì)象特征點(diǎn)信息,實(shí)現(xiàn)對(duì)動(dòng)態(tài)對(duì)象的有效判斷與處理。
2.1? 三幀差分法
三幀差分法[6]是通過(guò)相鄰三幀圖像利用運(yùn)動(dòng)目標(biāo)的位置差異做差分運(yùn)算,并對(duì)結(jié)果做閾值化處理得到運(yùn)動(dòng)目標(biāo)區(qū)域的方法。選取圖像序列連續(xù)的3幀圖像,分別為[fk-1(x,y)],[fk(x,y)], [fk+1(x,y)] ,相鄰2幀圖像的差值為:
2.2? LK光流法
本文提出的SLAM系統(tǒng)早期采用LK光流法。Yu C等提出的LK光流法首先在跟蹤線程提取ORB特征點(diǎn),粗略地檢查特征點(diǎn)的移動(dòng)情況,并保存潛在異常值,再通過(guò)語(yǔ)義分割線程對(duì)關(guān)鍵幀做語(yǔ)義分割,使用異常值拒絕方法,結(jié)合語(yǔ)義分割和移動(dòng)一致性檢查方法過(guò)濾掉動(dòng)態(tài)對(duì)象,將位于移動(dòng)物體上的ORB特征點(diǎn)潛在的異常值剔除[7]。
然而,LK光流法在追蹤運(yùn)動(dòng)速度較快的小目標(biāo)時(shí),出現(xiàn)了跟蹤丟失的情況,尤其是面對(duì)遠(yuǎn)處的車輛時(shí),丟失效果較為嚴(yán)重。造成這種現(xiàn)象的原因是圖像經(jīng)過(guò)多次下采樣,會(huì)使小目標(biāo)丟失特征,且只是對(duì)某些特征點(diǎn)進(jìn)行光流計(jì)算,有一定的局限性,無(wú)法達(dá)到運(yùn)動(dòng)檢測(cè)要求。
2.3? 全局稠密性光流法
考慮到全局性稠密光流法能夠較好地提取出運(yùn)動(dòng)物體的軌跡,且定位動(dòng)態(tài)物體較為準(zhǔn)確。本文提出的SLAM系統(tǒng)結(jié)合了基于梯度的全局性稠密光流算法,通過(guò)圖像金字塔匹配方法,計(jì)算圖像上所有點(diǎn)的光流,并將其與已設(shè)定的光流動(dòng)靜點(diǎn)閾值作比較,若大于閾值,則判斷其移動(dòng),并將圖像掩模置0,用于后續(xù)動(dòng)態(tài)點(diǎn)處理。
為消除相機(jī)本身的移動(dòng)對(duì)建圖的影響,該算法通過(guò)單應(yīng)矩陣表示相鄰關(guān)鍵幀之間的相關(guān)性,以獲取上一幀與當(dāng)前幀間的對(duì)應(yīng)關(guān)系及運(yùn)動(dòng)信息。單應(yīng)矩陣能夠?qū)⑸溆捌矫嫔系狞c(diǎn)映射到另一射影平面上,設(shè)[p1x1,y1],[p2x2,y2]為相鄰2幀上的圖像點(diǎn)匹配的點(diǎn)對(duì),其單應(yīng)矩陣為H,則有[p2=Hp1],即:
3? Octo?map建圖
由于點(diǎn)云地圖規(guī)模很大,需要大量的存儲(chǔ)空間,且在位姿出現(xiàn)誤差時(shí),會(huì)導(dǎo)致地圖出現(xiàn)明顯的重疊。Sengupta S等將Octo?map地圖嵌入到分層魯棒性的馬爾可夫隨機(jī)場(chǎng),為帶有語(yǔ)義標(biāo)簽的地圖提供體素[8]。通過(guò)以上操作,Octo?map地圖能夠壓縮點(diǎn)云信息,并以八叉樹(shù)的形式存儲(chǔ)并更新地圖。
八叉樹(shù)是一種用于表述三維空間并具有8個(gè)子節(jié)點(diǎn)的樹(shù)狀數(shù)據(jù)結(jié)構(gòu),每個(gè)子節(jié)點(diǎn)代表其被占據(jù)的概率[9]。隨著不同關(guān)鍵幀的變化,每個(gè)子節(jié)點(diǎn)的概率也會(huì)發(fā)生改變,已知在[t=1,2,…,T]時(shí)刻,每個(gè)子節(jié)點(diǎn)的觀測(cè)值為[z1:T],則第n個(gè)葉子節(jié)點(diǎn)的概率公式為:
基于八叉樹(shù)結(jié)構(gòu)存儲(chǔ)的Octo?map地圖具有占用空間小、更新地圖方便,且分辨率可調(diào)的特點(diǎn),尤其適合無(wú)人機(jī)等邊緣計(jì)算設(shè)備搭載的視覺(jué)SLAM系統(tǒng)。
本文提出的SLAM系統(tǒng)將視覺(jué)模塊獲取的矯正圖像作為輸入,篩選出關(guān)鍵幀信息,并將其輸入到語(yǔ)義分割線程處理,將八叉樹(shù)的每個(gè)體素都關(guān)聯(lián)特定顏色,每種顏色代表一種語(yǔ)義標(biāo)簽,把相機(jī)坐標(biāo)系下的點(diǎn)云信息轉(zhuǎn)換成世界坐標(biāo)系下的點(diǎn)云坐標(biāo),生成融合了語(yǔ)義標(biāo)簽與點(diǎn)云信息的語(yǔ)義地圖。
4? 實(shí)驗(yàn)結(jié)果與分析
本文實(shí)驗(yàn)平臺(tái)硬件配置為NVIDIA TITAN RTX型號(hào)的GPU,測(cè)試系統(tǒng)為Ubuntu 16.04。SLAM部分采用CityScapes數(shù)據(jù)集(leftimg 8 bit和rightimg 8 bit組合形成雙目)及小覓雙目視覺(jué)模塊進(jìn)行建圖測(cè)試。語(yǔ)義分割網(wǎng)絡(luò)采用CityScapes數(shù)據(jù)集進(jìn)行對(duì)比驗(yàn)證。
4.1? 語(yǔ)義分割模塊驗(yàn)證
本文設(shè)計(jì)的SLAM系統(tǒng)將雙目視覺(jué)模塊立體匹配得到的視差圖作為輸入,獲取深度信息。語(yǔ)義分割線程選擇其中關(guān)鍵幀中的深度信息,控制空洞卷積中空洞的大小,自適應(yīng)地調(diào)整神經(jīng)網(wǎng)絡(luò)卷積過(guò)程中的感受野,提升特征提取效果。考慮到本文提出的語(yǔ)義SLAM系統(tǒng)的實(shí)際運(yùn)用場(chǎng)景為街景,因此采用 CityScapes數(shù)據(jù)集進(jìn)行效果驗(yàn)證。作為目前街景領(lǐng)域最權(quán)威的數(shù)據(jù)集之一,以場(chǎng)景復(fù)雜多變、分割難度大著稱,能夠較好地體現(xiàn)算法在實(shí)際應(yīng)用環(huán)境下的性能。圖3為傳統(tǒng)ENet網(wǎng)絡(luò)與本文提出的網(wǎng)絡(luò)在CityScapes數(shù)據(jù)集上的分割效果對(duì)比,自上而下依次為輸入圖像、本文算法的效果、傳統(tǒng)ENet分割效果。由圖3可以看出,相比原ENet網(wǎng)絡(luò)近處分割較為精細(xì),遠(yuǎn)處的物體分割粗略,融合深度信息的改進(jìn)方法使其分割效果更關(guān)注遠(yuǎn)處物體。表1為SegNet網(wǎng)絡(luò)、ENet網(wǎng)絡(luò)以及本文方法在CityScapes數(shù)據(jù)集下運(yùn)行的準(zhǔn)確率,本文方法在深度信息的引入下,相較于原有的ENet算法,分割效果提升1%。
4.2? 動(dòng)態(tài)物體剔除模塊驗(yàn)證
本文提出的語(yǔ)義SLAM系統(tǒng)通過(guò)結(jié)合全局性稠密光流法對(duì)動(dòng)態(tài)物體位置進(jìn)行判斷,提高了動(dòng)態(tài)物體位置的檢測(cè)精度,并能夠精確有效地消除動(dòng)態(tài)噪聲,從而構(gòu)建了相對(duì)穩(wěn)定的語(yǔ)義地圖,提高了系統(tǒng)的魯棒性。
4.3? Octo?map建圖模塊驗(yàn)證
在ROS系統(tǒng)下,整體運(yùn)行系統(tǒng),使用Octo?map模塊建立結(jié)合語(yǔ)義后的SLAM地圖,等待地圖建立后,利用Rviz可視化工具顯示地圖,建圖效果如圖5所示。
5? 結(jié)? 語(yǔ)
本文的主要工作是在傳統(tǒng)雙目ORB?SLAM2算法的基礎(chǔ)上,融合基于卷積神經(jīng)網(wǎng)絡(luò)的語(yǔ)義分割[10]算法,對(duì)移動(dòng)設(shè)備所處的環(huán)境構(gòu)建語(yǔ)義地圖。與其他語(yǔ)義地圖構(gòu)建方法相比,本文提出的算法引入圖像深度信息作為多尺度空洞卷積網(wǎng)絡(luò)的門控信號(hào),對(duì)分割算法進(jìn)行改進(jìn),得到了更適合移植到嵌入式設(shè)備上的語(yǔ)義分割方法。實(shí)驗(yàn)結(jié)果證明,該網(wǎng)絡(luò)在街景環(huán)境下能夠獲得較好的分割效果。此外,在SLAM算法中加入了全局性稠密光流法,將動(dòng)態(tài)環(huán)境中動(dòng)態(tài)點(diǎn)剔除,減少了動(dòng)態(tài)物體對(duì)相機(jī)姿態(tài)估計(jì)的影響,并實(shí)現(xiàn)了構(gòu)建地圖的優(yōu)化,提高了動(dòng)態(tài)場(chǎng)景下系統(tǒng)建圖的魯棒性。
參考文獻(xiàn)
[1] 潘思宇.基于背負(fù)式多激光系統(tǒng)的室內(nèi)二維與三維構(gòu)圖[D].廈門:廈門大學(xué),2016.
[2] MUR?ARTAL R, TARDOS J D. ORB?SLAM2: An open?source SLAM system for monocular, stereo, and RGB?D cameras [J]. IEEE transactions on robotics, 2017, 33(5): 1255?1262.
[3] PASZKE A, CHAURASIA A, KIM S, et al. Enet: a deep neural network architecture for real?time semantic segmentation [J]. Computer vision and pattern recognition, 2016(2): 174.
[4] HORNUNG A, WURM K M, BENNEWITZ M, et al. OctoMap: an efficient probabilistic 3D mapping framework based on octrees [J]. Autonomous robots, 2013, 34(3): 189?206.
[5] KONG S, FOWLKES C C. Recurrent scene parsing with perspective understanding in the loop [C]// Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Salt Lake City: IEEE, 2018: 956?965.
[6] 袁國(guó)武,陳志強(qiáng),龔健,等.一種結(jié)合光流法與三幀差分法的運(yùn)動(dòng)目標(biāo)檢測(cè)算法[J].小型微型計(jì)算機(jī)系統(tǒng),2013,34(3):668?671.
[7] YU C, LIU Z, LIU X J, et al. DS?SLAM: A semantic visual SLAM towards dynamic environments [C]// 2018 IEEE/RSJ International Conference on Intelligent Robots and Systems. Madrid: IEEE, 2018: 1168?1174.
[8] SENGUPTA S, STURGESS P. Semantic octree: unifying recognition, reconstruction and representation via an octree constrained higher order MRF [C]// 2015 IEEE International Conference on Robotics and Automation. Seattle: IEEE, 2015: 1874?1879.
[9] MAIER D, HORNUNG A, BENNEWITZ M. Real?time navigation in 3D environments based on depth camera data [C]// 2012 12th IEEE?RAS International Conference on Humanoid Robots. Osaka: IEEE, 2012: 692?697.
[10] 白云漢.基于SLAM 算法和深度神經(jīng)網(wǎng)絡(luò)的語(yǔ)義地圖構(gòu)建研究[J].計(jì)算機(jī)應(yīng)用與軟件,2018,35(1):183?190.