崔林飛,黃丹丹,王祎旻,耿振野,劉 智
(長春理工大學(xué) 電子信息工程學(xué)院,吉林 長春 130000)
動態(tài)環(huán)境中的自我運(yùn)動估計是移動設(shè)備的基本問題,SLAM技術(shù)就是有效解決這個問題的常用方法[1]。視覺傳感器因成本低廉和使用方便等優(yōu)點(diǎn),視覺SLAM得到了快速發(fā)展[2],目前開源視覺SLAM具有代表性的有ORB-SLAM[3]、DSO[4]等。為了彌補(bǔ)單目視覺SLAM在快速移動下容易失效的缺點(diǎn),添加了慣性測量單元(IMU),以增強(qiáng)單目視覺SLAM系統(tǒng)的定位精度和魯棒性。目前流行的開源視覺慣性SLAM解決方案包括:VINS-MONO[5]、VINS-Fusion[6]等。然而,絕大多數(shù)SLAM方法以及數(shù)據(jù)集都是基于靜態(tài)環(huán)境下進(jìn)行研究,而如何消除動態(tài)環(huán)境對SLAM算法性能影響的相關(guān)研究較少。同時視覺SLAM主要是根據(jù)兩幀圖像之間匹配的特征點(diǎn)估計出自身的旋轉(zhuǎn)和平移(即相機(jī)的位姿)。在動態(tài)環(huán)境中由于存在大量移動對象,會造成提取的特征中包含部分動態(tài)特征點(diǎn),使用這些動態(tài)特征點(diǎn)進(jìn)行特征匹配,會降低系統(tǒng)位姿估計的準(zhǔn)確性。
針對SLAM系統(tǒng)受到動態(tài)環(huán)境影響的問題,提出一種基于對極幾何的特征檢測算法,由于動態(tài)環(huán)境對視覺和慣性信息影響程度不同,設(shè)計了一種自適應(yīng)調(diào)整因子用于后端調(diào)整視覺信息權(quán)重。改進(jìn)后的視覺慣性SLAM系統(tǒng)可以提高相機(jī)的位姿估計精度以及系統(tǒng)魯棒性。
大多數(shù)基于視覺慣性SLAM的移動設(shè)備,通常應(yīng)用在動態(tài)環(huán)境,經(jīng)常會遇到移動的對象,如行人、汽車等。因此,研究SLAM系統(tǒng)如何在動態(tài)環(huán)境下穩(wěn)定、精確地定位導(dǎo)航,對智能機(jī)器人以及增強(qiáng)現(xiàn)實(shí)、虛擬現(xiàn)實(shí)的普遍應(yīng)用具有重要意義。
根據(jù)SLAM系統(tǒng)在動態(tài)環(huán)境中受到干擾的分析可知,去除提取特征中的動態(tài)特征,僅保留靜態(tài)特征可以提高SLAM系統(tǒng)在高動態(tài)環(huán)境中位姿估計的準(zhǔn)確性。現(xiàn)有針對動態(tài)環(huán)境的SLAM解決方案,主要可以分為:基于幾何信息的動態(tài)特征檢測;基于語義信息的動態(tài)目標(biāo)檢測;將幾何信息和語義信息相結(jié)合的動態(tài)目標(biāo)檢測。
幾何信息處理方案主要有Bescos等[7]提出的Dyna-SLAM通過結(jié)合多視圖幾何和深度學(xué)習(xí)的方法來檢測動態(tài)目標(biāo)。魏彤和李緒等[8]根據(jù)立體視覺幾何約束判別場景中的稀疏特征點(diǎn),然后根據(jù)場景深度和顏色進(jìn)行場景分割。高成強(qiáng)等[9]通過建立圖像塊實(shí)時更新高斯模型,依據(jù)方差變化分割出動態(tài)對象,通過最小化重投影誤差對相機(jī)位姿進(jìn)行優(yōu)化。張慧娟等[10]采取了直線特征的靜態(tài)權(quán)重剔除動態(tài)直線特征的方法。
基于語義信息處理的方案主要有房立金等[11]通過深度學(xué)習(xí)進(jìn)行語義信息分割,結(jié)合特征點(diǎn)光流對語義分割進(jìn)一步優(yōu)化,檢測動態(tài)目標(biāo)并去除不可靠的動態(tài)特征。Zhang等[12]使用光流殘差來突出RGB-D點(diǎn)云中的動態(tài)特征。Brasch等[13]提出一種基于CNN(convolution neural networks)預(yù)測的語義先驗(yàn)信息結(jié)合概率模型以及時間運(yùn)動信息判斷動態(tài)特征。利用語義信息來判斷動態(tài)目標(biāo)主要是根據(jù)常識和經(jīng)驗(yàn)對目標(biāo)進(jìn)行判斷,但是可能會將處于靜止的人、汽車等先驗(yàn)動態(tài)目標(biāo)的全部特征去除,而運(yùn)動的椅子、桌子等先驗(yàn)為靜態(tài)的目標(biāo)無法判斷為移動物體。
幾何信息與語義信息相融合的方案包括Cui和Ma等[14]提出的將語義分割和對極幾何信息以緊耦合的方式融合在一起有效檢測并去除動態(tài)特征。Yu和Liu等[15]通過將語義分割和運(yùn)動一致性檢測相結(jié)合檢測動態(tài)特征。Bescos等結(jié)合多視圖幾何和MaskR-CNN[16]檢測動態(tài)目標(biāo)。雖然將幾何信息和語義信息相結(jié)合會提升SLAM系統(tǒng)對動態(tài)目標(biāo)的檢測,但由于語義信息的獲取需要算力較高的硬件支持,這不適合移動設(shè)備輕便的設(shè)計要求。
綜上,現(xiàn)有的動態(tài)SLAM算法大多結(jié)合語義信息進(jìn)行動態(tài)目標(biāo)檢測,但要實(shí)現(xiàn)精確的動態(tài)目標(biāo)檢測需要構(gòu)建高性能的目標(biāo)檢測網(wǎng)絡(luò),但這需要大量的算力,難以應(yīng)用在嵌入式移動平臺上;同時這些解決方案大多只采用單一的視覺傳感器,已知單一的視覺傳感器容易受到環(huán)境的干擾。綜合考慮后,本文提出了一種適用于動態(tài)環(huán)境的DVI-SLAM系統(tǒng),它通過在VINS-MONO前端特征提取階段添加動態(tài)特征檢測器,同時根據(jù)當(dāng)前幀動態(tài)點(diǎn)的數(shù)量,自適應(yīng)調(diào)整后端優(yōu)化中視覺信息的權(quán)重,從而提高視覺慣性SLAM系統(tǒng)在動態(tài)環(huán)境中的位姿的準(zhǔn)確性以及系統(tǒng)的魯棒性。
在真實(shí)環(huán)境中,精確的位姿估計以及系統(tǒng)的魯棒性是評價智能機(jī)器人的一個重要標(biāo)準(zhǔn)。VINS-MONO在目前公開的視覺慣性數(shù)據(jù)集和真實(shí)環(huán)境中均有良好表現(xiàn),因此本文將VINS-MONO作為DVI-SLAM的基本框架,在此基礎(chǔ)上添加了動態(tài)目標(biāo)檢測并改進(jìn)了后端優(yōu)化方式,以更好適應(yīng)動態(tài)環(huán)境的挑戰(zhàn)。
DVI-SLAM系統(tǒng)的動態(tài)特征檢測器總覽如圖1所示,對先前圖像幀和當(dāng)前幀的特征點(diǎn)進(jìn)行KLT(Kanade-Lucas-Tomasi)稀疏光流[17]跟蹤,然后,通過對極幾何約束檢測并去除動態(tài)特征點(diǎn),只保留靜態(tài)特征點(diǎn)用于位姿估計。
圖1 DVI-SLAM動態(tài)檢測器總覽
本文提出的DVI-SLAM系統(tǒng)的整體結(jié)構(gòu)如圖2所示。其中測量預(yù)處理模塊對新采集的圖像幀提取亞像素級特征點(diǎn),然后,通過動態(tài)特征檢測器將特征點(diǎn)進(jìn)行分類,去除動態(tài)特征,僅保留真正的靜態(tài)特征,采用KLT稀疏光流法對靜態(tài)特征點(diǎn)進(jìn)行跟蹤;其中IMU數(shù)據(jù)的處理與VINS-MONO相同。在后端非線性優(yōu)化部分,通過添加自適應(yīng)視覺信息權(quán)重因子,來降低動態(tài)環(huán)境對系統(tǒng)的影響。初始化模塊、重定位模塊以及全局位姿圖優(yōu)化模塊與原始VINS-MONO相同。位姿圖優(yōu)化模塊接受幾何驗(yàn)證的重定位結(jié)果,并進(jìn)行全局優(yōu)化以消除漂移?;丨h(huán)檢測模塊是為了判斷是否到達(dá)過以前經(jīng)過的位置,消除軌跡漂移。
圖2 DVI-SLAM系統(tǒng)的整體結(jié)構(gòu)
本文采用對極幾何約束來判斷當(dāng)前關(guān)鍵幀中的特征是否為動態(tài)。圖3為靜態(tài)特征點(diǎn)在相鄰圖像幀的對極幾何約束,其中X是靜態(tài)三維特征點(diǎn),x1是空間點(diǎn)X在I1幀上的投影,x2是空間點(diǎn)X在I2幀上的投影。C1和C2是相機(jī)的光學(xué)中心,連接C1和C2的線稱為基線,與兩個關(guān)鍵幀相交的點(diǎn)稱為極點(diǎn)e1、e2。C1和C2以及空間點(diǎn)X組成的平面稱為對極平面,對極平面與幀I1、I2相交的直線L1,L2稱為極線。
假設(shè)在靜態(tài)環(huán)境中,已知像素點(diǎn)的像素坐標(biāo)p1,三維空間點(diǎn)X位于從x1的反投影線C1x上,通過對極幾何約束得到X在關(guān)鍵幀I2中的投影點(diǎn)x2的像素坐標(biāo)范圍,如圖3所示。若三維空間點(diǎn)X為靜態(tài)特征點(diǎn),在已知相機(jī)的旋轉(zhuǎn)和平移后,可以通過對極幾何約束判斷x2的像素坐標(biāo)。兩幅圖像的對極幾何約束可用相鄰兩圖像間的基礎(chǔ)矩陣來表示
(1)
式中:p1和p2是對應(yīng)投影x1和x2的像素坐標(biāo)。I2幀中的極線L2可以通過幀I1中相對應(yīng)的p1和基礎(chǔ)矩陣F計算得到
L2=Fp1
(2)
圖3 對極幾何約束
如果三維點(diǎn)X是靜態(tài)的,根據(jù)對極幾何約束,x2投影點(diǎn)一定會在極線L2上。如果三維點(diǎn)X是動態(tài)點(diǎn),X可能會在對極平面之外運(yùn)動如圖4(a)所示,會導(dǎo)致投影點(diǎn)x′2和極線L2之間有一定的距離d;若是在對極平面內(nèi)運(yùn)動如圖4(b)所示,則像素點(diǎn)x′2依然會落在極線L2上。由此可以看出,只有特征點(diǎn)在對極平面之外運(yùn)動才不滿足對極幾何約束。
圖4 空間三維點(diǎn)的運(yùn)動可能性
在實(shí)際操作中由于特征點(diǎn)的提取和基礎(chǔ)矩陣F的計算均存在誤差,即使三維點(diǎn)X是靜態(tài)的,投影點(diǎn)x′2也不一定位于對應(yīng)的極線L2上,而是距離相應(yīng)極線有一定距離(即使距離非常小),如圖4(a)所示。因此可以通過這個約束來判斷特征點(diǎn)是動態(tài)點(diǎn)還是靜態(tài)點(diǎn)。通過判斷投影點(diǎn)x2到對應(yīng)極線L2的距離d是否大于預(yù)定義的閾值,從而判斷該特征點(diǎn)是否為動態(tài)特征點(diǎn)。在具體的實(shí)現(xiàn)過程中,本文選擇1個像素作為閾值,即當(dāng)前幀中的投影點(diǎn)距離相應(yīng)極線的距離超過1個像素則認(rèn)為此特征點(diǎn)為動態(tài)特征。
假設(shè)有
P1=(x1,y1,1)P2=(x2,y2,1)
(3)
式中:P1和P2是投影點(diǎn)的歸一化坐標(biāo)。極線方程可以通過以下公式計算
(4)
式中:X,Y,Z是極線方程的系數(shù)向量,F(xiàn)代表基礎(chǔ)矩陣。投影點(diǎn)到對應(yīng)的極線的距離方程如下
(5)
通過式(5)可以看出,基礎(chǔ)矩陣F的選取對于距離d的精度非常重要。在相鄰兩幀之間通??梢酝ㄟ^5點(diǎn)法[18]、8點(diǎn)法[19]以及RANSAC(random sample consensus)[20]計算基礎(chǔ)矩陣。最常用的是8點(diǎn)法推導(dǎo)基礎(chǔ)矩陣F。假設(shè)
(6)
根據(jù)式(1)和式(3)可以得出
Af=0
(7)
式中:A=(x1x2,x1y2,x1,y1x2,y1y2,y1,x2,y2,1),f=(f11,f12,f13,f21,f22,f23,f31,f32,f33)T, 此時的A矩陣只是由一對匹配點(diǎn)組成的矩陣,想要計算出基礎(chǔ)矩陣F則只需找到兩幀之間8對匹配特征點(diǎn)。8點(diǎn)法是計算基礎(chǔ)矩陣F最簡單的方法,為了增強(qiáng)其計算的精度和穩(wěn)定性,一般先對輸入的匹配點(diǎn)進(jìn)行歸一化處理,具體過程在本文不作討論。
為了得到兩幀間正確匹配的特征點(diǎn),采用可以跟蹤特征點(diǎn)運(yùn)動方向的光流法,在一定程度上也可以對動態(tài)物體進(jìn)行判斷,但考慮到一般光流法計算量較大,因此采取了KLT稀疏光流法對特征點(diǎn)進(jìn)行跟蹤。采用RANSAC方法簡單去除跟蹤過程中誤匹配的特征點(diǎn),以得到更加精確的基礎(chǔ)矩陣。因此系統(tǒng)需要在一個相對靜態(tài)的環(huán)境下完成初始化,并通過RANSAC去除誤匹配的點(diǎn),得到一個相對精確的初始基礎(chǔ)矩陣。
特征點(diǎn)的提取、動態(tài)特征點(diǎn)檢測以及動態(tài)特征分離的算法如算法1所示。
算法1: 動態(tài)特征點(diǎn)檢測算法
輸入: 先前關(guān)鍵幀I1; 當(dāng)前關(guān)鍵幀I2;
輸出: 動態(tài)特征點(diǎn)集合D;
(1)先前幀的特征點(diǎn)P1=goodFeaturesToTrack(I1);
(2)亞像素級特征點(diǎn)P1=cornerSubPix(I1,P1);
(3)當(dāng)前幀特征點(diǎn)P2=CalcOpticakFlowPyrLK(I1,I2,P1);
(4)去除P2中的外點(diǎn);
(5)F=FindFundamentalMatrix(P1,P2);
(6)forP1,P2中每對匹配的點(diǎn)p1,p2do
L1=ComputeCorrespondEpilines(p1,F);
d=getDist_P2L(p2,L1);
ifd> 1 then
Appendp2to D;
end if
end for
算法1中用到的表達(dá)式均來源于OPENCV庫中的相關(guān)函數(shù)。
圖5表示原始VINS-MONO在3個動態(tài)序列中提取的特征點(diǎn)的結(jié)果。圖6顯示了本文提出的DVI-SLAM系統(tǒng)去除動態(tài)特征后的效果??梢钥吹脚c原始VINS-MONO相比DVI-SLAM提取的特征幾乎沒有來自于移動的行人身上。
圖5 VINS-MONO在動態(tài)環(huán)境中提取的特征點(diǎn)
圖6 DVI-SLAM系統(tǒng)在3個動態(tài)序列中的特征提取
當(dāng)SLAM系統(tǒng)在動態(tài)環(huán)境中運(yùn)行時,打破了傳統(tǒng)SLAM靜態(tài)環(huán)境的基本假設(shè),影響了SLAM系統(tǒng)位姿估計的準(zhǔn)確性。經(jīng)過分析發(fā)現(xiàn),移動目標(biāo)對視覺慣性系統(tǒng)的影響主要是發(fā)生在視覺前端,即在圖像幀提取關(guān)鍵特征的過程中使用動態(tài)特征點(diǎn)進(jìn)行特征點(diǎn)匹配。慣性傳感器是由陀螺儀和加速度計構(gòu)成,因此測量數(shù)據(jù)并不會受到移動對象的影響,因此可以調(diào)整視覺信息的權(quán)重來提高系統(tǒng)在動態(tài)環(huán)境中的魯棒性。
通過設(shè)置一個比率M,即當(dāng)前幀中去除動態(tài)特征后剩余靜態(tài)特征點(diǎn)的數(shù)量與當(dāng)前幀中特征點(diǎn)的總數(shù)的比值,作為調(diào)整視覺信息權(quán)重的參考條件
(8)
式中:當(dāng)前幀的特征點(diǎn)的數(shù)量,本文采用VINS-MONO中采用的150個特征點(diǎn)。
在滑動窗口內(nèi)n個IMU幀以及m個特征點(diǎn)的狀態(tài)向量為
(9)
通過最小二乘非線性優(yōu)化方法,最小化滑動窗口內(nèi)得到的邊緣化先驗(yàn)信息、視覺殘差以及慣性殘差的平方和。目標(biāo)函數(shù)如下
(10)
(11)
其中自適應(yīng)調(diào)整因子α被定義為
(12)
θ為確定是否舍棄當(dāng)前幀的視覺測量信息的閾值。閾值θ在實(shí)驗(yàn)過程中根據(jù)環(huán)境中動態(tài)對象的數(shù)量進(jìn)行自適應(yīng)調(diào)整。若當(dāng)前關(guān)鍵幀中的靜態(tài)特征點(diǎn)占的比重M小于閾值θ時,則舍棄當(dāng)前的視覺信息,只保留慣性信息進(jìn)行位姿估計,以此來保證SLAM系統(tǒng)在動態(tài)環(huán)境中的魯棒性。
在這一部分,本文在現(xiàn)有的公共視覺慣性數(shù)據(jù)集TUM-VI[21]上對提出的DVI-SLAM系統(tǒng)進(jìn)行相關(guān)實(shí)驗(yàn)。TUM-VI數(shù)據(jù)集中包含動態(tài)的運(yùn)動場景,這有利于對提出的DVI-SLAM系統(tǒng)在動態(tài)環(huán)境中的性能進(jìn)行評估。為了實(shí)驗(yàn)的公平比較,將提出的DVI-SLAM系統(tǒng)與原始VINS-MONO系統(tǒng)在多個動態(tài)場景序列中進(jìn)行了比較,以驗(yàn)證其在動態(tài)環(huán)境中的改進(jìn)效果。算法的實(shí)驗(yàn)平臺為:Intel i5 5200U處理器(2.2 GHz),8 GB RAM,64位Ububtu16.04操作系統(tǒng)。
TUM-VI數(shù)據(jù)集提供了許多序列,這些序列提供了20 Hz幀率,分辨率為1024×1024的高動態(tài)范圍光度較準(zhǔn)圖像。此外還提供了頻率為200 Hz的IMU慣性單元,測量3個軸上的加速度和角速度。相機(jī)和IMU在硬件中進(jìn)行時間同步。同時在數(shù)據(jù)序列的開始和結(jié)束處,給出使用運(yùn)動捕捉系統(tǒng)以120 Hz的高頻率獲取的精確標(biāo)準(zhǔn)位姿數(shù)據(jù),并與相機(jī)和IMU測量值對準(zhǔn)作為參考標(biāo)準(zhǔn)的地面真實(shí)值。為了驗(yàn)證提出的DVI-SLAM系統(tǒng)在動態(tài)環(huán)境中的性能,本文選擇具有挑戰(zhàn)性并且包含動態(tài)元素的序列來進(jìn)行相關(guān)實(shí)驗(yàn),即序列Slides1、Slides2、Slides3,這3個序列是在學(xué)校的中央大廳采集的,光照明暗變化較大,并且有突然進(jìn)入的行人,這樣的環(huán)境會對SLAM系統(tǒng)構(gòu)成巨大的挑戰(zhàn)。在TUM-VI數(shù)據(jù)集的這3個動態(tài)序列中,人是主要的動態(tài)對象。其中Slides1序列動態(tài)對象相對較少稱為低動態(tài)環(huán)境,其余兩個序列動態(tài)對象較多稱為高動態(tài)環(huán)境。
在選定的3個動態(tài)序列上分別運(yùn)行VINS-MONO和本文提出的DVI-SLAM系統(tǒng)。并把這兩個系統(tǒng)運(yùn)行估計的運(yùn)動軌跡與地面真實(shí)值繪制在一個圖中。為了更清晰直觀展示對比效果,將三維軌跡投影到二維平面中,以定性和直觀的方式展示兩個系統(tǒng)的定位精度。兩個系統(tǒng)估計的運(yùn)動軌跡對比結(jié)果如圖7所示。通過圖7可以看出,在低動態(tài)的場景下VINS-MONO和DVI-SLAM都可以回到出發(fā)原點(diǎn);而在高動態(tài)的場景下,VINS-MONO的軌跡會發(fā)生偏移而無法正?;氐匠霭l(fā)原點(diǎn);DVI-SLAM則偏移較小。
圖7 在3個動態(tài)序列中兩個系統(tǒng)的測試結(jié)果對比
由于TUM-VI數(shù)據(jù)集中的Slides1、Slides2和Slides3這3個動態(tài)序列,只給出了開始和結(jié)束的地面真實(shí)軌跡,位置如圖7中的虛線框處,兩個系統(tǒng)的軌跡與真實(shí)軌跡對比如圖8所示,其中粗虛線表示真實(shí)軌跡,點(diǎn)虛線表示
圖8 3個序列開始和結(jié)束階段地面真實(shí)軌跡的對比
VINS-MONO的軌跡,實(shí)線表示DVI-SLAM的軌跡。若軌跡與給出的地面真實(shí)軌跡重合度越高,表示SLAM系統(tǒng)的位姿估計更準(zhǔn)確。通過對圖8分析可知,在低動態(tài)序列Slides1中兩個系統(tǒng)的軌跡都非常接近地面真實(shí)值。而在高動態(tài)的Slides2和Slides3序列中,本文提出的DVI-SLAM系統(tǒng)與地面真實(shí)值更接近;而VINS-MONO估計的軌跡與地面真實(shí)值之間的差距較大,軌跡的偏移較大。這是因?yàn)?VINS-MONO僅僅通過使用RANSAC方法粗略的將誤匹配特征點(diǎn)去除,并沒有針對性的考慮移動對象對SLAM系統(tǒng)的影響。相反,新提出的DVI-SLAM系統(tǒng)針對性的對動態(tài)特征進(jìn)行檢測與去除,并改進(jìn)了后端非線性優(yōu)化,提高了系統(tǒng)的定位精度,減小了軌跡的偏移。
為了對提出的DVI-SLAM系統(tǒng)做進(jìn)一步的定性比較,以驗(yàn)證在動態(tài)環(huán)境中的性能。本文使用絕對軌跡誤差A(yù)TE(absolute trajectory error)的RMSE(root mean square error)作為本文實(shí)驗(yàn)的定性評估指標(biāo)。絕對軌跡誤差直接計算系統(tǒng)所估計的相機(jī)位姿于數(shù)據(jù)集提供的真實(shí)軌跡之間的差。首先,通過時間戳將估計位置與真實(shí)位置進(jìn)行對齊,然后,分別計算每對位姿的差值。絕對軌跡誤差的定義如下
(13)
式中:Qi為真實(shí)的位姿,Pi為估計位姿,并通過變換矩陣T將兩者對齊。獲得每幀的絕對軌跡誤差之后,求其均方根誤差
(14)
對于每種方法,都會在相應(yīng)序列運(yùn)行5次,以獲得RMSE的中位數(shù)、均值、最小和最大值,以降低偶然因素對實(shí)驗(yàn)定性測試的影響。結(jié)果見表1。為了更直觀展示DVI-SLAM較VINS-MONO在相應(yīng)序列的改進(jìn)情況,在表2中展現(xiàn)了提升的百分比。
根據(jù)表1和表2,可以看到在低動態(tài)序列Slides1中,這兩種方法的結(jié)果非常接近,VINS-MONO的性能要稍好于DVI-SLAM。而在高動態(tài)的兩個序列中,DVI-SLAM系統(tǒng)與原始的VINS-MONO相比大大提高了系統(tǒng)的準(zhǔn)確性,測試的所有參數(shù),中位數(shù)、均值、最小和最大RMSE都有很大幅度得提升。這說明了本文改進(jìn)后的視覺慣性SLAM算法,在動態(tài)環(huán)境中展現(xiàn)了更好的性能。因此驗(yàn)證了提出的DVI-SLAM系統(tǒng)在高動態(tài)的環(huán)境中實(shí)現(xiàn)了較高的定位精度。
為了更全面驗(yàn)證本文提出系統(tǒng)在動態(tài)環(huán)境中的性能,將本文的方法與已經(jīng)發(fā)表論文中的實(shí)驗(yàn)結(jié)果進(jìn)行比較。進(jìn)行對比的系統(tǒng)均在TUM-VI動態(tài)序列中測試過的視覺慣性SLAM:OKVIS、ROVIO[22],這兩個系統(tǒng)沒有對動態(tài)物體進(jìn)行針對處理。選擇DVI-SLAM在測試實(shí)驗(yàn)中RMSE的中位數(shù)作為對比值。比較結(jié)果見表3。
通過表3,可以看出本文提出的系統(tǒng)在動態(tài)環(huán)境中的軌跡的誤差遠(yuǎn)優(yōu)于OKVIS、ROVIO??梢则?yàn)證提出的DVI-SLAM系統(tǒng)在動態(tài)環(huán)境中的性能要優(yōu)于上述兩種視覺慣性SLAM系統(tǒng)。
本文提出一個適用于動態(tài)場景的視覺慣性SLAM——DVI-SLAM。通過在視覺前端添加動態(tài)檢測模塊,用于檢測動態(tài)特征,同時統(tǒng)計每幀靜態(tài)特征點(diǎn)所占的比重,用于后端非線性優(yōu)化過程中自適應(yīng)調(diào)整視覺信息的權(quán)重。在高動態(tài)的環(huán)境中,由于添加了慣性傳感器,當(dāng)相機(jī)提取的有效特征點(diǎn)不足的情況下,也可以通過IMU的測量信息在短時間內(nèi)進(jìn)行有效定位,這提高了系統(tǒng)在動態(tài)環(huán)境中的魯棒性。為了驗(yàn)證提出系統(tǒng)的有效性,在公開的TUM-VI數(shù)據(jù)集中進(jìn)行了相關(guān)實(shí)驗(yàn),并與最新的視覺慣性SLMA做了對比分析。實(shí)驗(yàn)結(jié)果表明,在高動態(tài)序列中,DVI-SLAM相對于VINS-MONO的定位精度提升了平均47.34%。
表1 RMSE實(shí)驗(yàn)數(shù)據(jù)對比
表2 較VINS-MONO提升的百分比
表3 與最新視覺慣性SLAM系統(tǒng)的RMSE數(shù)據(jù)對比