王 均,凌有鑄*,王 靜
(1.安徽工程大學(xué) 電氣工程學(xué)院,安徽 蕪湖 241000;2.巢湖學(xué)院 電子工程學(xué)院,安徽 巢湖 238000)
移動機(jī)器人在未知環(huán)境中運(yùn)動時逐步構(gòu)建環(huán)境地圖,同時運(yùn)用此地圖對機(jī)器人進(jìn)行位姿估計,即運(yùn)動機(jī)器人的同時定位和地圖創(chuàng)建(SLAM)。一般的地圖構(gòu)建和定位系統(tǒng)需要有環(huán)境的先驗(yàn)信息或者環(huán)境的模型,但是SLAM系統(tǒng)在地圖信息和機(jī)器人位置不明確的情況下仍然可以工作,即使在環(huán)境改變的情況下仍然可以工作。對SLAM問題的解決方法運(yùn)用最為廣泛的是基于數(shù)學(xué)概率的方法[1]。數(shù)學(xué)概率方法的實(shí)現(xiàn)是建立在傳感器平臺上的,傳感器雖然類型和能力各有不同,但是都存在使用限制和不同程度的噪聲,因此使用精準(zhǔn)的傳感器是提高機(jī)器人SLAM的精度和可靠性的一個方法[2]。自然界中的生物采用完全不同的辦法來解決這個問題,它們不需要高精度的傳感設(shè)備就可以在復(fù)雜環(huán)境中進(jìn)行地圖構(gòu)建和導(dǎo)航。這是因?yàn)閯游锞邆渫降貓D構(gòu)建和導(dǎo)航的能力[3]。受動物空間認(rèn)知的啟發(fā),在過去的幾十年里,許多研究者都在研究動物是如何感知、存儲和維持空間認(rèn)知的。生物的這種能力為SLAM在移動機(jī)器人中的應(yīng)用指示了研究方向[4]。
澳大利亞學(xué)者M(jìn)ichael[5-7]等就提出一種嚙齒動物海馬區(qū)擴(kuò)展模型(RatSLAM),該模型通過頭方向細(xì)胞和位置細(xì)胞網(wǎng)絡(luò)的融合構(gòu)建位姿感知細(xì)胞網(wǎng)絡(luò),將路徑積分和視覺關(guān)聯(lián)過程集成到位姿細(xì)胞模型中。然而,位姿感知細(xì)胞矩陣中最終的空間表征是不連續(xù)的,RatSLAM表征也會出現(xiàn)兩種附加現(xiàn)象:沖突和多沖表示。研究者們?yōu)榻鉀Q這三個問題,在RatSLAM基礎(chǔ)上根據(jù)機(jī)器人位姿表征和環(huán)境表征的對應(yīng)關(guān)系,擴(kuò)展出一種經(jīng)歷制圖算法,該算法直接存儲了環(huán)境空間、時間、機(jī)器人視覺、行為和變化等信息[8-9]。
RatSLAM算法的經(jīng)驗(yàn)圖中的活動具有一些幾何屬性,但仍然不能以人類可讀的形式表示,文獻(xiàn)[10]引入了一個“RatChat”的新系統(tǒng),利用語言游戲范式構(gòu)建空間概念作為交流基礎(chǔ),實(shí)現(xiàn)了人類與機(jī)器人的交流。文獻(xiàn)[11]將RatSLAM算法的基本原理與標(biāo)準(zhǔn)的概率SLAM算法進(jìn)行了比較,訓(xùn)練出一種新的非貝葉斯因果更新過濾器,并通過實(shí)驗(yàn)證明了它在功能上可以代替RatSLAM算法的核心。文獻(xiàn)[12-13]在RatSLAM算法的基礎(chǔ)上加入了多傳感器融合,同時介紹了一種基于運(yùn)動的自動校準(zhǔn)技術(shù),該技術(shù)可以校準(zhǔn)位置識別和自動過程,并在室內(nèi)和室外環(huán)境中都驗(yàn)證了方案的可行性。文獻(xiàn)[14]通過調(diào)整給定的約束條件,將RatSLAM系統(tǒng)用于人形機(jī)器人平臺。此外還引入了一種多重假設(shè)建圖技術(shù),這種算法在同一時間跟蹤多個空間機(jī)器人的假設(shè)位置,并對它們的合理性進(jìn)行加權(quán),從而提高了開放空間建圖的魯棒性。文獻(xiàn)[15]將RatSLAM系統(tǒng)中經(jīng)驗(yàn)地圖算法用于RGBD-SLAM算法,解決了RGBD-SLAM算法中需要連續(xù)的圖像流的問題,克服了由無特征的表面生成的模糊數(shù)據(jù)的問題,并通過實(shí)驗(yàn)驗(yàn)證了算法融合的可行性。
近年來,基于特征的視覺SLAM方法在SLAM領(lǐng)域得到了廣泛應(yīng)用。SIFT[16-17]特征經(jīng)過十幾年的發(fā)展已取得巨大成功,是一種非常流行和實(shí)用的視覺處理算法。SIFT描述符由128維向量表示,使其具有旋轉(zhuǎn)不變性等優(yōu)良性能,對光線變化也有魯棒性。同時其能夠比較方便地與其他相關(guān)的特征向量進(jìn)行融合。GIST[18-19]特征是模擬人的視覺特點(diǎn)提出的。利用多尺度多方向的Gabor濾波器組分別與圖像進(jìn)行卷積運(yùn)算,得到圖像的GIST特征。針對傳統(tǒng)RatSLAM算法中局部場景的形成和匹配過程中,沒有對場景的幾何處理和特征提取,導(dǎo)致其對光線變化的敏感性,以及不能識別已有模板圖像旋轉(zhuǎn)后的圖像的問題,研究在局部場景形成階段,分別提取局部場景圖像的GIST特征和SIFT特征,串行融合后形成局部場景特征模板存儲入局部場景細(xì)胞,改進(jìn)了原RatSLAM對光線變化敏感的問題,同時提高了檢測的準(zhǔn)確率。
圖1 RatSLAM模型
RatSLAM模型包括位姿感知細(xì)胞網(wǎng)絡(luò)、局部視圖細(xì)胞以及局部場景細(xì)胞和位姿細(xì)胞共同作用形成的經(jīng)歷圖,模型如圖1所示。
(1)興奮度更新。創(chuàng)建興奮度權(quán)重矩陣εabc:
(1)
式中,a、b、c為x′、y′、θ′的分布系數(shù);θ′維和(x′,y′)平面方差常數(shù)分別是kθ′和kx′y′;位姿感知細(xì)胞活性因興奮性致使的變化ΔPx′y′θ′:
(2)
式中,(x′,y′,θ′)空間中位姿感知細(xì)胞的三維矩陣元素分別為Nx′,Ny′,Nθ′。
(3)
式中,φ為抑制常數(shù),控制全局抑制水平。
(4)
歸一化可以使獲得積分路徑輸入和視覺輸入后的位姿細(xì)胞總活性在0~1之間。
(5)
(6)
式中,Px′y′θ′為位姿感知細(xì)胞的活動水平;Vi為局部場景細(xì)胞的活動水平。
經(jīng)歷由位姿感知細(xì)胞和局部場景細(xì)胞中的活性驅(qū)動產(chǎn)生。當(dāng)已有的經(jīng)歷集不足以描述機(jī)器人的活動狀態(tài)時,就將產(chǎn)生一個新的經(jīng)歷。第i個經(jīng)歷如式(7)所示。
ei={Ei,Pi,Vi},
(7)
(8)
RatSLAM中局部場景由一個一維細(xì)胞單元陣列組成,其中細(xì)胞單元對應(yīng)存儲著特征值模板。將照相機(jī)采集到的圖像轉(zhuǎn)換為灰度圖像,分別提取圖像的GIST特征和SIFT特征,并將向量標(biāo)準(zhǔn)化到(0,1)的范圍內(nèi),串行融合組成局部場景特征模板。融合后的RatSLAM技術(shù)路線如圖2所示。
圖2 技術(shù)路線
GIST特征的核心是通過Gabor變換提取全局特征。先對輸入圖像預(yù)處理,之后利用多尺度多方向的Gabor濾波器組分別與圖像進(jìn)行卷積運(yùn)算,得到圖像的全局特征。二維Gabor變換核函數(shù)表達(dá)式為:
gmn(x,y)=a-mgσx′σy′ω(x′,y′),a>1,
(9)
(10)
x′=a-m(x·cosθ+y·sinθ),
(11)
y′=a-m(-x·sinθ+y·cosθ),
(12)
(13)
式中,x、y為像素點(diǎn)的位置信息;σx和σy分別為沿x和y方向上的高斯標(biāo)準(zhǔn)差;n為方向數(shù);m為尺度數(shù);a-m為尺度變換系數(shù)(尺度因子)。
將一幅灰度圖像I(x,y)劃分成大小相等的4×4個網(wǎng)格,每個小塊圖像大小為h×d,對每個小塊圖像用4個尺度8個方向的Gabor濾波器組進(jìn)行卷積濾波,并將濾波后的結(jié)果級聯(lián)起來,形成該小塊的特征。將上述每一小塊計算出的特征值取平均值,得到該小塊的Gist特征:
(14)
式中,nc=m×n為濾波器個數(shù)。整幅圖像的Gist特征由每一小塊計算出的32個平均特征值級聯(lián)得到,其維數(shù)為4×4×32=512維。
SIFT算法在圖像與高斯函數(shù)卷積生成的尺度空間中尋找極值點(diǎn)來確定關(guān)鍵點(diǎn)位置,然后計算關(guān)鍵點(diǎn)周圍的梯度信息,進(jìn)而生成SIFT特征描述子。SIFT特征描述子對旋轉(zhuǎn)、尺度縮放、亮度變化等保持很好的不變性。
尺度空間L(x,y,σ)是由高斯函數(shù)G(x,y,σ)與二維圖像I(x,y)卷積生成。
L(x,y,σ)=G(x,y,σ)·I(x,y),
(15)
(16)
式中,x、y為像素點(diǎn)的位置信息;σ是尺度空間因子。
構(gòu)建高斯差分(Difference of Gaussian,DOG)金字塔D(x,y,σ),比較每個點(diǎn)與其相鄰的尺度和上下相鄰位置共計26個特征點(diǎn)的值,當(dāng)某點(diǎn)為最大值或最小值時,則該點(diǎn)是該尺度下的一個特征點(diǎn)。DOG算子定義如下:
D(x,y,σ)=(G(x,y,kσ)-G(x,y,σ))·I(x,y)=L(x,y,kσ)-L(x,y,σ),
(17)
其中,k為相鄰尺度空間的倍數(shù)。利用特征點(diǎn)相鄰的鄰域點(diǎn)梯度方向分布特性為每一個特征點(diǎn)確定方向信息,其中包括了特征點(diǎn)的梯度值m(x,y)與方向θ(x,y)。
(18)
(19)
以關(guān)鍵點(diǎn)為中心劃分為16個子塊,計算各子塊8個方向的梯度累加值,并繪制梯度方向直方圖,得到一個128維的描述子向量,最后將特征向量的模長做歸一化處理。
設(shè)該圖像的GIST特征向量為:Xgist=[X11,X12,…,X1n],SIFT特征向量為:Xsift=[X21,X22,…,X2m],串行融合后形成局部場景特征模板為:X=[Xgist,Xsift]。
使用歐氏距離來評估新的模板和之前學(xué)習(xí)的模板之間的相似程度。若超過閾值,就會學(xué)習(xí)到新的局部場景特征模板,否則,被認(rèn)為是匹配的。一個新的局部場景特征模板只有在當(dāng)前的局部場景特征模板沒有匹配的情況下才會被學(xué)習(xí)。
實(shí)驗(yàn)采用移動機(jī)器人平臺“旅行家Ⅱ號”,平臺上搭載了編碼器、視覺傳感器、激光傳感器、聲吶傳感器、電子羅盤。移動機(jī)器人實(shí)驗(yàn)平臺如圖3所示。實(shí)驗(yàn)場景選取9 m×6 m的會議室環(huán)境。實(shí)驗(yàn)內(nèi)容為機(jī)器人在環(huán)境中行走兩圈之后改變環(huán)境光線,同時通過攝像頭采集圖像并將采集信息傳輸至上位機(jī),進(jìn)行仿真實(shí)驗(yàn)。
圖3 實(shí)驗(yàn)平臺
第一圈中相鄰幀的SIFT特征提取與匹配如圖4a所示。第一圈與改變光線之后的第三圈形成閉環(huán)位置的SIFT特征提取與匹配如圖4b所示。SIFT特征旋轉(zhuǎn)不變性能強(qiáng),一定程度上也能對抗光線變化。第一圈中相鄰幀的GIST特征如圖5a、圖5b所示。第三圈在與第一圈形成閉環(huán)處的GIST特征如圖5c所示。
圖4 SIFT特征提取與匹配
圖5 GIST特征提取
RatSLAM模型經(jīng)驗(yàn)節(jié)點(diǎn)匹配圖如圖6所示。在前兩圈的實(shí)驗(yàn)中,RatSLAM模型能夠一定程度的匹配局部場景模板,但是第三圈改變環(huán)境光線之后,RatSLAM模型匹配局部場景模板數(shù)量降低,后續(xù)匹配效果變差。RatSLAM+SIFT模型經(jīng)驗(yàn)節(jié)點(diǎn)匹配圖如圖7所示。RatSLAM+GIST模型經(jīng)驗(yàn)節(jié)點(diǎn)匹配圖如圖8所示。相較于RatSLAM模型,兩組實(shí)驗(yàn)中檢測到的閉環(huán)數(shù)量都有所增加。其中,RatSLAM+SIFT模型第二圈實(shí)驗(yàn)效果較好,RatSLAM+GIST模型在改變環(huán)境光線之后的第三圈匹配效果較好。特征融合的RatSLAM模型經(jīng)驗(yàn)節(jié)點(diǎn)匹配圖如圖9所示。在前兩圈的實(shí)驗(yàn)中,特征融合的RatSLAM模型相較于前三組實(shí)驗(yàn)有更多的經(jīng)驗(yàn)節(jié)點(diǎn)匹配到局部場景模板,第三圈改變環(huán)境光線之后,也能很好地完成閉環(huán)檢測。
圖6 RatSLAM模型經(jīng)驗(yàn)節(jié)點(diǎn)匹配圖圖7 RatSLAM+SIFT模型經(jīng)驗(yàn)節(jié)點(diǎn)匹配圖
圖8 RatSLAM+GIST模型經(jīng)驗(yàn)節(jié)點(diǎn)匹配圖圖9 特征融合的RatSLAM模型經(jīng)驗(yàn)節(jié)點(diǎn)匹配圖
RatSLAM模型和特征融合的RatSLAM模型準(zhǔn)確率與召回率的對比如表1所示。由表1可知,RatSLAM模型的準(zhǔn)確率與召回率分別為65%和49%,RatSLAM+SIFT模型的準(zhǔn)確率與召回率分別為84%和83%,RatSLAM+GIST模型的準(zhǔn)確率與召回率分別為79%和88%,融合特征點(diǎn)的RatSLAM模型準(zhǔn)確率和召回率分別為91%和82%。相較于RatSLAM模型,特征融合的RatSLAM模型準(zhǔn)確率和召回率都得到提升。
表1 RatSLAM模型和特征融合的RatSLAM模型性能對比
RatSLAM模型構(gòu)建的經(jīng)歷圖與真實(shí)軌跡對比如圖10a所示,特征融合的RatSLAM模型經(jīng)歷圖與真實(shí)軌跡對比如圖10b所示。由圖10可知,RatSLAM模型在第三圈光線變化之后,經(jīng)歷圖產(chǎn)生了偏移,而特征融合的RatSLAM模型的經(jīng)歷圖更符合實(shí)際軌跡。
圖10 RatSLAM模型經(jīng)歷、特征融合的RatSLAM模型經(jīng)歷與真實(shí)軌跡對比圖
研究中提出的特征融合的RatSLAM算法改進(jìn)了現(xiàn)有RatSLAM仿生算法下由于光線變換等狀況造成的導(dǎo)航不穩(wěn)定的問題,系統(tǒng)魯棒性增強(qiáng),同時提高了系統(tǒng)檢測的準(zhǔn)確率。當(dāng)前的融合算法給定識別閾值,若系統(tǒng)自動調(diào)整識別閾值是否能夠提高召回率,以及如何通過現(xiàn)有的圖像處理技術(shù)與仿生算法相融合的手段處理復(fù)雜環(huán)境,這些仍值得進(jìn)一步研究。