馬 凱,林義忠 (廣西大學(xué) 機(jī)械工程學(xué)院,廣西 南寧530004)
隨著機(jī)器視覺技術(shù)和移動(dòng)機(jī)器人技術(shù)的發(fā)展,將二者結(jié)合已經(jīng)成為研究的一個(gè)新領(lǐng)域,通過視覺技術(shù)實(shí)現(xiàn)機(jī)器人的自主導(dǎo)航功能,從而使機(jī)器人更加自動(dòng)化與智能化。目前視覺導(dǎo)航正逐步走出實(shí)驗(yàn)室并表現(xiàn)出很好的發(fā)展前景[1-4]。
移動(dòng)機(jī)器人視覺技術(shù)即為機(jī)器人配置視覺裝置,通過攝像頭采集環(huán)境圖像信息,對(duì)采集到的信息進(jìn)行處理,轉(zhuǎn)化為計(jì)算機(jī)可以使用的地圖數(shù)據(jù),然后對(duì)數(shù)據(jù)進(jìn)行整合分析,最終通過含一定約束的計(jì)算為機(jī)器人到達(dá)目的地規(guī)劃出一條合適的路徑。
圖1 視覺導(dǎo)航關(guān)鍵技術(shù)
視覺定位是指通過移動(dòng)機(jī)器人上固定的視覺傳感器感知周圍環(huán)境信息,然后通過一系列的濾波降噪處理提取出環(huán)境特征信息,最后通過圖像處理技術(shù)和機(jī)器視覺技術(shù)計(jì)算移動(dòng)機(jī)器人的位姿。基于環(huán)境模型的定位方法主要有兩種方式:相對(duì)定位和絕對(duì)定位[5]。相比于激光和紅外超聲傳感器,視覺傳感器有著價(jià)格低、精度高、信息豐富等特點(diǎn)。
相對(duì)定位方法又稱航跡推算,通常是已知初始位姿,通過計(jì)算采集到的相鄰兩幀圖像之間的相對(duì)位姿,由前一幀位姿估算下一幀位姿,繼而推算整個(gè)運(yùn)動(dòng)軌跡,這一過程構(gòu)成視覺里程計(jì)。視覺里程計(jì)可不受輪子打滑漂移等影響,提高了系統(tǒng)精度。由于相對(duì)誤差是針對(duì)前一幀的結(jié)果,故常需要配合其他傳感方式消除由增量式計(jì)算方法造成的累積誤差。視覺里程計(jì)最早由Matthies等人[6]提出并設(shè)計(jì)了由特征值提取和特征匹配以及跟蹤到運(yùn)動(dòng)估計(jì)的原始模型。趙黎明[7]通過改進(jìn)SIFT算法對(duì)原始模型進(jìn)行了優(yōu)化,提高了系統(tǒng)的實(shí)時(shí)性,減小了實(shí)際偏差。
絕對(duì)定位方法又稱全局定位,該方法不要求知道機(jī)器人的初始位姿而能確定任意時(shí)刻機(jī)器人的位姿。通過攝像頭采集周圍環(huán)境信息,提取環(huán)境特征。導(dǎo)航定位的方案選取很大程度取決于所處環(huán)境,通常分為基于視覺路標(biāo)定位和基于環(huán)境場(chǎng)景的特征匹配定位[8]路標(biāo)定位方法利用路標(biāo)的顏色信息,通過圖像分割技術(shù)來確定出路標(biāo)的相對(duì)位置。環(huán)境場(chǎng)景特征匹配定位是利用攝像頭拍攝周圍環(huán)境,然后與地圖中的關(guān)鍵圖像庫進(jìn)行匹配,從而確定自身定位。王家恩等[9]提出一種基于QR碼視覺定位復(fù)合導(dǎo)航方法。結(jié)合制造工位離散特點(diǎn)和機(jī)器人差速運(yùn)動(dòng)模型,利用離散QR碼構(gòu)建地面柵格地圖;通過視覺定位QR碼特征并提取機(jī)器人相對(duì)地標(biāo)偏差,將此偏差作為地標(biāo)間微機(jī)電系統(tǒng)(MEMS)慣性傳感器軌跡推算的初始值,消除地標(biāo)間行駛的累積誤差。實(shí)驗(yàn)表明,復(fù)合導(dǎo)航方法使機(jī)器人1m/s速度和1.2m地標(biāo)間距下的側(cè)向距離偏差均值為8mm,方向偏差最大值在1°范圍內(nèi)。Royer等[10]提出了一種單目視覺訓(xùn)練導(dǎo)航方法,該方法的思路是先學(xué)習(xí)并建立完整地圖,然后利用建立好的地圖導(dǎo)航。通常是先將機(jī)器人置于環(huán)境中通過機(jī)器人的提前學(xué)習(xí),感知并建立周圍環(huán)境的三維模型。并在三維模型中標(biāo)記出一些具有特殊特征的位置提供給后續(xù)導(dǎo)航使用。在導(dǎo)航階段,便可利用已經(jīng)學(xué)習(xí)并有標(biāo)記的環(huán)境三維模型,通過關(guān)鍵幀的匹配進(jìn)行定位,從而確定任意時(shí)刻在環(huán)境中的位姿。
目前,針對(duì)實(shí)際情況,在導(dǎo)航中的地圖主要分為柵格地圖、幾何地圖、拓?fù)涞貓D以及綜合幾種地圖優(yōu)勢(shì)的混合地圖。
目前在移動(dòng)機(jī)器人上應(yīng)用得最為普遍的基于柵格地圖的路徑規(guī)劃算法是由Elfes和Moravec提出[11-12]。柵格地圖是將環(huán)境視為平面上的多個(gè)柵格,通過每個(gè)柵格攜帶的二值信息,來表征該空格區(qū)域是可行區(qū)域還是障礙區(qū)域[13],從而形成整個(gè)環(huán)境的障礙物信息,為后續(xù)的路徑規(guī)劃提供依據(jù)。柵格地圖表現(xiàn)形式直觀,創(chuàng)建和維護(hù)都比較容易,當(dāng)柵格太小時(shí),由于每個(gè)柵格內(nèi)都會(huì)占據(jù)一定的內(nèi)存空間,將會(huì)導(dǎo)致整個(gè)系統(tǒng)過大,在導(dǎo)航時(shí)會(huì)影響系統(tǒng)的搜索效率,導(dǎo)致實(shí)時(shí)性差。過大的柵格將會(huì)使得實(shí)際地圖中相鄰區(qū)域的信息變得模糊,嚴(yán)重的甚至?xí)霈F(xiàn)表征錯(cuò)誤,影響導(dǎo)航的準(zhǔn)確性,因此在使用時(shí)需要選取大小合適的柵格[14]。
幾何地圖是通過常見的幾何特征去擬合障礙物信息,比如常見的點(diǎn)特征、直線特征、平面特征等來搭建環(huán)境的主要環(huán)境框架,因此需要知道這些特征在處于環(huán)境中的具體位置[15]?;趲缀蔚貓D進(jìn)行定位是通過對(duì)攝像頭觀測(cè)到的環(huán)境數(shù)據(jù)進(jìn)行度量,并與搭建的環(huán)境框架進(jìn)行比較,通過特征估計(jì)技術(shù)來確定機(jī)器人在環(huán)境中的具體位置來實(shí)現(xiàn)定位[16]。
用拓?fù)涞慕Y(jié)構(gòu)來表示環(huán)境地圖并用于移動(dòng)機(jī)器人導(dǎo)航定位的概念最早由Mataric&Kuipers提出[17]。拓?fù)鋱D由許多關(guān)鍵節(jié)點(diǎn)和連接這些節(jié)點(diǎn)的線條來描述環(huán)境,可以很形象的表示環(huán)境的拓?fù)浣Y(jié)構(gòu)。其中,節(jié)點(diǎn)代表環(huán)境中的地點(diǎn),線條表示機(jī)器人可以在連接的節(jié)點(diǎn)間運(yùn)動(dòng)。拓?fù)涞貓D能夠?yàn)闄C(jī)器人在節(jié)點(diǎn)間的移動(dòng)提供節(jié)點(diǎn)間距離及方位等信息。拓?fù)涞貓D的特點(diǎn)是抽象、占用內(nèi)存空間很小、搜索時(shí)間短、運(yùn)用于導(dǎo)航定位系統(tǒng)的實(shí)時(shí)性較好。此外,運(yùn)用拓?fù)涞貓D進(jìn)行導(dǎo)航定位的算法也經(jīng)歷了很長一段時(shí)間的發(fā)展,已經(jīng)形成了許多成熟高效的搜索和推理算法,可以很方便的調(diào)用。缺點(diǎn)是每次匹配都需要從最鄰近的拓?fù)涔?jié)點(diǎn)開始匹配[18]。
混合地圖主要包含3種形式:柵格—幾何地圖,幾何—拓?fù)涞貓D,柵格—拓?fù)涞貓D?;旌系貓D通常是考慮到具體場(chǎng)景下選擇最為適用的地圖,通常應(yīng)用于大場(chǎng)景下的環(huán)境表示。相比于單一地圖模式,混合地圖更具靈活性,準(zhǔn)確性和魯棒性[15]。
3)通過在軟件系統(tǒng)平臺(tái)和技術(shù)架構(gòu)中融入GIS,可保證大數(shù)據(jù)分析過程的可視化和分析結(jié)果時(shí)空位置動(dòng)態(tài)展示的可操作性和實(shí)用性。
基于視覺的室內(nèi)導(dǎo)航技術(shù)是通過攝像頭捕獲周圍環(huán)境信息,通過周圍障礙物與非障礙物的識(shí)別進(jìn)而規(guī)劃出一條可行的路徑,從而實(shí)現(xiàn)移動(dòng)機(jī)器人的自主導(dǎo)航。常見的移動(dòng)機(jī)器人視覺導(dǎo)航方法有:基于環(huán)境信息的地圖模型匹配,同步定位與地圖構(gòu)造以及不依賴地圖導(dǎo)航。
在導(dǎo)航前對(duì)工作環(huán)境特征進(jìn)行提取與處理,建立全局地圖,并將地圖存放在機(jī)器人的數(shù)據(jù)庫中,在導(dǎo)航過程中調(diào)用地圖進(jìn)行匹配定位。將攝像頭捕獲的圖像特征或路標(biāo)與庫中地圖進(jìn)行比對(duì),計(jì)算匹配的概率,進(jìn)而確定機(jī)器人的位姿,并通過規(guī)劃模塊規(guī)劃出合適的路徑。該導(dǎo)航技術(shù)過程可分為以下步驟[19]:
(1)圖像獲?。簲z像頭捕獲周圍環(huán)境的視頻圖像;
(2)路標(biāo)識(shí)別及檢測(cè):通過圖像處理技術(shù)對(duì)采集圖像進(jìn)行預(yù)處理;
(3)路標(biāo)匹配:將拍攝到的圖像與庫中圖像進(jìn)行匹配;
(4)位置計(jì)算:當(dāng)與庫中的特征或路標(biāo)匹配上后,系統(tǒng)會(huì)根據(jù)庫中信息計(jì)算出機(jī)器人此刻在環(huán)境中的位姿。
典型的地圖匹配定位方式有2種[15]:
(1)起點(diǎn)和地圖均已知。這種情況最為簡單,屬于局部定位。
(2)不知起點(diǎn),已知地圖。屬于全局定位,一般會(huì)引進(jìn)一些輔助方法,常見的輔助方法有添加人工信標(biāo),紅外或超聲波系統(tǒng)進(jìn)行輔助定位。
文獻(xiàn)[20]使用的是一種基于完整線段和特征點(diǎn)的匹配方法。由有向線段特征、點(diǎn)特征構(gòu)成環(huán)境全局地圖,匹配是基于特征點(diǎn)相對(duì)有向線段的相對(duì)位置關(guān)系。鄭宏等[21]為解決場(chǎng)景大且地圖已知時(shí)的導(dǎo)航問題,研制了一套由地圖編輯、地圖匹配與定位模塊以及多層遞階規(guī)劃模塊組成的導(dǎo)航控制系統(tǒng)。并通過實(shí)驗(yàn)驗(yàn)證了該系統(tǒng)的可行性。邱書波等[22]通過電子地圖輔助攝像頭識(shí)別地面標(biāo)識(shí)線來實(shí)現(xiàn)AGV的自主導(dǎo)航。通過地面標(biāo)識(shí)線以及電子地圖中已知絕對(duì)坐標(biāo)的標(biāo)識(shí)物兩個(gè)參數(shù)做為輸入,來實(shí)現(xiàn)系統(tǒng)的精確定位。并通過實(shí)驗(yàn)證明,該方案對(duì)于直線和曲線有著較好的跟蹤效果,方位偏差和橫向偏差都較好地滿足了實(shí)際使用需求。
也稱為SLAM(Simultaneous Localization and Map Building)技術(shù),是由Smith等人[23-24]提出,是目前移動(dòng)機(jī)器人的一個(gè)研究熱點(diǎn)。SLAM技術(shù)是指移動(dòng)機(jī)器人在不知道自身處于環(huán)境中位置的情況下,通過攝像頭不斷的觀察環(huán)境,增量式的構(gòu)建完整環(huán)境地圖。
文獻(xiàn)[25]最早使用RGBD相機(jī)對(duì)室內(nèi)環(huán)境進(jìn)行三維重建。通過計(jì)算圖像中的SIFT算子并結(jié)合深度圖像和RANSAN方法計(jì)算機(jī)器人的運(yùn)動(dòng)變換,然后進(jìn)一步計(jì)算得到精確位姿。文獻(xiàn)[26]提出一種基于信標(biāo)識(shí)別和雙目視覺的改進(jìn)SLAM算法,通過雙目相機(jī)采集立體圖像信息,檢測(cè)視覺信標(biāo)和提取ORB特征點(diǎn),根據(jù)信標(biāo)定位信息和特征點(diǎn)匹配信息解算相機(jī)位姿初值,基于圖優(yōu)化框架進(jìn)行局部位姿優(yōu)化和全局優(yōu)化,維護(hù)地圖點(diǎn)和關(guān)鍵幀數(shù)據(jù),從而實(shí)現(xiàn)較高精度的定位和地圖構(gòu)建,實(shí)驗(yàn)表明誤差控制在5cm以內(nèi)。
文獻(xiàn)[27]通過稠密圖像對(duì)準(zhǔn)的方式來進(jìn)行自身定位,并構(gòu)建出稠密的3D地圖。文獻(xiàn)[28]指出視覺SLAM中特征檢測(cè)與匹配,關(guān)鍵幀的選擇,閉環(huán)檢測(cè)方法三個(gè)關(guān)鍵問題以及單目、雙目和RGBD這幾種相機(jī)SLAM方案的優(yōu)缺點(diǎn)。Mur Artal等[29]提出了一種可以實(shí)現(xiàn)室內(nèi)SLAM的ORB-SLAM方法,該方法提取圖像關(guān)鍵幀進(jìn)行配準(zhǔn),能夠快速高效地進(jìn)行檢索與匹配。文獻(xiàn)[30]針對(duì)傳統(tǒng)視覺導(dǎo)航技術(shù)中ORB-SLAM算法的特征點(diǎn)分布均勻程度低、耗時(shí)長的缺點(diǎn),通過構(gòu)建尺度金字塔,設(shè)置感興趣區(qū)域,引入非極大值抑制方法。實(shí)驗(yàn)表明,特征點(diǎn)期望數(shù)值為3 000時(shí),特征點(diǎn)分布均勻程度提高71.13%,耗時(shí)降低比率為69.52。
這種方法中不需要構(gòu)建環(huán)境地圖,常用于避障環(huán)節(jié)。機(jī)器人的活動(dòng)取決于當(dāng)時(shí)攝像頭捕獲的環(huán)境障礙,而不必明確障礙物的絕對(duì)坐標(biāo)。通常分為3大類[15]:基于光流的導(dǎo)航技術(shù)、基于外觀信息的導(dǎo)航技術(shù)、基于目標(biāo)識(shí)別的導(dǎo)航技術(shù)和基于目標(biāo)跟蹤的導(dǎo)航技術(shù)。
移動(dòng)機(jī)器人視覺導(dǎo)航技術(shù)是一種快速發(fā)展,不斷成熟的技術(shù),也是移動(dòng)機(jī)器人智能化的體現(xiàn)。在總結(jié)了一些常見的移動(dòng)機(jī)器人視覺導(dǎo)航方案后,也綜述了三類導(dǎo)航方式。但是移動(dòng)機(jī)器人目前仍有著巨大的發(fā)展空間。目前的視覺導(dǎo)航技術(shù)通常需要在特定的場(chǎng)合下完成,而對(duì)于真實(shí)、復(fù)雜的環(huán)境下仍然不能很好的解決,如何使視覺導(dǎo)航方案適配于不同的復(fù)雜環(huán)境將有待解決。此外,光線對(duì)視覺效果會(huì)造成很大的影響,如何在圖像處理方面減小環(huán)境因素對(duì)方案造成的影響。其次,視覺導(dǎo)航過程中需要識(shí)別大量的環(huán)境信息,同時(shí)也需要處理、計(jì)算大量的數(shù)據(jù),因此,高效的計(jì)算速度和充足的運(yùn)行內(nèi)存是進(jìn)行大環(huán)境視覺導(dǎo)航的前提。隨著技術(shù)的不斷更新,移動(dòng)機(jī)器人視覺導(dǎo)航技術(shù)將會(huì)朝著定位更加精確,路徑更加優(yōu)化以及占用內(nèi)存更加合理的方向前進(jìn)。