倪詩翔,王偉強(qiáng),蘇衍宇,吳冬梅
(1.哈爾濱工業(yè)大學(xué)機(jī)器人技術(shù)及系統(tǒng)國家重點實驗室,黑龍江哈爾濱150001;2.解放軍電子工程學(xué)院,安徽合肥 230031)
面向室外環(huán)境的單機(jī)器人輻射場尋源算法
倪詩翔1,王偉強(qiáng)2,蘇衍宇1,吳冬梅1
(1.哈爾濱工業(yè)大學(xué)機(jī)器人技術(shù)及系統(tǒng)國家重點實驗室,黑龍江哈爾濱150001;2.解放軍電子工程學(xué)院,安徽合肥 230031)
隨著機(jī)器人技術(shù)的發(fā)展,自主移動機(jī)器人已經(jīng)成功運(yùn)用在危險生物、化學(xué)、輻射及火災(zāi)環(huán)境中,機(jī)器人的應(yīng)用有效降低了危險環(huán)境對人的危害。在熱輻射場、核輻射場、強(qiáng)電磁輻射場和聲場中使用機(jī)器人搜尋輻射源,能最大程度減少人暴露在輻射環(huán)境中的時間,同時,這種搜尋方式準(zhǔn)確、高效,具有極大的實用價值。
上述多種輻射場和聲場有類似的分布特性,即在空氣中輻射強(qiáng)度隨著距輻射源的距離增大按固定的規(guī)律遞減,遇到阻擋物時,發(fā)生反射、折射和衍射現(xiàn)象,阻擋物背后的強(qiáng)度分布呈不規(guī)則狀態(tài),且任意位置的強(qiáng)度分布無時變。因此,可以提出一種同時適用于上述4種輻射場的尋源算法。
目前,國際國內(nèi)對聲源和火源的定位搜尋研究較為成熟,對于放射源和其他電磁輻射源的搜尋研究尚處于起步階段[1]。對于聲源的搜尋,多采用麥克風(fēng)陣列的方法,利用多個聲音信號接收器來實現(xiàn)[2-4],而對于火源的搜尋,則多采用紅外探測器探測環(huán)境中溫度最高點來實現(xiàn)[5-6]?,F(xiàn)有的場源定位搜尋算法都需要一套龐大且復(fù)雜的系統(tǒng)作為支持,不能靠單個移動機(jī)器人來實現(xiàn),這使得尋源的成本極高,而且對于不同環(huán)境的適應(yīng)性極差。
針對上述2個問題,提出了一種基于高斯過程回歸,采用單個移動機(jī)器人實現(xiàn)對電磁輻射和聲輻射源進(jìn)行定位搜尋的方法,該尋源算法的實施不需要環(huán)境中復(fù)雜系統(tǒng)的支持,使得搜尋大大簡化。同時,通過對WiFi信號源搜尋的實驗,驗證了所提算法的有效性。
在某一存在輻射源的環(huán)境中,輻射強(qiáng)度值最大的一點就是輻射源所在點。根據(jù)已知的某些點的輻射強(qiáng)度值,運(yùn)用回歸方法可以預(yù)測出未知點的輻射強(qiáng)度值。
傳統(tǒng)的回歸方法有神經(jīng)網(wǎng)絡(luò)法和支持向量機(jī)法等,但是這些方法只輸出預(yù)測值,不能給出對預(yù)測值分布的估計。高斯過程回歸與傳統(tǒng)方法不同,不僅可以獲得預(yù)測值,同時也能得到預(yù)測值的分布情況,即高斯分布的均值和方差,這十分有利于對輻射源的搜尋。
高斯過程是一組隨機(jī)變量的集合,該集合中的任意有限個隨機(jī)變量都服從多元高斯分布,對于一個定義在指標(biāo)集{χ}上的高斯過程{g(x):x∈χ,g(x)∈R}而言,它的均值函數(shù)為:
根據(jù)高斯過程存在性定理,可以通過將任意的實函數(shù)和正定函數(shù)分別作為均值函數(shù)和協(xié)方差函數(shù),來構(gòu)造一個高斯過程:
p是構(gòu)造均值函數(shù)和協(xié)方差函數(shù)所用的參數(shù),其維數(shù)由選擇的函數(shù)決定。典型的協(xié)方差函數(shù)有線性函數(shù)、布朗運(yùn)動函數(shù)、平方指數(shù)高斯過程函數(shù)(SE函數(shù))和奧恩斯坦-烏倫貝克過程函數(shù)等。
1.2 預(yù)測
對于給定的訓(xùn)練集
xi和yi分別為自變量和因變量。n∈N1表示訓(xùn)練集的大小,高斯過程回歸模型假設(shè)它的各個因變量,是取樣自某未知分布的獨立同分布隨機(jī)變量,并將它描述為:
1.3 訓(xùn)練
訓(xùn)練集確定時,高斯過程回歸的預(yù)測結(jié)果由因變量的先驗分布決定。在選定均值函數(shù)和協(xié)方差函數(shù)后,該分部則由這2個函數(shù)和獨立噪聲的參數(shù)共同決定。這種定義先驗分布的參數(shù)被稱為超參數(shù),即:
因此,高斯過程回歸的訓(xùn)練過程包括2個環(huán)節(jié):
a.確定均值函數(shù)和協(xié)方差函數(shù)。
b.通過最大似然法確定超參數(shù)。
均值函數(shù)和協(xié)方差函數(shù)需要根據(jù)具體問題選定,超參數(shù)則常通過求解如下優(yōu)化問題獲得:
其中,L(θ)=-log p(^y=y(tǒng)|x),p(^y=y(tǒng)|x)是出現(xiàn)訓(xùn)練集樣本^y=y(tǒng)時先驗概率分布的概率密度函數(shù)值。
2.1 方法概論
本文所研究的控制算法主要分為2步:高斯過程回歸對平面輻射場的在線預(yù)測;求解最優(yōu)化問題獲得機(jī)器人的移動方向。算法的流程如圖1所示。
該算法的原理如下:
a.機(jī)器人進(jìn)入搜尋區(qū)域,測出其所在柵格的輻射場強(qiáng)值,獲取所在柵格鄰域(附近8個柵格)的信息,包括柵格中有無障礙物和各柵格已經(jīng)走過的次數(shù),使用高斯過程回歸預(yù)測出鄰域中各柵格場強(qiáng)的均值和方差。
b.機(jī)器人計算附近鄰域中各柵格的回報函數(shù),選取回報函數(shù)值最大的柵格作為下一步的路徑點。
c.機(jī)器人移動到下一個柵格,測量該柵格的場強(qiáng)值,獲取鄰域各柵格的信息,之后根據(jù)已知的全部實際場強(qiáng)值繼續(xù)預(yù)測附鄰域各柵格場強(qiáng)的均值和方差。
d.重復(fù)步步驟b和步驟c,直至機(jī)器人行走至輻射場強(qiáng)大于閾值的柵格。
圖1 算法流程
2.2 搜索區(qū)域的離散化
對于輻射源的搜尋,當(dāng)機(jī)器人到達(dá)與輻射源距離足夠小的位置時即可認(rèn)為搜尋成功,因此,采用參考文獻(xiàn)[8]的方法對搜索區(qū)域進(jìn)行離散化,用邊長lc的正方形柵格劃分搜索區(qū)域。在搜索過程中,機(jī)器人可以從一個柵格移動到另一個柵格,測量輻射強(qiáng)度值只在柵格的中心點處進(jìn)行,以該點的輻射強(qiáng)度值代表該柵格的輻射強(qiáng)度值。
在初始時刻,機(jī)器人對環(huán)境未知,機(jī)器人每行走一步可以通過自身的傳感器獲得附近8個柵格的信息,機(jī)器人的鄰域即定義為其附近的8個柵格。
假設(shè)一個矩形搜索區(qū)域在X和Y方向的長度分別為LX和LY,則X和Y方向可劃分的柵格數(shù)M、N分別為:
ceil(x)為取不小于x的最小整數(shù)。由此,定義搜索區(qū)域S為:
對于離散化的柵格,若某一柵格中存在障礙物則認(rèn)為該柵格不可進(jìn)入,將該柵格標(biāo)記為黑色,如果某一柵格中任何位置都不存在障礙物,則該柵格為可進(jìn)入柵格,將該柵格標(biāo)記為白色。
2.3 基于高斯過程回歸的環(huán)境輻射強(qiáng)度分布估計
為完成對輻射源的搜尋,需要得知輻射源在環(huán)境平面中的位置,故需要對環(huán)境平面的輻射強(qiáng)度分布進(jìn)行估計。解決這一問題的原理是讓機(jī)器人在環(huán)境平面不同位置測量輻射強(qiáng)度值,使用高斯過程回歸利用有限的信息推測全局信息。
定義高斯過程回歸的訓(xùn)練集為:
x1,x2分別為機(jī)器人所在點的笛卡爾坐標(biāo)值;Ix為x點處的實際輻射強(qiáng)度值。
使用高斯過程回歸,首先要確定均值函數(shù)和協(xié)方差函數(shù)。本文采用無阻擋環(huán)境下的輻射強(qiáng)度分布函數(shù)作為高斯過程回歸的均值函數(shù),采用平方指數(shù)函數(shù)作為協(xié)方差函數(shù),即
其中,σf值取8.2,l值取17。
對于給定的訓(xùn)練集D,高斯過程回歸針對8個預(yù)測點的輸出是均值μ和方差σ,μ表示場強(qiáng)的預(yù)測值,σ表示預(yù)測值的不確定度。
2.4 回報函數(shù)求解
回報函數(shù)U為3個函數(shù)的乘積,即
此處,u1(x*)為Deisenroth等提出的高斯過程信息熵[9],參數(shù)ρ和β控制機(jī)器人行走的趨勢,當(dāng)ρ較大時,機(jī)器人趨向于朝場強(qiáng)大的方向行走,當(dāng)β較大時,機(jī)器人趨向于朝信息量更大的方向行走。尋源過程中采用動態(tài)的ρ和β參數(shù)值,即
u2(x*)控制機(jī)器人向沒有走過的地方行走,其中n(x*)為機(jī)器人經(jīng)過x*點的次數(shù)。
u3(x*)實現(xiàn)機(jī)器人的避障性能,對于有障礙物的柵格,u3(x*)及U(x*)將始終為0。
機(jī)器人在某一個柵格處通過上式計算出附近8個柵格的回報函數(shù)后,選取回報函數(shù)值最大的柵格作為下一步的路徑點。
在真實的室外環(huán)境中驗證了基于高斯過程回歸的輻射源定位算法,并給出具體的實驗設(shè)置和實驗結(jié)果。
3.1 實驗設(shè)置
實驗環(huán)境為一個300 m×200 m的室外環(huán)境,如圖2所示。圖2中白色部分為道路,是機(jī)器人的可行域,其他部分是建筑物、樹叢以及河流等阻擋物,是不可通行的區(qū)域。黑色圓點處為輻射源所在位置,三角形處為機(jī)器人的初始位置。
圖2 搜索區(qū)域地圖
用邊長lc=5 m正方形柵格對地圖進(jìn)行柵格化,得到離散化的地圖如圖3所示。
圖3 柵格化的搜索區(qū)域
實驗所用機(jī)器人為實驗室研制的TJ-1機(jī)器人。機(jī)器人本體載有1臺PC機(jī)作為機(jī)器人的上位機(jī),激光測距儀(URG-04LX)用于檢測障礙物,WiFi信號接收器(TL-WN722N)作為輻射強(qiáng)度檢測儀,GPS定位器(MEMSICNAV 440,定位精度2.5 m)用于機(jī)器人定位。電磁波輻射源是TLWDR6500無線路由器,該路由器產(chǎn)生2.4 GHz的WiFi信號。
實驗中,以機(jī)器人所在柵格的笛卡爾坐標(biāo)值作為訓(xùn)練集的自變量,以接收到的WiFi信號的功率作為輻射強(qiáng)度值,即訓(xùn)練集的因變量,輻射強(qiáng)度的閾值設(shè)定為-42 dBm。由于機(jī)器人的起始位置接近地圖的左上角,因此在搜尋前假定放射源位于地圖的右下角,由此確定均值函數(shù)中的超參數(shù)為(56,38)。
3.2 實驗結(jié)果
機(jī)器人搜尋輻射源的過程如圖4所示。圖4a為搜尋初期,機(jī)器人向假定的輻射源所在位置靠近,同時獲得盡量多的環(huán)境信息,擴(kuò)大訓(xùn)練集。圖4b為搜尋的中期,機(jī)器人在探索更多的未知區(qū)域。圖4c為搜尋的后期,機(jī)器人在獲得了足夠大的訓(xùn)練集后,迅速靠近輻射源。圖4d為搜尋的結(jié)果,機(jī)器人最終停留在輻射源所在柵格中。
圖4 輻射源搜尋結(jié)果
將高斯過程回歸引入輻射源的搜尋,提出了一種全新的輻射場尋源算法,研究內(nèi)容包括:對搜索區(qū)域進(jìn)行柵格化,采用高斯過程回歸預(yù)測鄰域輻射強(qiáng)度值,通過求回報函數(shù)的最大值對機(jī)器人進(jìn)行局部軌跡規(guī)劃,通過多次局部軌跡規(guī)劃使機(jī)器人到達(dá)全局最優(yōu)點。
在提出算法后,通過WiFi輻射場尋源實驗驗證了算法的有效性。實驗結(jié)果證明,該算法能夠以單機(jī)器人在300 m×200 m的室外環(huán)境中定位WiFi信號源。算法對輻射源的定位精度取決于柵格的邊長lc。
[1] Krishnanand K N.Glowworm swarm optimization:a multimodal function optimization paradigm with applications to multiple signal source localization tasks[D].Indian:Department of Aerospace Engineering,Indian Institute of Science,2007.
[2] 趙秀粉.基于麥克風(fēng)陣列的聲源定位技術(shù)研究[D].成都:電子科技大學(xué),2013.
[3] Tuma J,Janecka P,Vala M,et al.Sound source localization[C]//2012 13th International Carpathian Control Conference(ICCC),2012:740-743.
[4] Valin J M,Michaud F,Rouat J,et al.Robust sound source localization using a microphone array on a mobile robot[C]//International Conference on Intelligent Robots and Systems,2003:1228-1233.
[5] Wang S,Berentsen M,Kaiser T.Signal processing algorithms for fire localization using temperature sensor arrays[J].Fire Safety Journal,2005,40(8):689-697.
[6] 康一梅,楊恩博,楊鑫凱.基于改進(jìn)蟻群算法的火源定位策略研究[J].計算機(jī)工程與應(yīng)用,2012,48(2):207-210.
[7] Seeger M.Gaussian processes for machine learning[J].International Journal of Neural Systems,2004,14(2):69-106.
[8] 王陽,孟慶浩,李騰,等.室內(nèi)通風(fēng)環(huán)境下基于模擬退火算法的單機(jī)器人氣味源定位[J].機(jī)器人,2013,35(3):283-291.
[9] Deisenroth M P,Rasmussen C E,Peters J.Gaussian process dynamic programming[J].Neurocomputing,2009,72(7):1508-1524.
A Radiation Source Searching Algorithm Used for a Single Robot in Outdoor Environment
NI Shixiang1,WANG Weiqiang2,SU Yanyu1,WU Dongmei1
(1.State Key Laboratory of Robotics and System,Harbin Institute of Technology,Harbin 150001,China;2.Electronic Engineering Institute of PLA,Hefei 230031,China)
針對室外熱輻射場、核輻射場、強(qiáng)電磁輻射場和聲場的輻射源搜尋,提出了一種基于高斯過程回歸的單機(jī)器人輻射源搜尋算法。首先將連續(xù)的搜尋環(huán)境離散化,采用高斯過程回歸預(yù)測機(jī)器人鄰域中的輻射強(qiáng)度,然后將局部路徑規(guī)劃考慮為一個優(yōu)化問題,求取優(yōu)化目標(biāo)函數(shù)的最大值獲得機(jī)器人的下一步路徑點,最后通過多次局部路徑規(guī)劃引導(dǎo)機(jī)器人到達(dá)全局最優(yōu)點。為驗證所提算法的有效性,在300 m×200 m的室外環(huán)境中進(jìn)行了實驗。
室外環(huán)境;單機(jī)器人;尋源算法;輻射場
Aiming at searching the source of thermal radiation fields,nuclear radiation fields,strong electromagnetic radiation fields and sound fields in outdoor environment,a source searching algorithm based on Gaussian Process Regression using a single robot is proposed.First of all,the continuous searching area is discretized with square grids,and the radiation intensity of adjacent grids is predicted by Gaussian Process Regression.Then a local path planning is considered to be an optimization problem and the next path point is obtained by solving the problem.Finally,the robot is guided to the global optimal point through repeated local path planning.To verify the proposed algorithm,an experiment in an environment of 300 m×200 m has been conducted.
outdoor environments;single robot;source searching algorithm;radiation field
TP241
A
1001-2257(2015)09-0067-05
倪詩翔(1990-),男,四川西昌人,碩士研究生,研究方向為特種環(huán)境移動機(jī)器人;王偉強(qiáng) (1976-),男,安徽合肥人,工程師,研究方向為建筑與環(huán)境建模技術(shù);蘇衍宇 (1986-),男,湖南株洲人,博士研究生,研究方向為智能機(jī)器人控制及工業(yè)自動化;吳冬梅 (1968-),女,黑龍江哈爾濱人,博士研究生導(dǎo)師,教授,研究方向為醫(yī)療機(jī)器人技術(shù)。
2015-04-27