蒲興成,張軍,張毅
(1.重慶郵電大學(xué)數(shù)理學(xué)院,重慶 400065;2.重慶郵電大學(xué)自動化學(xué)院,重慶 400065)
基于神經(jīng)網(wǎng)絡(luò)的改進行為協(xié)調(diào)控制及其在智能輪椅路徑規(guī)劃中的應(yīng)用
蒲興成1,張軍2,張毅2
(1.重慶郵電大學(xué)數(shù)理學(xué)院,重慶 400065;2.重慶郵電大學(xué)自動化學(xué)院,重慶 400065)
針對傳統(tǒng)的基于行為的智能輪椅的路徑規(guī)劃方法在室外非結(jié)構(gòu)環(huán)境下的路徑規(guī)劃效果差的問題,提出一種新的智能輪椅的路徑規(guī)劃算法.該算法利用模糊邏輯設(shè)計了基本控制行為,并在此基礎(chǔ)上結(jié)合大量實際經(jīng)驗使用神經(jīng)網(wǎng)絡(luò)設(shè)計了行為協(xié)調(diào)控制器.改進的算法將仲裁機制和命令融合機制2種行為協(xié)調(diào)方法有效結(jié)合起來,并吸收了這2種行為協(xié)調(diào)方法的優(yōu)點,從而改善了系統(tǒng)的反應(yīng)速度,極大提高了控制精確;另一方面,該算法還可以識別陷阱區(qū)域并通過自主改變行為的權(quán)重方法控制輪椅逃出陷阱區(qū)域,因而具備了較強的人工智能特征.仿真和實物實驗驗證了該算法智能性高且實現(xiàn)簡單,適用于室外非結(jié)構(gòu)化環(huán)境下的機器人路徑規(guī)劃.
機器人;智能輪椅;非結(jié)構(gòu)化環(huán)境;路徑規(guī)劃;神經(jīng)網(wǎng)絡(luò);行為協(xié)調(diào)控制器
路徑規(guī)劃是移動機器人領(lǐng)域的核心技術(shù)之一[1],其目的是在有障礙物的工作空間中,尋找一條從起始點到目標(biāo)點的最優(yōu)或者近似最優(yōu)路徑,該路徑是無碰的且一般為最短的.針對移動機器人的路徑規(guī)劃問題,國內(nèi)外許多學(xué)者進行了大量的研究,獲得了很多有效的控制方法.全局路徑規(guī)劃技術(shù)[2-4]已經(jīng)相對比較成熟,可以在環(huán)境信息已知的情形下獲得全局最優(yōu)路徑,現(xiàn)在比較活躍的領(lǐng)域是研究在未知環(huán)境中的局部路徑規(guī)劃[5].比較成熟的局部規(guī)劃算法有人工勢場法[6]、滾動窗口法[7]、神經(jīng)網(wǎng)絡(luò)方法[8]、粒子群算法[9]、遺傳算法[10]等,以上算法都存在各自的優(yōu)點和不足;但是其共同的缺點是以上各算法都是基于認(rèn)知模型的功能規(guī)劃法,這種基于感知—建模—規(guī)劃—動作的方法缺乏實際運行所需的靈活性和實時性[11].
近年來興起的基于行為的規(guī)劃方法完成了從感知到動作的直接映射,機器人要完成的任務(wù)由幾個單獨封裝的行為配合完成,機器人對外部環(huán)境反應(yīng)迅速、實時性好.自從 Brooks[11]提出 SA(simulated annealing)模型以來,SA模型得到了廣泛的應(yīng)用,其主要優(yōu)點是實現(xiàn)簡單、反映靈敏,缺點是多個行為之間的反復(fù)切換導(dǎo)致路線不夠平滑且在機器人運動中控制不夠精確.命令融合機制[13-17]的引入解決了這一問題,通過每一時刻多個行為相互配合得到最終輸出,常用模糊邏輯作為工具進行命令融合的設(shè)計,但是其缺點是設(shè)計復(fù)雜,有時控制器規(guī)則較多或者要求控制精確時,甚至導(dǎo)致控制失去實時性.為解決這一缺陷,筆者提出一種改進的行為協(xié)調(diào)機制,該機制利用BP網(wǎng)絡(luò)設(shè)計一個行為協(xié)調(diào)控制器,控制器將基于優(yōu)先級的方法和模糊命令融合的方法相結(jié)合,系統(tǒng)同時具備了二者的主要優(yōu)勢,具有較好的實時性,同時可以實現(xiàn)精確控制.當(dāng)機器人進入陷阱區(qū)域時,控制器可以識別陷阱區(qū)域并靈活地改變原有各個行為的控制權(quán)重,控制輪椅盡快逃離陷阱區(qū)域,進一步提高了系統(tǒng)的智能性.
智能輪椅在室外環(huán)境下完成自主導(dǎo)航,需要3個基本行為:目標(biāo)趨向行為、避障行為、沿墻走行為.考慮到模糊邏輯控制器設(shè)計的簡便性和控制的有效性,采用模糊邏輯對3種行為分別進行設(shè)計.本設(shè)計所涉及的智能輪椅的絕對坐標(biāo)系和體坐標(biāo)系如圖1所示.
圖1 智能輪椅的絕對坐標(biāo)系和體坐標(biāo)系Fig.1 Absolute and body coordinate systems of the intelligent wheelchair
圖1中X、Y軸組成絕對坐標(biāo)系,在實際應(yīng)用中,該坐標(biāo)系即為地球的經(jīng)緯度坐標(biāo)系,以X表示緯度,Y表示經(jīng)度.x、y軸組成智能輪椅的體坐標(biāo)系,其中x表示智能輪椅當(dāng)前的運動方向.di表示智能輪椅的各個超聲傳感器探測的障礙物的距離信息,d表示智能輪椅與目標(biāo)點之間的距離,φ表示輪椅當(dāng)前運動方向偏離目標(biāo)點的角度大小.
目標(biāo)趨向行為不考慮外界環(huán)境中障礙物的信息,只控制輪椅由任意位置向目標(biāo)點靠近.趨向行為的模糊控制器的輸入有2個:輪椅和目標(biāo)點之間的距離d,輪椅當(dāng)前運動方向和輪椅當(dāng)前位置及目標(biāo)點之間連線的夾角φ,輸出為輪椅運動速度VG和轉(zhuǎn)動速度WG.各語言變量的隸屬度函數(shù)如圖2所示.
圖2 趨向行為模糊控制器各輸入輸出變量的隸屬度函數(shù)Fig.2 Membership function graphs of input and output invariables of the fuzzy controller with trend behavioral
模糊規(guī)則如下:
避障行為通過傳感器檢測輪椅前方是否存在障礙物,如果有則通過合理的動作避過障礙物使得輪椅安全行進.避障行為的模糊控制器輸入為:左側(cè)傳感器的讀數(shù)dL、右側(cè)傳感器的讀數(shù)dR、前方傳感器的讀數(shù)dF,輸出為行進速度VO和轉(zhuǎn)動速度WO.各語言變量的隸屬度函數(shù)如圖3所示.
圖3 避障行為各語言變量的隸屬度函數(shù)Fig.3 Membership function graphs among language invariables of avoiding behavioral
模糊規(guī)則如下:
沿墻走行為可以使輪椅完成對障礙物邊沿的實時跟蹤.控制器的輸入是左右傳感器的讀數(shù)dL、dR,輸出為輪椅的行進速度VF和轉(zhuǎn)動速度WF,各語言變量的隸屬度函數(shù)與避障行為相同,模糊規(guī)則如下所示:
行為協(xié)調(diào)機制的實現(xiàn)方法通常分為基于仲裁和基于命令融合2類.基于仲裁的行為協(xié)調(diào)機制在一個時刻內(nèi)只允許一個行為實施控制,而命令融合則允許將多個行為的結(jié)果綜合成一個命令,每一個行為都對最終的控制產(chǎn)生貢獻.仲裁機制實現(xiàn)簡單、反應(yīng)迅速,但是由于在多個動作之間切換,機器人動作不夠平滑,而且由于每一時刻只有一個行為有控制權(quán),當(dāng)某一行為被執(zhí)行時會犧牲其他行為,該控制方法智能性較低,當(dāng)環(huán)境復(fù)雜時很容易導(dǎo)致路徑規(guī)劃失敗.命令融合機制可以克服以上缺點,這種方法動作輸出更平滑,控制更精確,智能性較高,但是命令融合反應(yīng)速度更慢,有時甚至失去實時性.考慮到以上因素,將二者有效結(jié)合可以獲得更好的控制效果.筆者設(shè)計的改進的行為協(xié)調(diào)控制器如圖4所示.
圖4 改進的行為協(xié)調(diào)控制器Fig.4 Improved behavioral coordinated controller
BP神經(jīng)網(wǎng)絡(luò)的輸入輸出變量如圖5所示.距離傳感器的信息和標(biāo)志變量I作為神經(jīng)網(wǎng)絡(luò)的輸入,各個行為的權(quán)重作為神經(jīng)網(wǎng)絡(luò)的輸出,該輸出可以和各個行為的輸出相結(jié)合從而得到整體的輸出,如式(1)所示.
圖5 神經(jīng)網(wǎng)絡(luò)的輸入輸出Fig.5 Input and output of neural network
另一方面,神經(jīng)網(wǎng)絡(luò)的輸出可以作為控制信號控制某個行為是否能夠被激活,當(dāng)某個行為的權(quán)值小于預(yù)設(shè)的閾值K時,該行為將不被激活.例如表1中,若K=0.01,則第1行所示外界環(huán)境下僅趨向行為被激活,第2行所示外界環(huán)境下所有行為均被激活,利用式(1)得到整體輸出.
表1 權(quán)值控制行為Table 1 Weight control behavior
該方法將仲裁機制和命令融合機制有效結(jié)合起來,訓(xùn)練后的神經(jīng)網(wǎng)絡(luò)根據(jù)外部環(huán)境的情形可以選擇全部或者部分行為的激活.例如:周圍沒有障礙物時能夠單獨執(zhí)行趨向行為,忽略避障和沿墻走行為,可以節(jié)省不必要的系統(tǒng)開銷,系統(tǒng)具有較快的反應(yīng)速度;如果附近有障礙物則可以綜合所有行為的結(jié)果得到整體的輸出,提高系統(tǒng)控制精度.
為進一步提高系統(tǒng)的智能性,行為協(xié)調(diào)控制器引入標(biāo)志變量I用以監(jiān)測輪椅是否進入陷阱區(qū)域,并執(zhí)行相應(yīng)的操作.系統(tǒng)控制流程圖如圖6所示.
圖6中,dt為t時刻輪椅與目標(biāo)點的距離,該距離可以通過GPS計算.dt+1為t的下一個采樣時刻輪椅與目標(biāo)點的距離.當(dāng)dt+1>dt時表示輪椅向著背離目標(biāo)點的方向運動,反映出輪椅進入了陷阱區(qū)域,此時將I賦值為y.當(dāng)I=y時,行為協(xié)調(diào)控制器監(jiān)測到輪椅進入陷阱區(qū)域,神經(jīng)網(wǎng)絡(luò)的輸出為output_trap,此輸出針對陷阱區(qū)域所設(shè)計,具備以下2個特點.
1)可以忽略周圍障礙物信息而單純執(zhí)行趨向行為,如表2所示.表2中,當(dāng)I=y時,避障和沿墻走行為不被激活,而相同的環(huán)境下I=x時,所有的行為均被激活.
表2 I取不同值時神經(jīng)網(wǎng)絡(luò)的輸出Table 2 Neural network output in different I
該特性相當(dāng)于改變了行為的優(yōu)先級或者控制權(quán)重,在存在障礙物的環(huán)境條件下趨向行為也將有機會被單獨執(zhí)行.陷阱區(qū)域的障礙物信息導(dǎo)致控制器輸出的控制決策失去了路徑規(guī)劃的目的性,因此忽略障礙物的信息而執(zhí)行趨向行為可以提前終止不合理的控制決策,控制輪椅能盡快逃出陷阱區(qū)域.
2)output_trap=[0,WG],將趨向行為的線速度設(shè)置為0,輪椅可以原地完成方向的調(diào)整,從而保證了輪椅的安全.
圖6 系統(tǒng)控制流程Fig.6 Flowchart of system control
圖6中,F(xiàn)lag用以控制識別陷阱區(qū)域功能的開啟和關(guān)閉,F(xiàn)lag=0時開啟該功能,此時將對dt進行監(jiān)測.當(dāng)控制器輸出output_trap后,F(xiàn)lag被置為1關(guān)閉該功能,直至下一次執(zhí)行趨向行為后Flag重新被置為0,該功能再次啟動.關(guān)閉陷阱識別功能的目的是防止輪椅一直在陷阱區(qū)域反復(fù)不前.
為了驗證算法的有效性,本節(jié)對上述提及的各種算法進行了仿真實驗,并導(dǎo)航時間、路徑軌跡、對于陷阱區(qū)域的處理能力進行了比較.
輪椅的工作環(huán)境如圖7所示,圖中方塊表示障礙物,五角星表示目標(biāo)點,為了更真實地展示3種行為協(xié)調(diào)機制的導(dǎo)航效果,筆者設(shè)置了3個初始位置,如圖中圓圈所示.
圖7 輪椅工作環(huán)境Fig.7 Working conditions of the wheelchair
輪椅分別從3個初始位置出發(fā),記錄輪椅到達目標(biāo)點的時間,每個位置分別進行20次實驗最后統(tǒng)計取平均時間,結(jié)果如表3所示.
表3 各種行為協(xié)調(diào)方法比較結(jié)果Table 3 Comparison of results of different behavior coordination method
由表3可知,基于優(yōu)先級的方法導(dǎo)航效果最差,主要原因是該方法某一時刻只有一個行為起作用,缺乏導(dǎo)航的目的性.而模糊命令融合方法每一時刻所有的行為都對最終的整體行為有貢獻,因此輪椅的動作有更強的目的性.相對于傳統(tǒng)的模糊命令融合方法而言,改進的行為協(xié)調(diào)方法在趨向行為執(zhí)行時能抑制沿墻走行為和避障行為的激活,系統(tǒng)的反映更快,由此可見,改進的行為協(xié)調(diào)方法比傳統(tǒng)的模糊命令融合方法所需的導(dǎo)航時間更短.
基于優(yōu)先級的行為協(xié)調(diào)機制控制下,輪椅的運動軌跡如圖8所示.由圖8可以清晰看到輪椅的運動軌跡非常不平滑,存在大量尖角,這是由于不同的行為之間相互切換造成的.當(dāng)輪椅由趨向行為突然改為避障行為時,將會出現(xiàn)突然的轉(zhuǎn)向,其他的行為切換時同樣如此.實際應(yīng)用中,輪椅的不平滑的運動軌跡不但容易造成輪椅硬件的損壞,而且使得輪椅的使用舒適度嚴(yán)重降低.
圖8 基于優(yōu)先級的行為協(xié)調(diào)機制輪椅的軌跡Fig.8 Trace of behavioral coordinated wheelchair based on priority
在傳統(tǒng)的模糊命令融合機制和改進的行為協(xié)調(diào)機制控制下,輪椅的運動如圖9所示.
圖9 模糊命令融合機制和改進的行為協(xié)調(diào)機制控制輪椅的運動軌跡Fig.9 Trajectory of control wheelchair of convergence mechanisms of fuzzy order and improved behavioral coordinated controller
圖9中,傳統(tǒng)的模糊命令融合方法控制輪椅由初始位置1和初始位置3出發(fā),2條軌跡都非常平滑.原因是二者沒有行為之間的切換,每個轉(zhuǎn)向動作都是所有行為綜合作用的結(jié)果.改進的行為協(xié)調(diào)機制控制輪椅由初始位置2出發(fā),2號軌跡在A、B兩點處出現(xiàn)尖角,原因是改進的行為協(xié)調(diào)機制在以上兩點處會切換到單純的趨向行為,避障和沿墻走這2個行為沒有機會被執(zhí)行,這類似于基于優(yōu)先級的控制方法.考慮到該方法能夠在執(zhí)行趨向行為時降低系統(tǒng)的負(fù)擔(dān)及提高系統(tǒng)的反應(yīng)速度,且僅在切換到趨向行為時才出現(xiàn)尖角而其他情形下軌跡非常平滑,因此認(rèn)為這是可以接受的代價.
接下來的試驗中,輪椅的工作環(huán)境為圖10的陷阱區(qū)域,陷阱區(qū)域在實際應(yīng)用中可能會嚴(yán)重降低輪椅的導(dǎo)航質(zhì)量.基于優(yōu)先級的控制下,輪椅的運動軌跡如圖10所示.
圖10 基于優(yōu)先級的控制下輪椅的軌跡Fig.10 Trace of wheelchair based on priority control
由圖10所示,輪椅進入了陷阱區(qū)域后,會出現(xiàn)嚴(yán)重的導(dǎo)航錯誤,原因是基于優(yōu)先級的控制下,沿墻走行為的優(yōu)先級要高于趨向行為的優(yōu)先級,因此直到沿墻走行為終止之前,趨向行為沒有機會被執(zhí)行.相同的環(huán)境下,改進的行為協(xié)調(diào)機制控制輪椅的運動軌跡如圖11所示.
圖11 改進的行為協(xié)調(diào)機制控制輪椅運動軌跡Fig.11 Trace of wheelchair based on improved behavioral coordinated control
由圖11可見,輪椅進入陷阱區(qū)域后,改進的行為協(xié)調(diào)機制可以識別輪椅進入了陷阱區(qū)域并將趨向行為的權(quán)重設(shè)置為最大,輪椅原地調(diào)整了運動方向,由于周圍環(huán)境安全輪椅接下來執(zhí)行了趨向行為,因此輪椅可以很快到達目標(biāo)點,可見筆者設(shè)計的改進行為協(xié)調(diào)機制控制更加合理,進一步提高了控制系統(tǒng)的智能性.
換一種新的陷阱區(qū)域作為實驗場景,輪椅在傳統(tǒng)的模糊命令融合的控制下運動軌跡如圖12所示.同樣的環(huán)境下在改進的行為協(xié)調(diào)機制控制下輪椅的運動軌跡如圖13所示.圖13中,改進的行為協(xié)調(diào)機制識別出輪椅進入陷阱區(qū)域后將趨向行為的控制權(quán)設(shè)為最大,在原地完成了運動方向的調(diào)整,然后關(guān)閉了識別陷阱區(qū)域功能.由于外界環(huán)境存在障礙物,改進的行為協(xié)調(diào)機制激活了所有行為控制輪椅原路返回并最終從另一個方向走出了陷阱區(qū)域并到達了目的地.
圖12 傳統(tǒng)的模糊命令融合機制控制輪椅運動軌跡Fig.12 Trace of wheelchair of under traditional fuzzy order convergence mechanisms
圖13 改進的行為協(xié)調(diào)機制控制下輪椅的運動軌跡Fig.13 Trace of wheelchair based on improved behavioral coordinated control
本節(jié)為部分實際實驗效果展示,在實際實驗中輪椅的初始位置和目標(biāo)點之間存在多個障礙物.改進的行為協(xié)調(diào)機制可以控制輪椅安全通過障礙物區(qū)域趨向目標(biāo)點,如圖14所示.
圖14 輪椅安全通過障礙物區(qū)域Fig.14 Wheelchair passed obstacles region safely
在改進的行為協(xié)調(diào)機制控制下輪椅的運動軌跡非常平滑,證明了改進的行為協(xié)調(diào)機制能夠完成精確控制,如圖15中線條所示.
圖16展示了改進行為協(xié)調(diào)機制良好的處理陷阱區(qū)域的能力,輪椅能夠提前結(jié)束沿墻走行為而執(zhí)行趨向行為,因此可以更快地到達目標(biāo)點.
圖15 運動軌跡特寫Fig.15 Highlight of wheelchair trace
圖16 輪椅逃離陷阱區(qū)域Fig.16 Wheel escaped from the trap domain
在室外環(huán)境下進行實際的路徑規(guī)劃,輪椅在改進的行為協(xié)調(diào)機制控制下的運動路線如圖17所示,可見該行為協(xié)調(diào)機制能夠安全快速地將使用者送達目的地.
圖17 室外環(huán)境中輪椅運動路線Fig.17 Trace of wheelchair escaped outside the door
筆者提出的行為協(xié)調(diào)機制將仲裁機制和命令融合機制2種傳統(tǒng)的行為協(xié)調(diào)機制相結(jié)合,該控制系統(tǒng)反應(yīng)速度快且控制精確.同時改進的行為協(xié)調(diào)機制能夠識別陷阱區(qū)域的存在且通過自主改變行為控制權(quán)重的方式控制輪椅盡快逃出陷阱區(qū)域,進一步提高了控制系統(tǒng)的智能性.該控制器實現(xiàn)簡單且智能性好,適用于非結(jié)構(gòu)化環(huán)境下的路徑規(guī)劃.
[1]LATOMBE J C.Robot motion planning[M].Boston,USA:Kluwer Academic Publishers,1991:143-176.
[2]劉一松,魏寧,孫亞民.基于柵格法的虛擬人快速路徑規(guī)劃[J].計算機工程與設(shè)計,2008,29(5):1229-1231.
LIU Yisong,WEI Ning,SUN Yamin.Path planning algorithm based on grid method for virtual human[J].Computer Engineering and Design,2008,29(5):1229-1231.
[3]楊淮清,肖興貴,姚棟.一種基于可視圖法的機器人全局路徑規(guī)劃算法[J].沈陽工業(yè)大學(xué)學(xué)報,2009,31(2):225-229.
YANG Huaiqing,XIAO Xinggui,YAO Dong.A V-graph based global path planning algorithm for mobile robot[J].Journal of Shenyang University of Technology,2009,31(2):225-229.
[4]陳家照,張中位,徐福后.改進的概率路徑圖法[J].計算機工程與應(yīng)用,2009,45(10):54-55.
CHEN Jiazhao,ZHANG Zhongwei,XU Fuhou.Modified probabilistic roadmap method[J].Computer Engineering and Applications,2009,45(10):54-55.
[5]鮑慶勇,李舜酩,沈峘,等.自主移動機器人局部路徑規(guī)劃綜述[J].傳感器與微系統(tǒng),2009,28(9):1-4.
BAO Qingyong,LI Shunming,SHEN Huan,et al.Survey of local path planning of autonomous mobile robot[J].Transducer and Microsystem Technologies,2009,28(9):1-4.
[6]朱毅,張濤,宋靖雁.非完整移動機器人的人工勢場法路徑規(guī)劃[J].控制理論與應(yīng)用,2010,27(2):152-158.
ZHU Yi,ZHANG Tao,SONG Jingyan.Path planning for nonholonomic mobile robots using artificial potential field method[J].Control Theory & Application,2010,27(2):152-158.
[7]傅衛(wèi)平,張鵬飛,楊世強.利用機器人行為動力學(xué)與滾動窗口路徑規(guī)劃[J].計算機工程與應(yīng)用,2009,45(2):212-215.
FU Weiping,ZHANG Pengfei,YANG Shiqiang.Behavioral dynamics of mobile robot and rolling windows algorithm to path planning[J].Computer Engineering and Applications,2009,45(2):212-215.
[8]宋勇,李貽斌,李彩虹.遞歸神經(jīng)網(wǎng)絡(luò)的進化機器人路徑規(guī)劃方法[J].哈爾濱工程大學(xué)學(xué)報,2009,30(8):898-902.
SONG Yong,LI Yibin,LI Caihong.Path planning based on a recurrent neural network for an evolutionary robot[J].Journal of Haribn Engineering University,2009,30(8):898-902.
[9]趙先章,常紅星,曾雋芳,等.一種基于粒子群算法的移動機器人路徑規(guī)劃方法[J].計算機應(yīng)用研究,2007,24(3):181-186.
ZHAO Xianzhang,CHANG Hongxing,ZENG Junfang,et al.Path planning method for mobile robot based on particle swarm algorithm[J].Application Research of Computers,2007,24(3):181-186.
[10]郝博,秦麗娟,姜明洋.基于改進遺傳算法的移動機器人路徑規(guī)劃方法研究[J].計算機工程與科學(xué),2010,32(7):104-107.
HAO Bo,QIN Lijuan,JIANG Mingyang.Research on the path planning methods for mobile robots based on an improved genetic algorithm[J].Computer Engineering & Science,2010,32(7):104-107.
[11]郝冬,劉斌.基于模糊邏輯行為融合路徑規(guī)劃方法[J].計算機工程與設(shè)計,2009,30(3):660-663.
HAO Dong,LIU Bin.Behavior fusion path planning method for mobile robot based on fuzzy logic[J].Computer Engineering and Design,2009,30(3):660-663.
[12]BROOKS R.A robust layered control system for a mobile robot[J].IEEE Journal of Robotics and Automation,1986,2(1):14-23.
[13]ARKIN R C.Motor schema based navigation for a mobile robot:an approach to programming by behavior[C]//Proceedings of the IEEE International Conference on Robotics and Automation.Raleigh,USA,1987:264-271.
[14]ARKIN R C.Behavior-based robotics[M].Cambridge,USA:the MIT Press,1998.
[15]PIRJANIAN P.Behavior coordination mechanisms:stateof-the-art,Technical Report IRIS-99-375[R].Los Angeles,USA:Institute for Robotics and Intelligent Systems,University of Southern California,1999.
[16]ABREU A.Fuzzy behaviors and behavior arbitration in autonomous vehicles[C]//Proceedings of the 9th Portuguese Conference on Artificial Intelligence:Progress in Artificial Intelligence.London,UK:Springer-Verlag,1999:237-251.
[17]PEREZ M C.A proposal of behavior based control architecture with reinforcement learning for an autonomous underwater robot[D].Girona,Spain:University of Girona,2003.
蒲興成,男,1973年生,副教授,博士,主要研究方向為非線性系統(tǒng)、隨機系統(tǒng)和智能控制等.主持和參與省部級基金項目8項,發(fā)表學(xué)術(shù)論文40余篇,出版學(xué)術(shù)專著1部、教材1部.
張軍,男,1985年生,碩士研究生,主要研究方向為人工智能和機器人控制.
張毅,男,1966年生,教授,博士生導(dǎo)師,中國人工智能學(xué)會理事、青年工作委員會副主任、智能機器人專業(yè)委員會委員,中國計量測試學(xué)會高級會員,《機器人技術(shù)及其應(yīng)用》雜志理事.主要研究方向為智能服務(wù)機器人、信息無障礙技術(shù)、智能人機交互技術(shù).申請國家發(fā)明專利20項,獲得國家發(fā)明專利10項,發(fā)表學(xué)術(shù)論文150余篇,其中被SCI、EI、ISTP檢索80余篇,出版專著2部,撰寫教材3部.
Modified behavior coordination for intelligent wheelchair path planning based on a neural network
PU Xingcheng1,ZHANG Jun2,ZHANG Yi2
(1.Mathematics and Physics College,Chongqing University of Posts and Telecommunications,Chongqing 400065,China;2.Automation College,Chongqing University of Posts and Telecommunications,Chongqing 400065,China)
In order to solve the poor effects of traditional behavior-based path planning of intelligent wheelchairs in an outdoor unstructured environment,a new path planning method was proposed in this paper.The new algorithm uses fuzzy logic to design basic control behavior,and on this basis applies a neural network to design behavior coordination by combining a large amount of practical experience.The improved algorithm can combine arbitration mechanisms with fusion mechanisms successfully;it absorbs the major advantage of these two original algorithms and improves response speed of the system while enhancing the control accuracy significantly.On the other hand,the method can identify trap area and control the wheelchair escape from the trap by changing the behavior weights independently,therefore displaying strong artificial intelligence characteristics.The simulation and real experimental results verify that the algorithm is capable of advanced intelligence and can be implemented easily.Additionally,it can be used in an outdoor unstructured environment for robot path planning.
robot;intelligent wheelchair;unstructured environment;path planning;neural network;behavior coordination control
TP24
A
1673-4785(2011)05-0456-08
10.3969/j.issn.1673-4785.2011.05.011
2011-01-16.
科技部國際合作資助項目(2010DFA12160);重慶市科委資助項目(CSCT,2010AA2055);重慶郵電大學(xué)青年基金資助項目(A2009-50).
蒲興成.E-mail:puxingcheng@sina.com.