張 秦,段中興
(1.西安建筑科技大學(xué) 信息與控制工程學(xué)院, 西安 710055 ;2.西部綠色建筑國家重點實驗室, 西安 710055)
機器人路徑規(guī)劃問題是移動機器人導(dǎo)航與控制研究的最基本環(huán)節(jié),得到了廣泛的研究和探討。路徑規(guī)劃問題指的是在有障礙的環(huán)境中,尋找一條實現(xiàn)從起始點到目標(biāo)點的最優(yōu)路徑。路徑規(guī)劃問題主要由3個階段環(huán)境建模、路徑搜索、路徑生成構(gòu)成[1]。路徑規(guī)劃問題根據(jù)環(huán)境信息的特點劃分為靜態(tài)環(huán)境路徑規(guī)劃和動態(tài)環(huán)境路徑規(guī)劃;又可依據(jù)對環(huán)境信息掌握程度的差異劃分為全局路徑規(guī)劃和局部路徑規(guī)劃。當(dāng)前,常見的路徑規(guī)劃方法有:占據(jù)柵格法[2]、人工勢場法[3-4]、PSO算法[5]、A*算法[6]、生物激勵神經(jīng)網(wǎng)絡(luò)算法[7-9]等。
傳統(tǒng)占據(jù)柵格法將地圖環(huán)境離散化為獨立的正方形柵格,每個柵格有兩種狀態(tài):空閑和被占據(jù)。thrun等指出在柵格定位中,柵格大小和定位誤差與傳感器誤差有關(guān),影響了柵格地圖的精確度[10]。而岳偉韜等提出建立“有義地圖率”來描述占據(jù)柵格地圖的準(zhǔn)確度,并通過理論推導(dǎo),得到了有義地圖率的理論計算方法,建立信息量和柵格大小的聯(lián)系,用損失函數(shù)來評估占據(jù)柵格地圖的精度[2]。但是此算法計算量較大,路徑規(guī)劃效率較低,首先需要獲取全局地圖環(huán)境。人工勢場法是較為普遍的路徑規(guī)劃方法,但傳統(tǒng)人工勢場路徑規(guī)劃算法存在易陷入局部極小值,目標(biāo)不可達等問題,于振中等建立改進的勢場模型,采用計算勢場強度的方法代替矢量力控制,將移動障礙物與機器人的相對速度引入到勢場函數(shù)中,實現(xiàn)了動態(tài)環(huán)境下的路徑規(guī)劃,對于局部極小值的問題,引入了填平勢場法來使機器人走出局部極小值點[11]。傳統(tǒng)粒子群算法存在優(yōu)化精度低和易早熟,且收斂速度慢、搜索停滯的問題,且在應(yīng)用于路徑規(guī)劃中時效果不理想?;诖藛栴},對于PSO算法的研究主要集中在參數(shù)改進、種群結(jié)構(gòu)等方面??涤裣榈纫罁?jù)梯度下降法中變量負(fù)梯度方向變化的原則,提出了改進的粒子速度更新模型,從而實現(xiàn)優(yōu)化PSO算法的路徑規(guī)劃[5]。該算法,只適用于靜態(tài)障礙物情況下的路徑規(guī)劃,搜索效率和搜索精度有待提高。晁永生等應(yīng)用動態(tài)修改路徑的A*算法和增量式A*算法分別應(yīng)用于靜態(tài)和動態(tài)環(huán)境下,結(jié)合規(guī)劃時間與路徑長度建立路徑修改順序模型生成最優(yōu)路徑[6]。
生物激勵神經(jīng)網(wǎng)絡(luò)算法在機器人路徑規(guī)劃方面的應(yīng)用,無學(xué)習(xí)訓(xùn)練過程,無事先預(yù)知環(huán)境信息,計算速度較快,對動態(tài)環(huán)境中的變化能夠積極反應(yīng),獲得了廣泛而深入的研究和應(yīng)用。20世紀(jì)50年代生物物理學(xué)家Huxley和Hodgkin提出了關(guān)于細(xì)胞膜的HH模型和神經(jīng)細(xì)胞膜的電路模型,Grossberg改進HH模型并提出了Shunting網(wǎng)絡(luò)模型并應(yīng)用在運動控制、機器視覺等領(lǐng)域方向[12]。Jianjun Ni等將動態(tài)生物激勵神經(jīng)網(wǎng)絡(luò)模型應(yīng)用于水下移動機器人實時路徑規(guī)劃,該算法無需事先獲得環(huán)境信息,且計算規(guī)模小,可用于實時動態(tài)環(huán)境下的路徑規(guī)劃[13]。Mingzhi Chen等對快速動態(tài)變化環(huán)境下的實時路徑規(guī)劃的問題進行研究,研究了GBNN模型的替代權(quán)值函數(shù),以改善其在動態(tài)環(huán)境下的性能[14]。范莉麗等引入目標(biāo)距離制導(dǎo)因素,改進點對點生物激勵神經(jīng)網(wǎng)絡(luò)算法,但生成路徑未實現(xiàn)最優(yōu)或者次優(yōu)的效果[15]。王耀南等針對生物激勵神經(jīng)網(wǎng)絡(luò)存在的路徑未達到最優(yōu)問題,路徑錯判問題,在邊界附近與障礙物之間的路徑點中引入假想的障礙物相鄰點,在位置決策中加入了轉(zhuǎn)角最小因素,從而增大激勵輸入,優(yōu)化路徑[16]。代亞蘭等針對未知環(huán)境下考慮傳感器檢測范圍有限性與動態(tài)障礙物運動的不確定性,提出了基于動態(tài)威脅評估的改進生物激勵神經(jīng)網(wǎng)絡(luò)算法,采用柵格法與虛擬目標(biāo)點的滾動優(yōu)化方式進行路徑尋優(yōu),且進一步提出了基于直覺模糊集的動態(tài)屬性決策方法[17]。以上改進后的生物激勵神經(jīng)網(wǎng)絡(luò)方法在路徑規(guī)劃、全遍歷路徑規(guī)劃以及軌跡跟蹤等領(lǐng)域中取得了成功的應(yīng)用。但由于神經(jīng)元活性值狀態(tài)方程的特點,機器人還會出現(xiàn)過多偏離路徑,非最優(yōu)路徑等問題。本文提出了改進的生物激勵神經(jīng)網(wǎng)絡(luò)算法(biologically inspired neural network)在點對點路徑規(guī)劃中的應(yīng)用。在靜態(tài)環(huán)境下,初始階段路徑修正策略與理想路徑制導(dǎo)的選擇機制能有效的解決路徑偏離和路徑非最優(yōu)問題,平滑路徑,提升路徑質(zhì)量。
在生物激勵神經(jīng)網(wǎng)絡(luò)方法中,分流方程是核心,分流模型最早是由Grossberg提出,其用來理解個體對復(fù)雜的動態(tài)環(huán)境中出現(xiàn)的突發(fā)事件的實時適應(yīng)行為。該模型的基本思想是建立一個神經(jīng)網(wǎng)絡(luò)拓?fù)錉顟B(tài)結(jié)構(gòu),其動態(tài)神經(jīng)活性值表示動態(tài)變化的環(huán)境。通過適當(dāng)?shù)囟x來自變化的環(huán)境影響和內(nèi)部神經(jīng)活性值影響的外部輸入,可以保證可移動區(qū)域神經(jīng)活性值和障礙物的神經(jīng)活性值分別保持在神經(jīng)網(wǎng)絡(luò)活動區(qū)域的峰值和谷值??梢苿訁^(qū)域通過神經(jīng)活動傳播在整個狀態(tài)空間中吸引機器人,而障礙物僅具有局部作用以避免碰撞。且所有神經(jīng)元的活性值初始化為0,分流方程如下:
(1)
(2)
式中,變量xi為第i個神經(jīng)元的活性值,A為正常數(shù),表示衰減率;B為神經(jīng)元活性值的上限,D為神經(jīng)元活性值的下限;Ii為第i個神經(jīng)元的外部輸入,如果i處為目標(biāo)點,則Ii=E,如果i處為障礙物,則Ii=-E,否則Ii為0,其E是一個遠(yuǎn)遠(yuǎn)大于B的正常數(shù)。
(3)
如果a≤r0則f(a)=0,如果0 由分流方程可得出正神經(jīng)元活性值向外傳播并影響全局狀態(tài)空間,負(fù)神經(jīng)元活性值只在局部發(fā)生作用,障礙物單元和目標(biāo)單元的活性值大小分別與波谷和波峰相對應(yīng),生物激勵神經(jīng)網(wǎng)絡(luò)路徑規(guī)劃算法原理可解釋為:目標(biāo)單元通過正神經(jīng)元活性值在全局狀態(tài)空間中的傳播和影響作用吸引機器人向目標(biāo)單元靠近,而障礙單元由于具有負(fù)的活性值而只能夠作用在局部,排斥機器人的接近[16]。在點對點路徑規(guī)劃中,具體路徑可表示為: (4) 式中,k為第pq個神經(jīng)元鄰近處神經(jīng)元的個數(shù),也是所有可能的下一個位置的個數(shù);xj為第j個相鄰神經(jīng)元的活性值。 路徑生成過程:由起始單元開始,首先判斷當(dāng)前神經(jīng)元是否為目標(biāo)單元,若不是,再判斷當(dāng)前單元鄰域各神經(jīng)元的活性值大小,選擇鄰域神經(jīng)元中具有最大活性值的神經(jīng)元為下一單元的位置。當(dāng)機器人移動至下一位置單元后,更新當(dāng)前神經(jīng)元位置,再由同樣方法到達下一位置,依此循環(huán)直至到達目標(biāo)單元。 現(xiàn)設(shè)置仿真環(huán)境及模型參數(shù)如下:A=10,B=D=1,E=100,u=1,r0=2的情況下的點對點路徑規(guī)劃時路徑生成過程的仿真結(jié)果如圖1所示。結(jié)果表明應(yīng)用生物激勵神經(jīng)網(wǎng)絡(luò)路徑規(guī)劃方法的機器人雖然到達了目標(biāo)點,但是其所走路徑較長,且移動機器人產(chǎn)生了路徑偏離問題,而且轉(zhuǎn)折次數(shù)較多,路徑不夠平滑。 圖1 路徑偏離問題 在圖1中黑色實心點單元所構(gòu)成的為障礙物單元,白色柵格為機器人可行走區(qū)域,五角星所在單元為起始單元,起始單元與目標(biāo)單元之間用直線相連,表示無障礙理想情況下的最短路徑,用灰色折線相連的實心點代表機器人的運動路徑單元。圖1(a)中,在初始階段,機器人并未朝著目標(biāo)單元(19,29)移動,而是向左上方移動,并且在(3,12)、(4,12)單元處出現(xiàn)了重復(fù)的路徑單元;圖1(b)中,在初始階段,機器人依然先向著左上方移動,當(dāng)移動到(7,7)單元處,出現(xiàn)轉(zhuǎn)折,并朝向目標(biāo)點(26,27)單元移動,在后續(xù)的路徑出現(xiàn)不必要的轉(zhuǎn)折,使路徑的平滑度降低。結(jié)果表明雖然到達了目標(biāo)單元,但是所生成路徑長度較長,且路徑平滑度較低,未實現(xiàn)最優(yōu)或次優(yōu)路徑。 從實驗分析可得出,應(yīng)用生物激勵神經(jīng)網(wǎng)絡(luò)方法的點對點路徑規(guī)劃存在一定的問題,起始單元與目標(biāo)單元相距較遠(yuǎn),目標(biāo)單元對全局單元的活性值影響是隨著時間的推移而向全局空間傳播的。在起始階段,由于當(dāng)前位置單元的鄰域柵格單元活性值為零,且未受到目標(biāo)點單元活性值的影響,此時機器人按照人為設(shè)定行走規(guī)則沿左上方移動,直至活性值影響傳播到當(dāng)前位置的鄰域神經(jīng)單元,機器人被目標(biāo)單元吸引而移動,最終到達目標(biāo)單元。 在移動機器人的工作環(huán)境中,需要構(gòu)建相應(yīng)的路徑規(guī)劃環(huán)境模型。在靜態(tài)已知環(huán)境下,利用柵格法對移動機器人進行環(huán)境建模,因為柵格法建模方法簡單、環(huán)境描述能力強,適用于地圖柵格化。將工作地圖放置在正交直角坐標(biāo)系中,將工作環(huán)境劃分成若干個柵格單元,根據(jù)障礙柵格區(qū)域和自由柵格區(qū)域的不同,給柵格賦予不同的置信度,通過置信度的不同使機器人分辨障礙柵格區(qū)域和自由柵格區(qū)域。 2.1.1 柵格法環(huán)境建模步驟 1)選取柵格大小: 柵格大小是柵格法建模的關(guān)鍵因素,選取柵格較小,則環(huán)境地圖分辨率較大,環(huán)境信息量大,決策速度慢;選取柵格較大,則環(huán)境地圖分辨率較小,環(huán)境信息量小,決策速度快,但在密集障礙物環(huán)境中發(fā)現(xiàn)路徑的能力較弱,本文柵格選取以機器人直徑為柵格大小。柵格大小的確定,一般受以下因素的影響:①環(huán)境地圖大??;②障礙物大小及規(guī)則情況;③機器人最大的橫掃長度,要求掃描的橫截長度大于柵格長和寬;④機器人運算能力及算法復(fù)雜度,保證機器人的工作效率。 2) 確定障礙物柵格: 當(dāng)機器人進入陌生環(huán)境時,無法獲取環(huán)境內(nèi)障礙物信息,機器人首先遍歷全環(huán)境地圖,確定障礙物位置,并根據(jù)障礙物位置找到對應(yīng)柵格地圖中的序號值,并對相應(yīng)柵格置信度進行修改。障礙物柵格的置信度為1,自由柵格的柵格置信度為0。 2.1.2 柵格法與神經(jīng)網(wǎng)絡(luò)拓?fù)湫蜖顟B(tài)空間相結(jié)合 基于生物激勵神經(jīng)網(wǎng)絡(luò)的路徑規(guī)劃算法定義的環(huán)境由一個基于柵格法的神經(jīng)網(wǎng)絡(luò)拓?fù)錉顟B(tài)空間構(gòu)成。將工作環(huán)境地圖放置在直角坐標(biāo)系中,以設(shè)定大小將地圖環(huán)境分割成若干個柵格,將每個柵格表示為一個神經(jīng)元,柵格置信度為神經(jīng)元活性值,用來區(qū)分障礙物和可移動區(qū)域。將柵格置信度看為一個元素,這些元素就組成了一個二維矩陣,此二維矩陣就是工作環(huán)境的柵格模型。此工作環(huán)境被分割成均勻的柵格單元,將障礙物柵格的域置信度賦值為-1,可以移動的自由柵格賦值為零,因此工作區(qū)域柵格模型如下: 依據(jù)生物激勵神經(jīng)網(wǎng)絡(luò)的路徑規(guī)劃算法,第i個神經(jīng)元的活性值: (5) 由分流方程和實驗可知,路徑規(guī)劃初始階段自由神經(jīng)元的興奮輸入相比于外部抑制的影響弱化,且興奮輸入的作用時間點滯后于外部抑制的作用時間,因此,在初始階段生物激勵神經(jīng)網(wǎng)絡(luò)的路徑生成策略被弱化,而更趨向于外部設(shè)定的路徑選擇策略,范莉麗所提出的改進算法優(yōu)化了初始階段的路徑選擇,而由于加入目標(biāo)距離制導(dǎo)的因素,卻在全局的路徑規(guī)劃中,再次弱化了生物激勵神經(jīng)網(wǎng)絡(luò)算法的作用。這一作用導(dǎo)致在生成下一柵格單元位置的決策中,增加了路徑長度以及路徑轉(zhuǎn)折次數(shù)的增加。 針對生物激勵神經(jīng)網(wǎng)絡(luò)點對點路徑規(guī)劃在初始階段產(chǎn)生路徑偏離,使生成的路徑長度增加,引入初始路徑修正策略來解決這一問題,即在初始階段時各神經(jīng)元的活性值為零,需等待目標(biāo)單元活性值傳播,通過檢測起始點單元的外部興奮輸入大小和起始單元活性值大小是否滿足條件,決定是否觸發(fā)生物激勵神經(jīng)網(wǎng)絡(luò)路徑規(guī)劃算法,選擇下一最優(yōu)神經(jīng)元位置,從而實現(xiàn)初始路徑修正;并將選取活性值最大的神經(jīng)元與選取神經(jīng)元距離目標(biāo)點的歐氏測定的距離結(jié)合,找出活性值足夠大且距離目標(biāo)點足夠近的神經(jīng)元為機器人移動的下一位置。 (6) (7) 由分流方程可知,隨著時間的推移,目標(biāo)單元活性值向全局傳播從而影響到整個狀態(tài)空間的單元,即對其他非障礙物單元產(chǎn)生興奮輸入。機器人每隔0.01 s檢測一次[Ii]+,當(dāng)檢測到起始單元的外部興奮輸入 [Ii]+>0時,檢測起始單元活性值是否滿足xi 圖2 初始階段環(huán)境活性值分布圖 假定起始點單元與目標(biāo)點單元之間無障礙物,則起始點與目標(biāo)點之間的最短路徑為兩者用直線相連所經(jīng)過的柵格單元;如圖3(a)所示。然而在實際的路徑規(guī)劃情況下,路徑規(guī)劃的環(huán)境多樣而復(fù)雜,其障礙物分為規(guī)則圖形和不規(guī)則圖形,為有效避開障礙物并使路徑長度最優(yōu),路徑平滑度最優(yōu),為此引入路徑選擇機制,即測定當(dāng)前位置神經(jīng)元周圍相鄰的八個神經(jīng)元與無障礙理想環(huán)境下生成路徑的歐氏距離,將該因素引入至路徑選擇策略中,選擇距離理想路徑盡量短,活性值較大,距離目標(biāo)點較近的神經(jīng)元作為機器人移向的下一位置單元。具體實現(xiàn)方法如下。 圖3 路徑選擇機制示意圖 如圖3(b)所示,機器人當(dāng)前位置所在單元,活性值為xi,其到理想路徑的最短距離為di;當(dāng)前位置單元周圍相鄰的單元,活性值為xj,其到理想路徑的最短距離為dj;為了降低機器人的能耗,平滑機器人的移動路徑,采用如下的路徑選擇機制: (8) 當(dāng)檢測到當(dāng)前位置相鄰的各個單元無障礙物時觸發(fā)該路徑選擇機制,若當(dāng)前位置相鄰的各個單元存在障礙物時,引入選擇機制則會給全局路徑規(guī)劃造成路徑長度增加的結(jié)果。 1)全局神經(jīng)元活性值初始化為零; 2)設(shè)置起始單元和目標(biāo)單元; 3)等待目標(biāo)點活性值在整個狀態(tài)空間的傳播,根據(jù)分流方程計算得出當(dāng)前位置單元及周圍可行走的單元的活性值,每隔0.01 s判斷起始點單元外部激勵輸入是否大于零,若發(fā)生變化,再判斷起始點單元活性值是否小于某一鄰域神經(jīng)元活性值,滿足則觸發(fā)生物激勵神經(jīng)網(wǎng)絡(luò)路徑規(guī)劃算法,反之,等待并再次判斷; 4)判斷當(dāng)前位置神經(jīng)元相鄰單元是否存在障礙物單元,若無障礙物單元,觸發(fā)結(jié)合路徑選擇機制的生物激勵神經(jīng)網(wǎng)絡(luò)算法;若存在障礙物單元,觸發(fā)結(jié)合目標(biāo)制導(dǎo)的生物激勵神經(jīng)網(wǎng)絡(luò)算法;確定下一單元位置,并更新當(dāng)前單元; 5)判斷當(dāng)前位置是否為目標(biāo)點,若沒有到達目標(biāo)點則跳轉(zhuǎn)4),否則結(jié)束。 圖4 算法流程圖 通過設(shè)計靜態(tài)環(huán)境下的仿真實驗驗證了本文改進后的生物激勵神經(jīng)網(wǎng)絡(luò)路徑規(guī)劃算法的規(guī)劃效果。靜態(tài)環(huán)境實驗為驗證改進型算法是否能夠解決圖1所示路徑偏離問題,優(yōu)化生成路徑。仿真環(huán)境為靜態(tài)復(fù)雜環(huán)境地圖,機器人移動的起始單元(12, 4),目標(biāo)單元(19, 29),依據(jù)傳統(tǒng)生物激勵神經(jīng)網(wǎng)絡(luò)算法,結(jié)合目標(biāo)制導(dǎo)改進算法以及本文改進算法進行對比實驗,實驗結(jié)果如圖5~7所示。以Matlab 2016a為仿真實驗平臺,實驗環(huán)境為30×30的柵格地圖,單位柵格長度:Δx=0.5 m,環(huán)境模型參數(shù):A=10,B=D=1,E=100,u=1,r0=2A=10,B=D=1,E=100,u=1,r0=2。 圖5 傳統(tǒng)生物激勵算法生成路徑 圖6 目標(biāo)制導(dǎo)算法生成路徑 范莉麗結(jié)合目標(biāo)制導(dǎo)改進生物激勵算法存在的問題:過分倚重目標(biāo)與下一位置單元的距離因素,尤其在初始狀態(tài)時,由于目標(biāo)對各單元的激勵傳播需要一定時間,此時下一位置單元的選擇,完全依據(jù)目標(biāo)制導(dǎo)因素,而使生物激勵活性值的影響減弱,因此在全局的路徑規(guī)劃產(chǎn)生了偏離,導(dǎo)致不必要的路徑增加。 圖7 本文改進算法生成路徑 在靜態(tài)復(fù)雜環(huán)境下以算法效率、路徑長度、路徑轉(zhuǎn)折次數(shù)3個評價因素建立的由傳統(tǒng)算法、目標(biāo)制導(dǎo)改進算法和本文改進后的算法3個對比實驗可以得出,本文改進后的算法有較為突出的表現(xiàn),分別在3個評價因素上都有一定的提升和優(yōu)化,相對于傳統(tǒng)算法和范莉麗改進算法。本文改進算法在路徑生成過程中,首先并未出現(xiàn)路徑偏離問題,其次并未完全側(cè)重目標(biāo)制導(dǎo),而是選擇無障礙理想路徑制導(dǎo),使全局路徑規(guī)劃問題得到優(yōu)化。 表1 靜態(tài)環(huán)境下3種方法的仿真結(jié)果對比 從表1可知,相比于傳統(tǒng)生物激勵神經(jīng)網(wǎng)絡(luò)方法,本文改進算法規(guī)劃路徑長度減少28.2%,路徑轉(zhuǎn)折次數(shù)減少63%。相比于結(jié)合目標(biāo)制導(dǎo)改進算法,本文改進算法規(guī)劃路徑長度減少15.2%,路徑轉(zhuǎn)折次數(shù)減少56%。該改進算法所生成的路徑更趨近于理想路徑,其路徑所經(jīng)過單元分布緊貼在理想無障礙路徑兩側(cè),較少的偏離理想路徑。實驗結(jié)果表明,該改進后的算法實現(xiàn)了解決路徑偏離和優(yōu)化路徑問題的預(yù)期目標(biāo),在減少路徑長度和路徑平滑度上有了一定改進。 本文針對傳統(tǒng)生物激勵神經(jīng)網(wǎng)絡(luò)方法中出現(xiàn)的路徑偏離和路徑未達最優(yōu)的問題,提出了基于路徑修正和無障礙理想路徑制導(dǎo)的生物激勵神經(jīng)網(wǎng)絡(luò)算法。在復(fù)雜靜態(tài)環(huán)境下,對于初始階段的路徑偏離問題,引入路徑修正策略:每0.01 s檢測一次起始單元外部激勵輸入及起始單元活性值大小是否滿足條件,即當(dāng)目標(biāo)單元激勵影響傳播至起始單元時,觸發(fā)生物激勵神經(jīng)網(wǎng)絡(luò)路徑規(guī)劃算法,從而避免了初始階段的路徑偏離;對于路徑未達最優(yōu)問題引入路徑選擇機制,在生成下一位置的算法中結(jié)合無障礙理想路徑的導(dǎo)向,引入實際路徑單元與無障礙理想路徑單元間的理想路徑接近率使路徑神經(jīng)單元活性值增大,從而達到減少路徑長度和轉(zhuǎn)折次數(shù)的效果,使路徑更加平滑。仿真實驗結(jié)果表明,該改進基于生物激勵神經(jīng)網(wǎng)絡(luò)路徑規(guī)劃算法不僅有效解決初始階段路徑偏離問題,而且提升了路徑質(zhì)量?;诖烁倪M方法,將進一步研究其在未知動態(tài)環(huán)境下的應(yīng)用,并將其應(yīng)用于裝配式建筑機器人的相關(guān)研究。1.2 生物激勵神經(jīng)網(wǎng)絡(luò)路徑規(guī)劃存在的問題
2 改進生物激勵神經(jīng)網(wǎng)絡(luò)路徑規(guī)劃算法
2.1 柵格法環(huán)境建模
2.2 初始路徑修正策略
2.3 路徑選擇機制
2.4 改進算法具體步驟
3 實驗結(jié)果及分析
3.1 靜態(tài)復(fù)雜環(huán)境實驗
4 結(jié)束語