李 剛,智宏鑫
(1.華北電力大學(xué) 計(jì)算機(jī)系,河北 保定 071003;2.復(fù)雜能源系統(tǒng)智能計(jì)算教育部工程研究中心(華北電力大學(xué)),河北 保定 071003)
近年來,隨著電力系統(tǒng)基建速度的加快,電力系統(tǒng)的規(guī)模不斷增大,這給電力巡檢帶來了諸多問題和挑戰(zhàn)。電力巡檢旨在通過對(duì)電力設(shè)備(如變電站、輸電線路等)進(jìn)行定期檢查、測試和評(píng)估,來保障電力系統(tǒng)的安全穩(wěn)定運(yùn)行。
從巡檢任務(wù)上來看,變電站巡檢和輸電線路巡檢存在一些差異。變電站巡檢主要包括對(duì)變電設(shè)備和周圍環(huán)境的全面檢查和監(jiān)測,巡檢的目的是及時(shí)發(fā)現(xiàn)設(shè)備的異常、故障和安全隱患,以確保電力系統(tǒng)的安全穩(wěn)定運(yùn)行。輸電線路桿塔巡檢是指對(duì)高壓輸電線路及其支撐桿塔工作狀態(tài)進(jìn)行的全面檢查,包括輸電線路的導(dǎo)線、絕緣子、耐張裝置等元件的狀態(tài)檢查,以及桿塔的結(jié)構(gòu)穩(wěn)固性、傾斜和腐蝕情況檢查。例如,檢查絕緣子是否完好,接地系統(tǒng)是否正常,線路舞動(dòng)是否過大,防雷設(shè)施是否有效等。
通過巡檢,可以及時(shí)發(fā)現(xiàn)并處理線路和桿塔的異常、故障及安全隱患,確保輸電線路的安全穩(wěn)定運(yùn)行[1]。然而,傳統(tǒng)的電力巡檢方式因主要以人工巡檢為主而面臨諸多問題:
1)巡檢規(guī)模日益龐大。為了確保巡檢結(jié)果的準(zhǔn)確性和全面性,需要大量的人力資源來完成巡檢任務(wù);而當(dāng)前有限的人力資源難以滿足規(guī)模不斷擴(kuò)大的巡檢需求。
2)巡檢任務(wù)日益增多。電力設(shè)備的數(shù)量眾多、分布廣泛。各種變電設(shè)備、線路、傳感器和繼電保護(hù)裝置等的全面巡檢工作,對(duì)巡檢人員的專業(yè)素質(zhì)提出了更高的要求。
3)巡檢條件惡劣。電力設(shè)備通常分布在各種不同的地理環(huán)境中,其中部分位于高山、叢林或沼澤等復(fù)雜地形中,且會(huì)暴露在極端的氣候條件下。這些惡劣的環(huán)境條件給巡檢人員的工作帶來了很大的困難和風(fēng)險(xiǎn)。
針對(duì)上述問題,國內(nèi)外專家學(xué)者們積極探索了各種電力巡檢的新型應(yīng)用手段。其中,智能巡檢逐漸受到人們的關(guān)注[2]。
電力智能巡檢基本有2類場景。
第一種場景:在障礙物已知的情況下,地面機(jī)器人對(duì)電力設(shè)備待巡檢點(diǎn)的區(qū)域遍歷巡檢或定點(diǎn)巡檢,如變電站和發(fā)電站巡檢場景。對(duì)于此類場景,需要解決的是復(fù)雜環(huán)境下的避障問題[3]。
第二種場景:使用大型無人機(jī)或直升機(jī)對(duì)輸電線路或桿塔等進(jìn)行巡檢[4]。在此場景巡檢時(shí),需要事先為多個(gè)桿塔目標(biāo)的巡檢順序規(guī)劃出一條或多條優(yōu)化路徑,在避障的前提下解決多無人機(jī)多目標(biāo)巡檢問題。
路徑規(guī)劃方法發(fā)展歷程如圖1所示。
圖1 路徑規(guī)劃方法發(fā)展歷程Fig.1 The development of path planning method
以圖1為線索,本文對(duì)不同場景中的電力巡檢路徑規(guī)劃方法進(jìn)行了分析,從不同方法的發(fā)展歷程、特點(diǎn)和優(yōu)劣等方面進(jìn)行綜述,并梳理當(dāng)前行業(yè)的發(fā)展進(jìn)程和未來的發(fā)展趨勢。
電力巡檢路徑規(guī)劃是電力智能巡檢中的重要環(huán)節(jié)。為了高效地規(guī)劃出最優(yōu)路徑,學(xué)者們提出了各種算法,如圖2所示。這些算法主要分為傳統(tǒng)圖搜索算法[5]和智能優(yōu)化算法[6]2大類。
圖2 電力巡檢算法Fig.2 Electric power inspection algorithm
傳統(tǒng)圖搜索算法,如Dijkstra算法[7]和A*算法等,其思想是通過有效搜索圖中的節(jié)點(diǎn)來尋找最優(yōu)路徑?;陔S機(jī)采樣算法,如蒙特卡洛法和人工勢場法,其思想是利用隨機(jī)采樣的方式來探索可能的路徑,從而來尋找較優(yōu)解。
傳統(tǒng)算法在電力巡檢問題簡單和規(guī)模較小的場景中表現(xiàn)出色。然而,隨著電力系統(tǒng)規(guī)模增大,復(fù)雜性的不斷增加,傳統(tǒng)算法在應(yīng)對(duì)大規(guī)模場景、動(dòng)態(tài)環(huán)境下的電力巡檢問題時(shí)存在局限性,比如動(dòng)態(tài)適應(yīng)性、路徑的平滑性和實(shí)時(shí)性方面。為了解決這些問題,學(xué)者們轉(zhuǎn)向基于智能優(yōu)化算法的研究。
智能優(yōu)化算法主要為分2類。一類是基于智能仿生類算法,包括遺傳算法(Genetic algorithm,GA)、粒子群算法(Particle swarm optimization,PSO)和蟻群算法(Ant colony optimization,ACO)等,借鑒了自然界中生物的智能行為,通過模擬生物進(jìn)化和群體協(xié)作的過程,實(shí)現(xiàn)較優(yōu)路徑的快速尋找。另一類是深度強(qiáng)化學(xué)習(xí)算法[8]。深度強(qiáng)化學(xué)習(xí)算法結(jié)合了深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)各自的優(yōu)點(diǎn)。利用該類算法能夠?qū)崿F(xiàn)在復(fù)雜環(huán)境下的自主學(xué)習(xí)和路徑優(yōu)化規(guī)劃:通過構(gòu)建神經(jīng)網(wǎng)絡(luò)模型,可使巡檢機(jī)器人感知到環(huán)境狀態(tài)、接收獎(jiǎng)勵(lì)信號(hào),并在與環(huán)境交互中不斷優(yōu)化路徑規(guī)劃策略;使巡檢機(jī)器人能夠在不同場景下選擇最佳路徑,完成更智能、自適應(yīng)更強(qiáng)的巡檢任務(wù)。
表1對(duì)比了各種傳統(tǒng)的搜索算法的特點(diǎn)。
表1 傳統(tǒng)搜索算法對(duì)比Tab.1 Comparison of traditional search algorithms
表中,Dijkstra算法是一種用于解決單源最短路徑問題的經(jīng)典圖搜索算法,在計(jì)算機(jī)科學(xué)和工程領(lǐng)域應(yīng)用廣泛。該算法在網(wǎng)絡(luò)路由、地圖導(dǎo)航、交通規(guī)劃、電力網(wǎng)絡(luò)和機(jī)器人路徑規(guī)劃等方面發(fā)揮著重要作用。利用該算法可得到高效、可靠的最短路徑解決方案[13]。
如今,對(duì)Dijkstra算法的應(yīng)用主要是基于該算法的改進(jìn),如最經(jīng)典的A*算法。
A*算法:通過引入啟發(fā)式函數(shù)估計(jì)從當(dāng)前節(jié)點(diǎn)到目標(biāo)節(jié)點(diǎn)的代價(jià)(或距離),使用綜合評(píng)估函數(shù)f(n)來對(duì)節(jié)點(diǎn)進(jìn)行評(píng)估。
f(n)的計(jì)算方式為:
式中:g(n)為從起始節(jié)點(diǎn)到當(dāng)前節(jié)點(diǎn)n的實(shí)際代價(jià);h(n)為當(dāng)前節(jié)點(diǎn)到目標(biāo)點(diǎn)的預(yù)估代價(jià)。
目前,此類算法已經(jīng)從單源路徑規(guī)劃發(fā)展到了機(jī)器人避障算法;其應(yīng)用延伸到電力系統(tǒng)中,解決了變電站環(huán)境下機(jī)器人的路徑規(guī)劃問題。例如,文獻(xiàn)[9]對(duì)A*算法進(jìn)行改進(jìn),將父節(jié)點(diǎn)的預(yù)估路徑代價(jià)進(jìn)行指數(shù)加權(quán)衰減,使機(jī)器人能適應(yīng)各種復(fù)雜環(huán)境,連續(xù)不停地跟蹤規(guī)劃路徑到達(dá)目標(biāo);文獻(xiàn)[10]通過結(jié)合層次分析法,改進(jìn)A*算法和梯度下降法,使機(jī)器人可以自主選擇目標(biāo)、規(guī)避風(fēng)險(xiǎn)、快速到達(dá)終點(diǎn),從而提升了電力應(yīng)急作業(yè)的魯棒性。
隨機(jī)采樣法主要有PRM算法(Probabilistic roadmaps)、RRT算法(Rapidly random tree)及其變種。
RRT算法的思想是使用樹形結(jié)構(gòu)進(jìn)行探索。從起始點(diǎn)開始,通過隨機(jī)采樣和連接節(jié)點(diǎn)的方式來逐步擴(kuò)展樹形結(jié)構(gòu),直到找到目標(biāo)點(diǎn)為止。
PRM算法的思想是使用圖結(jié)構(gòu),通過隨機(jī)采樣配置并連接空間中的點(diǎn),構(gòu)建一個(gè)路標(biāo)圖,最后利用圖搜索算法來搜索有效路徑。
RRT算法的隨機(jī)性較強(qiáng),但用該算法在找到路徑時(shí)可能不是最優(yōu)的;而PRM算法在構(gòu)建路標(biāo)圖時(shí)較為全面,所以用該算法找到路徑時(shí)更有可能得到較優(yōu)結(jié)果。
鑒于PRM算法和RRT算法所具有的優(yōu)勢,許多學(xué)者將其用于解決機(jī)器人避障問題[13]。
對(duì)于PRM算法。文獻(xiàn)[14]提出了基于改進(jìn)概率地圖法的無人機(jī)電力線巡檢路徑規(guī)劃;通過改進(jìn)分支游動(dòng)的原理,減少了碰撞檢測次數(shù),提高了算法執(zhí)行效率。文獻(xiàn)[15]用局部敏感哈希算法代替最近鄰搜索,從而減少了傳統(tǒng)PRM的運(yùn)行時(shí)間。
對(duì)于RRT算法。文獻(xiàn)[11]利用融合有向D*的改進(jìn)RRT*算法,通過選取關(guān)鍵節(jié)點(diǎn)來提高重新布線效率;采用概率采樣函數(shù)增加路徑多樣性,并通過距離可變的樹枝修剪方案減少冗余節(jié)點(diǎn);最終得到耗時(shí)更少、總路徑更短的路徑。文獻(xiàn)[16]提出了適用于未知?jiǎng)討B(tài)環(huán)境下機(jī)器人導(dǎo)航的多目標(biāo)動(dòng)態(tài)快速探索隨機(jī)算法:以修改的RRT*獲得初始路徑,用生成狀態(tài)樹結(jié)構(gòu)作為先驗(yàn)知識(shí),并考慮路徑長度和平滑度因素,最終生成更高質(zhì)量的初始路徑。為解決RRT算法路徑曲折和規(guī)劃速度慢的問題,文獻(xiàn)[17]提出了一種融合PRM和基于概率的雙向RRT的算法:首先將規(guī)劃區(qū)域平均劃分為2個(gè)區(qū)域,然后使用規(guī)劃速度更快的PRM算法在每個(gè)區(qū)域進(jìn)行路徑預(yù)規(guī)劃,最后在2個(gè)區(qū)域各選擇1個(gè)節(jié)點(diǎn)形成1對(duì)最優(yōu)匹配點(diǎn)。
對(duì)于輸電線路桿塔巡檢路徑規(guī)劃,RRT算法是一種高效且靈活的路徑規(guī)劃方法。該算法具有隨機(jī)采樣和快速探索的特性,利用其能夠?qū)崿F(xiàn)在復(fù)雜的環(huán)境中快速搜索并生成優(yōu)質(zhì)的路徑,使飛行機(jī)器人能夠高效地穿越各種障礙物,避免不必要的路徑重規(guī)劃,從而顯著提高巡檢任務(wù)的效率和安全性。
綜上所述,RRT算法和PRM算法各有其優(yōu)勢和適用場景:RRT算法適合在未知環(huán)境中快速探索路徑,而PRM算法更適合在全局配置空間中尋找高質(zhì)量的路徑??紤]到上述2種算法各自的特點(diǎn),實(shí)際應(yīng)用中算法的選擇應(yīng)根據(jù)電力場景和問題需求來決定。
人工勢場法(Artificial potential field)的思想是通過設(shè)置目標(biāo)點(diǎn)的引力和障礙物的斥力,使機(jī)器人沿著梯度下降方向移動(dòng),以最小化總勢能來規(guī)劃路徑。
人工勢場法原理如圖3所示。在巡檢避障問題求解過程中,通過設(shè)定圖3中目標(biāo)點(diǎn)和障礙物的勢能場,引導(dǎo)機(jī)器人繞過障礙物和危險(xiǎn)區(qū)域,完成巡檢任務(wù)。
圖3 人工勢場法原理Fig.3 Principle of artificial potential field method
對(duì)于人工勢場法的應(yīng)用和改進(jìn)。文獻(xiàn)[13]將人工勢場結(jié)合虛擬勢場檢測圓模型,在動(dòng)態(tài)障礙環(huán)境下實(shí)現(xiàn)了無人駕駛飛行器的可靠在線無碰撞路徑規(guī)劃,有效解決了“最小陷阱”問題,提高了路徑規(guī)劃的可靠性。文獻(xiàn)[18]提出一種雙層路徑規(guī)劃方法:將路徑長度和平滑度作為適應(yīng)度函數(shù),采用優(yōu)化的人工勢場法和改進(jìn)的動(dòng)態(tài)窗口法得到了人工勢場法中障礙物的影響范圍、引力系數(shù)和斥力系數(shù)。然而,傳統(tǒng)的人工勢場算法及其改進(jìn)還是很難跳出“局部最優(yōu)陷阱”。
為了解決上述弊端,有學(xué)者通過融合蟻群算法、粒子群算法和遺傳算法等仿生智能算法對(duì)傳統(tǒng)人工勢場法進(jìn)行優(yōu)化。針對(duì)特高壓變電站大面積和多設(shè)備的特點(diǎn),文獻(xiàn)[19]將蟻群算法和人工勢場法融合,提高了巡檢機(jī)器人路徑規(guī)劃算法的效率和性能。文獻(xiàn)[20]通過改進(jìn)遺傳算法來解決最優(yōu)個(gè)體丟失的問題,并以此為基礎(chǔ)使用人工勢場法解決了局部避障的問題。文獻(xiàn)[21]通過融合粒子群和人工勢場法構(gòu)建了引力場和斥力場,進(jìn)而生成粒子群,克服了2種算法各自的缺點(diǎn),提高了搜索能力和收斂能力。
綜上所述,對(duì)于電力巡檢路徑規(guī)劃,人工勢場法具有簡單易實(shí)現(xiàn)、避障效果明顯、實(shí)時(shí)性較好和適應(yīng)動(dòng)態(tài)環(huán)境等優(yōu)點(diǎn)。然而,算法存在可能陷入局部最優(yōu)、無法規(guī)避環(huán)路和勢能場設(shè)置復(fù)雜等缺點(diǎn)。
智能仿生類啟發(fā)式算法是一種受生物學(xué)行為和智能機(jī)制啟發(fā)而來的優(yōu)化算法。表2對(duì)各種智能仿生類啟發(fā)式算法進(jìn)行了分類對(duì)比。
表2 智能優(yōu)化類算法對(duì)比Tab.2 Comparison of intelligent optimization algorithm
智能優(yōu)化類算法被廣泛應(yīng)用于電力巡檢路徑規(guī)劃。在發(fā)電廠和變電站等區(qū)域內(nèi),電力巡檢機(jī)器人主要任務(wù)是避開障礙物、安全到達(dá)終點(diǎn)。在輸電線路場景下,多無人機(jī)多目標(biāo)路徑規(guī)劃可視為多旅行商問題(Multiple traveling salesman problem,MTSP)。仿生類啟發(fā)式算法通過模擬蟻群、粒子群和染色體遺傳等生物集群特征來減少巡檢路徑或者飛行時(shí)間[31]??紤]到仿生類算法的特點(diǎn),以下選擇地面變電站的避障和輸電線桿塔的多目標(biāo)巡檢這2個(gè)場景的算法應(yīng)用來討論。
3.1.1 智能仿生類避障算法
1)遺傳算法。
遺傳算法(GA)由John H.Holland等人提出,是一種受到生物進(jìn)化思想啟發(fā)而來的優(yōu)化算法,可以用來解決機(jī)器人巡檢中的避障問題。該算法模擬了自然選擇中的遺傳機(jī)制,在搜索空間中通過對(duì)候選解進(jìn)行編碼、交叉和變異等遺傳操作來產(chǎn)生新的解;根據(jù)適應(yīng)度函數(shù)的評(píng)價(jià),將較好的解代入下一代;逐代優(yōu)化直到找到滿意的解。
使用遺傳算法解決電力巡檢路徑規(guī)劃中避障問題的基本過程為:首先,通過定義問題空間、設(shè)計(jì)適應(yīng)度函數(shù)以生成初始種群;然后,通過交叉、變異和碰撞檢測等操作,不斷進(jìn)化和選擇路徑;最終,避開障礙物從而找到最優(yōu)路徑。其中,適應(yīng)度函數(shù)用于衡量個(gè)體在種群中的優(yōu)劣程度。適應(yīng)度函數(shù)的設(shè)計(jì)對(duì)于遺傳算法的性能和收斂速度具有重要影響。通過對(duì)適應(yīng)度進(jìn)行改進(jìn),文獻(xiàn)[22]使用精英族系遺傳算法(Elite family genetic algorithm,EFGA)解決傳統(tǒng)路徑規(guī)劃算法存在局限性的問題;將基因適應(yīng)度納入適應(yīng)度評(píng)價(jià)函數(shù),同時(shí)在進(jìn)化過程中標(biāo)記精英個(gè)體作為多路徑規(guī)劃結(jié)果以減少任務(wù)的耗時(shí)。文獻(xiàn)[32]使用遺傳算法代替線性規(guī)劃(Linear programming,LP)和動(dòng)態(tài)規(guī)劃(Dynamic programming,DP)來尋找兩點(diǎn)間的最優(yōu)路徑,提高了模型求解速度和質(zhì)量。
2)粒子群優(yōu)化算法。
粒子群優(yōu)化算法(PSO)是一種模擬鳥群或魚群社會(huì)性群體行為的元啟發(fā)式優(yōu)化算法,其思想是通過模擬粒子在搜索空間中的移動(dòng)和信息共享,在全局搜索空間中尋找問題的最優(yōu)解。算法中,每個(gè)粒子代表一個(gè)潛在解。每個(gè)粒子根據(jù)自身的歷史最優(yōu)位置和整個(gè)群體的歷史最優(yōu)位置進(jìn)行引導(dǎo)和更新,逐步優(yōu)化解空間。
在電力巡檢避障中,雖然粒子群算法本身不是專門用于解決避障問題的算法,但可以通過合理的問題建模和適應(yīng)性函數(shù)設(shè)計(jì)來解決避障問題,即通過設(shè)計(jì)適應(yīng)性函數(shù)來引導(dǎo)粒子在搜索空間中避開障礙物,并找到最優(yōu)的路徑規(guī)劃解。例如,文獻(xiàn)[23]提出了一種針對(duì)旋翼無人機(jī)在已知靜態(tài)粗糙地形環(huán)境下的路徑規(guī)劃方法:通過改進(jìn)的多目標(biāo)粒子群優(yōu)化算法,實(shí)現(xiàn)了在最小化高度、長度和角度變化率的條件下避免碰撞,在不同粗糙地形下尋找到帕累托最優(yōu)路徑。文獻(xiàn)[33]采用改進(jìn)的粒子群算法來優(yōu)化智能制造車間中自動(dòng)導(dǎo)引車在單線生產(chǎn)線的路徑問題:通過改進(jìn)編碼方法、用交叉操作更新粒子位置以及突變機(jī)制,避免了局部最優(yōu),提高了自動(dòng)導(dǎo)引車物料運(yùn)輸效率和規(guī)劃路徑的有效性。
3)蟻群算法。
蟻群算法(ACO)是一種模擬螞蟻尋找食物行為而產(chǎn)生的啟發(fā)式優(yōu)化算法,其思想是模擬蟻群在尋找食物過程中留下信息素的現(xiàn)象,通過模擬信息素的積累和揮發(fā)來引導(dǎo)搜索過程。每個(gè)螞蟻代表一個(gè)潛在解。每個(gè)螞蟻根據(jù)信息素的濃度和啟發(fā)式函數(shù)進(jìn)行決策來選擇路徑并更新信息素。隨著螞蟻不斷搜索,信息素的分布逐漸收斂于更優(yōu)解的區(qū)域。
對(duì)于電力巡檢避障問題,可以利用蟻群釋放信息素和相互通信機(jī)制來尋找最優(yōu)路徑并避開障礙物,然后再經(jīng)過迭代和信息素更新找到較為可行的路徑。例如,針對(duì)傳統(tǒng)蟻群算法在路徑規(guī)劃中收斂速度慢、易陷入局部最優(yōu)、拐點(diǎn)過多等問題,文獻(xiàn)[24]通過對(duì)網(wǎng)格圖進(jìn)行預(yù)處理來減少冗余搜索,并將蟻群算法與遺傳算法相結(jié)合以加快算法的收斂速度,最終實(shí)現(xiàn)了“引導(dǎo)移動(dòng)機(jī)器人快速找到更加平滑軌跡”的結(jié)果。文獻(xiàn)[34]提出了雙層蟻群優(yōu)化算法(Double-layer ant colony optimization algorithm,DL-ACO)并用來解決機(jī)器人自主導(dǎo)航問題。該算法由2個(gè)獨(dú)立的蟻群算法組成,通過并行精英蟻群優(yōu)化方法生成初始無碰撞路徑,然后應(yīng)用拐點(diǎn)優(yōu)化算法的思路對(duì)路徑進(jìn)行優(yōu)化,最終提高了全局搜索能力。
4)其他算法。
除上述的遺傳算法、粒子群算法和蟻群算法外,還有一些其他的仿生類智能算法也可以用于解決電力巡檢避障問題。
①人工免疫算法。算法模擬了生物體免疫,包括抗體的產(chǎn)生、克隆、變異和選擇過程。利用該算法所具有的免疫系統(tǒng)優(yōu)點(diǎn),可實(shí)現(xiàn)避開障礙物尋找最優(yōu)解,同時(shí)可確保路徑的長度和安全性[25]。
②蜂群優(yōu)化算法。這是一種模擬蜜蜂尋找食物行為而得到的優(yōu)化算法。該算法模擬了蜜蜂的群體智能。利用該算法可使機(jī)器人繞過各種障礙物,找到最優(yōu)的巡檢路徑。該算法具備一定的全局搜索能力[26]。
③人工魚群算法。這是一種通過模擬魚群尋找食物的行為而發(fā)展起來的智能優(yōu)化算法,可以用于規(guī)劃機(jī)器人的路徑,使其在遇到障礙物時(shí)能夠迅速調(diào)整行進(jìn)方向,找到合適的路徑[27]。
④蝙蝠算法。該算法模擬了蝙蝠在捕食時(shí)的搜索和追蹤策略,可以用來解決避障問題[28]。
綜上所述,利用仿生類智能算法能夠模擬生物的行為和群體智能的優(yōu)勢以解決電力巡檢中的避障問題。這類算法在解決復(fù)雜環(huán)境下的路徑規(guī)劃問題方面具有一定的優(yōu)勢和適用性,能夠?yàn)殡娏ρ矙z任務(wù)提供有效的路徑規(guī)劃結(jié)果。
3.1.2 智能仿生類多目標(biāo)巡檢算法
在輸電線路桿塔巡檢場景中,為使無人機(jī)依次經(jīng)過所有待檢查的桿塔來完成巡檢任務(wù),需要規(guī)劃多條巡檢路徑。該問題可轉(zhuǎn)化為多旅行商問題。
1)多無人機(jī)巡檢。
針對(duì)多無人機(jī)巡檢的MTSP,文獻(xiàn)[35]提出了一種基于進(jìn)化計(jì)算模型的改進(jìn)遺傳算法——絨泡菌啟發(fā)計(jì)算模型(Physarum-inspired computational model),通過優(yōu)化初始化種群并采用爬坡方法,克服了傳統(tǒng)遺傳算法在解決MTSP過程中出現(xiàn)的過早收斂和解分布不均勻等問題。
為解決MTSP中遺傳算法容易早熟、收斂速度慢等問題,文獻(xiàn)[36]提出了一種基于探索–開發(fā)–跳躍策略的單親遺傳算法,通過探索策略來擴(kuò)展搜索空間、開發(fā)策略以增強(qiáng)算法局部搜索能力;同時(shí),引入跳躍策略來增強(qiáng)算法跳出局部最優(yōu)解的能力。
為解決多機(jī)器人協(xié)作任務(wù)分配問題,文獻(xiàn)[37]以最小化總團(tuán)隊(duì)成本來平衡其工作量,提出了一種新的多目標(biāo)粒子群優(yōu)化方法;通過帕累托優(yōu)化和領(lǐng)導(dǎo)者選擇策略,將標(biāo)準(zhǔn)的單目標(biāo)粒子群算法擴(kuò)展到多目標(biāo)粒子群算法。
文獻(xiàn)[38]介紹了一種改進(jìn)的基于交換序列的粒子群算法用于解決旅行商問題:將擴(kuò)展粒子群算法策略融入基于交換序列的粒子群算法中。該算法比傳統(tǒng)遺傳算法具有更快的收斂速度。
綜合考慮最大行駛距離和總行駛距離,結(jié)合多蟻群算法和序列變量鄰域下降算法,文獻(xiàn)[39]提出用一種基于雙目標(biāo)蟻群優(yōu)化算法來解決移動(dòng)機(jī)器人MTSP問題,通過強(qiáng)大的雙目標(biāo)MTSP局部優(yōu)化方法來改進(jìn)候選解。
將蟻群優(yōu)化與基于分解的多目標(biāo)進(jìn)化算法相結(jié)合,將多目標(biāo)優(yōu)化問題分解為多個(gè)單目標(biāo)優(yōu)化問題,文獻(xiàn)[40]提出了一種新的多目標(biāo)進(jìn)化算法,利用蟻群的搜索機(jī)制來解決每個(gè)子問題。該算法在多目標(biāo)0-1背包問題和雙目標(biāo)旅行推銷員問題上的性能表現(xiàn)較為優(yōu)異。
2)車–機(jī)協(xié)同巡檢。
對(duì)于普通的輸電線路巡檢,使用多無人機(jī)規(guī)劃可以很好地完成任務(wù);但對(duì)于區(qū)域較大或者跨區(qū)域輸電線桿塔巡檢,單一的無人機(jī)巡檢很難完成這類龐大的任務(wù)。針對(duì)此問題,有學(xué)者提出了一種新型模式——車–機(jī)協(xié)同巡檢。
面對(duì)無人機(jī)電池壽命短、遠(yuǎn)程機(jī)動(dòng)性差等挑戰(zhàn),文獻(xiàn)[41]結(jié)合較大區(qū)域輸電線路電力巡檢,提出了“無人機(jī)與運(yùn)營車”協(xié)同巡檢模式,即通過任務(wù)分配模型完成作業(yè)圈劃分、停車點(diǎn)選址、多無人機(jī)任務(wù)分配和無人機(jī)路徑規(guī)劃。
文獻(xiàn)[42]提出一種車載多無人機(jī)協(xié)同模式:利用小型無人機(jī)的優(yōu)勢實(shí)現(xiàn)大面積多區(qū)域覆蓋掃描任務(wù),以車輛為移動(dòng)基站,與多架無人機(jī)協(xié)同完成任務(wù)。采用文中基于三階段的智能優(yōu)化算法,可以快速生成可行解、進(jìn)行自適應(yīng)大規(guī)模鄰域搜索優(yōu)化。該協(xié)同模式相較于車載單無人機(jī)任務(wù)執(zhí)行在時(shí)間上有顯著優(yōu)勢。
綜上所述,針對(duì)輸電線路桿塔巡檢任務(wù)中的復(fù)雜任務(wù)和環(huán)境,學(xué)者們提出了車–機(jī)協(xié)同方法,即以車機(jī)協(xié)同模式,將車輛作為移動(dòng)基站與多無人機(jī)協(xié)同完成任務(wù)。利用該方法可得到高效實(shí)用的巡檢解決方案。
深度強(qiáng)化學(xué)習(xí)是一種結(jié)合深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的機(jī)器學(xué)習(xí)算法,其思想是:通過智能體與環(huán)境的交互學(xué)習(xí)最優(yōu)策略來獲得最大累積獎(jiǎng)勵(lì);利用深度神經(jīng)網(wǎng)絡(luò)逼近復(fù)雜的狀態(tài)–動(dòng)作映射關(guān)系,在高維狀態(tài)空間中進(jìn)行決策和規(guī)劃。
深度強(qiáng)化學(xué)習(xí)具有自適應(yīng)性和泛化能力,在游戲、無人駕駛、路徑規(guī)劃等領(lǐng)域廣泛應(yīng)用。其中,比較經(jīng)典的算法有DQN(Deep Q-network)、DDPG(Deep deterministic policy gradient)、PPO(Proximal policy optimization)、TRPO(Trust region policy optimization)、A3C(Asynchronous advantage actor-critic)等。
利用深度強(qiáng)化學(xué)習(xí)算法解決電力巡檢機(jī)器人的避障問題的思路是:利用深度強(qiáng)化學(xué)習(xí)算法獲取環(huán)境的深層信息,使機(jī)器人能夠智能地規(guī)劃路徑并與環(huán)境進(jìn)行交互;通過不斷迭代優(yōu)化神經(jīng)網(wǎng)絡(luò),機(jī)器人能夠?qū)崿F(xiàn)自主避障,確保在復(fù)雜環(huán)境中高效地巡檢。利用這類方法不僅能提高巡檢效率,還能提升機(jī)器人的安全性和穩(wěn)定性。
文獻(xiàn)[29]提出改進(jìn)型DQN算法:通過記錄重復(fù)狀態(tài)出現(xiàn)頻率,重新計(jì)算Q值。該算法提高了機(jī)器人對(duì)環(huán)境的探索能力,降低了網(wǎng)絡(luò)收斂于局部最優(yōu)的風(fēng)險(xiǎn),減少了網(wǎng)絡(luò)收斂的訓(xùn)練回合。
為訓(xùn)練無人機(jī)在三維城市區(qū)域中抵達(dá)移動(dòng)或靜態(tài)目標(biāo),文獻(xiàn)[30]提出了一個(gè)基于深度強(qiáng)化學(xué)習(xí)的自主無人機(jī)路徑規(guī)劃框架:采用DDPG訓(xùn)練無人機(jī);設(shè)計(jì)了定制的獎(jiǎng)勵(lì)函數(shù)來最小化無人機(jī)與目標(biāo)之間的距離。利用該策略可使無人機(jī)能夠從周圍環(huán)境中學(xué)習(xí)并實(shí)時(shí)確定自身軌跡,可提高算法的收斂速度和避障性能。
此外,深度強(qiáng)化學(xué)習(xí)算法也可用在解決電力巡檢中的多旅行商路徑規(guī)劃問題方面。在大區(qū)域輸電線路桿塔巡檢任務(wù)中,通過深度強(qiáng)化學(xué)習(xí)算法學(xué)習(xí)復(fù)雜的環(huán)境信息來不斷優(yōu)化策略,可得到最優(yōu)或近似最優(yōu)的巡檢路徑,最終有效地解決多旅行商問題。
文獻(xiàn)[43]提出了一種基于學(xué)習(xí)的MTSP優(yōu)化方法:通過共享圖神經(jīng)網(wǎng)絡(luò)和分布式策略網(wǎng)絡(luò)構(gòu)建通用策略;使用2階段方法,并結(jié)合規(guī)則優(yōu)化解決單代理旅行商問題;引入樣本批處理訓(xùn)練來提高算法性能。
為解決動(dòng)態(tài)圖上的旅行商問題,文獻(xiàn)[44]提出了一種融合多頭注意力機(jī)制和分層強(qiáng)化學(xué)習(xí)的輕量級(jí)模型。
為解決大規(guī)模旅行商問題,文獻(xiàn)[45]提出了一種新的分層式深度強(qiáng)化學(xué)習(xí)算法——即上層算法生成子問題、下層算法來求解。利用該方法能夠快速得到較優(yōu)解,并且可減少最優(yōu)解與其他解的之間的質(zhì)量差距。
綜上所述,深度強(qiáng)化學(xué)習(xí)算法不僅解決了電力巡檢中的避障問題、提高了巡檢過程中的安全性、優(yōu)化了電力巡檢任務(wù)的執(zhí)行效率,同時(shí)也為大面積跨區(qū)域輸電線桿塔巡檢問題提供了高效的路徑規(guī)劃問題解決方法。
目前來看,雖然關(guān)于電力巡檢路徑規(guī)劃方法的研究已經(jīng)取得了一定的進(jìn)展,但仍有待進(jìn)一步完善和創(chuàng)新。隨著深度強(qiáng)化學(xué)習(xí)類算法的不斷發(fā)展和相關(guān)技術(shù)的不斷進(jìn)步,未來將會(huì)有更多高效、智能且低耗的路徑規(guī)劃方法應(yīng)用于電力巡檢。隨著新型電力系統(tǒng)基建規(guī)模的不斷擴(kuò)大,以及電網(wǎng)對(duì)系統(tǒng)安全運(yùn)行需求的不斷提高,未來的電力巡檢機(jī)器人路徑規(guī)劃的研究有可能呈現(xiàn)出如下新趨勢:
1)深度學(xué)習(xí)避障策略。深度強(qiáng)化學(xué)習(xí)模型將變得更加智能,能夠根據(jù)環(huán)境變化實(shí)時(shí)調(diào)整避障策略,使機(jī)器人能更好地適應(yīng)不斷變化的電力設(shè)施和障礙物。
2)多機(jī)器人智能協(xié)作。電力巡檢通常涉及多個(gè)機(jī)器人協(xié)同工作。多個(gè)機(jī)器人將密切協(xié)同工作,實(shí)現(xiàn)協(xié)作式智能巡檢,從而使得工作效率得到大幅提升。
3)多模態(tài)感知。通過視覺、激光雷達(dá)和超聲波傳感等,深度強(qiáng)化學(xué)習(xí)將集成更全面的多模態(tài)環(huán)境感知,從而幫助機(jī)器人更好地避開障礙物。
4)自主決策。路徑規(guī)劃將更緊密融合自主導(dǎo)航技術(shù),如同步定位與地圖繪制、視覺識(shí)別等。這將提高機(jī)器人在未知環(huán)境中的自主路徑規(guī)劃能力,確保機(jī)器人能夠在動(dòng)態(tài)環(huán)境中快速做出反應(yīng)。
5)可持續(xù)性。未來,路徑規(guī)劃將重視可持續(xù)性,注重降低能耗和對(duì)環(huán)境的影響,推動(dòng)綠色低耗巡檢。