于 進(jìn),王建鵬,張海君
(鄂爾多斯市國(guó)源礦業(yè)開發(fā)有限責(zé)任公司,鄂爾多斯 010399)
由于煤礦井下經(jīng)常容易發(fā)生爆炸和坍塌事故,工作人員進(jìn)入到煤礦井下工作具有一定的安全隱患。所以,可以通過管路安裝機(jī)器人完成煤礦井下相關(guān)設(shè)備安裝。管路安裝機(jī)器人的出現(xiàn)有效降低了煤礦井下人員傷亡,同時(shí)還可以為井上決策提供建議。但由于煤礦井下環(huán)境狹窄,且井下管路布局通常非常密集,管道之間的空間有限,并且可能存在彎曲、分支等復(fù)雜情況,導(dǎo)致機(jī)器人的靈活性和適應(yīng)性受到一定的制約[1-2],為此研究管路安裝機(jī)器人在不確定環(huán)境下的協(xié)同自動(dòng)控制,具有十分重要的意義。
國(guó)內(nèi)相關(guān)專家也給出了一些比較好的研究成果。例如文獻(xiàn)[3]主要通過深度強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)機(jī)器人自動(dòng)化控制。該方法分析了神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)獎(jiǎng)勵(lì)模型對(duì)整體控制方法的影響,并最終通過實(shí)驗(yàn)驗(yàn)證了C2 結(jié)構(gòu)的自動(dòng)控制效率更高;文獻(xiàn)[4]通過DDPG 算法和PID 控制相結(jié)合的方式完成機(jī)器人協(xié)同控制,有效躲避障礙物;文獻(xiàn)[5]建立了機(jī)器人行走軌跡運(yùn)動(dòng)模型,計(jì)算對(duì)應(yīng)的角速度和線速度,同時(shí)引入自動(dòng)避障流程完成機(jī)器人自動(dòng)避障控制方法。
但是以上方法在不確定的煤礦井下環(huán)境應(yīng)用過程中,需要進(jìn)行大量迭代計(jì)算完成環(huán)境確認(rèn),應(yīng)用范圍受限。本文在以上幾種研究方法的基礎(chǔ)上,提出一種煤礦井下管路安裝機(jī)器人協(xié)同自動(dòng)控制方法。通過實(shí)驗(yàn)結(jié)果表明,采用所提方法可以獲取比較滿意的煤礦井下管路安裝機(jī)器人協(xié)同自動(dòng)控制效果。
管路安裝機(jī)器人在通常情況下工作于結(jié)構(gòu)化環(huán)境中,管路安裝機(jī)器人的周圍環(huán)境地圖可以采用比較簡(jiǎn)單的柵格地圖描述。在管路機(jī)器人展開協(xié)同自動(dòng)控制前期,優(yōu)先對(duì)管路機(jī)器人所在的煤礦井下不確定環(huán)境展開精準(zhǔn)描述,以組建精準(zhǔn)的環(huán)境地圖。
在構(gòu)建柵格環(huán)境地圖[6]過程中,精準(zhǔn)描述不確定障礙物是一個(gè)十分關(guān)鍵的問題,需要對(duì)障礙物展開如下假設(shè):
(1)二維柵格地圖中的障礙物面積也是障礙物在地面的面積,障礙物的高度信息并不參與計(jì)算。
(2)煤礦井下的障礙物詳細(xì)信息是利用傳感器以及攝像機(jī)采集到的,通過計(jì)算機(jī)展開處理,最終轉(zhuǎn)換為二值信息柵格。
柵格地圖表示法就是通過多個(gè)長(zhǎng)和寬相等的柵格將對(duì)煤礦井下管路安裝機(jī)器人的工作空間展開劃分處理,柵格的大小不僅和煤礦井下管路安裝機(jī)器人的本體尺寸存在很大關(guān)聯(lián),同時(shí)還會(huì)影響管路安裝機(jī)器人并行協(xié)同自動(dòng)控制結(jié)果的精確度。管路安裝機(jī)器人在行駛過程中,環(huán)境空間布局不會(huì)發(fā)生變化,障礙物的大小也是完全不變的。地圖被劃分為具有固定頻率的柵格,每個(gè)柵格代表一個(gè)存儲(chǔ)信息的網(wǎng)格單元。這樣可以將環(huán)境問題轉(zhuǎn)化為柵格的路徑規(guī)劃問題。以下給出柵格數(shù)量劃分的詳細(xì)操作步驟:
(1)選定環(huán)境空間中的障礙物。
(2)選用多個(gè)矩形包絡(luò)障礙物,即可獲取邊長(zhǎng)的最大值pmax和最小值pmin。
(3)通過式(1)求解每個(gè)矩形i 的面積Si:
式中:ai和bi分別為矩形的長(zhǎng)和寬。
(4)通過式(2)求解n 個(gè)矩形的區(qū)域面積Sn:
(5)通過式(3)和式(4)求解第i 個(gè)柵格的長(zhǎng)度pi以及柵格單元的長(zhǎng)度l:
劃分的柵格總數(shù)N 如式(5)所示:
式中:E 為地圖的長(zhǎng)度;A 為地圖的寬度。
通常情況下,柵格環(huán)境地圖是由兩類柵格組成,一類為自由柵格,采用z(x)=0 表示,也就是煤礦井下管路安裝機(jī)器人可通行區(qū)域;另外一類為障礙物柵格,采用z(x)=1 表示,是煤礦井下管路安裝機(jī)器人需要繞行的區(qū)域。在展開煤礦井下管路安裝機(jī)器人并行協(xié)同自動(dòng)控制前期,分別對(duì)可通行區(qū)域和不可通行區(qū)域展開編號(hào)處理。
在劃分柵格總數(shù)后,并不是全部的障礙物都可以完整表示在柵格中,還有一部分不規(guī)則障礙物沒有占用整數(shù)倍的柵格單元,所以需要對(duì)其邊緣使用二值膨脹方法,使其可以填滿整數(shù)倍的柵格。為此,構(gòu)建柵格環(huán)境地圖C 為式(6)的形式:
式中:D 為被處理的圖像;B 為結(jié)構(gòu)元素;(x,y)為柵格位置;為以單位長(zhǎng)度為步長(zhǎng)展開移動(dòng)。
通過柵格環(huán)境地圖,機(jī)器人可以了解到環(huán)境的結(jié)構(gòu)和特征,進(jìn)而進(jìn)行路徑規(guī)劃、避障等決策。為此,以上述構(gòu)建的地圖為主要實(shí)驗(yàn)環(huán)境,引入啟發(fā)函數(shù)來估計(jì)當(dāng)前位置到目標(biāo)位置的預(yù)測(cè)距離。啟發(fā)函數(shù)可根據(jù)現(xiàn)有信息提供蟻群選擇下一步移動(dòng)方向的指導(dǎo),使蟻群算法[7]更加高效。蟻群算法模擬螞蟻在尋找食物時(shí)的行為,通過信息素和啟發(fā)函數(shù)的權(quán)衡,在柵格之間選擇最優(yōu)路徑。
螞蟻?zhàn)鳛闁鸥裰械囊苿?dòng)單位,將每只螞蟻視為一個(gè)實(shí)體,在柵格內(nèi)進(jìn)行移動(dòng)。在柵格中引入信息素,每個(gè)柵格都具有一定數(shù)量的信息素。設(shè)定m 只螞蟻需要訪問n 個(gè)位置,記錄螞蟻k 當(dāng)前已經(jīng)訪問過的位置,行走路徑集合tk會(huì)隨著螞蟻的運(yùn)動(dòng)而變化。當(dāng)行走路徑集合tk內(nèi)包含了全部位置后,則說明螞蟻k 完成此次迭代。其中,轉(zhuǎn)移概率[8]決定了螞蟻k 下一步運(yùn)動(dòng)到哪個(gè)位置,而轉(zhuǎn)移概率和位置i及位置j 路徑上的信息素濃度以及啟發(fā)信息存在關(guān)聯(lián),為此,計(jì)算螞蟻k 在設(shè)定時(shí)間內(nèi)從位置i 轉(zhuǎn)移到位置j 的概率:
式中:ak為螞蟻k 能夠訪問的位置;τij(t)、ηij(t)為t時(shí)段內(nèi)從位置i 到位置j 的信息素量和期望啟發(fā)函數(shù);β 為期望啟發(fā)因子。
設(shè)定從位置i 到位置j 的啟發(fā)函數(shù):
式中:dij為位置i 到位置j 的距離;(xi,yi)和(xj,yj)分別為位置i 和位置j 對(duì)應(yīng)的坐標(biāo)位置。
螞蟻在訪問完一個(gè)位置或者全部位置都完成訪問后,更新柵格環(huán)境中各個(gè)行走路徑上的信息素濃度τij(t+1),對(duì)應(yīng)的計(jì)算式如下所示:
式中:ρ 為信息素?fù)]發(fā)因子。
通過上述分析,給出蟻群算法的操作流程如圖1 所示。由圖1 可知,啟發(fā)函數(shù)只考慮了當(dāng)前位置i和相鄰柵格位置j,但是并沒有起始點(diǎn)as以及目標(biāo)點(diǎn)ag,同時(shí)會(huì)導(dǎo)致算法在選擇下一位置時(shí)陷入死鎖。所以,需要對(duì)啟發(fā)函數(shù)展開改進(jìn),經(jīng)過改進(jìn)后的啟發(fā)函數(shù)如式(10)所示:
圖1 蟻群算法操作流程Fig.1 Operation flow chart of ant colony optimization algorithms
經(jīng)過多次迭代后,對(duì)信息素量的更新規(guī)則Δτij(t)以及信息素?fù)]發(fā)因子ρ 展開更新,對(duì)應(yīng)的計(jì)算式如下所示:
式中:Lm為路徑長(zhǎng)度的均值;R 為常數(shù);ψc為循環(huán)次數(shù);Q 為信息素強(qiáng)度;Lk為螞蟻k 在此次循環(huán)走過的路徑長(zhǎng)度;ρmax和ρmin為信息素?fù)]發(fā)因子的最大和最小值;ψ 和ψmax為當(dāng)前迭代次數(shù)和最大迭代次數(shù)。
完成上述操作后,通過改進(jìn)啟發(fā)函數(shù)優(yōu)化后的蟻群算法[9]展開煤礦井下管路安裝機(jī)器人并行協(xié)同自動(dòng)控制,詳細(xì)的操作步驟如下所示:
(1)通過柵格法建立柵格環(huán)境地圖C,同時(shí)對(duì)全部參數(shù)展開初始化處理,主要包含迭代次數(shù)等;
(2)設(shè)定tk為機(jī)器人行走路徑集合;
(3)通過式(7)計(jì)算螞蟻從當(dāng)前位置轉(zhuǎn)移到另外一個(gè)位置的概率,移動(dòng)一步就對(duì)集合tk更新一次;
(4)判斷螞蟻k 是否陷入凹型障礙物死鎖,假設(shè)是,則直接啟用螞蟻退回策略,將凹型障礙物內(nèi)的柵格設(shè)定為障礙物柵格,同時(shí)再返回上一步驟;反之,則跳轉(zhuǎn)至步驟(5);
(5)判斷螞蟻k 是否完成一次搜索,假設(shè)是,則跳轉(zhuǎn)至下一步;反之,則返回至步驟(3);
(6)通過多步長(zhǎng)移動(dòng)策略對(duì)螞蟻搜索到的路徑展開二次規(guī)劃,同時(shí)保存二次規(guī)劃后的路徑;
(7)通過式(11)對(duì)各個(gè)路徑上的信息素展開更新處理,且k=k+1;
(8)判斷是否全部螞蟻都完成一次搜索,假設(shè)是,直接跳轉(zhuǎn)至下一步;反之,則返回至步驟(3);
(9)判斷ψc<ψmax是否成立,假設(shè)是,則直接跳轉(zhuǎn)至步驟(2);反之,則直接跳出循環(huán),同時(shí)輸出最優(yōu)煤礦井下管路安裝機(jī)器人協(xié)同控制方案。
為了驗(yàn)證所提煤礦井下管路安裝機(jī)器人并行協(xié)同自動(dòng)控制方法的有效性,通過Matlab 平臺(tái)展開實(shí)驗(yàn)分析。
通過激光雷達(dá)和Clearpath ROS 機(jī)器人構(gòu)建煤礦井下管路真實(shí)環(huán)境下的地圖模型,對(duì)形成的環(huán)境地圖在Matlab 軟件中將地圖轉(zhuǎn)換為二值圖像,同時(shí)通過meshgrid 函數(shù)對(duì)地圖展開柵格化處理,同時(shí)障礙物邊緣和柵格單元邊緣兩者完全重合,采用式(6)最終獲取煤礦井下的柵格地圖。實(shí)驗(yàn)分析過程中需要在同一個(gè)地圖內(nèi)設(shè)定相同的起點(diǎn)和終點(diǎn),具體如圖2 所示。實(shí)驗(yàn)參數(shù)設(shè)置如表1 所示。
表1 實(shí)驗(yàn)參數(shù)設(shè)置Tab.1 Experimental parameter settings
圖2 柵格環(huán)境地圖Fig.2 Grid environment map
采用所提方法展開煤礦井下管路安裝機(jī)器人并行協(xié)同自動(dòng)控制,測(cè)試結(jié)果如圖3 所示。
圖3 所提方法的煤礦井下管路安裝機(jī)器人并行協(xié)同自動(dòng)控制結(jié)果Fig.3 Parallel collaborative automatic control results of coal mine underground pipeline installation robot using the proposed method
分析圖3 可知,采用所提方法展開煤礦井下管路安裝機(jī)器人并行協(xié)同自動(dòng)控制時(shí),可以有效躲避障礙物,具有良好的煤礦井下管路安裝機(jī)器人并行協(xié)同自動(dòng)控制性能。
分析不同柵格環(huán)境下所提方法的路徑長(zhǎng)度變化情況,如表2 所示。
表2 不同柵格環(huán)境下所提方法的路徑長(zhǎng)度實(shí)驗(yàn)結(jié)果Tab.2 Experimental results of path length for proposed method in different grid environments
通過表2 可知,所提方法具有較短的搜索路徑,說明采用所提方法展開煤礦井下管路安裝機(jī)器人并行協(xié)同自動(dòng)控制后,路徑長(zhǎng)度得到有效降低,充分驗(yàn)證了所提方法的優(yōu)越性。
對(duì)所提方法的煤礦井下管路安裝機(jī)器人并行協(xié)同自動(dòng)控制時(shí)間展開分析,如圖4 所示。
分析圖4 可知,所提方法的煤礦井下管路安裝機(jī)器人并行協(xié)同自動(dòng)控制時(shí)間較低,說明所提方法具有較快的控制效率。
為了確保煤礦井下安裝工作的順利展開,提出一種煤礦井下管路安裝機(jī)器人并行協(xié)同自動(dòng)控制方法。通過大量實(shí)驗(yàn)測(cè)試證明,所提方法可以有效避免管路安裝機(jī)器在行走過程中出現(xiàn)碰撞,同時(shí)還可以縮短行走路徑,減少控制時(shí)間,獲取更加滿意的管路安裝機(jī)器并行協(xié)同自動(dòng)控制效果。