朱 林,方勝良,吳付祥,吳志建
(1.解放軍電子工程學院,合肥 230037;2.電子制約技術(shù)安徽省重點實驗室,合肥 230037;3.解放軍63889部隊,河南 洛陽 471003)
基于動態(tài)數(shù)據(jù)驅(qū)動的多UAV實時任務(wù)規(guī)劃
朱 林1,2,方勝良1,2,吳付祥1,吳志建3
(1.解放軍電子工程學院,合肥 230037;2.電子制約技術(shù)安徽省重點實驗室,合肥 230037;3.解放軍63889部隊,河南 洛陽 471003)
針對在實時動態(tài)條件下多UAV任務(wù)規(guī)劃問題,提出了基于動態(tài)數(shù)據(jù)驅(qū)動的多UAV實時任務(wù)規(guī)劃仿真平臺,主要包括基于MultiUAV2的真實UAV群仿真平臺和基于Multi-Agent的預(yù)測仿真平臺兩個部分。采用了A*算法對真實系統(tǒng)工作流進行探索,在此基礎(chǔ)之上構(gòu)建了多UAV合成工作流模型,然后針對動態(tài)數(shù)據(jù)注入運行仿真的問題,研究了傳感器任務(wù)重置及傳感器的預(yù)處理方法。最后,通過一個仿真實例驗證了提出方法的可行性和有效性。
無人機,動態(tài)數(shù)據(jù)驅(qū)動應(yīng)用系統(tǒng),任務(wù)規(guī)劃,多Agent
在現(xiàn)代戰(zhàn)場全方位、大縱深的背景下,多無人機(Unmanned Aerial Vehicle,UAV)協(xié)作在偵查搜索、態(tài)勢監(jiān)控等方面發(fā)揮著越來越重要的作用[1-3]。UAV群通過協(xié)作執(zhí)行相互關(guān)聯(lián)的任務(wù),從而可以實現(xiàn)更高層次的任務(wù)目標。然而,隨著UAV飛行環(huán)境越來越復雜,執(zhí)行任務(wù)中不確定和突發(fā)性因素的增加,UAV的復雜任務(wù)執(zhí)行能力和應(yīng)變能力面臨著嚴峻的挑戰(zhàn)。這也對多UAV任務(wù)分配及指揮控制提出了新的要求,需要UAV群能及時根據(jù)當前環(huán)境信息,對作戰(zhàn)任務(wù)進行實時規(guī)劃和調(diào)整。
作為UAV發(fā)展的關(guān)鍵技術(shù)之一,多UAV任務(wù)規(guī)劃問題受到了國內(nèi)外學者的廣泛關(guān)注。文獻[4]基于空間距離研究了多機協(xié)同算法并進行了實驗驗證,其研究側(cè)重于對象本身的控制,其算法采用簡化的運動模型,不適用于空間機動過程的協(xié)同運動;文獻[5]對UAV任務(wù)分配和路徑規(guī)劃算法進行了歸納抽象,并利用多Agent技術(shù)搭建了UAV協(xié)同作戰(zhàn)算法仿真平臺,具備較強的通用性,但仿真的輸入數(shù)據(jù)多以歸檔數(shù)據(jù)為主,仿真的實時性和可靠性較弱;文獻[6]基于速度矢量場對UAV進行實時動態(tài)航路規(guī)劃,但沒有考慮UAV的機動限制和搜索環(huán)境的動態(tài)特性。
本文基于動態(tài)數(shù)據(jù)驅(qū)動應(yīng)用系統(tǒng)(Dynamic Data Driven Application System,DDDAS)的概念研究[7],提出以下基本思路:首先基于MultiUAV2構(gòu)建UAV群仿真平臺,通過模擬真實UAV群提供相關(guān)數(shù)據(jù)信息,然后構(gòu)建基于Multi-Agent的超實時運行試驗臺,根據(jù)從MultiUAV2反饋的實時數(shù)據(jù),基于Multi-Agent的試驗臺將進行動態(tài)的更新,在超實時條件下預(yù)測UAV群的性能,同時對控制算法、控制參數(shù)或協(xié)同UAV工作流程提出改進建議,最后將預(yù)測結(jié)果反饋給MultiUAV2對UAV群任務(wù)實時做出調(diào)整。針對上述思路,本文主要解決以下關(guān)鍵問題:一是對多UAV動態(tài)任務(wù)分配的工作流程進行建模,二是解決傳感器數(shù)據(jù)動態(tài)注入到正在運行的仿真中的問題。最后,通過仿真實例給出實時動態(tài)條件下的多UAV任務(wù)規(guī)劃的仿真結(jié)果。
本文主要解決以下關(guān)鍵問題:一是對多UAV動態(tài)任務(wù)分配的工作流程進行建模,二是解決傳感器數(shù)據(jù)動態(tài)注入到正在運行的仿真中的問題。最后,通過仿真實例給出實時動態(tài)條件下的多UAV任務(wù)規(guī)劃的仿真結(jié)果。
1.1 DDDAS及其動態(tài)特性
DDDAS是一種全新的仿真應(yīng)用模式[8],旨在將仿真與實驗/試驗有機結(jié)合起來,使仿真在運行過程中動態(tài)地從實際系統(tǒng)中接收新的數(shù)據(jù)并作出響應(yīng)。同時,仿真結(jié)果也可以動態(tài)地控制實際系統(tǒng)的運行,并指導數(shù)據(jù)測量的進行,仿真與實際系統(tǒng)之間構(gòu)成一個相互協(xié)作的動態(tài)反饋控制系統(tǒng)。
傳統(tǒng)系統(tǒng)仿真通常是比較復雜的缺乏準確描述實際系統(tǒng)的能力,這種情形在實時動態(tài)的條件下更為突出[9]。相比于傳統(tǒng)的靜態(tài)仿真系統(tǒng),DDDAS的動態(tài)性主要體現(xiàn)在以下幾個方面:①根據(jù)傳感器數(shù)據(jù)的動態(tài)注入,自適應(yīng)調(diào)整仿真系統(tǒng)的運行。②根據(jù)真實數(shù)據(jù)與仿真結(jié)果的對比,仿真系統(tǒng)實時調(diào)整仿真模型和模型分辨率,同時可對實際系統(tǒng)的狀態(tài)進行預(yù)測。③根據(jù)仿真結(jié)果,仿真系統(tǒng)實時調(diào)整數(shù)據(jù)采集策略,并且以此控制實際系統(tǒng)和選擇采集注入數(shù)據(jù)。
1.2 基于DDDAS的UAV群仿真平臺概念框架
圖1給出了基于DDDAS的UAV群仿真平臺的概念框架,MultiUAV2用來模擬真實UAV群及其運行環(huán)境,基于Multi-Agent的仿真平臺是一個動態(tài)數(shù)據(jù)驅(qū)動應(yīng)用系統(tǒng),它可以動態(tài)地進行更新,反過來可以發(fā)送給UAV群新的控制命令。在仿真運行期間,MultiUAV2的數(shù)據(jù)被提取出來并送入前端服務(wù)中,前端服務(wù)調(diào)用Multi-Agent仿真平臺來引導UAV群行為預(yù)測任務(wù)。任務(wù)完成后,Multi-Agent仿真返回新的控制參數(shù)和新的UAV群工作流規(guī)范,更新服務(wù)將仿真預(yù)測結(jié)果送入信使服務(wù)的消息隊列中,MultiUAV2定期更新信使服務(wù)來動態(tài)地調(diào)整仿真參數(shù)。
圖1 基于DDDAS的仿真平臺概念框架
通常情況下,基于DDDAS準則的預(yù)測仿真在對真實系統(tǒng)的行為進行仿真時,會與真實系統(tǒng)同時運行。而基于Multi-Agent仿真的工作流的執(zhí)行效率顯然要高于真實系統(tǒng),為此,將仿真系統(tǒng)參與到真實系統(tǒng)中探索類似于真實系統(tǒng)工作流的基于Agent的工作流,以提高仿真的可靠性和系統(tǒng)的執(zhí)行效率。
2.1 基于A*算法的系統(tǒng)工作流組合
為了把這些優(yōu)化的工作流轉(zhuǎn)換為可執(zhí)行的系統(tǒng),需要采用一種算法來從真實系統(tǒng)中發(fā)現(xiàn)狀態(tài)和性能信息,根據(jù)真實運行數(shù)據(jù)來構(gòu)成相同意義的工作流。探索運行系統(tǒng)的工作流類似于Web服務(wù)組合問題,A*算法[10]作為一種典型的啟發(fā)式搜索算法可達到探索系統(tǒng)工作流的目標,其基本思想是:將待解問題分為兩部分之和,即已求解問題的代價和將要求解問題的代價,該代價函數(shù)可表示為:
其中n表示問題某處待解節(jié)點,g(n)表示從起始點到當前點n的代價,h(n)表示從n到目標點的估計代價,稱之為啟發(fā)函數(shù)。f(n)就是從起始點到目標點的最優(yōu)路徑。采用A*算法的思想是將探索運行系統(tǒng)的工作流問題看作是一個狀態(tài)空間的搜索問題,其共同點是均為求解一條有向優(yōu)化的路徑,由于實際存在的路徑并不唯一,而我們希望花費最小代價尋找一條最優(yōu)路徑,所以問題最終轉(zhuǎn)化為求解源點到目標點的最優(yōu)路徑。
2.2 Agent任務(wù)的模塊化及通用性表示
Agent任務(wù)的模塊化及通用性表示是通過各自治Agent之間的相互協(xié)作完成任務(wù)來實現(xiàn)的。預(yù)測仿真執(zhí)行真實系統(tǒng)工作流是將系統(tǒng)總目標分解成各個子目標,將子目標映射到子任務(wù)達到可操作的程度,然后分配給各Agent,由Agent完成指派的子任務(wù)達到相應(yīng)的子目標從而實現(xiàn)總目標。
在協(xié)同的環(huán)境中,各Agent的能力組合在于分解后的任務(wù)能夠分配給各個Agent執(zhí)行,同時,分解后的子任務(wù)之間存在一定的邏輯關(guān)系,而這些關(guān)系是以Agent的任務(wù)執(zhí)行的方式來體現(xiàn)的。因此,A-gent之間的關(guān)系映射了各個子任務(wù)之間的關(guān)系,如圖2所示。由此可見,可通過分析Agent之間的關(guān)系來研究工作流中各任務(wù)之間的邏輯關(guān)系,Agent之間的協(xié)同關(guān)系實質(zhì)上是其執(zhí)行的任務(wù)之間內(nèi)在聯(lián)系的體現(xiàn)。
圖2 Agent與任務(wù)的映射關(guān)系
2.3 多UAV合成工作流建模
利用Agent任務(wù)通用的、可演化的表述,根據(jù)預(yù)測仿真對真實系統(tǒng)所提供的指導,可運用計算方法將新的操作進行重新組織。如圖3所示,圖形在操作環(huán)境和仿真環(huán)境中均能表現(xiàn)Agent的能力。系統(tǒng)R可以由一組Agent功能或服務(wù)所構(gòu)成的集合來表示,R=〈S1……Sn〉。一個服務(wù)定義為由前置條件、輸入、副作用、受影響目標、輸出和后置條件所構(gòu)成的六元組,可以表示為
其中,CI是前置條件,I是輸入列表,A是服務(wù)產(chǎn)生的副作用,AO是受影響的目標,O是輸出列表,CO是后置條件列表,前置條件和后置條件是地面控制系統(tǒng)的邏輯判斷。所給的問題可以表示為
廣義的組合問題可以定義為從R中動態(tài)尋找服務(wù)的一個有向無環(huán)圖G=〈V,E〉,其中,V是頂點集,E是曲線圖邊緣的集合。曲線圖中的每個頂點可以表示為包含組合的服務(wù),也可以表示為曲線圖中直接前驅(qū)服務(wù)的后置條件,其結(jié)果只能在服務(wù)執(zhí)行后確定,節(jié)點(服務(wù))的每一個溢出的邊緣表示由服務(wù)所產(chǎn)生的輸出和后置條件。UAV群的工作流建模為一個有向無環(huán)圖,可以實現(xiàn)動態(tài)UAV群任務(wù)重新分配。
圖3 多UAV工作流模型
UAV群與DDDAS控制及控制仿真之間反饋回路的質(zhì)量、可靠性和及時性取決于相關(guān)信息及時的收集與傳播,DDDAS的固有目標是通過頻繁地適應(yīng)數(shù)據(jù)采集來改善DDDAS控制及控制仿真的表現(xiàn)。因此,本節(jié)主要對多傳感器動態(tài)高效的任務(wù)重置和基于傳感器的數(shù)據(jù)采集的預(yù)處理這兩個方面進行研究。
3.1 傳感器任務(wù)重置
多傳感器的任務(wù)重置功能與遠程編程功能是動態(tài)數(shù)據(jù)驅(qū)動系統(tǒng)中最基本的功能,傳感器的輸出用來驅(qū)動仿真的運行,仿真的輸出反過來指導傳感器下一次任務(wù)。因此,需要一個能將仿真結(jié)果轉(zhuǎn)變?yōu)閭鞲衅魅蝿?wù)重置事件的可編程的傳感器體系結(jié)構(gòu)。
根據(jù)仿真的要求,將傳感器任務(wù)重置請求分為3種主要類型:瞬時的、周期性的和基于事件的。瞬時請求是在當前時間下某一特定傳感器讀數(shù)的需要,例如,為了保證仿真具有所有需要的信息或確認已獲得信息的準確性,在一定時間內(nèi)對某一傳感器或UAV發(fā)出的消息請求,其請求格式可表示為:
其中,SENSOR表示目標傳感器,TIMELIMIT表示本次請求的時延要求,如果在TIMELIMIT內(nèi)沒有獲得傳感器數(shù)據(jù),系統(tǒng)將會返回一個緩存?zhèn)鞲衅髦?。當傳感器需要定期對某一區(qū)域進行監(jiān)測,此時需要注冊一個異步監(jiān)視器,這種請求的格式是:
在該類型請求下,仿真周期性地(以1/PERIOD的速率)從SENSOR采集數(shù)據(jù)直到一個指定的截止時間(EXPERATION),該時間也可以設(shè)置為無窮大,此時仿真持續(xù)地從SENSOR采集數(shù)據(jù)。第3種類型是設(shè)置一臺監(jiān)視器連續(xù)地對某一傳感器的值進行監(jiān)測,當監(jiān)測值滿足指定的條件(CONDITION)時只報告這個值。例如,GPS讀數(shù)顯示已經(jīng)到達指定的區(qū)域,對其坐標值進行報告。這種請求的格式是:
3.2 基于傳感器的預(yù)處理
上述任務(wù)重置的方法提供了一種將合適的預(yù)處理活動送入傳感器的能力,我們的目標是提供一種必要的方法來描述復雜的遙感活動(通常涉及多個傳感器),從而進一步改善感知活動的性能和效率。該方法允許仿真系統(tǒng)或控制系統(tǒng)來指定具體的條件和屬性,以及集成的多個傳感器類型,且只對其所需的數(shù)據(jù)或類型進行收集。為此,本文采用一種基于本體的訂閱語言,在可解釋的軟件格式下描述服務(wù),該格式是將傳感需求映射到具體的傳感器規(guī)格。
下面通過舉例進行說明:在本案例中,提出從機載GPS中獲取當前地理位置信息(包括經(jīng)度、緯度和高度)的請求,GPS在所要求的時間段(如上午8點至9點之間)進行傳輸。同時,也可以對傳輸條件進行限制,如判斷是否受到干擾,據(jù)此判斷是否發(fā)送數(shù)據(jù)信息。
在此示例中,采用訂閱語言定義的控制結(jié)構(gòu)的規(guī)則來表示感知的限制和條件,即使用If-then-Else,除此之外還可支持迭代和條件式循環(huán)等結(jié)構(gòu)。當遇到更為復雜的請求時,可以先將其分解成一個或多個簡單的子服務(wù),然后逐一解決。
在MATLAB7.10中,利用Simulink、GUI和M函數(shù)相結(jié)合的方法,通過MATLAB提供的Web服務(wù)調(diào)用機制實施MultiUAV2與前端服務(wù)之間的聯(lián)系。設(shè)置如下仿真場景:派遣一批由12架UAV組成的編隊對指定區(qū)域執(zhí)行態(tài)勢監(jiān)控和情報搜集任務(wù),設(shè)置所探測區(qū)域為未知,即隨機出現(xiàn)對UAV構(gòu)成威脅的地面防空系統(tǒng)。實驗1采用任務(wù)預(yù)設(shè)的方式,在UAV群到達指定空域之前設(shè)定好任務(wù),在執(zhí)行過程中不對任務(wù)做任何修改,其通信數(shù)據(jù)率如圖4(a)所示,仿真結(jié)果如圖5(a)所示;實驗2采用實時任務(wù)規(guī)劃的方式,即只對UAV群設(shè)定任務(wù)目標,UAV群根據(jù)探測區(qū)域的當前態(tài)勢信息實時規(guī)劃作戰(zhàn)任務(wù),其通信數(shù)據(jù)率如圖4(b)所示,仿真結(jié)果如圖5(b)所示。
圖4 UAV群通信數(shù)據(jù)率仿真圖
從圖4兩組對比實驗看出,實驗2由于采用了實時任務(wù)規(guī)劃方式,在仿真中多UAV需要進行實時工作流轉(zhuǎn)換,同時傳感器需要對實時任務(wù)進行重置和處理分析大量的數(shù)據(jù),因而其平均通信數(shù)據(jù)率要大于實驗1的平均通信數(shù)據(jù)率,是實驗1的5倍左右。
圖5 UAV群態(tài)勢監(jiān)控任務(wù)仿真
從圖5中兩組實驗可以發(fā)現(xiàn),實驗1中UAV群通信數(shù)據(jù)率較低,且只有4架UAV能夠執(zhí)行預(yù)定作戰(zhàn)任務(wù),其余UAV由于地面干擾等情況變化失去預(yù)設(shè)的任務(wù)目標,未能完成預(yù)定任務(wù)。實驗2中UAV群通信數(shù)據(jù)率相對較高,有11架UAV能對目標區(qū)域?qū)嵤B(tài)勢監(jiān)控,并且其監(jiān)控區(qū)域要大于實驗1的監(jiān)控區(qū)域,說明在任務(wù)執(zhí)行期間,工作流轉(zhuǎn)換與傳感器任務(wù)數(shù)據(jù)處理是有效的。通過對比兩組實驗可得出以下結(jié)論:在有實時態(tài)勢數(shù)據(jù)支持的情況下,UAV群內(nèi)通信率有明顯的增加,顯示了UAV群協(xié)同完成任務(wù)的能力增強。由于預(yù)測仿真的預(yù)先判斷及對UAV群實時任務(wù)規(guī)劃,其執(zhí)行任務(wù)的效果有明顯的提升,反映了實時任務(wù)規(guī)劃的優(yōu)越性,同時也驗證了該仿真系統(tǒng)的有效性和可靠性。
本文基于動態(tài)數(shù)據(jù)驅(qū)動的思想提出構(gòu)建多UAV實時任務(wù)規(guī)劃的仿真平臺,包括基于MultiUAV2的真實UAV群仿真平臺和基于Multi-Agent的預(yù)測仿真平臺,通過對真實系統(tǒng)工作流探索提出了基于Agent的多UAV合成工作流模型,提高了多UAV仿真的真實性。通過對傳感器任務(wù)重置及傳感器的預(yù)處理研究,解決了動態(tài)數(shù)據(jù)注入的問題,為實時數(shù)據(jù)驅(qū)動仿真,以仿真結(jié)果指導多UAV實時任務(wù)規(guī)劃提供了依據(jù)。最后仿真結(jié)果驗證了該仿真系統(tǒng)的可行性和有效性,本文的研究為多UAV實時任務(wù)規(guī)劃提供了新的思路。
[1]李炳榮,江 鴻,王紅星.軍用UAV的現(xiàn)狀和發(fā)展探析[J].飛航導彈,2003,34(11):40-43.
[2]Napolitano M R.Development of Formation Flight Control Algorithms Using 3 YF-22 Flying Models[R].Morgantown: West Virginia University,2005.
[3]de Vries E,Subbarao K.Cooperative Control of Swarms of Unmanned Aerial Vehicles[C]//Proc.of the 49th AIAA Aerospace Sciences Meeting Including the New Horizons Forum and Aerospace Exposition,2011:1-23.
[4]洪 曄,繆存孝,雷旭升.基于長機-僚機模式的UAV編隊方法及飛行實驗研究[J].機器人,2010,32(4):505-509.
[5]周 昊,覃 征,邢劍寬.基于多Agent的多UAV協(xié)同決策算法仿真平臺設(shè)計[J].系統(tǒng)仿真學報,2012,24(3):587-593.
[6]李春濤,易小芹,胡 木.基于速度矢量場的UAV實時動態(tài)航路規(guī)劃[J].南京航空航天大學學報,2012,44(3):340-346.
[7]DDDAS-The Power of Dynamic Data Driven Applications Systems[R/OL].Multi-Agency Workshop Report,August 2010.www.dddas.org.
[8]NSF Workshop.DDDAS Workshop Report,NSF Workshop Report,January 2006[R/OL].(2007-1)[2007-5].
[9]Frederica Darema.Dynamic Data Driven Applications Systems:New Capabilities for Application Simulations and Measurements [C]//Proceedings ICCS'05,Berlin,Springer,2005:610-615.
[10]蔡 虹,胡 云,李存華.一種基于A*算法的Web Services動態(tài)組合策略[J].微電子學與計算機,2011,28(9):197-201.
Multi-UAV Real-time Mission Planning Based on Dynamic Data Driven Application System
ZHU Lin1,2,F(xiàn)ANG Sheng-liang1,2,WU Fu-xiang1,WU Zhi-jian3
(1.Electronic Engineering Institute,Hefei 230037,China;
2.Key Laboratory of Electronic Restriction,Hefei 230037,China;3.Unit 63889 of PLA,Luoyang 471003,China)
In order to achieve mission planning of Multi-UAV in the real-time and dynamic conditions,a Multi-UAV mission planning simulation system based on dynamic data driven application system(DDDAS)is proposed,mainly include real UAV swarm simulation platform based on MultiUAV2 and predictive simulation platform based on Multi-Agent.As a breakthrough point of the key technologies that addressed in the simulation system,the workflows within real-life system is discovered by using A*algorithm.Based on these analyses,a Multi-UAV workflows model is constructed,then the method of sensor re-tasking and sensor-based pre-processing are studied for injecting streaming sensor data into a running simulation.Finally,through a simulation example,the proposed method is feasibility and validity.
Multi-UAV,dynamic data driven application system,mission planning,Multi-Agent
TP391.9
A
1002-0640(2014)10-0163-04
2013-08-09
2013-10-07
朱 林(1989- ),男,河南周口人,碩士研究生。研究方向:電子對抗效能分析。