摘 要:隨著衛(wèi)星規(guī)模、種類的不斷增長,現(xiàn)有衛(wèi)星任務(wù)規(guī)劃技術(shù)架構(gòu)已很難滿足多類型衛(wèi)星聯(lián)合運用的有效性及可擴展性要求。通過深入分析多星任務(wù)籌劃、單星任務(wù)規(guī)劃、數(shù)傳資源規(guī)劃等環(huán)節(jié),建立了基于分層多智能體的多星聯(lián)合任務(wù)規(guī)劃技術(shù)架構(gòu),設(shè)計了與架構(gòu)匹配的相關(guān)優(yōu)化算法及智能體功能實現(xiàn)機制,實現(xiàn)了多星聯(lián)合任務(wù)規(guī)劃能力。仿真實驗及分析結(jié)果表明,該架構(gòu)對多類型衛(wèi)星聯(lián)合任務(wù)規(guī)劃場景有良好的適用性。
關(guān)鍵詞:衛(wèi)星任務(wù)規(guī)劃;多星聯(lián)合任務(wù)規(guī)劃;智能體技術(shù)
中圖分類號:V474. 2 文獻標(biāo)志碼:A
文章編號:1003-3114(2024)05-0993-07
0 引言
隨著航天事業(yè)的飛速發(fā)展,在軌運行的衛(wèi)星數(shù)量不斷增多,用戶對衛(wèi)星觀測數(shù)據(jù)的需求也迅速增長,衛(wèi)星任務(wù)規(guī)劃逐漸成為衛(wèi)星任務(wù)管控領(lǐng)域的重要研究方向[1],關(guān)注的是如何對衛(wèi)星及其地面管控資源、中繼資源進行任務(wù)分配、優(yōu)化調(diào)度以及運行管理,從而更好地滿足多源用戶需求。
衛(wèi)星任務(wù)規(guī)劃既要面向各類復(fù)雜場景的對地觀測保障要求進行天地基資源優(yōu)化分配,還要滿足應(yīng)急快響任務(wù)的高時效性要求[2-3]。特別是系統(tǒng)架構(gòu)設(shè)計應(yīng)開放靈活、易于改進,以匹配適應(yīng)不斷擴充的天地基觀測資源規(guī)模,在天地基資源和觀測任務(wù)數(shù)量不斷增長的情況下,能夠繼續(xù)高效生成多星規(guī)劃方案,滿足各類用戶的任務(wù)保障要求。
近年來人工智能技術(shù)快速發(fā)展,智能體(Agent)技術(shù)在衛(wèi)星任務(wù)管控領(lǐng)域得到了越來越廣泛的應(yīng)用。Agent 是能夠持續(xù)自主發(fā)揮作用的計算實體,可以將大型復(fù)雜的衛(wèi)星任務(wù)管控系統(tǒng)模塊化、簡明化、條理化,通過將系統(tǒng)內(nèi)個體和行為進行功能聚類,成員Agent 間相互溝通、相互協(xié)作,決策Agent 通過協(xié)調(diào)多個Agent 的行為以優(yōu)化籌劃與規(guī)劃問題,更好地完成任務(wù)目標(biāo)。
依據(jù)衛(wèi)星任務(wù)規(guī)劃的需求分析,面向多星聯(lián)合應(yīng)用場景構(gòu)建分層多Agent 架構(gòu),將規(guī)劃對象和規(guī)劃過程分解為任務(wù)籌劃、單星規(guī)劃、數(shù)傳資源規(guī)劃層級,提高規(guī)劃對象的自治能力和系統(tǒng)的擴展能力;在Agent 間建立交互關(guān)系,在功能業(yè)務(wù)分解的同時保證分解形成的Agent 之間具有一定的交互性,形成多星協(xié)同規(guī)劃的能力。
1 相關(guān)領(lǐng)域研究現(xiàn)狀
衛(wèi)星任務(wù)規(guī)劃一直是國內(nèi)外航天地面應(yīng)用領(lǐng)域的研究熱點之一,經(jīng)過多年的理論研究和工程實踐,取得了一些豐富的理論成果及顯著的應(yīng)用效果[4]。
多星任務(wù)規(guī)劃技術(shù)架構(gòu)分為集中式和分布式兩類。在集中式架構(gòu)下,將所有衛(wèi)星資源納入到一個集合中,將多星任務(wù)分配問題建模為數(shù)學(xué)規(guī)劃模型,在問題有解的條件下,基于某些簡化的假設(shè)可以保證給出問題的最優(yōu)解。文獻[5-6]面向光學(xué)衛(wèi)星星座,在考慮衛(wèi)星側(cè)視約束、多用戶共享約束及任務(wù)的關(guān)聯(lián)成像等約束的前提下,建立了約束滿足問題模型。靳肖閃[7]建立了綜合考慮衛(wèi)星資源和地面數(shù)傳資源的約束滿足問題模型。王鈞[8]針對階段性優(yōu)化多衛(wèi)星任務(wù)調(diào)度問題,采用有向圖模型將問題轉(zhuǎn)化為成像路徑最優(yōu)搜索問題。劉洋[9]針對衛(wèi)星資源狀態(tài)變化和新任務(wù)到達的情況,提出了一種基于動態(tài)約束滿足的反應(yīng)式調(diào)度算法,實現(xiàn)了任務(wù)規(guī)劃方案的動態(tài)調(diào)整。賀川等[10]將多星協(xié)同調(diào)度問題分解為任務(wù)排序主問題和資源匹配子問題,以任務(wù)收益為優(yōu)化目標(biāo)構(gòu)建問題的約束滿足模型,并應(yīng)用改進粒子群優(yōu)化算法進行求解。姜維等[11]建立多星任務(wù)協(xié)同規(guī)劃模型,提出算法協(xié)同進化模型求解技術(shù)。集中式任務(wù)規(guī)劃往往不考慮衛(wèi)星的自主性,衛(wèi)星之間沒有交互,由某種策略或算法統(tǒng)籌分配安排每顆衛(wèi)星的任務(wù),但隨著問題規(guī)模的增大,求解往往變得困難。
隨著多Agent 技術(shù)的發(fā)展與應(yīng)用[12-13],分布式任務(wù)規(guī)劃技術(shù)受到研究者越來越多的關(guān)注。陳愷等[14]基于改進的合同網(wǎng)協(xié)議以及多Agent 系統(tǒng)特點,提出了一種分布式系統(tǒng)的任務(wù)分配方法。張芷丹[15]針對天基衛(wèi)星、臨近空基飛艇、空基無人機組成的異構(gòu)多平臺對地觀測系統(tǒng)的任務(wù)分配問題,設(shè)計了基于合同網(wǎng)的異構(gòu)多平臺多任務(wù)分配算法,實現(xiàn)了多個任務(wù)在衛(wèi)星、飛艇、無人機三類平臺中的分配。對于離線模式下分布式協(xié)同任務(wù)規(guī)劃,王沖等[16]引入約束懲罰算子和多星聯(lián)合懲罰算子對衛(wèi)星Agent 原始的效用值增益函數(shù)進行改進,在此基礎(chǔ)上提出了一種多衛(wèi)星Agent 強化學(xué)習(xí)算法以求解多星協(xié)同任務(wù)分配策略。張正強等[17]結(jié)合Agent理論以及多Agent 系統(tǒng)的思想構(gòu)建了一種高可靠性的分布式成像衛(wèi)星系統(tǒng)結(jié)構(gòu)及智能成像衛(wèi)星Agent的分層混合結(jié)構(gòu)模型。李世一[18]針對衛(wèi)星自主任務(wù)規(guī)劃問題,設(shè)計了基于合同網(wǎng)招投標(biāo)模型的多星多任務(wù)協(xié)調(diào)規(guī)劃方法。
2 總體架構(gòu)設(shè)計
結(jié)合Agent 技術(shù)特點和當(dāng)前衛(wèi)星任務(wù)規(guī)劃運行架構(gòu)建設(shè)要求,為多星聯(lián)合任務(wù)規(guī)劃構(gòu)建分層多智能體運行架構(gòu),如圖1 所示。該架構(gòu)分為一級任務(wù)籌劃層、二級單星任務(wù)規(guī)劃層、三級數(shù)傳資源規(guī)劃層。各層負(fù)責(zé)面向不同實體對象實現(xiàn)不同的功能。借助合同網(wǎng)的招投標(biāo)機制對多星聯(lián)合任務(wù)規(guī)劃問題進行求解。
一級任務(wù)籌劃層為任務(wù)籌劃Agent,負(fù)責(zé)根據(jù)任務(wù)層面的指派意圖,向二級衛(wèi)星Agent 發(fā)出招標(biāo)通知;對二級規(guī)劃結(jié)果進行匯總,根據(jù)特定策略評估各星完成任務(wù)的收益和代價,確定中標(biāo)者。
二級單星規(guī)劃層為衛(wèi)星Agent,負(fù)責(zé)某型或某幾型衛(wèi)星的分布式任務(wù)規(guī)劃,以一級任務(wù)籌劃Agent指派的任務(wù)為輸入,向三級資源規(guī)劃層發(fā)送資源使用請求,針對型號衛(wèi)星特點完成單星任務(wù)排程。二級任務(wù)規(guī)劃可并行開展,并將方案收益及任務(wù)代價返回給一級籌劃完成投標(biāo)動作。
三級數(shù)傳資源規(guī)劃層為數(shù)傳資源Agent,各個數(shù)傳資源Agent 接收衛(wèi)星Agent 發(fā)出的招標(biāo)任務(wù),依據(jù)自身任務(wù)沖突情況,計算執(zhí)行該項任務(wù)的代價及收益,將信息反饋給衛(wèi)星Agent,由衛(wèi)星Agent 從中挑選最優(yōu)的資源進行安排,確定中標(biāo)的數(shù)傳資源Agent。
基于多Agent 架構(gòu)的任務(wù)規(guī)劃與傳統(tǒng)的集中式任務(wù)分配機制不同,其可以在智能Agent 技術(shù)的支持下,通過Agent 之間不斷協(xié)商的過程完成任務(wù)分配。在任務(wù)分配過程中,通過Agent 的動態(tài)感知能力持續(xù)感知環(huán)境和系統(tǒng)的變化,并在任務(wù)規(guī)劃過程中實時考慮這些變化信息,從而使任務(wù)分配對環(huán)境具有適應(yīng)性。另外,通過Agent 之間的協(xié)商,可以實現(xiàn)規(guī)劃問題的分布式求解,避免了集中式規(guī)劃方法的計算瓶頸問題,降低了問題求解的難度。