楊靖宇,高亮,李迪,李辰
(1.沈陽航空航天大學(xué) 智能飛行器系統(tǒng)理論與技術(shù)實驗室,遼寧 沈陽 110136;2.沈陽戈達(dá)德智能裝備科技有限公司 研發(fā)部,遼寧 沈陽 110001)
隨著5G 的普及和6G 的開發(fā),大帶寬無線通信讓大規(guī)模共位密集編隊衛(wèi)星群的組建成為了可能。甚至是原本只能依賴晶片通信總線和接線式的通信,在不久的未來也可以通過大帶寬無線通信互聯(lián)。人工智能技術(shù)的快速發(fā)展也讓衛(wèi)星群中的各個子衛(wèi)星擁有的自主能力持續(xù)提高。共位密集編隊衛(wèi)星群將原來的一顆重型衛(wèi)星的各個子系統(tǒng)拆分,分裝進(jìn)多個小型衛(wèi)星中,利用大帶寬無線通信互聯(lián),并且?guī)捄托盘栄舆t不亞于實體IO。在無線通信快速發(fā)展的大背景下,課題將通過當(dāng)前相關(guān)關(guān)鍵技術(shù)的研究進(jìn)展,探討共位編隊衛(wèi)星的智能系統(tǒng)特性與優(yōu)勢,并由此引出共位編隊衛(wèi)星群的可行性和大致開發(fā)方向。
共位密集編隊技術(shù)的發(fā)展對未來的軍事和商用航天領(lǐng)域有著重要的意義。當(dāng)一顆重型衛(wèi)星的各個子系統(tǒng)被拆分成為共位編隊中分散布置并且可以隨時替換的多個子衛(wèi)星時,能夠大大降低整個系統(tǒng)的發(fā)射成本和維護(hù)成本。小型的子衛(wèi)星可以通過堆疊充分利用運(yùn)載火箭的整流罩空間,戰(zhàn)時可以快速補(bǔ)充在軌戰(zhàn)斗力。故障的子衛(wèi)星再入大氣后,編隊中的大部分功能任可以保留,并且隨后即可補(bǔ)充。同時,編隊內(nèi)的子衛(wèi)星也可以作為執(zhí)行攻擊等命令的單位,整個共位衛(wèi)星編隊有著很強(qiáng)的靈活性和可編輯性。模塊化的系統(tǒng)也能夠大幅度提高衛(wèi)星的生產(chǎn)效率,短時間內(nèi)就可以大量地發(fā)射。在商用領(lǐng)域這一技術(shù)也大大降低了企業(yè)的運(yùn)營風(fēng)險,不會因為一個子系統(tǒng)的故障而報廢整個系統(tǒng)。
就共位編隊本身來說,十米級間距的共位密集編隊可以極大程度上改善以往因為間距較遠(yuǎn)所帶來的問題。比如,距離較遠(yuǎn)各衛(wèi)星軌道六根數(shù)不同、受到的攝動不同,因此隨著時間的推移編隊難以保持。小間距密集編隊各衛(wèi)星間的軌道根數(shù)相近、攝動幾乎相同,所以保持編隊所消耗的推進(jìn)劑更少,有利于長時間執(zhí)行任務(wù)。
在硬件方面,星載計算機(jī)由于受制于惡劣的使用環(huán)境普遍存在算力不足的問題,難以實現(xiàn)在軌深度學(xué)習(xí)等在軌復(fù)雜運(yùn)算。不過近些年來隨著半導(dǎo)體制程的不斷進(jìn)步,各種計算芯片的計算性能也隨著增強(qiáng)。目前小型衛(wèi)星的星載芯片系統(tǒng)大多基于FPGA+ARM 開發(fā),F(xiàn)PGA 在航空航天領(lǐng)域有著極為廣泛的應(yīng)用。在航天領(lǐng)域,基于FPGA的姿態(tài)控制、衛(wèi)星內(nèi)部總線(如1553B、CAN等)控制、CNN 網(wǎng)絡(luò)的卷積計算加速、高分辨率圖像處理、星間加解密通信及數(shù)據(jù)傳輸?shù)确较蛴兄罅康难芯颗c應(yīng)用。
相關(guān)行業(yè)的先進(jìn)單位基于FPGA 在航天領(lǐng)域的應(yīng)用做了大量的研究,在姿態(tài)精確控制、通信、硬件運(yùn)算加速、圖像處理等領(lǐng)域都取得了令人矚目的成果[1-2]。FPGA 芯片可以根據(jù)不同任務(wù)的需要進(jìn)行深度定制,芯片內(nèi)有大規(guī)模的邏輯門陣列,并行運(yùn)算能力突出,相比單片機(jī)有著極強(qiáng)的IPC性能。FPGA 芯片非常適合進(jìn)行信號處理、元件橋接、人工智能運(yùn)算等工作[3]。
隨著大規(guī)模集成電路制造技術(shù)的發(fā)展,精簡指令集架構(gòu)(如ARM)處理器的性能也隨著增強(qiáng)。ARM 處理器普遍有著IO 資源豐富、邏輯運(yùn)算能力強(qiáng)大的優(yōu)點,并且能夠集成大規(guī)模的流處理單元以提高并行計算能力,可拓展性極強(qiáng)。圖1 所示為ARM 處理器與星載陀螺儀集成設(shè)計的PCB。其中Cortex-M 系列內(nèi)核以其高能耗比、開發(fā)便捷的特點被廣泛應(yīng)用于人工智能運(yùn)算領(lǐng)域。尤其是2017 年發(fā)布的Cortex-M7 內(nèi)核更是集成了L1緩存(指令及數(shù)據(jù)緩存)、分支預(yù)測單元等以往CPU 上才有的模塊,單片機(jī)的特性也越來越向高性能運(yùn)算靠攏。德州儀器、意法半導(dǎo)體等都基于Cortex 內(nèi)核開發(fā)出了一系列性能優(yōu)良價格低廉的單片機(jī),這些單片機(jī)被廣泛地應(yīng)用于人工智能、航空航天、數(shù)控加工等大量高精尖領(lǐng)域。ARM 處理器在航天領(lǐng)域的應(yīng)用和研究更是在千禧年初就已經(jīng)開始了,隨著ARM 處理器的發(fā)展和完善,其在星載計算領(lǐng)域的地位在近幾年也越來越重要。
圖1 ARM 處理器與星載陀螺儀集成的PCBFig.1 PCB integrated with ARM processor and spaceborne gyroscope
2017 年,Nvidia 首次在Volta 架構(gòu)的GV100核心中將硬件張量計算單元Tensor Core 整合到GPU 中,并在之后的Turing 架構(gòu)和Ampere 架構(gòu)中沿用。以深度學(xué)習(xí)模型訓(xùn)練中常用的keras 庫為例,其核心的GEMM 運(yùn)算在Tensor Core 的加速下相比上一代架構(gòu)Pascal 有著8~9 倍的提升。在解決好功耗問題后,未來此類高性能GPU 可以與ARM 等架構(gòu)整合并用于星上模型訓(xùn)練,讓航天器獲得更加高效的實時學(xué)習(xí)能力,大幅度地擺脫對地面的依賴。這也將是航天器未來在無測控協(xié)同深空探測任務(wù)中所需要具備的條件之一。
人工智能在控制領(lǐng)域應(yīng)用的重要性日漸凸顯,以美國為代表的一些國家甚至直接將“保證人工智能領(lǐng)域領(lǐng)先狀態(tài)”寫入到行政命令中,大力扶持。當(dāng)今,隨著上述半導(dǎo)體行業(yè)的發(fā)展進(jìn)步,星載計算機(jī)的算力隨之快速增強(qiáng)。圖2 所示為星載芯片系統(tǒng)智能化發(fā)展歷程。
圖2 星載芯片系統(tǒng)智能化發(fā)展歷程Fig.2 Developmental history of the onboard chip system
以深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)為代表的下一代航天器人工智能控制技術(shù)勢必能夠由“地面訓(xùn)練,星上使用”逐步轉(zhuǎn)向“星上學(xué)習(xí),星上使用”。新一代智能自適應(yīng)容錯控制將具備更強(qiáng)的任務(wù)規(guī)劃和姿軌跟蹤及控制能力,勝任更加復(fù)雜的任務(wù)[4-5]。現(xiàn)今世界上主流的各類型航天器控制模型普遍具有時變、非線性、多變量的特點。并且復(fù)雜的任務(wù),執(zhí)行任務(wù)的航天器具有更復(fù)雜的結(jié)構(gòu)設(shè)計,其在調(diào)姿及變軌的時候也會有更加復(fù)雜的執(zhí)行擾動和難以識別的耦合,人工智能控制高魯棒性的優(yōu)勢就凸顯出來了[6-7]。
學(xué)習(xí)、推理、決策是人工智能控制系統(tǒng)所具備的基本能力。衛(wèi)星能夠主動適應(yīng)任務(wù)環(huán)境的變化,僅依靠自身算力進(jìn)行快速自適應(yīng)控制策略調(diào)整是星載計算領(lǐng)域研究推進(jìn)的大方向。人工智能飛控單元相比傳統(tǒng)的飛控系統(tǒng)具備的優(yōu)勢如表1 所示。
表1 星載智能系統(tǒng)相比傳統(tǒng)星載系統(tǒng)所具備的優(yōu)勢Table 1 Advantages of the onboard intelligent system over the traditional onboard system
智能體的自主控制是一個智能感知、智能決策、智能控制的閉環(huán),實現(xiàn)航天器的高度智能化先進(jìn)的信號處理方法、計算系統(tǒng)設(shè)計以及控制策略等方面都是必不可少的,不然就會因為木桶效應(yīng)使得整個系統(tǒng)應(yīng)用某一部分的缺陷導(dǎo)致無法得到預(yù)期的效果。諸如強(qiáng)化學(xué)習(xí)這種機(jī)器學(xué)習(xí)的方法,主要用于解決智能體與環(huán)境的交互問題,描述和優(yōu)化智能體在“實踐”過程中的學(xué)習(xí)策略。航天器在執(zhí)行任務(wù)時的環(huán)境是時變的,不合適的優(yōu)化算法可能會導(dǎo)致系統(tǒng)陷入到局部最優(yōu)解當(dāng)中,致使后續(xù)的監(jiān)測效果不佳甚至出錯。因此近些年對智能算法的改進(jìn)也成為了許多學(xué)者的工作方向。未來數(shù)年的航天器智能化也會依賴深度學(xué)習(xí)進(jìn)行地面數(shù)據(jù)訓(xùn)練,利用先進(jìn)通信技術(shù)實現(xiàn)地面-軌道的雙向遷移學(xué)習(xí)是一項較為關(guān)鍵的技術(shù)。將地面預(yù)訓(xùn)練模型鎖定后,發(fā)射入軌后在執(zhí)行任務(wù)的過程中利用星上算力進(jìn)行遷移學(xué)習(xí),對全連接層以及部分解鎖的卷積基等進(jìn)行在軌訓(xùn)練。比如谷歌開發(fā)的超深卷積神經(jīng)網(wǎng)絡(luò)InceptionResNetV2 深度高達(dá)572 層,使用全球的互聯(lián)網(wǎng)樣本進(jìn)行訓(xùn)練,其Top-1 和Top-5 精度分別可達(dá)0.803 和0.953。這一類的預(yù)訓(xùn)練網(wǎng)絡(luò)可以作為遷移學(xué)習(xí)模型對基礎(chǔ)特征進(jìn)行準(zhǔn)確的判斷,從而避免實際任務(wù)進(jìn)行中可采集樣本較少使模型在訓(xùn)練過程中出現(xiàn)過擬合。在軌訓(xùn)練所能采集的數(shù)據(jù)集較少,難以提取基礎(chǔ)特征,因此需要拆分訓(xùn)練模型,分別在地面對基礎(chǔ)任務(wù)特征以及在軌對具體任務(wù)特征進(jìn)行訓(xùn)練。如圖3 所示為星載智能系統(tǒng)的架構(gòu)簡要示意圖。
圖3 星載智能系統(tǒng)架構(gòu)示意Fig.3 Onboard intelligent system architecture
根據(jù)上述的諸多問題,國內(nèi)外許多機(jī)構(gòu)、院所的學(xué)者們進(jìn)行了大量的研究,提出了的開創(chuàng)性結(jié)論和相關(guān)解決方法。自2016 年開始,美國商業(yè)航天公司SpaceX 和美國國防高級研究計劃局(DARPA)聯(lián)合研制的獵鷹9 號系列運(yùn)載火箭實現(xiàn)了在線智能監(jiān)測與軌跡規(guī)劃,并利用該技術(shù)成功實現(xiàn)了芯一級和助推級的動力載入回收[12-13]。智能控制系統(tǒng)讓獵鷹9 號系列運(yùn)載火箭的發(fā)射成本和成功率實現(xiàn)了前所未有的突破。
編隊智能化這一課題主要有3 點顯著特征:1)抽象數(shù)據(jù)搜索引導(dǎo);2)基于抽象數(shù)據(jù)做出判斷;3)分布式智能體衛(wèi)星間能夠?qū)崿F(xiàn)一定程度上任務(wù)并行處理。從計算機(jī)科學(xué)初的通用線性問題求解器到現(xiàn)如今的專家系統(tǒng)和智能決策支持系統(tǒng),都利用了人類在任務(wù)領(lǐng)域的相關(guān)經(jīng)驗[14-15]。然而所謂經(jīng)驗是一個模糊抽象、非線性、數(shù)據(jù)量龐大的概念。智能化共位協(xié)同編隊的主要特征如表2 所示。
表2 智能化共位協(xié)同編隊的主要特征Table 2 Key features of intelligent co-located cooperative formations
未來共位衛(wèi)星群任務(wù)的關(guān)鍵就是實現(xiàn)分布式多智能體協(xié)同控制技術(shù)的應(yīng)用。而衛(wèi)星智能協(xié)同控制的關(guān)鍵技術(shù)及技術(shù)難點主要包括任務(wù)協(xié)調(diào)調(diào)度、路徑規(guī)劃、多星協(xié)同狀態(tài)監(jiān)測3 個主要方面[16-18]。其關(guān)鍵技術(shù)主要依賴于超深網(wǎng)絡(luò)的特征提取和任務(wù)規(guī)劃以及高效算法在包含深度網(wǎng)絡(luò)的系統(tǒng)中對協(xié)同控制策略的規(guī)劃。
球場上運(yùn)動員之間默契的配合,手術(shù)臺上外科醫(yī)生們的密切配合都依賴于個體之間的經(jīng)驗,能夠?qū)⑺^經(jīng)驗數(shù)據(jù)化就是智能協(xié)同控制系統(tǒng)最顯著的特征。在共軌位衛(wèi)星編隊中智能監(jiān)測衛(wèi)星的關(guān)鍵目標(biāo)就是通過利用全局/局部信息共享和鄰近代理分布式的方式來達(dá)到任務(wù)所需的多智能體協(xié)同行為。
共位編隊中的衛(wèi)星任務(wù)的協(xié)同調(diào)度是一大難點和關(guān)鍵技術(shù)。傳統(tǒng)的任務(wù)調(diào)度方式主要有兩種。其一是以BIE 為代表的優(yōu)先級分配。在一次任務(wù)中,編隊監(jiān)測衛(wèi)星對每顆衛(wèi)星預(yù)先的建模進(jìn)行評估以確定其在任務(wù)協(xié)調(diào)中的權(quán)重,或者每顆衛(wèi)星通過貪婪策略評估自身權(quán)重與其他衛(wèi)星進(jìn)行比對,以此來協(xié)調(diào)每顆衛(wèi)星在任務(wù)中所需執(zhí)行的最佳指令。這種策略的優(yōu)勢就在于在算力不足的星載系統(tǒng)上也能使各衛(wèi)星有效地協(xié)同完成任務(wù),較小的數(shù)據(jù)量也能夠讓該策略具有很好的通信時效性和容錯能力,但是無論由監(jiān)測星評估還是各星自身評估都會在不同程度陷入局部最優(yōu)解,穩(wěn)定性欠佳。其二是衛(wèi)星網(wǎng)絡(luò)調(diào)度協(xié)議,由優(yōu)先級協(xié)調(diào)策略發(fā)展而來。這種策略不以預(yù)先建模為評估原點,而是任務(wù)調(diào)度分為監(jiān)測衛(wèi)星接收任務(wù)指令、編隊各星對任務(wù)各項進(jìn)行申請、指令下達(dá)3 個階段進(jìn)行,在任務(wù)協(xié)調(diào)階段建立臨時能力集,以此為指標(biāo)進(jìn)行具體分配。作為優(yōu)先級確定權(quán)重策略的一種改進(jìn),這種策略仍然在一定程度上存在容易陷入局部最優(yōu)解的問題,但是其依賴先進(jìn)網(wǎng)絡(luò)協(xié)議的特性使其能夠在中小規(guī)模的衛(wèi)星編隊中實現(xiàn)全局最優(yōu)任務(wù)協(xié)同。
近年來隨著積體電路技術(shù)和無線網(wǎng)絡(luò)技術(shù)的快速發(fā)展,基于群體智能概念的自組織任務(wù)協(xié)同策略成為航天器編隊協(xié)同控制中的一項重要課題。在自組織協(xié)同中,監(jiān)測衛(wèi)星所發(fā)揮的作用也與傳統(tǒng)任務(wù)調(diào)度大有不同。這種任務(wù)協(xié)同方式通過編隊衛(wèi)星地面學(xué)習(xí)和長期的在軌學(xué)習(xí),解決在軌編隊任務(wù)自組織問題,極大地提高了編隊任務(wù)執(zhí)行過程中的魯棒性也避免了傳統(tǒng)算法策略中對既定任務(wù)局部最優(yōu)解的約束[19]。在編隊完成任務(wù)分配后的指令執(zhí)行階段,共軌位衛(wèi)星編隊的協(xié)同控制路徑規(guī)劃計算中,編隊結(jié)構(gòu)往往存在諸多約束條件,需要對算法進(jìn)行訓(xùn)練以讓動作序列滿足對應(yīng)的約束條件。在耦合路徑規(guī)劃中存在空間維度大,難以在復(fù)雜環(huán)境中解析編隊狀態(tài);而在解耦合狀態(tài)下又存在星間路徑?jīng)_突頻繁,容易陷入局部最優(yōu)解等問題。圖4 所示為當(dāng)前主要的協(xié)同路徑規(guī)劃模式。針對這些問題,近年來一些學(xué)者提出了基于三角不等式的RRT-connect 路徑規(guī)劃、改進(jìn)麻雀搜索算法等解決辦法[20-21]。著重解決了規(guī)劃時間、路徑長度、任務(wù)動態(tài)性的問題。同時,在編隊狀態(tài)監(jiān)測中,在軌的單個衛(wèi)星由于搭載的載荷種類、通信感知能力、星載處理系統(tǒng)往往都各不相同,對自身狀態(tài)與其他星狀態(tài)的感知能力受限,對于軌道攝動與自身故障等問題普遍魯棒性欠佳。而協(xié)同監(jiān)測體系則能夠有效地改善上述問題,整個編隊依托星間鏈路作為一個大的系統(tǒng)對編隊自身進(jìn)行監(jiān)測就能夠?qū)崿F(xiàn)1+1>2 的效果[22-23]。
圖4 協(xié)同路徑規(guī)劃示意Fig.4 Cooperative path planning mode
隨著近二十多年的研究發(fā)展,航天器編隊飛行的理論基礎(chǔ)已經(jīng)基本奠定。在100 km 間距量級上通過選定特定的一條軌道,讓在這條軌道上的衛(wèi)星集群能夠利用其攝動始終保持讓整個衛(wèi)星集群在一定的范圍內(nèi)而不需要攜帶推進(jìn)劑[24]。這樣能夠極大地簡化衛(wèi)星的設(shè)計,但是完全依靠特殊軌道上的攝動力保持一定的集群密度。缺點也是顯而易見的,這種集群方式軌道太過特殊,并且也無法保持某種特定的隊形,衛(wèi)星分布靠攝動力粗略地維持在一定范圍內(nèi),無法進(jìn)行在軌協(xié)同任務(wù)。事實上,對多星共構(gòu)衛(wèi)星群的相關(guān)研究起步較早。NASA 早在2003 年就曾提出過類似的計劃,將一組子衛(wèi)星轉(zhuǎn)移至地球火星軌道間的小行星帶之后從容器內(nèi)釋放,組成一個編隊,不同的衛(wèi)星各有分工,不過時至今日這個項目由于技術(shù)原因沒有上馬。因為多星協(xié)同嚴(yán)重依賴地面測控,如果能突破衛(wèi)星自主協(xié)同的技術(shù)難關(guān),多星共構(gòu)系統(tǒng)的應(yīng)用范圍將得到極大的擴(kuò)展。由此,有人曾提出了一種改進(jìn)的模擬退火算法,并將這種算法應(yīng)用于衛(wèi)星集群重構(gòu)中,這種機(jī)動測策略能夠在控制效率與燃料消耗之間找出良好的平衡點[25]。不過衛(wèi)星集群不等于共位編隊,這是兩個不同的概念。他提出的重構(gòu)機(jī)動策略雖然具有高效快捷的優(yōu)點,但是無法讓多個衛(wèi)星以一種特定的隊形共位運(yùn)行,應(yīng)用于對系統(tǒng)響應(yīng)能力要求較高的領(lǐng)域會有較大的局限性。
為此本文基于前文所述的協(xié)同控制策略加以改進(jìn)搭建了一個較為簡易的地面仿真+實驗的平臺,用于驗證相關(guān)的智能共位編隊在實現(xiàn)中較為關(guān)鍵的技術(shù),架構(gòu)如圖5 所示。
圖5 協(xié)同控制關(guān)鍵技術(shù)地面驗證平臺架構(gòu)Fig.5 Architecture of the ground verification platform for key technologies of cooperative control
該平臺以超深網(wǎng)絡(luò)+淺網(wǎng)絡(luò)機(jī)器學(xué)習(xí)的基本框架搭建了仿真的基本環(huán)境,通過超深網(wǎng)絡(luò)訓(xùn)練和地面-軌道雙向遷移學(xué)習(xí)使系統(tǒng)具有較強(qiáng)的擬合能力。在這個框架下,可以通過增減算法模塊的方式調(diào)整仿真實驗,具有較好的拓展性。在初步的技術(shù)驗證中該平臺的實驗效果較為理想。圖6、7 分別是平臺在子衛(wèi)星協(xié)同清除在軌非合作目標(biāo)中的路徑規(guī)劃效果和規(guī)劃效率的示意圖。實驗證明該平臺能夠在較短時間內(nèi)對非合作目標(biāo)進(jìn)行甄別和定點清除,在模型遷移后能夠有效地提取特征,可以用于進(jìn)一步的實驗。在更換性能更強(qiáng)的后端技術(shù)驗證平臺后,將會有更高效的表現(xiàn)。
圖6 協(xié)同監(jiān)測路徑規(guī)劃示意圖Fig.6 Diagram of collaborative monitoring path planning
圖7 路徑規(guī)劃實驗的學(xué)習(xí)曲線Fig.7 Learning curve of the path planning experiment
在之后的研究中,我們也能夠根據(jù)這一技術(shù)路線和系統(tǒng)框架,逐步地完善編隊在軌監(jiān)測與協(xié)同控制系統(tǒng),使其能夠應(yīng)用于實際任務(wù)當(dāng)中。
未來航天器智能協(xié)同編隊中至關(guān)重要的功能分化式子衛(wèi)星相關(guān)技術(shù),國內(nèi)目前的研究主要集中在硬件支持和算法的研究、改進(jìn)及應(yīng)用上。雖然當(dāng)前的研究處于起步階段,不過可重構(gòu)計算機(jī)近幾年隨著半導(dǎo)體制程的進(jìn)步得到了快速發(fā)展,星載可重構(gòu)計算機(jī)領(lǐng)域取得了長足的發(fā)展[26]。西北工業(yè)大學(xué)將基于FPGA 的可重構(gòu)星載計算機(jī)應(yīng)用在了一枚12U 立方星上。不過這一可重構(gòu)處理系統(tǒng)并不是以功能分化為目的設(shè)計的,僅是在系統(tǒng)部件出現(xiàn)故障的情況下,通過預(yù)設(shè)算法對系統(tǒng)進(jìn)行重構(gòu)以保證最低限度的性能來完成既定任務(wù)。當(dāng)然這一成就仍然以后續(xù)以功能分化為目的的可重構(gòu)系統(tǒng)具有相當(dāng)?shù)闹笇?dǎo)意義。算法相關(guān)的研究也自2017 年以來快速增加,衛(wèi)星的功能分化重構(gòu)依賴于執(zhí)行效率高、解集收斂性優(yōu)秀的算法。針對這一目標(biāo),國內(nèi)很多院所、學(xué)者對諸如NSGA-II、MOPSO 為代表的多個多目標(biāo)算法的應(yīng)用進(jìn)行了大量的研究[27-31]。衛(wèi)星通過計算得出并進(jìn)行特定方式篩選解集,利用算法對星載計算機(jī)進(jìn)行編碼重構(gòu),有針對性地自主制定一系列策略。研究結(jié)果表明,現(xiàn)階段衛(wèi)星在一定程度上能夠自主地對自身系統(tǒng)進(jìn)行無地面指令優(yōu)化,提高了系統(tǒng)的魯棒性。
自然界中的群居生物普遍具有一種被稱為自組織機(jī)制的社會行為,借鑒了這種機(jī)制的人工智能協(xié)同技術(shù)是實現(xiàn)大規(guī)模共位密集協(xié)同編隊的關(guān)鍵所在。人工智能協(xié)同在航天領(lǐng)域的發(fā)展大致可以分為3 個階段,如圖8 所示:第一階段,星上某個或某幾個分系統(tǒng)實現(xiàn)智能化任務(wù)協(xié)同[32];第二階段,單個整星可完全不依賴具體動作指令,以完成既定任務(wù)為目的進(jìn)行自主決策。具體行為自主完成,并且整個系統(tǒng)有很強(qiáng)的魯棒性,能夠自主診斷糾錯[33-34];第三階段,在一個任務(wù)當(dāng)中所有參與的單位全部實現(xiàn)智能化,各單位依賴先進(jìn)通信技術(shù)協(xié)同配合,全程無人參與,自主決策[35-36]。
圖8 航天器智能協(xié)同技術(shù)的發(fā)展階段示意Fig.8 Development stages of spacecraft intelligent collaboration technology
當(dāng)前的航天領(lǐng)域仍然處在第一階段,航天器尚不能實現(xiàn)完全地自主決策,而是以某一分系統(tǒng)的以深度學(xué)習(xí)的方式實現(xiàn)航天器的部分智能化自主決策。當(dāng)前諸如著陸自主避障,在軌自主交會對接、地形圖像識別著陸等技術(shù)就是其中的典型,而這些先進(jìn)的技術(shù)也將對航天器智能化邁向下一階段起到關(guān)鍵的支撐作用。自主協(xié)同控制將是未來我國航天器的關(guān)鍵技術(shù)之一,未來將對我國的航天探測、軌道軍事產(chǎn)生深遠(yuǎn)影響。航天器自主能力的提高將會在極大程度上減小對地面測控的依賴,航天領(lǐng)域下放到民用的門檻也將會降低。我國初步將人工智能應(yīng)用于航天領(lǐng)域的是嫦娥3 號、嫦娥4 號、嫦娥5 號、天問1 號著陸器。這幾個著陸器都通過人工智能算法在著陸最后階段的懸停避障時自主地完成著陸。嫦娥系列任務(wù),尤其是嫦娥5 號任務(wù)環(huán)月軌道自主交會及對接的成功將對我國后續(xù)多星智能協(xié)同具有重要的指導(dǎo)意義。
航天器的協(xié)同控制算法近幾年相關(guān)的研究發(fā)展迅速,控制算法多種多樣各有優(yōu)劣。實現(xiàn)方式大致都可以按照不同的協(xié)同方式分為一致性算法、蜂擁算法和基于優(yōu)化算法的編隊三類協(xié)同控制算法,如表3。
表3 不同類型的算法及其編隊特性Table 3 Different types of algorithms and their formation characteristics
如圖9 所示的一致性算法與代碼效率和網(wǎng)絡(luò)分區(qū)容錯性之間存在取舍,包括能夠著重解決優(yōu)化分布式緩存調(diào)度問題的一致性哈希算法、強(qiáng)一致性要求下監(jiān)測衛(wèi)星作為調(diào)度的二階段提交算法、著重解決多星資源互斥問題的Lamport 面包店算法、著重于解決星間交互容錯問題的raft、Paxos 算法等。
圖9 一致性算法下的編隊協(xié)同監(jiān)測模式示意圖Fig.9 Formation cooperative monitoring mode under consensus algorithm
如圖10 所示的基于蜂擁算法的衛(wèi)星協(xié)同集群中有兩種基本的運(yùn)動原則:規(guī)避和速度匹配。算法經(jīng)過長期的訓(xùn)練能夠高效地建立目標(biāo)運(yùn)動矢量與RCS 等控制機(jī)構(gòu)的映射[40],如式(1)可以簡要地說明蜂擁算法對編隊中任意一顆衛(wèi)星的控制邏輯。
圖10 基于優(yōu)化算法的協(xié)同監(jiān)測模式示意圖Fig.10 Cooperative monitoring model based on the optimization algorithm
式中:瞬時質(zhì)心受力Fco由RCS 等推力機(jī)構(gòu)產(chǎn)生;Fdrg為協(xié)同編隊密度參數(shù)算法通過訓(xùn)練對其進(jìn)行調(diào)整;為瞬時航點角度;Ksat表示單顆衛(wèi)星的一項系數(shù),可以表示如質(zhì)量、質(zhì)心位置等參數(shù);N為該衛(wèi)星規(guī)定鄰域內(nèi)的衛(wèi)星數(shù)量,或者是除該衛(wèi)星外的全部衛(wèi)星數(shù)量 (Ncom-1);‖lI‖、l分別為捕獲到對應(yīng)衛(wèi)星的各項距離參數(shù)和角度參數(shù);lmod為衛(wèi)星碰撞模型參數(shù)。通過引入式(2)的參數(shù)捕獲周期內(nèi)的質(zhì)心合力變量 ΔFco也可以對編隊結(jié)構(gòu)的剛性進(jìn)行一定程度上的收斂控制。
式中:ΔθCoS為當(dāng)前衛(wèi)星星體坐標(biāo)系X軸在參數(shù)捕獲周期內(nèi)的指向變量;Δlcur為當(dāng)前衛(wèi)星星體坐標(biāo)系原點在參數(shù)捕獲周期內(nèi)的位移;Atrans為整個編隊上一個參數(shù)捕獲周期開始時的瞬時矢量在當(dāng)前星體坐標(biāo)系的轉(zhuǎn)換值;K1、K2、K3表示在通過模型深度學(xué)習(xí)訓(xùn)練收斂得到的權(quán)重值。
三類協(xié)同控制算法又有眾多分支,相關(guān)研究者也深入地展開了一系列的挖掘。中國科學(xué)院軟件研究所的許軻等[41]致力于推進(jìn)人工智能技術(shù)在航天信息處理領(lǐng)域的應(yīng)用,他們的團(tuán)隊在2018 年提出了一種以改進(jìn)型PID 控制為初始策略的深度強(qiáng)化學(xué)習(xí)姿態(tài)控制算法。該算法可以在航天器有效載荷、自身結(jié)構(gòu)等各種參數(shù)未知的情況下通過深度學(xué)習(xí)以收斂出姿態(tài)控制的策略,并且在一定程度上可以隨著任務(wù)的進(jìn)行而對控制策略進(jìn)行小幅度優(yōu)化。這種算法實際上是一種為了簡化代碼而設(shè)計的貪心搜索算法,算法自身的局限性導(dǎo)致系統(tǒng)在航天器姿態(tài)控制、智能協(xié)同等復(fù)雜問題中傾向于得出局部最優(yōu)解,隨著時間的積累星載系統(tǒng)后續(xù)任務(wù)可能會出現(xiàn)預(yù)期之外的錯誤決策。海軍大連艦艇學(xué)院長期承擔(dān)艦艇指揮智能化方向的研究,多年來的研究對我國的軍事指揮體系有著深遠(yuǎn)的影響。該校首次將Agent 技術(shù)應(yīng)用于反潛指揮系統(tǒng)當(dāng)中。該系統(tǒng)目前在小型反潛無人艇上得到了初步的技術(shù)驗證,單個無人艇的系統(tǒng)有著良好的自主型,與其他無人艇的信息共享能力與協(xié)同作戰(zhàn)能力也表現(xiàn)良好[42]。但是需要其中一個無人艇作為主艇進(jìn)行全局干預(yù),由其他無人艇實現(xiàn)半自主協(xié)同。相信未來幾年隨著芯片計算能力、可靠性以及國產(chǎn)自主流片等關(guān)鍵技術(shù)的突破,更先進(jìn)的協(xié)同控制系統(tǒng)將能應(yīng)用于軍隊建設(shè)和航天探測之中去。針對目前飛行器自主程度不足,需要主飛行器干預(yù)的現(xiàn)狀,曾有專家在2016年提出了一種完全脫離個體間通信也能依靠外部綜合傳感器進(jìn)行人工智能協(xié)同的控制策略,這樣更加接近人類之間的協(xié)同工作關(guān)系[43]。這種策略充分地考慮了視覺傳感器延遲、計算延遲等對編隊保持的影響,其仿真結(jié)果也證明這一策略擁有較高的控制效率與精度。北京控制工程研究所曾多次參與研發(fā)我國重大航天探測任務(wù),如“嫦娥”系列探測器的綜合控制系統(tǒng)等。他們的團(tuán)隊提出了一種基于神經(jīng)網(wǎng)絡(luò)的智能協(xié)同控制系統(tǒng),該系統(tǒng)的控制策略的開創(chuàng)性實現(xiàn)了雙組神經(jīng)網(wǎng)絡(luò)一致性協(xié)議下的協(xié)同控制,通過一組循環(huán)神經(jīng)網(wǎng)絡(luò),根據(jù)其他衛(wèi)星的狀態(tài)進(jìn)行高頻次預(yù)測,預(yù)測結(jié)果收斂后再通過另一組循環(huán)神經(jīng)網(wǎng)絡(luò)將預(yù)先輸入的二階理想控制律轉(zhuǎn)變?yōu)樾l(wèi)星姿控執(zhí)行機(jī)構(gòu)的輸出量以完成協(xié)同控制。在他們的仿真實驗中,這套協(xié)同控制策略能夠有效地應(yīng)對類似多衛(wèi)星近距離協(xié)同這樣的復(fù)雜指令環(huán)境,并且有著理論上良好的魯棒性,對模型誤差有著良好的適應(yīng)性。
本文主要著眼于未來數(shù)年人工智能技術(shù)在航天任務(wù)中的應(yīng)用前景,梳理了共軌位智能監(jiān)測協(xié)同控制的發(fā)展現(xiàn)狀,總結(jié)了相關(guān)關(guān)鍵技術(shù)的開發(fā)和未來應(yīng)用所面臨的挑戰(zhàn)。根據(jù)調(diào)研,各國的該領(lǐng)域?qū)W者已經(jīng)針對航天器智能化進(jìn)行了大量且深入的研究,研究取得了顯著的成果。
智能化協(xié)同監(jiān)測是航天測控的一大主要發(fā)展方向,其根本目的是提高航天器的任務(wù)效率并盡可能減小對地面測控的依賴,是未來大規(guī)模集群協(xié)同任務(wù)的關(guān)鍵所在。航天智能化領(lǐng)域不可避免地成為了國際競爭的又一新焦點。航天器協(xié)同任務(wù)的高度智能化將會深刻地影響包括軌道軍事、航天基建、深空科研等諸多領(lǐng)域。