侯鵬榮, 王哲龍, 武強, 仇森, 褚慶浩, 曾梓康
(1. 大連理工大學(xué), 大連 116024; 2. 北京衛(wèi)星環(huán)境工程研究所, 北京 100000)
空間目標是指所有外太空物體, 包括非功能性航天器、 火箭上面級、 空間碎片等[1]。 隨著人類空間探索活動的逐漸增多, 空間碎片環(huán)境日益惡化, 嚴重威脅著在軌航天器的安全運行。 同時, 空間碎片的持續(xù)增加, 對有限的軌道資源構(gòu)成了嚴重威脅。 由于級聯(lián)碰撞效應(yīng), 即便大幅減少發(fā)射活動, 執(zhí)行嚴格的空間減緩措施, 仍無法有效減少空間碎片。 因此, 空間目標探測、 跟蹤對于避免空間碰撞, 保障航天器運行安全至關(guān)重要。 空間環(huán)境態(tài)勢感知對于碰撞預(yù)警、 機動跟蹤、 碎片清除等具有重要意義。 圖1 為已知空間碎片的分布概況。
圖1 已知空間碎片的分布概況Fig.1 The distribution of space debris known
空間環(huán)境態(tài)勢感知旨在對空間目標開展全面的、 準確的、 實時的探測、 跟蹤、 表征的過程,從而確定可能對合作目標構(gòu)成威脅的非合作目標的行為、 意圖。 空間環(huán)境態(tài)勢感知技術(shù)依賴于空間目標監(jiān)測平臺和自主感知算法。 其中, 美國空間監(jiān)視網(wǎng)絡(luò)(SSN) 是目前世界上技術(shù)最先進且覆蓋范圍最廣的空間目標探測系統(tǒng)。 該系統(tǒng)具備主動和被動的協(xié)同探測能力, 擁有天地一體的監(jiān)測平臺以及遍布全球的控制操作中心[2]。 SSN 的數(shù)據(jù)支持美國空間作戰(zhàn)部隊的任務(wù), 也為世界其他國家的空間監(jiān)測提供重要參考。 通過空間環(huán)境監(jiān)測網(wǎng)絡(luò)產(chǎn)生的傳感數(shù)據(jù), 具有多模態(tài)、 多時空、 多平臺特點, 亟待發(fā)展面向復(fù)雜空間環(huán)境的多源數(shù)據(jù)融合、 態(tài)勢全面感知、 空間事件推理和在線智能決策等技術(shù)。
AI 的高速發(fā)展將從根本上推動空間感知領(lǐng)域向智能化方向邁進。 首先, AI 可以大幅提高空間環(huán)境態(tài)勢感知系統(tǒng)的性能和效率。 態(tài)勢感知涉及海量的數(shù)據(jù)處理和分析工作, 例如, 圖像解譯、星座識別、 天體測量等。 AI 通過強大的計算能力和智能算法, 快速處理和分析海量數(shù)據(jù)。 其次,AI 將促進空間感知領(lǐng)域的自主學(xué)習(xí)和自適應(yīng)能力。 通過機器學(xué)習(xí), 從大量的歷史數(shù)據(jù)中學(xué)習(xí)和推理, 并不斷提升性能和精度。 這將支持更高效的軌道分析、 碎片預(yù)警和風(fēng)險評估能力, 有助于實現(xiàn)實時監(jiān)測和快速響應(yīng)。 此外, AI 將提供更全面、 多維度的空間態(tài)勢信息。 通過整合地基的雷達、 光學(xué)與激光測距和天基的雷達、 光學(xué)與碰撞探測等多種探測手段, 以提高航天感知系統(tǒng)的感知能力和準確性。 這將進一步提升空間環(huán)境態(tài)勢感知的綜合能力和智能化水平。
綜上所述, 回顧和討論AI 在空間環(huán)境態(tài)勢感知的應(yīng)用進展對于空間環(huán)境可持續(xù)性具有重要價值。 本文旨在探索空間環(huán)境態(tài)勢感知的相關(guān)背景研究和適用的AI 算法, 并進一步討論多源信息融合、 自主協(xié)同感知等未來研究方向。
空間環(huán)境狀態(tài)信息的感知和評估通常依賴傳感器的高質(zhì)量追蹤。 美國、 俄羅斯、 中國、 歐盟在全球空間環(huán)境態(tài)勢感知系統(tǒng)的建設(shè)中處于領(lǐng)先地位。 表1 粗略地給出世界各國和地區(qū)建立的空間目標監(jiān)測平臺清單[3-5]。
表1 SSA 數(shù)據(jù)來源Table 1 SSA data source
截止到2023年9月, 美國SSN 已編目包括有效載荷、 分析對象和空間碎片在內(nèi)的空間目標數(shù)量超過4.4 萬。 其探測范圍覆蓋低軌到高軌, 對特征尺寸在10cm 以上的中低軌目標跟蹤分辨率達5cm, 24h 定軌精度達1km, 特征尺寸在30cm以上的高軌目標跟蹤分辨率達50cm, 24h 定軌精度達3km[5]。
由表1 可知, 空間目標監(jiān)測平臺分為地基和天基兩種方式。 地基監(jiān)測平臺不受體積、 質(zhì)量等限制, 可以實現(xiàn)較高的空間目標分辨率和較遠的探測距離。 然而, 由于地基監(jiān)測平臺的空間覆蓋范圍受其部署數(shù)量和分布位置影響, 而探測性能受地球大氣衰減特性影響, 單獨依靠地基監(jiān)測平臺難以滿足近地空間環(huán)境日益復(fù)雜的監(jiān)測需求。天基監(jiān)測平臺作為地基監(jiān)測平臺的有力擴展和補充, 彌補了地基監(jiān)測存在的盲區(qū)問題。 相比地基監(jiān)測平臺, 天基監(jiān)測平臺具有全天候、 長時間連續(xù)觀測的優(yōu)勢, 可進一步提升對空間目標監(jiān)測的靈活性、 時效性以及覆蓋范圍。
綜上, 兩種監(jiān)測方式各有利弊, 只有統(tǒng)籌兼顧實現(xiàn)天地一體協(xié)同監(jiān)測才能更全面高效地掌握近地空間動態(tài)變化情況。 除此之外, 空間環(huán)境態(tài)勢感知還需考慮部署位置和設(shè)備配置優(yōu)化問題、傳感器網(wǎng)絡(luò)布設(shè)問題、 探測性能提升問題, 其核心是發(fā)展先進的空間目標感知算法。 只有充分融合發(fā)揮軟硬件技術(shù)優(yōu)勢, 才能構(gòu)建全天候、 多層次的空間環(huán)境感知體系, 實現(xiàn)長期可持續(xù)地利用空間資源。
空間環(huán)境態(tài)勢感知的核心是準確獲取空間目標數(shù)據(jù)以及必要的數(shù)據(jù)處理。 在此過程中, 海量多源異構(gòu)實際探測數(shù)據(jù)是不易獲得的, 特別是對于天基監(jiān)測平臺的開發(fā), 由于實際安裝成本較高, 難以在短時間內(nèi)獲取所需的傳感數(shù)據(jù)進行相關(guān)驗證。 因此, 用于空間環(huán)境態(tài)勢感知數(shù)據(jù)主要來自美國SSN 發(fā)布的兩行根數(shù)(TLE)、 各天文站以及仿真成像。 表2 整理了空間環(huán)境態(tài)勢感知在數(shù)據(jù)層面的研究。
表2 SSA 數(shù)據(jù)層面的相關(guān)研究Table 2 Related research on SSA data level
到目前為止, 空間環(huán)境態(tài)勢感知的主要來源是美國的SSN, 通過Space-Track. org 有選擇性地公布空間目標的TLE。 除此之外, TLE 并沒有包含軌道精度信息, 并根據(jù)物體位置和軌道的不同而變化, 使其應(yīng)用受到限制。 同時, 空間目標范圍廣, 受地緣政治影響, 全天候持續(xù)監(jiān)測面臨巨大挑戰(zhàn)。 在空間感知領(lǐng)域, 獲得完整、 有標簽、高質(zhì)量的空間探測真實數(shù)據(jù)依然十分困難且昂貴, 特別是光學(xué)圖像數(shù)據(jù)。 缺乏足夠的空間注釋數(shù)據(jù)限制了空間環(huán)境態(tài)勢感知的研究工作。
目前, 研究學(xué)者對空間目標可見光成像的仿真進行了相關(guān)研究, 用以支持動態(tài)模擬目標跟蹤和識別任務(wù)。 在空間可見光成像模擬中, 需要充分考慮空間目標光學(xué)特性和傳感器成像特性。 針對研究重點的不同(如傳感器種類[7]、 是否發(fā)生抖動[8]、 圖像信噪比[9]、 靜態(tài)或動態(tài)跟蹤[10]、 照明角度、 超亮星拖尾[11]), 自定義模擬和生成空間目標的光學(xué)圖像、 光變曲線以及軌跡數(shù)據(jù)。 據(jù)我們所知, 對于6D 航天器姿態(tài)估計任務(wù), 公開可供科學(xué)研究的包括航天器姿態(tài)估計數(shù)據(jù)集SPEED[12]、 虛擬渲染航天器在軌數(shù)據(jù)集URSO[13]; 對于空間目標檢測和識別任務(wù), 包括SPARK[14]; 可用于3D 軌跡估計的數(shù)據(jù)集包括SPARK-T[15]。
此外, 已經(jīng)有研究學(xué)者關(guān)注到空間感知中的數(shù)據(jù)共享和數(shù)據(jù)欺詐問題。 大多數(shù)衛(wèi)星運營商無法獨立獲取SSA 數(shù)據(jù), 必須依賴幾個由主要太空強國運營的集中存儲庫。 考慮到各國在空間軌道上的合作競爭關(guān)系不斷加深, 濫用共享信息進行攻擊的威脅也日益增加。 因此, 在實現(xiàn)數(shù)據(jù)共享的同時, 如何避免欺詐行為成為一個更為迫切的問題。 James Pavur 首次提出了針對SSA 欺騙的防御技術(shù), 進而開發(fā)了基于機器學(xué)習(xí)的異常檢測工具, 使防御者在沒有空間探測傳感條件的情況下依然可以檢測到90% ~98%的欺騙企圖[16]。 Robert J 提出一個關(guān)于空間目標的本體架構(gòu), 用于空間領(lǐng)域數(shù)據(jù)共享、 互操作和知識發(fā)現(xiàn), 從而促進空間環(huán)境態(tài)勢感知社區(qū)之間的數(shù)據(jù)交換和知識共享[3]。
數(shù)據(jù)處理是空間環(huán)境態(tài)勢感知的前置環(huán)節(jié)??臻g目標具有運行軌跡長、 飛行速度快等特性,僅靠單一傳感器無法對其整個軌跡進行有效覆蓋和精確跟蹤[17]。 通過多探測系統(tǒng)組網(wǎng)協(xié)同探測,可滿足對新目標、 動態(tài)目標快速發(fā)現(xiàn)的需求。 因而, 探測數(shù)據(jù)通常具有異站、 異時、 海量、 多模態(tài)、 探測精度不一等特點。 對各傳感器獲得的數(shù)據(jù)信息進行有效融合與處理, 能最大限度地提升空間態(tài)勢感知的作用和能力。
數(shù)據(jù)融合旨在對來自多個同構(gòu)或異構(gòu)傳感提供的局部不完整信息加以整合, 消除傳感器間存在的冗余和矛盾, 形成更全面、 準確、 可靠的融合信息, 從而增強對空間態(tài)勢的認知和理解。 數(shù)據(jù)融合難點和痛點在于數(shù)據(jù)格式的差異性、 數(shù)據(jù)質(zhì)量的均衡性以及數(shù)據(jù)整合的復(fù)雜性。 傳統(tǒng)的數(shù)據(jù)融合無法適應(yīng)日益復(fù)雜的空間傳感數(shù)據(jù)環(huán)境和多樣化的應(yīng)用需求, 需要通過引入新的方法和技術(shù)來提升數(shù)據(jù)融合的能力和適應(yīng)性。
數(shù)據(jù)融合包括數(shù)據(jù)層融合、 特征層融合和決策層融合三個層次。 數(shù)據(jù)層融合涉及對來自不同傳感器如雷達、 光學(xué)以及紅外等的數(shù)據(jù)進行配準、 校正和歸一化, 實現(xiàn)不同數(shù)據(jù)源之間的信息補償和數(shù)據(jù)增強。 基于卡爾曼濾波的軌跡預(yù)測是最典型的數(shù)據(jù)融合的案例[18]。
特征層融合是在提取數(shù)據(jù)源的特征后進行分析并支持后續(xù)決策。 特征可以是軌道參數(shù)、 位置坐標、 面質(zhì)比、 投影面積等手動提取的特征, 也可以是算法自動提取的特征。 基于多源信息融合的空間碎片檢測就是利用神經(jīng)網(wǎng)絡(luò)自動提取RGB圖像和深度圖像的深層特征后進行融合, 最后利用分類頭來實現(xiàn)目標檢測, 這是一種端對端的特征層融合的方法[19]。
在決策層面, 不同的傳感器和算法可能會產(chǎn)生關(guān)于目標的不一致結(jié)論。 利用貝葉斯推理[20]、DS 證據(jù)理論[21]、 神經(jīng)網(wǎng)絡(luò)等方法, 可以將不同數(shù)據(jù)源的單個決策綜合得到更全面、 更可靠的結(jié)果, 增強空間感知的智能和決策支持能力。
本節(jié)主要是圍繞如何去收集、 整合、 分析和理解來自空間環(huán)境中各種數(shù)據(jù)和信息, 來獲得對空間狀態(tài)和態(tài)勢的全面認知和理解的過程。 其核心任務(wù)
包括遠距離跟蹤測量和運動狀態(tài)識別, 以及獲取待測目標從整體到局部的屬性、 軌道參數(shù)及運動姿態(tài)等, 進而對目標特性數(shù)據(jù)進行評估以支持太空交通管理。 圖2 給出空間環(huán)境態(tài)勢感知的一般流程。
圖2 空間環(huán)境態(tài)勢感知的一般流程Fig.2 General process of situational awareness of space environment
目標檢測旨在識別和定位太空中的目標物體, 包括在軌衛(wèi)星、 載人航天器、 火箭發(fā)射級、空間碎片以及小行星等。 實施空間目標檢測任務(wù)時, 面臨著多個挑戰(zhàn), 如復(fù)雜背景和遮擋、 尺度變化、 復(fù)雜光照和氣象條件以及目標類型多樣性等因素的影響。 這些挑戰(zhàn)對于確保準確性、 效率和可靠性提出了要求。 為了克服這些挑戰(zhàn), 需要不斷發(fā)展和改進適應(yīng)性強、 魯棒性好的空間目標檢測算法。
目前已經(jīng)開發(fā)了許多用于空間目標檢測的技術(shù)。 Liu 提出一種基于拓撲掃描的多目標檢測技術(shù), 利用了幾何對偶性, 支持在大量雜波和噪聲中提取目標的近似線性軌跡[22]。 卷積神經(jīng)網(wǎng)絡(luò)(CNN) 在目標檢測任務(wù)中較為常見, 這歸功于其對圖像特征的有效學(xué)習(xí)能力。 它可以自動學(xué)習(xí)圖像的局部特征和全局特征, 并且具有平移不變性的特性, 使得它能夠在圖像中找到目標的位置和邊界框。 然而, 將CNN 用于空間目標檢測的復(fù)雜性在于: (1) 真實數(shù)據(jù)的信噪比有所不同;(2) 缺少標準的仿真數(shù)據(jù)集。 其中, CSAU-Net網(wǎng)絡(luò)[23]、 EfficientDet + EfficientNet-v2 網(wǎng)絡(luò)[19]等是通過模糊和添加噪聲進行數(shù)據(jù)增強, 從而提高了模型的精度, 減少了漏檢、 誤檢的事件發(fā)生。針對小碎片檢測場景下存在誤報而可能產(chǎn)生噪聲標簽的情況, Li 提出一種新的噪聲標簽學(xué)習(xí)范式-協(xié)同校正算法, 目的是在高噪聲標簽率下保持較高的空間碎片檢出率[24]。
目標跟蹤旨在準確追蹤和持續(xù)監(jiān)測目標運動狀態(tài), 為后續(xù)分析和決策提供關(guān)鍵性數(shù)據(jù)支持。同時, 目標跟蹤技術(shù)必須克服空間環(huán)境的復(fù)雜性和空間目標運動的不確定性, 如遠距離探測下的目標信號微弱、 目標間可能存在遮擋與交叉運動等困難[25]。 因此, 審查與目標跟蹤相關(guān)的關(guān)鍵技術(shù)對于空間態(tài)勢感知的后續(xù)研究開展至關(guān)重要。
4.2.1 軌道確定
軌道確定問題可視為一個回歸問題, 其關(guān)鍵在于如何充分利用多段極短弧觀測數(shù)據(jù), 與之對應(yīng)的是目標在不同時間點的位置和速度信息。Feng 提出一種加權(quán)分布回歸方法用于地球同步軌道(GEO) 的空間目標定軌, 該方法在白噪聲和有色噪聲干擾下優(yōu)于Laplace 方法[26], 而支持向量機則被用于減少空間目標在定軌和傳播過程后的位置誤差[27]。
4.2.2 軌道預(yù)測
軌道預(yù)測對于空間環(huán)境態(tài)勢感知相關(guān)任務(wù)(例如空間碰撞預(yù)警) 至關(guān)重要[28]。 然而, 由于觀測稀疏且精度低、 目標幾何特征未知以及對受力的簡化, 傳統(tǒng)基于軌道力學(xué)理論或者基于物理模型的軌道預(yù)測在較長時間內(nèi)誤差快速增長, 直接面臨不可用的問題[29]。 通過機器學(xué)習(xí)從歷史數(shù)據(jù)中學(xué)習(xí)軌道預(yù)測誤差的潛在模式[30-33]或者直接用于軌道預(yù)測[34-36], 可以大幅提高軌道預(yù)測精度。 更進一步, 將機器學(xué)習(xí)方法和傳統(tǒng)的軌道預(yù)測方法進行融合, 建立混合解析- 機器學(xué)習(xí)框架, 軌道預(yù)測的精度獲得極大提升[37,38]。
4.2.3 機動檢測
機動檢測是通過對空間目標的運動和軌跡進行分析, 確定其機動的類型和特征, 實現(xiàn)對目標運動狀態(tài)的動態(tài)監(jiān)測, 從而更好地了解目標意圖和行為模式。 LIU 等人通過假設(shè)檢驗實現(xiàn)對目標軌道數(shù)據(jù)分析, 判斷目標是否處于機動狀態(tài)。 這種方法可以有效地降低目標軌道機動檢測的誤報率, 提高檢測的準確性和可靠性[39,40]。 而后, 針對傳統(tǒng)的卡爾曼濾波器算法無法工作在非合作目標的機動檢測任務(wù)這一不足, JIANG 等人提出了改進的擴展卡爾曼濾波器、 增廣的無偏最小方差輸入和狀態(tài)估計等方法用于未知的機動檢測[41]。此外, LI 提出了兩種自適應(yīng)的基于Unscented 信息濾波器, 用于追蹤具有機動和有色量測噪聲的目標[42]。
部分研究集中在對空間目標進行建模和表征, 目的是提取目標關(guān)鍵信息, 了解目標可能來源、 軌跡和特征, 進而確定其威脅程度, 并制定相應(yīng)的對策。
軌跡估計在空間目標軌道預(yù)測中起著重要作用, 特別是在觀測數(shù)據(jù)有限或不準確的情況下。軌跡估計的目標是對目標歷史軌跡數(shù)據(jù)進行分析和建模, 以預(yù)測目標未來可能的運動軌跡。 由于空間軌跡在時間和空間維度上具有強相關(guān)性, 僅憑單張目標圖像的視角無法確定其三維位置[43]。研究表明, 通過單一攝像機連續(xù)捕捉空間目標的動態(tài)圖像, 并通過兩階段的計算可以獲得具有時間一致性的三維位置軌跡。 此外, Dave 提出了一種基于遞歸卷積神經(jīng)網(wǎng)絡(luò)的方法, 在低分辨率成像條件下實現(xiàn)了空間目標位置和速度的估計[44]。
姿態(tài)估計旨在推斷目標的朝向和姿態(tài)參數(shù),如目標的姿態(tài)角、 旋轉(zhuǎn)角速度等。 迄今為止, 已經(jīng)開發(fā)了很多針對空間目標的姿態(tài)估計方法。 現(xiàn)階段空間目標在軌姿態(tài)的精確測量依賴于雷達與光學(xué)高質(zhì)量連續(xù)高分辨成像感知, 目標狀態(tài)參數(shù)的估計依賴于目標觀測數(shù)據(jù)與歷史積累觀測數(shù)據(jù)庫的特征匹配, 缺乏觀測物理模型的支撐, 估計精度有限, 無法推廣至具有復(fù)雜運動的目標、 非合作目標等實際應(yīng)用場景。 基于深度學(xué)習(xí)的空間目標姿態(tài)估計方法具有潛在優(yōu)勢。 例如, 通過單站逆合成孔徑雷達(ISAR) 觀測目標, 隱馬爾可夫模型描述目標投影變化, 采用不同優(yōu)化算法進行求解計算[44,45]。 融合光學(xué)和ISAR 等不同測量手段實現(xiàn)空間目標的準確瞬時姿態(tài)[46,47]。 此外,多站ISAR 協(xié)同用于自旋航天器的動態(tài)估計[47]。深度學(xué)習(xí)在空間目標姿態(tài)估計的應(yīng)用不多但潛力巨大, 已成功應(yīng)用在光變曲線[48]、 單目視覺[49]、視頻幀[50]等不同觀測條件下的空間目標姿態(tài)估計, 實現(xiàn)了空間目標的姿態(tài)變化的精確捕捉和分析, 為碰撞預(yù)測和軌道博弈提供了更可靠的支持和指導(dǎo)。
特別地, Xu 等人提出了一種基于光度反射特性的衛(wèi)星工作狀態(tài)檢測方法, 可以作為快速檢測GEO 衛(wèi)星工作狀態(tài)的依據(jù)[51]。
空間環(huán)境態(tài)勢感知的決策部分實質(zhì)是將感知到的空間環(huán)境信息轉(zhuǎn)化為行動的過程。 決策可能涉及資源調(diào)度、 避免碰撞、 軌道博弈等。 本文對空間感知中的資源調(diào)度、 避免碰撞和軌道博弈等關(guān)鍵技術(shù)進行了回顧和討論。 表3 整理了空間環(huán)境態(tài)勢感知在決策層面的研究。
表3 SSA 決策層面的相關(guān)研究Table 3 Related research on SSA data level
由于空間碎片的爆炸性增加、 巨型星座的任務(wù)實施, 導(dǎo)致空間監(jiān)測任務(wù)較之前更為繁瑣復(fù)雜, 需要新的資源調(diào)度方法來滿足新需求。 在早期研究中, 調(diào)度問題被視為如何將傳感器的探測時間有效地分配到空間目標的收集和測量上。Bussy-Virat 等人提出了NICO 調(diào)度器, 該調(diào)度器通過考慮氣象和天文限制來協(xié)調(diào)各用戶的請求。其核心思想是利用遺傳算法來解決資源調(diào)度問題[52]。 此外, 其他學(xué)者還開發(fā)了基于禁忌遺傳算法[53]、 基于假設(shè)和協(xié)方差[54]等調(diào)度方法, 旨在提高求解速度和推理精度。
此外, 博弈論在解決資源調(diào)度方面具有很大潛力。 Jaunzemis 等人提出一種自組織的空間目標跟蹤方法, 將資源調(diào)度問題轉(zhuǎn)化成潛在博弈問題, 參與者需要遵循同步最優(yōu)反應(yīng)準則來更新其動作, 獲得了較大的跟蹤精度提升[55]。 類似地, Peng 等人將因果關(guān)系考慮在內(nèi), 提出基于深度強化學(xué)習(xí)的資源調(diào)度解決方案, 在提高跟蹤精度的同時, 使模型具有潛在的解釋學(xué)習(xí)策略的能力[56]。
避免碰撞技術(shù)的關(guān)鍵在于通過準確的碰撞預(yù)測和靈活的機動策略, 從而實現(xiàn)對在軌航天器的安全導(dǎo)航。 碰撞預(yù)測的核心是碰撞概率計算, 而機動規(guī)避算法則是機動策略的精髓。
5.2.1 碰撞概率計算
計算碰撞概率是避免碰撞的前置階段。 Fan等人提出一種基于蒙特卡羅協(xié)方差演化的碰撞概率計算方法。 該方法精度高但計算極慢, 僅適用于少量受控的、 重點監(jiān)測的空間目標間的碰撞演化計算, 不足以應(yīng)對更加復(fù)雜的空間環(huán)境導(dǎo)致的大批量的軌道碰撞預(yù)警[57]。 Fernandez-Mellado 等人在僅提供初始開普勒參數(shù)的前提下, 用一組ANN 來預(yù)測衛(wèi)星在一段時間內(nèi)的分點參數(shù)。 該方法不依賴任何動態(tài)模型, 在傳播中不涉及積分,因而執(zhí)行速度更快[58]。 在實際應(yīng)用中, 需要根據(jù)實測數(shù)據(jù)動態(tài)校正軌道預(yù)報協(xié)方差, 進行快速高精度的軌道誤差傳播, 以提供及時可靠的碰撞預(yù)警。
5.2.2 機動策略
機動規(guī)避策略旨在通過靈活的機動行為來避免潛在的碰撞風(fēng)險。 在相對距離計算和機動策略的設(shè)計中, Ni 等人提出基于人工勢函數(shù)的滑模控制策略, 在保證相對位置和姿態(tài)誤差的收斂的同時避免發(fā)生碰撞[59]。 Qu 等人還提出一種自適應(yīng)探索深度確定性策略梯度(DDPG) 算法, 這一訓(xùn)練控制策略相較于上述人工勢函數(shù)方法能夠在近距離階段能耗減少16.44%。 此外, 引入元學(xué)習(xí), 可以在短時間內(nèi)訓(xùn)練出適用于其他受擾動場景的控制策略[60]。
軌道博弈是兩個(含) 以上空間運動目標在各自允許的控制能力和所獲得的信息支持下, 通過施加主動控制實現(xiàn)相對位姿的動態(tài)變化的過程。 其中, 追逐-逃逸作為空間軌道博弈的典型代表, 旨在支撐整體空間博弈戰(zhàn)略, 獲得空間優(yōu)勢。
Zhang 等人提出將原始的追逐-逃逸問題等效為一個四維的單邊最優(yōu)控制問題(OCP), 利用深度神經(jīng)網(wǎng)絡(luò)建立OCP 和其解的映射關(guān)系, 進而解決自由時間橢圓軌道追逐- 逃逸的博弈問題[61]。 Zhang 等人將追逐-逃逸問題建模為差分博弈, 并給出一個閉合形式的邊界解。 通過深度強化學(xué)習(xí)得到了軌道追逐-逃逸中近乎最佳的攔截策略[62]。 Zhao 將追逐- 逃逸問題轉(zhuǎn)化為雙邊優(yōu)化問題, 為了確定博弈雙方的最優(yōu)脈沖動作,設(shè)計了基于多代理強化學(xué)習(xí)框架的PRD-MADDPG算法[63]。 結(jié)果表明, 即使是在更復(fù)雜的約束下,該算法仍能有效地找到適用的策略。
準確的空間探測數(shù)據(jù)是不可或缺的。 這些數(shù)據(jù)來源包括地基的雷達、 光學(xué)、 激光測距以及天基的紅外、 光學(xué)以及被動感知等, 對于目標的檢測、 跟蹤、 識別以及機動策略等至關(guān)重要。 為應(yīng)對數(shù)據(jù)量少且涉及數(shù)據(jù)安全, 可以考慮
(1) 數(shù)字孿生技術(shù)的運用: 基于數(shù)字孿生技術(shù)建模空間場景, 進而提供高保真的空間目標仿真數(shù)據(jù), 但需要注意數(shù)據(jù)與真實場景的匹配程度。
(2) 分布式機器學(xué)習(xí)的運用: 在保障數(shù)據(jù)安全的前提下, 建立國際間協(xié)作機制, 共同開展空間碎片的監(jiān)測和跟蹤工作。 聯(lián)邦學(xué)習(xí)等先進技術(shù)的引入, 能夠在不犧牲隱私的前提下, 促進全球范圍內(nèi)的合作, 實現(xiàn)信息共享與技術(shù)創(chuàng)新, 從而更好地應(yīng)對不斷增加的太空碎片問題。
當前的空間環(huán)境態(tài)勢感知系統(tǒng)在小目標和高軌目標的監(jiān)測能力方面存在局限性, 需要進一步優(yōu)化以提升性能。 此外, 對于空間目標的電磁和光學(xué)特性的監(jiān)測與識別也需要精細化改進。 為了有效解決這些問題, 需進一步發(fā)揮人工智能在知識表示和遷移學(xué)習(xí)等方面的潛力
(1) 知識圖譜的運用: 知識圖譜可用于空間態(tài)勢的知識表示與推理, 從而更好地組織表示空間物體、 行為事件之間的聯(lián)系, 進行基于知識的目標檢測、 跟蹤、 識別等高級推理。
(2) 遷移學(xué)習(xí)的運用: 遷移學(xué)習(xí)可以將源域?qū)W習(xí)到的知識遷移到目標域, 空間環(huán)境態(tài)勢感知涉及多樣化的環(huán)境和場景, 對應(yīng)的探測數(shù)據(jù)分布也存在差異。 通過域自適應(yīng)技術(shù), 將在一個空間場景獲得的知識和模型遷移到另一個場景, 以提高跨場景的空間目標識別的一致性。 運用弱監(jiān)督遷移學(xué)習(xí)提高對新發(fā)現(xiàn)空間目標的檢測能力。
現(xiàn)有地基雷達和光學(xué)等探測設(shè)備對空間的覆蓋范圍有限, 且受到地理條件的限制, 接收到的信號強度與被觀測目標的距離成反比。 為了彌補地面監(jiān)測網(wǎng)的不足, 基于天基光學(xué)的傳感器被用于高軌目標探測。 為了提高跟蹤性能, 需要使用多顆衛(wèi)星來執(zhí)行任務(wù)。
如何最大限度地降低消耗并獲得更好地感知是需要進一步思考的方向。 構(gòu)建多智能體協(xié)同算法,協(xié)調(diào)地面的雷達和光學(xué)傳感器以及衛(wèi)星上的紅外和光學(xué)設(shè)備, 進而實現(xiàn)更為高效的分布式空間監(jiān)測。
在過去的幾年里, 以深度學(xué)習(xí)和強化學(xué)習(xí)等關(guān)鍵技術(shù)為驅(qū)動, 以大數(shù)據(jù)和云計算為基礎(chǔ), 人工智能呈現(xiàn)出爆炸性的增長, 并在空間環(huán)境態(tài)勢感知方面表現(xiàn)出卓越的能力。 因此, 將人工智能新技術(shù)應(yīng)用于空間科學(xué)領(lǐng)域具有良好的發(fā)展前景。 可以預(yù)見, 數(shù)字孿生、 分布式機器學(xué)習(xí)、 知識圖譜、 遷移學(xué)習(xí)、 多智能體協(xié)同將是未來空間環(huán)境態(tài)勢感知的主要研究方向。 在此, 總結(jié)了本文關(guān)鍵結(jié)論和見解:
1. 在天地一體空間監(jiān)測網(wǎng)絡(luò)協(xié)同感知的背景下, 為了進一步強化空間態(tài)勢感知能力, 通過多傳感器的動態(tài)優(yōu)化管理, 使系統(tǒng)取得整體性能最優(yōu)。 通過數(shù)據(jù)融合, 將來自不同傳感器的數(shù)據(jù)整合, 從而提供更豐富、 詳盡的態(tài)勢感知信息。
2. 在空間目標檢測和識別任務(wù)中, 面臨特征不確定性和樣本稀缺性的雙重難題。 因此, 需要針對典型目標的特征變化, 提出自動數(shù)據(jù)增強方法, 用于改進空間目標檢測和識別的模型, 以提高其對空間目標特征變化的適應(yīng)性。
3. 針對在空間復(fù)雜環(huán)境的不完全信息條件下的軌道博弈問題, 單個智能體的知識和計算能力有限, 難以有效應(yīng)對各種不確定因素。 為了應(yīng)對這一挑戰(zhàn), 可以考慮結(jié)合深度強化學(xué)習(xí)技術(shù), 開展多智能體大規(guī)模博弈問題的建模和求解研究,以充分利用多智能體之間的交互信息, 并自適應(yīng)地調(diào)整環(huán)境參數(shù), 從而提高全局策略學(xué)習(xí)能力。