• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    信息非完備下多航天器軌道博弈強(qiáng)化學(xué)習(xí)方法

    2023-11-23 13:00:34王英杰耿遠(yuǎn)卓
    宇航學(xué)報(bào) 2023年10期
    關(guān)鍵詞:航天器約束軌道

    王英杰,袁 利,湯 亮,3,黃 煌,3,耿遠(yuǎn)卓,3

    (1. 北京控制工程研究所,北京 100094;2. 中國空間技術(shù)研究院,北京 100094;3. 空間智能控制技術(shù)重點(diǎn)實(shí)驗(yàn)室,北京 100094)

    0 引 言

    隨著空間任務(wù)日趨復(fù)雜,航天器智能水平的需求也日益增長。傳統(tǒng)的航天控制技術(shù)通常采用“地面測(cè)定軌+遙測(cè)下傳→情況判定→決策規(guī)劃→上注指令→在軌執(zhí)行”的天地大回路工作模式。當(dāng)面向具有高不確定性和強(qiáng)實(shí)時(shí)性的空間軌道博弈任務(wù)時(shí),傳統(tǒng)航天控制技術(shù)缺乏實(shí)時(shí)性與自主性,難以有效適應(yīng)任務(wù)需求[1-2]。因此,航天器亟需面向不確定空間軌道博弈場景的在軌自主博弈決策技術(shù)。

    隨著航天技術(shù)的不斷發(fā)展,小衛(wèi)星憑借研制周期短、性價(jià)比高、適合批量化發(fā)射等特點(diǎn)展現(xiàn)出了極高的經(jīng)濟(jì)價(jià)值。另一方面,微小衛(wèi)星集群協(xié)同的任務(wù)模式具有高效、強(qiáng)魯棒等特點(diǎn),能夠?qū)崿F(xiàn)超越大型平臺(tái)的功用。21世紀(jì)以來,在天文觀測(cè)、深空探測(cè)和對(duì)地勘測(cè)等方面,美國國家航空航天局、歐洲空間局等機(jī)構(gòu)相繼提出并逐漸實(shí)施各式各樣的航天器集群計(jì)劃。航天器正朝著小型化、協(xié)同化和集群化的方向快速發(fā)展。航天器集群化的發(fā)展趨勢(shì),給空間軌道博弈提出了多航天器分布式協(xié)同博弈的新挑戰(zhàn)。

    微分對(duì)策理論基于雙邊最優(yōu)控制理論,可描述連續(xù)時(shí)間系統(tǒng)內(nèi)受微分方程約束的博弈競爭問題,目前已廣泛應(yīng)用于軌道追逃[3-4]、姿態(tài)接管[5]等典型場景中。微分對(duì)策的優(yōu)點(diǎn)是在任務(wù)要求較為簡單的博弈場景中,能夠精確地求解出最優(yōu)策略。然而,當(dāng)面對(duì)復(fù)雜空間軌道博弈任務(wù)時(shí),由于微分博弈對(duì)成本函數(shù)的約束,難以設(shè)計(jì)出符合任務(wù)需求的運(yùn)動(dòng)策略[6]。另一方面,由于哈密頓雅可比方程的非線性和耦合性,微分對(duì)策通常很難求得解析解[5]。

    不同于依賴標(biāo)簽數(shù)據(jù)的深度學(xué)習(xí),強(qiáng)化學(xué)習(xí)[7]通過智能體在環(huán)境中不斷試錯(cuò),使智能體具備在特定環(huán)境下進(jìn)行自主決策的能力。近年來深度強(qiáng)化學(xué)習(xí)已在博弈問題中取得了令人矚目的成就。由DeepMind公司研發(fā)的人工智能算法AlphaGo先后戰(zhàn)勝了圍棋世界冠軍李世石、柯潔,成為了第一個(gè)戰(zhàn)勝圍棋世界冠軍的人工智能機(jī)器人[8]。AlphaStar在即時(shí)策略游戲星際爭霸Ⅱ中展現(xiàn)出超過99.8%人類玩家的大師級(jí)游戲水平[9]。在美國DARPA AlphaDogfight挑戰(zhàn)賽的人機(jī)大戰(zhàn)中,強(qiáng)化學(xué)習(xí)算法PHANG-MAN在虛擬空戰(zhàn)中以5:0的壓倒性優(yōu)勢(shì)擊敗了F-16飛行教官Banger[10]。針對(duì)傳統(tǒng)程序式機(jī)動(dòng)對(duì)多攔截器規(guī)避成功率低的問題,文獻(xiàn)[11]采用基于逆值法的稀疏獎(jiǎng)勵(lì)強(qiáng)化學(xué)習(xí)方法,有效提升了航天器編隊(duì)的協(xié)同自主規(guī)避能力。針對(duì)共面軌道攔截問題,文獻(xiàn)[12]采用基于經(jīng)驗(yàn)的深度確定性策略梯度(EBDDPG)算法,通過引入先驗(yàn)知識(shí),有效提升了強(qiáng)化學(xué)習(xí)算法在該問題中的收斂性。

    在真實(shí)物理環(huán)境的應(yīng)用中,智能體系統(tǒng)的敏感器通常無法感知環(huán)境中的所有信息,該問題在空間環(huán)境中尤為突出。非合作目標(biāo)的位置速度信息獲取需要測(cè)距測(cè)速雷達(dá)的支持,但雷達(dá)的探測(cè)范圍有限。若非合作目標(biāo)超過雷達(dá)探測(cè)范圍,則只能通過光學(xué)敏感器獲得其方位信息。在信息非完備的約束下,深度強(qiáng)化學(xué)習(xí)僅憑單步輸入通常難以取得滿意的控制效果。因此,學(xué)者們通過引入具有記憶功能的循環(huán)神經(jīng)網(wǎng)絡(luò),彌補(bǔ)部分可觀測(cè)的缺陷。深度Q網(wǎng)絡(luò)(DQN)算法[13]在進(jìn)行Atari等游戲時(shí),常常將最近的4幀畫面組成一個(gè)狀態(tài)作為神經(jīng)網(wǎng)絡(luò)輸入,這是因?yàn)閮H憑1幀畫面難以判斷物體運(yùn)動(dòng)方向、速度等信息。深度循環(huán)Q網(wǎng)絡(luò)(DRQN)算法[14]將LSTM[15]和DQN算法相結(jié)合,在僅使用1幀畫面作為輸入的條件下,通過LSTM網(wǎng)絡(luò)進(jìn)行歷史信息的凝練壓縮,達(dá)到預(yù)測(cè)速度的效果,進(jìn)而實(shí)現(xiàn)信息非完備約束下的高性能表現(xiàn)。文獻(xiàn)[16]將LSTM與多智能體深度確定性梯度(MADDPG)算法[17]相結(jié)合提出了深度循環(huán)多智能體演員-評(píng)論家框架(R-MADDPG)。文獻(xiàn)[16]在部分信息可見、通訊受限的多智能體協(xié)作場景下進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明,價(jià)值網(wǎng)絡(luò)采用循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)十分重要,能夠使得R-MADDPG具有應(yīng)對(duì)信息非完備約束的能力。

    本文首先根據(jù)空間軌道博弈特點(diǎn),進(jìn)行了軌道博弈動(dòng)力學(xué)與信息非完備約束建模。其次,依據(jù)分布式系統(tǒng)架構(gòu),進(jìn)行了網(wǎng)絡(luò)輸入輸出結(jié)構(gòu)設(shè)計(jì),并引入具有記憶功能的LSTM網(wǎng)絡(luò),根據(jù)航天器運(yùn)動(dòng)在時(shí)間、空間連續(xù)的屬性,補(bǔ)償位置、速度測(cè)量信息的非完備性。另一方面,為增強(qiáng)決策模型的泛化性能,同構(gòu)航天器之間共享權(quán)值參數(shù)。然后采用紅藍(lán)左右互搏的訓(xùn)練模式,利用PPO算法[18]開展學(xué)習(xí)訓(xùn)練,以增強(qiáng)決策模型應(yīng)對(duì)各類策略的泛化性能。最后,在多航天器軌道追逃場景和多航天器協(xié)同觀測(cè)場景中,進(jìn)行了三組對(duì)比訓(xùn)練實(shí)驗(yàn),驗(yàn)證了算法的有效性。

    1 問題描述

    空間軌道博弈是指在天體引力場內(nèi)受軌道動(dòng)力學(xué)約束的兩個(gè)(含)以上運(yùn)動(dòng)體在各自允許的控制能力和可獲得的信息支持下,主動(dòng)施加控制行動(dòng),追求相反、矛盾或不一致的相對(duì)位姿狀態(tài)所形成的軌道演化過程及其結(jié)果[6]。根據(jù)任務(wù)場景和任務(wù)目標(biāo)的不同,其包含上千公里距離的軌道潛伏、軌道偽裝,百公里尺度的軌道追逃、軌道攔截以及米級(jí)的軌道附著、軌道接管。本文的研究范圍是地球同步軌道(Geosynchronous orbit, GEO)百公里尺度的局部空間軌道博弈任務(wù)。

    1.1 軌道博弈動(dòng)力學(xué)建模

    各航天器按照一定的決策頻率進(jìn)行軌道控制,且均采用脈沖式推力:

    (1)

    各航天器的運(yùn)動(dòng)由C-W相對(duì)運(yùn)動(dòng)方程描述,其軌道面內(nèi)運(yùn)動(dòng)和面外運(yùn)動(dòng)如式(2)所示:

    (2)

    式中:n為坐標(biāo)原點(diǎn)的軌道角速度;T為步長;cnT和snT分別為cos(nT)和sin(nT)的簡寫。

    1.2 信息非完備約束建模

    信息非完備約束在空間環(huán)境中主要體現(xiàn)在兩方面:①測(cè)距測(cè)速雷達(dá)探測(cè)范圍約束,②合作航天器之間的通訊時(shí)刻約束。

    設(shè)各航天器的雷達(dá)探測(cè)范圍為dr。當(dāng)?shù)趇個(gè)航天器與第j個(gè)航天器的相對(duì)距離dij不大于dr時(shí),第i個(gè)航天器可通過雷達(dá)和光學(xué)敏感器信息融合獲得第j個(gè)航天器的相對(duì)位置信息rj-ri+δr和相對(duì)速度信息vj-vi+δv;否則就需要通過星間通訊或光學(xué)敏感器獲得其信息。

    空間環(huán)境中獲取其他航天器信息的詳細(xì)流程如圖1所示。

    圖1 空間環(huán)境中信息獲取流程圖

    2 基于強(qiáng)化學(xué)習(xí)的軌道博弈決策方法

    2.1 學(xué)習(xí)訓(xùn)練方法

    在軌道博弈任務(wù)中,藍(lán)方?jīng)Q策模型可采用基于專家知識(shí)的方式進(jìn)行建模,然后固定藍(lán)方策略對(duì)紅方策略進(jìn)行單方面訓(xùn)練。然而該種訓(xùn)練方式容易導(dǎo)致紅方策略過擬合、應(yīng)對(duì)其他藍(lán)方策略泛化性差的情況[19]。因此,本文采用紅藍(lán)左右互博方式進(jìn)行學(xué)習(xí)訓(xùn)練,以增強(qiáng)決策模型應(yīng)對(duì)各類策略的泛化性能。訓(xùn)練算法采用PPO算法。

    在前向推理階段,AC方法僅通過策略網(wǎng)絡(luò)輸出最優(yōu)動(dòng)作(或動(dòng)作分布)。在學(xué)習(xí)訓(xùn)練階段,價(jià)值網(wǎng)絡(luò)和策略網(wǎng)絡(luò)同時(shí)進(jìn)行訓(xùn)練。價(jià)值網(wǎng)絡(luò)的目標(biāo)函數(shù)梯度為:

    ▽LVF(φ)=δt▽?duì)誚(st,φ)

    (3)

    價(jià)值網(wǎng)絡(luò)的輸出將作為策略網(wǎng)絡(luò)梯度的一部分,輔助其進(jìn)行訓(xùn)練:

    ▽L(θ)=δt▽?duì)萳nπ(at|st,θ)

    (4)

    式中:L(θ)代表策略網(wǎng)絡(luò)的目標(biāo)函數(shù)。

    相較于傳統(tǒng)的AC方法,PPO算法將價(jià)值網(wǎng)絡(luò)和策略網(wǎng)絡(luò)相結(jié)合。除輸出層外,策略網(wǎng)絡(luò)和價(jià)值網(wǎng)絡(luò)共享相同的網(wǎng)絡(luò)結(jié)構(gòu)與權(quán)值。因此,其目標(biāo)函數(shù)同時(shí)包含了策略網(wǎng)絡(luò)和價(jià)值網(wǎng)絡(luò)的優(yōu)化指標(biāo):

    c2S[π(at|st,θ)]]

    (5)

    (6)

    其中,Tmax為單局最大仿真步長,Imax為最大訓(xùn)練步數(shù),αlr為學(xué)習(xí)率。

    2.2 LSTM網(wǎng)絡(luò)

    循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)[21]通過引入隱藏單元,使神經(jīng)網(wǎng)絡(luò)具有一定的記憶功能,具備處理序列數(shù)據(jù)的能力,目前已在自然語言處理[22]、語音識(shí)別[23]等領(lǐng)域得到了廣泛的應(yīng)用。

    針對(duì)一般RNN存在的長期依賴問題,LSTM通過引入門控單元,使神經(jīng)網(wǎng)絡(luò)學(xué)會(huì)決定何時(shí)清除狀態(tài),而不是手動(dòng)決定,有效解決了梯度爆炸或者消失的問題。

    LSTM一共包含三個(gè)門控單元:遺忘門ft、輸入門it和輸出門ot:

    (7)

    (8)

    (9)

    式中:⊙代表哈達(dá)瑪積,即相同維數(shù)向量(矩陣)間逐元素相乘。

    最終,LSTM網(wǎng)絡(luò)根據(jù)輸出門ot和網(wǎng)絡(luò)狀態(tài)ct輸出ht:

    ht:=ot⊙tanh(ct)

    (10)

    2.3 網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)

    在集中式系統(tǒng)架構(gòu)中,中央處理器需要在每個(gè)決策時(shí)刻對(duì)所有航天器進(jìn)行動(dòng)作量分配,給航天器星間通訊帶來了很大的負(fù)擔(dān)。因此,本文采用分布式系統(tǒng)架構(gòu),即每一個(gè)智能體根據(jù)環(huán)境輸入信息輸出單一航天器的動(dòng)作量。

    圖3 網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)

    為有效提升智能體的泛化性能,本文中的同構(gòu)航天器采用相同的網(wǎng)絡(luò)模型(網(wǎng)絡(luò)結(jié)構(gòu)和權(quán)值均相同)。不同的航天器只需調(diào)整網(wǎng)絡(luò)輸入向量的順序即可獲得相應(yīng)的動(dòng)作量。

    3 仿真校驗(yàn)

    3.1 實(shí)驗(yàn)場景

    本文將在兩個(gè)場景中驗(yàn)證所提出方法的有效性。第一個(gè)場景為多航天器軌道追逃場景。3個(gè)同構(gòu)主動(dòng)星從100 km外3個(gè)不同方向?qū)Ψ呛献髂繕?biāo)實(shí)施追捕,1個(gè)非合作目標(biāo)在不遠(yuǎn)離初始軌位100 km的條件下進(jìn)行逃逸。當(dāng)任一主動(dòng)星抵近非合作目標(biāo)5 km之內(nèi),判定主動(dòng)星完成追捕任務(wù)。主動(dòng)星x,y,z單軸單次最大速度增量為4 m/s,非合作目標(biāo)x,y,z單軸單次最大速度增量為4.4 m/s,為主動(dòng)星的1.1倍。3個(gè)主動(dòng)星需要通過相互協(xié)作構(gòu)建合適的圍捕構(gòu)型來彌補(bǔ)機(jī)動(dòng)能力上的劣勢(shì)。主動(dòng)星和非合作目標(biāo)的決策周期均為10分鐘,主動(dòng)星星間通訊周期為1小時(shí)。測(cè)距測(cè)速雷達(dá)探測(cè)范圍為50 km。

    (11)

    (12)

    第二個(gè)場景為多航天器協(xié)同觀測(cè)場景。3個(gè)同構(gòu)主動(dòng)星從100 km外抵近非合作目標(biāo)50 km內(nèi),以近似等邊三角形構(gòu)型進(jìn)行協(xié)同觀測(cè)任務(wù),并確保有1個(gè)主動(dòng)星占據(jù)非合作目標(biāo)的逆光區(qū),對(duì)其進(jìn)行順光觀測(cè),非合作目標(biāo)的逆光區(qū)定義如圖4所示。非合作目標(biāo)需要在不遠(yuǎn)離其初始軌位100 km的條件下,通過軌道博弈機(jī)動(dòng)盡量增加其與主動(dòng)星的相對(duì)距離。非合作目標(biāo)和主動(dòng)星的x,y,z單軸單次最大速度增量為4.8 m/s,且非合作目標(biāo)速度增量上限為100 m/s。主動(dòng)星和非合作目標(biāo)的決策周期均為10分鐘,主動(dòng)星星間通訊周期為1小時(shí)。測(cè)距測(cè)速雷達(dá)探測(cè)范圍為50 km。

    圖4 非合作目標(biāo)逆光區(qū)

    (13)

    (14)

    3.2 訓(xùn)練參數(shù)設(shè)計(jì)

    設(shè)置非合作目標(biāo)的初始軌道為GEO。設(shè)置非合作目標(biāo)的初始位置為相對(duì)軌道坐標(biāo)系的原點(diǎn)Oo,三個(gè)主動(dòng)星的初始位置根據(jù)式(15)隨機(jī)生成。設(shè)置仿真步長為10分鐘,單回合最大仿真步數(shù)為72。

    (15)

    式中:U(a,b)代表均勻分布。R的單位為km。

    采用PPO算法對(duì)主動(dòng)星和非合作目標(biāo)開展紅藍(lán)左右互搏式訓(xùn)練,學(xué)習(xí)訓(xùn)練的超參數(shù)如表1所示。為了充分驗(yàn)證算法的優(yōu)越性,進(jìn)行三組對(duì)比訓(xùn)練實(shí)驗(yàn):①信息全可見采用全連接網(wǎng)絡(luò):主動(dòng)星采用全連接網(wǎng)絡(luò),且信息全可見,即可實(shí)時(shí)獲得其他星的位置速度信息;②信息非完備采用全連接網(wǎng)絡(luò):主動(dòng)星采用全連接網(wǎng)絡(luò),但需考慮信息非完備約束;③信息非完備采用LSTM網(wǎng)絡(luò):主動(dòng)星采用LSTM網(wǎng)絡(luò),并考慮信息非完備約束。為確保驗(yàn)證的有效性,三組實(shí)驗(yàn)均采用如3.1節(jié)所述獎(jiǎng)勵(lì)函數(shù),三組實(shí)驗(yàn)下的非合作目標(biāo)均采用全連接網(wǎng)絡(luò),且信息全可見。LSTM網(wǎng)絡(luò)的架構(gòu)如圖3所示,全連接網(wǎng)絡(luò)的架構(gòu)只需將LSTM網(wǎng)絡(luò)架構(gòu)中隱藏層中的LSTM層替換為全連接層即可。全連接網(wǎng)絡(luò)和LSTM網(wǎng)絡(luò)的具體網(wǎng)絡(luò)參數(shù)如表2所示。

    表1 訓(xùn)練參數(shù)

    表2 全連接網(wǎng)絡(luò)和LSTM網(wǎng)絡(luò)參數(shù)

    本文實(shí)驗(yàn)平臺(tái):CPU為Intel Xeon Gold 6240R,顯卡為Nvidia GeForce RTX 3090。

    3.3 結(jié)果分析

    (1)多航天器軌道追逃場景

    主動(dòng)星在多航天器軌道追逃場景的訓(xùn)練曲線如圖5所示,選取三組實(shí)驗(yàn)中訓(xùn)練步驟為20 000的主動(dòng)星與非合作目標(biāo)決策模型分別進(jìn)行1 000局蒙特卡洛模擬,三組實(shí)驗(yàn)的優(yōu)化指標(biāo)如表3所示。

    表3 多航天器追逃場景中主動(dòng)星的優(yōu)化指標(biāo)

    圖5 多航天器追逃場景中主動(dòng)星訓(xùn)練曲線

    當(dāng)面對(duì)信息非完備約束時(shí),使用全連接網(wǎng)絡(luò)的主動(dòng)星追捕成功率僅為25%,且燃料消耗為224 m/s;使用LSTM網(wǎng)絡(luò)的主動(dòng)星追捕成功率為64%,燃料消耗為193 m/s。通過對(duì)比分析可知,全連接網(wǎng)絡(luò)難以適應(yīng)信息非完備約束,而LSTM網(wǎng)絡(luò)通過補(bǔ)償位置、速度測(cè)量信息的非完備性,既防止了追捕成功率的大幅下滑,且燃料消耗并未增長許多。

    選取信息非完備采用LSTM網(wǎng)絡(luò)實(shí)驗(yàn)中訓(xùn)練步驟為20 000的主動(dòng)星、非合作目標(biāo)決策模型進(jìn)行打靶仿真,雙方的運(yùn)動(dòng)軌跡如圖6所示。三個(gè)主動(dòng)星始終保持對(duì)非合作目標(biāo)的合圍之勢(shì),以彌補(bǔ)自身的機(jī)動(dòng)能力劣勢(shì)。最終在第460分鐘,主動(dòng)星1成功抵近非合作目標(biāo)5 km之內(nèi),追捕成功。

    圖6 多航天器追逃場景中主動(dòng)星和非合作目標(biāo)運(yùn)動(dòng)軌跡

    表4 多航天器追逃場景中主動(dòng)星的單步平均燃料消耗

    圖7 主動(dòng)星1和非合作目標(biāo)的相對(duì)距離

    圖9 多航天器追逃場景中主動(dòng)星1累積燃料消耗

    (2)多航天器協(xié)同觀測(cè)場景

    主動(dòng)星在多航天器協(xié)同觀測(cè)場景的訓(xùn)練曲線如圖10所示,其中子圖(a)中順光觀測(cè)時(shí)間代表著主動(dòng)星占據(jù)非合作目標(biāo)逆光區(qū)的累積時(shí)長,子圖(c)中隊(duì)型模糊隸屬度代表ΔABC隸屬于等邊三角形的模糊隸屬度μE(t)。選取三組實(shí)驗(yàn)中訓(xùn)練步驟為20 000的主動(dòng)星與非合作目標(biāo)決策模型分別進(jìn)行1 000局蒙特卡洛模擬,三組實(shí)驗(yàn)的優(yōu)化指標(biāo)如表5所示。通過對(duì)比分析可知:當(dāng)面對(duì)信息非完備約束時(shí),簡單的全連接網(wǎng)絡(luò)難以有效適應(yīng),各項(xiàng)指標(biāo)均下降了許多,且曲線收斂過程中也有很多震蕩,訓(xùn)練不平穩(wěn)。而具有記憶功能的LSTM網(wǎng)絡(luò),通過補(bǔ)償位置、速度測(cè)量信息的非完備性,有效應(yīng)對(duì)了信息非完備強(qiáng)約束,各項(xiàng)指標(biāo)下降不大,且訓(xùn)練過程很平穩(wěn)。

    表5 多航天器協(xié)同觀測(cè)場景中主動(dòng)星的優(yōu)化指標(biāo)

    圖10 多航天器協(xié)同觀測(cè)場景中主動(dòng)星訓(xùn)練曲線

    選取信息非完備采用LSTM網(wǎng)絡(luò)實(shí)驗(yàn)中訓(xùn)練步驟為20 000的主動(dòng)星、非合作目標(biāo)決策模型進(jìn)行打靶仿真,雙方的運(yùn)動(dòng)軌跡如圖11所示。仿真初期,在僅有非合作目標(biāo)測(cè)角信息的條件下,三個(gè)主動(dòng)星能夠迅速抵近目標(biāo)。仿真中期,非合作目標(biāo)通過頻繁的軌道機(jī)動(dòng)企圖破壞主動(dòng)星的觀測(cè)條件,三個(gè)主動(dòng)星能夠通過相應(yīng)的軌道機(jī)動(dòng),占據(jù)非合作目標(biāo)逆光區(qū)進(jìn)行順光觀測(cè)。在僅有其他主動(dòng)星測(cè)角信息且星間通訊周期為1小時(shí)的條件下,三個(gè)主動(dòng)星能夠保持合適的觀測(cè)構(gòu)型。仿真后期,非合作目標(biāo)燃料消耗殆盡,處于“漂星”狀態(tài)。三個(gè)主動(dòng)星能夠以較小的燃料代價(jià),繼續(xù)保持合適的觀測(cè)構(gòu)型。

    圖11 多航天器協(xié)同觀測(cè)場景中主動(dòng)星和非合作目標(biāo)的運(yùn)動(dòng)軌跡

    圖12 主動(dòng)星1門控單元輸出值

    4 結(jié) 論

    針對(duì)信息非完備約束下的多航天器軌道博弈自主決策問題,本文首先進(jìn)行了軌道博弈動(dòng)力學(xué)建模和信息非完備約束建模,然后依據(jù)分布式系統(tǒng)架構(gòu)進(jìn)行了網(wǎng)絡(luò)輸入輸出結(jié)構(gòu)設(shè)計(jì),并引入具有記憶能力的LSTM網(wǎng)絡(luò),以應(yīng)對(duì)信息非完備約束所帶來的負(fù)面影響。采用紅藍(lán)左右互搏的訓(xùn)練模式,利用PPO算法開展學(xué)習(xí)訓(xùn)練。最后,本文在多航天器軌道追逃場景和多航天器協(xié)同觀測(cè)場景中,進(jìn)行了三組對(duì)比訓(xùn)練實(shí)驗(yàn)。

    實(shí)驗(yàn)結(jié)果表明,全連接網(wǎng)絡(luò)難以適應(yīng)信息非完備約束,各項(xiàng)優(yōu)化指標(biāo)均呈現(xiàn)出較大程度的下滑,且訓(xùn)練曲線收斂過程中也有很多震蕩,學(xué)習(xí)訓(xùn)練過程不平穩(wěn)。本文所提出的算法利用LSTM網(wǎng)絡(luò)的記憶功能,補(bǔ)償了位置、速度測(cè)量信息的非完備性,有效應(yīng)對(duì)了信息非完備約束,各項(xiàng)指標(biāo)下降不大,且訓(xùn)練過程很平穩(wěn)。最后利用信息非完備約束下的決策模型進(jìn)行打靶仿真,驗(yàn)證了決策模型的實(shí)用性。

    本文中的星間通訊采用固定周期方式,缺乏靈活性。針對(duì)上述問題,未來研究方向?yàn)橥ㄓ嵵芷谧哉{(diào)整的航天器協(xié)同決策方法。

    猜你喜歡
    航天器約束軌道
    2022 年第二季度航天器發(fā)射統(tǒng)計(jì)
    國際太空(2022年7期)2022-08-16 09:52:50
    “碳中和”約束下的路徑選擇
    基于單純形法的TLE軌道確定
    約束離散KP方程族的完全Virasoro對(duì)稱
    CryoSat提升軌道高度與ICESat-2同步運(yùn)行
    朝美重回“相互羞辱軌道”?
    2019 年第二季度航天器發(fā)射統(tǒng)計(jì)
    國際太空(2019年9期)2019-10-23 01:55:34
    2018 年第三季度航天器發(fā)射統(tǒng)計(jì)
    國際太空(2018年12期)2019-01-28 12:53:20
    2018年第二季度航天器發(fā)射統(tǒng)計(jì)
    國際太空(2018年9期)2018-10-18 08:51:32
    適當(dāng)放手能讓孩子更好地自我約束
    人生十六七(2015年6期)2015-02-28 13:08:38
    人妻人人澡人人爽人人| 国产福利在线免费观看视频| 国产精品 国内视频| 美女国产视频在线观看| 91久久精品国产一区二区三区| 欧美性感艳星| 久久久久精品久久久久真实原创| 高清不卡的av网站| 欧美人与性动交α欧美软件 | 五月天丁香电影| av线在线观看网站| 国产精品麻豆人妻色哟哟久久| 久久久精品免费免费高清| 91成人精品电影| 看十八女毛片水多多多| 99视频精品全部免费 在线| 日韩人妻精品一区2区三区| 香蕉国产在线看| 少妇人妻久久综合中文| xxx大片免费视频| 咕卡用的链子| 一级黄片播放器| 精品99又大又爽又粗少妇毛片| 涩涩av久久男人的天堂| 欧美日韩综合久久久久久| 亚洲激情五月婷婷啪啪| av片东京热男人的天堂| av天堂久久9| 午夜激情av网站| 如何舔出高潮| 亚洲人成网站在线观看播放| 国产白丝娇喘喷水9色精品| 国产精品无大码| av免费在线看不卡| 国产综合精华液| 国产男女内射视频| 97精品久久久久久久久久精品| 中文字幕亚洲精品专区| 另类亚洲欧美激情| 亚洲国产精品999| 一级,二级,三级黄色视频| 中文字幕人妻熟女乱码| 伦理电影免费视频| 国产片特级美女逼逼视频| 久热久热在线精品观看| 成人午夜精彩视频在线观看| 国产av码专区亚洲av| 成人亚洲欧美一区二区av| 26uuu在线亚洲综合色| 自拍欧美九色日韩亚洲蝌蚪91| 欧美日韩视频高清一区二区三区二| 成人无遮挡网站| 麻豆乱淫一区二区| 亚洲国产毛片av蜜桃av| 肉色欧美久久久久久久蜜桃| 制服诱惑二区| www.熟女人妻精品国产 | 亚洲精品乱久久久久久| 日本av手机在线免费观看| 建设人人有责人人尽责人人享有的| 亚洲av在线观看美女高潮| 美女中出高潮动态图| 精品人妻在线不人妻| 18+在线观看网站| 熟女电影av网| 成人国产麻豆网| 国产精品欧美亚洲77777| 亚洲精品国产色婷婷电影| 国产精品嫩草影院av在线观看| 欧美3d第一页| 考比视频在线观看| 日本黄大片高清| 国产熟女午夜一区二区三区| 国产免费视频播放在线视频| 啦啦啦啦在线视频资源| 亚洲欧美色中文字幕在线| 久久精品熟女亚洲av麻豆精品| 欧美+日韩+精品| av播播在线观看一区| 日韩大片免费观看网站| 精品少妇内射三级| 成年人午夜在线观看视频| 巨乳人妻的诱惑在线观看| 亚洲精品美女久久av网站| 亚洲精品aⅴ在线观看| 国产精品成人在线| 国产免费视频播放在线视频| 黄色 视频免费看| 久久精品熟女亚洲av麻豆精品| 亚洲激情五月婷婷啪啪| 国产精品三级大全| 咕卡用的链子| 妹子高潮喷水视频| 18+在线观看网站| 天堂中文最新版在线下载| 99视频精品全部免费 在线| 国产精品人妻久久久影院| 综合色丁香网| 少妇人妻久久综合中文| 满18在线观看网站| 男女下面插进去视频免费观看 | 国产成人a∨麻豆精品| 亚洲欧美一区二区三区国产| 亚洲国产精品国产精品| 国产在线视频一区二区| 亚洲中文av在线| 国产一区二区在线观看日韩| 久久ye,这里只有精品| 夜夜骑夜夜射夜夜干| 丝袜在线中文字幕| 午夜免费观看性视频| 人妻一区二区av| 丁香六月天网| 精品亚洲成国产av| 国产在线一区二区三区精| 熟妇人妻不卡中文字幕| 狂野欧美激情性bbbbbb| 国产黄色视频一区二区在线观看| 99热全是精品| 超碰97精品在线观看| 亚洲成人一二三区av| 久久久久久久大尺度免费视频| 熟妇人妻不卡中文字幕| 91成人精品电影| 国产xxxxx性猛交| 考比视频在线观看| 日韩av在线免费看完整版不卡| 最近最新中文字幕免费大全7| 日日爽夜夜爽网站| 国产亚洲一区二区精品| 色94色欧美一区二区| 街头女战士在线观看网站| 亚洲内射少妇av| 嫩草影院入口| 高清在线视频一区二区三区| 国产熟女欧美一区二区| 久久精品久久久久久噜噜老黄| 成人影院久久| 欧美bdsm另类| 最新的欧美精品一区二区| 亚洲成色77777| 国产免费一级a男人的天堂| 日韩人妻精品一区2区三区| 夫妻性生交免费视频一级片| 汤姆久久久久久久影院中文字幕| 日韩伦理黄色片| 国产成人91sexporn| 久久久国产一区二区| 91久久精品国产一区二区三区| 校园人妻丝袜中文字幕| 久久 成人 亚洲| 在现免费观看毛片| 天天影视国产精品| 亚洲色图 男人天堂 中文字幕 | 午夜91福利影院| 一边摸一边做爽爽视频免费| 一区二区日韩欧美中文字幕 | 亚洲第一区二区三区不卡| 日本午夜av视频| 日日爽夜夜爽网站| 内地一区二区视频在线| 老司机影院毛片| 亚洲精品乱久久久久久| av不卡在线播放| 国产乱人偷精品视频| 日韩,欧美,国产一区二区三区| 菩萨蛮人人尽说江南好唐韦庄| 最近中文字幕高清免费大全6| 久久精品久久久久久久性| 夜夜爽夜夜爽视频| 99精国产麻豆久久婷婷| 亚洲国产色片| 欧美精品高潮呻吟av久久| 亚洲av中文av极速乱| 夫妻午夜视频| 97精品久久久久久久久久精品| 亚洲丝袜综合中文字幕| 国产精品 国内视频| 中国三级夫妇交换| 欧美人与性动交α欧美软件 | 最新的欧美精品一区二区| 国国产精品蜜臀av免费| 9热在线视频观看99| 国产精品久久久av美女十八| 国产成人精品无人区| 国产精品成人在线| 咕卡用的链子| 成人综合一区亚洲| 亚洲精品美女久久久久99蜜臀 | 香蕉丝袜av| 日韩伦理黄色片| 亚洲,一卡二卡三卡| 少妇人妻精品综合一区二区| 亚洲成人av在线免费| 日本wwww免费看| 91精品国产国语对白视频| 成人二区视频| 免费女性裸体啪啪无遮挡网站| 亚洲av男天堂| 国产老妇伦熟女老妇高清| 一个人免费看片子| 天堂中文最新版在线下载| 国产高清国产精品国产三级| 丝袜在线中文字幕| 国产成人精品福利久久| 国产成人91sexporn| 性色avwww在线观看| 女人被躁到高潮嗷嗷叫费观| 22中文网久久字幕| av天堂久久9| 久久久精品区二区三区| 精品少妇黑人巨大在线播放| 国产成人精品婷婷| 水蜜桃什么品种好| 亚洲国产精品999| 日本av免费视频播放| 久久人人爽av亚洲精品天堂| 乱人伦中国视频| 免费av不卡在线播放| 少妇被粗大猛烈的视频| 久久久久精品性色| 18+在线观看网站| 一区二区三区精品91| 综合色丁香网| 精品亚洲成a人片在线观看| www.av在线官网国产| 亚洲色图 男人天堂 中文字幕 | 久久人妻熟女aⅴ| 国产精品成人在线| 97在线视频观看| 久久久精品94久久精品| 欧美国产精品va在线观看不卡| 涩涩av久久男人的天堂| 一区二区日韩欧美中文字幕 | 国产在线视频一区二区| 天天操日日干夜夜撸| 国产一区二区三区av在线| 免费不卡的大黄色大毛片视频在线观看| 国产1区2区3区精品| 男人爽女人下面视频在线观看| 亚洲精品国产av蜜桃| 男人添女人高潮全过程视频| 在线精品无人区一区二区三| 免费观看av网站的网址| 免费观看a级毛片全部| 亚洲内射少妇av| 亚洲高清免费不卡视频| 亚洲国产色片| 丝瓜视频免费看黄片| 在线天堂最新版资源| 国产精品人妻久久久影院| 午夜激情av网站| kizo精华| 各种免费的搞黄视频| 精品一区二区三区视频在线| av视频免费观看在线观看| 高清黄色对白视频在线免费看| 亚洲欧洲日产国产| 麻豆乱淫一区二区| 免费av不卡在线播放| 精品福利永久在线观看| 毛片一级片免费看久久久久| 巨乳人妻的诱惑在线观看| a级毛片在线看网站| 2018国产大陆天天弄谢| 下体分泌物呈黄色| 日韩成人伦理影院| 精品一区二区三区四区五区乱码 | 久久国内精品自在自线图片| av视频免费观看在线观看| 一区在线观看完整版| 9色porny在线观看| 日韩一区二区视频免费看| 欧美日韩成人在线一区二区| 啦啦啦视频在线资源免费观看| 新久久久久国产一级毛片| 亚洲av日韩在线播放| 91在线精品国自产拍蜜月| 日日啪夜夜爽| 午夜福利网站1000一区二区三区| av电影中文网址| 在线观看免费视频网站a站| 搡女人真爽免费视频火全软件| 色婷婷久久久亚洲欧美| 赤兔流量卡办理| 26uuu在线亚洲综合色| av电影中文网址| 少妇精品久久久久久久| 人体艺术视频欧美日本| 美女xxoo啪啪120秒动态图| 水蜜桃什么品种好| 日韩,欧美,国产一区二区三区| 美女国产视频在线观看| 国产日韩欧美视频二区| 大香蕉久久网| 天美传媒精品一区二区| 国产高清三级在线| 日本av免费视频播放| 亚洲一级一片aⅴ在线观看| av国产久精品久网站免费入址| 一级爰片在线观看| 只有这里有精品99| 大片免费播放器 马上看| 国产日韩欧美在线精品| 亚洲精品自拍成人| 咕卡用的链子| 国产淫语在线视频| 欧美日韩视频精品一区| 国产精品一区二区在线不卡| 国产精品蜜桃在线观看| 免费人成在线观看视频色| 日产精品乱码卡一卡2卡三| 最近中文字幕高清免费大全6| 久久精品国产鲁丝片午夜精品| 免费观看av网站的网址| 99热网站在线观看| 麻豆乱淫一区二区| 熟女电影av网| 青春草亚洲视频在线观看| 美女国产高潮福利片在线看| 午夜免费男女啪啪视频观看| 久久久久久伊人网av| 最近的中文字幕免费完整| 国产成人精品福利久久| 啦啦啦在线观看免费高清www| 丰满饥渴人妻一区二区三| 亚洲成av片中文字幕在线观看 | 1024视频免费在线观看| 日日摸夜夜添夜夜爱| av线在线观看网站| 一区二区av电影网| 51国产日韩欧美| 国产精品不卡视频一区二区| 美女国产视频在线观看| 国产无遮挡羞羞视频在线观看| av有码第一页| 久久青草综合色| 男女无遮挡免费网站观看| 亚洲天堂av无毛| 在线观看免费高清a一片| a级片在线免费高清观看视频| 成人国产麻豆网| 97人妻天天添夜夜摸| 午夜福利,免费看| 草草在线视频免费看| 女的被弄到高潮叫床怎么办| 亚洲av中文av极速乱| 大片免费播放器 马上看| 免费黄频网站在线观看国产| 精品一区二区三区四区五区乱码 | 自线自在国产av| 日本-黄色视频高清免费观看| 成人18禁高潮啪啪吃奶动态图| 高清在线视频一区二区三区| 日韩中字成人| 亚洲欧美一区二区三区国产| 99视频精品全部免费 在线| 亚洲综合色惰| 乱码一卡2卡4卡精品| 国产黄频视频在线观看| 一本久久精品| 美女脱内裤让男人舔精品视频| 制服人妻中文乱码| 久久久a久久爽久久v久久| 90打野战视频偷拍视频| √禁漫天堂资源中文www| 久久人人97超碰香蕉20202| 天天躁夜夜躁狠狠久久av| 精品一区二区三区视频在线| 色94色欧美一区二区| 菩萨蛮人人尽说江南好唐韦庄| 麻豆精品久久久久久蜜桃| 全区人妻精品视频| 夫妻午夜视频| 午夜福利视频在线观看免费| 97超碰精品成人国产| 汤姆久久久久久久影院中文字幕| 国产精品一二三区在线看| 2022亚洲国产成人精品| 蜜桃国产av成人99| 99香蕉大伊视频| 婷婷成人精品国产| 中文字幕人妻熟女乱码| 乱人伦中国视频| 少妇人妻久久综合中文| 国产精品麻豆人妻色哟哟久久| 国产一区亚洲一区在线观看| 久久国产精品男人的天堂亚洲 | 伊人久久国产一区二区| 桃花免费在线播放| 亚洲国产看品久久| 亚洲欧洲精品一区二区精品久久久 | 日韩av免费高清视频| 欧美97在线视频| 久久人人爽人人爽人人片va| 久久精品熟女亚洲av麻豆精品| 精品久久国产蜜桃| 久久亚洲国产成人精品v| 视频在线观看一区二区三区| 热99国产精品久久久久久7| 黄色一级大片看看| 精品卡一卡二卡四卡免费| 欧美激情国产日韩精品一区| 有码 亚洲区| 亚洲三级黄色毛片| 亚洲综合色惰| 午夜精品国产一区二区电影| 国产国语露脸激情在线看| 久久人人爽人人片av| 免费观看在线日韩| 一本大道久久a久久精品| 国产精品.久久久| 观看av在线不卡| 久久久久久久国产电影| 国产精品无大码| 午夜激情av网站| 欧美日韩综合久久久久久| 王馨瑶露胸无遮挡在线观看| 免费看光身美女| 国产亚洲最大av| videos熟女内射| 777米奇影视久久| 九九爱精品视频在线观看| 精品一区二区免费观看| 久久人人97超碰香蕉20202| 在线观看免费日韩欧美大片| 999精品在线视频| 男女啪啪激烈高潮av片| 欧美人与性动交α欧美软件 | 亚洲欧美日韩卡通动漫| 久久av网站| 日日爽夜夜爽网站| 91精品三级在线观看| 一区在线观看完整版| 黄色 视频免费看| 亚洲精品视频女| 老司机亚洲免费影院| 美女脱内裤让男人舔精品视频| av在线播放精品| 成人亚洲精品一区在线观看| 欧美精品人与动牲交sv欧美| 午夜福利,免费看| 免费观看无遮挡的男女| 免费在线观看完整版高清| 最近中文字幕高清免费大全6| 宅男免费午夜| 午夜久久久在线观看| 热99久久久久精品小说推荐| xxx大片免费视频| 久久久久久人妻| 桃花免费在线播放| 亚洲伊人色综图| 亚洲精品色激情综合| videos熟女内射| 五月伊人婷婷丁香| 啦啦啦啦在线视频资源| 大香蕉久久成人网| 熟女人妻精品中文字幕| 街头女战士在线观看网站| 97精品久久久久久久久久精品| 国产黄频视频在线观看| 激情视频va一区二区三区| 亚洲一码二码三码区别大吗| 三级国产精品片| 人成视频在线观看免费观看| 男男h啪啪无遮挡| 永久网站在线| 99久久精品国产国产毛片| 欧美精品人与动牲交sv欧美| 97人妻天天添夜夜摸| 寂寞人妻少妇视频99o| 国产黄色视频一区二区在线观看| a级毛片在线看网站| av线在线观看网站| 香蕉国产在线看| 99久久综合免费| 99久久人妻综合| 日本午夜av视频| 性色av一级| 人人妻人人澡人人看| 成人二区视频| 亚洲精品乱码久久久久久按摩| 热re99久久精品国产66热6| 一级片免费观看大全| 日韩欧美精品免费久久| 人成视频在线观看免费观看| 国产精品嫩草影院av在线观看| 免费av不卡在线播放| 国产精品久久久久久精品电影小说| 国产熟女欧美一区二区| 精品少妇久久久久久888优播| 欧美激情 高清一区二区三区| 伦理电影免费视频| 99re6热这里在线精品视频| 成人漫画全彩无遮挡| 日韩欧美一区视频在线观看| 在线观看美女被高潮喷水网站| 亚洲国产精品999| 久久人人爽av亚洲精品天堂| 人体艺术视频欧美日本| 性色avwww在线观看| 国产精品 国内视频| 97精品久久久久久久久久精品| 精品酒店卫生间| 日本欧美国产在线视频| 纵有疾风起免费观看全集完整版| 国语对白做爰xxxⅹ性视频网站| 欧美精品人与动牲交sv欧美| 欧美日韩av久久| 大陆偷拍与自拍| 99九九在线精品视频| 少妇被粗大的猛进出69影院 | 亚洲精品第二区| 亚洲一区二区三区欧美精品| 国产av国产精品国产| 狠狠婷婷综合久久久久久88av| 精品国产国语对白av| 尾随美女入室| 亚洲欧美清纯卡通| 国产熟女欧美一区二区| 国产乱来视频区| 亚洲一区二区三区欧美精品| 午夜福利视频精品| 日韩av不卡免费在线播放| 亚洲人与动物交配视频| 最新中文字幕久久久久| 韩国精品一区二区三区 | 欧美性感艳星| 亚洲成人av在线免费| 性色avwww在线观看| 看免费成人av毛片| 91精品国产国语对白视频| 女人久久www免费人成看片| 一区二区三区乱码不卡18| 日本-黄色视频高清免费观看| 一级毛片我不卡| 亚洲精品,欧美精品| 人妻系列 视频| 亚洲伊人久久精品综合| 少妇精品久久久久久久| 一本—道久久a久久精品蜜桃钙片| 久久亚洲国产成人精品v| 9色porny在线观看| 久久精品熟女亚洲av麻豆精品| 免费久久久久久久精品成人欧美视频 | 国产一级毛片在线| 超色免费av| 亚洲少妇的诱惑av| 少妇的丰满在线观看| 九九爱精品视频在线观看| 丰满乱子伦码专区| 亚洲国产精品999| 国产精品久久久久成人av| 最近最新中文字幕大全免费视频 | 精品久久久精品久久久| 国产精品一区二区在线观看99| 中文乱码字字幕精品一区二区三区| 寂寞人妻少妇视频99o| 国产精品久久久久久精品电影小说| 日本午夜av视频| 亚洲精品一区蜜桃| 爱豆传媒免费全集在线观看| 国产又色又爽无遮挡免| 天堂8中文在线网| 插逼视频在线观看| 老司机影院成人| 人成视频在线观看免费观看| 韩国精品一区二区三区 | 精品少妇内射三级| 日韩av在线免费看完整版不卡| 国产69精品久久久久777片| 高清黄色对白视频在线免费看| 18禁观看日本| 国产成人免费观看mmmm| 内地一区二区视频在线| 桃花免费在线播放| 欧美97在线视频| 亚洲精品av麻豆狂野| 美女脱内裤让男人舔精品视频| 好男人视频免费观看在线| 婷婷色麻豆天堂久久| 亚洲av综合色区一区| 街头女战士在线观看网站| 欧美97在线视频| 91久久精品国产一区二区三区| 久久久久久久久久人人人人人人| 在线 av 中文字幕| 亚洲欧美精品自产自拍| 久久久久久久国产电影| av片东京热男人的天堂| 亚洲精品一区蜜桃| xxx大片免费视频| 免费少妇av软件| 一区二区三区四区激情视频| 波野结衣二区三区在线| 性色avwww在线观看| 亚洲欧美成人精品一区二区| 国产精品熟女久久久久浪| 日韩av不卡免费在线播放| 亚洲少妇的诱惑av| 国产精品三级大全| 亚洲精华国产精华液的使用体验| 午夜福利影视在线免费观看| 亚洲av日韩在线播放| 99久久精品国产国产毛片| 国产极品粉嫩免费观看在线| 老女人水多毛片| 日韩精品有码人妻一区| 日本91视频免费播放| 精品国产乱码久久久久久小说| kizo精华| 中文字幕av电影在线播放| 欧美人与善性xxx| 亚洲精品国产av成人精品| 亚洲第一区二区三区不卡|