• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于多智能體強化學習的軌道追逃博弈方法

    2022-04-28 11:58:50許旭升黨朝輝袁秋帆肖余之
    上海航天 2022年2期
    關(guān)鍵詞:機動軌道衛(wèi)星

    許旭升,黨朝輝,宋 斌,袁秋帆,肖余之

    (1.上海宇航系統(tǒng)工程研究所,上海 201109;2.西北工業(yè)大學 航天學院,陜西 西安 710109)

    0 引言

    近年來,隨著空間領(lǐng)域科學技術(shù)的迅猛發(fā)展,越來越多的國家開始發(fā)射自己的衛(wèi)星。雖然宇航科學造福的范圍越來越大,但是太空中存在的太空垃圾和失效航天器也越來越多。這些失效航天器大多以第一宇宙速度繼續(xù)在軌。若在軌航天器與這些失效航天器的軌道相交或者重合時,來不及躲避將會產(chǎn)生猛烈的撞擊,嚴重威脅到一些高價值衛(wèi)星和重要空間資源。于是,針對失效航天器的“在軌服務”也開始逐漸在一些航天國家得到重視。美國等國家已經(jīng)開展了針對非合作目標的在軌服務的研究,并進行了一系列實驗。

    在非合作目標的在軌服務研究中,有一類較為重要的問題就是具有機動能力的非合作目標的交會問題。由于非合作目標的機動能力未知,而太空中航天器燃料有限,所以將此類問題可以轉(zhuǎn)換為航天器的追逃博弈問題,逃逸者即為失效航天器,追捕者則為在軌服務衛(wèi)星。在這類問題中考慮到多個衛(wèi)星協(xié)同工作,共同實施對非合作目標的捕獲,因此成為多對一軌道追逃博弈問題。

    針對衛(wèi)星追逃博弈問題,國內(nèi)外學者已經(jīng)進行了深入而廣泛的研究。目前主要以微分對策求解的方法為主。文獻[6]通過將追逃博弈問題轉(zhuǎn)換為高維時變非線性兩點邊值問題,再進行數(shù)值求解的方式得到追逃策略。文獻[7]利用半直接配點法對微分對策博弈過程進行求解,得到相應的數(shù)值解。文獻[8]利用最優(yōu)控制方法,通過求解微分對策的鞍點得到追逃博弈策略。集群追逃博弈問題中,僅知自身狀態(tài)和非合作目標有限狀態(tài),未知非合作目標的未來機動信息和行為策略,且在集群衛(wèi)星之間也難以形成完全狀態(tài)的交流,利用微分博弈的數(shù)值方法求解比較復雜。

    近年來,隨著深度強化學習的興起,有些學者找到了另外一種解決博弈問題的途徑,即利用深度學習的方法對環(huán)境進行建模,然后不斷訓練策略,直至獎勵值達到最優(yōu),完成最優(yōu)博弈策略的求解。以深度強化學習為主的智能算法開始逐漸應用于求解這類復雜問題的過程中,文獻[10]通過構(gòu)建模糊推理模型,將多組并行神經(jīng)網(wǎng)絡的分支深度強化學習架構(gòu)引入到非合作目標追逃博弈策略求解的過程中。文獻[11]利用深度Q網(wǎng)絡(Deep Q-Networks,DQN)和最大最小(MiniMax)算法求取了近距空戰(zhàn)中的最優(yōu)機動策略。文獻[12]將平均場理論與多智能體強化學習算法(Multi-Agent Reinforcement Learning,MARL)相結(jié)合,對無人機集群進行了細粒度任務規(guī)劃。符小衛(wèi)等利用改進的分布式多智能體深度確定性策略梯度算法(Multi-intelligent Deep Deterministic Policy Gradient,MADDPG),驗證了在多無人機協(xié)同對抗快速目標的追逃博弈問題中的協(xié)同圍捕效果。深度學習由于其強大的擬合能力,被廣泛應用于各類追逃博弈問題中。本文將利用MADDPG 算法,對追逃博弈問題展開研究。

    1 問題描述與建模

    1.1 多對一衛(wèi)星追逃博弈問題

    假設(shè)有這樣一類場景,集群衛(wèi)星編隊在正常運行,在相對軌道上有一個非合作目標,該目標對編隊衛(wèi)星構(gòu)成了嚴重的威脅,需要集群衛(wèi)星協(xié)同與該非合作目標進行博弈,最終將其抓捕。而這個過程中就涉及一類博弈問題,即集群衛(wèi)星追逃博弈問題。傳統(tǒng)的方法通常是考慮博弈過程中的時間或燃料消耗,將其轉(zhuǎn)換為非合作目標的最優(yōu)交會問題,或者是利用微分博弈的方法,在假設(shè)對方策略是理性的前提下進行自身最優(yōu)博弈策略的求解。

    本文研究的多對一衛(wèi)星追逃博弈是個動態(tài)的過程,博弈參與者被定義為追捕衛(wèi)星和逃逸衛(wèi)星,博弈雙方具有相反的博弈目標,即追捕衛(wèi)星需要盡力追擊和捕獲逃逸衛(wèi)星,而逃逸衛(wèi)星則需要盡可能地避開和遠離追捕衛(wèi)星。而在這個過程中,涉及衛(wèi)星的許多真實約束,比如追捕衛(wèi)星之間需要協(xié)同好策略,避免相撞,優(yōu)化相互之間的策略,使得燃料消耗等指標實現(xiàn)最優(yōu)。多對一衛(wèi)星博弈場景如圖1所示。

    圖1 多對一衛(wèi)星追逃博弈場景Fig.1 Many-to-one satellite pursuit-evasion game scenario

    圖1 中,P(=1,2,…,)為追捕衛(wèi)星。為方便距離和速度的確定,假設(shè)有一個虛擬衛(wèi)星,此衛(wèi)星的軌道根數(shù)為在博弈開始前的追捕衛(wèi)星的平均軌道根數(shù)。在此衛(wèi)星的相對軌道坐標系下,追捕衛(wèi)星和逃逸衛(wèi)星之間進行博弈,轉(zhuǎn)換為數(shù)學模型如圖2 所示。

    圖2 博弈場景軌道坐標系Fig.2 Orbital coordinate system of the pursuit-evasion game scenario

    在圖2的軌道坐標系下,為逃逸衛(wèi)星的位置,rr,…,r為個追捕衛(wèi)星的位 置,為逃 逸衛(wèi)星的速度,v,v,…,v為個追捕衛(wèi)星的速度。本文針對以上多星追逃博弈問題,構(gòu)造出了集群衛(wèi)星追逃博弈數(shù)學模型。

    在本文研究的追逃博弈問題中,追捕衛(wèi)星需優(yōu)化策略去追擊和捕獲逃逸衛(wèi)星,而逃逸衛(wèi)星則也需要不斷優(yōu)化策略去避開和遠離追捕衛(wèi)星,雙方的博弈構(gòu)成了零和微分博弈問題。但是,在追捕衛(wèi)星之間需要協(xié)調(diào)和配合完成一定的博弈目的,每個追捕衛(wèi)星又相當于一個合作博弈問題,通過對博弈模型建模,利用數(shù)學模型對雙方的博弈策略進行表示。雙方的博弈策略數(shù)學模型如下:

    式中:、J為參與博弈的衛(wèi)星的機動策略代價函數(shù)。

    參與博弈的逃逸衛(wèi)星和每一個追捕衛(wèi)星都根據(jù)代價函數(shù)優(yōu)化自己的策略,目的是使得自己對應的代價函數(shù)最小。由于每一個博弈參與者的博弈策略都會影響到最后的博弈結(jié)果,而在博弈過程中博弈雙方必然需要優(yōu)化自己的策略到達最優(yōu)。因此在進行博弈時,假設(shè)雙方為理性,最終策略將形成納什均衡條件,即:若在博弈過程中有一方策略不是最優(yōu),則另一方博弈成功的概率將會增大。這個過程數(shù)學描述為

    在式(2)中,當一方的衛(wèi)星采用了納什均衡策略下的動作,而對方為非理性策略,即采用納什均衡策略以外的動作,都將使得對方的目標函數(shù)無法取得最優(yōu)。

    因此,在衛(wèi)星追逃博弈模型中,通過求解以上最優(yōu)化問題得到納什均衡策略,從而實現(xiàn)追逃博弈的最優(yōu)機動。

    1.2 衛(wèi)星動力學建模

    在空間多衛(wèi)星追逃博弈過程中,忽略攝動因素,衛(wèi)星滿足基本的二體軌道動力學。在軌道坐標系下,假設(shè)博弈開始前追捕衛(wèi)星圍繞著一顆虛擬參考星運行,而與非合作目標的相對距離遠遠小于參考星軌道運行半徑,由于衛(wèi)星在相對軌道坐標系下運動,所以其動力學模型忽略3階以上小量,可描述為

    衛(wèi)星的機動加速度約束公式如下:

    式中:、為追捕衛(wèi)星和逃逸衛(wèi)星的機動加速度;、為機動能力約束。

    通常情況下,根據(jù)博弈的平衡性考慮,當參加博弈的雙方數(shù)量有差異時,需要在機動能力上平衡,即當>時,<。

    由于本文假定整個追逃博弈過程均在可觀測的參考系軌道下,因此,規(guī)定追捕衛(wèi)星和逃逸衛(wèi)星的博弈機動范圍為

    同時,對博弈結(jié)果也進行相應的定義,由于在追逃博弈問題中,雙方的博弈目的是追捕和逃逸,考慮到衛(wèi)星間交會時速度與位置必須同時一致,否則將會進行碰撞產(chǎn)生損壞,因此,定義博弈中追捕成功的條件為

    式中:第1 部分為追捕衛(wèi)星中的某一顆衛(wèi)星與逃逸衛(wèi)星之間的距離小于等于一定的距離閾值;第2部分為當其中一顆衛(wèi)星與逃逸衛(wèi)星距離最近時,相對速度也小于等于一定的速度閾值。當兩部分同時滿足時,則定義為追捕博弈行為成功;否則,則為逃逸博弈行為成功。

    2 MADDPG 算法

    2.1 強化學習算法

    在本文的多對一衛(wèi)星追逃博弈模型中,將每個衛(wèi)星看作為一個智能體,利用強化學習的方法優(yōu)化策略,最終追捕衛(wèi)星和逃逸衛(wèi)星各自得到其最優(yōu)策略,達到納什均衡狀態(tài)。

    在強化學習模型中,智能體通常通過“感知信息—執(zhí)行動作—獲得獎勵”的方式與環(huán)境進行交互,在這個不斷迭代的過程中進行策略的優(yōu)化學習和訓練。首先,智能體通過接受環(huán)境的信號輸入即環(huán)境狀態(tài);之后根據(jù)狀態(tài)利用自身的策略轉(zhuǎn)化輸出動作a,該動作與環(huán)境交互,產(chǎn)生獎勵r,智能體接受該獎勵并根據(jù)獎勵的值進行調(diào)整自身的策略,以獲得的獎勵值最大為目標,不斷進行迭代;最終優(yōu)化得到自身對于環(huán)境最優(yōu)的策略。

    MARL 是一類基于馬爾可夫決策過程的隨機博弈算法,本質(zhì)過程與單智能體強化學習算法一樣,都是通過不斷地感知信息、輸出動作,獲得獎勵反饋,不斷迭代優(yōu)化的過程,但是MARL 中由于多個智能體共同作用于環(huán)境,因此利用馬爾可夫博弈描述如下:

    式中:為追捕智能體;為逃逸智能體;為模型的環(huán)境狀態(tài)空間;{U}為智能體的動作空間;:××→[0,1]為狀態(tài)轉(zhuǎn)移概率分布;{ρ}:××→R,∈為獎勵函數(shù);為獎勵衰減系數(shù)。

    多智能體算法可以由不同任務進行設(shè)計,比如完全合作、不完全合作、合作對抗等。本文模型中假設(shè)追捕衛(wèi)星和逃逸衛(wèi)星均為智能體,雙方都參與策略的優(yōu)化,追捕衛(wèi)星之間為完全合作,與逃逸衛(wèi)星之間為對抗關(guān)系。

    2.2 MADDPG 算法原理

    由于在多智能強化學習算法中,每個智能體在訓練學習策略的時候,其他智能體的動作未知,將導致環(huán)境非平穩(wěn),因此,當智能體數(shù)量變多時策略往往難以收斂。MADDPG 是一種在多智能體強化學習領(lǐng)域十分受歡迎的算法,各個智能體采用DDPG 的結(jié)構(gòu),同時利用一個全局的“演員-評論家”(Actor-Critic)架構(gòu),使得各個智能體利用“集中訓練,分散執(zhí)行”的方法,尋找到最優(yōu)的聯(lián)合策略。通過這種方式,充分考慮到每個智能體的策略,集中訓練時作為整體進行優(yōu)化,在執(zhí)行的時候各個智能體僅僅利用觀測到的信息進行預測,解決了環(huán)境不平穩(wěn)的問題。

    MADDPG 算法的核心是“集中訓練”的“演員-評論家”結(jié)構(gòu),考慮有個智能體,每個智能體對應有自己的決策網(wǎng)絡,這個決策網(wǎng)絡的輸出就是對應智能體的策略輸出。在進行集中訓練時,各個智能體利用觀測信息通過決策網(wǎng)絡后進行策略輸出對應的動作(π),同時每個智能體利用一個能夠接收全局信息的評價網(wǎng)絡,對智能體決策網(wǎng)絡的輸出進行評估,得到每一個智能體輸出動作對應的值函數(shù)Q。智能體的決策網(wǎng)絡接收該評價信號,進行自身策略π的調(diào)整和優(yōu)化。通過這種方式,每一個智能體的Actor 網(wǎng)絡雖然接收局部觀測信息輸出動作,但是在全局的評價網(wǎng)絡評價校正下,每一個智能體的策略都是將其他智能體考慮在內(nèi)的全局最優(yōu)策略。因此,在訓練完畢最后執(zhí)行的時候,智能體僅僅通過局部觀測信息,而不需要其他智能體的策略就能夠輸出考慮到全局的策略動作,以此達到了分散執(zhí)行時整體最優(yōu)的效果。MADDPG 算法原理如圖3 所示。

    圖3 MADDPG 算法原理圖Fig.3 Schematic diagram of the MADDPG algorithm

    MADDPG作為一種“演員-評論家”(Actor-Critic)結(jié)構(gòu)的MARL,在訓練優(yōu)化參數(shù)時,主要有2 部分組成,一部分是全局Critic 網(wǎng)絡的更新,另一部分是各個智能體決策網(wǎng)絡參數(shù)的優(yōu)化更新。MADDPG 在訓練的時候,每一條經(jīng)驗池中的樣本數(shù)據(jù)包括<,s,,…,a,,…,r>,即當前全局狀態(tài)、動作后全局的狀態(tài)、各智能體的動作與相應的獎勵。

    評價網(wǎng)絡輸入為全局信息的觀測,輸出為各智能體輸出動作的評估,值的計算可以表示為=(s,,…,a,θ),利用獎勵值對評價網(wǎng)絡進行更新如下:

    動作值函數(shù)利用當前時刻估值和動作后獎勵校正后估值的均方差的方式進行更新,相當于全局的中心評價網(wǎng)絡,有效地解決了環(huán)境不平穩(wěn)的問題。

    每個智能體擁有一個接收環(huán)境中狀態(tài)信息輸出動作的策略網(wǎng)絡,在進行訓練時,根據(jù)評價網(wǎng)絡輸出的動作值函數(shù)得到累積期望收益的梯度進行策略參數(shù)的更新??紤]到整體博弈策略是由個智能體的參數(shù)={,,…,θ}形成的策略={,,…,π}組成的,在進行集中訓練時,根據(jù)貝爾曼方程在隨機策略下,每個智能體的累積期望收益(θ)及其梯度? J(θ)為

    由于采用MADDPG 的確定性策略梯度,因此其更新的策略梯度如下:

    通過上述更新過程,在訓練過程中決策網(wǎng)絡和評價網(wǎng)絡同時更新,抽取經(jīng)驗池中的數(shù)據(jù)。當然在算法設(shè)計過程中,雙網(wǎng)絡參數(shù)差分更新等方法不再贅述,最終完成網(wǎng)絡的更新。

    3 基于MADDPG的空間軌道追逃博弈實現(xiàn)

    在軌道追逃博弈過程中,為使得博弈策略完整真實,追捕衛(wèi)星和逃逸衛(wèi)星均可看作為智能體,共同在環(huán)境中進行追逃博弈訓練,最終優(yōu)化得到的策略將能夠充分考慮到對方的策略和機動輸出,實現(xiàn)最優(yōu)的博弈目的。本文基于多智能體深度確定性策略梯度的方法,利用決策-評價網(wǎng)絡結(jié)構(gòu)得到最優(yōu)多個追捕衛(wèi)星的協(xié)同策略,同時,逃逸衛(wèi)星也在訓練中博弈迭代,實現(xiàn)最優(yōu)逃逸策略的求解。而每一個智能體按照相應的指標將優(yōu)化得到其最優(yōu)的策略,相互之間達到了納什均衡。

    最后在實施抓捕目標衛(wèi)星時,只要目標衛(wèi)星的機動方法不是最優(yōu)的策略,將得到更好的博弈效果。

    追逃博弈算法整體方案如圖4 所示。為達到博弈目的,訓練前需要對每個智能體進行獎勵塑造(Reward Shaping)。根據(jù)博弈目的和方法的區(qū)別,分為追捕衛(wèi)星博弈獎勵函數(shù)和逃逸衛(wèi)星博弈獎勵函數(shù)。

    圖4 軌道追逃博弈方法實現(xiàn)原理Fig.4 Method of the orbital pursuit-evasion game method

    首先是追捕衛(wèi)星捕獲成功時的獎勵函數(shù)設(shè)計,規(guī)定捕獲的成功條件為

    式中:第1 部分為追捕衛(wèi)星中的某一顆衛(wèi)星與逃逸衛(wèi)星之間的距離小于等于一定的距離閾值;第2部分為當其中一顆衛(wèi)星與逃逸衛(wèi)星距離最近時,相對速度也小于等于一定的速度閾值,當兩部分同時滿足時,則定義為追捕博弈行為成功。

    為當有其中一個衛(wèi)星捕獲逃逸衛(wèi)星時獲得任務正向獎勵;=-||Δ||為對衛(wèi)星在追捕過程中燃料消耗的懲罰,為了防止追捕時間過長,在獎勵函數(shù)中加入了<0,將時間作為懲罰,讓追捕衛(wèi)星能夠以更快的速度捕獲到逃逸衛(wèi)星,考慮到集群衛(wèi)星在追捕過程中要避免碰撞;

    為當集群衛(wèi)星中相互碰撞后進行負獎勵作為懲罰;同時,由于稀疏獎勵可能產(chǎn)生不容易收斂的問題,利用強化學習獎勵塑造的方法,在博弈過程中增加引導性獎勵;

    為多個智能體衛(wèi)星與逃逸衛(wèi)星的整體距離越小,則獎勵越大;、、、、為各獎勵的權(quán)重系數(shù),可根據(jù)具體任務調(diào)整大小。

    逃逸衛(wèi)星的目的是能夠最大限度地避免被追捕衛(wèi)星捕獲,因此在環(huán)境交互訓練中,逃逸衛(wèi)星每一步的獎勵函數(shù)設(shè)計如下:

    為被捕獲后的懲罰;由于只通過目標獎勵容易造成稀疏獎勵無法收斂,因此根據(jù)強化學習獎勵塑造中目標一致的原則,加入引導獎勵

    隨著與捕獲智能體愈近,給予逃逸衛(wèi)星更大的懲罰;同時加入了時間獎勵>0,表示博弈持續(xù)時間越長,智能體衛(wèi)星得到的獎勵越大;、、分別為捕獲懲罰、引導獎勵、時間懲罰的權(quán)重系數(shù),可針對不同任務進行調(diào)整。

    4 MADDPG 算法

    4.1 強化學習算法

    本文實驗針對同步軌道的集群衛(wèi)星追逃博弈場景進行了設(shè)計。假設(shè)有一個3 衛(wèi)星編隊在軌道高度為42 249 137 m 附近運行(7.270 1×10),在相對坐標系500 m×500 m×500 m 空間內(nèi)(訓練時位置速度隨機設(shè)定)遇到了軌道根數(shù)相似的一顆非合作目標衛(wèi)星,實施追逃博弈方案。

    為了使實驗更具可操作性,設(shè)定逃逸衛(wèi)星機動能力比追捕衛(wèi)星機動能力大,即/=1.2,同時,規(guī)定=10 m,=0.5 m/s 為距離和速度的安全約束,當其中有一個追捕衛(wèi)星靠近了逃逸衛(wèi)星該距離和速度的約束值內(nèi)時,博弈結(jié)束,追捕成功,每次博弈時間上限為1 000 s。由于在相對軌道系下進行博弈訓練,因此在忽略高階項后系統(tǒng)環(huán)境滿足C-W 方程,而在C-W 方程中,耦合較為緊密的是、軸,這也是系統(tǒng)的復雜點,為加快收斂,忽略軸的動力學模型。假設(shè)追捕衛(wèi)星和逃逸衛(wèi)星均在一個軌道面運行,得到一個軌道面內(nèi)二維的博弈場景。

    本文實驗平臺:CPU 為intel-10500,內(nèi)存8 GB×2,顯卡為GTX1660。針對以上場景進行訓練。

    4.2 結(jié)果分析

    通過以上的實驗設(shè)計,在合理調(diào)整獎勵函數(shù)的權(quán)重值,針對簡化后追逃博弈模型進行訓練后,算法達到了收斂。追捕衛(wèi)星整體的獎勵收斂過程效果如圖5 所示。

    圖5 追逃博弈訓練獎勵收斂過程效果Fig.5 Results of the reward convergence process of pursuit-evasion game training

    在圖5 中,隨著博弈的進行和追逃博弈雙方策略的不斷優(yōu)化,獎勵值有3 個階段的變化趨勢與特點:在一開始,博弈雙方策略均未能生成,可以理解為隨機進行博弈獎勵,由于追捕智能體具有數(shù)量優(yōu)勢,因此先找到了一定的聯(lián)合策略進行優(yōu)化,此階段使得追捕智能體獎勵值保持增加;隨著回合的增加,逃逸智能體逐漸利用到了機動性能的優(yōu)勢,開始生成一定的逃逸策略,由于追捕智能體生成的“初級協(xié)同策略”開始失效,使得追捕智能體獎勵函數(shù)值持續(xù)下降;隨著博弈的繼續(xù)進行,追捕智能體逐漸開始針對逃逸智能體優(yōu)化其協(xié)同追捕策略,而逃逸智能體也利用自身機動優(yōu)勢針對追捕智能體的追捕策略進行逃逸策略的優(yōu)化,因此獎勵值在不斷的波動中。最后,雙方的策略在一定范圍內(nèi)實現(xiàn)動態(tài)平衡,得到最優(yōu)或者次最優(yōu)的追捕和逃逸策略。

    各個智能體完成了集中訓練,分散開始執(zhí)行策略時,博弈策略驗證時“涌現(xiàn)”出來了一系列的智能協(xié)同追逃博弈現(xiàn)象,主要有以下4 類,如圖6 所示。

    圖6 “涌現(xiàn)”的智能博弈行為Fig.6 Emergent intelligent pursuit-evasion game behaviors

    1)協(xié)同圍捕。“協(xié)同圍捕”現(xiàn)象在驗證時最為常見,典型特點為多個追捕智能體按照不同方向靠近逃逸智能體,實現(xiàn)對逃逸智能體的“包圍”,通過縮小范圍完成追捕策略。

    2)智能攔截?!爸悄軘r截”的現(xiàn)象多出現(xiàn)在當逃逸智能體在一個方向逃逸機動時,追捕智能體協(xié)同運動至其逃逸方向上,實現(xiàn)攔截,當位置速度小于閾值時使得追捕博弈成功。

    3)合作追逐?!昂献髯分稹钡膱鼍案呖捎^賞性,追捕智能體并不是單單從距離上靠近實現(xiàn)協(xié)同追捕,而是有計劃地在逃逸智能體的其他方向上進行運動干擾,參與追捕博弈的智能體也不單單只是實現(xiàn)追捕的目的,有些智能體是以合作者的身份進行博弈,最終完成協(xié)同追捕任務。

    4)預測潛伏?!邦A測潛伏”為這樣一類場景和策略:當逃逸智能體試圖通過機動優(yōu)勢“飛掠”過追捕智能體時,追捕智能體采取應對策略,先偽裝成其他方向的機動,當逃逸智能體靠近以后,再改變機動方向,實現(xiàn)預測和潛伏的行為,最終實現(xiàn)追捕博弈。

    5 結(jié)束語

    本文面向空間多對一非合作目標追逃博弈場景進行了調(diào)研和分析,通過對博弈場景進行建模,在考慮最短時間、最優(yōu)燃料以及碰撞規(guī)避的情形下進行獎勵函數(shù)的塑造和改進,利用MADDPG 的方法進行集中訓練,得到各個追捕衛(wèi)星和逃逸衛(wèi)星的最優(yōu)追逃策略參數(shù);然后分布式執(zhí)行,使得多個追捕衛(wèi)星和逃逸衛(wèi)星之間能夠完成追逃博弈。仿真結(jié)果表明,該方法能夠完成集群衛(wèi)星對非合作目標的追逃博弈,且能夠利用數(shù)量優(yōu)勢有效地彌補速度劣勢,涌現(xiàn)出“攔截”“圍捕”“潛伏”“捕 獲”等一系列智能博弈行為,有效地實現(xiàn)了博弈的目的,為衛(wèi)星實施多對一非合作目標軌道追逃博弈的方法提供了一定的參考意義。

    猜你喜歡
    機動軌道衛(wèi)星
    miniSAR遙感衛(wèi)星
    裝載機動臂的疲勞壽命計算
    基于單純形法的TLE軌道確定
    CryoSat提升軌道高度與ICESat-2同步運行
    朝美重回“相互羞辱軌道”?
    靜止衛(wèi)星派
    科學家(2019年3期)2019-08-18 09:47:43
    12萬畝機動地不再“流浪”
    當代陜西(2019年12期)2019-07-12 09:12:02
    機動三輪車的昨天、今天和明天
    Puma" suede shoes with a focus on the Product variables
    海上機動之師
    日本av免费视频播放| 久久97久久精品| 精品久久久久久电影网| 亚洲av日韩精品久久久久久密 | 如日韩欧美国产精品一区二区三区| 91成人精品电影| 高清欧美精品videossex| 大片电影免费在线观看免费| 亚洲精品日韩在线中文字幕| 欧美黑人欧美精品刺激| 97在线人人人人妻| 老司机亚洲免费影院| 精品少妇久久久久久888优播| xxx大片免费视频| 丝袜人妻中文字幕| 成人午夜精彩视频在线观看| 天堂俺去俺来也www色官网| 亚洲 欧美一区二区三区| 国产成人精品久久二区二区91 | 男女床上黄色一级片免费看| 天天躁狠狠躁夜夜躁狠狠躁| 国产精品久久久久久精品电影小说| 一级片'在线观看视频| 亚洲av国产av综合av卡| 波野结衣二区三区在线| 国产色婷婷99| 国产精品一二三区在线看| 午夜福利影视在线免费观看| 中文字幕最新亚洲高清| 视频区图区小说| 中文字幕人妻熟女乱码| 黄频高清免费视频| 国产av精品麻豆| 国产成人午夜福利电影在线观看| 精品国产超薄肉色丝袜足j| 好男人视频免费观看在线| 亚洲综合色网址| 这个男人来自地球电影免费观看 | 一级毛片黄色毛片免费观看视频| 老熟女久久久| 91精品国产国语对白视频| 中文字幕色久视频| 国产精品一国产av| 精品国产露脸久久av麻豆| kizo精华| 国产野战对白在线观看| 一级黄片播放器| 99久久综合免费| 丰满乱子伦码专区| 色婷婷av一区二区三区视频| 大香蕉久久成人网| 最近中文字幕2019免费版| 1024香蕉在线观看| 伊人久久国产一区二区| 在线免费观看不下载黄p国产| 在线观看免费高清a一片| 丰满乱子伦码专区| 国产一区二区在线观看av| 日韩大码丰满熟妇| 国产精品av久久久久免费| 亚洲视频免费观看视频| 高清在线视频一区二区三区| 搡老岳熟女国产| 欧美黑人精品巨大| 欧美成人精品欧美一级黄| 国产精品嫩草影院av在线观看| 国产成人av激情在线播放| 精品久久蜜臀av无| 91aial.com中文字幕在线观看| av.在线天堂| 成年人免费黄色播放视频| 久久狼人影院| 日日啪夜夜爽| 飞空精品影院首页| 一二三四在线观看免费中文在| 亚洲欧美一区二区三区久久| 亚洲av电影在线观看一区二区三区| 国产一区二区在线观看av| 国产精品偷伦视频观看了| 大话2 男鬼变身卡| 午夜福利免费观看在线| 亚洲精华国产精华液的使用体验| av在线app专区| 悠悠久久av| 一边摸一边做爽爽视频免费| 美国免费a级毛片| 日本爱情动作片www.在线观看| 国产男女内射视频| 菩萨蛮人人尽说江南好唐韦庄| 欧美日韩成人在线一区二区| 肉色欧美久久久久久久蜜桃| 色94色欧美一区二区| 亚洲在久久综合| 亚洲精品久久成人aⅴ小说| 亚洲图色成人| 久久久久久人妻| 国产欧美日韩一区二区三区在线| 蜜桃国产av成人99| 亚洲av综合色区一区| 国产日韩欧美视频二区| 黄色视频在线播放观看不卡| av不卡在线播放| 国语对白做爰xxxⅹ性视频网站| 啦啦啦在线免费观看视频4| 9色porny在线观看| 伦理电影免费视频| 国产精品欧美亚洲77777| 亚洲av福利一区| 可以免费在线观看a视频的电影网站 | 最近最新中文字幕大全免费视频 | av有码第一页| 视频在线观看一区二区三区| 久久精品人人爽人人爽视色| 精品人妻熟女毛片av久久网站| 亚洲精华国产精华液的使用体验| 国产精品国产av在线观看| 亚洲精品久久成人aⅴ小说| 久久狼人影院| 日韩电影二区| 精品国产一区二区三区四区第35| 国产野战对白在线观看| 日日啪夜夜爽| 国产在线一区二区三区精| 18禁观看日本| 欧美 日韩 精品 国产| 欧美 日韩 精品 国产| 国产精品久久久久久精品古装| 韩国高清视频一区二区三区| 97人妻天天添夜夜摸| 亚洲国产精品成人久久小说| av在线播放精品| 国产亚洲午夜精品一区二区久久| 国产成人精品久久二区二区91 | 午夜免费男女啪啪视频观看| 卡戴珊不雅视频在线播放| 亚洲综合色网址| 考比视频在线观看| www.自偷自拍.com| 国产老妇伦熟女老妇高清| 制服人妻中文乱码| 亚洲免费av在线视频| 又大又爽又粗| 国产成人精品福利久久| 国产精品久久久久久精品古装| 国产在视频线精品| xxxhd国产人妻xxx| svipshipincom国产片| 精品久久久久久电影网| 汤姆久久久久久久影院中文字幕| 人体艺术视频欧美日本| 国产在线视频一区二区| 精品少妇黑人巨大在线播放| 国产欧美亚洲国产| 国产又色又爽无遮挡免| 伊人久久国产一区二区| 亚洲国产欧美日韩在线播放| 亚洲国产精品成人久久小说| 久久99热这里只频精品6学生| 一级片'在线观看视频| 中国国产av一级| 少妇人妻久久综合中文| 一区在线观看完整版| 男的添女的下面高潮视频| 99国产综合亚洲精品| 19禁男女啪啪无遮挡网站| 国产av一区二区精品久久| 精品亚洲成国产av| 欧美日韩亚洲高清精品| 一边摸一边做爽爽视频免费| 国产老妇伦熟女老妇高清| 亚洲欧美清纯卡通| 久久韩国三级中文字幕| 精品一区二区三区av网在线观看 | 成人漫画全彩无遮挡| xxx大片免费视频| 亚洲一卡2卡3卡4卡5卡精品中文| 国产精品人妻久久久影院| 日韩制服骚丝袜av| 最黄视频免费看| 婷婷色麻豆天堂久久| 交换朋友夫妻互换小说| 久久精品国产亚洲av高清一级| 伦理电影大哥的女人| av.在线天堂| 人体艺术视频欧美日本| www.av在线官网国产| 人妻一区二区av| 赤兔流量卡办理| av视频免费观看在线观看| 国产精品蜜桃在线观看| 午夜激情av网站| 久久精品亚洲熟妇少妇任你| 男女边吃奶边做爰视频| 成人黄色视频免费在线看| 日韩一卡2卡3卡4卡2021年| av免费观看日本| 大香蕉久久成人网| 男女边摸边吃奶| 亚洲av国产av综合av卡| 国产精品 国内视频| 亚洲第一青青草原| 国产乱人偷精品视频| 天堂中文最新版在线下载| 国产亚洲一区二区精品| 亚洲四区av| 亚洲国产最新在线播放| av女优亚洲男人天堂| 久久精品亚洲熟妇少妇任你| 9191精品国产免费久久| 亚洲精品久久午夜乱码| 国产激情久久老熟女| 啦啦啦在线观看免费高清www| 日韩精品有码人妻一区| 亚洲精品乱久久久久久| 国产精品无大码| 超色免费av| 亚洲av中文av极速乱| 交换朋友夫妻互换小说| 成年美女黄网站色视频大全免费| 天天添夜夜摸| 90打野战视频偷拍视频| 中文字幕另类日韩欧美亚洲嫩草| videosex国产| 波野结衣二区三区在线| 精品人妻熟女毛片av久久网站| 熟女av电影| 宅男免费午夜| avwww免费| 91成人精品电影| 久久久欧美国产精品| 青春草视频在线免费观看| 日本91视频免费播放| 国产又爽黄色视频| 在线观看一区二区三区激情| 涩涩av久久男人的天堂| 天天躁夜夜躁狠狠躁躁| 精品国产一区二区三区四区第35| 天天躁狠狠躁夜夜躁狠狠躁| 国产日韩欧美亚洲二区| 午夜福利视频在线观看免费| 日韩一区二区视频免费看| 一区福利在线观看| 国产日韩欧美在线精品| 国产毛片在线视频| 午夜免费男女啪啪视频观看| 亚洲精品久久成人aⅴ小说| 亚洲国产毛片av蜜桃av| 国产乱人偷精品视频| 国产精品蜜桃在线观看| 精品国产超薄肉色丝袜足j| av女优亚洲男人天堂| 美国免费a级毛片| 最近2019中文字幕mv第一页| 欧美人与性动交α欧美软件| 午夜日韩欧美国产| 国产日韩一区二区三区精品不卡| 操出白浆在线播放| 久久免费观看电影| 免费观看人在逋| 免费观看人在逋| 丝袜美腿诱惑在线| 久久国产精品大桥未久av| 大陆偷拍与自拍| 久久av网站| 99精国产麻豆久久婷婷| 亚洲av电影在线进入| 一级毛片黄色毛片免费观看视频| 波野结衣二区三区在线| 五月开心婷婷网| 岛国毛片在线播放| 亚洲av日韩精品久久久久久密 | 如日韩欧美国产精品一区二区三区| 这个男人来自地球电影免费观看 | 欧美人与善性xxx| 亚洲成色77777| 美女高潮到喷水免费观看| 伦理电影大哥的女人| 国产精品久久久人人做人人爽| 一级爰片在线观看| 精品人妻在线不人妻| 精品酒店卫生间| 日韩,欧美,国产一区二区三区| 久久天躁狠狠躁夜夜2o2o | 国产欧美日韩综合在线一区二区| 人人妻人人澡人人爽人人夜夜| 宅男免费午夜| 中文欧美无线码| 99精品久久久久人妻精品| 99久久精品国产亚洲精品| 两性夫妻黄色片| 亚洲色图 男人天堂 中文字幕| www.精华液| 两个人看的免费小视频| 啦啦啦在线免费观看视频4| av电影中文网址| av女优亚洲男人天堂| 久热爱精品视频在线9| 亚洲精品中文字幕在线视频| 国产精品久久久久久精品古装| 日韩精品免费视频一区二区三区| 赤兔流量卡办理| 91精品三级在线观看| 国产男女超爽视频在线观看| 久久精品人人爽人人爽视色| 看十八女毛片水多多多| 日韩一区二区视频免费看| 国产亚洲av片在线观看秒播厂| 精品亚洲成国产av| 久久婷婷青草| 亚洲中文av在线| 天天躁夜夜躁狠狠久久av| 十分钟在线观看高清视频www| 老司机影院成人| 午夜激情av网站| 男人舔女人的私密视频| 纯流量卡能插随身wifi吗| 国产探花极品一区二区| 亚洲一码二码三码区别大吗| 欧美精品一区二区免费开放| 久久久久国产一级毛片高清牌| 一边亲一边摸免费视频| 亚洲av电影在线观看一区二区三区| 啦啦啦在线免费观看视频4| 我要看黄色一级片免费的| av女优亚洲男人天堂| 建设人人有责人人尽责人人享有的| 女人爽到高潮嗷嗷叫在线视频| 少妇 在线观看| 免费看av在线观看网站| 国产精品麻豆人妻色哟哟久久| 日韩,欧美,国产一区二区三区| 肉色欧美久久久久久久蜜桃| 午夜av观看不卡| 国产成人啪精品午夜网站| 啦啦啦视频在线资源免费观看| 国产黄色视频一区二区在线观看| 精品亚洲成a人片在线观看| 人妻一区二区av| 大香蕉久久网| 欧美精品人与动牲交sv欧美| 别揉我奶头~嗯~啊~动态视频 | 成年动漫av网址| 一区福利在线观看| 久久久国产精品麻豆| 汤姆久久久久久久影院中文字幕| 日本一区二区免费在线视频| 亚洲精品国产一区二区精华液| 两个人看的免费小视频| 亚洲欧美中文字幕日韩二区| 亚洲成人免费av在线播放| 精品亚洲成国产av| 欧美老熟妇乱子伦牲交| 香蕉国产在线看| av网站在线播放免费| 国产精品偷伦视频观看了| 欧美日韩一级在线毛片| 久久精品亚洲av国产电影网| 交换朋友夫妻互换小说| 国产一区二区在线观看av| 国产高清国产精品国产三级| av国产久精品久网站免费入址| 我要看黄色一级片免费的| 中文乱码字字幕精品一区二区三区| 国产精品久久久久久久久免| 欧美精品高潮呻吟av久久| 妹子高潮喷水视频| 男女无遮挡免费网站观看| 男女下面插进去视频免费观看| 国产一区二区三区av在线| svipshipincom国产片| 人人妻人人添人人爽欧美一区卜| 免费在线观看视频国产中文字幕亚洲 | 秋霞伦理黄片| 90打野战视频偷拍视频| 亚洲av中文av极速乱| 黑人欧美特级aaaaaa片| 国产 精品1| 丁香六月天网| 在线精品无人区一区二区三| 中文天堂在线官网| 日韩精品有码人妻一区| 人妻人人澡人人爽人人| 一个人免费看片子| 色94色欧美一区二区| 黄片无遮挡物在线观看| 国产激情久久老熟女| 国产精品一二三区在线看| 在线观看一区二区三区激情| 精品人妻熟女毛片av久久网站| 欧美在线一区亚洲| 大片电影免费在线观看免费| 精品亚洲乱码少妇综合久久| 午夜福利,免费看| 久久99一区二区三区| 男女边吃奶边做爰视频| 黄色视频在线播放观看不卡| 欧美av亚洲av综合av国产av | 爱豆传媒免费全集在线观看| 久久 成人 亚洲| 国产爽快片一区二区三区| 夫妻性生交免费视频一级片| 日韩伦理黄色片| 久久青草综合色| 亚洲欧美日韩另类电影网站| 丝瓜视频免费看黄片| 波野结衣二区三区在线| 色精品久久人妻99蜜桃| 国产精品人妻久久久影院| 亚洲婷婷狠狠爱综合网| 国产日韩欧美视频二区| 亚洲久久久国产精品| 精品国产一区二区久久| 夫妻午夜视频| 毛片一级片免费看久久久久| 国产一级毛片在线| 久久天堂一区二区三区四区| 天天操日日干夜夜撸| 国产97色在线日韩免费| 久久久久国产精品人妻一区二区| 午夜免费观看性视频| 欧美日韩一区二区视频在线观看视频在线| 最黄视频免费看| 欧美另类一区| 久久久久国产精品人妻一区二区| 国产一区有黄有色的免费视频| 亚洲成av片中文字幕在线观看| 亚洲激情五月婷婷啪啪| 日韩中文字幕视频在线看片| 久久国产亚洲av麻豆专区| 午夜福利在线免费观看网站| 纵有疾风起免费观看全集完整版| 国产麻豆69| 人妻人人澡人人爽人人| 99久久人妻综合| a级毛片在线看网站| 成人国语在线视频| 精品卡一卡二卡四卡免费| 美女视频免费永久观看网站| 久久天堂一区二区三区四区| 国产熟女午夜一区二区三区| 中文字幕最新亚洲高清| 欧美日韩av久久| 美女中出高潮动态图| 大陆偷拍与自拍| av福利片在线| 啦啦啦视频在线资源免费观看| 青春草国产在线视频| 午夜免费观看性视频| 天堂中文最新版在线下载| 国产国语露脸激情在线看| 看免费av毛片| 久久久精品区二区三区| 久久天堂一区二区三区四区| 十八禁网站网址无遮挡| 青草久久国产| 久久久国产一区二区| av电影中文网址| 熟女av电影| 男女边摸边吃奶| 国产激情久久老熟女| 国产精品熟女久久久久浪| 涩涩av久久男人的天堂| 老鸭窝网址在线观看| 免费久久久久久久精品成人欧美视频| 亚洲欧美清纯卡通| 国产野战对白在线观看| 波野结衣二区三区在线| 日韩伦理黄色片| 久久97久久精品| 一个人免费看片子| 久久国产精品大桥未久av| av免费观看日本| 亚洲av电影在线观看一区二区三区| 在现免费观看毛片| 国产成人一区二区在线| 最近最新中文字幕大全免费视频 | 啦啦啦 在线观看视频| 亚洲av福利一区| 亚洲三区欧美一区| 成人毛片60女人毛片免费| 亚洲色图综合在线观看| 精品视频人人做人人爽| 亚洲国产av新网站| 国产人伦9x9x在线观看| 国产精品久久久久久久久免| 久久精品国产亚洲av涩爱| 午夜av观看不卡| 国产精品 欧美亚洲| 黄网站色视频无遮挡免费观看| 九草在线视频观看| 国产一区二区在线观看av| 欧美乱码精品一区二区三区| 午夜免费观看性视频| a级毛片在线看网站| 国产高清国产精品国产三级| 国产精品国产三级国产专区5o| 国产精品国产av在线观看| 亚洲av欧美aⅴ国产| 天天躁日日躁夜夜躁夜夜| 国产在线一区二区三区精| 亚洲第一区二区三区不卡| 国产成人啪精品午夜网站| 免费看av在线观看网站| 国产av一区二区精品久久| 日韩一本色道免费dvd| 精品一区二区三区av网在线观看 | 欧美日韩视频高清一区二区三区二| 久久精品国产a三级三级三级| 十八禁人妻一区二区| 超碰成人久久| av有码第一页| 制服人妻中文乱码| 成人午夜精彩视频在线观看| 成人国产av品久久久| 久久综合国产亚洲精品| 精品亚洲乱码少妇综合久久| 亚洲美女黄色视频免费看| 9热在线视频观看99| 国产av精品麻豆| 久久 成人 亚洲| 欧美人与善性xxx| 久久久久精品国产欧美久久久 | 久久久久精品国产欧美久久久 | 老汉色av国产亚洲站长工具| 亚洲熟女精品中文字幕| 国产99久久九九免费精品| av线在线观看网站| 久久精品国产亚洲av高清一级| www.熟女人妻精品国产| 中文字幕制服av| 成人亚洲精品一区在线观看| 日韩成人av中文字幕在线观看| 18禁观看日本| 国产成人精品无人区| 亚洲情色 制服丝袜| 18禁国产床啪视频网站| 中国三级夫妇交换| 中文乱码字字幕精品一区二区三区| 亚洲精品久久成人aⅴ小说| 国产亚洲欧美精品永久| 天堂俺去俺来也www色官网| 亚洲av日韩精品久久久久久密 | 波多野结衣av一区二区av| 久久女婷五月综合色啪小说| 色视频在线一区二区三区| 老熟女久久久| 中文字幕人妻丝袜一区二区 | 一本大道久久a久久精品| 少妇精品久久久久久久| 最近最新中文字幕大全免费视频 | 18禁国产床啪视频网站| 久久久亚洲精品成人影院| av天堂久久9| 18禁观看日本| 久久精品国产亚洲av高清一级| 免费av中文字幕在线| avwww免费| 人人妻人人澡人人看| 97精品久久久久久久久久精品| 这个男人来自地球电影免费观看 | 国产精品免费视频内射| 国产精品一区二区在线观看99| 啦啦啦视频在线资源免费观看| 国产成人系列免费观看| 国产 一区精品| 欧美乱码精品一区二区三区| 国产有黄有色有爽视频| 欧美国产精品一级二级三级| 婷婷色av中文字幕| 国产精品.久久久| 女人精品久久久久毛片| 精品人妻一区二区三区麻豆| 老鸭窝网址在线观看| 青青草视频在线视频观看| 久久久久久久国产电影| 18在线观看网站| 侵犯人妻中文字幕一二三四区| 老司机影院毛片| 亚洲情色 制服丝袜| 妹子高潮喷水视频| 看免费成人av毛片| 色综合欧美亚洲国产小说| 免费看av在线观看网站| 国产探花极品一区二区| 亚洲国产精品一区三区| 十八禁高潮呻吟视频| 日韩人妻精品一区2区三区| 在线 av 中文字幕| 亚洲久久久国产精品| 十分钟在线观看高清视频www| 99久久99久久久精品蜜桃| 精品人妻一区二区三区麻豆| 精品免费久久久久久久清纯 | 亚洲熟女毛片儿| 色94色欧美一区二区| av网站在线播放免费| 国产免费又黄又爽又色| 国产精品无大码| 欧美 亚洲 国产 日韩一| 热99久久久久精品小说推荐| 免费av中文字幕在线| 久久久久久人妻| 老鸭窝网址在线观看| 国产成人免费无遮挡视频| 黄色一级大片看看| 午夜久久久在线观看| 久久久久久久国产电影| 亚洲国产精品一区二区三区在线| 一本大道久久a久久精品| 黄片小视频在线播放| 亚洲伊人久久精品综合| 国产亚洲av高清不卡| 最新的欧美精品一区二区| 丰满少妇做爰视频| 亚洲国产精品999|