• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于強化學習的體系對抗仿真戰(zhàn)役層次指控算法

    2018-08-23 03:08:04閆雪飛李新明劉德生
    計算機工程與科學 2018年8期
    關(guān)鍵詞:藍方紅方差分

    閆雪飛,李新明,劉 東,劉德生,李 強

    (裝備學院復雜電子系統(tǒng)仿真實驗室,北京 101416)

    1 引言

    海灣戰(zhàn)爭以來,體系SoS(System-of Systems)作戰(zhàn)成為主要的作戰(zhàn)方式,武器裝備體系WSoS(Weapon equipment SoS)[1,2]成為各國軍隊發(fā)展的主要立足點,尤其是網(wǎng)絡(luò)信息體系頂層架構(gòu)的提出,進一步表明了體系支撐作戰(zhàn)的重要性。然而,作為一個典型的復雜系統(tǒng),WSoS的不確定性、復雜性以及巨量性使得作戰(zhàn)仿真研究面臨巨大的挑戰(zhàn),目前,針對WSoS的作戰(zhàn)仿真研究[3,4]還遠未達到成熟的地步。

    指揮與控制C2(Command and Control)是作戰(zhàn)仿真研究的一項核心技術(shù),也是影響戰(zhàn)爭勝負的重要因素。傳統(tǒng)的C2研究主要集中于戰(zhàn)術(shù)層次,屬于微觀層面,這是由于戰(zhàn)術(shù)層次的實體行為模型較易建立,武器平臺的運用規(guī)則相對簡單,不確定性相對較小,流程相對固定[5]。而戰(zhàn)役層次的C2研究則很少見諸文獻,這是由于戰(zhàn)役層次的C2行為屬于宏觀層次,考慮的對象不再是單個作戰(zhàn)實體,而是多個作戰(zhàn)單元,不僅要考慮我方兵力分布,還要考慮敵方態(tài)勢信息,既跨物理域,又跨信息域、認知域,涉及的范圍更廣、考慮的因素更多,一直以來都是作戰(zhàn)仿真研究領(lǐng)域的難點。

    人工智能的迅猛發(fā)展,尤其是令人矚目的谷歌AlphaGo在圍棋領(lǐng)域取得的重要突破,表明了基于機器學習的C2建模的可行性。AlphaGo推動了兩項與人工智能相關(guān)的技術(shù):神經(jīng)網(wǎng)絡(luò)技術(shù)以及強化學習RL(Reinforcement Learning)技術(shù)。神經(jīng)網(wǎng)絡(luò)是一種有效的復雜問題離散表示方法[6,7],而RL則相當于不確定性環(huán)境中的訓練樣本,兩者結(jié)合具有巨大的發(fā)展?jié)摿?,是作?zhàn)仿真C2研究的主要發(fā)展趨勢。為此,針對WSoS作戰(zhàn)仿真具有的不確定性、復雜性特點,以及戰(zhàn)役層次C2認知行為的實際條件,本文以GRBF(Gauss Radial Basis Function)神經(jīng)網(wǎng)絡(luò)作為指揮Agent認知域的離散模型,基于RL技術(shù)驅(qū)動神經(jīng)網(wǎng)絡(luò)的進化,提出了基于RL的SoS對抗仿真戰(zhàn)役層次C2算法,并對算法的可行性以及性能進行了作戰(zhàn)仿真研究,以期為WSoS戰(zhàn)役層次的認知決策技術(shù)提供一種有效的解決途徑,也為未來WSoS的智能化C2研究進行一定的初步探索。

    2 相關(guān)研究

    目前,常用的針對作戰(zhàn)Agent認知決策的主要技術(shù)包括三種方法:一種是個性優(yōu)化;另一種是Rule-based算法,對應(yīng)于反應(yīng)型Agent;第三種是基于BDI(Belief Desire Intention)的認知型Agent,如表1所示??梢钥闯觯捎赪SoS的Agent數(shù)目更多、組成要素與內(nèi)部結(jié)構(gòu)更加復雜、不確定性更高,使得傳統(tǒng)的決策算法已經(jīng)不能有效適用于復雜WSoS的認知決策研究。RL作為一種無師在線決策技術(shù),在無需任何先驗知識的情況下即可實現(xiàn)對未知環(huán)境的學習,對不確定環(huán)境具有自適應(yīng)能力,因此被廣泛用于復雜環(huán)境的作戰(zhàn)Agent自主決策研究[8]。楊萍等[9]將強化學習引入智能體模糊戰(zhàn)術(shù)機動決策模型中,有效地解決了馬爾科夫決策過程狀態(tài)轉(zhuǎn)移規(guī)律難以獲得時的模型求解問題;馬耀飛等[6]基于強化學習對戰(zhàn)術(shù)層面仿真航空兵的空戰(zhàn)機動決策問題進行了研究;徐安等[7]基于RBF(Radial Basis Function)神經(jīng)網(wǎng)絡(luò)和Q-learning算法對飛行器三維空間的隱蔽接敵策略進行了學習研究。上述研究為RL在體系對抗仿真中的應(yīng)用提供了一個良好的開端,但也存在一些明顯不足:大部分研究針對的并非是體系對抗情形,且以戰(zhàn)術(shù)層次為主;部分針對對抗決策的情景比較簡單,與實際戰(zhàn)爭中的多回合連續(xù)對抗樣式區(qū)別較大。

    Table 1 Traditional cognition and decision algorithms for the battle Agent

    鑒于RL算法對未知空間的自適應(yīng)優(yōu)勢,本文提出一種基于改進Q-learning的面向體系對抗的戰(zhàn)役層次認知決策算法,基于跨步差分學習解決單步差分學習用于時間離散指控Agent認知時序存在的兩個顯著問題。此外,為了解決指揮Agent的不確定性問題,傳統(tǒng)的RL認知決策算法的做法是在整個作戰(zhàn)回合結(jié)束后再進行Q函數(shù)的信度分配,效率較低。例如,楊克巍等[10]對基于半自治作戰(zhàn)Agent的Profit-sharing增強學習進行的實驗研究。因此,跨步差分的另一個優(yōu)點是將整個作戰(zhàn)回合分為多個有效的學習階段,當滿足一定的條件后,即進行Q函數(shù)的差分學習,進而提高了學習效率。

    Figure 1 UML framework of the WSoS architecture based on AOP圖1 基于AOP的WSoS UML結(jié)構(gòu)框架

    3 問題描述

    3.1 武器裝備體系組成架構(gòu)

    目前針對體系的相關(guān)實驗研究均以自行組合構(gòu)造為主[11],在對文獻[12]體系架構(gòu)發(fā)展的基礎(chǔ)上,設(shè)計的基于AOP(Agent Oriented Programming)的WSoS UML框圖如圖1所示。其中箭頭上面的數(shù)字含義表示所指Agent的數(shù)目,1代表1個,1..*代表1個或者多個,0..*代表0個或者多個,例如1個武器裝備體系由多個Agent組成。該框架設(shè)計的基本初衷一方面是為了盡可能囊括現(xiàn)實世界中各種類型的裝備,另一方面是為了給武器裝備體系的復雜特征[11]提供一個衍生基礎(chǔ),例如修復Agent和補給Agent對于體系的演化性具有重要的影響。

    此外,該框架與最新提出的網(wǎng)絡(luò)信息體系NISoS(Network Information SoS)架構(gòu)相契合,其中,通信Agent(CCAgent)可組成NISoS中的基礎(chǔ)網(wǎng),感知Agent(SCAgent)可組成NISoS中的感知網(wǎng),打擊Agent(ATAgent)可組成NISoS中的火力網(wǎng),補給Agent(SUAgent)以及修復Agent(RPAgent)可組成NISoS中的保障網(wǎng),指揮Agent(CMAgent)可組成NISoS中的決策網(wǎng),進而可為NISoS的作戰(zhàn)仿真研究提供一個實驗參考。

    3.2 作戰(zhàn)仿真原型系統(tǒng)及作戰(zhàn)想定

    為了實現(xiàn)WSoS的作戰(zhàn)仿真研究,基于Java語言自主開發(fā)了一款作戰(zhàn)仿真原型系統(tǒng),并為不同種類的Agent構(gòu)建了3D幾何模型用于可視化分析。原型系統(tǒng)采用分布式進程調(diào)度架構(gòu),離散時間仿真協(xié)議進行設(shè)計開發(fā),共包含6種類型的Agent,對應(yīng)于WSoS的結(jié)構(gòu)框架,其中CCAgent、SCAgent、ATAgent、SUAgent、RPAgent通過系統(tǒng)提供的項目編輯界面進行參數(shù)的編輯并添加到仿真體系,而CMAgent根據(jù)體系的層次結(jié)構(gòu)由系統(tǒng)自動添加,其依據(jù)是為每個編隊設(shè)計一個CMAgent。原型系統(tǒng)的物理作戰(zhàn)空間是按照Java 3D標準定制的100×100(m2)的三維幾何地圖,在作戰(zhàn)開始時,紅藍雙方的兵力被分別自動部署在地圖的左右兩側(cè),當仿真開始后,雙方會相向運動,直到在中間區(qū)域遭遇并展開對抗。其中,戰(zhàn)術(shù)層次的決策行為相對簡單,可采用有限狀態(tài)機實現(xiàn)。而CMAgent隸屬于戰(zhàn)役層次,負責對所屬Agent的宏觀指揮與控制,決策行為比較復雜,是論文研究的重點。

    3.3 指揮Agent的認知域描述

    由于系統(tǒng)基于時間離散模型進行調(diào)度,因此CMAgent的決策行為是以仿真時鐘為單位進行的,其主要目的是在當前感知態(tài)勢的基礎(chǔ)上進行決策,其認知域描述如表2所示,考慮到RPAgent的量少(通常紅藍雙方各有一個),故忽略其影響。圖2為CMAgent的決策行動原理示意圖,其中的Agent代表的是紅方的一個編隊,只有一個CMAgent,而其他類型的Agent則不止一個,這些戰(zhàn)術(shù)層Agent會始終與CMAgent分別保持在一個固定的距離之內(nèi)??梢钥闯?,前進行動的原理比較直觀,對于進攻行動,作戰(zhàn)Agent會根據(jù)CMAgent發(fā)送的優(yōu)先打擊目標執(zhí)行相應(yīng)的逼近行動;而對于撤退行動,CMAgent會首先根據(jù)敵我數(shù)目對比計算出前、后、左、右四個方向的敵軍力量,例如OL-EL=-10代表左方敵軍比友軍多10個,最終,根據(jù)計算結(jié)果,CMAgent會決定向右方移動。

    圖2中,O為友軍Agent數(shù)目,E為敵軍Agent數(shù)目,L代表左方,R代表右方,F(xiàn)代表前方,B代表后方。

    3.4 指揮Agent認知行為假設(shè)

    如果將CMAgent的態(tài)勢信息作為狀態(tài)空間S={s1,s2,…,sn},將可采取的決策指令作為行為集合A={a1,a2,…,am},則CMAgent的認知可以視為從S到A的一個映射,即f(s)→a,其中s∈S,a∈A,在RL領(lǐng)域中,通常將其稱為一個策略π,而最合理的映射即對應(yīng)于RL領(lǐng)域中的最優(yōu)策略為π*。由于仿真進程是以仿真時鐘為單位向前推進的,因此CMAgent的認知行為也是以仿真時鐘為單位,即在每一個仿真時鐘步t,CMAgent都會根據(jù)當前狀態(tài)st選擇一個合理的行為at,進而完成一次決策。在WSoS框架基礎(chǔ)上,結(jié)合RL算法的概念以及作戰(zhàn)實際情形,對CMAgent認知行為的六條假設(shè)如表3所示。

    Table 3 Hypothesis of the cognition anddecision actions for the CMAgent

    Table 2 Description of the cognition domain of the CMAgent

    Figure 2 Principle diagram of the decision actions for the CMAgent圖2 指揮Agent的決策行動原理示意圖

    可以看出,CMAgent認知過程的不確定性、隨機性和未知性均要高于其他應(yīng)用領(lǐng)域,僅能根據(jù)自身的有限信息進行策略的學習。

    4 跨步差分Q-leaning認知決策算法

    4.1 參數(shù)的歸一化

    為了壓縮參數(shù)空間,也為了使學習成果更具一般性,需要首先對用到的學習參數(shù)進行歸一化,其意義類似于流體力學中的無量綱化,這對實驗結(jié)果至關(guān)重要。主要包括狀態(tài)空間參數(shù)的歸一化以及獎賞參數(shù)的歸一化。狀態(tài)空間的歸一化公式如下所示:

    (1)

    其中,δ是一個極小值,其意義是避免除零,根據(jù)歸一化公式,CMAgent的狀態(tài)空間可由四維參數(shù)向量(Nc,Nsc,Nsu,Na)表示。獎賞信息的歸一化公式為:

    .5∈(-0.5,0.5)

    (2)

    其中,KE為殺死敵軍數(shù)目,KO為死亡友軍數(shù)目,δ的意義同前??梢钥闯觯攔>0時,CMAgent得到的是正獎賞,當r<0時,CMAgent得到的是負獎賞,獎賞的好壞一目了然。通過以上對學習參數(shù)的歸一化處理,使得學習數(shù)據(jù)更具普遍性和可比性。

    4.2 基于GRBF神經(jīng)網(wǎng)絡(luò)的狀態(tài)空間離散

    傳統(tǒng)的Q函數(shù)采用表格進行狀態(tài)空間的離散,然而,當狀態(tài)空間是連續(xù)的且維數(shù)較多時,表格離散法會面臨“分割難題”,并且學習效率較低??紤]到GRBF神經(jīng)網(wǎng)絡(luò)的離散性能以及泛化能力,可以采用GRBF神經(jīng)網(wǎng)絡(luò)對Q函數(shù)進行離散[6,7]。所謂泛化能力是指即使某個樣本沒有學習,GRBF神經(jīng)網(wǎng)絡(luò)也能估計其輸出,而這是表格離散法不能做到的,其網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。由圖3可知,GRBF神經(jīng)網(wǎng)絡(luò)由四層組成,第一層為輸入層,第二層為離散層,第三層為隱含層,第四層為輸出層。其中,離散層的等寬離散公式如下所示:

    (3)

    Figure 3 Discretization of the Q table based on the GRBF neural network圖3 基于GRBF神經(jīng)網(wǎng)絡(luò)的Q離散

    可以算出,輸入狀態(tài)空間的樣本數(shù)目最大為54=625個,可以想象采用傳統(tǒng)離散方法的復雜性,其輸出層輸出的是對應(yīng)動作的Q值,共有7個動作,其計算公式為:

    (4)

    (5)

    其中,徑向基函數(shù)bi(s)的計算公式如下所示:

    ,i=1,2,…,m

    (6)

    其中,ci是第i個基函數(shù)的中心,與s具有相同的維度,σi是第i個基函數(shù)的寬度,m是隱含層的個數(shù),‖s-ci‖為輸入狀態(tài)與基函數(shù)中心的歐氏距離。

    4.3 基于TD公式的跨步差分迭代

    Q-learning利用時間差分TD(Temporal Difference)公式直接估計狀態(tài)-動作(s-a)對的期望值,采用Q*(s,a)表示,對應(yīng)于行為選擇策略π*。假設(shè)Q*(s,a)的當前估計值用Q(s,a)表示,下一時刻的值用Vt(s)來表示,根據(jù)TD公式有:

    Qt(s,a)=Qt-1(s,a)+αtVt(s)-Qt-1(s,a)

    (7)

    Qt(s,a)=Qt-1(s,a)+

    (8)

    其中t表示當前仿真時鐘步,αt表示學習速率。可以看出,Q-learning的迭代公式采用的是單步差分公式,即在每個時間步都進行Q表(狀態(tài)-動作對表格)的學習。而實際上,對于基于WSoS對抗仿真的戰(zhàn)役層次指揮Agent認知決策問題,有兩個顯著的特點:一是指揮Agent的狀態(tài)并非在每個時間步都會發(fā)生變遷,往往連續(xù)多個仿真時鐘步都是同一個狀態(tài),即st=st-m;二是單步獎賞值rt非常小甚至趨于零,即Agent在st時采取一個動作at后沒有收到任何回報,因此也就無法對Qt(s,a)的好壞進行評價??赏ㄟ^某次仿真的某指揮Agent認知過程時序圖進一步印證這兩個特點,如圖4所示,其中X軸為仿真時刻,Y軸為狀態(tài)編號,Z軸為獎賞值。

    Figure 4 Time sequence change of the cognition domain of the CMAgent for a battle simulation圖4 某次作戰(zhàn)仿真的CMAgent認知域時序變化圖

    由圖4可以看出,狀態(tài)不變或者單步獎賞值為零的時刻居多,并且狀態(tài)與獎賞值變化之間沒有絕對關(guān)聯(lián),狀態(tài)變化獎賞值不一定變化,獎賞值變化狀態(tài)不一定變化??紤]到這兩種特殊情況,一是狀態(tài)未改變,二是獎賞值為零,均不適合進行差分學習,反而會造成計算資源的浪費,為此,提出跨步時間差分STD(Stride Temporal Difference)的Q-leaning迭代公式,即用于Q值更新的獎賞值不是單步獎賞,而是未來N步的累積獎賞值R,相應(yīng)地,Q表不會立即更新,而是當R大于一定的閾值R′或者狀態(tài)發(fā)生改變后再進行更新。采用STD-Q不僅能夠解決上述問題,而且能夠提高仿真效率,同時能夠增強學習信號,使針對Q(s,a)的估計也更加準確,尤其是對于不確定性極高的體系對抗環(huán)境。

    假設(shè)Vt-m(st-m)是t-m時刻狀態(tài)st-m對應(yīng)的新的Q*值,根據(jù)TD公式,可得Q函數(shù)在t時刻的更新公式如下所示:

    Qt(st,a)=Qt-m(st-m,a)+

    αtVt-m(st-m)-Qt-m(st-m,a)

    (9)

    又由于在Q表更新之前:

    Vt-m(st-m)=rt-m+γVt-m+1(st-m+1)

    Vt-m+1(st-m+1)=rt-m+1+γVt-m+2(st-m+2)

    ?

    Vt-1(st-1)=rt-1+γVt(st)

    則有:

    Vt-m(st-m)=rt-m+γVt-m+1(st-m+1)=

    rt-m+γ[rt-m+1+γVt-m+2(st-m+2)]=

    rt-m+γrt-m+1+γ2Vt-m+2(st-m+2)=

    rt-m+γrt-m+1+γ2[rt-m+2+γVt-m+3(st-m+3)]=

    rt-m+γrt-m+1+γ2rt-m+2+γ3Vt-m+3(st-m+3)=…=

    rt-m+γrt-m+1+γ2rt-m+2+…+γm-1rt-1+

    γmVt(st)=rt-m+γrt-m+1+γ2rt-m+2+…+

    (10)

    將式(10)代入式(9)得到最終的STD-Q函數(shù)更新公式如下所示:

    (11)

    Figure 5 Cognition and learning framework of the CMAgent based on STD-Q圖5 基于STD-Q的CMAgent認知學習框架

    4.4 GRBF網(wǎng)絡(luò)結(jié)構(gòu)的參數(shù)訓練

    (12)

    4.5 學習過程

    學習過程以周期計數(shù),當一個回合的作戰(zhàn)結(jié)束時視為一個學習周期的結(jié)束,其學習框架如圖5所示。基于STD-Q的WSoS戰(zhàn)役層次CMAgent的決策過程如下:

    步驟1初始化CMAgent的GRBF神經(jīng)網(wǎng)絡(luò),通過k-means聚類設(shè)置GRBF的中心和寬度,設(shè)定最大學習周期數(shù)K,令k=1;

    步驟5執(zhí)行決策指令at,轉(zhuǎn)到新的狀態(tài)st+1;

    步驟6如果仿真沒有分出勝負或者t小于最大仿真步數(shù),返回步驟3;

    步驟8k=k+1,如果k>K則結(jié)束學習,否則轉(zhuǎn)步驟2。

    5 作戰(zhàn)仿真及結(jié)果分析

    5.1 實驗設(shè)置與兵力部署

    5.2 實驗結(jié)果及分析

    5.2.1 不同隱含層節(jié)點數(shù)的效能分析

    得到的體系對抗結(jié)果如圖6所示,為不同隱含層節(jié)點數(shù)目對應(yīng)的STD-Q算法作戰(zhàn)效能(由勝率和總獎賞共同評估),其中m∈{2,10,20,30,…,610,620}(m最小不能小于2,最大不大于625),勝率W由獲勝次數(shù)除以學習周期計算(當對方兵力完全被消滅或者將一定會被完全消滅時視為獲勝),總獎賞RALL的計算公式為:

    Table 4 Decision rule of theCMAgent based on rule-based

    RALL=((KBI-KBE)+δ)/((KBI-KBE)+δ+(KRI-KRE)+δ)-0.5

    (13)

    其中,KBI為開始時敵軍總數(shù),KBE為周期結(jié)束時敵軍總數(shù),KRI為開始時友軍總數(shù),KRE為周期結(jié)束時友軍總數(shù)。由圖6可知,藍方W以及RALL要優(yōu)于紅方,當m∈{2,10,20,30,…,200}時,藍方占有絕對優(yōu)勢,勝率幾乎為1,但當200

    Figure 6 Operational effectiveness changes of the red and blue camp varied with number of nodes of the hidden layer圖6 紅藍雙方作戰(zhàn)效能隨隱含層節(jié)點數(shù)目的變化

    圖7為總用時隨m的變化,可以看出隨著m的增大,總用時總體保持增加的趨勢,但當m∈{100,110,…,200}時出現(xiàn)了一個波峰,這是由誤差導致的,通過多次仿真取均值或增大最大仿真步長可以有效消除其影響。根據(jù)以上的分析,m在{2,10,20,…,100}之內(nèi)選擇最佳。

    Figure 7 Total time consumption changes with the number of nodes of the hidden layer 圖7 總用時隨隱含層節(jié)點數(shù)目的變化

    5.2.2 算法的收斂性分析

    Figure 8 Development of the total repay value of the red and blue camps changes with learning cycles 圖8 紅藍雙方總獎賞值隨學習周期的演化

    5.2.3 可視化仿真回溯分析

    為了探索算法的優(yōu)勢根源,選擇算法收斂時的一組對抗數(shù)據(jù)進行可視化仿真回溯分析,圖9為不同階段下紅藍雙方可視化對抗情景。其中,圖9a表示對抗開始時雙方尋敵作戰(zhàn)情景,圖9b是雙方在中間發(fā)生遭遇后開始作戰(zhàn),圖9c是雙方激戰(zhàn)階段,從圖9d時刻開始,藍方開始占據(jù)優(yōu)勢,之后,紅方依據(jù)撤退規(guī)則開始執(zhí)行撤退行為,如圖9e所示,而藍方則一直在追擊并打掉了紅方的大本營(RPAgent),由于此時紅方已經(jīng)無處可退,且有生兵力已經(jīng)全部陣亡,獲勝概率為零,被系統(tǒng)判定為負,使得對抗過程提前結(jié)束,最終,采用STD-Q的藍方獲得最后勝利,如圖9f所示。

    Figure 9 Typical visualization scene of the red-blue confrontation process圖9 典型的紅藍雙方對抗可視化情景(N為兵力數(shù)目)

    進一步對雙方的對抗情景進行多次反復可視化回溯分析,發(fā)現(xiàn)藍方勝利的直接因素主要表現(xiàn)在兩方面:一是與藍方優(yōu)先選擇空中目標進行攻擊有一定的關(guān)聯(lián),并且藍方的火力打擊更加協(xié)調(diào);二是藍方地面兵力一直在進行小范圍機動,這使得紅方的炮彈存在大量的落空,避免了藍方地面兵力的大量傷亡,而激戰(zhàn)過程中的紅方地面兵力則一直保持靜止,使得藍方炮彈“彈無虛發(fā)”,致使紅方的傷亡十分嚴重,最終不敵藍方潰敗。以上只是對雙方對抗過程的一種粗略的可視化分析,實際的對抗過程十分復雜,具有更多的復雜因素有待挖掘。

    6 結(jié)束語

    考慮到RL在復雜環(huán)境、不確定性環(huán)境以及未知環(huán)境中的求解優(yōu)勢,本文提出了基于跨步差分Q-leaning的體系對抗智能認知決策算法,并通過武器裝備體系對抗仿真實驗進行了驗證,表明了算法的有效性;同時表明,基于GRBF神經(jīng)網(wǎng)絡(luò)的狀態(tài)空間離散方法能夠有效應(yīng)對體系對抗環(huán)境下指揮Agent認知域狀態(tài)連續(xù)多維的分割難題,并且以較少的隱層節(jié)點數(shù)即可獲得優(yōu)異的決策效能。研究對于體系對抗仿真環(huán)境下戰(zhàn)役層次指揮Agent認知決策以及信息化對抗環(huán)境下輔助指揮員進行決策具有一定的參考價值。

    猜你喜歡
    藍方紅方差分
    如何在方格紙上確定位置
    數(shù)列與差分
    精彩的足球比賽
    暗號
    暗號
    小小說月刊(2015年5期)2016-01-22 08:39:19
    暗號
    基于差分隱私的大數(shù)據(jù)隱私保護
    相對差分單項測距△DOR
    太空探索(2014年1期)2014-07-10 13:41:50
    試論棋例裁決難點
    棋藝(2014年3期)2014-05-29 14:27:14
    差分放大器在生理學中的應(yīng)用
    亚洲午夜理论影院| videosex国产| 在线观看舔阴道视频| av不卡在线播放| 一区福利在线观看| 如日韩欧美国产精品一区二区三区| 人妻丰满熟妇av一区二区三区 | 99久久人妻综合| 久99久视频精品免费| 国产视频一区二区在线看| 免费观看人在逋| 黄色毛片三级朝国网站| 国产免费av片在线观看野外av| 免费不卡黄色视频| 999精品在线视频| 视频在线观看一区二区三区| 国产精品乱码一区二三区的特点 | 操美女的视频在线观看| 久久精品国产a三级三级三级| 日本一区二区免费在线视频| ponron亚洲| 三级毛片av免费| 黑人巨大精品欧美一区二区蜜桃| 99久久国产精品久久久| 国产精品综合久久久久久久免费 | 别揉我奶头~嗯~啊~动态视频| 老汉色∧v一级毛片| 欧美日韩视频精品一区| 999久久久精品免费观看国产| 两性夫妻黄色片| 老熟妇仑乱视频hdxx| 99热国产这里只有精品6| 国产欧美日韩一区二区三区在线| 99热国产这里只有精品6| 韩国精品一区二区三区| 精品无人区乱码1区二区| 亚洲少妇的诱惑av| 在线av久久热| avwww免费| 国产精品一区二区在线不卡| a级片在线免费高清观看视频| 高清在线国产一区| 深夜精品福利| 久久 成人 亚洲| 老司机影院毛片| 在线十欧美十亚洲十日本专区| 天天操日日干夜夜撸| 国产精品亚洲一级av第二区| 午夜精品在线福利| 老熟女久久久| 精品午夜福利视频在线观看一区| 日韩欧美一区二区三区在线观看 | 午夜福利欧美成人| 又紧又爽又黄一区二区| 免费在线观看影片大全网站| 日韩有码中文字幕| videos熟女内射| av一本久久久久| av有码第一页| 欧美日韩瑟瑟在线播放| 一区二区三区精品91| 丝瓜视频免费看黄片| 欧美另类亚洲清纯唯美| 人人妻人人爽人人添夜夜欢视频| 丁香欧美五月| 999精品在线视频| 老司机深夜福利视频在线观看| 大片电影免费在线观看免费| 777米奇影视久久| 少妇猛男粗大的猛烈进出视频| 91九色精品人成在线观看| 国产成人av激情在线播放| av视频免费观看在线观看| 看免费av毛片| 老司机在亚洲福利影院| 精品视频人人做人人爽| 大香蕉久久网| 久99久视频精品免费| 久久国产精品人妻蜜桃| 在线观看免费视频日本深夜| 在线观看免费视频网站a站| 国产成人精品在线电影| 精品久久久久久电影网| 少妇猛男粗大的猛烈进出视频| 欧美日韩亚洲高清精品| 在线天堂中文资源库| 中文字幕制服av| 在线观看免费视频日本深夜| 亚洲av美国av| 大香蕉久久成人网| 国产高清国产精品国产三级| 老司机在亚洲福利影院| 国产精品久久久人人做人人爽| 国产亚洲精品久久久久5区| 中文字幕人妻熟女乱码| 国产1区2区3区精品| 黄色 视频免费看| 深夜精品福利| 一级作爱视频免费观看| 欧美一级毛片孕妇| 手机成人av网站| 亚洲国产看品久久| 亚洲精华国产精华精| 夜夜夜夜夜久久久久| 成人精品一区二区免费| 亚洲伊人色综图| videosex国产| 女人精品久久久久毛片| 欧美人与性动交α欧美软件| 999精品在线视频| 美女扒开内裤让男人捅视频| 久久人妻熟女aⅴ| 免费黄频网站在线观看国产| 两性夫妻黄色片| 国产一区在线观看成人免费| 国产精品1区2区在线观看. | 丰满饥渴人妻一区二区三| 精品高清国产在线一区| 免费久久久久久久精品成人欧美视频| 母亲3免费完整高清在线观看| 操出白浆在线播放| 亚洲av片天天在线观看| 日本五十路高清| 午夜福利在线免费观看网站| 亚洲精品乱久久久久久| 9热在线视频观看99| 国产精品香港三级国产av潘金莲| 最近最新免费中文字幕在线| 久久国产精品人妻蜜桃| 18禁观看日本| 欧美日韩亚洲综合一区二区三区_| 日韩一卡2卡3卡4卡2021年| 王馨瑶露胸无遮挡在线观看| 国产成人系列免费观看| 免费人成视频x8x8入口观看| 中文字幕最新亚洲高清| 午夜精品国产一区二区电影| 叶爱在线成人免费视频播放| 高清av免费在线| 手机成人av网站| 50天的宝宝边吃奶边哭怎么回事| 欧美成人免费av一区二区三区 | 欧美另类亚洲清纯唯美| 欧美日韩福利视频一区二区| 久久精品亚洲av国产电影网| 亚洲人成77777在线视频| 欧美 日韩 精品 国产| 91九色精品人成在线观看| 久久午夜综合久久蜜桃| 校园春色视频在线观看| av网站免费在线观看视频| 男女之事视频高清在线观看| 欧美日本中文国产一区发布| 国产无遮挡羞羞视频在线观看| 久久久国产成人精品二区 | 看片在线看免费视频| 91九色精品人成在线观看| 国产无遮挡羞羞视频在线观看| 日韩成人在线观看一区二区三区| 精品国产一区二区三区久久久樱花| 免费观看a级毛片全部| 校园春色视频在线观看| 啦啦啦视频在线资源免费观看| 国产亚洲av高清不卡| 国产精品久久久人人做人人爽| 五月开心婷婷网| 日韩人妻精品一区2区三区| 99久久综合精品五月天人人| 亚洲av片天天在线观看| 亚洲 国产 在线| 午夜福利在线免费观看网站| 精品国产一区二区久久| 国产精品一区二区免费欧美| netflix在线观看网站| 欧美亚洲日本最大视频资源| 精品久久久久久,| 捣出白浆h1v1| 欧美日韩一级在线毛片| 亚洲国产欧美网| 久久人人97超碰香蕉20202| 男女床上黄色一级片免费看| 国产成人影院久久av| av天堂久久9| 少妇 在线观看| 男女午夜视频在线观看| 51午夜福利影视在线观看| 久久午夜亚洲精品久久| 亚洲精品av麻豆狂野| 三上悠亚av全集在线观看| 欧美激情 高清一区二区三区| 18禁裸乳无遮挡免费网站照片 | 欧美成人免费av一区二区三区 | 久久精品国产清高在天天线| av超薄肉色丝袜交足视频| 免费久久久久久久精品成人欧美视频| 久久久久国产精品人妻aⅴ院 | 久久九九热精品免费| 欧美另类亚洲清纯唯美| 亚洲av片天天在线观看| 18禁观看日本| 国产欧美亚洲国产| 国产熟女午夜一区二区三区| av网站在线播放免费| 成人影院久久| 人妻丰满熟妇av一区二区三区 | 下体分泌物呈黄色| 亚洲 国产 在线| 亚洲,欧美精品.| 久久天躁狠狠躁夜夜2o2o| 91国产中文字幕| 性少妇av在线| svipshipincom国产片| 成年人午夜在线观看视频| 99久久人妻综合| 人人妻人人爽人人添夜夜欢视频| 91国产中文字幕| 国产精品 欧美亚洲| 一级毛片精品| 日韩免费av在线播放| 久久久水蜜桃国产精品网| 欧美日韩一级在线毛片| 在线观看免费高清a一片| 亚洲 国产 在线| 91成年电影在线观看| av福利片在线| 精品第一国产精品| 丰满饥渴人妻一区二区三| 免费在线观看完整版高清| 免费人成视频x8x8入口观看| 日韩一卡2卡3卡4卡2021年| 黄色片一级片一级黄色片| 亚洲av片天天在线观看| 欧美黄色片欧美黄色片| 老司机福利观看| 老司机靠b影院| 国产精品自产拍在线观看55亚洲 | 又黄又爽又免费观看的视频| 国产又色又爽无遮挡免费看| 中文字幕人妻熟女乱码| 中文亚洲av片在线观看爽 | 国产99久久九九免费精品| 在线国产一区二区在线| 亚洲精华国产精华精| 99热国产这里只有精品6| 伦理电影免费视频| 亚洲精品成人av观看孕妇| 制服诱惑二区| 夜夜夜夜夜久久久久| 成人18禁高潮啪啪吃奶动态图| 亚洲色图av天堂| 欧美黑人精品巨大| 69av精品久久久久久| 欧美日韩亚洲国产一区二区在线观看 | 免费观看a级毛片全部| 看免费av毛片| 中文字幕制服av| 国产一区二区激情短视频| 18禁黄网站禁片午夜丰满| 99国产精品99久久久久| 中文字幕人妻丝袜一区二区| 国产精品欧美亚洲77777| 亚洲av成人不卡在线观看播放网| 欧美日韩视频精品一区| 成人特级黄色片久久久久久久| 精品国产乱码久久久久久男人| 两个人看的免费小视频| 久久亚洲精品不卡| 成年女人毛片免费观看观看9 | 又大又爽又粗| 欧美最黄视频在线播放免费 | 日韩欧美免费精品| 国产av精品麻豆| 美女 人体艺术 gogo| 精品卡一卡二卡四卡免费| 黄色 视频免费看| 国产不卡av网站在线观看| 久久香蕉国产精品| 国产极品粉嫩免费观看在线| 后天国语完整版免费观看| 欧美精品人与动牲交sv欧美| 少妇的丰满在线观看| 757午夜福利合集在线观看| 精品国产美女av久久久久小说| 免费看十八禁软件| 人妻丰满熟妇av一区二区三区 | 99国产极品粉嫩在线观看| 国产欧美日韩精品亚洲av| 久久久久国内视频| 欧美日韩国产mv在线观看视频| 精品视频人人做人人爽| 黑丝袜美女国产一区| 欧美黄色淫秽网站| 亚洲自偷自拍图片 自拍| 国产精品综合久久久久久久免费 | 熟女少妇亚洲综合色aaa.| 97人妻天天添夜夜摸| www.999成人在线观看| 国产麻豆69| 757午夜福利合集在线观看| 亚洲欧美色中文字幕在线| 欧美激情极品国产一区二区三区| 亚洲五月婷婷丁香| 搡老乐熟女国产| ponron亚洲| 91成年电影在线观看| 成人三级做爰电影| 国产99白浆流出| 美女高潮到喷水免费观看| av片东京热男人的天堂| 91精品国产国语对白视频| 亚洲专区中文字幕在线| 亚洲av欧美aⅴ国产| 9色porny在线观看| 色在线成人网| 亚洲av熟女| 精品久久蜜臀av无| 啦啦啦视频在线资源免费观看| 亚洲熟女毛片儿| 人妻 亚洲 视频| 一区在线观看完整版| 香蕉久久夜色| 宅男免费午夜| 欧美人与性动交α欧美精品济南到| av国产精品久久久久影院| 日韩欧美三级三区| 精品一区二区三区av网在线观看| 人人妻人人爽人人添夜夜欢视频| 国产高清videossex| 精品一区二区三卡| 亚洲avbb在线观看| 国产淫语在线视频| 夫妻午夜视频| 国产不卡av网站在线观看| 多毛熟女@视频| 国产又爽黄色视频| 十分钟在线观看高清视频www| 黑人巨大精品欧美一区二区蜜桃| 极品人妻少妇av视频| ponron亚洲| 亚洲一卡2卡3卡4卡5卡精品中文| 悠悠久久av| 欧美亚洲 丝袜 人妻 在线| 午夜激情av网站| 亚洲av日韩在线播放| 一本综合久久免费| 中文字幕另类日韩欧美亚洲嫩草| 久久精品亚洲熟妇少妇任你| 久久精品国产亚洲av高清一级| 欧美人与性动交α欧美软件| 中文字幕人妻丝袜制服| 欧美人与性动交α欧美软件| 久久99一区二区三区| 99国产精品一区二区三区| 免费观看人在逋| netflix在线观看网站| 亚洲av电影在线进入| 日日摸夜夜添夜夜添小说| www.999成人在线观看| 黄色a级毛片大全视频| 久久亚洲精品不卡| 免费观看a级毛片全部| 三级毛片av免费| 麻豆国产av国片精品| 丁香六月欧美| 国产成人系列免费观看| 午夜福利在线观看吧| 真人做人爱边吃奶动态| 在线视频色国产色| 嫁个100分男人电影在线观看| 免费观看精品视频网站| 天天影视国产精品| 欧美成狂野欧美在线观看| 韩国av一区二区三区四区| 久热这里只有精品99| 99热网站在线观看| 亚洲美女黄片视频| 老司机午夜福利在线观看视频| 免费黄频网站在线观看国产| 高清av免费在线| 成年动漫av网址| √禁漫天堂资源中文www| 精品一品国产午夜福利视频| 成人18禁在线播放| 国产精品二区激情视频| 精品国内亚洲2022精品成人 | 美女 人体艺术 gogo| 日韩欧美国产一区二区入口| 国产亚洲欧美98| 欧美av亚洲av综合av国产av| 十八禁人妻一区二区| 免费在线观看视频国产中文字幕亚洲| 国产精品久久久久久人妻精品电影| 岛国在线观看网站| av超薄肉色丝袜交足视频| 侵犯人妻中文字幕一二三四区| 又大又爽又粗| 每晚都被弄得嗷嗷叫到高潮| 亚洲人成伊人成综合网2020| 久久久国产欧美日韩av| 午夜久久久在线观看| 他把我摸到了高潮在线观看| 精品少妇久久久久久888优播| 精品人妻熟女毛片av久久网站| 中文字幕av电影在线播放| 91成年电影在线观看| 国产亚洲精品一区二区www | 超碰97精品在线观看| 两性夫妻黄色片| 成人av一区二区三区在线看| 99久久国产精品久久久| 国产野战对白在线观看| 美女扒开内裤让男人捅视频| 免费在线观看完整版高清| 精品国内亚洲2022精品成人 | 夜夜躁狠狠躁天天躁| 国产午夜精品久久久久久| 久久国产亚洲av麻豆专区| 黄色视频,在线免费观看| 欧美 亚洲 国产 日韩一| 一夜夜www| 又黄又爽又免费观看的视频| a在线观看视频网站| 动漫黄色视频在线观看| 操出白浆在线播放| 亚洲国产毛片av蜜桃av| 亚洲精品国产一区二区精华液| 热99久久久久精品小说推荐| 高潮久久久久久久久久久不卡| 亚洲中文av在线| 亚洲国产欧美网| 18禁美女被吸乳视频| 国产精品1区2区在线观看. | 97人妻天天添夜夜摸| 欧美在线一区亚洲| 又黄又粗又硬又大视频| 免费观看人在逋| 老司机在亚洲福利影院| 久久久久久久精品吃奶| 免费日韩欧美在线观看| 亚洲一码二码三码区别大吗| 亚洲五月色婷婷综合| 国产欧美日韩一区二区精品| 91成人精品电影| 亚洲欧美日韩另类电影网站| 999精品在线视频| 亚洲精品国产精品久久久不卡| 亚洲国产中文字幕在线视频| 一进一出抽搐gif免费好疼 | 午夜福利在线观看吧| 9191精品国产免费久久| 午夜福利一区二区在线看| 日本wwww免费看| 亚洲欧美精品综合一区二区三区| 国产欧美日韩精品亚洲av| 国产亚洲欧美精品永久| 日韩制服丝袜自拍偷拍| 久9热在线精品视频| 亚洲av成人不卡在线观看播放网| 久久久国产一区二区| 精品国产美女av久久久久小说| 脱女人内裤的视频| 叶爱在线成人免费视频播放| 国产乱人伦免费视频| 午夜精品在线福利| 亚洲精品在线观看二区| 校园春色视频在线观看| 亚洲精品美女久久久久99蜜臀| 王馨瑶露胸无遮挡在线观看| 男女下面插进去视频免费观看| 午夜两性在线视频| 黄色片一级片一级黄色片| 在线观看一区二区三区激情| 亚洲欧洲精品一区二区精品久久久| 高清视频免费观看一区二区| 亚洲av成人一区二区三| 一级片免费观看大全| 丰满饥渴人妻一区二区三| 日本wwww免费看| 国产精品香港三级国产av潘金莲| 亚洲情色 制服丝袜| 国产精品.久久久| 成人永久免费在线观看视频| 99国产综合亚洲精品| 亚洲av成人一区二区三| 91精品三级在线观看| 亚洲欧美日韩高清在线视频| 久久中文看片网| 777米奇影视久久| 国产成人系列免费观看| 9色porny在线观看| 丝袜美腿诱惑在线| 久久国产精品影院| 精品无人区乱码1区二区| av欧美777| 久久青草综合色| 久久中文字幕人妻熟女| 女同久久另类99精品国产91| 精品一区二区三区四区五区乱码| 人妻 亚洲 视频| 亚洲色图综合在线观看| 久久中文字幕人妻熟女| 久久香蕉精品热| 亚洲人成伊人成综合网2020| 久久精品国产亚洲av香蕉五月 | 狠狠婷婷综合久久久久久88av| 国产视频一区二区在线看| 日本wwww免费看| 久久精品aⅴ一区二区三区四区| 国产成人av激情在线播放| 国内毛片毛片毛片毛片毛片| 少妇 在线观看| 三级毛片av免费| 一区二区日韩欧美中文字幕| 久久国产亚洲av麻豆专区| 男女下面插进去视频免费观看| 美女视频免费永久观看网站| 亚洲精品乱久久久久久| 男女床上黄色一级片免费看| 欧美 亚洲 国产 日韩一| 国产精品成人在线| 欧美精品高潮呻吟av久久| 欧美大码av| 大陆偷拍与自拍| 欧美成人午夜精品| 极品人妻少妇av视频| 另类亚洲欧美激情| netflix在线观看网站| 国产黄色免费在线视频| 黑人巨大精品欧美一区二区蜜桃| 在线播放国产精品三级| 国产一区二区三区在线臀色熟女 | 亚洲成人国产一区在线观看| 99久久99久久久精品蜜桃| 一级片免费观看大全| 自线自在国产av| 国产激情久久老熟女| 久久久水蜜桃国产精品网| 久久久久国产精品人妻aⅴ院 | 巨乳人妻的诱惑在线观看| 国产精品一区二区免费欧美| 亚洲精品国产精品久久久不卡| 精品国产乱子伦一区二区三区| 热99久久久久精品小说推荐| 亚洲av第一区精品v没综合| 两性午夜刺激爽爽歪歪视频在线观看 | 韩国av一区二区三区四区| 亚洲七黄色美女视频| 不卡av一区二区三区| 一级片免费观看大全| 亚洲成人免费电影在线观看| 两性夫妻黄色片| 91字幕亚洲| aaaaa片日本免费| 天天躁狠狠躁夜夜躁狠狠躁| 美女扒开内裤让男人捅视频| 一本一本久久a久久精品综合妖精| 啦啦啦在线免费观看视频4| 国产亚洲精品久久久久5区| 久久国产精品影院| 国产精品美女特级片免费视频播放器 | 国产精品 国内视频| 丰满饥渴人妻一区二区三| bbb黄色大片| 国产区一区二久久| 男女午夜视频在线观看| 人妻久久中文字幕网| 亚洲精品一二三| 国产在线精品亚洲第一网站| 亚洲人成77777在线视频| 亚洲自偷自拍图片 自拍| 母亲3免费完整高清在线观看| 下体分泌物呈黄色| 18在线观看网站| 婷婷成人精品国产| 免费在线观看黄色视频的| 99久久人妻综合| 777米奇影视久久| 一进一出好大好爽视频| 亚洲欧美日韩高清在线视频| 欧美日韩中文字幕国产精品一区二区三区 | 欧美 日韩 精品 国产| 99热网站在线观看| 精品一区二区三卡| 丰满迷人的少妇在线观看| 国产一区二区三区综合在线观看| 王馨瑶露胸无遮挡在线观看| 亚洲av日韩在线播放| 中文亚洲av片在线观看爽 | 亚洲全国av大片| aaaaa片日本免费| 80岁老熟妇乱子伦牲交| 夜夜躁狠狠躁天天躁| videosex国产| 国产亚洲一区二区精品| 国产亚洲欧美精品永久| 国产一区二区三区在线臀色熟女 | 久久久水蜜桃国产精品网| 久热爱精品视频在线9| 亚洲精品乱久久久久久| av有码第一页| 日本黄色视频三级网站网址 | 成年人免费黄色播放视频| 少妇 在线观看| 亚洲第一欧美日韩一区二区三区| 久久久久久久午夜电影 | 99热只有精品国产| 老司机亚洲免费影院| bbb黄色大片| 一本一本久久a久久精品综合妖精| 亚洲午夜精品一区,二区,三区| 99热网站在线观看| 久久久水蜜桃国产精品网| 在线观看免费视频日本深夜| 自拍欧美九色日韩亚洲蝌蚪91| 女性生殖器流出的白浆|