鐘赟,萬路軍,張杰勇
1. 中國人民解放軍94040部隊,庫爾勒 841000 2. 空軍工程大學(xué) 信息與導(dǎo)航學(xué)院,西安 710077 3. 空軍工程大學(xué) 空管領(lǐng)航學(xué)院,西安 710051 4. 中國電科28所 空中交通管理系統(tǒng)與技術(shù)國家重點實驗室,南京 210007
隨著航空平臺技術(shù)、信息網(wǎng)絡(luò)技術(shù)和人工智能技術(shù)的飛速發(fā)展,空中作戰(zhàn)集群化、網(wǎng)絡(luò)化和智能化趨勢日益顯現(xiàn)[1-2]??罩凶鲬?zhàn)的行動過程(Course of Action, COA)設(shè)計,作為空中作戰(zhàn)任務(wù)計劃生成的關(guān)鍵技術(shù),是空中作戰(zhàn)編隊根據(jù)實際作戰(zhàn)環(huán)境和敵方可能采取的作戰(zhàn)行動,生成的最優(yōu)或較優(yōu)作戰(zhàn)行動方案,其本質(zhì)是對動態(tài)作戰(zhàn)行動、作戰(zhàn)環(huán)境和作戰(zhàn)效果三者因果關(guān)系的科學(xué)定量描述和高效優(yōu)化求解,其設(shè)計效果決定了空中作戰(zhàn)效能發(fā)揮[3-4]。
對COA問題建模分析,運用較多的貝葉斯網(wǎng)絡(luò)(Bayesian Nets, BNs)和動態(tài)貝葉斯網(wǎng)絡(luò)(Dynamic Bayesian Nets, DBNs)方法存在其固有缺陷:一是在概率推理過程中,BNs和DBNs高度依賴條件概率表(Conditional Probability Table, CPT),而CPT的合理構(gòu)建具有一定困難;二是隨著作戰(zhàn)規(guī)模的增大,CPT中節(jié)點數(shù)量隨之增多,進(jìn)而降低概率推理的計算效率[5]。因此,研究人員主要通過引入因果強(qiáng)度邏輯(Causal Strength Logic, CAST)參數(shù),采用參數(shù)定義較少、推理效率較高的影響網(wǎng)絡(luò)(Influence Nets, INs)方法[6],對COA問題進(jìn)行研究。
在現(xiàn)有研究中,大多考慮了COA優(yōu)選中的不確定性,并采用不同方法處理這種不確定性。文獻(xiàn)[7]考慮到作戰(zhàn)過程中的不確定性和對抗性,基于不完全信息博弈方法和INs進(jìn)行問題建模,但缺乏對參數(shù)的不確定性表征。文獻(xiàn)[8]認(rèn)為不確定性(外部事件出現(xiàn)概率的區(qū)間性)主要來源于外部事件,通過蒙特卡洛(Monte Carlo)方法對外部事件的不確定性進(jìn)行模擬,并根據(jù)多次實驗下的概率計算信噪比(Signal-to-Noise Ratio, SNR)作為目標(biāo)函數(shù),但沒有考慮基準(zhǔn)概率和影響強(qiáng)度值的不確定性。文獻(xiàn)[9]對文獻(xiàn)[8]進(jìn)行了拓展研究,針對影響強(qiáng)度值時變場景,基于動態(tài)影響網(wǎng)絡(luò)(Dynamic Influence Nets, DINs)進(jìn)行建模,并采用學(xué)習(xí)型遺傳算法對模型進(jìn)行求解,但缺乏對關(guān)鍵參數(shù)確定過程中專家知識的一致性檢驗。
綜上所述,當(dāng)前研究存在著不確定性來源分析不充分、對參數(shù)不確定性處理方式相對簡單、關(guān)鍵參數(shù)獲取過程中專家知識缺少一致性檢驗等問題。
本文采用無需估計變量分布律的區(qū)間值度量參數(shù)不確定性,引入?yún)^(qū)間優(yōu)化思想[10-11]構(gòu)建基于DINs的COA優(yōu)選模型;基于改進(jìn)Kendall協(xié)和系數(shù)檢驗法得到經(jīng)過一致性檢驗的關(guān)鍵參數(shù),并分析期望效果實現(xiàn)概率和各關(guān)鍵參數(shù)的相關(guān)關(guān)系;最后,采用改進(jìn)快速非支配排序遺傳(Non-dominated Sorting Genetic Algorithm II, NSGA-II)算法對模型進(jìn)行求解。
期望效果(Desired Effects, DE):是空中作戰(zhàn)編隊所要實現(xiàn)的最終作戰(zhàn)目的。執(zhí)行的作戰(zhàn)任務(wù)不同,期望效果的種類和數(shù)量也有所不同,選取高效COA的核心目標(biāo),就是使得期望效果的實現(xiàn)概率最大。令空中作戰(zhàn)過程中的期望效果集合為D={d1,d2,…,d|D|},其中,|D|為期望效果的數(shù)量。
中間效果(Intermediate Effects, IE):是空中作戰(zhàn)編隊為達(dá)成最終作戰(zhàn)目的而取得的階段性作戰(zhàn)效果,其是作戰(zhàn)行動、外部事件和期望效果之間的紐帶??罩凶鲬?zhàn)編隊執(zhí)行復(fù)雜任務(wù)時,直接建立數(shù)量較多的作戰(zhàn)行動、外部事件和期望效果之間的影響關(guān)系難度較大。因此,一般通過中間效果實現(xiàn)對各影響關(guān)系的分類關(guān)聯(lián),從而有效降低表征作戰(zhàn)過程中所有影響關(guān)系的難度。令空中作戰(zhàn)中的中間效果集合為C={c1,c2,…,c|C|},其中,|C|為中間效果的數(shù)量。
基于INs進(jìn)行COA問題因果關(guān)系建模,是將作戰(zhàn)行動、外部事件、期望效果和中間效果之間的因果關(guān)系影響強(qiáng)度用CAST參數(shù)來表示,通過從根節(jié)點到葉節(jié)點的概率傳播,進(jìn)而計算得到期望效果的實現(xiàn)概率。
圖1 基于INs的COA靜態(tài)模型Fig.1 Static model of COA based on INs
圖1為基于INs的COA靜態(tài)模型?;贗Ns的COA靜態(tài)模型可表征為四元組IN={V,E,CAST,BP}。V={A,B,C,D}表示影響網(wǎng)絡(luò)中作戰(zhàn)行動A、外部事件B、期望效果C和中間效果D等節(jié)點集合。E={(A,C),(B,C),(C,D)}表示影響網(wǎng)絡(luò)中節(jié)點的因果關(guān)系,用帶箭頭或圓頭的有向邊描述。
CAST表示對?v∈V,影響網(wǎng)絡(luò)中的因果關(guān)系影響強(qiáng)度集合,對于有向邊(A,C),影響強(qiáng)度為CAST(A,C)∈{(h,g)|h≥-1,g≤1}。其中,h表示父節(jié)點為1對子節(jié)點為1的影響程度,g表示父節(jié)點為0對子節(jié)點為1的影響程度。一般可以根據(jù)h和g的取值情況,將因果關(guān)系劃分為促進(jìn)關(guān)系和抑制關(guān)系兩類,對于有向邊(A,C),當(dāng)h>0,g≤0時,表示A對C有促進(jìn)作用,所對應(yīng)的有向邊e∈E帶箭頭;當(dāng)h≤0,g>0時,表示A對C有抑制作用,所對應(yīng)的有向邊e∈E帶圓頭。而在概率推理過程中,影響強(qiáng)度值取h值或g值,取決于父節(jié)點是否發(fā)生。若發(fā)生則取h值,反之則取g值。
BP表示影響網(wǎng)絡(luò)中各相關(guān)節(jié)點取值的基準(zhǔn)概率集合,即在沒有外部因果關(guān)系影響下,相應(yīng)節(jié)點取值為1的概率,有BP={bp1,bp2,…,bp|BP|}。
以事件cn受事件ai影響場景下的概率計算為例,令xi為取值0或1的隨機(jī)向量,ai的發(fā)生與否,直接影響到xi的取值情況。若事件ai發(fā)生,則xi=1;反之,則xi=0。為度量xi的取值對事件cn是否發(fā)生的影響,采用式(1),從定性角度定義事件ai對事件cn的影響情況:
(1)
對于給定的ai,事件cn發(fā)生的條件概率為P(cn|ai),則式(2)表示從定量角度定義事件ai對事件cn的影響情況:
(2)
式中:P(cn)為事件cn發(fā)生的基準(zhǔn)概率。
令s(ai)∈[-1,1],進(jìn)而利用線性插值法擴(kuò)展P(cn|ai)的定義空間,則給定ai,事件cn發(fā)生的條件概率P(cn|ai)定義為
P(cn|ai)=
(3)
在實際問題中,存在多個事件對某事件同時產(chǎn)生影響。此時,需要進(jìn)行影響強(qiáng)度值聚合后進(jìn)行概率推理,具體見式(14)~式(18)。
通過式(1)~式(3),建立了CAST值與條件概率P(cn|ai)的映射關(guān)系,從而將作戰(zhàn)行動、外部事件、期望效果和中間效果的因果關(guān)系用影響值進(jìn)行鏈接,生成相應(yīng)影響網(wǎng)絡(luò)。
然而,空中作戰(zhàn)是連續(xù)動態(tài)的作戰(zhàn)過程,作戰(zhàn)行動和外部事件會隨著戰(zhàn)場態(tài)勢的變化而不斷演進(jìn),從而導(dǎo)致基于INs的COA靜態(tài)模型并不能有效表征參數(shù)變量的動態(tài)演變過程。
為克服INs在建模過程中時間特性表征不足的缺陷,需基于DINs對空中作戰(zhàn)COA問題進(jìn)行動態(tài)建模,在影響強(qiáng)度計算過程中引入自環(huán)(Self Loop, SL)機(jī)制。即某作戰(zhàn)階段的期望效果和中間效果實現(xiàn)概率不僅與當(dāng)前作戰(zhàn)階段的作戰(zhàn)行動過程有關(guān),還會受到上一作戰(zhàn)階段的期望效果和中間效果實現(xiàn)概率的影響,從而有效刻畫了期望效果和中間效果狀態(tài)轉(zhuǎn)移的馬爾科夫特性。
圖2 基于DINs的COA動態(tài)模型Fig.2 Dynamic model of COA based on DINs
考慮到空中作戰(zhàn)COA優(yōu)選的目的是有效完成使命任務(wù),因此主要選取最后作戰(zhàn)階段的期望效果實現(xiàn)概率P{dm(tT+1)}作為評價指標(biāo)。以編隊作戰(zhàn)資源和規(guī)則為約束條件,以特定行動過程下的期望效果實現(xiàn)概率為優(yōu)化目標(biāo),建立基于DINs的COA優(yōu)選數(shù)學(xué)模型為
maxF(S)=P{dm(tT+1)|CE(t0),ΨS}
(4)
式中:R(tk)為tk-1~tk階段的作戰(zhàn)資源消耗;R0為作戰(zhàn)資源閾值。
目標(biāo)函數(shù)表示以初始外部作戰(zhàn)環(huán)境為起點,在可行行動空間中選取相應(yīng)行動過程,使得最終期望效果實現(xiàn)概率最大;第1個約束表示任意作戰(zhàn)階段的作戰(zhàn)資源消耗均不能超過作戰(zhàn)資源閾值;第2個約束表示行動過程必須在可行行動空間中選取。
在空中作戰(zhàn)編隊作戰(zhàn)過程中,不確定性主要體現(xiàn)在相關(guān)作戰(zhàn)參數(shù)的取值分布上,主要包括以下3類。
1) 外部事件出現(xiàn)概率的不確定性。由于敵方敵對行為的不可預(yù)測以及作戰(zhàn)專家知識的局限性,外部事件出現(xiàn)概率很難以準(zhǔn)確值給出。
2) 基準(zhǔn)概率的不確定性。由于作戰(zhàn)專家知識的局限性,不能給出基準(zhǔn)概率的準(zhǔn)確值。
3) 影響強(qiáng)度值的不確定性。由于作戰(zhàn)專家知識的局限性,不能給出影響強(qiáng)度的準(zhǔn)確值。
在復(fù)雜的戰(zhàn)場環(huán)境中,難以給出上述參數(shù)的準(zhǔn)確值,甚至較難估計其分布律。因此,主要采用只需簡單給出上下界的區(qū)間數(shù)對上述參數(shù)的不確定性進(jìn)行表征。對于區(qū)間數(shù)U=[uL,uR]和V=[vL,vR],定義相關(guān)運算法則為[12]
U+V=[uL+vL,uR+vR]
(5)
kU=[kuL,kuR]k>0
(6)
與INs一樣,DINs的概率傳播也是子節(jié)點與多個獨立父節(jié)點之間的近似概率推理,概率推理的核心要素CAST參數(shù)由作戰(zhàn)專家根據(jù)作戰(zhàn)知識給出。與INs不同的是,DINs具有動態(tài)特性,若父節(jié)點的實現(xiàn)概率隨著時間發(fā)生動態(tài)變化,則子節(jié)點的實現(xiàn)概率也會發(fā)生相應(yīng)變化。
DINs的概率傳播機(jī)制主要包括2個方面,分別是關(guān)鍵參數(shù)確定和概率傳播算法,其中,關(guān)鍵參數(shù)主要包括CAST參數(shù)和外部事件出現(xiàn)概率。
對于DINs中的關(guān)鍵參數(shù),一般采用多專家知識融合方法進(jìn)行確定。在具體表征方式上,用橫坐標(biāo)為專家權(quán)威度Q、縱坐標(biāo)為關(guān)鍵參數(shù)的二維坐標(biāo)系,即信念圖進(jìn)行表示[6]。圖3為關(guān)鍵參數(shù)是影響強(qiáng)度值時,基于信念圖的影響強(qiáng)度值。
圖3 基于信念圖的影響強(qiáng)度值Fig.3 Influence strength value based on belief graph
其中,專家權(quán)威度Q和關(guān)鍵參數(shù)的分類采用模糊語言型分類,并建立評語到定量表達(dá)的映射,專家權(quán)威度Q的評判劃分為5個等級,分別為高、較高、一般、較低、低,對應(yīng)量化值為1.0、 0.75、0.5、0.25、0;關(guān)鍵參數(shù)的評判劃分為7個等級,分別為絕對強(qiáng)、很強(qiáng)、較強(qiáng)、一般、較弱、很弱、無,對應(yīng)量化值為1.0、0.9、0.7、0.5、0.3、0.1、0。圖3中點位h2(0.8,[0.75,0.85])和g2(0.8,[0.25,0.30])分別表示,在不考慮取值正負(fù)性情況下,權(quán)威度為0.8的專家給出h值的取值范圍為[0.75, 0.85],g值的取值范圍為[0.25,0.30]。
一般直接采用相應(yīng)方法進(jìn)行關(guān)鍵參數(shù)的融合生成,然而,當(dāng)前研究缺乏對專家知識的一致性檢驗,從而造成某些與其他專家知識不一致的專家知識對最終融合值生成產(chǎn)生影響。因此,首先采用改進(jìn)Kendall協(xié)和系數(shù)檢驗法對專家知識進(jìn)行一致性檢驗,隨后將通過一致性檢驗的專家知識融合生成最終結(jié)果。
1) 基于改進(jìn)Kendall協(xié)和系數(shù)檢驗法的一致性檢驗
同樣以影響強(qiáng)度值為例,記所有作戰(zhàn)專家集合為Z={z1,z2,…,z|Z|},|Z|為專家數(shù)量,則對集合Z中專家知識進(jìn)行一致性檢驗步驟如下。
Ro=[ro,1,ro,2,…,ro,|V|]
(7)
式中:ro,v(1≤v≤|V|)為Cho,v在Ho中按升序排序的排序號,區(qū)間數(shù)的排序方法見式(21)。
步驟2建立假設(shè)J0:集合Z中作戰(zhàn)專家關(guān)于影響強(qiáng)度賦值意見不一致;備擇假設(shè)J1:集合Z中作戰(zhàn)專家關(guān)于影響強(qiáng)度賦值意見一致。令顯著性水平α=0.05。
步驟3根據(jù)式(8),計算專家集合Z中集合所有專家知識的Kendall協(xié)和系數(shù)檢驗量Kendall(Z)。
Kendall(Z)=
(8)
步驟4判斷Kendall(Z)與顯著性水平α下Kendall協(xié)和系數(shù)檢驗閾值Kα的大小關(guān)系,若Kendall(Z) 2) 基于綜合加權(quán)的一致性專家知識集結(jié) 通過對專家知識的一致性檢驗,可以得到集合Z的專家知識一致度ηZ: (9) 則對于一致性專家知識集結(jié),需要找到一組這樣的專家組Z′,使得Z′中專家知識一致并且具有最高專家組權(quán)威度,即有 maxμZ′ (10) 式中:第1個約束表示Z′中專家知識必須一致。μZ′為Z′的專家組權(quán)威度,計算公式為 (11) 為求解式(11),并利用綜合加權(quán)方法集結(jié)專家知識得到融合后影響強(qiáng)度值,采用具體步驟如下。 步驟1初始化專家集合Y=?,令計數(shù)標(biāo)志count=1。 步驟2判斷專家集合Z的知識一致度ηZ是否等于1,若否,則將Z中知識相似度最小專家移至集合Y,循環(huán)執(zhí)行步驟2直至ηZ=1或Z中只剩1名專家。專家知識相似度計算方法如式(12)所示: (12) 步驟3令集合Zcount=Z且count=count+1,并先后執(zhí)行Z=Y,Y=?,循環(huán)執(zhí)行步驟2和3直至ηZ=1或Z中只剩1名專家。 步驟4比較Z1,Z2,…的專家組權(quán)威度,并令Z′=argmax{μZ1,μZ2,…}。 步驟5通過步驟1~步驟4,確定了符合一致性原則并使得權(quán)威度最大的專家組,采用式(13) 計算得到融合多專家知識的影響強(qiáng)度h值結(jié)果。 (13) 式(13)的計算涉及到區(qū)間數(shù)和區(qū)間數(shù)的加法運算規(guī)則,以及區(qū)間數(shù)和實數(shù)的乘法運算規(guī)則,采用式(5)和式(6)進(jìn)行計算。 類似地,融合多專家知識的其他關(guān)鍵參數(shù)均可以通過上述步驟計算得到。 在任意作戰(zhàn)階段,子節(jié)點的實現(xiàn)概率取決于父節(jié)點的實現(xiàn)概率。因此,隨著作戰(zhàn)進(jìn)程的不斷推進(jìn),需要根據(jù)父節(jié)點的實現(xiàn)概率變化情況,從上至下依次進(jìn)行子節(jié)點實現(xiàn)概率的更新。具體概率傳播算法如下。 步驟1對于特定作戰(zhàn)階段,根據(jù)當(dāng)前影響網(wǎng)絡(luò)中所有節(jié)點出度和入度情況,將節(jié)點劃分為不同層次。其中,根節(jié)點層次最高,中間節(jié)點層次居中,葉節(jié)點層次最低。 步驟2判斷是否進(jìn)入下一作戰(zhàn)階段,若是,則更新所有節(jié)點所在層次和根節(jié)點先驗概率。 步驟3根據(jù)影響強(qiáng)度值計算子節(jié)點條件概率,以父節(jié)點集合A、子節(jié)點cn,求cn的條件概率P(cn|a1,a2,…,a|A|)為例,ai的影響強(qiáng)度取值為s(ai)。相應(yīng)條件概率具體計算過程如下。 1) 進(jìn)行正影響強(qiáng)度聚合,生成PI值。 (14) 2) 進(jìn)行負(fù)影響強(qiáng)度聚合,生成NI值。 (15) 3) 將PI值和NI值聚合,生成整體影響強(qiáng)度OI值。 (16) 4) 計算得到條件概率P(cn|a1,a2,…,a|A|)。 P(cn|a1,a2,…,a|A|)= (17) 步驟4根據(jù)全概率公式,計算子節(jié)點的實現(xiàn)概率。同樣以步驟3中父節(jié)點事件發(fā)生情況為例,并考慮到父節(jié)點的獨立性,P(cn)的計算公式為 P(cn)= P(cn|a1,a2,…,a|A|)×P(a1)× P(a2)×…×P(a|A|)+ P(cn|a1,a2,…,a|A|)× P(a1)×P(a2)×…×P(a|A|)+ P(cn|a1,a2,…,a|A|)×P(a1)× P(a2)×…×P(a|A|)+…+ P(cn|a1,a2,…,a|A|)× P(a1)×P(a2)×…×P(a|A|) (18) 步驟5按照上述步驟,將所有層次節(jié)點進(jìn)行概率更新。 由于外部事件出現(xiàn)概率、基準(zhǔn)概率和影響強(qiáng)度值的區(qū)間不確定性,期望效果和中間效果的實現(xiàn)概率必然也為區(qū)間值。而期望效果和中間效果實現(xiàn)概率區(qū)間值的上下界取決于其與上述各關(guān)鍵參數(shù)的相關(guān)關(guān)系。因此,需要根據(jù)式(14)~式(18), 分析子節(jié)點實現(xiàn)概率與各關(guān)鍵參數(shù)的相關(guān)關(guān)系,有定理1~定理4成立,詳見附錄A。由此可知,目標(biāo)節(jié)點實現(xiàn)概率與外部事件出現(xiàn)概率成反比,與基準(zhǔn)概率成正比,與影響強(qiáng)度h值、g值成正比。 考慮到空中作戰(zhàn)具有隨時間演化的動態(tài)特性,在目標(biāo)節(jié)點,即期望效果和中間效果實現(xiàn)概率計算過程中,需要逐階段進(jìn)行,步驟如下。 步驟1對目標(biāo)節(jié)點狀態(tài)進(jìn)行初始化,輸入經(jīng)過一致性檢驗專家知識集結(jié)的各關(guān)鍵參數(shù)。 步驟2根據(jù)作戰(zhàn)專家知識,選取tk-1~tk階段的可行行動策略。 步驟3根據(jù)式(14)~式(18)進(jìn)行概率傳播,生成本作戰(zhàn)階段期望和中間效果實現(xiàn)概率。 步驟4向下一作戰(zhàn)階段傳播期望效果和中間效果實現(xiàn)概率,并同樣根據(jù)式(14)~式(18),計算下一階段目標(biāo)節(jié)點實現(xiàn)概率。 步驟5當(dāng)作戰(zhàn)使命結(jié)束時,計算目標(biāo)函數(shù)值P{dm(tT+1)}。 空中作戰(zhàn)行動過程生成是一個典型的組合優(yōu)化問題,本質(zhì)是優(yōu)選出使得期望效果實現(xiàn)概率最大的行動組合,其主要包括3個關(guān)鍵部分:一是根據(jù)Kendall協(xié)和系數(shù)檢驗法集結(jié)專家知識生成影響強(qiáng)度值;二是根據(jù)DINs計算生成期望效果實現(xiàn)概率;三是采用改進(jìn)區(qū)間優(yōu)化算法優(yōu)選最佳行動過程。如圖4所示,為行動過程優(yōu)選方法框架。 圖4 行動過程優(yōu)選方法框架Fig.4 Framework of COA optimized selection method 從式(4)可知,需要進(jìn)行優(yōu)化的目標(biāo)不止一個,空中作戰(zhàn)行動過程優(yōu)選問題是一個典型的多目標(biāo)優(yōu)化問題,可采用多目標(biāo)優(yōu)化算法進(jìn)行求解,而NSGA-II算法是一種有效求解方法[13]。 該算法根據(jù)快速非支配排序、個體擁擠距離計算以及基于外部檔案的精英保留等策略,對包括選擇、交叉和變異等算子的遺傳算法[14]進(jìn)行拓展,使之能夠高效、穩(wěn)定求解多目標(biāo)優(yōu)化問題。 因此,需要根據(jù)區(qū)間優(yōu)化的特點,對NSGA-II算法進(jìn)行適應(yīng)性改造,主要包括實數(shù)型編解碼方式、基于可能度的區(qū)間數(shù)個體排序、基于期望值和寬度值的區(qū)間數(shù)個體擁擠距離計算,從而有效求解式(4)描述的數(shù)學(xué)模型。 1) 實數(shù)型編解碼方式 考慮到NSGA-Ⅱ算法的迭代特性,采用長度為|A|的實數(shù)型編碼方式。對于不同位置的個體元素,取值范圍各有不同,如對第i個個體元素,取值范圍為(1,|ai|+1),其中,|ai|為作戰(zhàn)行動ai中基本策略的個數(shù)。 2) 基于可能度的區(qū)間數(shù)個體排序 若存在區(qū)間數(shù)U=[uL,uR]和V=[vL,vR],則可以構(gòu)建區(qū)間可能度模型為[15] (19) 根據(jù)式(19),區(qū)間可能度的主要特性如下:① 0≤P(U≤V)≤1成立;② 若P(U≤V)=P(V≤U),則同時有uL=vL,uR=vR成立;③P(U≤V)+P(V≤U)=1成立。 在此基礎(chǔ)上,定義區(qū)間數(shù)個體排序方法。對區(qū)間數(shù)U=[uL,uR]和V=[vL,vR],若P(U≤V)≥0.5,則稱U不大于V;若P(U≤V)≤0.5, 則稱U不小于V;若P(U≤V)>0.5,則稱U小于V;若P(U≤V)<0.5,則稱U大于V。 因此,若染色體Y1對應(yīng)的期望效果實現(xiàn)概率分別為P1{d1(tT+1)}和P1{d2(tT+1)},染色體Y2對應(yīng)的期望效果實現(xiàn)概率分別為P2{d1(tT+1)}和P2{d2(tT+1)}。 1) 若滿足P1{d1(tT+1)}≥P2{d1(tT+1)}且P1{d2(tT+1)}≥于P2{d2(tT+1)},與此同時,若滿足P1{d1(tT+1)}>P2{d1(tT+1)}或P1{d2(tT+1)}>P2{d2(tT+1)},稱Y1優(yōu)于Y2,即有Y1?Y2。 2) 若滿足P1{d1(tT+1)}≤P2{d1(tT+1)}且P1{d2(tT+1)}≤P2{d2(tT+1)},與此同時,若滿足P1{d1(tT+1)} 3) 當(dāng)Y1既不優(yōu)于,也不劣于Y2時,稱Y1等價于Y2,即有Y1~Y2。 改進(jìn)NSGA-II算法搜索目的,是通過多次迭代尋優(yōu),搜索到優(yōu)于其他所有個體的個體集合。 4) 基于期望值和寬度值的區(qū)間數(shù)個體擁擠距離計算 在改進(jìn)NSGA-II算法中,由于規(guī)模限制,某一等級的染色體無法全部進(jìn)入外部檔案,需要根據(jù)個體間擁擠距離計算結(jié)果,排除擁擠距離較小的個體。因此,對區(qū)間數(shù)距離計算主要采用基于期望值和寬度值的廣義EW距離計算方法[16]。 dEW(U,V)= p≥1 (20) 式中:一般取p=2;E(U)=(uL+uR)/2和W(U)=(uR-uL)/2分別為區(qū)間數(shù)U的期望值和寬度值;E(V)和W(V)的計算方法類似。 空中作戰(zhàn)任務(wù)類型眾多,以離岸島嶼攻擊任務(wù)為例。假定敵方在某離岸島嶼構(gòu)建完整作戰(zhàn)防御體系,敵方重要目標(biāo)主要包括作戰(zhàn)指揮中心、雷達(dá)陣地、彈藥庫、機(jī)場以及港口等。我方作戰(zhàn)行動預(yù)期是集中各類作戰(zhàn)力量,摧毀敵方關(guān)鍵作戰(zhàn)目標(biāo),便于下一步奪取島嶼控制權(quán)。 在作戰(zhàn)行動方面,令空中作戰(zhàn)編隊可采取行動集如下。a1:對敵方空中作戰(zhàn)編隊實施空對空攻擊;a2:對敵方水面艦艇實施空對海攻擊;a3:對敵方固定預(yù)定目標(biāo)實施空對地攻擊;a4:對影響固定預(yù)定目標(biāo)攻擊的前序固定非預(yù)定目標(biāo),實施空對地攻擊;a5:對敵方移動預(yù)定目標(biāo)實施空對地攻擊;a6:對影響移動預(yù)定目標(biāo)攻擊的前序移動非預(yù)定目標(biāo),實施空對地攻擊;a7:作戰(zhàn)信息支援;a8:空中截?fù)糇鲬?zhàn);a9:對敵電子干擾;a10:空中加油。 在外部事件方面,由作戰(zhàn)專家根據(jù)作戰(zhàn)知識或作戰(zhàn)歷史數(shù)據(jù)給出事件類型和出現(xiàn)概率,可能的外部事件如下。b1:敵方空中作戰(zhàn)編隊進(jìn)行空中攔截;b2:敵方水面艦艇編隊進(jìn)行對空攔截;b3:敵方地面防空系統(tǒng)進(jìn)行防空作戰(zhàn);b4:敵方對我進(jìn)行電子干擾;b5:島外增援空中作戰(zhàn)編隊參與作戰(zhàn)。 在期望效果方面,主要包括兩類。d1:空中作戰(zhàn)編隊成功完成離岸島嶼攻擊任務(wù);d2:空中作戰(zhàn)編隊任務(wù)執(zhí)行中戰(zhàn)損程度。 在中間效果方面,由我方作戰(zhàn)行動和外部事件共同作用生成,包括如下。c1:空對空攻擊任務(wù)執(zhí)行效果;c2:空對海攻擊任務(wù)執(zhí)行效果;c3:對影響預(yù)定目標(biāo)攻擊的前序非預(yù)定目標(biāo)攻擊任務(wù)執(zhí)行效果;c4:空中作戰(zhàn)編隊攻擊預(yù)定目標(biāo)前空中集結(jié);c5:對預(yù)定目標(biāo)攻擊任務(wù)執(zhí)行效果;c6:空中作戰(zhàn)編隊返航空中集結(jié)。 根據(jù)作戰(zhàn)專家分析,空中作戰(zhàn)編隊執(zhí)行離岸島嶼攻擊任務(wù),可以分為6個作戰(zhàn)階段:①t0~t1階段,對敵方空中攔截作戰(zhàn)編隊進(jìn)行截?fù)?;②t1~t2階段,對敵方海面艦艇進(jìn)行壓制; ③t2~t3階段,對敵方前序固定或移動非預(yù)定目標(biāo)進(jìn)行攻擊;④t3~t4階段,經(jīng)過空中加油后,進(jìn)行預(yù)定目標(biāo)攻擊前的空中集結(jié);⑤t4~t5階段,對敵方固定或移動預(yù)定目標(biāo)進(jìn)行攻擊;⑥t5~t6階段,對敵方島外增援空中作戰(zhàn)編隊進(jìn)行截?fù)艉?,編隊返航?/p> 圖5 離岸島嶼攻擊任務(wù)DINs模型Fig.5 DINs model of offshore island attack mission 表1為經(jīng)過一致性檢驗的外部事件出現(xiàn)概率。表2為根據(jù)專家知識,考慮作戰(zhàn)資源和規(guī)則約束,給出的各作戰(zhàn)階段行動可選策略[11]。 表1 外部事件(EE)出現(xiàn)概率Table 1 Occurrence probabilities of EE 表2 各作戰(zhàn)階段的可選策略Table 2 Alternative strategies for all phases 為驗證模型正確性和算法有效性、優(yōu)越性,在CPU配置為Intel(R) Core(TM) i3 2.27 GHz的計算機(jī)上,基于MATLAB R2010a進(jìn)行多組仿真實驗。其中,實驗1驗證改進(jìn)Kendall協(xié)和系數(shù)檢驗法的有效性;實驗2驗證目標(biāo)節(jié)點實現(xiàn)概率與各關(guān)鍵參數(shù)相關(guān)關(guān)系理論分析的正確性;實驗3和4分別驗證改進(jìn)NSGA-II算法的有效性和優(yōu)越性。 表3為根據(jù)專家知識給出的基準(zhǔn)概率(bp),表4為根據(jù)專家知識,給出的h值和g值取值情況。 采用Kendall協(xié)和系數(shù)檢驗法對h值進(jìn)行一致性檢驗,具有最高權(quán)威度專家組集合為{z1,z2,z3,z6},生成的最終h值分別為[0.36,0.44]、[0.65, 0.72]、[-0.89,-0.78]、[-0.82,-0.77]、 [0.52,0.67]、[0.58,0.67]、[-0.69,-0.59]、[-0.65,-0.57]、[0.41,0.51]、[0.25,0.38]、[-0.84,-0.69]、[0.26,0.35]、[0.52,0.59]、 [0.51,0.62]、[0.66,0.78]、[0.20,0.31]、 [0.51,0.63]、[0.36,0.46]、[0.70,0.82]、 [0.37,0.44]、[-0.49,-0.39]、[0.37,0.47]、[0.28,0.40]、[-0.72,-0.58]、[0.23, 0.30]。 當(dāng)對g值進(jìn)行一致性檢驗生成時,具有最高權(quán)威度專家組集合為{z1,z2,z3,z5},生成的最終g值分別為[-0.55,-0.49]、[-0.68,-0.55]、 [0.23,0.31]、[0.44,0.57]、[-0.40,-0.31]、[-0.66,-0.59]、[0.61,0.71]、[0.42,0.50]、[-0.82,-0.70]、[-0.72,-0.64]、[0.38, 0.48]、[-0.36,-0.23]、[-0.58,-0.49]、 [-0.45,-0.35]、[-0.28,-0.19]、[-0.43,-0.37]、[-0.56,-0.48]、[-0.54,-0.47]、 [-0.56,-0.44]、[-0.33,-0.19]、[0.30, 0.37]、[-0.74,-0.63]、[-0.75,-0.68]、 [0.61,0.71]、[-0.67,-0.56]。 當(dāng)對bp值進(jìn)行一致性檢驗生成時,具有最高權(quán)威度專家組集合為{z1,z2,z3,z5},生成的最終bp值分別為[0.21,0.30]、[0.55,0.65]、[0.31,0.42]、[0.56,0.63]、[0.41,0.54]、[0.53,0.64]、[0.36,0.47]、[0.67,0.75]。 表3 各專家給出的基準(zhǔn)概率(bp)取值情況Table 3 Values of bp given by all experts 表4 各專家給出的h值和g值取值情況Table 4 h and g values given by all experts 圖6為期望效果實現(xiàn)概率隨外部事件出現(xiàn)概率、基準(zhǔn)概率和影響強(qiáng)度值的變化情況。從圖6可以看出,d1和d2的實現(xiàn)概率與外部事件出現(xiàn)概率成反比,與基準(zhǔn)概率和影響強(qiáng)度值成正比,驗證了理論分析的正確性。 仿真實驗3為驗證改進(jìn)NSGA-II算法的有效性,利用相應(yīng)算例參數(shù),進(jìn)行仿真實驗。其中,本文算法的最大迭代次數(shù)gen=100,種群規(guī)模sizepop=30,交叉概率pc=0.9,變異概率pm=0.1。 仿真實驗4為驗證本文算法的優(yōu)越性,將其與多目標(biāo)離散人工蜂群(Multi-Objective Discrete Artificial Bee Colony, MODABC)算法[17]和多目標(biāo)離散粒子群(Multi-Objective Discrete Particle 圖6 期望效果(DEs)實現(xiàn)概率隨各關(guān)鍵參數(shù)變化情況Fig.6 Change in DEs realization probabilities with each key parameter 圖7 典型Pareto最優(yōu)解Fig.7 Typical Pareto optimal solution Swarm Optimization, MODPSO)算法[18]進(jìn)行對比。對比指標(biāo)采用衡量多目標(biāo)優(yōu)化算法的覆蓋性指標(biāo)、均勻性指標(biāo)和寬廣性指標(biāo)[19],其中,覆蓋性指標(biāo)和寬廣性指標(biāo)為效益型指標(biāo),越大越好;均勻性指標(biāo)為成本型指標(biāo),越小越好。對目標(biāo)函數(shù)進(jìn)行歸一后計算指標(biāo)值,各算法均運行20次,取20次運行結(jié)果平均值進(jìn)行對比。 圖8為本文算法與MODABC算法對比情況。圖9為本文算法與MODPSO算法對比情況。 從圖8可以看出,與MODABC算法相比,本文算法在覆蓋性指標(biāo)和均勻性指標(biāo)上都要更優(yōu),在寬廣性指標(biāo)上,在大多數(shù)迭代次數(shù)下,均更優(yōu)。從圖9可以看出,與MODPSO算法相比,本文算法在覆蓋性指標(biāo)和均勻性指標(biāo)上都要更優(yōu),在寬廣性指標(biāo)上,劣于MODPSO算法。因此,相比于其他2種對比算法,本文算法總體上較優(yōu)。 圖8 改進(jìn)NSGA-II算法與MODABC算法的對比Fig.8 Comparison between improved NSGA-II algorithm and MODABC algorithm 圖9 改進(jìn)NSGA-II算法與MODPSO算法的對比Fig.9 Comparison between improved NSGA-II algorithm and MODPSO algorithm 空中作戰(zhàn)COA設(shè)計過程中,存在大量不確定性,為了提高COA設(shè)計的高效性和魯棒性,需要充分考慮這種不確定性。本文針對其中的參數(shù)不確定性,基于區(qū)間優(yōu)化思想構(gòu)建問題模型,在關(guān)鍵參數(shù)確定過程中引入改進(jìn)Kendell協(xié)和系數(shù)檢驗法進(jìn)行專家知識的一致性檢驗,定量分析目標(biāo)節(jié)點實現(xiàn)概率與各關(guān)鍵參數(shù)的相關(guān)關(guān)系,進(jìn)而采用改進(jìn)NSGA-II算法對模型進(jìn)行求解。仿真實驗結(jié)果表明,所提出方法是有效的,且相比其他算法,具有優(yōu)越性。本文研究對于考慮參數(shù)區(qū)間性的空中作戰(zhàn)COA設(shè)計問題具有一定參考價值,下一步,可以將事件隨機(jī)性、決策模糊性等不確定性[20-21]引入空中作戰(zhàn)COA優(yōu)選。 附錄A: 定理1若父節(jié)點A、C對子節(jié)點D有促進(jìn)作用,父節(jié)點B對子節(jié)點D有抑制作用,則子節(jié)點D與父節(jié)點A、C呈正相關(guān)關(guān)系。 證明取簡單情形,假定父節(jié)點集合為{a1,b1,c1},對于子節(jié)點d1,共有8種組合場景,包括{d1|a1,b1,c1}、{d1|a1,b1,c1}、{d1|a1,b1,c1}、{d1|a1,b1,c1}、{d1|a1,b1,c1}、{d1|a1,b1,c1}、{d1|a1,b1,c1}和{d1|a1,b1,c1}。 以父節(jié)點a1為例,定義只有a1狀態(tài)不同,b1和c1狀態(tài)相同的兩個場景,為一對場景對。例如,{d1|a1,b1,c1}和{d1|a1,b1,c1}即為一對場景對;同理,{d1|a1,b1,c1}和{d1|a1,b1,c1}也為一對場景對。 對于場景對{d1|a1,b1,c1}和{d1|a1,b1,c1},在場景{d1|a1,b1,c1}下,影響強(qiáng)度值取為h(a1)>0、h(b1)≤0和h(c1)>0,分別進(jìn)行正、負(fù)影響強(qiáng)度聚合,有PI(a1,b1,c1)=1-[(1-h(a1))×(1-h(c1))],NI(a1,b1,c1)=1-(1+h(b1))成立。類似地,在場景{d1|a1,b1,c1}下,影響強(qiáng)度值取為g(a1)≤0、h(b1)≤0和h(c1)>0,分別進(jìn)行正、負(fù)影響強(qiáng)度聚合,則同樣地,有PI(a1,b1,c1)=1-(1-h(c1)),NI(a1,b1,c1)=1-[(1+h(b1))×(1+g(a1))]成立。 當(dāng)P(a1)=x,0≤x≤1時,有P(a1)=1-x。根據(jù)式(18),P(d1)在上述場景對下的部分項P(d1|b1,c1)可以表示為 P(d1|b1,c1)=P(a1)×P(b1)×P(c1)× P(d1|a1,b1,c1)+P(a1)×P(b1)× P(c1)×P(d1|a1,b1,c1) (A1) 式中:P(d1|a1,b1,c1)和P(d1|a1,b1,c1)的計算主要根據(jù)式(14)~式(17)。 由于影響強(qiáng)度值取值范圍為[-1,1],因此,必定有PI(a1,b1,c1)≥PI(a1,b1,c1),NI(a1,b1,c1)≤NI(a1,b1,c1)成立。根據(jù)式(16)可知,OI與PI呈正相關(guān)關(guān)系,OI與NI呈負(fù)相關(guān)關(guān)系,則有P(d1|a1,b1,c1)≥P(d1|a1,b1,c1)成立。若記S1=P(b1)×P(c1)×P(d1|a1,b1,c1),S2=P(b1)×P(c1)×P(d1|a1,b1,c1),則S1≥S2,式(A1)可簡化為P(d1|b1,c1)=P(a1)×S1+P(a1)×S2。 當(dāng)P(a1)=x+Δx,Δx≥0時,有P(a1)=1-x-Δx成立,P(d1)在相應(yīng)場景對下的部分項變化量為:ΔP(d1|b1,c1)=(x+Δx)×S1+(1-x-Δx)×S2-x×S1-(1-x)×S2=Δx×(S1-S2)≥0。對于其他場景對,均可采用以上證明過程進(jìn)行證明,且可以拓展到更復(fù)雜情形。因此,子節(jié)點D與父節(jié)點A呈正相關(guān)關(guān)系;同樣地,可以證明,子節(jié)點D與父節(jié)點C呈正相關(guān)關(guān)系。 定理2若父節(jié)點A、C對子節(jié)點D有促進(jìn)作用,父節(jié)點B對子節(jié)點D有抑制作用,則子節(jié)點D與父節(jié)點B呈負(fù)相關(guān)關(guān)系。 證明同樣以定理1證明過程中的簡單情形為例,對于場景對{d1|a1,b1,c1}和{d1|a1,b1,c1},在場景{d1|a1,b1,c1}下,影響強(qiáng)度、PI和OI取值情況與定理1中相同。在場景{d1|a1,b1,c1}下,影響強(qiáng)度值取為h(a1)>0、g(b1)>0和h(c1)>0,分別進(jìn)行正、負(fù)影響強(qiáng)度聚合,同樣地,有PI(a1,b1,c1)=1-[(1-h(a1))×(1-g(b1))×(1-h(c1))],NI(a1,b1,c1)=0。 當(dāng)P(b1)=y,0≤y≤1時,有P(b1)=1-y。根據(jù)式(18),P(d1)在上述場景對下的部分項P(d1|a1,c1)可以表示為 P(d1|a1,c1)=P(b1)×P(a1)×P(c1)× P(d1|a1,b1,c1)+P(b1)×P(a1)× P(c1)×P(d1|a1,b1,c1) (A2) 由于影響強(qiáng)度值取值范圍為[-1,1],因此,必有PI(a1,b1,c1)≤PI(a1,b1,c1),NI(a1,b1,c1)≥NI(a1,b1,c1)成立。根據(jù)OI與PI、NI的相關(guān)關(guān)系,則有P(d1|a1,b1,c1)≤P(d1|a1,b1,c1)成立。若記S3=P(a1)×P(c1)×P(d1|a1,b1,c1),S4=P(a1)×P(c1)×P(d1|a1,b1,c1),則S3≤S4,式(A2)可簡化為P(d1|a1,c1)=P(b1)×S3+P(b1)×S4。 當(dāng)P(b1)=y+Δy,Δy≥0時,有P(b1)=1-y-Δy成立,P(d1)在相應(yīng)場景對下的部分項變化量ΔP(d1|a1,c1)=(y+Δy)×S3+(1-y-Δy)×S4-y×S3-(1-y)×S4=Δy×(S3-S4)≤0。對于其他場景對,均可采用以上證明過程進(jìn)行證明,且可以拓展到更復(fù)雜情形。因此,子節(jié)點D與父節(jié)點B呈負(fù)相關(guān)關(guān)系。 定理3若父節(jié)點A、C對子節(jié)點D有促進(jìn)作用,父節(jié)點B對子節(jié)點D有抑制作用,則子節(jié)點D與父節(jié)點的影響強(qiáng)度h值呈正相關(guān)關(guān)系。 證明同樣以定理1證明過程中的簡單情形為例,對于場景對{d1|a1,b1,c1}和{d1|a1,b1,c1},影響強(qiáng)度、PI以及OI的取值情況與定理1中相同。 首先,分析起促進(jìn)作用父節(jié)點的影響強(qiáng)度h值對子節(jié)點D實現(xiàn)概率的影響。在場景{d1|a1,b1,c1}下,當(dāng)h(c1)增大時,則PI(a1,b1,c1)也增大,進(jìn)而導(dǎo)致OI和P(d1|a1,b1,c1)的增大。在場景{d1|a1,b1,c1}下,當(dāng)h(c1)增大時,則PI(a1,b1,c1)也增大,同樣進(jìn)而導(dǎo)致OI和P(d1|a1,b1,c1)的增大。因此,在該場景對下,根據(jù)式(18),P(d1)隨之增大。對于其他場景對,均可采用以上證明過程進(jìn)行證明,且可以拓展到更復(fù)雜情形。 然后,分析起抑制作用父節(jié)點的影響強(qiáng)度h值對子節(jié)點D實現(xiàn)概率的影響。在場景{d1|a1,b1,c1}下,當(dāng)h(b1)增大時,則NI(a1,b1,c1)減小,進(jìn)而導(dǎo)致OI和P(d1|a1,b1,c1)的增大。類似地,在場景{d1|a1,b1,c1}下,當(dāng)h(b1)增大時,則NI(a1,b1,c1)減小,進(jìn)而使OI和P(d1|a1,b1,c1)增大。因此,在該場景對下,根據(jù)式(18),P(d1)隨之增大。對于其他場景對,均可采用以上證明過程進(jìn)行證明,且可以拓展到更復(fù)雜情形。 綜上,子節(jié)點與所有父節(jié)點的影響強(qiáng)度h值呈正相關(guān)關(guān)系。 定理4若父節(jié)點A、C對子節(jié)點D有促進(jìn)作用,父節(jié)點B對子節(jié)點D有抑制作用,則子節(jié)點D與父節(jié)點的影響強(qiáng)度g值呈正相關(guān)關(guān)系。 證明同樣以定理1證明過程中的簡單情形為例,以場景對{d1|a1,b1,c1}和{d1|a1,b1,c1}為例。在場景{d1|a1,b1,c1}下,影響強(qiáng)度值取為g(a1)≤0、g(b1)>0和h(c1)>0,分別進(jìn)行正、負(fù)影響強(qiáng)度聚合,則有PI(a1,b1,c1)=1-[(1-g(b1))×(1-h(c1))],NI(a1,b1,c1)=1-(1+g(a1))成立。在場景{d1|a1,b1,c1}下,影響強(qiáng)度值取為g(a1)≤0、g(b1)>0和g(c1)≤0,進(jìn)行正、負(fù)影響強(qiáng)度聚合,有PI(a1,b1,c1)=1-(1-g(b1)),NI(a1,b1,c1)=1-[(1+g(a1))×(1+g(c1))] 首先,分析起促進(jìn)作用父節(jié)點的影響強(qiáng)度g值對子節(jié)點D實現(xiàn)概率的影響。在場景{d1|a1,b1,c1}下,當(dāng)g(a1)增大時,NI(a1,b1,c1)減小,進(jìn)而導(dǎo)致OI和P(d1|a1,b1,c1)的增大。在場景{d1|a1,b1,c1}下,當(dāng)g(a1)增大時,NI(a1,b1,c1)減小,同樣進(jìn)一步導(dǎo)致OI和P(d1|a1,b1,c1)的增大。因此,在該場景對下,根據(jù)式(18),P(d1)隨之增大。對于其他場景對,均可采用以上證明過程進(jìn)行證明,且可以拓展到更復(fù)雜情形。 然后,分析起抑制作用父節(jié)點的影響強(qiáng)度g值對子節(jié)點D實現(xiàn)概率的影響。在場景{d1|a1,b1,c1}下,當(dāng)g(a1)增大時,PI(a1,b1,c1)也增大,進(jìn)而導(dǎo)致OI和P(d1|a1,b1,c1)的增大。在場景{d1|a1,b1,c1}下,當(dāng)g(a1)增大時,則PI(a1,b1,c1)隨之增大,進(jìn)而導(dǎo)致OI和P(d1|a1,b1,c1)的增大。因此,在該場景對下,根據(jù)式(18),P(d1)隨之增大。對于其他場景對,均可采用以上證明過程進(jìn)行證明,且可以拓展到更復(fù)雜情形。 綜上,子節(jié)點與所有父節(jié)點的影響強(qiáng)度g值呈正相關(guān)關(guān)系。2.2 概率傳播算法
3 行動過程優(yōu)選模型求解
4 仿真實驗分析
4.1 仿真案例設(shè)計
4.2 仿真結(jié)果分析
5 結(jié) 論