李 儉,秦國領(lǐng),張開才,張 輝,吉雪霞
(酒泉衛(wèi)星發(fā)射中心,甘肅 酒泉 732750)
測控系統(tǒng)作為連接航天器和地面站的運(yùn)行中樞,擔(dān)負(fù)著對航天器軌道、姿態(tài)及其工作狀態(tài)跟蹤測量與監(jiān)視控制等任務(wù),成為空間信息對抗的重要目標(biāo)[1]。開展測控系統(tǒng)作戰(zhàn)效能評估,對分析測控系統(tǒng)適應(yīng)不同環(huán)境的能力、探尋測控作戰(zhàn)薄弱環(huán)節(jié)、科學(xué)客觀評價不同測控系統(tǒng)的作戰(zhàn)性能等具有重大意義。常見的評估方法主要有AHP[2]、模糊灰色綜合評估法[3]、灰色關(guān)聯(lián)度[4]、熵權(quán)法[5]、I2TOPSIS[6]等,而測控系統(tǒng)作戰(zhàn)效能評估多以這些常見的評估方法開展靜態(tài)評估。綜合分析發(fā)現(xiàn)存在以下兩點不足:一是評估模型基于裝備固有參數(shù),兼顧人與環(huán)境因素影響的效能評估少,評價結(jié)果往往是靜態(tài)數(shù)值;二是評估模型主要是基于線性與主觀性處理,非線性與主客觀相結(jié)合的處理方法偏少。在實際作戰(zhàn)中,測控系統(tǒng)攻防雙方的對抗可視為一個不完全信息動態(tài)博弈[7-9]的過程,攻防雙方會根據(jù)最大化自身利益的原則來選擇應(yīng)對策略。因此,本文提出一種基于博弈論的測控系統(tǒng)動態(tài)作戰(zhàn)效能評估方法。首先,從設(shè)備固有性能、物品方案成熟度以及操作人員素質(zhì)3個維度構(gòu)建評估指標(biāo)體系;其次,設(shè)計一種非線性指標(biāo)預(yù)處理和復(fù)合權(quán)重多指標(biāo)綜合處理算法;最后,通過分析解析納什均衡解條件下測控系統(tǒng)作戰(zhàn)效能和策略決策。仿真結(jié)果表明,該方法解決了測控系統(tǒng)作戰(zhàn)時干擾方不同進(jìn)攻策略下的效能評估和策略決策問題,具有一定的實用價值。
測控系統(tǒng)作戰(zhàn)效能評估是通過分析測控系統(tǒng)在一定環(huán)境下的作戰(zhàn)性能表現(xiàn)進(jìn)而評估系統(tǒng)遂行任務(wù)的能力?;谀康男?、全面性、客觀性、層次性原則[10-13],影響測控系統(tǒng)作戰(zhàn)效能的因素主要分為3個方面:一是測控設(shè)備固有性能,二是物品方案準(zhǔn)備的成熟程度,三是操作人員的素質(zhì)。構(gòu)建測控系統(tǒng)作戰(zhàn)效能評估的指標(biāo)體系如圖1所示。
圖1 測控系統(tǒng)作戰(zhàn)效能評估指標(biāo)體系
設(shè)備固有性能E1由發(fā)射機(jī)發(fā)射功率E11、天線增益E12、工作帶寬E13、設(shè)備可靠性E14組成,是測控系統(tǒng)完成作戰(zhàn)任務(wù)的先決條件。物品方案成熟度E2反映的是測控設(shè)備實際工作中應(yīng)對突發(fā)意外如設(shè)備故障、天氣變化等依然能夠執(zhí)行任務(wù)的能力,反映了設(shè)備遂行測控任務(wù)的慣性,由備品備件E21、措施方案E22組成。操作人員素質(zhì)E3用來衡量操作人員對測控設(shè)備執(zhí)行任務(wù)時的處理能力,以及應(yīng)對意外的處置和排除故障的能力,是確保測控任務(wù)圓滿完成的關(guān)鍵,由操作熟練度E31、應(yīng)急靈活運(yùn)用E32、綜合排故能力E33組成。
測控系統(tǒng)作戰(zhàn)效能評估是一個多指標(biāo)綜合評估過程。由于評估指標(biāo)的單位、定義域以及屬性各不相同,因此,如果直接使用原始數(shù)據(jù)進(jìn)行評估處理,一方面困難較大,缺乏著手點;另一方面將增加評估難度,增大影響誤差。為解決這些問題需要對指標(biāo)進(jìn)行規(guī)范化處理,主要有線性變換和非線性變換二類方法[14]。為克服指標(biāo)值與規(guī)范化值之間線性化的不足,本文采用非線性變換的半正態(tài)變換對定量指標(biāo)進(jìn)行規(guī)范化處理[15],如圖2所示。當(dāng)指標(biāo)值位于最優(yōu)區(qū)間內(nèi)時,規(guī)范化數(shù)值為1;當(dāng)指標(biāo)取值不在最優(yōu)值區(qū)間內(nèi)時,規(guī)范化函數(shù)采用半正態(tài)變換函數(shù);當(dāng)指標(biāo)取值超出要求值的下限時,規(guī)范化數(shù)值為 0,具體如式(1)所示。
其中,u是系統(tǒng)指標(biāo)的標(biāo)準(zhǔn)值,u1是系統(tǒng)要求最優(yōu)值的臨界點;u2為系統(tǒng)能夠容忍的極值;au2為修正算子。
圖2 升降半正態(tài)函數(shù)
系統(tǒng)指標(biāo)聚合模型是指通過函數(shù)映射將評估指標(biāo)轉(zhuǎn)化為評估結(jié)果的數(shù)學(xué)模型。測控系統(tǒng)作戰(zhàn)防御效能指標(biāo)體系呈現(xiàn)多層次結(jié)構(gòu),任一層次的能力可由下層能力(設(shè)備固有性能指標(biāo)/物品方案成熟度指標(biāo)/操作人員素質(zhì)指標(biāo))聚合而成。下層指標(biāo)對上層指標(biāo)的影響可以分為3類,A類指標(biāo)是一些下層指標(biāo)的變化會導(dǎo)致上層指標(biāo)急劇下降,采用加權(quán)平均算子(Ordered Weighted Averaging,OWA)得到聚合結(jié)果,B類指標(biāo)不會因為個別指標(biāo)的變差而導(dǎo)致上層指標(biāo)急劇下降,采用加權(quán)幾何平均算子(Weighted Geometric Mean,WGM)得到聚合結(jié)果。C類指標(biāo)不會因為個別指標(biāo)的變化導(dǎo)致上層急劇變好,一般來說,C類指標(biāo)不常見。例如有m個A類指標(biāo)和n個B類指標(biāo)的具體表達(dá)式如下:
式中:w=(w1,w2,…,wm)為指標(biāo)集的復(fù)合權(quán)重向量,wi為第i個指標(biāo)的復(fù)合權(quán)重,γ(i)是第i個指標(biāo)預(yù)處理后的值。
針對主觀賦權(quán)和客觀賦權(quán)的優(yōu)缺點,既要兼顧評估主體的偏好,又要盡量克服賦權(quán)的主觀性,使指標(biāo)賦權(quán)達(dá)到主客觀的統(tǒng)一,確保決策結(jié)果真實可信,有必要通過組合賦權(quán)來確定指標(biāo)權(quán)重。本文基于改進(jìn)的熵權(quán)法[5]和改進(jìn)的AHP層次分析法[16],設(shè)計一種主客觀結(jié)合的組合賦權(quán)方法,提高權(quán)重設(shè)置的科學(xué)性。設(shè)w1為改進(jìn)AHP層次分析法確定的權(quán)重向量,w2為改進(jìn)的熵權(quán)法確定的權(quán)重向量,φ為最小二乘法確定的組合賦權(quán)值[17],則復(fù)合權(quán)重公式為:
本文將測控系統(tǒng)作戰(zhàn)的技術(shù)措施和戰(zhàn)術(shù)運(yùn)用稱之為策略,并將干擾方和作戰(zhàn)方之間的測控系統(tǒng)對抗行為建模為二人零和有限博弈的過程,干擾方的損失是作戰(zhàn)方的盈利,兩者盈利之和為零,可以用雙方任何一方的盈利來構(gòu)建盈利函數(shù)[18],由此,建立圖3所示的測控系統(tǒng)作戰(zhàn)效能動態(tài)評估模型。
圖3 測控系統(tǒng)作戰(zhàn)動態(tài)效能評估模型
用AJ表示作戰(zhàn)方,J表示干擾方,假設(shè)作戰(zhàn)方有m種測控系統(tǒng)作戰(zhàn)策略,干擾方有n種進(jìn)攻策略,則作戰(zhàn)方和干擾方的策略集分別為SAJ={AJ1,AJ2,…,AJm}和 SJ={J1,J2,…,Jn},AJ 盡量采取最優(yōu)策略降低作戰(zhàn)時干擾方的影響,而J采取最優(yōu)策略使得作戰(zhàn)時干擾效果最好,兩者目的相反,盈利值之和為零。若用第i種測控系統(tǒng)作戰(zhàn)策略對抗第j種作戰(zhàn)進(jìn)攻策略,記作作戰(zhàn)方的盈利為U(i,j),形成博弈模型為(AJi,Jj,U(i,j))。
本文將系統(tǒng)指標(biāo)聚合權(quán)重得到的作戰(zhàn)方作戰(zhàn)效能E作為其盈利值,即令E=U。假設(shè)設(shè)備固有性能指標(biāo)E1、物品成熟度指標(biāo)E2共有a+b個,其中a個指標(biāo)屬于A類指標(biāo),b個指標(biāo)屬于B類指標(biāo),操作人員素質(zhì)指標(biāo)E3用εi表示。在第i種作戰(zhàn)策略對抗第j種干擾策略下,根據(jù)式(2)構(gòu)建作戰(zhàn)方的盈利函數(shù)如下
在m×n種作戰(zhàn)條件下,最終得到盈利矩陣為U=(U(i,j))mn。根據(jù)最大最小值和最小最大定理,從最不利情形中選取最有利的結(jié)果,對于干擾方J而言,希望作戰(zhàn)干擾效果最佳,而對于作戰(zhàn)方AJ而言,則希望作戰(zhàn)防御的有效程度最好。所以,在雙方均不知道采取何種策略的情況下,AJ不論遇到何種干擾方式,為了保證最低的作戰(zhàn)效果,要保證測控系統(tǒng)作戰(zhàn)效果不小于該值,則作戰(zhàn)方的盈利應(yīng)不少于:
干擾方應(yīng)滿足在作戰(zhàn)方的盈利最小的情況下干擾方的損失最小,則干擾方的損失應(yīng)不多于:
由于干擾方和作戰(zhàn)方是二人零和有限博弈,干擾方的損失是作戰(zhàn)方的盈利,此時對盈利矩陣分析有以下兩種情況:
1)如果作戰(zhàn)方的盈利和干擾方的損失同時滿足:
也即VAJi=VJi,即認(rèn)為博弈達(dá)到了一個平衡狀態(tài),其解稱納什均衡解。此時,可以將 U(i*,j*)稱為作戰(zhàn)方和干擾方的盈利值,也即作戰(zhàn)方處于納什均衡解情況下的作戰(zhàn)防御效能,AJi*、Ji*分別為作戰(zhàn)方和干擾方的最優(yōu)純策略。
2)當(dāng)VAJi≠VJi,在博弈過程中沒有使之達(dá)到平衡的最優(yōu)解,因此,博弈雙方會以概率的最優(yōu)選擇相應(yīng)的策略,這種情況稱為動態(tài)博弈的混合策略。記:
稱X和Y分別為作戰(zhàn)方和干擾方的混合策略集,其中 X={x1,x2,…,xm}和 Y={y1,y2,…,yn}表示博弈雙方進(jìn)行多次對抗時,作戰(zhàn)方和干擾方采取策略AJ1,AJ2,…,AJm和 J1,J2,…,Jn的頻率,并用:
表示作戰(zhàn)方的盈利矩陣。根據(jù)最小最大及最大最小原理,此時作戰(zhàn)方的盈利應(yīng)不少于:
干擾方保證自己的損失不多于:
當(dāng)且僅當(dāng)VJ=VAJ時,可以求出混合策略下的穩(wěn)態(tài)解(X*,Y*),也即應(yīng)滿足:
其中:X*={x*1,x*2,…,x*m}、Y*={y*1,y*2,…,y*n}分別為作戰(zhàn)方和干擾方的“最優(yōu)”混合策略。因此,在采取這種“最優(yōu)”混合策略的條件下,對應(yīng)的作戰(zhàn)方的效能是最穩(wěn)定的,作戰(zhàn)方不論遇到何種干擾方式都能保證其測控系統(tǒng)作戰(zhàn)防御效果不小于該值。
分別以測控設(shè)備、干擾機(jī)為作戰(zhàn)方、干擾方建立上述測控系統(tǒng)作戰(zhàn)動態(tài)評估模型,根據(jù)圖1的測控系統(tǒng)作戰(zhàn)效能評估指標(biāo)體系來采集數(shù)據(jù),其樣本數(shù)據(jù)來源于測控設(shè)備相關(guān)指標(biāo)參數(shù)。測控系統(tǒng)的作戰(zhàn)效能評估模型參考圖3,相應(yīng)的測控系統(tǒng)的策略集如下:
測控設(shè)備AJ的測控系統(tǒng)作戰(zhàn)策略集AJ={AJ1,AJ2,AJ3},其中 AJ1表示自頻率跟蹤,AJ2表示改變跟蹤方式,AJ3表示自檢并替換故障設(shè)備。干擾機(jī)J的進(jìn)攻策略集為 J={J1,J2,J3},其中 J1表示窄帶干擾,J2表示寬帶干擾,J3表示設(shè)備故障。
由于作戰(zhàn)方被動受到干擾方的進(jìn)攻,故只考慮作戰(zhàn)方操作人員對3種策略的綜合掌握程度,其分別為 0.85、0.9、1。
Step 1:根據(jù)測控系統(tǒng)作戰(zhàn)策略的內(nèi)容并參考相應(yīng)資料,建立對應(yīng)的評估指標(biāo)集,則策略AJ1的評估指標(biāo)為 E={E11,E12,E13,E14,E22},策略 AJ2的評估指標(biāo)為 E={E14,E22},策略 AJ3的評估指標(biāo)為 E={E14,E21,E22}。
Step 2:參考相關(guān)文獻(xiàn)確定指標(biāo)規(guī)范數(shù)據(jù)及類型,并進(jìn)行定性評分和指標(biāo)的規(guī)范化處理[19]。定性評分采用5級評語集{極差、較差、一般、良好、優(yōu)},用{S1,S2,S3,S4,S5}來表示,對應(yīng)的量化值{C1,C2,C3,C4,C5},為提高評估的準(zhǔn)確性,延伸其相應(yīng)的量化區(qū)間為[0,0.01]、[0.01,0.25]、[0.25,0.5]、[0.5,0.75]、[0.75,1]。指標(biāo)數(shù)據(jù)參考式(1)可到定量指標(biāo)相應(yīng)的半升降函數(shù) u,u1,u2,σu2的值,具體如表1所示。
表1 指標(biāo)的半升降函數(shù)構(gòu)建值
根據(jù)指標(biāo)歸一化式(1),指標(biāo)的規(guī)范化信息如表2所示。
表2 測控裝備在不同條件下的指標(biāo)信息
Step 3:根據(jù)專家指標(biāo)函數(shù),仿真得到采用A型指標(biāo)聚合模型的權(quán)重為 wA=(0.490 8,0.227 6,0.281 5),同理采用B型指標(biāo)聚合模型的權(quán)重為wB=(0.221 3,0.350 7,0.428 0)。
Step 4:根據(jù)文中的構(gòu)建的盈利函數(shù)式(4),依照上述的數(shù)據(jù)值可求得作戰(zhàn)雙方在(AJ1,J1)、(AJ1,J2)、(AJ1,J3)、(AJ2,J1)、(AJ2,J2)、(AJ2,J3)、(AJ3,J1)、(AJ3,J2)、(AJ3,J3)對抗后的作戰(zhàn)防御效能,結(jié)果如表3所示,并由此組成盈利矩陣U。
表3 不同對抗策略下的盈利矩陣
對表3的盈利矩陣進(jìn)行分析,得到測控系統(tǒng)作戰(zhàn)的最少盈利為0.201 6,即遙測裝備所能達(dá)到的作戰(zhàn)效果不低于0.201 6;當(dāng)干擾方的損失至多為0.201 6,此時VAJ=VJ,可以求出納什均衡解,即作戰(zhàn)方和干擾方雙方在不知道對方策略的情況下,會按照納什均衡選擇最穩(wěn)定的對抗策略,本案例中干擾機(jī)會選擇J3的干擾策略,即選擇物理干擾,使測控設(shè)備出現(xiàn)問題;而測控裝備會選擇AJ3的電子作戰(zhàn)策略,即選擇采取自檢并替換故障設(shè)備。
由于在實際作戰(zhàn)環(huán)境中,對測控設(shè)備而言干擾方的電子進(jìn)攻策略是未知的,通過博弈分析,測控設(shè)備在未知干擾方電子干擾策略的條件下,選擇對自己最有利的電子作戰(zhàn)防御策略,以確保任何情況下自身的效能發(fā)揮達(dá)到最大。表3是在已知干擾機(jī)電子進(jìn)攻策略的條件下,對測控設(shè)備電子防御效能的一種預(yù)測評估。對表3中的數(shù)據(jù)進(jìn)一步進(jìn)行分析可知,對抗 J1、J2、J3的“最佳”作戰(zhàn)防御措施分別 AJ1、AJ2、AJ3,對應(yīng)的作戰(zhàn)防御效能分別為 0.4507、0.4455、0.4417。其中(AJ1,J1)的作戰(zhàn)防御效能最高為 0.4507,綜合評價為良好。這與先驗知識是相符的。
本文針對測控系統(tǒng)動態(tài)作戰(zhàn)效能評估研究不足的問題,提出了一種博弈論評估方法。通過構(gòu)建評估指標(biāo)體系,從博弈論視角實現(xiàn)了多指標(biāo)的動態(tài)作戰(zhàn)效能評估,為作戰(zhàn)方的效能分析和策略決策提供了一種可行的評估方法。與傳統(tǒng)評估方法相比,對提高測控裝備的效能發(fā)揮和指導(dǎo)測控作戰(zhàn)決策有一定的價值。