李常雙,胡建軍,周飛飛,趙喜慶(軍事交通學(xué)院,天津300161)LI Chang-shuang,HU Jian-jun,ZHOU Fei-fei,ZHAO Xi-qing(Academy of Military Transportation,Tianjin 300161,China)
隨機(jī)環(huán)境下鐵路軍事運(yùn)輸保障作戰(zhàn)模擬決策方法研究
Study on Decision-making in Simulation of Military Railway Transport Guarantee under Stochastic Condition
李常雙,胡建軍,周飛飛,趙喜慶(軍事交通學(xué)院,天津300161)
LI Chang-shuang,HU Jian-jun,ZHOU Fei-fei,ZHAO Xi-qing(Academy of Military Transportation,Tianjin 300161,China)
以博弈論為基礎(chǔ),以戰(zhàn)時(shí)鐵路軍事運(yùn)輸保障為背景,建立了紅藍(lán)雙方動(dòng)態(tài)非接觸對(duì)抗的決策模型;針對(duì)戰(zhàn)時(shí)鐵路軍事運(yùn)輸保障決策中的隨機(jī)問(wèn)題,提出了天氣影響因子和隨機(jī)影響因子,反映戰(zhàn)場(chǎng)隨機(jī)環(huán)境對(duì)紅藍(lán)雙方的影響,并建立了隨機(jī)期望值決策模型。通過(guò)模擬,合理設(shè)置戰(zhàn)場(chǎng)隨機(jī)狀態(tài),客觀分析輸送過(guò)程,為戰(zhàn)時(shí)鐵路軍事運(yùn)輸保障決策提供有力的決策支持,方法直觀、有效,具有很好的應(yīng)用前景。
鐵路軍事運(yùn)輸保障;隨機(jī)環(huán)境;決策;博弈論
Abstract:This paper on the basis of game theory,and taking the military railway transport guarantee on war time as the background,we established an opposed dynamic and non-contact decision-making model.Aiming at the problems in military decision-making under stochastic condition in uncertainty, we put forward the factors of weather and stochastic influence, which reflects the influence of stochastic condition on the red and the blue,and establishes stochastic opposed decisionmaking models in anticipant value and in correlative chance way farther.It can be seen from the simulating results that the models can dispose the stochastic status in battlefield reasonably,analyse the transport result impersonally,and offer a powerful decision-making sustaining for military command and control.The proposed method is very practical and effective, and has a good applying future.
Key words:military railway transport guarantee;stochastic condition;decision-making;game theory
Study on Decision-making in Simulation of Military Railway Transport Guarantee under Stochastic Condition
作戰(zhàn)指揮決策是為完成和依據(jù)各種條件而進(jìn)行的選擇作戰(zhàn)目標(biāo)和選擇實(shí)現(xiàn)目標(biāo)行動(dòng)策略的思維活動(dòng)。其中,每項(xiàng)指揮活動(dòng)都是一個(gè)不確定性的動(dòng)態(tài)過(guò)程,最終的決策效果取決于動(dòng)態(tài)過(guò)程中每一決策階段的局勢(shì)都要朝著有利于自己的方向發(fā)展。信息化條件下的戰(zhàn)爭(zhēng),戰(zhàn)場(chǎng)空間增大,交戰(zhàn)空間減小,前后方的概念日益模糊,因此,鐵路軍事運(yùn)輸始終在高強(qiáng)度的對(duì)抗環(huán)境中進(jìn)行。此外,由于信息化戰(zhàn)爭(zhēng)的復(fù)雜性、隱蔽性、欺騙性、對(duì)抗性越來(lái)越凸顯,大量的決策可能在不確定環(huán)境中進(jìn)行,因此,研究不確定條件下的動(dòng)態(tài)指揮決策優(yōu)化方法及其應(yīng)用顯得非常重要。針對(duì)以上問(wèn)題,本文以戰(zhàn)時(shí)鐵路運(yùn)輸保障非接觸對(duì)抗環(huán)境為背景,在一般博弈論的基礎(chǔ)上,建立了隨機(jī)環(huán)境下動(dòng)態(tài)決策模型,并進(jìn)行模擬驗(yàn)證。
設(shè)定戰(zhàn)時(shí)鐵路軍事運(yùn)輸保障作戰(zhàn)模擬的對(duì)抗雙方為紅方機(jī)動(dòng)方(記為Y),藍(lán)方阻撓方(記為B)。紅方包含多個(gè)列車梯隊(duì)Yi=(Y1,Y2,…,Ym),主要任務(wù)是在藍(lán)方阻撓破壞的情況下選擇最優(yōu)策略,使總延誤時(shí)間最??;藍(lán)方包含空中打擊力量Bj=(B1,B2,…,Bq),主要任務(wù)是對(duì)紅方機(jī)動(dòng)徑路上的關(guān)鍵點(diǎn)進(jìn)行打擊以阻撓紅方機(jī)動(dòng);本文模擬的是運(yùn)輸過(guò)程中的動(dòng)態(tài)決策方法,因此不考慮裝卸載過(guò)程。由于戰(zhàn)時(shí)鐵路軍事運(yùn)輸對(duì)抗環(huán)境的特點(diǎn),機(jī)動(dòng)方與阻撓方?jīng)]有直接的火力交互,雙方的決策收益通過(guò)路網(wǎng)空間R=(E,V)反應(yīng)。
基于動(dòng)態(tài)規(guī)劃的思想,采用模擬的方法將運(yùn)輸過(guò)程按若干時(shí)域離散化為K個(gè)階段。紅藍(lán)雙方及路網(wǎng)的階段狀態(tài)空間模型如下:
式1表示階段k時(shí)紅方機(jī)動(dòng)與搶修狀空間,式2表示k階段藍(lán)方武器平臺(tái)狀態(tài)空間,式3表示路網(wǎng)在階段k節(jié)點(diǎn)與路段狀態(tài)空間。
2.1 隨機(jī)環(huán)境影響因子建模
由于軍事運(yùn)輸過(guò)程中的復(fù)雜性、隱蔽性、欺騙性和對(duì)抗性,使得獲取信息的難度越來(lái)越復(fù)雜,大量的決策均在不確定環(huán)境中進(jìn)行。同時(shí),眾多的不確定因素對(duì)決策的影響是很大的,在眾多不確定因素中,一般的,天氣因素對(duì)鐵路運(yùn)輸?shù)挠绊戄^小,但在戰(zhàn)時(shí)軍事運(yùn)輸中,對(duì)藍(lán)方的空中打擊和紅方的搶修/搶建影響更為直觀和直接。本文考慮將隨機(jī)環(huán)境下的隨機(jī)因素劃分為基于Markov chain的隨機(jī)天氣模型以及影響雙方?jīng)Q策收益的隨機(jī)因素影響因子兩種模型,其中,隨機(jī)因素影響因子模型用以反映情報(bào)偵察、戰(zhàn)場(chǎng)評(píng)估等隨機(jī)因素的影響。
2.1.1 基于Markov chain的隨機(jī)天氣模型
將輸送模擬過(guò)程中的天氣影響程度分為3級(jí):1級(jí)、2級(jí)、3級(jí),其中1級(jí)最好,3級(jí)最差。天氣狀態(tài)更新的時(shí)間同樣為階段k的時(shí)間步長(zhǎng),共有K個(gè)更新周期。設(shè)節(jié)點(diǎn)i區(qū)域Ai處在階段k的天氣狀態(tài)為ai()k,狀態(tài)空間為{1,2,3},由于共有N個(gè)區(qū)域,可知該天氣模型是一個(gè)有4NK種狀態(tài)的馬爾科夫鏈。定義pwij(k)為當(dāng)前階段天氣狀態(tài)i,下個(gè)階段變?yōu)閖的轉(zhuǎn)移概率。天氣因素對(duì)紅藍(lán)雙方的活動(dòng)影響通常通過(guò)定性分析或以經(jīng)驗(yàn)值進(jìn)行估計(jì),很難確定準(zhǔn)確的分布函數(shù)。本文假設(shè)天氣影響隨機(jī)變量ζIa(k)∈(1,+∞)表示階段k在節(jié)點(diǎn)v處天氣狀態(tài)ai(k)對(duì)紅藍(lán)雙方策略收益的影響程度,則天氣影響因子χIi(k)=pwij(k)·ζIa(k)。
2.1.2 隨機(jī)因素影響因子建模
正態(tài)分布函數(shù)常用于描述眾多獨(dú)立隨機(jī)因素共同作用下的影響,這里設(shè)戰(zhàn)場(chǎng)環(huán)境下情報(bào)狀況及戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估等若干隨機(jī)因素對(duì)雙方策略收益的綜合影響為服從正態(tài)分布N( μ,σ)的隨機(jī)變量ξji(k),其中,μ∈[-1,1],σ∈[0,1]。當(dāng)μ∈[-1,0]時(shí),表示作戰(zhàn)平臺(tái)受到了隨機(jī)環(huán)境的負(fù)面影響,決策收益有所減少;當(dāng)μ∈[0,1]時(shí),表示作戰(zhàn)平臺(tái)受到了隨機(jī)環(huán)境的正面影響,決策收益有所增強(qiáng)。故,正態(tài)分布隨機(jī)變量ξji(k),i={1,2,…,n},j={1,2}定義為階段k節(jié)點(diǎn)i處隨機(jī)變量對(duì)紅藍(lán)雙方的影響程度。λji(k)為隨機(jī)影響因子,表示戰(zhàn)場(chǎng)隨機(jī)影響因子階段k節(jié)點(diǎn)i處對(duì)紅藍(lán)雙方的影響程度,j={1,2}。為了度量其對(duì)各作戰(zhàn)平臺(tái)的實(shí)際影響,取隨機(jī)變量的正弦值,將各隨機(jī)變量產(chǎn)生的影響范圍度量在(0,2)之間,有:
2.2 紅方?jīng)Q策目標(biāo)模型
紅方的決策目標(biāo)包含機(jī)動(dòng)決策與搶修/搶建模型,由于加入了隨機(jī)影響因子,由確定性函數(shù)轉(zhuǎn)變?yōu)椴淮_定性函數(shù),因此,采用期望值算法[1],將目標(biāo)函數(shù)變?yōu)橄鄬?duì)確定性的問(wèn)題。
2.2.1 基于路網(wǎng)可靠性的紅方機(jī)動(dòng)模型
石玉峰在文獻(xiàn)[2]中提出了基于可靠性的戰(zhàn)時(shí)隨機(jī)運(yùn)輸時(shí)間的路徑優(yōu)化模型,本文在文獻(xiàn)[2]的基礎(chǔ)上提出建立隨機(jī)環(huán)境下的機(jī)動(dòng)模型,將問(wèn)題轉(zhuǎn)化為多階段離散狀態(tài)下,求置信水平下,任務(wù)完成時(shí)間T的悲觀值,即T最小值,得出各階段k所對(duì)應(yīng)的最優(yōu)機(jī)動(dòng)路徑。
其中,T為目標(biāo)函數(shù),即為輸送完成的最小時(shí)限,E(T)表示輸送完成的期望時(shí)間,E( Tij(k))表示通過(guò)節(jié)點(diǎn)i的路徑ij的期望時(shí)間,α為T不超過(guò)T的置信水平,V為路網(wǎng)的節(jié)點(diǎn)集合,χ1i(k),λ1i(k)分別為階段k時(shí),節(jié)點(diǎn)i處影響紅方的天氣影響因子和隨機(jī)環(huán)境影響因子。
2.2.2 搶修/搶建目標(biāo)模型
符號(hào)說(shuō)明:
qi(k)表示第k階段節(jié)點(diǎn)i可投入的搶修力量。搶修力量包括人員、器材、機(jī)械工具等。
Q總表示整個(gè)作戰(zhàn)階段可投入的搶修力量總量。
Q作業(yè)面表示節(jié)點(diǎn)i受打擊后,最大作業(yè)面可展開(kāi)的搶修力量。
q'i(k)表示k階段節(jié)點(diǎn)i可提供的搶修等級(jí),與毀傷等級(jí)相對(duì)應(yīng)。
Di(k)表示第k階段節(jié)點(diǎn)i的毀傷等級(jí)。
其中,式(4)為目標(biāo)函數(shù),E( Tij(k))為第k階段紅方搶修/搶建策略下經(jīng)過(guò)路網(wǎng)中節(jié)點(diǎn)i的徑路期望通過(guò)時(shí)間;式(5)表示β置信水平下,紅方搶修/搶建策略;式(6)中有:搶修弧ij的通過(guò)期望時(shí)間(搶修收益):
搶建弧ij的通過(guò)期望時(shí)間(搶建收益):
T集(k)表示滿足節(jié)點(diǎn)i搶修/搶建等級(jí)下的保障力量的最小集結(jié)時(shí)間;E (T修(k ))E (T建(k))分別表示搶修/搶建滿足通車條件(平均行駛速度不低于30km/h)的平均期望時(shí)間;T(k)T(k)表示通過(guò)節(jié)點(diǎn)i的平均通過(guò)時(shí)修通建通間。
式(7)代表?yè)屝蘖α考s束,式(8)代表作業(yè)條件約束,式(9)代表?yè)屝薜燃?jí)約束。
2.3 藍(lán)方阻撓模型的建立
由于戰(zhàn)時(shí)鐵路網(wǎng)中影響車流量和通過(guò)時(shí)間的樞紐站、區(qū)間段上的橋梁、隧道等目標(biāo)易受打擊,在路網(wǎng)變形,將這些易受打擊破壞的目標(biāo)轉(zhuǎn)化為節(jié)點(diǎn),進(jìn)而考慮路網(wǎng)最短路關(guān)鍵點(diǎn)與關(guān)鍵邊的問(wèn)題。文獻(xiàn)[3]建立了基于關(guān)鍵點(diǎn)與關(guān)鍵邊算法的藍(lán)方阻撓模型,藍(lán)方阻撓模型的實(shí)質(zhì)在于對(duì)路網(wǎng)最短路關(guān)鍵點(diǎn)和關(guān)鍵邊的選擇上,因此路網(wǎng)最短路關(guān)鍵點(diǎn)與關(guān)鍵邊的確定是建立模型的基礎(chǔ)。在此基礎(chǔ)上,引入隨機(jī)影響因子,采用期望值[1]算法將模型轉(zhuǎn)化為相對(duì)確定性問(wèn)題。將問(wèn)題轉(zhuǎn)化為γ置信水平下,藍(lán)方選擇打擊當(dāng)前路網(wǎng)上影響紅方輸送的關(guān)鍵節(jié)點(diǎn),使阻撓紅方機(jī)動(dòng)時(shí)間最大。
模型的假設(shè)條件:
①藍(lán)方對(duì)節(jié)點(diǎn)目標(biāo)打擊后視為目標(biāo)毀傷程度劃分為3級(jí):破壞、嚴(yán)重破壞、摧毀,對(duì)應(yīng)的通過(guò)能力分別下降30%、60%、100%;通過(guò)能力的下降以通過(guò)時(shí)間延遲反映。
②路網(wǎng)結(jié)構(gòu)經(jīng)過(guò)變形刪除禁止點(diǎn),并將橋梁等目標(biāo)表示為節(jié)點(diǎn)形式,根據(jù)假想敵美軍相關(guān)軍事理論,模擬中只考慮打擊路網(wǎng)關(guān)鍵節(jié)點(diǎn)以達(dá)到作戰(zhàn)企圖。
建立模型:
圖1 抽象路網(wǎng)
符號(hào)定義如下:
V1——原路網(wǎng)最短路集合
V——未被破壞的路網(wǎng)最短路集合
V——藍(lán)方路網(wǎng)目標(biāo)集合
Xi——通過(guò)節(jié)點(diǎn)i的列車數(shù)
ti——列車通過(guò)節(jié)點(diǎn)i的平均時(shí)間
mi——藍(lán)方投入到第i個(gè)打擊點(diǎn)的打擊力量數(shù)
n——藍(lán)方單個(gè)打擊力量攜彈單位
pit——第i個(gè)節(jié)點(diǎn)的突防概率
pim——藍(lán)方對(duì)第i個(gè)節(jié)點(diǎn)的命中概率
M——藍(lán)方可動(dòng)用的打擊力量
Tg——藍(lán)方預(yù)定遲滯時(shí)間
Ni——損毀第i個(gè)節(jié)點(diǎn)所需彈藥數(shù)
α——藍(lán)方可以接受的損失率
3.1 初始條件設(shè)定
圖1為某路網(wǎng)的抽象圖,模擬背景設(shè)定為紅方開(kāi)始從s點(diǎn)至t點(diǎn)的一次輸送,藍(lán)方集結(jié)空中打擊力量,阻撓紅方輸送,對(duì)紅方當(dāng)前輸送路網(wǎng)上的關(guān)鍵節(jié)點(diǎn)進(jìn)行打擊,以達(dá)到延遲紅方機(jī)動(dòng)、割裂紅方態(tài)勢(shì)部署的目的。表1和表2分別表示不同天氣條件下藍(lán)方突防概率和命中率,表3表示節(jié)點(diǎn)i受藍(lán)方打擊后,通過(guò)節(jié)點(diǎn)i的弧ij滿足最低通行條件的最小增加時(shí)間的期望值。
模擬共進(jìn)行了K步,初始參數(shù)如表中數(shù)值設(shè)定,天氣狀態(tài)和隨機(jī)影響因子采用蒙特卡洛方法進(jìn)行模擬,取第k階段為例,紅方可選策略:A,當(dāng)前路網(wǎng)最短路輸送;B,等待路徑上節(jié)點(diǎn)搶修/搶建;C,選擇繞行徑路;D,選擇其他方式輸送;藍(lán)方可選策略:E,打擊當(dāng)前路網(wǎng)上的關(guān)鍵節(jié)點(diǎn);F,不打擊。
3.2 模擬結(jié)果及分析
表1 藍(lán)方突防概率
表2 藍(lán)方對(duì)節(jié)點(diǎn)i的命中率
表3 通過(guò)節(jié)點(diǎn)i的最小增加時(shí)間
應(yīng)用Game bit博弈分析工具進(jìn)行均衡求解。(1)在未考慮天氣影響因素和隨機(jī)環(huán)境影響因子的情況下,得到策略均衡點(diǎn):s*1(k)=(A,A,B,A,A,A,B,A,A),輸送徑路為s-1-4-t;s*2=(F,F,E,F,F,E,F,F,F)。(2)引入隨機(jī)影響因子,對(duì)決策目標(biāo)函數(shù)進(jìn)行蒙特卡洛模擬,得到均衡點(diǎn)s*1(k)=(C,A,A,A,D),輸送徑路s-2-5,變?yōu)槠渌绞捷斔?,s*2(k)=(F,F,E,F,F)??梢钥吹?,隨機(jī)環(huán)境的影響對(duì)雙方?jīng)Q策的選擇均產(chǎn)生了影響,隨機(jī)影響因子對(duì)輸送過(guò)程產(chǎn)生了不可忽視的影響。
本文以隨機(jī)環(huán)境下的鐵路軍事運(yùn)輸保障為背景,主要研究了以博弈論為基礎(chǔ)的隨機(jī)環(huán)境下的鐵路軍事運(yùn)輸保障決策問(wèn)題,建立了動(dòng)態(tài)非直接火力交互對(duì)抗的決策模型,并根據(jù)戰(zhàn)場(chǎng)隨機(jī)環(huán)境對(duì)各參戰(zhàn)平臺(tái)的影響,提出了天氣影響因子和隨機(jī)影響因子,建立隨機(jī)期望值對(duì)抗決策模型。模擬結(jié)果表明,隨機(jī)影響因子的設(shè)置可以使得鐵路軍事運(yùn)輸保障作戰(zhàn)模擬更加貼近真實(shí)環(huán)境。建立隨機(jī)環(huán)境下的紅藍(lán)雙方?jīng)Q策模型,分析戰(zhàn)場(chǎng)隨機(jī)環(huán)境對(duì)鐵路軍事運(yùn)輸保障指揮決策的影響,為戰(zhàn)時(shí)鐵路軍事運(yùn)輸保障指揮決策提供了有力的輔助決策依據(jù),具有良好的應(yīng)用前景。
[1]劉寶碇,趙瑞清,王綱.不確定規(guī)劃及應(yīng)用[M].北京:清華大學(xué)出版社,2003:61-110.
[2]石玉峰.戰(zhàn)時(shí)隨機(jī)運(yùn)輸時(shí)間路徑優(yōu)化研究[J].系統(tǒng)工程理論與實(shí)踐,2005(4):133-136.
[3]李常雙,李庚.戰(zhàn)時(shí)鐵路軍事運(yùn)輸保障模擬藍(lán)方阻撓模型研究[J].軍事交通學(xué)院學(xué)報(bào),2010(5):18-20.
[4]張莉,張安.隨機(jī)環(huán)境下編隊(duì)協(xié)同對(duì)地攻防對(duì)抗決策方法分析與研究[J].兵工學(xué)報(bào),2007(10):1229-1233.
[5]戴玲,夏學(xué)知.基于Markov天氣模型的流量管理改航策略[J].艦船電子工程,2007(4):57-59.
[6]A.Nilim,L.El Ghaou,i V.Duong,M.Hansen.Trajectory based air traffic management(tb-atm)under weather uncertainty [C]//In Proc.of the Fourth International Air Traffic Management R&D Seminar ATM,Santa Fe,NewMexico,2001:5-6.
F530
A
1002-3100(2010)10-0106-05
2010-07-06
李常雙(1984-),男,內(nèi)蒙古通遼人,軍事交通學(xué)院研究生管理大隊(duì)軍事運(yùn)籌學(xué)專業(yè)碩士研究生,研究方向:作戰(zhàn)軍交運(yùn)輸保障模擬、車輛路徑優(yōu)化問(wèn)題。