薄 云,廖學(xué)軍,白洪波,白 宇
(1.航天工程大學(xué)研究生院,北京 101416;2.中國白城兵器試驗中心,吉林 白城 137001;3.航天工程大學(xué)航天保障系,北京 102206;4.國防大學(xué)聯(lián)合勤務(wù)學(xué)院,北京 100039)
作戰(zhàn)試驗是我軍體制機制改革在武器裝備試驗鑒定領(lǐng)域的重點內(nèi)容,它強調(diào)“打仗怎么打,試驗就怎么試”,是實戰(zhàn)化導(dǎo)向在武器裝備試驗鑒定領(lǐng)域最重要體現(xiàn)[1-2],對于提升試驗鑒定服務(wù)實戰(zhàn)的綜合效益具有重要推動作用。截至目前,我軍作戰(zhàn)試驗在運行機制、內(nèi)容設(shè)計、任務(wù)策劃、組織實施、環(huán)境保障等方面已形成一批研究成果[3-6],在各軍兵種、各級、各類、各型武器裝備方面也已積累大量任務(wù)經(jīng)驗[1,7-9]。
為推動我軍武器裝備作戰(zhàn)試驗進一步發(fā)展,必須深化作戰(zhàn)試驗底層機理研究??己酥笜俗鳛樽鲬?zhàn)試驗任務(wù)組織出發(fā)點和結(jié)果評估落腳點,其遴選科學(xué)性將深刻影響作戰(zhàn)試驗任務(wù)組織有效性和鑒定結(jié)論正確性。本文概述了作戰(zhàn)試驗指標考核過程,討論了考核指標數(shù)據(jù)特性,仿真演示并總結(jié)歸納了考核結(jié)果規(guī)律,探討了遴選指標的具體準則,可為后續(xù)任務(wù)提供有益參考。
我軍自2015 年啟動試驗鑒定體制機制改革以來,將武器裝備的全壽命周期試驗活動劃分為3 類,分別是性能試驗、作戰(zhàn)試驗和在役考核[1]。其中,作戰(zhàn)試驗是軍方以“用戶”身份模擬被試武器裝備實戰(zhàn)過程,針對被試武器裝備引申自作戰(zhàn)使命的一系列考核指標,檢驗并評估被試武器裝備履行既定作戰(zhàn)任務(wù)的完成情況和適用情況。具體過程包括5 個環(huán)節(jié):
1)指標構(gòu)建環(huán)節(jié)。主要依據(jù)作戰(zhàn)使命,分解武器裝備的關(guān)鍵作戰(zhàn)任務(wù)。再圍繞這些關(guān)鍵作戰(zhàn)任務(wù),以指標的形式度量武器裝備的作戰(zhàn)效能水平及作戰(zhàn)適用性水平,即構(gòu)建了武器裝備的指標體系。
2)試驗策劃環(huán)節(jié)。主要依據(jù)指標體系,設(shè)計試驗方案,確定如何考核單項指標、綜合評價武器裝備某方面或整體能力;設(shè)計作戰(zhàn)想定,確定如何模擬武器裝備作戰(zhàn)背景;確定資源保障方案,確定人員、裝備、設(shè)備、場地、耗材等資源需求;計算試驗日程,確定試驗具體的日程計劃安排;編訂應(yīng)急方案,針對可能危及人身財產(chǎn)安全,或因技術(shù)故障無法繼續(xù)試驗的情況,確定處置措施。
3)試驗準備環(huán)節(jié)。主要審核武器裝備是否具備開展作戰(zhàn)試驗的基本條件;開展人員培訓(xùn);協(xié)調(diào)裝備、設(shè)備、場地,及耗材等資源。
4)任務(wù)實施環(huán)節(jié)。主要是依據(jù)策劃環(huán)節(jié)的試驗方案開展試驗考核,采集試驗數(shù)據(jù)。
5)結(jié)果評估環(huán)節(jié)。主要是對任務(wù)實施環(huán)節(jié)采集的數(shù)據(jù)進行處理,得出單項指標檢驗結(jié)果和綜合評估結(jié)果,給出是否通過鑒定的決策建議和裝備改進、戰(zhàn)法應(yīng)用的具體意見。
可以看出作戰(zhàn)試驗考核指標選取對于作戰(zhàn)試驗各環(huán)節(jié)都有影響。應(yīng)充分反映被試武器裝備的作戰(zhàn)能力需求,即全面涵蓋武器裝備作戰(zhàn)效能與作戰(zhàn)適用性的考核場景[5-6,8-9],且作為作戰(zhàn)試驗任務(wù)組織出發(fā)點和檢驗評估落腳點,其影響主要表現(xiàn)在4 個方面:
1)影響作戰(zhàn)試驗全程有效性。如果指標反映武器裝備關(guān)鍵作戰(zhàn)問題的本質(zhì)屬性,那么作戰(zhàn)試驗就可以非常公正客觀地衡量并評判武器裝備作戰(zhàn)效能與作戰(zhàn)適用性需求的達成情況。
2)影響作戰(zhàn)試驗進度高效性。如果指標缺乏良好的數(shù)據(jù)特征,不僅難以基于數(shù)據(jù)科學(xué)高效設(shè)計試驗方案[10],更加嚴重的是,難以回答試驗應(yīng)當試多少次,即樣本量估算的問題。
3)影響作戰(zhàn)試驗成本經(jīng)濟性。如果選擇了不合適指標,作戰(zhàn)試驗不僅影響任務(wù)進程,而且會導(dǎo)致作戰(zhàn)試驗成本的整體提升。
4)影響作戰(zhàn)試驗結(jié)論可靠性。如果指標不具備良好的數(shù)據(jù)特征,試驗方案往往難以控制無關(guān)因素,使試驗引入大量信息噪聲[10],并最終造成試驗結(jié)果存較大誤差,從而擴大了決策風(fēng)險。
作為一種特殊試驗,作戰(zhàn)試驗既體現(xiàn)試驗的一般特征,又表現(xiàn)出實戰(zhàn)化的獨有特征。為依據(jù)數(shù)據(jù)科學(xué)合理遴選指標,本節(jié)分析作戰(zhàn)試驗的數(shù)據(jù)特性。
作戰(zhàn)試驗的指標按照其內(nèi)容,可分為效能和適用性指標[6,11];按照數(shù)據(jù)特征,可分為定量和定性指標;按照考核形式,可被分為以下兩類:
1)單項檢驗指標,主要考察武器裝備是否達到了研制總要求的相關(guān)閾值。其數(shù)據(jù)處理方法一般是統(tǒng)計學(xué)中的各種假設(shè)檢驗。
2)綜合評估指標,主要將武器裝備所有的性能、效能、適用性信息“打包”進一個“總”的數(shù)值,以這個數(shù)值代表武器裝備的綜合評估得分。其數(shù)據(jù)處理方法一般為AHP 法等加權(quán)求和方法[11-13]。
作戰(zhàn)試驗通過模擬實戰(zhàn)評估被試裝備的作戰(zhàn)使命達成情況。而無論模擬實戰(zhàn)還是真實作戰(zhàn),偵查、通信、指控、打擊、保障等各作戰(zhàn)要素必須協(xié)調(diào)運轉(zhuǎn),才能保證任務(wù)有效完成。這使得作戰(zhàn)試驗考核指標體現(xiàn)出如下3 項數(shù)據(jù)特性:
1)數(shù)據(jù)存在隨機性。任何試驗都是通過研究樣本信息推斷總體信息[14],所以無論是單項檢驗還是綜合評估,其結(jié)果都是隨機變量。這種隨機性一般通過數(shù)據(jù)的集中屬性和離散屬性加以描述,最常用的形式是均值和標準差。
2)數(shù)據(jù)存在相關(guān)性。由于各作戰(zhàn)要素之間必須充分協(xié)調(diào)才能有效完成作戰(zhàn)任務(wù),因此,這些要素的作戰(zhàn)表現(xiàn)是相互關(guān)聯(lián)的,即它們存在統(tǒng)計學(xué)意義上的相關(guān)關(guān)系[15]。這些相關(guān)關(guān)系可通過協(xié)方差矩陣[15]加以描述。
3)數(shù)據(jù)存在正態(tài)性。作戰(zhàn)試驗的單項指標一般以均值表述結(jié)果,而依據(jù)中心極限定理[15],當單項指標結(jié)果存在方差且有限,那么在樣本量充足的情況下,近似服從正態(tài)分布。當前綜合評估模型大多為加權(quán)求和模型,而正態(tài)變量的線性變換仍為正態(tài)變量,因此,綜合評估結(jié)果也近似服從正態(tài)分布[15]。
前文概述了作戰(zhàn)試驗指標考核一般過程,分析了作戰(zhàn)試驗考核指標的基本特性。本節(jié)通過數(shù)值仿真演示分析該過程下,具備該特性的指標考核結(jié)果反映出的一般性規(guī)律,為后文提出作戰(zhàn)試驗指標遴選準則提供支撐。
某裝甲突擊類武器作戰(zhàn)試驗經(jīng)過前期論證,構(gòu)建了包含偵查、指控、打擊、保障、防護、機動6 類作戰(zhàn)效能和作戰(zhàn)適用性的指標體系。對于各底層指標,均以假設(shè)檢驗的方式考核。最后綜合所有底層指標考核結(jié)果,按指標體系的層次,以AHP 法對上層指標進行評估。
于是,根據(jù)前文闡述的作戰(zhàn)試驗指標的基本數(shù)據(jù)特性,在不失一般性的前提下,可以簡化作戰(zhàn)試驗的指標考核過程。具體參數(shù)設(shè)置包括3 個方面。
3.1.1 設(shè)定各指標近似服從正態(tài)分布。
通過AHP 法,自底向上加權(quán)求和得到了包含打擊、偵查、指控、保障、防護、機動6 個分量的隨機向量x→,則它的分布為六元正態(tài)分布,其協(xié)方差矩陣為:
由于正態(tài)分布經(jīng)過平移和縮放,都可以轉(zhuǎn)化為標準形式,且過程可逆[15],因此,可假設(shè)該六元正態(tài)分布的均值向量μ→為零向量。
3.1.2 設(shè)定各單項指標的檢驗閾值。
由于設(shè)置了被試裝備的均值向量為零向量,則指標的閾值為正數(shù)時,表示被試裝備的該項能力低于閾值,反之則高于閾值。閾值的絕對值反映了這種差別的程度。于是,設(shè)置偵查、指控、保障、防護、機動能力的閾值為其對應(yīng)標準差的0.05 倍、-0.1倍、-0.1、-0.2 倍、-0.2 倍、-0.3 倍。另外,根據(jù)假設(shè)檢驗的原理[15],當顯著性水平為0.05 時,如果仿真出的某一指標的取值小于閾值1.644 854(z0.05)倍標準差時,即認為該單項指標未通過考核。
3.1.3 設(shè)定綜合評估指標
由于該作戰(zhàn)試驗主要考察武器裝備履行突擊任務(wù)作戰(zhàn)使命的情況,因此,最關(guān)注x→中的打擊分量,其次是偵查、指控、保障、防護分量,最后是機動分量,因此,設(shè)定權(quán)重向量ω→為:
由于AHP 法需標準化各指標,故設(shè)置標準化方法為:
其中,允許值為閾值減去0.8 倍標準差,滿意值為其閾值加上0.8 倍標準差。當標準化值小于0 時,令其為0;大于100 時,令其為100。
根據(jù)以上仿真參數(shù)設(shè)置,模擬生成1 000 組作戰(zhàn)試驗數(shù)據(jù),每組數(shù)據(jù)為每次作戰(zhàn)試驗獲取的打擊、偵查、指控、保障、防護、機動各分量的試驗結(jié)果均值,通過分析處理,可反映出3 方面問題。
3.2.1 單項指標檢驗存在錯誤率上升情況
按照參數(shù)設(shè)定,對生成數(shù)據(jù)進行單項指標檢驗,得出每組數(shù)據(jù)分別有1~6 項能力通過假設(shè)檢驗的情況,如圖1 所示;而各能力分別通過檢驗的情況,如下頁圖2 所示。由于各分量均值都比較貼近各自標準,因此,在不失一般性的情況下,可認為檢驗拒絕原假設(shè)即犯了“第1 類錯誤”[15-16]。
圖1 單次試驗有1~6 個分量通過檢驗的情況
通過觀察圖2,可以看出,各分量通過檢驗的比率大約都為95%,即出現(xiàn)第一類錯誤的概率大約為5%,與預(yù)設(shè)基本持平。然而圖1 卻顯示出至少有一項能力未通過檢驗的為173 個。即同時檢驗6 個單項指標時,單次試驗犯第一類錯誤的概率由預(yù)設(shè)的5%上升至17.3%。
圖2 各分量的單項指標檢驗情況
3.2.2 綜合評估指標可能誤導(dǎo)決策
按照參數(shù)設(shè)定,對生成數(shù)據(jù)進行綜合評估,得出的綜合評估結(jié)果以10 分為間隔統(tǒng)計的頻數(shù)情況如圖3 所示。很顯然,綜合評估的結(jié)果是隨機變量。
如果以AHP 等加權(quán)求和算法進行綜合評估,每次作戰(zhàn)試驗只能得到綜合評估的一個具體數(shù)值,而這個數(shù)值并無法反映圖3 所展示出的綜合評估結(jié)果的變動情況,即被試裝備的綜合評估結(jié)果會以多大的概率出現(xiàn)在哪個得分區(qū)間內(nèi)。
圖3 綜合評估結(jié)果示意圖
更為嚴重的是,由于綜合評估結(jié)果的隨機性,如果只僅僅依據(jù)作戰(zhàn)試驗的數(shù)據(jù)給出一個具體的評估數(shù)值,非常可能誤導(dǎo)裝備發(fā)展的決策。例如,綜合評估結(jié)果沒有落在概率密度[15]最大,也即最有可能出現(xiàn)的75~95 的區(qū)間,而是落在了概率密度最小,也就是最沒有可能出現(xiàn)的0~60 的區(qū)間,則該結(jié)果將會影響主管部門做出正確決策。
3.2.3 單項指標與綜合指標考核結(jié)果存在沖突
由于作戰(zhàn)試驗考核指標的隨機性,單項指標和綜合指標的檢驗或評估結(jié)果顯然也會存在一定的沖突概率。即綜合評估暗示被試裝備應(yīng)當通過鑒定時,單項指標卻暗示不應(yīng)當通過鑒定,或者相反。
歸納整理1 000 次模擬作戰(zhàn)試驗的單項考核結(jié)果與綜合評估結(jié)果,可得如表1 所示的對應(yīng)表。該表各行表示以10 為跨度的各綜合評估成績區(qū)間內(nèi),分別通過1~6 各單項檢驗結(jié)果的統(tǒng)計情況。中間的分割線區(qū)分了綜合評估低于和高于60 分的結(jié)果,即綜合評估認為不應(yīng)/應(yīng)該通過作戰(zhàn)試驗的情況。5 個添加背景色的單元格表示綜合評估認為應(yīng)當通過作戰(zhàn)試驗(高于60 分),而單項檢驗認為不應(yīng)通過作戰(zhàn)試驗(至少有1 個單項指標未通過檢驗)的情況,或其相反情況。
表1 綜合評估與單次試驗檢驗結(jié)果對應(yīng)表
由于5 個單元格數(shù)值總和為88,即綜合評估與單項檢驗結(jié)果沖突的概率大約為8.8%,接近于10次試驗即會出現(xiàn)一次。
通過作戰(zhàn)試驗指標特性的定性分析和基于仿真的定量研究,可以看出遴選指標時,不僅需要有效反映武器裝備履行作戰(zhàn)使命的程度,具備良好的數(shù)據(jù)特征,而且不宜選用過多指標,尤其是綜合指標往往無法有效反映裝備信息,所以,后續(xù)作戰(zhàn)試驗遴選指標可參照以下準則。
作戰(zhàn)試驗的根本目的是從軍方角度衡量被試武器裝備作戰(zhàn)任務(wù)完成程度,以及作戰(zhàn)任務(wù)適用程度。實踐中,考核指標應(yīng)盡可能與作戰(zhàn)演訓(xùn)評價指標相兼容,這既方便作戰(zhàn)人員理解作戰(zhàn)試驗結(jié)果,也提升作戰(zhàn)試驗服務(wù)實戰(zhàn)水平。必要時可適當參考作戰(zhàn)部隊的訓(xùn)練大綱,或是定型鑒定中的部隊試驗、部隊試用軍用標準。性能指標主要用來考察武器裝備的工程實現(xiàn)情況,要求精準控制試驗條件,這與作戰(zhàn)試驗實戰(zhàn)化的高度動態(tài)特性相沖突。如果必須在作戰(zhàn)試驗中兼顧性能指標,應(yīng)盡可能確保該性能指標有利于解釋作戰(zhàn)任務(wù)完成情況。
與定性指標相比,定量指標精確性更高,結(jié)果可靠性更好,可用的數(shù)據(jù)處理方法也往往更加成熟。作戰(zhàn)試驗往往涉及作戰(zhàn)人員主觀感受評價,因此,也勢必存在定性指標。實踐中,在遴選指標時,可以吸納軍事專家、工程人員、試驗人員成立專家組。首先,由軍事專家提出日常演訓(xùn)評價作戰(zhàn)任務(wù)完成情況的各類指標;其次,由工程人員盡可能分析這些指標反映的物理實質(zhì),盡可能以定量指標加以描述,并嘗試其可用軍事化語言加以解釋的可能性;最后,由試驗人員綜合考慮試驗資源、技術(shù)、日程的可行性,組織軍事專家、工程人員對已選指標進行迭代優(yōu)化。
一般指標與核心指標往往具有較強相關(guān)性,核心指標結(jié)果實際反映了一般指標完成情況。選用過多一般指標檢驗不僅提升了試驗復(fù)雜度,增加了任務(wù)成本,也如仿真所示,不可避免地提高了錯檢率。實踐中,可由軍事專家從一線作戰(zhàn)角度出發(fā),考察作戰(zhàn)試驗指標體系各類指標在日常演訓(xùn)活動中的使用頻次。根據(jù)作戰(zhàn)試驗的資源承受情況,依頻次由多至少精選核心指標,兼顧一般指標。
同上,核心指標往往與所有指標都有較強相關(guān)性,而其在綜合評估的過程中又必定具有更高權(quán)重。因此,綜合評估結(jié)果可以被看作加入一定擾動信息的核心指標檢驗結(jié)果??紤]到核心指標往往具有物理層面的比較明確的作戰(zhàn)含義,且作為單項檢驗,能以概率形式提供更多的數(shù)據(jù)變動信息,從而更好地指導(dǎo)裝備管理與作戰(zhàn)運用。實踐中,可以用單項指標的假設(shè)檢驗結(jié)果作為是否通過作戰(zhàn)試驗的基本依據(jù),而把綜合評估結(jié)果作為武器裝備是否定型的決策參考。