李赫才,韋國軍
(航天工程大學,北京 102200)
在役考核是新的試驗鑒定類型,是對性能試驗和作戰(zhàn)試驗的補充和拓展,舊裝備改進升級和新裝備立項都必須經(jīng)過在役考核。隨著大量新型裝備列裝部隊,在裝備服役期檢驗裝備性能、效能的需求不斷增加,在役考核正在成為部隊的經(jīng)常性工作。裝甲裝備在役考核是裝甲裝備在服役期間檢驗滿足部隊訓練使用和保障需求程度[1],旨在發(fā)現(xiàn)制約裝甲裝備戰(zhàn)斗力提升的關鍵問題缺陷,給出裝甲裝備改進升級的有效建議[2]。在役考核指標存在非一一對應的關系,無法做到完全相互獨立,比如裝備維修費用既影響裝備服役經(jīng)濟性,又影響裝備部隊適用性。深度學習具有擬合任意非線性關系的特性,為其應用于裝甲裝備在役考核評估打下了理論基礎。
裝甲裝備在役考核評估就是以發(fā)現(xiàn)挖掘裝備問題和不足為目標[3],以在役考核數(shù)據(jù)為基礎,采取科學合理的數(shù)據(jù)分析與計算方法,挖掘隱藏在數(shù)據(jù)背后的規(guī)律、信息和問題等內(nèi)容,得出反映裝甲裝備狀態(tài)的具體結論。
在役考核數(shù)據(jù)是在役考核評估的輸入,而裝備在服役期間的效能和適用性是在役考核評估的輸出。在役考核數(shù)據(jù)產(chǎn)生于裝備服役的整個階段,在日常使用、訓練、作戰(zhàn)、維修保障等過程中持續(xù)增長,使得在役考核數(shù)據(jù)類型多樣、結構復雜、體量龐大。以裝甲裝備服役經(jīng)濟性數(shù)據(jù)為例,其包含大量紙質(zhì)的使用及維護保養(yǎng)記錄數(shù)據(jù),如維修器材消耗、彈藥及油料消耗等;大量自動采集數(shù)據(jù),如測量儀測量數(shù)據(jù)、裝備自檢數(shù)據(jù)等。
裝甲裝備在役考核評估內(nèi)容以在役考核大綱規(guī)定的具體內(nèi)容為準,結合部隊的實際工作情況,綜合評估裝甲裝備在服役期間的真實情況和底數(shù),主要包括:驗證前期試驗給出的戰(zhàn)技性能、考核前期試驗未能進行的內(nèi)容及裝甲裝備在役適用性等內(nèi)容[4]。
1)著眼裝甲裝備的實際運用。裝甲裝備在役考核評估必須圍繞部隊實際服役任務進行,綜合考慮裝甲裝備的整個服役周期。只有立足裝甲裝備在部隊的使用、保障等工作,才能發(fā)現(xiàn)裝甲裝備在服役過程中出現(xiàn)的各類問題。
2)確??陀^準確反映裝甲裝備狀態(tài)。在役考核評估結果服務于裝備的訓練、作戰(zhàn)和發(fā)展決策,這就要求裝甲裝備在役考核評估必須做到客觀和準確。不僅要選擇準確的評估模型,還要精確地采集在役考核數(shù)據(jù)[5]。
3)堅持定性評估與定量評估結合。在役考核是在裝備服役過程中組織實施的,這一特點決定了在役考核數(shù)據(jù)既有大量的定量數(shù)據(jù),又有大量的定性數(shù)據(jù)。定量數(shù)據(jù)確保在役考核評估的準確性,而定性數(shù)據(jù)能夠清楚描述裝備使用人員的主觀感受,綜合使用定性和定量評估的方法,才能使評估結論更加科學合理[6]。
目前,經(jīng)過長期發(fā)展形成了基于定性推斷的經(jīng)驗方法、基于因果關系的建模方法、基于仿真的模擬試驗方法等評估方法體系,用于解決各類評估問題。在役考核是持續(xù)性考核,在役考核數(shù)據(jù)持續(xù)產(chǎn)生,裝備在服役后處于復雜的裝備體系內(nèi),各種影響因素相互交織[7],比如裝備自身的維修適應性與裝備體系的維修保障能力相互影響。傳統(tǒng)的評估方法很難取得預期的評估效果。針對在役考核數(shù)據(jù)的特點,采用合適的數(shù)據(jù)處理方法非常重要,深度學習作為一種“黑箱”機制,能夠輸入各種非結構化的數(shù)據(jù)后輸出預測結果[8],非常適用于在役考核評估。
在役考核數(shù)據(jù)存在大量半結構化(比如裝備維修信息)或非結構化的數(shù)據(jù)(比如裝備維修錄像),并且由于數(shù)據(jù)采集手段的限制,部分數(shù)據(jù)的精確度不高,這些都要求創(chuàng)新使用新的評估方法以適應在役考核數(shù)據(jù)的特點。
深度學習并非某一種學習算法,而是一類學習算法的統(tǒng)稱,通過利用簡單的概念來構建復雜的模型,能夠從視頻、音頻、圖像等原始數(shù)據(jù)中提取有用的信息,對于處理各種結構復雜的數(shù)據(jù)具有天然優(yōu)勢[9]。深度置信網(wǎng)絡(Deep Belief Networks,DBN)就是第一批成功應用于深度學習的模型之一,由多層受限玻爾茲曼機和一個BP神經(jīng)網(wǎng)絡組成[10]。受限玻爾茲曼機是無監(jiān)督學習,無法得出確定的結果,BP神經(jīng)網(wǎng)絡是有監(jiān)督學習,能夠學習出模型函數(shù),得到輸出結果。
裝甲裝備在役考核數(shù)據(jù)類型復雜、體量大、相互關系交織等特點,決定了深度置信網(wǎng)絡模型在裝甲裝備在役考核評估方面具有很好的應用前景。
1)受限玻爾茲曼機。受限玻爾茲曼機(Restricted Boltzmann Machine,RBM)本身是只包含一層可見層和一層隱藏層,而非深層模型,用于表示學習輸入,是構建深度置信網(wǎng)絡的基礎[11]。標準的RBM是具有二值的可見層和隱藏層的模型,其能量函數(shù)為
E(v,h)=-bΤv-cΤh-vΤWh
(1)
其中向量b、c和權重矩陣W都是沒有約束、實值的能夠通過學習得到的參數(shù),v為可見層向量,h為隱藏層向量,W代表二者之間關系的權重矩陣,可見層與隱藏層之間有相互關系,但是各層的元素之間沒有直接相互作用,如圖1所示。
圖1 單個受限玻爾茲曼機
2)深度置信網(wǎng)絡模型。DBN是典型的深度學習模型,涉及有向連接和無向連接,頂部兩層之間的連接是無向的,而其他層之間的連接是有向的,即上層向下層連接。每層的每個元素與相鄰層的每個元素有連接,而層間元素無連接,可見層與隱藏層由受限玻爾茲曼機組成,最后用BP神經(jīng)網(wǎng)絡[12]進行反向微調(diào)。
DBN隱藏層的個數(shù)決定著權重矩陣的個數(shù),即有n個隱藏層時會有n個權重矩陣:W1,W2,…,Wn,同時也擁有n+1個偏置向量:b0,b1,…,bn,其中b0為可見層的偏置向量。DBN的概率分布為
(2)
將第一個受限玻爾茲曼機的可見層作為深度置信網(wǎng)絡的輸入層,而第一個受限玻爾茲曼機的隱藏層就是第二個受限玻爾茲曼機的可見層,輸入的在役考核樣本數(shù)據(jù)經(jīng)過第一個受限玻爾茲曼機進行提取特征數(shù)據(jù),由隱藏層輸出并作為第二個受限玻爾茲曼機的輸入,以此方式逐層疊加。最后一個受限玻爾茲曼機的輸出作為BP神經(jīng)網(wǎng)絡的輸入,并進行反向微調(diào),最終形成深度置信網(wǎng)絡[13]。
深度置信網(wǎng)絡能夠直接從原始數(shù)據(jù)中提取數(shù)據(jù)特征,直接將數(shù)據(jù)用于評估模型,最大程度地保存數(shù)據(jù)的真實性,使裝甲裝備在役考核評估更加真實。利用深度置信網(wǎng)絡的非線性擬合特性,將裝甲裝備在役考核數(shù)據(jù)輸入建立的深度置信網(wǎng)絡模型就能得到需要的評估結論,既省去了復雜的計算過程以提高評估效率,又能夠保證裝甲裝備在役考核評估的時效性[14],基于深度置信網(wǎng)絡的裝甲裝備在役考核評估流程如圖2所示。
圖2 基于深度置信網(wǎng)絡的評估流程
1)裝甲裝備在役考核數(shù)據(jù)樣本。裝甲裝備在役考核評估貫穿于裝備整個服役期,因此在裝甲裝備服役期間產(chǎn)生的各類數(shù)據(jù)均可用于在役考核評估,在進行數(shù)據(jù)采集,需要采用合適的數(shù)據(jù)采集方法,以保證采集的在役考核數(shù)據(jù)的準確性,能夠真實反映裝備狀態(tài)。將裝甲裝備在役考核數(shù)據(jù)分成訓練樣本數(shù)據(jù)、驗證樣本數(shù)據(jù)和測試樣本數(shù)據(jù)。訓練樣本數(shù)據(jù)是指用來完成深度置信網(wǎng)絡模型訓練的數(shù)據(jù),這部分數(shù)據(jù)可用由部隊積累的歷史數(shù)據(jù)組成。驗證樣本數(shù)據(jù)是指用來驗證訓練出來的深度置信網(wǎng)絡模型是否真實有效,這部分數(shù)據(jù)可以由歷史數(shù)據(jù)組成,也可以由部分采集的現(xiàn)場數(shù)據(jù)組成。測試樣本數(shù)據(jù)是指用來進行裝甲裝備在役考核評估的數(shù)據(jù),是評估的輸入數(shù)據(jù),由采集的現(xiàn)場數(shù)據(jù)組成。
2)確定深度置信網(wǎng)絡評估模型。深度置信網(wǎng)絡評估模型的輸入是裝甲裝備在役考核評估的指標體系,輸出是裝甲裝備滿足部隊訓練使用和保障需求的程度。針對具體需要給出結論的評估內(nèi)容,還需要單獨選取輸入指標體系和相關數(shù)據(jù)樣本集,并確定相應的評估輸出。采用基于能力需求的方法,結合部隊實際工作和考核需求,提出影響裝甲裝備服役的關鍵在役問題,對這些關鍵在役問題進行逐層分解,直至得到可測的指標元,完成裝甲裝備在役考核指標體系構建,并選取合適的優(yōu)化方法,完善指標體系。在考核評估某型裝甲裝備服役情況時,需將所有的在役考核指標作為模型輸入,而在對裝甲裝備服役經(jīng)濟性進行評估時,只需選擇相關的指標數(shù)據(jù)作為輸入。深度置信網(wǎng)絡評估模型如圖3所示。
圖3 深度置信網(wǎng)絡評估模型
3)訓練深度置信網(wǎng)絡評估模型。訓練樣本的選擇會影響模型的精度,為了保證模型是通過充分的訓練學習得到的,選擇訓練樣本時,必須具有較強的代表性,同時涵蓋所有的指標數(shù)據(jù)。裝甲裝備在役考核數(shù)據(jù)量綱差距較大,很多數(shù)據(jù)具有較高的維度,需要對這部分數(shù)據(jù)進行降維處理,將數(shù)據(jù)從高維空間降到便于處理的低維空間。常用的有線性降維方法,如主成分分析;非線性降維方法,如流形學習。
將訓練樣本輸入構建的深度置信網(wǎng)絡模型,完成模型的訓練并通過驗證樣本數(shù)據(jù)的驗證,進而得到成熟的評估模型。以此得到的裝甲裝備深度置信網(wǎng)絡模型可作為評估模型進行應用。
以某型坦克裝甲車輛為例,僅將某型坦克裝甲車輛的服役經(jīng)濟性作為在役考核評估的一項內(nèi)容。
結合坦克裝甲車輛的服役情況和部隊工作實際,提出影響坦克裝甲車輛服役經(jīng)濟性的關鍵問題,通過對這些關鍵問題的進一步分解,得到影響裝備服役經(jīng)濟性的指標主要包括:裝備年均使用費、裝備年均維持費、使用維修費效比、標準經(jīng)費滿足度。
裝備年均使用費是指裝備完成年度訓練、作戰(zhàn)等任務所需的油料、彈藥、器材、設施設備、技術資料、人員等費用。
Fu=o+a+e+fe+t+p
(3)
其中,Fu是指裝備年均使用費,o是指年度消耗油料費用,a是指年度消耗彈藥費用,e是指年度消耗器材費用,fe是指年度消耗設施設備費用,t是指年度消耗技術資料等費用,p是指年度消耗人力折合費用。
裝備年均維持費是指為使裝備保持良好可用狀態(tài)所消耗的費用。
Fm=rm+dm+tm
(4)
其中,Fm是指裝備年均維持費,rm是指裝備年度故障后維修所耗費用,dm是指裝備年度日常維護所耗費用,tm是指裝備執(zhí)行年度任務前維護所耗費用。
使用維修費效比是指裝備年度使用維修的費效比。
(5)
其中,CE是指裝備年度使用維修費效比,t是指裝備年度可用時間。
標準經(jīng)費滿足度是指裝備年度的標準經(jīng)費滿足裝備完成年度訓練、使用、維護保養(yǎng)的等所需的程度??梢酝ㄟ^根據(jù)裝備年度經(jīng)費的使用情況進行問卷調(diào)查或者專家打分得到。
由于基層單位沒有開展在役考核任務,缺少成體系的數(shù)據(jù)采集手段和設備,因此能夠獲得的數(shù)據(jù)雜亂無章,甚至包含大量的異常數(shù)據(jù),無法直接用于在役考核評估,需要對數(shù)據(jù)進行預處理。數(shù)據(jù)預處理包括數(shù)據(jù)抽取、清理和標準化,堅持數(shù)據(jù)處理真實、客觀、簡潔、有效的原則,主要是對定性數(shù)據(jù)進行量化處理,對定量數(shù)據(jù)進行歸一化處理,采用多種數(shù)據(jù)處理方式,使數(shù)據(jù)能夠直接用于模型。部分數(shù)據(jù)如表1所示。
表1 某型坦克裝備服役經(jīng)濟性數(shù)據(jù)
由于深度置信網(wǎng)絡評估模型需要大量數(shù)據(jù)進行訓練,收集的數(shù)據(jù)樣本對于深度置信網(wǎng)絡需要的樣本量來說還是太少,會影響網(wǎng)絡模型訓練的精度。需要對樣本集進行優(yōu)化即進行樣本增廣,增加樣本數(shù),采用線性插值或者非線性補差法對樣本集進行擴充。還要注意在對樣本進行增廣時,需要整體均衡地擴充數(shù)據(jù)樣本集,不能只進行部分或局部樣本的擴充,避免出現(xiàn)樣本集不均衡的問題。
利用matlab中的DBN網(wǎng)絡模型對訓練樣本數(shù)據(jù)進行訓練,RBM的輸出值作為BP神經(jīng)網(wǎng)絡的輸入值。每層神經(jīng)元設置為100個,通過模型訓練,結果如圖4所示。
圖4 數(shù)據(jù)訓練結果
隨著樣本數(shù)據(jù)的增加,訓練值逐漸逼近期望值。
通過分析模型的結果可知,該型坦克裝甲車輛的服役經(jīng)濟性基本符合預期值,能夠繼續(xù)服役,但是在數(shù)據(jù)處理和模型運行過程中也發(fā)現(xiàn)該型裝備的故障維修費和日常維護費在逐漸增高,而可用時間則在逐漸降低。特別是執(zhí)行大項任務或者裝備進行超負荷使用時,對裝備的損害相對較大,部分日常訓練使用裝備狀態(tài)明顯低于戰(zhàn)備裝備狀態(tài)。通過實例,以服役經(jīng)濟性指標作為模型的輸入,經(jīng)過訓練可得能夠用于評估裝甲裝備服役經(jīng)濟性的深度置信網(wǎng)絡模型,驗證了評估模型的可行性,能夠實現(xiàn)裝甲裝備服役經(jīng)濟性的實時評估,并能夠發(fā)現(xiàn)影響裝備效能發(fā)揮的關鍵問題和暴露的問題缺陷,為裝備的改進改型提供參考。
本文圍繞裝甲裝備在役考核評估的內(nèi)容和原則,利用深度置信網(wǎng)絡的自學習優(yōu)勢,搭建了深度置信網(wǎng)絡的評估模型。通過matlab軟件中的DBN模塊,以裝甲裝備服役經(jīng)濟性為例進行驗證,可以推廣至裝甲裝備在役考核評估。論文選取的數(shù)據(jù)樣本相對較小,裝甲裝備在役考核擁有海量數(shù)據(jù),建立的深度置信網(wǎng)絡模型非常復雜,還需要進一步研究深度置信網(wǎng)絡模型結構,使評估更加簡潔高效。