, ,,
近年來,隨著全球新一代信息技術(shù)的應(yīng)用,人類社會(huì)進(jìn)入了一個(gè)大規(guī)模生產(chǎn)、分享和應(yīng)用數(shù)據(jù)的大數(shù)據(jù)與人工智能時(shí)代,數(shù)據(jù)已經(jīng)成為軍事信息中不可或缺又亟待開發(fā)的重要資源[1]。
大數(shù)據(jù)與人工智能成為推動(dòng)各國(guó)軍事轉(zhuǎn)型和軍隊(duì)建設(shè)的新動(dòng)力,促進(jìn)了國(guó)家安全和軍事戰(zhàn)略決策方式的變革[2],提高了國(guó)防和軍隊(duì)建設(shè)的精確化水平,催生了新型武器裝備,引導(dǎo)了軍事組織形態(tài)變革,轉(zhuǎn)變了武裝力量的運(yùn)用模式,推動(dòng)了戰(zhàn)爭(zhēng)形態(tài)的演變[3]。
各類傳感設(shè)備在軍事領(lǐng)域的安裝應(yīng)用以及獲取數(shù)據(jù)的渠道增多,將會(huì)產(chǎn)生海量的數(shù)據(jù)。未來影響、決定軍事行動(dòng)的最大核心在于數(shù)據(jù),數(shù)據(jù)的積累量、數(shù)據(jù)分析和處理能力、數(shù)據(jù)主導(dǎo)決策以及人工智能水平將是獲得戰(zhàn)場(chǎng)優(yōu)勢(shì)的關(guān)鍵。
目前,全軍及各軍兵種啟動(dòng)建設(shè)了各類軍事應(yīng)用系統(tǒng),安裝了大量的傳感器及其他數(shù)據(jù)采集設(shè)備,為軍事大數(shù)據(jù)的收集提供了平臺(tái),為海量數(shù)據(jù)的挖掘和整合奠定了基礎(chǔ)。
未來工作的重心是努力建構(gòu)處理大數(shù)據(jù)的硬件系統(tǒng)、軟件模型,實(shí)現(xiàn)大數(shù)據(jù)“從數(shù)據(jù)轉(zhuǎn)化為決策”的智能化和瞬時(shí)化,從而引領(lǐng)指揮決策方式變革,優(yōu)化作戰(zhàn)指揮流程,提高軍事管理水平,提升體系作戰(zhàn)能力[4]。
在部隊(duì)裝備建設(shè)中,總線裝備運(yùn)行參數(shù)記錄儀計(jì)劃安裝到裝備中,采集裝備各部件的運(yùn)行參數(shù),如××式車采集的參數(shù)為300多個(gè),××式車采集的參數(shù)為400多個(gè)。參數(shù)類型既有離散型(如某參數(shù)0表示正常,1表示故障);又有連續(xù)型(如某參數(shù)有效范圍0~250),參數(shù)用途類型涵蓋了維修、管理等各環(huán)節(jié)。
本方案將建立評(píng)價(jià)指標(biāo)體系,針對(duì)某種類型裝備,模擬總線裝備運(yùn)行參數(shù)記錄儀采集的數(shù)據(jù)樣本,進(jìn)行深度的數(shù)據(jù)融合,利用機(jī)器學(xué)習(xí)算法建立數(shù)學(xué)模型,挖掘數(shù)據(jù)中裝備的信息,實(shí)時(shí)評(píng)價(jià)單裝的狀態(tài),實(shí)時(shí)展現(xiàn)部隊(duì)裝備的整體態(tài)勢(shì)。
分析總線裝備運(yùn)行參數(shù)記錄儀采集數(shù)據(jù)參數(shù)的取值情況,將連續(xù)型參數(shù)離散化。如某參數(shù)有效范圍0~250,數(shù)據(jù)在有效范圍內(nèi)記為0,在有效范圍外記為1;某參數(shù)數(shù)值范圍0~500之間,定義400~500為1級(jí),300~399為2級(jí),200~299為3級(jí),200以下為4級(jí)。
根據(jù)總線裝備運(yùn)行參數(shù)記錄儀采集數(shù)據(jù)參數(shù)范圍情況,將裝備狀態(tài)等級(jí)分為良好、一般、劣化、嚴(yán)重,對(duì)應(yīng)的裝備策略為正常運(yùn)行、計(jì)劃安排維修、盡快安排維修、立即安排維修[5](表1)。
表1 裝備狀態(tài)分類與指揮策略
根據(jù)總線裝備運(yùn)行參數(shù)記錄儀采集數(shù)據(jù)參數(shù)范圍情況,確定每個(gè)等級(jí)各參數(shù)的取值范圍。如某參數(shù),0表示正常,1表示故障,2表示嚴(yán)重故障,則定義裝備狀態(tài)等級(jí)對(duì)應(yīng)的參數(shù):良好為0,一般為0,劣化為1,嚴(yán)重為2。
根據(jù)部隊(duì)裝備狀態(tài)各等級(jí)參數(shù)取值范圍,隨機(jī)生成模擬樣本,每個(gè)等級(jí)模擬一定量的樣本,各參數(shù)取值原則為本級(jí)別取值或向優(yōu)取值,但要保證至少有一個(gè)參數(shù)為本級(jí)別取值[6]。如在“劣化”的等級(jí)中,至少有一個(gè)參數(shù)達(dá)到“劣化”標(biāo)準(zhǔn),參數(shù)“發(fā)動(dòng)機(jī)自檢信息”,本級(jí)別取值為1,向優(yōu)取值為0,該參數(shù)的取值為1或0;如果取值為0,要保證該樣本中其他參數(shù)至少有一個(gè)為“劣化”水平[7],從而建立模擬樣本集,滿足數(shù)據(jù)建模對(duì)訓(xùn)練集和測(cè)試集樣本的需求[8]。
將模擬樣本集按一定比例隨機(jī)劃分為訓(xùn)練集和測(cè)試集。如取訓(xùn)練集的比例為75%,測(cè)試集的比例為25%,利用訓(xùn)練集訓(xùn)練模型,選擇k-Nearest Neighboers,Logistic Regression,Decision Tree,Random Forest,Gradient Boosting,Support Vector Machine,Deep Learning等機(jī)器學(xué)習(xí)模型進(jìn)行對(duì)比[9](表2)。
表2 不同模型的準(zhǔn)確率比較
從表2可以看出,各類模型對(duì)訓(xùn)練樣本的準(zhǔn)確率均較高,其中Random Forest對(duì)測(cè)試樣本的準(zhǔn)確率最高。因此,選擇Random Forest模型,調(diào)整模型中的參數(shù),估評(píng)模型在訓(xùn)練集和測(cè)試集的準(zhǔn)確度[10](表3)。
從表3可以看出,在Random Forest模型選擇參數(shù)max_depth=None,n_estimators=500,random_state=0時(shí),模型對(duì)測(cè)試樣本的準(zhǔn)確率的準(zhǔn)確率達(dá)到了96.0%,因此是較好的選擇。
將單個(gè)裝備總線裝備運(yùn)行參數(shù)記錄儀采集的數(shù)據(jù)輸入Random Forest模型,進(jìn)行分類預(yù)測(cè),得到單個(gè)裝備的狀態(tài)等級(jí)[11]。同時(shí)結(jié)合裝備實(shí)際運(yùn)行情況,調(diào)整指標(biāo)體系中各指標(biāo)的權(quán)重,使模型更科學(xué)合理[12]。
表3 Random Forest模型不同參數(shù)的準(zhǔn)確率比較
部隊(duì)裝備類型多樣,可按照大的類型區(qū)分成通用車輛、履帶裝甲、輪式裝甲、工程機(jī)械、飛機(jī)、船艇等,同類型裝備制定通用模型。并在此基礎(chǔ)上,按照不同武器裝備的不同特性,制定不同型號(hào)裝備的具體模型。運(yùn)行使用時(shí),針對(duì)總線裝備運(yùn)行參數(shù)記錄儀采集的數(shù)據(jù)情況,分別建立評(píng)價(jià)指標(biāo)體系,構(gòu)建評(píng)價(jià)模型并進(jìn)行評(píng)估。以各單個(gè)裝備最新的采集數(shù)據(jù)為依據(jù),評(píng)價(jià)部隊(duì)全部單個(gè)裝備的狀態(tài)等級(jí),以旅、軍、戰(zhàn)區(qū)軍種、軍兵種為展示單位,進(jìn)行匯總展示;以各單個(gè)裝備狀態(tài)等級(jí)為基礎(chǔ),利用Topsis,Projection Pursuit,EDA等方法,對(duì)各旅、軍、戰(zhàn)區(qū)軍種的全部裝備的總體水平進(jìn)行評(píng)估、排序。隨著總線裝備運(yùn)行參數(shù)記錄儀的普遍安裝,并采集積累一定時(shí)間的數(shù)據(jù),可以對(duì)裝備進(jìn)行回歸分析、聚類分析、時(shí)間序列分析、關(guān)聯(lián)分析等。
通過對(duì)海量大數(shù)據(jù)進(jìn)行實(shí)時(shí)處理,進(jìn)行多維度數(shù)據(jù)應(yīng)用分析,實(shí)時(shí)監(jiān)控?cái)?shù)據(jù)流向,實(shí)現(xiàn)數(shù)據(jù)互動(dòng)可視化分析[13]。對(duì)同個(gè)單位不同型號(hào)武器裝備數(shù)據(jù)集、歷史數(shù)據(jù)集、配套裝備數(shù)據(jù)集的分析,以及對(duì)不同單位同型裝備數(shù)據(jù)集、異型裝備、同底盤裝備、同上裝裝備等的交叉分析,可清晰地看到同一類裝備在不同單位情況,同一單位不同裝備情況,不同歷史時(shí)期裝備情況等全過程、全壽命周期武器裝備動(dòng)用、使用、保管、保養(yǎng)、維修保障等比對(duì)信息[14]。此外,構(gòu)建的豐富的決策模型,為軍事決策提供精準(zhǔn)的分析預(yù)測(cè)服務(wù),支持軍事首長(zhǎng)統(tǒng)攬全局,清晰洞察相關(guān)業(yè)務(wù)領(lǐng)域的客觀現(xiàn)狀,并在動(dòng)態(tài)數(shù)據(jù)中探索多維變量的相關(guān)性和相關(guān)領(lǐng)域的發(fā)展趨勢(shì),快速科學(xué)地制定決策模型,提高決策效率[15]。通過機(jī)器學(xué)習(xí)、深度學(xué)習(xí),并結(jié)合專家驗(yàn)證的方法對(duì)模型進(jìn)行優(yōu)化,不斷升級(jí)模型、優(yōu)化對(duì)策,驅(qū)動(dòng)科學(xué)決策,提升部隊(duì)科學(xué)管裝治裝整體水平[16]。