鄔美春 左永剛 陳福澤 黨海鵬
(陸軍勤務學院 重慶 401331)
隨著科技的不斷進步,大量運用高精尖技術的武器被投送到戰(zhàn)場,導致現代化局部戰(zhàn)爭變得復雜化、多樣化,戰(zhàn)場態(tài)勢也發(fā)生重大改變,這使得人員對裝備的依賴度越來越高,大大增加油料裝備保障的難度和成本。從最近幾次局部沖突中可以看出,占據信息優(yōu)勢的一方能很快掌控局勢,人員和裝備補給較為迅速。
隨著軍隊改革步伐的不斷加快,新型裝備也在快速列裝,但大量不同型號的武器裝備給后勤裝備保障部門的保障能力帶來較大的壓力。近年來,我軍推動了后勤保障建設向信息化轉型,在精確化保障、規(guī)范化管理、科學化建設等方面取得了創(chuàng)新發(fā)展。但我們同時也應該看到在裝備信息智能化保障方面還存在不足,傳統(tǒng)低效單一化的保障模式仍然存在。因此,尋求新技術、新手段提高裝備保障的信息化水平,對提升軍隊作戰(zhàn)能力具有重要意義。
大數據深度挖掘技術作為一種較為日漸成熟的數據處理手段,能夠快速理清需求和供應之間復雜的關系,提供最優(yōu)的解決方案。將常年累積的裝備保障信息進行了處理,建立裝備保障預測模型,為提升裝備保障能力提供了新思路。劉洪偉[1]分析了常用的保障模式,針對信息化裝備具備數據下載、加注的保障特點,并需要定期進行更換的特點,完成裝備保障信息化模型的建立及系統(tǒng)實現。焦敬義等[2]利用數據挖掘技術對裝備保障信息資源中大量數據進行挖掘,為裝備保障部門的正確決策提供科學的依據是裝備信息管理的重要內容。
上述研究表明,大數據技術對裝備保障信息化建設具有一定的指導作用,但目前研究還遠遠不足。本文基于大數據挖掘技術,建立了裝備保障信息化管理模型,并驗證了模型的可靠性,為提升裝備保障水平提供了有價值的參考。
目前,后勤保障建設信息化水平不斷提高,油料裝備保障作為其中的重要組成部分,信息化建設也取得了較大的進展。為滿足不同類型裝備及作戰(zhàn)形式的油料裝備保障需求,各級后勤裝備保障部門依據實際需求,搭建了許多不同類型的裝備保障平臺。然而,由于數據種類繁瑣、通用性較差,平臺之間的關聯性不強、數據利用效率較低,出現了許多“信息孤島”,造成一定程度上的資源浪費。
為了對標現代戰(zhàn)爭,必須要運用大數據思維和精確算法,準確掌握后勤保障需求、供應、保障數據信息,暢通保障鏈路。在建立后勤大數據資源庫的基礎上,通過電腦與人腦的有機結合,運用精確算法,實現缺什么補什么的目標。通過依托后勤大數據平臺,統(tǒng)籌平戰(zhàn)時可動用的各類資源及分布情況,通過深度計算和精確計算,對軍內資源和地方資源、部隊資源和聯勤資源、自我資源和友鄰資源進行測算、統(tǒng)籌、優(yōu)化和設計,生成適應作戰(zhàn)需求的后勤供應保障方案。
大數據時代的到來,既是挑戰(zhàn)、更是機遇。以數據為坐標,統(tǒng)籌后勤整體建設,積極搶占數據保障主權,實現我軍后勤和裝備信息化建設的跨越式發(fā)展。
當前物聯網、大數據和云計算的發(fā)展,掀起了第三次信息化浪潮[2]。隨著數據量的積累,傳統(tǒng)的數據處理模式已經不能滿足任務需求,大數據處理技術應運而生。大數據具有數據體量大(Volume)、處理速度快(Velocity)、數據類別大(Variety)、數據真實性高(Veracity)、價值密度低,商業(yè)價值(Value)高[3]等特點[3]。表1表達了傳統(tǒng)數理統(tǒng)計與大數據處理技術的異同。
表1 大數據與傳統(tǒng)統(tǒng)計學的不同
大數據計算體系由數據存儲系統(tǒng)、數據處理系統(tǒng)、數據應用系統(tǒng)三個基本系統(tǒng)組成。具體如圖1所示。
圖1 大數據分層計算系統(tǒng)
三個階層各有不同的作用。相較于傳統(tǒng)的關系型數據庫系統(tǒng),大數據的數據存儲系統(tǒng)較為復雜的多[4~8]。主要表現為關系型數據庫通過外鍵關聯來建立表與表之間的關系,非關系型數據庫通常指數據以對象的形式存儲在數據庫中,而對象之間的關系通過每個對象自身的屬性來決定。對于數據處理系統(tǒng)而言,可按照功能和相似度對不同算法進行分類[9~12]。計算處理模型需要針對不同數據的類型、不同處理方式需要不同的計算模型來提供計算范式和數據處理邏輯。
對于油料裝備保障系統(tǒng)而言,數據是分析數據之間內在規(guī)律以及建立模型的關鍵,但油料裝備活動包括裝備發(fā)展規(guī)劃與計劃、研究設計、試驗定型、生產制造、籌措、供應與調撥、編配、儲備、分級與轉級、日常保管、日常操作使用、戰(zhàn)時運用、維護保養(yǎng)、維修與搶修、退役與報廢和教學與培訓等。各種類型信息之間難以互聯,因此,在數據存儲層要對數據進行歸一化處理。
建模的目的是實現油料裝備的快速化、智能化保障。大數據平臺構建,應該以油料裝備管理人員的業(yè)務應用需求的先導,只要弄清需求才能提出具體的應對措施,從而根據需求進行相應建模。魏忠平等[13]從業(yè)務和技術兩個方面論述了油料裝備保障應滿足的主要需求,本文以此需求為出發(fā)點進行模型建立。
通過大數據技術建立模型可分為幾個步驟:
1)數據收集:在現有軍事綜合網的基礎上,組織對采集數據的分類、甄別和統(tǒng)計、梳理。
2)數據歸一化處理:制定歸一化指標規(guī)則,對不同類型的數據進行歸一化處理。
3)數據清洗:為保障模型的可靠性,應摒棄不合理的離散數據。
4)特征提取與數據擬合:以MIC作為相關性評價指標,找出黏性系數相關性較高的參數,通過泛函網絡自適應擬合方法,給出各參數之間的大數據特征函數[14~15]。
根據裝備保障信息管理需要解決的問題,進行數據采集,然后不同的數據進行權重設置。具體流程圖如圖2。
圖2 建立模型流程圖
數據的歸一化是數據分析的關鍵,對數據樣本的處理方法至關重要。本文所獲取的樣本當中,有些樣本獲取的年代較久,有些樣本較新,有些樣本來源于實戰(zhàn),而有些樣本則來源于訓練或是仿真實驗等。這些因素決定著樣本在關系挖掘過程中的重要程度是不一樣的,若不考慮這諸多的不同而將每個樣本的懲罰系數設置為一樣,則必然使所得模型的精度與泛化能力受損,影響模型的使用。因此,本文選取樣本加權最小二乘支持向量回歸模型處理數據。
設有N個訓練樣本(xi,yi)。因此在標準最小二乘支持向量優(yōu)化問題中引入樣本權vi,就變?yōu)槿缦聝?yōu)化問題:
其相應的對偶問題為
由上式可以到最終的擬合函數為
其中 Kf(x,xi)=K(VTx,VTxi)為加權核函數。
在確定了模型之后,就將模型轉化為計算a、b值的問題。由于a、b非線性的關系。最大互信息系數作為一種非線性相關度量,具有普適性、公平性和對稱性等優(yōu)點。普適性是指在樣本量足夠大(包含了樣本的大部分信息)時,能夠捕獲各種各樣有趣的關聯,而不限定于特定的函數類型(如線性函數、指數函數或周期函數),或者說能均衡覆蓋所有的函數關系。公平性是指在樣本量足夠大時能為不同類型單噪聲程度相似的相關關系給出相近的系數。例如,對于一個充滿相同噪聲的線性關系和一個正弦關系,一個好的評價算法應該給出相同或相近的相關系數。MIC與其它相關性算法對比如表2所示,MIC是一種計算復雜度低,適用于線性與非線性數據,魯棒性高的相關系數算法[16~18]。
MIC源于互信息概念,它可以看成是一個隨機變量中包含的關于另一個隨機變量的信息量,或者說是一個隨機變量由于已知另一個隨機變量而減少的不確定性。簡而言之,互信息可理解為聯合分布與邊緣分布的相對熵,但是一般情況下聯合概率計算比較麻煩。
MIC是針對兩個離散在二維空間中變量之間的關系,使用散點圖來表示,將當前二維空間在x,y方向分別劃分為一定的區(qū)間數,然后查看當前的散點在各個方格中落入的情況,這就是聯合概率的計算,這樣就解決了在互信息中的聯合概率難求的問題。MIC的計算方法如下所示:
式中:a,b是在x,y方向上劃分格子的個數,本質上就是網格分布,B是變量,一般取數據量的0.6次方。
對于給定i和 j的情況下 M(X,Y,D,i,j)的計算方法,即:給定很多(i,j)值,計算每一種情況下M(X,Y,D,i,j)的值,將所有M(X,Y,D,i,j)中的最大那個值作為MIC值。MIC計算分為三個步驟:1)給定i,j,對 X ,Y 構成的散點圖進行i列 j行網格化,并求出最大的互信息值;2)對最大的互信息值進行歸一化;3)選擇不同尺度下互信息的最大值作為MIC值。
從已有的數據庫中選取14組樣本數據,共分為4類(a.信息化時代、訓練演習、同類裝備2組數據;b.信息化時代、訓練演習、近似裝備6組數據;c.半機械化半信息化時代、實戰(zhàn)、近似裝備3組數據;d.信息化時代、仿真實驗、同類裝備3組數據)。進行訓練,并另選擇8組數據(信息化時代、訓練演習、同類裝備)進行精度測試。訓練數據如表2所示。
表2 訓練數據
利用該模型對測試樣本進行測試所得結果如圖3及表3所示。
圖3 測試結果
表3 不同方法的測試結果
研究分析了目前油料裝備保障的現狀,介紹了大數據挖掘技術的原理,關鍵技術及系統(tǒng)組成?;诖髷祿夹g建立了樣本加權的最小二乘支持向量回歸模型,并進行模型的可靠性驗證,結果表明本文所提出的能夠較好地預測在復雜戰(zhàn)場環(huán)境下,油料裝備保障的最優(yōu)時間,能夠為油料裝備保障信息化建設提供有價值的參考。