?
數(shù)據(jù)挖掘在戰(zhàn)術(shù)導(dǎo)彈保障輔助決策系統(tǒng)中的應(yīng)用
針對(duì)在戰(zhàn)術(shù)導(dǎo)彈保障管理過程中出現(xiàn)的數(shù)據(jù)種類多、業(yè)務(wù)工作量大以及數(shù)據(jù)處理效率不高的問題,提出使用輔助決策系統(tǒng)來優(yōu)化業(yè)務(wù)流程,提高保障效率。以某型裝備的保障為例,針對(duì)保障數(shù)據(jù)做出數(shù)據(jù)挖掘效果仿真,分析裝備的保障特性,總結(jié)保障規(guī)律,為決策者提供科學(xué)的決策依據(jù)。
數(shù)據(jù)挖掘;決策支持;數(shù)據(jù)倉庫;決策樹
隨著全壽命周期管理思想在裝備管理中的不斷應(yīng)用,如何將裝備保障做得更精確、更高效,已經(jīng)成為我軍信息化建設(shè)的一個(gè)熱點(diǎn)。我軍戰(zhàn)術(shù)導(dǎo)彈裝備分布廣泛,型號(hào)、批次眾多,即使是同一種裝備,在不同的地域、不同的氣候條件以及不同的保障單位等都會(huì)造成裝備的性能差異。如果實(shí)施同一的維護(hù)保障手段、方法,同一的管理進(jìn)度,勢(shì)必影響裝備性能的發(fā)揮。本文通過戰(zhàn)術(shù)導(dǎo)彈保障部門積累的大量使用維護(hù)數(shù)據(jù),應(yīng)用數(shù)據(jù)挖掘方法來分析裝備的保障特性,總結(jié)戰(zhàn)術(shù)導(dǎo)彈保障的規(guī)律性特點(diǎn),并將此融入到裝備管理系統(tǒng)中。
輔助決策系統(tǒng)(Decision Support System, DSS) 在裝備保障中的應(yīng)用主要是以軍事裝備學(xué)、軍事運(yùn)籌學(xué)、控制論、思維科學(xué)和行為科學(xué)為基礎(chǔ),以計(jì)算機(jī)技術(shù)、模擬技術(shù)和信息技術(shù)為手段,面向裝備保障決策問題,支持指揮員和裝備保障機(jī)關(guān)對(duì)裝備保障活動(dòng)全過程做出決策[1]。
戰(zhàn)術(shù)導(dǎo)彈保障DSS貫穿于裝備的管理、使用和維護(hù)等各個(gè)環(huán)節(jié)。 應(yīng)用戰(zhàn)術(shù)導(dǎo)彈保障DSS可幫助裝備部門快速、準(zhǔn)確地掌握導(dǎo)彈裝備的各種信息,有效地提高管理和決策的及時(shí)性、科學(xué)性和準(zhǔn)確性。戰(zhàn)術(shù)導(dǎo)彈裝備保障流程主要包括7個(gè)部分(見圖1)[2]。一般情況下,決策者都是基于對(duì)當(dāng)前裝備保障狀況的掌握,對(duì)未來裝備保障的需求和發(fā)展做出預(yù)測(cè),從而制定相應(yīng)方案。
圖1 戰(zhàn)術(shù)導(dǎo)彈裝備保障流程
應(yīng)用戰(zhàn)術(shù)導(dǎo)彈保障DSS,除了利用網(wǎng)絡(luò)將各級(jí)保障單位有機(jī)的連成一體,方便、快捷和準(zhǔn)確地傳輸各種裝備保障信息、裝備狀態(tài)參數(shù),還應(yīng)將收集的數(shù)據(jù)進(jìn)行科學(xué)的分析,總結(jié)裝備保障中出現(xiàn)的規(guī)律性現(xiàn)象,以達(dá)到預(yù)測(cè)問題并對(duì)癥下藥的效果,為決策者提供科學(xué)的決策依據(jù)。
2.1 數(shù)據(jù)倉庫的數(shù)據(jù)分析
由裝備保障和倉儲(chǔ)可靠性原理可知,影響戰(zhàn)術(shù)導(dǎo)彈保障質(zhì)量的主要自然因素為倉儲(chǔ)環(huán)境和儲(chǔ)存時(shí)間。其中,倉儲(chǔ)環(huán)境包括自然環(huán)境因素、誘導(dǎo)環(huán)境因素和復(fù)合條件因素,自然環(huán)境因素如導(dǎo)彈倉儲(chǔ)的溫度、濕度、低氣壓、細(xì)菌和鹽霧等,誘導(dǎo)環(huán)境因素如機(jī)械沖擊、空氣污染等,還有自然環(huán)境因素和誘導(dǎo)環(huán)境因素同時(shí)作用的復(fù)合條件因素等,均可對(duì)導(dǎo)彈倉儲(chǔ)質(zhì)量產(chǎn)生影響[3]。此外,還有人為因素會(huì)對(duì)保障質(zhì)量產(chǎn)生影響,如保障方法和手段。由于導(dǎo)彈裝備的日常維護(hù)、維修、延壽和退役等均是根據(jù)各型裝備維護(hù)細(xì)則和上級(jí)機(jī)關(guān)要求完成,在實(shí)施手段上差異不大,所以本文主要討論自然因素對(duì)導(dǎo)彈保障的影響。
從不同的方向分析戰(zhàn)術(shù)導(dǎo)彈保障質(zhì)量數(shù)據(jù)可以得到許多信息。例如,分析倉儲(chǔ)時(shí)間,可以發(fā)現(xiàn)裝備在一年中某個(gè)特定時(shí)間段故障率較高;分析裝備的故障部件,可以發(fā)現(xiàn)哪些部件容易發(fā)生故障,哪些部件的可靠性較高;分析不同單位的保障數(shù)據(jù),可以比較各單位的倉儲(chǔ)環(huán)境。
2.2 數(shù)據(jù)倉庫建模
星型模型是一種由一點(diǎn)向外輻射的建模范例,中間有一個(gè)對(duì)象,延半徑向外連接到多個(gè)對(duì)象。星型模型反映了最終用戶對(duì)故障查詢的看法,檢測(cè)的情況、修復(fù)的情況和換件的情況都可以通過一維或多維來描述(按時(shí)間、地理分布等)。星型模式中心的對(duì)象稱為事實(shí)表,與之相連的對(duì)象稱為維度表(見表1)。
表1 故障維度表
目前,決策樹的生成方法主要有2個(gè)著名的算法:ID3算法和C4.5算法,其中,C4.5算法是ID3算法的擴(kuò)充[4],本文采用ID3算法。
信息增益是基于信息論中熵(Entropy)的概念。ID3算法總是選擇具有最高信息增益(或最大熵壓縮)的屬性作為當(dāng)前結(jié)點(diǎn)的測(cè)試屬性。該屬性使得對(duì)結(jié)果劃分中的樣本分類所需的信息量最小,并反應(yīng)劃分的最小隨機(jī)性或不純性。采用這種信息理論方法,使得對(duì)一個(gè)對(duì)象分類所需的期望測(cè)試數(shù)目達(dá)到最小,并盡量確保找到一棵簡單的(但不必是最簡單的)樹來刻畫相關(guān)的信息。
下述結(jié)合表2所示的一組簡單的假想測(cè)試數(shù)據(jù),介紹數(shù)據(jù)挖掘的數(shù)據(jù)訓(xùn)練過程、知識(shí)獲取方法,構(gòu)造導(dǎo)彈保障可靠性決策樹。
表2 某型裝備測(cè)試訓(xùn)練數(shù)據(jù)
設(shè)S是此裝備測(cè)試數(shù)據(jù)所有數(shù)據(jù)樣本的集合,表2 中的10 條測(cè)試數(shù)據(jù)即構(gòu)成了一個(gè)簡單的S集合。設(shè)所需要分析的結(jié)果屬性具有m個(gè)不同值,定義m個(gè)不同類Ci(i=1,2,…,m),表2中共有3個(gè)結(jié)果屬性,m=3。類C1對(duì)應(yīng)于“部件老化”;類C2對(duì)應(yīng)于“正?!?;類C3對(duì)應(yīng)于“隨機(jī)故障”。設(shè)si是類Ci中的樣本數(shù):類C1有3個(gè)樣本,類C2有3個(gè)樣本,類C3有4個(gè)樣本。則對(duì)給定樣本分類所需的期望信息由下式給出:
(1)
式中,pi是任意樣本屬于Ci的概率,一般可以用si/s來估計(jì)。因?yàn)樾畔⒂枚M(jìn)位編碼,此處對(duì)數(shù)函數(shù)以2為底。由式1得到:
(2)
式中,(s1j+s2j+…+smj)/s是第j個(gè)子集的權(quán),并且等于子集(即A值為aj)中的樣本個(gè)數(shù)除以S中的樣本總數(shù)。熵值越小,子集劃分的純度就越高。根據(jù)上述給出的期望信息計(jì)算公式,對(duì)于給定的子集Sj,其期望信息由下式計(jì)算:
(3)
式中,pij=Sij/Sj是Sj中的樣本屬于類Ci的概率。
對(duì)于洞庫倉儲(chǔ)=“否”,s12=1,s22=2,s32=2, 由式3得:
下述計(jì)算每個(gè)屬性的熵。首先計(jì)算屬性為“洞庫倉儲(chǔ)”的熵。觀察屬性“對(duì)每個(gè)分布計(jì)算期望信息。如果樣本按“洞庫倉儲(chǔ)”劃分,對(duì)一個(gè)給定樣本分類所需的期望信息為:
由期望信息和熵值可以得到對(duì)應(yīng)的信息增益值。對(duì)于在A上分支將獲得的信息增益計(jì)算公式為:
(4)
則:
同理:
利用ID3算法計(jì)算每個(gè)屬性的信息增益,并選取具有最高增益的屬性作為給定集合S的測(cè)試屬性。對(duì)被選取的測(cè)試屬性逆光創(chuàng)建一個(gè)結(jié)點(diǎn),并以該屬性標(biāo)記,對(duì)該屬性的每個(gè)值創(chuàng)建一個(gè)分支,并據(jù)此劃分樣本。
由上述計(jì)算結(jié)果可知,倉儲(chǔ)溫度在屬性中具有最高信息增益,被選作測(cè)試屬性。創(chuàng)建一個(gè)節(jié)點(diǎn),用倉儲(chǔ)溫度標(biāo)記,并對(duì)每個(gè)屬性值,引出一個(gè)分支。樣本按此劃分,對(duì)每個(gè)分支再引出分支,用判定樹歸納分類法進(jìn)行分類,而后繼續(xù)引出分支,最后,算法返回最終的判定樹(見圖2)。
圖2 數(shù)據(jù)判定樹
將建立的判定樹歸納分類法模型所確定的檢驗(yàn)集實(shí)例分類與正確分類值進(jìn)行比較,檢驗(yàn)集分類的正確性預(yù)示模型將來的性能。
為了說明上文的數(shù)據(jù)挖掘模型在實(shí)際工作中的應(yīng)用,以某戰(zhàn)術(shù)導(dǎo)彈保障實(shí)例,用決策樹分類方法對(duì)故障部件和故障時(shí)間預(yù)測(cè)。
設(shè)某型導(dǎo)彈裝備服役以來,下發(fā)6個(gè)單位(a,b,c,d,e,f)對(duì)其進(jìn)行技術(shù)保障,各保障單位每次的檢測(cè)結(jié)果都有登記?,F(xiàn)在每個(gè)單位選取20套此型裝備的近10年來故障數(shù)據(jù),對(duì)其進(jìn)行分析,以求得到相關(guān)的保障規(guī)律。本文選取的數(shù)據(jù)挖掘工具為微軟Analysis Manager[5],它的決策樹分類算法為C4.5算法。保障單位決策樹如圖3所示。
圖3 保障單位決策樹
由圖3可以看出,此型裝備的2個(gè)易損部件I和II,部件I的故障率明顯高于部件II;當(dāng)裝備儲(chǔ)存至第8年后開始進(jìn)入故障高發(fā)期。在圖右側(cè)的直方圖中可以看出,保障單位c和d所保障的裝備故障率要高于其他單位。
因此,在為此型裝備配備維修力量和維修備件時(shí),應(yīng)多考慮上述故障特征,對(duì)部件I要準(zhǔn)備高于一般水平的配件數(shù);對(duì)保障單位c和d應(yīng)多配置保障力量。
數(shù)據(jù)挖掘作為一門新興的熱點(diǎn)技術(shù),將隨著技術(shù)的成熟而被越來越廣泛地應(yīng)用于裝備保障的方方面面。這也給我們當(dāng)前裝備保障提出了一個(gè)亟需解決的問題,即如何獲得、保存第一手裝備保障數(shù)據(jù)。在獲得數(shù)據(jù)后,應(yīng)按規(guī)范的標(biāo)準(zhǔn)將大量的保障數(shù)據(jù)保存、分類,來保證數(shù)據(jù)挖掘結(jié)果的可靠性,幫助決策者做出準(zhǔn)確的判斷,制定科學(xué)的保障方案。
[1] 馬龍,李劍雄,柳少軍.作戰(zhàn)指揮決策支持系統(tǒng)研究評(píng)述[J].軍事運(yùn)籌與系統(tǒng)工程,2004(9):48-52.
[2] 余高達(dá),趙潞生. 軍事裝備學(xué)[M].北京:清華大學(xué)出版社,2000.
[3] 陸廷孝,鄭鵬洲.可靠性設(shè)計(jì)與分析[M].北京:國防工業(yè)出版社,1995.
[4] 羅可,張學(xué)茂.SPRINT算法及其改進(jìn)方法[J] .計(jì)算機(jī)工程與應(yīng)用, 2005(32):178-180.
[5] 羅運(yùn)模.SQL Server2000數(shù)據(jù)倉庫應(yīng)用與開發(fā)[M].北京:人民郵電出版社,2001.
責(zé)任編輯 馬彤
劉培毅,劉 鑫,孫迎豐
(92941部隊(duì)92分隊(duì),遼寧 葫蘆島 125001)
The Application of Data Mining in the Decision Support System of Armament Maintenance Support
LIU Peiyi, LIU Xin,SUN Yingfeng
(Detachment 92 of 92941thUnit of PLA, Huludao 125001, China)
To tactical missile types of data appeared in the process of security management, appearing the volume of business and the low data processing efficiency, propose the use of auxiliary decision system to optimize business processes, and improve the efficiency of security. By using the method of data mining to a certain type of guarantee equipment, make a data mining effect on the security data simulation, analyze the equipment security feature, summarize the security law, and provide scientific decision for decision makers.
data mining, decision support, data warehouse, decision trees
I(s1,s2,s3)=I(3,3,4)=
I(s11,s21,s31)=
I(s12,s22,s32)=
Gain(洞庫倉儲(chǔ))=
Gain(倉儲(chǔ)時(shí)間>7a)=
Gain(倉儲(chǔ)溫度>18 ℃)=
Gain(倉儲(chǔ)低氣壓)=
Gain(倉儲(chǔ)濕度>40%)=
劉培毅(1978-),男,工程師,主要從事武器裝備試驗(yàn)方法等方面的研究。
2016-06-22
TP 311
A