基于PCA-SVM的航材需求預(yù)測(cè)方法研究
劉旭周麗華朱臣
(空軍勤務(wù)學(xué)院航材系徐州221000)
航材需求預(yù)測(cè)是對(duì)航材需求量客觀規(guī)律進(jìn)行預(yù)先估計(jì)和推測(cè),即根據(jù)現(xiàn)有的統(tǒng)計(jì)資料來(lái)推測(cè)航材未來(lái)的需求量。為了提高航材需求預(yù)測(cè)精度,論文提出一種將主成分分析與支持向量機(jī)相結(jié)合的航材需求預(yù)測(cè)模型,首先利用主成分分析法對(duì)航材消耗預(yù)測(cè)的各影響因素進(jìn)行篩選,然后將篩選結(jié)果作為支持向量機(jī)的輸入量,最后建立航材需求預(yù)測(cè)模型,計(jì)算結(jié)果表明主成分分析改進(jìn)支持向量機(jī)模型能夠提高航材需求預(yù)測(cè)的精度。
航材需求量;主成分分析;支持向量機(jī);預(yù)測(cè)
Class NumberE239.4
航材供應(yīng)直接影響著航空兵部隊(duì)、空降兵部隊(duì)?wèi)?zhàn)斗力的形成、維持和提高,是提高戰(zhàn)斗出動(dòng)率的基礎(chǔ)[1]?,F(xiàn)代高技術(shù)戰(zhàn)爭(zhēng)具有高速度、高強(qiáng)度、高消耗的特點(diǎn),對(duì)航材供應(yīng)的依賴(lài)性空前增大,要求航材部門(mén)能夠在要求的時(shí)間和地點(diǎn)提供所需的航材。但是供應(yīng)部門(mén)為了滿(mǎn)足使用需求,往往會(huì)加大航材庫(kù)存量,提高保險(xiǎn)程度,這就造成了大量航材積壓呆滯,浪費(fèi)嚴(yán)重。所以必須著力提高航材需求預(yù)測(cè)準(zhǔn)確率,權(quán)衡優(yōu)化航材供應(yīng)軍事效益和經(jīng)濟(jì)效益,以求能夠高效而又經(jīng)濟(jì)地保障部隊(duì)需要的航材。
需求預(yù)測(cè)的方法有很多,傳統(tǒng)的預(yù)測(cè)方法包括回歸分析法、移動(dòng)平均法、指數(shù)平滑法、灰色預(yù)測(cè)法等,現(xiàn)代預(yù)測(cè)方法包括BP神經(jīng)網(wǎng)絡(luò)、遺傳算法、支持向量機(jī)、模糊預(yù)測(cè)等。這些方法對(duì)航材需求預(yù)測(cè)精度的提高具有很大幫助,但是也存在兩個(gè)方面的問(wèn)題:一是預(yù)測(cè)精度未達(dá)到理想要求;二是這些預(yù)測(cè)方法只是選取幾個(gè)主要影響因素作為代表,這樣雖然降低了分析難度,但有可能將重要的影響因素忽略,從而使預(yù)測(cè)結(jié)果失真[2]。所以本節(jié)采用了主成分分析改進(jìn)支持向量機(jī)算法,既能抓住關(guān)鍵的影響因素,又能提高需求預(yù)測(cè)的準(zhǔn)確率。
2.1 主成分分析
在多元統(tǒng)計(jì)分析中,每一個(gè)指標(biāo)變量往往都不同程度地反映該類(lèi)指標(biāo)的信息,變量之間總會(huì)存在重疊、相關(guān)的關(guān)系,在研究過(guò)程中,變量太多會(huì)增大計(jì)算量和問(wèn)題的復(fù)雜性,所以一般在進(jìn)行定量分析的過(guò)程中涉及的影響因素要盡可能少,而包含的信息量要盡可能多。主成分分析法就是利用降維的思想,把多指標(biāo)轉(zhuǎn)化為少數(shù)幾個(gè)綜合指標(biāo),既能反映原始變量的大部分信息,而且所含信息互不重疊[3~4]。主成分分析法的計(jì)算步驟如下:
第一步:建立指標(biāo)變量矩陣
假設(shè)有n個(gè)指標(biāo)X1,X2,X3,…,Xn分別表示每個(gè)對(duì)象的各種特性,如果有N個(gè)對(duì)象,則可用N×n矩陣表示,即:
式中:xˉj、sj分別為指標(biāo)變量xj的均值和方差。
第三步:計(jì)算相關(guān)系數(shù)矩陣
第二步:數(shù)據(jù)標(biāo)準(zhǔn)化
按下式進(jìn)行標(biāo)準(zhǔn)化處理,生成標(biāo)準(zhǔn)化矩陣Y:
rij為標(biāo)準(zhǔn)化矩陣Y中yi與yj的相關(guān)系數(shù),rij=rji,其計(jì)算方法為
第四步:求特征值與特征向量
先對(duì)特征方程||λI-R=0求解,求出特征值,然后按大小順序進(jìn)行排列:
分別求出對(duì)應(yīng)于特征值λi的特征向量示向量ei的第j個(gè)分量。
第五步:求出主成分貢獻(xiàn)率和累計(jì)貢獻(xiàn)率
其中貢獻(xiàn)率的計(jì)算方法為
累計(jì)貢獻(xiàn)率的計(jì)算方法為
取累計(jì)貢獻(xiàn)率達(dá)到85%~95%的特征值λ1,λ2,…,λm所對(duì)應(yīng)的第1、第2、…、第m(m≤n)個(gè)主成分。
2.2 支持向量機(jī)
利用支持向量機(jī)(SVM)進(jìn)行預(yù)測(cè)的基本思路想為:通過(guò)引入非線性算子函數(shù)φ,把初始樣本映射到高維空間,并在高維空間對(duì)這些樣本進(jìn)行處理,通過(guò)這種方法能夠?qū)⒎蔷€性預(yù)測(cè)問(wèn)題變?yōu)楦呔S度上的線性預(yù)測(cè)問(wèn)題,這樣就可以把一些較復(fù)雜的運(yùn)算簡(jiǎn)單化[5]。式中,ω為自回歸系數(shù),b是誤差值。
由風(fēng)險(xiǎn)最小化正則函數(shù)計(jì)算得出ω和b的值,所以有:
式中,ξi,ξ*i為松弛因子,n是訓(xùn)練樣本個(gè)數(shù),C為懲罰參數(shù)。
根據(jù)拉格朗日函數(shù)的基本原理[6],將上述正則函數(shù)求解問(wèn)題變?yōu)橥苟蝺?yōu)化問(wèn)題,所以有:
式中,αi和是拉格朗日乘子。
最終得出支持向量機(jī)預(yù)測(cè)模型:
對(duì)于非線性預(yù)測(cè)問(wèn)題,利用核函數(shù)k(xi,x)將其映射到較高維度的空間中,變?yōu)楹?jiǎn)單線性問(wèn)題,再進(jìn)行預(yù)測(cè),即:
式中,k(xi,x)表示核函數(shù)。
一般情況下,歐氏徑向基核函數(shù)預(yù)測(cè)準(zhǔn)確度比其它核函數(shù)要高,因此選用歐氏徑向基核函數(shù)作為支持向量機(jī)的核函數(shù)[7]。最終得出支持向量機(jī)預(yù)測(cè)模型:
2.3 計(jì)算流程
首先利用主成分分析法對(duì)影響航材需求量的因素進(jìn)行篩選,并將簡(jiǎn)化后的因子作為支持向量機(jī)的輸入量,最終得到符合要求的主成分分析法優(yōu)化支持向量機(jī)的航材需求預(yù)測(cè)模型。
1)根據(jù)影響因素收集航材消耗歷史數(shù)據(jù),去除其中的錯(cuò)誤數(shù)據(jù)。
2)采用主成分分析法對(duì)原始航材消耗量化數(shù)據(jù)進(jìn)行處理,選擇主成分。
3)根據(jù)主成分選擇訓(xùn)練集和測(cè)試集。
4)將訓(xùn)練集輸入到支持向量機(jī)進(jìn)行學(xué)習(xí),建立最優(yōu)的航材消費(fèi)量預(yù)測(cè)模型。
5)采用最優(yōu)的航材消耗預(yù)測(cè)模型對(duì)測(cè)試集進(jìn)行預(yù)測(cè),得到相應(yīng)的預(yù)測(cè)結(jié)果。
基于主成分分析法改進(jìn)支持向量機(jī)的航材消耗預(yù)測(cè)模型計(jì)算流程如圖1所示。
根據(jù)對(duì)某場(chǎng)站飛機(jī)航材保障情況的分析研究可知,影響此機(jī)型航材需求的因素包括以下幾個(gè)方面:
1)飛行訓(xùn)練任務(wù)情況。飛行時(shí)間、起落次數(shù)、飛行強(qiáng)度、飛行科目難易等對(duì)航材的消耗都有影響,飛行時(shí)間越長(zhǎng),起落次數(shù)越多,飛行強(qiáng)度越大,飛行科目越困難,航材的消耗就會(huì)越多,需求也越大。
2)航材可靠性。航材技術(shù)狀態(tài)、產(chǎn)品質(zhì)量等都會(huì)對(duì)航材的消耗產(chǎn)生重要影響,航材技術(shù)狀態(tài)越好,故障率越小,平均故障間隔時(shí)間越短,航材的需求就越?。?]。
3)自然條件。自然條件對(duì)航材消耗會(huì)有一定影響,其中溫濕度對(duì)航材保管質(zhì)量影響較大,在此規(guī)定航材保管庫(kù)房溫度5℃~30℃、濕度45%~60%為正常溫濕度,把溫濕度不在該范圍內(nèi)的視為異常溫濕度[9]。
選取飛機(jī)總數(shù)a1(架)、飛行時(shí)間a2(小時(shí))、起落次數(shù)a3(次)、故障率a4(個(gè)103h)、平均故障間隔時(shí)間a5(10-3h)、異常溫度系數(shù)a6、異常濕度系數(shù)a7七個(gè)航材需求量影響因素進(jìn)行分析,其中異常溫度系數(shù)a6、異常濕度系數(shù)a7的值為當(dāng)年異常溫度或濕度與正常天數(shù)的比值,具體數(shù)據(jù)如表1所示,將2007~2013年的航材需求量相關(guān)數(shù)據(jù)作為訓(xùn)練樣本,將2014~2016年的數(shù)據(jù)作為預(yù)測(cè)樣本。
表12007 ~2016年航材需求量及各影響因素的數(shù)據(jù)
利用SPSS軟件對(duì)六個(gè)因素進(jìn)行處理,得到如表2所示結(jié)果。
根據(jù)式(1)計(jì)算標(biāo)準(zhǔn)化矩陣Y,將其轉(zhuǎn)化為如表3所示表格。根據(jù)式(2)計(jì)算相關(guān)系數(shù)矩陣R。
表2 均值和標(biāo)準(zhǔn)差
表3 標(biāo)準(zhǔn)化數(shù)據(jù)
通過(guò)計(jì)算得出六個(gè)因素的特征值為
根據(jù)式(3)可以得出各因素的貢獻(xiàn)率為
根據(jù)式(4)可以得到前兩個(gè)因素的累計(jì)貢獻(xiàn)率為
因此這兩個(gè)成分可以代表所有原始影響因素的信息,其余噪聲可以忽略。根據(jù)前兩個(gè)主成分對(duì)10項(xiàng)數(shù)據(jù)進(jìn)行處理,得到SVM的訓(xùn)練集和測(cè)試集,并對(duì)訓(xùn)練樣本和測(cè)試樣本進(jìn)行歸一化處理,歸一化公式為[10]
歸一化后數(shù)據(jù)如表4所示。
將訓(xùn)練集輸入到支持向量機(jī)進(jìn)行學(xué)習(xí),建立最優(yōu)的航材消耗量預(yù)測(cè)模型,并根據(jù)最優(yōu)模型對(duì)2007~2013年測(cè)試集進(jìn)行預(yù)測(cè),得到的預(yù)測(cè)結(jié)果如表5所示。
表4 歸一化數(shù)據(jù)
表5 預(yù)測(cè)結(jié)果
從表5可以看出,PCA-SVM預(yù)測(cè)模型擬合效果較好,預(yù)測(cè)相對(duì)誤差最大的僅為22.5%,圖2為PCA-SVM預(yù)測(cè)模型對(duì)訓(xùn)練集的預(yù)測(cè)曲線,從圖中可以看出預(yù)測(cè)值與真實(shí)值差距較小,預(yù)測(cè)效果較好,因此可以利用此模型對(duì)測(cè)試集進(jìn)行預(yù)測(cè)。
借助Matlab軟件,得到測(cè)試集的預(yù)測(cè)結(jié)果,將組合預(yù)測(cè)模型的預(yù)測(cè)結(jié)果與SVM單個(gè)模型的預(yù)測(cè)結(jié)果比較,比較結(jié)果如表6所示。
表6 PCA-SVM預(yù)測(cè)結(jié)果
從表6可知,PCA-SVM組合預(yù)測(cè)模型相對(duì)誤差較小,擬合效果和預(yù)測(cè)精度都較高,因?yàn)镻CA-SVM組合預(yù)測(cè)模型能夠?qū)⒕哂薪徊嫘?yīng)的影響因素排除掉,使SVM的輸入量更加貼合實(shí)際,因此具有較好的預(yù)測(cè)能力,從而為航材決策部門(mén)制定航材訂貨、供應(yīng)、儲(chǔ)存等計(jì)劃提供了科學(xué)依據(jù)。
飛機(jī)航材的消耗預(yù)測(cè)是航材保障工作的重要環(huán)節(jié),對(duì)航材的消耗進(jìn)行準(zhǔn)確預(yù)測(cè),能夠節(jié)省大量人力物力財(cái)力資源,確保部隊(duì)飛機(jī)完好率,提高庫(kù)存航材利用率,同時(shí)又能夠滿(mǎn)足飛行保障任務(wù)對(duì)航材的需求,有助于提高航材保障的軍事效益和經(jīng)濟(jì)效益。本文利用主成分分析法對(duì)傳統(tǒng)支持向量機(jī)預(yù)測(cè)模型進(jìn)行改進(jìn),充分考慮了航材消耗的各個(gè)主要因素,提高了預(yù)測(cè)精度,給航材訂貨部門(mén)提供了有力的決策支撐,對(duì)于提高航材完好率具有很大幫助。
[1]何亞群,柏林,趙福軍,等.航材供應(yīng)學(xué)[M].徐州:空軍勤務(wù)學(xué)院,2012:23-24.
[2]蔡新滄.基于主成分分析和粒子群優(yōu)化的支持向量機(jī)對(duì)汽車(chē)客運(yùn)量的預(yù)測(cè)[J].公路與汽運(yùn),2016(1):71-74.
[3]吳先慧.基于主成分分析和DEA方法的我國(guó)區(qū)域創(chuàng)新效率評(píng)價(jià)[D].哈爾濱:哈爾濱工業(yè)大學(xué),2011.
[4]岳斯瑋.主成分分析在生態(tài)城市建設(shè)能力評(píng)價(jià)中的應(yīng)用研究[D].成都:成都理工大學(xué),2011.
[5]江敏.基于主成分分析和支持向量機(jī)相結(jié)合的天然氣消耗量預(yù)測(cè).科技通報(bào)[J],2013,29(12):42-47.
[6]Gareth James,Daniela Witten,Trevor Hastie,et al.An introduction to statistical learning with applications in R[M].Beijing:China Machine Press,2015:234-256.
[7]高凱.基于支持向量機(jī)的煤自然預(yù)測(cè)方法研究[D].西安:西安科技大學(xué),2012.
[8]翟勝路,張作剛,李元壘.戰(zhàn)時(shí)航材需求預(yù)測(cè).四川兵工學(xué)報(bào)[J],2011,32(12):10-13.
[9]張良,崔崇立,賁徐偉等.基于影響因素主成分分析的航材消耗預(yù)測(cè)模型.兵工自動(dòng)化[J],2016,35(8):50-54.
[10]吳桂芳,何勇等.基于主成分分析和支持向量機(jī)的山羊絨原料品種鑒別分析.光譜學(xué)與光譜分析[J].2009,29(6):1541-1543.
Prediction of Air Material Requirement Based on PCA-SVM
LIU XuZHOU LihuaZHU Chen
(Department of Air Material,Air Force Logistics College,Xuzhou221000)
The forecast of air material demand is pre-estimated and speculated on the objective law of material demand.According to the existing statistical data,estimate the future demand of the material.In order to improve the accuracy of forecasting of air material demand,this paper proposes a material demand forecasting model combining principal component analysis and support vector machine.Firstly,the principal component analysis is used to screen the influencing factors of material consumption forecast. The results show that the principal component analysis and improved support vector machine model can improve the accuracy of forecasting of material demand.Finally,the forecasting model of material demand is established.
air material demand,principal component analysis,support vector machine,prediction
E239.4
10.3969/j.issn.1672-9730.2017.07.026
2017年1月12日,
2017年2月14日
劉旭,男,碩士研究生,研究方向:控制科學(xué)與工程。周麗華,女,碩士研究生,講師,研究方向:倉(cāng)儲(chǔ)管理。朱臣,男,碩士研究生,研究方向:控制科學(xué)與工程。