劉 暢,伍 潔,肖 斌,張東東
(1.海軍工程大學 管理工程與裝備經(jīng)濟系,湖北 武漢 430033;2.武警第二機動總隊,福建 福州 350200)
維修器材是指用于裝備維修所需要的零部件、元器件、附件、原材料及耗材的總稱,包括裝備購置費購買的隨裝器材和維修管理費購買、修復、研制和維修的器材[1]。目前,國內(nèi)外學者對消耗性器材備件預測方法進行了大量探索,如BP神經(jīng)網(wǎng)絡、卡爾曼濾波、支持向量機和極端學習機等。BP神經(jīng)網(wǎng)絡考慮了數(shù)據(jù)序列的非線性,但收斂速度慢,容易出現(xiàn)網(wǎng)絡結(jié)構(gòu)確定不方便、過學習、欠學習、局部極小等問題[2];卡爾曼濾波使用前一點的預測值和當前值更新狀態(tài)變量的估量,該方法的前提是假定噪聲的統(tǒng)計特性已知,但這也正是其難點所在[3];支持向量機法在處理小樣本回歸問題時能較好地解決非線性問題,但核函數(shù)及懲罰系數(shù)等參數(shù)對支持向量機的預測結(jié)果影響較大,且訓練集大時,運算耗時長[4]。與傳統(tǒng)的基于梯度下降尋優(yōu)的算法相比,極限學習機(extreme learning machine,ELM)的訓練速度更快,可以節(jié)省網(wǎng)絡參數(shù)的調(diào)整時間,學習效率較高。
目前,粒子群算法與極限學習機組合算法(PSO-ELM)在二氧化碳排放[5]、太陽能光伏發(fā)電[6]和原油期貨價格[7]等領域顯示了優(yōu)異的預測性能,但尚無PSO-ELM用于器材消耗預測的研究。由于器材消耗量序列的非線性、非平穩(wěn)性,筆者利用PSO優(yōu)化后的ELM具有的強泛化能力和非線性的表征能力,通過3種非線性、非平穩(wěn)數(shù)據(jù)集測試及器材消耗數(shù)據(jù)的預測分析,驗證了PSO-ELM的預測精度優(yōu)于EMD-GA-BP、LSSVM、PSO-LSSVM、ELM模型。
ELM由HUANG等[8]提出,是一種單隱含層前饋神經(jīng)網(wǎng)絡。若訓練樣本R={(xj,tj)|j=1,2,…,N;xj∈Rn,tj∈Rm},則極限學習機的算法可以表示為:
(1)
式中:ai=[ai1,ai2,…,ain]T為隱藏層與輸入層之間的連接權值;bi為隱含層第i個節(jié)點的偏置,i=,1,2,…,L;βi=[β1i,β2i,…,βmi]T為隱含層第i個節(jié)點與輸出層節(jié)點的權值;xj為輸入值;tj為輸出值;L為隱藏層節(jié)點數(shù);N為樣本數(shù)量。
式(1)可簡化為:
Hβ=T
(2)
式中:H為隱藏層輸出矩陣;T為樣本輸出;β為輸出層權值。
計算隱藏層輸出矩陣,即:
(3)
通過式(2)和式(3)計算輸出層權值β:
(4)
其中,H+為H的Moore-Penrose廣義逆。
將測試集代入式(3)計算隱藏層輸出矩陣H,結(jié)合式(2)和式(4)計算測試集輸出值:
(5)
E(W)為期望與實際值的誤差平方和,搜索最優(yōu)權值W=(a,b,β)使代價函數(shù)E(W)最小,可表示為:
(6)
其中,εj=[εj1,εj2,…,εjm]為第j個樣本的誤差。
PSO算法在初始化時,粒子被隨機給予一個位置和速度,不同個體代表不同的隨機解,迭代后最終得到粒子最優(yōu)解。D維空間中第i個粒子的速度為Vi=[vi1,vi2,…,viD],位置為Xi=[xi1,xi2,…,xiD]。跟蹤個體極值Pb、種群極值Gb迭代更新位置,并根據(jù)式(7)和式(8)更新粒子的速度、位置。
vij(t+1)=w·vij(t)+c1r1[Pij-xij(t)]+
c2r2[Gj-xij(t)]
(7)
xij(t+1)=xij(t)+vij(t+1)
(8)
式中:c1、c2分別為個體學習因子、社會學習因子;r1、r2為[0,1]區(qū)間的隨機數(shù);w為慣性因子,調(diào)整w對尋優(yōu)性能作出調(diào)整。
參數(shù)設置如下:①慣性權重。w較大便于全局尋優(yōu),較小便于局部尋優(yōu)。為了平衡優(yōu)化過程,采用線性遞減權重。取迭代次數(shù)為20,wmin=0.4,wmax=0.8。②學習因子。標準PSO中,c1=c2,即粒子轉(zhuǎn)移到兩個不同位置的概率相同,未考慮每個粒子各階段的搜索重點。相對非線性配對發(fā)現(xiàn),c1+c2≤4時,利于ELM預測,故令c1=2.4,c2=1.6。③粒子速度和位置。為避免尋優(yōu)發(fā)散,粒子速度、位置通常設在一定區(qū)域內(nèi)。因粒子由ELM網(wǎng)絡連接,故將粒子速度、位置設為[-1,1]。④ELM參數(shù)。訓練誤差目標為0.001,輸入為1,輸出為1,隱含層為30,激活函數(shù)選擇Sig函數(shù)。
將學習樣本輸出、實際輸出的均方誤差作為PSO的適應度。比較目前適應度與最優(yōu)適應度,若目前適應度相對較小,則將目前適應度更新為最優(yōu)適應度,目前位置更新為Pb,否則保持最優(yōu)適應度不變。同樣,比較適應度、全局適應度,更新Gb。直到迭代達最大次數(shù)或適應度達設定值。算法具體步驟如下:①標準化樣本數(shù)據(jù),建立訓練集、測試集;②輸入輸出數(shù)據(jù)確定網(wǎng)絡結(jié)構(gòu);③初始化粒子數(shù)、空間維數(shù)、慣性參數(shù)w、學習因子c1與c2、迭代次數(shù)、最大速度vmax;④將構(gòu)建的訓練集輸入ELM,根據(jù)式(9)計算個體的適應度,尋找個體和全局最優(yōu)粒子的位置和最優(yōu)值;⑤按照式(7)和式(8)更新粒子速度和位置;⑥重新計算適應度并更新位置和速度;⑦PSO優(yōu)化得到ELM最優(yōu)參數(shù)ai、βi、bi后,代入ELM模型中進行預測。⑧結(jié)果評價值計算。
(9)
PSO-ELM算法流程圖如圖1所示。
圖1 PSO-ELM算法流程圖
采用平均絕對誤差(mean absolute error,MAE)、均方根誤差(root mean square error,RMSE)、平均絕對百分比誤差(mean absolute percentage error,MAPE)作為評價指標。
(10)
(11)
(12)
由于股票指數(shù)具有非線性波動的特點,在股票指數(shù)原有趨向出現(xiàn)反轉(zhuǎn)時,時間序列模型不便預測,ELM給股票預測帶來了新的方法。選取上證指數(shù)(000001)、深證成指(399001)、滬深300(399300)非線性非平穩(wěn)性的收盤價作為數(shù)據(jù)集1,測試模型的預測性能。數(shù)據(jù)集1包括2018年3月20日—2021年1月29日700個數(shù)據(jù)(前600個用于訓練,后100個用于測試),數(shù)據(jù)來自WIND數(shù)據(jù)庫,實證過程基于Eviews11和Matlab2019a完成,具體數(shù)據(jù)如表1所示。
表1 股票收盤價數(shù)據(jù)
(1)上證指數(shù):使用文獻[9]中的BDS(brock dechert & scheinkman)檢驗,標準差為0.003 3、0.005 2、0.006 1、0.006 2、0.006 4,嵌入維數(shù)范圍為2~6,標準差為0.003 3,當維數(shù)為2時統(tǒng)計值最小(56.210 6),但5%顯著性水平下仍大于臨界值1.96,95%的置信水平下是非線性的;使用ADF(augmented dickey-fuller)檢驗時,t統(tǒng)計量為-1.278 1,大于5%顯著性水平下的臨界值-1.942 2,95%的置信水平下是非平穩(wěn)的。
(2)深證成指:使用BDS檢驗時,標準差分別為0.003 4、0.005 4、0.006 3、0.006 4、0.006 6,嵌入維數(shù)范圍為2~6,標準差為0.003 4,當維數(shù)為2時統(tǒng)計值最小(55.494 6),但5%顯著性水平下仍大于臨界值1.96,95%的置信水平下是非線性的;使用ADF檢驗時,t統(tǒng)計量為-1.278 1,大于5%顯著性水平下的臨界值-1.942 2,95%的置信水平下是非平穩(wěn)的。
(3)滬深300:使用BDS檢驗時,標準差分別為0.003 1、0.004 8、0.005 7、0.005 9,嵌入維數(shù)范圍為2~6,標準差為0.003 1,當維數(shù)為2時統(tǒng)計值最小(59.977 2),但5%顯著性水平下仍大于臨界值1.96,95%的置信水平下是非線性的;使用ADF檢驗時,t統(tǒng)計量為-1.530 1,大于5%顯著性水平下的臨界值-1.942 2,95%的置信水平下是非平穩(wěn)的。
以某裝備器材消耗量序列作為數(shù)據(jù)集2,開展應用分析,以月為單位,共獲取120個月的統(tǒng)計數(shù)據(jù),如圖2所示。由圖2可知,器材消耗量數(shù)據(jù)具備非線性非平穩(wěn)特征的數(shù)據(jù)集,異常值較多,具有明顯的周期性特點。
圖2 原始器材消耗量序列圖
隨著多樣化軍事任務的頻率和強度不斷增加,加之經(jīng)濟環(huán)境的動態(tài)變化,裝備器材的消耗會受到各種內(nèi)外部因素的影響,這些影響的顯性表現(xiàn)是多種多樣的?,F(xiàn)代改裝、各種培訓、等級修理、供需彈性不足、經(jīng)濟環(huán)境劇烈波動,使消耗序列結(jié)構(gòu)發(fā)生突變。上述因素在不同時期的影響是非線性和非平穩(wěn)的,使得傳統(tǒng)預測和決策模型的適應性變差,分析更加困難[10-11]。
ADF檢驗顯示,計算得出在1%、5%和10%顯著性水平下的臨界值分別為-2.586 6、-1.943 8、-1.614 8,統(tǒng)計量為2.264 7,P值為0.994 3,表明消耗量序列是非平穩(wěn)的,序列中可能包括趨勢、季節(jié)性或周期性成分,符合裝備器材故障的一般規(guī)律以及計劃消耗與臨時任務消耗相結(jié)合的實際。
BDS檢驗顯示,標準差為0.004 7、0.007 3、0.008 3、0.008 6、0.008 8,嵌入維數(shù)范圍為2~6,當維數(shù)為4時統(tǒng)計值最小(6.360 9),大于顯著性水平5%時的臨界值1.96,說明消耗量序列是非線性的,驗證了消耗受到多重因素的共同作用,存在著復雜的非線性關系。
為了評價所提出組合模型的優(yōu)越性,將結(jié)果與EMD-GA-BP[12]、LSSVM[13]、PSO-LSSVM[14]的預測結(jié)果進行對比,如圖3和表2所示。
圖3 各模型預測結(jié)果對比
表2 各模型評估結(jié)果對比
從各模型的預測結(jié)果可以看出,PSO-ELM曲線沒有劇烈的波動和偏差,具有良好的泛化性能,與ELM及其他方法相比,精度有很大提高,對于非線性、非平穩(wěn)數(shù)據(jù)集有更好的魯棒性。
筆者從器材消耗序列特點和傳統(tǒng)器材需求預測建模缺陷出發(fā),針對時間序列的波動性、間歇性、隨機性等問題,提出了基于PSO-ELM的預測模型,選取3種非線性、非平穩(wěn)性的股價數(shù)據(jù)集進行效果測試,并對裝備器材消耗量數(shù)據(jù)作出預測,驗證了預測方法對于提升精度效果的穩(wěn)健性。對器材消耗進行科學預測,把握消耗規(guī)律,可以為現(xiàn)實生活器材管理中采購計劃的制訂提供參考依據(jù)。