林 琳, 陳湘芝, 鐘詩勝
(哈爾濱工業(yè)大學 機電工程學院, 哈爾濱 150001)
林琳, 陳湘芝, 鐘詩勝
(哈爾濱工業(yè)大學 機電工程學院, 哈爾濱 150001)
摘要:針對工程機械備件需求預測準確性低的問題,提出一種新的基于特征合成的周期性維修備件需求預測方法. 定義等間隔備件需求樣本集的相似度模型,采用優(yōu)化算法確定最優(yōu)備件需求周期長度,并利用回歸模型建立各周期內的備件需求模型;提出基于特征合成的模型綜合方法,借鑒物理力學中的矢量合成方法,將多個歷史備件周期需求模型特征矢量合成新的特征矢量,利用新特征矢量還原獲得最優(yōu)的周期預測模型,該模型綜合考慮了各個歷史備件周期預測模型,使獲得的備件周期預測模型具有更好的魯棒性和泛化性. 采用人工數(shù)據(jù)和礦用圓環(huán)鏈的實際需求數(shù)據(jù)對該預測模型進行驗證,實驗結果表明,該模型具有良好的穩(wěn)定性和準確性.
關鍵詞:需求預測;維修備件;特征合成;周期提?。恢芷谛枨蠼?/p>
備件是大型機械設備正常運作的保障性物資,必須保證適量且及時的備件供應,高效的備件庫存管理與供應對提高企業(yè)的經(jīng)濟效益具有重要意義[1]. 其中,備件需求量的確定是備件庫存管理的前提. 影響備件需求的原因是多方面的,除了備件的可靠性之外,備件的使用、維護方式及維修策略等均可能影響備件的需求量. 受這些復雜關系的影響,不同備件的歷史需求數(shù)據(jù)特征差異較大,需要針對備件的需求模式研究合適的需求預測方法[2]. 本文研究對象為需求模式呈周期性變化的備件,即其歷史需求時間序列中含有隨機性成分和周期性成分. 需求時間序列中含有周期性成分和隨機性成分時,基于時間序列的預測方法一般分為2類,第1類是使用ARIMA模型[3],這樣就剔除了歷史需求數(shù)據(jù)中的周期性成分,從而遺漏了數(shù)據(jù)中的重要信息[4]. 第2類是將周期性成分分離出來,如Holt-Winters模型[5]以及改進的Holt-Winters模型[6-7]. 該方法對于初始參數(shù)值以及平滑常數(shù)的確定仍有一定的困難[8]. Grubb等[9]對Holt-Winters模型進行改進,通過使預測誤差最小來獲取最佳的平滑常數(shù). Bermúdez等[10]則建立了用于更新季節(jié)指數(shù)的方程,以此為目標函數(shù),并對平滑常數(shù)以及初始值進行優(yōu)化. Abdesselam等[11]將模糊邏輯應用于Holt-Winters模型,并用實驗證明了方法的可行性. 除此之外,針對周期型備件的需求預測,董笑曉[12]提出移動平均周期系數(shù)法,即采用系數(shù)來表征時間序列中的周期性成分. Boylan等[13]針對歷史需求數(shù)據(jù)不足這一問題,將GSI(group seasonal indices)和ISI(individual seasonal indices)方法結合起來用于預測需求. 對具有季節(jié)性的間斷型需求,Gamberini等[14]比較了Holt-Winters和ARIMA模型的預測精度.
本文提出對備件實際需求數(shù)據(jù)按其周期長度進行分段,然后對各段進行多項式擬合以提取周期項,為消除隨機因素的影響,對各個周期段的多項式函數(shù)進行合成得到新的多項式函數(shù),以此來計算下一個周期的需求量預測值.
1周期長度檢測
通常備件的需求數(shù)據(jù)雖然呈現(xiàn)出一定的周期性,但是其周期性并不是表現(xiàn)為以周期間隔的需求數(shù)據(jù)相等,而是具有相似的波動形式. 假定時間序列X=(x1,x2,…,xn),對于時間序列中以周期間隔的兩個數(shù)據(jù),如果有xt+T=xt+εt,其中εt為獨立的隨機變量,則說明該時間序列是周期為T的隱周期序列[15]. 為獲得隱周期時間序列的周期長度,一般是將時間序列等分成N段,分別比較各段時間序列的相似度,如果平均相似度滿足一定的閾值,則說明時間序列存在該長度的周期. 因此,為檢測時間序列的周期,最重要的是解決如何準確的度量時間序列的相似度這一問題.
1.1時間序列的相似性度量
在相似性度量的研究中,大部分采用歐式距離來度量兩個時間序列的相似性,距離度量值越小,則兩個時間序列越相似. 對于兩個等長的時間序列H=(h1,h2,…,hm)和L=(l1,l2,…,lm),H是目標時間序列,L是需要進行相似度測量的時間序列,則這兩個時間序列之間的歐式距離定義為
(1)
但是,式(1)只是表征了兩個時間序列在距離上的接近程度,并未體現(xiàn)其動態(tài)變化趨勢. 兩個數(shù)據(jù)的相似性也表現(xiàn)為它們的整體波動趨勢一致,具有一定的相關性,因此可以用相關系數(shù)作為相似性度量的另一個量值. 當相關系數(shù)>0時,表現(xiàn)為正相關,即H上升,L也上升,H下降,L也下降,此時具有較大的相似度. 當相關系數(shù)<0時,表現(xiàn)為負相關,此時,兩序列相似度較小. 在計算相似度時,需要同時考慮兩時間序列的歐式距離和相關系數(shù). 因此,對兩個長度相等的時間序列H=(h1,h2,…,hm)和L=(l1,l2,…,lm),其相似性度量函數(shù)為
(2)
式中ρHL為表示時間序列H和L的相關系數(shù).
用式(2)計算兩個時間序列的相似度,當f(H,L)≤α時,則認為兩個時間序列具有相似性.
1.2基于相似度的周期長度檢測
給定時間序列X=(x1,x2,…,xn),設序列H=(xt,xt+1,…,xt+T-1)為原始時間序列中的T片段,則序列集合{(x1+K*T,x2+K*T,…,x(K+1)*T)|K=0~[n/T]}([?]表示取整)為時間序列X的T片段集合,計為XT. 對于時間序列X=(x1,x2,…,xn),當時間長度為T時,時間序列X按照時間長度T分段后,該時間序列的T片段集合XT的平均相似度為
(3)
(4)
式中:a=1,b=[n/2],閾值α為均值或中值的10%左右.
1)設定步長h,在區(qū)間[a,b]之間以步長h進行搜索,即令Tn=a+n*h(其中n=1,2,…,[(b-a)/h]),代入式(3)中并比較F(Tn)的大??;
2)根據(jù)目標函數(shù)(式(4))選出相對較優(yōu)的前m個時間長度Tn,重新標記為T1,T2,…,Tm;
3)分別以T1,T2,…,Tm為中心,搜索寬度為中心左右兩邊各h/2的范圍,以步長h/4在中心左右兩邊分別進行搜索,即令Tn=Tm+n*h/4(其中n∈[-2,2],n為整數(shù)),代入式(3)中并比較F(Tn)的大小;
4)根據(jù)目標函數(shù)(式(4))選出相對較優(yōu)的前l(fā)(l 2預測模型的建立 由前文得到時間序列的周期長度,則可以將整個時間序列按照其周期長度劃分成各個周期段. 各個周期段內的函數(shù)解析表達式未知,只是已知其上m個數(shù)據(jù)點(xi,yi),i∈[1,m],為提取各個周期段內的周期函數(shù),需對已知的各個周期內的數(shù)據(jù)點進行函數(shù)擬合. 對于各個周期段內的歷史需求數(shù)據(jù),由于各個周期內的備件需求受到的外界因素影響是不一樣的,因此,由擬合函數(shù)所提取的周期項并不能代表整個時間序列上的周期趨勢. 為消除隨機因素的影響,可將各個周期段內的擬合函數(shù)進行合成,得到一個新的擬合函數(shù),綜合所有周期內的需求趨勢,以此作為整個時間序列上的周期項表達式. 2.1多項式函數(shù)擬合 各個周期段內的離散數(shù)據(jù)點比較少,而多項式擬合方法簡單有效,應用廣泛,本文采用多項式擬合離散需求數(shù)據(jù). 設φ為所有次數(shù)不超過n(n≤m)的多項式構成的函數(shù)類,對數(shù)據(jù)點(xi,yi)(i∈[1,m])擬合,即求 使得 最小. 上述問題的求解最終可轉換為求極值的問題,最后可以求解出參數(shù)ak(k=0,1,···,n)的值,得到擬合多項式的表達式: (5) 2.2擬合多項式函數(shù)的合成 空間中任意多個向量采取兩兩合成的方法最終可以合成一個向量,由多個函數(shù)最終合成為一個函數(shù)也可以借鑒向量合成的思想. 對于時間序列中任意兩個周期段內的多項式擬合函數(shù),獲取函數(shù)的特征集合,函數(shù)的特征即為能夠將函數(shù)區(qū)分開來的對象,可以利用向量合成的方式將多個函數(shù)特征集合合成為一個新的特征集合,合成的新特征集合再還原成一個新的多項式擬合函數(shù),這就將多個函數(shù)合成轉換為對函數(shù)特征集合的合成. 2.2.1多項式函數(shù)的特征集合 2.2.2基于特征集合合成的函數(shù)合成 對于兩個函數(shù)的合成過程,以多項式次數(shù)為3時的兩個周期函數(shù)為例進行解釋,過程如圖1所示. 圖1 特征集合合成過程 第1個和第2個周期段內的數(shù)據(jù)點經(jīng)擬合后得到的多項式函數(shù)表達式分別為 p1(x)=a3x3+a2x2+a1x1+a0, p2(x)=b3x3+b2x2+b1x1+b0. 這兩個函數(shù)的特征集合分別為 P3={c3,c2,c1,c0},ck=(ak+bk)/2,(k=0,1,2,3). 最后根據(jù)合成的新特征集合還原成新的多項式函數(shù)為 p3(x)=c3x3+c2x2+c1x1+c0. 考慮到歷史需求數(shù)據(jù)信息對預測未來周期段內的備件需求量的作用是不一樣的,對于新合成函數(shù)特征值的計算采用加權求和法,而不是求和取平均,即ck=w1ak+w2bk,其中0 s.t.w1∈(0,1). (6) 式中:yi為實際需求數(shù)據(jù),yi′(w1)為對應的預測值,采用應用較廣的遺傳算法求解權重. 3實驗驗證 3.1人工數(shù)據(jù)驗證 試驗所采用的數(shù)據(jù)由SinSeries數(shù)據(jù)產(chǎn)生器產(chǎn)生,該數(shù)據(jù)產(chǎn)生器為 式中:μi、σi為隨機數(shù),A=80,T=3,B=300,μ=0,σ=20. 截取xi中的45個數(shù)據(jù)作為樣本數(shù)據(jù). 周期長度的取值范圍為1~23,閾值為均值的10%,用1.2節(jié)中的周期長度檢測算法計算得到序列的周期長度為9. 將樣本數(shù)據(jù)分成5個數(shù)據(jù)段,以前面4個周期段的數(shù)據(jù)建立備件需求預測模型,用該預測模型計算第5個周期段的需求. 當n=6時,計算得到的第4個周期段的需求預測值與實際值的誤差最小,因此選擇擬合多項式n=6. 以第4個周期段的預測值的平均相對誤差最小為優(yōu)化函數(shù),采用遺傳算法確定權值為w1=0.41,w2=0.29,w3=0.30. 確定多項式擬合次數(shù)和權值后,則可建立需求預測模型. 對周期段2、3、4的離散數(shù)據(jù)進行擬合,得到各段的擬合多項式函數(shù),表1中第2~4行分別是這3個周期段擬合多項式函數(shù)的特征值. 通過加權合成方式得到新的特征值為dn=0.41an+0.29bn+0.3cn,即表1中第5行所示數(shù)據(jù). 表1 多項式函數(shù)的特征值 用新合成的特征值還原成多項式函數(shù),以此作為預測模型用于預測第5個周期段的數(shù)據(jù),預測結果如圖2所示. 實驗表明,預測值與實際值的平均相對誤差為7.4%. 圖2 預測值與實際值比較 3.2備件需求預測驗證 運用該方法對礦用高強度圓環(huán)鏈的需求進行預測,并與文獻[12]中的移動平均周期系數(shù)法進行對比分析. 圓環(huán)鏈為采煤機的備件,實驗數(shù)據(jù)來自文獻[16],為2007年1月~2010年12月計4年的數(shù)據(jù). 已知備件歷史需求數(shù)據(jù),周期長度T的取值范圍為1-24,閾值α為備件需求數(shù)據(jù)均值的10%,通過1.2節(jié)的周期長度檢測算法計算得出備件需求時間序列的周期為12. 按照周期長度將樣本數(shù)據(jù)分成4個周期段,以前面3個周期段的數(shù)據(jù)建立備件需求預測模型,使用所建立的預測模型計算最后12個月的備件需求量,并和需求實際值進行對比. 在建立周期需求預測模型時,需要確定的參數(shù)為多項式的擬合次數(shù)n,擬合次數(shù)n可以通過實驗獲得. 遍歷擬合次數(shù)n可能的值,選擇使得第3個周期段的預測值和實際值的預測誤差最小的擬合次數(shù),以此作為最佳的多項式擬合次數(shù). 表2列出了各數(shù)值對應的預測誤差,可以看出,當多項式次數(shù)為n=11時,預測誤差最小,因此,采用多項式回歸模型擬合備件需求數(shù)據(jù)時,多項式次數(shù)為n=11. 表2 各多項式次數(shù)對應的預測誤差 對第1、2周期段的離散需求數(shù)據(jù)分別進行多項式擬合,提取其特征集合,集合中的元素分別設為an和bn,采用加權求和的方式來合成新的特征集合,即dn=w1an+w2bn,其中,0≤w1≤1,0≤w2≤1,w1+w2=1,式(6)為優(yōu)化目標,yi為第3個周期段的需求數(shù)據(jù),并采用遺傳算法求解w1和w2. 設置遺傳算法的初始種群為80,迭代次數(shù)為80,適應度函數(shù)為式(6),交叉概率為0.3,變異概率為0.7,編碼方式為浮點數(shù)編碼、選擇方式為比例選擇,交叉方式為線性交叉,變異方式為擾動變異. 遺傳算法求解結果如圖3所示,求得w1=0,則w2=1. 圖3 遺傳算法求解結果 以上過程通過對前3個周期段的數(shù)據(jù)分析確定了預測模型的多項式擬合次數(shù)n=11,權值w1=0,w2=1. 當這些參數(shù)確定后,則可以建立周期型需求模式的備件需求預測模型. 對第2、3個周期段內的離散數(shù)據(jù)進行多項式擬合,提取多項式函數(shù)的特征集合,特征集合中的元素分別設為an′和bn′,如表3所示. 表3 各周期段多項式函數(shù)的特征值表 采用加權求和的方式來合成新的特征集合,即dn′=w1an′+w2bn′,故dn′=bn′. 合成后的特征值如表3中第4行所示. 合成得到的新的特征集合還原成新的多項式函數(shù),此多項式函數(shù)即為需求預測模型,各周期段的加權合成過程如圖4所示. 應用該模型計算2010年12個月的備件需求量數(shù)據(jù),預測結果如圖5所示,可以看出預測值比較接近實際值. 圖4 周期段的加權合成 圖5 多項式擬合模型的預測結果 本文所述預測模型與移動平均周期系數(shù)法的預測結果比較如表4所示. 表4 兩種預測模型結果對比 從表4中的數(shù)據(jù)可以計算出,移動平均周期系數(shù)法的預測值與實際值的平均絕對誤差為286.8,平均相對誤差為12.8%. 多項式擬合模型的預測值與實際值的平均絕對誤差為199.6,平均相對誤差為8.9%. 因此可以看出本文提出的預測模型的預測效果更好. 4結論與展望 1)針對需求模式為周期型的維修備件需求預測問題,本文提出了一種新的需求預測方法. 用預測模型對人工數(shù)據(jù)和礦用圓環(huán)鏈的需求量進行預測,實驗結果表明,該預測方法具有較高的預測精度. 2)維修備件的種類非常多,對于不同種類的維修備件,其需求數(shù)據(jù)的波動形式會有較大區(qū)別,有時其周期成分比較弱,可能會被隨機成分遮掩,此時,本文所提的預測方法并不適用. 因此,針對不同形式的維修備件需求數(shù)據(jù),探討新的建模方法,仍然是今后需要深入研究的工作. 參考文獻 [1] 王林, 富慶亮, 曾宇容. 基于遺傳和差分進化算法的備件庫存協(xié)同控制模型[J]. 計算機集成制造系統(tǒng), 2010, 16(10): 2257-2264. [2] NEZIH A. Service parts management: demand forecasting and inventory control[M]. New York: Springer Verlag GMBH, 2011: 89-101. [3] 王振龍. 時間序列分析[M]. 北京: 中國統(tǒng)計出版社, 2000: 45-50. [4] 采峰, 曾鳳章. 產(chǎn)品需求量非平穩(wěn)時序的ANN-ARMA預測模型[J]. 北京理工大學學報, 2007, 27(3): 277-282. [5] WINTERS P R. Forecasting sales by exponentially weighted moving averages[J]. Management Science, 1960, 6(3): 324-342. [6] VINKO L, MARIJA A. Forecasting electricity consumption by using Holt-Winters and seasonal regression models[J]. Economics and Organization, 2011, 8(4): 421-431. [7] LEE M H, NOR M E, SUHARTONO, et al. Fuzzy time series: an application to tourism demand forecasting[J]. American Journal of Applied Sciences, 2012, 9(1): 132-140. [8] BERMúDEZ J D, SEGURA J V, VERCHER V E. A decision support system methodology for forecasting of time series based on soft computing[J]. Computational Statistics & Data Analysis, 2006, 51(1): 177-191. [9] GRUBB H, MASON A. Long lead-time forecasting of UK air passengers by Holt-Winters methods with damped trend[J]. International Journal of Forecasting, 2001, 17(1): 71-82. [10]BERMúDEZ J D, SEGURA J V, VERCHER V E. Holt-winters forecasting: an alternative formulation applied to UK air passenger data[J]. Journal of Applied Statistics, 2007, 34(9): 1075-1090. [11]ABDESSELAM M, KARIM A N M, KAYS H M E, et al. Forecasting demand: development of a fuzzy growth adjusted Holt-Winters approach[J]. Advanced Materials Research, 2014, 903: 402-407. [12]董笑曉. 基于需求預測的軌道交通備件庫存控制研究[D]. 上海: 上海交通大學, 2012: 30-34. [13]BOYLAN J E, CHEN H, MOHAMMADIPOUR M, et al. Formation of seasonal groups and application of seasonal indices[J]. Journal of the Operational Research Society, 2014, 65(2): 227-241. [14]GAMBERINI R, LOLLI F, RIMINI B,et al. Forecasting of sporadic demand patterns with seasonality and trend components: an empirical comparison between Holt-Winters and (s)ARIMA methods[J/OL]. Mathematical Problems in Engineering, 2010. DOI: 10.1155/2010/579010. [15]李曉光, 宋寶燕, 于戈, 等. 基于小波的時間序列流偽周期檢測方法[J]. 軟件學報, 2010, 21(9): 2161-2172. [16]李志. 基于支持向量機的兗礦集團備件需求研究[D]. 青島: 中國海洋大學, 2012: 38. (編輯楊波) Demand forecasting method for periodic spare parts based on feature synthesis LIN Lin,CHEN Xiangzhi,ZHONG Shisheng (School of Mechatronics Engineering, Harbin Institute of Technology, Harbin 150001, China) Abstract:A novel approach for forecasting the periodic demand of spare parts based on feature synthesis is proposed to solve the problem of inaccurate prediction due to many influencing factors of the spare parts demand for construction machines and the demand cycle hard to be selected. The optimal demand cycle length is obtained with the optimization algorithm by defining a similarity measuring model of the spare parts demand sample sets under equal space, and the demand model for spare parts in every cycle period is built by the regression model. Then, a method is presented to integrate multiple cycle demand models of the spare parts into one according to the vector synthesis method in physics, so the optimal demand forecasting model for the spare parts with periodic pattern is obtained by reduction technology. The model synthetically considers the demand forecasting model for the spare parts in every historical cycle and it is great robust and generalized. The prediction model is verified by simulated datasets and the practical data of the demand of round link chains for mining, and experiment results prove that the model has good stability and accuracy. Keywords:demand forecasting; spare parts; feature synthesis; period extraction; periodic requirement modeling doi:10.11918/j.issn.0367-6234.2016.07.004 收稿日期:2015-05-21 基金項目:國家科技支撐計劃(2015BAF32B01-4); 作者簡介:林琳(1973—),女, 教授,博士生導師; 鐘詩勝(1964—),男,教授,博士生導師 通信作者:林琳, waiwaiyl@163.com 中圖分類號:TP301; F272.1 文獻標志碼:A 文章編號:0367-6234(2016)07-0027-06 國家自然科學基金(U1533202)