呂丹丹,顧巧祥,邢 超
(中國計量大學(xué) 質(zhì)量與安全工程學(xué)院,浙江 杭州310018)
二次指數(shù)平滑法優(yōu)化馬爾科夫預(yù)測模型
呂丹丹,顧巧祥,邢 超
(中國計量大學(xué) 質(zhì)量與安全工程學(xué)院,浙江 杭州310018)
馬爾科夫預(yù)測模型具有“無后效性”,即預(yù)測未來的銷售情況只與當(dāng)前的銷售數(shù)據(jù)有關(guān),而與過去的銷售數(shù)據(jù)無關(guān).事實上,過去不同的時間點對當(dāng)前的銷售結(jié)果會有不同程度的影響.而指數(shù)平滑法恰好彌補了馬爾科夫預(yù)測模型的缺點,它認為最近的過去銷售數(shù)據(jù),在某種程度上會持續(xù)到未來.因此本文利用二次指數(shù)平滑系數(shù)法優(yōu)化馬爾科夫預(yù)測模型,并以某品牌電動車的銷售情況為例進行驗證,發(fā)現(xiàn)優(yōu)化后預(yù)測模型的絕對誤差均小于馬爾科夫模型的預(yù)測結(jié)果.由此得出結(jié)論,基于二次指數(shù)平滑法優(yōu)化的馬爾科夫預(yù)測模型具有可行性.
馬爾科夫鏈;狀態(tài)轉(zhuǎn)移概率;二次指數(shù)平滑法;銷售預(yù)測
Abstract: Markov has “no aftereffect”, which means that future sales will only be related to the current sales data, not to the past sales figures. In fact, different time points in the past have different degrees of impact on current sales results. The exponential smoothing, which makes up for the shortcomings of the Markov prediction model, suggests that recent past sales data, in some ways, will influence the future. In this paper, the quadratic exponential smoothing coefficient method is used to optimize the Markov prediction model, and is verified with some brand electric car sales. It was found that the absolute error of the optimized prediction model was less than the predicted results of Markov models. Therefore, it is concluded that the Markov prediction model based on the quadratic exponential smoothing method is feasible.
Keywords: Markov Chain; transition probability matrix; secondary exponential smoothing; sales forecast
馬爾科夫鏈,因安德烈·馬爾科夫(A.A.Markov,1856-1922)得名,是指數(shù)學(xué)中具有馬爾科夫性質(zhì)的離散時間隨機過程.該過程中,在給定當(dāng)前知識或信息的情況下,過去(即當(dāng)前以前的歷史狀態(tài))對于預(yù)測將來時無關(guān).因此,馬爾科夫鏈可用來對現(xiàn)實中的許多具有無后效性特點的事物進行預(yù)測.國內(nèi)外眾多學(xué)者應(yīng)用馬爾科夫鏈進行了各種研究和預(yù)測,張浩[1],劉愛紅[2]等人在醫(yī)藥方面應(yīng)用馬爾科夫鏈預(yù)測藥物轉(zhuǎn)運時間及評價藥物經(jīng)濟性;張家善[3]等人應(yīng)用馬爾科夫鏈預(yù)測了港口的吞吐量情況;鐘國敏[4]等人應(yīng)用馬爾科夫鏈分析研究了土地利用的動態(tài)演變情況.隨著馬爾科夫模型的不斷發(fā)展,更多的學(xué)者將其與其他數(shù)學(xué)理論結(jié)合應(yīng)用,使馬爾科夫模型的預(yù)測結(jié)果更加精準(zhǔn).劉春月[5]在預(yù)測物流需求時,用灰色模型對馬爾科夫預(yù)測得到的結(jié)果進一步分析研究,發(fā)現(xiàn)最終的預(yù)測精度比單一的預(yù)測精度有很大的提高;文士發(fā)[6]提出了一種新的計算轉(zhuǎn)移概率的方法來改進馬爾科夫鏈預(yù)測模型,經(jīng)實例驗證表明改進的模型比原模型的預(yù)測精度更高.目前,馬爾科夫模型的發(fā)展雖趨于成熟,但仍存在不足.在預(yù)測過程中,其預(yù)測結(jié)果只與當(dāng)前的數(shù)據(jù)及狀態(tài)轉(zhuǎn)移概率矩陣相關(guān),忽略了歷史數(shù)據(jù)的影響.因此,本文的研究目的是為了能夠得到更好的預(yù)測精度,引入二次指數(shù)平滑法優(yōu)化馬爾科夫鏈的預(yù)測模型,使得歷史數(shù)據(jù)對預(yù)測結(jié)果具有一定的影響.
1.1 馬爾科夫鏈的定義
假設(shè)馬爾科夫過程{Xn,n∈T}的參數(shù)集T是離散的時間集合,即T={0,1,2,…},其相應(yīng)Xn可能取值的全體組成的狀態(tài)空間是離散的狀態(tài)集I={i0,i1i2…}.若隨機過程{Xn,n∈T}對于任意的非負整數(shù)n∈T和任意的i0,i1,i2…in+1∈I,其條件概率滿足:P={Xn+1=in+1|X0=io,X1=i1,…,Xn=in}=
{Xn+1=in+1|Xn=in}.
(1)
則稱{Xn,n∈T}為馬爾科夫鏈,簡稱馬氏鏈.
1.2 狀態(tài)轉(zhuǎn)移概率
條件概率P{Xn+1=j|Xn=i|}的直觀含義為系統(tǒng)在時刻處于狀態(tài)的條件下,在時刻n+1系統(tǒng)處于狀態(tài)的概率.記此條件概率
Pij(n)=P{Xn+1=j|Xn=i}
(2)
為馬爾科夫鏈{Xn,n∈T}在時刻n的一步轉(zhuǎn)移概率,簡稱轉(zhuǎn)移概率,其中i,j∈I.
一般地,計算轉(zhuǎn)移矩陣步驟如下:
(1)對原始數(shù)據(jù)分組,即數(shù)據(jù)離散化.
(2)計算初始概率.假設(shè)時間序列
X={x1,x2,…,xn}.
有n個觀測值,其中Xn未知.被劃分為r個狀態(tài).
E={e1,e2,…,er}.
若有ci數(shù)據(jù)落在ei中(∑ci=n-1),則狀態(tài)發(fā)生的概率為
(3)
(3)計算一步轉(zhuǎn)移概率.落在中的數(shù)據(jù)有ci個,下一時刻轉(zhuǎn)移到ei的數(shù)據(jù)有cij,所以ei一步轉(zhuǎn)移到ej的轉(zhuǎn)移概率為
(4)
1.3 馬爾科夫預(yù)測模型
已知初始狀態(tài)概率S(t)以及一步轉(zhuǎn)移狀態(tài)概率p,則下一狀態(tài)的馬爾科夫預(yù)測值為
S(t+1)=S(t)·P.
(5)
同理,后期的預(yù)測值為:
S(t+2)=S(t)·P2,
S(t+n)=S(t)·pn.
(6)
指數(shù)平滑法(exponential smoothing,ES)是布朗(Robert G.Brown)提出.布朗認為時間序列的態(tài)勢具有穩(wěn)定性或規(guī)則性,所以時間序列可被合理地順勢推延;他認為最近的過去態(tài)勢,在某種程度上會持續(xù)到未來,所以將較大的權(quán)數(shù)放在最近的資料.
根據(jù)平滑次數(shù)的不同,指數(shù)平滑法分為:一次指數(shù)平滑法、二次指數(shù)平滑法及三次指數(shù)平滑法,他們的區(qū)別如表1.
表1三種指數(shù)平滑法的區(qū)別
Table 1 Difference between three exponential smoothing methods
區(qū)別一次指數(shù)平滑法二次指數(shù)平滑法三次指數(shù)平滑法發(fā)展趨勢無明顯的趨勢變化具有線性趨勢變化二次曲線趨勢變化
本文主要針對的是對制造業(yè)產(chǎn)品進行預(yù)測,所以產(chǎn)品的發(fā)展趨勢是根據(jù)現(xiàn)有的科技手段呈線性趨勢在逐漸提高的,因此選擇二次指數(shù)平滑法進行后期的計算.
2.1 二次指數(shù)平滑法
當(dāng)數(shù)據(jù)從某時期開始具有直線趨勢,且認為未來時期會按此直線趨勢變化的時候,用一次指數(shù)平滑法就不能得到較好的預(yù)測結(jié)果,會有滯后偏差.這時對依次平滑進行修正,即再做一次指數(shù)平滑,稱之為二次指數(shù)平滑.計算公式如下:
(7)
2.2 指數(shù)平滑系數(shù)α的確定
在指數(shù)平滑法預(yù)測中,α即指數(shù)平滑系數(shù)的確定對整個精度有著非常重要的影響.α越大,距離預(yù)測狀態(tài)越近的數(shù)據(jù)占有的成分越大.從理論角度看,α的取值范圍在0~1之間,選取原則是預(yù)測誤差越小,精度越高.
本文擬借助excel求解α(0<α<1)的值.在excel中有數(shù)據(jù)分析工具——指數(shù)平滑法確定這一選項,首先隨機選取不同的α值,并計算各值對應(yīng)的絕對誤差,根據(jù)誤差越小α值越優(yōu)為原則縮小α值的選取范圍;隨后對在范圍內(nèi)隨機選取α值,再比較絕對誤差,以此類推(一般α值精確到百分位或十分位即可);最后絕對誤差值最小者即為最優(yōu)α值.
3.1 模型概述
在運用歷史數(shù)據(jù)預(yù)測下一狀態(tài)發(fā)展趨勢時,不考慮各時間段對預(yù)測結(jié)果的權(quán)重問題,可能會導(dǎo)致預(yù)測結(jié)果誤差偏大的現(xiàn)象.而二次指數(shù)平滑法,可以根據(jù)與當(dāng)前時間的遠近進行加權(quán)運算,使得距離當(dāng)前越近的數(shù)據(jù),對預(yù)測值的影響愈大;反之,距離當(dāng)前時間越遠的數(shù)據(jù),對預(yù)測結(jié)果影響越小.所以,本文將二次指數(shù)平滑法與馬爾科夫鏈這兩種預(yù)測方法相結(jié)合,提出一種改進的馬爾科夫鏈模型.
在改進的馬爾科夫鏈模型中,使用當(dāng)前狀態(tài)以及與當(dāng)前狀態(tài)緊鄰的兩個歷史狀態(tài)的加權(quán)和來預(yù)測下一個狀態(tài).權(quán)重的分配采用二次指數(shù)平滑法,按其原則依時間從近到遠,權(quán)值呈指數(shù)遞減.具體公式如下:
α(1-α)2St-2P3.
(8)
對公式(8)進一步變換,可得
(9)
3.2 模型算法描述
綜上所述,采用改進后的馬爾科夫模型預(yù)測下一狀態(tài)的計算流程如圖1.
圖1 改進的馬爾科夫模型預(yù)測下一狀態(tài)的流程圖Figure 1 Improved Markov model predicts the flow chart of the next state
其中,數(shù)據(jù)離散化實際上就是根據(jù)某種相似性或者相異性對數(shù)據(jù)進行分類.
基于以上對模型的描述,本文將借助excel和matlab工具分別來確定α值以及求解最終的預(yù)測值.下面以預(yù)測某新藝電動車零售店的銷售情況為例,來驗證本文提出模型的有效性.
每個品牌的電動車通常會根據(jù)其性能或外觀等不同,生產(chǎn)不同系列的子產(chǎn)品以應(yīng)對市場的不同的需求.例如華為手機,其旗下?lián)碛袠s耀系列、mate系列及P系列等不同的子產(chǎn)品,為應(yīng)對不同的消費群體、不同的用戶需求.新藝電瓶車根據(jù)不同的用戶需求,生產(chǎn)不同的車型來供不同人群使用,主要有電動摩托車和電動三輪車,而電動摩托車又分為豪華款、簡約款、一度寬頻等系列,每個系列又會根據(jù)配置的不同進行細分.本文主要以新藝電動車旗下的豪華款系列中的戰(zhàn)威、戰(zhàn)影、戰(zhàn)迪、戰(zhàn)神等12種款式為依據(jù),在已知某零售店2016年1-11月份的實際銷售情況,來預(yù)測12月份該12種款式銷售的概率情況.
已知2016年1-11月份該零售店銷售12種電動摩托車共115輛,統(tǒng)計各月份的各狀態(tài)數(shù),建立狀態(tài)空間,如表2.
表2 2016年1-11月份的各狀態(tài)數(shù)統(tǒng)計
其次根據(jù)已有的狀態(tài)空間及式(3)可以計算各個狀態(tài)的初始概率S0:
然后,根據(jù)式(4)計算出各狀態(tài)一步轉(zhuǎn)移概率:
同時,在excel中運用指數(shù)平滑數(shù)據(jù)分析,通過選取不同的α值,來比較預(yù)測值與真值間的絕對誤差大小,誤差越小者,則其對應(yīng)的α值為最優(yōu).通過最終結(jié)果比較,可以得到,當(dāng)α=0.99時,絕對誤差最小,因此,選取此α值作為最終指數(shù)平滑系數(shù).
最后,根據(jù)公式(5)和(8)分別求解2016年9至11月份馬爾科夫模型預(yù)測值及基于二次指數(shù)平滑法優(yōu)化的馬爾科夫模型預(yù)測值(如表3、表4),并與真值作比較(表格中的誤差為絕對誤差),分析優(yōu)化后的模型精度是否更好.
表3 2016年9-11月份馬爾科夫模型預(yù)測值
由表3可求得9月、10月及11月的平均絕對誤差,分別為5.28%、5.60%、5.76%.
表42016年9~11月份基于二次指數(shù)平滑法的馬爾科夫預(yù)測值
Table 4 Markov forecast based on the second exponential smoothing method in September and November 2016
E1E2E3E4E5E6E7E8E9E10E11E12Y(9)0.106000.106000.10600.1590000.159000.31800.0530S(9)0.032700.11180.04910.06370.07340.04740.00100.10430.06690.12880.0351誤差0.073300.00580.04910.04230.08560.04740.00100.05470.06690.18920.0179Y(10)000.33600.05600.11200.1680000.168000.05600.1120S(10)0.043200.18060.08800.12690.10820.06130.02110.12710.07430.12620.0495誤差0.043200.15540.03200.01490.05980.06130.02110.04090.07430.07020.0625Y(11)0.09100000.18200.09100.091000.09100.18200.18200.0910S(11)0.049200.19700.05110.12090.11240.08710.00020.13820.00980.19450.0481誤差0.041800.19700.05110.06110.02140.00390.00020.04720.17220.01250.0429
由4可求得9月、10月及11月的平均絕對誤差,分別為5.27%、5.29%、5.43%.
綜上所述可以發(fā)現(xiàn),基于二次指數(shù)平滑法優(yōu)化的馬爾科夫預(yù)測模型的預(yù)測結(jié)果精度更高.因此,采用新模型預(yù)測新藝電動車旗下品牌各狀態(tài)12月份的分布情況,如表5.
表5 2016年12月份基于二次指數(shù)平滑法的馬爾科夫預(yù)測值
預(yù)測結(jié)果表明,12月份最暢銷的三款分別為E3、E6、E11,即戰(zhàn)迪、戰(zhàn)將和勁跑,所占比重分別為13.74%、10.65%及11.61%.因新模型的有效性,所以預(yù)測結(jié)果能夠為零售店提供一定的銷售依據(jù),使零售商提前應(yīng)對市場,做好準(zhǔn)備.
本研究將二次指數(shù)平滑法引入到馬爾科夫預(yù)測模型中,二次指數(shù)平滑法的核心理論是最近的過去態(tài)勢,在某種程度上會持續(xù)到未來,所以將較大的權(quán)數(shù)放在最近的資料;而馬爾科夫鏈最重要的性質(zhì)是在給定當(dāng)前知識或信息的情況下,過去(即當(dāng)前以前的歷史狀態(tài))對于預(yù)測將來時是無關(guān)的.因此,結(jié)合二者的優(yōu)點,使兩種方法在預(yù)測功能上得到互補,從而提高了預(yù)測的精度.本文提出的模型主要應(yīng)用于制造業(yè)領(lǐng)域,不僅可預(yù)測其最終產(chǎn)品的銷售情況還可以預(yù)測在制造過程中零部件的使用情況.但不論是馬爾科夫預(yù)測模型還是二次指數(shù)平滑系數(shù)法,二者均適用于短期預(yù)測,因此該模型也主要適用于短期預(yù)測.文中最后以電動車為例的驗證結(jié)果表明,基于二次指數(shù)平滑法優(yōu)化馬爾科夫預(yù)測模型達到了預(yù)期結(jié)果,起到了優(yōu)化的作用,同時驗證了新預(yù)測模型的可行性,今后還可將其應(yīng)用于其他領(lǐng)域預(yù)測,以更好地滿足用戶需求.
[1] 張浩,黃泰康.藥物經(jīng)濟學(xué)評價中馬爾可夫模型的優(yōu)化——馬爾可夫決策模型[J].藥物經(jīng)濟學(xué),2008,19(17): 1284-1286.ZHANG H,HUANG T K.An optimization of Markov model in the evaluation of drug economics:Markov decision model [J].PharmaceuticalEconomics,2008,19(17) :1284-1286.
[2] 劉愛紅,楊光.應(yīng)用馬爾科夫鏈計算藥物運轉(zhuǎn)時間和穩(wěn)態(tài)藥量[J].沈陽師范大學(xué)學(xué)報,2016,34(1):57-61. LIU A H,YANG G.Use Markov chain to calculate the operation time and steady state medicine [J].JournalofShenyangUniversity,2016,34(1):57-61.
[3] 張家善,林曉群.基于馬爾科夫鏈的港口吞吐量區(qū)間預(yù)測模型研究[J].?dāng)?shù)學(xué)的實踐與認識,2016,46(15):159-164. ZHANG J S,LIN X Q.Based on Markov chain's port throughput interval prediction model research [J].JournalofMathematicsinPracticeandTheory,2016,46(15):159-164.
[4] 鐘國敏,張學(xué)雷,段金龍.利用馬爾科夫過程預(yù)測鄭州市土地利用的動態(tài)演變[J].河南農(nóng)業(yè)大學(xué)學(xué)報,2011,45(6):696-701. ZHONG G M,ZHANG X L,DUAN J L.The use of Markov process to predict the dynamic evolution of land use in Zhengzhou [J].JournalofHenanAgriculturalUniversity,2011,45(6):696-701.
[5] 劉春月.物流需求量灰色——馬爾科夫鏈預(yù)測模型分析研究[J].物流科技,2016(10) :11-14. LIU C Y.Logistics demand gray : Markov chain prediction model analysis and research [J].LogisticsSCI-Tech,2016(10) :11-14.
[6] 文士發(fā),徐梅,王福林.一種估算馬爾科夫狀態(tài)轉(zhuǎn)移概率矩陣的新方法[J].?dāng)?shù)學(xué)的實踐與認識,2014,44(8):164-168. WEN S F,XU M,WANG F L.A new method of estimating Markov state transition probability matrix [J].JournalofMathematicsinPracticeandTheory,2014,44(8):164-168.
OptimizationonMarkovpredictionmodelswiththesecondexponentialsmoothingmethod
LYU Dandan, GU Qiaoxiang, XING Chao
(College of Quality and Safety Engineering, China Jiliang University, Hangzhou 310018, China)
2096-2835(2017)03-0334-06
10.3969/j.issn.2096-2835.2017.03.011
2017-06-29 《中國計量大學(xué)學(xué)報》網(wǎng)址zgjl.cbpt.cnki.net
浙江省自然科學(xué)基金資助項目(No.LY14E050024).
TP39
A