陳銀光, 于守健
(東華大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院, 上海 201620)
預(yù)測(cè)是對(duì)未來(lái)將要發(fā)生的事情做出的推測(cè)。隨著數(shù)據(jù)預(yù)測(cè)技術(shù)的發(fā)展,數(shù)據(jù)預(yù)測(cè)技術(shù)的應(yīng)用范圍日趨廣泛,已拓展普及至經(jīng)濟(jì)、環(huán)境、教育、交通、醫(yī)療等重要領(lǐng)域。本文主要研究服裝銷(xiāo)售相關(guān)的預(yù)測(cè)。時(shí)下的服裝業(yè)正銳意前行,競(jìng)爭(zhēng)相對(duì)也在加劇,因而需要在學(xué)習(xí)中探索利用科學(xué)的方法解決服裝銷(xiāo)售中的問(wèn)題,從而增強(qiáng)自身的競(jìng)爭(zhēng)實(shí)力。在服裝銷(xiāo)售中如果能夠預(yù)測(cè)服裝的銷(xiāo)售量,不僅有利于合理制定銷(xiāo)售計(jì)劃、最佳優(yōu)化商品分配、科學(xué)控制商品生產(chǎn)、有效避免商品積壓,而且可以大幅減少人力物力,由此提高商品銷(xiāo)售利潤(rùn)。所以服裝銷(xiāo)售行業(yè)亟需一個(gè)快速優(yōu)質(zhì)的方法用于服裝銷(xiāo)售的評(píng)估預(yù)測(cè),通過(guò)選擇合適的數(shù)據(jù)預(yù)測(cè)模型,結(jié)合歷史銷(xiāo)售數(shù)據(jù)來(lái)預(yù)測(cè)未來(lái)一段時(shí)間的銷(xiāo)售狀況,預(yù)測(cè)的結(jié)果可以輔助企業(yè)匯總籌劃日常決策,從而發(fā)揮一定的參考借鑒作用。
銷(xiāo)售數(shù)據(jù)是典型的時(shí)間序列。在基于時(shí)間序列的預(yù)測(cè)分析方法中,移動(dòng)平均法業(yè)已躋身學(xué)界流行行列,但也存在一些不足。簡(jiǎn)單的移動(dòng)平均法并未考慮周期內(nèi)數(shù)據(jù)的權(quán)重,加權(quán)移動(dòng)平均法彌補(bǔ)了這一缺陷,但李云剛經(jīng)過(guò)對(duì)比證明卻發(fā)現(xiàn)加權(quán)移動(dòng)平均法也表現(xiàn)出一定劣勢(shì)[1]?;诖?,本文探討了移動(dòng)平均法和加權(quán)移動(dòng)平均法存在的問(wèn)題,通過(guò)計(jì)算相鄰數(shù)據(jù)的增減情況,引入了趨勢(shì)的概念,并且利用對(duì)整體預(yù)測(cè)結(jié)果的平移處理,解決了預(yù)測(cè)延遲的問(wèn)題。而且通過(guò)計(jì)算誤差對(duì)比實(shí)驗(yàn)可以看出改進(jìn)后的方法大大提高了預(yù)測(cè)的精度。
移動(dòng)平均法是時(shí)間序列模型中比較常見(jiàn)的方法,是一種簡(jiǎn)單平滑預(yù)測(cè)技術(shù)。該技術(shù)的基本原理是根據(jù)已知一段時(shí)間的數(shù)據(jù),從開(kāi)始位置逐步向后移動(dòng)指定期數(shù),再求取其平均值作為下一個(gè)期數(shù)要預(yù)測(cè)的值。時(shí)間序列的數(shù)據(jù)一般會(huì)受周期變動(dòng)和隨機(jī)波動(dòng)的影響,有較大的起伏,不易探尋出時(shí)間的發(fā)展趨勢(shì),使用移動(dòng)平均法可以消除這些因素的影響,研究求出時(shí)間的發(fā)展方向與趨勢(shì),并據(jù)此分析預(yù)測(cè)未來(lái)的發(fā)展趨勢(shì)。
移動(dòng)平均法可以分為:簡(jiǎn)單移動(dòng)平均法和加權(quán)移動(dòng)平均法,本文將對(duì)其展開(kāi)解析分述如下[2]。
設(shè)有一段時(shí)間序列x1,x2,x3,…,xm,可以參照各數(shù)據(jù)點(diǎn)的順序逐點(diǎn)推移求出n個(gè)數(shù)的平均數(shù),即可得到一次移動(dòng)平均數(shù),計(jì)算公式如下:
(1)
其中,k>n;n為數(shù)據(jù)移動(dòng)的周期數(shù),n的值可以結(jié)合實(shí)際情況設(shè)置;xk表示周期內(nèi)的一次移動(dòng)平均數(shù),可以依次求出其它的預(yù)測(cè)值;xk-1,xk-2,…,xk-n為居于xk之前的一個(gè)周期的數(shù)據(jù)。
當(dāng)k值不斷向后推移,移動(dòng)一次就可以求出一個(gè)平均值,這個(gè)方法可以依次求出后面一段時(shí)間的值??紤]到該方法的設(shè)計(jì)原理是不斷地逐期向后移動(dòng),因此將其稱(chēng)為移動(dòng)平均法。
與移動(dòng)平均法不同,加權(quán)移動(dòng)平均法就是每一項(xiàng)中均增加了一個(gè)權(quán)值,具體就是給一定周期的變量值增加不同的權(quán)值。其設(shè)計(jì)原理是基于在一個(gè)時(shí)間序列中每一個(gè)時(shí)期的數(shù)據(jù)對(duì)未來(lái)預(yù)測(cè)的作用大小各有不同,因此可為其增加一個(gè)權(quán)值來(lái)衡定其作用大小。分析可知,在一個(gè)周期中距離預(yù)測(cè)時(shí)間越遠(yuǎn),其影響力就相對(duì)較小,而距離越近影響力可能就越大。研究中設(shè)置的權(quán)重可依從時(shí)間的順序逐漸變大。當(dāng)周期為n時(shí),加權(quán)移動(dòng)平均法的公式可以表示如下:
(2)
進(jìn)一步地,式(2)可以簡(jiǎn)化為:
(3)
其中,w1+w2+…+wn=1;x′k表示預(yù)測(cè)值;wi表示xk-i的權(quán)重,i=1,2,3…,n。
從以上的加權(quán)移動(dòng)平均法公式可以看出,權(quán)重的選擇是一個(gè)關(guān)鍵問(wèn)題。常規(guī)方法是根據(jù)經(jīng)驗(yàn)進(jìn)行選擇。一般情況下,研究中是將距離預(yù)測(cè)時(shí)間近的值賦予大的權(quán)重,距離遠(yuǎn)的將賦予較小權(quán)重值。
在時(shí)間序列數(shù)據(jù)中會(huì)存在數(shù)值的增加或者減少,移動(dòng)平均法及加權(quán)移動(dòng)平均法中均未對(duì)此予以特別關(guān)注,為此研究中將引入趨勢(shì)的概念[3-5]。在移動(dòng)平均法中還存在預(yù)測(cè)結(jié)果時(shí)間推移的現(xiàn)象,這里通過(guò)把預(yù)測(cè)的結(jié)果整體前移一個(gè)時(shí)間單位用于應(yīng)對(duì)這一問(wèn)題狀況。為此,研究推得改進(jìn)后的公式可表述如下:
(4)
其中,pk表示預(yù)測(cè)值;xk+1表示時(shí)間序列數(shù)據(jù)的移動(dòng)平均值,其求解過(guò)程如式(1)所示;x′k+1表示時(shí)間序列數(shù)據(jù)的加權(quán)移動(dòng)平均值,其求解過(guò)程如式(2)所示;y表示在n周期內(nèi)曲線的整體趨勢(shì),當(dāng)y>0,說(shuō)明曲線整體為上升的趨勢(shì)。如果y<0,則表示曲線整體呈下降的趨勢(shì)。y的表達(dá)式可以用以下方法進(jìn)行表示:
(5)
其中,vi表示相鄰2個(gè)數(shù)差的權(quán)值。
在前文研究論述基礎(chǔ)上,分析歸納后得出改進(jìn)的加權(quán)移動(dòng)平均法的設(shè)計(jì)步驟可闡釋解析如下。
Step1根據(jù)時(shí)間序列數(shù)據(jù)求出周期為n的數(shù)據(jù)移動(dòng)平均值,數(shù)學(xué)運(yùn)算如式(1)所示。
Step2求取周期為n的時(shí)間序列數(shù)據(jù)的加權(quán)移動(dòng)平均值,數(shù)學(xué)運(yùn)算如式(2)所示。
Step3根據(jù)式(5)可求得取周期為n的時(shí)間序列的趨勢(shì)平均值。
Step4綜合前述3步得到的各方法結(jié)果進(jìn)行合并計(jì)算,其數(shù)學(xué)運(yùn)算形式即如式(4)所示。
實(shí)驗(yàn)數(shù)據(jù)選取了某一服裝銷(xiāo)售商2013年12月至2018年5月的銷(xiāo)售額,通過(guò)使用移動(dòng)平均法(公式(1))、加權(quán)移動(dòng)平均法(公式(2))以及改進(jìn)的加權(quán)移動(dòng)平均法(公式(4))進(jìn)行預(yù)測(cè),而這里的預(yù)測(cè)設(shè)計(jì)則將以折線圖的形式繪制出預(yù)測(cè)數(shù)據(jù)與原始數(shù)據(jù),從而得到更加直觀的誤差對(duì)比結(jié)果。為此,研究中專(zhuān)門(mén)選用了平均絕對(duì)誤差(MAE)和均方根誤差(RMSE)用于誤差值計(jì)算[6]。文中,將對(duì)這2個(gè)誤差計(jì)算方法做出研究簡(jiǎn)述如下。
(1)平均絕對(duì)誤差(Mean Absolute Deviation,MAE)。MAE是絕對(duì)誤差的平均值,能夠更好地反映預(yù)測(cè)值誤差的實(shí)際情況。計(jì)算公式如下:
(6)
(2)均方根誤差(root-mean-square error,RMSE),也稱(chēng)為標(biāo)準(zhǔn)誤差。是觀測(cè)值與真值偏差的平方與周期次數(shù)比值的平方根。RMSE可用于衡量預(yù)測(cè)值與實(shí)際值的偏差。計(jì)算公式如下:
(7)
本次實(shí)驗(yàn)數(shù)據(jù)中,將移動(dòng)周期選為3個(gè)月,研究擬預(yù)測(cè)2018年6~8月的銷(xiāo)售額。首先使用移動(dòng)平均法(公式(1))與加權(quán)移動(dòng)平均法(公式(2))進(jìn)行服裝銷(xiāo)售額預(yù)測(cè),預(yù)測(cè)的結(jié)果與原始數(shù)據(jù)的對(duì)比折線圖,則如圖1所示。由圖1可以發(fā)現(xiàn),傳統(tǒng)的移動(dòng)平均法和加權(quán)移動(dòng)平均法的預(yù)測(cè)值與實(shí)際值之間誤差較大。
圖1 移動(dòng)平均法和加權(quán)移動(dòng)平均法預(yù)測(cè)值對(duì)比
其次,通過(guò)改進(jìn)加權(quán)移動(dòng)平均法(公式(4))對(duì)原始數(shù)據(jù)進(jìn)行預(yù)測(cè)求得的結(jié)果與原始數(shù)據(jù)對(duì)比繪制的折線圖,如圖2所示。其中,服裝銷(xiāo)售數(shù)據(jù)移動(dòng)的周期仍然為3個(gè)月,預(yù)測(cè)2018年6~8月的銷(xiāo)售額。通過(guò)折線圖可以看出,改進(jìn)后的預(yù)測(cè)方法與實(shí)際數(shù)據(jù)的誤差呈明顯減少態(tài)勢(shì),分析得知改進(jìn)的加權(quán)移動(dòng)平均法對(duì)服裝銷(xiāo)售額的預(yù)測(cè)獲得了更好的改良性能。
為了更清晰地對(duì)比這3種方法的運(yùn)行結(jié)果,使用平均絕對(duì)誤差(公式(6))和均方根誤差(公式(7))計(jì)算各類(lèi)方法誤差,運(yùn)算結(jié)果可見(jiàn)表1。通過(guò)數(shù)值對(duì)比可以看到,改進(jìn)后的方法誤差降低了很多,由此即可推得:改進(jìn)后的加權(quán)移動(dòng)平均法對(duì)服裝銷(xiāo)售額的預(yù)測(cè)精度有了可觀的改善。
根據(jù)服裝銷(xiāo)售商的歷史銷(xiāo)售記錄,分別使用這3種方法預(yù)測(cè)了2018年6~8月的銷(xiāo)售額,預(yù)測(cè)結(jié)果可詳見(jiàn)表2。研究至此可知,通過(guò)前文的仿真實(shí)驗(yàn)證明改進(jìn)的加權(quán)移動(dòng)平均法在數(shù)據(jù)預(yù)測(cè)精度上已有可觀改善,因此2018年6月、7月、8月的預(yù)測(cè)值將可分別選擇為:39.83萬(wàn)元、38.97萬(wàn)元、39.07萬(wàn)元。
表1 3種預(yù)測(cè)方法的誤差對(duì)比
表23種方法分別預(yù)測(cè)6~8月的銷(xiāo)售額
Tab. 2 Three methods predict sales from June to August 萬(wàn)元
圖2 改進(jìn)加權(quán)移動(dòng)平均法預(yù)測(cè)值
本文在移動(dòng)平均法和加權(quán)移動(dòng)平均法的基礎(chǔ)上,增加了趨勢(shì)和解決預(yù)測(cè)推移的方法,構(gòu)造了一種改進(jìn)的加權(quán)移動(dòng)平均方法,通過(guò)平均絕對(duì)誤差和均方根誤差進(jìn)行誤差分析,經(jīng)過(guò)仿真可以確知:這種改進(jìn)的加權(quán)移動(dòng)平均法比原有的移動(dòng)平均預(yù)測(cè)方法已取得了長(zhǎng)足進(jìn)步。利用這種方法對(duì)某服裝銷(xiāo)售商的未來(lái)銷(xiāo)售額進(jìn)行預(yù)測(cè),目前雖然仍還存在一些誤差,但相對(duì)于傳統(tǒng)預(yù)測(cè)方法已有較大的優(yōu)化與改進(jìn)。