潘焜 王鐵錚 張璇 李酈原
[摘 要]“煤改電”電力物資采購數(shù)量在倉儲過程中是一個重要問題。存儲定額數(shù)量可以轉(zhuǎn)化為消耗數(shù)量的預(yù)測問題。對“煤改電”電力物資數(shù)量的較為準(zhǔn)確的預(yù)測可以有效地增加倉儲規(guī)劃的效率。而“煤改電”電力物資數(shù)量具有較大的不確定性,隨著項(xiàng)目的推進(jìn),子項(xiàng)目的數(shù)量減少,總的電力物資所需的數(shù)量也會相應(yīng)減少。因此,本文將影響電力物資采購數(shù)量因素分為兩部分,一是項(xiàng)目數(shù)量,二是每個子項(xiàng)目中的物資采購的數(shù)量,對于項(xiàng)目數(shù)量采用基于指數(shù)加權(quán)平均移動的預(yù)測方法,對于采購數(shù)量采用高斯概率模型進(jìn)行預(yù)測。
[關(guān)鍵詞]概率模型;“煤改電”;電力物資
[中圖分類號]R311 [文獻(xiàn)標(biāo)識碼]A
“煤改電”電力物資采購與電力公司中的應(yīng)急物資采購不同,“煤改電”工程中所使用的電力物資的規(guī)律性比較復(fù)雜。一般而言,一個“煤改電”工程會根據(jù)區(qū)域、時間、工程階段等因素被分解成多個子項(xiàng)目。隨著工程進(jìn)度的不斷推進(jìn),有待完成的子項(xiàng)目數(shù)量會逐漸減少。因此,子項(xiàng)目的數(shù)量是“煤改電”電力物資采購數(shù)量的主要因素之一。為了能夠較為準(zhǔn)確地預(yù)測子項(xiàng)目的數(shù)量,本文采用了指數(shù)加權(quán)平均移動的方式進(jìn)行預(yù)測。對于每一個子項(xiàng)目需要使用的電力物資的數(shù)量,本文采用了高斯概率模型進(jìn)行預(yù)測。預(yù)測“煤改電”電力物資的數(shù)量的意義在于能夠制訂更加可靠的采購計(jì)劃,從而減少倉儲成本和采購成本。
1 高斯概率模型
高斯概率模型是基于高斯分布的預(yù)測模型,高斯分布又稱正態(tài)分布。正態(tài)分布是一種常見而普遍的分布,由于中心極限定理的存在,當(dāng)相關(guān)的影響因素很多的時候,所有影響因素的和近似符合正態(tài)分布,并且無論因素的本身的分布。
假設(shè)隨機(jī)變量X1,X2…Xn獨(dú)立同分布,均值E(Xi)=μ,方差D(Xi)=σ2,那么所有的隨機(jī)變量和滿足公式(1)
那么Yn近似符合標(biāo)準(zhǔn)正態(tài)分布。
由于真實(shí)情況下,n無法趨于正無窮,因此數(shù)據(jù)分布可能并不符合正態(tài)分布,所以在預(yù)測數(shù)據(jù)之前,需要對數(shù)據(jù)分布進(jìn)行檢驗(yàn)。偏度-峰度檢驗(yàn)是概率論中用來檢測分布是否是正態(tài)分布的常用方法。其根據(jù)樣本數(shù)據(jù)的矩來分析數(shù)據(jù)的分布和正態(tài)分布的相似程度。
假設(shè)用X表示隨機(jī)變量,樣本的來源為獨(dú)立同分布,v1和v2分別為的3階矩和4階矩的估計(jì)量,G1和G2分別為樣本的偏度和峰度分布。若樣本服從正態(tài)分布,則v1服從G1,v2服從G2。
公式(3)和公式(4)表示了G1和G2所服從的分布情況,其中n為數(shù)據(jù)的樣本數(shù)量。
當(dāng)樣本服從正態(tài)分布時,|u1|和|u2|都應(yīng)該小于zα/4,其中α為顯著程度,一般取5%,對應(yīng)的值z1-α/4=2.2414。α顯著程度的意思是,假設(shè)成立時,最多α的概率認(rèn)為它是假的,即事實(shí)為真時被誤認(rèn)為假的概率為α。當(dāng)α為0.05的時候,意味著結(jié)論有0.95的可信度,z1-α/4為1-α/4對應(yīng)的分位點(diǎn),當(dāng)結(jié)果大于z1-α/4意味著很可能出現(xiàn)了小概率事件。
當(dāng)認(rèn)為樣本是符合高斯分布時,就可以使用高斯模型進(jìn)行分析。高斯模型一般指混合高斯模型,有多個輸入的隨機(jī)變量。
公式(5)是混合高斯模型的分布形式,其中k表示混合高斯模型中包含的正態(tài)分布的數(shù)量;wi表示第i個分布對于總分布的貢獻(xiàn)的權(quán)重,所有w的總和為1.0;N表示正態(tài)分布;μk表示每一個被包含的正態(tài)分布的均值;Σk表示協(xié)方差矩陣。
結(jié)合實(shí)際情況,在電力物資預(yù)測中,只有一個參數(shù),即月份,因此混合高斯模型退化成了單變量的高斯模型。
2 指數(shù)加權(quán)平均移動預(yù)測模型
由于電力物資采購的數(shù)量會隨著時間的推移而不斷變化。一般而言,隨著時間的推進(jìn),工程中子項(xiàng)目的數(shù)量變少,這種情況導(dǎo)致了電力物資采購的總的數(shù)量會不斷變少,但其實(shí)每次采購的數(shù)量變化不大。因此若要預(yù)測電力物資采購的總數(shù)量,除了通過高斯模型預(yù)測每次采購的數(shù)量外,還需要預(yù)測子項(xiàng)目的數(shù)量。
考慮到實(shí)際應(yīng)用中,以月為單位時,能夠較好地保留采購次數(shù)的季節(jié)和節(jié)假日等特征,因此本文采用了以月為劃分的方式,即選取約為30天的時間間隔作為分析子項(xiàng)目的時間區(qū)間,一年一共分為12個區(qū)間。由于子項(xiàng)目的數(shù)量除了隨機(jī)性的波動外,還有時間上遞減的趨勢性的變化,無法通過高斯模型來預(yù)測子項(xiàng)目的數(shù)量。
指數(shù)加權(quán)平均移動,又稱指數(shù)平均移動(EMA),是平滑有著趨勢性的不斷波動的數(shù)據(jù)的一種方式。
公式(6)所描述的為指數(shù)加權(quán)平均移動的一種定義(也有將ema初始值定義為0的情況),其中,xi為標(biāo)量輸入,下標(biāo)i表示第i個輸入;emai為輸出值,下標(biāo)i表示第i個輸出;decay表示移動的幅度,在0與1之間,decay的值越大,對于過去數(shù)據(jù)的權(quán)重也就越大。
由于EMA只能做平滑,而EMA本身難以直接應(yīng)用到預(yù)測,因此需要對其進(jìn)行改進(jìn)。本文采用了線性模型對子項(xiàng)目數(shù)量進(jìn)行預(yù)測,并且通過EMA對線性系數(shù)進(jìn)行平滑。
具體而言,假設(shè)輸入的樣本數(shù)量為m,且m大于2,那么按照以下算法進(jìn)行預(yù)測:
(1)令計(jì)數(shù)變量i=2;
(2)根據(jù)第一和第二個樣本,與y=kx+b直線公式,求得斜率為k0,并將ema0=k0。
(3)求得第i個樣本和第i+1個樣本之間的直線方程,然后將斜率ki-1當(dāng)作EMA算法的輸入,求得emai-1,緩存截距bi-1。
(4)令i=i+1,若i等于m,則退出算法,輸出最后的ema結(jié)果和緩存的截距;否則回到步驟3。
上述算法平滑了直線的斜率k,使得對于后續(xù)子項(xiàng)目數(shù)量的預(yù)測更加平穩(wěn),減少受波動的影響。
3 實(shí)驗(yàn)結(jié)果
本文使用的數(shù)據(jù)為近三年(2015-2018),某省電力公司在“煤改電”項(xiàng)目中,電力物資采購的數(shù)據(jù),數(shù)據(jù)格式見表 1。
其中,由于保密的原因,已經(jīng)對敏感數(shù)據(jù)做了處理。假設(shè)一共有相同物料k類,每類含有的數(shù)據(jù)nk條,對應(yīng)的數(shù)量為pi,下標(biāo)i為在1和nk之間的索引,則:
公式(7)中Ek為每類中的數(shù)量均值,Dk為每類中數(shù)量的方差,zp為歸一化后的新數(shù)量。
隨機(jī)選取其中的部分?jǐn)?shù)據(jù)進(jìn)行可視化。
其中,橫坐標(biāo)是月份,縱坐標(biāo)是歸一化后的數(shù)量??梢钥闯?,每月的數(shù)量分布有著明顯的不同。
經(jīng)過偏度-峰度測試,在顯著程度為0.0762的情況下,符合正態(tài)分布。通過將前2年的數(shù)據(jù)作為訓(xùn)練集,使用高斯模型,對第3年的數(shù)據(jù)進(jìn)行預(yù)測,并對實(shí)際的值進(jìn)行比較。
表 2中,均值等于預(yù)測均值乘以預(yù)測子項(xiàng)目數(shù)量,標(biāo)準(zhǔn)差等于預(yù)測標(biāo)準(zhǔn)差,可以看出,根據(jù)3-sigma準(zhǔn)則,所有的實(shí)際值都包括在了2-sigma區(qū)間內(nèi),除了2月、11月和12月外,其他所有的月份都被包括在了1-sigma區(qū)間內(nèi)。而這3個月份的均值都較小。因此,在實(shí)際進(jìn)行預(yù)測時,對于均值較小的月份,可以選擇2-sigma區(qū)間,對于均值較大的月份,可以選擇1-sigma區(qū)間。
4 總結(jié)
本文針對“煤改電”電力物資采購數(shù)量進(jìn)行研究,將影響采購數(shù)量的因素分為某月份中可能的子項(xiàng)目的數(shù)量和每個子項(xiàng)目中采購物資數(shù)量。對于子項(xiàng)目的數(shù)量,本文采用了EMA平滑斜率的方式進(jìn)行預(yù)測,減少了波動對預(yù)測造成的影響。對于子項(xiàng)目中的采購數(shù)量,本文使用了高斯概率模型進(jìn)行預(yù)測。因此,每個月份的總的預(yù)測結(jié)果等于每月預(yù)測均值乘以每月預(yù)測的子項(xiàng)目數(shù)量,每月預(yù)測的標(biāo)準(zhǔn)差表示預(yù)測的數(shù)量波動的大小。最后,通過實(shí)際的數(shù)據(jù),給出了實(shí)驗(yàn)的結(jié)果。
[參考文獻(xiàn)]
[1] 盛驟,謝式千,潘承毅著.概率論與數(shù)理統(tǒng)計(jì)第4版[M].高等教育出版社,2010.
[2] 劉杰,肖紅,王波,等.基于逆高斯幾率模型的心率預(yù)測算法[J].電子學(xué)報,2008(01).