梁達強
摘 要:針對進口木漿銷售的復雜非線性.本文以K公司6年以來在內地銷售木漿的數據和中國海關的統(tǒng)計數據。選出對銷售量影響最大的8個因素,建立GRNN網絡模型對木漿銷售量進行預測。在訓練樣本有限的情況下將原始數據分組進行交叉驗證,選取最優(yōu)網絡結構和光滑因子。利用GRNN網絡的優(yōu)勢預測2015年下半年各個區(qū)域的銷售量,并與實際的銷售量進行比較,發(fā)現(xiàn)平均誤差百分比不大。只有個別點出現(xiàn)較大誤差,但是真?zhèn)€預測模型的精度很好,具有實際應用的意義。
【關鍵詞】進口木漿 銷售量預測 GRNN神經網絡 交叉驗證
當前我國造紙行業(yè)的原料木漿主要依靠進口。K公司作為原料供應商,通過提前進口木漿在倉庫儲存,之后已現(xiàn)貨的形勢銷售給國內造紙企業(yè)。在日益激烈的市場競爭中.在客戶需求呈現(xiàn)多樣化、特殊化的情況下,公司要增強市場的競爭力,在提高產品質量和服務水平的同時,必須對于市場的變化做出及時響應,對生產、物料進行合理規(guī)劃提高公式相應效率,銷售預測在這一過程中起著關鍵的作用。因為較為準確的銷量預測可以有效的降低公司倉庫的庫存量,這樣可以降低公司的運營成本和經營風險,提升現(xiàn)金流動和服務質量。但是目前,K公司對于木漿的進口計劃沒有一套完善的銷售預測體系作為支撐,而是僅僅依靠決策者的經驗判斷。這種方式極易造成庫存積壓或者脫銷,因此每個月銷售量預測成為改進經營管理的重要一環(huán)。
銷售量預測是一種時間序列的預測。常用的短期預測方法有移動平均法、指數平滑法、趨勢外推法、博克斯一詹倉斯法(The Box—Jenkins Model,ARIMA)、回歸及相關分析等,這些數值預測技術都試圖用建立數學模型的方法來求解實際問題。市場是時刻變化的,未來的銷售量與很多因素有關,銷售量的變化是非線性的,為此要找出合適的數學模型是相當困難的。近年來,國內外有很多研究工作,開始將神經網絡技術應用于預測。神經網絡具有超強的非線性映射能力和向數據學習的能力,因而在各項預測中得到了廣泛的重視和應用.目前為止,在預測時用得最多的是BP網絡模型,但這種網絡在預測時,并非沒有缺點:BP網絡存在收斂速度慢,容易陷入局部極小等缺點。特別是在相關企業(yè)數據樣本不足時,BP網絡在處理小樣本的效果很不理想,預測結果容易受人為因素的影響.而另一種GRNN神經網絡在逼近能力、分類能力和學習速度上較BP網絡有較強的優(yōu)勢。此外,GRNN神經網絡中人為調節(jié)的參數少,只有一個閾值,網絡的學習全部依賴數據樣本,這樣網絡就可以最大限度地避免人為主觀假定對預測結果的影響。因此,本研究嘗試利用GRNN網絡建立預測模型,并對預測性能進行分析和評價。
1 GRNN的基本原理
1.1 GRNN統(tǒng)計學理論基礎
GRNN--廣義回歸神經網絡是美國學者Donald F.Specht在1991年提出的,它是徑向基神經網絡的一個分支。具有很強的非線性映射能力和柔性網絡結構以及高度的容錯性和魯棒性。網絡最后收斂于樣本量積聚較多的優(yōu)化回歸面。它比一般的BP網絡有更強的逼近能力和學習速度,可以用來處理不穩(wěn)定的數據,尤其是在樣本數據缺乏時,它的預測效果較為更好。GRNN的理論基礎來源于于非線性回歸分析,原理來源于概率論的思想:當用作函數逼近時,網絡輸出可以當做網絡輸入的回歸函數,當用作分類時,起可當做相應類別的后驗概率。設隨機變量x,y的聯(lián)合概率密度函數為f(x,y),且x的觀測值為X,所以y作為X的回歸其條件均值為:
當δ取取值適中,預測時所有學習樣本的應變量都被計算進去,與預測點距離近的樣本點對應因變量被賦予了更大權值。
1.2 GRNN網絡結構
GRNN網絡由輸入層、模式層、求和層、輸出層四層組成。如圖1所示。
1.2.1 輸入層
輸入層功能只是簡單將輸入向量x=[x1...xn]輸入到模式層。
1.2.2 模式層
模式層神經元數目等于學習樣本的數目,各個神經元和學習樣本一一對應。將學習樣本作為數據中心,計算輸入樣本與數據中心的歐氏距離。
式中δ為拓展速度變量,它決定了基函數圍繞中心點的寬度,x為輸入量,xi為第i個神經元對應數據中心。
1.2.3 求和層
神經元計算公式:
其中分母SD是對模式層輸出進行算術求和,各個模式層神經元權值為1:
分子SNj是對模式層輸出進行加權求和,yij為模式層第i個輸出和求和層第j個神經元的權值。
1.2.4 輸出層
輸出層中神經元數目等于學習樣本中輸出向量維數k,第j個神經元對應輸出估計:
2 預測模型建立和求解
2.1 模型建立
由于木漿進口需要一個相對較長的準備和安排的時間,我們將K公司國內的木漿銷售分為華北,華中,華東,華南,東北,西南六個銷售大區(qū),分別按月統(tǒng)計自2010年至2015年銷售數據根據對每月木漿銷售量影響因素的分析。選取了我們認為對木漿銷量有直接影響的8項因素:
2.1.1 當月木漿銷售價格
K公司木漿當月的銷售價格。
2.1.2 當月木漿銷量
K公司當月的木漿銷售數量。
2.1.3 當月月份
由于木漿產銷量都受一定季節(jié)影響,將月份作為一個變量因素。
2.1.4 當月人民幣兌美元匯率
進口木漿結算以美元價格為準,匯率直接影響企業(yè)的采購成本。
2.1.5 國內該品類木漿當月進口總量
中國海關公布的當月該類木漿進口到中國大陸的總量。
2.1.6 地區(qū)客戶該品類木漿消耗總量
K公司對國內市場進行分區(qū)管理,每個大區(qū)內按照5年內有貿易往來的客戶工廠的在正常全線開機狀況下的木漿消耗量作為該地區(qū)的木漿預計消耗量。
2.1.7 當月進口木漿平均價格
當月海關公布的該類木漿進口報關的平均單價。
2.1.8 下月新合同銷售價格
K公司計劃下月訂單簽訂合同的銷售價格。
將這八個項指標因素作為網絡的輸入量。將下月木漿銷量作為網絡輸出。建立GRNN網絡對銷售量進行預測。以2010年1月至2015年6月的數據共396組數據作為學習樣本。并且我們將2015年下半年各個大區(qū)的銷售數據作為測試數據共36組,用來評價預測的效果。(數據見表1)
2.2 利用MATLAB對模型實現(xiàn)求解
用Matlab調用GRNN的函數newgrnn(P,T,SPREAD)建立神經網絡,由于學習樣本數量有限,我們采取交叉驗證的方式。將數據分組代入,進行學習訓練網絡。反復訓練可得到SPREAD為0.2時預測結果較好。采用最優(yōu)的光滑因子建立網絡對2015年下半的36組數據進行預測。并與真實值進行比較檢驗是否預測的效果如下。
由表2可以看出,雖然在一些點上誤差較大,但是36個測試點的整體的預測效果不錯。平均誤差百分比只有4.90%。這樣對公司在運營和決策中已經具備了相當大的參考意義了。
3 分析與結論
GRNN網絡在根據當月木漿銷售數據對下月銷售量預測中可以很好的發(fā)揮左右。預測結果在大多數時候具有一定的參考價值。因為首先它的訓練過程不需要反復迭代,計算速度較快。而且GRNN網絡不需要對神經原個數和傳遞函數進行認為的設定,只需要確定光滑因子,訓練過程中的網絡學習完全來源于訓練樣本,這樣可以盡量避免人為的主管因素的干擾。
當然在某些情況下,GRNN的預測結果和真實的銷售量還存在較大的誤差,這是由于銷售問題本身的一些不可控和復雜性。一些人為操作上的意外例如質量異常,內地貿易政策變化等也會造成不可控的影響。另外訓練樣本數據的有限也制約了GRNN網絡的學習和預測能力。通過對原始數據采集的更加準確,選取更完善的影響銷量的網絡輸入,增加學習樣本的數量這些舉措是進一步提高預測精度的一個方向。對于K公司的木漿銷售預測來說是一個指的深入研究和探討的改進方向。
參考文獻
[1]鳳德偉,張忠能,凌君逸.基于神經網絡的短期銷售預測[J].計算機工程,2004,30(z1):363-364.
[2]王小川,史峰,郁磊,李洋.MATLAB神經網絡43個案例分析.北京:北京航空航天大學出版社,2013:67-73.
[3]Zhao C,Liu K,Li D S.Freight volume forecast based on GRNN[J].Journal of The China Railway Society, 2004,26(1):4-7.
[4]Jin-yan WEI,F(xiàn)eng RU.Forecasting the traffic volume by the model of GRNN and studing its realization[J]. Journal of Changsha Communications University,2006(2):10.
[5]童玉娟,李曉會.基于GRNN的貨運量預測[J].福建電腦,2013,28(10):108-109.
[6]葉春明.生產計劃與控制[M].北京:高等教育出版社,2005.
[7]李霞.基于BP神經網絡的銷售預測研究[D] 上海:上海交通大學,2012.
[8]趙亞鵬.丁以中/基于GRNN神經網絡的長江干線港口集裝箱吞吐量預測[J].中國航海.2006.69(4):90-91.
[9]郭丹.徑向基神經網絡在木材銷售量預測中的應用口[J].價值工程,2011(6):100-101.
[10]張德豐.Matlab神經網絡應用設計[M].北京:機械工業(yè)出版社,2009.
作者單位
上海交通大學自動化系 上海市 200050