魏貝貝 盧明銀
摘 要: 空調行業(yè)一直處于雙寡頭格局,從雙十一的價格戰(zhàn)到目前的疫情影響,中小企業(yè)的電子商務銷量預測面臨著更加嚴峻的考驗。為降低傳統(tǒng)預測模型的低擬合度,提高預測精度,提出了布谷鳥算法與BP神經網絡算法相結合的預測方法。首先對影響空調銷量預測的主要因素進行了降維處理,其次運用布谷鳥算法對BP神經網絡算法的權值和閾值進行優(yōu)化,同時在布谷鳥算法中引入了細菌覓食算法的群體信息共享機制,加快算法的收斂。通過與不同預測方法的結果對比,該方法的預測誤差更低,可以為空調電子商務銷量預測提供良好的科學依據。
關鍵詞: 因子分析;布谷鳥算法;BP神經網絡算法;銷量預測
中圖分類號: TT-9
文獻標志碼: A
Air Conditioning E-commerce Based on ImprovedCuckoo-BP Algorithm Sales Forecast
WEI Beibei LU Mingyin
(1.School of Mining Engineering, China University of Mining and Technology,Jiangsu Xuzhou 221100, China; 2.School of Mining Engineering, China Universityof Mining and Technology, Jiangsu Xuzhou 221100, China)
Abstract: The air-conditioning industry has always been in a duopolistic pattern. From the price war of the Double Eleven to the current epidemic, the forecast of SMEse-commerce sales is facing a more severe test. In order to reduce the artificial interference and the low fitting degree of the traditional prediction model and improve the prediction accuracy, it will propose a prediction method combining the cuckoo algorithm and the BP neural network algorithm. First of all, the main factors that affect the sales forecast are processed for dimensionality reduction. Secondly, the cuckoo algorithm is used to optimize the weights and thresholds of the BP neural network algorithm. At the same time, the cuckoo algorithm introduces the group information sharing mechanism of the bacterial foraging algorithm to speed up the convergence of the algorithm. Compared with the results of different prediction methods, the prediction error of this method is lower, which can provide a good scientific basis for the sales forecast of e-commerce of air conditioners.
Key words: factor analysis; cuckoo algorithm; BP neural network algorithm; sales forecast
2019年網購零售額達106324億元,比上年增長16.5%,網絡零售在促進消費結構升級、拉動內需等方面起著越來越重要的作用,京東、蘇寧易購、天貓等電商平臺成為了推動消費升級的主力軍。與此同時,企業(yè)運營問題面臨著更大的挑戰(zhàn)。由于客戶在多個平臺的選擇性廣,且企業(yè)無法直接接觸客戶,特別是B2C模式更增加了訂單預測的難度。如果生產過多,引起庫存積壓,占用大量財務資金影響企業(yè)正常運轉,生產過少,缺貨狀態(tài)下只能形成越賣越差的惡性循環(huán),而且一旦預測不準確,頻繁的變更訂單需求,勢必會影響采購、生產環(huán)節(jié)的工作安排,導致工廠間產能、物料的不均衡,因此保證訂單預測高準確率和低波動率顯得尤為重要。
人工神經網絡( Artificial Neural Networks,簡寫為 ANNs ),是應用于計算機視聽、語音分析、數(shù)字水印、圖像識別等各行各業(yè)的數(shù)學模型,具有自學習能力、較強的非線性擬合能力、高速尋優(yōu)能力;但也有易陷入局部最優(yōu),收斂性不強的缺點。本文以X空調公司為研究背景,運用改進的布谷鳥算法優(yōu)化BP神經網絡算法中初始化時的權重和閾值,提高BP神經網絡的泛化能力和收斂性,從而更加準確地預測電商月度銷量和分機型銷量,降低牛鞭效應,也使工廠在淡旺季切換之際對物資、人員規(guī)劃有充足的準備,達到減員提效,提高線上占有率的目的。
1 電商銷量預測的關鍵因素
通過對100名X公司電商運營人員及日常網購人員的問卷調查分析,將影響空調業(yè)電商銷量的因素歸納為以下幾點:
為避免數(shù)據冗余,通過spss軟件進行了因子分析,將相關性較高的因素進行聚類以降低問題的復雜性,聚類結果如表2、表3、表4所示。
從表2中可以看出,KMO為0.714,大于0.6,且Bartlett球形度檢驗中P<0.05,說明研究數(shù)據適合進行因子分析。從表3、表4中得出,3個因子總共提取出11個分析項中88.377%的信息量,因此將影響因素劃分為三個類別,如表5所示。
2 改進布谷鳥- BP神經網絡算法
2.1 改進布谷鳥算法
Yang XS與Deb S通過模擬自然界中布谷鳥產卵、孵化過程,在《Cuckoo Search via Levy Flights》一文中提出了布谷鳥算法(簡稱CS)。 布谷鳥自身不筑巢、不孵卵、不育雛,而是抓住機會叼走他鳥巢中的蛋,并在巢內產卵,讓其他鳥類代其孵化,雛鳥為了更好地生存會模仿宿主雛鳥的叫聲以獲得食物。布谷鳥一般在一個鳥巢中只寄生一枚蛋,當宿主鳥發(fā)現(xiàn)外來鳥蛋后,要么舍棄該鳥巢,重新選擇位置筑巢,要么拋棄布谷鳥蛋,即鳥窩、卵蛋代表解。卵蛋能否被宿主鳥成功孵化是一個優(yōu)勝劣汰的過程,也是衡量解好壞的唯一標準。
在算法設計中,布谷鳥通過萊維飛行在D維空間中尋找最優(yōu)解,同時考慮群體間缺乏信息共享,因此引入了細菌覓食算法(Bacterial Foraging Optimization Algorithm)中的群聚策略,假設群體最優(yōu)值對各位置釋放信息素,吸引布谷鳥朝最優(yōu)解方向移動:
Xt+1,i=Xt,i+αlevy(β)+ρattractexp(-ωattract(θi-θbest)2)(1)
式中,Xt表示第t代第i個解;α表示隨機搜索范圍的步長因子,⊕表示點對點乘法。萊維飛行通常使用Mantegna算法模擬,步長s數(shù)學表達式如下:
s=u|v|1/β(2)
其中,u服從N(0,σ2),v~N(0,1),σ={Г(1+β)sinπβ2β Г1+β22β-12}1β
宿主鳥按一定概率舍棄鳥窩,采用偏好隨機游走生成新的解:
Xt+1,i=Xt,i+αsH(Pa-r)(Xj,i-Xk,i)(3)
其中,Xj,i,Xk,i是通過隨機位置變換隨機選擇的兩個不同的解,s是步長,H(v)是單位解約函數(shù),r是從均勻分布中抽取得隨機概率。
同時,在CS算法中,每個解以隨機概率消失的同時也增加了淘汰最優(yōu)解的概率。本文中結合了BFOA的趨化策略,增加其局部搜索能力,并對每次趨化步驟中的平均適應度值排序,較差的半數(shù)鳥巢以一定概率發(fā)生遷移,以降低最優(yōu)解被隨機淘汰的可能性。具體步驟如下:
Step 1.初始化種群N、最大進化代數(shù)T、步長因子a,發(fā)現(xiàn)概率Pa、趨化步驟的步數(shù)M等,并隨機產生初始種群。計算所有個體的適應度,記錄全局最優(yōu)適應度值Gbest和全局平均適應度值Gave。
Step 2.判斷是否達到最大迭代次數(shù)或設定精度,若終止條件不滿足, 則重復Step 3 - Step 5,否則進行Step 6;
Step 3.通過萊維飛行更新鳥窩位置,若f(xi)
Step 4.計算趨化步驟中布谷鳥的平均適應度值得到布谷鳥能量,并排序,對于獲取能力差的半數(shù)鳥巢,生成一個隨機概率r,并將它與固定遷移概率Pa進行比較,若r< Pa則利用式(3)進行隨機遷移,并返回Step 2;
Step 6. 將改進布谷鳥算法更新后的權值、閾值作為神經網絡算法中的初始值進行訓練,達到迭代次數(shù)后或達到精度,結束運算,輸出預測值。
2.2 BP神經網絡算法
BP(Back Propagation)神經網絡應用于各行各業(yè),是1986年由Rumelhart和McClelland提出的概念,通過誤差反復訓練神經網絡模型,使預測結果最接近實際結果。BP神經網絡共包含三層結構:輸入層、隱藏層和輸出層,其中隱含層節(jié)點的選擇是影響模型性能的重要因素,增加節(jié)點數(shù)有助于獲得更低的誤差,但也增加了訓練復雜性低和訓練時間。一般BP神經網絡分為兩個步驟:首先,輸入值通過前向傳播算法獲得預測值,并判斷預測值與實際值的差異是否滿足精度要求。其次,誤差在不滿足精度要求的前提下,按原路逆向傳播到各層級,各層級運用梯度下降法更新權值和閾值,以使誤差信號最小。
本文中BP神經網絡的激活函數(shù)設置為:
sigmoid(z)=1+11+e-1(4)
改進CS算法的目標函數(shù)和BP神經網絡的損失函數(shù)設置為:
Et=1n∑ni=1(t,i-yt,i)2(5)
其中:y(x)=∑ni=1(ωixi+εi)(6)
ωi:第i個因素的權重;εi:閾值。
2.3 實例驗證及參數(shù)選擇
本文取X公司以2010—2019年的冷凍年為例,選取2010年9月—2018年12月共100個月的數(shù)據作為訓練樣本,為驗證“雙十一”、“618”大促節(jié)點數(shù)據,選取2019年1月至2019年12月全年數(shù)據作為為測試樣本。
運用Matlab 2013軟件中進行模型的求解其中,相關參數(shù)設置如下:CS算法中種群規(guī)模n=25,最大迭代次數(shù)t=200,步長因子α=0.2,遷移概率Pa=0.25,引力深度度ρattract=0.1,引力寬度ωattract=0.2。BP算法設計為3層網絡結構,輸入層n=3,輸出層m=1,隱含層P=n+m+rand(1,10)=8,預測結果如圖1和表6所示。
通過圖1可以看出,改進CS-BP神經網絡算法相比另兩種方法預測精度更高,均平方誤差達到0.52%;而CS-BP算法誤差為0.73%,傳統(tǒng)的BP算法誤差為0.89%,優(yōu)化率分別為28.76%、41.57%。因此,改進BP-CS算法對于提高電子商務訂單的銷量預測準確率具有較大實踐意義,同時也簡化了神經網絡結構,加快了收斂速度。
3 結語
空調行業(yè)有明顯的淡旺季之分,尤其是相對于中小企業(yè),四、五月份會面臨巨大的材料采購、產能缺口壓力,準確的銷量預測至關重要。本文通過因子分析歸納了影響空調行業(yè)電商預測的主要因素,同時在CS算法中結合了BFOA算法的優(yōu)勢,對BP算法中的參數(shù)進行初步擬定。根據X公司2019年的預測結果表明,優(yōu)化后的CS-BP算法預測準確率更高,具有可靠性和有效性,也可為其他公司、其他行業(yè)的預測方法提供良好的借鑒。
參考文獻:
[1] 楊光,汪長波,黃滌,王金燕,劉海明.基于無偏灰色PSOMarkov優(yōu)化模型的加油站便利店零售銷量預測方法研究[J].數(shù)學的實踐與認識,2019,49(20):44-52.
[2] YANG X S, DEB S. Cuckoo search via Lévy flights. Proceedings of world congress on nature and biologically inspired computing (NaBIC 2009). IEEE Publications, USA, 2009: 210-214.
[3] ROBERTO ANTONIO VZQUEZ. Training spiking neural models using cuckoo search algorithm[C]// Proceedings of the IEEE Congress on Evolutionary Computation, CEC 2011, New Orleans, LA, USA, 5-8 June, 2011. IEEE, 2011.
[4] PASSINO K M.Biomimicry of bacterial foraging for distributed optimization and control[J].IEEE Control Systems Magazine (S0272-1708), 2002, 22(3): 52-67.
[5] 焦李成. 神經網絡系統(tǒng)理論[M]. 西安電子科技大學出版社, 1990.