肖泉彬,黎小龍,車俊俊,何敏
(江西理工大學(xué)軟件工程學(xué)院,江西 南昌 330013)
中國零售市場進(jìn)入了一個(gè)創(chuàng)新與技術(shù)應(yīng)用的高發(fā)期[1],產(chǎn)品供應(yīng)是市場上最重要的環(huán)節(jié)之一,準(zhǔn)確預(yù)測商品銷售量從而把握供應(yīng)量成為企業(yè)在市場競爭中存活的關(guān)鍵。隨著技術(shù)的進(jìn)步,人工神經(jīng)網(wǎng)絡(luò)預(yù)測技術(shù)在不同領(lǐng)域的應(yīng)用不斷深入[2],相關(guān)學(xué)者應(yīng)用神經(jīng)網(wǎng)絡(luò)對臨床紅細(xì)胞用量[3]、血紅蛋白濃度[4]、鐵路大宗貨物運(yùn)價(jià)風(fēng)險(xiǎn)[5]、羊肉價(jià)格[6]、滾動(dòng)軸承故障預(yù)測[7]等各個(gè)領(lǐng)域進(jìn)行預(yù)測,結(jié)果較好。該文在神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)之上通過Pearson相關(guān)性分析,對新零售行業(yè)銷售量的預(yù)測進(jìn)行應(yīng)用并得到驗(yàn)證。
銷售數(shù)據(jù)預(yù)測的準(zhǔn)確性取決于過去統(tǒng)計(jì)的銷售量數(shù)據(jù)的質(zhì)量和數(shù)量,在數(shù)據(jù)的收集統(tǒng)計(jì)中存在異常情況,需要剔除不完整和異常的數(shù)據(jù)。如果采用這些數(shù)據(jù)進(jìn)行預(yù)測,會導(dǎo)致預(yù)測成功率下降。由于數(shù)據(jù)量龐大且數(shù)據(jù)變量之間相互影響,必須對樣本數(shù)據(jù)進(jìn)行預(yù)處理[8],對原始數(shù)據(jù)進(jìn)行異常值的剔除、相關(guān)性分析等。
相關(guān)性分析是研究兩個(gè)及其以上處于同等地位的隨機(jī)變量之間的相關(guān)關(guān)系的統(tǒng)計(jì)分析方法。相關(guān)系數(shù)是一種定量描述兩組隨機(jī)變量的統(tǒng)計(jì)學(xué)相關(guān)性的指標(biāo)。通過比較數(shù)組中的每個(gè)數(shù)對以確定兩組數(shù)據(jù)整體間的相關(guān)程度。當(dāng)自變量取某一值時(shí),因變量對應(yīng)為一個(gè)概率分布,如果對于所有的自變量取值的概率分布都相同,則說明因變量和自變量是沒有相關(guān)關(guān)系的。反之,如果自變量的取值不同,因變量的分布也不同,則說明兩者是存在相關(guān)關(guān)系的。
影響因素既有產(chǎn)品自身的內(nèi)在因素,也有外部因素[9],但該文從已知數(shù)據(jù)入手主要分析庫存量、標(biāo)價(jià)、售價(jià)與折扣等因素。采用Pearson相關(guān)系數(shù)分析數(shù)據(jù)間的相似程度[10]。
原假設(shè)為H0∶r=0,則備擇假設(shè)為H1∶r≠0(其中,r為Pearson相關(guān)系數(shù))。
如表1所示,國慶期間,在99%置信水平上,拒絕原假設(shè),Pearson相關(guān)系數(shù)顯著異于0,即銷售量與庫存、售價(jià)相關(guān)。
表1 國慶相關(guān)性檢驗(yàn)
目標(biāo)單款商品銷售量的影響均與其庫存、售價(jià)相關(guān),與產(chǎn)品的實(shí)際價(jià)格、節(jié)假日的折扣相關(guān)性不強(qiáng)[11]。
BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)是一種按誤差逆?zhèn)鞑ニ惴ㄓ?xùn)練的多層前饋網(wǎng)絡(luò),其拓?fù)浣Y(jié)構(gòu)包括輸入層、隱含層和輸出層,通過反向傳播來不斷調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值,使網(wǎng)絡(luò)的誤差平方和最小。
BP神經(jīng)網(wǎng)絡(luò)的算法具有良好的自適應(yīng)性和分類識別等能力。其可以看作是一個(gè)函數(shù)映射,適用于有明確的輸入與輸出的對應(yīng)關(guān)系,但其中的函數(shù)存在不容易確定的問題。而銷售量的預(yù)測可以看成將相關(guān)因素作為輸入,銷售量為輸出的復(fù)雜函數(shù)映射問題。因此,利用BP神經(jīng)網(wǎng)絡(luò)對銷售量進(jìn)行預(yù)測。
符號說明如表2所示。
表2 符號說明
輸入層:
隱含層:
其中,f(x)是激發(fā)函數(shù),有多種形式:sigmoid函數(shù)、tanh函數(shù)、ReLU函數(shù)。該文采用sigmoid函數(shù),該函數(shù)將取值為(-∞,+∞)的數(shù)映射到(0,1)之間。
sigmoid函數(shù)為:
輸出層為:
3.2.1 輸入層和輸出層的設(shè)計(jì)
根據(jù)相關(guān)性分析得出,影響目標(biāo)skc銷量的因素主要有產(chǎn)品的售價(jià)以及產(chǎn)品的庫存量??紤]到節(jié)假日客流量大,人們的消費(fèi)欲望明顯上漲,所以選取產(chǎn)品售價(jià)、庫存量以及節(jié)假日時(shí)長作為網(wǎng)絡(luò)的輸入層節(jié)點(diǎn),商品的銷量作為輸出節(jié)點(diǎn)。故網(wǎng)絡(luò)結(jié)構(gòu)含有3個(gè)輸入,1個(gè)輸出。
3.2.2 隱含層設(shè)計(jì)
4.1.1 訓(xùn)練樣本預(yù)處理
由于樣本數(shù)據(jù)[13]中,不同變量之間數(shù)值的大小以及量綱不同,需要在訓(xùn)練前進(jìn)行數(shù)據(jù)預(yù)處理,將所有數(shù)據(jù)轉(zhuǎn)化在[0,1]范圍內(nèi),轉(zhuǎn)化方法采用標(biāo)準(zhǔn)化歸一化處理[14]。
選取對銷量有影響的相關(guān)因子(售價(jià)、庫存量)以及節(jié)假日時(shí)長作為網(wǎng)絡(luò)的輸入。
4.1.2 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)初始化
在確定輸入層、隱含層、輸出層及相關(guān)神經(jīng)元個(gè)數(shù)的過程中,該文選取了產(chǎn)品的售價(jià)、庫存量以及節(jié)假日時(shí)長,建立圖1所示的網(wǎng)絡(luò)結(jié)構(gòu),輸出節(jié)點(diǎn)為目標(biāo)小類的預(yù)測銷量[15]。
圖1 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
4.1.3 生成隨機(jī)的神經(jīng)網(wǎng)絡(luò)的權(quán)值與閾值
設(shè)定一定大小的迭代次數(shù),以下函數(shù)作為相應(yīng)的訓(xùn)練函數(shù)。
輸出層誤差調(diào)整函數(shù)為:
隱含層誤差函數(shù)為:
輸入層誤差函數(shù)為:
通過輸入層、輸出層以及隱含層誤差函數(shù)的反饋,對BP神經(jīng)網(wǎng)絡(luò)各節(jié)點(diǎn)的權(quán)重不斷調(diào)整優(yōu)化。算法迭代停止時(shí)生成的值為訓(xùn)練目標(biāo)小類的預(yù)測值。
BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型的結(jié)果如圖2所示,該圖為一個(gè)商品小類的預(yù)測圖形,可以看出,模型的預(yù)測值與實(shí)際值比較接近,說明神經(jīng)網(wǎng)絡(luò)的預(yù)測效果良好。
圖2 BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型實(shí)際值與預(yù)測值
如表3所示,MAPE誤差范圍小,進(jìn)一步說明神經(jīng)網(wǎng)絡(luò)的預(yù)測效果較好。
表3 預(yù)測商品小類MAPE
建立Pearson相關(guān)系數(shù)模型,深度挖掘數(shù)據(jù)之間的聯(lián)系,再通過BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型來精準(zhǔn)預(yù)測市場需求,對商品的銷售情況能夠較好地預(yù)測[16],可以為新零售行業(yè)的庫存調(diào)配決策工作提供可靠的科學(xué)依據(jù)。在將來的預(yù)測中,應(yīng)當(dāng)盡可能地增加樣本數(shù)據(jù)以提高神經(jīng)網(wǎng)絡(luò)預(yù)測的準(zhǔn)確性。