陳德洪 李長(zhǎng)云
摘? 要:為了獲得精度更高的服裝銷量預(yù)測(cè)結(jié)果,提出一種基于LSTM神經(jīng)網(wǎng)絡(luò)的服裝銷量預(yù)測(cè)方法。LSTM神經(jīng)網(wǎng)絡(luò)具有較好的非線性和自適應(yīng)特性,可以更好地挖掘時(shí)序數(shù)據(jù)中的時(shí)序特征和非線性特征,從而獲得更加符合實(shí)際的預(yù)測(cè)結(jié)果值。使用某服裝企業(yè)的服裝銷量時(shí)間序列數(shù)據(jù)集訓(xùn)練LSTM模型,設(shè)計(jì)與經(jīng)典時(shí)間序列預(yù)測(cè)模型ARIMA的對(duì)比實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,該模型能夠有效提升服裝銷量預(yù)測(cè)任務(wù)的精度。
關(guān)鍵詞:服裝銷量預(yù)測(cè);LSTM;ARIMA
中圖分類號(hào):TP18? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):2096-4706(2021)20-0106-03
Short Term Clothing Sales Forecast Based on LSTM Neural Network
CHEN Dehong, LI Changyun
(School of Computer Science, Hunan University of Technology, Zhuzhou 412007, China)
Abstract: In order to obtain more accurate clothing sales forecast results, a clothing sales prediction method based on LSTM neural network is proposed. LSTM neural network has good nonlinear and adaptive characteristics. It can better mine the temporal and nonlinear characteristics in time series data, so as to obtain more realistic prediction results. Using the clothing sales time series data set of a clothing enterprise to train the LSTM model, a comparative experiment with the classical time series prediction model ARIMA is designed. The experimental results show that the model can effectively improve the accuracy of clothing sales forecast.
Keywords: clothing sales forecast; LSTM; ARIMA
0? 引? 言
服裝銷量對(duì)服裝生產(chǎn)企業(yè)進(jìn)行科學(xué)生產(chǎn)、減輕庫(kù)存壓力[1]等具有重要的指導(dǎo)意義。隨著經(jīng)濟(jì)社會(huì)的快速發(fā)展,影響服裝物料需求的因素呈現(xiàn)出明顯的復(fù)雜性和多樣性,主要包括流行趨勢(shì)、經(jīng)濟(jì)發(fā)展水平、消費(fèi)觀念、季節(jié)、節(jié)假日等。從而導(dǎo)致對(duì)服裝物料需求進(jìn)行預(yù)測(cè)較為困難。如果能有一種對(duì)服裝銷量進(jìn)行可靠預(yù)測(cè)的方法,將為企業(yè)減少貨物積壓,把握市場(chǎng)動(dòng)向,提升企業(yè)利潤(rùn)等具有重要的意義。
進(jìn)行預(yù)測(cè)研究,常用的時(shí)間序列預(yù)測(cè)方法主要分為兩類,一類是時(shí)間序列統(tǒng)計(jì)模型,主要是把整個(gè)時(shí)間序列放入模型中進(jìn)行訓(xùn)練,如AR、MA、ARIMA[2]、Prophet[3]等;另一類時(shí)間序列監(jiān)督模型,需要把時(shí)間序列通過滾動(dòng)的方式構(gòu)建對(duì)應(yīng)的X和Y,如CNN[4]、RNN[5]、LSTM[6]、Attention Model[7]、Transformer[8]等。在眾多時(shí)序預(yù)測(cè)算法的應(yīng)用中,LSTM神經(jīng)網(wǎng)絡(luò)被廣泛應(yīng)用在眾多領(lǐng)域,高海翔等[6]使用LSTM神經(jīng)網(wǎng)絡(luò)模型對(duì)數(shù)據(jù)進(jìn)行分量重構(gòu),有效提升了原油價(jià)格的預(yù)測(cè)精度。劉翀等[7]引入深度LSTM建模,解決金融數(shù)據(jù)間的長(zhǎng)依賴問題,得到一個(gè)具有高準(zhǔn)確性和穩(wěn)定性的金融領(lǐng)域預(yù)測(cè)模型。曹超凡等[9]使用LSTM模型進(jìn)行關(guān)聯(lián)預(yù)測(cè),在股價(jià)預(yù)測(cè)領(lǐng)域取得了較優(yōu)水準(zhǔn)。LSTM神經(jīng)網(wǎng)絡(luò)在眾多領(lǐng)域均取得了良好效果,證明了該方法的優(yōu)越性和可行性。由此將該方法引入服裝銷量預(yù)測(cè)領(lǐng)域,提升預(yù)測(cè)精度。
針對(duì)上述問題,本文選用LSTM神經(jīng)網(wǎng)絡(luò)來完成服裝銷量預(yù)測(cè)任務(wù),為企業(yè)提供的生產(chǎn)幾乎決策提供精度更好的理論依據(jù)。首先對(duì)獲取的企業(yè)服裝銷量數(shù)據(jù)進(jìn)行數(shù)據(jù)處理得到時(shí)序數(shù)據(jù),然后對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,再輸入到LSTM模型中進(jìn)行訓(xùn)練,得到短期服裝銷量預(yù)測(cè)值。
1? 基礎(chǔ)理論
1.1? LSTM神經(jīng)網(wǎng)絡(luò)
LSTM[6]神經(jīng)網(wǎng)絡(luò)是一種特殊的RNN,主要是為了消除RNN在進(jìn)行長(zhǎng)序列訓(xùn)練過程中的梯度消失和梯度爆炸問題,在處理序列數(shù)據(jù)方面表現(xiàn)優(yōu)異。LSTM主要由輸入門、遺忘門和輸出門組成。LSTM神經(jīng)網(wǎng)絡(luò)的重要之處在于它獨(dú)有的細(xì)胞狀態(tài)與三類功能各異的“門”結(jié)構(gòu)[6]。細(xì)胞狀態(tài)作為各類信息傳輸?shù)穆窂?,讓模塊內(nèi)的信息能在不用序列連中有序傳遞??蓪⑵淇醋骶W(wǎng)絡(luò)的“記憶”部門。從基礎(chǔ)理論來說,細(xì)胞中存儲(chǔ)的狀態(tài)能夠?qū)⑾嚓P(guān)序列處理過程中的各類有效信息一直傳遞下去。所以即使是原始時(shí)間步長(zhǎng)的有效信息也能攜帶到后續(xù)時(shí)間步長(zhǎng)的細(xì)胞中來,這有效克服了短時(shí)記憶的影響,改進(jìn)了原有RNN的局限性。因此LSTM是通過“門”結(jié)構(gòu)來實(shí)現(xiàn)信息的增添和減少,“門”結(jié)構(gòu)在大量訓(xùn)練過程中可以自主得去學(xué)習(xí)保持或刪除各類相關(guān)數(shù)據(jù)[7]。
1.2? ARIMA模型
自回歸綜合移動(dòng)平均(ARIMA)是時(shí)間序列預(yù)測(cè)中最常用的方法之一,它是將自回歸模型和移動(dòng)平均模型相結(jié)合的一種方法,由于其能夠使序列平穩(wěn),通常應(yīng)用于非平穩(wěn)時(shí)間序列。在識(shí)別步驟中,通常需要進(jìn)行數(shù)據(jù)轉(zhuǎn)換,使時(shí)間序列平穩(wěn)。平穩(wěn)性是建立用于預(yù)測(cè)的ARIMA模型的必要條件。平穩(wěn)時(shí)間序列具有這樣的特性,即它的統(tǒng)計(jì)特征,如均值和自相關(guān)結(jié)構(gòu),隨時(shí)間的推移是恒定的。
1.3? 預(yù)測(cè)任務(wù)流程
針對(duì)時(shí)間序列模型,考慮服裝銷量受到季節(jié)、流行趨勢(shì)、社會(huì)經(jīng)濟(jì)狀況、消費(fèi)觀念、傳統(tǒng)文化影響等多重因素的干擾,具有很強(qiáng)特殊性,同時(shí)提升預(yù)測(cè)精度又非常有必要,會(huì)給企業(yè)帶來可觀的效益,因此提出了一個(gè)基于LSTM神經(jīng)網(wǎng)絡(luò)的短期服裝銷量預(yù)測(cè)方法,步驟為:
(1)獲取服裝銷量原始數(shù)據(jù)數(shù)據(jù)。
(2)數(shù)據(jù)清洗。將銷量原始數(shù)據(jù)數(shù)據(jù)整理得到銷量時(shí)間序列數(shù)據(jù),由2列數(shù)據(jù)組成,第一列是日期,第二列是銷售數(shù)值。
(3)整理數(shù)據(jù)。為減少誤差,降低非線性因素對(duì)預(yù)測(cè)的影響,對(duì)已有數(shù)據(jù)已月為單位重新計(jì)算,得到新的時(shí)序數(shù)據(jù)。同時(shí)另外經(jīng)過序列處理,以時(shí)間為序號(hào),銷量為值,對(duì)應(yīng)得到一組序列數(shù)據(jù)。
(4)劃分訓(xùn)練集和測(cè)試集。由于是短期預(yù)測(cè),因此只劃分12個(gè)月即12條數(shù)據(jù)作為測(cè)試集。
(5)使用LSTM模型對(duì)訓(xùn)練集進(jìn)行訓(xùn)練。
(6)預(yù)測(cè)評(píng)估。對(duì)預(yù)測(cè)結(jié)果進(jìn)行綜合評(píng)價(jià),包括評(píng)價(jià)指標(biāo)和曲線擬合情況。
2? 實(shí)驗(yàn)結(jié)果與分析
2.1? 數(shù)據(jù)集的選擇和預(yù)測(cè)評(píng)估
本實(shí)驗(yàn)選用某服裝企業(yè)的服裝銷量時(shí)間序列數(shù)據(jù)集進(jìn)行驗(yàn)證實(shí)驗(yàn),該數(shù)據(jù)集記錄了企業(yè)從2008年1月到2015年12月的服裝銷售時(shí)間序列數(shù)據(jù)。首先進(jìn)行數(shù)據(jù)預(yù)處理,由于銷售是以天為單位,而天為單位受到當(dāng)天天氣、當(dāng)天溫度等較多因素的影響,綜合考慮后認(rèn)為以月為單位對(duì)數(shù)據(jù)集進(jìn)行重新分配處理。以月為單位重新整理數(shù)據(jù)格式,對(duì)每個(gè)月度的各天銷售數(shù)據(jù)求和,集中到各月1號(hào),形成一個(gè)新的數(shù)據(jù)集。新時(shí)間序列數(shù)據(jù)集中由2列組成,第一列是時(shí)間序列的時(shí)間戳,第二列是月銷售數(shù)據(jù)值。新的時(shí)間序列數(shù)據(jù)中得到96個(gè)樣本,本實(shí)驗(yàn)將其中前84個(gè)樣本作為訓(xùn)練集,后12個(gè)樣本作為測(cè)試集。
本實(shí)驗(yàn)借助均方根誤差(RMSE)和平均絕對(duì)百分比誤差(MAPE)來作為預(yù)測(cè)評(píng)估指標(biāo),對(duì)預(yù)測(cè)結(jié)果進(jìn)行一個(gè)綜合的比較分析。RMSE和MAPE的數(shù)據(jù)越小,就表明預(yù)測(cè)的效果越好。同時(shí)還會(huì)繪制出預(yù)測(cè)數(shù)據(jù)與原始數(shù)據(jù)的對(duì)比圖,通過走勢(shì)和對(duì)重要節(jié)點(diǎn)的擬合精度來對(duì)整體的預(yù)測(cè)效果進(jìn)行判斷。結(jié)合預(yù)測(cè)評(píng)估指標(biāo)和走勢(shì)圖對(duì)比效果,才能得到最終的對(duì)預(yù)測(cè)效果的評(píng)價(jià),得出是否提升了預(yù)測(cè)精度。
2.2? LSTM模型構(gòu)建
初始化LSTM模型,采用標(biāo)準(zhǔn)的三層結(jié)構(gòu),批處理個(gè)數(shù)為50,迭代次數(shù)設(shè)置為200,目標(biāo)函數(shù)為均方差。為了防止梯度爆炸問題,在眾多的梯度優(yōu)化算法中選擇了自適應(yīng)估計(jì)(Adaptive Moment Estimation, Adam)算法。激活函數(shù)選用ReLU函數(shù)。原始服裝銷量數(shù)據(jù)經(jīng)過標(biāo)準(zhǔn)化方法處理得到標(biāo)準(zhǔn)且變化平緩的數(shù)據(jù)集,數(shù)據(jù)LSTM模型中,得到的結(jié)果經(jīng)過反標(biāo)準(zhǔn)化處理,最終得到服裝銷量預(yù)測(cè)結(jié)果值。
2.3? 實(shí)驗(yàn)結(jié)果
圖1是LSTM模型預(yù)測(cè)結(jié)果與ARIMA模型測(cè)結(jié)果與原始數(shù)據(jù)的走勢(shì)對(duì)比圖,由圖1可知,兩條預(yù)測(cè)曲線可以較為精確的預(yù)測(cè)數(shù)據(jù)走勢(shì),部分月份的數(shù)據(jù)擬合效果好,但整體的預(yù)測(cè)值都普遍偏大,形成的視覺效果較差,但認(rèn)真分析圖中3條曲線的走勢(shì)情況,可以看到LSTM模型曲線的走勢(shì)較為平穩(wěn),整體的預(yù)測(cè)效果更好,預(yù)測(cè)的12個(gè)數(shù)據(jù)點(diǎn)位與實(shí)際值的偏差較小,證明整體的預(yù)測(cè)效果較好。ARIMA模型的曲線的起伏和效果較為接近原曲線,在2015年1月全年銷售最高點(diǎn)和2015年6月全年銷售最低點(diǎn)的擬合效果較差,造成整體的預(yù)測(cè)效果偏差,同時(shí)整體數(shù)值偏高,因此造成誤差大。LSTM模型對(duì)實(shí)際曲線的擬合效果更好,預(yù)測(cè)值也更為接近實(shí)際值。以上從預(yù)測(cè)結(jié)果趨勢(shì)圖的走勢(shì)和對(duì)重要節(jié)點(diǎn)的擬合精度角度證明了LSTM模型整體的預(yù)測(cè)效果優(yōu)于ARIMA模型。
隨后使用預(yù)測(cè)評(píng)估計(jì)算公式對(duì)得到的LSTM模型的預(yù)測(cè)結(jié)果值與ARIMA的預(yù)測(cè)結(jié)果值進(jìn)行對(duì)應(yīng)的計(jì)算,分別計(jì)算兩者的RMSE和MAPE值,匯合得到表1。由于RMSE和MAPE值的計(jì)算只與數(shù)據(jù)本身有關(guān),因此與絕對(duì)大小無關(guān),只與相對(duì)大小的關(guān)聯(lián)性更強(qiáng),幾組數(shù)據(jù)比較得到的評(píng)估指標(biāo)數(shù)據(jù)更大的預(yù)測(cè)值,表明預(yù)測(cè)效果相對(duì)較差,預(yù)測(cè)精度較低;評(píng)估指標(biāo)數(shù)據(jù)更小的預(yù)測(cè)值,表明預(yù)測(cè)效果相對(duì)較好,預(yù)測(cè)精度較高。其中,LSTM模型的RMSE值為14.80,對(duì)比ARIMA模型降低31.23%;同時(shí),LSTM模型的MAPE值為5.40,對(duì)比ARIMA模型降低30.68%。從預(yù)測(cè)評(píng)估角度證明了LSTM模型整體的預(yù)測(cè)效果均好于ARIMA模型,且有著較大提升。
由實(shí)驗(yàn)結(jié)果可知,LSTM模型自身對(duì)數(shù)據(jù)的擬合效果好,數(shù)據(jù)誤差小,且預(yù)測(cè)速度較快。對(duì)比ARIMA模型,對(duì)原始數(shù)據(jù)的趨勢(shì)擬合效果更好,預(yù)測(cè)評(píng)估指標(biāo)也更佳。從預(yù)測(cè)評(píng)估指標(biāo)和走勢(shì)圖對(duì)比效果兩個(gè)方面均可表明LSTM神經(jīng)網(wǎng)絡(luò)在服裝銷量預(yù)測(cè)任務(wù)有更高的精度,能夠很好地滿足企業(yè)的實(shí)際需求,幫助服裝企業(yè)制定精度更高的生產(chǎn)計(jì)劃。
3? 結(jié)? 論
服裝企業(yè)想進(jìn)一步優(yōu)化庫(kù)存與提高生產(chǎn)效率,以此提高經(jīng)營(yíng)利潤(rùn),提升行業(yè)活力。更加精準(zhǔn)的銷售預(yù)測(cè)可以為企業(yè)制定生產(chǎn)計(jì)劃提供有效參考,為提升服裝需求預(yù)測(cè)任務(wù)的精度,更好擬合發(fā)展趨勢(shì),消除誤差因素的影響,提出了一種基于LSTM神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)方法,引入高效的神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)。通過與傳統(tǒng)方法ARIMA算法的對(duì)比實(shí)驗(yàn)可知,該方法對(duì)服裝生產(chǎn)企業(yè)進(jìn)行有效預(yù)測(cè)服裝銷量,合理安排生產(chǎn)計(jì)劃具有積極作用。本文中LSTM模型相對(duì)于傳統(tǒng)方法取得了一定的優(yōu)勢(shì)和進(jìn)步,有效提升了預(yù)測(cè)精度,但整體的預(yù)測(cè)效果仍不是非常理想,后續(xù)在引入深度學(xué)習(xí)算法進(jìn)行服裝銷量預(yù)測(cè)的基礎(chǔ)上,嘗試新的更加符合服裝銷量預(yù)測(cè)任務(wù)的神經(jīng)網(wǎng)絡(luò),進(jìn)一步提升服裝預(yù)測(cè)任務(wù)精度。
參考文獻(xiàn):
[1] G?IZA J,LUQUE R,MURILLO J,et al. Integrating pricing and coordinated inventory decisions between one warehouse and multiple retailers[J].Journal of Industrial and Production Engineering,2021,38(7):536-546.
[2]王英偉,馬樹才.基于ARIMA和LSTM混合模型的時(shí)間序列預(yù)測(cè)[J].計(jì)算機(jī)應(yīng)用與軟件,2021,38(2):291-298.
[3]張家晨,左興權(quán),黃海,等.Prophet混合模型應(yīng)用于基站網(wǎng)絡(luò)流量長(zhǎng)期預(yù)測(cè)[J/OL].計(jì)算機(jī)工程與應(yīng)用:1-11.(2021-07-06).http://kns.cnki.net/kcms/detail/11.2127.TP.20210706.0941.002.html.
[4]魏健,趙紅濤,劉敦楠,等.基于注意力機(jī)制的CNN-LSTM短期電力負(fù)荷預(yù)測(cè)方法[J].華北電力大學(xué)學(xué)報(bào)(自然科學(xué)版),2021,48(1):42-47.
[5]陳聰,候磊,李樂樂,等.基于GRU改進(jìn)RNN神經(jīng)網(wǎng)絡(luò)的飛機(jī)燃油流量預(yù)測(cè)[J].科學(xué)技術(shù)與工程,2021,21(27):11663-11673.
[6]高海翔,胡瑜,余樂安.基于分解集成的LSTM神經(jīng)網(wǎng)絡(luò)模型的油價(jià)預(yù)測(cè)[J].計(jì)算機(jī)應(yīng)用與軟件,2021,38(10):78-83.
[7]劉翀,杜軍平.一種基于深度LSTM和注意力機(jī)制的金融數(shù)據(jù)預(yù)測(cè)方法[J].計(jì)算機(jī)科學(xué),2020,47(12):125-130.
[8]周哲韜,劉路,宋曉,等.基于Transformer模型的滾動(dòng)軸承剩余使用壽命預(yù)測(cè)方法[J/OL].北京航空航天大學(xué)學(xué)報(bào):1-17.(2021-07-12).https://doi.org/10.13700/j.bh.1001-5965.2021.0247.
[9] 趙紅蕊,薛雷.基于LSTM-CNN-CBAM模型的股票預(yù)測(cè)研究 [J].計(jì)算機(jī)工程與應(yīng)用,2021,57(3):203-207.
作者簡(jiǎn)介:陳德洪(1995—),男,漢族,湖南永州人,碩士研究生在讀,研究方向:數(shù)據(jù)分析、智能信息處理;李長(zhǎng)云(1971-),男,漢族,湖南衡陽(yáng)人,教授,博士,研究方向:軟件理論、物聯(lián)網(wǎng)工程、人工智能。