王志剛,馮云超,江勇
(湖南師范大學(xué)信息科學(xué)與工程學(xué)院,長(zhǎng)沙410081)
連鎖超市零售業(yè)是一個(gè)競(jìng)爭(zhēng)非常激烈的市場(chǎng),庫(kù)存控制能力是公司盈利的關(guān)鍵。因此,準(zhǔn)確的銷售預(yù)測(cè)是取得成功的基礎(chǔ)。否則可能會(huì)出現(xiàn)缺貨或庫(kù)存過剩等情況,直接影響公司的盈利[1]。這種影響并不局限于盈利性業(yè)績(jī),服務(wù)客戶的質(zhì)量也會(huì)受到低效預(yù)測(cè)系統(tǒng)的影響。例如,缺貨將導(dǎo)致客戶去其他零售商購(gòu)物。此外,連鎖超市行業(yè)的供應(yīng)鏈很長(zhǎng),涉及大量參與者(如原材料供應(yīng)商、制造商、分銷商和零售商),這導(dǎo)致在對(duì)產(chǎn)品的需求水平有一個(gè)準(zhǔn)確的了解之前就下了訂單。
盡管有相關(guān)性,但銷售預(yù)測(cè)是一個(gè)復(fù)雜的過程,因?yàn)楫a(chǎn)品的銷售高度依賴消費(fèi)者的個(gè)人品味,而消費(fèi)者的品味差異很大[2]。商品也是由大量不同尺寸的不同產(chǎn)品組成,對(duì)應(yīng)許多不同的庫(kù)存單位(SKUs)。此外,天氣條件、節(jié)假日、市場(chǎng)活動(dòng)、促銷和當(dāng)前的經(jīng)濟(jì)環(huán)境等外部因素也會(huì)對(duì)銷售產(chǎn)生直接影響[3]。
本案例研究旨在通過以下方式改善銷售預(yù)測(cè)問題:
(1)考慮新產(chǎn)品銷量和因素的大量變化,可以對(duì)未來的銷售產(chǎn)生很大的影響。而過往研究的模型通常只包含影響銷售的有限因素;
(2)評(píng)估深度神經(jīng)網(wǎng)絡(luò)(DNN)的性能,以在連鎖超市銷售預(yù)測(cè)上下文中執(zhí)行預(yù)測(cè)。雖然深度學(xué)習(xí)的應(yīng)用還處于起步階段,但值得進(jìn)一步探索。另外將DNN模型與淺層數(shù)據(jù)挖掘回歸技術(shù)的性能進(jìn)行比較,以便了解使用更先進(jìn)的方法是否可以顯著提高模型精度,或者更簡(jiǎn)單的方法是否可以獲得類似的結(jié)果;
(3)將領(lǐng)域?qū)<业囊庖姾彤a(chǎn)品的特性結(jié)合起來,作為預(yù)測(cè)變量的一部分。
為了探討連鎖超市零售額預(yù)測(cè)的問題,研究人員開發(fā)了幾種分析模型。在統(tǒng)計(jì)技術(shù)中,最常用的是基于時(shí)間序列的預(yù)測(cè)方法,如ARIMA、SARIMA、指數(shù)平滑、回歸等。
盡管統(tǒng)計(jì)方法很受歡迎,但仍存在一些局限性,例如需要將定性數(shù)據(jù)轉(zhuǎn)換為定量數(shù)據(jù)、需要匯總信息或時(shí)間序列數(shù)據(jù),而這在連鎖超市行業(yè)通常是不可用的,因?yàn)槠鋷?kù)存單位經(jīng)常被更換,銷售模式可能不規(guī)則[4]。模糊系統(tǒng)或數(shù)據(jù)挖掘模型已經(jīng)優(yōu)于統(tǒng)計(jì)方法。這些方法能夠處理大型數(shù)據(jù)集,并且可以處理數(shù)值和標(biāo)稱數(shù)據(jù)[5]??梢阅M銷售和歷史商品變量之間復(fù)雜的非線性關(guān)系,再將這些關(guān)系推廣到未來商品的銷售預(yù)測(cè)中[6]。在各種研究中都有令人滿意的結(jié)果,例如文獻(xiàn)[7]將神經(jīng)網(wǎng)絡(luò)與進(jìn)化計(jì)算相結(jié)合來支持一個(gè)預(yù)測(cè)系統(tǒng),其模型的性能優(yōu)于SARIMA模型,且適用于需求不確定性低、季節(jié)性趨勢(shì)較弱的短期零售預(yù)測(cè)。然而,很難在精確的結(jié)果和計(jì)算時(shí)間之間取得良好的折衷。
近年來,深度學(xué)習(xí)技術(shù)受到了廣泛關(guān)注?;谄潇`活性和顯著優(yōu)于其他數(shù)據(jù)挖掘方法的能力[8],該技術(shù)已被用于解決不同研究領(lǐng)域的實(shí)際問題,如圖像分類、語(yǔ)音識(shí)別和生物信息學(xué)[9]。深度學(xué)習(xí)技術(shù)在需求預(yù)測(cè)中的應(yīng)用也越來越多,諸如交通系統(tǒng)[10]、醫(yī)院管理和電力負(fù)荷等。然而,深度學(xué)習(xí)算法在零售業(yè)銷售預(yù)測(cè)中的應(yīng)用還處于起步階段。
盡管數(shù)據(jù)分析技術(shù)為改進(jìn)預(yù)測(cè)做出了不可否認(rèn)的貢獻(xiàn),基于其更高的客觀性和推理能力,來自領(lǐng)域?qū)<业囊庖姂?yīng)得到特別關(guān)注。一些研究將專家意見納入預(yù)測(cè)模型,強(qiáng)調(diào)了在預(yù)測(cè)需要調(diào)整的情況下,領(lǐng)域?qū)<移痍P(guān)鍵作用。這些調(diào)整可能是源于獲得的額外信息或存在特殊事件[11]。這些研究的一個(gè)共同點(diǎn)是,將專家的知識(shí)與數(shù)據(jù)分析工具相結(jié)合,而不是僅僅依賴其中一個(gè)工具,預(yù)測(cè)模型的性能會(huì)更好。然而,在連鎖超市零售的背景下,還沒有研究將產(chǎn)品特性和領(lǐng)域?qū)<业囊庖娮鳛轭A(yù)測(cè)變量來預(yù)測(cè)銷售額。
國(guó)內(nèi)對(duì)零售采購(gòu)決策做的研究工作不多,主要集中在供貨渠道、價(jià)格和盈利管理方面的研究。文獻(xiàn)[13]構(gòu)建了一個(gè)由平臺(tái)商和電商平臺(tái)構(gòu)成的混合銷售渠道決策模型,分析了不同權(quán)利結(jié)構(gòu)下制造商入駐的質(zhì)量條件、入駐前后對(duì)雙方的決策影響。文獻(xiàn)[14]研究了一個(gè)初入行業(yè)的生產(chǎn)型零售商,和一條由上下游競(jìng)爭(zhēng)零售商組成的成熟型供應(yīng)鏈,將市場(chǎng)需求不確定性進(jìn)行量化,將自制和外購(gòu)策略的定義具體化。探討了在兩種策略下,零售商的生產(chǎn)/訂貨量、供應(yīng)商的批發(fā)價(jià)和參與者的期望收益。
關(guān)于連鎖超市行業(yè)的預(yù)測(cè)研究一般是按產(chǎn)品類別進(jìn)行的,對(duì)單個(gè)庫(kù)存單位進(jìn)行銷售預(yù)測(cè)的研究也很少。這些研究工作的一個(gè)共同特點(diǎn)是考慮很少的變量來預(yù)測(cè)銷售額(通常不超過4個(gè)),并且都沒有考慮領(lǐng)域知識(shí)。
本文通過評(píng)估DNN在連鎖超市零售行業(yè)中進(jìn)行銷售預(yù)測(cè)的效率,同時(shí)考慮不同性質(zhì)的特性,如產(chǎn)品的物理特性、價(jià)格和代表領(lǐng)域知識(shí)的特性。
以一個(gè)在各地有近百家分店的連鎖超市公司作為研究案例。盡管這家公司的產(chǎn)品種類繁多,如雨傘、手表、帽子和箱包,但本研究分析的數(shù)據(jù)與2017年春夏(S17)和2018年春夏(S18)期間三百多種箱包的銷售有關(guān)。
數(shù)據(jù)有每個(gè)產(chǎn)品的歷史銷售數(shù)據(jù)及其物理特性、公司的物流和內(nèi)部組織方面,還包括領(lǐng)域?qū)<业囊庖姟K羞@些因素都被用來了解哪些特性使產(chǎn)品對(duì)客戶更有吸引力,從而幫助采購(gòu)部門更好地確定要訂購(gòu)的產(chǎn)品數(shù)量。
目前,公司訂購(gòu)的箱包數(shù)量依據(jù)三個(gè)因素:上一季和同一季節(jié)同類產(chǎn)品的銷售情況、采購(gòu)部人員的經(jīng)驗(yàn),以及開發(fā)人員和市場(chǎng)部從不同來源收集的未來趨勢(shì)信息。表1列出了收集的信息類型,對(duì)于每個(gè)變量,都指定了名稱、類型、含義以及可以采用的類別總數(shù)。
表1 變量及說明
變量分為產(chǎn)品特征(PC)、公司后勤與內(nèi)部組織(LIO)和領(lǐng)域?qū)<遥―E)三個(gè)類別。共10個(gè)變量描述產(chǎn)品的特性,價(jià)格和銷量是數(shù)值變量,其他是定性變量。
按規(guī)模及其銷售潛力將公司的門店分為四種類型(A、B、C或D),A類是指展示面積大、銷售潛力大的店,將接收為該季節(jié)采購(gòu)的全部產(chǎn)品。而銷售潛力較低的小型門店,可供選擇的產(chǎn)品種類將比較有限,分類為D。門店的這種分類用于定義每個(gè)商品的總訂購(gòu)量。為了推斷這一數(shù)量,根據(jù)以下方法創(chuàng)建了門店類型的聚集區(qū):D類門店將只提供可以在公司的所有門店展示的商品,而A類可以接收更特殊的產(chǎn)品,因?yàn)檫@些門店已經(jīng)證明了銷售這些產(chǎn)品的能力。因此,分類為DCBA的產(chǎn)品將在公司所有門店銷售,分類為A的產(chǎn)品僅在A類門店中銷售。預(yù)期水平變量與產(chǎn)品的銷售期望水平有關(guān),有四個(gè)可能的值:SB、M1、M2和M3,分別對(duì)應(yīng)銷售預(yù)期的最高值、正常、平均、較低,這種分類由市場(chǎng)、開發(fā)和采購(gòu)部門定義。因?yàn)轭悇e名稱不能傳達(dá)每個(gè)類別之間的差異,款型變量則可以根據(jù)季節(jié)趨勢(shì)將產(chǎn)品分為四類:時(shí)新、基本時(shí)新、普通和集中分發(fā);其中時(shí)新產(chǎn)品更接近當(dāng)季潮流;集中分發(fā)與普通類似,只是在所采用的分發(fā)策略上有所不同。這種分類還與產(chǎn)品在店內(nèi)銷售的周數(shù)有關(guān),時(shí)新產(chǎn)品在商店可以銷售4周,基本時(shí)新產(chǎn)品在6周內(nèi)可以買到,普通和集中分發(fā)類則可達(dá)8周。產(chǎn)品也根據(jù)其設(shè)計(jì)的目標(biāo)受眾進(jìn)行區(qū)分。例如被歸類為“青少年”的產(chǎn)品是為青少年設(shè)計(jì)的,而打算銷售給女性的產(chǎn)品則被歸類為“女性”。這種分類是市場(chǎng)部工作人員對(duì)年齡或性別的看法,目標(biāo)受眾會(huì)對(duì)特定產(chǎn)品表現(xiàn)出更大興趣。
期望水平、門店、款型和區(qū)分這四個(gè)分類都是由公司的專業(yè)人員生成,它們代表了領(lǐng)域知識(shí)。這些變量被作為附加值整合到預(yù)測(cè)模型中。
雖然沒有每個(gè)季節(jié)新推出產(chǎn)品的歷史銷售數(shù)據(jù),但公司擁有以前產(chǎn)品的銷售信息,并完全了解歷史和新產(chǎn)品的特點(diǎn)。因此,可以根據(jù)歷史商品的銷售情況和新舊商品的特點(diǎn),探索兩者的相似性,從而實(shí)現(xiàn)對(duì)未來商品銷售的預(yù)測(cè)。為此,提出探索不同的回歸數(shù)據(jù)挖掘技術(shù)來開發(fā)新產(chǎn)品銷售預(yù)測(cè)模型。
在模型的學(xué)習(xí)過程中,使用了同一季節(jié)產(chǎn)品的歷史銷售數(shù)據(jù)。如圖1所示,在數(shù)據(jù)預(yù)處理步驟之后,根據(jù)觀測(cè)所屬季節(jié)將初始數(shù)據(jù)集分成兩個(gè)子集。有關(guān)S17季節(jié)的信息是訓(xùn)練過程的基礎(chǔ),該過程對(duì)應(yīng)一個(gè)由300多個(gè)商品組成的數(shù)據(jù)集,其中有可用的歷史數(shù)據(jù)。S18季節(jié)對(duì)應(yīng)的數(shù)據(jù)用于對(duì)模型進(jìn)行性能評(píng)估,即總共300來個(gè)未來商品。必須強(qiáng)調(diào)的是,產(chǎn)品不會(huì)從一個(gè)季節(jié)過渡到下一個(gè)相應(yīng)的季節(jié),這意味著兩個(gè)不同季節(jié)之間的產(chǎn)品沒有重疊。
在S17和S18記錄的庫(kù)存單位銷售總量中,大部分產(chǎn)品的銷售記錄在2000至6000件之間,大約相當(dāng)于構(gòu)成各自收集的庫(kù)存單位總數(shù)的80%左右。也可以得出這樣的結(jié)論,少數(shù)庫(kù)存單位的銷量超過了剩余產(chǎn)品的銷量。銷量超過14000件的可以被認(rèn)為是優(yōu)秀產(chǎn)品。
圖1 流程示意圖
預(yù)測(cè)模型的構(gòu)建有三個(gè)相互聯(lián)系的重要步驟,即改進(jìn)模型的學(xué)習(xí)過程和創(chuàng)建更精確的預(yù)測(cè)工具。這些步驟是:應(yīng)用貪婪方法選擇模型中的預(yù)測(cè)變量,對(duì)所涉及的參數(shù)進(jìn)行優(yōu)化,并對(duì)模型進(jìn)行測(cè)試。圖2描述了算法的結(jié)構(gòu),下面將介紹這些步驟以及在模型開發(fā)過程中的鏈接方式。
圖2 算法結(jié)構(gòu)
該過程的目的是首先確定變量和參數(shù)的選擇,它們僅使用歷史數(shù)據(jù)就可以得到更好的模型,然后,在對(duì)未來和未知信息進(jìn)行測(cè)試時(shí),評(píng)估所獲得的最佳模型的性能。
為此,應(yīng)用K=10的K-fold交叉驗(yàn)證將初始訓(xùn)練數(shù)據(jù)集劃分為K個(gè)折。通過多次重復(fù)訓(xùn)練與驗(yàn)證過程(與定義的折數(shù)相同)來找到最佳的參數(shù)和預(yù)測(cè)器組合。
為了選擇模型中預(yù)測(cè)變量的最佳組合,采用貪婪特征選擇方法在每個(gè)階段進(jìn)行局部最優(yōu)選擇。這一過程將因變量分別與每個(gè)自變量相關(guān)聯(lián),也就是說,開始考慮僅用一個(gè)獨(dú)立變量獲得的所有可能的組合(總共有10種可能性)。對(duì)于每一個(gè)組合參數(shù)都進(jìn)行優(yōu)化,其中包括在驗(yàn)證數(shù)據(jù)集上的模型測(cè)試過程。對(duì)所分析的參數(shù)定義值進(jìn)行暴力網(wǎng)格搜索。每一參數(shù)組合的決定系數(shù)R是模型評(píng)估過程中獲得的10個(gè)R值的平均值。每個(gè)變量組合的最佳參數(shù)組合被選為使R平均值最大化的參數(shù)組合。類似地,在所有可能的變量組合中,選擇能使平均R達(dá)到最高值的組合。
然后將能夠達(dá)到最高平均值R的單個(gè)預(yù)測(cè)值與其余預(yù)測(cè)值相結(jié)合。重復(fù)這個(gè)過程,直到平均R值沒有改善,這意味著加入一個(gè)額外的預(yù)測(cè)值(不管是哪個(gè)預(yù)測(cè)值)并不能改善模型估計(jì)的預(yù)測(cè)值和觀察到的銷售值之間的R。然后,將預(yù)測(cè)因子和一組參數(shù)組合起來,得到最佳的績(jī)效模型,用于構(gòu)建預(yù)測(cè)未來銷售的模型。
最終模型的性能評(píng)估過程遵循自舉方法,并由以下步驟重復(fù)十次組成:通過重新定位原始S17和S18數(shù)據(jù)集,創(chuàng)建訓(xùn)練和測(cè)試數(shù)據(jù)集(與原始數(shù)據(jù)集大小相同),開發(fā)預(yù)測(cè)模型、測(cè)試數(shù)據(jù)集預(yù)測(cè)值的確定、R的計(jì)算以及預(yù)測(cè)值和測(cè)試數(shù)據(jù)集之間的剩余性能度量值。
由于在預(yù)測(cè)模型的構(gòu)建和測(cè)試中采用了這種重復(fù)采樣過程,模型的魯棒性提高了,并避免了過度擬合。計(jì)算均方根和均方根誤差等評(píng)價(jià)指標(biāo)來衡量最終預(yù)測(cè)模型的性能。模型性能指標(biāo)的最終值被確定為十次迭代的平均值。
此外,為了比較深度學(xué)習(xí)技術(shù)與淺層技術(shù)的性能,還采用了線性回歸方法。所采用的一些數(shù)據(jù)挖掘技術(shù)需要定義一組可以調(diào)整的參數(shù),以便確定每個(gè)參數(shù)的值,從而提高預(yù)測(cè)模型的效率。
總的來說,結(jié)果表明模型可以作為有效的工具來預(yù)測(cè)銷售,并幫助定義連鎖超市行業(yè)的訂貨和營(yíng)銷策略,但管理者必須充分意識(shí)到與使用這些模型相關(guān)的一些特殊之處。
另外,管理者需要了解與可用的不同類型模型相關(guān)的復(fù)雜性,以及所需的不同資源。例如,DNN可以在大型和小型數(shù)據(jù)集上成功運(yùn)行,但在實(shí)踐中,由于需要復(fù)雜的訓(xùn)練過程,這種技術(shù)可能難以實(shí)現(xiàn)。在許多情況下,更簡(jiǎn)單的技術(shù)如RF也能取得良好的結(jié)果,也是最具成本效益的方法。
基于專家在確定潛在銷售方面所起的重要作用,管理者必須確保其員工充分了解市場(chǎng)及其需求,并在決策過程中整合他們的知識(shí)。值得注意的是,連鎖超市零售市場(chǎng)的一個(gè)公認(rèn)特征是高度依賴顧客的偏好,這種偏好非常不穩(wěn)定。因此,決定使用這類模型來協(xié)助其決策過程時(shí),管理者必須每年用新信息對(duì)模型進(jìn)行再培訓(xùn),因?yàn)檫@一步驟能使模型捕捉客戶的最新偏好。
本文論述了一個(gè)預(yù)測(cè)模型的研發(fā),以估計(jì)未來的產(chǎn)品銷售。探討了使用深度學(xué)習(xí)方法實(shí)現(xiàn)這一目標(biāo)的潛力。使用了一家在連鎖超市零售市場(chǎng)經(jīng)營(yíng)的公司提供的銷售數(shù)據(jù)。數(shù)據(jù)集包括以前收集的產(chǎn)品銷售信息,以及描述以前和未來產(chǎn)品的預(yù)測(cè)變量。
雖然這項(xiàng)工作的重點(diǎn)是連鎖超市零售業(yè),但所提出的模型也可應(yīng)用于其他零售業(yè)領(lǐng)域,因?yàn)閱栴}的特點(diǎn)通常是相似的。