摘要:針對地市煙草商業(yè)企業(yè)卷煙供應(yīng)及市場調(diào)控過程中,區(qū)域市場及客戶零售需求的預(yù)測不夠精準(zhǔn),自上而下貨源分配和客戶零售需求存在供需矛盾,運(yùn)用BP神經(jīng)網(wǎng)絡(luò)對客戶零售需求進(jìn)行預(yù)測。首先,確定影響卷煙零售的特征,并對各特征進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化處理;其次,運(yùn)用LM算法,使用Matlab軟件進(jìn)行模型訓(xùn)練得到BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型,模擬擬合效果達(dá)到0.92005;最后,通過獨(dú)立樣本對網(wǎng)絡(luò)進(jìn)行模擬預(yù)測。研究表明:使用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行卷煙零售需求預(yù)測的方法,在評估零售客戶經(jīng)營能力和區(qū)域市場的容量時有運(yùn)用價值,也能為科學(xué)規(guī)劃卷煙品牌、制定貨源供應(yīng)策略提供參考依據(jù)。
關(guān)鍵詞:卷煙零售;需求預(yù)測;BP神經(jīng)網(wǎng)絡(luò);LM方法
中圖分類號:F721文獻(xiàn)標(biāo)識碼:A文章編號:1005-6432(2024)25-0101-04
DOI:10.13939/j.cnki.zgsc.2024.25.026
1引言
卷煙營銷工作是煙草商業(yè)公司的一項重要經(jīng)營工作,是行業(yè)經(jīng)濟(jì)運(yùn)行穩(wěn)定的重要組成,是行業(yè)稅利貢獻(xiàn)的重要來源之一。近年來,各地各級商業(yè)公司做了大量探索,如2012年上海煙草在貨源投放上探索利用數(shù)據(jù)驅(qū)動加模型運(yùn)用,2015年漳州市煙草提出“五要素”調(diào)控法,2017年湖南煙草實行貨源投放上限調(diào)控,2017年大連市煙草探索基于機(jī)器學(xué)習(xí)的市場狀態(tài)調(diào)控方法[1],2018年浙江煙草推進(jìn)大數(shù)據(jù)和經(jīng)營活動的深度融合[2],2020年青島市煙草探索基于大數(shù)據(jù)驅(qū)動的精準(zhǔn)貨源投放模式研究[3],2021年鄧超、劉頌、王露笛等和青島市煙草探索了基于深度神經(jīng)網(wǎng)絡(luò)的卷煙智能投放模型[4],2023年貴陽市煙草探索基于人工智能的貨源投放模式[5]等。卷煙營銷領(lǐng)域?qū)?shù)據(jù)、數(shù)學(xué)方法的探索研究越來越廣泛,但這些探索基本是對整個市場的宏觀調(diào)控,關(guān)注卷煙市場的規(guī)范有序和供需平衡,著眼于單個零售客戶的需求研究較少。在此背景下,文章提出基于BP神經(jīng)網(wǎng)絡(luò)對客戶的卷煙零售需求進(jìn)行預(yù)測,為合理研判區(qū)域市場需求、科學(xué)制定營銷策略提供參考。
2利用神經(jīng)網(wǎng)絡(luò)預(yù)測卷煙零售需求的意義
由于卷煙商品的專賣專營性質(zhì)及計劃屬性,傳統(tǒng)卷煙貨源分配一般采用自上而下分解的方式,地市級煙草商業(yè)公司根據(jù)經(jīng)濟(jì)運(yùn)行目標(biāo)和市場調(diào)控需要,周期性將貨源按照客戶檔級逐級分解,卷煙零售客戶被動接受分配結(jié)果。在實際中,長期存在零售需求和貨源分配之間的供需矛盾。
傳統(tǒng)的需求預(yù)測方法包括定性預(yù)測或定量預(yù)測。定性預(yù)測的不科學(xué)性讓預(yù)測結(jié)果難以標(biāo)準(zhǔn)化,準(zhǔn)確性有待證實;定量預(yù)測是利用已有的歷史數(shù)據(jù),運(yùn)用數(shù)學(xué)方法進(jìn)行加工,揭示各變量之間的規(guī)律并做趨勢分析,在數(shù)學(xué)建模時需要對樣本進(jìn)行簡化,特別是面對樣本自變量增加、數(shù)據(jù)非線性和弱關(guān)聯(lián)性等情況,常規(guī)的定量分析受限明顯。
隨著信息技術(shù)的發(fā)展,人工智能中的深度學(xué)習(xí)技術(shù)飛速發(fā)展,其將特征工程完全自動化處理,在解決問題時體現(xiàn)出更好的性能。基于機(jī)器學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模擬人腦結(jié)構(gòu),通過網(wǎng)絡(luò)學(xué)習(xí)達(dá)到其輸出與期望輸出相符的結(jié)果,具有很強(qiáng)的自適應(yīng)、自學(xué)習(xí)和糾錯能力。使用大量的獨(dú)立樣本數(shù)據(jù)訓(xùn)練生成神經(jīng)網(wǎng)絡(luò)模型,通過單客戶的特征輸入預(yù)測其零售需求,用多客戶預(yù)測結(jié)果來評估區(qū)域市場的需求,進(jìn)而有針對性地制定營銷策略,精準(zhǔn)滿足客戶個性化需求,有效調(diào)控區(qū)域市場狀態(tài)。需求—供應(yīng)示意圖見圖1。
3運(yùn)用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練
3.1BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
BP(backpropagation)神經(jīng)網(wǎng)絡(luò)是由Rumelhart、Mcclelland等科學(xué)家于1986年提出,利用代價函數(shù)將誤差逆向傳播進(jìn)行訓(xùn)練的多層前饋網(wǎng)絡(luò),也稱為反向傳播神經(jīng)網(wǎng)絡(luò),在處理非線性問題時有獨(dú)特的優(yōu)勢。網(wǎng)絡(luò)由神經(jīng)元聯(lián)結(jié),將輸入加權(quán)求和,然后加上偏置量,經(jīng)激活函數(shù)后得到輸出。BP神經(jīng)網(wǎng)絡(luò)的輸入層、隱含層和輸出層的神經(jīng)元相互連接,各層神經(jīng)元相互獨(dú)立。當(dāng)達(dá)到預(yù)期誤差后則停止訓(xùn)練。
圖1需求—供應(yīng)示意
3.2算法選擇
3.2.1梯度下降法(gradientdescent)
BP神經(jīng)網(wǎng)絡(luò)的傳統(tǒng)訓(xùn)練方法利用的是梯度下降法,梯度下降法又叫最速梯度下降法,是一種致力于找到函數(shù)極值點的算法,其收斂方向始終朝著當(dāng)前梯度最大的方向。此方法算法簡潔,但收斂速度較慢,且當(dāng)梯度接近于0時,易導(dǎo)致提前終止訓(xùn)練。其迭代公式為:
xi+1=xi-λiSymbolQC@
f(xi)(1)
式中,λi為學(xué)習(xí)率。
如果設(shè)Δxi=-λiSymbolQC@
f(xi),則表示為:
xi+1=xi+Δxi(2)
3.2.2牛頓法(Newton’smethod)及高斯牛頓法(Gauss-Newton)
牛頓法的泰勒展開式為二階展開,在考慮每次收斂方向的同時兼顧下一次收斂方向是否為最大,收斂速度有效提升。其迭代公式為:
xi+1=xi-H-1(xi)SymbolQC@
f(xi)(3)
式中,H為二階導(dǎo)數(shù)組成的海森矩陣。
H=2f2x212fx1x2…2fx1xi2fx1x22f2x22…2fx2xi
2fx1xi2fxix2…2f2x2i(4)
在高維情況下,牛頓法的海森矩陣過于復(fù)雜,迭代難度大幅增加。在針對最小二乘法問題時,對海森矩陣進(jìn)行近似計算,即高斯牛頓法。
3.2.3LM(levenberg-marquardt)算法
LM算法是使用最廣泛的非線性最小二乘算法,適用于中等規(guī)模的BP神經(jīng)網(wǎng)絡(luò)。可將其視為梯度下降和高斯牛頓法的結(jié)合,同時具備兩者的優(yōu)點。LM算法在高斯牛頓法的基礎(chǔ)上進(jìn)行優(yōu)化,在求解過程中引入阻尼因子α,公式為:
xi+1=xi-(H+αI)-1SymbolQC@
f(xi)(5)
式中,I是單位矩陣。當(dāng)α較大時接近高斯牛頓法,當(dāng)α較小時接近梯度法。
3.2.4其他算法
貝葉斯正則化(bayesianregularization)算法通過在神經(jīng)網(wǎng)絡(luò)中添加懲罰項來限制網(wǎng)絡(luò)的復(fù)雜度,可以有效避免訓(xùn)練過程中的過擬合狀態(tài),提高模型的泛化能力。SCG算法是由Moller提出的標(biāo)準(zhǔn)BP神經(jīng)網(wǎng)絡(luò)的改進(jìn)算法,結(jié)合傳統(tǒng)梯度法和共軛梯度法,在收斂過程中將負(fù)梯度方向與上一次搜索方向結(jié)合起來,計算出新的搜索方向。
文章訓(xùn)練模型為中等規(guī)模,選用LM算法作為訓(xùn)練算法。
3.3激活函數(shù)選擇
激活函數(shù)將非線性特征引入網(wǎng)絡(luò),讓神經(jīng)可以逼近任何非線性函數(shù)。常見的激活函數(shù)有Sigmoid函數(shù)、tanh函數(shù)、relu函數(shù)、leaky-relu函數(shù)。其中,Sigmoid函數(shù)將輸入、輸出映射到(0,1),可能出現(xiàn)“梯度消失”,且計算量較2e5aabefe5acd22ee32e4c91712e9260a7fbf0c42c91116659810478406373bd大。relu函數(shù)可有效避免“梯度消失”的問題,計算相對較簡單,但會造成部分神經(jīng)元不能被激活,參數(shù)不能更新。
綜合考慮本研究模型規(guī)模和計算量,所用神經(jīng)元數(shù)量較少,需盡可能多的激活神經(jīng)元,使用Sigmoid函數(shù)作為激活函數(shù)。函數(shù)表達(dá)式如下:
Sigmoid=11+e-x(6)
3.4輸入層確認(rèn)
客戶的卷煙零售能力和很多因素相關(guān),一般來說,其所在區(qū)域的經(jīng)濟(jì)水平、人員密度、消費(fèi)能力和卷煙動銷密切相關(guān),客戶的經(jīng)營能力對卷煙零售影響較大,同時,對卷煙品牌的價位、品質(zhì)、知名度等有影響。
因此,本研究使用德爾菲法,選取了客戶屬性、卷煙品牌屬性和經(jīng)濟(jì)屬性三大類27個特征對數(shù)據(jù)序列進(jìn)行轉(zhuǎn)換處理。輸入層特征見表1。
3.5隱藏層和神經(jīng)元個數(shù)確認(rèn)
在BP神經(jīng)網(wǎng)絡(luò)中,隱藏層層數(shù)和神經(jīng)元個數(shù)很大程度地影響神經(jīng)網(wǎng)絡(luò)的性能。數(shù)據(jù)越復(fù)雜,所需隱藏層越多。層數(shù)越多,函數(shù)擬合能力越強(qiáng),但也可能造成過擬合或難以收斂。較少的神經(jīng)元可能導(dǎo)致欠擬合,反之可能導(dǎo)致過擬合。
神經(jīng)元數(shù)量確認(rèn)可參考經(jīng)驗公式:
Nh=Nsα×(Ni+No)(7)
式中,Ni是輸入層神經(jīng)元個數(shù);No是輸出層神經(jīng)元個數(shù);Ns是訓(xùn)練集樣本數(shù);α是自取調(diào)節(jié)變量,可在2~10之間取數(shù)。在實際訓(xùn)練過程中,神經(jīng)元的數(shù)量還要綜合考慮輸入層、輸出層大小,并需對隱藏層進(jìn)行微調(diào),如文章分別嘗試了各種隱藏層和神經(jīng)元數(shù)量組合。迭代次數(shù)和擬合效果R數(shù)據(jù)如表2所示。
其中,使用2層隱藏層,單層20個神經(jīng)元的網(wǎng)絡(luò)擬合效果R更接近1。
3.6數(shù)據(jù)標(biāo)準(zhǔn)化
輸入層每個特征由于性質(zhì)不同,其量綱和數(shù)量級不一致,水平差距較大。有些特征是0~100的浮點數(shù),如陳列面積特征;有些特征是相對較大的整數(shù),如可支配收入特征,最大值超過50000。
所以,需要對每個特征進(jìn)行標(biāo)準(zhǔn)化處理。常用的數(shù)據(jù)標(biāo)準(zhǔn)化方法有Min-Max標(biāo)準(zhǔn)化和Z-Score標(biāo)準(zhǔn)化。
Min-Max標(biāo)準(zhǔn)化通過對數(shù)據(jù)序列X進(jìn)行最大最小值變換,使序列映射到\[0,1\],形成新的序列y,轉(zhuǎn)換公式如下:
yi=xi-min(X)max(X)-min(X)(8)
Z-Score標(biāo)準(zhǔn)化方法適用于數(shù)據(jù)序列最大值和最小值未知,或有超出取值范圍的離群數(shù)據(jù)的情況。通過計算序列的均值μ和標(biāo)準(zhǔn)差σ后進(jìn)行處理,轉(zhuǎn)換公式如下:
yi=xi-μσ(9)
文章所使用的特征序列最大值和最小值都可求得,故采用Min-Max標(biāo)準(zhǔn)化進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化處理。
3.7訓(xùn)練模型
文章選取了12284個樣本用于訓(xùn)練模型,為了避免模型過擬合,將數(shù)據(jù)樣本按照70%、15%、15%分成訓(xùn)練集、驗證集和測試集三個集合,LM算法為訓(xùn)練算法,Sigmoid函數(shù)作為激活函數(shù),經(jīng)過測試后選擇2層隱藏層、單層20個神經(jīng)元,使用Matlab軟件進(jìn)行訓(xùn)練。在第14次迭代時,驗證集和測試集達(dá)到最小均方誤差,擬合系數(shù)R為0.92005,較接近于1,訓(xùn)練效果較好。
4獨(dú)立樣本預(yù)測測試
模型訓(xùn)練完成后,利用模型對100個獨(dú)立樣本進(jìn)行預(yù)測測試,經(jīng)過數(shù)據(jù)標(biāo)準(zhǔn)化處理后,輸出測試結(jié)果序列Z,并與樣本結(jié)果序列y進(jìn)行對比。為了進(jìn)一步檢驗用不同隱藏層數(shù)訓(xùn)練模型的情況,對不同隱藏層訓(xùn)練后進(jìn)行測試并對比,測試結(jié)果顯示2L-20N隱藏層誤差最小,訓(xùn)練的模型最佳。誤差情況如表3所示。
5結(jié)論
文章運(yùn)用BP神經(jīng)網(wǎng)絡(luò)較成功地預(yù)測了卷煙零售客戶個體對于單品牌的零售需求。實際工作中,對零售客戶的特征進(jìn)行錄入,即可使用模型分析出其對某個品牌的零售需求,對于評估零售客戶經(jīng)營能力和區(qū)域市場的容量有運(yùn)用價值,也能為科學(xué)規(guī)劃卷煙品牌、制定貨源供應(yīng)策略提供參考依據(jù)。
隨著行業(yè)數(shù)字化轉(zhuǎn)型的持續(xù)推進(jìn),樣本的特征數(shù)據(jù)將不斷豐富完善,卷煙銷售數(shù)據(jù)采集將更加全面、準(zhǔn)確,同時,在規(guī)范經(jīng)營的前提下,商零網(wǎng)配供應(yīng)方式的推廣使用將讓零售客戶的零售數(shù)據(jù)更加真實,文章使用的模型將得以進(jìn)一步優(yōu)化,預(yù)測將更加精準(zhǔn)。
下一個階段,需要探索使用Python+TensorFlow進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練及界面開發(fā),嘗試模型獨(dú)立運(yùn)行并與卷煙營銷系統(tǒng)數(shù)據(jù)外掛對接,實現(xiàn)自動取數(shù)、自動預(yù)測、自動調(diào)控。
參考文獻(xiàn):
[1]王棟.基于機(jī)器學(xué)習(xí)的市場狀態(tài)調(diào)控方法的研究和探索[C]//中國煙草學(xué)會.中國煙草學(xué)會學(xué)術(shù)年會優(yōu)秀論文集,2017:2641-2652.
[2]林少華,倪震海,周飛.數(shù)據(jù)驅(qū)動卷煙市場調(diào)控的探索與實踐[J].中國煙草學(xué)報,2019,25(4):93-100.
[3]劉頌,朱峰,王偉,等.基于大數(shù)據(jù)驅(qū)動的精準(zhǔn)貨源投放模式研究[J].現(xiàn)代商業(yè),2020(19):123-125.
[4]鄧超,劉頌,王露笛,等.基于深度神經(jīng)網(wǎng)絡(luò)的卷煙智能投放模型構(gòu)建方法[J].煙草科技,2021,54(2):78-83.
[5]宋普陽,何逸冰,張沛洋.基于人工智能的貨源投放模式研究——以貴陽市煙草公司實踐探索為例[J].現(xiàn)代商業(yè),2023(7):31-34.
[作者簡介]豐家輝(1981—),男,漢族,湖南邵陽人,高級營銷師,碩士,研究方向:機(jī)械設(shè)計及理論;陳亮(1981—),男,漢族,湖南湘潭人,本科,研究方向:經(jīng)濟(jì)學(xué)。