□文/李云鶴 歐陽誠軍 周 虹 費(fèi)鐵橋
(湖南省煙草公司郴州市公司 湖南·郴州)
[提要] 市場(chǎng)經(jīng)濟(jì)下,消費(fèi)者作為關(guān)鍵性的“最后一公里”,在卷煙生產(chǎn)和流通中的重要性日益凸顯。本文建立以消費(fèi)信息采集、消費(fèi)記錄管理、消費(fèi)會(huì)員管理、消費(fèi)數(shù)據(jù)綜合分析的卷煙消費(fèi)跟蹤體系,利用統(tǒng)計(jì)學(xué)中的K-means聚類算法劃分不同的消費(fèi)群體,從多個(gè)維度構(gòu)建消費(fèi)者畫像,通過LSTM算法預(yù)測(cè)卷煙消費(fèi)變化趨勢(shì),有針對(duì)性地為不同群體設(shè)計(jì)不同的營銷活動(dòng),并根據(jù)消費(fèi)者需求反向指導(dǎo)貨源投放和品牌培育,基于行業(yè)特殊性,將消費(fèi)者的聚集特征投射到零售戶層面,分析研究卷煙消費(fèi)群體及市場(chǎng)變化趨勢(shì),提升宏觀運(yùn)行調(diào)控、貨源投放、品牌培育、客戶指導(dǎo)的精準(zhǔn)性。
(一)研究背景。目前,由于行業(yè)的特殊性,煙草企業(yè)在消費(fèi)者信息收集和研究方面仍處在初期探索階段,缺乏深層次的分析。采用數(shù)據(jù)挖掘方法進(jìn)行數(shù)據(jù)挖掘,可以為煙草行業(yè)提供更有效的客戶關(guān)系管理方法,從大量雜亂的數(shù)據(jù)中提取到有效信息,掌握市場(chǎng)變化和趨勢(shì),了解消費(fèi)者需要,為客戶提供高質(zhì)量的經(jīng)營指導(dǎo)。對(duì)此,本文將以消費(fèi)者數(shù)據(jù)分析為起點(diǎn)展開消費(fèi)行為追蹤,構(gòu)建消費(fèi)者細(xì)分模型,完善消費(fèi)者需求預(yù)測(cè)模型,實(shí)現(xiàn)零售戶精準(zhǔn)定位,為工商企業(yè)開展品牌培育、貨源精準(zhǔn)投放、零售客戶終端建設(shè)及面向消費(fèi)者的精準(zhǔn)營銷提供數(shù)據(jù)支撐。
(二)研究意義
1、從宏觀運(yùn)行情況來看,明悉市場(chǎng)變化是當(dāng)前環(huán)境下煙草行業(yè)的必修課。處在大環(huán)境中的煙草行業(yè)在卷煙消費(fèi)領(lǐng)域面臨著不確定性和多樣性,需要更好地把握消費(fèi)變化。通過科學(xué)的統(tǒng)計(jì)研究方法,卷煙消費(fèi)傾向理論上是可以被計(jì)算和預(yù)測(cè)的,可以作為制定產(chǎn)業(yè)發(fā)展戰(zhàn)略和卷煙消費(fèi)政策的依據(jù)。
2、從企業(yè)發(fā)展來看,掌握消費(fèi)趨勢(shì)是煙草公司發(fā)展需要。市場(chǎng)經(jīng)濟(jì)下,企業(yè)逐漸把更多的目光投向了消費(fèi)者,消費(fèi)者數(shù)據(jù)分析幫助零售戶精準(zhǔn)識(shí)別客戶價(jià)值,通過對(duì)客戶貢獻(xiàn)度的鑒別與篩選,識(shí)別不同層次、不同需求、不同消費(fèi)習(xí)慣的客戶群。
3、從品牌價(jià)值來看,把握消費(fèi)偏好是煙草宣傳的基礎(chǔ)保障。煙草行業(yè)受行業(yè)特殊性影響,在傳播和廣告宣傳有嚴(yán)格的法律限制,消費(fèi)偏好分析可幫助企業(yè)找準(zhǔn)目標(biāo)消費(fèi)者,精準(zhǔn)進(jìn)行品牌投放。
(一)K-means聚類算法。本文采用基于K均值的K-means算法,劃分出消費(fèi)者群,并對(duì)每個(gè)群體賦予業(yè)務(wù)意義。
K-means算法的具體步驟:
輸入:聚類數(shù) k 和數(shù)據(jù)集 X={x1,x2,…,xn}。
輸出:k 個(gè)簇{S1,S2,…,Sk}。
方法:
(1)從數(shù)據(jù)集中隨機(jī)選定k個(gè)對(duì)象作為初始聚類中心c1,c2,…,ck。
(2)逐個(gè)將對(duì)象xi(i=1,2,…,n)按歐式距離分配給距離最近的一個(gè)聚類中心:
(4)若聚類中心不再變化,目標(biāo)函數(shù)最小,算法終止,否則重復(fù)步驟(2)~(3)。
(二)長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM)。LSTM能夠?qū)崿F(xiàn)長(zhǎng)序列數(shù)據(jù)的處理與學(xué)習(xí)。在時(shí)序數(shù)列處理中,需求預(yù)測(cè)等領(lǐng)域有不可替代的作用。本文采用的長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。(圖1)
圖1 長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)LSTM結(jié)構(gòu)圖
長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)的每個(gè)LSTM單元包含了遺忘門f(forget)、輸入門 i(input)、輸出門 o(output)以及細(xì)胞狀態(tài) C(cell state)和激活函數(shù)σ,遺忘門的計(jì)算公式如下:
輸出門的計(jì)算公式如下:
本文提出了一種卷煙消費(fèi)定向跟蹤模型,對(duì)消費(fèi)者會(huì)員、消費(fèi)記錄、零售戶信息、卷煙信息等數(shù)據(jù)進(jìn)行聯(lián)合分析,利用K-means聚類算法劃分不同的消費(fèi)群體,并從業(yè)務(wù)角度賦予其實(shí)際意義,通過LSTM算法預(yù)測(cè)卷煙消費(fèi)變化趨勢(shì),模型構(gòu)建流程如圖2所示。(圖2)
圖2 卷煙消費(fèi)定向跟蹤模型流程圖
(一)樣本來源及分類。本文整理了某市煙草公司2020年6月份至2021年6月份的銷售數(shù)據(jù),全市共發(fā)展87,276名消費(fèi)者會(huì)員,產(chǎn)生200多萬條全商品數(shù)據(jù),初步篩選并剔除異常數(shù)據(jù)后,最終將4,000多名消費(fèi)者會(huì)員,共2萬多條消費(fèi)者數(shù)據(jù)作為研究數(shù)據(jù)集,如表1所示。(表1)
表1 樣本類別及內(nèi)容一覽表
(二)消費(fèi)者細(xì)分
1、數(shù)據(jù)采集與預(yù)處理。將含有空值、異常值,同時(shí)掃碼集中度較高的消費(fèi)者數(shù)據(jù)剔除。
2、構(gòu)建基于RFMLM的消費(fèi)者細(xì)分模型。在對(duì)消費(fèi)者進(jìn)行聚類分析時(shí),建立客戶價(jià)值分類模型(RFM)對(duì)消費(fèi)者標(biāo)簽進(jìn)行聚類細(xì)分,由于在引入新品時(shí)消費(fèi)者對(duì)品牌的忠誠度及對(duì)新品的購買能力也是企業(yè)十分關(guān)心的,因此將品牌忠誠度(Loyalty)和新品喜好度(News)也納入分類指標(biāo),組成消費(fèi)者細(xì)分模型的五項(xiàng)核心指標(biāo),由此確定不同的消費(fèi)者群體對(duì)該企業(yè)的價(jià)值。(表2)
表2 消費(fèi)者細(xì)分模型核心指標(biāo)一覽表
本文通過對(duì)活躍度R、忠誠度F、消費(fèi)能力M、品牌忠誠度L、新品喜好度N這五項(xiàng)核心指標(biāo)進(jìn)行K-means聚類分析來構(gòu)建消費(fèi)者細(xì)分模型RFMLM。
3、模型分析。K-means算法在計(jì)算時(shí)必須事先給出K的個(gè)數(shù)才能進(jìn)行計(jì)算,將聚類范圍定在K=3~5,分別計(jì)算其性能,最終得到在K=5時(shí)可達(dá)到最佳性能。(表3)
表3 聚類效果比較一覽表
依據(jù)消費(fèi)群特征指標(biāo)數(shù)據(jù),采用K-means算法對(duì)消費(fèi)者進(jìn)行分群,結(jié)合指標(biāo)權(quán)重對(duì)每個(gè)消費(fèi)群的特征進(jìn)行評(píng)分,如表4所示。(表4)
表4 消費(fèi)者細(xì)分模型特征得分一覽表
按照聚類結(jié)果,結(jié)合業(yè)務(wù)實(shí)際進(jìn)行消費(fèi)群分析,聚類結(jié)果分為五類。(圖3)
圖3 消費(fèi)群特征分析圖
(1)消費(fèi)群1:F和L較大,R較低,說明這類客戶最近剛剛消費(fèi)過且近一年內(nèi)消費(fèi)頻次很高,且愿意嘗試不同品規(guī),屬于重要保持客戶。
(2)消費(fèi)群2:R、F、M均較低,但N較高,說明這類客戶消費(fèi)能力一般,但活躍度較高,對(duì)新品的接受能力較強(qiáng),屬于重要發(fā)展客戶。
(3)消費(fèi)群 3:R最大,F(xiàn)、M、N均較低,說明離上次消費(fèi)已經(jīng)很久了,且消費(fèi)頻次和消費(fèi)金額較低,屬于低價(jià)值用戶。
(4)消費(fèi)群 4:M 最大,R、L、F較低,說明這類客戶消費(fèi)能力較強(qiáng),但還處于品牌選擇期,屬于十分活躍但不夠忠誠的客戶,可通過品牌培育提升忠誠度,屬于重要挽留客戶。
(5)消費(fèi)群 5:N 較高,R、F、M、L 均一般,可能在新品推廣時(shí)愿意消費(fèi),屬于一般客戶。
4、消費(fèi)者價(jià)值排名。根據(jù)消費(fèi)者細(xì)分模型特征得分結(jié)果,結(jié)合公司實(shí)際需要對(duì)消費(fèi)群的價(jià)值進(jìn)行排名,并對(duì)不同的消費(fèi)群體制定個(gè)性化的營銷策略。(表5)
表5 聚類效果比較一覽表
(1)消費(fèi)群1為“重要保持顧客”,這類顧客對(duì)企業(yè)貢獻(xiàn)度最高,應(yīng)盡可能延長(zhǎng)這類顧客的高消費(fèi)水平,將貨源優(yōu)先考慮投放到此類顧客,提供優(yōu)質(zhì)服務(wù),提高客戶滿意度。
(2)消費(fèi)群2為“重要發(fā)展顧客”,這類顧客價(jià)值貢獻(xiàn)度低于重要保持顧客,但發(fā)展?jié)摿^大,是企業(yè)的潛在價(jià)值顧客,需要努力促使增加他們的消費(fèi)。
(3)消費(fèi)群4為“重要挽留顧客”,這類顧客對(duì)企業(yè)的價(jià)值貢獻(xiàn)具有不確定性,應(yīng)采取必要的營銷手段,多開展相關(guān)活動(dòng)推廣以提升品牌認(rèn)同感,同時(shí)投其所好延長(zhǎng)顧客的生命周期。
(4)消費(fèi)群5和消費(fèi)群3分別為“一般顧客”和“低價(jià)值顧客”,這類顧客對(duì)企業(yè)的貢獻(xiàn)度一般,以保證留存為主,并適時(shí)地推薦一些稍高于現(xiàn)有消費(fèi)水平的品規(guī),引導(dǎo)其消費(fèi)升級(jí)。
通過對(duì)基于RFMLM的消費(fèi)者細(xì)分模型的分析,可得到五類消費(fèi)群的價(jià)值排名,從分析中得出重要保持顧客、重要發(fā)展顧客、重要挽留顧客是最具價(jià)值的前三名客戶類型,需要提升重要發(fā)展顧客的價(jià)值、穩(wěn)定和延長(zhǎng)重要保持顧客的高水平消費(fèi)、對(duì)重要挽留顧客積極進(jìn)行關(guān)系恢復(fù),并策劃相應(yīng)的營銷策略加強(qiáng)鞏固顧客關(guān)系。
(三)消費(fèi)者需求預(yù)測(cè)。對(duì)于重要保持顧客、重要發(fā)展顧客、重要挽留顧客進(jìn)行需求預(yù)測(cè),利用LSTM模型判斷消費(fèi)者購煙趨勢(shì)變化情況,從而對(duì)重要顧客進(jìn)行針對(duì)性的投放,指導(dǎo)貨源購進(jìn)。以郴州市某煙酒店為例,對(duì)其店鋪的銷售數(shù)據(jù)進(jìn)行建模,融合多維度信息進(jìn)行特征提取,將研究樣本分為3個(gè)維度,9個(gè)指標(biāo)構(gòu)建消費(fèi)者特征因子。對(duì)特征因子進(jìn)行多元分析,找到特征與銷售額之間的相關(guān)關(guān)系,分析結(jié)果如圖4所示。(圖4)
圖4 多元分析相關(guān)系數(shù)矩陣熱圖
本文計(jì)算了9個(gè)指標(biāo)的皮爾遜相關(guān)系數(shù),從圖4中可以得到,銷售額與消費(fèi)者會(huì)員的學(xué)歷、收入相關(guān)性較大,所以本文將學(xué)歷均值、收入均值納入模型的輸入特征,同時(shí)加入前一天、前一周及前365天即上年同期數(shù)據(jù)作為未來消費(fèi)者需求預(yù)測(cè)的特征,模型結(jié)構(gòu)如圖5所示。(圖5)
圖5 消費(fèi)者需求預(yù)測(cè)模型結(jié)構(gòu)圖
在對(duì)模型進(jìn)行訓(xùn)練時(shí),首先輸入特征進(jìn)行歸一化,確保實(shí)驗(yàn)結(jié)果的有效性。本文采用Min-max歸一化方法,將取值范圍控制在[0,1]之間,公式如下:
其中,x代表維度特征,xmax代表最大值,xmin代表最小值。
本文訓(xùn)練時(shí)所用代碼語言為Python 3.6,網(wǎng)絡(luò)模型搭建基于開源人工神經(jīng)網(wǎng)絡(luò)庫Keras實(shí)現(xiàn)。模型訓(xùn)練過程中使用Adam算法進(jìn)行優(yōu)化,訓(xùn)練參數(shù)epochs=500,batch_size=20。利用該模型對(duì)郴州市某煙酒店作為期一周的銷量預(yù)測(cè),擬合結(jié)果見圖 6,將均方誤差(MAE)、擬合優(yōu)度(r2)、平均百分比誤差(MAPE)、測(cè)試數(shù)據(jù)均值(AVG)作為評(píng)價(jià)指標(biāo),計(jì)算結(jié)果如表6所示。(圖 6、表 6)
表6 模型評(píng)價(jià)結(jié)果一覽表
圖6 消費(fèi)者需求預(yù)測(cè)模型結(jié)構(gòu)圖
由表6可以看出,MAE值為11.04,即預(yù)測(cè)銷售額與實(shí)際銷售額的誤差約為11元,r2代表擬合優(yōu)度,值越接近1,表示回歸直線對(duì)觀測(cè)值的擬合程度越好,整體來說,本文提出的消費(fèi)者需求預(yù)測(cè)模型可以較好地預(yù)測(cè)出零售戶一周內(nèi)的銷售額,對(duì)零售戶的貨源購進(jìn)起到一定的輔助作用,同時(shí)及時(shí)觀察消費(fèi)價(jià)類的切換,用于指導(dǎo)品牌培育及貨源投放。
基于行業(yè)的特殊性,把對(duì)消費(fèi)者的分析結(jié)果,精準(zhǔn)落實(shí)到零售戶群體,由零售戶完成傳導(dǎo)輸出。將消費(fèi)者和零售戶相匹配,每一次購買行為,每個(gè)消費(fèi)者最多從屬于一個(gè)零售客戶,在進(jìn)行新品引入時(shí),對(duì)于目標(biāo)卷煙產(chǎn)品,根據(jù)產(chǎn)品特征和消費(fèi)者特征推薦合適的零售門店,從而將卷煙精準(zhǔn)投放到這些門店。
模型在品牌各個(gè)生命周期的應(yīng)用,如表7所示。(表7)
表7 品牌生命周期應(yīng)用一覽表
在新品上市前,分析新投放規(guī)格的產(chǎn)品特征,通過余弦相似度計(jì)算出與其最接近的m款卷煙產(chǎn)品,對(duì)購買這m個(gè)產(chǎn)品的消費(fèi)者匯總分析,找出這些消費(fèi)者消費(fèi)過的銷量排名前n位的零售店,按照銷量比例進(jìn)行投放。在較少的貨源投放下,使盡可能多的潛在消費(fèi)者能夠購買到新品。
在新品上市N周后,根據(jù)上市后的新品實(shí)際消費(fèi)數(shù)據(jù)找到消費(fèi)轉(zhuǎn)移信息,重新匹配最接近的N的產(chǎn)品,找到最暢銷的零售戶進(jìn)行投放。在導(dǎo)入期,精準(zhǔn)投放的意義在于建立零售戶的經(jīng)營信心,通過意見領(lǐng)袖傳播新品上市信息和樹立品牌形象。當(dāng)新品進(jìn)入市場(chǎng)一段時(shí)間后,根據(jù)消費(fèi)趨勢(shì)分析發(fā)現(xiàn)投放戶數(shù)和投放量無法滿足市場(chǎng)需求時(shí),嘗試進(jìn)行增加投放點(diǎn),并開展實(shí)地的品牌宣講和推廣活動(dòng),宣講地點(diǎn)和時(shí)間可根據(jù)數(shù)據(jù)分析精準(zhǔn)定位。
在產(chǎn)品進(jìn)入成熟期后,觀察消費(fèi)轉(zhuǎn)移情況,是否因?yàn)楦?jìng)品的進(jìn)入、外部卷煙流入、宏觀經(jīng)濟(jì)的變化等因素導(dǎo)致消費(fèi)減少。
當(dāng)產(chǎn)品出現(xiàn)連續(xù)消費(fèi)低迷的情況時(shí)可建議退出目錄,聯(lián)系工業(yè)公司進(jìn)行規(guī)格替換。
本文建立了以消費(fèi)信息采集、消費(fèi)記錄管理、消費(fèi)會(huì)員管理、消費(fèi)數(shù)據(jù)綜合分析的卷煙消費(fèi)跟蹤體系,以2020年6月至2021年6月的多維數(shù)據(jù)為樣本,利用統(tǒng)計(jì)學(xué)中的RFM模型及K-means聚類算法劃分不同的消費(fèi)群體,通過LSTM算法預(yù)測(cè)重要顧客卷煙消費(fèi)變化趨勢(shì),當(dāng)發(fā)現(xiàn)有消費(fèi)下降或上升趨勢(shì)時(shí),積極開展?fàn)I銷活動(dòng)。
隨著煙草行業(yè)市場(chǎng)化改革,卷煙營銷變得更加透明,下一步將繼續(xù)探究卷煙營銷與零售戶和消費(fèi)者的關(guān)系,根據(jù)消費(fèi)者需求反向指導(dǎo)貨源投放,將消費(fèi)者的聚集特征投射到零售戶找到目標(biāo)消費(fèi)者集聚的目標(biāo)零售戶,分析研究卷煙消費(fèi)群體及市場(chǎng)變化趨勢(shì),找準(zhǔn)市場(chǎng)方向,實(shí)現(xiàn)工商零消共贏的良好生態(tài)。