代金輝,王夢恩,仲璇
(山東工商學院 統(tǒng)計學院,山東 煙臺 264005)
近年來,電商行業(yè)呈現(xiàn)出飛速發(fā)展的態(tài)勢.隨著網絡技術的發(fā)展,網絡購物越來越成為全球居民消費的重要渠道.2019年全球網絡的零售額占比14%,達3.5萬億美元.據(jù)有關研究顯示,2022年全球電商銷售額將繼續(xù)穩(wěn)步增長,預計增長12%,首次突破5萬億美元,達5.54萬億美元.2023年全球網絡零售額的比重將增加到22%,最終可達6.5萬億美元.由此可見,電子商務將逐漸成為各國國民經濟發(fā)展的重要力量.基于此,客戶在購物時產生的交易數(shù)據(jù)蘊藏著巨大的價值信息,電子商務平臺應該對銷售數(shù)據(jù)進行深入挖掘合理利用.
大數(shù)據(jù)背景下,眾多研究提出應當積極利用大數(shù)據(jù)技術對商務數(shù)據(jù)進行提取、整理、挖掘進行整合分析[1].如對商品價值、用戶行為進行分析,進一步了解客戶購買需求與喜好,優(yōu)化企業(yè)運營、營銷模式.對不同的消費者進行差異化營銷,實現(xiàn)客戶的個性化服務,最終提高運營的效率、電商平臺的競爭力[2-4].
從目前已有的研究來看,對電商銷售數(shù)據(jù)的分析主要體現(xiàn)在3個方面:一是采用可視化分析的手段,對銷售數(shù)據(jù)進行分析,費千笑采用數(shù)據(jù)可視化方法,從時間維度、用戶行為與商品分析方面進行研究[5];二是利用RFM模型、K-means聚類算法對客戶進行細分,賈桂霞和陳東清構建客戶分層模型并提出差異化的客戶營銷策略[6-7];三是根據(jù)客戶購買記錄實現(xiàn)商品個性化推薦,多為推薦方法研究,張鵬飛對客戶的行為數(shù)據(jù)進行分析,實現(xiàn)對客戶的商品推薦[8].
綜上,已有研究多從某一方面對數(shù)據(jù)進行分析,缺乏完整的數(shù)據(jù)分析體系.本文創(chuàng)新性地從商品價值、客戶價值以及客戶與商品購買關系3個角度,設計數(shù)據(jù)分析、特征提取的流程,根據(jù)帕累托法則,設計分析篩選高價值客戶的流程與方法,根據(jù)客戶的購買歷史設計商品推薦算法,從而系統(tǒng)地對電商平臺訂單進行數(shù)據(jù)分析,幫助商家從網絡運營數(shù)據(jù)中挖掘有效的消費信息,更好地提高客戶忠誠度、穩(wěn)定客流,不斷調整運營方向,提高行業(yè)競爭力.
K-means算法是相對比較簡單的一種迭代型聚類算法[9],并將距離作為相似性指標,因此可以發(fā)現(xiàn)所給數(shù)據(jù)集中的K個類,且每一個類的中心是可以通過計算類中所有數(shù)值的均值得到,每個類的中心用聚類中心來描述.
RFM分析是一種將客戶分層,進而針對不同客戶群體進行精細化運營的方法[10-11].RFM模型從消費時間間隔(Recency)、消費頻率(Frequency)和消費金額(Monetary)3個指標對客戶的價值進行評估.針對每個維度設定一個閾值,將每個維度劃分為二,即高于閾值和低于閾值,三個維度將客戶整體劃分為23=8個客戶細分群.
客戶細分情況如圖1所示,根據(jù)R、F、M的高低將客戶群體劃分為重要價值客戶、重要發(fā)展客戶等8類客戶[12].
圖1 客戶細分圖
協(xié)同過濾算法又稱社會過濾[13],被廣泛用于推薦系統(tǒng)的設計,從海量的用戶中挖掘信息,根據(jù)用戶歷史行為數(shù)據(jù)中挖掘出用戶的喜好偏向,對用戶可能喜好的產品進行預測、推薦.協(xié)同濾波的實現(xiàn):根據(jù)和你有共同喜好的人給你推薦;根據(jù)你喜歡的物品給你推薦相似物品;根據(jù)以上條件綜合推薦.
協(xié)同濾波算法可以分為基于用戶的協(xié)同濾波、基于物品的協(xié)同濾波,也就是“物以類聚,人以群分”,并據(jù)此進行預測與推薦.
樣本數(shù)據(jù)來源于2022年應用統(tǒng)計案例大賽提供的某禮品批發(fā)電商平臺一年內的訂單數(shù)據(jù),包括發(fā)票、產品代碼,客戶ID等8個字段,389169條交易記錄.
在對數(shù)據(jù)進行分析之前,應該先對歷史訂單數(shù)據(jù)進行預處理操作.由于歷史訂單數(shù)據(jù)數(shù)量、變量過多等各種因素,導致給出的數(shù)據(jù)集會存在異常值、缺失值、重復值,無法直接對數(shù)據(jù)進行分析,所以對電商平臺一年內的訂單交易數(shù)據(jù)進行預處理.
清洗后的數(shù)據(jù)一共為342466條交易記錄,但是退貨數(shù)據(jù)記錄作為異常值被剔除,由于本文還要對退貨數(shù)據(jù)進行分析,所以要對退貨數(shù)據(jù)進行提取,經過數(shù)據(jù)清洗之后的退貨數(shù)據(jù),一共有1633種不同產品發(fā)生退貨,將數(shù)據(jù)集分為產品購買、商品退貨信息兩部分.
3.1.1 平臺每月的銷售狀況
不同的月份,產品的交易量會有所不同,該電商平臺一年的月交易量(Monthly)、月銷售額(Monthsale)變化如圖2.
圖2 平臺每月交易情況
由圖2可知,該電商平臺2011年8月、9月、10月、11月的銷售單量持續(xù)增長,2011年的11月的最高銷售單量達到2657單.臨近年末,該平臺可能采用舉辦年末大促、購物節(jié)等促銷手段,吸引客戶.1月份到6月份的銷售單量不穩(wěn)定.
電商平臺在2011年9-11月的銷售額與銷售量的變化一致,都處于較高水平.我們發(fā)現(xiàn)2011年1月份的銷售單量較2010年12月份的銷售單量少,但兩個月份的銷售額水平大致相同,說明1月份銷售產品的單價水平比12月份產品的單價水平高.
3.1.2 平臺每周的銷售情況
將交易時間年、月、日轉化成交易周,分析電商平臺平均一周的周交易量(Monthly)、周銷售額(Monthsale)變化情況如圖3.
圖3 平臺每周的銷售情況
由圖3可知,該電商平臺2010年12月到2011年11月一年的銷售訂單中,周四的銷售單數(shù)最多,周五、周日的銷售單數(shù)少,可能與人們的消費習慣相關,臨近休息日的網上消費較少或者該電商平臺銷售產品針對的不是普通消費者.每周的銷售額與交易單數(shù)的變化趨勢基本吻合,電商平臺的交易額在周四達到頂峰.周三的銷售量比周二的多,周三較周二的銷售額反而更少,這可能與產品的銷售種類不同有關.
3.1.3 商品的銷量
從整理好的銷售數(shù)據(jù)中我們篩選出銷量前20的產品,將這些產品作為熱銷產品.
由圖4可知產品代碼為84077的商品銷量最多可達五萬多件,說明客戶對于這些熱銷產品有很高的需求,建議該電商平臺應該多引進該類產品的子產品為客戶提供更多的選擇,從而提高這些熱銷產品的銷量.
圖4 熱銷產品銷售量
3.1.4 商品退貨情況
將退貨數(shù)據(jù)進行篩選、整理,在處理退貨率的數(shù)據(jù)時,發(fā)現(xiàn)退貨率出現(xiàn)大于1的情況,說明這類產品存在退貨數(shù)量大于下單數(shù)量的情況,數(shù)據(jù)信息缺失,統(tǒng)一將退貨率改為1.對退貨率最高的20種商品進行分析.
從圖5中可以看到,該平臺不少產品存在退貨率高的情況,基于此,平臺應針對這些高退貨率的產品認真分析,及時調整銷售策略.
從“商品是否暢銷”“是否具備高盈利能力”“是否退貨率較高”3個指標使用K-means聚類方法來對商品的商業(yè)價值進行評估,最后根據(jù)肘部法確定最終分類數(shù)K=4.
由分類結果來看,將商品分成4類分類效果較好,每一類各維度的平均值如下表:
從以上結果來看4類產品的特點為:
第一類:銷量一般-較高盈利-較低退貨率;第二類:低銷量-較高盈利-低退貨率;第三類:高銷量-高盈利-較低退貨率;第四類:較高銷量-低盈利-高退貨率.
由產品的分類情況,該平臺的第一類產品的品類數(shù)最多,占該平臺銷售的所有產品77.8%,但是該類產品的銷量一般,該平臺可以適當減少該類產品的進貨量,避免出現(xiàn)存貨積壓的情況.高銷量、高盈利、低退貨率的第三類產品的種類占比較少僅占13%,該電商平臺應該多增加一些這類產品的品類,提供給客戶更多的選擇,從而提高該平臺的銷量水平.
4.1.1 R、F、M分箱
從交易數(shù)據(jù)中提取R、F、M 3個指標的信息.按R值越小、F、M值越大越好的規(guī)則將3個指標各自劃分為5個評分層級,得到RFM評分表如下.
由表2可知,大部分客戶最近一次消費的時間間隔較短、消費頻率較低,這說明客戶在電商平臺購買的商品大多為耐消品.為了更好地研究客戶的消費行為,分別將R、F指標的頻數(shù)分布與消費金額占比結合分析.
由表2、圖6可知,距離最近一次購買天數(shù)在0-12 d時,顧客數(shù)量占比20.2%,貢獻了46.9%的消費,在177-364 d時,顧客數(shù)量占比20.0%,僅貢獻了6.2%的消費.說明消費間隔短的絕大部分客戶,消費能力高.相比許久未消費的客戶,采取適當營銷策略喚醒、刺激其消費更容易.
由表2、圖7可知,在該電商平臺消費1-2次的客戶占比為56.7%,超過了客戶總數(shù)二分之一,但消費金額僅為16.6%.消費頻率最高的客戶占比少,反而貢獻了54.0%的消費金額.說明客戶消費頻率越高,客戶越忠誠其貢獻的消費金額越多,客戶消費頻率越低,客戶越不穩(wěn)定,其貢獻的消費金額越低.電商平臺可以根據(jù)客戶的消費頻率、累計的消費金額建立獎勵機制.如針對忠誠度高的客戶,當累計消費金額達到不同水平時,購買商品時可以享受不同程度的折扣,以增加客戶的粘性.
圖7 F頻數(shù)分布及消費金額占比情況
圖8 客戶的分類結果
4.1.2 分類
對消費間隔(R),消費頻率(F),消費金額(M)計算平均得分,將每個客戶的RFM各指標評分與平均值比較將大于平均值的指標記為高,反之記為低并結合表1,得到以下分類結果.
表1 分類商品各維度均值
表2 RFM打分表
從分類結果來看,重要價值客戶和一般挽留客戶所占人數(shù)較多,重要發(fā)展客戶、一般價值、保持客戶所占人數(shù)少.為了更好地分析每種客戶類型的行為特征,計算不同價值客戶的消費金額、商品購買量、訂單總量等各項指標的均值,并為不同價值類型的客戶提出相應的銷售策略.
由不同客戶價值各指標均值對比可知,重要價值客戶的消費金額、消費次數(shù)的均值最高,屬于忠誠用戶可以采用讓客戶有榮譽感的銷售策略,提高客戶的忠誠度.一般保持客戶、一般挽留客戶除最近消費間隔均值高外,其他各項指標都較低,說明客戶處于流失階段,可以不做營銷.但電商平臺的一般挽留客戶占比較高,可以對這部分客戶進行各種渠道推送優(yōu)惠活動,若喚醒效果不佳可以減少對這部分客戶的營銷.對于重要發(fā)展客戶可以對提升其客戶價值、穩(wěn)定和延長其高消費水平,防范重要挽留客戶的流失并積極進行關系恢復.
本文選擇基于用戶的協(xié)同濾波,首先對數(shù)據(jù)進行處理,整理出客戶的購買信息,使用杰卡德相似系數(shù)計算兩數(shù)據(jù)之間的距離,進而計算客戶間的相似度,并依據(jù)他們的相似度分數(shù),尋找到與該客戶最為相似的兩個客戶,結合客戶和相似客戶的購買記錄,對客戶第13個月可能購買的產品進行預測.部分預測結果如表3所示:
表3 預測結果
由表3可知,ID為12347的客戶可能購買產品代碼為22144、84988等商品,利用用戶的協(xié)同過濾算法,最終實現(xiàn)商品的個性化推薦,不僅幫助客戶更快買到所需商品,還將客戶與商品進行連接;在解決商品信息過載問題、提升客戶購物體驗的同時,還提高了平臺商品的轉化率和銷售水平.
第一,建議電商平臺根據(jù)商品的商業(yè)價值,選擇合適的商品進行銷售,并時刻留意市場的變化動態(tài)以及發(fā)展趨勢,對商品的商業(yè)價值進行更新.該平臺銷量一般-較高盈利-較低退貨率的商品的品類最多,但是銷量一般,該平臺可以適當減少該類產品的進貨量,避免出現(xiàn)存貨積壓的情況.高銷量-高盈利-較低退貨率的商品的品類較少,該電商平臺應該多增加一些這類產品的品類,提供給客戶更多的選擇.并建議該電商平臺可以多選取這樣的商品進行銷售,將其作為主打產品進行推廣.對于低銷商品,建議電商平臺進一步查找原因,進一步提升交易量,可以針對該平臺的爆款產品帶動滯銷產品,利用二八定律中的80%的剩余商品的利用價值建立熱銷產品和低銷產品的捆綁關系,推出合適的捆綁營銷.按月來看,2011年9-11月為銷售的高峰期;按周來看,每周四達到銷售高峰;這說明該電商平臺的促銷效果較為明顯,應該繼續(xù)抓住促銷的黃金時期.
第二,客戶是一個企業(yè)生存的根基,也是商業(yè)模式的核心.應該利用RFM等客戶分類模型對客戶進行分層,了解每位客戶的特性,實現(xiàn)差異化營銷,最終實現(xiàn)企業(yè)利潤的最大化.該平臺要利用有限的資源抓住重要發(fā)展客戶,提供會員積分服務,給與一定程度的優(yōu)惠來提高留存率;對于重要價值用戶,建議升級為VIP客戶,提供個性化服務,傾斜較多的資源提高售后服務的質量,建立積分商城,完善積分體系,提高用戶的生命周期.對于消費頻率低、粘性不強的客戶,應推薦一些促銷力度較大的商品,通過拼團打折、發(fā)放滿減優(yōu)惠券等方式喚起這部分用戶的注意力,當資源分配不足時可以選擇暫時放棄該部分客戶.