孫洪波
摘要:本文主要基于獲取的商場會員信息數據、商場銷售流水表、會員消費明細表、商品信息表,通過Oracle數據處理與分析,剔除異常數據,為后續(xù)處理做準備。通過分析商場的會員消費特征,會員與非會員消費特征的差異,有針對性的為商場管理者提供營銷建議;建立了基于會員性別、入會時長、年齡和消費頻次的評估會員購買力的多元線性回歸模型,并對模型的每個參數進行了檢驗。
Abstract: This paper is mainly based on the acquired mall member information data, shopping mall sales flow meter, member consumption schedule and commodity information table. Through Oracle data processing and analysis, the abnormal data is eliminated to prepare for subsequent processing. By analyzing the characteristics of member consumption of the mall and the difference between the consumption characteristics of members and non-members, the marketing suggestions for the mall managers are proposed; the multiple linear regression model for assessing member purchasing power based on the membership gender, the length of membership, the age and the frequency of consumption are established and each parameter of the model is tested.
關鍵詞:消費特征;會員信息;銷售流水;購買力模型
Key words: consumption characteristics;member information;sales flow;purchasing power model
中圖分類號:TP311.13? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻標識碼:A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文章編號:1006-4311(2019)18-0243-06
1? 研究背景
伴隨著大數據以及人工智能的爆炸式發(fā)展,我國零售業(yè)正在從O2O階段邁向線上線下深度融合的OMO階段。在這樣的背景下,零售企業(yè)唯有通過不斷創(chuàng)新營銷來提升品牌力和吸引客戶,才能更好地迎接新商業(yè)模式的到來。
在大數據時代,通過獲取的商場數據分析消費特征,并以此為基礎進行會員精準營銷,已經是一種很常用的會員營銷手段。在會員管理營銷系統(tǒng)中,為每個會員打上個性化標簽,則成一項基礎工作。比如某會員經常來店鋪購買零食,則可以給該會員打上“吃貨”、“零食”等標簽。在零售行業(yè)中,電商的飛速發(fā)展嚴重沖擊了零售運營商,造成商場會員的大量流失,促使大型商場通過實施營銷策略重視對現有會員的針對性管理,以此維系與會員之間長久的、穩(wěn)定的關系,為零售運營商帶來穩(wěn)定的銷售額和利潤。
因此,有必要通過分析零售業(yè)會員消費特征和建立會員購買力模型,為零售運營商策略的制定提供數據支持。本文以獲取的某大型百貨商場會員的相關信息為基礎展開。
2? 研究方法
首先,依據某大型百貨商場會員的相關信息,分析會員和非會員的消費特征并進行比較,以研究會員與非會員群體的差異,得出會員和非會員給商場帶來的經濟效益差異。其次,在分析會員購買力的影響因素的基礎上,利用消費金額刻畫會員的購買力,建立多元線性回歸模型,并對該模型進行參數檢驗。
本文主要以Oracle數據處理為基礎,輔以Origin進行可視化。解題過程并不需要建立復雜的數學模型。技術路線如圖1所示。
3? 模型假設與準備
①假設既有數據,假定會員的購買力只與會員性別、會員消費時的年齡、會員入會的時長以及會員在商場的購買頻次有關。②根據既有數據,假設會員最后一次消費記錄即為會員的退出日期,否則無法評價會員何時退會。③假設會員入會時年齡小于18歲和大于80歲的數據為異常記錄。
解題過程的數據準備主要是進行數據預處理,本課題的數據預處理工作主要包括:①將附件中的數據導入Oracle數據庫中;②刪除會員信息表中會員出生年月為空;③刪除會員入會日期早于會員出生日期的記錄;④刪除會員入會時年齡小于18歲以及大于80歲的記錄;⑤刪除消費數據中銷售數量為負值的記錄。
4? 商場會員消費特征分析
要分析會員的消費特征,可根據會員信息數據和會員消費明細表,以會員卡號為數據融合字段,從會員的年齡、性別、不同會員的購買力、購買頻次等信息的基本統(tǒng)計特征入手,通過Oracle數據庫統(tǒng)計相關信息再進行可視化。要比較會員與非會員群體的差異,可根據銷售流水表和會員消費明細表,以商品編碼為數據融合字段,兩者做差集得出非會員消費明細,進而對兩者的消費特征進行比較,以得出會員和非會員給商場帶來的經濟效益差異。
①首先在會員信息表中添加字段會員入會時年齡,以會員入會登記時間減去會員出生時間即可得到會員入會時的年齡。根據獲取的年齡結果,剔除年齡小于18歲和大于80歲的記錄,進行會員年齡分布統(tǒng)計以及會員性別統(tǒng)計。
通過圖2和圖3可以看出商場會員主要分布在20~30歲之間,隨著年齡的增長會員數量呈現先增后長的趨勢,其中會員數量分布最多的年齡段為26~30歲,該類群體大多為剛畢業(yè)不久的青年人員注重保養(yǎng)和養(yǎng)生,購買力較強,屬于商場重點推銷對象。
②將會員消費明細表和會員信息表通過會員卡號進行融合,統(tǒng)計不同年齡段、不同性別在消費金額、消費商品上的特征。
通過圖4可以看出隨著年齡階段的增長,消費金額同樣呈現先增后減的趨勢,但通過圖5比較可以明顯看出,雖然20-35歲的會員數量居多,但是其消費金額并非最多的,反之,36歲-55歲的會員雖然數量并非最多,但其消費金額卻占比較高,充分體現了年輕人由于經濟基礎相對薄弱,其購買力相對較弱,而年長者由于具有足夠的社會經驗和經濟基礎,購買了相對較強。
通過圖6和圖7可以看出,該商場會員中女性會員占絕大多數(80.74%),而其消費總金額占比更高,高達86.52%。男性會員數量占比19.26%,而其消費金額占比13.48%。所以女性消費者應該為該商場的重點推銷對象。
③為求得會員和非會員信息的消費情況,利用消費流水表統(tǒng)計總消費金額為1222599720.4元,利用會員消費明細表統(tǒng)計會員總消費金額為1204268449.39元,兩者相減即為非會員消費金額,為18331271.01元。
從圖8中可以看出,商場中的銷售來源絕大部分是來源于會員,其中會員為商場帶來的經濟效益高達98.5%,而非會員僅占1.5%,所以商場應重點發(fā)展會員。
④提取非會員消費明細表,將非會員消費明細表與商品信息表通過商品編碼字段進行融合,得到含有商品名稱的非會員消費明細表,再利用會員消費明細表和非會員消費明細表,提取會員和非會員在商品類別購買上的差別。
會員和非會員在商品購買上也有較大差別,其中會員購買的商品類別有7384類商品,非會員購買的商品類別僅有249類商品,其中排名前50的商品及其銷售數量如表1所示。從表1中可以清晰看出,購買商品數量排名靠前的幾件商品中,非會員的主要購買特價和促銷商品較多,而會員購買正價商品較多,體現出明顯的消費觀念差異。此外,購買商品排名情況可為商場管理者在進貨、促銷等方面提供建設性指導參考。
⑤通過提取會員和非會員在不同價格區(qū)間上的商品購買數量,獲取不同價格區(qū)間會員和非會員在商品銷售數量的差異。
從不同價格區(qū)間會員與非會員購買商品數量的分布上來看,兩者變化趨勢相同,都是價格在0-1000的商品購買數量最多,隨著價格的升高,購買商品的數量也相對減少。該分析結果可指導商場管理者對不同價格區(qū)段的商品進行針對性的促銷。
⑥利用會員消費明細表和非會員消費明細表,提取會員與非會員在一天內不同時段購買商品數量的差異,結果如圖11、圖12所示。
從圖11和圖12中可以看出,會員與非會員同樣是在下午14:00-17:00期間購買商品數量較多,符合常人的購買習慣,不同的是,會員在夜間00:00-02:00有少量消費,而非會員在此期間并無任何消費,此外,會員消費開始時間較早,早09:00便開始有消費行為,而非會員此期間仍然沒有消費行為。根據此分析結果,商場管理者可重點集中在下午時段進行促銷活動。
⑦利用會員消費明細表和非會員消費明細表,提取會員與非會員在一年內不同季節(jié)購買商品數量的差異,結果如圖13、圖14所示。
從圖13和圖14中可以看出,會員購買商品時在一年內分布較均勻,其中1月、3月、5月、8月、11月商品購買數量相對較多。而非會員1月份和2月份春節(jié)前后購買商品數量明顯增多,商場管理者可據此在春節(jié)附近針對非會員做一些對應的促銷活動,此外,非會員在4月、8月、11月購買商品數量相對較多。
5? 會員購買力多元線性回歸模型
要分析會員的購買力,首先應獲取會員消費時的年齡、會員的入會時長以及消費頻次等數據。首先將會員消費明細表和會員信息表通過會員卡號字段進行融合,然后進行統(tǒng)計分析。會員消費時的年齡為消費年月月出生年月之差,會員入會時長為消費年月與入會年月之差,會員消費頻次為會員卡號出現的次數總和。
假設會員的購買力與會員的性別、消費時的年齡、消費時的入會時長以及消費頻次有關,建立消費金額與性別、消費年齡、入會時長和消費頻次的多元線性回歸模型進行回歸:
其中,Y為消費金額,即會員購買力,X1為消費年齡,X2為入會時長,X3為性別,X4為消費頻次,b、A、B、C、D為模型參數,利用origin進行回歸后得回歸方程為:
其中各個參數的標準差及統(tǒng)計檢驗結果如圖15、圖16、圖17、圖18所示。從輸出結果圖15中可以看出,模型擬合優(yōu)度較好。從輸出結果圖16中可以看出,在給定的顯著性水平α=0.05的情況下,回歸方程顯著性F檢驗的概率p=0遠小于α,說明回歸方程的線性關系非常顯著。從輸出結果圖17中可以看出,各個參數的殘差也基本分布在0值兩側。
6? 結論
①本文中的會員購買力多元線性回歸模型比較簡單,以面向應用為主,并不需要復雜的理論推導,有利于推廣應用。
②本文所使用的主要工具為Oracle,使用簡單的sql語句解決復雜的實際應用,有效避免了復雜理論模型需要大面積編程的難題,處理易于操作和修改。
③本文在分析結果的同時,分別根據結果對商場管理者提供了針對性營銷建議,有利于理論研究成果的應用轉化以指導實際營銷運營。
④由于在刻畫會員購買力模型時考慮因素不夠充分,導致模型精度不高,后期可重新進行自變量的選取,采用向前選擇法、向后選擇法、逐步選擇法等進行回歸,以獲取更好的預測模型。
參考文獻:
[1]朱道元,等.數學建模案例精選[M].北京:科學出版社,2003.
[2]姜啟源,謝金星,葉俊優(yōu).數學模型[M].四版.北京:高等教育出版社,2010.
[3]Oder R R, Price C R. HGMS: Mathematical modeling of commercial practice[C]// American Institute of Physics, 1976:641-643.
[4]Rivera R, Burnaev E. Forecasting of Commercial Sales with Large Scale Gaussian Processes[C]// IEEE International Conference on Data Mining Workshops. IEEE Computer Society, 2017:625-634.
[5]King N, Bax T J. Using Grocery Store Point-ofSale Date to Correlate Consumer Purchase Habits to Nutrition Targets:, US20160133140[P]. 2016.
[6]Dorismond J. Supermarket optimization: Simulation modeling and analysis of a grocery store layout[C]// Winter Simulation Conference. IEEE, 2017:3656-3657.
[7]Pasichnyk R, Maslyyak B, Vitsentiy V. Modeling of products sale velocity and products recommended structure on the basis of a data reduction method[C]// Intelligent Data Acquisition and Advanced Computing Systems: Technology and Applications, International Workshop on. IEEE, 2001:238-241.
[8]秦靖,劉存勇.Oracle從入門到精通[M].機械工業(yè)出版社, 2011.
[9]秦靖,劉存勇.ORACLE從入門到精通:視頻實戰(zhàn)版[M].機械工業(yè)出版社,2013.
[10]王秀峰.數據分析與科學繪圖軟件ORIGIN詳解[M].化學工業(yè)出版社,2008.