□ 胡朝暉,張革伕
(1.南華大學(xué)船山學(xué)院,湖南 衡陽 421001;2.南華大學(xué) 管理學(xué)院,湖南 衡陽421001)
衡陽的一家連鎖洗凈菜企業(yè)在O2O高速發(fā)展下迅速成為一顆明星。在互聯(lián)網(wǎng)支持下,洗凈菜企業(yè)開設(shè)了以自主銷售門店為示范。沒有客戶就沒有收益,凈菜門店更需要客戶。研究客戶行為,無疑能更好地把握企業(yè)的經(jīng)營(yíng)決策。研究客戶管理者眾多,客戶管理能力是現(xiàn)代服務(wù)業(yè)發(fā)展所必需的[1],而信息與技術(shù)成為現(xiàn)代客戶管理的最佳工具[2]。客戶關(guān)系管理是客戶管理的核心內(nèi)容,備受重視。Adam Idzikowski等[3]研究了客戶關(guān)系管理哲學(xué)在企業(yè)管理中的意義。Yangfan Li等[4]用實(shí)證方法研究了客戶關(guān)系管理的商業(yè)價(jià)值,構(gòu)建了一個(gè)兩階段模型,證明了客戶關(guān)系管理可帶來高額利潤(rùn)與價(jià)值。Wouroud Elfarmawi[5]研究了客戶關(guān)系管理與產(chǎn)品創(chuàng)新之間的關(guān)系,使用客戶關(guān)系管理系統(tǒng)可以吸引潛在客戶,留住老客戶。
通過客戶關(guān)系管理改善企業(yè)經(jīng)營(yíng),或者通過對(duì)客戶行為的分析來發(fā)現(xiàn)經(jīng)營(yíng)的問題,這是一個(gè)問題的兩個(gè)方面。本研究旨在研究洗凈菜門店的客戶行為,以幫助企業(yè)找到問題所在,提出解決策略。
K-Means是經(jīng)典的客戶聚類算法,通過計(jì)算客戶特征數(shù)據(jù)之間的空間距離來把客戶劃分到不同類群體中。每一類群體內(nèi)部具有良好的同質(zhì)性(距離相近),而類之間則具有顯著的差距。陸靜[6]研究了K-Means算法在電信客戶關(guān)系管理中的應(yīng)用。K-Means算法簡(jiǎn)單,算法過程如下:
①從N個(gè)樣本數(shù)據(jù)中隨機(jī)選取K個(gè)對(duì)象作為初始的聚類中心;
②分別計(jì)算每個(gè)樣本到各個(gè)聚類中心的距離,將對(duì)象分配到距離最近的聚類中;
③所有對(duì)象分配完成后,重新計(jì)算K個(gè)聚類的中心;
④與前一次計(jì)算得到的K個(gè)聚類中心比較,如果聚類中心發(fā)生變化,轉(zhuǎn)②,否則轉(zhuǎn)⑤;
⑤當(dāng)質(zhì)心不發(fā)生變化時(shí)停止并輸出聚類結(jié)果。
距離的計(jì)算可以采用歐幾里得或者曼哈頓方法,也可計(jì)算非連續(xù)型數(shù)據(jù)之間的相似性,一個(gè)類群內(nèi)部中心與組成樣本點(diǎn)之間的距離之和或者相似性之和穩(wěn)定不變,那么這些樣本點(diǎn)即構(gòu)成一個(gè)類群。把客戶分群可針對(duì)群體特征,制定管理策略,用好用準(zhǔn)資源。
IBM公司的數(shù)據(jù)挖掘工具M(jìn)odeler建模都是透明的,用戶無須了解計(jì)算細(xì)節(jié),用戶只需要通過調(diào)整幾個(gè)改善計(jì)算性能的參數(shù),即可快速獲得比較理想的聚類效果,幫助企業(yè)進(jìn)行客戶關(guān)系管理。
本研究從菜店P(guān)OS系統(tǒng)數(shù)據(jù)庫中提取了近2年的交易數(shù)據(jù),約8000條支付記錄。經(jīng)過篩選,提取了從2015-1-1到2015-3-1之間的數(shù)據(jù)1045條來聚類。從系統(tǒng)數(shù)據(jù)庫導(dǎo)出的數(shù)據(jù)字段包含了:序列號(hào)、支付創(chuàng)建時(shí)間、交易額、余額、客戶賬號(hào)等信息,考慮采用RFM模型來進(jìn)行客戶關(guān)系管理,保留了支付創(chuàng)建時(shí)間、交易額和客戶賬號(hào)字段。數(shù)據(jù)預(yù)處理過程如下圖1所示。在“過濾”節(jié)點(diǎn),去掉了不相關(guān)的序列號(hào)、余額等等字段。在“RFM匯總”節(jié)點(diǎn),設(shè)置了觀察時(shí)間點(diǎn)為“2015-12-1”,由此計(jì)算出“R”因子即購物周期、“F”因子即頻次數(shù)、“M”為貨幣因子數(shù),共獲得386條記錄。
圖1 數(shù)據(jù)預(yù)處理
IBM的數(shù)據(jù)挖掘平臺(tái)Modeler提供了透明的K-Means建模工具,其特點(diǎn)是把K-Means模型當(dāng)成一個(gè)流節(jié)點(diǎn),插入到數(shù)據(jù)流中,如圖1所示。根據(jù)RFM模型,將“R、F、M”三個(gè)因子分別作為K-Means模型的輸入,如下圖2所示。按照K-Means算法,模型就是求取“近因、頻數(shù)、貨幣”三個(gè)變量之間的距離。數(shù)據(jù)被分成2個(gè)區(qū),一個(gè)50%的數(shù)據(jù)用于訓(xùn)練建模,一個(gè)50%的數(shù)據(jù)用于檢驗(yàn)。模型預(yù)定聚類數(shù)量為3,標(biāo)簽說明用字符串。進(jìn)行的迭代次數(shù)最大為150次。點(diǎn)圖2中的【運(yùn)行】按鈕,即生成門店客戶的“K-Means”聚類模型。生成結(jié)果拖入原數(shù)據(jù)流中,如圖1中的輸出節(jié)點(diǎn)。
圖2 模型參數(shù)設(shè)置
運(yùn)行結(jié)果表明,上述客戶聚類模型的聚類結(jié)果為三類:第一類(“聚類-1”)客戶占比95.3%,第二類(“聚類-3”)客戶占比4.3%,第三類(“聚類-2”)客戶占比0.4%,從第16代開始就沒有再出現(xiàn)簇群中心點(diǎn)改變。聚類效果處在“好”的評(píng)級(jí)范圍。
圖3 菜店客戶分群狀態(tài)
從模型給出的分群來看,非常有意思,活躍客戶只有11位,2個(gè)月時(shí)間內(nèi)購買了約19次,金額為460元,最近的一次消費(fèi)在20天前。觀望型客戶觀察期內(nèi)只消費(fèi)了約3次,金額161元;沖動(dòng)型大客戶就1戶,只消費(fèi)了一次,一次性采購花費(fèi)了2328元。顯然,這種情況對(duì)于企業(yè)是不樂觀的。菜店作為連鎖門店才開張,觀望人群最近一次消費(fèi)比活躍型的長(zhǎng),而活躍型的則消費(fèi)周期越來越拉長(zhǎng)了。因而,門店的經(jīng)營(yíng)越來越不樂觀。
事實(shí)上,隨后的幾個(gè)月情況確實(shí)亦如此。繼續(xù)使用原有1-6月數(shù)據(jù),觀察點(diǎn)設(shè)在“2015-7-1”利用所建聚類模型再對(duì)其進(jìn)行聚類。發(fā)現(xiàn):“活躍型客戶”群體雖然在擴(kuò)大,但是平均最近一次購物行為發(fā)生在39天前,購物金額和頻次都在減少;“觀望型客戶”群體規(guī)模減小,但購物金額和頻次同樣在減少,最近一次購物發(fā)生在137天前;“沖動(dòng)采購型”則維持原有狀態(tài),再也沒有來采購過。
更符合實(shí)際需求的是:決策層需要明白哪些客戶屬于何種類型客戶,從而對(duì)癥下藥,繼續(xù)留住或進(jìn)行誘導(dǎo)轉(zhuǎn)化,下圖3為部分客戶聚類分布狀況,“idmember”為客戶編號(hào)代表唯一客戶。
圖4 部分客戶聚類分布
菜籃子工程關(guān)系民生,是居民幸福指數(shù)感知高低的因素之一。連鎖凈菜企業(yè)經(jīng)過了大半年的運(yùn)行后,在第二年仍然沒有進(jìn)入正軌,可以從其客戶聚類分析中反映出來。在前后兩個(gè)不同的時(shí)點(diǎn)觀察發(fā)現(xiàn):門店“活躍型”客戶逐步蛻變成了低迷型,與“觀望型”日漸合并,“觀望型”逐步演變成“退出型”,“采購型”客戶變成了“異常型”。顯然,門店的客戶體驗(yàn)變得糟糕,主要體現(xiàn)在:凈菜菜品多樣性差、包裝后重量誤差太大、門店服務(wù)響應(yīng)速度慢。企業(yè)決策者必須清楚凈菜店賺取的是時(shí)間、新鮮與服務(wù)中間的差價(jià),需要制定嚴(yán)格的、標(biāo)準(zhǔn)的加工與包裝流程,以保證凈菜菜品的品質(zhì),增加菜品的多樣性,加快配送速度和上架速度。