陳忠仁,王淑華,馬淑艷
客戶價值關(guān)聯(lián)分析的應(yīng)用研究
——以某零售企業(yè)為例
陳忠仁,王淑華,馬淑艷
在如今激烈的市場競爭中,如何贏得客戶是很多企業(yè)追求的目標。本文從RFM分析入手,通過聚類方法劃分出對企業(yè)具有不同價值的客戶群,通過關(guān)聯(lián)分析找出主要群體所消費產(chǎn)品的品牌之間的關(guān)聯(lián)關(guān)系,以分析不同品牌對于不同類型客戶的重要性。以期這種方法能為零售企業(yè)商品的布局及商品品牌的管理等方面提供一定的決策信息,從而增加企業(yè)的盈利能力和客戶的滿意度,進而達到雙贏的目的。
客戶價值;關(guān)聯(lián)分析;聚類
陳忠仁/吉林大學工會常務(wù)副主席(吉林長春130012);王淑華/吉林大學數(shù)量經(jīng)濟研究中心副主任(吉林長春130012);馬淑艷/吉林大學研究生院副研究員,碩士(吉林長春130012)。
在現(xiàn)今激烈的市場競爭中,對于商業(yè)企業(yè)來說,僅靠商品本身已很難取勝,企業(yè)之間的競爭已更多地轉(zhuǎn)變成如何贏取客戶的競爭。因此如何更好地識別出對企業(yè)具有不同價值的客戶,并根據(jù)客戶各自不同的特點挖掘其感興趣的商品信息,從而有針對性地對客戶進行營銷和管理,盡量增加客戶的購買機率并努力維系與最有價值客戶之間的關(guān)系是許多商家不斷追求并努力實現(xiàn)的目標,而基于客戶價值的關(guān)聯(lián)分析是實現(xiàn)此目標的有效方式之一。
一些研究表明:客戶生命周期值是一種有效地識別不同價值客戶的方法,它對于發(fā)展針對目標客戶的戰(zhàn)略具有一定的實際意義,而RFM(R:最近消費時間,F(xiàn):單位時間內(nèi)消費頻次,M:單位時間內(nèi)消費金額)模型[1]是衡量客戶生命周期的一種有效方法,該模型主要是通過對客戶過去消費行為的研究來分析和總結(jié)客戶的購買特性并預測客戶今后的消費行為,從而為企業(yè)的決策提供支持。
基于此,本文從RFM分析入手,首先用聚類方法劃分出對企業(yè)具有不同價值的客戶群,通過關(guān)聯(lián)分析找出主要群體所消費產(chǎn)品的品牌之間的關(guān)聯(lián)關(guān)系,以分析不同品牌對于不同類型客戶的重要性。以期這種方法能為零售企業(yè)商品的布局及商品品牌的管理等方面提供一定的決策信息,從而增加企業(yè)的盈利能力和客戶的滿意度,進而達到雙贏的目的。最后,本文通過某零售企業(yè)2008.06.30—2009.06.29一年的銷售數(shù)據(jù)進行了應(yīng)用研究。
1.客戶價值衡量指標:RFM。RFM模型最早是1994年由Stone[2]等學者提出的,Stone等學者認為R、F和M是影響客戶價值的三個主要因素,R表示客戶最近一次購買時間,為了計量方便,也可以把R當作是客戶最近一次購買的時間到統(tǒng)計當日為止這段時間內(nèi)所持續(xù)的天數(shù)/周數(shù)/月數(shù)等,即近度,該值越小,預示著客戶再次購買的可能性就越大;也可以把R看做是統(tǒng)計周期的起始日到最近一次購買日期為止這段時間內(nèi)所持續(xù)的天數(shù)/周數(shù)/月數(shù),即持續(xù)采購的時間,該值越大,預示著客戶在未來再次購買的可能性就越大。F表示客戶在統(tǒng)計周期內(nèi)購買的次數(shù)(頻度),客戶的購買頻度越高就表示該客戶越忠誠。M代表客戶在統(tǒng)計周期內(nèi)的消費總額(值度),該值越大,意味著客戶對企業(yè)的利潤貢獻越大,企業(yè)越應(yīng)重點關(guān)注該客戶。因此,企業(yè)在衡量客戶價值的過程中,需要把R、F和M三個指標綜合起來進行考慮?;诖耍疚母鶕?jù)這三個指標進行聚類分析來劃分出具有不同價值的客戶,進而找出不同類別客戶的消費產(chǎn)品之間的關(guān)聯(lián)關(guān)系,以期能為企業(yè)的營銷策略提供支撐。
2.基于客戶價值的客戶分類??蛻舴诸愂歉鶕?jù)客戶的一些購買行為和人口統(tǒng)計特性等把具有相同特征的客戶聚集到一起,不同類別中的客戶具有顯著的差異。本文中所采用的方法是k-均值聚類法,該方法的基本思想是首先隨機地從樣本數(shù)據(jù)中選取k個值作為初始聚類中心,然后計算其它樣本到每個類中心的距離,進而把其它樣本分到離它最近的聚類中心所在的類,這樣就完成了一次迭代。接下來重新計算每類的中心,該中心為毎類中所包含樣本數(shù)據(jù)的平均值,若相鄰兩類的聚類中心沒有什么變化,則算法結(jié)束。一般來說k的取值范圍在2到20之間,對每組樣本數(shù)據(jù)來說,具體的k值可以通過實驗的方法來確定,即要選取所有可能的聚類結(jié)果中平均方差最小的k,毎個類的方差為該類中每一個樣本值與均值之差的平方和。本文首先把反映客戶價值的R、F、M三個指標分別聚成k類,然后對聚類后的R、F、M指標進行組合,從而可以得到類客戶,不同類別的客戶對企業(yè)的價值是不同的,在此類客戶中有一類客戶的R、F、M指標分別都是最佳的,即來店頻率高、購買金額多、最近來店時間短,這類客戶是最有價值的,他們應(yīng)該是企業(yè)需要重點關(guān)注的對象。
3.關(guān)聯(lián)分析。按照上面所述的方法,企業(yè)的客戶按其價值可以被劃分成不同的類,對毎類客戶群,由于其購買習慣等特征具有一定的差異,因此本文把Agrawal[3]等人在1993年提出的關(guān)聯(lián)規(guī)則方法應(yīng)用到不同類別的客戶群中,以此來尋找不同類別客戶所購買產(chǎn)品之間的關(guān)聯(lián)關(guān)系,從而有助于企業(yè)進行有針對性的營銷。關(guān)聯(lián)規(guī)則的基本思想[4]是,對于某個企業(yè)的交易數(shù)據(jù)庫D來說,設(shè)I={i1,i2,…,in}是企業(yè)所有商品項的集合,I中的每一個元素都稱為項(item),客戶的每一次交易都是項的集合T(TI),而且客戶的每次交易都有唯一的標識符如TID(Transaction ID)與之相對應(yīng)。關(guān)聯(lián)規(guī)則就是要尋找形如XY的蘊涵式,其中XI,YI,X與Y的交集為空,并且該蘊涵式的支持度和置信度要滿足最小支持度(minsupp)和最小可信度(minconf)的條件,最小支持度和最小可信度的閾值都是人為設(shè)定的。所說的支持度是指交易數(shù)據(jù)庫集合D中同時包含事務(wù)X和事務(wù)Y的百分比,該值反映了事務(wù)X和事務(wù)Y同時出現(xiàn)在交易事務(wù)中的頻繁程度,支持度較高意味著商品項之間的關(guān)聯(lián)性也比較強;置信度是包含X的事務(wù)中同時又包含事務(wù)Y的百分比,該值是代表關(guān)聯(lián)規(guī)則可靠性的一個參數(shù),置信度較高意味著商品交易項之間的關(guān)聯(lián)顯著性[5][6]也比較高。Apriori算法是尋找關(guān)聯(lián)規(guī)則的經(jīng)典算法,運用該算法可以得出商品之間的網(wǎng)絡(luò)依賴圖,從圖中可以看出商品之間的關(guān)聯(lián)并可以分析出哪些商品處于核心地位。當然,也可以根據(jù)商品品類或商品品牌進行關(guān)聯(lián)。本文下面就是以商品品牌之間的關(guān)聯(lián)關(guān)系為例來進行分析的。
本文從某零售企業(yè)2008.06.30—2009.06.29數(shù)據(jù)出發(fā),對前面文中所述的基于客戶價值的不同客戶群體消費商品的品牌關(guān)聯(lián)進行了分析。
1.數(shù)據(jù)清理。在數(shù)據(jù)收集過程中,原始數(shù)據(jù)中經(jīng)常會存在大量的不規(guī)范、不合理的數(shù)據(jù),這些數(shù)據(jù)會對正常信息和知識的挖掘造成嚴重干擾,從而使分析結(jié)果偏離真實或不可用,因此,在進行數(shù)據(jù)分析之前,通常要對數(shù)據(jù)進行噪聲清理,也就是通過數(shù)據(jù)預處理,清除掉不規(guī)范的數(shù)據(jù),使分析結(jié)果接近真實情況。本次清理過程中,發(fā)現(xiàn)數(shù)據(jù)中存在客戶名為空、一人多卡、證件號相同但客戶名不同等多種情況,把這些數(shù)據(jù)通過程序和人工清理后得到在這一年內(nèi)有消費記錄的客戶共138305人。
2.聚類。根據(jù)企業(yè)的交易數(shù)據(jù)統(tǒng)計出2008.06.30—2009.06.29這個交易周期內(nèi)每個客戶的R、F和M值,進而分別對R、F和M值依次進行聚類,毎個指標都分為三個等級,然后把三個指標組合在一起,得到27類,在此27類中,最有價值的一類客戶為1617人,價值最低的一類客戶為10454人。
3.基于客戶價值的關(guān)聯(lián)分析
本部分分別對前面得出的最有價值、價值最低客戶以及全部客戶所消費產(chǎn)品的品牌進行關(guān)聯(lián)分析,得出如下的結(jié)果。
1)將聚類所得的最有價值的1617人的消費記錄取出,把他們所消費商品按品牌進行關(guān)聯(lián),本文得出如圖1所示網(wǎng)絡(luò)依賴關(guān)系(鑒于所得圖形較大,本文只給出局部示意圖)。
圖1 最有價值客戶消費產(chǎn)品的品牌網(wǎng)絡(luò)依賴關(guān)系局部示意圖
2)將價值最低的一類客戶消費商品按品牌進行關(guān)聯(lián),當最小支持度和最小可信度按常規(guī)設(shè)置時,幾乎沒有得到所消費產(chǎn)品的品牌之間的關(guān)聯(lián),只有當這兩個參數(shù)值調(diào)得非常低時,才得到如下的網(wǎng)絡(luò)依賴關(guān)系,見圖2。
圖2 最低價值客戶消費產(chǎn)品的品牌網(wǎng)絡(luò)依賴關(guān)系
3)將所有客戶作為一個整體,對其在消費周期內(nèi)消費的商品按品牌進行關(guān)聯(lián)分析,設(shè)定好最小支持度與最小可信度后,本文得出所有客戶的消費商品的品牌之間的網(wǎng)絡(luò)依賴關(guān)系,局部示意如圖3和圖4所示。
從不同客戶群體的消費情況得出的品牌網(wǎng)絡(luò)依賴圖中可以看出,在所有客戶消費產(chǎn)品的品牌關(guān)聯(lián)結(jié)果中,曼妮芬(MANIFORM)、阿迪達斯(體服)、與歐萊雅共同處于核心地位;在最有價值客戶消費產(chǎn)品的品牌關(guān)聯(lián)結(jié)果中,巴布豆、麗嬰房以及黃色小鴨(P.YO.P.YO)等品牌更多與其他品牌有所關(guān)聯(lián);對于最低價值客戶群,當最小支持度、最小可信度等參數(shù)調(diào)至極低時,才得出一些規(guī)則,關(guān)聯(lián)項目較少。由以上對比可以看出,對于不同特性的客戶群,其所需要的商品及品牌是有著明顯區(qū)別的。了解這些差異可以使企業(yè)更好地對商品進行管理,如為了重點關(guān)注最有價值的客戶群,對于一些兒童品牌企業(yè)要引起足夠的重視等。同時,針對這些有趣的、有意義的模式,企業(yè)可以制定出有效的客戶服務(wù)和營銷策略并在品牌的引進和商品的布局管理等方面有所依據(jù)。
圖3 所有客戶消費產(chǎn)品的品牌網(wǎng)絡(luò)依賴關(guān)系局部示意圖
圖4 所有客戶消費產(chǎn)品的品牌網(wǎng)絡(luò)依賴關(guān)系局部示意圖
商品和客戶一直是零售企業(yè)管理中備受重視的領(lǐng)域,如何識別出不同價值的客戶群以便進行有針對性的商品促銷,如何運用數(shù)據(jù)庫中的數(shù)據(jù)進行商品的交叉銷售,如何對商品的布局管理等提供支持等都是企業(yè)所關(guān)注的重點。本文利用某企業(yè)2008.06.30—2009.06.29一年的銷售數(shù)據(jù),從RFM分析入手,通過聚類方法劃分出對企業(yè)具有不同價值的客戶群,通過關(guān)聯(lián)分析找出了主要群體所消費產(chǎn)品品牌之間的關(guān)聯(lián)。結(jié)果表明:不同價值的客戶群所消費的產(chǎn)品品牌之間具有一定差異,這種差異為零售企業(yè)在品牌的引進、商品的布局管理等方面的有效決策提供了依據(jù)。
:
[1]David Goldberg,David Nichos,Brain M.Oki,and Douglas Terry,Using Collaborative Filtering to Weave an Information Tapestry[J],Communications of the ACM,1992,35(12)61-70
[2]Stone,Bob.Successful Direct Marketing Methods[M].Lincolnwood:NTC Business Books,1994
[3]Agrawal,T.Imielinski,and A.Swami.,Mining Association Rules between Sets of Items in Large Databases.Proceedings of the ACM SIGMODConferenceonManagementofdata,pp.207-216,1993
[4]Sarwar,B.M.,Karvpis,G.,Konstan,J.A.,and Riedl,J.Application of DimensionalitvReductioninRecommenderSystem-ACaseStudy[C].In ACMWebKDDWebMiningforE-Commenceworkshop,2000
[5]蔡偉杰,張曉輝,朱建秋,朱楊勇.關(guān)聯(lián)規(guī)則挖掘綜述[J].計算機工程,2001(5)
[6]何小東,劉衛(wèi)國.數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則挖掘算法比較研究[J].計算機工程與設(shè)計,2005(5)
C931
A
1671-6531(2013)18-0041-02
吉林省科技發(fā)展計劃項目 (項目編號:20120616)吉林省光電子產(chǎn)業(yè)發(fā)展態(tài)勢分析及對策研究
責任編輯:姚 旺