謝鵬壽,張 寬,范宏進(jìn),貴向泉,張恩展
1(蘭州理工大學(xué) 計(jì)算機(jī)與通信學(xué)院,蘭州 730050) 2(甘肅省制造業(yè)信息化工程技術(shù)研究中心,蘭州 730050)E-mail:874357450@qq.com
近年來,我國(guó)的汽車市場(chǎng)發(fā)展速度呈現(xiàn)出遞增趨勢(shì),隨之而來的是4S店的快速興起.伴隨著汽車產(chǎn)業(yè)快速發(fā)展,汽車4S店在售后服務(wù)上積累了大量的客戶服務(wù)信息.汽車行業(yè)的根本就是客戶,客戶是企業(yè)的根本資源、也是企業(yè)的最大“無形資產(chǎn)”[1].為了提高汽車4S店的運(yùn)行效率,增加汽車4S店的利潤(rùn),為不同的客戶提供不同的個(gè)性化服務(wù),需要4S店能夠正確地評(píng)估客戶價(jià)值,對(duì)客戶關(guān)系能夠進(jìn)行有效地管理.然而,任何高效的客戶關(guān)系管理都是以扎實(shí)的客戶細(xì)分為基礎(chǔ)[2].客戶細(xì)分(Customer Segmentation),是企業(yè)在明確的戰(zhàn)略、業(yè)務(wù)模式和特定的市場(chǎng)中,根據(jù)客戶的屬性、行為、需求、偏好以及價(jià)值等因素對(duì)于客戶進(jìn)行分類,并提供有針對(duì)性的產(chǎn)品、服務(wù)和營(yíng)銷模式的過程[3].在客戶細(xì)分中RFM模型應(yīng)用較為廣泛,其主要依據(jù)客戶消費(fèi)數(shù)據(jù)中的R指標(biāo)、F指標(biāo)、M指標(biāo)進(jìn)行客戶細(xì)分,三個(gè)指標(biāo)分別是最近購(gòu)買時(shí)間(Regency),購(gòu)買頻率(Frequency)和購(gòu)買金額(Monetary)[4].
目前,顧客行為細(xì)分對(duì)于消費(fèi)行業(yè)挖掘重要價(jià)值客戶、預(yù)測(cè)客戶流失等都有著重要意義.文獻(xiàn)[5]在電信客戶流失預(yù)測(cè)的信息特征提取過程中,設(shè)計(jì)了利用RFM模型描繪的交互信息豐富原始圖形的兩種不同方法來融合互動(dòng)信息和結(jié)構(gòu)信息.文獻(xiàn)[6]采用客戶交易數(shù)據(jù)的RFM模型對(duì)摩托車和汽車尾氣行業(yè)的公司進(jìn)行客戶分類,提出了客戶關(guān)系管理的建議.文獻(xiàn)[7]將RFM分析應(yīng)用于高科技產(chǎn)品消費(fèi)者,提出了一種基于分類方法的用戶群分析方法.文獻(xiàn)[8]通過追蹤某醫(yī)院3年患者的行為,并嘗試使用RFML模型來檢測(cè)特殊人群及其行為傾向,以發(fā)現(xiàn)忠誠(chéng)的客戶及潛在的流失客戶.文獻(xiàn)[9]利用RFM技術(shù)和K-means算法對(duì)客戶進(jìn)行分類,并采用內(nèi)部評(píng)估方法確定最佳聚類簇?cái)?shù).文獻(xiàn)[10]提出了一種基于多重統(tǒng)計(jì)的方法,通過時(shí)間序列對(duì)大規(guī)模數(shù)據(jù)上的RFM時(shí)間間隔進(jìn)行分割.
綜上所述,在各消費(fèi)行業(yè)中,以RFM模型為基礎(chǔ)的客戶細(xì)分在潛在價(jià)值客戶挖掘、客戶忠誠(chéng)度預(yù)測(cè)上取得了一些成果.但RFM模型主要集中應(yīng)用于通信、銀行、銷售等行業(yè),難于適用于汽車服務(wù)行業(yè),如若車主消費(fèi)時(shí)間剛好在分析時(shí)間節(jié)點(diǎn)之后,用RFM模型的R指標(biāo)分析就存在一定誤差等.對(duì)此,課題組針對(duì)汽車售后服務(wù)業(yè)的特點(diǎn),在傳統(tǒng)RFM模型基礎(chǔ)上,進(jìn)一步修改客戶細(xì)分指標(biāo),形成一種適應(yīng)汽車4S店的客戶細(xì)分模型,然后利用K-means算法對(duì)汽車4S店客戶進(jìn)行聚類分析,得到不同行為特征的客戶群體.
RFM模型因其容易理解且計(jì)算簡(jiǎn)單的特點(diǎn)而得到了廣泛的關(guān)注和應(yīng)用,但將其應(yīng)用在汽車4S店客戶細(xì)分上,仍存在一些缺點(diǎn),比如上文所述的R指標(biāo)可能存在的不準(zhǔn)確,以及F指標(biāo)的不適用性等.在汽車4S店售后方面,車主回店次數(shù)(F指標(biāo))少,可能是未到保修期或地域問題等因素導(dǎo)致的,這屬于正常的情況,也可能是流失傾向的表現(xiàn).車主在未到保養(yǎng)時(shí)間點(diǎn)或未達(dá)到汽車保養(yǎng)維修里程數(shù)的情況下,回店的次數(shù)少甚至沒有,這屬于正常情況,若時(shí)間窗口選在這個(gè)時(shí)間段,依據(jù)F指標(biāo)可能會(huì)將該車主劃分為無價(jià)值或低價(jià)值客戶,這樣是不合理的.
因此,課題組以傳統(tǒng)RFM模型為基礎(chǔ),改進(jìn)其模型的參數(shù)指標(biāo),形成一種適應(yīng)汽車4S店的客戶細(xì)分模型.該模型改進(jìn)形成3個(gè)參數(shù),其含義分別為T:TimeRatio,表示客戶最近一次回店時(shí)間距分析時(shí)間節(jié)點(diǎn)的時(shí)長(zhǎng)與客戶平均回店時(shí)間間隔的比值;F:FrequencyRatio,表示客戶回店次數(shù)與上個(gè)時(shí)間節(jié)點(diǎn)內(nèi)的回店次數(shù)比值;M:Monetary,表示在分析時(shí)間節(jié)點(diǎn)內(nèi)回店消費(fèi)總額,具體的指標(biāo)涵義表示如表1所示.
表1 TFM數(shù)據(jù)分析指標(biāo)Table 1 TFM data analysis indicators
對(duì)于參數(shù)指標(biāo)T,考察客戶較平均回店間隔時(shí)間的變化,分為回店時(shí)長(zhǎng)增加、回店時(shí)長(zhǎng)基本不變及回店時(shí)長(zhǎng)減少;對(duì)于參數(shù)指標(biāo)F,考察客戶比較上一時(shí)間段內(nèi)消費(fèi)次數(shù)的變化,具有三種狀態(tài),即消費(fèi)次數(shù)增加、消費(fèi)次數(shù)基本不變以及消費(fèi)次數(shù)減少;對(duì)于參數(shù)指標(biāo)M,主要分為高價(jià)值、較高價(jià)值、一般價(jià)值、低價(jià)值及無價(jià)值.對(duì)以上三個(gè)參數(shù)指標(biāo)進(jìn)行分析,其中,T值越小,表明客戶流失傾向越低,客戶價(jià)值越高;F值越大,客戶較上一期增長(zhǎng)越多,價(jià)值越高,相對(duì)越不容易流失;M值越大,表明客戶為汽車4S店帶來的價(jià)值相對(duì)越大.
傳統(tǒng)RFM模型中未對(duì)各參數(shù)指標(biāo)設(shè)置權(quán)值,而權(quán)值的設(shè)置可以體現(xiàn)出參數(shù)指標(biāo)的重要程度,使客戶細(xì)分更為準(zhǔn)確.課題組采用AHP(層次分析法)得到各項(xiàng)參數(shù)指標(biāo)的權(quán)值[ωT,ωF,ωM]=[0.11,0.26,0.63].
利用分箱法對(duì)各參數(shù)指標(biāo)進(jìn)行打分,計(jì)算客戶RRM綜合價(jià)值,其計(jì)算方法如公式(1)所示.
TFM=ωTT′+ωFF′+ωMM′
(1)
其中,ωT,ωF,ωM分別為T,F,M三個(gè)數(shù)據(jù)分析指標(biāo)的權(quán)重,T′,F′,M′為對(duì)應(yīng)三個(gè)數(shù)據(jù)分析指標(biāo)得分.將客戶以上指標(biāo)屬性以及TFM得分作為輸入變量,采用聚類算法,進(jìn)行客戶聚類分析,確定不同行為特征與價(jià)值的客戶群.
數(shù)據(jù)處理是模型實(shí)施的保障,數(shù)據(jù)預(yù)處理所得到的數(shù)據(jù)質(zhì)量將直接影響到汽車4S店客戶細(xì)分結(jié)果的精度和性能.因此,在進(jìn)行實(shí)驗(yàn)之前需要對(duì)原始數(shù)據(jù)進(jìn)行處理,具體的數(shù)據(jù)處理過程如圖1所示.對(duì)于原始數(shù)據(jù),課題組采用了某汽車4S店售后數(shù)據(jù),其中包含汽車4S店的客戶基本信息、售后服務(wù)信息等.課題組使用SPSS作為數(shù)據(jù)預(yù)處理的主要工具,對(duì)原始數(shù)據(jù)進(jìn)行數(shù)據(jù)清理過濾等操作.其中,數(shù)據(jù)清理主要對(duì)數(shù)據(jù)集中缺失的數(shù)據(jù)進(jìn)行缺失值處理,采取SPSS自帶的臨近點(diǎn)中位數(shù)的方法為缺失值進(jìn)行填補(bǔ);然后依據(jù)所需的指標(biāo)屬性對(duì)處理后的數(shù)據(jù)進(jìn)行過濾,并做相應(yīng)的運(yùn)算,最終獲取模型指標(biāo)數(shù)據(jù).
在用于客戶細(xì)分的數(shù)據(jù)挖掘算法中,聚類算法是一種很重要的數(shù)據(jù)挖掘算法,它包括了劃分法、層次法、密度算法、圖論聚類法等.常用的聚類算法包括以下幾個(gè):
DBSCAN(Density-Based on Spatial Clustering of Application with Noise)算法是一種經(jīng)典的基于密度的聚類方法[11],其基本思想是從某個(gè)選定的核心點(diǎn)出發(fā),不斷向密度可達(dá)的區(qū)域擴(kuò)張,最終得到一個(gè)包含核心點(diǎn)和邊界點(diǎn)的最大化區(qū)域[12].該算法的優(yōu)點(diǎn)是不需要定義聚類的簇?cái)?shù),并且能夠較好地處理噪聲數(shù)據(jù),但對(duì)樣本集的密集程度較為敏感,在樣本集數(shù)據(jù)密度不均勻、聚類間距差相差很大時(shí),聚類質(zhì)量較差.
BIRCH(Balanced Iterative Reducing and Clustering using Hierarchies)算法是一種使用距離來控制聚類形狀的層次聚類方法,適用于聚類非常大的數(shù)據(jù)集[13].其中涉及到聚類特征(CF)和聚類特征樹(CF Tree)兩個(gè)概念,其核心思想是通過掃描數(shù)據(jù)庫(kù),建立一個(gè)初始存放于內(nèi)存中的聚類特征樹,然后對(duì)聚類特征樹的葉結(jié)點(diǎn)進(jìn)行聚類.CF是指三元組CF =(N,LS,SS),用來概括子簇信息.其中N為簇中d維點(diǎn)的數(shù)目;LS為N個(gè)點(diǎn)的線性和;SS為N個(gè)點(diǎn)的平方和.CF樹是一棵具有兩個(gè)參數(shù)的高度平衡樹,用來存儲(chǔ)層次聚類的聚類特征[14].該算法的缺點(diǎn)在于聚類結(jié)果依賴于數(shù)據(jù)點(diǎn)的插入順序,對(duì)于高維數(shù)據(jù)聚類效果不好.
K-means算法是一種最為常用的無監(jiān)督聚類算法[15].K-means算法的思想是設(shè)數(shù)據(jù)集含有n個(gè)數(shù)據(jù)對(duì)象,首先從這n個(gè)數(shù)據(jù)對(duì)象中隨機(jī)選取出k個(gè)對(duì)象作為初始聚類中心,對(duì)于剩余的對(duì)象根據(jù)每個(gè)數(shù)據(jù)對(duì)象與k個(gè)聚類中心的相似程度將其分配到最相似的簇中,然后對(duì)于每一個(gè)簇,將簇中的所有對(duì)象的平均值作為新的聚類中心,進(jìn)行下次迭代,不斷重復(fù)該過程,直到簇中心不再發(fā)生變化,準(zhǔn)則函數(shù)收斂[16].其缺點(diǎn)是需要提前設(shè)置聚類個(gè)數(shù),在大規(guī)模數(shù)據(jù)聚類上收斂速度慢;但具有原理簡(jiǎn)單,容易實(shí)現(xiàn),小規(guī)模數(shù)據(jù)聚類收斂速度快,聚類效果較優(yōu),算法的可解釋度較強(qiáng),所需調(diào)參的參數(shù)少等優(yōu)點(diǎn).
結(jié)合汽車4S店數(shù)據(jù)特點(diǎn),比較以上三種算法,K-means算法對(duì)數(shù)據(jù)密度不均勻及數(shù)據(jù)點(diǎn)插入順序要求不敏感,在小規(guī)模數(shù)據(jù)上數(shù)據(jù)具有收斂速度快,聚類效果好的優(yōu)勢(shì).因此,課題組將采用K-means聚類算法對(duì)預(yù)處理后的數(shù)據(jù)進(jìn)行聚類劃分.
圖2 K-means聚類算法流程圖Fig.2 K-means clustering algorithm flow chart
在改進(jìn)得到的TFM模型基礎(chǔ)上利用K-means算法進(jìn)行聚類分析得到不同的客戶群,具體聚類過程如圖2所示.K-means算法的具體步驟:
1)從預(yù)處理的數(shù)據(jù)中隨機(jī)抽取2000個(gè)數(shù)據(jù),并將抽取的客戶數(shù)據(jù)作為一個(gè)數(shù)據(jù)集由X表示,其中每一條客戶數(shù)據(jù)用xi表示,即X={xi|i=1,2,…,2000}.在每一條客戶數(shù)據(jù)中均包含了3個(gè)數(shù)據(jù)分析指標(biāo),分別表示為xiT,xiF,xiM.
2)設(shè)定細(xì)分客戶群的個(gè)數(shù)為8個(gè),即n=8,并選定8個(gè)客戶數(shù)據(jù)在作為初始客戶群中心,表示為a1,a2,…,a8.
3)將每個(gè)客戶xi與每個(gè)初始客戶群中心通過公式(2)進(jìn)行距離計(jì)算比較,并將其分配到最近的客戶群中.
(2)
4)在將所有的客戶數(shù)據(jù)分群后,對(duì)8個(gè)客戶群的每個(gè)客戶群中心利用公式(3)計(jì)算得到新的客戶群中心aj.
(3)
其中Nj是第j個(gè)客戶群中所包含的客戶數(shù)據(jù)的個(gè)數(shù),Sj表示第j個(gè)客戶群,而xi表示其所在客戶群的每一條客戶數(shù)據(jù).
5)計(jì)算總體平方差,判斷客戶群中心是否不再發(fā)生變化.若不在變化,則輸出最終的8個(gè)客戶群,即Sj={S1,S2,…,S8},否則轉(zhuǎn)至第3步,重復(fù)計(jì)算直至客戶群中心不再發(fā)生變化.
課題組采用SPSS Clementine軟件,對(duì)汽車4S店客戶進(jìn)行聚類分析.在數(shù)據(jù)處理獲得的TFM分析數(shù)據(jù)表基礎(chǔ)上,根據(jù)屬性得分利用K-means聚類算法細(xì)分客戶,依據(jù)各類之間相似度,最終確定K取值為8,即將客戶分成8類,將每個(gè)類別的客戶指標(biāo)統(tǒng)計(jì)值與總體統(tǒng)計(jì)值對(duì)比,確定每個(gè)類別客戶特征.具體的聚類模型數(shù)據(jù)流程如圖3所示.
圖3 聚類模型流程Fig.3 Process of clustering model
此次聚類分析選取某汽車4S店半年之內(nèi)產(chǎn)生的數(shù)據(jù)作為分析對(duì)象,隨機(jī)抽取部分客戶進(jìn)行分析,其中共包含2000個(gè)樣本.具體輸入指標(biāo)有近期回店時(shí)間比(指標(biāo)T)、回店次數(shù)比(指標(biāo)F)及消費(fèi)金額(指標(biāo)M).通過K-means聚類分析,得到各個(gè)細(xì)分類別,并將各聚類結(jié)果輸出.同時(shí)得出各聚類之間相似度,其相似度結(jié)果如表2所示,通過表2可以發(fā)現(xiàn)此次的聚類效果是較好的.
表2 各類之間相似度Table 2 Similarity between categories
改進(jìn)的TFM模型與傳統(tǒng)RFM的聚類結(jié)果分別如圖4、圖5所示,其中包括聚類類別和指標(biāo)分布情況.根據(jù)聚類輸出的各指標(biāo)分布,對(duì)TFM聚類、RFM聚類的各個(gè)類別分別進(jìn)行計(jì)量統(tǒng)計(jì)并分析,其聚類結(jié)果分析如表3、表4所示.在TFM聚類結(jié)果分析中,將T、F指標(biāo)中位數(shù)與總體中位數(shù)對(duì)比,M指標(biāo)、TFM綜合得分(Z)的均值與總體均值對(duì)比;在RFM聚類結(jié)果分析中,將各類別指標(biāo)均值與總體均值進(jìn)行對(duì)比,確定每個(gè)類別客戶特征.
表3 TFM模型聚類結(jié)果分析Table 3 Analysis of TFM model clustering results
表4 RFM模型聚類結(jié)果分析Table 4 Analysis of RFM model clustering results
通過對(duì)比分析表3中TFM模型聚類結(jié)果與表4中RFM模型聚類結(jié)果分析發(fā)現(xiàn),在聚類類別的客戶數(shù)量上,RFM模型的客戶分布較為均勻,差別較小;而改進(jìn)的TFM模型中客戶分布差異較大,這表明TFM模型對(duì)客戶劃分更為準(zhǔn)確.在客戶聚類特征判斷中,傳統(tǒng)RFM模型聚類中的一般價(jià)值與低價(jià)值客戶類別特征相似度很高,例如類別6與類別7聚類結(jié)果基本一致,而改進(jìn)的TFM聚類中,將低價(jià)值客戶群細(xì)分為低價(jià)值發(fā)展客戶、挽留客戶及已流失客戶.各客戶群之間差異明顯,這使得低價(jià)值客戶細(xì)分的準(zhǔn)確度更高.在一般價(jià)值與低價(jià)值客戶聚類細(xì)分上,改進(jìn)的TFM模型聚類細(xì)分優(yōu)于傳統(tǒng)的RFM模型.
通過汽車4S店客戶歷史數(shù)據(jù)對(duì)客戶進(jìn)行分類,并針對(duì)不同客戶群體制定個(gè)性化服務(wù)策略以提高汽車4S店服務(wù)質(zhì)量與收益一直是汽車4S客戶管理的重點(diǎn).傳統(tǒng)RFM模型在通信、銀行、旅游等行業(yè)應(yīng)用廣泛,各行業(yè)中均有相關(guān)的文獻(xiàn)利用RFM模型進(jìn)行客戶細(xì)分,為其行業(yè)的管理者在客戶管理決策上提供了幫助,然而對(duì)于汽車4S店客戶細(xì)分卻不能完全適用.課題組改進(jìn)形成新的TFM客戶細(xì)分模型在客戶分群中,能夠更加準(zhǔn)確的細(xì)分客戶,在一般價(jià)值與低價(jià)值客戶判別上優(yōu)于傳統(tǒng)RFM模型.相對(duì)RFM模型,TFM模型可依據(jù)客戶行為的變化情況,更好地進(jìn)行服務(wù)決策,提高客戶管理效率,對(duì)不同客戶提供個(gè)性化服務(wù),有助于汽車4S店以盡量小的成本費(fèi)用獲取更大的利潤(rùn).
研究過程中,在客戶細(xì)群準(zhǔn)確度及客戶一般價(jià)值、低價(jià)值判別上,TFM模型具有一定的優(yōu)勢(shì),但在較高價(jià)值與高價(jià)值的客戶細(xì)分上,改進(jìn)的TFM模型與傳統(tǒng)RFM模型基本一致,需要進(jìn)一步優(yōu)化改進(jìn).在下一步研究中,優(yōu)化改進(jìn)TFM模型在高價(jià)值客戶上的判別細(xì)分,并在客戶細(xì)分的基礎(chǔ)上對(duì)各客戶群進(jìn)行客戶流失預(yù)測(cè),獲取具有流失傾向的客戶.