鄭州航空工業(yè)管理學(xué)院實(shí)驗(yàn)室管理處計(jì)算中心 王海燕 李曉玲
客戶關(guān)系管理(CRM,Customer Relationship Management),可以理解為應(yīng)用信息技術(shù)為企業(yè)提供全面的、個(gè)性化的客戶資料,從而使客戶與企業(yè)間所有的過(guò)程和互動(dòng)能夠有助于維系和拓展這種互利關(guān)系的一種商業(yè)戰(zhàn)略。其核心思想來(lái)自市場(chǎng)營(yíng)銷理論,強(qiáng)調(diào)以客戶為中心,通過(guò)完善的客戶服務(wù)和深入的客戶分析來(lái)滿足客戶的需求,不斷提高客戶的滿意度和忠誠(chéng)度,進(jìn)而實(shí)現(xiàn)客戶的終生價(jià)值。在過(guò)去的幾年CRM已經(jīng)變成每個(gè)企業(yè)獲得成功的重要部分。
而CRM的核心是客戶理解,“正確的客戶理解和由此引導(dǎo)的行動(dòng)可提高顧客的終身價(jià)值。不恰當(dāng)?shù)目蛻衾斫鈱?dǎo)致冒險(xiǎn)盲目的行動(dòng)和措施 ”。因此本文利用數(shù)據(jù)挖掘中的聚類技術(shù)對(duì)客戶進(jìn)行分析,理解客戶的分布和特征。
不同的數(shù)據(jù)挖掘工具可以從客戶數(shù)據(jù)庫(kù)抽取不同目的的信息,同時(shí)通過(guò)分析顧客的問(wèn)題來(lái)為企業(yè)吸引更多的客戶。在數(shù)據(jù)挖掘中最早和最簡(jiǎn)單的分析步驟是描述數(shù)據(jù),例如,總結(jié)它的統(tǒng)計(jì)特征(例如平均值和標(biāo)準(zhǔn)差),用圖表和圖形可以形象地觀察,查看數(shù)據(jù)域內(nèi)值的分布情況。用數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則來(lái)詳細(xì)地分析客戶的交易數(shù)據(jù),從中得知顧客同時(shí)會(huì)購(gòu)買哪些商品,基于規(guī)則可以組合流行產(chǎn)品,基于規(guī)則可以讓營(yíng)銷人員和企業(yè)決策者制定市場(chǎng)營(yíng)銷策略或操作規(guī)則,并且積極提供客戶感興趣的產(chǎn)品[1]。用數(shù)據(jù)挖掘中的聚類來(lái)為客戶進(jìn)行分群,將具有相似消費(fèi)行為的客戶歸為一組,理解客戶并提供相應(yīng)的個(gè)性化服務(wù)。數(shù)據(jù)挖掘中的分類可以用于客戶行為預(yù)測(cè),挖掘潛在消費(fèi)人群,刺激其消費(fèi)。
聚類,顧名思義,即物以類聚,人以群分。所以聚類的定義為將物理的或抽象對(duì)象的集合分成相似的對(duì)象類的過(guò)程成為聚類(cl ust er ing)[2]。簇(cl ust er)是數(shù)據(jù)對(duì)象的集合,這些對(duì)象與同一個(gè)簇中的對(duì)象彼此相似,而與其他簇中的對(duì)象相異。簡(jiǎn)單地說(shuō),從人類對(duì)這個(gè)社會(huì)具有認(rèn)知性開(kāi)始聚類活動(dòng)就一直存在,我們會(huì)通過(guò)不停地改進(jìn)下意識(shí)的聚類模式來(lái)學(xué)習(xí)如何識(shí)別蘋果和梨,通過(guò)尋找和區(qū)分對(duì)象所具有的特征來(lái)區(qū)植物和動(dòng)物等等。
聚類分析已經(jīng)廣泛應(yīng)用于圖像處理、模式識(shí)別、數(shù)據(jù)分析和市場(chǎng)研究等領(lǐng)域。在商業(yè)領(lǐng)域聚類能夠幫助市場(chǎng)分析人員根據(jù)顧客的購(gòu)買模式從客戶數(shù)據(jù)庫(kù)中發(fā)現(xiàn)不同的顧客群,總結(jié)顧客群的特征,就是我們所說(shuō)的“人以群分”,比如可以識(shí)別具有高水平索賠額的汽車保險(xiǎn)持有者組群,進(jìn)而提出具有針對(duì)性的市場(chǎng)營(yíng)銷策略。在生物領(lǐng)域,聚類分析可以用來(lái)推導(dǎo)不同物種的分類,根據(jù)相似功能對(duì)基因進(jìn)行分類,獲得對(duì)種群中固有結(jié)構(gòu)的認(rèn)識(shí)。
由聚類所用標(biāo)準(zhǔn)的不同可以將聚類分為劃分方法、層次方法、基于密度的方法和基于網(wǎng)格的方法。
下面依次經(jīng)過(guò)數(shù)據(jù)預(yù)處理、算法分析、結(jié)果解釋和提出針對(duì)性意見(jiàn)等步驟來(lái)實(shí)現(xiàn)將聚類分析應(yīng)用到客戶關(guān)系管理中。
本文所用數(shù)據(jù)為某4s店的客戶消費(fèi)數(shù)據(jù),為了便于分析,需要將某些屬性量化處理。將分類數(shù)據(jù)進(jìn)行量化處理,以上挑選出的分類屬性有“車主姓名”、“性別”、“所在行業(yè)”、“車主婚姻狀況”、“車主教育狀況”、“車主家庭收入”、“配置”等?!败囍骷彝ナ杖搿钡膶傩灾等〉氖且粋€(gè)個(gè)的取值范圍,比如“3000-5999元、6000-9999元、10000-14999元……30000-50000元、50000元以上”,所以也要對(duì)其進(jìn)行量化處理。對(duì)于有高低之分的屬性取值如“車主教育狀況”、“車主家庭收入”、“配置”量化時(shí)就按數(shù)字從高到低進(jìn)行。
DBSCAN算法為聚類分析技術(shù)中應(yīng)用廣泛且成熟的經(jīng)典算法,因此本文也選用此算法建模對(duì)數(shù)據(jù)進(jìn)行分群分析。DBSCAN[3](Densit y-Based Spat ial Cl ust er ing of Appl icat ions wit h Noise)可處理噪聲的基于密度的空間聚類算法是一個(gè)基于密度的聚類算法。表1描述核心對(duì)象的定義是如果一個(gè)對(duì)象的ε鄰域內(nèi)包含至少M(fèi)inPts個(gè)數(shù)據(jù)對(duì)象,則此對(duì)象被稱為一個(gè)核心對(duì)象。DBSCAN具體步驟如下:
表1 DBSCAN算法描述
本次建模算法運(yùn)行中參數(shù)設(shè)置MinPts=4,半徑ε= 0.9。
表2 聚類結(jié)果簇特征分析
經(jīng)過(guò)分析數(shù)據(jù)集被劃分成四個(gè)簇,簇1包含3578條數(shù)據(jù),所占比例為70%;簇2包含1240條數(shù)據(jù),所占比例為24%;簇3包含123條數(shù)據(jù),所占比例為2%;簇4包含181條數(shù)據(jù),所占比例為4%。最后總結(jié)各個(gè)簇的特征,并給出相應(yīng)的建議,如表2所示。
本文將聚類分析應(yīng)用到客戶關(guān)系管理中,目的用來(lái)理解客戶,相比傳統(tǒng)的統(tǒng)計(jì)總結(jié)而言,本方法不僅可以根據(jù)客戶特征對(duì)客戶進(jìn)行分群,還能更好的總結(jié)出各個(gè)群體的特征。
下一步嘗試將關(guān)聯(lián)規(guī)則分析、分類分析也應(yīng)用到CRM中,利用關(guān)聯(lián)規(guī)則來(lái)詳細(xì)地分析客戶的交易數(shù)據(jù),基于規(guī)則組合流行產(chǎn)品,讓營(yíng)銷人員和企業(yè)決策者制定市場(chǎng)營(yíng)銷策略或操作規(guī)則,并且積極提供客戶感興趣的產(chǎn)品,利用分類可以預(yù)測(cè)客戶行為,挖掘潛在消費(fèi)人群,刺激其消費(fèi)。
[1]Chen R S,Wu R C,Chen J Y,Data Mining Application in Customer Relationship Management Of Credit Card Business,in proceedings of the IEEE,29th Annual International Computer Software and Applications Conference,2005.
[2]Jiawei Han,Micheline Kamber著;范明,孟小峰譯.Data Mining Concepts and Techniques[M].北京:機(jī)械工業(yè)出版社,2004.
[3]Ester M,Kriegel H P,Sander J et al.A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise,Proceedings of 2nd Int.Conf.On Knowledge Discovery and Data Mining[C].Portland,OR,1996:226-231.