摘要:電信業(yè)是典型的數(shù)據(jù)密集行業(yè),客戶分群對(duì)電信企業(yè)發(fā)現(xiàn)更多的商機(jī)有重要作用。該文利用商業(yè)數(shù)據(jù)挖掘自動(dòng)化軟件KXEN并依據(jù)其方法給出了電信客戶分群的解決方案。
關(guān)鍵詞:客戶分群;KXEN
中圖分類號(hào):TP311文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2009)14-3815-02
Telecom Customer Segmentation Analysis with KXEN
LUO Ye, CAI Qiu-ru, LIU Yi-jun, LI Bin-zhang
(School of Computer Science and Engineering, Jiangsu Teachers University of Technology, Changzhou 213001,China)
Abstract: Customer segmentation is very important for Telecom to discover more commercial chances. The paper proposes a resolution of customer segmentation for Changzhou telecom based on the commercial automatic data mining tool KXEN and its method.
Key words: Customer segmentation; KXEN
1 引言
電信業(yè)是典型的數(shù)據(jù)密集行業(yè), 隨著電信體制改革的深化, 電信業(yè)的競(jìng)爭(zhēng)也日趨激烈。與其他行業(yè)相比,電信行業(yè)擁有更多的有關(guān)用戶的數(shù)據(jù)。誰能正確地分析這些數(shù)據(jù)所得到有用的知識(shí), 誰就能更好地向用戶提供服務(wù), 能夠發(fā)現(xiàn)更多的商機(jī), 從而在競(jìng)爭(zhēng)中獲勝。而數(shù)據(jù)挖掘可以從大量數(shù)據(jù)中抽取挖掘出未知的、有價(jià)值的模式或規(guī)律等知識(shí),因此數(shù)據(jù)挖掘應(yīng)用開發(fā)對(duì)電信企業(yè)的發(fā)展有重要意義[1]。
KXEN是商業(yè)數(shù)據(jù)挖掘自動(dòng)化軟件,其特點(diǎn)在于專注數(shù)據(jù)挖掘的高端技術(shù),面向結(jié)果而不是面向方法。用戶不需要專業(yè)的統(tǒng)計(jì)學(xué)背景和機(jī)器學(xué)習(xí)的理論,而只需要知道數(shù)據(jù)和想分析的問題,對(duì)于每種問題,KXEN都提供一種簡單的解決方案。本文以江蘇省常州電信為例,利用KXEN并依據(jù)其方法給出了電信客戶分群的解決方案。
2 客戶分群原理
電信的數(shù)據(jù)挖掘應(yīng)用開發(fā),主要進(jìn)行客戶分群、客戶流失分析、客戶發(fā)展分析、客戶行為分析等數(shù)據(jù)挖掘?qū)n}分析,逐步實(shí)現(xiàn)業(yè)務(wù)預(yù)測(cè)和信息挖掘等功能??蛻舴秩菏歉鶕?jù)一個(gè)或多個(gè)客戶屬性組合把所有客戶劃分成不同的類,同類內(nèi)的客戶具有最大的相似性,異類間的客戶具有最大的差異性。通過對(duì)客戶合理的類別劃分,并對(duì)當(dāng)前客戶以及預(yù)期的客戶群作區(qū)段分析,判斷不同區(qū)段的突出特點(diǎn),對(duì)客戶總體構(gòu)成有準(zhǔn)確的認(rèn)識(shí),對(duì)客戶的服務(wù)和營銷更具針對(duì)性。對(duì)客戶分群可以達(dá)到如下目標(biāo)[2]:
1)了解客戶的總體構(gòu)成;
2)了解各種客戶價(jià)值的客戶群體特征;
3)了解流失客戶的客戶群體特征;
4)了解客戶群體的消費(fèi)特征;
5)了解各信用等級(jí)的客戶群體特征。
客戶分群后的結(jié)果可應(yīng)用于:對(duì)不同價(jià)值分段的客戶進(jìn)一步分析以了解各個(gè)分段的客戶組成;對(duì)流失傾向高的客戶進(jìn)一步細(xì)分以采取不同的挽留策略;對(duì)交叉銷售的目標(biāo)客戶進(jìn)一步細(xì)分以采取不同的行銷策略。
常用的數(shù)據(jù)挖掘技術(shù)包括關(guān)聯(lián)分析、異類分析、分類與預(yù)測(cè)、聚類分析以及演化分析等??蛻舴秩翰捎镁垲惙治黾夹g(shù)解決。
3 KXEN軟件特點(diǎn)分析
數(shù)據(jù)挖掘自動(dòng)化軟件KXEN特點(diǎn)如下[3-4]:
1) 在數(shù)據(jù)準(zhǔn)備階段,KXEN可以自動(dòng)化處理缺失值、奇異值、進(jìn)行自動(dòng)化編碼。KXEN獨(dú)特的預(yù)處理編碼技術(shù)和特征選擇方式,大量減少了建模時(shí)間。
2) KXEN在建模的時(shí)候不用額外的磁盤空間來存儲(chǔ)數(shù)據(jù),數(shù)據(jù)直接在數(shù)據(jù)倉庫內(nèi)部處理,很好的利用數(shù)據(jù)倉庫的性能,節(jié)省硬件成本,符合現(xiàn)在的Knowledge Discovery in Database的理念。
3) KXEN共有四個(gè)模塊(穩(wěn)健回歸、聰明分群、關(guān)聯(lián)規(guī)則和時(shí)間序列)來解決所有的商業(yè)數(shù)據(jù)挖掘問題。一個(gè)商業(yè)問題只有一種算法,因此不需要用戶選擇算法。所有算法都基于Vapnik的結(jié)構(gòu)風(fēng)險(xiǎn)最小化理論。
4) KXEN進(jìn)行自動(dòng)建模,不需要進(jìn)行模型的參數(shù)設(shè)置,KXEN引擎采用結(jié)構(gòu)風(fēng)險(xiǎn)最小化理論,找到最佳模型。
5) 結(jié)果的可解釋性。KXEN所有組件的設(shè)計(jì)都使之對(duì)最終用戶呈現(xiàn)有意義的結(jié)果。
由于上述特點(diǎn),KXEN改變了傳統(tǒng)的數(shù)據(jù)挖掘方法,數(shù)據(jù)準(zhǔn)備時(shí)間從以前的占整個(gè)建模周期的70%到現(xiàn)在的幾乎不用花時(shí)間,如圖1和圖2所示。而KXEN的模型與傳統(tǒng)工具創(chuàng)建的模型一樣精確健壯。
4 應(yīng)用實(shí)例
4.1 業(yè)務(wù)問題
電信運(yùn)營商定義的客戶分群的商業(yè)目標(biāo)是“對(duì)市數(shù)十萬公眾客戶,從價(jià)值和行為的分析維度進(jìn)行客戶分群,以了解不同客戶群的消費(fèi)行為特征,為發(fā)展新業(yè)務(wù)、流失客戶保有、他網(wǎng)用戶爭(zhēng)奪的針對(duì)性營銷策略的制訂提供分析依據(jù),并實(shí)現(xiàn)企業(yè)保存量、激增量的戰(zhàn)略目標(biāo)”。將此商業(yè)目標(biāo)轉(zhuǎn)化為數(shù)據(jù)挖掘的可行性方案:從價(jià)值和行為維度,考察客戶業(yè)務(wù)擁有與使用、消費(fèi)行為變化、他網(wǎng)業(yè)務(wù)滲透等方面屬性,采用聚類分析的數(shù)據(jù)挖掘技術(shù)對(duì)研究的目標(biāo)客戶進(jìn)行客戶分群,對(duì)各客戶群進(jìn)行特征刻畫和屬性分析,為針對(duì)性營銷確定目標(biāo)客戶群,并根據(jù)客戶群屬性和營銷目標(biāo)量體裁衣制訂恰當(dāng)?shù)臓I銷方案。
4.2結(jié)果分析
本文在常州選擇了營銷服務(wù)相對(duì)薄弱的小型商客作為目標(biāo)客戶群,取得目標(biāo)客戶群的近一年的相關(guān)數(shù)據(jù)。其中小型商客是指客戶有1-2門電話、小靈通的客戶,不包含已經(jīng)安裝寬帶的客戶,有效小型商客為23074戶?;A(chǔ)表涵蓋了以下數(shù)據(jù):1) 用戶及客戶的基本信息:包括客戶身份信息、聯(lián)系方式、產(chǎn)品擁有情況、入網(wǎng)時(shí)長、服務(wù)開通情況、優(yōu)惠套餐信息、客戶服務(wù)信息(投訴、咨詢、催繳情況)等;2) 價(jià)值信息:包括業(yè)務(wù)月租費(fèi)、使用費(fèi)、優(yōu)惠費(fèi)用及增值業(yè)務(wù)、新業(yè)務(wù)、信息費(fèi)和卡類、結(jié)算費(fèi)用、繳欠費(fèi)信息等;3) 行為信息:包括時(shí)長、次數(shù)、跳次、發(fā)話不同號(hào)碼數(shù)、時(shí)長集中度、次數(shù)集中度等。
KXEN軟件分群采用結(jié)構(gòu)風(fēng)險(xiǎn)最小化的K-Means算法實(shí)現(xiàn)。本文使用KXEN軟件從價(jià)值緯度(V)將客戶分為6個(gè)價(jià)值分群,從行為緯度(B)將客戶分為5個(gè)行為分群。其中參加分群的V變量有21個(gè),B變量有15個(gè)。然后對(duì)V變量按總費(fèi)用進(jìn)行群排序,形成VB矩陣交叉圖,如圖3和圖4所示。在組成的交叉矩陣中選出1000人以上的8個(gè)戰(zhàn)略客戶群SS1-SS8,共有客戶17128戶,占總客戶的比例為74.23%。
根據(jù)分群結(jié)果,計(jì)算出每個(gè)群的平均收入進(jìn)行客戶價(jià)值分析:
ARPU=客戶群總收入/m
式中m為該群客戶人數(shù),ARPU(Average Revenue Per User)為每用戶平均收入。圖5是各群分布?xì)馀輬D。圖中氣泡的大小代表客戶數(shù)的多少。SS7、SS8客戶群最大。橫軸方向越靠右,表明客戶價(jià)值越高。SS1、SS2、SS3群為高值的小商客,SS7、SS8為低值小商客。縱軸表明客戶的消費(fèi)趨勢(shì)值情況,橫軸以下為下降趨勢(shì),偏離越多,下降值越大。SS2群下降最多,SS1上升最為明顯。
以中值下降的SS6戰(zhàn)略客戶群為例進(jìn)行特征分析,可得到該群特征如下:
1)該群為中值下降群,ARPU值為93.35元??傎M(fèi)用趨勢(shì)下降較明顯,月均下降5.28元,各項(xiàng)費(fèi)用均呈下降趨勢(shì)。
2)該群客戶為長話低值客戶,長話主要使用傳統(tǒng)長途。
3)使用他網(wǎng)卡較多,但他網(wǎng)IP卡下降趨勢(shì)明顯。SS6群使用非電信卡消費(fèi)均值最高,長話流失嚴(yán)重。
針對(duì)上述情況,采用的營銷策略是用超級(jí)IP、商務(wù)行、17908卡等有針對(duì)性地開展策反工作。
5 結(jié)束語
數(shù)據(jù)挖掘可以對(duì)大量數(shù)據(jù)進(jìn)行自動(dòng)分析,發(fā)現(xiàn)有價(jià)值的模式或規(guī)律。聚類分析能幫助企業(yè)進(jìn)行客戶分群,從而應(yīng)用于目標(biāo)市場(chǎng)營銷。本文利用數(shù)據(jù)挖掘工具KXEN出了一個(gè)電信企業(yè)客戶分群的解決方案。實(shí)踐證明本文提供的電信目標(biāo)市場(chǎng)營銷客戶分群的解決方案是成功有效的。
參考文獻(xiàn)
[1] 張建萍,劉希玉.基于聚類分析的K-means算法研究及應(yīng)用[J].計(jì)算機(jī)應(yīng)用研究, 2007(5):166-168.
[2] 陶露菁.基于數(shù)據(jù)挖掘的電信客戶分群設(shè)計(jì)和實(shí)現(xiàn)[D].南京大學(xué)碩士學(xué)位論文,2005.06.
[3] 劉文.凱森(KXEN)商業(yè)數(shù)據(jù)挖掘[EB/OL].www.datom-i.com,2008
[4] 劉文.KXEN市場(chǎng)細(xì)分教程[EB/OL].http://www.amteam.org/print.aspx?id=606090,2007.7
[5]蘇寧軍.采用聚類分析的數(shù)據(jù)挖掘技術(shù)進(jìn)行電信市場(chǎng)客戶分群[EB/OL].http://www.billingchina.com/html/2006-07-03/1726.html,2006.7