王未卿 龔曉狄 劉澄
[摘 要] 客戶細(xì)分是商業(yè)銀行客戶關(guān)系管理的核心技術(shù)之一。本文首先對(duì)國(guó)內(nèi)某商業(yè)銀行客戶的性別、年齡、學(xué)歷、職業(yè)、年薪、婚姻狀況、健康狀況和居住年限8類重要屬性進(jìn)行標(biāo)準(zhǔn)化處理,利用聚類分析方法將客戶粗分為4類,進(jìn)而采用決策樹C5.0算法對(duì)該銀行客戶進(jìn)行細(xì)分,得出更為細(xì)致的分類規(guī)則。最后針對(duì)4類客戶的特征和屬性,設(shè)計(jì)出差異化的銀行客戶服務(wù)體系方案。
[關(guān)鍵詞] 客戶細(xì)分;決策樹;差異化營(yíng)銷
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2014 . 05. 019
[中圖分類號(hào)] F830.33;F830.49 [文獻(xiàn)標(biāo)識(shí)碼] A [文章編號(hào)] 1673 - 0194(2014)05- 0026- 04
0 引 言
在現(xiàn)代的商業(yè)銀行客戶關(guān)系管理(Customer Relationship Management, CRM)中,面對(duì)海量的客戶信息,銀行需要對(duì)數(shù)據(jù)庫(kù)中的原始客戶數(shù)據(jù)進(jìn)行深層次挖掘、合理分類,才有可能實(shí)現(xiàn)高效的管理。據(jù)美國(guó)META集團(tuán)的調(diào)查發(fā)現(xiàn),數(shù)據(jù)挖掘技術(shù)已經(jīng)在美國(guó)金融業(yè)、商貿(mào)業(yè)等行業(yè)得到了廣泛的應(yīng)用。采用數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘技術(shù)的企業(yè)大幅度提高了投資回報(bào)率,部分優(yōu)秀企業(yè)的投資回報(bào)率甚至達(dá)到每年600%。毋庸置疑,數(shù)據(jù)挖掘技術(shù)優(yōu)化了CRM系統(tǒng)的服務(wù)功能,可以為客戶服務(wù)提供準(zhǔn)確的參考信息,提高客戶事務(wù)的處理能力。因此,在銀行客戶管理中,數(shù)據(jù)挖掘技術(shù)得到高度重視。
利用數(shù)據(jù)挖掘技術(shù)對(duì)客戶進(jìn)行細(xì)分是客戶關(guān)系管理的重要一環(huán)。學(xué)者們致力于開發(fā)不同的數(shù)據(jù)挖掘技術(shù)進(jìn)行客戶細(xì)分研究,如基于KSP混合聚類算法的移動(dòng)商務(wù)中的客戶細(xì)分、基于模糊聚類集成算法的客戶細(xì)分等。對(duì)商業(yè)銀行而言,客戶的細(xì)分可以幫助銀行識(shí)別優(yōu)質(zhì)客戶,并針對(duì)不同客戶執(zhí)行個(gè)性化的營(yíng)銷策略,以實(shí)現(xiàn)合理分配資源,更好地進(jìn)行經(jīng)營(yíng)決策。其中,決策樹分類技術(shù)就是一種有效的對(duì)銀行客戶進(jìn)行分類的數(shù)據(jù)挖掘技術(shù)。最早,Quinlan等人(1986)提出決策樹ID3方法,該算法采用信息增益選擇策略的方式進(jìn)行分類,具有使用簡(jiǎn)單、樣本識(shí)別率高等優(yōu)點(diǎn),被廣泛應(yīng)用于客戶價(jià)值分析、反洗錢、客戶貸款預(yù)測(cè)等方面。ID3方法在銀行客戶分類中的應(yīng)用在很大程度上提高了客戶分類的準(zhǔn)確度。此后,一些學(xué)者開始嘗試對(duì)ID3算法進(jìn)行改進(jìn)??到『土涸蕵s(2003)改進(jìn)了決策樹的ID3算法,提出了數(shù)據(jù)挖掘結(jié)果可視化展現(xiàn)的兩層軟件結(jié)構(gòu),并以內(nèi)蒙某銀行為例驗(yàn)證了算法的可行性。鄒鵬 等(2011)針對(duì)客戶錯(cuò)誤分類不平衡的問(wèn)題,對(duì)經(jīng)典的ID3信息增益決策樹算法進(jìn)行改進(jìn),把對(duì)客戶誤判的代價(jià)納入考量范圍,構(gòu)建了一個(gè)代價(jià)敏感的決策樹對(duì)客戶價(jià)值進(jìn)行細(xì)分,驗(yàn)證了這個(gè)方法在挖掘優(yōu)質(zhì)客戶時(shí)更有效。
綜上所述,客戶關(guān)系管理要求銀行與客戶之間建立有效的溝通渠道,而決策樹分類技術(shù)進(jìn)一步優(yōu)化溝通的有效性,提高客戶關(guān)系管理效果,優(yōu)化管理決策。盡管如此,目前決策樹分類技術(shù)在銀行客戶分類應(yīng)用中仍然存在一些不足之處:一是決策樹算法的精度和效率有待于進(jìn)一步提高;二是在對(duì)銀行客戶細(xì)分之后,缺乏針對(duì)不同客戶營(yíng)銷方案的設(shè)計(jì)。針對(duì)以上不足,本文將繼續(xù)探索基于決策樹的銀行客戶分類研究,利用精度更高的C5.0決策樹分類算法,以銀行的真實(shí)數(shù)據(jù)樣本為例,對(duì)銀行客戶進(jìn)行細(xì)分,進(jìn)而針對(duì)不同類型的客戶提供具體的營(yíng)銷方案。
1 決策樹C5.0算法
在經(jīng)歷決策樹ID3、C4.5算法之后,C5.0算法采用決策樹剪枝技術(shù)和Boosting技術(shù),減少了過(guò)度擬合問(wèn)題,有效地提高了算法的效率和精度,并提升了處理大型數(shù)據(jù)的能力。
C5.0 算法采用最大屬性信息增益率來(lái)選擇屬性,下面簡(jiǎn)要介紹 C5.0 決策樹的產(chǎn)生及計(jì)算過(guò)程。假設(shè)集合數(shù)據(jù)S按屬性C劃分為m類不同的類數(shù)據(jù)子集Ci(i=1,2,…,m),每個(gè)類數(shù)據(jù)子集Ci(i=1,2,…,m)的樣本數(shù)為ni(i=1,2,…,m),pi為類別Ci(i=1,2,…,m)樣本數(shù)ni(i=1,2,…,m)占總樣本數(shù)n的比例,即pi=ni /n。S是n個(gè)樣本數(shù)據(jù)的集合,樣本數(shù)據(jù)集合的信息熵用下式表示:
E(S)=-■pi log2(pi)(1)
假設(shè)屬性A將樣本數(shù)據(jù)集合S劃分成v個(gè)子集Sv,每個(gè)子集Sv的取值均為av,nij是子集Sj中屬于Ci(i=1,2,…,m)類的樣本數(shù),p′j是屬于屬性A的屬性值為aj的樣本數(shù)占總樣本數(shù)的比例,即p′j=■nij/n,pij是屬性A屬性值為aj時(shí),類別為Ci(i=1,2,…,m)的概率,即pij=nij/■nij。屬性A的條件熵可以用下式表示:
E(S|A)=-■p′j■pij log2(pij)(2)
進(jìn)而可以得到屬性A的信息增益Gain(A),信息熵SplitI(A)和信息增益率GainRatio(A),三者的表達(dá)式分別為:
Gain(A)=E(S)-E(S|A)(3)
SplitI(A)=-■p′j log2(p′j)(4)
GainRatio(A)=Gain(A)/SplitI(A)(5)
然后通過(guò)比較各個(gè)屬性的信息增益率即可確定決策樹的節(jié)點(diǎn),重復(fù)以上過(guò)程,最終能夠得出屬性分類的決策樹。
2 商業(yè)銀行客戶分類
2.1 銀行客戶樣本及細(xì)分變量的選取
客戶樣本是從北京市某商業(yè)銀行客戶數(shù)據(jù)庫(kù)中隨機(jī)抽選得到,樣本數(shù)量為500個(gè)。每個(gè)銀行客戶樣本涵蓋其基本的個(gè)人信息、收入狀況和信用狀況等。
細(xì)分變量的選擇是客戶細(xì)分的基礎(chǔ),在進(jìn)行銀行客戶細(xì)分變量的選取時(shí),重點(diǎn)考慮變量的代表指標(biāo)的可獲得性、變量之間的差異性和變量的時(shí)效性。通常情況下,細(xì)分變量主要分為行為變量和描述型變量?jī)深?。行為變量是指涉及客戶消費(fèi)行為和其與銀行相互關(guān)系的一系列變量指標(biāo),它可以幫助銀行的營(yíng)銷人員和客戶服務(wù)人員掌握和理解客戶的交易行為。描述型變量主要是描述客戶基本屬性信息的靜態(tài)數(shù)據(jù),如客戶的性別、年齡、年薪、房屋住所等變量。
綜合考量銀行客戶細(xì)分變量的注意事項(xiàng),本文采取描述型變量細(xì)分法,選取性別、年齡、學(xué)歷、職業(yè)、年薪、婚姻狀況、健康狀況和居住年限8個(gè)變量作為銀行客戶細(xì)分的指標(biāo)。
2.2 基于聚類分析的銀行客戶初分
為了對(duì)銀行客戶特征進(jìn)行初步的判斷,采用聚類分析的方法對(duì)500個(gè)客戶樣本進(jìn)行初分。在聚類分析之前,首先將銀行客戶的各類特征屬性進(jìn)行標(biāo)準(zhǔn)化處理,處理的方法是將各指標(biāo)按照屬性的特征分為2~4類,具體規(guī)則見表1。
以上指標(biāo)經(jīng)過(guò)量化處理后,利用SPSS軟件中的系統(tǒng)聚類方法對(duì)原始數(shù)據(jù)進(jìn)行聚類分析,其中距離分析采用歐氏距離和類平均法。選取閾值16,將500名銀行客戶分為4類:低檔客戶、關(guān)注客戶、普通客戶以及重要客戶。分類結(jié)果描述如下。
(1)低檔客戶:類別1為低檔客戶,共有51位,年齡大部分在40~50歲之間,年薪整體水平相對(duì)較低,不正常。
(2)重要客戶:類別2為重要客戶,共有264位,年齡大部分在40~50歲之間,年薪整體水平相對(duì)較高,正常。
(3)關(guān)注客戶:類別3為關(guān)注客戶,共有37位,年齡大部分在35~45歲之間,年薪整體水平相對(duì)較低,不正常。
(4)普通客戶:類別4為普通客戶,共有148位,年齡大部分在20~30歲之間,未婚者多,年薪整體水平相對(duì)不高,正常。
2.3 基于決策樹的銀行客戶細(xì)分
在對(duì)銀行客戶的進(jìn)行決策樹細(xì)分之前,仍然需要對(duì)其8類特征屬性進(jìn)行標(biāo)準(zhǔn)化處理,然后按照聚類分析的4類客戶結(jié)果進(jìn)行匹配,挖掘客戶分類更為細(xì)致的規(guī)則。利用決策樹C5.0 方法對(duì)商業(yè)銀行客戶進(jìn)行分類,主要通過(guò)第二部分介紹的計(jì)算節(jié)點(diǎn)特征屬性信息增益率的方法對(duì)各類屬性進(jìn)行劃分。具體的過(guò)程利用SPSS Clementime軟件來(lái)實(shí)現(xiàn),并采用決策樹剪枝技術(shù)和Boosting技術(shù)提高分類的精確性。最終,在調(diào)節(jié)CF值為0.25,Boosting技術(shù)迭代5次的情況下,SPSS Clementime軟件進(jìn)行決策樹分類達(dá)到最優(yōu)的效果。最優(yōu)決策樹共含有10個(gè)葉節(jié)點(diǎn),如圖1所示。
總結(jié)銀行客戶決策樹分類結(jié)果,得出10個(gè)葉節(jié)點(diǎn)的決策規(guī)則,具體內(nèi)容如下:
(1)年薪30萬(wàn)元以上(第三、四類),則認(rèn)定該客戶為重要客戶。
(2)年薪30萬(wàn)元以下(第一、二類),年齡36歲以上(第三、四類),且學(xué)歷為高中、中專(第二類),則認(rèn)定該客戶為低檔客戶。
(3)年薪30萬(wàn)元以下(第一、二類),年齡36歲以上(第三、四類),且學(xué)歷為初中以下或本科以上(第一、三、四類),健康狀況良(第二類),則認(rèn)定該客戶為重要客戶。
(4)年薪30萬(wàn)元以下(第一、二類),年齡46歲以上(第四類),且學(xué)歷為初中以下或本科以上(第一、三、四類),健康狀況優(yōu)(第一類),則認(rèn)定該客戶為重要客戶。
(5)年薪30萬(wàn)元以下(第一、二類),年齡36~45歲之間(第三類),且學(xué)歷為初中以下或本科、大專(第一、三類),健康狀況為優(yōu)(第一類),則認(rèn)定該客戶為關(guān)注客戶。
(6)年薪30萬(wàn)元以下(第一、二類),年齡在36~45歲之間(第三類),且學(xué)歷為碩士或博士(第四類),健康狀況為優(yōu)(第一類),則認(rèn)定該客戶為普通客戶。
(7)年薪30萬(wàn)元以下(第一、二類),年齡20~35歲之間(第一、二類),性別男(第一類),則認(rèn)定該客戶為普通客戶。
(8)年薪30萬(wàn)元以下(第一、二類),年齡20~35之間(第一、二類),性別女(第二類),職業(yè)為教師、勘探設(shè)計(jì)、建筑設(shè)計(jì)、醫(yī)務(wù)服務(wù)類(第一、三類),學(xué)歷為本科、大專(第三類),則認(rèn)定該客戶為重要客戶。
(9)年薪30萬(wàn)元以下(第一、二類),年齡20~35之間(第一、二類),性別女(第二類),職業(yè)為教師、勘探設(shè)計(jì)、建筑設(shè)計(jì)、醫(yī)務(wù)服務(wù)類(第三類),學(xué)歷為碩士、博士(第四類),則認(rèn)定該客戶為普通客戶。
(10)年薪30萬(wàn)元以下(第一、二類),年齡20~35之間(第一、二類),性別女(第二類),職業(yè)為農(nóng)民、工人、學(xué)生、服務(wù)員、廣播電視臺(tái)、石化公司、網(wǎng)通保險(xiǎn)、銀行職員、軍人、煙草、公務(wù)員、房地產(chǎn)、進(jìn)出口貿(mào)易類(第一、二類),則為普通客戶。
3 商業(yè)銀行客戶分類營(yíng)銷方案設(shè)計(jì)
在對(duì)客戶細(xì)分之后,商業(yè)銀行可以針對(duì)不同的客戶采取差異化的營(yíng)銷方式。這樣不僅能夠有效地降低銀行運(yùn)營(yíng)成本,同時(shí)還可以為目標(biāo)客戶提供滿意的產(chǎn)品和服務(wù),以擴(kuò)大市場(chǎng)占有率。為此,本部分針對(duì)聚類分析得到的4類商業(yè)銀行客戶群,結(jié)合決策樹細(xì)分所得出的分類規(guī)則,為其設(shè)計(jì)差異化的營(yíng)銷方案。
3.1 重要客戶
重要客戶對(duì)銀行的綜合貢獻(xiàn)最大,是銀行主要的收入來(lái)源。因此,針對(duì)此類客戶銀行應(yīng)當(dāng)采取的策略有:建立客戶經(jīng)理“一對(duì)一”的服務(wù)制度,為其提供“一對(duì)一”的人性化、優(yōu)質(zhì)化服務(wù),對(duì)此類客戶的服務(wù)最終應(yīng)發(fā)展成為西方銀行所流行的私人銀行業(yè)務(wù)。提供個(gè)人高端理財(cái)業(yè)務(wù)、離岸業(yè)務(wù)、境外結(jié)算、實(shí)時(shí)匯兌、衍生交易、受托金融資產(chǎn)管理、代客投資理財(cái)?shù)确?wù),同時(shí)還可以提供各種優(yōu)惠,包括減免借記卡和信用卡的年費(fèi)、透支使用的利息、代收付業(yè)務(wù)的費(fèi)用;優(yōu)惠貸款利率、外匯買賣匯率、證券交易傭金等。通過(guò)上述方式為此類最有價(jià)值的客戶群體提供量身定制的個(gè)性化產(chǎn)品,提高客戶的滿意度與忠誠(chéng)度。
3.2 普通客戶
從聚類分析的結(jié)果來(lái)看,本文所劃分的普通客戶的平均年薪整體水平不高,同時(shí)居住年限也多為10年以下甚至有1/3以上的居住年限為5年以下,但是平均學(xué)歷卻比較高,大多數(shù)為本科以上學(xué)歷,所以這類客戶基本處于事業(yè)發(fā)展的初期階段,大多數(shù)應(yīng)為年輕客戶,同時(shí),升為重要客戶的可能性比較大,因此可以針對(duì)其特點(diǎn)實(shí)行特別的營(yíng)銷策略。
首先,要定期對(duì)客戶的成長(zhǎng)潛力進(jìn)行有效評(píng)估,比如可以觀察其年薪增長(zhǎng)率和儲(chǔ)蓄基金等賬戶金額變動(dòng),對(duì)一些有較大可能發(fā)展為重要客戶的客戶,可以開展持卡消費(fèi)積分或者抽獎(jiǎng)以及持卡繳費(fèi)減免手續(xù)費(fèi)等優(yōu)惠活動(dòng)。其次,對(duì)于這類客戶中年薪增長(zhǎng)緩慢但是也能給銀行帶來(lái)穩(wěn)定收入的客戶,銀行可以盡可能多地進(jìn)行客戶問(wèn)卷調(diào)查或回訪,了解其需求,通過(guò)提供更優(yōu)質(zhì)的、個(gè)性化的服務(wù)來(lái)吸引這些客戶,比如銀行可以針對(duì)性地為客戶提供一些理財(cái)產(chǎn)品或者基金產(chǎn)品;針對(duì)客戶的消費(fèi)行為,提供POS消費(fèi)免手續(xù)費(fèi);完善銀行的網(wǎng)上付款系統(tǒng),降低客戶消費(fèi)成本,使他們更忠誠(chéng)于本銀行,從而持久性地為銀行創(chuàng)造價(jià)值。
3.3 低檔客戶
本文所劃分的低檔客戶存在的特點(diǎn)是居住年限長(zhǎng)達(dá)18.6年,平均年薪雖然遠(yuǎn)遠(yuǎn)低于重點(diǎn)客戶,但是卻高于普通客戶和關(guān)注客戶,說(shuō)明這組客戶群應(yīng)該是中年穩(wěn)定客戶,他們的賬戶總額應(yīng)該不會(huì)有太大變動(dòng),收入也不是特別高,因此對(duì)于這類客戶主要任務(wù)是采取相應(yīng)的營(yíng)銷策略防止其流失。
因?yàn)樵擃惪蛻艚o銀行帶來(lái)穩(wěn)定的收益,且中年客戶不像年輕客戶沒(méi)有很多的消費(fèi)金額,因此可以針對(duì)這類客戶的刷卡消費(fèi)進(jìn)行消費(fèi)積分,一方面是鼓勵(lì)消費(fèi),增加銀行的業(yè)務(wù)收入,另一方面對(duì)客戶的消費(fèi)積分進(jìn)行累計(jì)換購(gòu)或者積分換禮等活動(dòng),提升這類客戶的忠誠(chéng)度,保證銀行的這類客戶的利潤(rùn)來(lái)源。同時(shí)這類客戶可能對(duì)銀行的中間代收業(yè)務(wù)使用頻繁,可以為他們提供便捷的自助式繳費(fèi)方式,如存折、銀行卡繳費(fèi)服務(wù)等,以防止這類客戶流失。
3.4 關(guān)注客戶
關(guān)注類客戶群的年齡范圍在35~45歲之間,年薪在4類客戶群體中是最低的。此類客戶貸款違約的可能性較大,是對(duì)商業(yè)銀行的收入貢獻(xiàn)最低的,也是對(duì)于銀行來(lái)說(shuō)價(jià)值最低的。因此,此類客戶對(duì)銀行的吸引力較小,銀行將投入較少的資源甚至采取一些營(yíng)銷策略試圖解除與該類客戶的關(guān)系。
盡管如此,銀行也不能以任何理由將此類客戶拒之門外,而向其收取額外的服務(wù)費(fèi)用也是有限制的。因此,銀行只好被動(dòng)地為其提供存款類業(yè)務(wù)和一些中間服務(wù),包括定期存款、活期存折、存單質(zhì)押、轉(zhuǎn)賬匯款、自助銀行、網(wǎng)上銀行、電話銀行和代收代付中間業(yè)務(wù)等。而對(duì)于此類客戶的貸款業(yè)務(wù),應(yīng)當(dāng)著重預(yù)防違約風(fēng)險(xiǎn)的發(fā)生。此外,銀行還可以通過(guò)縮減為此類客戶辦理業(yè)務(wù)的柜臺(tái)數(shù)量,鼓勵(lì)其使用自助柜員終端,而達(dá)到合理配置銀行有限資源的目的,同時(shí),可以鼓勵(lì)或強(qiáng)制要求此類低效客戶歸并小額活期存款戶頭,并在政策的指導(dǎo)下收取小額賬戶管理費(fèi),以達(dá)到逐步清掃低價(jià)值客戶的目的,從而縮減銀行運(yùn)營(yíng)成本,增加收益。
4 結(jié) 論
商業(yè)銀行客戶細(xì)分,對(duì)銀行了解客戶特征和需求,實(shí)施差異化的服務(wù)體系,保持并擴(kuò)大客戶資源具有重要意義。本文主要采用決策樹C5.0算法對(duì)商業(yè)銀行客戶進(jìn)行了細(xì)分。首先梳理決策樹算法的發(fā)展概況,選用精度較高,使用范圍較廣的C5.0算法作為核心分類工具。通過(guò)遴選出商業(yè)銀行客戶的性別、年齡、學(xué)歷、職業(yè)、年薪、婚姻狀況、健康狀況和居住年限8類重要屬性,利用聚類分析方法將客戶粗分為重要客戶、普通客戶、低檔客戶與關(guān)注客戶4類,進(jìn)而采用C5.0的決策樹算法對(duì)客戶進(jìn)行細(xì)分,得出更為細(xì)致的分類規(guī)則。最后針對(duì)4類客戶的特征和屬性,設(shè)計(jì)了差異化的銀行客戶服務(wù)體系方案,以期為銀行與客戶之間建立長(zhǎng)期而穩(wěn)定的合作關(guān)系,完善客戶關(guān)系管理,實(shí)現(xiàn)銀行收益的持續(xù)增加提供有價(jià)值的參考。
主要參考文獻(xiàn)
[1]Kim T S, Kim H K, Song H S, et al. Detecting the Change of Customer Behavior Based on Decision Tree Analysis [J]. Expert Systems, 2005, 22(4):193-205.
[2]Koh H C, Chan K L G. Data Mining and Customer Relationship Marketing in the Banking Industry[J]. Singapore Management Review, 2002, 24(2): 1-27.
[3]Quinlan J R. Bagging,Boosting, and C4.5[C]. Procceding of 14th National Conference on Artificial Intelligence.Portland, Oregon, 1996: 725-730.
[4]Quinlan J R. Boosting First-order Learning[C].Proceedings of 7th Internationol Work Shop of Algorithmic Learning Theory. Sydney,Australia, 1996: 143-155.
[5]Quinlan J R. Induction of Decision Trees[J]. Machine Learning,1986, 1(1):81-106.
[6]Tillett L S. Banks Mine Customer Data[J]. Internet Week, 2000(831):45-46.
[7]鄧曉懿,金淳,樋口良之,等.移動(dòng)商務(wù)中面向客戶細(xì)分的KSP混合聚類算法[J].管理科學(xué),2011(4):54-61.
[8]高偉,賀昌政,蔣曉毅.基于模糊聚類集成算法的客戶細(xì)分研究[J].情報(bào)雜志,2011(4):125-128.
[9]康健,梁允榮.分類挖掘技術(shù)在金融客戶關(guān)系管理中的應(yīng)用[J].北京理工大學(xué)學(xué)報(bào),2003,23(2):207-211.
[10]鄒鵬,莫佳卉,江亦華,等.基于代價(jià)敏感決策樹的客戶價(jià)值細(xì)分[J].管理科學(xué),2011,24(2):20-29.