石楊 岳嘉佳
摘要:在銀行客戶流失預(yù)測系統(tǒng)中經(jīng)常要通過客戶數(shù)據(jù)對未知客戶的服務(wù)信息進(jìn)行預(yù)測,以對銀行今后的經(jīng)營策略提供依據(jù)。在對客戶的預(yù)測中,經(jīng)常需要對他們的某種分類屬性進(jìn)行分類規(guī)則挖掘。該文主要探討使用決策樹這種常用的有效的方法來對客戶數(shù)據(jù)進(jìn)行分類規(guī)則挖掘。
關(guān)鍵詞:決策樹,客戶流失,關(guān)聯(lián)規(guī)則, 數(shù)據(jù)挖掘
中圖分類號:TP391 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2014)10-2533-04
Abstract: In the bank customer churn prediction system often unknown by the customer data to predict customer service information in order to provide the basis for the bank in the future business strategy. In the customer's forecast, they often need to classify certain classification rule mining properties. This paper discusses the use of this common and effective decision tree approach to classification rule mining of customer data.
Key words: decision trees; Churn; association rules; data mining
網(wǎng)絡(luò)信息化飛速發(fā)展的今天,傳統(tǒng)的商業(yè)模式發(fā)生了質(zhì)的變化。在金融領(lǐng)域里,隨著客戶對銀行推出的產(chǎn)品及其服務(wù)的預(yù)期要求的不斷提高,導(dǎo)致各家銀行之間的競爭更加白熱化。在此環(huán)境下客戶的忠誠度成為建立和維持客戶關(guān)系,各家銀行取得競爭優(yōu)勢的重要指標(biāo)。基于數(shù)據(jù)挖掘技術(shù)和數(shù)據(jù)倉庫技術(shù)為基礎(chǔ)的客戶關(guān)系管理系統(tǒng),成為解決該問題的有效方法。而銀行客戶流失預(yù)測系統(tǒng)作為客戶關(guān)系管理系統(tǒng)中的一個重要組成部分經(jīng)常要通過客戶數(shù)據(jù)對未知客戶的服務(wù)信息進(jìn)行預(yù)測,以對銀行今后的經(jīng)營策略提供依據(jù)。在對客戶的預(yù)測中,經(jīng)常需要對他們的某種分類屬性進(jìn)行分類規(guī)則挖掘。該文主要探討使用決策樹這種常用的有效的方法來對客戶進(jìn)行分類規(guī)則挖掘。
1 決策樹技術(shù)概述
決策樹是數(shù)據(jù)挖掘中一種常用的技術(shù),它既可以用來分析數(shù)據(jù),同時也可以對數(shù)據(jù)進(jìn)行預(yù)測。為什么要選擇決策樹技術(shù)來分析銀行客戶流失情況呢? 因為從銀行己有的客戶流失情況作為基礎(chǔ)數(shù)據(jù)進(jìn)行統(tǒng)計,可以分析出一定的規(guī)則,從而為判斷現(xiàn)有客戶的忠誠度提供必要的指導(dǎo)。雖然分析判斷客戶流失情況的計算量不大,但分析完成后,需要知道每個客戶流失的主要原因,而決策樹可以清晰的顯示出來。所以我們采用決策樹技術(shù)進(jìn)行分析,來為銀行挽留客戶提供必要的參考。
2 構(gòu)造決策樹的貪心算法
決策樹貪心算法的構(gòu)造,選取一個計算出來的預(yù)測流失率,該流失率為最能區(qū)分?jǐn)?shù)據(jù)中不同樣本類別的屬性,讓其作為決策樹的樹根,接下來再依次在每一塊樣本集中選出區(qū)分度最大的屬性,作為決策樹的下一層結(jié)點。自頂向下依此類推,直到所有的葉結(jié)點都只包含唯一樣本時終止:
1)構(gòu)造訓(xùn)練集
從數(shù)據(jù)倉儲中提取描述訓(xùn)練集屬性的元素和描述結(jié)果的元素,以備構(gòu)造生成決策樹使用。
2)決策樹的生長
構(gòu)造好訓(xùn)練集后,使用信息增益度量對每個屬性域分裂的好壞做出量化,測試集合中的每個屬性,選擇具有最高信息增益的屬性,讓其作為決策樹的初始分枝點即根節(jié)點。接下來再依次在每一塊樣本集中選出區(qū)分度最大的屬性,作為決策樹的下一層結(jié)點。自頂向下依此類推,直到分出所有的葉結(jié)點。
3 決策樹技術(shù)預(yù)測銀行客戶流失
根據(jù)銀行中現(xiàn)有的客戶數(shù)據(jù),結(jié)合上述提出的決策樹貪心算法來預(yù)測哪些客戶具有流失的特性,為其制定相應(yīng)的服務(wù)和方案,從而最大程度地挽留住該客戶。
1)構(gòu)造訓(xùn)練集
從銀行現(xiàn)有的客戶數(shù)據(jù)中分類出客戶相關(guān)數(shù)據(jù),從數(shù)據(jù)中選取客戶相關(guān)屬性,使的構(gòu)造訓(xùn)練集中包含如下字段:客戶號屬性,該屬性為客戶在該銀行中定義的編號;業(yè)務(wù)量屬性,該屬性指的是客戶在銀行辦理中間業(yè)務(wù)的種類數(shù)量,比如某客戶在銀行繳納養(yǎng)老保險、辦理公積金或商貸以及水電煤氣費代扣,即該用戶的業(yè)務(wù)量就是3種;客戶類型屬性,該屬性分為個人客戶(簽約客戶)、公共客戶(非簽約客戶)、企業(yè)客戶(簽約客戶)三種類型;參加營銷業(yè)務(wù)屬性,該屬性判斷用戶是否參加過營銷業(yè)務(wù)如理財產(chǎn)品、信托等;從事業(yè)屬性,該屬性體現(xiàn)客戶所處的業(yè)范圍如IT、金融等;是否忠誠客戶屬性,該屬性體現(xiàn)客戶是否會流失。2)銀行客戶狀態(tài)決策樹算法
2) 計算是否忠誠客戶(Ifgood)的期望信息。4)通過步驟3)計算出的信息增益值,比較后選擇最高信息增益值對應(yīng)的屬性作為分支結(jié)點,分支結(jié)點為是否參加銀行的某次產(chǎn)品營銷活動,選作測試屬性,創(chuàng)造一個屬性,用BusinessMarket標(biāo)志,并對于每個屬性值,引出一個分支。
5) 重復(fù)步驟3)和步驟4)的過程,直到樹不再生長。然后把得到的兩個分支作為初始分裂點分別計算出各屬性的信息增益值,選出作為測試的屬性,創(chuàng)建結(jié)點繼續(xù)樹的生長3)利用決策樹進(jìn)行未知客戶流失預(yù)測
利用上述生成的決策樹,可以對新的客戶數(shù)據(jù)進(jìn)行分析,從而對其流失可能性進(jìn)行預(yù)測。 這里,兩個客戶的忠誠度為未知。我們用上述生成的決策樹來判斷其忠誠度。
對客戶0901200,由于其沒參加銀行的某次營銷活動,我們在如圖2的決策樹上轉(zhuǎn)移到根節(jié)點的右兒子節(jié)點。在這個節(jié)點上,根據(jù)分支條件,再看其客戶類型。由于它是企業(yè)客戶,則轉(zhuǎn)移到該節(jié)點的中間兒子節(jié)點。然后再根據(jù)該企業(yè)的業(yè)(即IT業(yè))選擇右兒子節(jié)點,這就到達(dá)了一個葉子節(jié)點,得到的結(jié)論是“NO”,即意味著該客戶不是忠誠客戶,很可能會流失。
對客戶0901201,由于其參加了銀行的某次營銷活動,我們在如圖2的決策樹上轉(zhuǎn)移到根節(jié)點的左兒子節(jié)點。在這個節(jié)點上,根據(jù)分支條件,再看其客戶的業(yè)。由于它是金融業(yè),則轉(zhuǎn)移到該節(jié)點的左兒子節(jié)點。這就到達(dá)了一個葉子節(jié)點,得到的結(jié)論是“YES”,表明該客戶是忠誠客戶,不在流失的范圍內(nèi)。
4)決策樹分析客戶特征
根據(jù)最終生成的決策樹不難看出,進(jìn)行決策樹分支最重要因素是營銷業(yè)務(wù)屬性,其次為客戶類型、業(yè)務(wù)量、從事業(yè)。分析最終生成的決策樹中的訓(xùn)練集數(shù)據(jù),可以細(xì)分出如下8種群體的模型及特征。
4 總結(jié)
本文就銀行客戶流失預(yù)測中有關(guān)數(shù)據(jù)挖掘方法的應(yīng)用進(jìn)行了研究分析,將優(yōu)化改進(jìn)后的的算法應(yīng)用到銀行客戶流失預(yù)測中,根據(jù)現(xiàn)有客戶相關(guān)信息提出基于關(guān)聯(lián)規(guī)則決策樹的銀行客戶流失的預(yù)測算法。能夠較準(zhǔn)確地篩選出符合流失因素的客戶,從而為篩選出的流失客戶制定相應(yīng)的方案和服務(wù),最大程度地挽留他們,對未知客戶的服務(wù)信息進(jìn)行預(yù)測,以對銀行今后的經(jīng)營策略提供依據(jù)。
參考文獻(xiàn):
[1] Dunham M H.數(shù)據(jù)挖掘教程[M].郭崇惠,田鳳占,靳曉明,等,譯.北京:清華大學(xué)出版社,2005:65-104.
[2] 王穎.基于數(shù)據(jù)挖掘技術(shù)的銀行客戶關(guān)系管理[D].貴陽:貴州大學(xué),200:26-34.
[3] 高洪深:決策支持系統(tǒng)(DSS)—理論、方法、案例[M].2版.北京:清華大學(xué)出版社,2000.
[4] 蘇新寧,楊建林.數(shù)據(jù)挖掘理論與技術(shù)[M].北京:科學(xué)技術(shù)文獻(xiàn)出版社,2003.
[5] 莫笛.電子商務(wù)營銷平臺的研究與設(shè)計[D].杭州:浙江大學(xué),2008.
[6] 決策樹技術(shù)在網(wǎng)上書店系統(tǒng)中的應(yīng)用[EB/OL].[2012-07-03].http://www.studa.net/electronic/090108/08532820.html.endprint
摘要:在銀行客戶流失預(yù)測系統(tǒng)中經(jīng)常要通過客戶數(shù)據(jù)對未知客戶的服務(wù)信息進(jìn)行預(yù)測,以對銀行今后的經(jīng)營策略提供依據(jù)。在對客戶的預(yù)測中,經(jīng)常需要對他們的某種分類屬性進(jìn)行分類規(guī)則挖掘。該文主要探討使用決策樹這種常用的有效的方法來對客戶數(shù)據(jù)進(jìn)行分類規(guī)則挖掘。
關(guān)鍵詞:決策樹,客戶流失,關(guān)聯(lián)規(guī)則, 數(shù)據(jù)挖掘
中圖分類號:TP391 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2014)10-2533-04
Abstract: In the bank customer churn prediction system often unknown by the customer data to predict customer service information in order to provide the basis for the bank in the future business strategy. In the customer's forecast, they often need to classify certain classification rule mining properties. This paper discusses the use of this common and effective decision tree approach to classification rule mining of customer data.
Key words: decision trees; Churn; association rules; data mining
網(wǎng)絡(luò)信息化飛速發(fā)展的今天,傳統(tǒng)的商業(yè)模式發(fā)生了質(zhì)的變化。在金融領(lǐng)域里,隨著客戶對銀行推出的產(chǎn)品及其服務(wù)的預(yù)期要求的不斷提高,導(dǎo)致各家銀行之間的競爭更加白熱化。在此環(huán)境下客戶的忠誠度成為建立和維持客戶關(guān)系,各家銀行取得競爭優(yōu)勢的重要指標(biāo)?;跀?shù)據(jù)挖掘技術(shù)和數(shù)據(jù)倉庫技術(shù)為基礎(chǔ)的客戶關(guān)系管理系統(tǒng),成為解決該問題的有效方法。而銀行客戶流失預(yù)測系統(tǒng)作為客戶關(guān)系管理系統(tǒng)中的一個重要組成部分經(jīng)常要通過客戶數(shù)據(jù)對未知客戶的服務(wù)信息進(jìn)行預(yù)測,以對銀行今后的經(jīng)營策略提供依據(jù)。在對客戶的預(yù)測中,經(jīng)常需要對他們的某種分類屬性進(jìn)行分類規(guī)則挖掘。該文主要探討使用決策樹這種常用的有效的方法來對客戶進(jìn)行分類規(guī)則挖掘。
1 決策樹技術(shù)概述
決策樹是數(shù)據(jù)挖掘中一種常用的技術(shù),它既可以用來分析數(shù)據(jù),同時也可以對數(shù)據(jù)進(jìn)行預(yù)測。為什么要選擇決策樹技術(shù)來分析銀行客戶流失情況呢? 因為從銀行己有的客戶流失情況作為基礎(chǔ)數(shù)據(jù)進(jìn)行統(tǒng)計,可以分析出一定的規(guī)則,從而為判斷現(xiàn)有客戶的忠誠度提供必要的指導(dǎo)。雖然分析判斷客戶流失情況的計算量不大,但分析完成后,需要知道每個客戶流失的主要原因,而決策樹可以清晰的顯示出來。所以我們采用決策樹技術(shù)進(jìn)行分析,來為銀行挽留客戶提供必要的參考。
2 構(gòu)造決策樹的貪心算法
決策樹貪心算法的構(gòu)造,選取一個計算出來的預(yù)測流失率,該流失率為最能區(qū)分?jǐn)?shù)據(jù)中不同樣本類別的屬性,讓其作為決策樹的樹根,接下來再依次在每一塊樣本集中選出區(qū)分度最大的屬性,作為決策樹的下一層結(jié)點。自頂向下依此類推,直到所有的葉結(jié)點都只包含唯一樣本時終止:
1)構(gòu)造訓(xùn)練集
從數(shù)據(jù)倉儲中提取描述訓(xùn)練集屬性的元素和描述結(jié)果的元素,以備構(gòu)造生成決策樹使用。
2)決策樹的生長
構(gòu)造好訓(xùn)練集后,使用信息增益度量對每個屬性域分裂的好壞做出量化,測試集合中的每個屬性,選擇具有最高信息增益的屬性,讓其作為決策樹的初始分枝點即根節(jié)點。接下來再依次在每一塊樣本集中選出區(qū)分度最大的屬性,作為決策樹的下一層結(jié)點。自頂向下依此類推,直到分出所有的葉結(jié)點。
3 決策樹技術(shù)預(yù)測銀行客戶流失
根據(jù)銀行中現(xiàn)有的客戶數(shù)據(jù),結(jié)合上述提出的決策樹貪心算法來預(yù)測哪些客戶具有流失的特性,為其制定相應(yīng)的服務(wù)和方案,從而最大程度地挽留住該客戶。
1)構(gòu)造訓(xùn)練集
從銀行現(xiàn)有的客戶數(shù)據(jù)中分類出客戶相關(guān)數(shù)據(jù),從數(shù)據(jù)中選取客戶相關(guān)屬性,使的構(gòu)造訓(xùn)練集中包含如下字段:客戶號屬性,該屬性為客戶在該銀行中定義的編號;業(yè)務(wù)量屬性,該屬性指的是客戶在銀行辦理中間業(yè)務(wù)的種類數(shù)量,比如某客戶在銀行繳納養(yǎng)老保險、辦理公積金或商貸以及水電煤氣費代扣,即該用戶的業(yè)務(wù)量就是3種;客戶類型屬性,該屬性分為個人客戶(簽約客戶)、公共客戶(非簽約客戶)、企業(yè)客戶(簽約客戶)三種類型;參加營銷業(yè)務(wù)屬性,該屬性判斷用戶是否參加過營銷業(yè)務(wù)如理財產(chǎn)品、信托等;從事業(yè)屬性,該屬性體現(xiàn)客戶所處的業(yè)范圍如IT、金融等;是否忠誠客戶屬性,該屬性體現(xiàn)客戶是否會流失。2)銀行客戶狀態(tài)決策樹算法
2) 計算是否忠誠客戶(Ifgood)的期望信息。4)通過步驟3)計算出的信息增益值,比較后選擇最高信息增益值對應(yīng)的屬性作為分支結(jié)點,分支結(jié)點為是否參加銀行的某次產(chǎn)品營銷活動,選作測試屬性,創(chuàng)造一個屬性,用BusinessMarket標(biāo)志,并對于每個屬性值,引出一個分支。
5) 重復(fù)步驟3)和步驟4)的過程,直到樹不再生長。然后把得到的兩個分支作為初始分裂點分別計算出各屬性的信息增益值,選出作為測試的屬性,創(chuàng)建結(jié)點繼續(xù)樹的生長3)利用決策樹進(jìn)行未知客戶流失預(yù)測
利用上述生成的決策樹,可以對新的客戶數(shù)據(jù)進(jìn)行分析,從而對其流失可能性進(jìn)行預(yù)測。 這里,兩個客戶的忠誠度為未知。我們用上述生成的決策樹來判斷其忠誠度。
對客戶0901200,由于其沒參加銀行的某次營銷活動,我們在如圖2的決策樹上轉(zhuǎn)移到根節(jié)點的右兒子節(jié)點。在這個節(jié)點上,根據(jù)分支條件,再看其客戶類型。由于它是企業(yè)客戶,則轉(zhuǎn)移到該節(jié)點的中間兒子節(jié)點。然后再根據(jù)該企業(yè)的業(yè)(即IT業(yè))選擇右兒子節(jié)點,這就到達(dá)了一個葉子節(jié)點,得到的結(jié)論是“NO”,即意味著該客戶不是忠誠客戶,很可能會流失。
對客戶0901201,由于其參加了銀行的某次營銷活動,我們在如圖2的決策樹上轉(zhuǎn)移到根節(jié)點的左兒子節(jié)點。在這個節(jié)點上,根據(jù)分支條件,再看其客戶的業(yè)。由于它是金融業(yè),則轉(zhuǎn)移到該節(jié)點的左兒子節(jié)點。這就到達(dá)了一個葉子節(jié)點,得到的結(jié)論是“YES”,表明該客戶是忠誠客戶,不在流失的范圍內(nèi)。
4)決策樹分析客戶特征
根據(jù)最終生成的決策樹不難看出,進(jìn)行決策樹分支最重要因素是營銷業(yè)務(wù)屬性,其次為客戶類型、業(yè)務(wù)量、從事業(yè)。分析最終生成的決策樹中的訓(xùn)練集數(shù)據(jù),可以細(xì)分出如下8種群體的模型及特征。
4 總結(jié)
本文就銀行客戶流失預(yù)測中有關(guān)數(shù)據(jù)挖掘方法的應(yīng)用進(jìn)行了研究分析,將優(yōu)化改進(jìn)后的的算法應(yīng)用到銀行客戶流失預(yù)測中,根據(jù)現(xiàn)有客戶相關(guān)信息提出基于關(guān)聯(lián)規(guī)則決策樹的銀行客戶流失的預(yù)測算法。能夠較準(zhǔn)確地篩選出符合流失因素的客戶,從而為篩選出的流失客戶制定相應(yīng)的方案和服務(wù),最大程度地挽留他們,對未知客戶的服務(wù)信息進(jìn)行預(yù)測,以對銀行今后的經(jīng)營策略提供依據(jù)。
參考文獻(xiàn):
[1] Dunham M H.數(shù)據(jù)挖掘教程[M].郭崇惠,田鳳占,靳曉明,等,譯.北京:清華大學(xué)出版社,2005:65-104.
[2] 王穎.基于數(shù)據(jù)挖掘技術(shù)的銀行客戶關(guān)系管理[D].貴陽:貴州大學(xué),200:26-34.
[3] 高洪深:決策支持系統(tǒng)(DSS)—理論、方法、案例[M].2版.北京:清華大學(xué)出版社,2000.
[4] 蘇新寧,楊建林.數(shù)據(jù)挖掘理論與技術(shù)[M].北京:科學(xué)技術(shù)文獻(xiàn)出版社,2003.
[5] 莫笛.電子商務(wù)營銷平臺的研究與設(shè)計[D].杭州:浙江大學(xué),2008.
[6] 決策樹技術(shù)在網(wǎng)上書店系統(tǒng)中的應(yīng)用[EB/OL].[2012-07-03].http://www.studa.net/electronic/090108/08532820.html.endprint
摘要:在銀行客戶流失預(yù)測系統(tǒng)中經(jīng)常要通過客戶數(shù)據(jù)對未知客戶的服務(wù)信息進(jìn)行預(yù)測,以對銀行今后的經(jīng)營策略提供依據(jù)。在對客戶的預(yù)測中,經(jīng)常需要對他們的某種分類屬性進(jìn)行分類規(guī)則挖掘。該文主要探討使用決策樹這種常用的有效的方法來對客戶數(shù)據(jù)進(jìn)行分類規(guī)則挖掘。
關(guān)鍵詞:決策樹,客戶流失,關(guān)聯(lián)規(guī)則, 數(shù)據(jù)挖掘
中圖分類號:TP391 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2014)10-2533-04
Abstract: In the bank customer churn prediction system often unknown by the customer data to predict customer service information in order to provide the basis for the bank in the future business strategy. In the customer's forecast, they often need to classify certain classification rule mining properties. This paper discusses the use of this common and effective decision tree approach to classification rule mining of customer data.
Key words: decision trees; Churn; association rules; data mining
網(wǎng)絡(luò)信息化飛速發(fā)展的今天,傳統(tǒng)的商業(yè)模式發(fā)生了質(zhì)的變化。在金融領(lǐng)域里,隨著客戶對銀行推出的產(chǎn)品及其服務(wù)的預(yù)期要求的不斷提高,導(dǎo)致各家銀行之間的競爭更加白熱化。在此環(huán)境下客戶的忠誠度成為建立和維持客戶關(guān)系,各家銀行取得競爭優(yōu)勢的重要指標(biāo)。基于數(shù)據(jù)挖掘技術(shù)和數(shù)據(jù)倉庫技術(shù)為基礎(chǔ)的客戶關(guān)系管理系統(tǒng),成為解決該問題的有效方法。而銀行客戶流失預(yù)測系統(tǒng)作為客戶關(guān)系管理系統(tǒng)中的一個重要組成部分經(jīng)常要通過客戶數(shù)據(jù)對未知客戶的服務(wù)信息進(jìn)行預(yù)測,以對銀行今后的經(jīng)營策略提供依據(jù)。在對客戶的預(yù)測中,經(jīng)常需要對他們的某種分類屬性進(jìn)行分類規(guī)則挖掘。該文主要探討使用決策樹這種常用的有效的方法來對客戶進(jìn)行分類規(guī)則挖掘。
1 決策樹技術(shù)概述
決策樹是數(shù)據(jù)挖掘中一種常用的技術(shù),它既可以用來分析數(shù)據(jù),同時也可以對數(shù)據(jù)進(jìn)行預(yù)測。為什么要選擇決策樹技術(shù)來分析銀行客戶流失情況呢? 因為從銀行己有的客戶流失情況作為基礎(chǔ)數(shù)據(jù)進(jìn)行統(tǒng)計,可以分析出一定的規(guī)則,從而為判斷現(xiàn)有客戶的忠誠度提供必要的指導(dǎo)。雖然分析判斷客戶流失情況的計算量不大,但分析完成后,需要知道每個客戶流失的主要原因,而決策樹可以清晰的顯示出來。所以我們采用決策樹技術(shù)進(jìn)行分析,來為銀行挽留客戶提供必要的參考。
2 構(gòu)造決策樹的貪心算法
決策樹貪心算法的構(gòu)造,選取一個計算出來的預(yù)測流失率,該流失率為最能區(qū)分?jǐn)?shù)據(jù)中不同樣本類別的屬性,讓其作為決策樹的樹根,接下來再依次在每一塊樣本集中選出區(qū)分度最大的屬性,作為決策樹的下一層結(jié)點。自頂向下依此類推,直到所有的葉結(jié)點都只包含唯一樣本時終止:
1)構(gòu)造訓(xùn)練集
從數(shù)據(jù)倉儲中提取描述訓(xùn)練集屬性的元素和描述結(jié)果的元素,以備構(gòu)造生成決策樹使用。
2)決策樹的生長
構(gòu)造好訓(xùn)練集后,使用信息增益度量對每個屬性域分裂的好壞做出量化,測試集合中的每個屬性,選擇具有最高信息增益的屬性,讓其作為決策樹的初始分枝點即根節(jié)點。接下來再依次在每一塊樣本集中選出區(qū)分度最大的屬性,作為決策樹的下一層結(jié)點。自頂向下依此類推,直到分出所有的葉結(jié)點。
3 決策樹技術(shù)預(yù)測銀行客戶流失
根據(jù)銀行中現(xiàn)有的客戶數(shù)據(jù),結(jié)合上述提出的決策樹貪心算法來預(yù)測哪些客戶具有流失的特性,為其制定相應(yīng)的服務(wù)和方案,從而最大程度地挽留住該客戶。
1)構(gòu)造訓(xùn)練集
從銀行現(xiàn)有的客戶數(shù)據(jù)中分類出客戶相關(guān)數(shù)據(jù),從數(shù)據(jù)中選取客戶相關(guān)屬性,使的構(gòu)造訓(xùn)練集中包含如下字段:客戶號屬性,該屬性為客戶在該銀行中定義的編號;業(yè)務(wù)量屬性,該屬性指的是客戶在銀行辦理中間業(yè)務(wù)的種類數(shù)量,比如某客戶在銀行繳納養(yǎng)老保險、辦理公積金或商貸以及水電煤氣費代扣,即該用戶的業(yè)務(wù)量就是3種;客戶類型屬性,該屬性分為個人客戶(簽約客戶)、公共客戶(非簽約客戶)、企業(yè)客戶(簽約客戶)三種類型;參加營銷業(yè)務(wù)屬性,該屬性判斷用戶是否參加過營銷業(yè)務(wù)如理財產(chǎn)品、信托等;從事業(yè)屬性,該屬性體現(xiàn)客戶所處的業(yè)范圍如IT、金融等;是否忠誠客戶屬性,該屬性體現(xiàn)客戶是否會流失。2)銀行客戶狀態(tài)決策樹算法
2) 計算是否忠誠客戶(Ifgood)的期望信息。4)通過步驟3)計算出的信息增益值,比較后選擇最高信息增益值對應(yīng)的屬性作為分支結(jié)點,分支結(jié)點為是否參加銀行的某次產(chǎn)品營銷活動,選作測試屬性,創(chuàng)造一個屬性,用BusinessMarket標(biāo)志,并對于每個屬性值,引出一個分支。
5) 重復(fù)步驟3)和步驟4)的過程,直到樹不再生長。然后把得到的兩個分支作為初始分裂點分別計算出各屬性的信息增益值,選出作為測試的屬性,創(chuàng)建結(jié)點繼續(xù)樹的生長3)利用決策樹進(jìn)行未知客戶流失預(yù)測
利用上述生成的決策樹,可以對新的客戶數(shù)據(jù)進(jìn)行分析,從而對其流失可能性進(jìn)行預(yù)測。 這里,兩個客戶的忠誠度為未知。我們用上述生成的決策樹來判斷其忠誠度。
對客戶0901200,由于其沒參加銀行的某次營銷活動,我們在如圖2的決策樹上轉(zhuǎn)移到根節(jié)點的右兒子節(jié)點。在這個節(jié)點上,根據(jù)分支條件,再看其客戶類型。由于它是企業(yè)客戶,則轉(zhuǎn)移到該節(jié)點的中間兒子節(jié)點。然后再根據(jù)該企業(yè)的業(yè)(即IT業(yè))選擇右兒子節(jié)點,這就到達(dá)了一個葉子節(jié)點,得到的結(jié)論是“NO”,即意味著該客戶不是忠誠客戶,很可能會流失。
對客戶0901201,由于其參加了銀行的某次營銷活動,我們在如圖2的決策樹上轉(zhuǎn)移到根節(jié)點的左兒子節(jié)點。在這個節(jié)點上,根據(jù)分支條件,再看其客戶的業(yè)。由于它是金融業(yè),則轉(zhuǎn)移到該節(jié)點的左兒子節(jié)點。這就到達(dá)了一個葉子節(jié)點,得到的結(jié)論是“YES”,表明該客戶是忠誠客戶,不在流失的范圍內(nèi)。
4)決策樹分析客戶特征
根據(jù)最終生成的決策樹不難看出,進(jìn)行決策樹分支最重要因素是營銷業(yè)務(wù)屬性,其次為客戶類型、業(yè)務(wù)量、從事業(yè)。分析最終生成的決策樹中的訓(xùn)練集數(shù)據(jù),可以細(xì)分出如下8種群體的模型及特征。
4 總結(jié)
本文就銀行客戶流失預(yù)測中有關(guān)數(shù)據(jù)挖掘方法的應(yīng)用進(jìn)行了研究分析,將優(yōu)化改進(jìn)后的的算法應(yīng)用到銀行客戶流失預(yù)測中,根據(jù)現(xiàn)有客戶相關(guān)信息提出基于關(guān)聯(lián)規(guī)則決策樹的銀行客戶流失的預(yù)測算法。能夠較準(zhǔn)確地篩選出符合流失因素的客戶,從而為篩選出的流失客戶制定相應(yīng)的方案和服務(wù),最大程度地挽留他們,對未知客戶的服務(wù)信息進(jìn)行預(yù)測,以對銀行今后的經(jīng)營策略提供依據(jù)。
參考文獻(xiàn):
[1] Dunham M H.數(shù)據(jù)挖掘教程[M].郭崇惠,田鳳占,靳曉明,等,譯.北京:清華大學(xué)出版社,2005:65-104.
[2] 王穎.基于數(shù)據(jù)挖掘技術(shù)的銀行客戶關(guān)系管理[D].貴陽:貴州大學(xué),200:26-34.
[3] 高洪深:決策支持系統(tǒng)(DSS)—理論、方法、案例[M].2版.北京:清華大學(xué)出版社,2000.
[4] 蘇新寧,楊建林.數(shù)據(jù)挖掘理論與技術(shù)[M].北京:科學(xué)技術(shù)文獻(xiàn)出版社,2003.
[5] 莫笛.電子商務(wù)營銷平臺的研究與設(shè)計[D].杭州:浙江大學(xué),2008.
[6] 決策樹技術(shù)在網(wǎng)上書店系統(tǒng)中的應(yīng)用[EB/OL].[2012-07-03].http://www.studa.net/electronic/090108/08532820.html.endprint