樊英 朱燦
摘要:文章針對A保險公司的客戶數(shù)據(jù),首先選取客戶的細分指標(biāo),然后進行數(shù)據(jù)預(yù)處理,進而利用兩步聚類方法建立模型,最后利用模型進行數(shù)據(jù)分析。實證分析結(jié)果表明,客戶被分為三類,第一類為職業(yè)風(fēng)險高,收入居中并且投保金額高的男性,第二類為職業(yè)風(fēng)險低,收入較高且投保金額居中的女性,第三類為職業(yè)風(fēng)險較低,收入較低并且投保金額低的女性。為保險公司實現(xiàn)精準(zhǔn)營銷提供了輔助決策依據(jù)。
關(guān)鍵詞:A保險公司 客戶細分 兩步聚類法
一、引言
隨著國內(nèi)保險市場對外開放,外資保險公司紛紛進入中國市場,給國內(nèi)的保險公司帶來了巨大的挑戰(zhàn),而要想在國內(nèi)市場占有一席之地,就必須重視客戶,增強客戶意識。如何利用這些資源來進行更好的客戶關(guān)系管理和精準(zhǔn)營銷已經(jīng)成為各大保險公司必須解決的問題。
從已有的研究成果中可以發(fā)現(xiàn),國內(nèi)很多學(xué)者已經(jīng)對保險行業(yè)的客戶細分進行了一定的研究。鄭直(2012)[1]提出了“重要客戶”的概念,主張保險公司應(yīng)該根據(jù)客戶的重要程度采取不同的營銷方式。顏可?。?013)[2]基于客戶利潤貢獻度和貢獻增長率從橫向與縱向兩方面進行客戶細分。王洪濤(2013)[3]建立交叉分析表并應(yīng)用Apriori算法建立關(guān)聯(lián)規(guī)則模型對購買車險的客戶數(shù)據(jù)進行分析。程瑞芬(2013)[4]構(gòu)建了基于C5.0算法的目標(biāo)客戶分析模型和基于Apriori算法的購物籃分析模型,并且利用基于K—means細分的交叉銷售模型,綜合三種模型進行保險行業(yè)的客戶細分和識別開發(fā)。陳偉(2013)[5]利用理論研究與實證研究結(jié)合的方法,用SAS軟件進行數(shù)據(jù)挖掘建立模型,最后對照模型進行測試來驗證模型的可行性與準(zhǔn)確性。孫欽杰(2013)[6]采用對保險公司已有客戶進行問卷調(diào)查的形式來進行客戶細分。王智平(2013)[7]采用數(shù)據(jù)挖掘的相關(guān)算法進行保險行業(yè)的客戶細分,利用決策樹、聚類分析、K-means算法的改進形式以及Apriori算法對保險客戶樣本數(shù)據(jù)實例進行分析。束曉君(2014)[8]提出用K-means聚類方法對太平洋壽險的客戶進行細分。李杏誼(2014)[9]綜合利用了決策樹模型、貝葉斯模型、神經(jīng)網(wǎng)絡(luò)模型和邏輯回歸模型來進行客戶的識別細分,最后利用購物籃分析模型對客戶數(shù)據(jù)進行產(chǎn)品購買關(guān)聯(lián)的分析,利用模型的結(jié)果提出相應(yīng)的建議。
從已有的研究成果中發(fā)現(xiàn),從研究方法上來看,大多數(shù)的研究基于K-means算法、Apriori算法或者是購物籃分析來進行客戶細分,而很少利用兩步聚類方法來進行研究。在研究內(nèi)容上,大多數(shù)研究或是從保險公司產(chǎn)品的角度來分析,或是從客戶價值角度分析,并沒有利用保險公司已有的客戶基本信息來分析。因此文章從A保險公司的客戶基礎(chǔ)信息著手,來選取客戶細分的指標(biāo)后進行數(shù)據(jù)預(yù)處理,運用兩步聚類方法來進行客戶的細分,最后利用細分結(jié)果對A保險公司如何精準(zhǔn)營銷與客戶關(guān)系管理提出合理的建議與意見。
二、研究設(shè)計
(一)指標(biāo)選取
客戶投保信息表中包含很多指標(biāo),總體可以分為三類,第一客戶的特征數(shù)據(jù),如性別、年齡、職業(yè)等,第二客戶的地域?qū)傩?,包括所屬機構(gòu)、代理人等,第三客戶的消費行為數(shù)據(jù),投保金額、繳費方式等。根據(jù)文獻的閱讀及A保險公司人員的經(jīng)驗,選取性別、年齡、收入、職業(yè)、繳費方式和投保金額作為客戶細分的輸入指標(biāo)。
(二)數(shù)據(jù)預(yù)處理
將客戶的年齡進行區(qū)間化處理,客戶的職業(yè)按照保險業(yè)規(guī)定的職業(yè)類別進行分類以及將投保金額進行標(biāo)準(zhǔn)化處理等。
(三)模型建立
選取兩步聚類方法建立模型并進行分析。兩步聚類算法是Chiu等人于2001年在BIRCH算法基礎(chǔ)上提出的一種改進算法。該算法優(yōu)點突出,既可以處理數(shù)值型聚類變量,也可以處理分類型變量,并且能夠根據(jù)一定的準(zhǔn)則確定聚類數(shù)目,能夠診斷樣本中的離群點和噪聲數(shù)據(jù),通過兩步實現(xiàn)數(shù)據(jù)聚類。兩步聚類采用距離測度樣本或類間的親疏程度,如果聚類變量均為數(shù)值型,采用歐氏距離來測量,否則,需要同時考慮數(shù)值型和分類型變量,采用對數(shù)似然距離。
三、實證分析
利用Clementine11.1軟件,采用兩部聚類算法實現(xiàn)A保險公司的客戶細分挖掘。下面對具體的分析過程進行描述。
(一)提取相關(guān)數(shù)據(jù)
利用SQL Server2012從A保險公司的數(shù)據(jù)倉庫中抽取新投保客戶相關(guān)數(shù)據(jù),共12605條記錄。
(二)數(shù)據(jù)的預(yù)處理
根據(jù)建立模型的需要,將年齡、收入、職業(yè)進行區(qū)間化處理,將投保金額進行標(biāo)準(zhǔn)化處理。
(三)建立模型
采用Clenmentine11.1中的兩步聚類模型進行客戶細分。首先進行數(shù)據(jù)鏈接,在數(shù)據(jù)源選項中直接選取Excel圖標(biāo),將它拖到工作區(qū)中,選擇數(shù)據(jù)文件所在地址并選取相應(yīng)的字段,即性別、年齡、職業(yè)、收入狀況、繳費方式以及投保金額;其次選取類型節(jié)點進行數(shù)據(jù)的讀取及輸入輸出的設(shè)置,將性別、年齡、職業(yè)、收入狀況、繳費方式以及投保金額設(shè)置為輸入變量;然后在字段選項中選擇分區(qū)節(jié)點進行訓(xùn)練集和測試集的設(shè)置,這里隨機選取80%的數(shù)據(jù)作為訓(xùn)練集,選取20%的數(shù)據(jù)作為測試集;最后選擇兩步聚類模型,模型設(shè)置選擇使用分區(qū)數(shù)據(jù),采用自動計算聚類數(shù),并將最小聚類數(shù)設(shè)置為2,最大聚類數(shù)設(shè)置為6。模型建立后可以利用矩陣節(jié)點對每一個輸入指標(biāo)在各類中的差異程度進行進一步分析。
(四)結(jié)果分析
模型將12605位客戶聚為三類,六個輸入變量對模型的建立作用都是重要的,下面對模型結(jié)果進行詳細說明。
1、第一類客戶的職業(yè)風(fēng)險較高,客戶的職業(yè)是貨車司機、一般工人等。平均年收入在1.5萬到6萬之間,年齡集中在30到50歲,性別以男性居多,繳費方式為“Y”,投保金額在三類客戶中是最高的。
2、第二類客戶的職業(yè)風(fēng)險較低,主要為會計、文職人員及家庭主婦等,收入水平比第一類及第二類中的客戶稍高,一般為3萬以上,年齡也是集中在30到50歲,性別以女性居多,繳費方式為“Y”,投保金額在三類客戶中居中。
3、第三類客戶的職業(yè)風(fēng)險較低,與第二類相同,收入水平較低,大多數(shù)在1.5萬以下,年齡大多數(shù)集中在40—60歲,性別以女性居多,繳費方式全為“W”,投保金額在三類客戶中是最低的。
4、三類客戶在性別方面存在差異,第一類以男性居多,第二類和第三類以女性居多;年齡沒有顯著的差異,都是集中在30—60歲;收入有明顯的差異,第二類收入水平最高,第一類收入水平居中,第三類收入水平最低;職業(yè)有明顯的差異,第一類客戶職業(yè)風(fēng)險較高,第二類和第三類客戶職業(yè)風(fēng)險較低;繳費方式有顯著的差異,第一類和第二類中的客戶繳費方式為“Y”,第三類中的客戶繳費方式為“W”。
通過以上結(jié)果,A保險公司可以針對不同的客戶推薦相應(yīng)的險種,并采取相應(yīng)的措施,比如針對第一類,客戶的職業(yè)風(fēng)險較高,在銷售過程中要仔細對客戶的風(fēng)險情況進行評估;針對第二類,客戶主要是職業(yè)風(fēng)險低,收入較高的女性,投保金額較高,是公司的重點客戶;針對第三類,客戶主要是職業(yè)風(fēng)險較低,收入較低的女性,銷售人員應(yīng)該推薦與她們的收入水平相適應(yīng)的險種。
四、結(jié)論
文章針對A保險公司的客戶數(shù)據(jù),選取指標(biāo),利用兩步聚類方法將客戶準(zhǔn)確分成了三類,第一類為職業(yè)風(fēng)險高,收入居中并且投保金額高的男性,第二類為職業(yè)風(fēng)險低,收入較高且投保金額居中的女性,第三類為職業(yè)風(fēng)險較低,收入較低并且投保金額低的女性。A保險公司可以針對這三類客戶的特征和消費行為進行客戶關(guān)系的管理和精準(zhǔn)營銷。
另外文章僅考慮了客戶的收入、職業(yè)等特征,沒有考慮到其他的因素如家庭結(jié)構(gòu)等,文章也僅采用了兩步聚類方法進行客戶細分。在以后的研究中還可以結(jié)合其他的聚類方法,選取多樣的指標(biāo)進行更加精準(zhǔn)的客戶細分和客戶定位,使之更符合保險行業(yè)數(shù)據(jù)挖掘的需要。
參考文獻:
[1]鄭直.財產(chǎn)保險市場重要客戶營銷淺析[J]. 中國保險,2012(1):53—56
[2]顏可俊.基于客戶細分的客戶保持最優(yōu)投入模型—以S公司為例[D].華東理工大學(xué),2013
[3]王洪濤.車險的大數(shù)據(jù)營銷[J].通信世界,2013(10):48—49
[4]程瑞芬.基于數(shù)據(jù)挖掘的保險業(yè)客戶識別與開發(fā)研究[D].河南工業(yè)大學(xué),2013
[5]陳偉.基于客戶細分的保險電銷保費提升的實證分析—以A保險公司為例[D].杭州:浙江工商大學(xué),2013
[6]孫欽杰.基于客戶關(guān)系管理的財產(chǎn)保險公司客戶服務(wù)研究[J].時代金融,2013(20):34—35
[7]王智平.數(shù)據(jù)挖掘在保險客戶數(shù)據(jù)中的應(yīng)用研究[D].昆明理工大學(xué),2013
[8]束曉君.基于數(shù)據(jù)挖掘的保險公司精準(zhǔn)營銷研究[D].西安工業(yè)大學(xué),2014
[9]李杏誼.數(shù)據(jù)挖掘技術(shù)在保險行業(yè)目標(biāo)客戶識別中的應(yīng)用研究[D].中山大學(xué),2014
(樊英,1966年生,陜西西安人,四川省經(jīng)濟和信息化委員會信息中心高級工程師。研究方向:信息管理與信息系統(tǒng)。朱燦,1994年生,湖南常德人,四川大學(xué)商學(xué)院。研究方向:管理系統(tǒng)工程數(shù)據(jù)挖掘方向)