劉鳳艷(淮南師范學(xué)院 金融學(xué)院,安徽 淮南 232001)
?
基于聚類分析的證券業(yè)客戶分層實證研究
劉鳳艷
(淮南師范學(xué)院金融學(xué)院,安徽淮南232001)
摘要:客戶管理的依據(jù)是客戶價值.本文根據(jù)客戶對證券公司提供的價值,采用聚類分析方法對某證券公司提供的2014年6月到2015年6月總資產(chǎn)在50萬~100萬之間93個客戶共1116條記錄進(jìn)行實證分析,研究客戶的分層情況.通過細(xì)分結(jié)果可以對不同類的客戶提供和設(shè)計不同的服務(wù)項目并提供個性化服務(wù)策略.
關(guān)鍵詞:客戶細(xì)分;聚類分析;證券業(yè);客戶價值
近年來,證券企業(yè)行業(yè)的競爭越來越激烈,在各個企業(yè)中哪個單位能把握住客戶的真正需求并且能保留住老客戶且吸引新客戶,才能有更高的收益;哪些客戶的投資回報率最大,哪些的虧損率多,誰能根據(jù)以往的海量的交易數(shù)據(jù),提出合理的投資建議,提取更多有價值的信息以便幫助各個企業(yè)有更好的發(fā)展,是各個企業(yè)重要的目標(biāo).而在金融證券業(yè)對客戶的相關(guān)數(shù)據(jù)的挖掘越來越重要,其對企業(yè)未來的發(fā)展趨勢可以進(jìn)行預(yù)測,此種方法已得到廣泛的應(yīng)用,本文是利用聚類分析對證券公司提供的總資產(chǎn)在50萬到100萬的客戶數(shù)據(jù)進(jìn)行實證分析.
聚類分析是根據(jù)建立模型簡化數(shù)據(jù)結(jié)構(gòu)的方法,可以對變量進(jìn)行聚類也可以對樣品進(jìn)行聚類.聚類的方法也很多,常見的有系統(tǒng)聚類,快速聚類法及有序聚類.而系統(tǒng)聚類根據(jù)類與類之間距離的定義不同又分為最短距離法,最長距離法重心法及類平均法等等.在系統(tǒng)聚類中因為需要計算出不同樣品或變量的距離還要在聚類的每一步都要計算類間距離,相應(yīng)的計算量較大,特別是容量很大時需要占據(jù)很大的計算機(jī)內(nèi)存空間,這會給計算帶來很大的困難.所以在數(shù)據(jù)量較大時可以采用快速聚類法,得到的結(jié)果比較簡單易懂,對計算機(jī)的性能求不高,所以應(yīng)用比較廣泛,本文就是利用快速聚類來進(jìn)行分析.
聚類分析的應(yīng)用比較廣泛,常被應(yīng)用在在以下幾個方面:生物學(xué)方面,聚類分析可以用來進(jìn)行動植物的分類,可以對基因進(jìn)行分類;商務(wù)方面,聚類分析可以幫助企業(yè)人員從龐大的客戶數(shù)據(jù)庫中發(fā)現(xiàn)不同類別的客戶群,并且根據(jù)客戶群特征提供相應(yīng)的服務(wù);經(jīng)濟(jì)研究中,為了研究不同地區(qū)城鎮(zhèn)居民生活中的收入和消費情況;在地質(zhì)學(xué)中,為了研究礦物勘探,需要根據(jù)各種礦石的化學(xué)和物理性質(zhì)和所含的化學(xué)成分把它們歸屬于不同的礦石類;在人口學(xué)研究中,需要構(gòu)造人口生育分類模式、人口死亡分類模式,來研究人口的生育和死亡規(guī)律.
客戶關(guān)系管理(簡稱CRM)20世紀(jì)90年代初出現(xiàn)在美國,90年代末期進(jìn)入中國.客戶關(guān)系管理應(yīng)用的最終目標(biāo)的幫助企業(yè)獲取更多的客戶、保留原來的老客戶、提高客戶的忠誠度,從而達(dá)到客戶創(chuàng)造價值的目的.客戶關(guān)系管理的實質(zhì)是利用網(wǎng)絡(luò)系統(tǒng)的優(yōu)勢實現(xiàn)對消費者的一對一營銷,企業(yè)向客戶提供個性化的服務(wù),盡量讓每個客戶都認(rèn)為這種服務(wù)是完全針對他個人的.要做到這一點,就要區(qū)別地對待不同的客戶,具體的實施步驟可以分為以下四個階段:第一階段:識別你的客戶,第二階段:對客戶進(jìn)行差異分析,第三階段:與客戶保持良性接觸,就是同客戶的交流和溝通,第四階段:調(diào)整產(chǎn)品或服務(wù)以滿足每一個客戶的需求,即企業(yè)向客戶提供個性化的服務(wù),進(jìn)行市場營銷.利用統(tǒng)計方法,分析出有效的客戶價值信息,有利于企業(yè)把握優(yōu)質(zhì)客戶,發(fā)展?jié)摿蛻簦J(rèn)識到客戶間的差異,從而為客戶提供一對一的差異化服務(wù).最終達(dá)到增加客戶滿意度、提高客戶忠誠度、挽留優(yōu)質(zhì)客戶的目的,并實現(xiàn)企業(yè)利潤的最大化.
而客戶分層最重要的就是客戶細(xì)分.客戶細(xì)分就是指根據(jù)客戶的某種屬性或特征將大的客戶群體劃分成若干個小的客戶群的過程,同屬一個客戶群的消費者彼此相似,而隸屬不同客戶群的消費者彼此不相似.客戶細(xì)分可以使企業(yè)全方位的、有目的性的分析、提取客戶數(shù)據(jù)庫中的有效客戶信息,同時使得企業(yè)可以根據(jù)細(xì)分群采取不同的方式為處于不同群的客戶提供優(yōu)質(zhì)服務(wù).客戶細(xì)分的方法有很多種,基于客戶統(tǒng)計學(xué)特征的、基于客戶生命周期的、基于客戶交易行為的以及基于客戶價值指標(biāo)的都是比較常見的細(xì)分方法.
本文針對淮南市某證券業(yè)提供的數(shù)據(jù)進(jìn)行客戶細(xì)分,以便提出合理的分群方法,提供不同的服務(wù).
客戶細(xì)分是客戶關(guān)系管理重要的實現(xiàn)手段之一,采用基于客戶交易行為的客戶細(xì)分是一個可選的方法.針對證券業(yè)龐大的客戶群,通過一定的劃分方法,將客戶分為優(yōu)質(zhì)客戶、潛力客戶、一般客戶,有利于證券公司提供差異化的服務(wù),有利于客戶關(guān)系管理的成功實施.
3.1模型中變量的解釋
客戶細(xì)分的變量屬性有動態(tài)屬性,也有靜態(tài)屬性.調(diào)查的數(shù)據(jù)是2014年7月到2015年6月底,資產(chǎn)在50w到100w之間的客戶.調(diào)查的動態(tài)屬性變量有期末資金,期末資產(chǎn),交易量,成交筆數(shù),凈傭金,傭金,股票盈虧,成交金額-買入,成交金額賣出,靜態(tài)屬性變量有證券代碼、交易時間、客戶姓名、客戶年齡等.
3.2數(shù)據(jù)的預(yù)處理
分析過程中最重要的是數(shù)據(jù)預(yù)處理.在現(xiàn)實生活中,數(shù)據(jù)對象并不都是規(guī)范的,大多會有噪音、冗余、數(shù)據(jù)不一致等問題出現(xiàn),為了能夠提高數(shù)據(jù)挖掘的質(zhì)量、效率,就必須對這些存在缺陷的、不完整的數(shù)據(jù)進(jìn)行預(yù)處理,使得數(shù)據(jù)挖掘過程更簡單、更有效、更實用,結(jié)果更能準(zhǔn)確地反映客觀情況.數(shù)據(jù)預(yù)處理可以概括為以下三個階段:
(1)數(shù)據(jù)選取
由于從數(shù)據(jù)庫中隨機(jī)選取的歷史交易數(shù)據(jù)屬性繁多、數(shù)量巨大,這就需要人為地設(shè)定標(biāo)準(zhǔn)以便從眾多的數(shù)據(jù)中選擇有用的數(shù)據(jù).
(2)數(shù)據(jù)變換
數(shù)據(jù)的觀側(cè)值可能相差很大,因為數(shù)據(jù)庫中的各個數(shù)據(jù)對象具有各種不同的性質(zhì)屬性,通常都有不同的度量單位.所以,絕對值相對較少的變量起不到應(yīng)有的作用,絕對值較大的變量可能會影響到絕對值較小的變量.為了保證各變量在聚類分析中所處的地位相同,有必要對數(shù)據(jù)對象進(jìn)行數(shù)據(jù)變換.標(biāo)準(zhǔn)化變換是常見的變換方法.
標(biāo)準(zhǔn)化公式為:設(shè)共有n個客戶,設(shè)計p個屬性(變量),設(shè)xij是第i個對象的第j個屬性i=1,2,…,n;j=1,…,p,算得第j個屬性的平均值為,而樣本的標(biāo)準(zhǔn)差為則標(biāo)準(zhǔn)化后的數(shù)據(jù)為(i=1,2,…,n;j=1,…,p).
在經(jīng)過標(biāo)準(zhǔn)化變換后,各數(shù)據(jù)對象的變量屬性的均值為0,且標(biāo)準(zhǔn)差均為1.也就是說各變量屬性的基點相同,并且變化范圍也相同.
3.3快速聚類的算法:
此方法的實現(xiàn)有以下三步:
(1)初始重心的選擇.重心選擇的好壞能夠影響到聚類結(jié)果是否是有效的.
(2)進(jìn)行修改,逐個分派樣品到其最近均值的類中,重新計算接受新樣品的類和失去樣品的類的重心.
(3)重復(fù)上步,直到?jīng)]有元素進(jìn)出.此時聚類結(jié)束.
本例所選的具體數(shù)據(jù)選自淮南某證券公司柜面系統(tǒng)中2014年7月到2015年6月底,資產(chǎn)在50w到100w之間的客戶部分客戶歷史交易數(shù)據(jù),經(jīng)過數(shù)據(jù)的選取、清理后選取94個客戶信息,每個客戶所用數(shù)據(jù)為一年的平均值.其中包含的觀測變量有期末資金,期末資產(chǎn),交易量,成交筆數(shù),凈傭金,傭金,股票盈虧,成交金額-買入,成交金額賣出.處理的數(shù)據(jù)是一年的平均值.利用PASW Statistics 18軟件進(jìn)行K均值聚類:
指標(biāo)的含義及計算方法
因上述指標(biāo)數(shù)量級差別較大,若直接放在一起進(jìn)行運算,則數(shù)量級大的指標(biāo)將掩蓋數(shù)量級小的指標(biāo),為了保證各變量所處的地位相同,有必要對數(shù)據(jù)對象進(jìn)行數(shù)據(jù)變換,而標(biāo)準(zhǔn)化后的數(shù)據(jù)根據(jù)準(zhǔn)則,應(yīng)該都是介于-3到+3之間,通過統(tǒng)計方法處理,最后刪掉異常數(shù)據(jù),最后剩下82個客戶的數(shù)據(jù).利用剩下的數(shù)據(jù),利用K-均值聚類進(jìn)行分析,得到結(jié)果如下:
初始聚類中心
迭代歷史記錄a
最終聚類中心
每個聚類中的案例數(shù)
可以看到在第一分類中有4個客戶,第二個分類客戶中有62個客戶,第三分類中有19個客戶.在第二分類中客戶最多,是所有大客戶中比例最多的.
從最終聚類的重心可以看出,客戶細(xì)分結(jié)果得出三個質(zhì)心,三個質(zhì)心分別為:
第一個質(zhì)心為
(389386.681,9210.025,6142706.393,89.167,3081199.564,3061506.828,2614.587,1982.649,16435.200);
第二個質(zhì)心為
(410626.495,88931.742,721038.618,19.116,357467.390,363599.010,839.049,766.991,22087.037);
第三個質(zhì)心為
(548603.918, 55948.980, 2870916.795, 41.864, 1435940.978, 1434975.817, 2035.590, 1741.470, 25414.573)
這三個質(zhì)心的數(shù)據(jù)分別代表三種不同類型的客戶:
(1)第一類代表著優(yōu)質(zhì)客戶,從最終聚類中心中可以看出這類客戶股票操作頻率頻繁、資金量大,手續(xù)費收入多,客戶數(shù)量很少,但貢獻(xiàn)的手續(xù)費收入很多.表示這類客戶資金雄厚,熱衷于股市,是證券公司獲得利潤的重要客戶,證券公司可以從這類客戶身上獲得頗豐的收入.對于優(yōu)質(zhì)客戶,企業(yè)要積極與這部分客戶溝通,了解客戶的需求,進(jìn)行細(xì)致入微的訪談,必要時進(jìn)行“一對一”的服務(wù).優(yōu)質(zhì)客戶可以優(yōu)先享用證券公司的資源,如信息提前通知,高頻率的電話回訪等.最終達(dá)到客戶滿意、公司盈利,并挽留客戶的目的.
(2)第三類代表著潛力客戶,從表中可以看出,這類客戶操作頻率可觀,手續(xù)費收入比優(yōu)質(zhì)客戶少一些,由數(shù)據(jù)表明這類客戶有發(fā)展成為優(yōu)質(zhì)客戶的潛質(zhì),如果公司服務(wù)不到位也可能面臨著這部分客戶的流失.因此,證券公司要掌握這類客戶的有效信息,如個人愛好、購買特點,抓住客戶的心里需求,從而提供積極主動的服務(wù),讓客戶有被尊重的感覺,可以放心地在公司辦理一切業(yè)務(wù),以至最終達(dá)到客戶滿意公司提供的服務(wù)、信任公司,發(fā)展成優(yōu)質(zhì)客戶.
(3)第二類代表著一般客戶,一般客戶占有的比例較大,但這類客戶由于種種因素,對股票的操作頻率僅為19.116,手續(xù)費收入相對不高,股市參與度相對較低.一般客戶對公司的利潤貢獻(xiàn)最少的,但是人數(shù)眾多,總的受益還是很客觀的,對這類客戶要努力開發(fā)成潛力客戶,這類客戶的資金也很多,開發(fā)的潛能很大.證券公司要注意提取有價值信息,辨別一般客戶是否有成為優(yōu)質(zhì)客戶的潛力,對癥下藥,為其提供與之相適應(yīng)的服務(wù).
根據(jù)以上分群,首先,可以對對公司的貢獻(xiàn)價值對不同的客戶提供差異化服務(wù),為貢獻(xiàn)度高的客戶優(yōu)先配置有限的資源,為貢獻(xiàn)度不大的客戶配置資源放在次要順序,這樣就實現(xiàn)了顧客的區(qū)別對待;其次客戶可以根據(jù)自身的條件選擇不同的服務(wù);最后,企業(yè)為獲取增長性、持續(xù)性的利潤的就必然要提供差異化服務(wù),滿足客戶合理需求.
參考文獻(xiàn):
〔1〕邢留偉.K-Means算法在客戶細(xì)分中的應(yīng)用研究[D].西南財經(jīng)大學(xué),2007.
〔2〕婁至濤.基于聚類分析的證券業(yè)客戶關(guān)系管理研究[D].西北農(nóng)林科技大學(xué),2010.
〔3〕劉莉.K-means算法在移動客戶細(xì)分中的應(yīng)用研究[J].信息通信,2008(6).
〔4〕王荇,鄭成增.聚類算法在證券公司CRM中的應(yīng)用[J].常州工學(xué)院學(xué)報,2008(4).
〔5〕王園.證券業(yè)客戶細(xì)分模型構(gòu)建及時政研究[J].上海管理科學(xué),2012(2).
基金項目:淮南師范學(xué)院教師社會實踐項目;淮南師范學(xué)院科學(xué)研究項目(No.2014xj45)
收稿日期:2015-11-5
中圖分類號:F830.91;F270
文獻(xiàn)標(biāo)識碼:A
文章編號:1673-260X(2016)04-0099-03