段夢娟
(西安培華學(xué)院, 會計與金融學(xué)院, 陜西, 西安 710125)
隨著大數(shù)據(jù)時代信息技術(shù)的發(fā)展與更新,數(shù)據(jù)分析成為價值挖掘的基本手段。對于商業(yè)銀行來說,客戶是重要的無形財富,了解客戶的購買傾向、關(guān)注客戶的購買意愿是商業(yè)銀行提供優(yōu)質(zhì)產(chǎn)品及服務(wù)的前提,與此同時,結(jié)合客戶的關(guān)注點開發(fā)出更優(yōu)質(zhì)的理財信貸產(chǎn)品也是商業(yè)銀行實現(xiàn)利潤最大化的關(guān)鍵手段。因此,優(yōu)異的商業(yè)銀行客戶關(guān)系管理系統(tǒng)不僅更利于追蹤客戶需求,也可以用更低的成本促成更多的交易,將帶來巨大的實際應(yīng)用價值。
在商業(yè)銀行中,客戶關(guān)系管理更加側(cè)重于利用信息技術(shù)對銀行的業(yè)務(wù)流程以及營銷對策進行優(yōu)化與改革,提供創(chuàng)新管理思路,為客戶和銀行利益最大化提供數(shù)據(jù)支持。管理客戶關(guān)系的終極目標(biāo)在于降低銀行運營成本、提高收入及利潤、維系改善客戶關(guān)系、開拓新市場、提升客戶滿意度及忠誠度、合理進行客戶分類、根據(jù)客戶傾向為有價值的客戶分配資源。
客戶生命周期指的是某一客戶對于銀行而言存在類似生命周期的分階段的發(fā)展過程。主要包括識別、吸引、維系和發(fā)展4個生命階段,針對不同階段的客戶維護側(cè)重點不同,主要內(nèi)容如圖1所示。通過對基本信息數(shù)據(jù)進行歸類、回歸等學(xué)習(xí),挖掘客戶需求,制定維護策略[1]。
圖1 客戶生命周期維系流程
AJAX技術(shù)無需刷新當(dāng)前頁面的信息即可實現(xiàn)客戶端與服務(wù)端的通信,應(yīng)用于商業(yè)銀行客戶關(guān)系管理系統(tǒng)中可以實現(xiàn)用戶需求快速獲取,使銀行與客戶的通信更便捷。ADO.NET技術(shù)可實現(xiàn)數(shù)據(jù)訪問伸縮性,針對商業(yè)銀行海量的客戶關(guān)系數(shù)據(jù),可實現(xiàn)高效訪問。
商業(yè)銀行客戶關(guān)系管理的最終目的是整理分析客戶信息,并根據(jù)數(shù)據(jù)結(jié)果提供有針對性的服務(wù),提升客戶滿意度與忠誠度,因此在系統(tǒng)功能設(shè)計上需要涵蓋客戶、產(chǎn)品、服務(wù)等多方面的管理。普通用戶具備營銷管理、客戶信息查看、產(chǎn)品信息查看、服務(wù)管理、統(tǒng)計分析等權(quán)限;系統(tǒng)管理員具備客戶管理、產(chǎn)品管理、服務(wù)管理、配置管理、權(quán)限管理、系統(tǒng)維護等權(quán)限。系統(tǒng)功能用例設(shè)計如圖2所示。
圖2 系統(tǒng)功能用例
機器學(xué)習(xí)屬于多領(lǐng)域交叉學(xué)科,在推理、識別等領(lǐng)域應(yīng)用廣泛,根據(jù)涵蓋經(jīng)驗的多少可以分為監(jiān)督、半監(jiān)督、無監(jiān)督幾類,最常見的學(xué)習(xí)方法包括回歸、分類、降維以及聚類。商業(yè)銀行客戶管理中最核心的產(chǎn)品營銷管理主要目的在于查找有購買意愿的客戶,在實現(xiàn)過程中首先要將問題標(biāo)準(zhǔn)化,然后獲取訓(xùn)練數(shù)據(jù)進行預(yù)處理之后利用適當(dāng)?shù)膶W(xué)習(xí)算法進行模型的訓(xùn)練,最終調(diào)整相關(guān)參數(shù),篩選出有購買傾向的客戶群[2]。
訓(xùn)練數(shù)據(jù)的預(yù)處理主要包括分析、清洗以及轉(zhuǎn)換3個步驟。首先,需要理解數(shù)據(jù)集中字段和屬性的關(guān)聯(lián),提取基礎(chǔ)特征、短期內(nèi)行為特征以及經(jīng)濟環(huán)境特征?;A(chǔ)特征包括年齡、職業(yè)、婚姻狀態(tài)、教育水平、信用度、是否有貸款等;短期內(nèi)行為特征包括最后接觸日期、交流方式、距今天數(shù)、聯(lián)系次數(shù)、之前的營銷結(jié)果等;經(jīng)濟環(huán)境特征包括物價指數(shù)、就業(yè)率等。其次,進行數(shù)據(jù)分析之后剔除重復(fù)、有誤的噪聲數(shù)據(jù),補充缺失數(shù)據(jù)。最后,對數(shù)據(jù)進行標(biāo)準(zhǔn)化、歸一化處理,轉(zhuǎn)換為適用于機器學(xué)習(xí)的格式。選用scale函數(shù)實現(xiàn)數(shù)組數(shù)據(jù)標(biāo)準(zhǔn)化,選用quantile_transform函數(shù)對非數(shù)值數(shù)據(jù)進行線性轉(zhuǎn)換,選用sklearn平臺的Normalizer工具做歸一化處理[3]。整體處理流程如圖3所示。
圖3 數(shù)據(jù)預(yù)處理流程
利用GTB算法進行模型構(gòu)建,主要通過2種方法實現(xiàn)樣本劃分:優(yōu)化訓(xùn)練數(shù)據(jù)集參數(shù)、評估特征的重要性。參數(shù)主要包括樹參數(shù)、Boosting參數(shù)以及其他調(diào)節(jié)模型運作的相關(guān)參數(shù)。選取加州大學(xué)歐文分校(University of California,Irvine)的UCI公開數(shù)據(jù)庫中符合要求的銀行數(shù)據(jù)41 188條,將其中70%作為訓(xùn)練集,30%作為測試集[5]。先設(shè)置參數(shù)初始值:最小樣本數(shù)min_samples_split=900;葉子節(jié)點最少樣本數(shù)min_samples_leaf=75;最大樹深度max_depth=8;分類特征數(shù)max_feature=8。接下來進行參數(shù)調(diào)優(yōu),首先指定學(xué)習(xí)率為0.1,利用多次交叉驗證分析迭代次數(shù)需達到100才能得到最優(yōu)解,因此調(diào)整學(xué)習(xí)率為0.15,只需60次迭代即可,因此n_estimators=60。然后,調(diào)節(jié)數(shù)參數(shù),得到max_depth=11,min_samples_split=400,subsample=0.7。最后優(yōu)化Boosting參數(shù),為了避免過度擬合,降低學(xué)習(xí)率,增加決策樹的迭代次數(shù),調(diào)整后逐步對比最終確定為學(xué)習(xí)率=0.005,n_estimators=1 800.使得準(zhǔn)確率Accuracy達到0.911。得到最優(yōu)參數(shù)之后,在推薦相似產(chǎn)品時即可利用分類器進行客戶篩選,假設(shè)預(yù)計可以對60%的潛在客戶進行營銷,那么:
隨機選取的營銷數(shù)量=總客戶數(shù)×60%;
基于機器學(xué)習(xí)后篩選出的營銷數(shù)量=總客戶數(shù)*總購買比例*預(yù)期銷售比例/準(zhǔn)確率。
在準(zhǔn)確率為0.911,總購買比例為14.53%時,營銷數(shù)量=總客戶數(shù)* 9.57%。即可將營銷數(shù)量從60%降低到9.57%,具備良好的分類效果,很大幅度的過濾了客戶、提升了營銷效率。
商業(yè)銀行客戶關(guān)系管理系統(tǒng)在整體架構(gòu)上劃分為4層:數(shù)據(jù)層、支撐層、邏輯層和展示層。數(shù)據(jù)層采用關(guān)系型數(shù)據(jù)庫SQL Server實現(xiàn)數(shù)據(jù)存儲;支撐層主要為系統(tǒng)核心技術(shù),包括AJAX、ADO.NET、jQuery、J2EE等;邏輯層主要完成系統(tǒng)核心業(yè)務(wù)邏輯處理,完成對數(shù)據(jù)的分析與計算并將結(jié)果返回給用戶;展示層作為人機交互界面,是用戶與系統(tǒng)的交互通道。系統(tǒng)整體組成結(jié)構(gòu)如圖4所示[6]。
圖4 系統(tǒng)總體架構(gòu)
根據(jù)系統(tǒng)的功能需求分析,結(jié)合商業(yè)銀行的客戶關(guān)系管理目標(biāo)以及客戶生命周期的維系流程,在系統(tǒng)總體架構(gòu)上設(shè)計功能模塊,將核心功能劃分為8個模塊,組成結(jié)構(gòu)如圖5所示。
圖5 系統(tǒng)功能模塊組成
(1) 營銷管理:利用產(chǎn)品營銷分類模型,定位潛在具有購買產(chǎn)品意向的客戶群。查看訂單及合同信息。
(2) 客戶管理:客戶名稱、行業(yè)、性別、職位、聯(lián)系方式、地址等基本信息管理。實現(xiàn)客戶信息的增刪改查。
(3) 產(chǎn)品管理:實現(xiàn)對商業(yè)銀行的理財產(chǎn)品、信貸產(chǎn)品的編碼、描述、類別等基本信息進行管理。
(4) 服務(wù)管理:實現(xiàn)客戶的新需求、意見、投訴等的登記與處理。
(5) 統(tǒng)計分析:多維度統(tǒng)計分析,包括客戶的貢獻、構(gòu)成分類、服務(wù)類別以及流失原因分析等,直觀展示數(shù)據(jù)挖掘結(jié)果。
(6) 配置管理:實現(xiàn)對城市、區(qū)域、部門、客戶職業(yè)、狀態(tài)、行業(yè)類型等分析功能所需的各類參數(shù)進行個性化配置。
(7) 權(quán)限管理:實現(xiàn)用戶權(quán)限設(shè)置,根據(jù)用戶或角色賦權(quán),確保系統(tǒng)安全與數(shù)據(jù)安全。
(8) 系統(tǒng)維護:實現(xiàn)系統(tǒng)登錄、密碼修改等系統(tǒng)維護事項[7]。
根據(jù)系統(tǒng)功能模塊設(shè)計核心數(shù)據(jù)庫表如下。
(1) 客戶基本信息表:核心字段包括客戶名稱、證件號碼、賬號、行業(yè)、職位、性別、地址、聯(lián)系方式、學(xué)歷、月收入、產(chǎn)品編號、產(chǎn)品名稱、意愿等級等。
(2) 產(chǎn)品信息表:核心字段包括產(chǎn)品編碼、產(chǎn)品名稱、產(chǎn)品類型、風(fēng)險分級、內(nèi)容描述等。
(3) 服務(wù)信息表:核心字段包括投訴編號、用戶編號、客戶姓名、投訴信息、投訴時間、處理時間、處理結(jié)果等。
(4) 需求信息表:核心字段包括需求編號、客戶姓名、需求描述、提出時間、處理時間、處理人等。
(5) 營銷信息表:核心字段包括產(chǎn)品編號、客戶編號、客戶名稱、意愿等級、最后聯(lián)系時間、客戶狀態(tài)等[8]。
在系統(tǒng)測試過程中,秉承合理規(guī)劃測試事項、合理輸入異常輸入結(jié)合、發(fā)現(xiàn)漏洞修改后再次驗證等原則設(shè)計了系統(tǒng)功能測試用例,主要包括客戶、產(chǎn)品、服務(wù)信息的增刪改查;客戶、產(chǎn)品、服務(wù)信息的查詢與檢索;營銷類型的預(yù)測;用戶權(quán)限與角色的分配等。驗證結(jié)果均與預(yù)期相符且各類主流瀏覽器頁面展示正常,兼容性較好,整體功能滿足設(shè)計預(yù)期。
采用100個用戶訪問系統(tǒng)功能模塊,系統(tǒng)登錄平均耗時1 245 ms,信息查詢平均耗時3 927 ms,添加各類信息平均耗時2 732 ms,整體響應(yīng)迅速,無卡頓崩潰現(xiàn)象,系統(tǒng)性能優(yōu)異。
為了驗證系統(tǒng)營銷模型的預(yù)測準(zhǔn)確性,采用國內(nèi)某浦發(fā)銀行的1號理財產(chǎn)品作為樣本集,選取符合要求的247名客戶的銀行數(shù)據(jù),收集客戶背景、參與活動次數(shù)、上次接觸后天數(shù)、聯(lián)系次數(shù)、之前營銷活動結(jié)果等營銷數(shù)據(jù),聯(lián)合我國季度就業(yè)率、季度就業(yè)變動率、消費物價指數(shù)月指標(biāo)、消費者信息指數(shù)等宏觀經(jīng)濟變量構(gòu)成20個混合變量,帶入系統(tǒng)設(shè)計的GTB營銷預(yù)測訓(xùn)練模型,對樹參數(shù)、Boosting參數(shù)進行調(diào)優(yōu)以及數(shù)據(jù)訓(xùn)練,最終得到預(yù)測準(zhǔn)確率Accuracy為0.900,極大程度的過濾了不相關(guān)客戶,為商業(yè)銀行的個性化營銷提供了十分重要的參考價值。
本研究從商業(yè)銀行客戶關(guān)系的管理目標(biāo)為基點,通過機器學(xué)習(xí)設(shè)計了營銷預(yù)測分類模型,并設(shè)計了4層體系的管理系統(tǒng),實例數(shù)據(jù)驗證系統(tǒng)功能完備,預(yù)測模型準(zhǔn)確度高,為商業(yè)銀行客戶關(guān)系管理提供了技術(shù)手段。但建模參數(shù)還需進一步精確,納入更多影響因子以提升預(yù)測準(zhǔn)確度。同時在使用過程中還需不斷完善系統(tǒng)功能,為商業(yè)銀行提供更精細的客戶價值挖掘手段。