矯世全
遼寧錦州渤海大學信息科學與技術學院
基于Java的信用卡數(shù)據(jù)挖掘系統(tǒng)
矯世全
遼寧錦州渤海大學信息科學與技術學院
隨著銀行信用卡市場在全球普及,信用卡在消費中占主導地位,大多數(shù)銀行信用卡業(yè)務都能為本行增加經濟收益,銀行嘗試在信用卡業(yè)務上創(chuàng)新或者優(yōu)化信用卡管理,銀行信用卡原始數(shù)據(jù)量巨大,通過分析原始數(shù)據(jù)挖掘潛在的商機,本文基于決策樹算法實現(xiàn)銀行信用卡數(shù)據(jù)挖掘的功能,實現(xiàn)決策信用卡業(yè)務功能。信用卡的數(shù)據(jù)庫中存在大量數(shù)據(jù)記錄,通過數(shù)據(jù)挖掘建立信用卡客戶、業(yè)務功能模型,統(tǒng)計分析信用卡的業(yè)務模型以降低銀行信用卡的運營風險,該系統(tǒng)構建以業(yè)績統(tǒng)計分析、銀行收益分析、重點業(yè)務領域分析等綜合性數(shù)據(jù)挖掘管理系統(tǒng),促進銀行信用卡業(yè)務良性發(fā)展。本系統(tǒng)因信用卡實現(xiàn)數(shù)據(jù)挖掘具有可行性,針對于信用卡的數(shù)據(jù)挖掘建立挖掘模型,信用卡數(shù)據(jù)挖掘分析系統(tǒng)的設計對銀行經濟收益具有實際應用意義。
Java 銀行 信息卡 數(shù)據(jù)挖掘 決策樹算法
銀行信用卡業(yè)務量不斷增長,基于數(shù)據(jù)庫統(tǒng)計分析、存儲錄入、業(yè)務辦理等功能,由于信用卡數(shù)據(jù)量大,數(shù)據(jù)組織存儲凌亂,根本無法預測或者挖掘數(shù)據(jù)之間關聯(lián),更不可能根據(jù)某種規(guī)則挖掘信用卡未來業(yè)務的發(fā)展趨勢。信用卡管理缺乏基于原始數(shù)據(jù)挖掘數(shù)據(jù)之間的關聯(lián),銀行信用卡業(yè)務為了奪得客戶和市場,實現(xiàn)銀行信用卡業(yè)務長遠的發(fā)展。銀行通過數(shù)據(jù)挖掘系統(tǒng)深入分析不同信用卡客戶的實際需求,尋找潛在客戶源,為其提供有針對性的信用卡業(yè)務服務,是銀行提高市場占有率的關鍵,因此,基于數(shù)據(jù)挖掘方式實現(xiàn)客戶關系挖掘、重點業(yè)務挖掘等便成為銀行研究的重點問題。
信用卡成為現(xiàn)今普遍的支付方式,代表著信用憑證。信用卡業(yè)務集成了“存、貸、消”三種常用的功能,這是實現(xiàn)無紙無現(xiàn)鈔時代,它促進社會經濟發(fā)展和各類商品銷售,拉動國內經濟增長,對社會發(fā)展起到促進作用。
由于信用卡性質,需要實施基于數(shù)據(jù)挖掘手段整合信用卡業(yè)務需求。另外,銀行信用卡業(yè)務種類繁多,可能存在信用卡種類與客戶群不對稱的現(xiàn)象,務必會影響到信用卡發(fā)展趨勢,銀行使用信用卡業(yè)務的風險和獲取利潤并存。因此,銀行有必要對數(shù)據(jù)庫中的原始數(shù)據(jù)進行整合,實施有效地數(shù)據(jù)組織操作,將數(shù)據(jù)挖掘后的原始數(shù)據(jù)進行分析和歸類操作,可以幫助銀行推行信用業(yè)務,同時能夠準確地預測未來發(fā)展。
2.1 系統(tǒng)功能性需求分析
本系統(tǒng)劃分為一級功能模塊和二級功能子模塊兩種。其中一級功能模塊賬戶管理、信用卡管理、數(shù)據(jù)挖掘管理、信用卡激活管理;二級功能模塊申請開卡業(yè)務、賬戶管理、開戶管理、信用卡管理、統(tǒng)計交易類型、統(tǒng)計交易金額、統(tǒng)計交易次數(shù)、統(tǒng)計客戶分布、統(tǒng)計查詢和激活功能。
①申請開卡:客戶通過銀行信用卡系統(tǒng)實現(xiàn)客戶資料填寫,完成信用卡開卡操作;
②賬戶管理:系統(tǒng)管理員實現(xiàn)對賬戶進行管理,修改信用卡狀態(tài)、管理信用卡業(yè)務;
③信用卡管理:實現(xiàn)對信用卡類型、額度、狀態(tài)等進行綜合性管理操作;
④數(shù)據(jù)挖掘管理:統(tǒng)計交易類型,實現(xiàn)信用卡不同類型的統(tǒng)計操作;統(tǒng)計交易類型,統(tǒng)計信用卡交易類型;統(tǒng)計交易額度,統(tǒng)計某個用戶一段時間內的交易額度;統(tǒng)計交易次數(shù),統(tǒng)計銀行信用卡用戶表在一定時間內的交易次數(shù);
⑤信用卡激活操作:系統(tǒng)的管理人員通過信用卡賬戶或者身份證號查詢或者激活操作,當信用卡開通之后必須進行激活才能進行后期的使用,包括:“存、貸、消”三種常用的功能。
2.2 系統(tǒng)非功能性需求分析
本文研究的信用卡數(shù)據(jù)挖掘管理系統(tǒng)的非功能性需求:
2.2.1 界面要求
要求該系統(tǒng)的功能界面按照統(tǒng)一界面風格設計,追求系統(tǒng)界面中控件布局合理、風格一致。
2.2.2 功能擴展性要求
系統(tǒng)的新功能擴展要求采用遠程服務器端進行功能擴展升級設計方案,其目的是當信用卡需求變更為新功能時,只在遠程的服務器端更新即可實現(xiàn)異步更新,使得系統(tǒng)新功能擴展的需求。
2.2.3 安全性能要求
為了保障系統(tǒng)安全性,避免系統(tǒng)在運行過程中受黑客惡意攻擊,當前的網絡環(huán)境下傳輸數(shù)據(jù)并不安全,如果對傳輸數(shù)據(jù)進行安全性保障,需要對傳輸?shù)臄?shù)據(jù)進行加密和解密操作。
3.1 系統(tǒng)的總體設計目標
信用卡數(shù)據(jù)挖掘系統(tǒng)實現(xiàn)的設計目標:
①系統(tǒng)資源整合操作,整合信用卡中心的原始業(yè)務數(shù)據(jù),實現(xiàn)原始數(shù)據(jù)實時共享。
②方便辦理銀行信用卡業(yè)務。
③信用卡數(shù)據(jù)挖掘系統(tǒng)并不是直接傳輸數(shù)據(jù),而需要對原始數(shù)據(jù)進行加密和解密操作,數(shù)據(jù)保密性較好。
④系統(tǒng)的新務功能進行擴展操作,例如:網上自助查詢與服務管理功能等。
⑤軟件界面簡單快捷,有利于客戶和管理者在實際信用卡管理過程中投入使用。
3.2 基于決策樹算法信用卡數(shù)據(jù)挖掘算法描述
本文基于決策樹算法來實現(xiàn)對銀行信用卡的原始數(shù)據(jù)進行數(shù)據(jù)挖掘操作,決策樹一度是數(shù)據(jù)挖掘實現(xiàn)的經典算法。算法巧妙的通過對已知訓練原始數(shù)據(jù)建立決策關系,再根據(jù)建好的決策樹模型實現(xiàn)對原始數(shù)據(jù)分析和歸類操作。建立決策過程可視為原始數(shù)據(jù)規(guī)則分類過程。
本文的基于決策樹構建數(shù)據(jù)挖掘系統(tǒng)的模型步驟如下:
①選擇經典的決策樹算法將銀行信用卡原始數(shù)據(jù)進行初步的分類與分析;
②經過預處理原始數(shù)據(jù),由于銀行領域的數(shù)據(jù)特殊性和系統(tǒng)中存在大量的原始信用卡數(shù)據(jù),如果想要通過對原始數(shù)據(jù)進行挖掘和應用,根據(jù)決策數(shù)據(jù)模型發(fā)現(xiàn)潛在原始數(shù)據(jù)匯總的重要的價值信息;
③基于決策樹算法訓練信用卡原始數(shù)據(jù)樣本,構建信用卡數(shù)據(jù)挖掘管理模型,而基于決策樹算法訓練獲取決策樹應用模型,更易于對數(shù)據(jù)挖掘的理解;
④根據(jù)應用模型獲取的關于原始數(shù)據(jù)分類結果,在本文的系統(tǒng)中存在功能模塊實現(xiàn)對原始數(shù)據(jù)的分類與評估操作,對信用卡的原始數(shù)據(jù)挖掘過程和挖掘結果進行排序,銀行信用卡中心工作人員根據(jù)數(shù)據(jù)挖掘模型所獲取關數(shù)數(shù)據(jù)集合;
⑤最后將數(shù)據(jù)挖掘得到的整合數(shù)據(jù)采用圖或者表或者圖標結合的方式展現(xiàn)給銀行信用卡中心管理人員,以一種直觀可視化的方法便于對現(xiàn)在的業(yè)務分析和對未來信用卡業(yè)務發(fā)展動向進行預測。
3.3 基于決策樹算法信用卡數(shù)據(jù)挖掘算法實現(xiàn)
在設計數(shù)據(jù)挖掘過程中,決策樹的決策路徑表示信用卡原始分類的路徑,對于給定的某個信用卡原始數(shù)據(jù)集合D而言,對于已經輸入的變量I值,表示輸入變量值表示要選擇的數(shù)據(jù)挖掘算法序號值,如果在原始數(shù)據(jù)中要獲取到N個數(shù)據(jù)分類路徑,由于管理人員輸入的變量存在不確定性,如果給定樣本數(shù)據(jù)集合D存在多種分類結果時,當分類結果視為數(shù)據(jù)增長的決定性因素,根據(jù)決策樹的路徑實現(xiàn)的對給定的樣本D進行數(shù)據(jù)分類,其評價值作為熵,為了下一步數(shù)據(jù)N的分類,定義分類函數(shù)F,其輸入參數(shù)為給定樣本數(shù)據(jù)集合D和表示數(shù)據(jù)挖掘算法序號I值,函數(shù)公式記作:F(Di,I),函數(shù)公式1表示為:
公式1中:i為n個數(shù)據(jù)樣本的第i個數(shù)據(jù)集合,n為總的數(shù)據(jù)集合總數(shù),I表示序號,D給定樣本原始數(shù)據(jù)集合。
算法1 基于決策樹算法的信用卡數(shù)據(jù)挖掘過程input: D,I; //輸入D樣本原始數(shù)據(jù)和I序號,存在系統(tǒng)中的數(shù)據(jù)挖掘分類算法序號output: G//輸出對原始數(shù)據(jù)樣本的數(shù)據(jù)挖掘分類關系圖; 1:初始化 G←null,T←null; //初始化數(shù)據(jù)挖掘的分類圖和空值決策樹2:switch(I);//根據(jù)參數(shù)I值判斷使用數(shù)據(jù)挖掘算法,本文定義I=1為決策樹3:for i←0 to D.length;//根據(jù)循環(huán)預處理原始數(shù)據(jù)樣本4: D←P(D);//根據(jù)預處理函數(shù)還原給原始樣本數(shù)據(jù)5:end for; 6:T←decisionFunction(D,I);//構建一個以原始數(shù)據(jù)為準的決策樹7:List list←select data node and path on decision tree; //從決策樹的數(shù)據(jù)節(jié)點上選擇路徑作為本次挖掘數(shù)據(jù)結果8:for i←0 to list.size;//根據(jù)循環(huán)取出本次挖掘數(shù)據(jù)結果9: G←list.get(i)//獲取數(shù)據(jù)節(jié)點,將此節(jié)點添加到數(shù)據(jù)挖掘分類圖中10:end for 11:end switch 12:return G;//返回一個原始數(shù)據(jù)挖掘后的關系圖
算法1關于決策樹應用過程和算法偽代碼實現(xiàn)設計,實現(xiàn)了從樣本原始數(shù)據(jù)的構建信用卡決策分類數(shù)據(jù),并將分類數(shù)據(jù)節(jié)點的路徑以圖或者表或者二者結合的形式表示,形成的數(shù)據(jù)關聯(lián)圖即直觀觀察,又便于信用卡中心對信用卡業(yè)務做出決策。
4.1 系統(tǒng)測試目標與測試原則
針對數(shù)據(jù)挖掘系統(tǒng),可使用相關測試工具完成系統(tǒng)的測試工作,預期目標如下:
4.1.1 整體測試目標
系統(tǒng)業(yè)務功能按照最終的需求分析設計,無嚴重缺陷即可,系統(tǒng)性能指標核系統(tǒng)響應時間在允許的范圍內。
4.1.2 功能測試
功能基本實現(xiàn),每個功能之間完整通暢。
4.1.3 性能測試
多用戶、高并發(fā)、多任務訪問服務器均能符合相關要求,并支持較大大數(shù)據(jù)并發(fā)量查詢性能,性能測試在允許的范圍內。
4.2 系統(tǒng)測試結論
4.2.1 系統(tǒng)優(yōu)點
通過上面測試可以發(fā)現(xiàn)數(shù)據(jù)挖掘系統(tǒng)功能上符合前期需求,為信用卡中心提供了良好應用平臺,一是能夠實現(xiàn)信用卡數(shù)據(jù)挖掘管理,二是為信用卡業(yè)務提供科學決策依據(jù)。
4.2.2 系統(tǒng)不足
系統(tǒng)對外接口未實現(xiàn)預留,隨著銀行信用卡業(yè)務不斷增多,信用卡數(shù)據(jù)挖掘會帶來巨大方便,該系統(tǒng)某些實用性的功能還需進一步擴展,更好的為信用卡中心服務。
本文研究的主要工作:
①做出符合銀行信用卡管理的需求分析。
②通過研究信用卡數(shù)據(jù)挖掘的成功案例,再加上前人論文的借鑒基礎上,熟悉Java編程語言的開發(fā)工作,熟練掌握了關于面向對象編程基本思想。
③分析本文所開發(fā)系統(tǒng)涉及到的關鍵技術與軟件設計思想,其中包括:編程技術和數(shù)據(jù)庫技術。詳細設計完成了系統(tǒng)的基本功能模塊實現(xiàn),并為未來的信用卡業(yè)務發(fā)展預留部分待功能擴展接口,方便該系統(tǒng)擴展升級操作。
信用卡數(shù)據(jù)挖掘的需求會隨銀行信用卡業(yè)務進行不斷更新,有變更需求的系統(tǒng)軟件功能也隨著發(fā)生改變,信用卡功能內容也隨著不斷豐富。信用卡數(shù)據(jù)挖掘管仍然存在一些不足之處,這些待改進的地方有望在今后研究中加以著重改進和完善的方面。
[1]沈阿強,陳潔,秦娟.大客戶關系管理流程與實務[M].北京:人民郵電出版社,2007
[2]杜麗英,趙秀菊.基于數(shù)據(jù)挖掘的銀行客戶關系管理系統(tǒng)的研究[J].計算機光盤軟件與應用,2014,1:18-19