摘要:利用數(shù)據(jù)倉庫技術(shù)對企業(yè)內(nèi)部積累的大量歷史數(shù)據(jù)以及可能得到的外部信息進行分析和挖掘,提取有價值的信息,幫幫管理人員分析業(yè)務(wù)狀況、預(yù)測市場,作出正確的決策?!稑I(yè)績價值管理系統(tǒng)》(Performance Value Management System,簡稱PVMS)以數(shù)據(jù)倉庫的方法理論和實現(xiàn)手段,以銀行核心系統(tǒng)為主要數(shù)據(jù)源,綜合計算收益、成本、風險,從四個角度——產(chǎn)品、機構(gòu)、客戶群、服務(wù)渠道考核銀行經(jīng)營業(yè)績。
關(guān)鍵詞:數(shù)據(jù)倉庫;數(shù)據(jù)挖掘;業(yè)績價值管理系統(tǒng);銀行核心系統(tǒng);商業(yè)智能技術(shù)
中圖分類號:TP311文獻標識碼:A 文章編號:1009-3044(2009)35-9891-04
Application of Data Warehouse Technology in Bank's Performance Value Management System
CHEN Nong-xin1, ZHANG Xiao-yan2
(1.Heyuan Polytechnic,Heyuan 517000,China;2. Educational Information Technology Center,South China Normal University,Guangzhou 510631,China)
Abstract: Data warehouse technology is used to analyze and dig a huge amount of historical data accumulated in bank as well as outside information obtained possibly and to find valuable information,which will help the manager analyze the business situation, predict market and make right decisions. Revenues, costs, risks are calculated using data warehouse to exam banks’ operating results from four perspectives -products, agencies, customer base and service channels in PVMS,which based on bank core system as main data source.
Key words: data warehouse; data mining; PVMS; bank core system; commerce intelligence technology
隨著國內(nèi)金融服務(wù)市場的開放、競爭,銀行多樣化的產(chǎn)品、服務(wù)發(fā)展和信息技術(shù)的突飛猛進,從市場、質(zhì)量、效益、成本、改革這五個方面看,建立數(shù)據(jù)倉庫對我國銀行的發(fā)展都具有非常重要的意義 [1] 。
當前,國內(nèi)銀行的利潤報告體系很不完整,傳統(tǒng)的三大報表不能準確衡量各業(yè)務(wù)單元、產(chǎn)品、客戶群、渠道,特別是單個客戶的責任成本和貢獻,成為決策的瓶頸。
為有效地為上述問題的決策提供依據(jù),業(yè)績價值管理系統(tǒng)主要由成本分攤、內(nèi)部轉(zhuǎn)移價格、貸款實際損失、關(guān)鍵業(yè)績指標四大模塊構(gòu)成,從業(yè)務(wù)單元、產(chǎn)品、客戶群、渠道等角度考察銀行的收入和成本, 產(chǎn)生業(yè)績價值報告。從而在國內(nèi)銀行系統(tǒng)范圍內(nèi),做到多角度準確評估和把握業(yè)績狀況,產(chǎn)生分業(yè)務(wù)單元、產(chǎn)品、客戶群、渠道的四分一體的業(yè)績報告,實現(xiàn)面向管理、面向市場、面向客戶、面向決策的自動化業(yè)績價值管理系統(tǒng)。系統(tǒng)兼具現(xiàn)實性與前瞻性、多維性與整體性,能夠適應(yīng)業(yè)務(wù)品種的變化。
1 數(shù)據(jù)倉庫的理論和技術(shù)
1.1 數(shù)據(jù)倉庫技術(shù)
1.1.1 數(shù)據(jù)倉庫概念
20世紀90年代初,美國著名信息工程科學家W.H.Inmon提出數(shù)據(jù)倉庫的概念是:“數(shù)據(jù)倉庫就是面向主題的、集成的、穩(wěn)定的、不同時間的數(shù)據(jù)集合,用以支持經(jīng)營管理中的決策制訂過程。[3]”,主題是指用戶使用數(shù)據(jù)倉庫進行決策時所關(guān)心的重點方面;集成是指數(shù)據(jù)倉庫中的信息不是從各個業(yè)務(wù)系統(tǒng)中簡單抽取出來的,是經(jīng)過系統(tǒng)加工、匯總和整理,保證數(shù)據(jù)倉庫內(nèi)的信息是關(guān)于整個系統(tǒng)的一致的全局信息。所謂穩(wěn)定,是指一旦某個數(shù)據(jù)進入數(shù)據(jù)倉庫以后,一般情況下將被長期保留,也就是數(shù)據(jù)倉庫中一般有大量的插入和查詢操作,但修改和刪除操作很少。所謂包含歷史數(shù)據(jù)的,是指數(shù)據(jù)倉庫內(nèi)的信息并不只是當時或某一時點的信息,而是系統(tǒng)記錄了從過去某一時點到目前的各個階段的信息,通過這些信息,可以表明發(fā)展歷程并對未來的趨勢作出定量分析和預(yù)測。
數(shù)據(jù)倉庫既是一種結(jié)構(gòu)和富有哲理性的方法,也是一種技術(shù),數(shù)據(jù)倉庫至少應(yīng)包括3個基本的功能部分[4]:數(shù)據(jù)獲取、數(shù)據(jù)存儲和管理和信息訪問。
1.1.3 數(shù)據(jù)倉庫的組成
數(shù)據(jù)倉庫由以下幾個部分組成[5]。
1) 源系統(tǒng)(Source Systems)。即各種事務(wù)型數(shù)據(jù)庫, 它們是數(shù)據(jù)倉庫數(shù)據(jù)的來源。
2) 數(shù)據(jù)轉(zhuǎn)移和清理工具(Data Transport and Cleansing)。它們是將數(shù)據(jù)從源系統(tǒng)中轉(zhuǎn)移到中央存儲庫并加以清理的軟件, 一般具有描述數(shù)據(jù)在不同系統(tǒng)之間映射的圖形界面。數(shù)據(jù)清理包括消除數(shù)據(jù)的不一致, 更新過期數(shù)據(jù)和補齊缺失數(shù)據(jù)。
3) 中央存儲庫(Central Repository)。這是數(shù)據(jù)倉庫中實際存儲數(shù)據(jù)的部分。它包括以下三個關(guān)鍵要素: 可擴展硬件、關(guān)系型數(shù)據(jù)庫系統(tǒng)和邏輯數(shù)據(jù)模型。
4) 數(shù)據(jù)集市(Data Marts)。數(shù)據(jù)倉庫通常有成百上千的用戶, 這些用戶對數(shù)據(jù)倉庫往往有不同的要求, 而用一個集中的系統(tǒng)來滿足所有用戶是低效的。解決這一問題的方法是采用面向某一部門或某一應(yīng)用的數(shù)據(jù)倉庫——數(shù)據(jù)集市。數(shù)據(jù)集市一般通過創(chuàng)造中央存儲庫中原有數(shù)據(jù)庫的視圖來實現(xiàn)。
5) 在線分析處理(Online analytical processing, OLAP) 工具。OLAP是一種基于多維數(shù)據(jù)模型的分析工具, 它可以提供數(shù)據(jù)的多層面, 多角度的邏輯視圖, 為復(fù)雜的分析查詢產(chǎn)生快速響應(yīng)。用戶可通過OLAP對數(shù)據(jù)倉庫進行有效的利用。
1.2 數(shù)據(jù)挖掘
1.2.1 數(shù)據(jù)挖掘的概念
數(shù)據(jù)挖掘(Data Mining)就是從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。這些數(shù)據(jù)可以是結(jié)構(gòu)化的,如關(guān)系數(shù)據(jù)庫中的數(shù)據(jù),也可以是半結(jié)構(gòu)化的,如文本,圖形,圖像數(shù)據(jù),甚至是分布在網(wǎng)絡(luò)上的異構(gòu)型數(shù)據(jù)。發(fā)現(xiàn)知識的方法可以是數(shù)學的,也可以是非數(shù)學的,可以是演繹的,也可以是歸納的。發(fā)現(xiàn)了的知識可以被用于信息管理、查詢優(yōu)化、決策支持、過程控制等,還可以進行數(shù)據(jù)自身的維護。數(shù)據(jù)挖掘借助了多年來數(shù)理統(tǒng)計技術(shù)和人工智能以及知識工程等領(lǐng)域的研究成果構(gòu)建自己的理論體系,是一個交叉學科領(lǐng)域,可以集成數(shù)據(jù)庫、人工智能、數(shù)理統(tǒng)計、可視化、并行計算等技術(shù)。
1.2.2 數(shù)據(jù)挖掘的主要步驟、任務(wù)、方法和應(yīng)用
數(shù)據(jù)挖掘一般有以下幾個主要步驟:數(shù)據(jù)收集、數(shù)據(jù)整理、數(shù)據(jù)挖掘、對數(shù)據(jù)挖掘結(jié)果的評估以及最終的分析決策。數(shù)據(jù)挖掘過程需要多次的循環(huán)反復(fù),才有可能達到預(yù)期的效果。
數(shù)據(jù)挖掘技術(shù)的目標就是從大量數(shù)據(jù)中,發(fā)現(xiàn)隱藏于其后的規(guī)律或數(shù)據(jù)間的關(guān)系,從而服務(wù)于決策。
數(shù)據(jù)挖掘主要任務(wù)有:數(shù)據(jù)總結(jié)、分類、關(guān)聯(lián)分析和聚類分析。
數(shù)據(jù)挖掘工具采用的主要方法包括決策樹、相關(guān)規(guī)則、神經(jīng)元網(wǎng)絡(luò)、遺傳算法,以及可視化、OLAP聯(lián)機分析處理等,另外也采用了傳統(tǒng)的統(tǒng)計方法。
目前,數(shù)據(jù)挖掘的研究和應(yīng)用非常熱門,應(yīng)用主要集中在以下幾個領(lǐng)域:金融、市場業(yè)、工程與科學研究、產(chǎn)品制造業(yè)、司法和證券業(yè)。
2 系統(tǒng)總體設(shè)計
業(yè)績價值管理系統(tǒng)主要由成本分攤、內(nèi)部轉(zhuǎn)移價格、貸款實際損失、關(guān)鍵業(yè)績指標四大模塊構(gòu)成,從業(yè)務(wù)單元、產(chǎn)品、客戶群、渠道等角度考察銀行的收入和成本。本系統(tǒng)完成成本分攤和關(guān)鍵業(yè)績指標、實際貸款損失和內(nèi)部轉(zhuǎn)移價格的計算和分析,從而產(chǎn)生業(yè)績價值報告。
2.1 系統(tǒng)設(shè)計概要
本系統(tǒng)的設(shè)計原則是以自頂向下設(shè)計為主線,以自底向上的方法論進行設(shè)計審查,以減少后續(xù)主題開發(fā)中的重復(fù)建構(gòu)。
項目設(shè)計分三層。
第一層:系統(tǒng)總體邏輯結(jié)構(gòu),如圖1所示。
對數(shù)據(jù)流的各個處理階段說明:
1) 數(shù)據(jù)下載和OLTP存儲:數(shù)據(jù)倉庫的數(shù)據(jù)源主要是銀行核心系統(tǒng)的各個子系統(tǒng)以及必要的手工信息輸入;
2) 數(shù)據(jù)倉庫處理:以總分類帳為中心,包括三大處理內(nèi)容:數(shù)據(jù)清理、數(shù)據(jù)倉庫加載和存儲、數(shù)據(jù)匯總導(dǎo)出;
3) 數(shù)據(jù)集市處理:維度定義和參數(shù)維護、數(shù)據(jù)導(dǎo)入和數(shù)據(jù)整合、報表制作;
4) 面向普通用戶的靜態(tài)報表瀏覽展現(xiàn)、面向高級用戶的客戶端分析以及用戶管理。
第二層:對上述四部分進行細化設(shè)計,重點是第二步圍繞數(shù)據(jù)倉庫及其計算的處理,將其局部放大,從數(shù)據(jù)源到最終用戶界面的處理如圖2所示。
第三層:各模塊的詳細設(shè)計。
2.3 數(shù)據(jù)流程圖
根據(jù)最終所要生成的利潤報告的數(shù)據(jù)組成要素,把整個系統(tǒng)劃分為關(guān)鍵業(yè)績指標、成本分攤方案、中間轉(zhuǎn)移價格、貸款實際損失四大功能組件。四大組件均包含存儲模型和計算模型兩種成分。
數(shù)據(jù)處理的邏輯模型如圖3所示。
2.4 數(shù)據(jù)倉庫設(shè)計
1) 數(shù)據(jù)模型設(shè)計
根據(jù)本項目的特點,設(shè)計了三個主題存儲域:客戶、帳戶、帳務(wù)。其關(guān)系如圖4所示。
圖中產(chǎn)品用虛線橢圓表示,是由于在業(yè)務(wù)系統(tǒng)中并無明確的產(chǎn)品概念,而是在本系統(tǒng)中根據(jù)需要而增加的。圖中實線橢圓內(nèi)各實體說明如表1所示。
2) 客戶主題域
客戶主題域包括客戶信息和銀行評級或分類。前者主要來自銀行核心系統(tǒng)中客戶信息系統(tǒng);后者來自本系統(tǒng)或相關(guān)系統(tǒng)(包括人工系統(tǒng))的運行結(jié)果。
3) 產(chǎn)品定義
產(chǎn)品定義是本項目的基點,本項目采取在科目層面對產(chǎn)品進行定義,在賬戶層面(通過科目定義到產(chǎn)品后)對產(chǎn)品進行數(shù)據(jù)歸集和計算。產(chǎn)品定義分為兩部分:產(chǎn)品的資產(chǎn)負債定義和損益定義。
3 系統(tǒng)的分析建模
業(yè)績價值管理系統(tǒng)主要由成本分攤、內(nèi)部轉(zhuǎn)移價格、貸款實際損失、關(guān)鍵業(yè)績指標四大子系統(tǒng)構(gòu)成,從業(yè)務(wù)單元、產(chǎn)品、客戶群、渠道等角度考察銀行的收入和成本,產(chǎn)生業(yè)績價值報告。
3.1 成本分攤
首先,該子系統(tǒng)先將成本分類成共享成本和直接成本。再根據(jù)得到的成本,將其分攤到各個產(chǎn)品(帳號)當中。
3.1.1成本歸集和維度
1) 成本歸集定義
① 成本歸集的目的是將發(fā)生的費用歸集到相應(yīng)的成本中心。歸集到成本中心的成本包括直接成本、共享成本。
② 進行成本歸集的數(shù)據(jù)源為計財系統(tǒng)的計帳明細表
2) 維度定義
在該系統(tǒng)中,根據(jù)報表、分析的角度和內(nèi)容,分為三個維度:機構(gòu)、產(chǎn)品和指標項目。
3.1.2 成本分攤建模
1) 成本分攤的基本流程(由成本中心至網(wǎng)點—產(chǎn)品)如圖5所示。
2) 分攤基數(shù)
① 網(wǎng)點:發(fā)生在網(wǎng)點的成本全部是經(jīng)營成本,直接分攤到網(wǎng)點的產(chǎn)品上去;
② 支行經(jīng)營部門成本按照基數(shù)分攤法直接分攤到所屬網(wǎng)點的產(chǎn)品上;
③ 分行經(jīng)營部門成本按照基數(shù)分攤法直接分攤到所屬網(wǎng)點的產(chǎn)品上;
④ 支行辦公室成本首先按支行三部的各部人頭數(shù)分攤到這三個經(jīng)營部門,然后按照各部門成本分攤規(guī)則,將該部分成本分攤到網(wǎng)點的產(chǎn)品上;
⑤ 分行管理部門的成本分攤:
a) 按人頭基數(shù)分攤到分行經(jīng)營部門(A)和所屬各支行(B);
b) A部分成本按照相應(yīng)的經(jīng)營部門的分攤基數(shù)分攤到網(wǎng)點產(chǎn)品上;
c) B部分按支行中三部一室的人數(shù)分成4部分,然后按相應(yīng)的規(guī)則分攤到網(wǎng)點產(chǎn)品上。
3.2 內(nèi)部轉(zhuǎn)移價格
內(nèi)部轉(zhuǎn)移價格,也叫中間轉(zhuǎn)移價格(以下簡稱MOR),是指企業(yè)內(nèi)各部門之間由于相互提供產(chǎn)品、半成品或勞務(wù)而引起的相互結(jié)算、相互轉(zhuǎn)賬所需要的一種計價標準。轉(zhuǎn)移價格廣泛地應(yīng)用在企業(yè)決策制定、成本計算、業(yè)績評價等方面。它與公司經(jīng)營戰(zhàn)略和公司的內(nèi)部控制、管理制度相關(guān)。
MOR的計算建模主要分為以下五個步驟,其計算頻率和計算時間段皆為一季度。
1) 導(dǎo)入現(xiàn)行三大資金市場的各期限參考利率和現(xiàn)行的存、貸利率;
2) 計算無市場利率的各期限利率,得到完整的基準利率;
3) 計算分期限、分市場的資金量Ak 、Bk 、Ck 。其中k為各個期限;
4) 根據(jù)資產(chǎn)與負債的利差和利差分配方式,計算各期限資產(chǎn)/負債的MOR。
假設(shè)利差為0.5%(“利差”要可維護),分配方式為均分,計算公式為
資產(chǎn)MOR(k)= (Ra *Ak + Rb * Bk + Rc * Ck)/ (Ak +Bk+Ck) + 0.45%
負債MOR(k)= (Ra *Ak + Rb * Bk + Rc * Ck)/ (Ak +Bk+Ck) - 0.45%
其中:k為各個期限。
5) 計算各產(chǎn)品的MOR。方法有兩種,一是根據(jù)該產(chǎn)品各期限余額占比計算,二是根據(jù)該產(chǎn)品各期限的沉淀率計算。
3.3 貸款實際損失
1) 根據(jù)上個報告期的貸款實際損失率,計算期初貸款損失A1。
2) 計算本報告期的貸款實際損失率。
貸款實際損失率L按以下公式計算:
貸款實際損失率L(k) = 不良貸款發(fā)生率E(k) * (1–回收率)
其中:回收率作為參數(shù)由人工輸入,k為各種逾期天數(shù)。
3) 計算本報告期內(nèi)貸款實際損失ALL
把期末所有貸款根據(jù)其逾期天數(shù)分為k類,假設(shè)每一類的期末余額為B(k),根據(jù)第2步得出的本報告期的貸款實際損失率L(k),可計算期末貸款損失A2
A2 = ∑ B(k) * L(k)
其中: k為各種逾期天數(shù)。
本報告期內(nèi)貸款實際損失ALL = 期末貸款損失A2 - 期初貸款損失A1
4 總結(jié)
銀行的利潤和成本是相輔相成的,某項業(yè)務(wù)、某個產(chǎn)品、某個部門的利潤收入,一定與其所占用的銀行資源密切相關(guān),因此,深入理解業(yè)務(wù)的出發(fā)點,就應(yīng)當是對銀行業(yè)務(wù)的完整觀察,所看到的不僅僅是業(yè)務(wù)的收入情況,還要綜合考察業(yè)務(wù)、產(chǎn)品、部門的成本情況,只有這樣,才能綜合判斷銀行某個產(chǎn)品、某項業(yè)務(wù)、某個部門的盈利率,才能正確指導(dǎo)銀行的投資方向決策。數(shù)據(jù)倉庫建設(shè)的第一步,是統(tǒng)計銀行的業(yè)務(wù)數(shù)據(jù),不僅包括核心業(yè)務(wù)的數(shù)據(jù)(包括會計、零售、信貸、卡業(yè)務(wù)、國際結(jié)算等),還應(yīng)包括內(nèi)部財務(wù)管理的數(shù)據(jù)(如成本、費用等),該系統(tǒng)以數(shù)據(jù)倉庫的方法理論和實現(xiàn)手段,以銀行核心系統(tǒng)等系統(tǒng)為主要數(shù)據(jù)源,綜合計算收益、成本、風險,從四個角度——產(chǎn)品、機構(gòu)、客戶群、服務(wù)渠道考核銀行經(jīng)營業(yè)績;提供信息,指導(dǎo)銀行的投資方向。
參考文獻:
[1] 張成虎.金融電子化熱點問題透析[D].西安:陜西財經(jīng)學院計算機科學系,2006.
[2] 夏火松.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)[M].北京:科學出版社,2004.
[3] Han Jiawei,Kamber M.數(shù)據(jù)挖掘概念與技術(shù)[M].范明,譯.北京:機械工業(yè)出版社,2001.
[4] Inmon W H.Building the Data Warehouse Third Edition[M].王志海,林友芳,譯.北京:機械工業(yè)出版社,2002.
[5] 錫德 阿德爾曼.數(shù)據(jù)倉庫項目管理[M].薛宇,譯.北京:清華大學出版社,2003.
[6] Kimball R.數(shù)據(jù)倉庫工具箱—維度建模的完全指南[M]譚明金,譯.2版.北京:電子工業(yè)出版社,2003.
[7] 林宇.數(shù)據(jù)倉庫原理與實踐[M].北京:人民郵電出版社,2003.
[8] 林杰斌,劉明德,陳湘,等.數(shù)據(jù)挖掘與OLAP理論與實務(wù)[M].北京:清華大學出版社,2003.