楊瀾
一、大數(shù)據(jù)分析挖掘科學
(一)大數(shù)據(jù)分析背景
以大規(guī)模、多類型、高速度和高價值為特征的大數(shù)據(jù)是繼互聯(lián)網、物聯(lián)網和云計算之后IT行業(yè)的又一新興技術。我們說生活在“大數(shù)據(jù)”時代,其意思是指我們擁有收集、存儲、處理大量信息的能力和工具,而這些信息的規(guī)模是我們聞所未聞的。隨著電商平臺、社交網絡和數(shù)字媒體的快速發(fā)展,網頁、圖像、地理信息、聲音、視頻、日志等數(shù)據(jù)量呈現(xiàn)出井噴式增長。FaceBook的照片存儲量已經超過100億張,超過1PB。淘寶網每天會產生超過數(shù)千萬條的交易數(shù)據(jù),每天數(shù)據(jù)量總大小超過50TB。國際數(shù)據(jù)資訊(IDC)公司發(fā)布的最新報告顯示:全球數(shù)據(jù)量大約每兩年翻一番,預計到2020年全球將擁有35ZB的數(shù)據(jù)量,其中的絕大多部分是非結構化或半結構化數(shù)據(jù)。
大數(shù)據(jù)風潮的涌進對諸如商業(yè)銀行在內的傳統(tǒng)金融機構產生了巨大的沖擊。以阿里巴巴為代表的電商平臺紛紛利用大數(shù)據(jù)技術開展精準營銷,引導越來越多的消費者體驗網購和移動支付的便捷性,加速金融脫媒,致使商業(yè)銀行傳統(tǒng)業(yè)務的拓展步履維艱;電子商務市場和金融創(chuàng)新的迅速發(fā)展不斷擠壓著商業(yè)銀行的市場份額和盈利空間,傳統(tǒng)金融機構以凈利潤差收入為主的經營發(fā)展模式面臨嚴峻挑戰(zhàn)?;ヂ?lián)網銀行不再像傳統(tǒng)銀行那樣依靠廣設網點去占領市場,而是通過現(xiàn)代數(shù)字通訊、互聯(lián)網、移動通信以及互聯(lián)網相關技術,借助大數(shù)據(jù)、云計算等方式為客戶提供金融服務。傳統(tǒng)銀行業(yè)必須進行改革,必須想方設法高效的存儲和分析這些數(shù)據(jù),努力利用數(shù)據(jù)展開分析、挖掘和預測,讓數(shù)據(jù)產生價值。
(二)數(shù)據(jù)分析挖掘工具
利用大數(shù)據(jù)離不開合理的分析挖掘工具,傳統(tǒng)的數(shù)據(jù)分析挖掘工具類型廣泛,主要以SPSS、SAS、R為主。然而,這些傳統(tǒng)的數(shù)據(jù)分析挖掘工具在分析中小型數(shù)據(jù)量時表現(xiàn)出眾,但處理GB、TB、PB級以上的數(shù)據(jù)時的效率幾乎是災難性的。另外,不得不提的一點是,2006年Apache軟件基金發(fā)布了第一個Hadoop開源版本,加州大學伯克利分校實驗室也于2009年研發(fā)誕生Spark。這兩項技術的誕生和飛速發(fā)展無疑相當于在我們面對一份饕餮盛宴無從下手的情況下,給予了我們一副刀叉。
(三)數(shù)據(jù)分析挖掘算法
就像銼刀和石頭本身并不能構成雕像一樣,有了工具和數(shù)據(jù)并不等于能夠做有價值的事情。這時我們就需要數(shù)據(jù)分析科學,數(shù)據(jù)分析是一門古老的科學,幾百年來,經過科學家的探索和積累,研發(fā)出了很多經典的數(shù)據(jù)分析算法,比如:關聯(lián)分析、聚類分析、回歸分析、判別分析、決策樹、集成學習、隨機森林、神經網絡等等。常見的數(shù)據(jù)挖掘算法有如下幾種:樸素貝葉斯分類器Naive Bayes、SVM支持向量機、關聯(lián)式規(guī)則Apriori算法、K-Means算法、PageRank。
二、大數(shù)據(jù)與金融機構的結合點
(一)金融機構大數(shù)據(jù)分析的意義
在國內,大數(shù)據(jù)正如火如荼的發(fā)展,眾多金融機構紛紛布局。股份制銀行成為在大數(shù)據(jù)發(fā)展方面相當活躍的群體,其將大數(shù)據(jù)技術應用在產品創(chuàng)新、客戶營銷、運營優(yōu)化和風險控制等領域。例如,光大銀行研發(fā)生成“陽光理財”資產配置系統(tǒng)用以整合分散數(shù)據(jù)、中信銀行與銀聯(lián)商務合作開發(fā)基于商戶信息和POS流水交易數(shù)據(jù)進行風控的“POS貸”等。為了提高核心競爭力,搶占市場份額,應對來自同業(yè)的挑戰(zhàn),金融機構亟需充分利用大數(shù)據(jù)這把利器,開發(fā)特色產品,提高收益,提升影響力。
現(xiàn)實經營數(shù)據(jù)也時刻提醒著金融機構要勇于應對大數(shù)據(jù)挑戰(zhàn),掌握大數(shù)據(jù)核心技術,從海量數(shù)據(jù)中精準、高效地挖掘出有用信息,自下而上地支持業(yè)務轉型的現(xiàn)實需要。充分利用企業(yè)經營數(shù)據(jù),能從根本上提升服務質量,留住高質量客戶,提升經營決策水平,實現(xiàn)管理上的精細化、標準化、流程化、自動化。針對挖掘數(shù)據(jù)的發(fā)展方向,進行精準化營銷、搶占市場資源、提高利潤收入,實現(xiàn)營銷上的個性化、體驗化和場景化。
(二)金融機構大數(shù)據(jù)分析現(xiàn)狀
在大數(shù)據(jù)時代,經營數(shù)據(jù)成為決策中最為重要的參考要素。金融機構在長年的運營過程中積累了海量數(shù)據(jù),這使得其在大數(shù)據(jù)分析方面有先天性優(yōu)勢,如何利用好這個優(yōu)勢是金融機構的重要課題。隨著業(yè)務管理水平的不斷提升和業(yè)務經營模式的轉型,傳統(tǒng)金融機構越來越重視通過數(shù)據(jù)來輔助決策,對機構內數(shù)據(jù)管理提出了更高的要求。與此同時,隨著業(yè)務需求的不斷增加、客戶數(shù)據(jù)范圍的不斷擴大、客戶數(shù)據(jù)之間關系的日趨復雜等現(xiàn)狀,利用大數(shù)據(jù)分析手段,支撐機構高效穩(wěn)定安全運營是大數(shù)據(jù)分析的目的和價值所在。
近幾年來傳統(tǒng)金融機構大力推廣“科技推動業(yè)務發(fā)展”的理念,這契合了目前企業(yè)界和學術界所推崇的“數(shù)據(jù)化運營”的概念,只有數(shù)據(jù)化運營,才可以滿足精細化的效益提升。而數(shù)據(jù)挖掘和數(shù)據(jù)分析的高效運用則是數(shù)據(jù)化運營的技術保障和基礎所在。數(shù)據(jù)化運營有很多方向,例如:網站及移動應用的流量監(jiān)控分析、目標用戶行為研究、精準營銷策劃與推廣、機構運營風險預警及管控等。
三、大數(shù)據(jù)互聯(lián)時代下金融機構的挑戰(zhàn)與風險
眾所周知,金融機構在大數(shù)據(jù)發(fā)展方面擁有天然的優(yōu)勢。因此,近兩年金融機構在這方面的發(fā)展如雨后春筍般興起,多家金融機構都積極部署著自己的電商平臺。與此同時,很多金融機構也逐漸看到大數(shù)據(jù)互聯(lián)下金融機構的發(fā)展問題,紛紛與大型互聯(lián)網公司合作。
雖然大數(shù)據(jù)互聯(lián)時代能夠促使金融機構更好的服務客戶、推薦產品、提高營業(yè)效率、防范風險,金融機構也普遍看到了數(shù)據(jù)的價值,并且努力進行大數(shù)據(jù)及互聯(lián)網平臺建設。但是,如何進行有效的數(shù)據(jù)管理和數(shù)據(jù)應用也成為更嚴峻和迫切的課題。同時,在金融機構應用大數(shù)據(jù)互聯(lián)網產品或者技術時也存在著一定的問題。
(一)基礎數(shù)據(jù)不夠全面、質量差、可用性低
金融機構內部數(shù)據(jù)碎片化嚴重,存在數(shù)據(jù)孤島,各種數(shù)據(jù)往往存儲在不同數(shù)據(jù)庫并由不同部門負責管理,沒有辦法打通,形成數(shù)據(jù)孤島。此外,目前金融機構由于系統(tǒng)設計開發(fā)時對預處理不重視、數(shù)據(jù)檢查不規(guī)范,導致產生的數(shù)據(jù)質量差,很大程度上制約了大數(shù)據(jù)的精算能力。
(二)金融機構競爭版圖重組
互聯(lián)網及大數(shù)據(jù)行業(yè)不斷與金融行業(yè)融合,一部分互聯(lián)網及大數(shù)據(jù)行業(yè)將觸角延伸至金融業(yè),導致了更激烈的版圖競爭。在大數(shù)據(jù)互聯(lián)時代下,未來金融機構主要圍繞著金融環(huán)境、戰(zhàn)略和產品三方面展開競爭,三方面的競爭也使得原有的金融機構版圖發(fā)生變化。誰發(fā)展的好,就會占得先機獲取更多的利益。相反,誰沒有跟上腳步,便可能蠶食原有的規(guī)模。
(三)技術架構與技術決策風險
首先,要解決以何種方式構建分布式的數(shù)據(jù)倉庫,并滿足可擴展大量服務器集群的需求;探究如何實現(xiàn)實時數(shù)據(jù)分析處理,實現(xiàn)分鐘級甚至是秒級計算分析等問題。此外,大數(shù)據(jù)的運維還要求在保證數(shù)據(jù)穩(wěn)定性、支持高并發(fā)性的同時減少服務器的負載。最后,大數(shù)據(jù)本身也還處于成長期,金融機構在進行大數(shù)據(jù)建設時技術的失誤也會造成選擇風險。
(四)安全管理
金融數(shù)據(jù)規(guī)模的不斷增長對存儲設備的物理安全性要求也越來越高,同時對數(shù)據(jù)的多副本與容錯機制也提出更高的要求。大數(shù)據(jù)建設需要打通金融機構的各個系統(tǒng)數(shù)據(jù)流以實現(xiàn)數(shù)據(jù)資源共享,在這種情況下如何有效地保護客戶隱私,也將是一個重大挑戰(zhàn)。此外,如何通過合法合規(guī)的途徑獲取外部數(shù)據(jù)也是金融機構需要考慮的一個問題。
四、金融機構如何在“大數(shù)據(jù)互聯(lián)”時代下更好的發(fā)展
有了發(fā)展方向,那么金融機構應該在何種方面采取行動,如何順應大數(shù)據(jù)互聯(lián)時代的潮流,發(fā)展好自己的業(yè)務呢?總體來說,金融機構建設一般認為可以分為四步走:基于數(shù)據(jù)存儲、分布式計算、大數(shù)據(jù)挖掘與分析和數(shù)據(jù)服務。此外,還要注意以下三點。
(一)完善數(shù)據(jù)規(guī)范化與安全管控
首先,將數(shù)據(jù)規(guī)范化與安全管控納入機構整體風控體系中,全面協(xié)調各相關部門,共同推動數(shù)據(jù)安全的建設,實現(xiàn)內部監(jiān)督與外部約束相結合;其次,細化數(shù)據(jù)安全建設的指標,將其納入到各崗位的考核內容中去,達到激勵約束;最后,實現(xiàn)對客戶的風險提示責任,形成管理合力。
(二)加強與第三方的合作
一方面,在電子信息化時代,電商平臺可以以較小的投入換取大量的數(shù)據(jù)流,而傳統(tǒng)的金融機構卻無此優(yōu)勢,常常處于信息鏈的末端,獲得信息量較小。因此傳統(tǒng)金融機構可以利用自己的規(guī)模及客戶量優(yōu)勢與第三方電商平臺進行合作,在保證客戶隱私信息不被泄露的前提下加強信息的共享;另一方面,還應重視網絡社交新媒體,通過多渠道獲取客戶畫像。
(三)培養(yǎng)專業(yè)人才、建立大數(shù)據(jù)分析平臺
金融機構應重視對新興產業(yè)人才的培養(yǎng),建立屬于自己的大數(shù)據(jù)分析團隊,主要應包括:需求挖掘人員、項目管理人員、架構設計人員、開發(fā)實施人員、運維操作人員、測試實施人員等。