仲崇高 遲愛寧
泰州學院,江蘇 泰州 225300
技術(shù)進步可以提升企業(yè)生產(chǎn)效率,推動社會經(jīng)濟發(fā)展。金融業(yè)作為現(xiàn)代經(jīng)濟的核心,一直是各項科技前沿技術(shù)研發(fā)的積極參與者和受益者。在過去幾十年里,技術(shù)一直在為金融帶來變革。依托這些技術(shù)提供、精煉的信息價值、數(shù)據(jù)價值,金融業(yè)經(jīng)歷了20世紀末的全面電子時代到21世紀興起的互聯(lián)網(wǎng)浪潮,實現(xiàn)了跨越式發(fā)展,形成了互聯(lián)網(wǎng)金融、金融科技(FinTech)等新的發(fā)展模式。另外,也促成了金融各領(lǐng)域與科技各領(lǐng)域之間的合作,并深刻地促進了金融生態(tài)圈的生長和發(fā)展。目前,人工智能技術(shù)(artificial intelligence,AI)成為推動金融業(yè)革新的新動力。
2015年,《國務(wù)院關(guān)于積極推進“互聯(lián)網(wǎng)+”行動的指導意見》將“互聯(lián)網(wǎng)+人工智能”列為11項重點行動之一。2016年,“人工智能”一詞寫入國家“十三五”規(guī)劃綱要;2016年,《“互聯(lián)網(wǎng)+”人工智能三年行動實施方案》發(fā)布,從鼓勵智能制造,逐步擴展到鼓勵 AI 進行全面的生態(tài)賦能。金融作為人工智能落地的最佳場景之一,成為政府關(guān)注鼓勵的重點方向。2017年7月20日,國務(wù)院發(fā)布《新一代人工智能發(fā)展規(guī)劃》指出,人工智能核心產(chǎn)業(yè)規(guī)模預(yù)期到2030年超過1萬億元。萬億人工智能市場將助力金融行業(yè)的整體技術(shù)更新,促進金融業(yè)從傳統(tǒng)金融向智能金融發(fā)展。
智能金融是人工智能與金融全面融合而產(chǎn)生的新金融服務(wù)模式,它以人工智能、大數(shù)據(jù)、云計算等創(chuàng)新科技為核心要素,在提升金融機構(gòu)服務(wù)效率的同時,實現(xiàn)金融服務(wù)的智能化、個性化和定制化。知識圖譜是人工智能的主要技術(shù)之一,智能金融的發(fā)展,需要知識圖譜技術(shù)的支持。知識圖譜的知識提取、融合、分析、推斷、決策等功能在大數(shù)據(jù)、云計算的基礎(chǔ)上不斷推動金融的智能化發(fā)展。
研究人員試圖將深度學習技術(shù)融入知識圖譜技術(shù)框架,以知識圖譜為代表的符號主義和以深度學習為代表的聯(lián)結(jié)主義,正在走上協(xié)同并進的新道路。融入深度學習的知識圖譜技術(shù),將為金融業(yè)智能化提供更多助力。
目前,國內(nèi)學者的研究主要集中于金融科技、人工智能在金融中的應(yīng)用,如金融科技與科技創(chuàng)新的應(yīng)用[1-2],人工智能與金融科技競爭[3],人工智能與金融革命[4-6],以及知識圖譜在金融業(yè)的具體場景應(yīng)用[7-9],少量文獻研究了智能金融[10]。本文研究了知識圖譜與智能金融的關(guān)系,以及融入深度學習技術(shù)后的知識圖譜對金融業(yè)的促進作用。
智能金融的概念是在現(xiàn)代大數(shù)據(jù)和人工智能技術(shù)發(fā)展背景下產(chǎn)生的,具備自動化信息處理、輔助決策和部分自決策相結(jié)合、自動化執(zhí)行等特征的金融服務(wù)綜合應(yīng)用。智能金融,本質(zhì)上是人工智能技術(shù)驅(qū)動的金融創(chuàng)新。從科技角度講,智能金融的發(fā)展,是基于人工智能技術(shù)的智能客服、智能風控、智能營銷、智能投研、智能投顧等場景的解決方案,人工智能技術(shù)能夠服務(wù)于金融全部業(yè)務(wù)流程,這也是人工智能能夠快速在金融業(yè)發(fā)展的原因之一。在人工智能技術(shù)的運用和大數(shù)據(jù)的沉淀與挖掘過程中,金融行業(yè)的邏輯從標準化、高風險、邊界有限向個性定制、安全可靠、場景連接轉(zhuǎn)變,這意味著金融服務(wù)的對象更加廣泛、金融服務(wù)的過程更加安全、金融服務(wù)品質(zhì)更加精細。
智能投顧為客戶提供精準定制產(chǎn)品。由于客戶的性別、年齡、投資能力等的差異,金融機構(gòu)的“標準化”產(chǎn)品往往無法滿足客戶的需求,無法實現(xiàn)客戶收益的最大化。智能金融分兩步可實現(xiàn)精準定制的邏輯。以智能投顧為例,第一步,精確實現(xiàn)充分了解客戶(know your customer,KYC),基于豐富的數(shù)據(jù)量,人工智能算法可以實現(xiàn)更細的數(shù)據(jù)顆粒度,將投資者的流動性、負債水平、資金量、儲蓄率等數(shù)據(jù)更細致地融入客戶風險偏好、資產(chǎn)偏好中去。第二步,個性定制金融產(chǎn)品。借助人工智能算法,為客戶定制適合的金融產(chǎn)品,其收益回報往往更為穩(wěn)健。
智能投資量化產(chǎn)品風險。智能投資運用機器學習、量化分析等技術(shù)與算法將投資市場上的標的風險進行識別與量化,進而將投資者的資產(chǎn)分散到債券、權(quán)益和另類等相關(guān)性較低的資產(chǎn)中,使得投資者的資產(chǎn)組合收益來源和波動率來源更為分散,從而有效抵御單一種類資產(chǎn)帶來的風險。
智能金融加速了普惠金融的進程,向行業(yè)上下游擴展。智能金融已經(jīng)延伸到傳統(tǒng)金融業(yè)難以普及到的廣大農(nóng)村地區(qū)。以往普惠金融中需要大量人力完成的業(yè)務(wù),現(xiàn)已被人工智能及相關(guān)技術(shù)替代,傳統(tǒng)以人力為核心資本以實現(xiàn)普惠金融的邏輯被人工智能改寫。
智能金融與不同業(yè)態(tài)進行組合,這在一定程度上實現(xiàn)了所在行業(yè)的上下游擴展。以智能保險為例,人工智能在保險業(yè)的運用最早屬于金融科技領(lǐng)域,現(xiàn)在應(yīng)用范圍擴大,幾乎包含了全部領(lǐng)域,通過將營銷、定價、風控、承保、保全以及理賠等內(nèi)容組合,擴展了保險行業(yè)的上下游。
作為人工智能的重要分支,知識圖譜不僅可以發(fā)現(xiàn)數(shù)據(jù)之間的關(guān)系,而且能利用關(guān)系進行推理,從而賦予數(shù)據(jù)更多價值。目前,知識圖譜被應(yīng)用到了搜索、地圖、個性化推薦等領(lǐng)域。金融作為一個對數(shù)據(jù)具有強依賴性的領(lǐng)域,對知識圖譜的應(yīng)用有更切實的需求,已經(jīng)發(fā)展出包括反欺詐、失聯(lián)客戶管理、精準營銷、智能搜索和可視化、問答交互在內(nèi)的多種應(yīng)用方式。
知識圖譜是描述客觀世界中實體及其之間關(guān)系的一種語義網(wǎng)絡(luò),由節(jié)點和邊組成。知識圖譜的發(fā)展歷程可以追溯到20世紀70年代誕生的專家系統(tǒng)。
知識圖譜提供了從“關(guān)系”的角度去分析問題的能力,是關(guān)系表示最有效的方式之一。如圖1所示,在知識圖譜中,每個節(jié)點表示現(xiàn)實世界中存在的“實體”,每條邊為實體與實體之間的“關(guān)系”。語義類型中最頂層抽象類是實體。其中,實體可分為概念實體和物理實體。概念實體指沒有具體實體的對象;物理實體指的客觀世界存在的對象。三元組是知識圖譜通用的表現(xiàn)形式。所謂三元組,就是由一個表示主語的節(jié)點,一條表示謂語的邊和一個表示賓語的節(jié)點組成一條記錄。當圍繞著一個主語有很多用三元組表示的關(guān)系呈現(xiàn)時,就構(gòu)建了知識圖譜。
圖1 知識圖譜示意
知識圖譜與其他信息源不同之處是它可以由計算機直接訪問,而無須任何的人工介入。由于計算機只理解正規(guī)的語言,所以知識圖譜中包含的信息通常被稱為結(jié)構(gòu)化數(shù)據(jù),而非結(jié)構(gòu)化數(shù)據(jù)(如純文本)只能夠被人類理解。從技術(shù)層面設(shè)計上來說,知識圖譜必須考慮兩個基本的權(quán)衡:一是知識圖譜應(yīng)該具有足夠的描述性,以便復雜的知識能夠被機器編碼;二是這種描述性應(yīng)該足夠的簡單,以便計算機能夠快速地處理。從領(lǐng)域上來說,知識圖譜可分為通用知識圖譜和特定領(lǐng)域知識圖譜。通用知識圖譜包含了大量的現(xiàn)實世界中的常識性知識,強調(diào)的是廣度;特定領(lǐng)域知識圖譜面向特定的垂直領(lǐng)域,強調(diào)的是深度。在實際中,知識圖譜的應(yīng)用趨勢逐漸從通用領(lǐng)域走向特定領(lǐng)域。不同行業(yè)都在關(guān)注適合自身的知識圖譜技術(shù)的應(yīng)用方式,但目前仍未形成大規(guī)模應(yīng)用。
當前,知識圖譜在金融領(lǐng)域的應(yīng)用仍處于起步階段,主要應(yīng)用包括反欺詐、失聯(lián)客戶管理、精準營銷、智能搜索和可視化、問答交互。
2.2.1 反欺詐
反欺詐是對包含交易欺詐、網(wǎng)絡(luò)欺詐、電話欺詐等詐騙行為進行識別的一項服務(wù),而知識圖譜的反欺詐計算是對反欺詐分析實時性的體現(xiàn)。知識圖譜在金融領(lǐng)域反欺詐方面的應(yīng)用包括貸前審批和貸中預(yù)警。目前知識圖譜在金融領(lǐng)域的應(yīng)用,主要集中在貸前審批管理。在貸前的審批階段,將借款人的基本信息、消費記錄、行為記錄、關(guān)系信息等整合到反欺詐知識圖譜里,比對客戶一度、二度關(guān)系是否觸黑,以及客戶消費關(guān)聯(lián)商家是否異常等。同時,利用不一致性檢驗,對借款人的風險進行分析和評估。例如,當兩個借款人填寫了相同的電話號碼時,這種不一致性就有可能是欺詐行為。
同時,知識圖譜還可以有效甄別團體欺詐。甄別團體欺詐的方式有兩種:一是根據(jù)之前標記的黑名單客戶,利用知識圖譜確定與其有緊密聯(lián)系的欺詐用戶。二是根據(jù)團體欺詐會共享部分信息的特點,利用知識圖譜發(fā)現(xiàn)不同用戶之間的信息關(guān)聯(lián)性,從而識別欺詐團體。
在貸中的交易階段,通過構(gòu)建已知的主要欺詐要素(如設(shè)備、賬號、地域等)的關(guān)系圖譜,全方位監(jiān)控借款人的風險數(shù)據(jù),對潛在欺詐行為做出及時反應(yīng)。即使欺詐分子修改了登陸時間和地址之類的行為線索,知識圖譜仍然可以挖掘出共用設(shè)備、共用IP等可疑特征,從而識別欺詐事件。
2.2.2 失聯(lián)客戶管理
在貸后管理中,知識圖譜也發(fā)揮著重要作用。當借款人不按時還款并且“失聯(lián)”時,催收人員的工作難度加大。目前貸后管理對知識圖譜的應(yīng)用,主要是結(jié)合借款人授權(quán)的通信記錄,挖掘與借款人有關(guān)系且在相同平臺借過款的新聯(lián)系人,從而重新取得與借款人的聯(lián)系,提高催收成功率,此技術(shù)已廣泛應(yīng)用。同時,各金融機構(gòu)也在進一步擴充數(shù)據(jù)維度,如工作單位等。
2.2.3 精準營銷
知識圖譜在精準營銷中的應(yīng)用有兩種形式。一是理解用戶。通過知識圖譜聚合用戶的基本屬性,如年齡、學歷、消費習慣、搜索習慣等,將這些基本屬性加以分類,形成不同的用戶標簽,展現(xiàn)不同類別用戶的身份特質(zhì)及具體偏好。然后分析客戶潛在需求,進行精準推送。二是挖掘潛在客戶?;诂F(xiàn)有用戶的社交網(wǎng)絡(luò)知識圖譜,根據(jù)交往方式和頻次等社交行為建立關(guān)系模型,從而實現(xiàn)潛在用戶的拓展。此外,還可以結(jié)合所有用戶的標簽特征,使用社區(qū)算法將全局用戶細分,識別隱藏在數(shù)據(jù)深處的價值用戶。目前此種形式較為常見,主要是通過借款人之間的推薦關(guān)系,挖掘為平臺帶來大量資金和新客戶的推薦人,分析這些推薦人的特征,從而發(fā)展新的具有類似特征的客戶。
2.2.4 智能搜索和可視化
通過知識圖譜,搜索功能可以在語義上擴展更多的搜索關(guān)鍵詞,從而獲取更全面的信息,通過圖譜可視化技術(shù),可以以圖形網(wǎng)絡(luò)的形式展示全方位信息,包括復雜信息和隱藏信息等。
2.2.5 問答交互
知識圖譜在問答交互中最常用到的場景是文本客服。首先通過知識圖譜創(chuàng)建知識庫,在對用戶問題進行語義理解和解析后,利用知識庫查詢、推理得出答案并反饋給用戶。通過知識圖譜,所有知識點以及連接知識點的邊都與問句關(guān)聯(lián)起來,極大地提高了應(yīng)答的關(guān)聯(lián)性和準確性。
目前雖然知識圖譜在金融領(lǐng)域的應(yīng)用方式多種多樣,但是由于應(yīng)用場景非標準化以及建模較難的原因,導致知識圖譜在金融領(lǐng)域的應(yīng)用還處于初級階段,尚未形成大規(guī)模應(yīng)用。但知識圖譜技術(shù)已成為金融科技公司未來技術(shù)競爭的關(guān)鍵領(lǐng)域。
國外對于知識圖譜與深度學習結(jié)合的應(yīng)用也進行了深入的研究與探索,并取得了很好的效果。例如,2004年在硅谷開始運作的 Palantir,結(jié)合客戶提供的信息源與公共網(wǎng)絡(luò)上的事件,提供對海量數(shù)據(jù)的研究分析,其金融數(shù)據(jù)分析平臺 Palantir Metropolis 可以對金融數(shù)據(jù)進行復雜搜索、可視化編輯、關(guān)聯(lián)發(fā)現(xiàn)等操作。
國內(nèi)互聯(lián)網(wǎng)巨頭同樣在知識圖譜與深度學習結(jié)合方面進行了研究探索。例如,神馬知識圖譜已發(fā)展為擁有近5000萬實體、近30億關(guān)系的大規(guī)模知識圖譜。百度發(fā)布了深度學習平臺—PaddlePaddle平臺,騰訊公司也發(fā)布了DI-X深度學習平臺,為用戶提供一站式的深度學習服務(wù)。
在未來的應(yīng)用中,知識圖譜和深度學習將在更多層面形成互補,提升深度神經(jīng)網(wǎng)絡(luò)的可解釋性,知識圖譜技術(shù)和方法還將進一步與自然語言處理技術(shù)深度融合。知識圖譜將幫助金融行業(yè)構(gòu)建有學識的人工智能,走向知識智能時代。
融入深度學習技術(shù)的知識圖譜,打造知識智能金融,為金融業(yè)的高質(zhì)量服務(wù)提供技術(shù)支持。①提供更加智能的數(shù)據(jù)服務(wù)??梢詾榻鹑趩柎鹣到y(tǒng)、智能客服系統(tǒng)以及金融智能搜索等業(yè)務(wù)提供相應(yīng)的支持,提升金融信息的檢索效率,幫助構(gòu)建知識型的智能金融客服,滿足金融業(yè)務(wù)的實際需求。②幫助解決金融自然語言處理NLP所遇到的技術(shù)問題,如實體語義消歧、文本語義理解、文本結(jié)構(gòu)化等。③促進知識驅(qū)動的金融決策分析領(lǐng)域深入發(fā)展。金融因果關(guān)聯(lián)圖譜的精細化構(gòu)建及深入應(yīng)用趨勢,包括圍繞事件構(gòu)建事理知識圖譜、利用事件抽取技術(shù)提升新聞事件識別的敏感度、建立事件因果推理知識庫、利用事理圖譜分析技術(shù)對事件影響力傳導進行深度分析等。④提升金融預(yù)測能力。金融知識圖譜在金融預(yù)測分析中具有重要的作用,是進行事件推理的基礎(chǔ),可應(yīng)用于智能投研和智能投顧等領(lǐng)域。例如,當重大事件發(fā)生時,可根據(jù)產(chǎn)業(yè)鏈圖譜推導出未來可能會受影響的公司。⑤讓金融搜索更具價值。在智能投研、智能投顧和智能客服等場景,基于深度學習技術(shù)的金融問答和語義搜索的技術(shù),不僅使信息獲取更加便捷,還可把各方面的相關(guān)信息組織成立體化信息,并且能提供一定的分析預(yù)測結(jié)論。⑥賦能風險評估與反欺詐。風險評估是互聯(lián)網(wǎng)時代的傳統(tǒng)應(yīng)用場景,是通過大數(shù)據(jù)、機器學習技術(shù)對用戶行為數(shù)據(jù)分析后,進行用戶畫像,并進行信用和風險評估。引入深度學習技術(shù)后,可以進一步提升關(guān)系穿透、挖掘的能力,從而偵測欺詐行為,有助于關(guān)聯(lián)交易關(guān)聯(lián)賬號識別、信息披露等,在風控領(lǐng)域有較大的應(yīng)用空間。
目前,大多金融機構(gòu)對于數(shù)據(jù)的應(yīng)用處于“從信息到知識”的階段,而知識圖譜突破了現(xiàn)有的關(guān)系型數(shù)據(jù)庫的限制,從信息中發(fā)掘和構(gòu)建深度的關(guān)聯(lián),使得信息知識化,提供更加智慧的決策支持。行業(yè)或企業(yè)知識圖譜的建設(shè)需要考慮以下3個方面:首先,需要分析行業(yè)特點,創(chuàng)建統(tǒng)一的數(shù)據(jù)模型和視圖;其次,要對收集的各類行業(yè)數(shù)據(jù)進行整合,并通過關(guān)聯(lián)計算找出數(shù)據(jù)間的關(guān)系,再使用圖數(shù)據(jù)庫保存及展示;最后,建立業(yè)務(wù)模型對數(shù)據(jù)進行機器學習,挖掘有價值的信息支撐業(yè)務(wù)場景。
具體到金融行業(yè),建立知識圖譜有3個主要步驟:①從金融機構(gòu)內(nèi)部結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)以及互聯(lián)網(wǎng)采集數(shù)據(jù)、第三方合作數(shù)據(jù)中辨別金融實體;②定義并挖掘金融實體間的各種關(guān)系,如企業(yè)與企業(yè)之間的集團關(guān)系、投資關(guān)系、上下游關(guān)系、擔保關(guān)系,企業(yè)與個人之間的任職、實際控制、一致行動關(guān)系,從而生成知識圖譜;③定義并表達業(yè)務(wù)邏輯,在知識圖譜構(gòu)建的知識體系中,可以實現(xiàn)各種具體任務(wù),如對企業(yè)股權(quán)關(guān)系、一致行動人、實際控制人等挖掘,擔保圈、擔保鏈、擔保群挖掘,疑似欺詐交易發(fā)現(xiàn)及欺詐團伙追蹤發(fā)現(xiàn)等,及時發(fā)現(xiàn)商機和識別風險傳導機制。
此外,金融知識圖譜還包含了很多其他的形式,如A股的公司、港股和美股的公司,各種基本面的數(shù)據(jù)、行情的數(shù)據(jù)等都在逐漸知識圖譜化,還有公告數(shù)據(jù)、研報數(shù)據(jù)及工商數(shù)據(jù)等都是金融知識圖譜的分支。
當前,知識圖譜在金融業(yè)還沒有形成大規(guī)模的應(yīng)用,很多仍處于調(diào)研階段,主要原因在于金融機構(gòu)知識圖譜理解不深以及知識圖譜本身構(gòu)建的困難,具體體現(xiàn)在數(shù)據(jù)的可訪問性、數(shù)據(jù)的可發(fā)現(xiàn)性、領(lǐng)域知識的集成以及策略的生成4個主要方面。
以策略的生成為例?,F(xiàn)有階段,機器在業(yè)務(wù)場景中還無法完全替代人類的作用,而是輔助人類做出價值判斷、風險判斷,通過過往的案例或者既定的邏輯,為人類推薦可行的策略。具體場景有:在用戶交互層面,有意圖理解、語言生成、用戶畫像匹配等;在業(yè)務(wù)層面,有邏輯生成、投資模型、風險模型等;涉及的數(shù)據(jù)處理有規(guī)則提取、知識庫建設(shè),語義檢索、邏輯推理等。
在智能金融時代,金融知識圖譜構(gòu)建主要有兩個方面挑戰(zhàn)。一方面,需要著手進行面向人工智能的大數(shù)據(jù)治理,在數(shù)據(jù)層面上通過知識圖譜將原有的金融數(shù)據(jù)再次加工、整理;另一方面,進一步把知識圖譜等人工智能技術(shù)的服務(wù)能力開放給傳統(tǒng)的業(yè)務(wù)系統(tǒng),進行面向人工智能的服務(wù)治理。