徐 怡
(安徽大學(xué)經(jīng)濟學(xué)院,安徽 合肥230601)
隨著經(jīng)濟社會各領(lǐng)域從數(shù)字化向智能化大步邁進,傳統(tǒng)的風險管理體系與金融創(chuàng)新發(fā)展新模式不相適應(yīng),金融風險管理問題日益突出。2018年我國P2P平臺爆雷事件接連不斷,資金池、自融、關(guān)聯(lián)擔保導(dǎo)致提現(xiàn)困難問題屢見不鮮,“跑路風”不斷蔓延,網(wǎng)貸行業(yè)操作風險的集中爆發(fā)顯示出金融風險管理協(xié)同發(fā)展的緊要性和急迫性。近年來,在互聯(lián)網(wǎng)、大數(shù)據(jù)、超級計算等新理論新技術(shù)以及經(jīng)濟社會發(fā)展需求的共同驅(qū)動下,人工智能開始逐步應(yīng)用于金融風險管理領(lǐng)域。2017年7月8日國務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》,明確提出要建立金融大數(shù)據(jù)系統(tǒng),提升金融多媒體數(shù)據(jù)處理與理解能力,鼓勵金融行業(yè)應(yīng)用智能客服、智能監(jiān)控等技術(shù)和裝備,以及建立金融風險智能預(yù)警與防控系統(tǒng)。因此,機器學(xué)習(xí)作為人工智能的核心,研究機器學(xué)習(xí)在金融風險管理中的應(yīng)用有助于金融機構(gòu)建立有效的內(nèi)部風險管理系統(tǒng)、監(jiān)管部門創(chuàng)建良好的外部風險控制環(huán)境。
圖1 機器學(xué)習(xí)基本框架
機器學(xué)習(xí)是人工智能的核心,它與大數(shù)據(jù)革命息息相關(guān)。圖1為機器學(xué)習(xí)運行的基本框架,與傳統(tǒng)的數(shù)據(jù)處理方法相比,它使用的算法允許計算機在未編程的情況下,通過對樣本數(shù)據(jù)的特征學(xué)習(xí)識別數(shù)據(jù)間的關(guān)系并建模,對模型進行數(shù)千次或數(shù)萬次的精確度優(yōu)化,以提高模型的樣本外預(yù)測能力。其學(xué)習(xí)形式有兩種:有監(jiān)督的和無監(jiān)督的。在有監(jiān)督的機器學(xué)習(xí)中,已有經(jīng)驗可以將樣本特征標簽化,在建立統(tǒng)計模型后基于特定的輸入預(yù)測結(jié)果。在無監(jiān)督機器學(xué)習(xí)中,學(xué)習(xí)樣本不帶標簽信息,數(shù)據(jù)分析可以在不估算因變量情況下用于識別模式。
機器學(xué)習(xí)的分析方法有很多,總結(jié)起來有三大類統(tǒng)計方法:回歸、分類和聚類。回歸和分類都可以通過監(jiān)督機器學(xué)習(xí)來解決,而聚類則遵循無監(jiān)督的方法。
圖2 信貸風險的回歸分析
分類對離散型變量進行預(yù)測。邏輯回歸是其最常見的方法,將輸出轉(zhuǎn)化為0到1之間的概率,再根據(jù)這個概率進行判斷。以貸款者年齡預(yù)測信貸風險為例(見圖3),若模型計算新樣本的信貸風險超過設(shè)定閾值,一般認為會違約。當分析多因素影響時,觀測結(jié)果可以通過支持向量機將低維的空間映射到高維的空間進行分類,并在各類別中賦予變量數(shù)值。
圖3 信貸風險的分類分析
聚類通過自助法尋找數(shù)據(jù)的類重心,進而將數(shù)據(jù)劃分為若干個不相交的簇,每個簇表示一個潛在的類別,這些類別在執(zhí)行算法之前是未知的,聚類即是自動形成簇結(jié)構(gòu)的過程。它既可以單獨運行尋找數(shù)據(jù)內(nèi)在的分布結(jié)構(gòu),也可作為過渡將無監(jiān)督學(xué)習(xí)的輸出作為監(jiān)督學(xué)習(xí)方法的輸入。以圖4所示的反洗錢分析為例,它可以在不清楚哪些因素導(dǎo)致欺詐的情況下檢測欺詐行為,并將檢測結(jié)果應(yīng)用于新的模型中。
圖4 聚類分析
決策樹是一種以實例為基礎(chǔ)的非參數(shù)化監(jiān)督學(xué)習(xí)方法,它可以通過分類和回歸有效處理復(fù)雜的非線性數(shù)據(jù),并將結(jié)果進行可視化展示。該方法在本質(zhì)上是從訓(xùn)練數(shù)據(jù)集中歸納出分類規(guī)則,據(jù)此持續(xù)分類直到?jīng)Q策終點。其學(xué)習(xí)的策略是以損失函數(shù)為目標函數(shù)的極小化。決策樹在風險管理領(lǐng)域應(yīng)用較早,圖5為銀行信貸分析中根據(jù)客戶特征判定其違約概率示例。
圖5 決策樹分析
圖6 深度學(xué)習(xí)分析
深度學(xué)習(xí)方法在傳統(tǒng)的模型方法上進行了發(fā)展和優(yōu)化。傳統(tǒng)模型關(guān)注的是定義良好的結(jié)構(gòu)化數(shù)據(jù)集,而深度學(xué)習(xí)則是通過在學(xué)習(xí)過程中應(yīng)用分層算法,并將原始數(shù)據(jù)轉(zhuǎn)換為識別復(fù)雜模式,從而模仿人類大腦(見圖6)。每種算法都關(guān)注于數(shù)據(jù)的特征表示,這些表示的分層允許模型合并大量的輸入,包括低質(zhì)量或非結(jié)構(gòu)化數(shù)據(jù)。最重要的是,這些分層不是編程設(shè)計的,而是由模型從各種數(shù)據(jù)中學(xué)到的。然而,深度學(xué)習(xí)模型非常復(fù)雜,通常需要數(shù)百萬或數(shù)億數(shù)據(jù)集。
金融機構(gòu)逐漸放棄了傳統(tǒng)的線性信用風險回歸模型,并開始將機器學(xué)習(xí)方法與傳統(tǒng)模型結(jié)合起來用于捕獲信用風險常見的非線性關(guān)系,以提高它們預(yù)測金融風險的能力。無監(jiān)督方法通常用于探索數(shù)據(jù),而回歸和分類方法可以預(yù)測違約率、違約損失率等關(guān)鍵信用風險變量。
ZestFinance公司將機器學(xué)習(xí)算法應(yīng)用于信用風險評分模型中,這是機器學(xué)習(xí)提供融資授信決策的早期探索之一。ZestFinance具有模型開發(fā)和數(shù)據(jù)分析能力,除了資產(chǎn)狀況還將更多非傳統(tǒng)數(shù)據(jù)信息納入模型中,致力于從應(yīng)用程序、社交媒體信息以及用戶個人習(xí)慣等基本資料中挖掘風險因子,分類并標簽化不同類型的復(fù)雜數(shù)據(jù),對借款人借款行為背后的線索及線索間的關(guān)聯(lián)性進行學(xué)習(xí),最終根據(jù)評分做出準確的信貸決策。有關(guān)數(shù)據(jù)顯示,與傳統(tǒng)信貸管理業(yè)務(wù)比較,ZestFinance的處理效率提高了將近90%,在風險控制方面,其模型相比于傳統(tǒng)信用評估模型性能則提高了40%[1]。
國內(nèi)眾多金融機構(gòu)也已經(jīng)將機器學(xué)習(xí)應(yīng)用于信用風險控制系統(tǒng),如中國工商銀行從2007年起專門建立了數(shù)據(jù)倉庫,通過對客戶的違約率、違約損失率等進行動態(tài)監(jiān)測和實時預(yù)警,為銀行把控信用風險、提升融資服務(wù)效率做出了巨大貢獻。螞蟻金服旗下的征信機構(gòu)芝麻信用,運用無監(jiān)督學(xué)習(xí)從用戶信用歷史、行為偏好、履約能力、身份特質(zhì)、人脈關(guān)系五個維度對海量信用數(shù)據(jù)進行處理,進而得出用戶信用狀況綜合評分,并在信用卡、消費金融等上百個場景為用戶提供授信擔保服務(wù)[2]。
然而,機器學(xué)習(xí)模型復(fù)雜的“黑盒子”性質(zhì)、對異常值的敏感性導(dǎo)致數(shù)據(jù)過度擬合和違反直覺的預(yù)測難以解釋,使得機器學(xué)習(xí)不適合全面納入金融機構(gòu)的持續(xù)風險監(jiān)測中。而且這些尚未形成司法一致性定義的數(shù)據(jù)對于監(jiān)管機構(gòu)來說過于復(fù)雜,給審計工作帶來了越來越大的困難。盡管機器學(xué)習(xí)模型存在缺陷,但它可以成功地用于優(yōu)化現(xiàn)有的具有調(diào)節(jié)功能的信用風險模型。這一能力的價值在中國市場則被成倍放大——其不僅可以在很大程度上幫助中國這一新興且制度不完善的信貸市場突破發(fā)展瓶頸,更能幫助企業(yè)有效構(gòu)建用戶模型,評估信用等級,預(yù)測預(yù)防信用風險。
金融機構(gòu)已經(jīng)開始利用機器學(xué)習(xí)來檢測信用卡欺詐。信用卡的大交易量為模型提供了足夠的數(shù)據(jù),進而可以通過監(jiān)督學(xué)習(xí)進行訓(xùn)練、反向測試和模型驗證,預(yù)先確定欺詐性交易的關(guān)鍵特性,并能夠?qū)⑺鼈兣c正常交易區(qū)分開來。無監(jiān)督學(xué)習(xí)是近年才發(fā)展起來的反欺詐方法,它無需任何訓(xùn)練和標簽,通過關(guān)聯(lián)分析和相似性分析發(fā)現(xiàn)欺詐用戶間的聯(lián)系,并在更多群組中發(fā)掘新型欺詐行為。無監(jiān)督學(xué)習(xí)也可以用于反洗錢或打擊恐怖主義融資活動,聚類可以識別與其他數(shù)據(jù)無關(guān)聯(lián)性的異常值,這種方式可以有效發(fā)現(xiàn)異常并減少假陽性。
信息時代金融機構(gòu)的客戶征信成本不斷增加,通過對客戶信息與交易紀錄的自主學(xué)習(xí)可以有效甄別異常交易,減少欺詐事件發(fā)生。招商銀行圍繞“數(shù)據(jù)+模型+算法”,采用深度學(xué)習(xí)技術(shù)進行風險管理,在申請流程中生物識別技術(shù)可以迅速核實相關(guān)信息,資金發(fā)放后通過無監(jiān)督學(xué)習(xí)自主優(yōu)化反欺詐模型,對資金流向進行監(jiān)測以防止客戶將貸款資金用于民間借貸。英國銀行業(yè)創(chuàng)業(yè)公司Monzo通過總結(jié)交易模式建立了一個模型,能夠?qū)崿F(xiàn)事中攔截及時阻止詐騙嫌疑人完成交易,降低合規(guī)風險。這令該公司的預(yù)付費卡欺詐率從2016年6月的0.85%降至2017年1月的不到0.1%。
中國銀行開發(fā)貿(mào)易融資業(yè)務(wù)反洗錢核查項目,運用機器學(xué)習(xí)對交易內(nèi)容真實性進行偵測,并綜合運用文本分析、圖像識別等技術(shù)進行交叉驗證,審核階段耗時由原來的2小時下降到2分鐘,提升了反洗錢系統(tǒng)的偵測率,大大降低了人工操作的時間成本。一些國際監(jiān)管機構(gòu),例如澳大利亞證券及投資委員會、新加坡貨幣當局及美國證券交易委員會,都將機器學(xué)習(xí)應(yīng)用于可疑交易識別。具體做法包括從證據(jù)文件中識別和提取利益主體,分析用戶的交易軌跡、行為特征和關(guān)聯(lián)信息,充分降低誤報率,更快更準確地打擊地下洗錢等犯罪活動[3]。
欺詐類違規(guī)行為是很難界定的,銀行也沒有得到執(zhí)法機構(gòu)的充分反饋究竟哪些交易確實存在欺詐行為。因此,只使用歷史數(shù)據(jù)進行反欺詐算法很難用于檢測新的欺詐行為。相比于傳統(tǒng)檢測方法,無監(jiān)督學(xué)習(xí)最大的優(yōu)勢在于可以提前預(yù)警。由于違法者在潛伏期的行為依然符合某種規(guī)律,具有某些一致性,同樣還是會被無監(jiān)督算法捕捉到,進而幫助用戶創(chuàng)建新的檢測規(guī)則,一旦發(fā)現(xiàn)客戶遇到新型未知欺詐,無監(jiān)督檢測可以早期預(yù)警,幫助客戶在欺詐解決方案的各個方面提升機制、提高效率。
監(jiān)視交易違規(guī)行為是另一個日益發(fā)展的領(lǐng)域,機器學(xué)習(xí)越來越多地被用于檢測流氓交易、內(nèi)幕交易和基準操縱行為。及時發(fā)現(xiàn)這些違規(guī)行為很重要,因為它們可能對金融機構(gòu)和聲譽造成重大損害。早期的監(jiān)控技術(shù)往往依賴于監(jiān)控和評估單一交易行為。機器學(xué)習(xí)方法的改進能力,處理大型復(fù)雜數(shù)據(jù)的模型,使得新一代的系統(tǒng)能夠評估整個交易組合,并將信息與交易員的其他活動聯(lián)系起來,包括電子郵件、電話和簽到,甚至是基于深度學(xué)習(xí)的語言處理和文本挖掘。交易員的行為可以與其他交易員的“正?!毙袨檫M行比較。系統(tǒng)檢測任何偏離正常模式的情況,并通知金融機構(gòu)的合規(guī)團隊。
英國智能語音公司向大銀行出售基于機器學(xué)習(xí)的語音轉(zhuǎn)錄工具,可用來監(jiān)控交易員的電話,以檢測內(nèi)幕交易等不正當行為的跡象。其他的專業(yè)公司如Xcelerit和Kinetica向銀行和投資公司提供接近實時的風險敞口跟蹤,讓它們能隨時監(jiān)控自己的資本要求。信托業(yè)也不例外,我國中航信托建立的COSO全面風險管理系統(tǒng),通過系統(tǒng)對項目及公司整體的風險輪廓進行線上統(tǒng)計和監(jiān)測,實現(xiàn)對項目存續(xù)期管理的常規(guī)監(jiān)控和重點風險預(yù)警提示。
監(jiān)管部門在這個層面上應(yīng)用機器學(xué)習(xí)也面臨幾個挑戰(zhàn)。首先,通常沒有標記數(shù)據(jù)來培訓(xùn)算法,因為金融機構(gòu)與開發(fā)人員共享過去的違規(guī)信息會帶來法律權(quán)責問題的復(fù)雜性。此外,系統(tǒng)需要可審計,但由于機器學(xué)習(xí)模型的設(shè)計目的是不斷地從數(shù)據(jù)中學(xué)習(xí),因此很難向合規(guī)官員解釋為什么某個行為會引發(fā)警報。為了更好地解決這些問題,監(jiān)管部門正在嘗試將人工決策與機器學(xué)習(xí)有效結(jié)合起來,系統(tǒng)數(shù)據(jù)可以用來了解相關(guān)交易員的全面信息,并設(shè)計一個更適合審計和監(jiān)管目的的算法模型。
加快機器學(xué)習(xí)在風險管理領(lǐng)域應(yīng)用是未來的發(fā)展方向,有關(guān)機構(gòu)應(yīng)該正視這種趨勢,積極完善金融立法體系有關(guān)的工作,為機器學(xué)習(xí)發(fā)展創(chuàng)造良好的市場環(huán)境,同時也必須重視機器化應(yīng)用給風控工作造成的沖擊,未雨綢繆地開展前瞻性研究和戰(zhàn)略性部署。要借鑒國外先進的有關(guān)風險防范的法律法規(guī),從宏觀角度將機器學(xué)習(xí)納入法律體系,修訂、補充現(xiàn)有法律法規(guī)中與其不相符的部分以填補監(jiān)管的空白,加大金融犯罪的懲治力度,為金融機構(gòu)的健康發(fā)展提供強有力的法律保障。特別地,相關(guān)部門應(yīng)在金融交易一致性、合規(guī)性等方面加快立法速度,對識別數(shù)字簽名、保護消費者信息等方面作出詳細規(guī)定,以保障機器學(xué)習(xí)健康有序地開展[4]。
應(yīng)加快形成符合中國國情的風險管理長效監(jiān)管機制。根據(jù)實際需要和各自的特點,明確各領(lǐng)域監(jiān)管主體并賦予其監(jiān)管權(quán)限,對監(jiān)管層次和監(jiān)管內(nèi)容予以更為詳細的劃分,以加快對機器學(xué)習(xí)參與的風險管理領(lǐng)域監(jiān)管的合作。一方面,爭取由國家層面牽頭建立以“一委一行兩會”為主,相關(guān)部門為輔的機器學(xué)習(xí)監(jiān)管機構(gòu)體系,形成長效合作機制,將監(jiān)管重點從傳統(tǒng)銀行的資產(chǎn)負債流動性管理轉(zhuǎn)換為金融交易和客戶信息的安全性保護。另一方面,加強機器學(xué)習(xí)監(jiān)管的國際分工合作,加快參與機器學(xué)習(xí)風險國際治理機制的形成,打造統(tǒng)一的公開信息共享平臺,帶動各國金融機構(gòu)的交流互動并形成多層次的監(jiān)管體系。
信息開發(fā)是機器學(xué)習(xí)提供服務(wù)的重要能力指標,要加強技術(shù)創(chuàng)新、業(yè)務(wù)創(chuàng)新、模式創(chuàng)新。在系統(tǒng)設(shè)計過程中,應(yīng)盡可能包含數(shù)據(jù)處理、模型擬合、交叉驗證和異常處理等重要環(huán)節(jié),建立關(guān)聯(lián)數(shù)據(jù)集敏感度監(jiān)測系統(tǒng),并對信息二次利用的安全性和合法性標準進行契合度核查。將新模型納入系統(tǒng)之前要進行算法漏洞掃描和壓力測試,對單元測試、系統(tǒng)測試、用戶測試等分別進行維護并提供單獨的情景模擬,以實現(xiàn)對信息和環(huán)境時變的更新控制。為了識別可能出現(xiàn)的過度擬合、極端異常值等問題的原因,必須定期進行在險價值評估,并動態(tài)完善安全保障措施,結(jié)合滲透測試和技術(shù)審核,及時修復(fù)出問題編碼和系統(tǒng)漏洞。
智能時代的到來是通過自動化技術(shù)的運用擴展數(shù)據(jù)來源,將更多的數(shù)據(jù)納入分析體系來提高傳統(tǒng)業(yè)務(wù)的決策效率,應(yīng)該清醒地認識到它與人類決策的互補而非取代作用,畢竟機器學(xué)習(xí)更多的是通過數(shù)據(jù)敏感性分析信息單位間的相關(guān)性,進而得出決策結(jié)論。因果分析法相比,即使對業(yè)務(wù)完全不熟悉的金融工具也能自動進行交易策略,甚至模擬專家進行決策,這必然會隱含許多新的風險。所以,必須對前期數(shù)據(jù)來源、算法編程等環(huán)節(jié)進行嚴格審查,高資產(chǎn)凈值和更復(fù)雜業(yè)務(wù)的交易仍需要面對面的風險度量,尤其在國際市場動蕩、監(jiān)管政策變革等個別極端情況下,必須介入人類決策,由風險管理人員進行必要的風險檢測及應(yīng)急計劃制定。
既懂機器學(xué)習(xí)又懂風險管理的復(fù)合型人才十分匱乏,這是制約我國機器學(xué)習(xí)技術(shù)在風控領(lǐng)域深入應(yīng)用的瓶頸因素。必須要增強核心科研人員和技術(shù)操作人員的儲備,尤其要增大福利待遇引進全能型、復(fù)合型人才。鑒于數(shù)據(jù)特征的時變性,強化專業(yè)性、技術(shù)性、實用性人才開發(fā)以適應(yīng)發(fā)展要求[5]。員工素質(zhì)能力對于提高風險管理的安全性和可靠性發(fā)揮重要作用,為了更好地促進機器學(xué)習(xí)在風險管理中的應(yīng)用,應(yīng)注重培養(yǎng)技術(shù)人員相關(guān)基本金融知識、業(yè)務(wù)操作和技術(shù)更新,管理人員應(yīng)及時掌握新型風險的相關(guān)知識,動態(tài)調(diào)整監(jiān)測模型,進而提高機器學(xué)習(xí)應(yīng)用的風險防控能力。
一方面,機器學(xué)習(xí)不斷提高的數(shù)據(jù)挖掘能力使得消費者的隱私保護受到嚴重破壞,個人信息泄露的現(xiàn)象屢見不鮮。無論從保護消費者基本權(quán)利,還是從機器學(xué)習(xí)的長久發(fā)展考慮,都亟須相關(guān)部門加強相關(guān)法律約束和行政監(jiān)管,明確金融機構(gòu)相關(guān)告知義務(wù)、信息安全保障義務(wù),有效保證機器學(xué)習(xí)在風險管理應(yīng)用中的信息安全[5]。另一方面,消費者應(yīng)提高對風險管理相關(guān)業(yè)務(wù)的了解程度。隨著金融新產(chǎn)品新服務(wù)的創(chuàng)新活躍,消費者應(yīng)及時知曉與之相關(guān)的風險點,提高自身的風險識別和防范能力。相關(guān)金融機構(gòu)要為消費者提供實時的信息和持續(xù)的教育,提高業(yè)務(wù)流程的透明度,為金融產(chǎn)品的真實性和安全性負責,指導(dǎo)幫助消費者認識風險因素并正確地報吿安全問題。
智能時代機器學(xué)習(xí)的發(fā)展,為風險管理工作帶來了巨大的便利。監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和深度學(xué)習(xí)等自動化技術(shù)在金融風險管理領(lǐng)域的應(yīng)用,尤其是信用風險和欺詐行為的監(jiān)測方面,大大提高了數(shù)據(jù)挖掘和數(shù)據(jù)分析能力,有效地減少了人工處理的時間成本,提升了金融機構(gòu)風險管理的效率。然而,我們也應(yīng)該清醒地認識到,對于機器學(xué)習(xí)的應(yīng)用還存在諸多局限和爭議,算法的透明度和解釋度依然是其面臨的重大挑戰(zhàn),擺正機器學(xué)習(xí)和人類決策的位置至關(guān)重要。只要我們主動求變應(yīng)變,合理發(fā)揮人工智能發(fā)展的先發(fā)優(yōu)勢,“智能經(jīng)濟”時代一定會加速到來。