張立華,張順順
1.溫州商學院 金融貿(mào)易學院,浙江 溫州 325000
2.倫敦大學國王學院 國王商學院,倫敦WC2B 4BG
在大數(shù)據(jù)、云計算、元宇宙、人工智能等新技術革命的推動下,機器學習(machine learning,ML)誕生了自然語言處理(natural language processing,NLP)、計算機視覺(computer vision)和機器人(robotics)技術發(fā)展的一座座里程碑。伴隨著海量數(shù)據(jù)的挖掘過程,區(qū)域金融風險防控面臨著數(shù)據(jù)稀疏性和復雜性的挑戰(zhàn)。區(qū)域金融風險的量化和防控非常重要。當金融機構愈來愈強大和業(yè)務更加綜合,準確量化和減輕風險的綜合統(tǒng)計模型變得比過往任何時候更加復雜多變。當需要準確評估大金融機構的投資組合風險敞口,運用傳統(tǒng)的統(tǒng)計或模擬方法將變得越來越無所適從。為克服傳統(tǒng)方法的缺陷不足,研究者開始關注ML 方法在應對區(qū)域金融風險防控中的應用。
理論學術界相關的研究工作已經(jīng)逐漸展開,不斷研發(fā)的ML 防控區(qū)域金融風險研究方法主要表現(xiàn)為兩方面:一是,從傳統(tǒng)金融風險管控ML 視角看,2016 年Cavalcante 等人介紹了2009—2015 年的主要研究文獻,綜述了計算智能方法的金融市場動態(tài)預測,全文著重于金融數(shù)據(jù)的預處理和聚類、未來市場走勢的預測、金融文本信息挖掘技術等。隨后,De Spiegeleer 等人描述了傳統(tǒng)高斯回歸的加速多個數(shù)量級的機器學習技術,擬合了復雜的希臘值風險并總結了隱含波動率,減少了模型的普通期權價值測算、美式期權定價和超越Black-Scholes 模型奇異期權定價的計算次數(shù)。2020 年Mashrur 等人介紹了一個傳統(tǒng)金融風險管理ML 分類法,詳述了其過去十年中的重要出版文獻,梳理了研究人員面臨的主要困惑,指出了傳統(tǒng)金融風險管理機器學習的未來研究方向。二是,從金融系統(tǒng)風險管控ML 視角看,Helbing強調(diào)了當今全球網(wǎng)絡具有廣泛且相互依存的系統(tǒng),當網(wǎng)絡世界的復雜性和交互作用增加時,這些系統(tǒng)可能對社會造成嚴重的破壞。之后,2019 年Kuo對現(xiàn)有的利用大數(shù)據(jù)分析、網(wǎng)絡分析和情感分析等ML技術評估衡量金融系統(tǒng)風險的研究方法進行了綜述,梳理了當前金融系統(tǒng)風險ML 的研究方法和未來工作方向。2020年Giudici等人描述了多元網(wǎng)絡結構的關聯(lián)網(wǎng)絡模型(correlation network models,CNM),注重系統(tǒng)風險、間接風險敞口,將其關聯(lián)于直接風險敞口,捕捉和度量金融網(wǎng)絡中的系統(tǒng)風險。RFRP(regional financial risks prevention)防控模擬的優(yōu)化路徑如圖1 所示,ML 模型求解過程是對傳統(tǒng)統(tǒng)計計量方法的一種優(yōu)化策略。
圖1 RFRP 防控模擬的優(yōu)化路徑Fig.1 Optimal path to simulate RFRP prevention
綜合來看,以往研究文獻分別關注傳統(tǒng)金融風險管理或者金融系統(tǒng)風險管控,然而,缺乏對區(qū)域金融風險管控的科學化分類法和區(qū)域金融風險管控框架中優(yōu)化ML 方法。本文的研究擴展有以下幾個方面:首先提出了區(qū)域金融風險防控的科學分類,在ML 的簡要概述上描述了ML 的關聯(lián)性,這有助于研究者在復雜多變的區(qū)域金融風險領域中確定正確的研究方向;其次綜述了傳統(tǒng)金融風險防控ML 的主要方法和技術,并基于不同的方法和技術,梳理了傳統(tǒng)金融風險防控ML 的國內(nèi)外研究進展,揭示了傳統(tǒng)金融風險防控ML 應用的實踐路徑;再次梳理了區(qū)域金融系統(tǒng)風險防控ML 的主要模型和技術,著重于金融系統(tǒng)風險防控ML 的最新進展,以便駕馭ML 目前在區(qū)域金融系統(tǒng)風險防控領域中的研究方向和重點領域;最后對區(qū)域金融風險防控機器學習新興方向和前景技術進行了展望,希望有助于國內(nèi)外研究者和從業(yè)者,進一步研發(fā)出更適合的ML 方法與技術,有效應對區(qū)域金融風險。
區(qū)域金融風險無論在管理區(qū)域TFR 還是堅守不發(fā)生區(qū)域FSR 中都要進行識別、評測和預防,但以往文獻對區(qū)域金融風險存在著模糊不全面的理解和應用,其中涉及“地區(qū)”和“區(qū)域”這對詞語。查證調(diào)研了該對詞語歷史發(fā)展過程,發(fā)現(xiàn)“地區(qū)”與“區(qū)域”的內(nèi)涵是基本一致的。本文認為區(qū)域金融風險一般呈現(xiàn)出五種表現(xiàn)形式:(1)跨國層面的金融風險;(2)國內(nèi)層面的金融風險;(3)跨省層面的金融風險;(4)省內(nèi)層面的金融風險;(5)跨市層面的金融風險。本文將區(qū)域金融風險分為區(qū)域傳統(tǒng)金融風險和區(qū)域金融系統(tǒng)風險兩大類型。這種金融風險分類視角不同于傳統(tǒng)的風險劃分方法,既有助于機器學習模擬區(qū)域傳統(tǒng)金融風險,也有利于機器學習量化區(qū)域金融系統(tǒng)風險。
金融行業(yè)的繁榮發(fā)展伴隨著承擔、預防和化解金融風險。金融事件可能造成不利的金融市場波動、貸款違約、金融機構倒閉、欺詐活動、客戶損失。根據(jù)金融風險因素的來源,本文拓展了2017年Silva等人研究脈絡,在傳統(tǒng)的金融信用風險、市場風險、操作風險、保險風險基礎上,引入“系統(tǒng)風險(systemic risk)”。
(1)信用風險是指債權人履行貸款違約或破產(chǎn)合同義務能力的不確定性。信用風險主要呈現(xiàn)為零售貸方風險和企業(yè)貸方風險。
(2)市場風險是指高度流動性的金融市場風險敞口導致公司標的資產(chǎn)、債務或收入價值的不確定性。市場風險主要表現(xiàn)為利率風險、匯率風險、大宗商品價格風險等。
(3)操作風險是指金融業(yè)務操作的不可預測性致使虧損風險或錯誤欺詐行為造成績效損失。操作風險一般可分為業(yè)務風險和事件風險。業(yè)務風險表現(xiàn)為經(jīng)營業(yè)績的不確定性,事件風險呈現(xiàn)出業(yè)務操作產(chǎn)生不利影響事件的不確定性。
(4)保險是一種保險人事先約定,承諾在一定時期內(nèi)發(fā)生意外事故并造成損失的情況下,對被保險人進行賠償或提供保險服務的金融系統(tǒng),也是一種應對風險的方法。保險風險主要特征表現(xiàn)在保險損失或死亡事件中的不確定性。
(5)系統(tǒng)風險是指由金融機構崩潰等影響的廣泛事件引發(fā)的金融系統(tǒng)嚴重衰退的概率,事件對金融市場以及整個經(jīng)濟帶來負面沖擊。
圖2 匯總了不同來源的金融風險種類及范圍,有助于及時運用各種區(qū)域金融風險防控策略測度和化解金融復雜體系的風險。這種新的分類視角有助于對區(qū)域金融風險開展重點研究和應對未來金融系統(tǒng)所面臨的風險挑戰(zhàn)。
圖2 金融風險分類Fig.2 Taxonomy of financial risks
機器學習是一種利用以往數(shù)據(jù)或經(jīng)驗提高績效或準確預測的計算機算法,其學習具有優(yōu)化損失或回報函數(shù)的性能。基于學習方式的機器學習主要分類為:
(1)監(jiān)督學習(supervised learning,SL)
SL 又稱為有導師學習,是利用標簽(labelled)的樣本數(shù)據(jù)進行訓練,其算法中訓練模型可用于對未標簽(unlabelled)的數(shù)據(jù)做出預測。監(jiān)督學習主要包括回歸和分類。圖3 給出了SL 的流程框架。
圖3 監(jiān)督學習的流程框架Fig.3 Progress framework of supervised learning
(2)無監(jiān)督學習(unsupervised learning,UL)
UL也稱為無導師學習,是指利用沒有被標簽的數(shù)據(jù)探測模式識別的機器學習任務。該算法中沒有可用的標簽數(shù)據(jù)。無監(jiān)督學習算法旨在解決未標簽數(shù)據(jù)的聚類(clustering)、異常檢測(anomaly detection)、降維(dimensionality reduction)等特定問題。從圖4 可以理解UL 的決策系統(tǒng)。
圖4 無監(jiān)督學習的流程框架Fig.4 Progress framework of unsupervised learning
(3)半監(jiān)督學習(semi-supervised learning,SSL)
SSL在實際應用中很常見,其利用大量的未標簽數(shù)據(jù)以及標簽數(shù)據(jù)進行模式識別研究。SSL 的具體流程框架如圖5 所示。從學習算法看,SSL 可以分類為生成模型(generative models)、自訓練算法(selftraining)、協(xié)同訓練算法(co-training)、半監(jiān)督支持向量機(semi-supervised supported vector machines,S3VM)、圖論算法(graph-based algorithms)。
圖5 半監(jiān)督學習的流程框架Fig.5 Progress framework of semi-supervised learning
(4)強化學習(reinforcement learning,RL)
RL 是指不確定性下實現(xiàn)在環(huán)境交互過程中最大化回報或完成特定目標的序列決策。強化學習方法主要包括時序差分學習(temporal-difference learning,TD)、狀態(tài)-動作-回報-狀態(tài)-動作(state action reward state action,SARSA)算法、異步優(yōu)勢行動者評價者算法(asynchronous advantage actor-critic,A3C)、深度Q網(wǎng)絡(deep Q-network,DQN)、深度確定性策略梯度(deep deterministic policy gradient,DDPG)等。圖6表明智能體與環(huán)境的交互過程是一個試錯策略,以最大化獎勵累計值。
圖6 強化學習的流程框架Fig.6 Progress framework of reinforcement learning
(5)深度學習(deep learning,DL)
深度學習是一種提取特征的多層表示的、擬合特征到標簽的層級轉換的非線性復合函數(shù)的機器學習形式。這種學習方法非常適合復雜非線性數(shù)據(jù)相互作用的識別模式。隨后,深度學習方法發(fā)展了卷積神經(jīng)網(wǎng)絡(convolutional neural network,CNN)、循環(huán)神經(jīng)網(wǎng)絡(recurrent neural networks,RNN)、長短期記憶網(wǎng)絡(long short-term memory,LSTM)。近年,出現(xiàn)了一種融合深度學習和強化學習用于金融市場動態(tài)環(huán)境中做出決策的深度強化學習。
例如代表性RNN 模型是將輸入序列映射到輸出序列的非線性動態(tài)系統(tǒng)。如圖7 顯示右側是左側遞歸表示的展開表示,其中遞歸關系表達式如下:
隨時間反向傳播算法(backpropagation through time)可以直接應用于圖7 右側展開網(wǎng)絡的計算圖,以計算所有狀態(tài)s和所有參數(shù)的總偏差導數(shù)。
圖7 循環(huán)神經(jīng)網(wǎng)絡框架Fig.7 Progress framework of RNN
目前流行的LSTM解決了RNN 無法處理長距離依賴的問題,改進了網(wǎng)絡間的梯度流。
20 世紀80 年代以來,隨著區(qū)域經(jīng)濟一體化和金融國際化的發(fā)展,區(qū)域金融風險對區(qū)域金融穩(wěn)定帶來挑戰(zhàn)。從1988 年起,巴塞爾銀行業(yè)監(jiān)管委員會(Basel Committee on Banking Supervision,BCBS)先后發(fā)布了巴塞爾協(xié)議I(Basel I)和巴塞爾協(xié)議Ⅱ(Basel II),Basel I、Basel Ⅱ都著重于銀行不同資產(chǎn)的風險差異。借鑒Basel I、Basel Ⅱ對銀行風險的劃分,區(qū)域傳統(tǒng)金融風險防控機器學習方法的系統(tǒng)性分類具體模型如圖8 所示。本章分類框架綜合分列了利用機器學習模擬區(qū)域傳統(tǒng)金融風險中的信用風險、市場風險、操作風險、保險風險等方法與技術。
圖8 區(qū)域金融風險防控機器學習方法分類框架Fig.8 Taxonomy framework of machine learning for regional financial risks prevention
鑒于以上綜述的TFR 防控不同ML 方法,表1 分析了各類ML 方法的優(yōu)點、局限和傳統(tǒng)場景等。
表1 TFR 防控的不同ML 方法比較Table 1 Comparison of ML methods for TFR prevention
信用風險(credit risk)定義為借款人履行義務的不確定性。這包括個人貸款違約或公司破產(chǎn)。信用風險防控著重于信用評分和破產(chǎn)預測。信用評分(credit scoring)系指個人貸款的風險敞口,而破產(chǎn)預測是指企業(yè)借款的風險度量。從統(tǒng)計建模來看,破產(chǎn)預測和信用評分用于建模的解釋變量不盡相同。前者的解釋變量關注于公司資產(chǎn)負債表或損益表等的主要財務比率;而零售信用評分模型(retail credit scoring)的預測變量使用貸款申請人的財務和人口統(tǒng)計信息。
近20 年以來,機器學習預測個人或企業(yè)違約的文獻不斷增長。其中用于信用風險評估分為兩類:
(1)監(jiān)督學習預測信用風險
兩個最常用的預測破產(chǎn)或信用評分的分類器(classifiers)是支持向量機(support vector machines,SVM)和神經(jīng)網(wǎng)絡(neural network,NN)。Kim 等人描述了一種多類SVM。新的選擇特征方法改進了這些模型的有效性。與此同時,集成學習(ensemble learning)和混合模型(hybrid models)也被廣泛應用。
Ghodselahi和Hu等人對自助聚合(Bagging)、提升法(Boosting)、堆疊法(stacking)等集成學習方法進行了綜述。Wang 等人描述的支持向量機提高了集成模型的預測性能。隨后,Ampountolas 等人和Harding 等人指出隨機森林算法(random forest)優(yōu)于其他單一或混合分類器模型。
(2)無監(jiān)督學習模擬信用風險
聚類方法(clustering methods)適用于識別破產(chǎn)或信用違約風險,這些方法有助于識別申請組合貸款的個人或企業(yè)。Lim 等人分析了聚類動態(tài)評分模型(cluster-based dynamic scoring model),并指出可以通過聚類的不同分類器獲取更高的評分精度。Kou等人綜述比較了研究文獻的不同聚類方法。
Kim等人提出了一種解決信用評級的多類SVM新方法。之后文獻[22]通過決策樹和AdaBoosed 決策樹解決財務預警問題。文獻[23-28]通過引入自助聚合、提升法、堆疊法、支持向量機、隨機森林或通過神經(jīng)網(wǎng)絡、分類與回歸、梯度提升法,或引入自助聚合支持向量機、自助聚合隨機森林等集成算法,進行特征選擇,改進了信用風險建模,提升了風險預測準確率問題。與此同時,文獻[29-30]通過數(shù)據(jù)分割或聚類選擇,提出了無監(jiān)督學習的行為評分或驗證了多準則決策的有效性。針對信用風險ML 算法選擇特征、性能績效、數(shù)據(jù)規(guī)模等問題,表2 分析了信用風險預測模型方法的局限性。
表2 信用風險預測方法的局限性Table 2 Limitation of credit risk model
正如Shiller所言,市場風險的主要測度是運用資產(chǎn)收益標準差衡量資產(chǎn)波動率。為了使市場風險最小化同時收益最大化,機器學習可采用動態(tài)資產(chǎn)配置系統(tǒng)。最優(yōu)投資組合的機器學習模型主要有兩大類型:機器學習預測波動率和機器學習優(yōu)化投資組合。
波動率(volatility)被定義為未來金融市場資產(chǎn)價格的不確定性。較高波動率呈現(xiàn)出較高市場風險。市場風險防控的波動率機器學習的典型方法有:
(1)傳統(tǒng)統(tǒng)計方法改進
20 多年以來,Luong 等人證明了混合機器學習(hybrid machine learning)技術可以改進傳統(tǒng)GARCH模型和隨機方法的性能。人工神經(jīng)網(wǎng)絡(artificial neural networks,ANN)可與GARCH 模型和隨機波動率模型融合,做出更準確的波動率預測。利用GARCH模型輸出作為多層感知機(multi-layer perceptron)模型的輸入,不僅可使模型預測更加準確,而且對于不同的窗口大小(window sizes)、堆疊模型(stacked model)呈現(xiàn)出更好的穩(wěn)健性和一致性。與此同時,Park 等人研究發(fā)現(xiàn)了機器學習模型,特別是支持向量回歸(support vector regression)、高斯過程回歸(Gaussian process regression)和神經(jīng)網(wǎng)絡模型可完全取代傳統(tǒng)的參數(shù)模型。Luo 等人分析了循環(huán)神經(jīng)網(wǎng)絡與隨機波動率模型(stochastic volatility models)相融合可以顯著提升模型的預測能力。
(2)神經(jīng)網(wǎng)絡序列方法
Hochreiter 等人指出了長短期記憶網(wǎng)絡模型是序列分析的循環(huán)神經(jīng)網(wǎng)絡流行變體,長短期記憶網(wǎng)絡模型被應用于預測波動率。最近,Ramos-Pérez 等人基于隨機森林、支持向量、人工神經(jīng)網(wǎng)絡建立了混合人工神經(jīng)網(wǎng)絡,其呈現(xiàn)的預測績效可靠性更高。
(3)市場文本數(shù)據(jù)方法
傳統(tǒng)方法沒有將金融、經(jīng)濟、流行病新聞等非結構化(unstructured)文本數(shù)據(jù)(textual data)用于預測波動率。Groth 等人總結了股票交易量和價格等結構化數(shù)據(jù)不僅用于機器學習預測投資組合波動率,而且文本數(shù)據(jù)也可作為市場波動率的重要解釋變量(predictors)。從歷史上看,金融市場文本數(shù)據(jù)有著不同的來源:一方面,來自資產(chǎn)波動輿論的公開討論區(qū)(public discussion boards)。Antweiler 等人早先討論了樸素貝葉斯(naive Bayes)算法根據(jù)公開討論區(qū)留言準確預測交易量和波動率。之后,Nizer等人研究了公司新聞可作為標的資產(chǎn)波動率短期預測的關鍵解釋變量指標。隨后,Manela 等人分析了支持向量回歸可將新聞隱含波動率以及市場崩盤等引發(fā)的不確定性作為有效解釋變量預測收益的波動率。另一方面,Oliveira 等人指出了有部分文本挖掘(text-mining)預測需要使用Twitter 微博等社交媒體上的數(shù)據(jù)。此后,Xu 等人分析了“谷歌趨勢”(Google trends)可作為股票市場預測波動率的有效指標。近來,自然語言處理(NLP)技術不斷用于提高金融預測性能。Xu 等人指出新聞文章、微博等非結構化文本數(shù)據(jù)可包含金融決策的重要信息。
投資組合優(yōu)化(portfolio optimization)是指一組特定金融合約權重的預期收益最大化或金融風險最小化資產(chǎn)配置過程。許多機器學習方法技術有助于構建波動率最小的投資組合。
(1)監(jiān)督學習優(yōu)化投資組合
Papadimitriou等人描述了支持向量預測S&P500股指極端變動的非線性關系。Ban 等人使用了新正則化(regularization)或交叉驗證(cross-validation)技術,進一步提升了監(jiān)督學習模型的性能。Pinelis 等人發(fā)現(xiàn)了隨機森林模型優(yōu)于傳統(tǒng)的投資組合選擇模型。
(2)在線學習優(yōu)化投資組合
Li 等人分析了金融市場均值回復(mean reversion)假設下找到最優(yōu)投資組合權重的在線投資組合選擇策略(online portfolio selection strategy)。隨后,Li 等人對使用投資組合選擇的不同在線學習方法進行了文獻綜述。
(3)強化學習優(yōu)化投資組合
Jiang 等人總結了強化學習方法可運用卷積神經(jīng)網(wǎng)絡(CNN)、循環(huán)神經(jīng)網(wǎng)絡(RNN)和長短期記憶網(wǎng)絡(LSTM)達到策略優(yōu)化。同時,Almahdi 等人分析了循環(huán)強化學習方法(recurrent reinforcement learning,RRL),在產(chǎn)生市場買賣信號的同時,并基于下行風險調(diào)整目標函數(shù)(downside risk-adjusted objective function)獲得最優(yōu)資產(chǎn)配置權重。
Luong等人提出了一種基于隨機森林與GARCH模型隨機融合的解決波動率預測的新方法。針對GARCH 方法中參數(shù)建模的路徑依賴問題,文獻[33-34]基于支持向量機、深度循環(huán)神經(jīng)網(wǎng)絡,分別提升了傳統(tǒng)計量模型的預測性能,實現(xiàn)了基于實際場景優(yōu)化預測。文獻[35-36]針對金融時間序列問題,闡述了基于長短期記憶網(wǎng)絡或混合人工神經(jīng)網(wǎng)絡的波動率預測方法。文獻[39-40]從新聞文本數(shù)據(jù)測度了市場的隱含波動率,提高了市場風險的預測效應。表3給出了針對波動率預測的文獻模型的局限性。
表3 預測波動率方法的局限性Table 3 Limitation of volatility prediction models
Papadimitriou 等人提出了一種基于支持向量機預測指數(shù)組合收益與風險的非線性新方法。文獻[45-46]通過績效正則化與交叉驗證技術、隨機森林與彈性網(wǎng)絡等監(jiān)督學習技術,預測了資產(chǎn)組合的收益和波動風險問題;文獻[47-48]基于被動均值回歸,設計了最小損失函數(shù)的新權重,優(yōu)化在線學習投資組合;文獻[49-50]提出的深度強化學習、循環(huán)強化學習框架,優(yōu)化了傳統(tǒng)機器學習方法,獲得資產(chǎn)組合的優(yōu)化配置。針對投資組合優(yōu)化的文獻算法,表4 解釋了相關投資組合預測文獻模型的局限性。
表4 優(yōu)化投資組合的局限性Table 4 Limitation of portfolio optimization
金融欺詐活動是金融機構操作風險的主要來源之一。Ngai等人描述了金融欺詐檢測系統(tǒng)的機器學習算法,區(qū)分了欺詐性金融數(shù)據(jù)與大數(shù)據(jù)。金融欺詐活動包括欺詐性信用卡交易和洗錢、欺詐性保險索賠、證券和大宗商品欺詐。這類操作風險防控機器學習算法可以分為監(jiān)督學習方法和無監(jiān)督學習方法:
(1)監(jiān)督學習方法
Sahin等人總結了邏輯回歸(logistic regression)、神經(jīng)網(wǎng)絡、K-最近鄰(K-nearest neighbor)、決策樹(decision trees)和支持向量機等二元分類器被用于欺詐檢測的研究文獻。Bahnsen 等人描述了特征工程方法(feature engineering methods)可以有效提高欺詐檢測模型的預測性能。Abbasi 等人指出元學習(meta-learning)算法可檢測欺詐。Kusaya 等人分析了人工神經(jīng)網(wǎng)絡等ML 方法也用于檢測欺詐行為。當前,基于文本挖掘(text-mining)算法也被用于檢測欺詐研究。
(2)無監(jiān)督學習方法
Nian 等人綜述了基于異常檢測處理欺詐檢測。Papernot 等人提出了異常檢測的理論框架。2019 年Chalapathy 等人發(fā)現(xiàn)了深度學習模型也可用于異常檢測。近年來,生成式對抗網(wǎng)絡(generative adversarial networks,GAN)已被用于模擬和檢測欺詐活動。
監(jiān)督機器學習和無監(jiān)督機器學習方法可以用于自然語言處理模型訓練和調(diào)優(yōu)。自然語言處理技術被廣泛用于挖掘與欺詐檢測的相關文本。近年,Purda等人基于決策樹方法,在排序單詞上應用支持向量機等分類器,有效提高了識別欺詐報告的準確度。Hajek 等人綜述了自然語言處理模型從財務報表中檢測欺詐行為。
Bahnsen 等人基于ML 和數(shù)據(jù)挖掘技術構建了一種信用卡欺詐檢測的新方法。通過實際金融成本,提取交易數(shù)據(jù)的真實特征。文獻[54-55,57,59-60]通過引入ML 的元學習,自適應學習、堆棧泛化,卷積神經(jīng)網(wǎng)絡、循環(huán)神經(jīng)網(wǎng)絡、長短期記憶,生成對抗網(wǎng)絡實現(xiàn)了異常檢測處理信用卡等金融欺詐問題。針對操作風險ML 算法提取特征、性能績效、數(shù)據(jù)規(guī)模等問題,表5 列出了操作風險預測模型方法的局限性。
表5 操作風險預測方法的局限性Table 5 Limitation of operational risk prediction models
保險公司為社會提供保險服務的同時,也承擔或引發(fā)金融保險的不確定性。保險風險可能呈現(xiàn)多種來源,每種風險都需要準確地預測。保險公司預測失誤將導致保險產(chǎn)品定價過低,引發(fā)公司未來金融風險;人壽保險公司需要準確估計人口預期壽命。保險風險主要包括索賠風險、死亡風險等。
索賠風險(claims risk)是指與投保人(policyholders)保險索賠有關的所有未來的不確定性。索賠頻率(claim frequency)和索賠額度(claim severity)是確定未來不確定性的重要指標。索賠建模的傳統(tǒng)統(tǒng)計模型主要是廣義線性模型(generalised linear models,GLM)。但GLM 模型的缺點是假設索賠頻率和索賠額度獨立,并不符合實際。集成模型(ensemble models)預測索賠頻率和索賠額度的績效優(yōu)于GLM 模型。同時,神經(jīng)網(wǎng)絡可以高質量預測憑保單索賠(policylevel claim)的準確率。索賠風險建模的車載信息系統(tǒng)(Telematics)為保險業(yè)務提供了重要的動態(tài)數(shù)據(jù)庫。當獲得汽車傳感器數(shù)據(jù)(Telematics data),可以捕捉到汽車司機的行為特征。這種車載信息數(shù)據(jù)庫改進了索賠預測的準確性。
遠程醫(yī)療系統(tǒng)(telemedicine)逐漸應用于保險領域。保險智能服務需要數(shù)據(jù)作為支撐。有效地獲取高質量的數(shù)據(jù)資源成為不可或缺的重要工作。Tsai等人首次提出了一種圖像超分辨率重建(image superresolution reconstruction,ISRR)算法,基于傅里葉變換(Fourier transform)的多幅圖像恢復增強高頻信息的超分辨率重建算法。該模型假設圖像中不存在動態(tài)模糊(motion blur)和觀測噪聲(observation noise),忽略了光學系統(tǒng)的點擴散分布,僅適用于理想的圖像退化模型。
針對保險理賠風險面臨的數(shù)據(jù)缺失、數(shù)據(jù)稀疏、數(shù)據(jù)重建和數(shù)據(jù)安全等問題,需要增加ML 中訓練樣本的數(shù)量,減少模型過擬合。當前圖像超分辨率重建(ISRR)算法的相關研究已經(jīng)逐漸展開,如Ghaffar等人提出了一種提高衛(wèi)星圖像超分辨率的數(shù)據(jù)增強技術(data augmentation technique,DAT)。超分辨率卷積神經(jīng)網(wǎng)絡(super-resolution convolutional neural network,SRCNN)作為最先進的深度學習模型測試DAT。模型中超分辨率輸出的重建質量使用峰值信噪比(peak signal to noise ratio,PSNR)進行定量評估,同時運用超分辨率前后測試樣本的可視化進行定性評估。構建深度學習算法的衛(wèi)星圖像訓練數(shù)據(jù)集可能會影響分類或回歸的性能和速度。通常構建深度學習匹配規(guī)模的數(shù)據(jù)集很困難。實證發(fā)現(xiàn)數(shù)據(jù)增強緩解了數(shù)據(jù)稀缺問題,也減少了模型等的過度擬合。實驗結果表明SRCNN 模型有效融合了增強方法與實際標準方法。
Ledig 等人提出了生成對抗網(wǎng)絡的單幅圖像超分辨率算法(super-resolution using a generative adversarial network,SRGAN),SRGAN 是第一個對放大四倍自然圖像超分辨率的框架。模型提出了由對抗損失(adversarial loss,AL)和內(nèi)容損失(content loss,CL)組成的感知損失函數(shù)(perceptual loss function)。模型通過訓練比下采樣(down-sampling)層更多上采樣(up-sampling)層的編碼器-解碼器網(wǎng)絡(encoderdecoder network),基于下采樣中恢復圖像詳細特征,AL 使得判別器(discriminator)生成的圖像更加接近自然圖像。CL 促使圖像的感知相似,不是像素空間相似。深度殘差網(wǎng)絡從深度下采樣恢復圖像逼真性。平均意見得分(mean opinion score,MOS)測試結果表明SRGAN 獲得的圖像MOS 值比其他方法獲得圖像MOS 值更加接近原始的高分辨率圖像。目前SRGAN 已被應用于從低分辨率圖像生成高分辨率圖像的醫(yī)學、保險領域。
2021 年Li 等人運用神經(jīng)網(wǎng)絡改進了ISRR 處理低分辨率圖像的問題,提出了基于自注意力機制圖像超分辨率重建(self-attention-based image reconstruction)方法,利用殘差網(wǎng)絡(residual network)結構和子像素卷積(sub-pixel convolution),提取圖像中的詳細信息;運用生成對抗(generative confrontation)和圖像特征感知機(image feature perception),提高了圖像重建質量,保障數(shù)據(jù)的安全傳輸。目前,圖像超分辨率重建算法應用于金融保險的研究文獻并不多見。
死亡風險(mortality risk)是金融機構提供與受益人長壽相關的人壽保險產(chǎn)品的未來不確定性。死亡率(mortality rate)是人壽保險的量化指標,對人壽保險產(chǎn)品進行估值。通常表示為特定人群組中每1 000人的預期死亡人數(shù)。以往死亡風險建模研究主要分為兩方面:一是廣泛應用的年度死亡率演化的離散時間模型(Lee-Carter模型等);二是刻畫了瞬時死亡的連續(xù)時間隨機模型。近年來,多種ML 技術已經(jīng)用于死亡率建模。神經(jīng)網(wǎng)絡已被廣泛用于增強預測多人口死亡率(multi-population mortality)預測的方法。比如神經(jīng)網(wǎng)絡擴展了Lee-Carter模型預測多人口死亡率同時,也可以用于多人口死亡率預測的降維分析。
目前X 光圖像檢測技術(X-ray image detection,XRID)是保險、醫(yī)學、質量檢測、安全檢查等行業(yè)中最重要的診斷方法之一。主要提供形態(tài)信息,也可獲取一些功能信息。X 光可以穿透普通可見光無法穿透的物質,X 光波長越短、密度越低或厚度越薄,其穿透率越高。X 光可以實現(xiàn)其他檢測方法無法比擬的獨特檢測效果。就X 光的實時成像來說,通過探測器將檢測數(shù)據(jù)傳輸至電腦顯示端,經(jīng)過軟件同步處理,呈現(xiàn)出實時成像檢測結果,具有操作簡單、實時保存、追溯性強的特點。
冠狀病毒?。–OVID-19)是一種被世界衛(wèi)生組織(WHO)命名為大流行病的急性呼吸道疾病,醫(yī)療衛(wèi)生系統(tǒng)面臨著感染人數(shù)突然激增和高死亡率的巨大壓力。Karthikeyan 等人運用X 光圖像、CT 掃描和超聲波等死亡率檢測技術,提出了基于檢測數(shù)據(jù)的ML 方法,預測COVID-19 死亡風險,以96%準確率預測了死亡率。在整個疾病期間,對神經(jīng)網(wǎng)絡、邏輯回歸、XGBoost、隨機森林、SVM 和決策樹等ML 模型進行了訓練和性能比較。發(fā)現(xiàn)使用XGBoost 的重要特征提取和神經(jīng)網(wǎng)絡方法,提前16 天以90%的準確率做出了預測,有助于提高醫(yī)療保險系統(tǒng)的決策過程。
X 光圖像檢測技術等臨床數(shù)據(jù)的ML已被用于預測COVID-19 患者的病情惡化導致死亡風險。Sriram等人指出COVID-19 患者數(shù)據(jù)的稀缺性,目前受到預訓練數(shù)據(jù)(pretraining data)和目標COVID-19 患者數(shù)據(jù)之間差異的限制,需要補充對非COVID-19 圖像的監(jiān)督預訓練,在預訓練中使用動量對比(momentum contrast,MoCo)的自監(jiān)督學習,學習更通用的圖像表征(image representations)用于下步任務。提出了一種新的多圖像序列預測的轉換器架構(transformer-based architecture)模型,結果表明模型實現(xiàn)了0.848AUC 預測96 h 的死亡率。
Gourdeau 等人闡述了胸部X 光圖像檢測(chest X-ray detection,CXRD)結果,表明亟需從當前CXRD開展未來COVID-19 患者的病情評估(severity evaluation)?;贑heXnet 開放數(shù)據(jù)集(65 240 名患者的224 316 幅胸部X 光圖像)訓練了一種重新調(diào)整的深度學習算法,提取映射到放射標簽的數(shù)據(jù)特征。從開源數(shù)據(jù)集(COVID-19 圖像數(shù)據(jù)集)和多機構ICU數(shù)據(jù)集中收集了COVID-19 陽性患者的CXR,從圖像和報告中將數(shù)據(jù)分組為成對的CXR“更差”“穩(wěn)定”或“改進”三類。訓練了深度學習提取的特征,實時病情評估和未來放射軌跡的預測,進行了觀測者操作特性曲線(receiver operating characteristic curve,ROC)分析和曼-惠特尼檢驗(Mann-Whitney tests)。COVID-19 在本地圖像數(shù)據(jù)收集上訓練的病情評估具有良好的分布外泛化性。CXRD 深度學習表明了病情評估和軌跡進行分類的應用前景。當納入臨床數(shù)據(jù)和更大樣本量的研究得到驗證,可以為分診決策(triage decisions)、保險風險預測提供有效信息。
2018 年綜合汽車圖像、司機行為特征的動態(tài)數(shù)據(jù)庫車載信息數(shù)據(jù)庫開始用于改進保險索賠風險預測的精確性。之前,Tsai 等人提出了一種完善保險索賠風險數(shù)據(jù)的圖像超分辨率重建(ISRR)問題的雛形,其模型通過傅里葉變換的多幅圖像恢復增強高頻數(shù)據(jù)信息。文獻[65-67]提出了改進ISRR 的數(shù)據(jù)增強新技術,引入卷積神經(jīng)網(wǎng)絡、生成對抗網(wǎng)絡、自注意力機制,利用殘差網(wǎng)絡結構和子像素卷積提取圖像的特征信息,將圖像從低分辨率轉為高分辨率,補充了圖像數(shù)據(jù)庫及數(shù)據(jù)稀缺問題,提高了數(shù)據(jù)的傳輸效率,減少了傳輸數(shù)據(jù)加密和密鑰交換的成本,成為保障數(shù)據(jù)安全的重要環(huán)節(jié)。超分辨率醫(yī)學圖像(super-resolution medical images)可以幫助更準確地判斷疾病,提高索賠的準確度,化解和減少索賠風險。為保險理賠風險預測做好了數(shù)據(jù)增強的準備基礎。針對保險索賠風險ML 算法提取圖像特征中的圖像處理的問題、數(shù)據(jù)傳輸?shù)陌踩葐栴},表6 解析了基于索賠風險預測模型方法的局限性。
表6 索賠風險預測方法的局限性Table 6 Limitation of claims risk prediction models
Lee 等人早前提出了一種預測死亡風險的離散時間模型。之后,文獻[69-71]相繼提出了死亡風險預測的連續(xù)時間隨機模型、多人口死亡風險模型、降維死亡風險模型等。隨著ML 算法的發(fā)展,使用X 光圖像檢測技術成為一種預測保險死亡風險的新方法。2021—2022 年間,文獻[72-74]運用X 光圖像檢測了COVID-19 的患者病情,通過神經(jīng)網(wǎng)絡、邏輯回歸、XGBoost、SVM 和決策樹等ML 方法進行訓練,補充非COVID-19 圖像的監(jiān)督預訓練,提取自監(jiān)督和圖像表征。針對數(shù)據(jù)集沒有包括臨床數(shù)據(jù)和樣本數(shù)量的限制,其泛化能力不足。表7 給出了基于死亡風險預測模型方法的局限性。
表7 死亡風險預測方法的局限性Table 7 Limitation of mortality risk prediction models
2008 年國際金融危機后,從始于2010 年巴塞爾協(xié)議Ⅲ,到2017 年最終方案的確認,既強調(diào)資產(chǎn)風險,又匹配資產(chǎn)負債期限,著重防范和化解銀行系統(tǒng)風險,統(tǒng)一規(guī)劃微觀審慎管理與宏觀審慎監(jiān)管。當今,金融系統(tǒng)風險(systemic financial risk)主要研究策略是識別風險并監(jiān)管風險。過往文獻對金融系統(tǒng)風險著重于風險損失演化、“大而不倒”金融機構的識別,以及對金融、經(jīng)濟的影響沖擊研究。本章將從金融機構網(wǎng)絡、大數(shù)據(jù)、金融穩(wěn)定性和監(jiān)管量化視角展開對區(qū)域金融系統(tǒng)風險防控的機器學習研究。
基于網(wǎng)絡的金融系統(tǒng)風險(network-based financial systemic risk)被定義為從宏觀視角研究網(wǎng)絡系統(tǒng)對金融系統(tǒng)的風險傳導。2008 年美國金融危機和2010年爆發(fā)的歐債危機以來,金融機構網(wǎng)絡系統(tǒng)風險已經(jīng)成為研究者持續(xù)關注的熱門課題。金融機構相互連接形成的復雜網(wǎng)絡存在著風險傳導的或然性。一方面,銀行系統(tǒng)流動性要求銀行間的直接關聯(lián);另一方面,產(chǎn)品同質化和風險規(guī)避致使銀行間有著廣泛的間接聯(lián)系。正如Battiston 等人所言,經(jīng)濟和金融政策需要應用網(wǎng)絡分析(network analysis)、行為建模(behavioural modelling)和復雜系統(tǒng)(complex systems)理論的融合。Haldane 等人分析了金融體系的衍生工具交易是金融網(wǎng)絡風險的主要來源。同時,Prasanna 等人和Hu 等人發(fā)現(xiàn)了金融網(wǎng)絡系統(tǒng)和風險傳染致使金融網(wǎng)絡的風險擴大。之后,Diebold 等人利用加權有向圖(weighted directed graph)的連通性(connectedness),研究了美國2007—2008 年金融危機期間主要金融機構的日度股票收益的波動率。Acemoglu 等人總結了復雜金融網(wǎng)絡的轉折點和穩(wěn)定性將決定金融政策的發(fā)展方向。
(1)金融網(wǎng)絡的風險敞口與傳導
金融網(wǎng)絡被定義為一個模擬銀行違約過程的風險敞口矩陣。Amini 等人通過異質性有向圖(inhomogeneous directed graphs)研究了金融網(wǎng)絡的級聯(lián)過程(cascade process)和漸近傳染(asymptotic contagions),提出了監(jiān)管政策應對風險傳染敞口設定為最小資本比率。Bluhm 等人基于互聯(lián)銀行資產(chǎn)負債表,研發(fā)了一個系統(tǒng)風險的網(wǎng)絡模型,并提出了宏觀審慎系統(tǒng)在險價值(value at-risk)方法。Choi發(fā)現(xiàn)了較大金融機構對金融網(wǎng)絡有更大的積極作用,因此,做強做大金融機構將有助于保障銀行體系的穩(wěn)定性。Giudici 等人通過多元圖模型(multivariate graphical models)和貝葉斯圖模型(Bayesian graphical models)實證了不同國家作為金融網(wǎng)絡中心節(jié)點具有不同的行為特征。Yu等人提出了一種新的復雜網(wǎng)絡方法,模擬銀行間網(wǎng)絡的系統(tǒng)風險傳染,發(fā)現(xiàn)金融機構具有充足資本儲備金可用于預防風險傳染。同時,Betz等人闡述了一個不同時期系統(tǒng)風險的評測框架。該框架揭示了銀行業(yè)分化(fragmentation)與主權銀行間的聯(lián)動過程。Shen提出了一種模擬電子物流投資金融風險的貝葉斯網(wǎng)絡方法(Bayesian networks approach)。
(2)金融機構網(wǎng)絡的結構
多層銀行網(wǎng)絡(multilayer bank networks)是相同資產(chǎn)相同風險的金融系統(tǒng)的重要特征。Battiston 等人發(fā)現(xiàn)多層網(wǎng)絡致使抵御金融風險的能力不斷下降,并使金融危機成本不斷增加。Poledna 等人描述了信用、衍生工具、外匯和證券關聯(lián)的金融多層網(wǎng)絡,且單層網(wǎng)絡預期損失被低估了90%。同時,分析了金融多層網(wǎng)絡系統(tǒng)風險總和低于總風險的非線性特征。Grassia 等人提出了一種檢測復雜網(wǎng)絡系統(tǒng)崩潰預警信號的量化系統(tǒng)風險方法,機器學習更好地量化復雜系統(tǒng)的脆弱性及其沖擊反應。
當前,隨機圖論、博弈論、收益成本分析等一系列數(shù)學模型和復雜網(wǎng)絡方法被引入銀行系統(tǒng)風險的研究。流行病模型和隨機最優(yōu)模型等也被應用于金融網(wǎng)絡研究。區(qū)域金融網(wǎng)絡的系統(tǒng)風險研究還并不多見。顯然,未來網(wǎng)絡會變得更廣泛并產(chǎn)生大量數(shù)據(jù),網(wǎng)絡金融系統(tǒng)風險應從大數(shù)據(jù)視角展開分析。
Amini 等人提出了一種基于度序列和任意權重分布下異質性、加權、有向隨機圖風險傳染的新框架。文獻[84-85]引入多元高斯圖、動態(tài)貝葉斯、級聯(lián)違約、復雜網(wǎng)絡傳染等多元網(wǎng)絡方法,識別和預警金融復雜網(wǎng)絡的系統(tǒng)風險敞口;文獻[88-90]通過復雜性、違約概率、違約可回收率分析了多層網(wǎng)絡成本持續(xù)增加,圖卷積神經(jīng)網(wǎng)絡和多層次感知機的引入,更好地拆解了網(wǎng)絡復雜系統(tǒng),量化了復雜網(wǎng)絡系統(tǒng)績效。表8分析了針對金融機構網(wǎng)絡風險ML 的局限性。
表8 網(wǎng)絡風險預測方法的局限性Table 8 Limitation of network risk prediction models
如今,大數(shù)據(jù)不僅借助數(shù)據(jù)挖掘技術和商業(yè)智能進行了理論研究,而且在金融系統(tǒng)風險分析、供應鏈金融風險等管理中開展了廣泛的實證應用。金融系統(tǒng)風險防控的大數(shù)據(jù)分析主要從算法和數(shù)據(jù)兩方面展開。
(1)系統(tǒng)風險大數(shù)據(jù)分析
從金融系統(tǒng)風險來說,大數(shù)據(jù)分析是基于金融大數(shù)據(jù)研究風險源與分散風險的相互關系。金融大數(shù)據(jù)包括銀行同業(yè)資金流動、全球資本流動等金融信息,被用于風險預警和風險識別以應對金融風險。近十年來,涌現(xiàn)了大數(shù)據(jù)算法、網(wǎng)絡合約與金融市場相關性、金融信用風險評估、股市波動分析以及股價與輿情關聯(lián)性等模型。Cerchiello 等人建立了第一個基于兩個異質性數(shù)據(jù)源的大數(shù)據(jù)系統(tǒng)風險模型,實證了聯(lián)合運用貝葉斯方法的不同數(shù)據(jù)結構,并評測了金融風險與公眾輿情的相關性。Sarlin引入了模擬系統(tǒng)風險的機器學習、網(wǎng)絡分析、仿真和模糊系統(tǒng)(simulation and fuzzy systems)等智能算法。Sarlin提出了一種具有繪圖、地圖和網(wǎng)絡三個模塊的金融監(jiān)管可視化工具。Cerchiello 等人研究了基于金融推文和金融市場的風險傳染模型,當發(fā)生沖擊時可預測金融風險的相關性。
(2)系統(tǒng)風險的數(shù)據(jù)問題
金融系統(tǒng)是大數(shù)據(jù)的主要來源。金融系統(tǒng)風險分析依托于高質量的數(shù)據(jù)。目前,區(qū)域和全球金融市場數(shù)據(jù)的不可利用性或質量問題使得系統(tǒng)風險的研究文獻并不多見。如何保證大數(shù)據(jù)的有效性問題研究是一個亟待解決的話題。Cerchiello 等人提出的多源異構數(shù)據(jù)集成(multi-source heterogeneous data integration)應視為大數(shù)據(jù)。Flood 等人分析了金融風險總是與時間和時變數(shù)據(jù)相關,難以確保數(shù)據(jù)資源的有效金融風險分析。加之,金融機構的復雜性,數(shù)據(jù)集成和質量也是一個不容易解決的問題。Jagadish 等人總結了大數(shù)據(jù)分析應包括數(shù)據(jù)收集、建模分析、數(shù)據(jù)解讀和應用等步驟。然而,大數(shù)據(jù)的異質性(heterogeneity)、時效性(timeliness)、不一致性(inconsistency)和不完整性(incompleteness)等也成為金融市場應用中的障礙。同時,Yang等人提出了一個改進存儲數(shù)據(jù)的框架和分類標準。Brammertz等人提出了從金融合約信息粒度(information granularity)中提取金融大數(shù)據(jù)的監(jiān)管信息,并研發(fā)了針對機構、系統(tǒng)和個人等多層次金融目標的混合模型。為了給大數(shù)據(jù)分析奠定堅實的基礎,需要進一步完善數(shù)據(jù)質量的評價指標體系(evaluation index system)。
(3)金融市場的情緒分析
推文、新聞、法律等互聯(lián)網(wǎng)數(shù)據(jù)一直視為研究金融風險的文本數(shù)據(jù)。當前,研究學者從輿情視角分析了金融系統(tǒng)風險。首先,Nyman 等人發(fā)現(xiàn)金融系統(tǒng)風險可通過基于文本集(text set)的市場情緒來衡量。Chiang 等人從金融新聞網(wǎng)站收集并構建了一個金融文本數(shù)據(jù)庫,提取常用詞集并測算了情緒指數(shù)(sentiment index),發(fā)現(xiàn)了情緒指數(shù)可用于預測電子行業(yè)的股票指數(shù)。Tsai 等人利用金融銀行報告的文本信息預測金融風險,實證了軟信息(soft information)與金融風險具有強相關性,發(fā)現(xiàn)了金融風險與市場情緒間存在強相關性。Meyer 等人運用粒度情感分析(granularity sentiment analysis)研究金融新聞,揭示了定價和風險預測模型,通過自然語言處理提取相應句法句型和預測情緒。情感分析(sentiment analysis)和輿情挖掘(opinion mining)旨在利用文本挖掘發(fā)現(xiàn)客戶和市場的態(tài)度、輿情和趨勢。目前,機器學習情緒分析方法主要有回歸與排序方法(regression and ranking methods)、詞典與機器學習情感分析(lexicon and machine learning sentiment analysis)、規(guī)則排放模型算法(rule-based emission model algorithm)、正面詞匯與負面詞匯比例(fractions of positive and negative words)等。
文獻[92-94]主要引入機器學習、圖模型、貝葉斯方法,以及金融穩(wěn)定分布圖、銀行關聯(lián)圖可視化,識別和預測金融推文、金融市場的關聯(lián)風險、風險溝通等系統(tǒng)風險的重要特征。從系統(tǒng)風險數(shù)據(jù)視角看,文獻[91,95-96]分析了多源異構數(shù)據(jù)、大數(shù)據(jù)規(guī)范、數(shù)據(jù)提取和清洗、數(shù)據(jù)整合和加總,強化了數(shù)據(jù)信息豐富的金融風險管理系統(tǒng)基礎。從金融市場情緒視角看,文獻[99-100,102]通過文本集、新聞機構和網(wǎng)站,運用KNN 算法、支持向量機、樸素貝葉斯,結合半監(jiān)督學習和監(jiān)督學習,抑或使用自然語言處理提取句法句型特征,更準確預測金融新聞情緒,識別和預防金融系統(tǒng)風險。表9 分析了針對大數(shù)據(jù)風險預測ML的局限性。
表9 大數(shù)據(jù)風險預測方法的局限性Table 9 Limitation of big data risk prediction models
現(xiàn)代金融創(chuàng)新要求構建一個穩(wěn)定的金融體系,以便更好地既規(guī)避金融風險又保證流動性。全球金融危機后,第二代預警模型(early warning models)隨著技術的發(fā)展開始應用于金融穩(wěn)定測度。如今,決策樹(decision trees)、稀疏模型(sparse models)和無監(jiān)督學習(unsupervised learning)成為用于金融穩(wěn)定的主要機器學習技術。
首先,決策樹模型是研究金融穩(wěn)定的重要預警模型。Duttagupta 等人基于二元分類樹(binary classification tree)方法,分析了50 個新興市場和發(fā)達經(jīng)濟體的銀行危機,決策者只需監(jiān)控特定變量是否超過目標國家的預警門檻值。Manasse 等人測度了可能導致新興市場銀行危機的脆弱性,通過交叉驗證聚合(cross-validation aggregating,CRAGGING)方法測試了540 個備選預測變量,識別出兩個銀行危機的“危險區(qū)域”。2019 年Gabriele基于15 個歐盟國家的樣本,使用CRAGGING 算法識別了銀行系統(tǒng)危機的脆弱性,發(fā)現(xiàn)了信貸總量高和市場風險低的認知是關鍵因素。Tanaka 等人根據(jù)銀行財務報表的預測變量,通過隨機森林模型評測了銀行業(yè)的脆弱性。Ward基于17 個國家的長期樣本,運用自助聚合(Bagging)和隨機森林算法衡量了銀行危機的風險,決策樹集成學習(tree ensembles)算法的預測性能好于傳統(tǒng)Logit模型。2019 年Casabianca 等人基于100 個發(fā)達和新興經(jīng)濟體的數(shù)據(jù),使用自適應提升算法(AdaBoost)識別了銀行系統(tǒng)危機的累積,發(fā)現(xiàn)了機器學習算法比Logit 模型具有更好的預測性能。2021 年Bluwstein 等人實證了機器學習在樣本外優(yōu)于邏輯回歸的預測,根據(jù)每個觀測的危機概率分解為預測變量的貢獻總和,對機器學習模型進行了預測。其次,決策樹集成學習方法也被用于主權危機的早期預警模型。2019 年Arakelian 等人根據(jù)宏觀經(jīng)濟基本面、門檻值等預測變量,運用遞歸分區(qū)(recursive partitioning)方法衡量了區(qū)域歐洲主權風險。最后,決策樹模型還可被用于預測貨幣危機。Joy等人使用CART 模型和隨機森林算法,基于36 個工業(yè)化經(jīng)濟體的樣本,識別了每種危機的主要變量,預測了貨幣危機和銀行危機,并分析了危機的不同原因。
早前,Barry使用了貝葉斯方法解決估計誤差項累積造成的不利影響。之后,Brodie 等人和Fan等人運用LASSO 回歸方法對優(yōu)化問題進行了正則化,構建了穩(wěn)定的稀疏投資組合。從貝葉斯模型的金融穩(wěn)定性來說,Eidenberger 等人研發(fā)了一個金融壓力指數(shù)的預警系統(tǒng)模型,運用了30 個備選解釋變量,并基于最大概率解釋變量遴選了重要的預測變量。Chen 等人使用層次貝葉斯模型(Bayesian hierarchical model)研究了2008 年全球金融危機的決定因素,對組合變量選擇進行了聯(lián)合處理。2019 年Guidolin 等人基于時變貝葉斯模型估測了美國次貸危機的影響,估計了美國金融市場的跨資產(chǎn)風險傳染。Lang 等人使用了Logistic LASSO 算法并融合懲罰參數(shù)的交叉驗證,基于銀行和宏觀金融數(shù)據(jù),實時遞歸了(real-time recursive)樣本外測試其模型。2019 年Alessi等人將LASSO 算法應用于測度主權危機,識別了遞歸環(huán)境中主權信用違約互換(credit default swaps,CDS)的宏觀橫截面指標,并估測了特定經(jīng)濟基本面的市場時變敏感性。Holopainen 等人總結了Logit LASSO 模型、分類樹(classification trees)和隨機森林等機器學習方法作為預警模型,指出了決策樹算法(tree-based algorithms)的性能高于樸素貝葉斯(naive Bayes approach)方法和LASSO 算法,LASSO 算法優(yōu)于標準Logit 模型。顯然,LASSO 回歸模型是金融穩(wěn)定的重要稀疏模型。
近年來,網(wǎng)絡方法在金融穩(wěn)定研究中得以廣泛認同。正如Battiston 等人所說,金融系統(tǒng)終歸是一個復雜系統(tǒng),可通過傳統(tǒng)網(wǎng)絡方法研究其彈性、穩(wěn)健性和穩(wěn)定性等重要特征。Glasserman 等人已將網(wǎng)絡模型用于風險傳染建模。之后,Battiston 等人運用網(wǎng)絡方法測度了金融系統(tǒng)風險。美國金融危機后,網(wǎng)絡應用的文獻數(shù)量呈指數(shù)式增長。Marcus 等人提出了有效的人機合作關系能夠降低系統(tǒng)風險方法。人類和人工智能差異推動了新技術在金融市場、監(jiān)管和政策制定中的使用,并分析了它們對金融穩(wěn)定的潛在影響。2020 年Schuldenzucker 等人研究了無法確定銀行違約時的系統(tǒng)風險。
Duttagupta 等人首次引入二元分類樹,提出了應對銀行危機的預警模型。文獻[108-109]通過分類決策樹、遞歸分區(qū)、分類樹集成、自適應提升算法,提出了應對銀行系統(tǒng)危機的預警系統(tǒng),識別銀行危機的宏觀驅動力。文獻[115,119]通過引入LARS-LASSO、Logistic LASSO 建模技術,運用協(xié)方差矩陣、損失函數(shù)、正則化邏輯回歸、交叉驗證,回歸預測了總風險敞口稀疏投資組合、風險早期預警。文獻[118]基于脈沖響應函數(shù)、貝葉斯估計,預測了美國金融危機跨資產(chǎn)傳染機制。文獻[75,123-124]從網(wǎng)絡分析、人工智能、依賴關系框架,分析了金融市場、信用違約互換合約中的系統(tǒng)風險,成為用于金融穩(wěn)定的ML 技術。表10分析了針對穩(wěn)定性風險預測ML的局限性。
表10 穩(wěn)定性風險預測方法的局限性Table 10 Limitation of stability risk prediction models
為了應對金融危機,無論是金融研究者,還是中央銀行和國際金融組織一致認為金融監(jiān)管缺失致使金融系統(tǒng)風險傳遞和蔓延。21 世紀以來,Galat 等人和Kara先后描述了金融系統(tǒng)風險監(jiān)管研究過往涌現(xiàn)出的大量文獻。全球金融危機的文獻總結了金融網(wǎng)絡、大數(shù)據(jù)分析和金融穩(wěn)定性分析等多種衡量系統(tǒng)風險的方法,與此同時,文獻研究中也描述了金融監(jiān)管的設計分析。Posner 等人發(fā)現(xiàn)在評估金融監(jiān)管成本時應該考慮效益成本分析(benefit-cost analysis)。系統(tǒng)風險監(jiān)管的網(wǎng)絡分析是金融監(jiān)管研究的一個重要課題。從Bosma分析政策相互依賴性和Clark 等人總結的最優(yōu)干預政策(optimal intervention policy)規(guī)則看,定量分析監(jiān)管決策將成為未來金融監(jiān)管的主流方向之一。之前,Cao 等人比較了不同的監(jiān)管機制,并推導出應對系統(tǒng)流動性風險的方法。隨后,Nucera 等人對系統(tǒng)風險進行了分類研究,發(fā)現(xiàn)價格與資本評級結果呈現(xiàn)出顯著性偏差。
Posner 等人引入了一種應對金融風險監(jiān)管系統(tǒng)危機的效益成分分析的新方法。通過解決信息外部性、規(guī)避系統(tǒng)危機等測算金融監(jiān)管成本。文獻[126,128-129]通過協(xié)調(diào)不同國家的資本充足要求、政策工具之間相互依賴性、最優(yōu)干預政策措施,提出了定量識別和化解系統(tǒng)風險的金融監(jiān)管的新方向。表11分析了基于金融風險監(jiān)管量化預測方法ML 的局限性。
表11 監(jiān)管量化預測方法的局限性Table 11 Limitation of quantitative supervision prediction models
針對以上分析的FSR 防控的不同ML 方法,表12闡述了各類ML 方法的優(yōu)勢、缺陷和適應場景等。
表12 FSR 防控的不同ML 方法比較Table 12 Comparison of ML methods for FSR prevention
本文提出了區(qū)域金融風險防控機器學習方法的科學分類和簡要概述,描述了金融風險分類、區(qū)域金融風險和機器學習方法。同時,本文基于巴塞爾協(xié)議Ⅲ的前后,梳理了傳統(tǒng)區(qū)域金融風險防控的機器學習方法分析,并系統(tǒng)地綜述了區(qū)域金融系統(tǒng)風險防控機器學習的具體應用。從以往區(qū)域金融風險防控機器學習文獻來看,國外的分析研究方興未艾,而國內(nèi)的分析僅有零星研究。如今,隨著經(jīng)濟學計算機化的發(fā)展,ML 在關注預防TFR 的同時,更加著重防范和化解FSR。圖9 展望了未來RFRP 管控機器學習的數(shù)據(jù)、建模、預測、監(jiān)管科技等方法技術將在以下六方面迎來新的發(fā)展。
圖9 區(qū)域金融風險防控機器學習方法未來方向Fig.9 Future direction of machine learning for regional financial risks prevention
近年來,TFR 防控中信用風險、市場風險、操作風險的測度問題,表現(xiàn)為模型復雜非收斂性、數(shù)據(jù)來源有限、運算速度過慢等問題??山梃bML、深度學習和大數(shù)據(jù)的邏輯算法思想,通過文本數(shù)據(jù)、音頻數(shù)據(jù)和視頻數(shù)據(jù),豐富TFR 防控中的數(shù)據(jù)缺失,求解策略問題的非線性解,可準確預測在線借款方的違約風險;也可預測為投資者賺取更多的收益。同時,可以結合以往TFR防控中統(tǒng)計計量模型與ML算法互相補充有效數(shù)據(jù)信息也是未來研究的一個重要發(fā)展方向。
如今的研究中,許多模型算法的數(shù)據(jù)面臨著時變數(shù)據(jù)不穩(wěn)定性、數(shù)據(jù)隱私性、數(shù)據(jù)高噪音、模擬成本昂貴的問題。實踐中為了解決RFRP 防控中ML 可能面對數(shù)據(jù)隱私致使數(shù)據(jù)不可用、記錄缺乏、模擬昂貴的問題,需要基于小數(shù)據(jù)學習模型基于少量樣本進行有效學習。針對RFRP 防控機器學習數(shù)據(jù)統(tǒng)計上的非平穩(wěn)性或大量噪聲時,用于分類情景或時間序列情景的穩(wěn)健學習方法可以解決有問題數(shù)據(jù)。許多學者運用聯(lián)邦學習分布式訓練技術避免了數(shù)據(jù)泄漏,通過利用多方模型訓練,而無需交換潛在的私人或敏感客戶的金融數(shù)據(jù),不需要從數(shù)據(jù)持有方訪問數(shù)據(jù),保護了數(shù)據(jù)隱私性和安全性。未來差分隱私建立了個人隱私更高的標準,在聯(lián)邦學習技術防止多方泄漏私人數(shù)據(jù)和信息的同時,差分隱私技術是解決RFRP 的ML 模型整體安全性的一個重要發(fā)展方向。
當前利用數(shù)據(jù)挖掘的FSR 數(shù)據(jù)面臨著因為數(shù)據(jù)的不可用性,大數(shù)據(jù)還沒有完全被用于金融系統(tǒng)風險的問題。大多數(shù)研究FSR 的文獻主要是從宏觀層面、順周期視角識別應對金融風險。大數(shù)據(jù)技術需要突破目前異常行為檢測、微觀主體分類管理、跨國公司監(jiān)管建模等微觀管理研究缺陷。識別“大而不倒(too big to fail)”機構是一項金融宏觀審慎監(jiān)管的重要任務。然而,隨著金融系統(tǒng)高度網(wǎng)絡化、復雜性,以及風險傳染不確定性的研究,“大而不倒”逐漸轉變?yōu)椤皬碗s不倒(too complex to fail)”的問題。識別金融復雜網(wǎng)絡關鍵節(jié)點是推動金融監(jiān)管措施和政策的有效路徑。顯然,大數(shù)據(jù)分析技術、偏微分方程的金融生態(tài)穩(wěn)定性是金融復雜網(wǎng)絡的主流研究,大數(shù)據(jù)在FSR 中的應用將成為未來研究的主要方向。與此同時,系統(tǒng)重要性金融機構管理和數(shù)據(jù)挖掘需要進一步深入研究,以往金融網(wǎng)絡中的風險傳染和系統(tǒng)風險被認為源自系統(tǒng)重要性金融機構,因此,大多數(shù)國家重點監(jiān)管這些金融機構。然而,研究表明非金融機構和金融機構關聯(lián)的網(wǎng)絡穩(wěn)定性可能影響整個系統(tǒng)的穩(wěn)定性。金融網(wǎng)絡的多維體系結構呈現(xiàn)出網(wǎng)絡金融機構受到非金融機構的影響,增加了金融系統(tǒng)的不穩(wěn)定性。當前,RFRP 防控中區(qū)域網(wǎng)絡關系著重關注于金融機構、非金融機構之間的債務、借貸資本和現(xiàn)金流量。因此,區(qū)域非金融機構和金融機構的數(shù)據(jù)來源是未來大數(shù)據(jù)研究的主要方向。
以往大多數(shù)研究主要用于預測,神經(jīng)網(wǎng)絡等高維參數(shù)模型準確識別了特征和標簽之間的相關性,很少關注特征和模型預測之間的因果關系。但是,對于信用批準決策模型、因果關系解釋模型等RFRP 防控研究對研發(fā)者和監(jiān)管機構都是非常重要的環(huán)節(jié)。歧視發(fā)現(xiàn)和公平感知機器學習的技術改進,有助于信用批準決策等金融風險管理。神經(jīng)網(wǎng)絡的不確定性測量是一個非?;钴S的研究領域,預測區(qū)間可以看作神經(jīng)網(wǎng)絡點預測不確定性的準確指標。未來的ML模型需要改善和優(yōu)化以往學習中的高度隨機性、不可解釋性、不公平性等特征。同時,從金融系統(tǒng)風險的宏觀性、全局性特征來看,基于金融復雜化網(wǎng)絡的特征,未來應開發(fā)融合機器學習模型與傳統(tǒng)計量方法的聯(lián)合模型,發(fā)揮兩者的優(yōu)勢互補是新的重要研究方向,為識別、測度和治理RFRP 防控注入堅實的理論基礎。
目前圖像數(shù)據(jù)增效已經(jīng)成為識別、測度金融保險風險管控的新發(fā)展方向。金融保險實踐中密度不足的模糊成像將致使數(shù)據(jù)嚴重匱乏。為了擴充圖像數(shù)據(jù)和模型泛化能力,需要引入圖像數(shù)據(jù)增強算法。圖像超分辨率重建算法增加了ML 中訓練樣本的數(shù)量,減少模型過擬合。超分辨率卷積神經(jīng)網(wǎng)絡提高了衛(wèi)星圖像超分辨率的數(shù)據(jù)增強技術,模型中高分辨率輸出的重建質量使用峰值信噪比進行定量評估,同時運用超分辨率前后測試樣本的可視化進行定性評估,數(shù)據(jù)增強緩解了數(shù)據(jù)稀缺問題。當前生成對抗網(wǎng)絡的單幅圖像超分辨率算法從低分辨率圖像生成高分辨率圖像,獲得的圖像MOS 值比其他方法更加接近原始的高分辨率圖像。自注意力機制圖像超分辨率重建方法運用神經(jīng)網(wǎng)絡,提高了圖像重建質量,保障數(shù)據(jù)的傳輸安全。近年來,為了應對冠狀病毒大流行的保險體系開始引入X 光圖像檢測技術。X 光技術可以實現(xiàn)操作簡單、實時成像、追溯性強的獨特檢測效果。目前COVID-19患者數(shù)據(jù)的稀缺性,需要補充對非COVID-19 圖像的監(jiān)督預訓練,基于X 光圖像檢測數(shù)據(jù)的ML 方法預測COVID-19 死亡風險有助于提高醫(yī)療保險系統(tǒng)決策效率。COVID-19在本地圖像數(shù)據(jù)收集上訓練的病情評估具有良好的分布外泛化性。圖像數(shù)據(jù)增效為金融保險系統(tǒng)風險防控將迎來廣泛的應用前景。
為了應對金融系統(tǒng)風險,RFRP 管控應建立一個理論研究和管理實踐相結合的有機生態(tài)框架。這是管理科學的本質,也是信息技術的根本要求。近年來,應對RFRP 的金融科技監(jiān)管(Reg-Tech)已經(jīng)成為金融科技持續(xù)發(fā)展的重要話題。金融系統(tǒng)風險監(jiān)管是一項復雜的系統(tǒng)工程,需要一套在數(shù)據(jù)科學定量研究中綜合集成的政策工具箱。毋庸置疑,RFRP 的科學研究應是ML、行為監(jiān)管、微觀審慎、宏觀審慎的相互融合。然而,最優(yōu)政策選擇需要對成本和收益進行綜合評估。因此,對政策執(zhí)行效果評價是RFRP的重要范疇。多目標方法以及成本效益分析是解決未來RFRP 量化監(jiān)管深入研究的重要發(fā)展方向。