鐵 錦 程
(上海浦東發(fā)展銀行 上海 200120)
風(fēng)險(xiǎn)控制是信用卡業(yè)務(wù)發(fā)展的核心,隨著大數(shù)據(jù)、人工智能等技術(shù)的發(fā)展,大數(shù)據(jù)風(fēng)控研究成為各金融機(jī)構(gòu)的研究熱點(diǎn)。大數(shù)據(jù)風(fēng)控以數(shù)據(jù)驅(qū)動(dòng)風(fēng)險(xiǎn)決策,全面挖掘數(shù)據(jù)價(jià)值,提升客戶風(fēng)險(xiǎn)識別能力,對數(shù)據(jù)、算法、算力有較高的要求。隨著數(shù)據(jù)爆炸式增長,對算力、算法的要求越來越高,而摩爾定律趨于失效又使經(jīng)典計(jì)算的算力難以突破,計(jì)算資源的限制成為大數(shù)據(jù)技術(shù)持續(xù)深入應(yīng)用的瓶頸[1-2]。量子計(jì)算在特定場景下具有遠(yuǎn)超經(jīng)典計(jì)算機(jī)的計(jì)算能力[3]。各金融機(jī)構(gòu)都在積極探索量子計(jì)算在數(shù)字化轉(zhuǎn)型中的應(yīng)用,以求在新時(shí)代搶占新的競爭制高點(diǎn)。
量子計(jì)算以量子比特為基本單元,可實(shí)現(xiàn)并行計(jì)算、指數(shù)級計(jì)算加速,能夠?yàn)榻鹑陬I(lǐng)域的數(shù)字化轉(zhuǎn)型提供新的解決方案。近來量子計(jì)算發(fā)展火熱,2020年10月16日下午,中共中央政治局就量子科技研究和應(yīng)用前景舉行第二十四次集體學(xué)習(xí)。習(xí)近平總書記在主持學(xué)習(xí)時(shí)強(qiáng)調(diào):“當(dāng)今世界正經(jīng)歷百年未有之大變局,科技創(chuàng)新是其中一個(gè)關(guān)鍵變量。我們要于危機(jī)中育先機(jī),于變局中開新局,必須向科技創(chuàng)新要答案。要充分認(rèn)識推動(dòng)量子科技發(fā)展的重要性和緊迫性,加強(qiáng)量子科技發(fā)展戰(zhàn)略謀劃和系統(tǒng)布局,把握大趨勢,下好先手棋?!?021年3月《中華人民共和國國民經(jīng)濟(jì)和社會(huì)發(fā)展第十四個(gè)五年規(guī)劃和2035年遠(yuǎn)景目標(biāo)綱要》提出“打造數(shù)字經(jīng)濟(jì)新優(yōu)勢”“加快布局量子計(jì)算、量子通信、神經(jīng)芯片、DNA存儲等前沿技術(shù)”。2022年10月4日,阿蘭·阿斯佩、約翰·克勞澤和安東·塞林格三位量子信息科學(xué)領(lǐng)域的科學(xué)家獲得了2022年諾貝爾物理學(xué)獎(jiǎng),使量子計(jì)算受到社會(huì)各界的矚目,標(biāo)志著量子計(jì)算已進(jìn)入各領(lǐng)域開展應(yīng)用探索。
本文研究量子算法與經(jīng)典計(jì)算機(jī)算法相融合的方法,提升貸前審批決策組合優(yōu)化問題的計(jì)算性能,探索量子計(jì)算解決實(shí)際金融業(yè)務(wù)的新方法,為量子計(jì)算大規(guī)模應(yīng)用于金融業(yè)務(wù)積累經(jīng)驗(yàn)。通過Grover自適應(yīng)搜索算法,優(yōu)化“群內(nèi)同質(zhì)、群間異構(gòu)”客群篩選方法,通過超啟發(fā)算法和量子貝葉斯網(wǎng)絡(luò)相結(jié)合,優(yōu)化客群組合優(yōu)化的方法?;?0 bit超導(dǎo)量子真機(jī)完成驗(yàn)證,計(jì)算性能提升明顯。同時(shí),經(jīng)典-量子融合算法擴(kuò)大策略搜索空間,提升業(yè)務(wù)效果。
量子計(jì)算以量子比特為基本單元,利用量子疊加、量子糾纏等基本原理,可實(shí)現(xiàn)并行計(jì)算、指數(shù)級計(jì)算加速。同時(shí)量子計(jì)算具有天然的矩陣操作特性,能夠提供新的計(jì)算方式,將有助于增強(qiáng)模型的計(jì)算效能,開拓新的算法領(lǐng)域。近年來,在量子計(jì)算軟硬件方面的研究也取得了突破:2019年1月,IBM發(fā)布了世界上第一臺獨(dú)立的量子計(jì)算機(jī)IBMQSystemOne。2019年10月,谷歌發(fā)布53位量子芯片“懸鈴木”,宣稱“量子霸權(quán)”。2020年—2021年,中科大成功構(gòu)建76個(gè)光子的量子計(jì)算原型機(jī)“九章”和62 bit可編程超導(dǎo)量子計(jì)算原型機(jī)“祖沖之號”。2021年12月,IBM發(fā)布128個(gè)量子比特的超導(dǎo)量子計(jì)算機(jī)“Eagle”。2022年11月9日,IBM發(fā)布433 bit量子計(jì)算機(jī)魚鷹“Osprey”。
金融行業(yè)是量子計(jì)算較早取得應(yīng)用進(jìn)展的領(lǐng)域,當(dāng)前已處于實(shí)用化優(yōu)勢探索階段[4]。量子金融涉及銀行、券商、保險(xiǎn)公司、交易所等主要金融參與機(jī)構(gòu),涵蓋金融風(fēng)險(xiǎn)控制、投資優(yōu)化組合、金融衍生品定價(jià)、量化交易等在內(nèi)的重要應(yīng)用領(lǐng)域,在許多實(shí)際問題上取得了重要的理論和算法研究進(jìn)展[5]。
當(dāng)前,國內(nèi)多家銀行也已布局量子計(jì)算研究應(yīng)用,以提升銀行智能金融服務(wù)的數(shù)字化水平和響應(yīng)速度。工商銀行于2015年起率先實(shí)現(xiàn)基于量子通信技術(shù)的同城和異地?cái)?shù)據(jù)加密傳輸,并在電子檔案、網(wǎng)上銀行等領(lǐng)域落地試點(diǎn)。建信金科建立了量子金融應(yīng)用實(shí)驗(yàn)室,研究量子金融算法,如“量子期權(quán)定價(jià)算法”和“量子風(fēng)險(xiǎn)價(jià)值計(jì)量算法”,并探索量子金融的應(yīng)用落地。華夏銀行[6]將量子神經(jīng)網(wǎng)絡(luò)技術(shù)應(yīng)用于ATM機(jī)具管理的智能決策問題上,獲得人民銀行“2020年金融科技發(fā)展獎(jiǎng)一等獎(jiǎng)”。
信用卡貸前審批是指綜合運(yùn)用各方面數(shù)據(jù),決定客戶是否準(zhǔn)入以及如何授信。為了提高風(fēng)險(xiǎn)識別能力,確保在可容忍的風(fēng)險(xiǎn)水平下,盡可能多地獲客,通常需要利用豐富的數(shù)據(jù),結(jié)合評分模型、客戶分群等手段,實(shí)現(xiàn)客戶風(fēng)險(xiǎn)分層、分群識別、差異化準(zhǔn)入。
本文探索基于數(shù)據(jù)驅(qū)動(dòng)和智能算法來優(yōu)化審批決策。主要分為三個(gè)步驟:(1) 通過風(fēng)險(xiǎn)評分模型確定客戶風(fēng)險(xiǎn)標(biāo)尺,確定客戶風(fēng)險(xiǎn)分層,完成客戶風(fēng)險(xiǎn)第一層篩選;(2) 根據(jù)客戶各方面的特征,通過隨機(jī)森林算法將剩余客戶分為近萬個(gè)風(fēng)險(xiǎn)同質(zhì)小客群;(3) 通過對近萬個(gè)小客群進(jìn)行篩選、組合、測算,確??腿骸叭簝?nèi)同質(zhì)、群間異構(gòu)”,并獲取審批率最高、逾期率最低的組合最優(yōu)解,以達(dá)到風(fēng)控要求和獲客預(yù)期。流程如圖1所示。
圖1 最優(yōu)策略組合生成流程
目標(biāo)函數(shù):
審批率:X=φ(S_i,S_j,L_i,L_j)
逾期率:Y=ω(S_i,S_j,L_i,L_j)
max[φ(S_i,S_j,L_i,L_j)-ω(S_i,S_j,L_i,L_j)]
高低風(fēng)險(xiǎn)評分閾值:(S_i=,S_j=)
高低風(fēng)險(xiǎn)客群規(guī)則集:(L_i={},L_j={})
限制條件:
X≥目標(biāo)審批率,Y≤目標(biāo)逾期率
s.t. 0 L_i?(L_1,L_2,…,L_n) L_j?(L_1,L_2,…,L_n) 函數(shù)說明: φ(S_i,S_j,L_i,L_j):以高低風(fēng)險(xiǎn)評分閾值和高低風(fēng)險(xiǎn)規(guī)則集為變量,求解相應(yīng)客群審批率的函數(shù)。 ω(S_i,S_j,L_i,L_j):以高低風(fēng)險(xiǎn)評分閾值和高低風(fēng)險(xiǎn)規(guī)則集為變量,求解相應(yīng)客群逾期率的函數(shù)。 1) 客群“群內(nèi)同質(zhì)”:低風(fēng)險(xiǎn)客群:盡量都是優(yōu)質(zhì)客戶(審批率高、逾期率低),該客群用戶的審批結(jié)果傾向于“通過審批”;高風(fēng)險(xiǎn)客群:盡量都是高風(fēng)險(xiǎn)客戶(逾期率高、審批率低),該客群用戶的審批結(jié)果傾向于“拒絕審批”。 2) 客群“群間異構(gòu)”:兩個(gè)審批策略對應(yīng)的客群重疊人數(shù)少(重疊率=兩客群交集人數(shù)/兩客群并集人數(shù))。 隨著數(shù)據(jù)量的爆炸式增長,客戶各方面的數(shù)據(jù)急劇增多,該方法能夠更充分利用客戶隱藏的、稀疏的數(shù)據(jù),有利于應(yīng)對快速變化的風(fēng)險(xiǎn)形勢。但是,對客群規(guī)則進(jìn)行篩選、組合、測算,涉及大量計(jì)算,對算力要求極高,傳統(tǒng)計(jì)算方法難以實(shí)現(xiàn)。 信用卡審批策略的組合優(yōu)化問題需要決策是否選取每一個(gè)策略,即每個(gè)策略對應(yīng)一個(gè)0-1決策變量,即選取或不選取。因此該問題的解空間就是全部0-1變量的所有組合。每種不同的決策組合都會(huì)得到一個(gè)目標(biāo)函數(shù)值,這個(gè)目標(biāo)函數(shù)就是優(yōu)化的對象。 使用常規(guī)統(tǒng)計(jì)方法篩選信用卡審批策略只能根據(jù)該策略對應(yīng)客群的審批率與逾期率表現(xiàn)進(jìn)行判斷,即目標(biāo)函數(shù)為線性函數(shù)。根據(jù)信用卡審批策略的篩選經(jīng)驗(yàn),常規(guī)統(tǒng)計(jì)方法只能剔除60%的無效策略,無法直接剔除相似度高的策略。 當(dāng)目標(biāo)函數(shù)考慮總體策略相似度時(shí),該目標(biāo)函數(shù)變?yōu)橐粋€(gè)二次函數(shù),則該問題性質(zhì)變?yōu)槎螣o約束二進(jìn)制優(yōu)化問題(QUBO),QUBO問題是一個(gè)NP-hard問題,隨著策略數(shù)量的增多,計(jì)算所需時(shí)間呈指數(shù)級上升[7]。例如從1 000個(gè)策略中進(jìn)行篩選,最多需要迭代計(jì)算21 000次,所需計(jì)算量大,計(jì)算時(shí)間長。 針對信用卡審批策略組合優(yōu)化的難點(diǎn),本文提出綜合利用機(jī)器學(xué)習(xí)算法、運(yùn)籌優(yōu)化算法、量子計(jì)算與量子算法的解決方案。其中:機(jī)器學(xué)習(xí)算法用于劃分出大量風(fēng)險(xiǎn)同質(zhì)細(xì)分客群;運(yùn)籌優(yōu)化算法用于來快速尋找最佳的客群組合方案,并快速求解得到符合整體業(yè)務(wù)目標(biāo)的客群組合;量子計(jì)算用于提升客群組合逾期率和審核率的測算速度,從而提升整體優(yōu)化算法的計(jì)算時(shí)間,在更短時(shí)間內(nèi)找到更好的組合方案。 主要步驟如圖2所示。 圖2 基于量子計(jì)算的貸前審批策略組合優(yōu)化方案 利用客戶基本信息、收入、職業(yè)、共債、履約等信息,建立隨機(jī)森林模型,將樹模型轉(zhuǎn)化成客戶分群規(guī)則,將客戶劃分為極細(xì)的風(fēng)險(xiǎn)同質(zhì)客群。隨機(jī)森林中決策樹的數(shù)量大,因此能夠生成數(shù)萬條分群規(guī)則,大大提升客群的數(shù)量與精細(xì)化程度,從而充分利用多個(gè)小客群的長尾效應(yīng),對客戶進(jìn)行更全面的風(fēng)險(xiǎn)識別。 隨機(jī)森林產(chǎn)出的大量分群規(guī)則需要按照確??腿骸叭簝?nèi)同質(zhì)、群間異構(gòu)”原則進(jìn)行篩選,一方面需要保證對應(yīng)客群內(nèi)的審批率高或逾期率高,另一方面需要減少不同客群規(guī)則之間的相似程度[8]。 GAS算法步驟示意圖如圖3所示,該算法迭代地應(yīng)用Grover Search來找到目標(biāo)函數(shù)的最佳值,通過使用前一次運(yùn)行中的已知最優(yōu)值作為閾值。GAS算法中使用自適應(yīng)預(yù)言機(jī),識別所有高于或低于當(dāng)前閾值的值(分別為最大值和最小值),每次迭代閾值更新時(shí)都會(huì)減小搜索空間的大小,直到找到最優(yōu)值。 圖3 GAS算法步驟示意圖 針對客群組合的可能性多的難點(diǎn),本文不會(huì)遍歷所有的規(guī)則組合可能性,而是采用超啟發(fā)式優(yōu)化算法、進(jìn)行優(yōu)化計(jì)算。超啟發(fā)式優(yōu)化算法是一種具有頂層策略的啟發(fā)式優(yōu)化算法,能夠識別不同階段的優(yōu)化計(jì)算瓶頸,從而調(diào)用不同的、有針對性的優(yōu)化算法,最終快速、高效地找到最優(yōu)的規(guī)則組合。 本文方案的模型框架如圖4所示。 圖4 混合量子-經(jīng)典優(yōu)化算法框架 基本思路:采用混合量子-經(jīng)典算法,作為求解優(yōu)化問題的算法架構(gòu),在借助經(jīng)典計(jì)算機(jī)力量的同時(shí),盡可能發(fā)揮量子計(jì)算機(jī)的能力去解決具體優(yōu)化問題。經(jīng)典計(jì)算部分的作用主要有兩方面:(1) 用于串聯(lián)業(yè)務(wù)數(shù)據(jù)與量子算法、記錄最優(yōu)結(jié)果、確定優(yōu)化路徑、識別最優(yōu)規(guī)則組合;(2) 串聯(lián)量子算法與經(jīng)典運(yùn)籌算法的輸入和輸出,形成經(jīng)典算法與量子算法閉環(huán)回路,并結(jié)合經(jīng)典運(yùn)籌算法,利用量子算法的輸出數(shù)據(jù),對業(yè)務(wù)場景問題進(jìn)行優(yōu)化求解。 主要步驟有:(1) 制定超啟發(fā)式算法策略,超啟發(fā)式算法提供了某種高層策略(High-Level Strategy,HLS),通過操縱或管理一組低層啟發(fā)式算法(Low-Level Heuristics,LLH)[10],以獲得新啟發(fā)式算法。(2) 量子數(shù)據(jù)轉(zhuǎn)換,使用變分嵌入方法將組合數(shù)據(jù)轉(zhuǎn)化為量子數(shù)據(jù),將經(jīng)典數(shù)據(jù)作為量子線路的參數(shù),將數(shù)據(jù)歸一化處理到[0,π/2]區(qū)間,再作為量子線路的部分參數(shù)進(jìn)行量子寫入,使用固定的變分線路編碼數(shù)據(jù)。(3) 利用量子貝葉斯網(wǎng)絡(luò)計(jì)算關(guān)鍵指標(biāo)(逾期率和審批率)。通過業(yè)務(wù)目標(biāo)確定具體目標(biāo)函數(shù),并通過設(shè)計(jì)數(shù)學(xué)中的等價(jià)變化,調(diào)整目標(biāo)函數(shù)形式,保證函數(shù)的可以在量子計(jì)算機(jī)上通過測量高效計(jì)算[7,11]。(4) 對比不同迭代結(jié)果所對應(yīng)的指標(biāo)值,保留更優(yōu)客群組合,最終獲取審批策略的近似最優(yōu)組合。 從線下客戶申請的歷史數(shù)據(jù)中抽樣,形成客群組合樣本及該樣本對應(yīng)的審批率與逾期率,樣本數(shù)量共有20萬條。原始?xì)v史數(shù)據(jù)共包含509 095條客戶樣本數(shù)據(jù),其中386 997條樣本為審批通過樣本,審批通過的樣本中包含294條逾期樣本?;?2 bit超導(dǎo)量子計(jì)算機(jī)完成量子計(jì)算實(shí)驗(yàn)。 通過使用歷史數(shù)據(jù)訓(xùn)練隨機(jī)森林模型,并將隨機(jī)森林中的多決策樹拆解為客群規(guī)則,共生成超過10 000個(gè)風(fēng)險(xiǎn)同質(zhì)客群。 在量子真機(jī)的輔助下,規(guī)則篩選速度呈指數(shù)級大幅提升。在20 bit量子真機(jī)下,僅需1 253次即可完成有效規(guī)則篩選,而經(jīng)典計(jì)算需要220次搜索。 4.3.1貝葉斯網(wǎng)絡(luò)訓(xùn)練 根據(jù)篩選規(guī)則組合的可能性進(jìn)行抽樣,對每種可能性對應(yīng)的客群審批率與逾期率進(jìn)行統(tǒng)計(jì),得到20萬條數(shù)據(jù)。使用該數(shù)據(jù)集訓(xùn)練貝葉斯網(wǎng)絡(luò),學(xué)習(xí)每個(gè)節(jié)點(diǎn)的概率分布,同時(shí)開發(fā)量子態(tài)的概率幅與概率幅進(jìn)行加減乘除運(yùn)算的量子電路。表1為訓(xùn)練樣本示例。 表1 貝葉斯網(wǎng)絡(luò)訓(xùn)練樣本數(shù)據(jù) 4.3.2量子貝葉斯網(wǎng)絡(luò)構(gòu)建 圖5展示了最終搭建的量子貝葉斯網(wǎng)絡(luò)電子線路的4個(gè)節(jié)點(diǎn)。 圖5 量子貝葉斯網(wǎng)絡(luò)電路 4.3.3量子貝葉斯網(wǎng)絡(luò)拓展 由于目前量子真機(jī)僅支持20 bit,而本文研究最終需要使用的規(guī)則數(shù)高達(dá)180條,故需要將貝葉斯網(wǎng)絡(luò)進(jìn)行拓展。拓展思路如下:將180個(gè)節(jié)點(diǎn)的量子貝葉斯網(wǎng)絡(luò),切分為若干個(gè)子網(wǎng)絡(luò),每個(gè)子網(wǎng)絡(luò)的節(jié)點(diǎn)數(shù)量控制在20個(gè)之內(nèi),利用量子真機(jī)單獨(dú)計(jì)算每個(gè)子網(wǎng)絡(luò);然后將每個(gè)子網(wǎng)絡(luò)輸出的結(jié)果作為虛擬節(jié)點(diǎn),即中間概率;最后將這些虛擬節(jié)點(diǎn)和“審批率”“逾期率”作為最終的結(jié)果網(wǎng)絡(luò),從而進(jìn)行最終的計(jì)算。圖6為貝葉斯網(wǎng)絡(luò)拆分的示意圖,該拓展方案的目標(biāo)是在盡可能保證180節(jié)點(diǎn)的模型效果的前提下,盡最大可能發(fā)揮量子真機(jī)優(yōu)勢。 圖6 貝葉斯網(wǎng)絡(luò)拆分示意圖 4.3.4量子貝葉斯算法效果 在20個(gè)客群(量子貝葉斯子網(wǎng)絡(luò))下,以全局遍歷算法為基準(zhǔn),量子貝葉斯算法準(zhǔn)確率達(dá)到了99.5%。 基于20 bit超導(dǎo)量子計(jì)算機(jī),對客群數(shù)量為20和180個(gè)分別進(jìn)行驗(yàn)證,如表2、表3所示,最終得到的審批率、逾期率與傳統(tǒng)方法的對比??梢钥吹皆陲L(fēng)險(xiǎn)降低的情況下,實(shí)現(xiàn)了審批率的提升。規(guī)則數(shù)越多,效果提升越明顯,預(yù)估隨著量子計(jì)算機(jī)bit位越來越高,時(shí)間性能和業(yè)務(wù)效果增益將更加明顯。 表2 20個(gè)客群的效果對比 表3 180個(gè)客群的效果對比 量子計(jì)算機(jī)與量子算法憑借獨(dú)有的優(yōu)勢在金融行業(yè)的各領(lǐng)域展現(xiàn)出巨大的應(yīng)用前景。本文引入量子貝葉斯網(wǎng)絡(luò)能夠支持更多節(jié)點(diǎn)的大規(guī)模網(wǎng)絡(luò)模型,而且能夠充分發(fā)揮量子計(jì)算并行計(jì)算的優(yōu)勢。研究量子算法和經(jīng)典計(jì)算機(jī)算法相結(jié)合的混合算法,探索出一條量子計(jì)算機(jī)應(yīng)用于金融業(yè)務(wù)場景的有效路徑?;?0 bit超導(dǎo)量子計(jì)算機(jī),完成優(yōu)化方法的效果驗(yàn)證,提升計(jì)算性能,實(shí)現(xiàn)審批率的提升和逾期率的下降,達(dá)到了預(yù)期的目的。通過實(shí)踐證明量子計(jì)算在金融業(yè)務(wù)有較好的應(yīng)用前景,值得深入研究和應(yīng)用。 受限于當(dāng)前量子比特?cái)?shù)目有限,本文研究的混合算法暫時(shí)難以處理成千上萬級別的客群組合優(yōu)化。然而,隨著量子計(jì)算機(jī)的快速發(fā)展、量子比特?cái)?shù)的不斷增加,本文方法將進(jìn)一步在信用卡等金融領(lǐng)域的各組合優(yōu)化場景相結(jié)合,為金融機(jī)構(gòu)在價(jià)值分析、風(fēng)險(xiǎn)防控等方面提供更高效的解決方案。2.2 面臨的難點(diǎn)分析
3 基于量子計(jì)算的貸前審批決策方案
3.1 隨機(jī)森林產(chǎn)出分群規(guī)則
3.2 分群規(guī)則初篩
3.3 尋找近似最優(yōu)客群組合
4 基于量子計(jì)算的審批決策驗(yàn)證分析
4.1 隨機(jī)森林生成規(guī)則效果
4.2 GAS規(guī)則篩選效果
4.3 量子貝葉斯效果
4.4 整體方案優(yōu)化效果
5 結(jié) 語