隨著大語(yǔ)言模型(簡(jiǎn)稱(chēng)“大模型”)技術(shù)發(fā)展,人工智能時(shí)代已逐漸從判別式AI走向生成式AI,各金融機(jī)構(gòu)紛紛積極探索大模型技術(shù)應(yīng)用場(chǎng)景。商業(yè)銀行在日常經(jīng)營(yíng)管理過(guò)程中,存在大量判別式AI任務(wù),通常需要建模工程師根據(jù)業(yè)務(wù)需求構(gòu)建機(jī)器學(xué)習(xí)模型。本文提出將生成式AI和判別式AI相融合的技術(shù)方案,利用大模型的推理能力對(duì)需求進(jìn)行拆解,自動(dòng)化地開(kāi)展判別式AI模型的構(gòu)建。實(shí)證結(jié)果表明,該方案在保證建模效果的同時(shí),能夠有效提升建模效率、降低成本,為商業(yè)銀行實(shí)現(xiàn)判別式AI模型構(gòu)建,積極推進(jìn)數(shù)字金融發(fā)展,提供了新的解決思路。
業(yè)務(wù)判別;在精準(zhǔn)營(yíng)銷(xiāo)方面,判別式AI模型為各層級(jí)客群的產(chǎn)品推薦、價(jià)值提升、流失預(yù)警等業(yè)務(wù)提供決策支持;在智慧經(jīng)營(yíng)和依法合規(guī)方面,針對(duì)機(jī)具設(shè)備布放優(yōu)化、客服運(yùn)營(yíng)問(wèn)題判別、制度分類(lèi)等場(chǎng)景,判別式AI模型也在持續(xù)發(fā)揮作用。
大模型技術(shù)通過(guò)其問(wèn)題理解和生成能力,能夠?yàn)樯虡I(yè)銀行智能風(fēng)控、精準(zhǔn)營(yíng)銷(xiāo)、智慧經(jīng)營(yíng)、依法合規(guī)等領(lǐng)域的判別式AI模型構(gòu)建與使用提供新技術(shù)方案。本文基于大模型實(shí)現(xiàn)判別式AI任務(wù),使用戶(hù)僅需運(yùn)用自然語(yǔ)言,無(wú)需人工編寫(xiě)代碼,即可完成判別式AI模型構(gòu)建,有效提升了建模效率、提高了建模質(zhì)量、降低了建模成本。
金融判別式AI的技術(shù)發(fā)展
金融永遠(yuǎn)不變的核心本質(zhì)是風(fēng)控,其實(shí)質(zhì)是運(yùn)用現(xiàn)代數(shù)字技術(shù)將數(shù)據(jù)算料通過(guò)算力、算法等新型基礎(chǔ)設(shè)施平臺(tái)加工成為智能,從而判別風(fēng)險(xiǎn),降低由業(yè)務(wù)參與各方信息不對(duì)稱(chēng)性帶來(lái)的業(yè)務(wù)不確定性。數(shù)字經(jīng)濟(jì)時(shí)代下,為快速實(shí)現(xiàn)數(shù)據(jù)價(jià)值的深度挖掘,加快銀行數(shù)字化轉(zhuǎn)型,商業(yè)銀行運(yùn)用人工智能機(jī)器學(xué)習(xí)技術(shù)防風(fēng)險(xiǎn)、拓市場(chǎng)、保合規(guī),實(shí)現(xiàn)經(jīng)營(yíng)管理的降本提質(zhì)增效,銀行已經(jīng)構(gòu)建了大量判別式AI模型,在智能風(fēng)控、精準(zhǔn)營(yíng)銷(xiāo)、智慧經(jīng)營(yíng)、依法合規(guī)等領(lǐng)域全面推進(jìn)數(shù)字金融發(fā)展。例如,在智能風(fēng)控方面,判別式AI模型廣泛應(yīng)用于信貸業(yè)務(wù)的反欺詐、反洗錢(qián)、風(fēng)險(xiǎn)評(píng)價(jià)、風(fēng)險(xiǎn)預(yù)警等
大模型在數(shù)字金融領(lǐng)域的應(yīng)用發(fā)展
近年來(lái),隨著生成式AI的不斷發(fā)展,大模型相關(guān)技術(shù)也在不斷升級(jí)迭代,持續(xù)助力金融領(lǐng)域的數(shù)字化轉(zhuǎn)型與智能化發(fā)展。目前,在數(shù)字金融領(lǐng)域的應(yīng)用過(guò)程中,所涉及的大模型相關(guān)技術(shù)主要包括提示詞工程(PromptEngineering)、檢索增強(qiáng)生成(Retrieval-AugmentedGeneration,RAG)和智能體(Agent)等。
提示詞工程是通過(guò)設(shè)計(jì)和優(yōu)化輸入內(nèi)容,引導(dǎo)大模型生成符合用戶(hù)需求的輸出,無(wú)需對(duì)大模型進(jìn)行調(diào)參。好的提示詞可以激發(fā)大模型在文本生成方面的創(chuàng)造力,發(fā)揮大模型的創(chuàng)作優(yōu)勢(shì)。提示詞工程在銀行數(shù)字金融領(lǐng)域的應(yīng)用場(chǎng)景豐富多樣,通過(guò)優(yōu)化提示詞設(shè)計(jì),能夠顯著提升大模型在不同業(yè)務(wù)領(lǐng)域的效率和準(zhǔn)確性。在辦公自動(dòng)化方面,用戶(hù)可以通過(guò)提示詞工程技術(shù),將生成會(huì)議紀(jì)要、演講稿等需求輸入給大模型,大模型依靠其強(qiáng)大生成能力為用戶(hù)提供相關(guān)文檔生成服務(wù),提升辦公效率。在產(chǎn)品創(chuàng)新方面,用戶(hù)可以通過(guò)提示詞工程技術(shù),將產(chǎn)品的內(nèi)容、優(yōu)化方向和市場(chǎng)需求等輸入給大模型,隨即大模型能夠生成產(chǎn)品優(yōu)化的建議以及相關(guān)說(shuō)明,助力銀行快速響應(yīng)市場(chǎng)需求進(jìn)行產(chǎn)品迭代創(chuàng)新。
RAG技術(shù)通過(guò)動(dòng)態(tài)檢索相關(guān)信息來(lái)增強(qiáng)語(yǔ)言模型的生成能力,提升內(nèi)容生成的準(zhǔn)確性和相關(guān)性。通過(guò)RAG技術(shù),能夠有效解決大模型在數(shù)字金融領(lǐng)域的知識(shí)局限性和幻覺(jué)問(wèn)題,同時(shí)保障數(shù)據(jù)安全。RAG技術(shù)在商業(yè)銀行各業(yè)務(wù)領(lǐng)域應(yīng)用廣泛。在運(yùn)營(yíng)管理智能客服場(chǎng)景中,以銀行產(chǎn)品信息和客服歷史回復(fù)相關(guān)數(shù)據(jù)形成向量數(shù)據(jù)庫(kù),當(dāng)用戶(hù)對(duì)產(chǎn)品進(jìn)行提問(wèn)時(shí),通過(guò)大模型RAG技術(shù)基于相關(guān)向量數(shù)據(jù)庫(kù)的信息進(jìn)行回復(fù),從而優(yōu)化服務(wù)質(zhì)量,提升客戶(hù)滿(mǎn)意度。在法律合規(guī)合同審查分析場(chǎng)景中,將業(yè)務(wù)部門(mén)送審文本、后臺(tái)儲(chǔ)存的歷史合同等信息構(gòu)建向量數(shù)據(jù)庫(kù),當(dāng)客戶(hù)有相關(guān)合規(guī)問(wèn)題時(shí),通過(guò)大模型RAG技術(shù)定位信息,生成符合銀行內(nèi)部數(shù)據(jù)邏輯的反饋。在普惠金融客戶(hù)營(yíng)銷(xiāo)篩選場(chǎng)景中,將客戶(hù)工商經(jīng)營(yíng)狀態(tài)、納稅狀態(tài)和社保繳納狀態(tài)等多源數(shù)據(jù)信息構(gòu)建向量數(shù)據(jù)庫(kù),當(dāng)需要對(duì)客戶(hù)進(jìn)行篩選時(shí),通過(guò)大模型RAG技術(shù)對(duì)向量數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行判斷,能有效過(guò)濾掉不滿(mǎn)足營(yíng)銷(xiāo)基本要求的客戶(hù)。
Agent是一個(gè)感知環(huán)境、處理信息并采取行動(dòng)以實(shí)現(xiàn)特定目標(biāo)的軟件程序或系統(tǒng),它能夠在金融領(lǐng)域?qū)崿F(xiàn)高效、精準(zhǔn)的業(yè)務(wù)處理和決策支持。一個(gè)Agent需要具備問(wèn)題拆解能力、根據(jù)環(huán)境調(diào)用相關(guān)工具作出策略的能力以及記憶能力。在風(fēng)險(xiǎn)管理場(chǎng)景中,利用Agent問(wèn)題拆解能力對(duì)風(fēng)險(xiǎn)預(yù)測(cè)任務(wù)進(jìn)行規(guī)劃,使用數(shù)據(jù)分析工具對(duì)用戶(hù)的信用數(shù)據(jù)和市場(chǎng)動(dòng)態(tài)進(jìn)行實(shí)時(shí)分析,準(zhǔn)確預(yù)測(cè)相關(guān)風(fēng)險(xiǎn),提升風(fēng)險(xiǎn)防控能力。在工單智能分析場(chǎng)景中,利用Agent問(wèn)題拆解能力對(duì)工單異常原因分析報(bào)告生成任務(wù)進(jìn)行規(guī)劃,使用數(shù)據(jù)分析工具對(duì)異常工單進(jìn)行分析,生成話務(wù)工單異常原因分析報(bào)告,提升工作效率與決策質(zhì)量。在資產(chǎn)配置和產(chǎn)品組合場(chǎng)景中,利用Agent問(wèn)題拆解能力對(duì)合理資產(chǎn)配置任務(wù)進(jìn)行規(guī)劃,使用數(shù)據(jù)查詢(xún)和分析工具對(duì)客戶(hù)的風(fēng)險(xiǎn)偏好、持倉(cāng)歷史及產(chǎn)品收益表現(xiàn)等信息進(jìn)行分析,實(shí)現(xiàn)自動(dòng)化、智能化的資產(chǎn)規(guī)劃、配置比例以及持倉(cāng)診斷,為客戶(hù)量身定制專(zhuān)業(yè)、合理的資產(chǎn)配置方案。
大模型實(shí)現(xiàn)判別式AI應(yīng)用研究
技術(shù)總體方案
本研究依托一個(gè)基礎(chǔ)大模型,結(jié)合提示詞工程和RAG技術(shù)打造一個(gè)可以進(jìn)行自動(dòng)化構(gòu)建判別式AI的Agent。該Agent實(shí)現(xiàn)判別式AI模型構(gòu)建的具體流程如下。
首先基于特征數(shù)據(jù)及其元數(shù)據(jù)構(gòu)建支撐RAG檢索的增強(qiáng)知識(shí)庫(kù),然后根據(jù)建模工程師的經(jīng)驗(yàn)構(gòu)建提示詞模板,提示詞中應(yīng)當(dāng)包括客戶(hù)期望對(duì)數(shù)據(jù)的處理方法、構(gòu)建模型期望選用的算法和模型評(píng)估指標(biāo)等信息,用戶(hù)只需要與大模型進(jìn)行自然語(yǔ)言交互請(qǐng)求大模型執(zhí)行建模任務(wù),大模型即可自動(dòng)將任務(wù)進(jìn)行拆解,根據(jù)具體問(wèn)題進(jìn)行思考,編寫(xiě)相應(yīng)的數(shù)據(jù)讀取、數(shù)據(jù)處理、模型構(gòu)建、模型評(píng)估等代碼,而后調(diào)用本地代碼解釋器完成代碼運(yùn)行,得到建模結(jié)果,最后完成整個(gè)建模任務(wù),并將模型評(píng)估指標(biāo)返回給用戶(hù)。具體的流程如圖1所示。
場(chǎng)景描述
一家企業(yè)決定關(guān)閉或停正營(yíng)業(yè)時(shí),通常會(huì)經(jīng)歷一個(gè)正式的法律程序,即“注銷(xiāo)”。這不僅表明該企業(yè)將不再繼續(xù)參與市場(chǎng)競(jìng)爭(zhēng),同時(shí)也意味著它可能會(huì)給債權(quán)人帶來(lái)經(jīng)濟(jì)損失。從商業(yè)銀行的視角而言,如果貸款對(duì)象出現(xiàn)企業(yè)注銷(xiāo)的情況,則極有可能導(dǎo)致不良貸款的發(fā)生。鑒于此,構(gòu)建企業(yè)注銷(xiāo)風(fēng)險(xiǎn)預(yù)測(cè)模型可以有效識(shí)別具有潛在風(fēng)險(xiǎn)的客戶(hù),并采取預(yù)防措施,降低風(fēng)險(xiǎn)。本文以北京地區(qū)新一代信息技術(shù)產(chǎn)業(yè)企業(yè)為例,旨在基于大模型技術(shù)實(shí)現(xiàn)金融判別式AI,構(gòu)建企業(yè)注銷(xiāo)風(fēng)險(xiǎn)預(yù)測(cè)模型。
本文所使用的數(shù)據(jù)集包含8個(gè)自變量和1個(gè)因變量(是否為注銷(xiāo)企業(yè)),樣本量為2433,其中壞樣本(即注銷(xiāo)企業(yè))占比為 19% 。建模數(shù)據(jù)具體的自變量名稱(chēng)如表1所示。
建模效果評(píng)估
本文通過(guò)上述構(gòu)建的大模型Agent實(shí)現(xiàn)了判別式AI模型構(gòu)建。首先面向?qū)挶頂?shù)據(jù)加工及其元數(shù)據(jù)構(gòu)建RAG知識(shí)庫(kù),然后通過(guò)提示詞工程向大模型發(fā)送指令,讓其根據(jù)數(shù)據(jù)及業(yè)務(wù)描述進(jìn)行數(shù)據(jù)處理,并構(gòu)建判別式AI模型(本研究指定構(gòu)建邏輯回歸、決策樹(shù)、隨機(jī)森林和GBDT算法模型),提示詞中同時(shí)包含了期望使用的模型評(píng)估指標(biāo)(由于本研究應(yīng)用場(chǎng)景是判別式AI分類(lèi)任務(wù),故使用AUC、KS、Recall和Precision作為模型評(píng)估指標(biāo))。而后,大模型根據(jù)強(qiáng)大的推理能力對(duì)需求進(jìn)行拆分,完成相關(guān)代碼編寫(xiě),并調(diào)用本地代碼解釋器自動(dòng)化運(yùn)行,得到建模結(jié)果。最后,大模型將結(jié)果以表格的形式輸出給用戶(hù)。各個(gè)模型的建模結(jié)果如表2所示。
實(shí)證結(jié)果顯示,通過(guò)大模型技術(shù)構(gòu)建的判別式AI模型在保證建模效果的同時(shí),具有以下優(yōu)勢(shì):
建模效率提升與成本節(jié)省。在傳統(tǒng)建模過(guò)程中,大量的人力成本被用于模型構(gòu)建等重復(fù)性工作,通過(guò)引入大模型技術(shù),這些任務(wù)實(shí)現(xiàn)了自動(dòng)化處理,從而提升建模效率。經(jīng)測(cè)算,運(yùn)用大模型技術(shù)實(shí)現(xiàn)判別式AI模型構(gòu)建可提升工作效率約 30% 。未來(lái),商業(yè)銀行基于大模型技術(shù)廣泛構(gòu)建各業(yè)務(wù)條線所需要的大量判別式AI模型,將會(huì)有效節(jié)省人力成本,實(shí)現(xiàn)可觀的經(jīng)濟(jì)效益。
提升建模工程師的建模質(zhì)量。在傳統(tǒng)建模過(guò)程中,建模工程師的能力水平參差不齊,導(dǎo)致所構(gòu)建的模型質(zhì)量存在差異。通過(guò)大模型技術(shù)實(shí)現(xiàn)判別式AI模型構(gòu)建能夠建立標(biāo)準(zhǔn)化的建模流程,有效提升建模的整體質(zhì)量,從而減少因個(gè)人能力差異導(dǎo)致的模型效果不佳等問(wèn)題。
解放建模工程師的“雙手”,實(shí)現(xiàn)算法提質(zhì)。通過(guò)大模型技術(shù)實(shí)現(xiàn)判別式AI模型構(gòu)建,不僅提升了建模效率和質(zhì)量,還能解放建模工程師的“雙手”,從而使建模工程師有更多的時(shí)間和精力去深人理解數(shù)據(jù)邏輯和業(yè)務(wù)邏輯。通過(guò)大模型技術(shù)實(shí)現(xiàn)判別式AI模型構(gòu)建,可以構(gòu)建大部分經(jīng)典機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型,建模工程師可以將更多的時(shí)間用于研發(fā)新的模型和相關(guān)算法,提升建模工程師的整體技術(shù)和業(yè)務(wù)水平,更進(jìn)一步提升算法建模的質(zhì)量。
結(jié)語(yǔ)
本文基于大模型技術(shù)能力,結(jié)合提示詞工程與RAG等技術(shù),打造了自動(dòng)構(gòu)建判別式AI模型的Agent,它能夠有效分析用戶(hù)需求,自動(dòng)完成數(shù)據(jù)拆解、建模代碼編寫(xiě)和代碼調(diào)用。實(shí)證結(jié)果表明,使用大模型技術(shù)實(shí)現(xiàn)的判別式AI模型與建模工程師構(gòu)建的模型效果一致。同時(shí),基于大模型的技術(shù)方案能夠提升建模效率,節(jié)省人力成本,降低代碼編寫(xiě)的錯(cuò)誤率,提高建模質(zhì)量,促進(jìn)建模工程師提升對(duì)數(shù)據(jù)與業(yè)務(wù)的理解以及提升算法研究能力水平。大模型實(shí)現(xiàn)判別式AI的應(yīng)用前景廣闊,隨著人工智能技術(shù)的持續(xù)進(jìn)步,未來(lái)將進(jìn)一步探索大模型實(shí)現(xiàn)判別式AI相關(guān)技術(shù),例如,使用大模型提取或生成高質(zhì)量的數(shù)據(jù)特征和樣本,以提升模型構(gòu)建效果;使用知識(shí)蒸餾技術(shù),以提升機(jī)器學(xué)習(xí)模型的可解釋性。相關(guān)研發(fā)將有助于更好地賦能商業(yè)銀行判別式AI建模場(chǎng)景,推進(jìn)數(shù)字金融新發(fā)展。
(本文受北京市科技計(jì)劃項(xiàng)目[Z241100001324024]支持。)
(華夏銀行數(shù)字金融管理部劉小偉,龍盈智達(dá)[北京]科技有限公司徐奇、張?jiān)隆铊?、馮琳和曹曉峰,百碩同興科技〔北京]有限公司余浩和林建軍,以及北京智譜華章科技有限公司薛大山和王海強(qiáng)對(duì)本文亦有貢獻(xiàn))
(作者單位:華夏銀行股份有限公司)