將大語言模型深入應(yīng)用于信用行業(yè)是做好數(shù)字金融這篇大文章的重要實踐。但大模型在信用領(lǐng)域的適用仍是新嘗試,能否從制度層面搭建具前瞻性的監(jiān)管框架,引導(dǎo)市場化主體通過市場化手段在發(fā)展中自主解決模型公平性、模型歧視等問題,是決定大模型能否可持續(xù)高質(zhì)量發(fā)展的重要因素。
信用是現(xiàn)代經(jīng)濟社會發(fā)展的基石,完善的信用體系是現(xiàn)代經(jīng)濟社會實現(xiàn)高質(zhì)量發(fā)展的重要基礎(chǔ)之一。受益于人工智能數(shù)十年的積累,憑借高效地處理各類結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)的優(yōu)勢,大語言模型正在成為人工智能發(fā)展的新熱潮,為推動大數(shù)據(jù)場景化應(yīng)用、創(chuàng)新信用服務(wù)模式提供了新的技術(shù)支持,并為解決信用信息失真、提升信用功能效益提供了新方法、新實踐。但大語言模型在信用領(lǐng)域的探索應(yīng)用仍然處在起步發(fā)展的初期階段,依然面臨諸多挑戰(zhàn),需要通過在推動數(shù)據(jù)合作與共享、加強數(shù)據(jù)標準建設(shè)、夯實數(shù)據(jù)治理與安全保障體系建設(shè)、推動產(chǎn)學(xué)研用深度融合發(fā)展等方面持續(xù)發(fā)力,在加強隱私安全保護前提下,形成與人類價值觀對齊的大模型信用評級體系。
大語言模型與信用雙循環(huán)賦能
目前多數(shù)主流模型采用Transformer架構(gòu),這種架構(gòu)大大提高了模型理解復(fù)雜語言結(jié)構(gòu)的能力。但特定應(yīng)用場景還需要進行專項預(yù)訓(xùn)練與微調(diào)以適應(yīng)特定領(lǐng)域或任務(wù),與此同時,研發(fā)處理上下文學(xué)習(xí)和多任務(wù)學(xué)習(xí)能力也很重要。這些技術(shù)原理使大語言模型能夠理解和生成人類語言,執(zhí)行各種復(fù)雜的語言任務(wù),并在多個領(lǐng)域展現(xiàn)出強大的應(yīng)用潛力。
中央金融工作會議提出做好數(shù)字金融等五篇大文章,對數(shù)字金融高質(zhì)量發(fā)展提出了新要求。大語言模型技術(shù)具備強大的數(shù)據(jù)處理能力和復(fù)雜的算法結(jié)構(gòu),將該技術(shù)深人應(yīng)用于信用行業(yè)是做好數(shù)字金融這篇大文章的重要實踐。近年來,信用領(lǐng)域積極探索并高度重視大模型的實踐應(yīng)用,為信用質(zhì)量評估、風(fēng)險預(yù)測和應(yīng)急處置提供快速分析與輔助決策,助力實現(xiàn)高質(zhì)量信用體系建設(shè),已初步取得積極成效,具體體現(xiàn)在:
多模態(tài):文本、圖像、視頻、聲音融合,形成個性化信用評級服務(wù)和產(chǎn)品
天語言模型技術(shù)具備強大的數(shù)據(jù)處理能力和復(fù)雜的算法結(jié)構(gòu),能將文本、圖像、視頻、聲音融合,嘗試應(yīng)用大語言模型基礎(chǔ),可為企業(yè)和個人提供訂制化的信用評級服務(wù)與產(chǎn)品。從企業(yè)端來看,大語言模型技術(shù)利用海量數(shù)據(jù),快速識別企業(yè)的經(jīng)營趨勢、還款能力等關(guān)鍵信息,并通過深度學(xué)習(xí)和自然語言處理,從非結(jié)構(gòu)化數(shù)據(jù)中提取價值信息,提高信用評估的準確性和效率性,實現(xiàn)對企業(yè)信用風(fēng)險的分級識別和分級評估,建立個性化企業(yè)信用產(chǎn)品。從個體端來看,大語言模型技術(shù)憑借優(yōu)秀的自然語言理解和業(yè)務(wù)場景泛化能力,并借助高效的處理和數(shù)據(jù)分析手段,能快速收集信用領(lǐng)域涉及的大量數(shù)據(jù),可根據(jù)相應(yīng)的信用主題、信用目標,對客戶進行精準分類,生成客戶畫像,為其量身定制個性化信用產(chǎn)品和服務(wù),幫助金融機構(gòu)快速對客戶進行信用分級和識別產(chǎn)品分級機會。
多模型:提供輔助決策支持,助力金融穩(wěn)定
借助差異化歷史信用數(shù)據(jù)、交易異常行為、不良交易數(shù)據(jù)等,通過歸因分析、動態(tài)調(diào)整參數(shù)、模型預(yù)測的方式,大模型能夠起到輔助決策作用,降低風(fēng)險發(fā)生概率,顯著提升金融風(fēng)險防控的準確性,對于維護金融業(yè)穩(wěn)定和安全發(fā)揮重要作用。
一方面,大模型能夠獲取高質(zhì)量的風(fēng)險防控數(shù)據(jù)。借助大規(guī)模的金融交易數(shù)據(jù)、客戶行為數(shù)據(jù)、市場數(shù)據(jù)等非結(jié)構(gòu)化信息,加上數(shù)據(jù)補充、修改和統(tǒng)一功能,天模型可以根據(jù)客戶訴求輸出結(jié)構(gòu)化的、高質(zhì)量的數(shù)據(jù),鑒別異常交易行為,從而為后續(xù)數(shù)據(jù)分析、模型微調(diào)、風(fēng)險預(yù)警提供高質(zhì)量的風(fēng)險防控數(shù)據(jù)基礎(chǔ)。
另一方面,大模型技術(shù)可以通過分析歷史信用數(shù)據(jù)和行為模式,構(gòu)建精確的風(fēng)險評估和預(yù)警模型。該模型能夠動態(tài)調(diào)整參數(shù),適應(yīng)市場變化,為金融機構(gòu)提供實時的風(fēng)險評估結(jié)果,并根據(jù)宏觀經(jīng)濟數(shù)據(jù),分析市場波動、利率變化等對企業(yè)的潛在影響,同時結(jié)合大模型的異常檢測和輿情監(jiān)控功能,實時發(fā)現(xiàn)企業(yè)的潛在風(fēng)險,輔助金融機構(gòu)決策者評估未來的經(jīng)濟波動、信用風(fēng)險和潛在的行業(yè)變化,以及其對企業(yè)經(jīng)營的影響,同時基于上述分析預(yù)測進行相應(yīng)的預(yù)警。
實踐中,有信用公司建立公司級智能預(yù)警,通過建立風(fēng)險管理框架,協(xié)助金融機構(gòu)進行風(fēng)險管控,為投融資業(yè)務(wù)場景保駕護航。券商智能風(fēng)控方面,大數(shù)據(jù)、智能化算法及大模型可輔助證券公司進行風(fēng)險識別、評估和監(jiān)管,更好滿足客戶對證券評級和風(fēng)險預(yù)警的需求。
建立可依賴的信用評價模型,精準化預(yù)警欺詐、違約
天語言模型基于海量信息,建立起復(fù)雜的信用評價模型,用于評估不同的信用欺詐風(fēng)險,改變傳統(tǒng)的違約檢測對規(guī)則和經(jīng)驗的依賴,可應(yīng)對金融領(lǐng)域復(fù)雜多變的違約和欺詐風(fēng)險。
從微觀層面看,大模型技術(shù)可對企業(yè)和個人各項交易模式與異常行為進行交易數(shù)據(jù)歸集、實時統(tǒng)計分析、及時風(fēng)險預(yù)警,進而有效地識別和預(yù)防可能的欺詐行為,并借助實時監(jiān)控和智能報警系統(tǒng),減少信用欺詐帶來的損失。天模型可以幫助信用評級機構(gòu)自身進行合規(guī)檢查,審查各類合約和法律文件,確保其符合國家信用管理相關(guān)法規(guī)要求,并借助大模型的自然語言理解能力降低金融機構(gòu)的法律合規(guī)成本。
從宏觀層面著,在評估和跟蹤企業(yè)的信用風(fēng)險時,除分析傳統(tǒng)的財務(wù)指標外,大模型技術(shù)還會分析行業(yè)動態(tài)、區(qū)域經(jīng)濟發(fā)展情況、上下游及原材料價格波動對企業(yè)成本的影響,以及全球經(jīng)濟衰退可能導(dǎo)致的訂單減少等宏觀因素,通過這種多維度的評估,更準確地預(yù)測企業(yè)的違約概率,提供更可靠、精準的違約預(yù)警。
在當前的實踐應(yīng)用場景中,有金融服務(wù)類平臺借助大語言模型從紛繁復(fù)雜的文字報告中收集到關(guān)鍵信息,借助智能化、多維度數(shù)據(jù)分析和持續(xù)學(xué)習(xí),建立起符合自身實際的大模型智能評測服務(wù)系統(tǒng),使其成為信用領(lǐng)域核心工具,并進而借助該工具構(gòu)建全面的企業(yè)客戶畫像,基于風(fēng)險的評分和評級,對區(qū)域差異化、主體差異化實現(xiàn)精準分級評估,進而對注冊企業(yè)或服務(wù)申請主體相關(guān)適用性進行準入初篩,從事前減少欺詐和違約風(fēng)險。
大模型在信用領(lǐng)域應(yīng)用的機遇與挑戰(zhàn)
也要承認,大語言模型作為人工智能的最前沿技術(shù),其應(yīng)用尚且缺乏明確的實施標準和指導(dǎo)原則,在模型的公平性、權(quán)責(zé)劃分、模型透明性和可解釋性,數(shù)據(jù)匹配性與數(shù)據(jù)安全性等方面,依然面臨挑戰(zhàn)。
大模型“幻覺”和公平性挑戰(zhàn)。目前大模型對于信用行業(yè)依舊處于輔助階段,信用行業(yè)的風(fēng)險防控依靠傳統(tǒng)模型方法,經(jīng)由大模型輔助來完成風(fēng)險預(yù)警。隨著人工智能的迭代和健康發(fā)展,大模型將由輔助轉(zhuǎn)型發(fā)展為信用行業(yè)所依賴的主流模型,并最終形成由大模型主導(dǎo)的風(fēng)險管控審計。一旦大模型成為主流模型,大語言模型公平性挑戰(zhàn)就需要得到妥善解決。
首先,天模型在信用風(fēng)控領(lǐng)域的應(yīng)用旨在完善風(fēng)險管理相關(guān)模型,以及應(yīng)對突發(fā)情況的風(fēng)險預(yù)知,基于對于大量數(shù)據(jù)的機械學(xué)習(xí)和反復(fù)迭代,大模型可通過持續(xù)輸入用戶數(shù)據(jù)來計算出相應(yīng)違約概率及信用預(yù)警,在這個過程中,如何制定模型公平性的評估標準,進而要求在大規(guī)模信用評估場景中進行模型偏見的檢測與消除,確保算法結(jié)果不因地區(qū)、行業(yè)、性別、種族、年齡等因素產(chǎn)生歧視,是當下大模型發(fā)展值得思考的問題。其次,大模型的算法通常非常復(fù)雜,難以理解和解釋,如何在模型開發(fā)階段增加反歧視措施,確保訓(xùn)練數(shù)據(jù)樣本的平衡性和多樣性,值得思考。最后,天模型可能會受到數(shù)據(jù)偏差的影響,導(dǎo)致信用評估結(jié)果存在不公正或偏見,另外大模型的“幻覺”問題,可能導(dǎo)致錯誤的風(fēng)險評估,這也是當下大語言模型在運用過程中面臨的一個難點。
評級決策過程中權(quán)責(zé)主體界定難題??梢灶A(yù)見,大模型相較于傳統(tǒng)模型更能準確反映出評級產(chǎn)品違約率和相應(yīng)風(fēng)險,且能更準確地對市場提供預(yù)警,信息的準確性會吸引客戶投資,行業(yè)競爭格局會圍繞信息的精確性發(fā)生改變。一旦大模型成為主流技術(shù),信用機構(gòu)的核心競爭力和品牌影響力也將從原本的評級數(shù)量、口碑等因素變?yōu)槭欠窬邆浯竽P图夹g(shù)。在大模型應(yīng)用于信用領(lǐng)域的過程中,如果出現(xiàn)信用評估錯誤、數(shù)據(jù)泄露或其他問題,很難確定責(zé)任主體:是模型開發(fā)者、數(shù)據(jù)提供者、應(yīng)用企業(yè)還是監(jiān)管機構(gòu)的責(zé)任?如果一直缺乏行業(yè)指導(dǎo)標準和發(fā)展原則,應(yīng)用過程中權(quán)責(zé)劃分不清、信用評估懲罰機制不明確、商業(yè)無序競爭、監(jiān)管主體不清晰等問題,將成為制約行業(yè)發(fā)展的挑戰(zhàn)。
信用領(lǐng)域數(shù)據(jù)隱私與安全挑戰(zhàn)。數(shù)據(jù)基礎(chǔ)制度建設(shè)事關(guān)國家發(fā)展和安全大局,信用行業(yè)作為數(shù)據(jù)密集型行業(yè),相關(guān)數(shù)據(jù)具有高敏感性和高價值性的特征,全面夯實和保障數(shù)據(jù)安全與個人信息權(quán)益是實現(xiàn)數(shù)據(jù)治理的關(guān)鍵要素。大模型如何在確保數(shù)據(jù)安全的前提下獲取大量的數(shù)據(jù),并進行訓(xùn)練,尤其在信用領(lǐng)域,收集用戶的個人信息、財務(wù)數(shù)據(jù)、交易記錄等敏感信息時,如何在嚴格遵守相關(guān)的數(shù)據(jù)保護法規(guī)的同時,實現(xiàn)數(shù)據(jù)共享?如何建立數(shù)據(jù)脫敏、加密處理的標準,防止數(shù)據(jù)泄露和濫用?如何推動數(shù)據(jù)共享與跨機構(gòu)合作的框架,且確保用戶知情和授權(quán)的透明性?在應(yīng)用過程中,數(shù)據(jù)控制方如何承擔(dān)數(shù)據(jù)安全主體責(zé)任,主管部門如何承擔(dān)監(jiān)管職責(zé)?如何在處理和使用個人信息時具備明確合理的目的和合適的方法?這應(yīng)該是整個行業(yè)在發(fā)展中需要深人思考的問題??傊?,大模型在信用領(lǐng)域的應(yīng)用,應(yīng)該遵循《中共中央國務(wù)院關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見》,按照黨中央、國務(wù)院決策部署,構(gòu)建數(shù)據(jù)安全體系,在充分實現(xiàn)數(shù)據(jù)要素價值、保障數(shù)據(jù)安全的前提下,促進全體人民共享數(shù)字經(jīng)濟紅利。
評級模型的透明性和可解釋性挑戰(zhàn)。目前,大語言模型在信用領(lǐng)域的應(yīng)用處在探索階段,行業(yè)領(lǐng)域缺乏應(yīng)用規(guī)范和操作指南,如何與現(xiàn)有監(jiān)管規(guī)則相匹配是行業(yè)的一天挑戰(zhàn)。從監(jiān)管層面看,金融機構(gòu)應(yīng)該擁有透明、可審計、可調(diào)控的信用評級流程及風(fēng)險評估框架,且業(yè)務(wù)流程公開、透明,但天模型在前端框架構(gòu)建完成后,其數(shù)據(jù)輸入端和輸出端之間所存在的流程具有一定程度上的隱蔽性,智能算法非標準化、非公開化,是否符合以“信披為本”的監(jiān)管原則,是目前政策法規(guī)對于大模型能否在信用領(lǐng)域?qū)崿F(xiàn)普遍應(yīng)用的一大疑慮。這意味著,大模型適用于信用領(lǐng)域時,提升其過程中的透明性和可解釋性是重要的,且監(jiān)管機構(gòu)對于大模型適用的相應(yīng)數(shù)據(jù)保護、數(shù)據(jù)質(zhì)量評估、第三方管理、操作合規(guī)等方面定性定量規(guī)定的出臺,也是保障大模型在信用領(lǐng)域積極健康使用的一大影響因素。
對策建議
盡管多家信用評級機構(gòu)已經(jīng)有了對于大模型應(yīng)用于金融數(shù)據(jù)分析的落地成果,但大模型在信用領(lǐng)域的適用仍是一個嘗試的新概念,大模型如何在信用領(lǐng)域適用,與信用市場和風(fēng)險評估的動態(tài)變化發(fā)展相匹配,還需要通過前瞻性的監(jiān)管框架,推動數(shù)據(jù)合作與共享,加強金融訓(xùn)練數(shù)據(jù)標準建設(shè),夯實行業(yè)發(fā)展基礎(chǔ)。
推動信用領(lǐng)域訓(xùn)練數(shù)據(jù)合作與共享,助力模型評估與修正。數(shù)據(jù)的持續(xù)更新,以及模型的持續(xù)迭代,可以保障大模型與時俱進,這能保證信用行業(yè)進行深度數(shù)據(jù)迭代和天模型信用框架的建立,同時也是大模型技術(shù)在信用領(lǐng)域落地的重要保障。首先,企業(yè)、金融機構(gòu)、政府等多方應(yīng)加強數(shù)據(jù)共享,保障數(shù)據(jù)的透明流動和隱私保護,這樣的合作能夠匯聚更多維度的數(shù)據(jù),提升信用評估的全面性。高質(zhì)量的金融訓(xùn)練數(shù)據(jù)集需要涵蓋企業(yè)財務(wù)數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)(如新聞、社交媒體)、行業(yè)數(shù)據(jù)、宏觀經(jīng)濟指標等,利用交易數(shù)據(jù)、稅務(wù)記錄、經(jīng)營情況等來反映企業(yè)的資金流動和經(jīng)營健康狀況,數(shù)據(jù)能夠提供全面的企業(yè)信用畫像,幫助識別潛在的信用風(fēng)險。其次,為適應(yīng)信用市場的動態(tài)變化,金融數(shù)據(jù)集需要具備實時性。通過與政府、銀行、互聯(lián)網(wǎng)金融平臺等合作,能及時收集企業(yè)最新的經(jīng)營狀況、市場變化等數(shù)據(jù),確保信用評分的時效性和準確性。最后,制定行業(yè)通用的金融數(shù)據(jù)標準可以幫助更好地整合不同來源的數(shù)據(jù),從而提升數(shù)據(jù)的可用性和一致性,同時在樣本量小的特殊領(lǐng)域也可以保障其有效性。
出臺信用領(lǐng)域大模型發(fā)展指南,促進多方參與和監(jiān)督。新興領(lǐng)域想要高質(zhì)量發(fā)展離不開政策法規(guī)和監(jiān)管的保駕護航。監(jiān)管層面可以出臺信用領(lǐng)域大模型使用相關(guān)監(jiān)管措施和行業(yè)發(fā)展指南。高效的監(jiān)管可以促進技術(shù)應(yīng)用安全落地,并保障技術(shù)合規(guī)發(fā)展,迅速成長。
可以預(yù)見,隨著中國大模型方面技術(shù)力的提升,相關(guān)政策法規(guī)及監(jiān)管規(guī)定也會隨之越來越完善。與此同時,監(jiān)管層可以出臺關(guān)于大模型的數(shù)據(jù)治理和安全保障體系建設(shè)的規(guī)范,保障投資者數(shù)據(jù)、企業(yè)和證券數(shù)據(jù)、信用評級公司數(shù)據(jù)這三方數(shù)據(jù)的安全。
推動產(chǎn)學(xué)研用深度融合發(fā)展,形成匹配人類價值觀的信用大模型。大模型在信用領(lǐng)域能持續(xù)使用的前提是要結(jié)合生產(chǎn)、學(xué)習(xí)、科學(xué)研究、實際應(yīng)用,即結(jié)合產(chǎn)學(xué)研用四部分。面對不確定的未來,大模型需要保持更新迭代,以應(yīng)對多種突發(fā)情況,推動產(chǎn)學(xué)研用的深度融合,是保障大模型持續(xù)更新的一大要素,通過四部分結(jié)合,并持續(xù)迭代更新,能夠促進形成匹配人類價值觀的信用大模型。
結(jié)語
綜上,大模型在信用領(lǐng)域應(yīng)用,需要與信用市場對于高精度信用風(fēng)險預(yù)警和模型研發(fā)的需求相匹配。在大語言模型已經(jīng)在企業(yè)級和信用評級等領(lǐng)域?qū)崿F(xiàn)了輔助工作的落地的前提下,可以預(yù)見,在未來發(fā)展過程中,大模型在更高效率風(fēng)險預(yù)警和評價體系的研發(fā)方面將起到關(guān)鍵性的作用。在大語言模型的助力下,信用行業(yè)將加速信用模型和風(fēng)險評估模型創(chuàng)新,進而在金融市場中表現(xiàn)出更高的穩(wěn)定性和可持續(xù)性。但由于我國人工智能大模型處于發(fā)展前期階段,在其起步初期,能否符合監(jiān)管規(guī)定、能否保障數(shù)據(jù)安全,并從制度層面搭建具有前瞻性的監(jiān)管框架,引導(dǎo)市場化主體通過市場化手段在發(fā)展中自主解決出現(xiàn)的問題,是決定大模型能否可持續(xù)高質(zhì)量發(fā)展的重要因素。
(王小明供職于中國人壽保險股份有限公司,鄭杰為安泰信用評級有限責(zé)任公司總裁。特約編輯/孫世選,責(zé)任編輯/丁開艷)