中圖分類(lèi)號(hào):F830 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1008-4096(2025)04-0017-14
一、引言
黨的二十大報(bào)告強(qiáng)調(diào)構(gòu)建新一代信息技術(shù)、人工智能等增長(zhǎng)引擎。近年來(lái),我國(guó)的政府工作報(bào)告也多次強(qiáng)調(diào)人工智能等研發(fā)應(yīng)用,開(kāi)展“人工智能 + ”行動(dòng)。與此同時(shí),隨著全球科技飛速發(fā)展,銀行業(yè)逐步認(rèn)識(shí)到技術(shù)創(chuàng)新對(duì)其業(yè)務(wù)模式和運(yùn)營(yíng)效率的重要影響[]。大數(shù)據(jù)、人工智能和區(qū)塊鏈等技術(shù)的廣泛應(yīng)用正促使傳統(tǒng)銀行業(yè)不斷調(diào)整和重塑自身結(jié)構(gòu),以適應(yīng)數(shù)字化轉(zhuǎn)型的需求。這種變革不僅體現(xiàn)在優(yōu)化操作流程上,更深刻地影響了客戶服務(wù)、市場(chǎng)分析和風(fēng)險(xiǎn)管理等多個(gè)關(guān)鍵環(huán)節(jié)。在數(shù)字化轉(zhuǎn)型的浪潮中,以ChatGPT為首的大語(yǔ)言模型作為人工智能的代表,憑借其強(qiáng)大的語(yǔ)言生成和理解能力,逐漸成為銀行業(yè)創(chuàng)新的前沿工具,在股市投資、風(fēng)險(xiǎn)管理和金融知識(shí)服務(wù)等方面展現(xiàn)出廣闊的應(yīng)用前景[2。2023年7月,國(guó)家互聯(lián)網(wǎng)信息辦公室聯(lián)合國(guó)家發(fā)展和改革委員會(huì)等七個(gè)部門(mén)發(fā)布《生成式人工智能服務(wù)管理暫行辦法》,明確鼓勵(lì)生成式人工智能技術(shù)在各行業(yè)、各領(lǐng)域的創(chuàng)新應(yīng)用,為大語(yǔ)言模型在銀行業(yè)的應(yīng)用和發(fā)展奠定了基礎(chǔ)。
盡管大語(yǔ)言模型在銀行業(yè)的應(yīng)用逐漸成為研究熱點(diǎn),但國(guó)內(nèi)相關(guān)研究仍處于起步階段。一方面,銀行業(yè)對(duì)大語(yǔ)言模型的探索剛剛開(kāi)始,技術(shù)成熟度和實(shí)際應(yīng)用效果尚需進(jìn)一步驗(yàn)證。另一方面,國(guó)內(nèi)缺乏對(duì)大語(yǔ)言模型與銀行業(yè)務(wù)結(jié)合的系統(tǒng)性研究。基于此,本文創(chuàng)新性地從銀行業(yè)務(wù)視角出發(fā),系統(tǒng)梳理了現(xiàn)有研究,以期全面了解大語(yǔ)言模型在銀行領(lǐng)域的發(fā)展現(xiàn)狀和潛在應(yīng)用形式,探討未來(lái)大語(yǔ)言模型的研究和應(yīng)用方向。本文梳理現(xiàn)有研究發(fā)現(xiàn),大語(yǔ)言模型強(qiáng)大的語(yǔ)言生成和理解能力可能會(huì)革新銀行的傳統(tǒng)模式,但實(shí)際上其在銀行領(lǐng)域的應(yīng)用卻仍處于初級(jí)階段,主要集中在業(yè)務(wù)層面且效果有待觀察,尚未達(dá)到使銀行完全脫離以人為主模式的程度。如何平衡應(yīng)用大語(yǔ)言模型的效用與風(fēng)險(xiǎn)仍然是一個(gè)亟待深入研究的問(wèn)題。因此,從銀行業(yè)務(wù)視角深入分析梳理大語(yǔ)言模型的技術(shù)基礎(chǔ)、應(yīng)用形式和潛在風(fēng)險(xiǎn),有助于為未來(lái)大語(yǔ)言模型在銀行業(yè)的深度應(yīng)用和創(chuàng)新發(fā)展提供方向和參考。
相對(duì)于現(xiàn)有研究,本文的主要貢獻(xiàn)體現(xiàn)在三個(gè)方面。其一,本文系統(tǒng)梳理了大語(yǔ)言模型技術(shù)發(fā)展的最新脈絡(luò),從Transformer架構(gòu)及其改進(jìn)模型的技術(shù)討論出發(fā),進(jìn)一步分析了DeepSeek等新興大語(yǔ)言模型的特點(diǎn)。其二,本文基于銀行業(yè)的大語(yǔ)言模型應(yīng)用梳理文獻(xiàn)。鑒于大語(yǔ)言模型在提升客戶服務(wù)體驗(yàn)、提高業(yè)務(wù)處理效率和降低運(yùn)營(yíng)成本等方面展現(xiàn)出的巨大潛力,其在銀行業(yè)的應(yīng)用研究具有重要的理論價(jià)值和現(xiàn)實(shí)意義。目前,多數(shù)大語(yǔ)言模型研究集中于通用人工智能領(lǐng)域或其他特定行業(yè),針對(duì)銀行業(yè)的深入探討相對(duì)較少。然而,銀行業(yè)作為國(guó)民經(jīng)濟(jì)的關(guān)鍵支柱,具有獨(dú)特的業(yè)務(wù)架構(gòu)和運(yùn)營(yíng)邏輯,對(duì)技術(shù)應(yīng)用的要求更為嚴(yán)苛。因此,本文緊扣銀行核心業(yè)務(wù),深人剖析大語(yǔ)言模型在零售業(yè)務(wù)、金融市場(chǎng)業(yè)務(wù)和風(fēng)控業(yè)務(wù)等關(guān)鍵領(lǐng)域的具體應(yīng)用場(chǎng)景與實(shí)施可行性,旨在豐富銀行業(yè)應(yīng)用領(lǐng)域的研究?jī)?nèi)容,為后續(xù)的理論研究與實(shí)踐應(yīng)用奠定堅(jiān)實(shí)基礎(chǔ)。通過(guò)將大語(yǔ)言模型的技術(shù)優(yōu)勢(shì)與銀行業(yè)務(wù)需求深度融合,本文不僅揭示了該技術(shù)在推動(dòng)銀行數(shù)字化轉(zhuǎn)型和智能升級(jí)中的關(guān)鍵作用,也為銀行業(yè)在技術(shù)創(chuàng)新浪潮中把握發(fā)展機(jī)遇、提升核心競(jìng)爭(zhēng)力提供了重要理論支撐和實(shí)踐指引。其三,目前關(guān)于大語(yǔ)言模型風(fēng)險(xiǎn)的研究多集中于數(shù)據(jù)安全、倫理問(wèn)題或模型偏見(jiàn),而較少涉及銀行業(yè)的特有風(fēng)險(xiǎn),如合規(guī)性、金融欺詐、數(shù)據(jù)隱私保護(hù)等。本文結(jié)合銀行業(yè)的監(jiān)管要求,提出了針對(duì)性更強(qiáng)的防范策略,為銀行業(yè)應(yīng)用大語(yǔ)言模型提供可操作性的建議。
二、大語(yǔ)言模型的技術(shù)基礎(chǔ)與應(yīng)用場(chǎng)景
(一)大語(yǔ)言模型的技術(shù)基礎(chǔ)
1.Transformer:架構(gòu)演進(jìn)與原理剖析
大語(yǔ)言模型作為自然語(yǔ)言處理領(lǐng)域的重大進(jìn)展,依賴(lài)一系列關(guān)鍵技術(shù)的突破,主要包括詞嵌入(Word Embedding)、深度學(xué)習(xí)模型和Transformer架構(gòu)。詞嵌入技術(shù)為機(jī)器提供了理解文本的基礎(chǔ),其將詞匯映射為連續(xù)向量,保留了詞匯之間的句法和語(yǔ)義關(guān)系3。由神經(jīng)網(wǎng)絡(luò)延伸而出的深度學(xué)習(xí)模型則進(jìn)一步增強(qiáng)了其對(duì)文本數(shù)據(jù)的處理能力。但是,遞歸神經(jīng)網(wǎng)絡(luò)及其變種(長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)和門(mén)控循環(huán)單元等模型)的網(wǎng)絡(luò)結(jié)構(gòu)難以處理單詞之間的長(zhǎng)距離依賴(lài)關(guān)系,必須依照順序處理輸入序列中的單詞。這導(dǎo)致計(jì)算過(guò)程難以并行化,訓(xùn)練時(shí)間較長(zhǎng),在捕捉遠(yuǎn)程依賴(lài)關(guān)系時(shí)面臨梯度消失或梯度爆炸等問(wèn)題。直到2017年Transformer架構(gòu)的提出[4],這些局限才得以突破。與傳統(tǒng)的遞歸神經(jīng)網(wǎng)絡(luò)不同,Transformer摒棄了傳統(tǒng)遞歸神經(jīng)網(wǎng)絡(luò)的循環(huán)結(jié)構(gòu),僅依靠多頭自注意力機(jī)制(Multi-Head Self-Atention)便能高效捕捉文本中的長(zhǎng)距離依賴(lài)關(guān)系。這種創(chuàng)新設(shè)計(jì)賦予模型出色的并行計(jì)算能力,極大地提升訓(xùn)練效率和突破性能上限,并為后續(xù)超大規(guī)模語(yǔ)言模型的出現(xiàn)奠定了基礎(chǔ)。
Transformer架構(gòu)由多層編碼器和解碼器堆疊而成,編碼器和解碼器均配備嵌入層(EmbeddingLayer),最終通過(guò)輸出層生成結(jié)果。單詞輸入后,需添加位置編碼(Positional Encoding),以保留序列中的位置信息,使模型能夠理解單詞的順序關(guān)系。編碼器作為T(mén)ransformer的核心組件,包含自注意力層(Self-Attention Layer)和前饋層(Feed-ForwardLayer)。自注意力機(jī)制是Transformer的核心,通過(guò)對(duì)序列中所有位置的輸入進(jìn)行加權(quán)計(jì)算,使模型能夠捕捉長(zhǎng)距離依賴(lài)關(guān)系,并在處理長(zhǎng)序列時(shí)保持高效性。多頭注意力機(jī)制進(jìn)一步完善了自注意力機(jī)制,將注意力分解為多個(gè)并行運(yùn)算的注意力頭(AttentionHeads),使模型能夠在不同子空間中并行關(guān)注不同特征,增強(qiáng)特征提取的豐富性和多樣性。在自注意力層完成計(jì)算后,Transformer利用全連接層進(jìn)行特征處理,并通過(guò)殘差連接(ResidualConnections)和層歸一化(LayerNormalization)穩(wěn)定訓(xùn)練,避免梯度消失或梯度爆炸等問(wèn)題。解碼器包含與編碼器相似的層級(jí)結(jié)構(gòu),并額外增加了一個(gè)編碼器—解碼器注意力層(Encoder-DecoderAttentionLayer),以實(shí)現(xiàn)對(duì)編碼器輸出的有效解碼。
2.GPT和BERT:大語(yǔ)言模型的主流架構(gòu)
2018年,OpenAI基于Transformer的Decoder部分,開(kāi)發(fā)了GPT(GenerativePre-trainedTransformer)模型[5]。同年,Google基于Transformer的Encoder部分,開(kāi)發(fā)了BERT(BidirectionalEncoder Representations from Transformers)模型[6。與GPT單向的自回歸任務(wù)不同,BERT在預(yù)訓(xùn)練階段引人了兩個(gè)創(chuàng)新任務(wù):掩碼語(yǔ)言模型(MaskedLanguage Model)和下一句預(yù)測(cè)(NextSentence Prediction)。這使得BERT能夠深刻地理解詞語(yǔ)在上下文中的雙向關(guān)系,并判斷句子間的邏輯,在語(yǔ)言理解類(lèi)任務(wù)上表現(xiàn)卓越。作為自然語(yǔ)言處理領(lǐng)域中的重要預(yù)訓(xùn)練語(yǔ)言模型,GPT和BERT具有各自的獨(dú)特優(yōu)勢(shì)和適用場(chǎng)景,逐漸成為各個(gè)大語(yǔ)言模型建立的基礎(chǔ)。GPT與BERT的對(duì)比如表1所示,兩種模型在架構(gòu)、訓(xùn)練任務(wù)、訓(xùn)練方式、優(yōu)勢(shì)和應(yīng)用場(chǎng)景上存在差異。值得一提的是,GPT-1模型主要采用預(yù)訓(xùn)練和微調(diào)的訓(xùn)練方法,即模型先在大規(guī)模語(yǔ)料庫(kù)上進(jìn)行無(wú)監(jiān)督的預(yù)訓(xùn)練,學(xué)習(xí)語(yǔ)言的通用特征,再在特定任務(wù)上進(jìn)行微調(diào),以適應(yīng)具體的應(yīng)用場(chǎng)景。由于模型規(guī)模的迅速擴(kuò)大,GPT-2及后續(xù)模型展現(xiàn)出了強(qiáng)大的上下文學(xué)習(xí)能力,使其在應(yīng)用時(shí)可以通過(guò)零樣本或少樣本提示完成任務(wù),在很多場(chǎng)景下簡(jiǎn)化了對(duì)特定任務(wù)進(jìn)行模型微調(diào)的程序。這種方法不僅增強(qiáng)了模型的泛化能力,還減少了對(duì)標(biāo)注數(shù)據(jù)的依賴(lài)。與后續(xù)GPT不同的是,BERT最經(jīng)典、最主流的訓(xùn)練方式是預(yù)訓(xùn)練和微調(diào),以此適配不同領(lǐng)域的任務(wù)要求。
表1GPT與BERT的對(duì)比
大語(yǔ)言模型的技術(shù)架構(gòu)主要分為三種:以BERT為代表的編碼器(Encoder-Only)架構(gòu)、以GPT為代表的解碼器(Decoder-Only)架構(gòu)和融合兩者的編碼器—解碼器(Encoder-Decoder)架構(gòu)。BERT架構(gòu)側(cè)重于深度語(yǔ)言理解,通過(guò)“預(yù)訓(xùn)練—微調(diào)”范式,在特定分析任務(wù)上表現(xiàn)出色;GPT架構(gòu)則以其強(qiáng)大的零樣本或少樣本能力著稱(chēng),無(wú)須微調(diào)即可靈活適應(yīng)各類(lèi)生成場(chǎng)景和多任務(wù)場(chǎng)景,簡(jiǎn)化了應(yīng)用流程;混合架構(gòu)則兼具理解與生成的優(yōu)勢(shì)。國(guó)內(nèi)外主流大語(yǔ)言模型如表2所示,從中可以發(fā)現(xiàn),GPT模式正在逐漸成為國(guó)內(nèi)外大語(yǔ)言模型的主流架構(gòu)。除了以上三種架構(gòu)外,混合專(zhuān)家(MoE)機(jī)制作為一種關(guān)鍵的架構(gòu)優(yōu)化技術(shù),正在不斷提高大模型的計(jì)算效率。MoE機(jī)制通過(guò)引入多個(gè)專(zhuān)家網(wǎng)絡(luò),在推理時(shí)稀疏激活部分專(zhuān)家,能夠保持強(qiáng)大推理能力,并降低計(jì)算成本,有望成為未來(lái)大語(yǔ)言模型架構(gòu)的重要補(bǔ)充,進(jìn)一步推動(dòng)人工智能計(jì)算的高效化與智能化。
表2國(guó)內(nèi)外主流大語(yǔ)言模型
3.DeepSeek:推理能力增強(qiáng)與MoE機(jī)制優(yōu)化
2024年12月,DeepSeek推出了DeepSeek-V3,引發(fā)全球人工智能領(lǐng)域的廣泛關(guān)注。DeepSeek-R1也隨后誕生。不同于GPT,DeepSeek-R1更適用于小模型,其技術(shù)架構(gòu)圍繞強(qiáng)化學(xué)習(xí)驅(qū)動(dòng)的推理能力增強(qiáng)展開(kāi),通過(guò)多階段訓(xùn)練策略和知識(shí)蒸餾技術(shù)增強(qiáng)推理能力。整個(gè)架構(gòu)的核心理念是利用強(qiáng)化學(xué)習(xí)促進(jìn)推理能力的自演化,結(jié)合監(jiān)督微調(diào),通過(guò)運(yùn)用高質(zhì)量的初始推理數(shù)據(jù)(即冷啟動(dòng)數(shù)據(jù),Cold-StartData)與后續(xù)的多樣化指令,優(yōu)化模型的可讀性,增強(qiáng)泛化能力[7]。
此前,初代版本DeepSeek-R1-Zero采用群體相對(duì)策略?xún)?yōu)化(GroupRelative PolicyOptimization)作為強(qiáng)化學(xué)習(xí)算法,以減少訓(xùn)練成本和優(yōu)化穩(wěn)定性。該方法通過(guò)群體得分取代傳統(tǒng)強(qiáng)化學(xué)習(xí)需要的Critic模型,從而減少計(jì)算需求。模型訓(xùn)練過(guò)程中采用兩種主要的獎(jiǎng)勵(lì)建模策略:一是準(zhǔn)確性獎(jiǎng)勵(lì),用于評(píng)估數(shù)學(xué)和編程任務(wù)的正確性;二是格式獎(jiǎng)勵(lì),確保模型在推理時(shí)使用特定標(biāo)簽結(jié)構(gòu),使推理過(guò)程更加清晰。在強(qiáng)化學(xué)習(xí)訓(xùn)練的過(guò)程中,DeepSeek-R1-Zero具有極強(qiáng)的自演化能力,會(huì)自動(dòng)增加推理鏈的長(zhǎng)度,從簡(jiǎn)單推理行為逐步進(jìn)化為自我驗(yàn)證和反思等高級(jí)推理行為。
然而,DeepSeek-R1-Zero模型仍然存在可讀性差、語(yǔ)言混雜等問(wèn)題,因而研究團(tuán)隊(duì)進(jìn)一步開(kāi)發(fā)了DeepSeek-R1。在訓(xùn)練階段,研究團(tuán)隊(duì)首先收集數(shù)千條高質(zhì)量的長(zhǎng)鏈?zhǔn)酵评頂?shù)據(jù),以此為基礎(chǔ)對(duì)基礎(chǔ)模型進(jìn)行初步微調(diào),旨在優(yōu)化模型輸出的可讀性和推理過(guò)程的穩(wěn)定性。在強(qiáng)化學(xué)習(xí)階段,DeepSeek-R1沿用DeepSeek-R1-Zero所采用的強(qiáng)化學(xué)習(xí)算法,引人語(yǔ)言一致性獎(jiǎng)勵(lì)機(jī)制,確保模型能夠在多語(yǔ)言環(huán)境下生成連貫一致的推理內(nèi)容。當(dāng)強(qiáng)化學(xué)習(xí)訓(xùn)練達(dá)到收斂狀態(tài)后,研究團(tuán)隊(duì)?wèi)?yīng)用拒絕采樣(Reject Sampling)技術(shù),精心挑選強(qiáng)化學(xué)習(xí)過(guò)程中產(chǎn)生的最優(yōu)推理結(jié)果作為新的訓(xùn)練數(shù)據(jù)。通過(guò)結(jié)合DeepSeek-V3所提供的寫(xiě)作、問(wèn)答和角色扮演等多種類(lèi)型的數(shù)據(jù)進(jìn)行監(jiān)督微調(diào),進(jìn)一步優(yōu)化模型輸出的可讀性,增強(qiáng)模型在多語(yǔ)言環(huán)境下的推理能力,并提升輸出質(zhì)量。
DeepSeek使用的核心架構(gòu)是DeepSeekMoE,其在Transformer的前饋網(wǎng)絡(luò)層引入了MoE機(jī)制,采用的是一種高度專(zhuān)業(yè)化的專(zhuān)家劃分方式。在DeepSeekMoE145B規(guī)模下,每個(gè)MoE層由4個(gè)共享專(zhuān)家和128個(gè)路由專(zhuān)家組成[8]。共享專(zhuān)家負(fù)責(zé)通用特征處理,而路由專(zhuān)家則根據(jù)詞元(Token)的特定任務(wù)進(jìn)行動(dòng)態(tài)分配,使模型在處理不同領(lǐng)域的任務(wù)時(shí)更加精準(zhǔn)高效。在負(fù)載均衡方面,DeepSeekMoE引人無(wú)輔助損失策略,通過(guò)動(dòng)態(tài)調(diào)整專(zhuān)家偏置項(xiàng)均衡計(jì)算負(fù)載,這種策略避免了傳統(tǒng)MoE機(jī)制所依賴(lài)的輔助損失函數(shù)對(duì)主優(yōu)化目標(biāo)的潛在干擾。在分布式訓(xùn)練方面,DeepSeekMoE采用節(jié)點(diǎn)限制路由,每個(gè)Token最多被發(fā)送到4個(gè)計(jì)算節(jié)點(diǎn),以降低跨節(jié)點(diǎn)通信成本。整體來(lái)看,DeepSeekMoE使DeepSeek-V3在龐大參數(shù)量下仍能保持高效推理能力,極大地增強(qiáng)了AI任務(wù)的處理能力。
(二)大語(yǔ)言模型在銀行業(yè)的應(yīng)用潛力與技術(shù)適配性
1.金融大語(yǔ)言模型的發(fā)展及應(yīng)用前景
作為通用大語(yǔ)言模型在金融領(lǐng)域的深化應(yīng)用,金融大語(yǔ)言模型(FinLLM)正成為驅(qū)動(dòng)金融科技創(chuàng)新的核心力量。其發(fā)展程度依賴(lài)于專(zhuān)業(yè)化的金融語(yǔ)料庫(kù),通過(guò)“通用預(yù)訓(xùn)練 + 金融領(lǐng)域精調(diào)”或純金融領(lǐng)域預(yù)訓(xùn)練等路徑,應(yīng)對(duì)金融數(shù)據(jù)在專(zhuān)業(yè)性、實(shí)時(shí)性、合規(guī)性上的獨(dú)特挑戰(zhàn)。自2019年彭博社推出BloombergGPT以來(lái),全球金融大語(yǔ)言模型研發(fā)到2023年正式進(jìn)入快速發(fā)展階段,國(guó)內(nèi)外眾多金融與科技機(jī)構(gòu)紛紛投入應(yīng)用。到2024年,金融大語(yǔ)言模型的發(fā)展重心已轉(zhuǎn)向應(yīng)用場(chǎng)景的深化落地與模型性能優(yōu)化,銀行機(jī)構(gòu)成為核心參與者。以中國(guó)工商銀行、中國(guó)建設(shè)銀行、中國(guó)銀行、中國(guó)農(nóng)業(yè)銀行等大型國(guó)有商業(yè)銀行為引領(lǐng),股份制銀行和頭部城市商業(yè)銀行積極跟進(jìn),紛紛推出自研或深度合作的模型,構(gòu)建“模型 + 平臺(tái) + 應(yīng)用”的一體化體系,積極探索模態(tài)融合技術(shù)。
銀行業(yè)對(duì)金融大語(yǔ)言模型的應(yīng)用呈現(xiàn)場(chǎng)景驅(qū)動(dòng)、價(jià)值導(dǎo)向的顯著特點(diǎn),應(yīng)用場(chǎng)景主要聚焦于四個(gè)核心領(lǐng)域:一是通過(guò)智能客服、個(gè)性化推薦和財(cái)富管理助手等,提升客戶服務(wù)和營(yíng)銷(xiāo)的智能化水平;二是通過(guò)員工知識(shí)助手、自動(dòng)化報(bào)告生成和代碼輔助開(kāi)發(fā)等,提升內(nèi)部運(yùn)營(yíng)效率;三是通過(guò)信貸風(fēng)險(xiǎn)預(yù)警、反欺詐分析和合規(guī)文本審查等,增強(qiáng)風(fēng)險(xiǎn)管理和合規(guī)能力;四是通過(guò)海量信息摘要、輿情監(jiān)控和研究報(bào)告輔助生成,賦能投資研究和市場(chǎng)分析。為確保數(shù)據(jù)安全和決策可靠性,這些應(yīng)用普遍采用私有化部署方式,并將大語(yǔ)言模型與傳統(tǒng)規(guī)則引擎、機(jī)器學(xué)習(xí)模型相結(jié)合。
2.大語(yǔ)言模型契合銀行需求的技術(shù)特征
從銀行業(yè)的適用性看,大語(yǔ)言模型在處理海量非結(jié)構(gòu)化數(shù)據(jù)、提升工作效率和提供智能化決策支持等方面具有顯著的技術(shù)優(yōu)勢(shì),這些特征使其成為推動(dòng)銀行業(yè)數(shù)字化轉(zhuǎn)型的重要技術(shù)力量。
第一,大語(yǔ)言模型強(qiáng)大的自然語(yǔ)言處理能力與銀行業(yè)海量的非結(jié)構(gòu)化數(shù)據(jù)處理需求高度契合。銀行業(yè)日常運(yùn)營(yíng)中產(chǎn)生大量以自然語(yǔ)言形式存在的非結(jié)構(gòu)化數(shù)據(jù),包括客戶服務(wù)對(duì)話記錄、投資研究報(bào)告、法律合同文本和各類(lèi)監(jiān)管文件等。在處理此類(lèi)數(shù)據(jù)時(shí),傳統(tǒng)數(shù)據(jù)分析模型通常需要復(fù)雜且耗時(shí)的預(yù)處理步驟。而大語(yǔ)言模型憑借其龐大的參數(shù)規(guī)模和先進(jìn)的技術(shù)架構(gòu),能夠深度理解和處理這些數(shù)據(jù)。以GPT-4為例,其憑借高達(dá)約1.8萬(wàn)億的參數(shù)規(guī)模和MoE機(jī)制,在自然語(yǔ)言理解、生成和邏輯推理方面展現(xiàn)出前所未有的能力。銀行業(yè)可以直接利用大語(yǔ)言模型對(duì)原始文本數(shù)據(jù)進(jìn)行分析、分類(lèi)和提取信息,極大地簡(jiǎn)化了數(shù)據(jù)處理流程,釋放了數(shù)據(jù)價(jià)值。
第二,大語(yǔ)言模型的多功能性有助于銀行業(yè)實(shí)現(xiàn)運(yùn)營(yíng)自動(dòng)化和效率革命。大語(yǔ)言模型具備出色的文本生成、摘要、翻譯和問(wèn)答等功能,能夠賦能銀行員工,將其從重復(fù)性、事務(wù)性的工作中解放出來(lái)??蛻艚?jīng)理可以利用大語(yǔ)言模型快速生成營(yíng)銷(xiāo)文案和答復(fù)客戶問(wèn)詢(xún)的郵件初稿;風(fēng)險(xiǎn)管理部門(mén)可以利用大語(yǔ)言模型自動(dòng)生成信貸報(bào)告和風(fēng)險(xiǎn)評(píng)估摘要;合規(guī)部門(mén)則能通過(guò)大語(yǔ)言模型快速檢索且解讀復(fù)雜的監(jiān)管條款。摩根大通等金融機(jī)構(gòu)已著手開(kāi)發(fā)內(nèi)部的大語(yǔ)言模型應(yīng)用套件,用于起草投資備忘錄、提取研究報(bào)告要點(diǎn),從而大幅提升員工生產(chǎn)力。
第三,大語(yǔ)言模型的推理和分析能力為銀行的精準(zhǔn)決策提供了有力支持。大語(yǔ)言模型能夠綜合分析來(lái)自不同渠道、不同格式的數(shù)據(jù),識(shí)別其中復(fù)雜的模式和邏輯關(guān)系,從而為銀行的戰(zhàn)略決策、風(fēng)險(xiǎn)管理和投資建議提供更深層次的洞察。通過(guò)分析宏觀經(jīng)濟(jì)數(shù)據(jù)、市場(chǎng)新聞和社交媒體情緒,大語(yǔ)言模型可以輔助投資顧問(wèn)進(jìn)行市場(chǎng)趨勢(shì)預(yù)測(cè)和投資組合推薦。在客戶風(fēng)險(xiǎn)評(píng)估方面,大語(yǔ)言模型能夠整合分析客戶的交易歷史、信貸報(bào)告和行為模式,提供更全面、動(dòng)態(tài)的風(fēng)險(xiǎn)畫(huà)像,還能夠以通俗易懂的語(yǔ)言向客戶解釋決策原因。
第四,從應(yīng)用成本看,持續(xù)優(yōu)化的模型技術(shù)和靈活的部署策略正推動(dòng)大語(yǔ)言模型在金融場(chǎng)景中的普及。早期大語(yǔ)言模型高昂的訓(xùn)練和推理成本是其在銀行業(yè)規(guī)模化應(yīng)用的主要障礙之一。然而,隨著分布式訓(xùn)練、模型壓縮、知識(shí)蒸餾和剪枝等技術(shù)的成熟,大語(yǔ)言模型的計(jì)算成本已得到有效控制。業(yè)界也正在積極探索通過(guò)使用規(guī)模更小、針對(duì)特定金融任務(wù)進(jìn)行微調(diào)的開(kāi)源模型,以及采用檢索增強(qiáng)生成等技術(shù),在保證任務(wù)效果的同時(shí)降低成本。
三、大語(yǔ)言模型在銀行業(yè)務(wù)的潛在應(yīng)用方向
(一)零售業(yè)務(wù)
大語(yǔ)言模型在銀行零售業(yè)務(wù)領(lǐng)域展現(xiàn)出顯著的應(yīng)用潛力,尤其體現(xiàn)在為龐大的個(gè)人客戶群體提供服務(wù)方面。在客戶服務(wù)與銷(xiāo)售系統(tǒng)中部署對(duì)話式人工智能促使銀行有效減少傳統(tǒng)模式下對(duì)人力資本和物理網(wǎng)點(diǎn)的依賴(lài),進(jìn)而實(shí)現(xiàn)客戶互動(dòng)效能與經(jīng)濟(jì)效益的同步優(yōu)化。目前針對(duì)大語(yǔ)言模型在銀行零售業(yè)務(wù)中的應(yīng)用研究相對(duì)匱乏,而關(guān)于聊天機(jī)器人的傳統(tǒng)研究主要從智能客服和智能銷(xiāo)售兩個(gè)方面展開(kāi),側(cè)重于分析技術(shù)應(yīng)用的實(shí)際效果,對(duì)大語(yǔ)言模型的應(yīng)用具有重要的啟示作用。
1.智能客服:提升客戶使用度和留存率
從客戶接受度的角度看,交互的真實(shí)感和初始信任是驅(qū)動(dòng)客戶參與和持續(xù)使用的前提,客戶對(duì)聊天機(jī)器人的信任會(huì)顯著提升其使用意愿和參與度?;谏鐣?huì)反應(yīng)理論的研究發(fā)現(xiàn),當(dāng)金融科技聊天機(jī)器人提供了良好的互動(dòng)體驗(yàn)后,其能夠通過(guò)持續(xù)意圖機(jī)制有效改善客戶的態(tài)度,提升客戶的使用黏性。大語(yǔ)言模型憑借其在生成自然、連貫且符合語(yǔ)用規(guī)則的語(yǔ)言方面的卓越能力,為滿足上述心理預(yù)期提供了技術(shù)上的可能性,從而為后續(xù)的用戶深度使用奠定基礎(chǔ)。
當(dāng)用戶初步接受度得到解決后,決定用戶留存率和忠誠(chéng)度的關(guān)鍵因素便轉(zhuǎn)變?yōu)榉?wù)的內(nèi)在效度和效用,具體體現(xiàn)為信息的準(zhǔn)確性和服務(wù)的個(gè)性化。大語(yǔ)言模型在信息的準(zhǔn)確性和可靠性上優(yōu)勢(shì)顯著,能夠構(gòu)建全面的知識(shí)庫(kù),通過(guò)高效檢索提供比傳統(tǒng)機(jī)器人更準(zhǔn)確的答案[10]。更重要的是,大語(yǔ)言模型具備持續(xù)學(xué)習(xí)和調(diào)試的能力,能確保生成的回答不僅準(zhǔn)確,還可以動(dòng)態(tài)優(yōu)化,以符合客戶期望。智能客服的交互質(zhì)量是影響客戶留存率的關(guān)鍵決定因素。例如,銀行聊天機(jī)器人的系統(tǒng)質(zhì)量、信息質(zhì)量和服務(wù)質(zhì)量能夠?yàn)榭蛻魩?lái)正面體驗(yàn),顯著提升客戶留存率,從而增強(qiáng)客戶黏性[]。在此基礎(chǔ)上,大語(yǔ)言模型還能夠提供深度個(gè)性化的服務(wù),使用類(lèi)似BERT的模型技術(shù),利用上下文語(yǔ)境進(jìn)行深度雙向表征的預(yù)訓(xùn)練,精準(zhǔn)理解,并回答客戶的個(gè)性化提問(wèn)。
2.智能銷(xiāo)售:增強(qiáng)客戶購(gòu)買(mǎi)意愿和體驗(yàn)
在智能銷(xiāo)售領(lǐng)域,以ChatGPT為首的大語(yǔ)言模型具備較高的財(cái)務(wù)顧問(wèn)素養(yǎng),能夠?yàn)榭蛻籼峁┖侠淼慕ㄗh且被采納[12]。這種能力不僅限于簡(jiǎn)單的產(chǎn)品問(wèn)答,更延伸至復(fù)雜的投資組合構(gòu)建與財(cái)富規(guī)劃。現(xiàn)有研究表明,智能聊天機(jī)器人能夠顯著提高客戶的主觀購(gòu)買(mǎi)意愿和被動(dòng)接受推銷(xiāo)的可能性。從主觀購(gòu)買(mǎi)意愿角度看,智能銷(xiāo)售機(jī)器人通過(guò)強(qiáng)化系統(tǒng)質(zhì)量、信息質(zhì)量和服務(wù)質(zhì)量提升客戶體驗(yàn),進(jìn)而提升客戶對(duì)品牌的信任度。而大語(yǔ)言模型將其推向了新的高度,通過(guò)實(shí)現(xiàn)“超個(gè)性化”,生成高度定制化的產(chǎn)品推薦和溝通策略,顯著提升滿意度和信任度,并最終轉(zhuǎn)化為客戶購(gòu)買(mǎi)意愿的增強(qiáng)[13]。從被動(dòng)接受推銷(xiāo)角度看,客戶對(duì)智能銷(xiāo)售的建議具有較高的依從性,潛意識(shí)上傾向于接受推銷(xiāo)。一方面,這得益于智能銷(xiāo)售的擬人化設(shè)計(jì)。擬人化設(shè)計(jì)能夠顯著增加用戶接受聊天機(jī)器人建議的可能性,而社會(huì)臨場(chǎng)感在這一過(guò)程中起到中介作用[14]?;诮换ナ角榫w學(xué)習(xí)模型,大語(yǔ)言模型能通過(guò)構(gòu)建對(duì)話場(chǎng)景和刻畫(huà)客戶畫(huà)像,增強(qiáng)情緒感知能力,預(yù)測(cè)客戶的意圖、情緒和對(duì)話的狀態(tài)[i5],增強(qiáng)客戶對(duì)話的真實(shí)感。另一方面,銀行與客戶之間權(quán)力結(jié)構(gòu)的轉(zhuǎn)變也會(huì)產(chǎn)生影響。智能銷(xiāo)售使得傳統(tǒng)銷(xiāo)售中的“銀行主導(dǎo)”模式轉(zhuǎn)變?yōu)椤翱蛻糁鲗?dǎo)”模式,增強(qiáng)了銀行與客戶的共情感,提高了客戶接受建議的可能性。
然而,另一些研究則揭示了這項(xiàng)技術(shù)在現(xiàn)階段的局限性。相較于傳統(tǒng)的人工客服和銷(xiāo)售,客戶在使用以大語(yǔ)言模型為基礎(chǔ)的聊天系統(tǒng)時(shí)仍然對(duì)其服務(wù)效率有所顧慮,特別是在處理復(fù)雜客戶需求時(shí),大語(yǔ)言模型可能會(huì)出現(xiàn)耗時(shí)更長(zhǎng)和錯(cuò)誤更多的問(wèn)題。更嚴(yán)重的是,大語(yǔ)言模型存在“幻覺(jué)”現(xiàn)象,即可能生成與事實(shí)不符的、看似合理卻完全錯(cuò)誤的信息,這對(duì)高度要求準(zhǔn)確性的金融領(lǐng)域構(gòu)成了重大的潛在風(fēng)險(xiǎn)。此外,對(duì)于不同的用戶群體,大語(yǔ)言模型的生成結(jié)果并不一致,在可靠性和一致性上不如基于規(guī)則的聊天機(jī)器人[16]。
鑒于上述挑戰(zhàn),現(xiàn)有的大語(yǔ)言模型更多地被定位為輔助工具,在“人在回路”的協(xié)同框架下運(yùn)作,該框架旨在融合人工智能的數(shù)據(jù)處理效率與人工坐席的專(zhuān)業(yè)判斷、共情能力及對(duì)復(fù)雜情境的最終裁決權(quán),以此優(yōu)勢(shì)互補(bǔ)。在此模式下,大語(yǔ)言模型的核心任務(wù)是幫助人工坐席進(jìn)行客戶需求的簡(jiǎn)單識(shí)別和分類(lèi),以及執(zhí)行諸如實(shí)時(shí)對(duì)話摘要生成、客戶情緒動(dòng)態(tài)分析、內(nèi)部知識(shí)庫(kù)智能檢索等任務(wù),從而將人工坐席從重復(fù)性工作中解放出來(lái),使其專(zhuān)注于更高價(jià)值的溝通環(huán)節(jié)。在客戶意圖的精準(zhǔn)識(shí)別和分類(lèi)這一核心輔助任務(wù)上,學(xué)術(shù)界更為關(guān)注如何最大化模型的輔助效率。例如,Liu等[17]為解決標(biāo)準(zhǔn)模型難以充分理解客戶意圖的問(wèn)題,提出了一種名為icsBERTs的優(yōu)化模型。該模型的核心創(chuàng)新點(diǎn)在于兩個(gè)方面:一是它引入了自動(dòng)詞提取機(jī)制,用以識(shí)別并突出客戶話語(yǔ)中的關(guān)鍵領(lǐng)域術(shù)語(yǔ);二是它設(shè)計(jì)了一個(gè)多任務(wù)訓(xùn)練框架,將主要的“意圖分類(lèi)”任務(wù)與輔助的“關(guān)鍵術(shù)語(yǔ)檢測(cè)”任務(wù)相結(jié)合進(jìn)行同步訓(xùn)練。通過(guò)這種方式,大語(yǔ)言模型被引導(dǎo)去關(guān)注那些對(duì)判斷客戶真實(shí)意圖至關(guān)重要的詞匯,從而顯著提升了大語(yǔ)言模型在數(shù)據(jù)集上的文本分類(lèi)準(zhǔn)確性。
(二)金融市場(chǎng)業(yè)務(wù)
大語(yǔ)言模型在金融市場(chǎng)業(yè)務(wù)中的應(yīng)用主要體現(xiàn)在市場(chǎng)預(yù)測(cè)和資產(chǎn)管理兩個(gè)方面。隨著金融市場(chǎng)的復(fù)雜性不斷提升,傳統(tǒng)方法在處理市場(chǎng)波動(dòng)和不確定性方面逐漸暴露出局限性,而大語(yǔ)言模型憑借其強(qiáng)大的數(shù)據(jù)處理能力和靈活的預(yù)測(cè)機(jī)制,為金融市場(chǎng)業(yè)務(wù)帶來(lái)了新的突破。
1.市場(chǎng)預(yù)測(cè):分析結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)
通過(guò)分析大量結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),大語(yǔ)言模型能夠幫助銀行和投資者更準(zhǔn)確地預(yù)測(cè)市場(chǎng)趨勢(shì)。傳統(tǒng)的市場(chǎng)預(yù)測(cè)研究高度依賴(lài)股票價(jià)格、交易量等結(jié)構(gòu)化時(shí)間序列數(shù)據(jù),普遍采用計(jì)量經(jīng)濟(jì)模型或經(jīng)典的機(jī)器學(xué)習(xí)方法進(jìn)行分析。然而,這些方法通?;跀?shù)據(jù)平穩(wěn)性的統(tǒng)計(jì)假設(shè),難以捕捉金融市場(chǎng)中普遍存在的劇烈波動(dòng)、非線性及復(fù)雜的長(zhǎng)程依賴(lài)關(guān)系。針對(duì)以上不足,Kurisinkel等[18使用大語(yǔ)言模型進(jìn)行時(shí)間序列預(yù)測(cè),發(fā)現(xiàn)大語(yǔ)言模型基于少樣本學(xué)習(xí)的預(yù)測(cè)在具有明顯趨勢(shì)的時(shí)間序列方面表現(xiàn)良好,能夠同時(shí)使用價(jià)格信息和文本信息進(jìn)行股票價(jià)格的時(shí)間序列預(yù)測(cè)。但是,Tang等[19]認(rèn)為,在缺乏周期性的數(shù)據(jù)集方面,大語(yǔ)言模型的預(yù)測(cè)性明顯不足,結(jié)構(gòu)變化的穩(wěn)定性較弱。
針對(duì)這一問(wèn)題,學(xué)術(shù)界提出了創(chuàng)新的解決方案。其中,“重編程”技術(shù)成為一個(gè)重要的研究方向。Jin等[20]提出了Time-LLM模型,該模型通過(guò)將時(shí)間序列“重編程”為大語(yǔ)言模型可以理解的文本化表示,有效增強(qiáng)了模型對(duì)時(shí)間依賴(lài)性和非線性特征的識(shí)別能力。該方法將原始的時(shí)間序列數(shù)據(jù)分割成多個(gè)片段,隨后將其轉(zhuǎn)換為類(lèi)似自然語(yǔ)言的輸入,從而利用大語(yǔ)言模型強(qiáng)大的文本處理架構(gòu)進(jìn)行預(yù)測(cè)。GPT4TS和TimeGPT等模型也采用了相似的技術(shù),通過(guò)對(duì)海量時(shí)間序列數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,展現(xiàn)了強(qiáng)大的零樣本預(yù)測(cè)能力,在特定場(chǎng)景下甚至超越了專(zhuān)門(mén)為時(shí)間序列設(shè)計(jì)的模型。
然而,關(guān)于大語(yǔ)言模型在時(shí)間序列預(yù)測(cè)中的核心作用機(jī)制,學(xué)術(shù)界仍存在爭(zhēng)議。Noguer等[21]認(rèn)為,類(lèi)似于KAN和PatchTST等專(zhuān)業(yè)化模型,在處理復(fù)雜數(shù)據(jù)場(chǎng)景時(shí)可能比通用的大語(yǔ)言模型更為高效和穩(wěn)健。Tan等[22基于“消融實(shí)驗(yàn)”研究發(fā)現(xiàn),在某些情況下,移除大語(yǔ)言模型中的核心注意力機(jī)制,或?qū)⑵涮鎿Q為基礎(chǔ)的注意力層,并不會(huì)降低預(yù)測(cè)性能,有時(shí)甚至?xí)?lái)改善。這表明如何更好地將大語(yǔ)言模型應(yīng)用于時(shí)間序列預(yù)測(cè)領(lǐng)域仍是一個(gè)開(kāi)放性問(wèn)題。
除了處理數(shù)字序列,大語(yǔ)言模型在解讀新聞報(bào)道、公司財(cái)報(bào)和社交媒體討論等非結(jié)構(gòu)化文本數(shù)據(jù)方面擁有較大優(yōu)勢(shì),能夠模擬人類(lèi)的認(rèn)識(shí)進(jìn)行經(jīng)濟(jì)決策[23]。由于不同來(lái)源的金融文本在內(nèi)容規(guī)范性、表述客觀性和信息密度上存在顯著差異,其包含的信息量也各有側(cè)重[24],因而需要更細(xì)致的分析方法。情感分析等傳統(tǒng)的自然語(yǔ)言處理方法大多停留在文檔或句子級(jí)別,難以捕捉市場(chǎng)情緒的細(xì)微差別。大語(yǔ)言模型則將情感分析提升到了方面級(jí)別,能夠精確識(shí)別市場(chǎng)對(duì)某一特定事件、政策或公司具體業(yè)務(wù)的復(fù)雜情緒,從而更敏銳地預(yù)警潛在的市場(chǎng)波動(dòng)。多項(xiàng)研究已經(jīng)證實(shí),大語(yǔ)言模型在金融情感分析任務(wù)上顯著優(yōu)于傳統(tǒng)方法。例如,Lopez-Lira和Tang[25]認(rèn)為,利用ChatGPT分析新聞?lì)^條的情緒,可以有效預(yù)測(cè)次日的股票回報(bào)。Kim等[26]認(rèn)為,通過(guò)分析師報(bào)告訓(xùn)練的大語(yǔ)言模型,能夠構(gòu)建出超越市場(chǎng)基準(zhǔn)的投資組合。何勇等[27]則基于BERT和ChatGPT模型,分析了財(cái)經(jīng)新聞文本的情感傾向,以此探索能帶來(lái)超額收益的量化投資策略。李春濤等[28]認(rèn)為,大語(yǔ)言模型在金融市場(chǎng)預(yù)測(cè)中具有應(yīng)用潛力,GPT在提高文本數(shù)據(jù)處理效率、增強(qiáng)文本指標(biāo)刻畫(huà)能力、提升文本指標(biāo)衡量精度和豐富文本指標(biāo)信息含量上具有核心優(yōu)勢(shì)。
為進(jìn)一步提升預(yù)測(cè)精度,研究者們正在探索更為先進(jìn)的大語(yǔ)言模型應(yīng)用框架。由于通用大語(yǔ)言模型并未針對(duì)金融領(lǐng)域的專(zhuān)業(yè)術(shù)語(yǔ)和語(yǔ)境進(jìn)行優(yōu)化,直接應(yīng)用可能降低情緒分析的可靠性[29]。為此,姜富偉等[30]創(chuàng)新地融合結(jié)構(gòu)化金融數(shù)據(jù)和非結(jié)構(gòu)化文本,以股票的實(shí)際市場(chǎng)回報(bào)作為情緒標(biāo)簽對(duì)BERT模型進(jìn)行微調(diào),訓(xùn)練出了更適用于中國(guó)金融市場(chǎng)的中文金融大語(yǔ)言模型,其構(gòu)建的情緒指標(biāo)在預(yù)測(cè)能力上遠(yuǎn)超傳統(tǒng)詞典法。檢索增強(qiáng)生成技術(shù)也被用于分析金融情感。該方法將大語(yǔ)言模型與一個(gè)外部的、包含專(zhuān)業(yè)金融知識(shí)的數(shù)據(jù)庫(kù)相結(jié)合,在生成分析結(jié)果前先檢索相關(guān)信息,顯著提升了預(yù)測(cè)的準(zhǔn)確性和可解釋性。此外,為克服單一市場(chǎng)數(shù)據(jù)的局限性,Ding等[31提出了一個(gè)融合全球市場(chǎng)信息和強(qiáng)化學(xué)習(xí)的框架,其訓(xùn)練出的模型在預(yù)測(cè)中國(guó)A股市場(chǎng)的表現(xiàn)時(shí),遠(yuǎn)勝于僅依賴(lài)本地?cái)?shù)據(jù)的模型。
2.資產(chǎn)管理:驅(qū)動(dòng)動(dòng)態(tài)組合管理與個(gè)性化投資
傳統(tǒng)的資產(chǎn)組合管理以馬科維茨的現(xiàn)代投資組合理論為基石。該理論通過(guò)數(shù)學(xué)規(guī)劃,在給定的風(fēng)險(xiǎn)水平下最大化預(yù)期收益,其核心在于利用歷史數(shù)據(jù)的均值、方差和協(xié)方差進(jìn)行靜態(tài)優(yōu)化。但這種方法的有效性高度依賴(lài)于對(duì)未來(lái)市場(chǎng)收益和風(fēng)險(xiǎn)的準(zhǔn)確預(yù)測(cè),并且難以適應(yīng)由突發(fā)事件驅(qū)動(dòng)的市場(chǎng)劇烈變化。大語(yǔ)言模型能夠?qū)崟r(shí)處理和解讀海量的市場(chǎng)信息,包括新聞、財(cái)報(bào)和社交媒體討論等,從而實(shí)現(xiàn)更為動(dòng)態(tài)和靈活的資產(chǎn)組合管理。眾多研究者證明了ChatGPT在資產(chǎn)管理收益和滿足投資者偏好等方面存在顯著優(yōu)勢(shì)。從大語(yǔ)言模型在股票市場(chǎng)組合管理中的應(yīng)用看,ChatGPT能夠通過(guò)分析單個(gè)股票新聞標(biāo)題的情感得分生成更優(yōu)的投資組合,并且基于ChatGPT情緒得分的投資組合優(yōu)于基于其他大語(yǔ)言模型的投資組合[25]。盡管大語(yǔ)言模型在選股方面能力強(qiáng)大,但在個(gè)股的權(quán)重分配方面還有所欠缺,而結(jié)合傳統(tǒng)的均值—方差投資組合優(yōu)化模型能夠增強(qiáng)分配能力[32]。
除了優(yōu)化投資組合收益與防范風(fēng)險(xiǎn),大語(yǔ)言模型在個(gè)性化資產(chǎn)管理方面也展現(xiàn)出巨大潛力,可以通過(guò)與用戶進(jìn)行自然語(yǔ)言對(duì)話,更深入地理解其財(cái)務(wù)狀況、投資目標(biāo)、風(fēng)險(xiǎn)承受能力、年齡乃至個(gè)人價(jià)值觀。多項(xiàng)研究證實(shí)了大語(yǔ)言模型在這一領(lǐng)域的價(jià)值。Oehler和Hom[33認(rèn)為,無(wú)論是對(duì)于保守型還是進(jìn)取型投資者,在ChatGPT推薦的定制化投資組合中,風(fēng)險(xiǎn)調(diào)整后的收益均與所對(duì)比的基準(zhǔn)投資組合表現(xiàn)相當(dāng)。 Kim[34] 認(rèn)為,ChatGPT能夠根據(jù)具體的經(jīng)濟(jì)形勢(shì),智能推薦合適的資產(chǎn)類(lèi)別,實(shí)現(xiàn)真正意義上動(dòng)態(tài)的資產(chǎn)配置服務(wù)。大語(yǔ)言模型在資產(chǎn)管理中的應(yīng)用正在迅速擴(kuò)展至股票以外的領(lǐng)域。Ko和Lee[3]認(rèn)為,與隨機(jī)選擇的投資組合相比,ChatGPT構(gòu)建的多元化組合資產(chǎn)類(lèi)別更豐富,整體績(jī)效更好。
盡管大語(yǔ)言模型在資產(chǎn)管理領(lǐng)域前景廣闊,但其固有的局限性同樣不容忽視。大語(yǔ)言模型在決策時(shí)可能會(huì)表現(xiàn)出與人類(lèi)投資者相似的認(rèn)知偏差。例如,Winder等[3認(rèn)為,大語(yǔ)言模型可能存在處置效應(yīng),即過(guò)早賣(mài)出盈利資產(chǎn),而過(guò)久持有虧損資產(chǎn),這種非理性行為可能導(dǎo)致投資組合的整體風(fēng)險(xiǎn)不降反升。另一個(gè)更為嚴(yán)峻的挑戰(zhàn)是前瞻性偏見(jiàn)。許多研究在評(píng)估大語(yǔ)言模型表現(xiàn)時(shí),使用了在模型訓(xùn)練數(shù)據(jù)截止日期之后才發(fā)布的財(cái)經(jīng)新聞或數(shù)據(jù),這導(dǎo)致了模型收益率被人為夸大。Pelster和Val[37]認(rèn)為,必須采取更為嚴(yán)謹(jǐn)?shù)脑u(píng)估方法。他們?cè)谑褂肅hatGPT預(yù)測(cè)未來(lái)季度的標(biāo)普500股票收益時(shí),嚴(yán)格確保模型僅使用在預(yù)測(cè)時(shí)間點(diǎn)之前可獲得的市場(chǎng)信息。在這種動(dòng)態(tài)調(diào)整的“前向測(cè)試”框架下,大語(yǔ)言模型構(gòu)建的資產(chǎn)組合收益率有所下降,但ChatGPT構(gòu)建的組合依然獲得了顯著的正收益,并證明了其適應(yīng)市場(chǎng)信息進(jìn)行實(shí)時(shí)調(diào)整的潛力。這些發(fā)現(xiàn)與一項(xiàng)針對(duì)包含GPT-4o和多種金融專(zhuān)用大模型在內(nèi)的綜合測(cè)評(píng)結(jié)果相似,該測(cè)評(píng)顯示,雖然大語(yǔ)言模型在信息提取和文本分析任務(wù)中表現(xiàn)卓越,但在高級(jí)推理和復(fù)雜任務(wù)方面,其表現(xiàn)仍有很大提升空間[38]。
(三)風(fēng)控業(yè)務(wù)
風(fēng)險(xiǎn)管理是銀行業(yè)務(wù)中的關(guān)鍵一環(huán),大語(yǔ)言模型主要應(yīng)用于信用風(fēng)險(xiǎn)管理和操作風(fēng)險(xiǎn)管理。
1.信用風(fēng)險(xiǎn)管理:結(jié)合海量數(shù)據(jù)精準(zhǔn)刻畫(huà)用戶畫(huà)像
傳統(tǒng)的信用風(fēng)險(xiǎn)評(píng)估高度依賴(lài)規(guī)則驅(qū)動(dòng)或傳統(tǒng)的機(jī)器學(xué)習(xí)方法。這些方法主要處理結(jié)構(gòu)化的財(cái)務(wù)數(shù)據(jù),雖然在特定場(chǎng)景下行之有效,但仍然面臨數(shù)據(jù)局限性、模型剛性和“數(shù)據(jù)冷啟動(dòng)”等問(wèn)題。大語(yǔ)言模型憑借其強(qiáng)大的多任務(wù)學(xué)習(xí)和零樣本或少樣本學(xué)習(xí)能力,為解決上述難題提供了可能。在客戶信息有限的情況下,它們能夠整合并分析海量的歷史數(shù)據(jù),構(gòu)建客戶信用狀況的全方面畫(huà)像[39]。這種能力使得銀行能夠?qū)Ω笠?guī)模、更多樣化的信貸組合刻畫(huà)更精準(zhǔn)的風(fēng)險(xiǎn)畫(huà)像。在此基礎(chǔ)之上,研究者們已經(jīng)探索出多種利用大語(yǔ)言模型提升信用風(fēng)險(xiǎn)評(píng)估精度的方法,其應(yīng)用范圍從精準(zhǔn)預(yù)測(cè)個(gè)體違約概率延伸至評(píng)估系統(tǒng)性風(fēng)險(xiǎn)。例如,在提升違約預(yù)測(cè)精度方面,一項(xiàng)名為標(biāo)注引導(dǎo)提示(LabeledGuided Prompting)的創(chuàng)新技術(shù)通過(guò)在提示中為模型提供帶有標(biāo)簽的違約案例作為上下文,能夠引導(dǎo)大語(yǔ)言模型生成遠(yuǎn)比傳統(tǒng)方法更精確的違約概率預(yù)測(cè)報(bào)告[40]。此外,對(duì)于高風(fēng)險(xiǎn)客戶群體,如信息不透明的初創(chuàng)企業(yè)或中小型企業(yè),大語(yǔ)言模型展現(xiàn)了獨(dú)特的優(yōu)勢(shì),其能夠通過(guò)分析商業(yè)計(jì)劃書(shū)、創(chuàng)始人背景和行業(yè)趨勢(shì)等非傳統(tǒng)數(shù)據(jù),有效預(yù)測(cè)其未來(lái)的可持續(xù)性和破產(chǎn)風(fēng)險(xiǎn)[41];同時(shí)能夠有效提升信貸可得性,為新創(chuàng)企業(yè)提供關(guān)鍵的資金支持[42]。
2.操作風(fēng)險(xiǎn)管理:識(shí)別外部和內(nèi)部操作風(fēng)險(xiǎn)
在操作風(fēng)險(xiǎn)管理領(lǐng)域,大語(yǔ)言模型正成為銀行抵御日益復(fù)雜和隱蔽的金融犯罪、加強(qiáng)內(nèi)部控制的關(guān)鍵技術(shù)。傳統(tǒng)的操作風(fēng)險(xiǎn)管理體系嚴(yán)重依賴(lài)于傳統(tǒng)的機(jī)器學(xué)習(xí)模型和基于規(guī)則的系統(tǒng)。這些系統(tǒng)雖然能夠捕獲已知的欺詐模式,但在面對(duì)不斷演變的新型欺詐手段和復(fù)雜的洗錢(qián)網(wǎng)絡(luò)時(shí),往往顯得反應(yīng)遲緩、誤報(bào)率高,難以處理和關(guān)聯(lián)海量的非結(jié)構(gòu)化數(shù)據(jù)。大語(yǔ)言模型能夠在一定程度上解決上述問(wèn)題。在欺詐檢測(cè)方面,大語(yǔ)言模型能夠同時(shí)分析結(jié)構(gòu)化的交易數(shù)據(jù)(如交易金額、頻率、地點(diǎn))和非結(jié)構(gòu)化的文本信息(如商戶描述、用戶評(píng)論、內(nèi)部調(diào)查附注)。通過(guò)理解交易的上下文和語(yǔ)義,大語(yǔ)言模型可以識(shí)別出那些單個(gè)指標(biāo)看似正常、但組合起來(lái)卻構(gòu)成高度可疑行為的復(fù)雜交易模式,預(yù)防潛在的欺詐活動(dòng)或有組織的聯(lián)合欺詐行為。除了抵御外部風(fēng)險(xiǎn),大語(yǔ)言模型還能加強(qiáng)銀行的內(nèi)部操作風(fēng)險(xiǎn)管理。通過(guò)分析內(nèi)部通訊和操作日志,大語(yǔ)言模型可以監(jiān)測(cè)并識(shí)別預(yù)示著員工不當(dāng)行為或內(nèi)部欺詐的語(yǔ)言模式和異常操作,如未經(jīng)授權(quán)的系統(tǒng)訪問(wèn)或違反交易規(guī)定的討論,從而實(shí)現(xiàn)風(fēng)險(xiǎn)的早期預(yù)警和預(yù)防[43]。
四、大語(yǔ)言模型應(yīng)用于銀行業(yè)的潛在風(fēng)險(xiǎn)防范
作為一種新興科技,大語(yǔ)言模型在掀起銀行業(yè)變革的同時(shí)注定機(jī)遇與挑戰(zhàn)并存。學(xué)術(shù)界和業(yè)界對(duì)這方面問(wèn)題的討論日益增多,具體體現(xiàn)在數(shù)據(jù)風(fēng)險(xiǎn)、模型風(fēng)險(xiǎn)和部署風(fēng)險(xiǎn)三個(gè)方面。
(一)數(shù)據(jù)風(fēng)險(xiǎn):偏見(jiàn)、泄露與對(duì)抗性攻擊的挑戰(zhàn)
從數(shù)據(jù)上看,大語(yǔ)言模型訓(xùn)練在使用銀行數(shù)據(jù)時(shí)可能會(huì)出現(xiàn)隱含偏見(jiàn)、數(shù)據(jù)泄露或?qū)剐怨舻娘L(fēng)險(xiǎn)。首先,大語(yǔ)言模型依賴(lài)于大規(guī)模數(shù)據(jù)訓(xùn)練,但這些數(shù)據(jù)本身可能包含偏見(jiàn)。如果銀行使用大語(yǔ)言模型進(jìn)行決策,模型中的偏見(jiàn)可能會(huì)逐步累積并被放大。如果這種偏見(jiàn)長(zhǎng)期不被糾正,可能會(huì)加劇金融排斥,導(dǎo)致某些群體在貸款、投資機(jī)會(huì)等方面被不公平對(duì)待。其次,銀行處理大量敏感的客戶數(shù)據(jù),包括個(gè)人信息、財(cái)務(wù)記錄等。大語(yǔ)言模型因其訓(xùn)練機(jī)制中固有的過(guò)擬合風(fēng)險(xiǎn)與記憶效應(yīng),可能無(wú)意中“記住”甚至直接復(fù)現(xiàn)訓(xùn)練數(shù)據(jù)中的敏感內(nèi)容,并在生成文本中泄露[4。最后,大語(yǔ)言模型容易受到對(duì)抗性攻擊的影響,即攻擊者通過(guò)向模型輸入精心設(shè)計(jì)的數(shù)據(jù),誘導(dǎo)模型生成錯(cuò)誤的或有害的結(jié)果。在銀行業(yè)務(wù)中,這類(lèi)攻擊可能用于操縱信用評(píng)分、欺詐檢測(cè)系統(tǒng)或自動(dòng)交易決策。如果銀行使用大語(yǔ)言模型進(jìn)行重要的金融決策,數(shù)據(jù)泄露或?qū)剐怨艨赡軐?dǎo)致嚴(yán)重的金融損失或市場(chǎng)波動(dòng),甚至可能被惡意利用并且造成金融系統(tǒng)的不穩(wěn)定性。
(二)模型風(fēng)險(xiǎn):幻覺(jué)、缺乏解釋性與透明性的困境
從模型上看,大語(yǔ)言模型本身存在幻覺(jué)問(wèn)題和缺乏解釋性、透明性的風(fēng)險(xiǎn)。首先,大語(yǔ)言模型存在幻覺(jué)問(wèn)題,會(huì)生成虛假的或不準(zhǔn)確的回答。金融決策需要基于精確的數(shù)據(jù)和事實(shí),但大語(yǔ)言模型有時(shí)卻會(huì)“編造”事實(shí),而不是從數(shù)據(jù)中推導(dǎo)出結(jié)論。這種現(xiàn)象在智能客服、市場(chǎng)分析等銀行應(yīng)用中可能導(dǎo)致錯(cuò)誤的建議或決策,進(jìn)一步影響用戶信任,甚至引起銀行的聲譽(yù)風(fēng)險(xiǎn)、法律風(fēng)險(xiǎn)和操作風(fēng)險(xiǎn)。其次,大語(yǔ)言模型缺乏解釋性和透明性。大語(yǔ)言模型通常被稱(chēng)為“黑箱”,其決策過(guò)程難以解釋。這種解釋性和透明性的缺乏在銀行多個(gè)領(lǐng)域中產(chǎn)生影響,容易導(dǎo)致合規(guī)性和可信度問(wèn)題。一方面,銀行業(yè)是高度監(jiān)管的行業(yè),金融機(jī)構(gòu)在作出任何決策時(shí)都必須遵守各類(lèi)法規(guī)。傳統(tǒng)的決策系統(tǒng)通常能夠記錄詳細(xì)的決策路徑和依據(jù),便于審核和追。而大語(yǔ)言模型難以提供可解釋且透明的決策過(guò)程,使得銀行面臨合規(guī)風(fēng)險(xiǎn)。另一方面,客戶信任是金融機(jī)構(gòu)賴(lài)以生存的重要基礎(chǔ)。若在使用大語(yǔ)言模型的過(guò)程中,銀行對(duì)于一些軟信息無(wú)法向客戶清晰解釋模型如何獲取相關(guān)數(shù)據(jù)或得出某些結(jié)論,客戶可能會(huì)對(duì)銀行的決策公正性產(chǎn)生懷疑。
(三)部署風(fēng)險(xiǎn):過(guò)度依賴(lài)與決策趨同化的危機(jī)
從部署上看,銀行應(yīng)用大語(yǔ)言模型容易出現(xiàn)過(guò)度依賴(lài)的風(fēng)險(xiǎn)。過(guò)度依賴(lài)大語(yǔ)言模型可能導(dǎo)致銀行出現(xiàn)技術(shù)的單一性和決策的趨同化。銀行業(yè)作為高度競(jìng)爭(zhēng)和技術(shù)驅(qū)動(dòng)的行業(yè),過(guò)度依賴(lài)大語(yǔ)言模型可能導(dǎo)致創(chuàng)新停滯。此外,過(guò)度依賴(lài)某個(gè)大語(yǔ)言模型的局限性也可能導(dǎo)致決策模型的同質(zhì)化,使得各銀行在風(fēng)險(xiǎn)評(píng)估、信用審核和資產(chǎn)管理等業(yè)務(wù)中的決策趨于一致,減少了差異化競(jìng)爭(zhēng)的機(jī)會(huì),甚至可能導(dǎo)致趨同化決策下大規(guī)模市場(chǎng)風(fēng)險(xiǎn)的傳染。
五、結(jié)論與啟示
本文通過(guò)梳理現(xiàn)有研究發(fā)現(xiàn),大語(yǔ)言模型在多數(shù)銀行的應(yīng)用尚處于技術(shù)儲(chǔ)備和淺層試驗(yàn)階段,還很難真正脫離以人類(lèi)判斷為核心的傳統(tǒng)銀行模式來(lái)發(fā)揮作用。從具體的業(yè)務(wù)應(yīng)用層面審視大語(yǔ)言模型在銀行業(yè)中的作用:在銀行零售業(yè)務(wù)方面,相較于傳統(tǒng)聊天機(jī)器人,大語(yǔ)言模型作為智能客服與智能銷(xiāo)售的關(guān)鍵技術(shù),在交互真實(shí)性、語(yǔ)義理解準(zhǔn)確性和個(gè)性化服務(wù)方面具有顯著的比較優(yōu)勢(shì),從而在提升客戶參與度、滿意度和購(gòu)買(mǎi)意愿上表現(xiàn)得更為突出;但其在處理高復(fù)雜度、非標(biāo)準(zhǔn)化需求時(shí)存在瓶頸,且生成結(jié)果的可靠性與事實(shí)一致性亦有待確證,因而當(dāng)前其角色多被定位為對(duì)客戶需求進(jìn)行初步分類(lèi)的輔助工具。在金融市場(chǎng)業(yè)務(wù)方面,現(xiàn)有研究集中探討大語(yǔ)言模型在市場(chǎng)預(yù)測(cè)和資產(chǎn)管理中的應(yīng)用。對(duì)于市場(chǎng)預(yù)測(cè)而言,大語(yǔ)言模型通過(guò)分析海量結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)增強(qiáng)市場(chǎng)趨勢(shì)的預(yù)測(cè)能力,尤其在時(shí)間序列預(yù)測(cè)和金融文本分析領(lǐng)域極具應(yīng)用潛力,但在處理非周期性的結(jié)構(gòu)化數(shù)據(jù)時(shí)仍面臨局限,需要經(jīng)過(guò)微調(diào)等方式構(gòu)建專(zhuān)用大語(yǔ)言模型提升情感分析的準(zhǔn)確性。對(duì)于資產(chǎn)管理而言,大語(yǔ)言模型能夠生成更靈活的投資組合,并依據(jù)投資者動(dòng)態(tài)需求調(diào)整資產(chǎn)配置,然而,模型內(nèi)生的認(rèn)知偏見(jiàn)與基于已知信息的前瞻性偏見(jiàn)可能影響投資決策的客觀性,需審慎評(píng)估其生成的投資組合的具體表現(xiàn)。在風(fēng)控業(yè)務(wù)方面,目前大語(yǔ)言模型的應(yīng)用主要集中于信用風(fēng)險(xiǎn)管理和操作風(fēng)險(xiǎn)管理,對(duì)于銀行其他關(guān)鍵風(fēng)險(xiǎn)的控制研究則相對(duì)匱乏。盡管大語(yǔ)言模型在銀行各領(lǐng)域均有極強(qiáng)的應(yīng)用潛力,但其在數(shù)據(jù)安全、模型穩(wěn)健性和合規(guī)部署方面仍面臨諸多風(fēng)險(xiǎn),如何構(gòu)建一個(gè)審慎的框架來(lái)權(quán)衡其應(yīng)用效用與潛在風(fēng)險(xiǎn),仍是有待深人研究的核心議題。
總體而言,未來(lái)進(jìn)一步發(fā)揮大語(yǔ)言模型的文本處理、分析和生成能力,能夠有效提升傳統(tǒng)銀行業(yè)務(wù)的運(yùn)營(yíng)效率,提供更為實(shí)時(shí)、精準(zhǔn)的市場(chǎng)洞察,驅(qū)動(dòng)銀行逐步向以數(shù)據(jù)為主的決策模式轉(zhuǎn)型。然而,合規(guī)性和安全性依然是銀行經(jīng)營(yíng)的基石,這意味著在保障業(yè)務(wù)穩(wěn)定性與應(yīng)對(duì)高風(fēng)險(xiǎn)事務(wù)上,傳統(tǒng)模式在可預(yù)見(jiàn)的未來(lái)仍將起到關(guān)鍵作用。但是,隨著技術(shù)的持續(xù)完善和模型獨(dú)立操作能力的增強(qiáng),大語(yǔ)言模型在銀行的應(yīng)用可能迎來(lái)井噴式的發(fā)展。此外,大語(yǔ)言模型現(xiàn)有的潛在應(yīng)用方向基本集中在銀行內(nèi)部業(yè)務(wù),目前未有研究探討應(yīng)用于銀行外部監(jiān)管框架的可能性。未來(lái)可探索在銀行端與監(jiān)管機(jī)構(gòu)之間建立更為緊密的協(xié)作機(jī)制,以技術(shù)手段提升大語(yǔ)言模型的透明度、可解釋性和安全性,最終確保其應(yīng)用既能充分釋放技術(shù)紅利,又能在審慎的監(jiān)管框架下安全、穩(wěn)健地運(yùn)作,從而保障整個(gè)金融系統(tǒng)的穩(wěn)定。
參考文獻(xiàn):
[1] MURINDE V,RIZOPOULOS E, ZACHARIADIS M. The impact of the fintech revolution on the future of banking: opportunities and risks[J]. International review of financial analysis,2O22,81(5) :102103.
[2]汪壽陽(yáng),李明琛,楊昆,等.ChatGPT °+ 金融:八個(gè)值得關(guān)注的研究方向與問(wèn)題[J].管理評(píng)論,2023,35(4):3-11.
[3] MIKOLOV T,SUTSKEVER I,CHEN K,et al.Distributed representationsof wordsand phrasesand their compositionality[C]/BURGES C JC,BOTTOU L,WELLING M, et al. Advances in neural information processing systems 26.Red Hook:Curran Associates Inc.,2013:3111-3119.
[4]VASWANI A,SHAZEER N,PARMAR N,et al. Atention is all you need[C]//GUYON I,LUXBURG U V, BENGIU S,et al. Advances In neural intormation processng systems SU. Ked Hook: Uurran Associates Inc.,ZU1/: 5998-6008.
[5]RADFORD A,NARASIMHAN K,SALIMANS T,et al. Improving language understanding by generative pre-training[R]. OpenAI,2018.
[6]DEVLIN J,CHANG M W,LEE K,et al. Bert: bidirectional encoder representations from transformers[J/OL]. arXiv,(2018-10-11) [2025-06-09].https://arxiv.0rg/abs/1810.04805.
[7]GUO D,YANG D,ZHANG H,et al. DeepSeek-r1: incentivizing reasoning capability in llms via reinforcement learning[J/OL].arXiv,(2025-01-22)[2025-06-09]. https://arxiv.org/abs/2501.12948.
[8]DAI D,DENG C,ZHAO C,et al.DeepSeekMoE:towards ultimate expert specialization in mixture-of-experts language models[J/OL].arXiv,(2024-01-11)[2025-06-09].https://arxiv.org/abs/2401.06066.
[9]HUANG SYB,LEE C J.Predicting continuance intention to fintech chatbot[J].Computers in human behavior, 2022,129(4):107027.
[10]HUANG PC,PAN ML.A retrieval-based Chatbot for customer service using large language model[C]/SHARMA A,SINGH B.2024 International conference on future technologies for smart society (ICFTSS).Piscataway:IEEE, 2024:128-131.
[11]TRIVEDI J.Examining the customer experience of using banking chatbots and its impact on brand love:the moderating role of perceived risk[J]. Journal of internet commerce,2019,18(1):91-111.
[12]NISZCZOTA P,ABBAS S. GPT has become financialy literate: insights from financial literacy tests of GPT and a preliminary testof how people use it asa source of advice[J].Finance research leters,2O23,58(12):104333.
[13]SIPOS D. The efects of AI-powered personalization on consumer trust,satisfaction,and purchase intent[J]. European journal of applied science,engineering and technology,2O25,3(2) : 14-24.
[14]ADAM M, WESSEL M, BENLIAN A.AI-based chatbots in customer service and their effects on user compliance [J].Electronic markets,2021,31(2):427-445.
[15]LI Q,ZHENG J,OU Y,et al. Application technology of customer service emotional perception analysis based on big language model[C]/JIAO L,LI J. 20242Oth International conference on natural computation,fuzzy systems and knowledge discovery (ICNC-FSKD). Piscataway:IEEE,2O24:1-6.
[16]LAKKARAJU K,JONES S E,VURUMA S K R,et al. LLMs for financial advisement: a fairness and effcacy study in personal decision making[C]//BALCH T, CALINESCU A,BUESCU C,et al. Proceedings of the fourth acm international conference on AI in finance.New York :ACM,2023:100-107.
[17]LIU S,PENG C, WANG C,et al. Icsberts:optimizing pre-trained language models in intellgent customer service [J].Procedia computer science,2023,222(7):127-136.
[18]KURISINKEL L J, MISHRA P, ZHANG Y. Text2TimeSeries: enhancing financial forecasting through time series prediction updates with event-driven insights from large language models [J/OL].arXiv,(2024-07-04)[2025-06- 09]. https://arxiv.org/abs/2407.03689.
[19]TANG H, ZHANG C,JIN M, et al. Time series forecasting with llms: understanding and enhancing model capabilities[J].Acm sigkdd explorations newsletter,2025,26(2):109-118.
[20]JIN M,WANG S,MA L,et al. Time-llm: time series forecasting by reprogramming large language models [J/OL]. arXiv,(2023-10-03)[2025-06-09].https:/rxiv.org/abs/2310.01728.
[21]NOGUER I ALONSO M,PEREIRA FR.Large language models for financial time series forecasting [J/OL].SSRN, (2024-12-05)[2025-06-09]. https://ssrn.com/abstract=4988022.
[22]TAN M,MERRILL M,GUPTA V,etal. Are language models actuall useful for time series forecasting?[C]// DOSHI-VELEZ F,CHO K,KIELA D,et al. Advances in neural information processng systems 37. Red Hook: Curran AssociatesInc.,2024,37:60162-60191.
「23]林建浩.孫樂(lè)軒 大語(yǔ)言模型與經(jīng)濟(jì)金融文本分析·基本原理.應(yīng)用場(chǎng)景與研究展望[I]計(jì)量經(jīng)濟(jì)學(xué)報(bào).202.5. 5(1):1-34.
[24]范小云,王業(yè)東,王道平,等.不同來(lái)源金融文本信息含量的異質(zhì)性分析——基于混合式文本情緒測(cè)度方法 [J].管理世界,2022,38(10):78-101.
[25]LOPEZ-LIRA A,TANG Y. Can chatgpt forecast stock price movements? Return predictability and large language models[J/OL].arXiv,(2023-04-15)[2025-06-09]. htps://arxiv.0rg/abs/2304.07619.
[26]KIM S,KIM S,KIM Y,et al.LLMs analyzing the analysts:do BERTand GPT extract more value from financial analyst reports?[C]/BALCHT,CALINESCU A,BUESCU C,et al.Proceedings of the fourth acm international conference on AI in finance.New York:ACM,2023:383-391.
[27]何勇,焦麗,楊藝,等.AI大模型賦能金融市場(chǎng)量化投資?——基于另類(lèi)數(shù)據(jù)與傳統(tǒng)金融數(shù)據(jù)的研究[J].計(jì)量 經(jīng)濟(jì)學(xué)報(bào),2024,4(3):761-783.
[28]李春濤,閆續(xù)文,張學(xué)人.GPT在文本分析中的應(yīng)用:一個(gè)基于Stata的集成命令用法介紹[J].數(shù)量經(jīng)濟(jì)技術(shù)經(jīng) 濟(jì)研究,2024,41(5):197-216.
[29]ZHANG B,YANG H,ZHOU T,et al.Enhancing financial sentiment analysis via retrieval augmented large language models[C]/BALCH T,CALINESCU A,BUESCU C,et al. Proceedings of the fourth acm international conference on AI in finance.New York:ACM,2023:349-356.
[30]姜富偉,劉雨旻,孟令超.大語(yǔ)言模型、文本情緒與金融市場(chǎng)[J].管理世界,2024,40(8):42-64.
[31]DING Y,JIA S,MA T,et al.Integrating stock features and global information via large language models for enhanced stock return prediction[J/OL].arXiv,(2023-10-09)[2025-06-09]. htps://arxiv.org/abs/2310.05627.
[32]ROMANKO O,NARAYAN A,KWON R H. Chatgpt-based investment portfolio selection[J]. Operations research forum,2023,4(4):91.
[33]OEHLER A,HORN M.Does ChatGPT provide beter advice than robo-advisors?[J].Finance research leters, 2024,60(1) :104898.
[34]KIMJH. What if ChatGPT were a quant asset manager[J].Finance research letters,2023,58(12):104580.
[35]KO H,LEE J. Can ChatGPT improve investment decisions?From aportfolio management perspective[J].Finance research letters,2024,64(5):105433.
[36]WINDER P, HILDEBRAND C, HARTMANN J. Biased echoes: generative AI models reinforce investment biases and increase portfolio risks of private investors [J/OL].SSRN,(2024-11-08)[2025-06-09]. https:/ssrn.com/ abstract=4968821.
[37]PELSTER M, VAL J. Can ChatGPT assist in picking stocks?[J].Finance research leters,2024,59(1):104786.
[38]李毅,李浩,許驍哲,等.CFB:金融領(lǐng)域大模型評(píng)估方法[J].計(jì)算機(jī)科學(xué)與探索,2024,18(12):3272-3287.
[39]XIA Y,SHI Z,DUX,et al.Extracting narativedata via large language models forloan default prediction:when talk isn'tcheap[J]. Applied economics letters,2025,32(4) :481-486.
[40]TEIXEIRA A C, MARAR V, YAZDANPANAH H, et al. Enhancing credit risk reports generation using llms : an integration of bayesian networks and labeled guide prompting[C]//BALCH T, CALINESCU A,BUESCU C,et al. Proceedings of the fourth acm international conference on AIin finance.New York :ACM,2O23:340-348.
[41]SALEHL,SEMAAN S. The potential of AI in performing financial sentiment analysis for predicting entrepreneur survival[J].Administrative sciences,2024,14(9) :220.
[42]WANG D,LIANG Y, SHEN X. Can artificial intelligence assist banks in improving city entrepreneurship?[J]. Finance research letters,2025,83(13) :107721.
[43]LI C,ZHU Z,HE J,et al. RedChronos:a large language model-based log analysis system for insider threat detection in enterprises [J/OL].arXiv,(2025-03-04)[2025-06-09].https:/arxiv.org/abs/2503.02702.
[44]。姜毅,楊勇,印佳麗,等.大語(yǔ)言模型安全與隱私風(fēng)險(xiǎn)綜述[J/OL].計(jì)算機(jī)研究與發(fā)展,(2025-03-15)[2025- 06-09].http ://kns.cnki.net/kcms/detail/11.1777.TP.20250305.1350.023.html.
Technical Foundations,Application Scenarios, and Risk Mitigation of AI Large Language Models: A Case Study in the Banking Industry
WANG Daoping12,LIANG Yaxi'
(1.School of Finance,Nankai University,Tianjin 3Oo350,China; 2.Academy forAdvanced Interdisciplinary Studies,Nankai University,Tianjin 3Oo35O,China)
Summary:Large language models (LLMs)have becomeacore force driving thedigital transformationof the banking industry,andeirevelopentndaplicationsretriggeringprofoundidustryanges.Intisotext,itasoean inevitable trendforthebanking industryto embraceLLMs.However,most existing research lacks acomprehensive study that systematically combines LLMs with banking operations and deeplyanalyzes their potential application and risks.
This paper adopts a methodologyof systematic literature review and theoretical analysis.Such methodology enables thepapertofirst tracethe technologicalevolutionfromthe TransformertovariouspopularLLMs.Onthis basis,it systematicallyexamines theapplicationscenariosandriskmitigationstrategiesforLLMsinbanksandanalyzes indepth theirapplicationmodes,values,andlimitationsinthecorebusinessThisstudyfindsthat thetechnicalcharacteristicsof LLMs are highlycompatible with the demand for massve unstructured data processingand intellgent decision-making in banks.Specificall,inretailbusiness,LLMsoptimizecustomer experiencebyimprovingthesnseofrealityininteraction andtheaccuracyofsmanticunderstanding.However,duetoreliabilityissues,theyarestillmainlypositionedasauxiliary toolsforhumanagents.Inthefinancial market business,LLMsareabletomergemulti-sourcedata toimprove the eficiencyof marketpredictionandasset management.Yet,due totheendogenous biasof themodelsandthelimitationsof thedata,theectivenessoftheapplcationsstillneedstoecautiouslyevaluatedIntheriskcontrolbusiness,Lshave demonstratedsignificantadvantages inimproving theaccuracyofcreditassessmentandfrauddetectionthrough the integration ofnon-traditionaldata.However,therearealsopotentialrisksinthewideapplicationsofLLMs.LLMs may inadvertently memorize and disclose customers’sensitive financial information during the training process,which posesa direct threat to financial data security and brings serious privacy and compliance risks.
Compared with previous studies,this paper makes two primary contributions.Firstly,this paper goes beyond the generalizeddiscussionofLLMsandfocusesonthebankingindustryasaspecialfield,providingamoredetailedanalysis framework forthestudyofFintechappications.Secondly,thispaperdiffrsfromthediscussionof theimpactof technology atthemacrolevel.Itfocussoncorebusinssenarossuchasetail,iancialmakets,andriskontrol,andiclously analyzes the feasibilityof theirapplications,comparativeadvantages,and industry-specificrisks,therebyrealizing the combinationof theoreticalframeworkandpractice.Toacertainextent,thispaperreveals theinternallogicofAItechnology empowering traditional finane,whichhelpsfinancialinstitutionsandregulatorstoformulate prudentinovationapplication strategiesand governance frameworksinamore targetedmanner.Italsoprovidespotential developmentpaths for the applicationsofLLMsindiferentbusinesssegments,soastobeterbalancethetechnological dividendsand potentialisks, and to promote the banking industry to achieve sustained inteligent upgrading.
Key Words:artificial inteligence;large language models;banking industry;digital transformation; ChatGPT
(責(zé)任編輯:劉欣琦)
東北財(cái)經(jīng)大學(xué)學(xué)報(bào)2025年4期