摘要:綠色債券環(huán)境效益信息披露的質(zhì)量直接關(guān)乎市場的透明度與高質(zhì)量發(fā)展。當(dāng)前,環(huán)境效益信息披露存在披露文件標(biāo)準(zhǔn)化不足、綠色項目動態(tài)追蹤難等痛點。本文基于大模型技術(shù),設(shè)計了智能化信息披露質(zhì)量評估工具,構(gòu)建綠色項目追蹤、動態(tài)指標(biāo)計算及評估報告生成三大模塊,并通過提示詞、幻覺檢測技術(shù)等,確保輸出結(jié)果的科學(xué)性與可靠性。經(jīng)測試,該評估工具性能較好。
關(guān)鍵詞:綠色債券 信息披露 環(huán)境效益 大模型 幻覺檢測
環(huán)境效益信息披露質(zhì)量評價的意義與挑戰(zhàn)
(一)主要意義
作為綠色金融體系中的核心直接融資工具,綠色債券通過定向支持符合標(biāo)準(zhǔn)的綠色項目,既讓投資者獲得財務(wù)回報,又具有顯著的正外部性。這種雙重價值屬性要求建立嚴(yán)格的環(huán)境效益信息披露機制,以滿足投資者對環(huán)境效益的評估需求,保障公眾的知情權(quán)。綠色債券的環(huán)境效益信息披露應(yīng)當(dāng)貫穿發(fā)行、存續(xù)及到期全流程,其中發(fā)行階段的預(yù)期效益披露與存續(xù)期的實際效益驗證構(gòu)成關(guān)鍵閉環(huán)。這一機制既是綠色溢價的價值錨定基礎(chǔ),也是防范“洗綠”風(fēng)險的核心環(huán)節(jié)。
既有研究表明,基于信息不對稱理論,完整的綠色債券環(huán)境效益信息披露可以有效降低綠色債券融資成本(張錦濤等,2024)。然而,針對國內(nèi)外綠色信用債信息披露的縱向追蹤顯示,部分綠色債券在不同階段所披露環(huán)境效益信息的可比性較低,主要表現(xiàn)為信息維度不一致和環(huán)境效益差距較大等方面(劉茜等,2022)。這種信息斷層現(xiàn)象導(dǎo)致市場難以有效驗證環(huán)境效益的真實性,進而削弱了綠色金融工具的定價效率。
(二)政策支持及實踐中面臨的挑戰(zhàn)
2023年,綠色債券標(biāo)準(zhǔn)委員會出臺《綠色債券存續(xù)期信息披露指南》(以下簡稱《指南》),首次統(tǒng)一了我國綠色債券存續(xù)期信息披露標(biāo)準(zhǔn)?!吨改稀芬?guī)定,對于定量環(huán)境效益,綠色債券發(fā)行方須在存續(xù)期內(nèi)按年度節(jié)點開展信息披露;若存續(xù)期環(huán)境效益與注冊發(fā)行時披露效益發(fā)生重大變化(變動幅度超15%),需說明原因。
然而,部分綠色債券的信息披露文件在披露顆粒度和時間維度的指標(biāo)設(shè)置上存在不一致,這導(dǎo)致傳統(tǒng)手段難以準(zhǔn)確量化綠色項目環(huán)境效益的波動幅度。目前較多采用的抽樣和人工檢驗等方式效率偏低(張萌等,2024),難以實現(xiàn)對環(huán)境效益指標(biāo)的動態(tài)、精準(zhǔn)監(jiān)測,削弱了《指南》的政策效力。因此,亟須構(gòu)建科學(xué)、系統(tǒng)的綠色債券環(huán)境效益信息披露質(zhì)量評估工具(以下簡稱“評估工具”),推動披露實踐從形式合規(guī)向?qū)嵸|(zhì)有效轉(zhuǎn)變,實現(xiàn)綠色債券市場的高質(zhì)量發(fā)展。
對環(huán)境效益信息披露質(zhì)量進行有效評估的基礎(chǔ)在于對綠色項目的逐年追蹤。評估工具必須具備識別綠色項目全生命周期的能力,才能有效支持跨年度環(huán)境效益表現(xiàn)的連續(xù)性分析。本研究從中債-綠色低碳轉(zhuǎn)型債券數(shù)據(jù)庫收集了2016—2024年3544只綠色債券的信息披露文件。經(jīng)深入分析發(fā)現(xiàn),環(huán)境效益信息在項目名稱、披露方式及項目追蹤等方面呈現(xiàn)復(fù)雜且標(biāo)準(zhǔn)不統(tǒng)一的特征(見表1)。這種多維度的非標(biāo)準(zhǔn)化特征給綠色項目的準(zhǔn)確識別與持續(xù)追蹤帶來了實質(zhì)性障礙。
傳統(tǒng)的名稱識別技術(shù)主要基于固定模板格式從名稱中提取要素,或通過字符差異度判斷項目同一性。然而,這類方法在處理上述復(fù)雜場景時存在明顯局限:一是模式覆蓋不足,易在非標(biāo)準(zhǔn)的項目名稱上失效;二是缺乏語義理解,難以準(zhǔn)確衡量項目名稱在語義理解方面的差異。因此,其項目識別能力較難有效泛化至未知的特殊項目名稱。為應(yīng)對這一挑戰(zhàn),筆者創(chuàng)新性地引入基于海量訓(xùn)練數(shù)據(jù)和億級參數(shù)量構(gòu)建而成的大模型技術(shù),以提升評估工具對未知的特殊綠色項目名稱的處理效能。
大模型環(huán)境效益信息披露質(zhì)量評估工具的構(gòu)建
(一)設(shè)計思路
針對綠色債券環(huán)境效益披露的項目名稱語義復(fù)雜、指標(biāo)波動量化困難、環(huán)保專業(yè)知識門檻高等核心問題,筆者設(shè)計并構(gòu)建了一套基于大模型的評估工具。該工具基于大模型強大的語言理解與邏輯判斷能力,能夠?qū)G色項目名稱進行糾錯與精準(zhǔn)識別,并為每個項目賦予唯一性編碼。借助這一編碼,工具可追蹤項目環(huán)境效益指標(biāo)的時序變化,并據(jù)此生成評估報告。
具體而言,評估工具采取智能評估框架,涵蓋綠色項目追蹤、動態(tài)指標(biāo)分析與評估報告生成三大核心模塊。在輸入綠色債券的信息披露報告后,工具可自動執(zhí)行語義解析、代碼生成與文檔撰寫等關(guān)鍵流程,最終輸出一份結(jié)構(gòu)化的質(zhì)量評估報告,包含信息披露質(zhì)量評價、環(huán)境效益指標(biāo)異常波動預(yù)警及針對性改進建議等內(nèi)容。
(二)關(guān)鍵技術(shù)
1.大模型
大模型憑借龐大的數(shù)據(jù)基礎(chǔ)和復(fù)雜的參數(shù)架構(gòu),能夠?qū)崿F(xiàn)文本理解、邏輯推理、代碼生成等多元功能。大模型在金融領(lǐng)域具有廣泛的場景適應(yīng)性與智能化潛力(高蘭蘭等,2023)。然而,在實際運行中,大模型可能會產(chǎn)生幻覺現(xiàn)象,即輸出與輸入文本無關(guān)的內(nèi)容、編造答案或誤解輸入信息(趙月等,2024),需要算法優(yōu)化等手段實現(xiàn)其可控發(fā)展。
2.提示詞技術(shù)
提示詞技術(shù)是一種通過精心設(shè)計輸入指令,引導(dǎo)大模型生成符合要求且高質(zhì)量輸出內(nèi)容的方法(秦濤等,2024)。其核心在于將用戶意圖精準(zhǔn)轉(zhuǎn)化為大模型能夠理解的提示文本。為此,可采用優(yōu)化任務(wù)描述、思維鏈引導(dǎo)及角色扮演等方法。這些方法不僅高效,而且成本低廉,同時能夠顯著提升輸出內(nèi)容的相關(guān)性和準(zhǔn)確性。
3.幻覺檢測技術(shù)
幻覺檢測技術(shù)旨在識別并糾正大模型生成內(nèi)容中的錯誤信息?;糜X檢測技術(shù)能夠借助語義一致性分析、事實核查以及邏輯推理等手段,有效降低虛假信息風(fēng)險。
(三)評估工具的工作流程
評估工具可通過分析某只綠色債券歷年的信息披露文件,生成質(zhì)量評估報告,其流程如圖1所示。
1.綠色項目追蹤
綠色項目追蹤是評估的核心環(huán)節(jié),直接影響環(huán)境效益指標(biāo)偏離分析的精準(zhǔn)度。如前所述,綠色債券信息披露存在項目名稱不規(guī)范等核心挑戰(zhàn)。為此,筆者構(gòu)建三階段智能處理流程,利用大模型實現(xiàn)綠色項目的自動化識別。
第一階段,對于項目名稱不規(guī)范問題,筆者將信息披露中出現(xiàn)過的所有項目名稱作為一個集合,統(tǒng)一輸入大模型,要求其對項目集合進行名稱規(guī)范化。針對地理名稱、公司名稱錯誤等情況,輸入項目集合的方法能夠引導(dǎo)大模型發(fā)揮其上下文感知能力,識別并修復(fù)異常內(nèi)容。
第二階段,針對披露方式不統(tǒng)一問題,筆者運用大模型技術(shù),從語義和邏輯層面,對多個項目集合披露的總名稱進行精準(zhǔn)拆分。對于項目間分隔符復(fù)雜的狀況,傳統(tǒng)規(guī)則方法難以有效應(yīng)對。大模型能夠憑借其卓越的廣義理解能力,較好進行處理。
第三階段,針對項目追蹤困難問題,筆者將各年度處理后的綠色項目匯總,使用大模型對拆分后的單個項目進行同一項目識別。如果兩個項目名稱被大模型判定為同一項目,則為其賦予相同編碼;若被判定為不同項目,則賦予不同編碼。同時,將項目集合披露所對應(yīng)的多個項目編碼進行合并。通過綠色項目編碼,評估工具可以追蹤特定綠色項目環(huán)境效益指標(biāo)的歷次變化情況。
2.動態(tài)指標(biāo)分析
傳統(tǒng)的指標(biāo)計算通常依賴于技術(shù)專家預(yù)先設(shè)定的公式,由程序員編碼實現(xiàn)。由此得到的代碼雖然運行效率較高,但在公式更新時需要經(jīng)歷重新編碼、測試和發(fā)版等繁瑣流程,難以快速響應(yīng)業(yè)務(wù)需求。此外,對披露質(zhì)量的衡量可能因側(cè)重點不同而需要采用不同計算公式,技術(shù)專家也可能根據(jù)實際需求新增分析方法。為此,筆者提出一種基于大模型的動態(tài)指標(biāo)分析框架,利用大模型的代碼生成能力,實現(xiàn)計算公式的動態(tài)更新和實時代碼生成,從而提升業(yè)務(wù)靈活性和響應(yīng)速度。
具體而言,筆者首先要求其能夠根據(jù)指定的公式和數(shù)據(jù)格式進行計算代碼生成。公式設(shè)定為環(huán)境效益變動幅度:
定量環(huán)境效益變動幅度=(存續(xù)期環(huán)境效益-發(fā)行時預(yù)期效益)/發(fā)行時預(yù)期效益
隨后,根據(jù)所有的綠色項目環(huán)境效益數(shù)據(jù)計算其變動幅度。當(dāng)指標(biāo)更新或新增時,可由大模型快速生成新公式代碼并自動運行,不需要重復(fù)傳統(tǒng)方式中的復(fù)雜流程。
需要注意的是,大模型的訓(xùn)練數(shù)據(jù)可能存在噪聲或不準(zhǔn)確信息,其生成的代碼有時會出現(xiàn)語法錯誤、邏輯錯誤或無法輸出結(jié)果等問題。為確保代碼的可靠性和準(zhǔn)確性,評估工具引入幻覺檢測技術(shù),對生成的代碼進行多層驗證。一是在運行環(huán)境中嘗試運行生成的代碼,檢查是否存在語法錯誤或其他導(dǎo)致代碼無法運行的問題。若運行環(huán)境報錯,則將錯誤信息反饋給大模型,要求其修正代碼。二是人工驗證代碼計算結(jié)果的準(zhǔn)確性。如果生成代碼的計算結(jié)果與真實結(jié)果存在偏差,同樣要求大模型重新生成代碼。
最后,通過幻覺檢測的代碼可用于計算代碼執(zhí)行環(huán)節(jié),獲得所有綠色項目的環(huán)境效益信息披露質(zhì)量指標(biāo)。以上操作使得評估工具實現(xiàn)了指標(biāo)分析的自動化和動態(tài)化,同時有效降低了大模型生成代碼的潛在風(fēng)險。
3.評估報告生成
考慮到復(fù)雜指標(biāo)體系可能導(dǎo)致理解困難,筆者設(shè)計出一種基于大模型的智能債券評估報告生成系統(tǒng),其能夠?qū)⒕G色債券的基本信息、逐年環(huán)境效益數(shù)據(jù)和各項指標(biāo)的波動情況進行可視化,并配以專業(yè)的文字解讀,自動生成完整、專業(yè)且翔實的評估報告。具體過程分為以下三步。
第一步,設(shè)定綠色債券評估報告的模板,主要包括報告章節(jié)的組織結(jié)構(gòu)、數(shù)據(jù)展示形式及評估結(jié)論選項等。其中,評估結(jié)論選項需清晰表示綠色債券整體環(huán)境效益的偏離程度(高或低),以及環(huán)境效益指標(biāo)一致性的表現(xiàn)(好或差)。
第二步,由報告生成系統(tǒng)從綠色債券信息披露文件中自動采集評估所需基本信息,并通過指標(biāo)計算模塊得到各項指標(biāo)分析數(shù)據(jù)。
第三步,將設(shè)定好的報告模板與相應(yīng)數(shù)據(jù)一同輸入大模型,生成綠色債券評估報告。
為確保報告的完整性、專業(yè)性及較高的可讀性,需要充分發(fā)揮大模型在文本生成與專業(yè)知識領(lǐng)域的強大能力。具體而言,大模型承擔(dān)兩項核心任務(wù):其一,評估工具要求大模型對綠色債券的所有綠色項目及其環(huán)境效益指標(biāo)進行全面分析,包括環(huán)境效益指標(biāo)含義、環(huán)境效益數(shù)據(jù)趨勢、信息披露質(zhì)量解讀等;其二,評估工具要求大模型基于預(yù)設(shè)模板中的結(jié)論選項,根據(jù)不同綠色債券環(huán)境效益信息披露質(zhì)量選擇正確的結(jié)論。
為提高結(jié)論的準(zhǔn)確性,筆者采用自一致性校驗技術(shù),其流程如圖2所示。該技術(shù)要求大模型針對同一輸入內(nèi)容生成多次輸出結(jié)果,然后評估結(jié)果之間的一致性。如果高度一致,則表明結(jié)論可靠;如果差異顯著,則提示結(jié)論可信度較低,需要進行人工復(fù)核。
大模型在完成文本和結(jié)論生成后,報告生成系統(tǒng)將自動把對應(yīng)數(shù)據(jù)生成可視化圖表并完成排版,最終生成完整的報告。
(四)評估工具性能測試
為全面測試評估工具性能,筆者從前述3544只綠色債券中抽取131只債券的信息披露文件構(gòu)成測試集。該測試集已由專家對項目編碼進行標(biāo)注,并完成所有綠色項目的環(huán)境效益偏離指標(biāo)計算。
筆者使用評估工具通過項目名稱糾錯、集合項目分解和同一項目識別,生成了綠色項目的唯一性編碼。經(jīng)測試,131只債券樣本的項目維度準(zhǔn)確率為96.3%1,債券維度準(zhǔn)確率為77.1%2。尤其是在集合項目分解階段,面對由多個項目名稱組成的復(fù)雜披露名稱,大模型能夠有效進行分割(見表2),顯著提升了后續(xù)同一項目識別的準(zhǔn)確率。
在動態(tài)指標(biāo)分析模塊中,評估工具基于預(yù)設(shè)公式生成計算代碼,當(dāng)公式發(fā)生變更需要重新生成計算代碼時,評估工具完成從代碼生成、幻覺檢測到代碼執(zhí)行的全流程耗時約為4小時,其中主要時間消耗在生成代碼運行與測試集的驗證階段。相較于傳統(tǒng)的開發(fā)、測試、上線流程,該工具所需時間約縮短至1/3。
在報告生成模塊中,評估工具所生成文本的平均長度約為3000字。文本內(nèi)容分為數(shù)據(jù)描述和結(jié)論判斷兩類,其中關(guān)于環(huán)境效益指標(biāo)的數(shù)據(jù)分析文本內(nèi)容準(zhǔn)確率達到98.3%,環(huán)境效益信息披露質(zhì)量結(jié)論判斷的準(zhǔn)確率為96.4%。同時,對于錯誤的結(jié)論判斷,評估工具通過一致性校驗技術(shù)提供了“可信度較低,需人工復(fù)審”的警告提示。
結(jié)語
綠色債券作為推動經(jīng)濟綠色轉(zhuǎn)型的重要工具,其環(huán)境效益信息的披露質(zhì)量直接關(guān)乎市場的透明度與高質(zhì)量發(fā)展。筆者聚焦綠色債券信息披露質(zhì)量評估中的關(guān)鍵難點,探索并實踐了大模型技術(shù)應(yīng)用路徑,構(gòu)建了集綠色項目追蹤、動態(tài)指標(biāo)分析、評估報告生成于一體的智能化評估工具。實踐表明,該工具能夠準(zhǔn)確追蹤復(fù)雜綠色項目,對所有項目的識別準(zhǔn)確率達96.3%,同時在動態(tài)指標(biāo)計算和評估報告生成環(huán)節(jié)能夠顯著降低人工成本。
未來,隨著綠色金融標(biāo)準(zhǔn)的持續(xù)完善,大模型技術(shù)在環(huán)境效益核算、碳足跡追蹤等場景中的應(yīng)用有望進一步深化。通過構(gòu)建跨周期、多維度的智能監(jiān)管體系,綠色債券市場將更高效地連接資本流動與環(huán)境效益,真正實現(xiàn)金融工具對綠色經(jīng)濟轉(zhuǎn)型的精準(zhǔn)賦能。
參考文獻
[1]高蘭蘭,賈晨,馬文嘉,等. 金融行業(yè)AIGC落地方法論的探索和研究[J]. 債券,2023(10). DOI: 10.3969/j.issn.2095-3585.2023.10.015.
[2]劉茜,張騰,商瑾,等. 綠色信用債存續(xù)期環(huán)境效益信息披露國際比較[J]. 債券,2022(8). DOI:10.3969/j. issn.2095-3585.2022.08.006.
[3]秦濤,杜尚恒,常元元,等. ChatGPT的工作原理、關(guān)鍵技術(shù)及未來發(fā)展趨勢[J]. 西安交通大學(xué)學(xué)報,2024,58(1).
[4]張萌,張秦牛. 我國非金融企業(yè)綠色債券存續(xù)期環(huán)境效益信息披露研究[J]. 金融市場研究,2024(7).
[5]張錦濤,李洵. 環(huán)境效益信息披露完整度對綠色債券融資成本影響的實證研究[J]. 債券,2024(9). DOI: 10.3969/j.issn.2095-3585.2024.09.019.
[6]趙月,何錦雯,朱申辰,等. 大語言模型安全現(xiàn)狀與挑戰(zhàn)[J]. 計算機科學(xué),2024,51(1).