摘要:在全球金融市場中,Environmental, Social and Governance(ESG)“漂綠”現(xiàn)象頻發(fā),誤導投資者對企業(yè)ESG表現(xiàn)的理解,掩蓋真實風險。文章針對傳統(tǒng)ESG評估的不足,提出一種基于深度學習的ESG“漂綠”風險識別方法,不依賴評級機構評分,直接處理原始報告。采用“同行相對漂綠得分”作為訓練標簽,結合TextRank和Ernie-Multi-Head Attention模型,實現(xiàn)了精準的風險識別。在Bloomberg和Wind ESG數(shù)據(jù)測試集上,該方法平均絕對誤差為0.7014,性能優(yōu)于基線模型。研究有助于投資者深入理解企業(yè)ESG績效,推動可持續(xù)發(fā)展。
關鍵詞:ESG評級;漂綠;深度學習;金融投資;Ernie-Multi-Head Attention
中圖分類號:E790.37" 文獻標志碼:A
0 引言
環(huán)境、社會和治理(Environmental, Social and Governance, ESG)是評價企業(yè)可持續(xù)發(fā)展的重要因素,受到投資者和監(jiān)管機構的高度關注。ESG 負面事件可能引發(fā)債務融資風險、財務困境,降低投資者信心,增加股票市場崩盤風險[1]。然而,由于信息復雜性和不透明性,部分企業(yè)存在“漂綠”(Greenwashing)現(xiàn)象,即通過不準確或誤導性的可持續(xù)發(fā)展信息,營造虛假形象[2]。這種行為損害了ESG投資的信譽和效果,并帶來了巨大風險。因此,識別ESG“漂綠”風險成為研究熱點。
針對“漂綠”現(xiàn)象,學者們提出了量化評估方法。例如,Yu等[3] 學者基于彭博和Asset 4數(shù)據(jù)庫,通過比較披露數(shù)量和績效得分的相對位置,創(chuàng)建了“同行相對ESG漂綠得分”。然而,人工評級難以解決我國ESG領域的固有問題。在企業(yè)信息披露規(guī)則尚不完善的情況下,ESG報告缺乏統(tǒng)一標準,披露細節(jié)不充分且定量信息不足[4-5]。此外,不同評級機構方法論不一致,導致評級結果差異顯著,增加了投資風險[6-7]。同時,許多重要的非量化信息,如戰(zhàn)略描述和語言風格等,可能被忽略,而這些信息對于全面評估ESG表現(xiàn)至關重要。
在此背景下,研究逐漸關注深度學習技術在識別ESG“漂綠”中的潛力。深度學習能夠細致分析語義信息,如戰(zhàn)略描述和語言風格,從而揭露潛在“漂綠”行為。此外,該技術減少了對人工評級的依賴,提高了分析的客觀性和一致性。因此,探索深度學習與ESG“漂綠”現(xiàn)象的結合具有重要意義[8]。
本研究開發(fā)了一個深度學習框架,結合TextRank文本摘要技術和Ernie-Multi-Head Attention模型,以“同行相對漂綠得分”作為訓練標簽,實現(xiàn)了對ESG“漂綠”風險的精準識別。這一方法為投資者和監(jiān)管機構提供了更精確的ESG風險分析工具,助力企業(yè)履行社會責任,促進可持續(xù)發(fā)展實踐。
1 基于深度學習的ESG“漂綠”風險識別方法框架
基于深度學習的ESG“漂綠”風險識別與評估方法框架,主要包括利用“同行相對漂綠得分”獲取樣本、TextRank長文本摘要模型和Ernie-Multi-Head Attention深度學習模型。首先,利用“同行相對漂綠得分”公式結合Bloomberg和Wind ESG數(shù)據(jù),獲取樣本的“漂綠”得分;其次,通過TextRank對樣本數(shù)據(jù)進行長文本摘要,提取關鍵信息以滿足深度學習模型的需求;最后,采用Ernie-Multi-Head Attention模型對摘要進行分析,實現(xiàn)對ESG“漂綠”風險的準確識別,為投資者和金融機構提供決策支持。
1.1 “同行相對漂綠得分”計算
為了有效識別企業(yè)的ESG“漂綠”行為,Yu等[3]學者提出了“同行相對漂綠得分”方法,通過比較彭博ESG披露得分(衡量披露數(shù)量)和Asset 4 ESG得分(衡量績效)的相對位置,構建衡量“同行相對ESG漂綠得分”的指標體系。核心思想是:若企業(yè)ESG披露顯著高于實際績效,則可能存在夸大或誤導行為;反之,則可能說明信息披露不足。
本研究調整了“同行相對漂綠得分”計算公式,以適應國內環(huán)境,在國內應用場景中采納了Wind萬得數(shù)據(jù)庫的相關數(shù)據(jù)替代原公式中的Asset 4數(shù)據(jù)。按此方法,若企業(yè)ESG披露得分遠高于績效得分,表明其可能通過過度信息披露掩蓋績效不足,其漂綠得分為正值;反之,則可能隱瞞積極表現(xiàn),漂綠得分為負值,具體計算公式如下:
GWS=BloombergESGi,t-μBloombergESGtσBloombergESGt-WindESGi,t-μWindESGtσWindESGt(1)
式(1)中:
GWS是一家公司的“同行相對漂綠得分”。
BloombergESGi,t是在特定時間點t,企業(yè)i根據(jù)彭博數(shù)據(jù)庫所獲得的ESG披露評分。
μBloombergESGt是在時間點t通過對所有同行業(yè)企業(yè)的BloombergESG披露評分計算得到的平均值。
σBloombergESGt是在時間點t通過對所有同行業(yè)企業(yè)的BloombergESG披露評分計算得到的標準差。
WindESGi,t是在時間點t,企業(yè)i的WindESG績效評分。
μWindESGt是在時間點t通過對所有同行業(yè)企業(yè)的WindESG績效評分計算得到的平均值。
σWindESGt是在時間點t通過對所有同行業(yè)企業(yè)的WindESG績效評分計算得到的標準差。
1.2 Ernie-Multi-Head Attention深度學習模型
本文提出了一種結合Ernie預訓練模型與多頭注意力機制(Multi-Head Attention)的深度學習架構,以提升文本回歸任務的預測精度。Ernie通過大規(guī)模中文語料的知識增強策略,有效提取ESG報告中的關鍵語義特征,幫助識別和量化ESG“漂綠”風險;多頭注意力機制通過多個注意力頭關注文本不同部分,捕捉全局與局部的依賴關系,從而全面提升語義理解和預測能力。
模型架構中,Ernie生成初步文本表示,多頭注意力機制進一步處理,增強對細微變化的敏感度,尤其在ESG復雜回歸任務中,捕捉關鍵的長程依賴關系。這種方法有效保留長文本語義信息,生成更具代表性的特征,從而提升ESG風險分析表現(xiàn)。
1.2.1 Ernie預訓練語言模型
由于Ernie-Multi-Head Attention模型對單個樣本長度有限制,采用TextRank摘要方法將文本長度控制在模型最大范圍內。TextRank基于圖排序算法,通過詞語共現(xiàn)關系構建圖模型,提取關鍵詞[9]。
習海旭等[10] 學者認為,TextRank作為無監(jiān)督抽取式摘要方法,無需依賴大規(guī)模標注數(shù)據(jù),具備較高實用性,同時整合句子位置、文檔相似度等特征,優(yōu)化了摘要的相關性、多樣性和可讀性。在結合“語步”劃分和依存句法分析后,其簡潔性與連貫性進一步提升,適用于長文本摘要。
摘要后的ESG報告數(shù)據(jù)通過Ernie 3.0進行分詞和編碼,生成每個Token的序列特征表示及文本匯總表示,作為后續(xù)模型輸入。
1.2.2 Multi-Head Attention模型
注意力機制基于人類視覺原理,聚焦關鍵特征,忽略無關信息,從而提高處理效率[11]。注意力通過注意力函數(shù)實現(xiàn),注意力函數(shù)將dmodel維度的查詢、鍵和值映射為輸出,其中查詢、鍵、值和輸出均為向量。常見的注意力函數(shù)包括加法注意力和點積注意力,后者計算速度快且空間效率高。然而,點積注意力并不總是優(yōu)于加法注意力,當鍵的dk值較小時,兩者表現(xiàn)相近;在較大dk值未按比例放大的情況下,加法注意力反而表現(xiàn)更佳。為減小這種影響,可以對點積進行縮放[12]。其注意力輸出矩陣按照式(2)計算:
AttentionQ,K,V=SoftmaxQKT dkV(2)
式(2)中,Q,K,V作為點積注意力的輸入矩陣。
多頭注意力模型可以更加高效的關注序列的全局信息。它是對輸入Q,K,V用不同的學習過的投影參數(shù)矩陣進行線性投影,然后輸入進點積注意力,重復h次這個過程。如式(3)、式(4)所示:
MultiheadQ,K,V=Concat(head1,…,headh)wo(3)
headi=Attention(QWQi,KWKi,VWVi)(4)
其中,WQi,WKi,WVi分別是第i個頭的查詢、鍵、值的變換矩陣;wo是最終的輸出變換矩陣,Concat表示拼接操作[13]。
2 實驗結果與分析
2.1 數(shù)據(jù)集介紹
本研究選用了國內所有在Bloomberg彭博和Wind萬得系統(tǒng)中能夠收集到相關數(shù)據(jù)的A股上市公司,時間跨度為2018年至2022年。通過將這些公司的E、S、G各項得分納入“同行相對漂綠得分”公式計算,得到5802個數(shù)據(jù),這些數(shù)據(jù)的GWS值區(qū)間為-3.665836~5.703895。最終,根據(jù)得到的數(shù)據(jù)在證券交易網(wǎng)站爬取到1808個樣本數(shù)據(jù),這些樣本數(shù)據(jù)的GWS值區(qū)間為-3.261754~5.703895,這一縮小的樣本數(shù)量主要是因為:
(1)許多公司刪除了之前年度的可持續(xù)發(fā)展報告或社會責任報告。
(2)我國對上市公司ESG報告仍處于鼓勵自愿披露的狀態(tài),導致很多公司未披露相關報告,而將其作為年報中的兩個章節(jié)進行披露,信息有限,因此,在數(shù)據(jù)獲取階段舍棄了未單獨披露可持續(xù)發(fā)展報告或社會責任報告的樣本。
接下來將樣本標注上對應的GWS值,之后將其寫入到CSV文件中,以便訓練時讀取數(shù)據(jù)。數(shù)據(jù)集按照8∶1∶1的比例分為訓練集、驗證集和測試集。
2.2 超參數(shù)設置
深度學習模型涉及大量的超參數(shù),取值影響模型檢測性能。超參數(shù)調優(yōu)旨在尋找深度學習模型中最優(yōu)解與正則化之間的平衡。模型優(yōu)化的目標是找到全局最優(yōu)解,或至少是更優(yōu)的局部解,而正則化則關注模型的擬合效果。盡管兩者在某些情況下存在矛盾,但它們的共同目標是最小化期望風險。模型優(yōu)化側重于降低經驗風險,但容易導致過擬合,正則化則用于控制模型復雜度。因此,需要通過超參數(shù)調優(yōu)在兩者之間取得平衡,以獲得最優(yōu)或相對較優(yōu)的解。
在文本輸入階段,句子最大截斷長度設置為512,每個訓練批次內,句子數(shù)量為16。在模型訓練階段,將損失率設置為0.1,學習率設置為5e-5,訓練周期為20個epoch。
2.3 評價指標
實驗采用平均絕對誤差(Mean Absolute Error,MAE)、均方誤差(Mean Square Error,MSE)、均方根誤差(Root Mean Square Error,RMSE)衡量模型識別效果的優(yōu)劣。
MAE反映了預測值與實際值之間的平均絕對誤差,用于衡量模型預測的準確性。其計算公式為:
MAE=1n∑ni=1y︿i-yi(5)
式(5)中yi表示實際值,y︿i表示預測值,n為樣本數(shù)。MAE越小,表示模型預測準確性越高。
MSE則反映了預測值與實際值之間的平均平方誤差,用于衡量模型預測的精度。其計算公式為:
MSE=1n∑ni=1(y︿i-yi)2(6)
式(6)中yi表示實際值,y︿i表示預測值,n為樣本數(shù)。MSE越小,表示模型預測精度越高。
RMSE反映了預測值與實際值之間的平均平方根誤差,用于衡量模型預測的穩(wěn)定性。其計算公式為:
RMSE= 1n∑ni=1(y︿i-yi)2(7)
式(7)中yi表示實際值,y︿i表示預測值,n為樣本數(shù)。RMSE越小,表示模型預測穩(wěn)定性越高。
2.4 實驗結果與分析
為驗證本文中提出的基于Ernie-Multi-Head Attention的 ESG“漂綠”風險識別方法有效性,將所提方法與下列性能較高的深度學習模型進行對比實驗,對比模型如下,如表1所示:
(1)Bert模型:谷歌于2018年提出的Bert預訓練語言模型,具備處理中文和多語言任務的能力;
(2)Ernie模型:百度于2019年提出的Ernie預訓練語言模型,具有較強的處理中文任務的能力;
(3)Multi-Head Attention模型[13]:使用多頭注意力機制,以增強模型對不同位置詞匯的關注能力;
(4)Bert-Multi-Head Attention模型[14]:結合Bert預訓練模型與多頭注意力機制。
實驗結果顯示,Ernie-Multi-Head Attention模型在MAE、MSE和RMSE等指標上表現(xiàn)最佳,展現(xiàn)了較高的準確性和穩(wěn)定性。其結合Ernie模型強大的中文文本特征提取能力和多頭注意力機制對長文本的上下文捕捉能力,使其能更有效識別ESG報告中的“漂綠”行為關鍵信息。
對比其他模型,Bert模型因未針對中文優(yōu)化,性能略遜于Ernie;Multi-Head Attention模型雖擅長捕捉詞匯關系,但在處理長文本時效果較弱;Bert-Multi-Head Attention模型表現(xiàn)均衡,但仍不如Ernie-Multi-Head Attention。
3 結語
ESG 信息披露的復雜性和不透明性導致了“漂綠”現(xiàn)象的出現(xiàn),給投資者和市場帶來了巨大的損失和風險。本研究針對“同行相對漂綠得分”方法的局限性,采用深度學習技術,構建了基于Ernie-Multi-Head Attention的模型框架,實現(xiàn)了對企業(yè) ESG 報告中“漂綠”風險的精確識別。與傳統(tǒng)的評級方法相比,該方法直接分析原始 ESG 報告文本,避免了因評級機構標準不一致和信息丟失導致的“漂綠”得分準確性問題,為投資者和監(jiān)管機構提供了更加精確和透明的 ESG 風險分析工具,有助于提升市場透明度和投資決策質量。
盡管所提方法在識ESG“漂綠”風險識別方面取得了良好的效果,但仍然存在改進的空間和局限性:數(shù)據(jù)質量和樣本量的限制可能影響模型的泛化能力;模型的解釋性較弱,未來研究可以結合領域知識以提高可解釋性??傮w而言,未來的工作應進一步優(yōu)化模型,并擴展其在實際應用中的適用性。
參考文獻
[1]蔣藝翅,姚樹潔.ESG信息披露、外部關注與企業(yè)風險[J].系統(tǒng)管理學報,2024(1):214-229.
[2]DE F N S V, SOBRAL M F F, RIBEIRO A R B, et al. Concepts and forms of greenwashing: a systematic review[J]. Environmental Sciences Europe, 2020(32): 1-12.
[3]YU E P, VAN L B, CHEN C H. Greenwashing in environmental, social and governance disclosures[J]. Research in International Business and Finance, 2020(52): 101192.
[4]徐婷,田雪瑩.我國ESG研究脈絡梳理與展望:基于CiteSpace的可視化分析[J].財會研究,2024(2):62-71,80.
[5]張國富,李鼎.ESG評價分歧會提高審計定價嗎:基于企業(yè)內外部治理環(huán)境視角[J].財會月刊,2024(16):83-89.
[6]張真,王湛,楊青.重點行業(yè)公司ESG報告研究:演進、實踐及優(yōu)化路徑[J].財會月刊,2024(16):103-109.
[7]AVRAMOV D, CHENG S, LIOUI A, et al. Sustainable investing with ESG rating uncertainty[J]. Journal of financial economics, 2022(2): 642-664.
[8]SMEUNINX N, DE C B, AERTS W. Measuring the readability of sustainability reports: a corpus-based analysis through standard formulae and NLP[J]. International Journal of Business Communication, 2020(1): 52-85.
[9]周錦章,崔曉暉.基于詞向量與TextRank的關鍵詞提取方法[J].計算機應用研究,2019(4):1051-1054.
[10]習海旭,何勝,黃純國.融合語步和文本多特征的科技論文結構化摘要生成[J].情報學報,2023(10):1176-1186.
[11]高凱,李勛豪,胡林,等.基于多頭注意力的CNN-LSTM的換道意圖預測[J].機械工程學報,2022(22):369-378.
[12]GIULIARI F, HASAN I, CRISTANI M, et al. Transformer networks for trajectory forecasting[C]// 2020 25th International Conference on Pattern Recognition (ICPR). Italy:IEEE,2021:10335-10342.
[13]ASHISH V. Attention is all you need[J]. Advances in Neural Information Processing Systems, 2017(30): 1.
[14]CHENG L C, CHEN Y L, LIAO Y Y. Aspect-based sentiment analysis with component focusing multi-head co-attention networks[J]. Neurocomputing, 2022(489): 9-17.
(編輯 何 琳)
Deep learning-based ESG “greenwashing” risk identification method
YE" Ninghui
(School of Economics and Management, Jiangsu University of Science and Technology, Zhenjiang 212000, China)
Abstract:" In global financial markets, the phenomenon of Environmental, Social, and Governance (ESG) “greenwashing” occurs frequently, misleading investors’ understanding of corporate ESG performance and obscuring real risks. To address the limitations of traditional ESG assessments, this paper proposes a deep learning-based ESG “greenwashing” risk identification method that does not rely on rating agency scores but directly processes raw reports. Using “peer-relative greenwashing scores” as training labels and combining TextRank with the Ernie-Multi-Head Attention model, the method achieves accurate risk identification. On the Bloomberg and Wind ESG datasets, the proposed method achieves a mean absolute error of 0.7014, outperforming baseline models. This research helps investors gain a deeper understanding of corporate ESG performance and promotes sustainable development.
Key words: ESG rating; greenwashing; deep learning; financial investment; Ernie-Multi-Head Attention