李程 李聰
摘? ?要:為了解決現(xiàn)有財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型中指標(biāo)大量冗余相關(guān)性高、實(shí)時(shí)分析能力差以及忽略財(cái)務(wù)文本信息的問題,提出一種管理層語調(diào)視角下的財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型。選取2016—2020年276家上市公司作為研究樣本,從五個(gè)維度篩選了財(cái)務(wù)數(shù)據(jù)指標(biāo)后,對企業(yè)財(cái)務(wù)年報(bào)中的前瞻性信息進(jìn)行中文分詞處理并根據(jù)常用情感詞典計(jì)算其語調(diào),并加入財(cái)務(wù)指標(biāo),利用因子分析降維,消除指標(biāo)冗余和其間的相關(guān)性,提取出少量共性因子,最后采用支持向量機(jī)構(gòu)建風(fēng)險(xiǎn)預(yù)警模型。結(jié)果表明,五維指標(biāo)體系與因子分析所得的共性因子具有較強(qiáng)的一致性,證明了因子分析的經(jīng)濟(jì)意義可解釋性。同時(shí),結(jié)合財(cái)務(wù)文本信息可以有效提高財(cái)務(wù)風(fēng)險(xiǎn)預(yù)測的準(zhǔn)確率,驗(yàn)證了財(cái)務(wù)文本對風(fēng)險(xiǎn)預(yù)警模型的有效性。
關(guān)? 鍵? 詞:管理層語調(diào);上市公司;風(fēng)險(xiǎn)預(yù)警;財(cái)務(wù)風(fēng)險(xiǎn)
中圖分類號(hào):F832.5? ? ?文獻(xiàn)標(biāo)識(shí)碼:A? ? ?文章編號(hào):2096-2517(2022)01-0061-11
DOI:10.16620/j.cnki.jrjy.2022.01.007
一、引言
隨著經(jīng)濟(jì)全球化進(jìn)程的快速發(fā)展和上市公司之間競爭的激烈化,企業(yè)在經(jīng)營過程中背負(fù)著巨大的財(cái)務(wù)風(fēng)險(xiǎn)和不確定性,進(jìn)而可能導(dǎo)致財(cái)務(wù)危機(jī)的發(fā)生。在市場經(jīng)濟(jì)中,財(cái)務(wù)風(fēng)險(xiǎn)對于每一家公司的投資者和經(jīng)營者來說無處不在。截至2020年年底,國內(nèi)因?yàn)榘l(fā)生財(cái)務(wù)危機(jī)而被ST處理的上市公司就高達(dá)272家。被ST或ST*處理的公司,不僅會(huì)給投資者帶來巨大的經(jīng)濟(jì)損失,同時(shí)也會(huì)使上市公司背負(fù)較大的運(yùn)營、生產(chǎn)壓力,隨時(shí)都有退市的可能性。
但一般而言,企業(yè)的財(cái)務(wù)危機(jī)和破產(chǎn)并不是突然發(fā)生的,而是一個(gè)循序漸進(jìn)的過程。在危機(jī)的萌芽階段,公司某些局部的財(cái)務(wù)危機(jī)和困難都會(huì)在一定程度上暴露,而這種異常在一些財(cái)務(wù)數(shù)據(jù)指標(biāo)上可以體現(xiàn),并被廣泛用于財(cái)務(wù)預(yù)警。建立高效、準(zhǔn)確的預(yù)警系統(tǒng)可以在風(fēng)險(xiǎn)發(fā)生的早期就向公司管理層發(fā)出警報(bào),有助于上市公司實(shí)時(shí)應(yīng)對導(dǎo)致其財(cái)務(wù)狀況惡化的問題,及早消除危機(jī)。此外,智能的預(yù)警系統(tǒng)還能輔助投資者做出正確的投資決策,有利于信貸風(fēng)險(xiǎn)的防控。因此,精確預(yù)測上市公司的財(cái)務(wù)危機(jī),有效防范金融風(fēng)險(xiǎn),最大限度地避免金融危機(jī)的再度發(fā)生,一直是世界各國關(guān)注的焦點(diǎn),具有重要的現(xiàn)實(shí)意義。如何建立一套實(shí)時(shí)、準(zhǔn)確的金融風(fēng)險(xiǎn)預(yù)警體系一直是國內(nèi)外學(xué)者的重點(diǎn)研究方向,在財(cái)務(wù)數(shù)據(jù)指標(biāo)的選取和模型建立的方法等各個(gè)方面取得了出色的成果[1-4]。
20世紀(jì)60年代,國外對財(cái)務(wù)危機(jī)預(yù)警的研究基于一定的會(huì)計(jì)信息和統(tǒng)計(jì)理論,取得了一定的成果并廣泛應(yīng)用于實(shí)際。如Altman(1968)通過分別對美國20年間的破產(chǎn)公司和正常盈利公司的模式進(jìn)行深度挖掘后提出的利用財(cái)務(wù)指標(biāo)來判斷危機(jī)的Z值模型,與設(shè)定的閾值對比即可判斷上市公司的財(cái)務(wù)危機(jī)程度[5],但其適用范圍比較狹窄,只能對制造業(yè)相關(guān)的上市公司進(jìn)行預(yù)測。Beaver(1966)提出了單變量模型,在對財(cái)務(wù)風(fēng)險(xiǎn)進(jìn)行預(yù)測時(shí)選擇了5對財(cái)務(wù)指標(biāo)做線性回歸分析,并發(fā)現(xiàn)模型結(jié)果與現(xiàn)金流動(dòng)負(fù)債比率具有較高的相關(guān)性[6],但過于依賴簡單的線性回歸模型并不能對復(fù)雜數(shù)據(jù)做出準(zhǔn)確的擬合,一般來說模型處于欠擬合狀態(tài),無法得到較高的預(yù)測準(zhǔn)確率。
財(cái)務(wù)危機(jī)的判定是一個(gè)典型的二分類問題。因此,隨著人工智能和機(jī)器學(xué)習(xí)的迅速發(fā)展,涌現(xiàn)出了一批采用機(jī)器學(xué)習(xí)的分類方法對公司財(cái)務(wù)風(fēng)險(xiǎn)進(jìn)行研究的學(xué)者。比如,文柯(2012)利用Logistics回歸模型構(gòu)建了我國企業(yè)產(chǎn)融結(jié)合風(fēng)險(xiǎn)預(yù)警模型,并揭示了企業(yè)償債能力、盈利水平和營運(yùn)能力與企業(yè)產(chǎn)融結(jié)合后發(fā)生財(cái)務(wù)危機(jī)的關(guān)系[7]。張琳等(2021)利用Logistic模型探究企業(yè)ESG表現(xiàn)在債券信用風(fēng)險(xiǎn)預(yù)警中的應(yīng)用[8]。谷慎等(2019)利用支持向量機(jī)以我國的碳金融試點(diǎn)市場為研究樣本,構(gòu)建了風(fēng)險(xiǎn)預(yù)警模型[9]。但上述研究中,無論是早期的單變量分析和多變量分析法還是近年來的機(jī)器學(xué)習(xí)方法,均存在一個(gè)共同的缺陷,都僅以定量數(shù)據(jù)為基礎(chǔ), 而忽略了定性的財(cái)務(wù)文本信息。
自然語言處理(Nature Language Processing,NLP)和文本分析的迅速發(fā)展,為分析財(cái)務(wù)文本中的語調(diào)提供了不可或缺的幫助。情感語調(diào)是文本信息語言的重要特征之一。依據(jù)心理學(xué)效應(yīng),文本中正向的情感語調(diào)會(huì)激發(fā)接收者聯(lián)想積極、正面的信息,而負(fù)向語調(diào)則向接收者傳遞消極、負(fù)面的信息。類似的, 財(cái)務(wù)年報(bào)作為上市公司的重要文本信息,其管理層討論與分析(Management Discussions and Analysis,MD&A,以下簡稱MD&A)部分語調(diào)的走向?qū)τ谪?cái)務(wù)風(fēng)險(xiǎn)預(yù)警具有一定的參考意義。MD&A文本由董事會(huì)回顧和未來展望兩部分內(nèi)容組成,而未來展望信息具有一定的前瞻性,對風(fēng)險(xiǎn)發(fā)生的預(yù)測具有互補(bǔ)性的作用。謝仁德等(2015)基于上市公司年度業(yè)績說明會(huì)的相關(guān)文本,對管理層語調(diào)和公司業(yè)績的關(guān)系進(jìn)行研究,結(jié)果顯示二者呈顯著正相關(guān)關(guān)系[10],這對投資者挖掘和利用文本信息具有重要意義,揭開了國內(nèi)學(xué)者對財(cái)務(wù)文本語調(diào)研究的序幕。劉逸爽等(2018)對公司財(cái)務(wù)年報(bào)文本進(jìn)行分詞后根據(jù)常用情感詞典計(jì)算文本語調(diào),并結(jié)合公司的財(cái)務(wù)指標(biāo),利用logistics回歸、SVM等機(jī)器學(xué)習(xí)方法證明了文本信息語調(diào)對財(cái)務(wù)危機(jī)預(yù)警的有效性[11]。
已有的研究為財(cái)務(wù)危機(jī)預(yù)警提供了新的視角,引入了語調(diào)分析方法,但其研究中加入了大量的財(cái)務(wù)數(shù)據(jù)指標(biāo),而財(cái)務(wù)指標(biāo)之間通常具有較強(qiáng)的相關(guān)性,導(dǎo)致嚴(yán)重的數(shù)據(jù)冗余,給公司財(cái)務(wù)預(yù)警系統(tǒng)的實(shí)時(shí)計(jì)算帶來了較大的難度和較高的算力成本,甚至還會(huì)降低模型預(yù)測的準(zhǔn)確率。
綜上所述,為解決現(xiàn)有風(fēng)險(xiǎn)預(yù)警模型中指標(biāo)大量冗余、相關(guān)性高以及忽略財(cái)務(wù)文本信息對于企業(yè)破產(chǎn)預(yù)測效用的問題,并進(jìn)一步提高模型預(yù)測的準(zhǔn)確率, 本文首先從五個(gè)維度初步選取財(cái)務(wù)指標(biāo),并對樣本公司的財(cái)務(wù)年報(bào)MD&A部分進(jìn)行中文分詞,參考常用金融情感詞典計(jì)算管理層語調(diào),并考慮單獨(dú)加入負(fù)向詞頻比率的影響,最后融合財(cái)務(wù)指標(biāo)和管理層語調(diào)進(jìn)行因子分析,剔除冗余信息并壓縮數(shù)據(jù),提取出少量共性因子,采用支持向量機(jī)來構(gòu)建風(fēng)險(xiǎn)預(yù)警模型, 并與未壓縮的模型進(jìn)行對比。
二、研究設(shè)計(jì)與指標(biāo)選擇
(一)樣本選擇
對于上市公司出現(xiàn)財(cái)務(wù)危機(jī)的概念與定義,國內(nèi)外研究者暫未形成統(tǒng)一的觀點(diǎn),國內(nèi)學(xué)者一般以上市公司因出現(xiàn)財(cái)務(wù)異常狀況被ST作為可能的財(cái)務(wù)風(fēng)險(xiǎn)標(biāo)志[12]。由于上市公司的財(cái)務(wù)年報(bào)是在當(dāng)前年度結(jié)束后的4個(gè)月內(nèi)發(fā)布,因此該公司t-1年年報(bào)的發(fā)布與其在t年是否被ST處理是同時(shí)發(fā)生的,本文采納劉逸爽等(2018)的方法[11],模型輸入的數(shù)據(jù)均滯后兩期,即使用t-2年(2018年)的數(shù)據(jù)來預(yù)測該公司在t年(2020年)是否會(huì)因財(cái)務(wù)狀況異常被ST處理,使模型具有更強(qiáng)的風(fēng)險(xiǎn)預(yù)測能力。
本文選取2016—2020年A股全部上市公司中證監(jiān)會(huì)2012版行業(yè)分類為制造業(yè)的ST公司,并采用樣本配比原則,即選擇行業(yè)相同、公司規(guī)模相近的非ST公司作為配對樣本。為保證實(shí)證結(jié)果的準(zhǔn)確性,本文選取1:1和1:2兩種比例確定實(shí)證樣本中ST公司和非ST公司的數(shù)量進(jìn)行實(shí)驗(yàn)。剔除缺失數(shù)據(jù)的樣本后,確定ST公司共92家,健康公司(非ST公司)共184家,合計(jì)276家,并以7:3的比例劃分得到模型訓(xùn)練集和測試集。
(二)財(cái)務(wù)指標(biāo)的選取與定義
財(cái)務(wù)指標(biāo)是指上市公司總結(jié)和評價(jià)其財(cái)務(wù)狀況和經(jīng)營績效的相對指標(biāo)。通過結(jié)合已有文獻(xiàn)和大量實(shí)驗(yàn)的基礎(chǔ)上,本文的財(cái)務(wù)指標(biāo)分別從上市公司的償債能力、經(jīng)營能力、盈利能力、每股指標(biāo)和現(xiàn)金流分析五個(gè)維度選取,包含流動(dòng)比率(CURRENT)、速動(dòng)比率(ACID)、現(xiàn)金比率(CASH)、資產(chǎn)負(fù)債率(LEV)、權(quán)益乘數(shù)(EM)、總資產(chǎn)周轉(zhuǎn)率(TAT)、營業(yè)利潤率(OPR)、息稅折舊攤銷前營業(yè)利潤率(OMBI)、總營業(yè)成本率(TOCR)、凈利潤增長率(NPGR)、營業(yè)總收入增長率(GROR)、固定資產(chǎn)增長率(IRFA)和每股凈現(xiàn)金流量(CPS),其定義如表1所示。
本文選取的財(cái)務(wù)指標(biāo)均來源于CSMAR數(shù)據(jù)庫,為了避免離群點(diǎn)對本文實(shí)證分析的影響,對所有連續(xù)型財(cái)務(wù)指標(biāo)均進(jìn)行了上下1%的Winsorize處理,最終納入本文機(jī)器學(xué)習(xí)模型的有效年度財(cái)務(wù)指標(biāo)觀測值為3588個(gè)。
(三)財(cái)務(wù)年報(bào)MD&A文本語調(diào)計(jì)算
Loughran等(2009)指出,管理層人員在金融文件中更專注于討論“公司責(zé)任”“社會(huì)責(zé)任”等類似主題的上市公司更有可能被貼上罪股的標(biāo)簽,公司治理措施不當(dāng), 并在提交文件后的一年被起訴[13]??紤]到上市公司財(cái)務(wù)年報(bào)中MD&A部分能體現(xiàn)出管理層語調(diào)對公司持有一定程度的積極或消極態(tài)度,本文對此部分文本納入模型。本文上市公司財(cái)務(wù)年報(bào)均來源于新浪財(cái)經(jīng)網(wǎng),從中截取MD&A部分。在衡量一份金融文件的語氣或情感時(shí),研究人員通常會(huì)計(jì)算與特定情緒詞列表相關(guān)的單詞數(shù),并將其按文檔中單詞總數(shù)進(jìn)行縮放。例如,文檔中較高比例的否定詞傾向于更悲觀的語氣。
Loughran等(2016)指出對金融文本的情感分析主要有兩種方法:機(jī)器學(xué)習(xí)法和詞袋法(Bag of Words)[14]。機(jī)器學(xué)習(xí)方法主要通過樸素貝葉斯(Na?觙ve Bayes)等分類算法對文本進(jìn)行訓(xùn)練以確定分類準(zhǔn)則, 再應(yīng)用于全樣本中進(jìn)行預(yù)測,但其分類準(zhǔn)則通常帶有一定程度的主觀性。而詞袋法依據(jù)情感詞典對文本情感進(jìn)行正向和負(fù)向分類,在使用合適的情感詞典后可以基本避免主觀因素的影響。Connor等(2010)也認(rèn)為通過詞袋法來分析小型文本的情感傾向尤為合適[15]。LM詞表相對全面, 一般來說,沒有常見的消極或積極的詞缺失;它的創(chuàng)建考慮到了財(cái)務(wù)溝通。因此本文參考LM詞典,將其作為衡量財(cái)務(wù)年報(bào)文本的基準(zhǔn),同時(shí)結(jié)合大連理工大學(xué)整理的情感詞典中的褒貶義詞, 通過Python的HanLP作為分詞工具對財(cái)務(wù)年報(bào)文本進(jìn)行分詞處理后,進(jìn)行正向和負(fù)向情感詞頻統(tǒng)計(jì),在此采用歸一化的方法計(jì)算MD&A管理層語調(diào)Tone, 其計(jì)算公式如下:
Tone=? (1)
式中,Positive為上市公司財(cái)務(wù)年報(bào)MD&A文本中正向情感詞頻,Negative則為同一文本中的負(fù)向情感詞頻??梢钥闯觯琓one的取值范圍在-1到1之間,且Tone的值越接近1,說明管理層語調(diào)越積極,反之則說明管理層的語調(diào)偏向消極態(tài)度。
同時(shí),考慮到負(fù)向詞匯會(huì)披露更多的財(cái)務(wù)風(fēng)險(xiǎn)信息,本文將負(fù)向詞頻比率NEGR也納入到模型中訓(xùn)練,其計(jì)算公式如下:
NEGR=(2)
綜上,本文構(gòu)建了兩個(gè)衡量管理層語調(diào)的指標(biāo),整體指標(biāo)體系中的變量,如表1所示。
三、財(cái)務(wù)困境預(yù)警模型的構(gòu)建
國內(nèi)外學(xué)者在財(cái)務(wù)困境預(yù)測的相關(guān)研究中,大多使用兩類方法,一是較為傳統(tǒng)的方法,如單變量模型、Altman多元回歸模型和Z值模型;二是基于機(jī)器學(xué)習(xí)中監(jiān)督學(xué)習(xí)的分類算法, 如Logistics回歸、支持向量機(jī)、決策樹和AdaBoost等。而傳統(tǒng)的Altman多元線性回歸的回歸系數(shù)更適用于美國國情,若直接套用會(huì)造成某些財(cái)務(wù)指標(biāo)畸變,導(dǎo)致分類預(yù)測精度較低。而機(jī)器學(xué)習(xí)的方法通常能學(xué)習(xí)到指標(biāo)具有的特征,可以得到較高的準(zhǔn)確率。因此,本文考慮使用機(jī)器學(xué)習(xí)的方法進(jìn)行模型的構(gòu)建和實(shí)證分析。
在選擇預(yù)警指標(biāo)進(jìn)行訓(xùn)練的時(shí)候,可能會(huì)遇到較多冗余特征,隨著數(shù)據(jù)樣本量的不斷增大,模型訓(xùn)練結(jié)果的精確度雖然會(huì)有小幅度提升,但同時(shí)帶來巨大的時(shí)間和算力成本,這在實(shí)際情況中是不現(xiàn)實(shí)且不被允許的。 因此本文對選取的16個(gè)指標(biāo)使用因子分析,將高維的數(shù)據(jù)轉(zhuǎn)化為低維的數(shù)據(jù)后再次進(jìn)行訓(xùn)練,同時(shí)與直接使用支持向量機(jī)的模型進(jìn)行對比。
(一)支持向量機(jī)
支持向量機(jī)(Support Vector Machine,SVM)是一種分類算法,它的基本模型是定義在特征空間上的幾何間隔最大的線性分類器, 而核技巧(kernel method)和軟間隔的引入,使其能夠很好地解決高維非線性分類問題,支持向量機(jī)在中小型樣本上具有尤佳的表現(xiàn)[16-17]。
在給定的訓(xùn)練數(shù)據(jù)集T={(X1,y1),(X2,y2),…,(XN,yN),}中,待求解的最優(yōu)分類超平面?仔由W·X+b=0確定。其中,W為特征學(xué)習(xí)出的權(quán)重矩陣,b為偏置,因此超平面可用(W,b)表示。分類超平面將特征空間劃分為正類和負(fù)類兩部分,其對應(yīng)的分類決策函數(shù)為f(x)=sign(W·X+b)。
間隔(Margin)可以度量一個(gè)樣本點(diǎn)距離分類超平面的遠(yuǎn)近,從而表示分類預(yù)測的確信度,引入超平面(W,b)關(guān)于訓(xùn)練集T的函數(shù)間隔■和幾何間隔?酌分別為:
=min yi(W·Xi+b)
=?(3)
支持向量機(jī)考慮求解一個(gè)幾何間隔最大的分離超平面,具體地,可以定義為以下最優(yōu)化問題:
s.t.(W·Xi+b)yi≥? (4)
其中,i=1,2,…,N。因?yàn)楹瘮?shù)間隔的取值并不影響最優(yōu)化問題的求解,因此假設(shè)=1。這樣一來,X到平面?仔的最大距離為?酌=1/‖W‖。注意到最大化?酌和最小化‖W‖2是等價(jià)的,因此得到等價(jià)的凸二次規(guī)劃問題:
WT·W
s.t.(W·Xi+b)yi≥1? (5)
為了求解該規(guī)劃問題,應(yīng)用拉格朗日對偶性,為了方便求解該優(yōu)化問題和自然地引入核函數(shù),通過求解其對偶問題(dual problem)得到原始問題(primary problem)的最優(yōu)解。具體地,引入Lagrange函數(shù),對約束條件分別加入Lagrange乘子?琢i,即:
L(W,b,)=WT·W-i[yi(W·Xi+B)-1]
(6)
令其相應(yīng)的偏導(dǎo)數(shù)為0,可以分別得到:
將求得的偏導(dǎo)數(shù)代回Lagrange函數(shù)后,求L(W,b,)對的極大,即是求解對偶問題:
求解此二次規(guī)劃問題,即可得到最優(yōu)分類超平面。對于非線性分類問題的求解,首先需要對數(shù)據(jù)進(jìn)行歸一化,利用核函數(shù)將樣本從原始空間映射到高維空間,使其線性可分。本文使用的函數(shù)為高斯徑向基函數(shù):
f(x)=signiyi·exp-+b (9)
(二)因子分析
因子分析(Factor Analysis,F(xiàn)A)是指通過尋找多個(gè)可觀測變量相關(guān)矩陣的內(nèi)部依賴關(guān)系,從中提取少數(shù)共性因子,從而將原始觀測變量表達(dá)為共性因子的線性組合的降維技術(shù)。因子分析在簡化大規(guī)模觀測變量系統(tǒng)、減少觀測變量維度的方面起到了至關(guān)重要的作用。利用公共因子代替原始觀測系統(tǒng),使得因子之間代表的信息互不重疊,在一定程度上解決了數(shù)據(jù)冗余的問題[18-19]。
設(shè)要進(jìn)行因子分析的原始觀測變量有m個(gè),記為x=[x1,x2,x3,…,xm],n個(gè)樣本對應(yīng)的觀測值為xik(i=1,2,3,…,n;k=1,2,3,…,m),記樣本協(xié)方差矩陣為:
sk=(xik-xk)(xik-xk)'=(sik) (10)
其中,xk=xik為樣本均值。
一般p的確定原則為累積貢獻(xiàn)率大于等于75%。
因子分析中的公共因子是不可直接觀測但又客觀存在的共同影響特征,每一個(gè)變量都可以表示成共性因子的線性表達(dá)及特殊因子之和,即:
X1=a11F1+a12F2+…+a1m Fm+i,X2=a21F1+a22F2+…+a2m Fm+i,…Xp=ap1F1+ap2F2+…+apm Fm+i? (11)
式中,F(xiàn)1,F(xiàn)2,…,F(xiàn)m為Xi的共性因子,?著i為Xi的特殊因子。因此,因子分析的矩陣表達(dá)形式為:
簡記為:
其中,矩陣A稱為因子載荷矩陣,是第i個(gè)變量在第j個(gè)共性因子上的載荷,由主成分分析確定。
之后,由相關(guān)系數(shù)矩陣R得到特征值?姿j(j=1,2,3,…,m)及各個(gè)主成分的方差貢獻(xiàn)率、貢獻(xiàn)率和累計(jì)貢獻(xiàn)率,并根據(jù)累計(jì)貢獻(xiàn)率確定主成分保留的個(gè)數(shù)p。
如果共性因子有m個(gè),則需要逐次對每兩個(gè)共性因子進(jìn)行旋轉(zhuǎn)操作,也就是對每兩個(gè)因子確定的因子面正交旋轉(zhuǎn)一個(gè)角度,轉(zhuǎn)角需要滿足使旋轉(zhuǎn)后的因子載荷矩陣A總方差達(dá)到最大值,并得到因子得分。至此,因子分析的過程全部完成。
四、實(shí)證結(jié)果與分析
(一)指標(biāo)的描述性統(tǒng)計(jì)與顯著性差異檢驗(yàn)
為了確定ST公司和非ST公司之間是否存在顯著差異, 本文利用非參數(shù)檢驗(yàn)中的Wilcoxon符號(hào)秩和檢驗(yàn)(也稱Wilcoxon Mann-Whitney檢驗(yàn))來考察財(cái)務(wù)風(fēng)險(xiǎn)帶給兩類公司的差異性。若檢驗(yàn)統(tǒng)計(jì)量顯著, 則說明該指標(biāo)可以有效區(qū)分ST公司和非ST公司,反之則不能有效區(qū)分。
表2給出了本文確定的指標(biāo)體系描述性統(tǒng)計(jì)和Wilcoxon符號(hào)秩和檢驗(yàn)結(jié)果。 除了凈利潤增長率(NPGR)的Wilcoxon檢驗(yàn)不顯著外,其余指標(biāo)均較為顯著,可以很好地區(qū)分財(cái)務(wù)困境和財(cái)務(wù)狀況健康的上市公司。其中,現(xiàn)金比率(CASH)、總資產(chǎn)周轉(zhuǎn)率(TAT)、總營業(yè)成本率(TOCR)、管理層語調(diào)(TONE)和負(fù)向詞頻比率(NEGR)的Wilcoxon檢驗(yàn)Z統(tǒng)計(jì)量均小于-5.39,說明這些指標(biāo)對區(qū)分ST和非ST公司起到了至關(guān)重要的作用。由管理層語調(diào)的定義式可得,當(dāng)其值大于0時(shí),表明管理層對公司的語調(diào)基本呈現(xiàn)樂觀趨勢。實(shí)際計(jì)算出的管理層語調(diào)均值為0.5672,中位數(shù)為0.5763,兩者較為接近,說明選取的研究樣本均勻分布,且MD&A文本大多呈現(xiàn)出管理層較為樂觀的態(tài)勢。
(二)基于支持向量機(jī)的實(shí)證分析
本文將主要以預(yù)測準(zhǔn)確率(accuracy)、第一類錯(cuò)誤(Type I Error)、第二類錯(cuò)誤(Type II Error)和AUC四個(gè)指標(biāo)來衡量本文模型在財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警中的作用, 模型測試集為樣本確定的92家上市公司。
在衡量指標(biāo)中,AUC代表接收者操作特征曲線(Receiver Operating Characteristic Curve,ROC)下所圍成區(qū)域的面積,其x軸為負(fù)假陽率,y軸為真陽率,是評價(jià)二分類模型優(yōu)劣的重要指標(biāo)之一。ROC曲線對于正負(fù)樣本數(shù)量不平衡的模型具有很好的適應(yīng)性, 考慮到本文采用了1:1和1:2兩種樣本比例, 因此將其作為評價(jià)指標(biāo)。 隨機(jī)分類情況下的AUC值為0.5,AUC數(shù)值越接近于1, 說明模型的有效性越強(qiáng)。
表3給出了在兩種樣本比例下支持向量機(jī)模型的實(shí)驗(yàn)結(jié)果。在加入管理層語調(diào)指標(biāo)后,樣本比例1:1時(shí),整體準(zhǔn)確率都有一定提高,并較為顯著地降低了第一類和第二類錯(cuò)誤發(fā)生的情況;樣本比例1:2時(shí),模型的預(yù)測準(zhǔn)確率有一定提升,而加入負(fù)向語調(diào)詞頻后,預(yù)測準(zhǔn)確率從89.28%上升至96.43%,并顯著減少了第一類錯(cuò)誤的發(fā)生,AUC也提升至90%以上,證明財(cái)務(wù)年報(bào)文本語調(diào)信息對預(yù)警起到重要作用。
(三)基于因子分析和支持向量機(jī)的實(shí)證分析
首先對初步篩選的16個(gè)指標(biāo)利用因子分析進(jìn)行降維后,再使用支持向量機(jī)進(jìn)行財(cái)務(wù)預(yù)警模型的構(gòu)建,以比較因子分析在復(fù)雜觀測系統(tǒng)中起到的克服相關(guān)性、重疊性的問題,并對比SVM模型的預(yù)測效果。
在進(jìn)行因子分析前, 需要使用KMO和巴特利特檢驗(yàn)判斷原始觀測系統(tǒng)之間是否存在相關(guān)性。表4給出了本文所選指標(biāo)體系的KMO和巴特利特檢驗(yàn)結(jié)果。其中,KMO值為0.612,大于經(jīng)驗(yàn)閾值0.6。同時(shí), 巴特利特球形度檢驗(yàn)的顯著性遠(yuǎn)小于0.05,拒絕各觀測指標(biāo)間獨(dú)立的假設(shè),認(rèn)為變量間具有較強(qiáng)的相關(guān)性。因此,檢驗(yàn)的結(jié)果均表明本文構(gòu)建的指標(biāo)體系適合進(jìn)行因子分析。
在進(jìn)行因子分析的過程中,可以通過因子的總方差解釋表確定要選取共性因子的個(gè)數(shù),該表需要計(jì)算各個(gè)因子的特征值、 貢獻(xiàn)率和累計(jì)貢獻(xiàn)率,表示各觀測指標(biāo)中所含原始信息能被提取的共性因子所表達(dá)的程度,即變量信息被提取的占比,如表5所示。
由表5結(jié)果可以得出,前6個(gè)共性因子包含了原始觀測系統(tǒng)中75.053%的信息,累計(jì)貢獻(xiàn)率大于70%,滿足因子分析要求。從第7個(gè)共性因子開始,其包含的原始觀測系統(tǒng)信息逐漸減少, 后10個(gè)共性因子僅包含原始系統(tǒng)中不到25%的信息,因此可以放棄這10個(gè)因子, 利用前6個(gè)共性因子代替之前選取的16個(gè)觀測指標(biāo)。
通過共性因子的碎石圖也可以判斷各因子對原始觀測系統(tǒng)的重要性,如圖1所示。橫軸代表共性因子的序號(hào),縱軸代表其特征根大小。坡度越陡,對應(yīng)的特征根越大, 表示該因子起到的作用越明顯。在因子分析中,一般選取特征根大于1的作為共性因子,因此碎石圖驗(yàn)證了本文選取前6個(gè)共性因子的正確性。
由于在初始的因子載荷中,確定的6個(gè)共性因子的意義并不明顯,為了清晰地解釋各公共因子的經(jīng)濟(jì)含義,需要對因子進(jìn)行旋轉(zhuǎn)。表6展示了使用凱撒正太化方差最大化的正交旋轉(zhuǎn)所得到的因子載荷矩陣。
由表6可以看出, 第一共性因子在流動(dòng)比率、速動(dòng)比率、現(xiàn)金比率三個(gè)指標(biāo)具有90%以上的載荷量,反映了上市公司的償債能力,因此第一共性因子可以定義為“償債因子”;第二共性因子在營業(yè)利潤率、 息稅折舊攤銷前營業(yè)利潤率兩個(gè)指標(biāo)具有90%以上的載荷量, 反映了上市公司的盈利能力,因此定義第二共性因子為“盈利因子”;第三個(gè)共性因子在營業(yè)總收入增長率、固定資產(chǎn)增長率兩個(gè)指標(biāo)具有95%以上的載荷, 反映了公司的規(guī)模狀況,因此定義第三共性因子為“規(guī)模因子”;第四個(gè)共性因子,在管理層語調(diào)和負(fù)向詞頻比率上的載荷量較高,因此命名為“管理層響應(yīng)因子”;第五個(gè)共性因子在權(quán)益乘數(shù)、資產(chǎn)負(fù)債率上具有較高的載荷量,反映了上市公司的負(fù)債程度,因此命名為“負(fù)債因子”;最后一個(gè)共性因子在每股現(xiàn)金凈流量、總資產(chǎn)周轉(zhuǎn)率和凈利潤增長率上具有較高的載荷,可以看作公司的“成長因子”。
綜上,六個(gè)共性因子與上文選取的財(cái)務(wù)指標(biāo)維度較為吻合,驗(yàn)證了因子分析的有效性和經(jīng)濟(jì)意義可解釋性。
最后,根據(jù)旋轉(zhuǎn)成分矩陣,將原始觀測系統(tǒng)的指標(biāo)表示為公因子的線性形式,也稱為得分因子函數(shù)。至此,因子分析完成,16個(gè)指標(biāo)降維至6個(gè)共性因子指標(biāo)。將因子分析得到的6個(gè)共性因子輸入支持向量機(jī)中進(jìn)行訓(xùn)練,并與直接使用支持向量機(jī)的結(jié)果進(jìn)行數(shù)據(jù)壓縮量對比,如表7所示。
由表7可以看出,與單獨(dú)使用支持向量機(jī)的模型一樣,F(xiàn)A-SVM模型在兩種比例的上市公司財(cái)務(wù)風(fēng)險(xiǎn)預(yù)測上均取得了90%以上的精確率,而相較于SVM模型所使用的觀測指標(biāo)系統(tǒng),F(xiàn)A-SVM模型分別得到了73.33%和60%的數(shù)據(jù)壓縮率, 這對提升企業(yè)預(yù)警的實(shí)時(shí)性起到了至關(guān)重要的作用。
五、結(jié)論與啟示
上市公司財(cái)務(wù)年報(bào)中MD&A部分的內(nèi)容是其信息披露的必要組件之一,對這部分文本的處理與分析有助于投資者更好地了解企業(yè)的真實(shí)財(cái)務(wù)現(xiàn)狀, 同時(shí)幫助企業(yè)經(jīng)營者更準(zhǔn)確地預(yù)測財(cái)務(wù)困境,合理做出調(diào)節(jié)。本文以財(cái)務(wù)困境公司和正常運(yùn)營公司的財(cái)務(wù)數(shù)據(jù)及年報(bào)文本為研究對象,通過初步篩選財(cái)務(wù)數(shù)據(jù)指標(biāo), 對年報(bào)文本進(jìn)行中文分詞后,根據(jù)情感詞典計(jì)算語調(diào)得分,并將更有可能對風(fēng)險(xiǎn)起到預(yù)警作用的負(fù)面語調(diào)單獨(dú)計(jì)算作為指標(biāo),融合財(cái)務(wù)指標(biāo)進(jìn)行因子分析,得到少量共性因子,采用支持向量機(jī)的方法建立財(cái)務(wù)預(yù)警模型,并對進(jìn)行因子分析前后的模型分別分析。
本文得到的主要結(jié)論有:
第一,無論在配對樣本比率為1:1還是1:2的實(shí)驗(yàn)條件下, 向財(cái)務(wù)指標(biāo)體系中加入MD&A文本計(jì)算所得的管理層語調(diào)均可以提升財(cái)務(wù)風(fēng)險(xiǎn)模型預(yù)測的有效性,且在是否加入因子分析方法時(shí)均成立。這一結(jié)論表明企業(yè)財(cái)務(wù)年報(bào)文本內(nèi)容確實(shí)會(huì)給風(fēng)險(xiǎn)預(yù)警帶來一定的增益信息,量化財(cái)務(wù)文本內(nèi)容是對定量財(cái)務(wù)數(shù)據(jù)的合理補(bǔ)充。
第二,加入單獨(dú)計(jì)算的負(fù)向語調(diào)對模型預(yù)測的準(zhǔn)確率有一定的提升,說明了文本中揭露的管理層負(fù)向信息能更有效地反映企業(yè)經(jīng)營現(xiàn)狀。
第三,基于因子分析處理錯(cuò)綜復(fù)雜的財(cái)務(wù)指標(biāo)是有效的。使用因子分析,不僅消除了財(cái)務(wù)指標(biāo)之間的冗余性,降低共線性,還賦予了提取出的公共因子以合理的經(jīng)濟(jì)意義,壓縮了模型空間并提升了支持向量機(jī)模型的計(jì)算速度。
綜上所述,在對上市公司財(cái)務(wù)困境進(jìn)行建模和預(yù)測時(shí),可通過對其財(cái)務(wù)年報(bào)中管理層披露的文本信息進(jìn)行多尺度地挖掘和利用,建立合理情感語調(diào)指標(biāo)對更好地強(qiáng)化風(fēng)險(xiǎn)預(yù)警具有重要意義。同時(shí),可以將本文對公司財(cái)務(wù)年報(bào)的研究推廣到任何與公司有關(guān)的公開文本,如社交媒體輿論、新聞報(bào)道等,多元化的信息來源有助于擴(kuò)展公司信息披露,對于進(jìn)一步優(yōu)化風(fēng)險(xiǎn)信用預(yù)警有著至關(guān)重要的意義。但是需要注意的是,現(xiàn)實(shí)中存在較大道德風(fēng)險(xiǎn)的企業(yè)管理層可能故意放出正面信息,使得財(cái)務(wù)風(fēng)險(xiǎn)難以識(shí)別,這時(shí)不能一味依靠管理層語調(diào)的變化來判斷財(cái)務(wù)風(fēng)險(xiǎn),而是應(yīng)該根據(jù)其他指標(biāo),更加客觀地綜合考量企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)的真實(shí)狀況。
參考文獻(xiàn):
[1]龐清樂,劉新允.基于蟻群神經(jīng)網(wǎng)絡(luò)的財(cái)務(wù)危機(jī)預(yù)警方法[J].數(shù)理統(tǒng)計(jì)與管理,2011,30(3):554-561.
[2]楊毓,蒙肖蓮.用支持向量機(jī)(SVM)構(gòu)建企業(yè)破產(chǎn)預(yù)測模型[J].金融研究,2006(10):65-75.
[3]鄒清明,黃鐘億.基于比例優(yōu)勢模型的上市公司財(cái)務(wù)困境預(yù)測研究[J].數(shù)理統(tǒng)計(jì)與管理,2016,35(3):536-549.
[4]趙冠華.基于遺傳算法和熵的縮減記憶式LS-SVM財(cái)務(wù)困境預(yù)測模型研究[J].運(yùn)籌與管理,2010,19(5):71-77.
[5]ALTMAN E I.Financial Ratios,Discriminant Analysis and the Prediction of Corporate Bankruptcy[J].Journal of Finance,1968,23(4):589-609.
[6]BEAVER W H.Financial Ratios as Predictors of Failure,Empirical Research in Accounting:Selected Studies[J].Journal of Accounting Research,1966:179-199.
[7]文柯.基于Logistic的上市公司產(chǎn)融結(jié)合風(fēng)險(xiǎn)預(yù)警模型研究[J].中國管理科學(xué),2012,20(S1):346-350.
[8]張琳,潘佳英.融入ESG因素的企業(yè)債券信用風(fēng)險(xiǎn)預(yù)警研究[J].金融理論探索,2021(4):51-65.
[9]谷慎,汪淑娟.基于SVM的碳金融風(fēng)險(xiǎn)預(yù)警模型研究[J].華東經(jīng)濟(jì)管理,2019,33(3):179-184.
[10]謝德仁,林樂.管理層語調(diào)能預(yù)示公司未來業(yè)績嗎?——基于我國上市公司年度業(yè)績說明會(huì)的文本分析[J].會(huì)計(jì)研究,2015(2):20-27,93.
[11]劉逸爽,陳藝云.管理層語調(diào)與上市公司信用風(fēng)險(xiǎn)預(yù)警——基于公司年報(bào)文本內(nèi)容分析的研究[J].金融經(jīng)濟(jì)學(xué)研究,2018,33(4):46-54.
[12]李秉成,苗霞,聶梓.MD&A前瞻性信息能提升財(cái)務(wù)危機(jī)預(yù)測能力嗎——基于信號(hào)傳遞和言語有效理論視角的實(shí)證分析[J].山西財(cái)經(jīng)大學(xué)學(xué)報(bào),2019,41(5):108-124.
[13]LOUGHRAN T,MCDONALD B,YUN H.A Wolf in Sheep's Clothing:the Use of Ethics-Related Terms in 10-K Reports[J].Journal of Business Ethics,2009,89(suppl.1):39-49.
[14]LOUGHRAN T,MCDONALD B.Textual Analysis in Accounting and Finance:A Survey[J].Journal of Accounting Research,2016,54(4).
[15]O'CONNOR B,BALASUBRAMANYAN R,ROUTLEDGE B R,et al. From Tweets to Polls:Linking Text Sentiment to Public Opinion Time Series[C]// Proceedings of the Fourth International Conference on Weblogs and Social Media,ICWSM 2010,Washington,DC,USA,May 23-26,2010. DBLP,2010.
[16]王澤霞,李正治.基于管理層討論與分析情感性的財(cái)務(wù)預(yù)警研究[J].杭州電子科技大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2019,15(3):1-6.
[17]陳藝云,賀建風(fēng),覃福東.基于中文年報(bào)管理層討論與分析文本特征的上市公司財(cái)務(wù)困境預(yù)測研究[J].預(yù)測,2018,37(4):53-59.
[18]陳艷嬌.基于因子分析的國有農(nóng)場財(cái)務(wù)危機(jī)預(yù)警實(shí)證研究[J].經(jīng)濟(jì)問題,2007(5):109-111.
[19]顧雪玲,燕璇.基于顯著性檢驗(yàn)和因子分析的企業(yè)財(cái)務(wù)危機(jī)預(yù)警研究[J].商業(yè)會(huì)計(jì),2015(18):42-45.
Financial Risk Warning from the Perspective of Management Tone
——Research Based on FA-SVM Model
Li Cheng1, Li Cong2
(1. School of Economics and Management, Tiangong University, Tianjin 300387, China;
2. School of System Science, Beijing Normal University, Beijing 100875, China)
Abstract: In order to solve the problems of the existing financial risk early warning models with a large number of indicators, high redundancy, poor real-time analysis capabilities, and ignoring financial text information for corporate bankruptcy prediction, this paper proposes a financial risk early warning model under the perspective of management tone. Selecting 276 listed companies from 2016 to 2020 as the research sample, after preliminary screening of financial data indicators from five dimensions, the forward-looking information in the corporate financial annual report is processed in Chinese word segmentation and the tone is calculated according to the commonly used emotional dictionary, and the financial data is added for indicators. And factor analysis is used to reduce dimensionality, to eliminate indicator redundancy and the correlation between them. We try to extract a small amount of common factors, and finally use support vector machines to build a risk early warning model. The experimental results show that the five-dimensional index system selected in this paper has strong consistency with the common factors obtained by factor analysis, which proves the economic significance of factor analysis and the interpretability. At the same time, the combination of financial text information can effectively improve the accuracy of financial risk prediction, which verifies the effectiveness of financial text on risk early warning models.
Key words: management tone; listed company; risk warning; financial risk
(責(zé)任編輯:李丹;校對:盧艷茹)