伍 威
(廣州華南商貿(mào)職業(yè)學院,廣東 廣州 510000)
企業(yè)是我國社會經(jīng)濟發(fā)展的基礎(chǔ),而企業(yè)的財務問題是企業(yè)發(fā)展需要解決的核心問題之一。我國針對企業(yè)信息化財務危機預警的研究較少且研究技術(shù)不夠成熟,目前應用的財務危機預警模型不僅預測速度慢且準確率較低,不能滿足企業(yè)的發(fā)展需求。針對目前常用的集中財務危機預警模型,宋宇等(2019)提出的基于Cox回歸的企業(yè)信息化財務危機預警模型,通過半?yún)?shù)模型對不同生存時間的評價因子進行多因素分析,能夠有效利用截尾數(shù)據(jù)預測財務危機,但由于在運算過程中忽略了影響因子的分布和特征,降低了模型的財務危機識別能力,導致預測準確度較低;楊貴軍等(2019)提出的基于Benford-Logistic的企業(yè)信息化財務預警模型與基于Cox回歸的模型有相似之處,不同點在于該模型應用廣義線性論改變因變量,對數(shù)據(jù)進行連續(xù)的多重線性回歸,但由于缺少數(shù)據(jù)挖掘,預測精度不夠理想;侯旭華(2019)提出的基于模糊綜合評價法的財務危機預警模型,利用層次分析法將影響企業(yè)財務狀況的多種因素分層處理,系統(tǒng)性較強,但由于需進行指標權(quán)重分配和評議,模型運行時間較長,降低了預測效率。綜合上述幾種財務預警模型的弊端,本文提出一種基于風險識別的企業(yè)信息化財務危機預警模型,在對企業(yè)信息化財務進行風險識別的基礎(chǔ)上,結(jié)合主成分分析法和雙子支持向量機分析法構(gòu)建PCA-SVW組合財務危機預警模型,結(jié)合財務風險預測指標制定財務危機預警指標,實現(xiàn)高精度、高效率的財務預警,經(jīng)過對比實驗驗證,本文提出的模型的實際應用性能高于目前常用的幾種模型的性能,具有較高的應用價值。
根據(jù)海量的財務數(shù)據(jù),分析企業(yè)信息化財務風險的特征,參考多種指標對企業(yè)信息化財務風險進行分類,結(jié)果如圖1所示。
確定企業(yè)信息化財務風險預測指標便于梳理企業(yè)多種信息化財務狀況,形成條理清晰、側(cè)重點明確的財務指標關(guān)系網(wǎng)絡。通常情況下,依據(jù)有效的財務風險預測指標可以更加準確全面地了解企業(yè)的整體財務運營情況,在很大程度上給予企業(yè)管理者更加科學合理的參考性決策意見,在專業(yè)程度上可進一步展現(xiàn)企業(yè)的各項財務狀況,明確影響財務狀況的關(guān)聯(lián)因素。
圖1 企業(yè)信息化財務風險分類
根據(jù)企業(yè)信息化財務風險的類型,結(jié)合數(shù)據(jù)資料,本文確定的財務風險預測指標在滿足全面性原則、概括性原則、敏感性原則、先驗性原則以及可度量可操作性原則等五大指標篩選原則的前提下,包含13項財務風險預測指標,如表1所示。
表1 企業(yè)信息化財務風險識別
由于篩選的財務風險預測指標之間存在線性相關(guān)性、非線性相關(guān)性等多重關(guān)系問題,內(nèi)容重復的指標無法準確評估企業(yè)財務的真實狀況,為驗證本文確定的財務風險預測指標的有效性,將初步篩選的財務風險預測指標生成初始備選財務風險預測指標集,利用K-S正態(tài)分布檢驗方法驗證各財務指標是否滿足正態(tài)分布,依據(jù)均值比較獨立指標檢驗結(jié)果和非參數(shù)檢驗K-W檢驗結(jié)果,生成存在顯著性差異的財務風險預測指標集,考慮指標間的關(guān)聯(lián)性,引用多重共線檢驗因子分析進行指標檢驗,篩選滿足企業(yè)財務風險預測需求的財務風險預測指標,生成有效財務風險預測指標集。企業(yè)備選財務風險預測指標的檢驗和分析流程如圖2所示。經(jīng)過上述檢驗,本文提出的財務風險預測指標均滿足標準,具有一定的可靠性和實用性。
圖2 企業(yè)備選財務風險預測指標的檢驗和分析流程
企業(yè)信息化財務風險由多種要素構(gòu)成,依據(jù)風險類型、風險識別需求以及財務統(tǒng)計習慣,將財務風險的組成要素分為多層,在多層風險因素相互影響的情況下,進行企業(yè)信息化財務風險的特征提取,當采集的數(shù)據(jù)樣本包含風險特征時,可初步判斷所屬風險類型,便于企業(yè)信息化財務風險的識別。
考慮風險特征之間的信息冗余問題,為實現(xiàn)數(shù)量少且有效度高的特征提取,針對數(shù)據(jù)樣本中的不相關(guān)特征和冗余特征進行首要剔除,利用信息值I對定性特征的重要性進行衡量。信息值I的計算方式如下:
(1)
其中,ni1表示該特征變量第i個屬性對應的正常財務類型;n1表示樣本中總的正常財務類型數(shù)量;ni2表示該特征變量第i個屬性對應的風險財務類型;n2表示樣本中總的風險財務類型數(shù)量。當I>0.5時,說明該特征具有良好的預測能力,可以被采用;當0.1
針對定量特征提取,采用相關(guān)性分析方法,引入皮爾遜相關(guān)系數(shù)進行定量特征選擇。皮爾遜相關(guān)系數(shù)的定義式如下:
(2)
除以上兩種特征提取方法外,遞歸消減方法也是進行特征提取的有效方法之一,即通過構(gòu)建邏輯回歸模型多次訓練樣本數(shù)據(jù),逐步減少特征數(shù)量,對比預選特征預測誤差的顯著性,篩選預測力較好的特征,產(chǎn)生特征集。
結(jié)合上述風險預測指標,深入挖掘企業(yè)的信息化財務數(shù)據(jù),當提取的關(guān)鍵數(shù)據(jù)具有已知財務風險的特征時,可推斷該企業(yè)是否具有財務風險和風險類型。
數(shù)據(jù)樣本選取近兩年內(nèi)京滬兩市共60家企業(yè),優(yōu)先選取數(shù)據(jù)全面、無偏差的50家上市企業(yè)作為預選企業(yè)。按照企業(yè)間資產(chǎn)規(guī)模相近原則,在剩下的10家企業(yè)中篩選出8家資產(chǎn)規(guī)模相近的企業(yè),再在此8家企業(yè)中篩選出2家上市企業(yè)。至此,共收集并選取52家上市企業(yè)財務數(shù)據(jù)作為研究的數(shù)據(jù)樣本。
基于風險識別的企業(yè)信息化財務危機預警模型的研究,本文將收集的符合標準的數(shù)據(jù)大致分為訓練數(shù)據(jù)與測試數(shù)據(jù)兩種類型。針對預警模型的訓練需求,將訓練數(shù)據(jù)與測試數(shù)據(jù)樣本進行比例劃分,規(guī)定收集數(shù)據(jù)中80%左右的數(shù)據(jù)為訓練數(shù)據(jù),20%左右的數(shù)據(jù)為測試數(shù)據(jù)。訓練數(shù)據(jù)用于財務危機訓練預警模型,測試數(shù)據(jù)用于檢驗模型數(shù)據(jù)訓練結(jié)果的準確性。針對收集數(shù)據(jù)進行5次隨機劃分,通過數(shù)據(jù)訓練獲得相應的財務危機預測結(jié)果,并分別予以有效測試。
財務危機預警模型在應用前應對數(shù)據(jù)樣本進行數(shù)據(jù)的標準化處理,在提升數(shù)據(jù)適應性的同時,有利于快速地生成準確的訓練結(jié)果。在上述財務風險預測指標和風險特征提取的基礎(chǔ)上,本文構(gòu)建的財務預警模型應用的數(shù)據(jù)預處理方法包含主成分分析法和雙子支持向量機分析法。
1.主成分分析法。應用主成分分析法進行數(shù)據(jù)處理的優(yōu)勢在于能夠降低冗余變量對模型計算過程的影響。主成分分析法主要通過正交交換手法轉(zhuǎn)換數(shù)據(jù)屬性間重疊的觀察值,以相關(guān)性觀察值為依據(jù)消除數(shù)據(jù)間的關(guān)聯(lián)關(guān)系,提取出具有獨立特征的新數(shù)據(jù),并確保提取的新數(shù)據(jù)能夠反映全部數(shù)據(jù)的整體特征,我們將提取出的新數(shù)據(jù)稱為數(shù)據(jù)樣本中的主成分。
假設(shè)收集的某一企業(yè)的財務數(shù)據(jù)中包含n個風險特征維度,m行數(shù)據(jù),則構(gòu)建的協(xié)方差矩陣C的大小為m×n,矩陣C的風險特征值始終為實數(shù),風險特征變量為正交。矩陣C的構(gòu)建公式如下:
(3)
其中,S表示風險特征矩陣;r表示風險特征維度屬性。
對于風險特征矩陣S,由于無法完全避免收集數(shù)據(jù)重復,為降低重復數(shù)據(jù)對訓練數(shù)值的影響,將風險特征矩陣轉(zhuǎn)換到另一個特征空間,生成新的特征矩陣Z。在特征空間內(nèi),各風險特征向量呈現(xiàn)出正交關(guān)系,即特征值之間的線性相關(guān)性可以直接忽略。特征矩陣Z的轉(zhuǎn)換公式如下:
(4)
若在特征空間中,矩陣S到矩陣Z的轉(zhuǎn)換過程為:
SU=Z
(5)
其中,U為C的特征向量矩陣,則矩陣Z的特征向量矩陣D的表達方式為:
(6)
2.雙子支持向量機分析法。分類間隔、對偶以及核函數(shù)是雙子支持向量機的三個基本點,作為財務危機預警模型的核心數(shù)據(jù)處理技術(shù),決定了財務危機預警模型的結(jié)構(gòu)化風險與特征維度空間的分離性以及適用性等。雙子支持向量機的應用不僅使模型具有了全局最優(yōu)解,還使模型的結(jié)構(gòu)更加清晰明了。針對收集數(shù)據(jù)的復雜線性關(guān)系、非線性關(guān)系、數(shù)據(jù)數(shù)量多以及數(shù)據(jù)維數(shù)高等問題,具有較好的處理效果。
假設(shè)初始數(shù)據(jù)訓練集為:
{(x1,y1),(x2,y2),…,(xn,yn)}
劃分線性超平面,若在線性超平面中存在兩種不同數(shù)據(jù)樣本,以這兩種數(shù)據(jù)樣本確立最優(yōu)分類平面,最大化數(shù)據(jù)樣本的分類間隔,支持向量即表示為與最優(yōu)分類平面存在距離的數(shù)據(jù)樣本點,最優(yōu)分類平面示意圖如圖3所示。將處于低維空間中的數(shù)據(jù)樣本通過特征向量轉(zhuǎn)換手段轉(zhuǎn)換到高維空間中,針對無法采用線性超平面分離的數(shù)據(jù),通過特征轉(zhuǎn)化轉(zhuǎn)換到新的分類平面中進行分類。在最優(yōu)分類平面中,利用數(shù)據(jù)間對偶轉(zhuǎn)換實現(xiàn)最優(yōu)參數(shù)解,獲得相應的分類結(jié)果,雙子支持向量機的運算形式如下:
(7)
(8)
圖3 最優(yōu)分類平面示意圖
在企業(yè)信息化財務風險識別的基礎(chǔ)上,綜合主成分分析法和雙子支持向量機分析法對預警財務危機的優(yōu)勢,建立PCA-SVW組合財務危機預警模型,即主成分分析法和雙子支持向量機分析法的組合財務危機預警模型,主要有兩種組合方式。
一是在雙子向量機模型中嵌入主成分分析法對原始數(shù)據(jù)進行分析,再利用雙子支持向量機分析法進行數(shù)據(jù)分類與預測,得出相應的危機預警結(jié)果。危機預警結(jié)果表示為:
M=SVW(PCA(X))
(9)
二是采用線性組合方式,即單獨采用主成分分析法提取數(shù)據(jù)主成分,獲取原始數(shù)據(jù)分析結(jié)果M1,再利用雙子支持向量機分析法對原始數(shù)據(jù)進行預測,生成預測結(jié)果M2,對生成的兩種結(jié)果進行線性組合,輸出組合預測結(jié)果M。兩種分析方式的線性組合形式如下:
M=a1M1+a2M2
(10)
其中,a表示分析參數(shù)。
考慮主成分分析法針對非線性數(shù)據(jù)的降位劣勢,受主觀影響較大,權(quán)重的預測結(jié)果缺少客觀性,在復雜情況下無法發(fā)揮最大化優(yōu)勢,因此相較于第二種線性組合方式,第一種組合方式更具可靠性和準確性,因此本文選用第一種組合方式構(gòu)建PCA-SVW組合財務危機預警模型,并參考上文的財務風險預測指標,制定財務危機預警指標,設(shè)定參考預警值,當某一指標的真實值超過預警值時,觸發(fā)財務危機預警機制,實現(xiàn)企業(yè)信息化財務危機預警。財務危機預警指標如表2所示。
表2 財務危機預警指標
財務危機預警模型的表達式確定后,初始化模型參數(shù),將訓練數(shù)據(jù)輸入財務危機預警模型性數(shù)據(jù)訓練,生成財務危機預測結(jié)果。將危機預測結(jié)果大于0.5的企業(yè)輸出為正類(具有財務危機),相應預警機制,根據(jù)訓練數(shù)據(jù)的特征信息,明確財務危機類型,進行財務危機匯總進行信息反饋。反之則輸出為負類(不具有財務危機)。結(jié)束危機預測后,將測試數(shù)據(jù)輸入財務危機預警模型,對比預測結(jié)果和訓練結(jié)果,評價財務危機預警的性能。
為精準評價本文研究的財務危機預警模型,提升模型評價的可靠性,選擇多種評價指標進行模型評價,選用的評價指標和具體應用介紹如表3所示。
表3 混淆矩陣
在混淆矩陣中,TN表示負類預測為負類;TP表示正類預測為負類;FN表示正類預測為負類;FP表示負類預測為正類。
模型的準確率體現(xiàn)了模型對企業(yè)信息化危機預警的精度,準確率A的表達式為:
(11)
在非平衡數(shù)據(jù)集中,由于負類數(shù)據(jù)樣本和正類數(shù)據(jù)樣本的比例失衡,可能出現(xiàn)負類數(shù)據(jù)樣本數(shù)量大于正類數(shù)據(jù)樣本數(shù)量的情況,僅用準確率不能全面地評價財務危機預警模型的真實性能,可能導致評價結(jié)果失真。因此引入精確率進一步體現(xiàn)模型識別正類數(shù)據(jù)樣本的準確度,在數(shù)據(jù)訓練中,精確率在數(shù)值上表示正類樣本數(shù)量與總樣本數(shù)量的比值,精確率的計算公式為:
(12)
召回率體現(xiàn)了實際正類數(shù)據(jù)樣本中,被財務危機預警模型預測為正類的概率,在某種程度上,可以展現(xiàn)模型對正類數(shù)據(jù)樣本識別的敏感程度,召回率R的表達式為:
(13)
F1值以評價對象的精確率和召回率作為參考變量計算調(diào)和平均值,F1的表達式為:
(14)
通過以上4個評價指標對財務危機預警模型進行評價,得到的評價結(jié)果為優(yōu)秀,有力地驗證了該模型的綜合性能。
為進一步驗證本文研究的基于風險識別的企業(yè)信息化財務危機預警模型的實際應用性能,采用Matlb設(shè)計對比實驗,在相同的實驗環(huán)境中選擇本文研究的財務危機預警模型和傳統(tǒng)基于Cox回歸的企業(yè)信息化財務危機預警模型以及基于模糊綜合評價法的企業(yè)信息化財務危機預警模型為實驗對象,對比三種模型的實際應用性能。
從數(shù)據(jù)收集的真實性和可獲得性出發(fā),本實驗采用的數(shù)據(jù)樣本來源于WIND庫以及上市企業(yè)的年報財務信息。為保證數(shù)據(jù)樣本的多樣性,對不同主營業(yè)務的企業(yè)進行隨機挑選,且為驗證本文研究模型對不同規(guī)模企業(yè)的適應程度,最終選取24家小型企業(yè)和26家中型企業(yè),并且隨機選取其中40家企業(yè)的財務數(shù)據(jù)作為模型訓練數(shù)據(jù),其余10家企業(yè)的財務數(shù)據(jù)作為模型測試數(shù)據(jù)。
針對相同的數(shù)據(jù)樣本,三種模型的運行結(jié)果如圖4所示。從圖4中可以看出,基于Cox回歸的預警模型由于在訓練過程中沒有對訓練數(shù)據(jù)進行深層次的數(shù)據(jù)分析,不能對數(shù)據(jù)樣本中包含的所有財務危機進行準確分類和預警?;谀:C合評價法的預警模型的分類效果較為優(yōu)秀,能夠識別差異性較為明顯的財務危機類別,但針對差異性不明顯的財務危機分類效果最差。經(jīng)過對比,本文研究的基于風險識別的預警模型在主成分分析的基礎(chǔ)上,利用雙子支持向量機分析法遍歷數(shù)據(jù)樣本尋找出最優(yōu)懲罰參數(shù)和核函數(shù),通過構(gòu)建最優(yōu)分類平面進行數(shù)據(jù)分類,提升了多樣性數(shù)據(jù)分類的精度,進而提升了預測準確率。
基本cox回歸的企業(yè)信息化財務危機預警模型的運行結(jié)果
基本模糊綜合評價法的企業(yè)信息化財務危機預警模型的運行結(jié)果
基于風險識別的企業(yè)信息化財務危機預警模型的運行結(jié)果圖4 三種財務危機預警模型的運行結(jié)果對比
為使上述運行結(jié)果更具說服力,輸入測試數(shù)據(jù)進行驗證,統(tǒng)計實驗結(jié)果,計算三種模型的準確率、精確率、召回率以及F1值等,得到以下統(tǒng)計結(jié)果,如表4所示。
表4 模型綜合評定結(jié)果
根據(jù)表4的統(tǒng)計結(jié)果可以看出,對比三種模型對于企業(yè)信息化財務危機預測的準確率和精確率,進一步驗證了本文研究的基于風險識別的預警模型的準確率和精確率明顯高于其他兩種預警模型。對比召回率和F1值可知,本文研究的模型針對財務危機敏感度更高,原因在于風險識別方法相較于其他兩種方法更能準確挖掘數(shù)據(jù)間的聯(lián)系,識別敏銳度更強。對比運行時間可知,本文研究的基于風險識別的預警模型由于采用主成分分析法和雙子支持向量機分析法,在參數(shù)尋優(yōu)方面更具優(yōu)勢,可以簡化繁雜的計算步驟,從而達到提升模型預測效率的目的。
綜上所述,本文研究的基于風險識別的企業(yè)信息化財務危機預警模型對于多因素影響的財務危機預警具有更高的效率、準確率以及敏感度。隨著企業(yè)信息化財務建設(shè)逐漸取得顯著成效,借鑒多種財務風險識別的經(jīng)驗,進一步完善企業(yè)信息化財務危機預警模型的體系建設(shè),在減少企業(yè)財務工作量的同時,降低企業(yè)信息化財務危機的預測難度,有利于企業(yè)選擇適合未來發(fā)展的方向,從而促進我國經(jīng)濟的進一步發(fā)展。