石 峰
(湖南工程學(xué)院 管理學(xué)院,湖南 湘潭411104)
新冠病毒疫情爆發(fā)以來,大量企業(yè)陷入財(cái)務(wù)困境。對(duì)于投資者和其他利益相關(guān)者而言,預(yù)測(cè)上市公司的上市狀態(tài)至關(guān)重要?!疤貏e處理”(即Special Treatment,ST)是我國證券市場(chǎng)特有的一項(xiàng)旨在保護(hù)投資者利益的政策。具體而言,當(dāng)某上市公司出現(xiàn)財(cái)務(wù)狀況或其他狀況異常,導(dǎo)致投資者難以判斷該公司前景,且投資者利益可能受到損害時(shí),交易所要對(duì)該公司股票交易實(shí)行特別處理。特別處理的股票,除了漲跌幅度受到限制以外,其股票名稱之前還需注釋為“ST”。如果該ST 公司仍然持續(xù)虧損,那么它將有被退市的風(fēng)險(xiǎn)。
針對(duì)我國上市公司的ST 分類預(yù)測(cè)研究,國內(nèi)已有大量研究成果。陳瑜選取滬深A(yù) 股和B 股58 家ST 公司和58 家非ST 公司為研究樣本,基于流動(dòng)比率、資產(chǎn)負(fù)債率、總資產(chǎn)周轉(zhuǎn)率、總資產(chǎn)收益率、權(quán)益報(bào)酬率和凈利潤率等6 個(gè)財(cái)務(wù)指標(biāo)數(shù)據(jù),運(yùn)用判別分析法對(duì)ST 公司進(jìn)行分類,準(zhǔn)確率達(dá)75%左右。[1]姜國華和王漢生選取滬深股市33 家ST 公司和778家非ST 公司的7 個(gè)財(cái)務(wù)指標(biāo)數(shù)據(jù)(主營業(yè)務(wù)利潤、資產(chǎn)周轉(zhuǎn)率、債務(wù)資產(chǎn)比率、主營業(yè)務(wù)收入增長率、第一大股東持股比例、資產(chǎn)總額和營業(yè)外收支凈額),運(yùn)用邏輯回歸方法對(duì)ST 公司進(jìn)行分類預(yù)測(cè),預(yù)測(cè)準(zhǔn)確率大約為64%。[2]吳曼琪基于43 家ST 公司的4 個(gè)財(cái)務(wù)指標(biāo)數(shù)據(jù)(每股收益、每股凈資產(chǎn)、每股現(xiàn)金流量和每股資本公積金),運(yùn)用K 均值聚類法對(duì)ST 股票進(jìn)行分類,預(yù)測(cè)分類準(zhǔn)確率為66.7%。[3]時(shí)建中基于RS-Bag 分類器集成技術(shù)對(duì)我國ST 公司進(jìn)行分類預(yù)測(cè),預(yù)測(cè)準(zhǔn)確率達(dá)到80%左右。[4]張茂軍選取2001—2015 年我國制造業(yè)157 家ST 公司和200 家非ST 公司的9 個(gè)財(cái)務(wù)指標(biāo)數(shù)據(jù)(流動(dòng)比率、資產(chǎn)負(fù)債率、資產(chǎn)報(bào)酬率、營業(yè)利潤率、銷售現(xiàn)金比率、固定資產(chǎn)增長率、應(yīng)收賬款周轉(zhuǎn)率、產(chǎn)權(quán)比率和總資產(chǎn)規(guī)模),運(yùn)用生存分析法分析發(fā)現(xiàn):總資產(chǎn)規(guī)模越大,被ST 可能性越小。[5]
綜上,國內(nèi)針對(duì)ST 公司的分類預(yù)測(cè)研究,主要運(yùn)用傳統(tǒng)的分類預(yù)測(cè)方法(判別分析法、聚類分析法、邏輯回歸法和生存分析法)。這些預(yù)測(cè)方法的應(yīng)用通常需要某些假設(shè),比如,邏輯回歸中要求logit(p)和自變量之間存在線性關(guān)系;判別分析中要求各變量相互獨(dú)立,且服從多元正態(tài)分布。因此,當(dāng)自變量的數(shù)量逐漸增多且高度相關(guān)時(shí),這些方法的缺點(diǎn)更加明顯。同時(shí),以往的研究在指標(biāo)選擇上,主要選取償債能力、營運(yùn)能力、盈利能力、成長能力、現(xiàn)金流量和資產(chǎn)結(jié)構(gòu)等方面的少量財(cái)務(wù)指標(biāo),具有一定主觀性。另外,以往的研究在樣本選取上,主要根據(jù)1∶1配對(duì)的原則,即根據(jù)ST 公司的數(shù)量來選取“非ST”公司的數(shù)量。但GMDH 神經(jīng)網(wǎng)絡(luò)法應(yīng)用于分類預(yù)測(cè)研究不會(huì)受到如此嚴(yán)格的限制。然而需要指出的是,GMDH 神經(jīng)網(wǎng)絡(luò)法應(yīng)用于我國中小板上市公司ST 分類的預(yù)測(cè)研究還很難看到。
分組數(shù)據(jù)處理方法(Group Method of Data Handing,GMDH)型神經(jīng)網(wǎng)絡(luò)法是用于對(duì)復(fù)雜系統(tǒng)進(jìn)行建模的自組織算法,被廣泛應(yīng)用于回歸、分類、聚類和預(yù)測(cè)等研究領(lǐng)域。由此,首次將GMDH 神經(jīng)網(wǎng)絡(luò)法應(yīng)用于我國中小板上市公司的ST 分類預(yù)測(cè)中,構(gòu)建全面涵蓋償債能力、營運(yùn)能力、盈利能力、成長能力、現(xiàn)金流量和資產(chǎn)結(jié)構(gòu)等六大方面的86 個(gè)財(cái)務(wù)指標(biāo)的GMDH 神經(jīng)網(wǎng)絡(luò)分類預(yù)測(cè)模型,并評(píng)價(jià)其預(yù)測(cè)效果。
GMDH 神經(jīng)網(wǎng)絡(luò)法是一種研究變量之間關(guān)系的啟發(fā)式自組織方法。GMDH 神經(jīng)網(wǎng)絡(luò)法可以自動(dòng)查找數(shù)據(jù)中的相互關(guān)系、選擇模型或網(wǎng)絡(luò)的最佳結(jié)構(gòu),并提高現(xiàn)有算法的準(zhǔn)確性。Ivakhnenko 為更好地預(yù)測(cè)河流中的魚類種群,創(chuàng)造了分組數(shù)據(jù)處理方法(GMDH),使神經(jīng)元成為具有多項(xiàng)式傳遞函數(shù)的更復(fù)雜的單元,并簡化了神經(jīng)元之間的互聯(lián),同時(shí)開發(fā)了用于結(jié)構(gòu)設(shè)計(jì)和權(quán)重調(diào)整的自動(dòng)算法。[6]43-55Ivakhnenko 構(gòu)造的多項(xiàng)式為:
上式(1)也稱為Ivakhnenko 多項(xiàng)式。其中,m 表示每個(gè)神經(jīng)元進(jìn)入回歸模型的變量數(shù)量;a,b,c…是多項(xiàng)式中變量的權(quán)重;y是響應(yīng)變量;xi和xj是探索性變量。在研究中,上述模型僅包含主要影響,由此可表示為:
在模型建立和評(píng)估過程中,數(shù)據(jù)被分為三組:訓(xùn)練集(60%)、驗(yàn)證集(20%)和測(cè)試集(20%)。訓(xùn)練集包含在模型構(gòu)建中,驗(yàn)證集則用于對(duì)神經(jīng)元的選擇;測(cè)試集是用于考察評(píng)估模型在未觀察數(shù)據(jù)上的性能。GMDH 神經(jīng)網(wǎng)絡(luò)法是由神經(jīng)元構(gòu)成的層次系統(tǒng)。每層中對(duì)應(yīng)神經(jīng)元的數(shù)量取決于輸入的數(shù)量。假設(shè)進(jìn)入某一層的輸入數(shù)量等于p,則該層中的神經(jīng)元數(shù)量變?yōu)椋?/p>
圖1 GMDH 神經(jīng)網(wǎng)絡(luò)法的體系結(jié)構(gòu)
上式(3)考慮了所有成對(duì)的輸入組合,但這并不意味著所有層都包括h 個(gè)神經(jīng)元。例如,輸入層中的輸入數(shù)量僅定義第一層中的神經(jīng)元數(shù)量。在第一層中選擇的神經(jīng)元數(shù)量決定第二層中的神經(jīng)元數(shù)量。該算法自行組織架構(gòu),當(dāng)存在三個(gè)層次和四個(gè)輸入時(shí),GMDH 神經(jīng)網(wǎng)絡(luò)法的體系結(jié)構(gòu)如圖1 所示。
實(shí)證數(shù)據(jù)來源于巨潮資訊網(wǎng)公布的中小板上市公司的財(cái)務(wù)指標(biāo)數(shù)據(jù)。數(shù)據(jù)日期為2019 年1 月1 日至3 月31 日,即2019 年第一季度財(cái)務(wù)報(bào)告數(shù)據(jù)。中小板上市公司總共有940 家,且每家公司的財(cái)務(wù)指標(biāo)共計(jì)122 個(gè),其中有35 家“*ST”公司和9 家ST 公司。研究目的是運(yùn)用GMDH 神經(jīng)網(wǎng)絡(luò)法對(duì)中小板上市公司是否是ST 公司和非ST 公司做出正確預(yù)測(cè)分類。因此,進(jìn)一步對(duì)數(shù)據(jù)進(jìn)行篩選,以滿足GMDH 神經(jīng)網(wǎng)絡(luò)法對(duì)數(shù)據(jù)的要求。首先,在這122 個(gè)財(cái)務(wù)指標(biāo)數(shù)據(jù)中,刪除有缺失值的指標(biāo)和樣本;其次,刪除財(cái)務(wù)指標(biāo)數(shù)據(jù)為0 的樣本。由此得到86 個(gè)財(cái)務(wù)指標(biāo)的116 家公司樣本,其中“*ST”公司34 家,ST公司9 家。最后,將“*ST”公司和ST 公司都?xì)w類為ST 公司,共計(jì)43 家ST 公司,占116 家公司樣本的37.1%;73 家非ST 公司占116 家公司樣本的62.9%。運(yùn)用于分類預(yù)測(cè)的86 個(gè)財(cái)務(wù)指標(biāo)全面涵蓋了償債能力、營運(yùn)能力、盈利能力、成長能力、現(xiàn)金流量和資產(chǎn)結(jié)構(gòu)等六大方面內(nèi)容(見表一)。
表一 中小板上市公司財(cái)務(wù)指標(biāo)體系
續(xù)表一
運(yùn)用GMDH 神經(jīng)網(wǎng)絡(luò)法對(duì)中小板上市公司的財(cái)務(wù)指標(biāo)數(shù)據(jù)進(jìn)行特征選擇和分類預(yù)測(cè),同時(shí)參考Osman 和Yozgatligil 開發(fā)的R 軟件程序包GMDH 進(jìn)行計(jì)算[7],并使用Osman 和Erdem 最新開發(fā)的GMDH2 函數(shù)進(jìn)行分類預(yù)測(cè)[8]。二進(jìn)制分類是一項(xiàng)任務(wù),其中可以將二進(jìn)制目標(biāo)標(biāo)簽分配給每個(gè)觀察值,從而通過分組數(shù)據(jù)處理(GMDH)算法對(duì)兩標(biāo)簽輸出進(jìn)行分類。GMDH 神經(jīng)網(wǎng)絡(luò)法適用于復(fù)雜的非結(jié)構(gòu)化系統(tǒng),并且比高階回歸具有優(yōu)勢(shì)。通過GMDH神經(jīng)網(wǎng)絡(luò)法執(zhí)行二進(jìn)制分類存在兩種主要算法:GMDH 神經(jīng)網(wǎng)絡(luò)法和基于各種分類器集合的GMDH(dce-GMDH)神經(jīng)網(wǎng)絡(luò)法。
首先,我們將數(shù)據(jù)隨機(jī)分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,然后調(diào)用GMDH()函數(shù)。
運(yùn)行GMDH()函數(shù)得到的結(jié)果如表二所示。由表二看到,中小板上市公司ST 分類預(yù)測(cè)的算法結(jié)構(gòu)包括層、神經(jīng)元、被選中神經(jīng)元和最小均方誤差。該算法結(jié)構(gòu)共計(jì)5 層,每層神經(jīng)元的數(shù)量分別為3655、105、66、105 和105;每層被選中的神經(jīng)元分別為15、12、15、15 和1。計(jì)算神經(jīng)元的外部標(biāo)準(zhǔn)為最小均方誤差。
當(dāng)層數(shù)為5時(shí),最小均方誤差達(dá)到最小值0.081 52。該算法從86 個(gè)變量中選擇了8 個(gè)變量(X2,X3,X9,X15,X17,X25,X26,X57),即基本每股收益、稀釋每股收益、營業(yè)稅金率、成本費(fèi)用利潤率、應(yīng)收賬款周轉(zhuǎn)率、貨幣資金比率、固定資產(chǎn)比率和年化期間費(fèi)用毛利比。
在模型構(gòu)建完成后對(duì)測(cè)試集進(jìn)行預(yù)測(cè),測(cè)試集共有23 個(gè)觀測(cè)值,預(yù)測(cè)結(jié)果如表三所示。
從表三看出,GMDH 神經(jīng)網(wǎng)絡(luò)法預(yù)測(cè)第1 家公司為“ST”和“非ST”的概率分別為0.29 和0.71,由于第1 家公司為“非ST”的概率大于為“ST”的概率,因此第1 家公司歸類為非ST 公司。因此,在23 家測(cè)試樣本中,歸類為ST 公司的有4、6、8、9、11、13、15、19 和23;歸類為非ST 公司的有1、2、3、5、7、10、12、14、16、17、18、20、21 和22。
隨后,利用R 軟件中的confMat()函數(shù)為二進(jìn)制響應(yīng)生成一個(gè)混淆矩陣,并返回一些相關(guān)的統(tǒng)計(jì)信息。GMDH 神經(jīng)網(wǎng)絡(luò)法的分類預(yù)測(cè)正確率為0.7826。這說明該算法將78.26%的公司分類為正確的類別,即23 家公司中有18 家公司分類正確,其中8家ST 公司分類正確,1 家ST 公司分類錯(cuò)誤;10 家非ST 公司分類正確,4 家非ST 公司分類錯(cuò)誤。與此同時(shí),可以計(jì)算出敏感性值和特異性值分別為0.6667 和0.9091。這表明該算法將66.67%的ST 公司和90.91%的非ST 公司正確分類,即在分類預(yù)測(cè)結(jié)果中,12 家ST 公司有8 家ST 公司分類正確;11家非ST 公司有10 家非ST 公司分類正確。
運(yùn)用GMDH 神經(jīng)網(wǎng)絡(luò)法得到的分類預(yù)測(cè)結(jié)果,與以往研究相比,預(yù)測(cè)正確率大幅提高。進(jìn)一步采用1:1 配對(duì)原則(43 家ST 公司和43 家“非ST”公司)對(duì)中小板上市公司進(jìn)行ST 分類預(yù)測(cè)。首先,對(duì)兩類上市公司的86 家樣本進(jìn)行分組,即分成訓(xùn)練集(60%)、驗(yàn)證集(20%)和測(cè)試集(20%)。其中,43 家“非ST”公司樣本從73 家“非ST”公司隨機(jī)選取。1∶1 配對(duì)下的ST 分類預(yù)測(cè)算法結(jié)構(gòu)輸出結(jié)果見表四所示。
表四 1∶1 配對(duì)下的ST 分類預(yù)測(cè)算法結(jié)構(gòu)輸出結(jié)果
從表四看到,GMDH 神經(jīng)網(wǎng)絡(luò)法在每個(gè)相應(yīng)層的驗(yàn)證集上給出了最小外部標(biāo)準(zhǔn)值(均方誤差)。當(dāng)層數(shù)為10 時(shí),最小均方誤差達(dá)到最小值0.089 05。該算法從86 個(gè)變量中選擇了8 個(gè)變量(X5,X25,X32,X34,X42,X43,X44,X57),即每股未分配利潤、貨幣資金比率、現(xiàn)金比率、流動(dòng)負(fù)債比率、每股經(jīng)營現(xiàn)金流量、每股經(jīng)營現(xiàn)金流量經(jīng)營凈現(xiàn)金比率(短期債務(wù))、經(jīng)營凈現(xiàn)金比率(全部債務(wù))和年化期間費(fèi)用毛利比。
在模型構(gòu)建完成后對(duì)測(cè)試集的17 個(gè)觀測(cè)值進(jìn)行預(yù)測(cè)。1∶1 配對(duì)下GMDH 神經(jīng)網(wǎng)絡(luò)法的分類預(yù)測(cè)正確率為0.8824。這說明該算法將88.24%的公司分類為正確的類別,即17 家公司中,有15 家公司分類正確;其中7 家ST 公司分類正確,1 家ST 公司分類錯(cuò)誤;8 家非ST 公司分類正確,1 家非ST 公司分類錯(cuò)誤。同樣地,計(jì)算得到的敏感性值和特異性值分別為0.8750 和0.8889。這表明該算法將87.50%的ST公司和88.89%的非ST 公司正確分類,即在分類預(yù)測(cè)結(jié)果中,8 家ST 公司有7 家ST 公司分類正確;9家非ST 公司有8 家非ST 公司分類正確。
運(yùn)用GMDH 神經(jīng)網(wǎng)絡(luò)法對(duì)具有86 個(gè)財(cái)務(wù)指標(biāo)的116 家ST 公司(43 家)和非ST 公司(73 家)進(jìn)行分類預(yù)測(cè),預(yù)測(cè)正確率為78.26%,敏感性值和特異性值分別為0.6667 和0.9091,即將66.67%的ST 公司和90.91%的非ST 公司正確分類。隨后,進(jìn)一步以1∶1配對(duì)原則對(duì)43 家ST 公司和43 家非ST 公司進(jìn)行分類預(yù)測(cè),預(yù)測(cè)正確率達(dá)到88.24%,敏感性值和特異性值分別為0.8750 和0.8889,即將87.50%的ST 公司和88.89%的非ST 公司正確分類。
基于GMDH 神經(jīng)網(wǎng)絡(luò)法對(duì)我國中小板43 家ST公司和73 家非ST 公司的分類預(yù)測(cè)有助于為中小板上市公司的財(cái)務(wù)預(yù)警和監(jiān)測(cè)發(fā)揮作用,與此同時(shí)也可進(jìn)一步在我國主板市場(chǎng)進(jìn)行推廣和應(yīng)用。
需要指出的是,GMDH 神經(jīng)網(wǎng)絡(luò)法是基于對(duì)逐漸復(fù)雜的模型進(jìn)行分類,并通過最小化外部準(zhǔn)則特征來選擇最佳解決方案。GMDH 神經(jīng)網(wǎng)絡(luò)法找到了模型結(jié)構(gòu)的最佳復(fù)雜性,足以滿足樣本數(shù)據(jù)中的噪聲水平。其中,隱藏層中的層數(shù)和神經(jīng)元數(shù)量以及模型結(jié)構(gòu)和其他最佳神經(jīng)網(wǎng)絡(luò)參數(shù)自動(dòng)確定。由于輸入變量使用可影響輸出變量的非線性函數(shù),它會(huì)自動(dòng)在數(shù)據(jù)中找到可解釋的關(guān)系,并選擇有效的輸入變量。因此,GMDH 神經(jīng)網(wǎng)絡(luò)法可以使用兩個(gè)多層神經(jīng)網(wǎng)絡(luò)來提高另一種建模算法的準(zhǔn)確性。
湖南工程學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版)2021年2期