朱碧琴
(湖南環(huán)境生物職業(yè)技術(shù)學(xué)院,湖南 衡陽 421005)
在數(shù)字化時(shí)代背景下,云計(jì)算作為一項(xiàng)重要的技術(shù)革新,對(duì)各行業(yè)發(fā)展和運(yùn)營有深刻影響。在企業(yè)管理中,構(gòu)建和應(yīng)用管理會(huì)計(jì)預(yù)測模型對(duì)制定決策和業(yè)務(wù)規(guī)劃有重要意義。當(dāng)傳統(tǒng)的管理會(huì)計(jì)預(yù)測模型處理大規(guī)模數(shù)據(jù)、復(fù)雜的關(guān)聯(lián)關(guān)系和實(shí)時(shí)性要求等問題時(shí)有局限性[1]。而云計(jì)算平臺(tái)計(jì)算和存儲(chǔ)能力強(qiáng)大,處理和分析企業(yè)管理會(huì)計(jì)數(shù)據(jù)更高效、準(zhǔn)確。充分利用云計(jì)算平臺(tái),可以對(duì)企業(yè)數(shù)據(jù)進(jìn)行即時(shí)采集、準(zhǔn)確處理和模型訓(xùn)練,從而可以預(yù)測企業(yè)未來發(fā)展趨勢(shì)。該文探索了基于云計(jì)算視角下的管理會(huì)計(jì)預(yù)測模型構(gòu)建方法,通過選擇和定義關(guān)鍵績效指標(biāo),建立與企業(yè)實(shí)際需求相符的預(yù)測模型[2]。
云計(jì)算視角下管理會(huì)計(jì)預(yù)測模型構(gòu)建框架如圖1 所示。
圖1 云計(jì)算視角下管理會(huì)計(jì)預(yù)測模型構(gòu)建框架
利用云計(jì)算平臺(tái)的數(shù)據(jù)采集工具和技術(shù),對(duì)收集的數(shù)據(jù)進(jìn)行清洗和處理,包括去除異常值、填充缺失值等,保證數(shù)據(jù)的質(zhì)量和完整性[3]。利用云計(jì)算平臺(tái)對(duì)模型進(jìn)行訓(xùn)練和優(yōu)化,使用評(píng)估指標(biāo)MAE、MSE和RMSE,判斷模型的預(yù)測結(jié)果。
在構(gòu)建管理會(huì)計(jì)預(yù)測模型中指標(biāo)設(shè)計(jì)非常重要,對(duì)預(yù)測模型能夠輸出支持決策和規(guī)劃的指標(biāo)起到?jīng)Q定性作用[4]。通過明確定義關(guān)鍵績效指標(biāo),可以確保預(yù)測模型輸出的數(shù)據(jù)和信息與企業(yè)的業(yè)務(wù)目標(biāo)和決策需求一致[5]。云計(jì)算視角下管理會(huì)計(jì)預(yù)測模型指標(biāo)設(shè)計(jì)體系見表1。
表1 管理會(huì)計(jì)預(yù)測模型指標(biāo)設(shè)計(jì)
通過明確的指標(biāo)設(shè)計(jì),該模型可以利用云計(jì)算平臺(tái)的強(qiáng)大計(jì)算能力分析和預(yù)測數(shù)據(jù),從而幫助決策者根據(jù)實(shí)際數(shù)據(jù)做出決策[6]。
2.2.1 數(shù)據(jù)采集
管理會(huì)計(jì)預(yù)測模型根據(jù)設(shè)定的指標(biāo)體系收集T 企業(yè)數(shù)據(jù),隨機(jī)抽取的部分管理會(huì)計(jì)樣本數(shù)據(jù)見表2。
表2 企業(yè)管理會(huì)計(jì)預(yù)測樣本數(shù)據(jù)
利用云計(jì)算平臺(tái)提供的廣泛數(shù)據(jù)源,得到T 企業(yè)管理會(huì)計(jì)數(shù)據(jù)情況。2020—2022 年共得到143295 條樣本數(shù)據(jù),通過采集該企業(yè)各類關(guān)鍵指標(biāo)數(shù)據(jù),進(jìn)一步對(duì)企業(yè)成本、銷售、資產(chǎn)、利潤率和價(jià)值周期等方面進(jìn)行研究。
2.2.2 數(shù)據(jù)清洗轉(zhuǎn)換
對(duì)樣本數(shù)據(jù)進(jìn)行清洗和轉(zhuǎn)換,可以提高數(shù)據(jù)的質(zhì)量以及準(zhǔn)確性,便于后續(xù)分析、建模和決策。數(shù)據(jù)清洗轉(zhuǎn)換流程如圖2 所示。
圖2 管理會(huì)計(jì)預(yù)測樣本數(shù)據(jù)清洗轉(zhuǎn)換流程圖
將樣本數(shù)據(jù)導(dǎo)入分析環(huán)境中,通過檢查數(shù)據(jù)維度,可了解數(shù)據(jù)規(guī)模。使用Python 的pandas 庫中isnull(x)函數(shù),檢查每個(gè)數(shù)據(jù)點(diǎn)是否為缺失值,使用sum(x)函數(shù)計(jì)算每列的缺失值數(shù)量。根據(jù)缺失值的分布和模式,分析缺失值的原因,確定缺失值是隨機(jī)缺失還是特定模式缺失[7]。如果缺失值的數(shù)量很少且不影響整體分析結(jié)果,就刪除缺失值的行或列,如果缺失值較少,則使用插值方法填充缺失值,如果缺失值在某一特征中占比較大,可以創(chuàng)建一個(gè)指示變量表示該特征是否缺失,從而保留缺失值信息[8]。再使用統(tǒng)isnull(x)函數(shù)工具,檢查是否還存在缺失值,若數(shù)據(jù)質(zhì)量保持一致,則結(jié)束任務(wù)。
2.2.3 特征相關(guān)性分析
該模型利用斯皮爾曼相關(guān)系數(shù)(Spearman)可檢驗(yàn)T 企業(yè)會(huì)計(jì)管理數(shù)據(jù)特征間的線性相關(guān)性,斯皮爾曼相關(guān)系數(shù)(Spearman)如公式(1)所示。
式中:ρ為斯皮爾曼相關(guān)系數(shù);n為樣本數(shù)量;di為兩個(gè)特征在排序中的差異,即等級(jí)之差,∑為求和符號(hào)。經(jīng)分析,生產(chǎn)成本與銷售額間可能存在正相關(guān)關(guān)系,即提高生產(chǎn)成本會(huì)導(dǎo)致銷售額增加;銷售額與客單價(jià)間存在正相關(guān)關(guān)系,即銷售額增加與客單價(jià)增加相關(guān);銷售額和利潤率間存在一定程度的正相關(guān)關(guān)系,即銷售額增加會(huì)對(duì)利潤率產(chǎn)生積極影響。
XGBoost 企業(yè)管理會(huì)計(jì)預(yù)測模型訓(xùn)練流程如圖3 所示。
圖3 企業(yè)管理會(huì)計(jì)預(yù)測模型訓(xùn)練流程圖
將企業(yè)管理會(huì)計(jì)數(shù)據(jù)導(dǎo)入XGBoost 庫后,使用XGBoost庫的XGBRegressor(x)或XGBClassifier(x)函數(shù)創(chuàng)建一個(gè)XGBoost 模型對(duì)象。根據(jù)具體任務(wù)選擇回歸XGBRegressor(x)或分類XGBClassifier(x)模型,應(yīng)用set_params(x)模型對(duì)象的設(shè)置方法,設(shè)置模型的各種參數(shù)。為找到最佳的參數(shù)組合,采用網(wǎng)格搜索(Grid Search)或隨機(jī)搜索(Random Search)可對(duì)模型參數(shù)進(jìn)行調(diào)優(yōu),通過遍歷不同的參數(shù)組合,使用K 折交叉驗(yàn)證評(píng)估模型性能,對(duì)K次驗(yàn)證得分進(jìn)行平均,得到模型的平均性能指標(biāo),計(jì)算標(biāo)準(zhǔn)差衡量模型性能的穩(wěn)定性,找到最佳參數(shù)設(shè)置。使用訓(xùn)練數(shù)據(jù)對(duì)XGBoost 模型進(jìn)行訓(xùn)練,采用模型對(duì)象的fit(x)方法,將訓(xùn)練數(shù)據(jù)作為輸入內(nèi)容,并傳入其他參數(shù),根據(jù)輸入數(shù)據(jù)和參數(shù)迭代優(yōu)化模型,逐步提高訓(xùn)練數(shù)據(jù)的擬合程度。完成模型訓(xùn)練后,使用訓(xùn)練好的XGBoost 模型對(duì)新數(shù)據(jù)進(jìn)行預(yù)測評(píng)估,采用模型對(duì)象的predict(x)方法,將驗(yàn)證數(shù)據(jù)集作為輸入內(nèi)容,即計(jì)算模型在驗(yàn)證數(shù)據(jù)上的性能指標(biāo)。
構(gòu)建模型后評(píng)估模型性能,確保模型預(yù)測能力較好,能夠滿足企業(yè)管理會(huì)計(jì)實(shí)際需求。該模型使用XGBoost 算法,構(gòu)建企業(yè)管理會(huì)計(jì)預(yù)測模型,通過采用平均絕對(duì)誤差MAE、絕對(duì)百分誤差MAPE、均方根誤差RMSE等指標(biāo)對(duì)模型性能進(jìn)一步衡量,其中,MAE用于衡量預(yù)測值與實(shí)際值間的平均絕對(duì)差異,數(shù)值越小表示模型的預(yù)測誤差越小,更接近實(shí)際值,如公式(2)所示。
式中:MAE衡量預(yù)測值與實(shí)際值間的平均絕對(duì)差異。較小的MAE為較小的預(yù)測誤差和較接近實(shí)際值的擬合度。
MAPE用于衡量預(yù)測值與實(shí)際值間的相對(duì)差異的平均值,并用百分比表示,可以比較不同規(guī)模數(shù)據(jù)的預(yù)測準(zhǔn)確性,如公式(3)所示。
式中:MAPE提供相對(duì)的預(yù)測準(zhǔn)確度度量,可比較管理會(huì)計(jì)中不同數(shù)據(jù)規(guī)模的模型。RMSE用于衡量預(yù)測值與實(shí)際值間的平方差的平均值的平方根,數(shù)值越小表示模型的預(yù)測能力越好。如公式(4)所示。
式中:Q為預(yù)測值;t為實(shí)際值,RMSE較小表示預(yù)測性能較好。經(jīng)過隨機(jī)搜索確定的模型最佳參數(shù)值,利用XGBRegressor函數(shù)對(duì)T 企業(yè)的會(huì)計(jì)管理預(yù)測模型進(jìn)行訓(xùn)練,得到模型的各項(xiàng)回歸評(píng)價(jià)指標(biāo)值,數(shù)值見表3。
表3 模型回歸評(píng)價(jià)指標(biāo)值
根據(jù)模型回歸評(píng)價(jià)指標(biāo)值可知,XGBoost 模型的MAE值為0.000824,說明模型的平均預(yù)測誤差為0.000824,模型的預(yù)測結(jié)果與真實(shí)值的差異較小;XGBoost 模型的MSE值為0.000015,該指標(biāo)衡量模型預(yù)測值與真實(shí)值間的平均平方差異,數(shù)值較小就說明模型的預(yù)測結(jié)果與真實(shí)值接近;XGBoost模型的RMSE值為0.003728。該指標(biāo)是MSE的平方根,用于衡量模型預(yù)測值與真實(shí)值間的平均平方根差異,數(shù)值較小就表示該模型的預(yù)測誤差較小。綜合來看,XGBoost 模型在給定數(shù)據(jù)集中的MAE、MSE和RMSE值較低,說明該模型在預(yù)測連鎖企業(yè)銷售額方面具有準(zhǔn)確性和穩(wěn)定性。模型的預(yù)測結(jié)果與真實(shí)值較為接近,預(yù)測誤差較小。
基于云計(jì)算視角下構(gòu)建管理會(huì)計(jì)預(yù)測模型,充分利用云計(jì)算平臺(tái)的強(qiáng)大計(jì)算和存儲(chǔ)能力,結(jié)合適用的算法和技術(shù),成功構(gòu)建了可靠、準(zhǔn)確且高效的預(yù)測模型。經(jīng)過模型評(píng)估分析,驗(yàn)證該模型的準(zhǔn)確性及實(shí)效性,能夠?yàn)槠髽I(yè)提供更準(zhǔn)確、可靠的決策依據(jù),有利于促進(jìn)企業(yè)發(fā)展,提升競爭力。未來可進(jìn)一步優(yōu)化模型參數(shù)、拓展技術(shù)應(yīng)用以及研究實(shí)施方法,以提升模型的預(yù)測能力和實(shí)際應(yīng)用效果。