劉茂茹,王豐效
基于GM(1,1)-神經(jīng)網(wǎng)絡(luò)模型的安徽省財(cái)政收入預(yù)測(cè)
劉茂茹,王豐效
(喀什大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,新疆 喀什 844000)
財(cái)政收入是衡量一國(guó)政府財(cái)力的重要指標(biāo),政府在社會(huì)經(jīng)濟(jì)活動(dòng)中提供公共物品和服務(wù)的范圍和數(shù)量,在很大程度上決定于財(cái)政收入的充裕狀況,而地方財(cái)政是國(guó)家財(cái)政的重要組成部分,對(duì)財(cái)政收入進(jìn)行合理的預(yù)測(cè)能夠有效了解地方經(jīng)濟(jì)發(fā)展?fàn)顩r.關(guān)于地方財(cái)政收入及其影響因素,文獻(xiàn)[1-4]討論了影響因素在時(shí)間或空間上改變時(shí)地方財(cái)政的變化情況,并提出地方財(cái)政收入結(jié)構(gòu)優(yōu)化的建設(shè)性思路,探求合理的收入制度.自鄧聚龍教授提出灰色系統(tǒng)理論以來,灰色預(yù)測(cè)模型及其改進(jìn)模型在經(jīng)濟(jì)領(lǐng)域得到了廣泛應(yīng)用,主要因其能夠在數(shù)據(jù)量少、信息貧的情況下進(jìn)行較為準(zhǔn)確的預(yù)測(cè),對(duì)灰色預(yù)測(cè)模型的改進(jìn)和應(yīng)用已被眾多學(xué)者所關(guān)注[5-7].神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)方法被廣泛應(yīng)用于眾多領(lǐng)域[8-11],將灰色預(yù)測(cè)模型與神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型進(jìn)行組合預(yù)測(cè)能夠得到較為準(zhǔn)確的預(yù)測(cè)結(jié)果,眾多學(xué)者對(duì)于此組合預(yù)測(cè)模型也有著相應(yīng)的研究[12-14].
相關(guān)數(shù)據(jù)來源于安徽省統(tǒng)計(jì)年鑒[15-24].
2010—2019年安徽省財(cái)政收入及其影響因素的相關(guān)數(shù)據(jù)見表1.
表1 2010—2019年安徽省財(cái)政收入及其影響因素的相關(guān)數(shù)據(jù)
數(shù)據(jù)質(zhì)量分析是數(shù)據(jù)探索的前提,不可信的數(shù)據(jù)是無法得出可信的結(jié)論的.?dāng)?shù)據(jù)質(zhì)量分析是以評(píng)估數(shù)據(jù)的正確性和有效性為目標(biāo),本文通過Python軟件對(duì)收集到的數(shù)據(jù)進(jìn)行一系列數(shù)據(jù)質(zhì)量分析,從而判斷用來預(yù)測(cè)安徽省財(cái)政收入的各影響因素是否有效.
1.2.1 缺失值分析 判斷變量中是否含有缺失值,無論是數(shù)據(jù)中記錄的缺失還是某個(gè)字段信息的缺失,都會(huì)影響分析結(jié)果的準(zhǔn)確性.經(jīng)Python代碼運(yùn)行,發(fā)現(xiàn)安徽省影響財(cái)政收入的數(shù)據(jù)變量中不含有缺失值.
圖1 有異常值的箱線圖
圖2 修正過后的箱線圖
1.2.3 重復(fù)數(shù)據(jù)分析 重復(fù)性數(shù)據(jù)分析也是數(shù)據(jù)質(zhì)量分析的一個(gè)關(guān)鍵要素,通過判斷安徽省財(cái)政收入影響因素中變量之間是否有重復(fù)性數(shù)據(jù),來判別數(shù)據(jù)質(zhì)量是否影響預(yù)測(cè).經(jīng)Python代碼分析,發(fā)現(xiàn)數(shù)據(jù)中并無重復(fù)性數(shù)據(jù),符合數(shù)據(jù)質(zhì)量要求.
把握數(shù)據(jù)整體的性質(zhì)對(duì)于數(shù)據(jù)分析是否成功來說是至關(guān)重要的.使用統(tǒng)計(jì)量來檢查數(shù)據(jù)特征,主要是檢查數(shù)據(jù)的集中程度、離散程度和分布形狀,通過這些統(tǒng)計(jì)量可以識(shí)別數(shù)據(jù)集整體上的一些重要性質(zhì),對(duì)后續(xù)的數(shù)據(jù)分析,有較大的參考作用.本文采用描述性統(tǒng)計(jì)分析和相關(guān)性分析了解數(shù)據(jù)的結(jié)構(gòu)與性質(zhì).
1.3.1 描述性統(tǒng)計(jì)分析 對(duì)數(shù)據(jù)進(jìn)行描述性統(tǒng)計(jì)分析,結(jié)果見表2.
表2 描述性統(tǒng)計(jì)分析結(jié)果
圖3 熱力圖
Lasso回歸法的基本思想是在回歸系數(shù)的絕對(duì)值之和小于一個(gè)常數(shù)的約束條件下,使殘差平方和最小化,從而能夠產(chǎn)生某些嚴(yán)格等于0的回歸系數(shù),得到可以解釋的模型,其數(shù)學(xué)表達(dá)式為
設(shè)原始數(shù)列為
經(jīng)1-AGO后可得到
緊鄰均值生成為
最終得到灰色預(yù)測(cè)模型為
將經(jīng)過Lasso特征選擇之后的變量代入編譯好的灰色預(yù)測(cè)模型中進(jìn)行預(yù)測(cè),預(yù)測(cè)出2020—2021年各影響因素的值(見表3).
表3 2020—2021年各影響因素灰色模型預(yù)測(cè)結(jié)果
為了了解模型是否通過檢驗(yàn),預(yù)測(cè)后采用后驗(yàn)差檢驗(yàn)法判斷模型精度.經(jīng)Python代碼運(yùn)行,得到各影響因素的模型精度都為“一級(jí)(好)”,即模型通過檢驗(yàn).
2.2.2 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)包含輸入層、隱藏層(可以有多層)和輸出層.每一層當(dāng)中包含很多存儲(chǔ)數(shù)據(jù)的節(jié)點(diǎn),稱之為神經(jīng)元,每一個(gè)神經(jīng)元都與下一層所有神經(jīng)元連接,每一對(duì)連接都有對(duì)應(yīng)的一個(gè)參數(shù).這種連接維持了神經(jīng)元之間信息的傳遞,信息的傳遞其實(shí)就是一個(gè)數(shù)學(xué)計(jì)算過程.前向傳播過程輸入信息由輸入層→隱藏層→輸出層,后向傳播過程更新信息由輸出層→隱藏層→輸入層.預(yù)測(cè)時(shí),輸入原始數(shù)據(jù)信息到輸入層,經(jīng)過中間層的數(shù)學(xué)計(jì)算,得到輸出,即財(cái)政收入;訓(xùn)練時(shí),先進(jìn)行前向傳輸預(yù)測(cè)得到財(cái)政收入輸出,然后根據(jù)輸出與實(shí)際的差距,進(jìn)行后向傳播,這個(gè)過程會(huì)調(diào)整網(wǎng)絡(luò)之中的參數(shù),從而使得下一次預(yù)測(cè)更為準(zhǔn)確.
表4 2010—2021年安徽省財(cái)政收入神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)
由表4可以看出,已知的實(shí)際值與經(jīng)過預(yù)測(cè)后得到的預(yù)測(cè)值相差較小,可認(rèn)為模型擬合程度較好,經(jīng)過灰色模型-神經(jīng)網(wǎng)絡(luò)模型組合預(yù)測(cè)得到2020年安徽省財(cái)政收入為64 480 128萬(wàn)元,2021年安徽省財(cái)政收入為70 866 816萬(wàn)元.
[1] 劉明慧,黨立斌.地方財(cái)政收入的合意性:基于結(jié)構(gòu)視角的分析[J].宏觀經(jīng)濟(jì)研究,2014(8):10-20.
[2] 王克強(qiáng),胡海生,劉紅梅.中國(guó)地方土地財(cái)政收入增長(zhǎng)影響因素實(shí)證研究:基于1995—2008年中國(guó)省際面板數(shù)據(jù)的分析[J].財(cái)經(jīng)研究,2012,38(4):112-122.
[3] 尚元君,殷瑞鋒.對(duì)地方政府財(cái)政收入能力影響因素的實(shí)證分析[J].中央財(cái)經(jīng)大學(xué)學(xué)報(bào),2009(5):12-15,42.
[4] 蘇永軍.中國(guó)地方政府收入行為與地方收入制度優(yōu)化研究[D].上海:復(fù)旦大學(xué),2006.
[5] 王豐效.修正GM(1,1)模型在銷售量預(yù)測(cè)中的應(yīng)用[J].渭南師范學(xué)院學(xué)報(bào),2003(5):10-11,58.
[6] 楊華龍,劉金霞,鄭斌.灰色預(yù)測(cè)GM(1,1)模型的改進(jìn)及應(yīng)用[J].?dāng)?shù)學(xué)的實(shí)踐與認(rèn)識(shí),2011,41(23):39-46.
[7] 盧懿.灰色預(yù)測(cè)模型的研究及其應(yīng)用[D].杭州:浙江理工大學(xué),2014.
[8] 徐黎明,王清,陳劍平,等.基于BP神經(jīng)網(wǎng)絡(luò)的泥石流平均流速預(yù)測(cè)[J].吉林大學(xué)學(xué)報(bào)(地球科學(xué)版),2013,43(1):186-191.
[9] 范中洲,趙羿,周寧,等.基于灰色BP神經(jīng)網(wǎng)絡(luò)組合模型的水上交通事故數(shù)預(yù)測(cè)[J].安全與環(huán)境學(xué)報(bào),2020,20(3):857-861.
[10] 姚蘭,戎荷婷,褚超,等.基于人工神經(jīng)網(wǎng)絡(luò)的工業(yè)供應(yīng)鏈銷售預(yù)測(cè)方法[J].計(jì)算機(jī)與數(shù)字工程,2021,49(10):2057-2061,2144.
[11] 顧軍華,宋麗娟,宋潔,等.基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的稅收收入預(yù)測(cè)模型[J].河北工業(yè)大學(xué)學(xué)報(bào),2003(1):39-43.
[12] 王豐效.組合預(yù)測(cè)模型預(yù)測(cè)精度的貼近度評(píng)價(jià)法[J].統(tǒng)計(jì)與決策,2013(8):70-72.
[13] 王豐效.GM(1,1)組合預(yù)測(cè)模型及其應(yīng)用[J].統(tǒng)計(jì)與決策,2006(21):142-143.
[14] 陳淑燕,王煒.交通量的灰色神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法[J].東南大學(xué)學(xué)報(bào)(自然科學(xué)版),2004(4):541-544.
[15] 安徽省統(tǒng)計(jì)局.2011[M].北京:中國(guó)統(tǒng)計(jì)出版社,2011.
[16] 安徽省統(tǒng)計(jì)局.2012[M].北京:中國(guó)統(tǒng)計(jì)出版社,2012.
[17] 安徽省統(tǒng)計(jì)局.2013[M].北京:中國(guó)統(tǒng)計(jì)出版社,2013.
[18] 安徽省統(tǒng)計(jì)局.2014[M].北京:中國(guó)統(tǒng)計(jì)出版社,2014.
[19] 安徽省統(tǒng)計(jì)局.2015[M].北京:中國(guó)統(tǒng)計(jì)出版社,2015.
[20] 安徽省統(tǒng)計(jì)局.2016[M].北京:中國(guó)統(tǒng)計(jì)出版社,2016.
[21] 安徽省統(tǒng)計(jì)局.2017[M].北京:中國(guó)統(tǒng)計(jì)出版社,2017.
[22] 安徽省統(tǒng)計(jì)局.2018[M].北京:中國(guó)統(tǒng)計(jì)出版社,2018.
[23] 安徽省統(tǒng)計(jì)局.2019[M].北京:中國(guó)統(tǒng)計(jì)出版社,2019.
[24] 安徽省統(tǒng)計(jì)局.2020[M].北京:中國(guó)統(tǒng)計(jì)出版社,2020.
LIU Maoru,WANG Fengxiao
(School of Mathematics and Statistics,Kashi University,Kashi 844000,China)
A
10.3969/j.issn.1007-9831.2022.06.004
1007-9831(2022)06-0017-06
2021-12-13
國(guó)家社會(huì)科學(xué)基金項(xiàng)目(11XTJ001)
劉茂茹(1998-),女,安徽合肥人,在讀碩士研究生,從事金融統(tǒng)計(jì)與風(fēng)險(xiǎn)管理研究.E-mail:411695188@qq.com
王豐效(1965-),男,陜西禮泉人,教授,從事應(yīng)用概率統(tǒng)計(jì)研究.E-mail:fxw-hz@126.com