李立天,鄭曉燕,薛忠賢,張雨濃,邱斌斌
(1.中山大學(xué)計(jì)算機(jī)學(xué)院,廣東 廣州 510006; 2.中山大學(xué)人工智能學(xué)院,廣東 珠海 519082)
政府債務(wù)也叫國(guó)債,是指國(guó)家按照一定的債務(wù)發(fā)行規(guī)則向社會(huì)發(fā)行的債務(wù),當(dāng)政府的財(cái)政收入不足以償還財(cái)政支出時(shí),可以通過(guò)發(fā)行債務(wù)來(lái)平衡收支[1]。日本中央政府債務(wù)發(fā)行的規(guī)模,在一定程度上能夠反映中央政府的財(cái)政狀況。在過(guò)去的20年里,日本國(guó)債總額出現(xiàn)了大幅度增加,從1996年6月的334.130 9萬(wàn)億日元增長(zhǎng)到了2016年12月的1 066.423 4萬(wàn)億日元。日本財(cái)務(wù)省官網(wǎng)公布的數(shù)據(jù)顯示,截至2020年6月底,國(guó)債總額已經(jīng)達(dá)到1 159.028 9萬(wàn)億日元[2]。日本國(guó)債和國(guó)民生產(chǎn)總值(GDP,gross domestic product)的比值已經(jīng)明顯高于其他發(fā)達(dá)國(guó)家,2018年該比例達(dá)到239%,這一數(shù)字遠(yuǎn)遠(yuǎn)高于在歐債危機(jī)蔓延時(shí)期發(fā)生債務(wù)危機(jī)的五國(guó)[2-3]。為了預(yù)估未來(lái)的財(cái)政風(fēng)險(xiǎn)并協(xié)助日本中央政府制定更好的財(cái)政政策,需要對(duì)日本國(guó)債的規(guī)模進(jìn)行預(yù)測(cè)。
由于日本國(guó)債可參考的樣本數(shù)據(jù)較少,同時(shí)影響日本國(guó)債的因素也較為復(fù)雜,所以使用傳統(tǒng)的數(shù)據(jù)建模方式對(duì)其進(jìn)行預(yù)測(cè)是不合適的。如使用BP神經(jīng)網(wǎng)絡(luò)[4-5]、RBF神經(jīng)網(wǎng)絡(luò)[6]和最小二乘法[7]進(jìn)行預(yù)測(cè),其要求更加多的訓(xùn)練數(shù)據(jù)才會(huì)有很好的預(yù)測(cè)結(jié)果。為了較好地對(duì)未來(lái)日本國(guó)債規(guī)模進(jìn)行預(yù)測(cè),研究中使用了權(quán)值和結(jié)構(gòu)確定(WASD,weights and structure determination)算法訓(xùn)練切比雪夫神經(jīng)網(wǎng)絡(luò)[8-9],并利用訓(xùn)練效果最好的WASD神經(jīng)網(wǎng)絡(luò)對(duì)日本國(guó)債規(guī)模進(jìn)行了短期的預(yù)測(cè)。從2017年3月—2020年6月一共14個(gè)季度的預(yù)測(cè)結(jié)果與日本財(cái)務(wù)省官方公布數(shù)據(jù)的最大相對(duì)誤差僅為3.96%,說(shuō)明WASD神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)性能良好并且此方法有效。在此基礎(chǔ)上,利用預(yù)測(cè)性能最好的神經(jīng)網(wǎng)絡(luò)對(duì)2020年9月—2022年12月一共10個(gè)季度的日本國(guó)債規(guī)模進(jìn)行預(yù)測(cè)。
由于神經(jīng)網(wǎng)絡(luò)內(nèi)在的非線性性、自適應(yīng)能力和高容錯(cuò)性,神經(jīng)網(wǎng)絡(luò)目前已經(jīng)廣泛運(yùn)用于解決各種現(xiàn)實(shí)問題,例如人口預(yù)測(cè)、股票預(yù)測(cè)、模式識(shí)別等[10-11]。傳統(tǒng)的誤差回傳神經(jīng)網(wǎng)絡(luò)采用過(guò)程冗長(zhǎng)的迭代方式,在實(shí)際的使用中,往往需要耗費(fèi)大量時(shí)間[12-13]。為此,張立等[14]提出利用混沌粒子學(xué)算法對(duì)BP神經(jīng)網(wǎng)絡(luò)的權(quán)值優(yōu)化。這一方法提高了模型的預(yù)測(cè)精度,但模型收斂所耗的時(shí)間量依舊很大,而WASD神經(jīng)網(wǎng)絡(luò)的權(quán)值是通過(guò)求解矩陣偽逆得到的,避免了通過(guò)反復(fù)迭代才能得到網(wǎng)絡(luò)較優(yōu)權(quán)值的冗長(zhǎng)訓(xùn)練過(guò)程。因此我們采用WASD神經(jīng)網(wǎng)絡(luò)[15]對(duì)日本中央政府債務(wù)(TCGD,total central government debt)規(guī)模進(jìn)行預(yù)測(cè)。
研究中使用的WASD神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)[15]如圖1所示,該神經(jīng)網(wǎng)絡(luò)包括3層:輸入層、隱藏層和輸出層,其中輸入層和輸出層都各有1個(gè)由線性恒等函數(shù)激活的神經(jīng)元,隱藏層中有N個(gè)由切比雪夫多項(xiàng)式激活的神經(jīng)元[16-17]。為了降低神經(jīng)網(wǎng)絡(luò)訓(xùn)練和計(jì)算的復(fù)雜程度,我們將輸入層到隱藏層的連接權(quán)重設(shè)為1,隱藏層到輸出層的連接權(quán)重設(shè)為ωj(j=1,2,…,N),ωj是需要進(jìn)行調(diào)整的。此外,所有神經(jīng)元的閾值都設(shè)為0。我們只需要關(guān)注如何調(diào)整隱藏層神經(jīng)元的個(gè)數(shù)以及連接隱藏層和輸出層之間的神經(jīng)元的權(quán)值。與此同時(shí),以上所有的設(shè)置都需要保證此神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)性能。
圖1 3層WASD神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Structure of three-layer WASD neural network
實(shí)驗(yàn)過(guò)程中,我們發(fā)現(xiàn)第一類切比雪夫多項(xiàng)式在多項(xiàng)式插值和逼近上有良好的性能[18]。因此,使用第一類切比雪夫多項(xiàng)式作為WASD神經(jīng)網(wǎng)絡(luò)隱藏層的激勵(lì)函數(shù)[15]。
定義1第一類切比雪夫多項(xiàng)式
對(duì)于一個(gè)輸入x(x∈[-1,1]),第一類切比雪夫多項(xiàng)式的表達(dá)式定義為
(1)
我們使用的WASD神經(jīng)網(wǎng)絡(luò)利用切比雪夫正交多項(xiàng)式對(duì)未知的函數(shù)進(jìn)行逼近。當(dāng)輸入x滿足x∈[-1,1]時(shí),對(duì)一個(gè)未知的函數(shù)y=f(x),有
y=f(x)=ω1φ1(x)+ω2φ2(x)+…+ωNφN(x)=
(2)
用于擬合未知函數(shù)的切比雪夫多項(xiàng)式有N個(gè)。
WASD神經(jīng)網(wǎng)絡(luò)主要包括2個(gè)算法:權(quán)值直接確定(WDD,weights direct determination)算法和結(jié)構(gòu)選優(yōu)確定(SSD,structure selective determination)算法。在訓(xùn)練過(guò)程中,隱藏層神經(jīng)元的個(gè)數(shù)N由SSD確定,神經(jīng)元個(gè)數(shù)N的確定過(guò)程將在下一節(jié)敘述,而連接隱藏層和輸出層的權(quán)值ωj由WDD得到。對(duì)圖1中的3層WASD神經(jīng)網(wǎng)絡(luò),取M對(duì)數(shù)據(jù)S={(xi,yi)|i=1,2,…,M}作為訓(xùn)練數(shù)據(jù)集,則權(quán)值列向量W、輸入受激勵(lì)矩陣φ和期望(目標(biāo))輸出向量γ的定義分別為
(3)
(4)
(5)
則神經(jīng)網(wǎng)絡(luò)的權(quán)值列向量的最優(yōu)解可確定為
W=(φTφ)-1φTγ,
(6)
其中:(φTφ)-1φT是矩陣φ的偽逆,在MATLAB中可以用pinv(φ)計(jì)算得到。
首先我們需要構(gòu)建一個(gè)WASD神經(jīng)網(wǎng)絡(luò),然后利用TCGD數(shù)據(jù)集對(duì)這個(gè)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,并且通過(guò)WASD算法確定神經(jīng)網(wǎng)絡(luò)的最優(yōu)結(jié)構(gòu)。最后利用一個(gè)校驗(yàn)數(shù)據(jù)集對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行校驗(yàn)。
日本財(cái)務(wù)省每個(gè)季度都會(huì)在其官網(wǎng)公布債務(wù)數(shù)據(jù)。為了保證此神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果的真實(shí)性,我們把從日本財(cái)務(wù)省官網(wǎng)中獲取的數(shù)據(jù)作為神經(jīng)網(wǎng)絡(luò)的樣本數(shù)據(jù)集。研究使用1996年6月—2016年3月的數(shù)據(jù)對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,使用2016年6月—12月的數(shù)據(jù)對(duì)訓(xùn)練后的神經(jīng)網(wǎng)絡(luò)進(jìn)行校驗(yàn)。這里需要引入神經(jīng)網(wǎng)絡(luò)的均方差(MSE,mean square error)這一概念。
定義2均方差(MSE)
(7)
需要說(shuō)明的是此神經(jīng)網(wǎng)絡(luò)的輸入是TCGD數(shù)據(jù)中的時(shí)間(例如1996年6月),輸出是TCGD數(shù)據(jù)中的債務(wù)總額(例如334.130 9萬(wàn)億日元)。由上述可知,隱藏層的神經(jīng)元是由第一類切比雪夫多項(xiàng)式激活,而第一類切比雪夫多項(xiàng)式要求輸入的值域?yàn)閇-1,1]。因此,需要在數(shù)據(jù)輸入神經(jīng)網(wǎng)絡(luò)之前,對(duì)輸入的日期進(jìn)行預(yù)處理。
利用位于區(qū)間[-1,1]的無(wú)單位歸一化因子α將時(shí)間間隔區(qū)間[1996/6,2016/12]歸一化到[-1,α]。在以前的工作中,發(fā)現(xiàn)歸一化因子α對(duì)神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)擬合效果有一定的影響[15-17],因此找到一個(gè)合適的歸一化因子α也很有必要。我們發(fā)現(xiàn)對(duì)每一個(gè)具體的α值,可以計(jì)算出對(duì)應(yīng)的MSEmin以及相應(yīng)的隱藏層神經(jīng)元個(gè)數(shù)Nmin。那么當(dāng)找到最優(yōu)的α值后,也可以找到一個(gè)對(duì)應(yīng)的MSEmin和最優(yōu)的隱藏層神經(jīng)元個(gè)數(shù)Nmin,從而確定神經(jīng)網(wǎng)絡(luò)的最優(yōu)結(jié)構(gòu)。
前面利用訓(xùn)練數(shù)據(jù)集對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行了訓(xùn)練,接著需要對(duì)此神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)能力進(jìn)行校驗(yàn),這里使用的是位于時(shí)間區(qū)間[2016/6,2016/12]的TCGD數(shù)據(jù)。和之前的訓(xùn)練一樣,在校驗(yàn)神經(jīng)網(wǎng)絡(luò)之前,需要對(duì)輸入數(shù)據(jù)進(jìn)行預(yù)處理。
定義3校驗(yàn)誤差
(8)
其中:K表示校驗(yàn)數(shù)據(jù)集中數(shù)據(jù)對(duì)的個(gè)數(shù)(K=3);yj和γj分別表示對(duì)應(yīng)于輸入xj神經(jīng)網(wǎng)絡(luò)的輸出和期望輸出。
當(dāng)e的值越小,說(shuō)明神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)能力越好。然后比較所有的歸一化因子α(α∈[-1,1])對(duì)應(yīng)的校驗(yàn)誤差e,從而根據(jù)最小的校驗(yàn)誤差e確定α,理論上此時(shí)神經(jīng)網(wǎng)絡(luò)具有最優(yōu)的預(yù)測(cè)性能。歸一化因子α和對(duì)應(yīng)的具有最優(yōu)結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)的校驗(yàn)誤差之間的關(guān)系如圖2所示。不同的歸一化因子的值,將導(dǎo)致神經(jīng)網(wǎng)絡(luò)具有不同的預(yù)測(cè)性能。圖2中標(biāo)記了全局最小點(diǎn)和3個(gè)局部最小點(diǎn)。標(biāo)記的全局最小點(diǎn)和3個(gè)局部最小點(diǎn)的歸一化因子α的值以及對(duì)應(yīng)的最優(yōu)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的隱藏層神經(jīng)元個(gè)數(shù)N和校驗(yàn)誤差e如表1所列。注意理論上全局最小點(diǎn)對(duì)應(yīng)的神經(jīng)網(wǎng)絡(luò)就具有最優(yōu)的預(yù)測(cè)性能,但每一個(gè)局部最小點(diǎn)在周圍的點(diǎn)中有最小的校驗(yàn)誤差,因此這些局部最小點(diǎn)也值得注意和分析。文獻(xiàn)[15]中對(duì)標(biāo)記的全局最小點(diǎn)和局部最小點(diǎn)進(jìn)行了分析,并確定了最佳神經(jīng)網(wǎng)絡(luò)對(duì)應(yīng)的歸一化因子的值是全局最小點(diǎn)α=-0.999。由表1可知,最佳的神經(jīng)網(wǎng)絡(luò)中隱藏層神經(jīng)元的個(gè)數(shù)為4,校驗(yàn)誤差e=0.005 3為全局最小。
表1 歸一化因子α的全局最小值與局部極小值對(duì)應(yīng)的神經(jīng)網(wǎng)絡(luò)的隱藏層神經(jīng)元個(gè)數(shù)和校驗(yàn)誤差
圖2 歸一化因子α與具有最優(yōu)結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)模型的校驗(yàn)誤差之間的關(guān)系Fig.2 Relationship between normalization factor α and validation error of neural network model with optimal structure
對(duì)標(biāo)記出來(lái)的全局最小點(diǎn)和局部最小點(diǎn)進(jìn)行分析,我們認(rèn)為全局最小點(diǎn)對(duì)應(yīng)的神經(jīng)網(wǎng)絡(luò)具有最佳的預(yù)測(cè)性能。理論上,全局最小點(diǎn)對(duì)應(yīng)的神經(jīng)網(wǎng)絡(luò)的校驗(yàn)誤差是最小的,數(shù)據(jù)擬合能力是最好的,最有可能得到最準(zhǔn)確的預(yù)測(cè)結(jié)果。利用這個(gè)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)了2017年3月—2020年6月一共14個(gè)季度的日本國(guó)債規(guī)模,與日本財(cái)務(wù)省官網(wǎng)公布的真實(shí)數(shù)據(jù)對(duì)比見表2。由表2可以看到從2017年3月—2020年6月,預(yù)測(cè)數(shù)據(jù)和真實(shí)數(shù)據(jù)的相對(duì)誤差很小,最大的相對(duì)誤差只有3.96%。說(shuō)明最佳預(yù)測(cè)模型的預(yù)測(cè)性能較好,也充分說(shuō)明了將WASD神經(jīng)網(wǎng)絡(luò)應(yīng)用于日本國(guó)債規(guī)模的預(yù)測(cè)上是十分準(zhǔn)確和可靠的,并且預(yù)測(cè)結(jié)果是有意義的。
表2 理論最佳模型預(yù)測(cè)數(shù)據(jù)與真實(shí)數(shù)據(jù)回顧對(duì)比
經(jīng)過(guò)與官方公布的2017年3月—2020年6月的數(shù)據(jù)進(jìn)行比對(duì),確定此神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果具有一定的價(jià)值,所以用更多的數(shù)據(jù)對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。用新訓(xùn)練出來(lái)的理論最佳模型以及原來(lái)的理論最佳模型對(duì)接下來(lái)的10個(gè)季度(2020年9月—2022年12月)進(jìn)行預(yù)測(cè),得到的預(yù)測(cè)結(jié)果如表3所列。
表3 理論最佳模型和新訓(xùn)練的理論最佳模型對(duì)日本中央政府債務(wù)規(guī)模未來(lái)預(yù)測(cè)數(shù)據(jù)及相對(duì)差
從日本財(cái)務(wù)省官網(wǎng)公布的真實(shí)數(shù)據(jù)上來(lái)看,除了個(gè)別季度(例如2008年6月、2008年9月、2014年9月、2015年9月、2020年6月)比前一個(gè)季度的數(shù)據(jù)有所下降或大幅上升以外,日本中央政府的債務(wù)規(guī)模總體上是緩慢上升的。預(yù)測(cè)數(shù)據(jù)和真實(shí)數(shù)據(jù)的變化趨勢(shì)大體是一致的,但在具體的漲幅上有細(xì)微的差別,所以導(dǎo)致預(yù)測(cè)數(shù)據(jù)和真實(shí)數(shù)據(jù)之間存在微小的誤差。經(jīng)過(guò)對(duì)神經(jīng)網(wǎng)絡(luò)更進(jìn)一步地訓(xùn)練,新的預(yù)測(cè)結(jié)果顯示2個(gè)模型的預(yù)測(cè)結(jié)果的數(shù)據(jù)變化趨勢(shì)相同,但在具體的數(shù)值上存在微小的相對(duì)差。我們認(rèn)為未來(lái)的變化趨勢(shì)仍是緩慢上升的,并且具體的數(shù)值可能在2個(gè)模型的預(yù)測(cè)值附近浮動(dòng),但仍有可能在個(gè)別季度出現(xiàn)輕微的下降。當(dāng)然也可能因?yàn)槟承┈F(xiàn)實(shí)因素(例如日本國(guó)內(nèi)外金融環(huán)境變化、日本政府有力的財(cái)政政策以及重大自然災(zāi)害等)導(dǎo)致數(shù)據(jù)出現(xiàn)其他的變化趨勢(shì)。
在過(guò)去的20年間,日本國(guó)債規(guī)??焖僭鲩L(zhǎng),其國(guó)債與國(guó)民生產(chǎn)總值的比值明顯高于其他發(fā)達(dá)經(jīng)濟(jì)體。為此,評(píng)估日本政府債務(wù)風(fēng)險(xiǎn),對(duì)日本國(guó)債未來(lái)規(guī)模的預(yù)測(cè)具有一定的意義。利用日本財(cái)務(wù)省官方網(wǎng)站公布的1996年6月—2016年12月的日本國(guó)債規(guī)模數(shù)據(jù)對(duì)WASD神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練和校驗(yàn),并在此基礎(chǔ)上完成了2017年3月—2020年6月共14個(gè)季度的日本國(guó)債規(guī)模的預(yù)測(cè)。最佳訓(xùn)練模型預(yù)測(cè)結(jié)果表明日本國(guó)債規(guī)模未來(lái)的變化趨勢(shì)為緩慢上升,從2017年3月—2020年6月的預(yù)測(cè)結(jié)果與真實(shí)數(shù)據(jù)的相對(duì)誤差在4%以內(nèi),體現(xiàn)了該方法的準(zhǔn)確性和有效性。通過(guò)更進(jìn)一步的訓(xùn)練和預(yù)測(cè),結(jié)果表明在短期內(nèi)(2020年9月—2022年12月)日本國(guó)債規(guī)模仍將緩慢上升。為此,未來(lái)日本政府財(cái)政政策應(yīng)會(huì)繼續(xù)偏于穩(wěn)健,短期內(nèi)不會(huì)出現(xiàn)債務(wù)危機(jī)。同時(shí),WASD神經(jīng)網(wǎng)絡(luò)也可繼續(xù)應(yīng)用于未來(lái)國(guó)債規(guī)模的預(yù)測(cè)。當(dāng)日本政府或其他國(guó)家政府認(rèn)識(shí)到未來(lái)短期可能出現(xiàn)的趨勢(shì)時(shí),就可以制定出有效的財(cái)政政策規(guī)避風(fēng)險(xiǎn),控制國(guó)債增長(zhǎng)率,并做好應(yīng)急準(zhǔn)備。