吳文青,夏 杰
(1. 西南科技大學(xué) 理學(xué)院,四川 綿陽(yáng) 621010; 2. 電子科技大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,四川 成都 611731)
隨著中國(guó)經(jīng)濟(jì)的發(fā)展、國(guó)民收入水平的提高,汽車產(chǎn)業(yè)蓬勃興起。2017年底我國(guó)汽車保有量已達(dá)2.17億輛,近20年間汽車保有量增長(zhǎng)近18倍。汽車產(chǎn)業(yè)能夠帶動(dòng)鋼鐵、橡膠、石油等相關(guān)產(chǎn)業(yè)的發(fā)展,推動(dòng)國(guó)民經(jīng)濟(jì)的增長(zhǎng)[1]。汽車保有量的快速增長(zhǎng)也會(huì)帶來(lái)交通擁堵、環(huán)境污染、能源短缺等一系列問(wèn)題。為此,科學(xué)、準(zhǔn)確的對(duì)汽車保有量進(jìn)行預(yù)測(cè)是制定科學(xué)決策和計(jì)劃的基礎(chǔ)[2,3],對(duì)道路交通和汽車產(chǎn)業(yè)的發(fā)展,以及環(huán)境污染治理措施和汽車產(chǎn)業(yè)相關(guān)政策的制定能提供理論支撐。
對(duì)汽車保有量的預(yù)測(cè)現(xiàn)已有大量研究。周騫等[4]建立了基于BP神經(jīng)網(wǎng)絡(luò)的多相關(guān)因素汽車保有量預(yù)測(cè)模型;夏鈺等[5]建立了出租車保有量神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,并驗(yàn)證了該模型預(yù)測(cè)城市出租汽車保有量的可行性;王琦等[6]通過(guò)熵值法確定灰色系統(tǒng)、多元回歸、指數(shù)平滑、神經(jīng)網(wǎng)絡(luò)4種預(yù)測(cè)方法的加權(quán)系數(shù),建立了組合預(yù)測(cè)模型;孫璐等[7]提出了一種新的基于主成份分析和隱馬爾可夫模型的汽車保有量預(yù)測(cè)方法;王棟[8]運(yùn)用灰色關(guān)聯(lián)和BP神經(jīng)網(wǎng)絡(luò)對(duì)汽車保有量進(jìn)行了預(yù)測(cè);王明銳等[9]應(yīng)用計(jì)量經(jīng)濟(jì)學(xué)方法建立了汽車保有量預(yù)測(cè)模型;張?zhí)m怡等[10]基于PCA-Logistic回歸模型對(duì)福建省汽車保有量進(jìn)行預(yù)測(cè);羅志軍等[11]提出一種基于粒子群算法的汽車保有量預(yù)測(cè)方法,建立了一種多因素汽車保有量預(yù)測(cè)模型。
從上述研究文獻(xiàn)可知,汽車保有量預(yù)測(cè)模型主要包括時(shí)間序列模型、Logistic模型、Bass模型、灰色GM(1,1)模型、自回歸模型、人工神經(jīng)網(wǎng)絡(luò)模型、支持向量機(jī)及組合預(yù)測(cè)模型等。時(shí)間序列法和彈性系數(shù)法基于汽車保有量的歷史數(shù)據(jù)建立預(yù)測(cè)模型,該方法計(jì)算原理簡(jiǎn)單但不能反映其內(nèi)在因素的影響?;貧w分析法利用與汽車保有量相關(guān)的指標(biāo)建立回歸分析模型,所需的數(shù)據(jù)量大且預(yù)測(cè)精度不高?;疑獹M(1,1)模型所需的樣本數(shù)據(jù)少,但要求汽車保有量具有指數(shù)增長(zhǎng)的特點(diǎn)。Logistic模型對(duì)汽車保有量預(yù)測(cè)時(shí),需要選取不同的參數(shù)得出不同的擬合效果,預(yù)測(cè)精度不高。人工神經(jīng)網(wǎng)絡(luò)對(duì)非線性數(shù)據(jù)具有較高的處理能力,但在訓(xùn)練中容易陷入局部最優(yōu)解,達(dá)不到精度要求。組合預(yù)測(cè)模型如何確定各單項(xiàng)指標(biāo)的權(quán)重研究尚未成熟,預(yù)測(cè)精度也有待進(jìn)一步研究。為此,如何提高預(yù)測(cè)模型的預(yù)測(cè)精度是一個(gè)待解決的問(wèn)題。
筆者結(jié)合灰色預(yù)測(cè)模型和人工神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化組合預(yù)測(cè),充分利用汽車保有量預(yù)測(cè)因素,對(duì)汽車保有量進(jìn)行預(yù)測(cè)研究。首先利用Simpson積分公式對(duì)梯形公式GM(1,1)的背景值進(jìn)行改進(jìn),得出Simpson公式改進(jìn)的GM(1,1)模型。然后利用相關(guān)性分析找出與汽車保有量相關(guān)性較高的因素,并把相關(guān)性因素作為神經(jīng)網(wǎng)絡(luò)的輸入,以建立BP神經(jīng)網(wǎng)絡(luò)模型。進(jìn)一步根據(jù)灰色系統(tǒng)和BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)誤差的大小確定組合模型的權(quán)重,使灰色系統(tǒng)和人工神經(jīng)網(wǎng)絡(luò)有效結(jié)合,建立灰色神經(jīng)網(wǎng)絡(luò)和Simpson公式的灰色神經(jīng)網(wǎng)絡(luò)。以2000—2010年汽車保有量的實(shí)際數(shù)據(jù)為建模數(shù)據(jù),2011—2016年的數(shù)據(jù)為檢驗(yàn)數(shù)據(jù),對(duì)比分析GM(1,1)、Simpson公式改進(jìn)的GM(1,1)、BP神經(jīng)網(wǎng)絡(luò)、灰色神經(jīng)網(wǎng)絡(luò)、Simpson公式的灰色神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)精度。
GM(1,1)灰色模型[12,13]建立如下:
設(shè)原始非負(fù)序列X(0)=(x(0)(1),x(0)(2),…,x(0)(n)),建立灰色微分方程為:
(1)
(2)
記Z1(1)為X(1)的緊鄰均值生成序列:Z1(1)=(z1(1)(2),z1(1)(3),…,z1(1)(n))。背景值z(mì)1(1)(k)可表示為:
z1(1)(k)=0.5(x(1)(k)+x(1)(k-1)),
k=2,3,…,n
(3)
為此,灰色微分方程式(1)轉(zhuǎn)化為:
k=2,3,…,n
(4)
若u1=[a1,b1]T為參數(shù)列,則式(4)的最小二乘估計(jì)參數(shù)列滿足:
(5)
且有:
為了方便計(jì)算,把矩陣B1表示為
B1=(-(z1)(n-1)×n,e(n-1)×1),
其中e(n-1)×1為(n-1)×1維的單位矩陣,B1可表示為:
GM(1,1)模型的時(shí)間序列為:
k=1,2,…,n
(6)
還原后x(0)的預(yù)測(cè)值為:
(7)
借助Simpson數(shù)值積分公式,考慮式(1)在[k-1,k+1]上的積分,有:
k=2,3,…,n-1
(8)
式(8)進(jìn)一步可表示為:
k=2,3,…,n-1
(9)
利用Simpson積分公式,可得:
(10)
式(10)可轉(zhuǎn)化為:
4x(1)(k)+x(1)(k+1)]=2b2,
k=2,3,…,n-1
(11)
式(11)進(jìn)一步可表示為:
(a2+3)x(1)(k+1)+4a2x(1)(k)+(a2-3)x(1)(k-1)-6b2=0,
k=2,3,…,n-1
(12)
(13)
設(shè)u2=[a2,b2]T為參數(shù)列,應(yīng)用最小二乘法原理參數(shù)列滿足:
(14)
式中:
進(jìn)一步把矩陣B2表示為B2=(-(z2)(n-1)×n,e(n-1)×1):
由式(7)可知,GM(1,1)模型的預(yù)測(cè)精度取決于參數(shù)a1,b1,然而模型的預(yù)測(cè)精度主要由背景值決定。對(duì)式(1)在[k-1,k]上的積分為:
k=1,3,…,n
進(jìn)一步可化為:
則背景值可轉(zhuǎn)化為:
x(1)(k-1))
GM(1,1)背景值的幾何意義是積分曲線x(1)(t)在區(qū)間[k-1,k]上與t軸所圍成的曲邊梯形的面積,如圖1。然而Simpson公式的GM(1,1)模型中,其幾何意義是積分曲線在x(1)(t)在區(qū)間[k-1,k+1]上與t軸所圍成的曲邊梯形的面積,如圖2,其產(chǎn)生的誤差比梯形公式的GM(1,1)模型誤差小。
圖1 真實(shí)值與梯形公式背景值的比較Fig. 1 Comparison between real and background values of trapezoidal formula
圖2 真實(shí)值與Simpson公式背景值的比較Fig. 2 Comparison between real and background values of Simpson formula
1985年,美國(guó)加州大學(xué)的魯梅爾哈特和麥克萊蘭等人提出BP神經(jīng)網(wǎng)絡(luò)[14],神經(jīng)網(wǎng)絡(luò)已廣泛應(yīng)用于圖像處理、模式識(shí)別、語(yǔ)言處理、預(yù)測(cè)分析等各個(gè)領(lǐng)域。從結(jié)構(gòu)上看,該模型具有輸入層,隱含層和輸出層,是一種典型的多層前向型神經(jīng)網(wǎng)絡(luò)。
1.4.1 神經(jīng)元模型
一個(gè)基本的BP神經(jīng)元,具有R個(gè)輸入,每個(gè)輸入都通過(guò)一個(gè)對(duì)應(yīng)的權(quán)值w和下一層相連,網(wǎng)絡(luò)輸出可表示為:
Y=f(wp+b)
(15)
式中:f為輸入與輸出的傳遞函數(shù);w代表權(quán)值;b為隱含層神經(jīng)元的偏置值。
1.4.2 激勵(lì)函數(shù)
神經(jīng)元的各種不同的數(shù)學(xué)模型的主要區(qū)別在于采用了不同的激勵(lì)函數(shù),常見(jiàn)的激勵(lì)函數(shù)有:閾值型、分段線性飽和型、S型、子閾累積型。筆者選取S型函數(shù),其表達(dá)式為:
(16)
1.4.3 BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)算法
設(shè)樣本X=[x1,x2,…xm]′,Y=[y1,y2,…ym]′,隱含層神經(jīng)元為O=[O1,O2,…Om]′。
則隱含層神經(jīng)元的輸出為:
j=1,2,…l
(17)
輸出層神經(jīng)元的輸出為:
k=1,2,…n
(18)
網(wǎng)絡(luò)輸出與期望輸出的誤差為:
(19)
(20)
式(20)中負(fù)號(hào)表明梯度下降,η∈(0,1)是常數(shù),反映了學(xué)習(xí)過(guò)程中的學(xué)習(xí)梯度。
組合預(yù)測(cè)模型[15,16]綜合考慮各項(xiàng)單項(xiàng)預(yù)測(cè)模型的預(yù)測(cè)結(jié)果,用恰當(dāng)?shù)慕M合權(quán)重對(duì)其進(jìn)行加權(quán)平均得到組合預(yù)測(cè)模型。組合預(yù)測(cè)模型的關(guān)鍵環(huán)節(jié)是合理的確定組合權(quán)系數(shù)。目前,研究學(xué)者主要以絕對(duì)誤差或相對(duì)誤差作為導(dǎo)出組合權(quán)系數(shù)的優(yōu)化準(zhǔn)則。筆者采用灰色神經(jīng)網(wǎng)絡(luò)模型,將灰色模型和人工神經(jīng)網(wǎng)絡(luò)通過(guò)加權(quán)方式優(yōu)化組合,使2種預(yù)測(cè)方法優(yōu)勢(shì)互補(bǔ),提高預(yù)測(cè)精確,其結(jié)構(gòu)如圖3。
圖3 灰色神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig. 3 Gray neural network structure
設(shè)xt1,xt2分別表示人工神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型和灰色預(yù)測(cè)模型在第t個(gè)時(shí)段得到的預(yù)測(cè)值,Yt表示第t個(gè)時(shí)段組合預(yù)測(cè)值,c1,c2分別表示兩種模型的權(quán)系數(shù),則可得到:
Yt=c1xt1+c2xt2,
t=1,2,…n
(21)
且c1+c2=1
設(shè)r1,r2,r分別為灰色預(yù)測(cè)模型、神經(jīng)網(wǎng)絡(luò)模型、組合預(yù)測(cè)模型的誤差,x(0)(t)為原始序列,則誤差可分別表示為:
(22)
為了提高預(yù)測(cè)精度,需要使模型的誤差平方和最小,即:
(23)
進(jìn)一步,設(shè)取到每個(gè)預(yù)測(cè)值的概率均為P(每次取到的概率相等),組合預(yù)測(cè)Yt的誤差平方和最小,可轉(zhuǎn)化為求其方差最小,即:
(24)
為了找到組合預(yù)測(cè)Yt的最小值,對(duì)Var(r)關(guān)于c1求偏導(dǎo)數(shù),找到其最小值:
(25)
可得:
(26)
記Var(r1)=S11,Var(r2)=S22,Cov(r1,r2)=S12,因?yàn)榛疑A(yù)測(cè)模型和神經(jīng)網(wǎng)絡(luò)模型互相獨(dú)立,因此S12=0,則可得:
(27)
最后,將計(jì)算所的c1,c2代入式(21)可得灰色神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)值。
為了檢驗(yàn)各個(gè)模型的預(yù)測(cè)精度,采用預(yù)測(cè)值與真實(shí)值的相對(duì)誤差,相對(duì)標(biāo)準(zhǔn)偏差進(jìn)行檢驗(yàn)預(yù)測(cè)精確度。記δ為預(yù)測(cè)相對(duì)誤差,S為預(yù)測(cè)誤差的均方差,Yt為第t個(gè)時(shí)刻的預(yù)測(cè)值,x(0)(t)為第t個(gè)時(shí)刻實(shí)際值,則:
(28)
汽車保有量預(yù)測(cè)具有很大程度的不確定性,影響汽車保有量的因素較多,國(guó)民經(jīng)濟(jì)、人口總數(shù)、固定資產(chǎn)投資、進(jìn)出口額,政府政策等都會(huì)影響汽車保有量的增長(zhǎng)[17]。綜合考慮影響汽車保有量的各個(gè)因素和數(shù)據(jù)的可操作性,利用MATLAB軟件對(duì)汽車保有量有關(guān)的指標(biāo)進(jìn)行相關(guān)性分析,相關(guān)系數(shù)見(jiàn)表1。最終選取國(guó)民總收入、人均國(guó)內(nèi)生產(chǎn)總值、總?cè)丝?、固定資產(chǎn)投資、進(jìn)出口總額、鋼材產(chǎn)量、社會(huì)消費(fèi)品零售總額7個(gè)因素作為中國(guó)汽車保有量的主要影響因素。數(shù)據(jù)來(lái)源于中國(guó)統(tǒng)計(jì)局官網(wǎng)和《中國(guó)統(tǒng)計(jì)年鑒2017》[18]。
表1 汽車保有量相關(guān)系數(shù)Table 1 Correlation coefficient of car ownership
筆者利用MATLAB軟件編程,以2000—2010年共11年的中國(guó)民用汽車保有量歷史數(shù)據(jù)對(duì)2011—2016年共6年的汽車保有量進(jìn)行預(yù)測(cè)。根據(jù)預(yù)測(cè)結(jié)果分別對(duì)梯形公式的GM(1,1)模型、Simpson公式的GM(1,1)模型、BP神經(jīng)網(wǎng)絡(luò)模型、灰色神經(jīng)網(wǎng)絡(luò)組合模型進(jìn)行精度檢驗(yàn)。
2.2.1 梯形公式的GM(1,1)模型
由1.1的計(jì)算表達(dá)式求得GM(1,1)預(yù)測(cè)模型的發(fā)展系數(shù)a1=-0.175 9,灰色作用量b1=1 116.09,GM(1,1)模型的時(shí)間序列為
k=1,2,…,n
(29)
求得的預(yù)測(cè)值與相對(duì)誤差見(jiàn)表2。
2.2.2 Simpson公式的GM(1,1)模型
由1.2的計(jì)算表達(dá)式,求得基于Simpson公式的GM(1,1)模型的發(fā)展系數(shù)a2=-0.175 4,灰色作用量b2=1 112.85,Simpson公式GM(1,1)模型的時(shí)間序列可表示為:
k=1,2,…,n-1
(30)
求得的預(yù)測(cè)值及誤差見(jiàn)表2。
2.2.3 BP神經(jīng)網(wǎng)絡(luò)模型
筆者用MATLAB進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練,其中模型的輸入層為影響汽車保有量的因素,輸出層為汽車保有量,具體設(shè)計(jì)如下:①輸入層:選取國(guó)民總收入、人均國(guó)內(nèi)生產(chǎn)總值、總?cè)丝?、固定資產(chǎn)投資、進(jìn)出口總額、鋼材產(chǎn)量、社會(huì)消費(fèi)品零售總額共7個(gè)指標(biāo)作為輸入層;②輸出層:汽車保有量作為輸出層。
1)模型的結(jié)構(gòu)設(shè)計(jì)
經(jīng)過(guò)多次訓(xùn)練比較,得出誤差最小的3層BP神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)為7×40×1。在訓(xùn)練過(guò)程中,選取tansig函數(shù)為輸入層與隱含層的傳遞函數(shù),purelin為隱含層與輸出層的傳遞函數(shù),選取trainbr為訓(xùn)練函數(shù),選取learngdm為網(wǎng)絡(luò)學(xué)習(xí)函數(shù)。
2)模型網(wǎng)絡(luò)參數(shù)的選取及參數(shù)設(shè)定
參數(shù)設(shè)置為:net.trainparam.epochs=10000為網(wǎng)絡(luò)訓(xùn)練的最大次數(shù),net.trainparam.lr=0.01為學(xué)習(xí)效率,net.train- param.show=20為每20輪顯示一次,net.trainpara- m.goal=5×10-5為訓(xùn)練誤差。
從而得到汽車保有量預(yù)測(cè)值見(jiàn)表2。
2.2.4 灰色神經(jīng)網(wǎng)絡(luò)組合模型
鑒于灰色模型和人工神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)單一使用時(shí)都有一定的局限性,采用將灰色模型和人工神經(jīng)網(wǎng)絡(luò)通過(guò)加權(quán)的方式優(yōu)化組合,通過(guò)加權(quán)操作簡(jiǎn)單且能使兩種模型優(yōu)勢(shì)互補(bǔ),提高預(yù)測(cè)精度。結(jié)合灰色預(yù)測(cè)模型與BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)值,計(jì)算相應(yīng)誤差的方差,以式(27)求得組合權(quán)重系數(shù)。其中灰色GM(1,1)預(yù)測(cè)的權(quán)重c11=0.191 95,人工神經(jīng)網(wǎng)絡(luò)權(quán)重c12=0.808 05?;赟impson公式的GM(1,1)權(quán)重c21=0.206 46,人工神經(jīng)網(wǎng)絡(luò)權(quán)重c22=0.765 38。求得的組合灰色神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)值及其相對(duì)誤差見(jiàn)表2。
表2 基于不同模型的中國(guó)汽車擁有量預(yù)測(cè)值與實(shí)際值對(duì)比Table 2 Comparison table of predicted and actual value of china’s car ownership based on different models
由表2可得,采用灰色GM(1,1)模型、Simpson公式的GM(1,1)模型、BP神經(jīng)網(wǎng)絡(luò)、組合灰色神經(jīng)網(wǎng)絡(luò)、Simpson改進(jìn)的灰色神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)結(jié)果與實(shí)際結(jié)果的相對(duì)誤差均在16%以內(nèi),其誤差的均方差為62.958 1, 60.381 6, 12.043 4, 3.506 9, 3.279 0。為更直觀的看出各個(gè)模型的預(yù)測(cè)精度,對(duì)各個(gè)預(yù)測(cè)模型的相對(duì)誤差繪制直方圖,見(jiàn)圖4。相比較而言,Simpson改進(jìn)的GM(1,1)模型預(yù)測(cè)精度比GM(1,1)模型精度高。此外,組合Simpson改進(jìn)的灰色神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)精度最高,預(yù)測(cè)效果優(yōu)于灰色神經(jīng)網(wǎng)絡(luò)模型、GM(1,1)模型、Simpson改進(jìn)的GM(1,1)模型、BP神經(jīng)網(wǎng)絡(luò)模型。
圖3 基于不同模型的汽車保有量相對(duì)誤差對(duì)比Fig. 3 Relative error comparison of car ownership based on different models
筆者利用Simpson公式對(duì)灰色GM(1,1)模型進(jìn)行改進(jìn),提出了基于Simpson公式的灰色GM(1,1)模型。根據(jù)灰色系統(tǒng)和BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)誤差的大小確定組合模型的權(quán)重,構(gòu)建灰色神經(jīng)網(wǎng)絡(luò)組合模型,并以中國(guó)汽車保有量為例進(jìn)行預(yù)測(cè)分析。研究表明:筆者建立的模型預(yù)測(cè)值與實(shí)際值的相對(duì)誤差在16%以內(nèi),可得所建模型是有效可行的?;赟impson公式的改進(jìn)GM(1,1)模型預(yù)測(cè)精度比梯形公式的GM(1,1)精確度高,Simpson公式的灰色神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)精度最高,其相對(duì)誤差均在3%以內(nèi),標(biāo)準(zhǔn)方差為3.278 0,小于灰色神經(jīng)網(wǎng)絡(luò)模型、GM(1,1)模型、Simpson改進(jìn)的GM(1,1)模型、BP神經(jīng)網(wǎng)絡(luò)模型。