邢 蕾, 劉永超
(長(zhǎng)春工業(yè)大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院, 吉林 長(zhǎng)春 130012)
隨著我國(guó)綜合國(guó)力的日益強(qiáng)勁,人們的生活品質(zhì)和物質(zhì)水平得到顯著改善。20世紀(jì)90年代之前,國(guó)內(nèi)汽車市場(chǎng)大部分被地方政府以及企事業(yè)單位使用的公務(wù)車所占據(jù),此外,企業(yè)的公共商務(wù)車也占有較大比例,只有相當(dāng)少的私人用車;1990年以后的十年間,公務(wù)車的使用比例逐漸減少,商務(wù)用車比例日益上升,私人購(gòu)車逐漸被更多人接受;2002年以來(lái),私人購(gòu)車已然成為我國(guó)汽車行業(yè)十分重要的一部分[1]。隨著我國(guó)社會(huì)經(jīng)濟(jì)的日益增長(zhǎng),國(guó)民收入和生活水平得到改善和提升,購(gòu)買汽車的能力大幅增強(qiáng),與此同時(shí),國(guó)家制定的一些相關(guān)政策也很好地推動(dòng)了中國(guó)新能源汽車行業(yè)的繁榮和發(fā)展。
一方面,私人擁有汽車數(shù)量的多少與國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展是否健康高效、國(guó)內(nèi)生產(chǎn)總值是否穩(wěn)步提高、道路建設(shè)過程中是否安全有序具有密切聯(lián)系;另一方面,私人汽車在國(guó)內(nèi)的汽車生產(chǎn)和消費(fèi)市場(chǎng)中已經(jīng)處于舉足輕重的位置,能夠直接體現(xiàn)出整個(gè)國(guó)內(nèi)汽車市場(chǎng)的發(fā)展?fàn)顩r,因此,私人汽車擁有量逐漸發(fā)展成為國(guó)內(nèi)外專家學(xué)者們所需要和關(guān)注的研究對(duì)象。1967年,Mogridge M[2]首次利用英國(guó)家庭消費(fèi)調(diào)查相關(guān)數(shù)據(jù),基于家庭可支配收入和用于購(gòu)買家庭使用汽車的消費(fèi)支出,建立了汽車擁有量的預(yù)測(cè)模型;2002年,Soligo K[3]建立了經(jīng)濟(jì)發(fā)展與私人汽車擁有量之間關(guān)系的模型,并且證明了該模型足夠通用到其他消耗燃料,如家用電器等方面;Joyce M Dargay[4]使用偽面板方法研究英國(guó)農(nóng)村和城市家庭汽車擁有量的因素, 結(jié)果顯示,汽車運(yùn)輸成本的增加會(huì)對(duì)農(nóng)村家庭造成更大的經(jīng)濟(jì)負(fù)擔(dān),針對(duì)不同地區(qū)給出具體的運(yùn)輸措施;2004年,Hong S K等[5]針對(duì)1995年NPTS的數(shù)據(jù)建立有序Logit模型進(jìn)行分析和評(píng)估,結(jié)果表明,改善公共交通可以增加汽車的使用;Anowar S等[6]應(yīng)用潛在有序Logit模型和無(wú)序多項(xiàng)式Logit模型,并用加拿大魁北克市的數(shù)據(jù)進(jìn)行估算,驗(yàn)證了這些模型在汽車擁有量決策方面的優(yōu)勢(shì),無(wú)序選擇機(jī)制的表現(xiàn)略好于有序響應(yīng)機(jī)制;2010年,Nolan A[7]利用愛爾蘭一項(xiàng)生活調(diào)查的縱向數(shù)據(jù)來(lái)分析估計(jì)家庭汽車擁有量的動(dòng)態(tài)隨機(jī)效應(yīng)概率單位模型,結(jié)果顯示,收入是家庭汽車擁有量差異的最強(qiáng)決定性因素;2016年,Wu N等[8]采用固定效應(yīng)模型和隨機(jī)效應(yīng)模型對(duì)32個(gè)省會(huì)城市的私家車擁有量相關(guān)數(shù)據(jù)估計(jì)結(jié)果進(jìn)行了研究比較,結(jié)果顯示,固定效應(yīng)模型的性能要明顯優(yōu)于文中提到的另外兩種模型。
隨著中國(guó)的穩(wěn)步發(fā)展,汽車私有數(shù)量的持續(xù)增加,國(guó)內(nèi)研究學(xué)者也進(jìn)行了很多相關(guān)研究。韓雪等[9]引入與私人汽車擁有量相關(guān)的解釋變量,建立線性回歸模型,較為精準(zhǔn)地得到了私人擁有汽車數(shù)量的短期預(yù)測(cè)結(jié)果。隨后很多學(xué)者選擇使用線性回歸這一簡(jiǎn)單實(shí)現(xiàn)且容易理解的模型進(jìn)行分析與預(yù)測(cè),主要區(qū)別在于解釋變量的選擇上有所不同[10-12]。由于灰色系統(tǒng)模型不必明確數(shù)據(jù)分布,而且對(duì)研究數(shù)據(jù)沒有十分苛刻的制約,應(yīng)用較方便,很多學(xué)者以此展開了大量工作。朱開永等[13]根據(jù)灰色理論,以私家車保有量數(shù)據(jù)建立預(yù)測(cè)模型,并利用灰色關(guān)聯(lián)分析法得到了影響私家車保有量的主要因素;劉利斌等[14]運(yùn)用灰色理論和線性回歸思想針對(duì)特定地域的數(shù)據(jù),建立了私人汽車保有量的預(yù)測(cè)模型,得到比前者更好的預(yù)測(cè)結(jié)果;洪求枝等[15]以灰色系統(tǒng)比作私人汽車擁有數(shù)量的變化過程,建立了GM(1,1)模型,將其應(yīng)用于實(shí)際數(shù)據(jù)上,并進(jìn)一步驗(yàn)證了該預(yù)測(cè)模型的可行性[16];李乃偉等[17]利用灰色理論建立GM(1,1)動(dòng)態(tài)預(yù)測(cè)模型,根據(jù)精度大于90%的要求提出10種預(yù)測(cè)模型,得到了較準(zhǔn)確的預(yù)測(cè)結(jié)果,為城市交通規(guī)劃等各方面的研究提供了依據(jù);斯琴[18]利用GM(1,1)及其修正模型對(duì)私人擁有汽車的數(shù)量數(shù)據(jù)進(jìn)行預(yù)測(cè),證明了后者的預(yù)測(cè)精度比前者更好,在短期的預(yù)測(cè)精度方面也比前者更加理想。
這些研究工作在對(duì)汽車擁有量數(shù)據(jù)分析和預(yù)測(cè)等應(yīng)用方面已經(jīng)取得了一定的進(jìn)展,多元線性回歸模型的建模及預(yù)測(cè)過程容易實(shí)現(xiàn)、結(jié)果具有很好的可解釋性,但在一定程度上可能忽略了交互效應(yīng)和非線性的因果關(guān)系,導(dǎo)致預(yù)測(cè)結(jié)果不夠準(zhǔn)確?;疑A(yù)測(cè)模型對(duì)研究數(shù)據(jù)沒有嚴(yán)格要求,并且模型的預(yù)測(cè)精度相對(duì)令人滿意,可適用于短期、中長(zhǎng)期預(yù)測(cè)。文中利用自適應(yīng)Lasso估計(jì)方法進(jìn)行變量選擇得到影響我國(guó)私人汽車擁有量的主要因素,建立灰色GM(1,1)模型對(duì)其進(jìn)行分析預(yù)測(cè),最后,根據(jù)相對(duì)誤差等統(tǒng)計(jì)指標(biāo)比較不同模型的預(yù)測(cè)結(jié)果,為國(guó)家和汽車行業(yè)制定相關(guān)政策提供理論支持。
灰色預(yù)測(cè)模型是對(duì)單個(gè)時(shí)間序列進(jìn)行建模和預(yù)測(cè)的一種方法,它對(duì)所研究的數(shù)據(jù)沒有嚴(yán)苛的制約,以不完全知道樣本信息的小樣本為主要研究對(duì)象,不需要明確原始數(shù)據(jù)屬于何種分布,建模精度具有一定的優(yōu)勢(shì),被普遍應(yīng)用在經(jīng)濟(jì)等領(lǐng)域。灰色GM(1,1)模型是所有灰色預(yù)測(cè)理論中的一個(gè)基礎(chǔ)理論模型,也是所有灰色理論中應(yīng)用最為普遍的一種灰色預(yù)測(cè)模型,適合對(duì)數(shù)據(jù)量少以及信息不足的序列進(jìn)行中短期的灰色預(yù)測(cè),在這種灰色預(yù)測(cè)系統(tǒng)中,由于所能獲取的序列信息往往是有限的,因此常常需要對(duì)序列做一些處理,減弱序列的隨機(jī)性,經(jīng)常被用到實(shí)際中的處理辦法主要有:累加生成、累減生成和加權(quán)鄰值生成,文中選擇的是累加生成方法[19]。
灰色預(yù)測(cè)模型的建模步驟為:
已知原始序列
X(0)={x(0)(1),x(0)(2),…,x(0)(n)}
有n個(gè)非負(fù)觀測(cè)值,對(duì)該序列進(jìn)行累加生成變換,得到
X(1)={x(1)(1),x(1)(2),…,x(1)(n)},
其中
(1)
計(jì)算緊鄰均值序列
Z(1)={z(1)(2),z(1)(3),…,z(1)(n)},
其中
(2)
則得到一階單變量的灰色GM(1,1)預(yù)測(cè)模型形式為
(3)
式中:α----發(fā)展灰數(shù);
μ----內(nèi)生控制灰數(shù)。
令θ=(α,μ)T為待估參數(shù),利用最小二乘法進(jìn)行求解,解得
(4)
其中
Yn=(x(0)(2),x(0)(3),…,x(0)(n))T,
(5)
將預(yù)測(cè)累加值還原為預(yù)測(cè)值
(6)
為了保證所建立的模型能夠擁有較高的精度應(yīng)用于實(shí)例的預(yù)測(cè)中,通常需要經(jīng)過殘差檢驗(yàn)、關(guān)聯(lián)度檢驗(yàn)以及后驗(yàn)差檢驗(yàn)。若序列殘差滿足Δk<10%,則表示灰色GM(1,1)模型的預(yù)測(cè)精度較高;若關(guān)聯(lián)度r>0.6時(shí),可以認(rèn)為GM(1,1)模型的預(yù)測(cè)結(jié)果較好;若后驗(yàn)差滿足C<0.35,則說明灰色GM(1,1)模型的預(yù)測(cè)效果是令人滿意的。
根據(jù)《中國(guó)統(tǒng)計(jì)年鑒》2000—2019年共20年我國(guó)私人汽車擁有量的相關(guān)數(shù)據(jù),選取了7個(gè)相關(guān)解釋變量見表1。
表1 2000—2019年私人汽車擁有量及相關(guān)數(shù)據(jù)
續(xù)表1
應(yīng)用自適應(yīng)Lasso估計(jì)方法對(duì)這7個(gè)解釋變量進(jìn)行變量選擇,進(jìn)而得出對(duì)私人汽車擁有數(shù)量產(chǎn)生影響效應(yīng)的主要變量,利用灰色理論進(jìn)行預(yù)測(cè),比較不同方法的預(yù)測(cè)效果。
中國(guó)私人汽車擁有量與時(shí)間的關(guān)系如圖1所示。
圖1 中國(guó)私人汽車擁有量與時(shí)間的關(guān)系
由圖1可以看出,2000年以來(lái),中國(guó)私人汽車擁有量一直呈現(xiàn)遞增的趨勢(shì),利用灰色理論和模型構(gòu)建過程以及表1中的私人汽車擁有量的數(shù)據(jù),在R語(yǔ)言的基礎(chǔ)上進(jìn)行建模,由于在實(shí)際灰色理論建模中,原始時(shí)間序列不一定都被用來(lái)進(jìn)行建模,通過建立不同維數(shù)的序列可以得到不同的參數(shù)和預(yù)測(cè)值,因此,通過篩選適當(dāng)?shù)木S數(shù)可以得到預(yù)測(cè)精度最高的GM(1,1)動(dòng)態(tài)預(yù)測(cè)模型,模型通過一系列檢驗(yàn)后,相對(duì)誤差不超過1%,預(yù)測(cè)結(jié)果見表2。
表2 GM(1,1)模型檢驗(yàn)及預(yù)測(cè)
計(jì)算關(guān)聯(lián)度
r=1.137 334>0.6,
該值說明所建立的模型關(guān)聯(lián)性較好,后驗(yàn)差比值
說明所建立模型預(yù)測(cè)的很好。
Lasso估計(jì)方法是通過在回歸模型中加入懲罰項(xiàng),實(shí)現(xiàn)了在多個(gè)解釋變量中快捷地選擇其中較為重要變量的一種有偏估計(jì)方法,而且自適應(yīng)Lasso估計(jì)方法在對(duì)變量的選擇方面要比Lasso估計(jì)方法更加適合,在實(shí)際應(yīng)用中有更好的表現(xiàn)[20]。
變量間的相關(guān)系數(shù)見表3。
表3中,解釋變量x1、x2、x3,x4與y的相關(guān)系數(shù)分別為0.944 8、0.989 9、0.997 2、0.936 7,說明這4個(gè)解釋變量與y有非常強(qiáng)的正相關(guān)關(guān)系;解釋變量x6和x7與y的相關(guān)系數(shù)分別為0.894 3和0.830 2,說明這兩個(gè)解釋變量與y有比較強(qiáng)的正相關(guān)關(guān)系,而解釋變量x5與y的相關(guān)系數(shù)為-0.333 2,該解釋變量對(duì)y的影響較小。
表3 變量間的相關(guān)系數(shù)
根據(jù)Pearson相關(guān)系數(shù)檢驗(yàn)結(jié)果,可以初步認(rèn)為選擇的7個(gè)解釋變量對(duì)我國(guó)私人汽車擁有量都存在一定的相關(guān)關(guān)系,利用自適應(yīng)Lasso估計(jì)方法對(duì)解釋變量進(jìn)行選擇,得到回歸方程
yt=-0.619 3x2t+1.615 9x3t+0.026 2x4t+et,
et=0.233 6et-1-0.058 4et-2+0.071 1et-3+σεt。
(7)
由式(7)可以清楚的看出,我國(guó)私人汽車擁有量與國(guó)內(nèi)生產(chǎn)總值(億元)、居民消費(fèi)水平(元)、全國(guó)汽車產(chǎn)量(萬(wàn)輛)之間具有較強(qiáng)的相關(guān)性,與年末總?cè)丝跀?shù)(萬(wàn)人)、燃料動(dòng)力類購(gòu)進(jìn)價(jià)格指數(shù)、鋼材產(chǎn)量(萬(wàn)t)和公路里程(萬(wàn)km)之間的相關(guān)性比較弱,其中居民消費(fèi)水平(元)的影響最大。
利用自適應(yīng)Lasso估計(jì)方法選擇的變量建立多元線性回歸模型并預(yù)測(cè),這里只列舉了2015—2019年我國(guó)私人汽車擁有量的預(yù)測(cè)結(jié)果,相對(duì)誤差都在2%之內(nèi),模型擬合較好。
基于Lasso的線性回歸模型檢驗(yàn)及預(yù)測(cè)見表4。
表4 基于Lasso的線性回歸模型檢驗(yàn)及預(yù)測(cè)
利用逐步回歸得到回歸模型,即
y=-0.031 4x1-0.029 2x2+1.975 0x3+
0.486 5x4。
(8)
模型的R2=0.999 8,模型對(duì)應(yīng)的P值小于2.2×10-16,模型擬合的很好。
將表1中的數(shù)據(jù)代入式(8),得到逐步回歸模型檢驗(yàn)及預(yù)測(cè)結(jié)果見表5。
表5 逐步回歸模型檢驗(yàn)及預(yù)測(cè)
由表5可以看出,顯然逐步回歸模型預(yù)測(cè)結(jié)果的絕對(duì)誤差要大一些,自適應(yīng)Lasso估計(jì)方法進(jìn)行變量選擇為多元線性回歸模型的預(yù)測(cè)提供了一種更好的方法。
利用灰色理論預(yù)測(cè)出2017—2019年各因素的數(shù)據(jù)見表6。
表6 2017—2019年各因素的預(yù)測(cè)值
將表6中的數(shù)據(jù)代入式(8),得到私人汽車擁有量分別是18 468.49萬(wàn)輛、20 710.59萬(wàn)輛和22 501.15萬(wàn)輛,對(duì)應(yīng)的相對(duì)誤差分別是0.25%、0.66%和0.03%,該方法得到了更好的預(yù)測(cè)結(jié)果。
通過以上分析結(jié)果易知,普通線性回歸和基于自適應(yīng)Lasso變量選擇后的回歸對(duì)20年數(shù)據(jù)進(jìn)行預(yù)測(cè),相對(duì)誤差基本相同且大多數(shù)在2%之內(nèi),但自適應(yīng)Lasso估計(jì)方法縮減了逐步回歸的時(shí)間和過程,為建立回歸模型進(jìn)行預(yù)測(cè)提供了一種易于實(shí)現(xiàn)和理解的途徑和辦法,而對(duì)三維私人擁有的汽車數(shù)量短序列建立的GM(1,1)模型,得到的預(yù)測(cè)精度最高,相對(duì)誤差在1%之內(nèi),也間接說明了灰色模型更多地適用于對(duì)包括不確定信息進(jìn)行短期預(yù)測(cè)。
通過上述檢驗(yàn)證實(shí)了所建立的GM(1,1)預(yù)測(cè)模型是可行且有效的。利用建立的這個(gè)模型對(duì)我國(guó)未來(lái)兩年的私人汽車擁有量數(shù)據(jù)進(jìn)行預(yù)測(cè),結(jié)果如下:
2020年,我國(guó)私人汽車擁有數(shù)量
2021年,我國(guó)私人汽車擁有數(shù)量
1)運(yùn)用自適應(yīng)Lasso估計(jì)方法實(shí)現(xiàn)變量選擇,在已有的7個(gè)解釋變量中,年末總?cè)丝跀?shù)(萬(wàn)人)、燃料動(dòng)力類購(gòu)進(jìn)價(jià)格指數(shù)、鋼材產(chǎn)量(萬(wàn)t)和公路里程(萬(wàn)km)不是直接影響我國(guó)私人汽車擁有量的主要因素;
2)通過使用不同維數(shù)的私人汽車擁有量短序列建立GM(1,1)動(dòng)態(tài)預(yù)測(cè)模型,以預(yù)測(cè)精度最高的模型來(lái)預(yù)測(cè)出2020年和2021年我國(guó)私人汽車擁有量數(shù)據(jù)分別是24 604.58萬(wàn)輛和26 915.8萬(wàn)輛,根據(jù)預(yù)測(cè)結(jié)果,該方法在短期預(yù)測(cè)方面更有效且精度更高,可以應(yīng)用到小數(shù)據(jù)、貧信息方面;
3)雖然考慮了經(jīng)濟(jì)等因素與私人汽車擁有量的關(guān)系,但因?yàn)閿?shù)據(jù)會(huì)受到多方面影響因素的制約,存在著一定趨勢(shì)的同時(shí)具有隨機(jī)性,相關(guān)的預(yù)測(cè)模型很難得到非常準(zhǔn)確的長(zhǎng)期預(yù)測(cè)結(jié)果。
私人汽車數(shù)量日益增多不是單一因素導(dǎo)致的結(jié)果,而是經(jīng)濟(jì)因素、人口密度、道路面積等多方面因素共同形成的現(xiàn)象[21]。在回歸方程中,居民消費(fèi)水平(元)對(duì)應(yīng)的系數(shù)為1.615 9,對(duì)我國(guó)私人汽車擁有量產(chǎn)生了最大的影響效應(yīng),因此對(duì)于國(guó)家來(lái)說,增加居民收入、提高居民的消費(fèi)水平是增加私人擁有汽車數(shù)量的重要舉措之一,只有當(dāng)個(gè)人存有充足的資金后,才能將其用于汽車這類消費(fèi)品上,才會(huì)有愈來(lái)愈多的人注意到汽車市場(chǎng),購(gòu)買私人使用的汽車;其次,全國(guó)汽車產(chǎn)量(萬(wàn)輛)對(duì)應(yīng)的系數(shù)為0.026 2,對(duì)私人汽車擁有量有微弱的影響效應(yīng),汽車制造及相關(guān)行業(yè)應(yīng)在增加汽車數(shù)量的同時(shí),對(duì)現(xiàn)有汽車進(jìn)行技術(shù)創(chuàng)新,制造更適合家庭使用的汽車,增加私人汽車擁有量的數(shù)量同時(shí)使得汽車行業(yè)合理、高速的發(fā)展。
長(zhǎng)春工業(yè)大學(xué)學(xué)報(bào)2021年4期