趙珂一 ZHAO Ke-yi
(昆明理工大學(xué)津橋?qū)W院,昆明 650106)
自2013年我國制造業(yè)的產(chǎn)值首次被第三產(chǎn)業(yè)服務(wù)業(yè)超越以來,第三產(chǎn)業(yè)服務(wù)業(yè)逐漸替代制造業(yè)成為主導(dǎo)產(chǎn)業(yè),并且服務(wù)業(yè)內(nèi)部仍在持續(xù)深化分工,不僅成為制造業(yè)而且也成為現(xiàn)代化農(nóng)業(yè)發(fā)展的重要支撐力量[1]。在此背景下,云南省第三產(chǎn)業(yè)也得到了快速發(fā)展,其中,旅游業(yè)是第三產(chǎn)業(yè)發(fā)展的中堅(jiān)力量。從2016年開始,云南三次產(chǎn)業(yè)比例不斷演變,第三產(chǎn)業(yè)占據(jù)經(jīng)濟(jì)半壁江山,成為推動(dòng)經(jīng)濟(jì)增長的主要拉動(dòng)力。目前,第三產(chǎn)業(yè)已經(jīng)逐漸替代第二產(chǎn)業(yè)成為云南省經(jīng)濟(jì)發(fā)展的支柱產(chǎn)業(yè),走向“三、二、一”模式,但與全國平均水平比較還有一定差距,產(chǎn)業(yè)結(jié)構(gòu)還有待進(jìn)一步調(diào)整和優(yōu)化[2]。
有關(guān)第三產(chǎn)業(yè)發(fā)展的實(shí)證分析,有學(xué)者運(yùn)用灰色關(guān)聯(lián)度分析,發(fā)現(xiàn)居民總消費(fèi)水平和就業(yè)人員勞動(dòng)報(bào)酬的增長對第三產(chǎn)業(yè)產(chǎn)值影響是最大的[3]。還有學(xué)者運(yùn)用ARIMA-BP神經(jīng)網(wǎng)絡(luò)組合模型預(yù)測了我國旅游業(yè)在疫情過后的短期發(fā)展趨勢[4]。另一些學(xué)者運(yùn)用ARIMA模型對山東[5]和甘肅省[6]的GDP進(jìn)行了預(yù)測。本文采用云南省1991年到2022年的第三產(chǎn)業(yè)(服務(wù)業(yè))產(chǎn)值數(shù)據(jù),通過構(gòu)建ARIMA模型來對第三產(chǎn)業(yè)(服務(wù)業(yè))產(chǎn)值的未來增長趨勢進(jìn)行預(yù)測。
除受疫情影響的幾年,云南省第三產(chǎn)業(yè)產(chǎn)值增速放緩?fù)?,其他年份都在正常提升,如圖1所示。受政策的引導(dǎo)與支持,如圖2所示,從2016年開始,除受疫情影響的2021年為50%外,第三產(chǎn)業(yè)在GDP中的占比都超過了50%。而從圖2中,云南省旅游業(yè)產(chǎn)值在第三產(chǎn)業(yè)產(chǎn)值的占比變化中,可以看出旅游業(yè)對云南省第三產(chǎn)業(yè)發(fā)展貢獻(xiàn)較大,尤其在2019,達(dá)到91%,之后年份也都在50%以上。說明云南省第三產(chǎn)業(yè)的發(fā)展較為依賴旅游業(yè)。
圖1 云南省GDP與第三產(chǎn)業(yè)產(chǎn)值變化情況(1991-2022)
圖2 第三產(chǎn)業(yè)與旅游業(yè)占比變化
近年來,為了進(jìn)一步提高第三產(chǎn)業(yè)中生活性服務(wù)業(yè)的品質(zhì)、多樣化服務(wù)種類,同時(shí),提高生產(chǎn)性服務(wù)業(yè)對制造業(yè)高質(zhì)量發(fā)展的支撐,云南省政府提出了《云南省產(chǎn)業(yè)強(qiáng)省三年行動(dòng)(2022-2024年)》。
自回歸差分移動(dòng)平均(ARIMA)模型,是差分處理后的自回歸移動(dòng)平均(ARMA)模型,可以被寫為ARIMA(p,d,q)。其中,p代表AR(自回歸)滯后階數(shù)、d是差分階數(shù),q則是MA(移動(dòng)平均)階數(shù)。
等式(1)是ARIMA模型的預(yù)測公式,其中,Yd(t)代表d階差分后的序列,c是常數(shù)項(xiàng),Φ1,Φ2…Φp是自回歸項(xiàng)的系數(shù),μ(t)是時(shí)間t下的誤差項(xiàng),θ1,θ2…θq是移動(dòng)平均項(xiàng)的系數(shù)。而Yd(t-1),Yd(t-2)...Yd(t-p)表示過去p個(gè)時(shí)間點(diǎn)的差分后觀測值,用于自回歸部分的計(jì)算;ε(t-1),ε(t-2)…ε(t-q)表示過去q個(gè)時(shí)間點(diǎn)的模型誤差項(xiàng),用于移動(dòng)平均部分的計(jì)算[7]。
2.2.1 平穩(wěn)性分析
由圖1可知,云南省第三產(chǎn)業(yè)的產(chǎn)值三十年來呈現(xiàn)非線性上升趨勢,是非平穩(wěn)時(shí)間序列。因此,需要對觀測值序列進(jìn)行差分處理后,進(jìn)行平穩(wěn)性檢驗(yàn)。ADF(Augmented Dickey-Fuller test)檢驗(yàn)結(jié)果可以用來判斷序列是否平穩(wěn)。ADF檢驗(yàn)的原假設(shè)是存在隨機(jī)游走,不平穩(wěn),因此,只要Z(t)的檢測值在1%、5%、10%的三個(gè)置信區(qū)間中都顯著,就可以否定原假設(shè)。再結(jié)合p值(MacKinnon approximate p-value for Z(t))的大小,如果小于0.05,就可以確定序列是平穩(wěn)序列。據(jù)此標(biāo)準(zhǔn),如表1所示,二階差分后的序列是平穩(wěn)的。
表1 ADF檢驗(yàn)結(jié)果
2.2.2 模型構(gòu)建與參數(shù)估計(jì)
為得到模型預(yù)測所需的移動(dòng)平均階數(shù)q和自回歸階數(shù)p,需要通過分析自回歸(AC)圖和偏自回歸(PAC)圖的特征來初步確定。
如圖3所示,橫軸Lag表示滯后階數(shù),縱軸表示二階差分后的第三產(chǎn)業(yè)產(chǎn)值序列自相關(guān)系數(shù)(Autocorrelations of D2.iii)與偏自相關(guān)系數(shù)(Partial autocorrelations of D2.iii)。陰影部分是95%的置信區(qū)間。由AC圖可知,Lag3處的相關(guān)系數(shù)在置信區(qū)間之外,且小于0,而其他各滯后階數(shù)上的相關(guān)系數(shù)取值都在置信區(qū)間內(nèi)。這說明,該序列在第3個(gè)滯后時(shí)間點(diǎn)上與當(dāng)前值之間存在較強(qiáng)的負(fù)相關(guān)性。同時(shí),Lag4處的相關(guān)系數(shù)在置信區(qū)間內(nèi),且為正數(shù),可以判斷序列在Lag3處截尾。由PAC圖可知,Lag3處的偏自相關(guān)系數(shù)顯著偏離置信區(qū)間,這說明存在較強(qiáng)的負(fù)偏自相關(guān)性。而Lag2和Lag4處的偏自相關(guān)系數(shù)都在置信區(qū)間的邊界上,這說明存在較弱的負(fù)偏自相關(guān)性,圖形在Lag4處截尾。另外,從AC圖和PAC圖中的前四階的回歸系數(shù)變化上看,Lag1到Lag3之間有拖尾趨勢。
圖3 二階差分后的序列自相關(guān)(AC)與偏自相關(guān)(PAC)圖
由此可知,自回歸階數(shù)p和移動(dòng)平均階數(shù)q的可能取值組合(p,q)為:(1,3)、(3,1)、(2,2)(3,2)、(2,3),五種組合的預(yù)測模型。結(jié)果如表2所示。表2中,卡方分布的P值(Prob>chi2)都是非常趨近于0或者等于0的,所以,五個(gè)模型都是相對顯著的。但是通過比較模型之間的AIC(Akaike Information Criterion)值和BIC(Bayesian Information Criterion)值,結(jié)合信息準(zhǔn)則判斷標(biāo)準(zhǔn),最后得出ARIMA(2,2,2)是比較合適的模型。模型的預(yù)測等式如下,其中,^Yd(t)表示d次差分后的預(yù)測值,其他變量的定義與等式(1)相同,由表1可知,等式(2)中的d為2,代表對觀測序列進(jìn)行了二次差分。
由表3可知,除了常數(shù)項(xiàng)c的卡方分布P值大于0.05的顯著標(biāo)準(zhǔn),說明對預(yù)測結(jié)果的影響不夠顯著外,其他各個(gè)系數(shù)的P值都小于0.05,說明對預(yù)測結(jié)果會(huì)有顯著的影響。另外,所有系數(shù)值也都處在置信區(qū)間中,初步說明該模型可用于預(yù)測云南省第三產(chǎn)業(yè)增長。由于軟件只能直接輸出2023一年的預(yù)測結(jié)果,為16684.18億元。隨后幾年,則是通過預(yù)測模型公式推測得出,分別為17982.82億元,19549.14億元,20306.15億元,21982.79億元。
表3 ARIMA(2,2,2)模型系數(shù)的顯著性
2.2.3 模型的擬合度檢驗(yàn)
由圖4可知,代表第三產(chǎn)業(yè)產(chǎn)值預(yù)測值的曲線(由“iii,arima(2,2,2)”表示)與代表第三產(chǎn)業(yè)產(chǎn)值真實(shí)值的曲線(由“iii”表示),在2019年之前的大多數(shù)年份里是幾乎重合的。而2019年后兩條曲線之間出現(xiàn)了小幅度的分離。反映了2020年到2021年新冠疫情這一突發(fā)事件,對云南省第三產(chǎn)業(yè)發(fā)展的不良影響。要確定這一隨機(jī)事件會(huì)在多大程度上影響模型的預(yù)測準(zhǔn)確性,需要對模型進(jìn)行擬合度測試。
圖4 ARIMA(2,2,2)模型預(yù)測曲線
通常一個(gè)擬合度較好的模型,其殘差序列是平穩(wěn)的白噪音序列,序列沒有自相關(guān)性,并且呈現(xiàn)正態(tài)分布。殘差序列等式如式(3)所示,其中,Residual表示殘差,Y(t)表示真實(shí)觀測值,表示預(yù)測值。
首先,是平穩(wěn)性檢驗(yàn),如表4所示,ADF單位根檢驗(yàn)中,p值為0,拒絕原假設(shè),序列是平穩(wěn)的。由于ADF檢驗(yàn)在序列存在自相關(guān)性的情況下可能會(huì)產(chǎn)生虛假拒絕,所以還要用到對自相關(guān)情況更敏感的PP檢驗(yàn)。其中,Z(rho)主要用于檢驗(yàn)是否存在單位根;而Z(t)主要用于檢驗(yàn)總體均值是否存在差異,是否拒絕隨機(jī)游走的原假設(shè)。由表4可知,PP檢驗(yàn)的結(jié)果也表明,序列是不存在單位根,且拒絕原假設(shè)的。綜合上述兩種檢驗(yàn)方法的結(jié)論,殘差序列是平穩(wěn)的。
表4 殘差序列的平穩(wěn)性檢驗(yàn)結(jié)果
其次,是白噪音檢驗(yàn)(Portmanteau test for white noise)。檢驗(yàn)結(jié)果顯示,Portmanteau(Q)統(tǒng)計(jì)量為13.2269,P值為0.4304,大于0.05的統(tǒng)計(jì)顯著標(biāo)準(zhǔn),無法拒絕存在白噪聲的原假設(shè)。殘差序列為白噪聲,說明會(huì)影響模型變化的隨機(jī)因素已經(jīng)被包含在了殘差序列中,模型本身不存在較大的預(yù)測誤差。
再次,是自相關(guān)分析,如圖5所示,縱軸(Autocorrelation of Residual)為殘差的自相關(guān)系數(shù),橫軸(Lag)為滯后階數(shù),所有滯后階數(shù)上的自相關(guān)系數(shù)都在95%的置信區(qū)間內(nèi),且距離邊界較遠(yuǎn),不顯著。這說明殘差序列是隨機(jī)和無自相關(guān)的,結(jié)合前面的白噪聲檢驗(yàn)結(jié)果,二者結(jié)論一致,說明ARIMA(2,2,2)模型的擬合效果相對較好。
圖5 殘差序列自相關(guān)圖
最后,是正態(tài)分布檢驗(yàn),如圖6所示,殘差序列近似正態(tài)分布。在偏度與峰度聯(lián)合檢驗(yàn)中,檢驗(yàn)結(jié)果顯示,偏度的P值為0.1826,峰度的P值為0.1594,聯(lián)合檢驗(yàn)的卡方統(tǒng)計(jì)量的P值為0.1359,都大于0.05的顯著性水平,說明不能拒絕原假設(shè),殘差序列符合正態(tài)分布,說明預(yù)測模型的擬合效果較好。
圖6 殘差序列的正態(tài)分布圖
近年來,雖然云南省第三次產(chǎn)業(yè)有了一定發(fā)展,但仍需進(jìn)一步優(yōu)化。首先,第三產(chǎn)業(yè)的發(fā)展過于依賴旅游業(yè),一旦發(fā)生疫情這樣的突發(fā)事件,就會(huì)對地方經(jīng)濟(jì)產(chǎn)生較大影響。因此,要盡快優(yōu)化第三產(chǎn)業(yè)內(nèi)部結(jié)構(gòu),鼓勵(lì)其他服務(wù)業(yè)的發(fā)展。另外,從旅游業(yè)發(fā)展的角度看,云南旅游業(yè)的目標(biāo)群體絕大部分都是國內(nèi)游客,國際游客占比很小,且一日游的游客超過一半以上[8]。每年長假過后,國內(nèi)游客對云南旅游的負(fù)面評價(jià)都會(huì)增加。由此可見,云南省旅游產(chǎn)品的吸引力和質(zhì)量都有待提升,對省內(nèi)旅游資源的粗放式開發(fā)并不符合可持續(xù)發(fā)展的精神。其次,從統(tǒng)計(jì)數(shù)據(jù)上看,以2021年云南省內(nèi)各主要州市的第三產(chǎn)業(yè)法人主要分布為例,排第一的昆明市服務(wù)企業(yè)數(shù)量是排第二的曲靖的五倍,是排第三的紅河的六倍。說明大部分服務(wù)企業(yè)都集中在昆明市,第三產(chǎn)業(yè)服務(wù)業(yè)發(fā)展地區(qū)分布不平衡。這說明,支撐第三產(chǎn)業(yè)發(fā)展的合格人才,在高等教育普及度較高、服務(wù)企業(yè)相對集中的省會(huì)城市更易獲得,其他地區(qū)則相對供給不足。
云南省第三產(chǎn)業(yè)的健康發(fā)展,離不開政府政策的引導(dǎo)和扶持。首先,要合理適度地開發(fā)省內(nèi)旅游資源,維持好原有的自然生態(tài)優(yōu)勢,推進(jìn)文化和旅游深度融合。建立景區(qū)服務(wù)質(zhì)量監(jiān)督制度,暢通投訴渠道,提高景區(qū)服務(wù)質(zhì)量,推進(jìn)服務(wù)智慧化。規(guī)范景區(qū)附近的餐飲、住宿、購票等服務(wù)的提供,提高熱門景區(qū)商家的準(zhǔn)入門檻,嚴(yán)防宰客現(xiàn)象出現(xiàn)。其次,扶持地州服務(wù)企業(yè)發(fā)展,提高當(dāng)?shù)啬贻p人的受教育程度,為企業(yè)培養(yǎng)所需人才[9]。同時(shí),制定合理的人才培養(yǎng)和引進(jìn)政策,并完善企業(yè)人才績效考評制度,留住人才。另外,通過完善區(qū)域交通網(wǎng)絡(luò)系統(tǒng),減少地區(qū)間的運(yùn)輸成本,從而產(chǎn)生外部經(jīng)濟(jì)性,促進(jìn)地區(qū)產(chǎn)業(yè)發(fā)展與融合,也有利于區(qū)域產(chǎn)業(yè)結(jié)構(gòu)調(diào)整[10]。
ARIMA模型可以用于預(yù)測云南省第三產(chǎn)業(yè)產(chǎn)值的變化,結(jié)果顯示,云南省第三產(chǎn)業(yè)未來短期內(nèi)仍然會(huì)保持增長。而要實(shí)現(xiàn)這一目標(biāo),需在政府的引導(dǎo)和扶持下,進(jìn)一步優(yōu)化云南省第三產(chǎn)業(yè)的內(nèi)部結(jié)構(gòu)。本文主要針對云南省第三產(chǎn)業(yè)產(chǎn)值進(jìn)行分析和預(yù)測,對其他暫時(shí)未涉及到的問題的探討,會(huì)在未來的研究中補(bǔ)齊。