陳 斌, 吳 瑾
(1. 南京航空航天大學(xué)民航學(xué)院, 江蘇 南京 211106; 2. 中國民航工程咨詢有限公司, 北京 100621)
機(jī)場客、貨吞吐量預(yù)測結(jié)果是決策機(jī)場建設(shè)規(guī)模的重要依據(jù),直接決定著機(jī)場建設(shè)投資[1]。目前,時(shí)間序列法、因果關(guān)系法、人工智能法等方法已廣泛應(yīng)用于機(jī)場客、貨吞吐量預(yù)測[2-9]。時(shí)間序列法和因果關(guān)系法能夠精準(zhǔn)地對線性平穩(wěn)序列進(jìn)行預(yù)測,人工智能法能夠?qū)⒎蔷€性非平穩(wěn)序列逼近到預(yù)期精度[10-12]。
然而,機(jī)場業(yè)務(wù)量發(fā)展容易受到外界宏觀經(jīng)濟(jì)因素的干擾和驅(qū)動(dòng),因此在科學(xué)研究領(lǐng)域,因果關(guān)系法常被用于機(jī)場業(yè)務(wù)量需求預(yù)測[4,13-15]?;貧w分析法是因果關(guān)系模型中的一種經(jīng)典預(yù)測方法,已被廣泛使用和推廣。在利用回歸分析法進(jìn)行預(yù)測時(shí),首先需要確定與航空運(yùn)輸相關(guān)的各類經(jīng)濟(jì)指標(biāo)。例如,Wu等[16]利用2006~2015年中國各省機(jī)場吞吐量和社會(huì)經(jīng)濟(jì)發(fā)展數(shù)據(jù),以人均機(jī)場客、貨吞吐量和單位國內(nèi)生產(chǎn)總值(gross domestic product, GDP)機(jī)場客、貨吞吐量作為區(qū)域航空運(yùn)輸利用的衡量指標(biāo),分析了機(jī)場吞吐量與宏觀變量之間的相關(guān)性,結(jié)果表明機(jī)場客、貨吞吐量與人均GDP、城鎮(zhèn)化率、人口密度之間存在較強(qiáng)的相關(guān)性。Zhang[17]等分析了航空運(yùn)輸與經(jīng)濟(jì)增長之間的因果關(guān)系,研究表明航空運(yùn)輸與經(jīng)濟(jì)的關(guān)系是雙向的,這種雙向關(guān)系在欠發(fā)達(dá)地區(qū)普遍存在。但通過對航空市場成熟國家的研究發(fā)現(xiàn),航空運(yùn)輸對經(jīng)濟(jì)增長產(chǎn)生積極影響,反之則不然。在基于回歸分析法的預(yù)測中,Bastola[18]等在假設(shè)機(jī)場旅客吞吐量取決于游客人次和GDP的基礎(chǔ)上,分別構(gòu)建了兩個(gè)一元線性回歸模型,結(jié)果表明構(gòu)建的模型表現(xiàn)較好。Peng[19]等基于GDP、常住人口、機(jī)場競爭和空間距離等多源數(shù)據(jù)構(gòu)建了多元線性回歸模型,結(jié)果表明GDP和人口是影響民航機(jī)場旅客吞吐量的重要因素。Zhang[20]等從GDP、從業(yè)人員數(shù)量、水路貨運(yùn)量、公路貨運(yùn)量、游客人數(shù)等宏觀統(tǒng)計(jì)指標(biāo)中選取相關(guān)性最高的變量構(gòu)建回歸預(yù)測模型,預(yù)測大連新機(jī)場航空貨郵吞吐量。此外,隨著大數(shù)據(jù)的發(fā)展,Kim[21]等將互聯(lián)網(wǎng)搜索數(shù)據(jù)作為自變量構(gòu)建回歸預(yù)測模型,證實(shí)了搜索數(shù)據(jù)是預(yù)測航空運(yùn)輸需求的有效數(shù)據(jù)。
雖然已有大量文章研究回歸分析法在機(jī)場業(yè)務(wù)量需求方面的預(yù)測問題,然而從目前的研究成果來看,依然存在著以下幾點(diǎn)不足:① 自變量選擇正確與否對預(yù)測結(jié)果產(chǎn)生重大影響,雖然已有利用大量樣本從省級(jí)層面對航空運(yùn)輸影響因素進(jìn)行研究的文獻(xiàn),但從機(jī)場角度出發(fā)進(jìn)行大樣本研究目前較為稀缺,無法系統(tǒng)地說明哪些宏觀變量與機(jī)場業(yè)務(wù)量之間具有強(qiáng)相關(guān)性;② 回歸分析法有各種變體,現(xiàn)有研究多使用一元線性回歸和多元線性回歸,然而一元線性回歸一次只能引入一個(gè)宏觀變量。多元線性回歸一次可以引入多個(gè)變量,但宏觀變量之間具有一定的相關(guān)性,同時(shí)引入模型會(huì)導(dǎo)致模型存在多重共線性,因此有必要對模型進(jìn)行改進(jìn);③ 沒有一個(gè)單一的預(yù)測模型在所有情況下都能始終優(yōu)于其他模型[22],也不存在能夠保證準(zhǔn)確性的最佳預(yù)測方法[23-24],然而現(xiàn)有研究在回歸方法選擇上多是依賴主觀選擇,因此非常有必要利用大量樣本對預(yù)測方法進(jìn)行事后評估,通過大量樣本實(shí)證研究判斷預(yù)測模型的適用性[25-28]。
本文從不同回歸分析法的優(yōu)缺點(diǎn)出發(fā),提出了相關(guān)性回歸和主成分回歸兩種組合回歸預(yù)測方法,并基于2015年之前通航的203個(gè)機(jī)場航空客、貨吞吐量和機(jī)場所在市的12個(gè)宏觀指標(biāo)數(shù)據(jù),對每一個(gè)機(jī)場客、貨吞吐量分別構(gòu)建一元線性回歸模型、相關(guān)性回歸模型、逐步回歸模型、主成分回歸模型,并根據(jù)預(yù)測結(jié)果和真實(shí)結(jié)果之間的絕對誤差百分比評判預(yù)測效果,分析每種回歸方法在機(jī)場客、貨吞吐量預(yù)測中的適用性,并得出結(jié)論。
本文主要介紹構(gòu)建的旅客吞吐量預(yù)測模型,貨郵吞吐量預(yù)測模型與之相似。
回歸預(yù)測模型的模型參數(shù)及變量說明如下:
k:機(jī)場旅客吞吐量第k個(gè)觀測年份;
K:機(jī)場旅客吞吐量最大觀測年份;
Yhistory={y(1),y(2),…,y(k)} (k=1,2,…,K):機(jī)場旅客吞吐量歷史觀測數(shù)列;
M:機(jī)場所在市宏觀統(tǒng)計(jì)變量個(gè)數(shù);
m:機(jī)場所在市第m個(gè)宏觀統(tǒng)計(jì)變量;
P:代入模型的宏觀變量個(gè)數(shù),滿足P≤M;
Xhistory,m={xm(1),xm(2),…,xm(k)} (m=1,2,…,M;k=1,2,…,K)代表機(jī)場所在市第m個(gè)宏觀變量K年的歷史觀測數(shù)列,其中xm(k)表示第m個(gè)宏觀變量在第k年的指標(biāo)觀測值;
xmax:機(jī)場所在市M個(gè)宏觀統(tǒng)計(jì)變量中與機(jī)場旅客吞吐量相關(guān)性最高的變量;
XXhistory,m={xxm(1),xxm(2),…,xxm(k)} (m=1,2,…,P;k=1,2,…,K)表示P個(gè)宏觀變量做主成分后第m個(gè)主成分K年的歷史觀測數(shù)列,其中xxm(k)表示第m個(gè)主成分在第k年的指標(biāo)值;
t:機(jī)場旅客吞吐量第t個(gè)預(yù)測年份;
T:機(jī)場旅客吞吐量預(yù)測區(qū)間最大值;
Xfuture,m={xm(1),xm(2),…,xm(t)} (m=1,2,…,M;t=1,2,…,T):機(jī)場所在市第m個(gè)宏觀變量T年的預(yù)測數(shù)列,其中xm(t)表示第m個(gè)宏觀變量在第t年的指標(biāo)預(yù)測值;
XXfuture,m={xxm(1),xxm(2),…,xxm(t)} (m=1,2,…,P;t=1,2,…,T)表示主成分分析之后第m個(gè)主成分T年的預(yù)測序列,其中xxm(t)表示第m個(gè)主成分在第t年的預(yù)測值;
Ω:允許的最大預(yù)測誤差情景集合;
ω:一種特定的情景,ω∈Ω;
φ:允許的最大預(yù)測誤差百分比。
一元線性回歸模型如下:
(1)
式中:a1m是一元線性回歸模型的回歸系數(shù);ε1是常數(shù)項(xiàng)。
相關(guān)性回歸模型如下:
ρ(Y,xm)=
(2)
ρ(Y,xmax)=
max{ρ(Y,x1),ρ(Y,x2),…,ρ(Y,xm)},m=1,2,…,M
(3)
(4)
式(2)表示計(jì)算旅客吞吐量和第m個(gè)宏觀變量之間的相關(guān)系數(shù);式(3)表示找到與機(jī)場旅客吞吐量相關(guān)性最大的宏觀統(tǒng)計(jì)變量;式(4)表示利用相關(guān)性最高的宏觀統(tǒng)計(jì)變量進(jìn)行一元線性回歸,amax2,ε2是回歸系數(shù)。
主成分回歸模型如下:
b1xx1(t)+b2xx2(t)+n+bmxxm(t)+ε3,m=1,2,…,P
(5)
式(5)表示利用P個(gè)宏觀統(tǒng)計(jì)指標(biāo)做主成分分析后得到P個(gè)線性無關(guān)的主成分回歸建模,b1,b2,…,bm,ε3表示多項(xiàng)式回歸系數(shù)。
逐步回歸模型如下:
逐步回歸模型是從備選的宏觀自變量中依次引入新變量到回歸模型中,使得最終引入模型的變量都對因變量顯著為止。本文使用的搜索方法為向前法。
(6)
(7)
步驟 3考慮機(jī)場旅客吞吐量對宏觀變量子集{xm1,xm2,xm}的回歸重復(fù)步驟2。
依次按方法重復(fù)進(jìn)行,每次從未引入回歸模型的自變量中選取一個(gè)自變量,直到檢驗(yàn)到?jīng)]有變量引入為止。
對于每個(gè)機(jī)場客、貨吞吐量預(yù)測結(jié)果,利用絕對誤差百分比進(jìn)行評估。
(8)
et≤φ(ω)
(9)
式中:et表示第t年的絕對誤差百分比;φ(ω)表示情景ω下允許的最大預(yù)測誤差,如果機(jī)場客、貨吞吐量預(yù)測誤差小于允許的最大預(yù)測誤差百分比,則認(rèn)為模型預(yù)測效果良好。
本文用到的數(shù)據(jù)主要包括兩類:一類是機(jī)場客、貨吞吐量,主要來源于民用航空局官方網(wǎng)站公布的民航機(jī)場生產(chǎn)統(tǒng)計(jì)公報(bào);另一類是機(jī)場所在市宏觀統(tǒng)計(jì)指標(biāo),數(shù)據(jù)來源于統(tǒng)計(jì)年鑒。個(gè)別城市部分年份的宏觀統(tǒng)計(jì)指標(biāo)尚未公布,應(yīng)在實(shí)證分析過程中將這些缺口數(shù)據(jù)對應(yīng)的年份做剔除處理。
在歷史數(shù)據(jù)選取上,由于2020年和2021年受疫情影響,航空運(yùn)輸需求受到某種程度抑制,機(jī)場客、貨吞吐量未能反映真實(shí)的航空運(yùn)輸需求,本文選用2020年以前的相關(guān)數(shù)據(jù)進(jìn)行實(shí)證分析。在每一個(gè)機(jī)場客、貨吞吐量實(shí)證回歸預(yù)測過程中,以2002~2014年(2002年后通航的機(jī)場以通航年份作為初始年份)數(shù)據(jù)作為歷史數(shù)據(jù)預(yù)測2015~2019年機(jī)場客、貨吞吐量。其中,宏觀變量為自變量,機(jī)場客、貨吞吐量分別為因變量。
在宏觀變量選取上,本文根據(jù)各地市公布的歷年國民經(jīng)濟(jì)和社會(huì)生產(chǎn)統(tǒng)計(jì)公報(bào)選取綜合指標(biāo)、旅游指標(biāo)、貿(mào)易指標(biāo)、人口指標(biāo)、收入指標(biāo)和城鎮(zhèn)化度量指標(biāo)6大類12個(gè)可能相關(guān)的經(jīng)濟(jì)指標(biāo),即GDP、第一產(chǎn)業(yè)GDP、第二產(chǎn)業(yè)GDP、第三產(chǎn)業(yè)GDP、旅游人次、旅游收入、進(jìn)出口額、社會(huì)消費(fèi)品零售總額、常住人口、年末總?cè)丝凇⑷司芍涫杖?、城?zhèn)化率。
在相關(guān)性分析中,一般認(rèn)為,相關(guān)系數(shù)|ρ|≥0.8時(shí),兩個(gè)變量之間呈現(xiàn)高度相關(guān);0.5<|ρ|<0.8時(shí),兩個(gè)變量呈現(xiàn)中度相關(guān);0.3<|ρ|<0.5時(shí),兩個(gè)變量呈現(xiàn)低度相關(guān);|ρ|≤0.3時(shí),兩個(gè)變量不相關(guān)。本文以|ρ|≥0.8作為兩個(gè)變量之間是否高度相關(guān)的判斷標(biāo)準(zhǔn)。
在實(shí)證過程設(shè)計(jì)上,對于每個(gè)機(jī)場客、貨吞吐量進(jìn)行預(yù)測,在一元線性回歸模型構(gòu)建中,自變量依次選擇12個(gè)宏觀指標(biāo);在相關(guān)性回歸模型構(gòu)建中,自變量選擇與機(jī)場客、貨吞吐量相關(guān)性最高的宏觀指標(biāo);在逐步回歸模型構(gòu)建中,為了驗(yàn)證不同宏觀指標(biāo)組合下預(yù)測結(jié)果的差異,自變量分別選取高度相關(guān)的n個(gè)宏觀指標(biāo)(由機(jī)場客、貨吞吐量影響因素研究得出高度相關(guān)的宏觀指標(biāo))和12個(gè)宏觀指標(biāo);在主成分回歸模型構(gòu)建中,自變量選取與逐步回歸法保持一致,確定自變量后根據(jù)主成分分析結(jié)果構(gòu)建多元線性回歸模型。為了下文描述清晰,此處對所有構(gòu)建的模型進(jìn)行編號(hào),如表1所示。
表1 預(yù)測模型編號(hào)
在回歸分析模型有效性方面,一般采用擬合優(yōu)度R-Squared評估最佳擬合線預(yù)測的準(zhǔn)確性,R-Squared越接近1,說明回歸直線對觀測值的擬合程度越好;相反,R-Squared值越小,說明回歸直線對觀測值的擬合程度越差,一般擬合優(yōu)度大于0.8則認(rèn)為模型有效。此外,還要通過F檢驗(yàn)和t檢驗(yàn)對模型參數(shù)進(jìn)行顯著性檢驗(yàn),即檢驗(yàn)在一定顯著性水平下回歸系數(shù)的顯著性,顯著性水平通常取0.95。本文按照擬合優(yōu)度是否大于0.8作為回歸模型是否有效的判定標(biāo)準(zhǔn),并在顯著性水平為0.95的條件下對模型參數(shù)進(jìn)行F檢驗(yàn)和t檢驗(yàn),如果同時(shí)滿足擬合優(yōu)度檢驗(yàn)、F檢驗(yàn)和t檢驗(yàn),則認(rèn)為擬合模型可以用于預(yù)測,否則則認(rèn)為擬合模型無法進(jìn)行有效預(yù)測。
在擬合模型滿足檢驗(yàn)的情況下,預(yù)測效果評判標(biāo)準(zhǔn)設(shè)置參照Nicolaisen[29]及Profillidis[30]的事后評估研究。一般情況下,預(yù)測絕對誤差百分比在10%以下認(rèn)為是高精度預(yù)測。為了觀察φ在不同取值下,不同回歸分析法對中國機(jī)場客、貨吞吐量的預(yù)測效果,本文對φ進(jìn)行靈敏度分析,設(shè)置情景1~情景4共4個(gè)分析情景。首先,以5%為步長設(shè)置,設(shè)置φ(1)=10%、φ(2)=15%、φ(3)=20%。此外,機(jī)場客、貨吞吐量量級(jí)不同,允許的最大預(yù)測誤差應(yīng)該有所區(qū)別,因此φ(4)以梯度方式進(jìn)行設(shè)置。根據(jù)民航機(jī)場生產(chǎn)統(tǒng)計(jì)公報(bào),按照旅客吞吐量200萬人次和1 000萬人次將機(jī)場劃分為3個(gè)等級(jí),即1 000萬人次以上、200~1 000萬人次、200萬人次以下;對應(yīng)的貨郵吞吐量則分為5萬噸以上、1~5萬噸、1萬噸以下3個(gè)等級(jí)。因此,按照梯度設(shè)置的思路,旅客吞吐量在200萬人次以下(貨郵吞吐量在1萬噸以下)機(jī)場,φ(4)=20%;旅客吞吐量在200~1 000萬人次(貨郵吞吐量為1~5萬噸)機(jī)場,φ(4)=15%;旅客吞吐量在1 000萬人次以上(貨郵吞吐量在5萬噸以上)機(jī)場,φ(4)=10%。在結(jié)果分析中,對于任意一個(gè)機(jī)場客、貨吞吐量預(yù)測結(jié)果,如果絕對誤差百分比小于對應(yīng)情景的φ值,則認(rèn)為在該情景下模型預(yù)測效果良好。此外,為了觀察回歸分析法對不同量級(jí)機(jī)場客、貨吞吐量預(yù)測的適用性問題,本文對203個(gè)機(jī)場的客、貨吞吐量預(yù)測效果分別按照3個(gè)等級(jí)進(jìn)行統(tǒng)計(jì),統(tǒng)計(jì)結(jié)果如表2和表3所示。
表2 機(jī)場旅客吞吐量等級(jí)分布統(tǒng)計(jì)
表3 機(jī)場貨郵吞吐量等級(jí)分布統(tǒng)計(jì)
機(jī)場客、貨吞吐量預(yù)測的目的主要是確定機(jī)場建設(shè)規(guī)模,常以5年為一個(gè)預(yù)測周期,因此本文在2015~2019年預(yù)測結(jié)果中主要分析2019年的預(yù)測結(jié)果。以A機(jī)場旅客吞吐量預(yù)測為例,當(dāng)允許的最大預(yù)測誤差百分比給定后,對于17個(gè)單個(gè)擬合模型預(yù)測結(jié)果,如果2019年旅客吞吐量預(yù)測誤差百分比小于允許的最大預(yù)測誤差百分比,即當(dāng)e5≤φ(ω)時(shí),認(rèn)為模型預(yù)測結(jié)果有效。對于同一細(xì)分回歸分析法,例如一元線性回歸,如果在構(gòu)建的12個(gè)細(xì)分模型中至少有一個(gè)模型的預(yù)測誤差百分比滿足e5≤φ(ω),則認(rèn)為一元線性回歸預(yù)測結(jié)果有效,同時(shí)選取最小的預(yù)測誤差百分比作為該機(jī)場一元線性回歸的預(yù)測誤差。如果12個(gè)細(xì)分預(yù)測模型均不滿足e5≤φ(ω),則記作一元線性回歸無法有效預(yù)測A機(jī)場旅客吞吐量。如果4類回歸分析法中至少有一種細(xì)分回歸分析法可以有效預(yù)測A機(jī)場的旅客吞吐量。則認(rèn)為回歸分析法能夠有效預(yù)測A機(jī)場的旅客吞吐量。根據(jù)Atiya[31]和Blancy[32]的研究結(jié)果,加權(quán)平均之后預(yù)測結(jié)果最可靠,因此A機(jī)場旅客吞吐量回歸分析預(yù)測誤差由4類回歸分析法中有效的細(xì)分回歸分析法的預(yù)測誤差百分比取平均加權(quán)得到。
2.3.1 機(jī)場客、貨吞吐量影響因素
針對機(jī)場客、貨吞吐量影響因素已有相關(guān)研究[4,17,33-34]。本文基于大量的統(tǒng)計(jì)數(shù)據(jù),分析了203個(gè)機(jī)場樣本客、貨吞吐量與12個(gè)宏觀指標(biāo)的兩兩相關(guān)性,并分別統(tǒng)計(jì)客、貨吞吐量與12個(gè)宏觀指標(biāo)分別高度相關(guān)的機(jī)場數(shù)量,根據(jù)高度相關(guān)機(jī)場數(shù)量確定與機(jī)場客、貨吞吐量高度相關(guān)的宏觀指標(biāo)。此外,還計(jì)算了GDP與其他宏觀指標(biāo)之間的兩兩相關(guān)系數(shù),用于判定宏觀指標(biāo)之間的自相關(guān)性,統(tǒng)計(jì)結(jié)果如表4~表6所示。研究表明:機(jī)場客、貨吞吐量分別與GDP高度相關(guān),GDP又與其他宏觀指標(biāo)相關(guān),因此機(jī)場客、貨吞吐量與12個(gè)宏觀指標(biāo)均有不同程度的相關(guān)性。根據(jù)統(tǒng)計(jì),總體而言,至少60%的機(jī)場的旅客吞吐量與GDP、第三產(chǎn)業(yè)GDP、可支配收入、社會(huì)消費(fèi)品零售總額、旅游人次、旅游收入等6個(gè)指標(biāo)呈現(xiàn)高度相關(guān),至少60%的機(jī)場貨郵吞吐量與GDP、第一產(chǎn)業(yè)GDP、第三產(chǎn)業(yè)GDP、社會(huì)消費(fèi)品零售總額、人均可支配收入之間呈現(xiàn)高度相關(guān),且隨著機(jī)場量級(jí)的不斷提高,機(jī)場客、貨吞吐量與宏觀指標(biāo)的相關(guān)性更加明顯。此外,從機(jī)場客、貨吞吐量與宏觀指標(biāo)高度相關(guān)的單個(gè)機(jī)場特征來看,機(jī)場均具有歷史數(shù)據(jù)充足、發(fā)展規(guī)律明顯等特點(diǎn),然而相關(guān)性低的機(jī)場則表現(xiàn)為因歷史數(shù)據(jù)少、因改擴(kuò)建或遷建機(jī)場中途停航、遷建后機(jī)場客、貨吞吐量飛躍式發(fā)展、機(jī)場客、貨吞吐量波動(dòng)無序發(fā)展或吞吐量波動(dòng)上升(多為支線旅游機(jī)場)而呈現(xiàn)出經(jīng)濟(jì)指標(biāo)逐年下降(多為邊遠(yuǎn)省份機(jī)場)等特點(diǎn)。
表4 旅客吞吐量與宏觀變量高度相關(guān)的機(jī)場數(shù)統(tǒng)計(jì)
表5 貨郵吞吐量與宏觀變量高度相關(guān)的機(jī)場數(shù)統(tǒng)計(jì)
表6 GDP與其他宏觀變量高度相關(guān)的機(jī)場數(shù)統(tǒng)計(jì)
2.3.2 不同回歸分析法的預(yù)測結(jié)果
本節(jié)仿真求解每個(gè)機(jī)場在不同預(yù)測模型、不同預(yù)測情景下的預(yù)測結(jié)果。根據(jù)機(jī)場客、貨吞吐量影響因素研究結(jié)果,在逐步回歸模型和主成分回歸模型計(jì)算中,旅客吞吐量預(yù)測時(shí)選取12個(gè)經(jīng)濟(jì)指標(biāo)和6個(gè)高度相關(guān)的宏觀指標(biāo)兩種情景,貨郵吞吐量選取12個(gè)經(jīng)濟(jì)指標(biāo)和5個(gè)高度相關(guān)的宏觀指標(biāo)兩種情景。
4種回歸方法構(gòu)建的17個(gè)細(xì)分模型客、貨吞吐量預(yù)測結(jié)果如圖1所示。圖1中,黑色線表示吞吐量與宏觀指標(biāo)高度相關(guān)的機(jī)場數(shù)量,品紅色線表示模型通過檢驗(yàn)的機(jī)場數(shù)量,深藍(lán)色、紅色、綠色、淺藍(lán)色分別表示情景1~情景4的預(yù)測結(jié)果。對比來看,高度相關(guān)的機(jī)場數(shù)量高于模型通過檢驗(yàn)的機(jī)場數(shù)量,模型通過檢驗(yàn)的機(jī)場數(shù)量又遠(yuǎn)高于情景1~情景4代表的可預(yù)測機(jī)場數(shù)量,這說明雖然客、貨吞吐量與宏觀指標(biāo)高度相關(guān),但二者構(gòu)建的回歸模型不一定能夠通過檢驗(yàn)。同時(shí),即使回歸模型通過檢驗(yàn),也不一定能夠得到精準(zhǔn)的預(yù)測結(jié)果。從4類回歸方法的預(yù)測效果來看,以情景1為例,模型13表示的相關(guān)性回歸預(yù)測效果最好;模型16和模型17表示的逐步回歸法預(yù)測效果次之。從模型16和模型17的對比來看,改變自變量輸入個(gè)數(shù),可預(yù)測的機(jī)場數(shù)量基本保持一致,因此如果使用逐步回歸法進(jìn)行預(yù)測,可以引入多個(gè)相關(guān)的宏觀變量,模型自動(dòng)選擇能使模型顯著的若干宏觀變量。需要注意的是,逐步回歸法引入的宏觀變量相關(guān)性并非很高。模型14和模型15表示的主成分回歸預(yù)測效果相對中等。從模型14和模型15的對比來看,模型14在自變量選擇高度相關(guān)的n個(gè)宏觀變量時(shí)預(yù)測效果更好,這說明主成分分析時(shí)要選擇相關(guān)性最高的宏觀經(jīng)濟(jì)指標(biāo),相關(guān)性不高的宏觀變量越多,越會(huì)削弱最大主成分所涵蓋的主要宏觀指標(biāo)信息,從而使預(yù)測結(jié)果精度不高。模型1~模型12表示的一元回歸分析預(yù)測效果相對最低,但從單個(gè)自變量的預(yù)測效果來看,旅客吞吐量與GDP、第三產(chǎn)業(yè)GDP、可支配收入、社會(huì)消費(fèi)品零售總額、旅游人次、旅游收入6個(gè)指標(biāo)的一元回歸分析結(jié)果相對更加有效,貨郵吞吐量與GDP、社會(huì)消費(fèi)品零售總額、可支配收入、第一產(chǎn)業(yè)GDP、第二產(chǎn)業(yè)GDP、第三產(chǎn)業(yè)GDP的一元回歸分析結(jié)果相對更加有效,即一元回歸分析法預(yù)測效果較好的宏觀經(jīng)濟(jì)指標(biāo)均是與機(jī)場客、貨吞吐量高度相關(guān)的宏觀指標(biāo)。從情景1~情景4的預(yù)測效果對比來看,改變?chǔ)罩?可有效預(yù)測的機(jī)場數(shù)量基本不會(huì)發(fā)生太大變化,即如果回歸分析法可以預(yù)測,那么預(yù)測誤差百分比多在10%以內(nèi)。從旅客和貨郵吞吐量預(yù)測效果的對比來看,利用4類回歸方法構(gòu)建的17個(gè)模型對機(jī)場客、貨吞吐量的預(yù)測效果整體上基本一致。
圖1 機(jī)場客、貨吞吐量預(yù)測結(jié)果Fig.1 Prediction results of airport passenger and cargo throughput
對4類回歸方法可有效預(yù)測的機(jī)場數(shù)量進(jìn)行統(tǒng)計(jì),由于不同φ值下預(yù)測結(jié)果差異不大,本文以情景3為例進(jìn)行統(tǒng)計(jì)分析,預(yù)測結(jié)果的統(tǒng)計(jì)分析如圖2所示。
圖2 不同回歸分析法的預(yù)測結(jié)果(情景3)Fig.2 Prediction results of different regression analysis methods (Scenario 3)
從圖2來看,4類回歸方法中,相關(guān)性回歸、主成分回歸和逐步回歸法的預(yù)測效果基本一致,可預(yù)測機(jī)場數(shù)占比在50%上下,一元線性回歸由于一次只能代入一個(gè)宏觀變量,預(yù)測效果相對較低。此外,從客、貨吞吐量預(yù)測效果的對比來看,4類回歸方法可預(yù)測機(jī)場數(shù)量中客運(yùn)相比貨運(yùn)更多,這是由于民航客運(yùn)發(fā)展與宏觀因素關(guān)系密切,貨運(yùn)在宏觀因素的影響下,還會(huì)受到地方政府補(bǔ)貼、快遞企業(yè)引進(jìn)等多方面外力因素影響,導(dǎo)致機(jī)場貨郵吞吐量發(fā)展與地方宏觀變量相關(guān)性更低。
將4類回歸分析法看作一個(gè)整體,按照設(shè)定規(guī)則統(tǒng)計(jì)回歸分析法對不同量級(jí)機(jī)場客、貨吞吐量的預(yù)測效果。以情景3為例,統(tǒng)計(jì)結(jié)果如表7和表8所示。
表7 機(jī)場客運(yùn)吞吐量可有效預(yù)測的機(jī)場數(shù)量(情景3)
表8 機(jī)場貨郵吞吐量可有效預(yù)測的機(jī)場數(shù)量(情景3)
對機(jī)場旅客吞吐量預(yù)測而言,整體上可有效預(yù)測機(jī)場117個(gè),占比58%,從不同量級(jí)可有效預(yù)測機(jī)場數(shù)量來看,機(jī)場量級(jí)越高,可預(yù)測機(jī)場數(shù)量越多,尤其是對旅客吞吐量在千萬級(jí)以上機(jī)場,回歸分析法基本均可實(shí)現(xiàn)預(yù)測。機(jī)場貨郵吞吐量也存在一致的結(jié)論,但對于貨郵來說,由于航空貨郵發(fā)展主要聚焦在一些大型機(jī)場,支線機(jī)場多是客運(yùn)機(jī)場,其貨運(yùn)發(fā)展基本處于無序狀態(tài),因此1萬噸以下機(jī)場可有效預(yù)測的機(jī)場的數(shù)量相比客運(yùn)較少,且無法預(yù)測的機(jī)場的貨郵吞吐量基本都在5 000噸以下???、貨吞吐量無法預(yù)測的機(jī)場的相關(guān)數(shù)據(jù)發(fā)展趨勢如圖3所示。
圖3中,縱坐標(biāo)數(shù)值表示原始數(shù)據(jù)按照0~1歸一化后的數(shù)值,根據(jù)變動(dòng)趨勢無法預(yù)測的機(jī)場的特征可歸納為兩類,一是機(jī)場客、貨吞吐量發(fā)展速度與地方經(jīng)濟(jì)發(fā)展速度不同步,例如珠海機(jī)場、九寨溝機(jī)場、鄭州機(jī)場等;二是機(jī)場在發(fā)展過程中經(jīng)歷了遷建、改擴(kuò)建停航、其他交通方式影響等,導(dǎo)致機(jī)場客、貨吞吐量出現(xiàn)猛增、中斷或斷崖式下跌,從而無法預(yù)測,例如漢中機(jī)場由于遷建,在2012~2013年停航。
圖3 無法有效預(yù)測機(jī)場吞吐量與宏觀變量發(fā)展關(guān)系圖Fig.3 Development relationship between airport throughput and macroeconomic variables of unpredictable airport
本文按照機(jī)場客、貨吞吐量由大到小繪制回歸分析法可有效預(yù)測的機(jī)場的絕對誤差百分比,如圖4所示。(注:圖4中縱坐標(biāo)數(shù)值表示原始數(shù)據(jù)按照0~1歸一化后的數(shù)值。)可以看出,回歸分析法的預(yù)測誤差因機(jī)場而異,整體上表現(xiàn)為機(jī)場量級(jí)越大,預(yù)測誤差相對越低的趨勢。
圖4 回歸分析法預(yù)測誤差Fig.4 Prediction error of regression analysis method
基于大量樣本數(shù)據(jù),利用4類回歸分析法對中國機(jī)場旅客吞吐量和貨郵吞吐量進(jìn)行預(yù)測,主要研究結(jié)論如下:
(1) 從203個(gè)機(jī)場預(yù)測效果統(tǒng)計(jì)來看,機(jī)場客、貨吞吐量與各類宏觀指標(biāo)之間均具有一定的相關(guān)性。其中,旅客吞吐量與GDP、第三產(chǎn)業(yè)GDP、旅游總?cè)舜巍⒙糜慰偸杖?、社?huì)消費(fèi)品零售總額、人均可支配收入呈現(xiàn)高度相關(guān),貨郵吞吐量與GDP、第一產(chǎn)業(yè)GDP、第三產(chǎn)業(yè)GDP、社會(huì)消費(fèi)品零售總額、人均可支配收入呈現(xiàn)高度相關(guān)性。同時(shí),利用高度相關(guān)的指標(biāo)作為自變量構(gòu)建的回歸模型預(yù)測效果相對更好。
(2) 在4類回歸方法中,本文提出的相關(guān)性回歸、主成分回歸及逐步回歸預(yù)測效果相對更好。通過大量樣本實(shí)證發(fā)現(xiàn),不是每個(gè)回歸方法都適用于所有機(jī)場,存在僅能使用其中一種回歸方法進(jìn)行預(yù)測的情況。
(3) 回歸分析法能否實(shí)現(xiàn)有效預(yù)測與機(jī)場旅客吞吐量和貨郵吞吐量的量級(jí)息息相關(guān),機(jī)場客、貨吞吐量量級(jí)越高,可預(yù)測機(jī)場數(shù)量越多,且預(yù)測絕對誤差百分比越小。其中,當(dāng)機(jī)場旅客吞吐量超過1 000萬人次或機(jī)場貨郵吞吐量超過5萬噸時(shí),回歸分析法可預(yù)測90%以上的機(jī)場。這是因?yàn)楫?dāng)機(jī)場客、貨吞吐量發(fā)展到一定量級(jí)后,機(jī)場發(fā)展已經(jīng)逐步穩(wěn)定,如果沒有疫情、地震等隨機(jī)事件影響,機(jī)場發(fā)展將與宏觀經(jīng)濟(jì)呈現(xiàn)高度相關(guān)性,因而客、貨吞吐量與宏觀指標(biāo)之間的回歸預(yù)測效果更好。
(4) 從回歸分析法對203個(gè)機(jī)場客、貨吞吐量的預(yù)測效果來看,客運(yùn)可預(yù)測機(jī)場數(shù)量相對更多。這是因?yàn)闄C(jī)場航空客運(yùn)發(fā)展主要由當(dāng)?shù)匦枨筘暙I(xiàn),貨運(yùn)發(fā)展除本地貨源,還靠周邊集散貨物提振,因此航空貨運(yùn)發(fā)展主要聚焦在大型樞紐機(jī)場,多數(shù)機(jī)場貨運(yùn)發(fā)展長期處于較低量級(jí),與當(dāng)?shù)亟?jīng)濟(jì)相關(guān)性較弱,回歸分析法預(yù)測效果相對較差。