張培文,杜福民,汪瑜*
(1.中國民用航空飛行學(xué)院,經(jīng)濟(jì)與管理學(xué)院,四川廣漢 618307;2.西南財經(jīng)大學(xué),統(tǒng)計學(xué)院,成都 611130)
探索中小機(jī)場航線選擇的影響因素,揭示中小機(jī)場航線選擇規(guī)律,是研究中小機(jī)場航線連接機(jī)制的重要內(nèi)容。截止到2020年底,我國民用運輸機(jī)場數(shù)量達(dá)到241 個,但年旅客吞吐量不足200 萬人次的中小機(jī)場數(shù)量占全部機(jī)場總數(shù)的近80%,其吞吐量僅為機(jī)場總量的10%。年旅客吞吐量超過1000 萬人次的大型繁忙機(jī)場數(shù)量僅占機(jī)場總數(shù)的11%,其吞吐量卻占機(jī)場總量的70%。在中小機(jī)場和大型機(jī)場之間發(fā)展極不平衡的形勢下,探索中小機(jī)場發(fā)展普遍困境,提高其航線選擇和網(wǎng)絡(luò)布局的合理性,對于改善我國航線網(wǎng)絡(luò)的通達(dá)性,充分發(fā)揮運輸網(wǎng)絡(luò)的運行效率和效益,以及實現(xiàn)中國民航局“十四五”時期“一二三三四”戰(zhàn)略有著重要的現(xiàn)實意義。
國內(nèi)外學(xué)者對網(wǎng)絡(luò)連接機(jī)制從不同角度進(jìn)行了研究,Barabási 等[1]最早提出了一種基于優(yōu)先連接機(jī)制的無標(biāo)度網(wǎng)絡(luò)演化模型(BA模型),王杰等[2]利用改進(jìn)的BA模型分析了不同規(guī)模海運網(wǎng)絡(luò)的演化機(jī)制情況。但不同網(wǎng)絡(luò)機(jī)制之間的優(yōu)劣性難以判斷,因而鏈路預(yù)測的出現(xiàn)為網(wǎng)絡(luò)連接機(jī)制提供了統(tǒng)一且公平的比較方法。在航空網(wǎng)絡(luò)中,劉宏鯤等[3]比較了多種節(jié)點屬性接近性因素,指出第三產(chǎn)業(yè)產(chǎn)值對航線網(wǎng)絡(luò)演化機(jī)制影響較大;馮霞等[4]同時考慮航線網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)和節(jié)點屬性兩類特征,提出基于鏈路預(yù)測的未來新增航線發(fā)現(xiàn)模型;Takahashi等[5]從航線網(wǎng)絡(luò)不同結(jié)構(gòu)接近性的角度,評估了各種鏈接預(yù)測方法之間的相對預(yù)測精度;Najari等[6]探討了多層航空網(wǎng)絡(luò)層間結(jié)構(gòu)的接近性并對層間節(jié)點進(jìn)行連接可能性預(yù)測。以上研究對航線網(wǎng)絡(luò)連接機(jī)制的探討多針對整體網(wǎng)絡(luò),而中小機(jī)場在整體網(wǎng)絡(luò)中的地位處于弱勢特征,未能關(guān)注到中小機(jī)場在航線網(wǎng)絡(luò)中的連接機(jī)制問題,對預(yù)測結(jié)果也缺乏實際驗證與應(yīng)用。
本文考慮影響中小機(jī)場航線連接的外生屬性,同時選取網(wǎng)絡(luò)的結(jié)構(gòu)性特征作為內(nèi)生因素,比較內(nèi)外影響因素的鏈路預(yù)測精確度,確定不同因素對航線連接的影響程度,并選取精確度高的內(nèi)外因素進(jìn)行多因素耦合預(yù)測,驗證耦合算法的有效性并進(jìn)行實際驗證,以期更為全面且有針對性地挖掘中小機(jī)場的重要連接機(jī)制。
本文航線數(shù)據(jù)來源于2019年民航局公布的夏秋航季全國航班計劃總表,以連接中小機(jī)場的航線為邊構(gòu)建出無向的中小機(jī)場航線網(wǎng)絡(luò)。對吞吐量高于200 萬人次的多機(jī)場城市的航班數(shù)據(jù)進(jìn)行合并,數(shù)據(jù)不包含港澳臺地區(qū)。數(shù)據(jù)經(jīng)處理后判別出中小機(jī)場159 個,與中小機(jī)場相連的航線1588 條,網(wǎng)絡(luò)共包含224個機(jī)場。
令V為點集,E為邊集,則生成的中小機(jī)場航線網(wǎng)絡(luò)可表示為G(V,E),同時所有節(jié)點對的全集為對于一種鏈路預(yù)測算法,為所有未產(chǎn)生航線連接的節(jié)點對(x,y)賦予分?jǐn)?shù)值vxy,這種分?jǐn)?shù)值可視為一種接近性,分?jǐn)?shù)值越高的節(jié)點對連接可能性越大。為檢驗算法的準(zhǔn)確性,將邊集E隨機(jī)分為訓(xùn)練集ET以及測試集EP,數(shù)據(jù)集滿足于E=ET∪EP,ET∩EP=?[7],前者主要作為已知信息計算分?jǐn)?shù)值,后者用以連邊測試。
中小機(jī)場航線網(wǎng)絡(luò)是一個整體,因而從預(yù)測的完整性角度考慮,本文選取從全局角度衡量預(yù)測算法精確度的AUC(Area Under Curve)指標(biāo)評價算法的準(zhǔn)確性。其基本原理為:一種接近性算法經(jīng)過訓(xùn)練后可以得到網(wǎng)絡(luò)中所有節(jié)點對間的接近性矩陣,然后利用AUC 指標(biāo)以網(wǎng)絡(luò)中不存在的邊為基準(zhǔn),每次隨機(jī)選擇不存在邊的接近性值與EP中的邊進(jìn)行比較。若EP中選擇的邊分值更高則記1 分,分值相等則記0.5 分,小于則不記分。顯然抽取次數(shù)越多,得到的AUC越精確。在進(jìn)行m次比較以后,若有m1次記1分,m2次記0.5分,則AUC的具體測度定義為
其中,若所有分?jǐn)?shù)均隨機(jī)產(chǎn)生,則AUC≈0.5,當(dāng)AUC=1 時,表示算法準(zhǔn)確預(yù)測出所有結(jié)果。因而AUC 大于0.5 時算法便具備一定可行性,接近1的程度則反映出當(dāng)前預(yù)測算法的準(zhǔn)確性。此外,ET的選取比例也會影響AUC計算結(jié)果,一般ET劃分比例越高,AUC值越大。因而本文判別當(dāng)ET∶EP=9∶1時,AUC對不同算法的預(yù)測精確度評價情況。
中小機(jī)場發(fā)展好壞受自身、社會、經(jīng)濟(jì)等因素的影響,以上因素可以構(gòu)成中小機(jī)場航線網(wǎng)絡(luò)的外生屬性。在獲得節(jié)點相關(guān)數(shù)據(jù)的情況下,從節(jié)點屬性角度進(jìn)行鏈路預(yù)測同樣值得關(guān)注。本文選取機(jī)場間航距反映其連接屬性,以機(jī)場的起降架次反映其自身屬性,以機(jī)場所在城市的人口數(shù)量、第三產(chǎn)業(yè)產(chǎn)值反映其社會、經(jīng)濟(jì)屬性,4種外生屬性接近性指標(biāo)具體如下。
(1)航距(Flight distance,Fld)的接近性
航距對航線網(wǎng)絡(luò)的連接有著明顯影響,航線的數(shù)量會隨著航距的增加逐漸上升,當(dāng)航距達(dá)到某一值后,航線的數(shù)量又逐漸減少[3]。但航線兩端機(jī)場的連接可能性并不能僅以現(xiàn)實航線數(shù)量分布進(jìn)行考慮,為了分析航線的航距與航線連接的可能性之間的關(guān)系,本文對中小機(jī)場航線網(wǎng)絡(luò)中所有節(jié)點間的連接按距離進(jìn)行統(tǒng)計,以真實存在的不同航距的航線數(shù)量與該航距下總的航線數(shù)量的比值作為連接率,并對連接率分布趨勢進(jìn)行擬合,擬合曲線如圖1所示,擬合優(yōu)度為0.9757,表明該曲線能夠較好地反映航距對機(jī)場間連接可能性的影響。由于航距低于200 km 的航線數(shù)量極少,故未對其進(jìn)行擬合。從航距角度用擬合函數(shù)將其接近性定義為
圖1 不同航距航線連接率擬合曲線Fig.1 Fitting curve of connection rate of routes with different distances
式中:F(x,y)為機(jī)場x與機(jī)場y的航距。
(2)起降架次(Sortie,Sor)的接近性
機(jī)場的起降架次能反映其繁忙程度,是機(jī)場業(yè)務(wù)量的重要統(tǒng)計特征之一。一般而言,起降架次高的機(jī)場能獲得更高的客運或貨郵吞吐量,越能吸引其他機(jī)場的連接,新增的航線也就越多,使得機(jī)場的整體連通性獲得提升,而連通性的提升又反過來使得機(jī)場更為繁忙,最終產(chǎn)生“強(qiáng)者越強(qiáng)”的現(xiàn)象。這種“強(qiáng)者越強(qiáng)”的連接現(xiàn)象,可以通過一個優(yōu)先連接模型描述起降架次的接近性[8],即
式中:n為機(jī)場數(shù)量;Sx為機(jī)場x的起降架次數(shù)量;Sy為機(jī)場y的起降架次數(shù)量;Sn為n個機(jī)場的起降架次數(shù)量。式(3)表示兩機(jī)場在起降架次因素影響下相互選擇的概率,在本文鏈路預(yù)測方法中指起降架次的接近性。
(3)人口數(shù)量(Population,Popu)的接近性
在使用航空出行概率相同的情況下,每個目的城市都有相同幾率被選擇,機(jī)場所在城市的人口數(shù)量越多,則兩城市間的人員流動密度越高。人口數(shù)量同樣具有“強(qiáng)者越強(qiáng)”的特征,因而人口數(shù)量的接近性表示為
式中:Px為機(jī)場x所在城市的人口數(shù)量;Py為機(jī)場y所在城市的人口數(shù)量;Pn為n個機(jī)場所在城市的人口數(shù)量。本文所使用的城市人口數(shù)據(jù)為年平均人口,人口及下文的第三產(chǎn)業(yè)產(chǎn)值數(shù)據(jù)均來源于《中國城市統(tǒng)計年鑒2020》。
(4)第三產(chǎn)業(yè)產(chǎn)值(Tertiary Industry,TI)的接近性
由于航空運輸與服務(wù)業(yè)息息相關(guān),同時已有研究從城市GDP以及第三產(chǎn)業(yè)的接近性角度研究了整體航空網(wǎng)絡(luò)的預(yù)測性,發(fā)現(xiàn)第三產(chǎn)業(yè)的接近性更好[3],因此從中小機(jī)場航線網(wǎng)絡(luò)中機(jī)場所在城市的第三產(chǎn)業(yè)角度建立網(wǎng)絡(luò)連接的接近性模型,即
式中:Tx為機(jī)場x所在城市的第三產(chǎn)業(yè)產(chǎn)值;Ty為機(jī)場y所在城市的第三產(chǎn)業(yè)產(chǎn)值;Tn為n個機(jī)場所在城市的第三產(chǎn)業(yè)產(chǎn)值。
網(wǎng)絡(luò)中兩個節(jié)點是否連接除受自身屬性影響外,網(wǎng)絡(luò)結(jié)構(gòu)特征也是重要影響因素,因而有必要從網(wǎng)絡(luò)結(jié)構(gòu)信息角度進(jìn)行發(fā)掘。從網(wǎng)絡(luò)結(jié)構(gòu)信息角度定義的接近性,一般稱為結(jié)構(gòu)接近性,本文指網(wǎng)絡(luò)內(nèi)生因素的接近性。一種結(jié)構(gòu)接近性能否很好地抓住網(wǎng)絡(luò)的結(jié)構(gòu)特征,決定了該結(jié)構(gòu)接近性最終鏈路預(yù)測精度的好壞?,F(xiàn)有研究發(fā)現(xiàn),一個網(wǎng)絡(luò)的集聚系數(shù)小于閾值0.1 時,基于全局信息的接近性算法預(yù)測效果較好[9]。對中小機(jī)場航線網(wǎng)絡(luò)的結(jié)構(gòu)特征參數(shù)進(jìn)行統(tǒng)計,結(jié)果如表1所示,可以發(fā)現(xiàn),其集聚系數(shù)未達(dá)到0.1,故從全局信息接近性研究中小機(jī)場航線網(wǎng)絡(luò)的鏈路連接機(jī)制是本文的主要角度。本文按上述算法的類別,選用以下4種典型算法探究中小機(jī)場連接機(jī)制。
表1 中小機(jī)場航線網(wǎng)絡(luò)結(jié)構(gòu)特征參數(shù)統(tǒng)計Table 1 Statistics of characteristic parameters of small and medium-sized airports network
(1)優(yōu)先連接(Preferential Attachment,PA)
PA指標(biāo)主要是從兩個節(jié)點度值的乘積角度定義兩節(jié)點間的接近性,也就是各節(jié)點度值越高則相互連接的可能性越大。應(yīng)用優(yōu)先連接方法可以產(chǎn)生無標(biāo)度的網(wǎng)絡(luò)結(jié)構(gòu),而中小機(jī)場航線網(wǎng)絡(luò)度值分布符合冪律特征,PA 指標(biāo)可表示機(jī)場節(jié)點度值與網(wǎng)絡(luò)連接性的關(guān)系,公式為
式中:Kx為節(jié)點x的度值;Ky為節(jié)點y的度值。
(2)局部路徑(Local Path,LP)
局部路徑是考慮網(wǎng)絡(luò)三階路徑的基礎(chǔ)上提出的接近性指標(biāo),表示為
式中:α為可變參數(shù);A為網(wǎng)絡(luò)的鄰接矩陣;A3xy為兩節(jié)點間路徑長度為3 的數(shù)量。此處局部路徑是3 階路徑,在其基礎(chǔ)上也可以擴(kuò)展到更高階路徑的情形,但隨著階數(shù)增加,指標(biāo)的計算復(fù)雜性會越高。
(3)平均通勤時間(Average Commute Time,ACT)
對于一個隨機(jī)游走粒子,由節(jié)點x至節(jié)點y的平均步數(shù)為m(x,y),則兩節(jié)點間的平均通勤時間可表示為n(x,y)=m(x,y)+m(y,x)。n(x,y)可通過求解網(wǎng)絡(luò)的拉普拉斯矩陣L(L=D-A)的偽逆L+得到,其中,D為網(wǎng)絡(luò)的度矩陣。于是平均通勤時間的接近性可以理解為兩節(jié)點的通勤時間越小,節(jié)點間越接近,表示為
式中:l+xx為矩陣L+中第x行y列所在位置的元素。
(4)重啟隨機(jī)游走(Random Walk with Restart,RWR)
若一個隨機(jī)游走粒子每走一步都有可能以概率c返回其初始位置。粒子從節(jié)點x處走到節(jié)點y處的概率可用網(wǎng)絡(luò)的馬爾科夫概率轉(zhuǎn)移矩陣表示,其中,kx為粒子在節(jié)點x處的狀態(tài)向量,若兩節(jié)點相連則axy=1,反之為0[7]。某粒子在初始節(jié)點x處,在下一時刻到達(dá)網(wǎng)絡(luò)中任一節(jié)點的概率向量為
式中:t為時間;PT為概率轉(zhuǎn)移矩陣的轉(zhuǎn)置;ex為初始狀態(tài)。求得式(9)的穩(wěn)態(tài)解為
于是可將重啟隨機(jī)游走接近性的定義為
式中:πxy為由節(jié)點x出發(fā)最終到達(dá)節(jié)點y的概率。
中小機(jī)場航線網(wǎng)絡(luò)中224 個節(jié)點處于全聯(lián)通狀態(tài)時,邊數(shù)為24976條,當(dāng)前未知連邊數(shù)為23388條。在保證訓(xùn)練集連通性的情況下,訓(xùn)練集劃分比例為90%,測試集劃分比例為10%,測試邊數(shù)量為159條。在進(jìn)行AUC計算時,一般采用抽樣的方式節(jié)省計算時間,本文抽樣次數(shù)為300000次,計算出300000次抽樣時實驗的AUC值。此外,設(shè)LP指標(biāo)中可變參數(shù)α=0.5,RWR 指標(biāo)中粒子返回概率c=0.1。由前文所述外生與內(nèi)生因素接近性算法,進(jìn)行鏈路預(yù)測,最終求得的預(yù)測精確度AUC如表2所示。
表2 8種接近性算法預(yù)測精確度Table 2 Prediction accuracy of eight proximity algorithms
由表2可以看出,在中小機(jī)場航線網(wǎng)絡(luò)連接的外生影響因素中,機(jī)場的自身屬性也就是起降架次的預(yù)測精確度值最高為0.8413,其次是機(jī)場所在城市的第三產(chǎn)業(yè)產(chǎn)值,預(yù)測精確度為0.7981。表明在中小機(jī)場航線網(wǎng)絡(luò)中,機(jī)場的起降架次相較于其他外部因素是影響機(jī)場間是否連接的重要因素,機(jī)場自身因素對航線的連接決定性更大。此外,對4種內(nèi)生因素而言,其接近性指標(biāo)的預(yù)測精度均高于除起降架次以外的外生屬性指標(biāo),其中基于局部路徑的接近性預(yù)測精確度最高為0.9052。由于中小機(jī)場航線網(wǎng)絡(luò)的結(jié)構(gòu)特征不同于整體航線網(wǎng)絡(luò),其集聚系數(shù)較小使得從網(wǎng)絡(luò)路徑的角度進(jìn)行鏈路預(yù)測更能符合網(wǎng)絡(luò)的結(jié)構(gòu)特征,同時基于隨機(jī)游走過程的平均通勤時間與重啟隨機(jī)游走全局信息算法預(yù)測精確度也略好于局部信息優(yōu)先連接算法,再次表明,網(wǎng)絡(luò)路徑的結(jié)構(gòu)接近性更適合于中小機(jī)場航線網(wǎng)絡(luò)的鏈路預(yù)測。總體來看,網(wǎng)絡(luò)內(nèi)生因素的結(jié)構(gòu)接近性預(yù)測效果整體好于外生屬性的接近性,從網(wǎng)絡(luò)路徑的角度進(jìn)行預(yù)測效果較為理想,挖掘小機(jī)場網(wǎng)絡(luò)內(nèi)部的結(jié)構(gòu)信息更有利于預(yù)測網(wǎng)絡(luò)的連接情況。
網(wǎng)絡(luò)中節(jié)點的連接與否絕不是單個因素決定的,有必要進(jìn)一步耦合不同類型的接近性,以綜合分析網(wǎng)絡(luò)的連接機(jī)制。考慮到內(nèi)生因素的整體預(yù)測精確度好于外生屬性,局部路徑的接近性預(yù)測效果最好,而外生屬性中起降架次的接近性預(yù)測精確度最好,因而本文在確定起降架次與局部路徑接近性作為主要耦合因素的情況下,繼續(xù)選擇不同的內(nèi)生因素接近性進(jìn)行多因素耦合,表示為
式中:為基于網(wǎng)絡(luò)內(nèi)生因素接近性的其他3 種指標(biāo)的1 種;λ1,λ2為耦合系數(shù),λ1、λ2∈[0,1],且λ1+λ2≤1,任意λ1、λ2的取值步長為0.1。當(dāng)任一λ1、λ2取值為1 時,耦合算法回歸到系數(shù)取值為1的初始算法。為了確保耦合算法的合理性和準(zhǔn)確性,各耦合指標(biāo)的接近性矩陣參數(shù)均除以其最大值,即采取歸一化措施后進(jìn)行耦合計算。
多因素耦合算法的預(yù)測精確度如圖2所示,不同子圖展現(xiàn)了λ1、λ2取值變化對精確度變化的影響。對圖2進(jìn)行分析發(fā)現(xiàn),在不同的λ1、λ2取值情況下,各耦合算法均存在最優(yōu)值,圖2(a)、(b)均在(λ1,λ2)=(0.1,0.9)時分別取得最優(yōu)值0.90663、0.90609,而 Sor + LP + RWR 算法則在(λ1,λ2)=(0.0,0.6)取得最優(yōu)值0.9088。具體來看,對Sor+LP+PA算法而言,在λ2取值一定的情況下,λ1取值越大時精確度越高;當(dāng)λ2取值盡可能大,λ1取值盡可能小時,該耦合算法預(yù)測精確度越好,也就是精確度值整體受LP 接近性影響較大。對Sor+LP+ACT 算法而言,當(dāng)λ2取值越大,λ1取值越小時,其耦合精確度越高且波動性越小,表明LP接近性在此耦合方式中具有主導(dǎo)性。對Sor+LP+RWR算法而言,其耦合最優(yōu)值效果最好,但與Sor+LP+PA 算法精確度分布不同,在λ2取值一定的情況下,λ1的取值增加會使得預(yù)測精確度降低??傮w來看,在不同λ1、λ2取值情況下,3 種耦合算法分別有98%、98%、95%的精確度值高于各自耦合方式中單個指標(biāo)的最低值,說明耦合算法對預(yù)測精確度的提升效果較好,但在λ2取值為0 的11 種情況當(dāng)中,3 種耦合算法的精確度均處于末位,整體與λ2存在取值時有著較大差距,隨著LP接近性的加入,會使得各自精確度逐漸增加。為了進(jìn)一步展示耦合算法的預(yù)測效果,對耦合算法預(yù)測效果與原單個算法進(jìn)行比較,結(jié)果如表3所示。
圖2 耦合算法精確度變化情況Fig.2 Accuracy change of coupling algorithm
表3 耦合算法精確度統(tǒng)計Table 3 Accuracy statistics of coupling algorithm
由表3可以看出,耦合算法的精確度在各自耦合范圍內(nèi)均高于單個指標(biāo),但相較于LP 指標(biāo)精確度則提升極其有限,此外當(dāng)各耦合算法取得最優(yōu)值時,λ2取值分別為0.9、0.9、0.6,可以看出LP指標(biāo)在耦合算法中具有主導(dǎo)作用,這種單個指標(biāo)在耦合算法中起主導(dǎo)作用的現(xiàn)象在我國整體航線網(wǎng)絡(luò)[3]與能源供應(yīng)鏈網(wǎng)絡(luò)[7]中均有發(fā)現(xiàn)。盡管從精確度數(shù)值比較角度,所有耦合算法相較于LP指標(biāo)提升不明顯,但通過耦合方式對整體以及其他耦合指標(biāo)精確度的提升效果不可忽視。在單個指標(biāo)的精確度中,僅有LP指標(biāo)達(dá)到0.9以上,但通過耦合以后,3種耦合算法達(dá)到0.9 以上的精確度的情況數(shù)量分別為5、19、20,同時上文也有提到所有耦合方式均有95%以上的精確度值高于單個指標(biāo)的最低值,因此表明通過耦合的方式能提高對中小機(jī)場航線網(wǎng)絡(luò)連接可能性的預(yù)測效果。
利用節(jié)點間接近性進(jìn)行鏈路預(yù)測的一個前提是,節(jié)點間連接可能性越大則他們之間的接近性越高。在所有耦合算法當(dāng)中,Sor+LP+RWR算法最優(yōu)值較高,本文考慮以其取得最優(yōu)值時的節(jié)點間接近性作為預(yù)測結(jié)果。將此時的接近性矩陣視為節(jié)點間的連接網(wǎng)絡(luò),得到50176 組節(jié)點間接近性值,對該網(wǎng)絡(luò)進(jìn)行無向化以及去除自環(huán)處理后,得到無向的航線網(wǎng)絡(luò)全圖,共24976組接近性值。由于航線網(wǎng)絡(luò)邊集滿足于E=ET∪EP,但在該預(yù)測情況下,邊集E的各邊接近性值處于整體排序的前列。一個直觀的現(xiàn)象是,在接近性排序較高的前400條航線中,僅有9.25%的航線不屬于邊集E,這些航線也就是不存在的航線。若不存在的航線接近性值排序越靠前且高于已經(jīng)存在的航線,則表明該航線的兩機(jī)場間具有很大的連接可能性。在接近性值排序中,有2407條航線接近性值高于0.1,在整體排序中屬于連接可能性較大的航線,排除已經(jīng)存在于邊集E的1290 條航線以及40 條非中小機(jī)場航線后,共得到1077條不存在的中小機(jī)場航線,本文以該1077條連接可能性較強(qiáng)的航線作為預(yù)測航線。
對預(yù)測航線的地理空間分布進(jìn)行分析發(fā)現(xiàn),所預(yù)測的航線主要集中在東部地區(qū),內(nèi)陸的機(jī)場傾向于連接沿海地區(qū)機(jī)場。其中大多數(shù)中小機(jī)場預(yù)測連接的對象均為省會或區(qū)域中心城市,中小機(jī)場間的連接依然較少。同時,預(yù)測結(jié)果也顯示在西北地區(qū)的中小機(jī)場與內(nèi)陸連接可能性較小,這是由于連接中小機(jī)場的航線一般為中短程航線,地理距離的存在使得其新增航線連接受限,以上預(yù)測現(xiàn)象也較為符合中小機(jī)場的實際連接情況。
當(dāng)然,預(yù)測結(jié)果的好壞也離不開實際的檢驗,本文將預(yù)測結(jié)果與2020年、2021年夏秋航季的中小機(jī)場航線進(jìn)行對比,并計算了兩個年度實際新增航線的接近性值,得出相對于2019年的接近性值環(huán)比增長情況,如表4所示。2020年、2021年相較于2019年中小機(jī)場航線數(shù)量有所增加,實際新增航線數(shù)量變化較大,分別為431 條和674 條。對于命中的航線而言,其在兩個年度的實際新增航線中的占比(命中率)均達(dá)到1/3以上,2020年、2021年命中航線的接近性值相對于2019年平均增長率分別為55.4%、39.6%。對于未命中的航線而言,2020年、2021年分別有265條、428條航線的接近性值相較于2019年大幅增長,各自的平均增長率均達(dá)到300%以上,也就是這些航線的接近性值增長達(dá)到2019年的3倍以上,造成此現(xiàn)象的原因可能是這些航線連接的機(jī)場在2019年之后的網(wǎng)絡(luò)演化當(dāng)中結(jié)構(gòu)特征變化較大,如路徑數(shù)量增加、連接機(jī)場數(shù)增多等,最終影響了航線的接近性值變化。此外,相較于2019年航線的接近性值,2020年、2021年未命中航線中分別有10 條、14 條航線的接近性值降低1%左右,這類航線在未命中航線當(dāng)中占比極少且變化很小。對比命中航線及未命中航線的接近性值平均增長情況可以發(fā)現(xiàn),2020年、2021年命中航線的接近性值平均增長率較小,也就是命中航線連接機(jī)場的結(jié)構(gòu)特征較為穩(wěn)定,而未命中航線的接近性值平均增長率極大,表明在新增航線預(yù)測工作當(dāng)中機(jī)場節(jié)點的路徑及連接變化等情況會極大的影響預(yù)測命中效果。當(dāng)然,由于2020年新冠疫情的爆發(fā),疫情防控政策和航空市場低迷導(dǎo)致大量的國際航線停飛,航空公司將運力轉(zhuǎn)移到國內(nèi)航空市場,國內(nèi)航空市場受疫情防控政策影響較大,從而對新增航線的預(yù)測也產(chǎn)生一定影響,但以上結(jié)果仍然表明耦合算法能一定程度模擬中小機(jī)場航線網(wǎng)絡(luò)連接機(jī)制,具有一定實用性。
表4 預(yù)測結(jié)果對比統(tǒng)計Table 4 Comparative statistics of prediction results
本文使用鏈路預(yù)測方法,探索不同屬性或因素對中小機(jī)場航線連接影響的程度并進(jìn)行驗證,得到的主要結(jié)論如下:
(1)在單個接近性指標(biāo)中,中小機(jī)場的起降架次在外生屬性中預(yù)測效果最好,機(jī)場自身的因素對航線連接影響較大,航距、人口等環(huán)境因素則影響相對較小,而基于網(wǎng)絡(luò)路徑的LP 指標(biāo)在所有內(nèi)生因素中精確度最高,網(wǎng)絡(luò)集聚程度較低使得網(wǎng)絡(luò)路徑的構(gòu)成會極大影響節(jié)點連接情況。同時內(nèi)生因素指標(biāo)的預(yù)測精度均高于除起降架次以外的外生屬性指標(biāo),相較于中小機(jī)場網(wǎng)絡(luò)的外部因素,挖掘其網(wǎng)絡(luò)內(nèi)部的結(jié)構(gòu)信息更能預(yù)測網(wǎng)絡(luò)的連接情況。
(2)從多因素耦合算法預(yù)測精確度來看,耦合網(wǎng)絡(luò)內(nèi)外因素的預(yù)測效果優(yōu)于單個指標(biāo),LP 指標(biāo)在耦合算法中占主導(dǎo)地位,通過耦合的方式能提高中小機(jī)場航線網(wǎng)絡(luò)連接預(yù)測的精確度。
(3)預(yù)測的中小機(jī)場航線主要集中在東部地區(qū),多數(shù)中小機(jī)場依然選擇省會或區(qū)域中心城市連接,所預(yù)測的航線在后兩年的新增航線中占比均高于1/3,命中航線的接近性值變化相對較小,網(wǎng)絡(luò)結(jié)構(gòu)演化的穩(wěn)定性對預(yù)測結(jié)果有較大影響。