摘 要:針對現(xiàn)有航班延誤預(yù)測模型中僅考慮機(jī)場之間空間拓?fù)浣Y(jié)構(gòu)的缺陷,提出一種基于多圖信息融合的改進(jìn)雙動態(tài)時空圖卷積網(wǎng)絡(luò)航班延誤預(yù)測模型。首先,根據(jù)航班延誤傳播的不同空間相關(guān)性,構(gòu)建基于機(jī)場和航路的四種空間鄰接矩陣,并進(jìn)行多圖融合提供更加全面空間特征信息;其次,將多圖結(jié)構(gòu)轉(zhuǎn)換成超圖刻畫航班延誤航線之間的空間相關(guān)性,利用門控時間卷積提取其時間序列相關(guān)性,利用超圖卷積提取其空間相關(guān)性,并設(shè)計兩種特征增強(qiáng)模塊進(jìn)一步避免部分點(diǎn)和邊空間特征信息丟失現(xiàn)象。最后,以美國2009—2019年的50個機(jī)場之間航班延誤預(yù)測為例,將本模型與五個主流基線模型進(jìn)行對比,完成了消融實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,相較于其他基線模型,該改進(jìn)模型能夠更好地在該問題上擬合實(shí)際情況。
關(guān)鍵詞: 航空運(yùn)輸; 航班延誤預(yù)測; 圖卷積神經(jīng)網(wǎng)絡(luò); 超圖卷積神經(jīng)網(wǎng)絡(luò); 多圖信息融合
中圖分類號: V351 文獻(xiàn)標(biāo)志碼: A 文章編號: 1001-3695(2025)02-006-0365-06
doi: 10.19734/j.issn.1001-3695.2024.06.0282
Flight delay prediction model based on improved
dual dynamic spatial-temporal graph network
Wei Ming, Xu Ziqing, Sun Bo
(College of Air Traffic Management, Civil Aviation University of China, Tianjin 300300, China)
Abstract:This paper proposed a flight delay prediction model based on multi graph information fusion and improved dual dynamic spatial-temporal graph convolutional network to address the limitation of only considering the spatial topology structure between airports in existing flight delay prediction models. Firstly, based on the different spatial correlations of flight delay propagation, it constructed four spatial adjacency matrices based on airports and routes, and performed multi graph fusion to provide more comprehensive spatial feature information. Secondly, it transformed the multi graph structure into a hypergraph to depict the spatial correlation between flight delays. It used gated time convolution to extract its time series correlation, while hypergraph convolution was used to extract its spatial correlation. This paper designed two feature enhancement modules to further avoid the loss of some point and edge spatial feature information. Finally, taking the prediction of flight delays between 50 airports in the United States from 2009 to 2019 as an example," it presented the true and predicted deviations of different airport sizes, and time steps. This model was compared with five mainstream baseline models and ablation experiments were conducted. The experimental results show that compared to other baseline models, the improved model in this paper can better fit the actual situation on this issue.
Key words:air transportation; flight delay prediction; graph convolution network; hyper graph convolution network; multi graph information fusion
0 引言
航班延誤是指航班實(shí)際降落時間比計劃降落時間延遲15 min以上的情況,與天氣原因、交通管制、機(jī)械故障等因素相關(guān),決定了空管和機(jī)場的服務(wù)水平、航空公司的運(yùn)行效率和服務(wù)質(zhì)量、旅客出行滿意度。一個特定機(jī)場的大面積航班延誤必然引起相關(guān)聯(lián)機(jī)場的銜接航班也被延誤。隨著空中交通流量的迅速增長,引起空域資源供需時空分布失衡加劇,必然經(jīng)常產(chǎn)生航班延誤。因此,亟待實(shí)現(xiàn)航班延誤時空分布特征的精細(xì)化預(yù)測,據(jù)此建立多方聯(lián)動機(jī)制和應(yīng)急資源調(diào)度,從而減少因航班延誤給各個利益相關(guān)方帶來的損失[1,2]。
當(dāng)前航班延誤預(yù)測的研究一般都是基于時間序列數(shù)據(jù),主要分為單機(jī)場的時間序列預(yù)測[3~9]和多機(jī)場的時空相關(guān)性預(yù)測[10~17]兩大類。在單機(jī)場的時間序列預(yù)測方面,可以進(jìn)一步分為單輸入單輸出[3]、多輸入單輸出[4~6]、多輸入多輸出[7~9],一般采用回歸模型[3~5]、各種機(jī)器學(xué)習(xí)[6~8]和深度學(xué)習(xí)方法[9],研究相對成熟,具體包括:Tu等人[3]構(gòu)建了一個戰(zhàn)略性的起飛延誤預(yù)測模型,利用混合分布的方法去估計殘差;Wesonga等人[4]利用多因素邏輯模型來預(yù)測飛機(jī)起飛和抵達(dá)的每日概率延遲;程華等人[5]構(gòu)建了基于C4.5決策樹的航班延誤預(yù)測模型,并證明其優(yōu)于貝葉斯方法的預(yù)測結(jié)果;王維莉等人[6]利用最大相關(guān)-最小冗余算法結(jié)合機(jī)器學(xué)習(xí)方法進(jìn)行航班延誤預(yù)測;Lambelho等人[7]使用LightGBM預(yù)測飛行延誤,證明其性能優(yōu)于支持向量機(jī)、隨機(jī)樹和多元線性回歸等方法;Guo等人[8]基于北京機(jī)場的數(shù)據(jù),將隨機(jī)森林和最大信息系數(shù)相結(jié)合來預(yù)測航班起飛延誤;Yu等人[9]利用深度置信網(wǎng)絡(luò)來預(yù)測高維數(shù)據(jù)中的機(jī)場航班延誤問題。在多機(jī)場的時空相關(guān)性預(yù)測方面,一般采用圖卷積網(wǎng)絡(luò)[10,12,14~16]、注意力機(jī)制[13、14,17]等,具體包括:Li等人[10]提出了一個CNN-LSTM深度學(xué)習(xí)框架來處理飛行延誤預(yù)測的時空相關(guān)性和外在特征;Li等人[11]首先利用復(fù)雜網(wǎng)絡(luò)理論提取航路網(wǎng)中的空間特征,再利用LSTM提取時間特征,最后利用隨機(jī)森林進(jìn)行航班延誤預(yù)測;Cai等人[12]提出了一種用于多機(jī)場航班延誤預(yù)測的地理和運(yùn)算圖卷積網(wǎng)絡(luò),通過圖中的地理和操作時空交互提高了節(jié)點(diǎn)特征表示能力;Bao等人[13]設(shè)計一種融合注意力機(jī)制的航空網(wǎng)絡(luò)航班延誤多步前進(jìn)圖序列學(xué)習(xí)預(yù)測方法;劉曉琳等人[14]提出一種將自適應(yīng)圖與時空注意力相結(jié)合的航班延誤時空演變預(yù)測模型;姜雨等人[15]利用時空圖卷積網(wǎng)絡(luò)對航班延誤時空分布進(jìn)行預(yù)測;Sun等人[16]提出一個傳輸因果關(guān)系知識引導(dǎo)的擴(kuò)展圖卷積網(wǎng)絡(luò)架構(gòu),并將其應(yīng)用預(yù)測航班延誤時空傳播問題;Maged等人[17]提出一種基于注意力機(jī)制雙向長短期記憶網(wǎng)絡(luò)的航班延誤預(yù)測模型。
從現(xiàn)有研究成果可知,傳統(tǒng)的機(jī)器學(xué)習(xí)方法已經(jīng)發(fā)展得較為完善,但在航班延誤預(yù)測這一問題上,傳統(tǒng)機(jī)器學(xué)習(xí)方法存在參數(shù)量較小、難以完全學(xué)習(xí)時間特征這一缺陷。隨著傳統(tǒng)深度學(xué)習(xí)方法如CNN、RNN與LSTM的引入,可學(xué)習(xí)的參數(shù)量較小這一問題得到了改善,卻依舊存在著無法分析由航班延誤傳播帶來的機(jī)場之間的空間相關(guān)性。近年來,諸多學(xué)者將注意力轉(zhuǎn)向圖網(wǎng)絡(luò),利用該技術(shù)可以分析機(jī)場之間的空間相關(guān)性。但由上可知,現(xiàn)有利用圖網(wǎng)絡(luò)解決該問題的研究不足主要有:a)雖然現(xiàn)有的利用圖卷積模型可以處理網(wǎng)絡(luò)節(jié)點(diǎn)之間的空間特征,但是無法解決網(wǎng)絡(luò)邊之間的空間相關(guān)性,僅Sun等人[18]提出基于雙動態(tài)時空圖卷積網(wǎng)絡(luò)(dual dynamic spatial-temporal graph convolution network, DDSTGCN)的交通流預(yù)測模型可以彌補(bǔ)此缺陷,尚未被應(yīng)用在航班延誤預(yù)測領(lǐng)域;b)多數(shù)航班延誤預(yù)測深度學(xué)習(xí)模型僅考慮機(jī)場之間是否連接空間拓?fù)浣Y(jié)構(gòu),但考慮到航空網(wǎng)絡(luò)的復(fù)雜性,其會受到多方面的影響,它們之間距離、流量、時間序列和交通興趣等多維空間信息的缺失影響其模型預(yù)測精度。
綜上所述,針對現(xiàn)有航班延誤預(yù)測模型僅考慮機(jī)場之間是否連接空間拓?fù)浣Y(jié)構(gòu)的不足,提出一種基于多圖信息融合的改進(jìn)雙動態(tài)時空圖卷積網(wǎng)絡(luò)(multi-graph information merge improved DDSTGCN, MGMIDDSTGCN)航班延誤預(yù)測模型,主要工作有:a)將DDSTGCN應(yīng)用在航班延誤預(yù)測上,可以同時對機(jī)場之間以及航線之間的時間序列和空間相關(guān)性進(jìn)行處理,能夠反映銜接航線航班之間的延誤傳播特性,使得預(yù)測精度更好;b)針對傳統(tǒng)航班延誤模型僅處理機(jī)場之間的空間拓?fù)潢P(guān)系,從距離、流量、交通興趣等視角,構(gòu)建基于機(jī)場和航路的不同空間鄰接矩陣并進(jìn)行融合,空間特征信息更加全面的DDSTGCN有利于提升航班延誤預(yù)測的準(zhǔn)確性;c)針對傳統(tǒng)DDSTGCN在特征轉(zhuǎn)換部分無法結(jié)合本文所設(shè)計的不同圖結(jié)構(gòu)的缺陷,改進(jìn)DDSTGCN,設(shè)計了融合所有邊特征與點(diǎn)特征的改進(jìn)鄰接矩陣,采用解耦的輸入方法以融合不同空間特征信息、增強(qiáng)空間信息特征,進(jìn)一步避免部分點(diǎn)和邊空間特征信息丟失現(xiàn)象,從而提升預(yù)測精度。最后,通過比較本模型和五個主流基線模型在不同時間步長上預(yù)測美國50個不同機(jī)場的航班延誤水平的差異,驗(yàn)證本研究的正確性和有效性。
1 問題建模與圖結(jié)構(gòu)構(gòu)建
1.1 問題建模
為分析航空網(wǎng)絡(luò)的航班延誤傳播機(jī)理,將機(jī)場作為節(jié)點(diǎn)、機(jī)場之間的航線作為邊,建立帶權(quán)重的航空網(wǎng)絡(luò)G=(V,ε,S), 其中V是N個機(jī)場集合, ε為E條航線的集合,S∈?N×N是機(jī)場之間的空間鄰接矩陣。對航空網(wǎng)絡(luò)G,某t時刻的各個機(jī)場航班到港準(zhǔn)點(diǎn)率動態(tài)特征矩陣為Ct∈?N×D,根據(jù)過去T個時間步長的歷史航班到港準(zhǔn)點(diǎn)率Ct-T+1:t預(yù)測未來T′個時間步長的Ct+1:t+T′,它們的函數(shù)關(guān)系如下:
Ct+1:t+T′=f(Ct-T+1:t,G)(1)
1.2 圖結(jié)構(gòu)構(gòu)建
既有圖結(jié)構(gòu)一般采用機(jī)場之間是否連接拓?fù)潢P(guān)系Gr,其空間鄰接矩陣Sr如式(2)所示,無法描述更加全面的空間特征信息,如距離、流量、交通興趣等視角,不考慮這些空間特征信息的航班延誤預(yù)測效果相對較差。因此,需要構(gòu)建基于機(jī)場和航路的不同空間鄰接特征信息矩陣Sr,并進(jìn)行融合以提升航班延誤預(yù)測性能。
α0ij=1
如果機(jī)場i與j之間有航線
0
其他 (2)
其中:α0ij為Sr的各個元素。
1.2.1 基于流量關(guān)系的空間鄰接矩陣
顯然地,有銜接航線的兩個機(jī)場航班延誤可以傳播,它們的流量越大對航班延誤程度的影響越高。因此,基于流量關(guān)系圖結(jié)構(gòu)Gflow的空間鄰接矩陣Sflow如下所示:
α1ij=MinMaxScaler(Fij)
Fij≠0
0 Fij=0(3)
其中:α1ij代表Sflow中的各個元素;Fij表示機(jī)場i和j之間的航班量;MinMaxScaler表示歸一化操作函數(shù),讓Fij取值在[0,1]。
1.2.2 基于距離關(guān)系的空間鄰接矩陣
根據(jù)地理學(xué)第一定律,若任意兩個機(jī)場距離越近,其航班延誤傳播速度越快。因此,利用高斯徑向基函數(shù)構(gòu)建基于距離圖結(jié)構(gòu)Gdis的空間鄰接矩陣Sdis,如下所示:
α2ij=exp(-(dij÷1000)) α0ij∈Sr≠0
0 其他(4)
其中:α2ij代表Sdis的元素;dij表示機(jī)場i和j之間的空間距離。
1.2.3 基于時序相似性的空間鄰接矩陣
顯然地,若兩個機(jī)場的航班延誤時序數(shù)據(jù)高度相似,可以反映它們之間延誤傳播可能性大。因此,利用快速動態(tài)時間規(guī)整(FastDTW)算法計算任意兩個機(jī)場的航班延誤時序數(shù)據(jù)之間的相關(guān)性,構(gòu)建基于時序相似性圖結(jié)構(gòu)Gsim的空間鄰接矩陣Ssim,如下所示:
α3ij=MinMaxScaler(DTWij)
α0ij∈Sr≠0
0 其他 (5)
其中:α3ij代表鄰接矩陣Ssim中的元素;DTWij代表機(jī)場i和j時間序列數(shù)據(jù)計算得到的動態(tài)時間規(guī)整距離。
1.2.4 基于航空興趣點(diǎn)的空間鄰接矩陣
引入航空興趣點(diǎn)(APOI)刻畫機(jī)場對旅客出行的吸引力,主要與航線開設(shè)數(shù)量(航班吞吐量)、航班延誤時間、極端天氣(降水和能見度)四方面相關(guān)。因此,首先通過上述四個角度構(gòu)建四維APOI向量,再利用曼哈頓距離計算得到機(jī)場i與j的APOI向量之間的相似性Mij,構(gòu)建基于航空興趣點(diǎn)圖結(jié)構(gòu)GAPOI的空間鄰接矩陣SAPOI,如下所示:
α4ij=Mij
α0ij∈Sr≠0
0 其他(6)
其中:α4ij代表鄰接矩陣SAPOI中的各個元素;γi表示機(jī)場i的四維APOI向量。
2 基于MGMIDDSTGCN的航班延誤預(yù)測模型
本文MGMIDDSTGCN的結(jié)構(gòu)如圖1所示,主要包括多圖信息融合的輸入、時空處理模塊和輸出三個方面。
2.1 多圖信息融合的數(shù)據(jù)輸入
為了避免DDSTGCN僅考慮Gr的缺陷,將上述四個圖融合作為DDSTGCN的數(shù)據(jù)輸入,通過對它們進(jìn)行線性加權(quán)一個線性層,將低維度的特征數(shù)據(jù)映射到高維度,蘊(yùn)涵更加全面的機(jī)場之間距離、流量及其時序數(shù)據(jù)、交通興趣空間特征信息。因此,構(gòu)建基于多圖信息融合圖結(jié)構(gòu)Gmer的空間鄰接矩陣Smer,如下所示:
αmij=a·α1ij+b·α2ij+c·α3ij+d·α4ij(7)
a+b+c+d=1(8)
其中:αmij為Gmer中的元素;a、b、c和d分別為α1ij、α2ij、α3ij和α4ij的權(quán)重系數(shù)。
2.2 時空處理模塊
2.2.1 圖轉(zhuǎn)換與特征變換
為了能夠提取邊之間的空間信息特征,將Gmer轉(zhuǎn)換為超圖Gh=(Vh,εh,Sh)。其中:Vh為點(diǎn)集合;εh為邊集合,Sh為空間鄰接矩陣,其定義為
αhij=1
vi∈Vh,εj∈εh,vi與εj存在連接
0
其他情況(9)
其中:αhij為Sh中的元素。顯然地,Gmer的邊和點(diǎn)分別作為Gh的點(diǎn)和邊。在Gmer中必定存在一個機(jī)場有多條航線的情況,其對應(yīng)Gh必定有邊連接兩個以上的節(jié)點(diǎn)。
此外,需要將Gmer的點(diǎn)空間特征矩陣Ct∈?N×D變換到Gh上的Sh。由于超圖的節(jié)點(diǎn)是由原圖的邊轉(zhuǎn)換而來,所以在構(gòu)建超圖的特征矩陣時,應(yīng)考慮邊上的空間特征信息。因此,超圖的特征信息矩陣Cht如下所示:
f1=[(W1⊙Ssrch)Ct;(W2⊙Sdsth)Ct;Cflow](10)
f2=[(W1⊙Ssrch)Ct;(W2⊙Sdsth)Ct;Cdis](11)
Cht=f1+f2(12)
其中:W1與W2是待學(xué)習(xí)的參數(shù)矩陣;⊙表示哈達(dá)瑪積運(yùn)算;Ssrch和Sdsth表示原圖中邊的起始和結(jié)束點(diǎn);Cflow為航路網(wǎng)的流量矩陣;Cdis表示航路網(wǎng)的距離矩陣。
2.2.2 特征增強(qiáng)模塊
為避免本航班延誤預(yù)測所涉及的多個空間特征關(guān)系鄰接矩陣在單獨(dú)利用DDSTGCN時可能會造成空間信息特征缺失的不足,采用兩支分離的并行處理方式實(shí)現(xiàn)點(diǎn)和邊空間特征信息融合。其中一個分支先融合所有設(shè)計的由點(diǎn)特征構(gòu)成的空間特征關(guān)系鄰接矩陣,然后利用圖卷積提取點(diǎn)之間的輔助空間關(guān)聯(lián)信息,將其作為超圖卷積模塊的輔助輸入以補(bǔ)充超圖卷積對于點(diǎn)之間空間特征信息提取不充分的問題,提升預(yù)測效果;另一個分支是融合所有設(shè)計的由邊特征構(gòu)成鄰接矩陣,利用超圖卷積提取邊之間的空間關(guān)聯(lián)信息,將其作為圖卷積的輔助輸入以解決圖卷積對于邊之間空間特征提取不充分的問題。在該模塊的上半分支,首先利用式(13)對特征矩陣進(jìn)行池化操作,然后根據(jù)式(14)對兩個點(diǎn)特征空間鄰接矩陣Ssim與SAPOI進(jìn)行加權(quán)操作,得到融合的新空間鄰接矩陣Spoint。與原矩陣相比,以確??臻g特征關(guān)系信息的完整性。
Cp=Pooling(Ct)(13)
Spoint=0.5×Ssim+0.5×SAPOI(14)
然后,利用Li等人[19]提出的雙向擴(kuò)散圖卷積對其進(jìn)行圖卷積操作,如下所示:
S1=Spoint/rowsum(Spoint)(15)
S2=STpoint/rowsum(STpoint)(16)
GCN(Cp)=∑N-1n=0(θn,1(S1)n+θn,2(S2)n)Cp(17)
其中: θn,1、θn,2為圖卷積濾波器的參數(shù);rowsum為行的累加操作。
在該模塊的下半分支中,為確保所輸入的空間特征信息的完整性,在原來基礎(chǔ)上先利用式(18)將時間特征矩陣與邊特征進(jìn)行融合,如下所示:
Ce=(W3VsrcCt;W4VdstCt)(18)
其中:W3與W4為待學(xué)習(xí)的參數(shù)矩陣;Vsrc和Vdst為G中起始和終止節(jié)點(diǎn)的向量。
然后利用Feng等人[20]提出的超圖卷積方法進(jìn)行操作,如下所示:
W=diag(Ladp)(19)
HGCN(Ce)=∑N-1n=0((D-1/2vHWD-1eHTD-1/2Vθ)n·Cε)(20)
其中:DV和De表示節(jié)點(diǎn)度和邊度的對角矩陣;H為關(guān)聯(lián)矩陣;W為通過自適應(yīng)學(xué)習(xí)得到的邊權(quán)重; θ為待學(xué)習(xí)的參數(shù)。
2.2.3 超圖卷積模塊
使用圖2的門控時間卷積模塊提取時間特征。首先,輸入數(shù)據(jù)用兩個膨脹因果卷積的時間卷積模塊進(jìn)行處理,如式(21)所示,通過增加每層的深度去允許一個更大的感受野。
TCN(Cht)u=∑S0-1s=0f(s)Cht(u-d×s)(21)
其中:TCN(x)u為第u個時間步長的輸出; f代表卷積核;d為膨脹卷積的膨脹因數(shù);S0為一維卷積核向量f的長度。
其次,利用不同的激活函數(shù)對兩個時間卷積模塊的輸出進(jìn)行處理,并利用哈達(dá)瑪積進(jìn)行進(jìn)一步操作,如式(22)所示。
GateTCN(Cht)=tanh(TCN1(Cht))⊙σ(TCN2(Cht))(22)
其中:TCN1和TCN2是兩個不同時間的卷積模塊。
最后,將門控時間卷積模塊和圖卷積模塊得到的結(jié)果作為超圖卷積模塊的輸入,其計算方法如式(23)(24)所示。
Wh=diag(GCN(Cp))(23)
HGCN(Cht)=∑N-1n=0(D-1/2vHWD-1eHTD-1/2Vθhgcn)n·Cht(24)
2.2.4 圖卷積模塊
利用門控時間卷積提取時間特征,將其與超圖卷積得到的空間特征進(jìn)行Reshape操作,把該整合結(jié)果作為圖卷積的輸入數(shù)據(jù),其計算方法如下:
S3=Smer/rowsum(Smer)(25)
S4=STmer/rowsum(STmer)(26)
GCN(Ct)=∑N-1n=0(θn,a(S3⊙Sh1)n+θn,b(S4⊙Sh2)n+
θn,c·Softmax(relu(E1ET2)))Ct(27)
2.3 輸出模塊
通過跳躍連接對全部時空處理模塊的輸出進(jìn)行拼接,據(jù)此利用線性層通過加權(quán)獲得最終的航班延誤輸出。
3 模擬計算與結(jié)果分析
3.1 參數(shù)設(shè)置
測試數(shù)據(jù)集源自美國交通統(tǒng)計局(BTS),涉及2009—2019年的50個機(jī)場之間38 403 885條原始航班正點(diǎn)到達(dá)率記錄,每條數(shù)據(jù)的時間間隔為一天。根據(jù)美國聯(lián)邦航空局的航班延誤標(biāo)準(zhǔn),航班準(zhǔn)時為其在預(yù)計著陸時間的15 min內(nèi)著陸。在實(shí)驗(yàn)中,用過去7天的歷史航班正點(diǎn)率數(shù)據(jù)(時間步長T=7)預(yù)測未來1、2、3、7天的航班延誤水平(時間步長T′=1,2,3,7),對比預(yù)測結(jié)果偏差選取三種最常見的指標(biāo),即平均絕對誤差(MAE)、均方根誤差(RMSE)和平均絕對百分誤差(MAPE)。
實(shí)驗(yàn)環(huán)境設(shè)置包括兩方面:a)計算機(jī)配置為Intel? CoreTM i5-13600KF CPU@5.10 GHz CPU, GeForce RTX 3080 12 GB VRAM和32 GB RAM;b)算法參數(shù)設(shè)置包括初始學(xué)習(xí)率為0.001 5,學(xué)習(xí)率衰減為0.97,權(quán)重衰減為0.000 1,模型的迭代輪數(shù)為200,批量大小為32,總共擁有三個時空處理模塊。
3.2 構(gòu)造鄰接矩陣的有效性及其融合參數(shù)標(biāo)定
為了檢驗(yàn)不同鄰接矩陣構(gòu)造方式的有效性,將它們分別作為DDSTGCN模型的輸入數(shù)據(jù),在預(yù)測時間步長T′=7下的結(jié)果如表1所示。從中可知:a)Ssim、Sdis、SAPOI、Sflow好于Sr,這是因?yàn)镾r僅反映機(jī)場之間的拓?fù)浣Y(jié)構(gòu)關(guān)系,不能表示其距離、流量、航空興趣點(diǎn)等相關(guān)性,故其性能比這四種鄰接矩陣差;b)Ssim、Sdis和SAPOI三種鄰接矩陣性能相差無幾,它們稍微好于Sflow,這是因?yàn)樗鼈儚木嚯x、流量、航空興趣點(diǎn)等角度為機(jī)場航班延誤傳播預(yù)測提供不同的空間特征信息,故需要對它們進(jìn)行融合以獲取更準(zhǔn)確的航班延誤預(yù)測值。
為了實(shí)現(xiàn)四種空間鄰接矩陣的融合,采用線性加權(quán)方式,部分融合參數(shù)標(biāo)定的實(shí)驗(yàn)結(jié)果如表2所示,從中可知:若四個鄰接矩陣的權(quán)重相差很大,其預(yù)測效果較差,這是因?yàn)檫^多依賴單一鄰接矩陣會引起部分空間特征信息的缺失,故各個鄰接矩陣的權(quán)重較為相近時,其預(yù)測結(jié)果最佳。因此,Sflow、Sdis、Ssim和SAPOI的最佳權(quán)重為0.3、0.2、0.2、0.3。
3.3 基線模型的對比
在3.2節(jié)的多圖結(jié)構(gòu)融合基礎(chǔ)上,將本文MGMIDDSTGCN模型與五種主流的基線模型進(jìn)行對比,以驗(yàn)證其性能。本文選取的基線模型如下:
a)自回歸差分移動平均模型(autoregressive integrated mo-ving average model, ARIMA)[21]: 該模型通過數(shù)據(jù)的自相關(guān)性和差分的方式,提取出隱藏在數(shù)據(jù)背后的時間序列模式,然后用這些模式來預(yù)測未來的數(shù)據(jù)。
b)長短期記憶網(wǎng)絡(luò)(long short-term memory network, LSTM)[22]:通過利用三個控制開關(guān)來增強(qiáng)網(wǎng)絡(luò)的性能。
c)時空圖卷積神經(jīng)網(wǎng)絡(luò)(spatio-temporal graph convolutional network, STGCN)[23]:將圖卷積與門控線性單元相結(jié)合的模型。
d)擴(kuò)散卷積遞歸神經(jīng)網(wǎng)絡(luò)(diffusion convolutional recurrent neural network, DCRNN)[19]:將交通流的動態(tài)建模為擴(kuò)散過程,并提出擴(kuò)散卷積操作來捕獲空間依賴性。
e)圖多注意力網(wǎng)絡(luò)(graph multi-attention network, GMAN)[24]:利用時空多頭注意力機(jī)制分析時空關(guān)系。
六種模型在不同預(yù)測時間步長T′的結(jié)果如表3所示,從中可知:a)對于同一預(yù)測時間步長,它們的性能排名依次為MGMIDDSTGCN、GMAN、DCRNN、STGCN、LSTM和ARIMA;b)隨著預(yù)測時間步長變寬,任意模型的預(yù)測精度逐步下降。這是因?yàn)椋篴)ARIMA與LSTM僅擅長分析時間特征,而MGMIDDSTGCN、GMAN、DCRNN和STGCN均同時考慮時間和空間特征信息,故后四者優(yōu)于前兩者;b)GMAN、STGCN和DCRNN僅擅長處理機(jī)場之間的空間特征信息,MGMIDDSTGCN可以同時對機(jī)場之間以及航線之間的空間相關(guān)性進(jìn)行處理,鑒于任意銜接航線的航班延誤可以傳播,故本文模型優(yōu)于這三個模型。圖3為各個模型連續(xù)100天的平均值預(yù)測結(jié)果,相較于其他模型,本文模型能夠較好地擬合實(shí)際數(shù)據(jù)變化。
3.4 消融實(shí)驗(yàn)
為了在多圖融合基礎(chǔ)上驗(yàn)證改進(jìn)DDSTGCN的有效性,在改進(jìn)算法中分別取消策略A、策略B以及它們的組合策略,預(yù)測時間步長T′=1,2,3,7的消融實(shí)驗(yàn)結(jié)果如表4所示。從中可知:a)策略A將圖特征轉(zhuǎn)換到超圖時,部分邊特征信息缺失,從而導(dǎo)致航班延誤預(yù)測精度下降;b)由于策略B不能對邊和點(diǎn)特征進(jìn)行針對性提取,這引起超圖卷積和圖卷積接收到的輔助信息質(zhì)量下降,從而導(dǎo)致航班延誤預(yù)測精度也被降低。由上可知,本文的改進(jìn)算法比傳統(tǒng)DDSTGCN的預(yù)測精度提升1.12%~1.53%。
3.5 不同機(jī)場規(guī)模和淡旺季的預(yù)測效果比較驗(yàn)證
為了進(jìn)一步分析本模型在不同機(jī)場規(guī)模和淡旺季的航班延誤預(yù)測效果差異,選取了亞特蘭大機(jī)場(大流量)、勞德代爾堡機(jī)場(中流量)、圣安東尼奧機(jī)場(小流量)為研究對象,預(yù)測時間步長T′=1的結(jié)果如圖4~6所示。從中可知:機(jī)場的流量越大,其預(yù)測精度越差,這是因?yàn)槟硞€機(jī)場的航線多導(dǎo)致它與其他機(jī)場之間空間關(guān)系非常復(fù)雜,無法獲取機(jī)場之間全面空間特征信息,導(dǎo)致航班延誤預(yù)測結(jié)果有一定偏差。
同上,圖7~9是三個機(jī)場在淡、旺季的預(yù)測結(jié)果,從中可知:三個機(jī)場在旺季的預(yù)測結(jié)果均要差于在淡季的預(yù)測效果,出現(xiàn)該現(xiàn)象的原因與圖5~7相似,某個機(jī)場的旺季,航班1的空間信息比其淡季航班的空間信息復(fù)雜、難以捕捉。
4 結(jié)束語
針對現(xiàn)有航班延誤預(yù)測研究未涉及相鄰航線之間傳播空間特征信息,本文提出一種基于MGMIDDSTGCN的航班延誤預(yù)測模型,并從距離、流量、航空興趣點(diǎn)等方面構(gòu)建相應(yīng)空間鄰接矩陣,通過多圖融合提供更加全面的空間特征信息,從而獲取更好的航班延誤預(yù)測效果。此外,針對傳統(tǒng)DDSTGCN在特征轉(zhuǎn)換部分無法結(jié)合不同圖結(jié)構(gòu)的缺陷,設(shè)計了融合所有邊特征改進(jìn)鄰接矩陣、采用解耦的輸入方法融合不同空間特征信息以增強(qiáng)空間信息特征等兩種策略,并通過消融實(shí)驗(yàn)可以證明它們的性能。最后,以美國50個機(jī)場航班延誤預(yù)測實(shí)驗(yàn)驗(yàn)證了本研究的正確性和有效性。研究表明:
a)與傳統(tǒng)拓?fù)浣Y(jié)構(gòu)Sr的MAE相比,Sflow、Sdis、Ssim和SAPOI分別提升了1.97%、2.25%、2.26%、2.18%,多圖融合比它們又分別提升了2.81%、0.86%、0.58%、0.56%、0.65%,從而驗(yàn)證了本模型蘊(yùn)涵更加全面的空間特征信息,可以提升航班延誤預(yù)測性能。
b)本文模型的MAE與五種主流的基線模型GMAN、DCRNN、STGCN、LSTM和ARIMA相比,分別提升了0.79%~7.13%、1.66%~10.84%、2.51%~10.84%、3.91%~25.73%、17.4%~32.8%,從而證明本文模型同時處理機(jī)場以及航線之間空間信息有助于提升預(yù)測性能。
將MGMIDDSTGCN與其兩種改進(jìn)策略及其組合策略進(jìn)行對比,通過消融實(shí)驗(yàn)可以發(fā)現(xiàn),它們的性能可以提升0.18%~0.52%、0.27%~0.57%、1.12%~1.53%。
然而,本文的研究未考慮航班延誤的多輸入多輸出因素,如氣象、交通管制等。因此,考慮“多輸入-多輸出”航班延誤預(yù)測是未來的研究重點(diǎn)。
參考文獻(xiàn):
[1]Kim A M. The impacts of changing flight demands and throughput performance on airport delays through the great recession [J]. Transportation Research Part A: Policy and Practice, 2016, 86: 19-34.
[2]Takeichi N. Nominal flight time optimization for arrival time scheduling through estimation/resolution of delay accumulation [J]. Transportation Research Part C: Emerging Technologies, 2017, 77: 433-443.
[3]Tu Y, Ball M O, Jank W S. Estimating flight departure delay distributions—a statistical approach with long-term trend and short-term pattern [J]. Journal of the American Statistical Association, 2008, 103(481): 112-125.
[4]Wesonga R, Nabugoomu F, Jehopio P. Parameterized framework for the analysis of probabilities of aircraft delay at an airport [J]. Journal of Air Transport Management, 2012, 23: 1-4.
[5]程華, 李艷梅, 羅謙,等. 基于C4.5決策樹方法的到港航班延誤預(yù)測問題研究 [J]. 系統(tǒng)工程理論與實(shí)踐, 2014, 34(S1): 239-247. (Cheng Hua, Li Yanmei, Luo Qian, et al. Study on flight delay with C4.5 decision tree based prediction method [J]. Systems Engineering-Theory amp; Practice, 2014, 34(S1): 239-247.)
[6]王維莉, 王逸文. 基于氣象因素與特征選擇的進(jìn)港航班延誤可解釋預(yù)測研究 [J]. 交通運(yùn)輸系統(tǒng)工程與信息, 2023, 23(5): 162-171. (Wang Weili, Wang Yiwen. Explainable prediction of inbound flight delays based on meteorological factors and feature selection[J]. Journal of Transportation Systems Engineering and Information Technology, 2023, 23(5): 162-171.)
[7]Lambelho M, Mitici M, Pickup S, et al. Assessing strategic flight schedules at an airport using machine learning-based flight delay and cancellation predictions [J]. Journal of Air Transport Management, 2020, 82: 101737.
[8]Guo Zhen, Yu Bin, Hao Mengyan, et al. A novel hybrid method for flight departure delay prediction using random forest regression and maximal information coefficient [J]. Aerospace Science and Technology, 2021, 116: 106822.
[9]Yu Bin, Guo Zhen, Asian S, et al. Flight delay prediction for commercial air transport: a deep learning approach [J]. Transportation Research Part E: Logistics and Transportation Review, 2019, 125: 203-221.
[10]Li Qiang, Guan Xinjia, Liu Jinpeng. A CNN-LSTM framework for flight delay prediction [J]. Expert Systems with Applications, 2023, 227: 120287.
[11]Li Qiang, Jing Ranzhe. Flight delay prediction from spatial and temporal perspective [J]. Expert Systems with Applications, 2022, 205: 117662.
[12]Cai Kaiquan, Li Yue, Zhu Yongwen, et al. A geographical and opera-tional deep graph convolutional approach for flight delay prediction [J]. Chinese Journal of Aeronautics, 2023, 36(3): 357-367.
[13]Bao Jie, Yang Zhao, Zeng Weili. Graph to sequence learning with attention mechanism for network-wide multi-step-ahead flight delay prediction [J]. Transportation Research Part C: Emerging Technologies, 2021, 130: 103323.
[14]劉曉琳, 郭夢嬌, 李卓. 基于自適應(yīng)注意力圖卷積循環(huán)網(wǎng)絡(luò)的航班延誤組合預(yù)測方法 [J/OL]. 北京航空航天大學(xué)學(xué)報. (2023-02-28) [2024-01-20]. https://doi. org/10. 13700/j. bh. 1001-5965. 2022. 0990. (Liu Xiaolin, Guo Mengjiao, Li Zhuo. Flight delay prediction based on attention-based adaptive graph convolution-gated recurrent unit[J/OL]. Journal of Beijing University of Aeronautics and Astronautics. (2023-02-28) [2024-01-20]. https://doi. org/10. 13700/j. bh. 1001-5965. 2022. 0990.)
[15]姜雨, 陳名揚(yáng), 袁琪,等. 基于時空圖卷積神經(jīng)網(wǎng)絡(luò)的離港航班延誤預(yù)測 [J]. 北京航空航天大學(xué)學(xué)報, 2023, 49(5): 1044-1052. (Jiang Yu, Chen Mingyang, Yuan Qi, et al. Departure flight delay prediction based on spatio-temporal graph convolutional networks[J]. Journal of Beijing University of Aeronautics and Astronautics,2023,49(5):1044-1052.)
[16]Sun Mengyuan, Tian Yong, Wang Xunuo, et al. Transport causality knowledge-guided GCN for propagated delay prediction in airport delay propagation networks [J]. Expert Systems with Applications, 2024, 240: 122426.
[17]Mamdouh M, Ezzat M, Hefny H. Improving flight delays prediction by developing attention-based bidirectional LSTM network [J]. Expert Systems with Applications, 2024, 238: 121747.
[18]Sun Yanfeng, Jiang Xiangheng, Hu Yongli, et al. Dual dynamic spatial-temporal graph convolution network for traffic prediction [J]. IEEE Trans on Intelligent Transportation Systems, 2022, 23(12): 23680-23693.
[19]Li Yaguang, Yu R, Shahabi C, et al. Diffusion convolutional recurrent neural network: data-driven traffic forecasting [C]// Proc of International Conference on Learning Representations. Washington DC: ICLR, 2018.
[20]Feng Yifan, You Haoxuan, Zhang Zizhao, et al. Hypergraph neural networks [C]// Proc of AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 2019: 3558-3565.
[21]Makridakis S, Hibon M. ARMA models and the box-Jenkins metho-dology [J]. Journal of Forecasting, 1997, 16(3): 147-163.
[22]Sutskever I, Vinyals O, Le Q V. Sequence to sequence learning with neural networks [C]// Proc of the 27th International Conference on Neural Information Processing Systems. Cambridge, MA: MIT Press, 2014:3104-3112.
[23]Yu Bing, Yin Haoteng, Zhu Zhanxing. Spatio-temporal graph convolution al networks: a deep learning framework for traffic forecasting [C]// Proc of the 27th International Joint Conference on Artificial Intelligence. Freiburg: IJCAI, 2018: 3634-3640.
[24]Zheng Chuanpan, Fan Xiaoliang, Wang Cheng, et al. GMAN: a graph multi-attention network for traffic prediction [C]// Proc of AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press,2020: 1234-1241.