張啟凡 王永忠 王圣堂 裴柯欣
(中國民用航空飛行學院空中交通管理學院 廣漢 618300)
受到管制、天氣等因素的影響,航班延誤的情況時有發(fā)生。由于造成航班延誤有很多潛在且不確定的因素,所以目前還未有有效的方法可以避免航班的大面積延誤。因此,對于航班延誤時長的預測可以為管制放行的決策提供指導。國內(nèi)外學者根據(jù)航班延誤中的不確定因素,建立了諸多模型[1~7]并對其進行大量的預測研究。
研究表明航班延誤中天氣因素大約占到65%,本文基于前人的研究,主要基于氣象數(shù)據(jù)并考慮包括氣候、季節(jié)、交通需求在內(nèi)的周期性因素對航班延誤時長的影響[8],通過對歷史數(shù)據(jù)的分析,建立考慮周期性波動因素的神經(jīng)網(wǎng)絡模型,用于未來時間內(nèi)航班延誤時長的預測。
本文所選取的氣象數(shù)據(jù)采集于航空例行天氣報告(METAR),報文來源于 INPE's BDM website。依據(jù)METAR報文中各氣象要素的編碼格式和氣象電報術語對報文進行解析。
1)利用正則表達式按各氣象要素的編碼格式從METAR中提取:時間、地面風向、風速、云底高、云量、修正海壓、溫度、露點溫度、能見度信息;
2)風向為“0~“360”,將報文中顯示風向多變的數(shù)據(jù)標注為“720”;能見度顯示“9999”或缺失均標注為“9999”。
本文根據(jù)巴西國家民航局(ANAC)提供的數(shù)據(jù)選取2018年巴西圣保羅瓜魯柳斯國際機場的離港航班數(shù)據(jù)5560條。由于本文主考周期性因素以及氣象因素對單航班延誤時長的影響,因此選取航司ID、航班號、航班離港日期、航班離港時間,作為數(shù)據(jù)集的描述性變量特征;選取航班出發(fā)的月份數(shù)據(jù),對其依據(jù)四個季度進行虛擬變量的建立,將其從事件類型變量轉(zhuǎn)換為定量變量;選取單航班離港延誤時長作為目標變量特征。
本文基于機場單航班離港延誤數(shù)據(jù)進行預測,依據(jù)航班離港日期和時間對航班運行數(shù)據(jù)和氣象數(shù)據(jù)進行融合,得到單航班延誤時長的數(shù)據(jù)集。對數(shù)據(jù)中含有空缺值的數(shù)據(jù)進行刪除。本文主要對延航班誤特性進行分析研究,因此選取延誤數(shù)據(jù)與正常運行數(shù)據(jù)組合訓練數(shù)據(jù)集并剔除其他不相關數(shù)據(jù)。
RBF神經(jīng)網(wǎng)絡是兩層前饋網(wǎng)絡,其隱藏層不是傳統(tǒng)的神經(jīng)網(wǎng)絡層,隱層的功能是將輸入向量的非線性可分離集轉(zhuǎn)換為線性可分離集[9]。隱藏層的每一個神經(jīng)元需計算輸入數(shù)據(jù)到代表神經(jīng)元聚類中心的距離,找到RBF作為激勵函數(shù)的輸入與聚類中心的距離r。第二層是一個簡單的前饋層,網(wǎng)絡輸出由隱含層的輸出結(jié)果經(jīng)感知神經(jīng)元或ADA?LINE線性加權輸出[10]。最常用的徑向基函數(shù)是高斯核函數(shù),形式為
其中xc為核函數(shù)中心,σ為函數(shù)的寬度參數(shù),控制了函數(shù)的徑向作用范圍。
xk為第k個輸入樣本,cj為第j個中心點,m為隱含層的結(jié)點數(shù),n是輸出的樣本數(shù)[11]??傻玫骄W(wǎng)絡的輸出為
Poggio和Girosi已經(jīng)證明,RBFNN是連續(xù)函數(shù)的最佳逼近,而非BPNN。
為證明周期波動因素影響的存在,圖1為四個季度單航班平均延誤時長。可以看出四個季度的航班延誤時長分布并非呈現(xiàn)平滑趨勢,而呈明顯波動趨勢。所以考慮周期性變量對預測結(jié)果有重要的影響。
圖1 航班平均延誤時長周期分布
考慮周期性因素的模型中RBF輸入神經(jīng)元節(jié)點數(shù)為數(shù)據(jù)集中的定量變量與虛擬變量個數(shù)共13個變量分別為一季度、二季度、三季度、四季度、第一層云類型、風向、風速、云底高、云量、QNH溫度、露點溫度、能見度,未考周期性因素的模型中則只輸入定量變量即輸入層神經(jīng)元節(jié)點數(shù)為9;隱單元神經(jīng)元節(jié)點數(shù)設置為50;選擇高斯核函數(shù)作為激勵函數(shù);輸出神經(jīng)元節(jié)點數(shù)為1,對應變量為離港航班延誤時長。
模型經(jīng)運行后得到仿真結(jié)果如圖2~3所示,圖2為未考慮周期性波動因素的仿真結(jié)果,圖3為考慮周期性因素后的仿真結(jié)果。
圖2 RBFNN仿真結(jié)果
圖3 RBFNN考慮周期性因素仿真結(jié)果
為驗證模型延誤時長預測的準確度,用延誤時長容差準確性來評價模型的準確度得到結(jié)果如表1所示。
表1 RBFNN仿真結(jié)果評價
改進后的模型在三個容差范圍內(nèi)均有較高的準確性,說明航班的延誤時長是會受到包括氣候、季節(jié)、交通需求等因素在內(nèi)的周期性波動影響。
本文在研究過程中同時還采用了BP神經(jīng)網(wǎng)絡和小波神經(jīng)網(wǎng)絡進行了仿真實驗,用以進行模型準確度的對比和最優(yōu)模型的驗證。
小波神經(jīng)網(wǎng)絡的結(jié)果基于小波理論,其因隱藏層激勵函數(shù)采用小波函數(shù),所以其學習能力和精確度較高,選用Morlet作為激勵函數(shù),若輸入層、隱含層、輸出層節(jié)點數(shù)為h、k、n,輸入和輸出集分別為x=[x1,x2,…,xk]T、y(x)=[y1,y2,…,ym]T,得到小波神經(jīng)網(wǎng)絡的隱單元表達式為
式中,aj、bj分別表示小波神經(jīng)網(wǎng)絡的伸縮和平移參數(shù),wi,j、wj,h分別表示輸入單元到隱單元的權重值、隱單元到輸出的權重值。
小波神經(jīng)網(wǎng)絡輸出層表達式為
BP神經(jīng)網(wǎng)絡在預測時為三層網(wǎng)絡,其中輸入層節(jié)點個數(shù)為自變量個數(shù),隱單元節(jié)點數(shù)為60,隱含層函數(shù)tansig[12],輸出層函數(shù) purelin[13],學習率設置為0.001,gaol為0.0001,最大迭代次數(shù)1000次。小波神經(jīng)網(wǎng)絡在預測時隱單元節(jié)點數(shù)為30,隱單元為Morlet核函數(shù),學習率[14]設置為0.001,最大迭代次數(shù)1000。
模型經(jīng)運行后得到仿真結(jié)果如圖4~5所示,圖4為BPNN未考慮周期性波動因素的仿真結(jié)果,圖5為考慮周期性因素后的仿真結(jié)果。
圖4 BPNN仿真結(jié)果
圖5 BPNN考慮周期性因素仿真結(jié)果
圖6為WNN未考慮周期性波動因素的仿真結(jié)果,圖7為考慮周期性因素后的仿真結(jié)果。
圖6 WNN仿真結(jié)果
圖7 WNN考慮周期性因素仿真結(jié)果
同樣,用延誤時長容差準確性來評價模型的準確度得到結(jié)果如表2所示。
表2 BPNN及WNN仿真結(jié)果評價
從上表可以看出小波神經(jīng)網(wǎng)絡的精確度高于BP神經(jīng)網(wǎng)絡,且采用考慮周期因素后的模型的準確度均有提升。RBF神經(jīng)網(wǎng)絡的預測精確度最高,同時本文還將改進后RBF的神經(jīng)網(wǎng)絡模型的仿真結(jié)果與文獻[7]中彈性神經(jīng)網(wǎng)絡的仿真結(jié)果進行了對比,本文模型在容差(±3min)內(nèi)的準確率為91%高于文獻[7]仿真結(jié)果83.954%。
本文通過繪制延誤時長周期分布圖,發(fā)現(xiàn)延誤時長并非呈平滑趨勢而會受到包括交通需求、氣候、季節(jié)在內(nèi)的周期性因素波動的影響。利用RBF神經(jīng)網(wǎng)絡建立仿真模型,輸入經(jīng)篩選后的定量變量與周期虛擬變量共13個。運行得到仿真結(jié)果,±10min、±5min、±3min容差內(nèi)延誤時長預測準確率分別為98%、94%、91%,相較于未考慮周期性波動因素模型表現(xiàn)出較高的準確性。小波神經(jīng)網(wǎng)絡和BP神經(jīng)網(wǎng)絡在考慮周期性波動因素后準確度也得到提升,但模型預測準確度遠不及RBF神經(jīng)網(wǎng)絡。此外,因數(shù)據(jù)樣本的關系,本文未過多考慮管制因素的影響,后續(xù)的研究中可以進一步地挖掘相關因素從而再次提升模型預測的準確度。