陳亞青,陳九龍
(1. 中國(guó)民用航空飛行學(xué)院空中交通管理學(xué)院,廣漢 618307;2. 中國(guó)民用航空飛行學(xué)院民航飛行技術(shù)與飛行安全科研基地,廣漢 618307)
隨著國(guó)內(nèi)民航業(yè)的快速發(fā)展,航空流量與日俱增,現(xiàn)有機(jī)場(chǎng)容量將無(wú)法滿足未來(lái)機(jī)場(chǎng)運(yùn)行需求,機(jī)場(chǎng)運(yùn)行效率提升面臨瓶頸。航空器著陸跑道占用時(shí)間(arrival runway occupancy time,AROT)的預(yù)測(cè)能夠有效地提升機(jī)場(chǎng)跑道運(yùn)行效率,在航空器著陸階段為管制員做出準(zhǔn)確決策和安排航空器間隔提供重要參考,實(shí)現(xiàn)安全且高效的航空器運(yùn)行。
國(guó)外學(xué)者早在上世紀(jì)就對(duì)跑道占用時(shí)間(runway occupancy time,ROT)展開了廣泛的研究。Hu 等[1]通過(guò)構(gòu)建跑道容量模型,研究了著陸航空器尾流間隔和跑道占用時(shí)間對(duì)跑道著陸吞吐量的影響程度;Spencer 等[2]基于貝葉斯回歸算法對(duì)AROT 進(jìn)行預(yù)測(cè),將平均預(yù)測(cè)誤差控制在4.3 秒內(nèi),提升了預(yù)測(cè)精度;Lim 等[3]基于數(shù)據(jù)驅(qū)動(dòng)的方法對(duì)跑道占用時(shí)間的影響因素進(jìn)行分析,發(fā)現(xiàn)更小的最后進(jìn)近速度和更優(yōu)的下滑角能夠有效地縮短跑道占用時(shí)間;Mirmohammadsadeghi 等[4]通過(guò)構(gòu)建雙層前饋神經(jīng)網(wǎng)絡(luò)模型,對(duì)美國(guó)37 個(gè)機(jī)場(chǎng)的跑道占用時(shí)間進(jìn)行了預(yù)測(cè);Chow 等[5]基于決策樹回歸算法構(gòu)建了可解釋規(guī)則的跑道占用時(shí)間預(yù)測(cè)模型,縮短了預(yù)測(cè)模型計(jì)算時(shí)間。
國(guó)內(nèi)對(duì)跑道占用時(shí)間的研究較少,且由于跑道占用時(shí)間定義相對(duì)模糊,相關(guān)研究缺乏系統(tǒng)性和全面性。張思遠(yuǎn)等[6]利用數(shù)學(xué)建模方法分析了跑道占用時(shí)間和著陸間隔對(duì)跑道容量的影響,發(fā)現(xiàn)出口滑行道角度和數(shù)量會(huì)顯著地影響跑道占用時(shí)間;潘衛(wèi)軍等[7]結(jié)合機(jī)場(chǎng)場(chǎng)面監(jiān)視數(shù)據(jù),基于BP 神經(jīng)網(wǎng)絡(luò)算法預(yù)測(cè)了著陸跑道占用時(shí)間和跑道出口距離;谷潤(rùn)平等[8]對(duì)跑道占用時(shí)間的影響因素進(jìn)行了研究,發(fā)現(xiàn)飛機(jī)尾流等級(jí)對(duì)跑道占用時(shí)間的影響最為顯著;李楠等[9]構(gòu)建了灰狼優(yōu)化算法和隨機(jī)森林算法結(jié)合的跑道占用時(shí)間預(yù)測(cè)模型,相比其他預(yù)測(cè)模型,預(yù)測(cè)精度得到了提升。
上述研究中對(duì)跑道占用時(shí)間影響因素的研究缺乏系統(tǒng)地歸類,同時(shí)使用的預(yù)測(cè)模型多為簡(jiǎn)單機(jī)器學(xué)習(xí)模型,預(yù)測(cè)精度偏低。本文研究將從航空器性能、機(jī)場(chǎng)條件、氣象等方面系統(tǒng)性選擇影響因素,對(duì)其進(jìn)行跑道占用時(shí)間相關(guān)性分析,再基于集成學(xué)習(xí)算法構(gòu)建預(yù)測(cè)模型,通過(guò)評(píng)估指標(biāo)對(duì)比模型預(yù)測(cè)精度。
美國(guó)聯(lián)邦航空管理局將AROT 定義為[10]:航空器從跑道入口到脫離跑道所用時(shí)間;歐洲空中航行安全組織將AROT 定義為[11]:航空器飛越跑道入口時(shí)刻與機(jī)尾離開跑道時(shí)刻的時(shí)間間隔。中國(guó)民用航空局將AROT 定義為[12]:航空器占用跑道,航空器著陸占用地面保護(hù)區(qū)的時(shí)間。美國(guó)聯(lián)邦航空管理局和中國(guó)民用航空局關(guān)于跑道占用時(shí)間的定義都存在對(duì)AROT 開始和結(jié)束時(shí)刻模糊不清的情況,故本研究采用歐洲空中航行安全組織的定義,根據(jù)AROT 定義,如公式(1):
式(1)中:ts為航空器飛越跑道入口時(shí)刻,te為航空器脫離跑道時(shí)刻。
本文研究所用數(shù)據(jù)樣本為2021 年7 月到2022年7月某航空公司737-800機(jī)型在成都天府機(jī)場(chǎng)、石家莊正定機(jī)場(chǎng)和承德機(jī)場(chǎng)著陸航班QAR數(shù)據(jù),共計(jì)9066條。
從航空器性能、機(jī)場(chǎng)條件和氣象三個(gè)方面考慮,航空器著陸跑道占用時(shí)間影響因素有航空器重量、航空器越過(guò)跑道入口速度、航空器脫離跑道速度、航空器加速度、航空器著陸后滑行距離、機(jī)場(chǎng)跑道和滑行道的構(gòu)型、著陸時(shí)風(fēng)速、風(fēng)向和氣溫。影響因素中機(jī)場(chǎng)跑滑構(gòu)型難以進(jìn)行數(shù)值分析,需要借助以下特征參數(shù)進(jìn)行表征:快速脫離滑行道數(shù)量、脫離道角度和脫離道口到跑道入口距離。
皮爾遜積矩相關(guān)系數(shù)常用于度量?jī)山M特征參數(shù)間相關(guān)程度,如公式(2):
式(2)中:r為皮爾遜積矩相關(guān)系數(shù),和分別為兩組特征參數(shù)的樣本均值。
使用皮爾遜積矩相關(guān)系數(shù)對(duì)航空器跑道占用時(shí)間影響因素進(jìn)行相關(guān)性排序,排序結(jié)果如圖1所示。
圖1 跑道占用時(shí)間影響因素排序
由圖1 可知,航空器性能中航空器加速度、越過(guò)跑道入口速度和脫離跑道速度皮爾遜相關(guān)系數(shù)較大,相關(guān)性強(qiáng);機(jī)場(chǎng)跑滑道構(gòu)型中快速滑行道數(shù)量、脫離道角度和脫離道到跑道入口距離同樣具有較強(qiáng)相關(guān)性;氣象因素皮爾遜相關(guān)系數(shù)較小,相關(guān)性弱。
本文提出一種基于集成學(xué)習(xí)的航空器跑道占用時(shí)間預(yù)測(cè)模型,集成學(xué)習(xí)(ensemble learning)算法常用于解決回歸預(yù)測(cè)和目標(biāo)分類問(wèn)題,通過(guò)使用不同的集成策略:boosting、bagging 和stacking,將多個(gè)機(jī)器學(xué)習(xí)模型進(jìn)行組合,得到比單一模型具有更好泛化能力的預(yù)測(cè)模型。
基于stacking 集成策略構(gòu)建的航空器跑道占用預(yù)測(cè)模型結(jié)構(gòu)分為兩層,第一層由多個(gè)不同結(jié)構(gòu)的模型構(gòu)成,第二層為一個(gè)元模型。在第一層中,使用k折交叉驗(yàn)證將數(shù)據(jù)集切分后,由各模型訓(xùn)練輸出預(yù)測(cè)結(jié)果;將第一層預(yù)測(cè)結(jié)果合并后作為第二層元模型的訓(xùn)練集,使用新訓(xùn)練集訓(xùn)練得到最終的預(yù)測(cè)結(jié)果。本研究采用stacking 集成策略,使用GBDT、Random Forest、Extra Trees和AdaBoost構(gòu)建航空器跑道占用預(yù)測(cè)模型第一層,使用線性回歸模型作為模型第二層的元模型,模型參數(shù)設(shè)置見(jiàn)表1。
表1 模型參數(shù)設(shè)置
隨機(jī)森林算法是一種基于裝袋算法的決策樹模型,常用于解決分類問(wèn)題和回歸問(wèn)題。算法步驟如下:
(1)對(duì)數(shù)據(jù)集D進(jìn)行有放回地Bootstrap 抽樣,從中抽取N個(gè)樣本作為預(yù)測(cè)模型的訓(xùn)練集。重復(fù)k次,得到k個(gè)訓(xùn)練集,并將其依次標(biāo)號(hào);
(2)對(duì)每個(gè)訓(xùn)練集構(gòu)建CART 決策樹,根據(jù)最小誤差平方和確定決策樹的最優(yōu)劃分點(diǎn),采用二分劃分法從根節(jié)點(diǎn)到葉子節(jié)點(diǎn)進(jìn)行劃分,得到預(yù)測(cè)結(jié)果;
(3)對(duì)所有訓(xùn)練集得到的預(yù)測(cè)結(jié)果取平均值,得到隨機(jī)森林算法的最終預(yù)測(cè)結(jié)果。
Extra Trees(extremely randomized trees)極端隨機(jī)樹算法,基于裝袋(bagging)算法集成多棵決策樹進(jìn)行預(yù)測(cè)。和隨機(jī)森林算法類似,但在訓(xùn)練樣本的選擇和劃分方法上有所不同,極端隨機(jī)樹的訓(xùn)練集使用相同的訓(xùn)練樣本,采用完全隨機(jī)的劃分方式?;貧w模型常使用均方誤差(MSE)作為節(jié)點(diǎn)不純度的判斷標(biāo)準(zhǔn),選擇最優(yōu)的特征作為分裂節(jié)點(diǎn),對(duì)所有訓(xùn)練集得到的預(yù)測(cè)結(jié)果取平均值,得到最終預(yù)測(cè)結(jié)果。
GBDT(gradient boosting decision tree)梯度提升決策樹算法,由多個(gè)弱學(xué)習(xí)器串聯(lián)構(gòu)成,模型通過(guò)不斷降低殘差的方法來(lái)提高預(yù)測(cè)精度,前序?qū)W習(xí)器的輸出為后序?qū)W習(xí)器的輸入,算法計(jì)算流程如下:
(1)計(jì)算梯度值;
(2)遍歷節(jié)點(diǎn),計(jì)算得到每個(gè)節(jié)點(diǎn)的最優(yōu)輸出,更新得到最終學(xué)習(xí)器。
AdaBoost(adaptive boosting)自適應(yīng)增強(qiáng)算法,算法步驟如下:
(1)對(duì)訓(xùn)練樣本劃分N個(gè)學(xué)習(xí)器的權(quán)值進(jìn)行初始化,賦予相同權(quán)值1N;
(2)計(jì)算第m個(gè)學(xué)習(xí)器在訓(xùn)練樣本中的最大誤差和相對(duì)誤差,得出每個(gè)學(xué)習(xí)器的誤差率和權(quán)重系數(shù);
(3)更新學(xué)習(xí)器權(quán)重,對(duì)每個(gè)學(xué)習(xí)器進(jìn)行加權(quán),將m個(gè)學(xué)習(xí)器組合成一個(gè)強(qiáng)學(xué)習(xí)器。
基于航空器歷史運(yùn)行數(shù)據(jù),將影響因素作為集成學(xué)習(xí)預(yù)測(cè)模型的輸入,對(duì)不同預(yù)測(cè)模型的預(yù)測(cè)結(jié)果通過(guò)評(píng)價(jià)指標(biāo)進(jìn)行分析,對(duì)比預(yù)測(cè)精度。
為更好對(duì)比本文預(yù)測(cè)模型相較于其他預(yù)測(cè)模型在預(yù)測(cè)精度上的表現(xiàn),對(duì)比分析基于Random Forest、Extra Trees、GBDT、AdaBoost 和集成學(xué)習(xí)的跑道占用時(shí)間預(yù)測(cè)模型,本文選取均方誤差MSE和決定系數(shù)R2作為模型的評(píng)估指標(biāo),用于評(píng)估預(yù)測(cè)模型的泛化能力和預(yù)測(cè)能力。
MSE的區(qū)間為[0,1],值越趨近于0,表明模型的預(yù)測(cè)精度越高,決定系數(shù)R2的區(qū)間為[0,1],值越趨近于1,表明模型的預(yù)測(cè)精度越高,評(píng)估指標(biāo)計(jì)算公式如下:
式中:yi表示真實(shí)值,表示預(yù)測(cè)值,表示樣本均值。
對(duì)預(yù)測(cè)模型預(yù)測(cè)精度進(jìn)行對(duì)比,結(jié)果見(jiàn)表2。
表2 模型評(píng)價(jià)指標(biāo)
由表2 數(shù)據(jù)可知,Stacking 集成學(xué)習(xí)預(yù)測(cè)模型的MSE為12.682,R2為0.82,相較于其他預(yù)測(cè)模型,其MSE值更低,R2值更高,表明本文提出的Stacking跑道占用時(shí)間預(yù)測(cè)模型具有更高的預(yù)測(cè)精度。
本文在相關(guān)性分析后發(fā)現(xiàn)跑道占用時(shí)間影響因素中飛機(jī)性能和著陸跑滑道構(gòu)型的皮爾遜相關(guān)系數(shù)更高,說(shuō)明在航空器著陸過(guò)程中,更佳的航空器性能和更合理的跑滑道構(gòu)型能夠有效地減小AROT,而氣象因素對(duì)AROT 影響程度較小。對(duì)比多個(gè)預(yù)測(cè)模型發(fā)現(xiàn),本文提出的集成學(xué)習(xí)模型在模型評(píng)價(jià)指標(biāo)MSE和R2上表現(xiàn)更優(yōu),擁有更高的預(yù)測(cè)精度。在未來(lái)跑道占用時(shí)間的預(yù)測(cè)工作中,可以對(duì)起飛跑道占用時(shí)間展開分析,考慮實(shí)際運(yùn)行中人因?qū)︻A(yù)測(cè)模型的影響,提高預(yù)測(cè)準(zhǔn)確性,為更加高效的機(jī)場(chǎng)運(yùn)行提供理論依據(jù)。