• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于XGBoost 的航空器動態(tài)滑行時間預(yù)測方法研究

    2022-02-22 08:57:48趙征馮事成宋梅雯胡莉陸莎
    航空工程進展 2022年1期
    關(guān)鍵詞:離港進港數(shù)據(jù)量

    趙征,馮事成,宋梅雯,胡莉,陸莎

    (1.南京航空航天大學(xué) 民航學(xué)院,南京 211106)

    (2.上海國際機場股份有限公司運行指揮中心,上海 201202)

    0 引 言

    大型民用機場場面運行復(fù)雜,實際運行中,經(jīng)常出現(xiàn)進港航空器的機位保障資源不能及時到位;離港航空器按照預(yù)計時間推出,但跑道頭排隊錯位導(dǎo)致無法滿足分配起飛時刻的情況。上述現(xiàn)象主要是由于機場協(xié)同決策(A-CDM)系統(tǒng)中滑行時間設(shè)置較為單一和靜態(tài),缺乏科學(xué)預(yù)測和動態(tài)修訂而導(dǎo)致的。通過對航空器進港和離港滑行時間的精確和動態(tài)預(yù)測,可以更加準(zhǔn)確地計算出預(yù)計上輪擋時間、預(yù)計推出時間等,從而提升機場的運行效率,提高航班準(zhǔn)點率。

    在滑行時間影響因素的分析方面,A-CDM 系統(tǒng)實施文件中將影響滑行時間最常見的因素歸為11 種,包括機場布局和機場設(shè)施、使用的跑道、跑道交叉的次數(shù)、停機位、氣象條件、航空器類型和飛行員、航空器重量、推出指令傳達時間、除冰位、交通密度和機場當(dāng)?shù)氐牟僮鞒绦?。R. A.Shumsky基于排隊論,考慮航空公司、離港跑道和離港需求等影響因素,對離港滑行時間進行預(yù)測;H.Idris 等分析了影響滑行時間的主要因素,如起飛隊列長度、跑道配置、天氣、飛機類型和停機位等,并使用排隊論模型對離港滑行時間進行預(yù)測,結(jié)果顯示起飛隊列長度是最重要的影響因素,但是模型在±5 min 范圍內(nèi)的預(yù)測精度不到70%。

    針對前人研究中關(guān)于進港航空器數(shù)量對離港滑行時間影 響有限的觀點,R. R. Clewlow 等經(jīng)過分析證明了進港航空器數(shù)量對離港滑行時間有著顯著影響,且進/離港航空器流交互越多,這種影響就越顯著;劉繼新等分析了航空器滑行時間的影響因素,結(jié)果表明,場面流量對滑行時間的影響最為顯著。

    在滑行時間預(yù)測模型和方法的研究方面,M.S.Kistler 等以達拉斯—沃思堡國際機場為對象,使用線性回歸和對數(shù)線性回歸模型對航空器滑行時間進行預(yù)測,結(jié)果表明,線性回歸模型預(yù)測效果較好,在±1 min 誤差范圍內(nèi),預(yù)測精度達到71%,決定因子值達到0.95;P.Balakrishna 等采用強化學(xué)習(xí)算法對美國的三個機場進行了離港滑行時間預(yù)測,算法在底特律國際機場和坦帕國際機場表現(xiàn)出較好的預(yù)測效果;S.Ravizza 等提出滑行距離應(yīng)分為推出段、轉(zhuǎn)彎段和直線滑行段,并研究了飛機滑行通過這三段時的滑行角度和速度,然后基于多元線性回歸、最小中位數(shù)平方線性回歸、支持向量機和M5 模型樹等對離港滑行時間進行了預(yù)測;H.Lee 等以夏洛特機場為例,基于神經(jīng)網(wǎng)絡(luò)、線性回歸模型、支持向量機、近鄰和隨機森林等算法對滑行時間進行預(yù)測,并比較了這幾種算法的預(yù)測效能,結(jié)果顯示,支持向量機預(yù)測效果 優(yōu) 于 其 他 模 型;T. Diana比 較 了 集 成 機 器 學(xué)習(xí)、普通最小二乘法和懲罰算法在預(yù)測滑行時間方面的性能,以探究機器學(xué)習(xí)是否比傳統(tǒng)的線性回歸具有更好的預(yù)測效能,結(jié)果表明,在對預(yù)測結(jié)果進行偏差和方差的評估比較方面,兩者各有優(yōu)劣,故在模型選擇時應(yīng)當(dāng)以偏差和方差的均衡作為選擇依據(jù);Wang X W 等比較了線性回歸、梯度提升決策樹和隨機森林等算法對滑行時間的預(yù)測效果,并研究了各個特征對模型的影響程度,得出使用一小部分特征(包括所有機場的一般性特征起飛/到達、滑行距離、總轉(zhuǎn)彎數(shù)、平均速度和航空器數(shù)量),以及針對特定目標(biāo)機場的少數(shù)特征,就可以實現(xiàn)較高的預(yù)測準(zhǔn)確性;李楠等基于多元回歸模型,分別采用傳統(tǒng)統(tǒng)計學(xué)和機器學(xué)習(xí)預(yù)測航空器離港滑行時間,結(jié)果顯示,機器學(xué)習(xí)的預(yù)測準(zhǔn)確度較高,±5 min 誤差范圍內(nèi)預(yù)測精度達到87%;馮霞等將離港滑行時間預(yù)測劃分為兩個階段,先利用已知特征預(yù)測離港滑行過程中使用相同跑道起降的航班數(shù)量,再將其作為變量輸入滑行時間預(yù)測模型,結(jié)果顯示,該方法的預(yù)測效果優(yōu)于直接預(yù)測。

    現(xiàn)有研究成果大都只針對離港滑行時間進行分析預(yù)測,且未分析樣本數(shù)據(jù)量對預(yù)測模型的影響??紤]到進/離港滑行在影響因素和滑行時間上均存在差異,進港滑行時間的準(zhǔn)確預(yù)測對計算預(yù)計上輪擋時間和確定地面保障資源的到位時間至關(guān)重要,而樣本數(shù)據(jù)量與預(yù)測效果的關(guān)聯(lián)分析可為機場的系統(tǒng)開發(fā)和運行提供參考。因此,本文采用XGBoost 算法針對進港滑行時間和離港滑行時間分別進行預(yù)測,并剖析機場滑行時間預(yù)測所需樣本數(shù)據(jù)量與滑行時間預(yù)測精度的關(guān)聯(lián)。

    1 航空器滑行時間影響因素分析

    雖然滑行時間預(yù)測的算法具有一定程度的普適性,但因機場機位和機坪布局、跑滑構(gòu)型、滑行規(guī)則、氣象環(huán)境等的不同,導(dǎo)致不同機場的航空器滑行時間影響因素有其定制性。因此,本文首先介紹滑行預(yù)測方法的實證機場信息,然后針對實證機場進行影響因素的分析提取。

    1.1 機場運行環(huán)境分析

    廣州白云國際機場(以下簡稱“白云機場”)是中國三大門戶復(fù)合樞紐機場之一,也是中國最繁忙的五大機場之一,年旅客吞吐量超5 000 萬人次。白云機場場面布局圖如圖1 所示,機場建有三條跑道,跑道運行方向為南北運行,01/19 號跑道進、離場混合運行,02L/20R 號跑道主要用于離場,02R/20L 號跑道主要用于進場。機場共有2 個航站樓,分別為T1 和T2,停機位275 個,主要分布在東機坪、西機坪、北機坪以及其他區(qū)域。

    圖1 廣州白云國際機場場面布局Fig.1 Layout of Guangzhou Baiyun International Airport

    1.1.1 航空器滑行規(guī)則

    進港航空器滑行方面,由01 號和19 號跑道進港的航空器主要滑入北機坪和東機坪,由02R 號和20L 號跑道進港的航空器主要滑入北機坪和西機坪。離港航空器滑行方面,東機坪、西機坪和北機坪的航空器經(jīng)由01 號、02L 號和20R 號跑道離港,而19 號跑道只有東機坪和北機坪的航空器經(jīng)此跑道離港。

    1.1.2 機場天氣概況

    白云機場位于廣州市北部花都區(qū),處于雷雨多發(fā)地帶,據(jù)統(tǒng)計白云機場近50 年來,年平均出現(xiàn)雷暴日數(shù)為75.4 天,最多為109 天,最少為49 天。此外,因受臺風(fēng)或臺風(fēng)外圍因素影響,經(jīng)常出現(xiàn)短時強陣雨。雷暴和強陣雨是影響白云機場航空器滑行兩個最主要的天氣因素。

    1.2 影響因素分析方法

    航空器滑行時間受多種因素影響,不同機場存在共同的影響因素,也有其特定的影響因素?;趯C場運行環(huán)境的分析,白云機場場面存在較多交叉路口,容易造成滑行沖突,因此存在較多沖突熱點區(qū)域(Hot Spot,簡稱HS);且由于機位分配的原因,使得航空器存在穿越跑道滑行和交叉滑行的可能。針對白云機場場面運行環(huán)境選取三個特定的影響因素,即經(jīng)過HS 的數(shù)量、是否交叉滑行、是否穿越跑道;兩個一般性影響因素,即所屬航空公司、停機位,通過統(tǒng)計單個影響因素下的平均滑行時間,直觀展示各個因素對滑行時間的影響情況,為最終影響因素集的確定提供分析方法。

    1.2.1 經(jīng)過HS 的數(shù)量

    經(jīng)過HS 區(qū)域時,航空器可能需要減速或者停車,待其他航空器通過后才能繼續(xù)滑行。隨著經(jīng)過HS 的數(shù)量增多,航空器需要減速或者停車的幾率會增加,滑行時間的受影響程度也會增大。由HS 數(shù)量統(tǒng)計的平均滑行時間如圖2 所示,可以看出:當(dāng)經(jīng)過HS 的數(shù)量從0 增加到2 時,進港平均滑行時間依次增加約5%和58%,離港平均滑行時間依次增加約2%和13%。

    圖2 由經(jīng)過的HS 數(shù)量統(tǒng)計的平均滑行時間Fig.2 Average taxi time measured by HS number

    1.2.2 交叉滑行

    交叉滑行是反映航空器滑行距離的重要因素,若從東機坪離港的航空器由01/19 號跑道起飛,或從西機坪離港的航空器由02L/20R 號跑道起飛,則視為存在交叉滑行;同理,若從01/19 號跑道進港的航空器滑入東機坪,或從02R/20L 號跑道進港的航空器滑入西機坪,則視為存在交叉滑行。由交叉滑行統(tǒng)計的平均滑行時間如圖3 所示,可以看出:當(dāng)存在交叉滑行時,進港平均滑行時間增加約70%,離港平均滑行時間增加約10%。

    圖3 由交叉滑行統(tǒng)計的平均滑行時間Fig.3 Average taxi time calculated by cross taxi

    1.2.3 穿越跑道

    對于白云機場由02R/20L 號跑道進港的航空器存在穿越02L/20R 號跑道的情況,若此時02L/20R 號跑道上有航空器離港起飛,則由02R/20L 號跑道進港的航空器必須在穿越點外等待,進港滑行時間會受到影響。由穿越跑道統(tǒng)計的平均進港滑行時間如圖4 所示,可以看出:當(dāng)航空器存在穿越跑道的情況時,進港平均滑行時間增加約54%。

    圖4 由穿越跑道統(tǒng)計的平均滑行時間Fig.4 Average taxi time calculated by crossing runway

    1.2.4 所屬航空公司

    不同航空公司對航空器推出模式和航空器滑行速度有不同的規(guī)定,會對航空器滑行時間造成影響。由航空公司統(tǒng)計的平均進港滑行時間和平均離港滑行時間分別如圖5~圖6 所示,可以看出:不同航空公司航空器平均進/離港滑行時間均存在較大差異。

    圖5 由航空公司統(tǒng)計的平均進港滑行時間Fig.5 Average taxi-in time calculated by airline

    圖6 由航空公司統(tǒng)計的平均離港滑行時間Fig.6 Average taxi-out time calculated by airline

    1.2.5 停機位

    從同一跑道起飛/落地的航空器,由于停放區(qū)域不同,會對航空器滑行造成兩方面的影響,一是滑行距離不同,二是滑行過程中受其他航空器干擾的程度不同,每一方面都會對滑行時間造成影響。由停機位統(tǒng)計的平均進港滑行時間和平均離港滑行時間分別如圖7~圖8 所示,可以看出:不同停機位上的航空器平均進/離港滑行時間均存在較大差異。

    圖7 由停機位統(tǒng)計的平均進港滑行時間Fig.7 Average taxi-in time calculated by stand

    圖8 由停機位統(tǒng)計的平均離港滑行時間Fig.8 Average taxi-out time calculated by stand

    1.3 最終影響因素集

    基于現(xiàn)有研究選取影響滑行時間的其他因素,如航空器類型、起飛/到達跑道、時段、起飛隊列長度、場面同時滑行的航空器數(shù)量和天氣。針對場面滑行的航空器流量統(tǒng)計方法,本文采用Yin Jianan 等基于宏觀網(wǎng)絡(luò)拓?fù)鋱D對流量的計算方法,將其分為離港瞬時流量、離港累計流量、進港瞬時流量和進港累計流量。在對天氣的處理上,結(jié)合機場運行的天氣統(tǒng)計數(shù)據(jù)和管制一線經(jīng)驗,將對航空器滑行會造成較嚴(yán)重影響的雷暴和強陣雨天氣視為惡劣天氣,其他對航空器滑行幾乎沒有影響的天氣視為正常天氣,而后根據(jù)機場記錄的歷史天氣情況給每一個航班標(biāo)定對應(yīng)的天氣類型。結(jié)合對特定影響因素的分析提取,最終確定的進/離港滑行時間影響因素如表1 所示。

    表1 進/離港滑行時間影響因素Table 1 Influencing factors of taxi-in and taxi-out time

    2 預(yù)測模型

    2.1 模型及評估標(biāo)準(zhǔn)

    XGBoost 的英文全稱為Extreme Gradient Boosting,是Chen Tianqi 等提出的一種梯度提升模型,也是一種基于決策樹的集成機器學(xué)習(xí)算法。相較于前幾代基于決策樹的算法,XGBoost算法可在最短的時間內(nèi),使用較少的計算資源,得到較為出色的結(jié)果。

    為了更加直觀地比較XGBoost 算法在航空器滑行時間預(yù)測方面的性能,本文選擇隨機森林和支持向量回歸兩種常用的滑行時間預(yù)測算法用以對比分析。

    在對模型預(yù)測性能的評估上,選擇決定系數(shù)()、均 方 根 誤 差()和 平 均 絕 對 誤 差()三個指標(biāo)。通常情況下,值越大,自變量可以解釋的滑行時間變化的比例越大,然而,值過大也可能意味著一些過擬合的問題;衡量觀測值與真實值之間的偏差;反映預(yù)測值誤差的實際情況,它們是機器學(xué)習(xí)中評價模型的兩把重要標(biāo)尺。這兩個指標(biāo)的計算公式如下:

    式中:為所有進港航班或者所有離港航班;p為航班滑行時間的預(yù)測值;t為航班滑行時間的真實值。

    2.2 模型輸入與輸出

    2.2.1 模型輸入

    本文先進行訓(xùn)練集和測試集的劃分,然后進行數(shù)據(jù)預(yù)處理,包括異常值和空缺值的處理,以避免模型提前學(xué)習(xí)到測試集數(shù)據(jù)信息。在測試不同劃分比例的預(yù)測效果后,最終選定以80%的數(shù)據(jù)作為訓(xùn)練集,20%的數(shù)據(jù)作為測試集。以進港為例,經(jīng)過預(yù)處理后的進港航班數(shù)據(jù)如表2 所示。

    基于前文對滑行時間影響因素分析的結(jié)果,從預(yù)處理后的數(shù)據(jù)中提取、計算用于輸入模型的各個特征,而后通過編碼將計算機無法識別的字符信息,如航空公司代碼、機型和跑道號等轉(zhuǎn)化為數(shù)值型信息,作為模型的最終輸入數(shù)據(jù)。以進港為例,模型最終輸入的進港數(shù)據(jù)如表3 所示。

    表2 預(yù)處理后的進港航班數(shù)據(jù)Table 2 Preprocessed incoming flight data

    表3 輸入模型的進港數(shù)據(jù)Table 3 Incoming flight data input to model

    2.2.2 模型輸出

    模型輸出即是預(yù)測的滑行時間。本文參照中國民用航空局A-CDM 系統(tǒng)的相關(guān)定義,進港航空器滑行時間(指航空器從落地()時刻到滑入停機位上輪擋()時刻之間的時間。

    離港航空器滑行時間()指航空器從撤輪擋時刻()到起飛離地時刻()之間的時間。

    2.3 模型調(diào)參

    機器學(xué)習(xí)模型的預(yù)測性能主要取決于兩方面因素,一是數(shù)據(jù)本身的質(zhì)量,二是模型參數(shù)的調(diào)整。為了進一步提高模型預(yù)測效果,需對基于XG?Boost 的滑行時間預(yù)測模型進行調(diào)參。

    首先,介紹對XGBoost 算法預(yù)測性能影響較大的關(guān)鍵參數(shù)。n_estimators 為集成算法中弱評估器的數(shù)量,此參數(shù)值越大,模型的學(xué)習(xí)能力越強,但模型也越容易過擬合;min_chil_weight 參數(shù)控制葉子上所需的最小樣本量,它的調(diào)整對于樣本量較大的數(shù)據(jù)比較有效;max_depth 控制模型中樹的最大深度,這個參數(shù)值越大模型越復(fù)雜,且模型容易過擬合;Subsample 參數(shù)控制隨機抽取的用于訓(xùn)練的數(shù)據(jù)比例;learning_rate 參數(shù)控制迭代速率,兩者都可以防止模型過擬合;reg_lambda 和reg_alpha參數(shù)分別是權(quán)重的L1 和L2 正則化項;Gamma 控制節(jié)點分裂所需的最小損失函數(shù)下降值,它們可以降低模型的復(fù)雜度,加快算法收斂速度。然后,本文使用網(wǎng)格搜索對XGBoost 算法的關(guān)鍵參數(shù)進行調(diào)整,并以交叉驗證結(jié)果作為參數(shù)選擇的標(biāo)準(zhǔn)。最后,經(jīng)過多輪測試調(diào)參,確定的部分關(guān)鍵參數(shù)最佳值如表4 所示。

    表4 模型關(guān)鍵參數(shù)最佳值Table 4 The optimal value of key parameters of the model

    2.4 滑行時間預(yù)測步驟

    在對滑行時間影響因素分析、模型及模型預(yù)測性能評估標(biāo)準(zhǔn)和模型輸入輸出介紹的基礎(chǔ)上,總結(jié)出滑行時間預(yù)測的步驟,如圖9 所示。

    圖9 滑行時間預(yù)測步驟Fig.9 The steps of taxi time prediction

    3 預(yù)測結(jié)果分析

    基于隨機森林、支持向量回歸和XGBoost 三種模型對進港和離港滑行時間分別進行預(yù)測。首先對白云機場進/離港滑行時間進行統(tǒng)計,為預(yù)測結(jié)果分析中誤差范圍的確定提供參考;然后比較三種模型的預(yù)測性能,分析特征的重要性;最后分析樣本數(shù)據(jù)量對模型預(yù)測精度的影響。

    3.1 誤差范圍確定

    本文所用航班數(shù)據(jù)來源于白云機場塔臺運行管理系統(tǒng)(TOMS)2019 年全年數(shù)據(jù),數(shù)據(jù)內(nèi)容包括航空公司、航班號、機型、進港跑道、離港跑道、進港機位、離港機位、進港時間、出港時間、上輪擋時間和撤輪擋時間。去除數(shù)據(jù)中的缺失值和時間邏輯錯誤值后得到進港航班數(shù)據(jù)約19 萬條,離港航班量數(shù)據(jù)約20 萬條。

    分別對進港滑行時間和離港滑行時間進行統(tǒng)計,統(tǒng)計結(jié)果如表5 所示,可以看出:進港滑行時間集中在5~10 min,離港滑行時間集中在16~23 min,進港滑行時間遠小于離港滑行時間。

    表5 進港和離港滑行時間統(tǒng)計Table 5 Statistics of taxi-in and taxi-out time

    結(jié)合白云機場進/離港滑行時間統(tǒng)計結(jié)果和現(xiàn)有研究成果,選擇進港滑行時間以±3 min 誤差范圍,離港滑行時間以±5 min 誤差范圍為評估標(biāo)準(zhǔn)。

    3.2 預(yù)測模型性能對比

    支持向量回歸、隨機森林和XGBoost 模型的擬合度和預(yù)測誤差的評估結(jié)果如表6~表7 所示。

    表6 進港滑行時間預(yù)測模型評估結(jié)果Table 6 Evaluation results of the prediction model for taxi-in time

    表7 離港滑行時間預(yù)測模型評估結(jié)果Table 7 Evaluation results of the prediction model for taxi-out time

    從表6~表7 可以看出:無論是訓(xùn)練集還是測試集,三個模型均得到較高的值和較小的誤差值,證明模型在進/離港滑行時間的預(yù)測上均有良好的性能。其中,雖然進港滑行時間預(yù)測結(jié)果的誤差值小于離港,但考慮到進港滑行時間遠小于離港滑行時間,故從誤差比例的角度來看并不能認(rèn)為模型對進港滑行時間的預(yù)測效果優(yōu)于離港滑行時間。支持向量回歸和XGBoost 在訓(xùn)練集和測試集上的表現(xiàn)較為穩(wěn)定,而隨機森林則有較大的波動。在訓(xùn)練集上,隨機森林值過大,達到了0.96,表明模型存在過擬合的情況。在測試集上,XGBoost 的預(yù)測效能優(yōu)于隨機森林和支持向量回歸,其值比兩者都高,而誤差值比兩者都低。

    進港和離港滑行時間預(yù)測結(jié)果與實際值誤差在±1、±2、±3、±4 和±5 min 范圍內(nèi)的模型預(yù)測精度如表8~表9 所示。

    表8 進港滑行時間預(yù)測精度Table 8 Prediction accuracy of taxi-in time

    表9 離港滑行時間預(yù)測精度Table 9 Prediction accuracy of taxi-out time

    從表8~表9 可以看出:進港滑行時間預(yù)測方面,±3 min 誤差范圍內(nèi),三個模型精度均在91%以上。其中,支持向量回歸預(yù)測精度最低,僅有91.2%,XGBoost 預(yù)測精度最高,達到了94.1%。離港滑行時間預(yù)測方面,±5 min 誤差范圍內(nèi),三個模型精度均在93%以上。其中,支持向量回歸預(yù)測精度最低,僅有93.1%,XGBoost 精度最高,達到了96.6%。

    三個模型進港和離港滑行時間預(yù)測值與實際值之差的對比如圖10~圖11 所示,可以看出:支持向量回歸算法預(yù)測結(jié)果的誤差值范圍最大,XG?Boost 算法最小。

    圖10 三種算法進港滑行時間預(yù)測值與實際值之差Fig.10 Difference between the predicted and actual taxi-in time of the three algorithms

    圖11 三種算法離港滑行時間預(yù)測值與實際值之差Fig.11 Difference between the predicted and actual taxi-out time of the three algorithms

    3.3 特征重要性分析

    根據(jù)XGBoost 和隨機森林得出的特征重要度排名,探究針對白云機場提取的特定影響因素對于滑行時間預(yù)測的重要性。隨機森林和XGBoost的進港特征重要度排名如圖12~圖13 所示,可以看出:在兩者的結(jié)果中,交叉滑行都具有最高的特征重要度;在XGBoost 的結(jié)果中,穿越跑道和經(jīng)過HS 數(shù)量的特征重要度也排在前4。

    隨機森林和XGBoost 的離港特征重要度排名如圖14~圖15 所示,可以看出:交叉滑行和經(jīng)過HS 的數(shù)量只在XGBoost 的結(jié)果中具有約0.05 的特征重要度,而在隨機森林的結(jié)果中,這兩個特征的重要度只有約0.01。此外,所屬航空公司在進港和離港中的重要度都不超過0.02。

    圖12 隨機森林進港特征重要度排名Fig.12 Feature importance of taxi-in time of random forest

    圖13 XGBoost 進港特征重要度排名Fig.13 Feature importance of taxi-in time of XGBoost

    圖14 隨機森林離港特征重要度排名Fig.14 Feature importance of taxi-out time of random forest

    圖15 XGBoost 離港特征重要度排名Fig.15 Feature importance of taxi-out time of XGBoost

    對特征重要度的分析表明,針對白云機場提取的特征對于進港滑行時間預(yù)測的重要性高于離港滑行時間預(yù)測,其中交叉滑行、穿越跑道和經(jīng)過HS 的數(shù)量這三個特征的重要性高于所屬航空公司。

    3.4 樣本數(shù)據(jù)量對模型預(yù)測精度的影響

    滑行時間預(yù)測使用的進港航班數(shù)據(jù)量約19 萬條,離港航班數(shù)據(jù)量約20 萬條,過大的數(shù)據(jù)量會造成數(shù)據(jù)采集、處理和計算負(fù)擔(dān)。為了研究XG?Boost 模型預(yù)測精度隨樣本數(shù)據(jù)量的變化情況,在保留所有特征信息的基礎(chǔ)上,對進港和離港數(shù)據(jù)分別進行3 次隨機采樣,數(shù)據(jù)量從2 000 條開始,并以2 000 作為梯度,一直增加到40 000 條,之后用3次樣本預(yù)測的均值作為最終結(jié)果。

    進港和離港滑行時間預(yù)測精度隨數(shù)據(jù)量的變化情況如圖16~圖17 所示,可以看出:進港和離港滑行時間預(yù)測精度隨數(shù)據(jù)量的增加呈逐步提高的趨勢,但隨著數(shù)據(jù)量的增加,這種趨勢逐漸變緩。當(dāng)數(shù)據(jù)量在26 000 條以下時,預(yù)測精度的變化趨勢波動較大,預(yù)測精度的提高速度較快;當(dāng)數(shù)據(jù)量超過26 000 條,預(yù)測精度的變化趨勢變得平緩;當(dāng)數(shù)據(jù)量超過32 000 條,進港±3 min 誤差范圍的預(yù)測精度穩(wěn)定在93.0%~93.5%,離港±5 min 誤差范圍的預(yù)測精度穩(wěn)定在95.0%~95.5%。

    圖16 進港滑行時間預(yù)測精度隨數(shù)據(jù)量的變化情況Fig.16 The change of the prediction accuracy of the taxi-in time with the data quantity

    圖17 離港滑行時間預(yù)測精度隨數(shù)據(jù)量的變化情況Fig.17 The change of the prediction accuracy of the taxi-out time with the data quantity

    對模型預(yù)測精度隨樣本數(shù)據(jù)量變化的分析表明,當(dāng)數(shù)據(jù)量超過32 000 條時,模型就能獲得較高的預(yù)測精度和較穩(wěn)定的預(yù)測表現(xiàn)。

    4 結(jié) 論

    (1)本文提出了基于XGBoost 的航空器動態(tài)滑行時間預(yù)測方法,并以白云機場為實例,驗證了方法的有效性。

    (2)模型預(yù)測結(jié)果表明,XGBoost 算法在預(yù)測誤差和預(yù)測精度方面都優(yōu)于隨機森林和支持向量回歸;且使用XGBoost 算法,進/離港滑行時間的預(yù)測精度分別達到了94.1%和96.6%。

    (3)對特征重要度的分析表明,提取的特征能夠較好地反映白云機場滑行態(tài)勢,且提取的特征對于進港滑行時間預(yù)測的重要性要高于離港滑行時間預(yù)測,其中交叉滑行、穿越跑道和經(jīng)過HS 的數(shù)量這三個特征的重要性高于所屬航空公司。

    (4)對模型預(yù)測精度隨樣本數(shù)據(jù)量變化的分析表明,當(dāng)數(shù)據(jù)量超過32 000 條時,模型就能獲得較高的預(yù)測精度和較穩(wěn)定的預(yù)測表現(xiàn),可為白云機場A-CDM 系統(tǒng)中滑行時間動態(tài)預(yù)測所需樣本量提供參考。

    猜你喜歡
    離港進港數(shù)據(jù)量
    離港航班延誤成本研究
    價值工程(2022年15期)2022-07-13 05:37:08
    基于大數(shù)據(jù)量的初至層析成像算法優(yōu)化
    計算Lyapunov指數(shù)的模糊C均值聚類小數(shù)據(jù)量法
    長三角機場群運行相關(guān)性分析
    大型滿載油輪使用魚山作業(yè)區(qū)南部進港航道航行方法探討
    航海(2020年6期)2020-12-23 06:53:37
    高刷新率不容易顯示器需求與接口標(biāo)準(zhǔn)帶寬
    寬帶信號采集與大數(shù)據(jù)量傳輸系統(tǒng)設(shè)計與研究
    電子制作(2019年13期)2020-01-14 03:15:18
    船舶進靠浙能臺二電煤炭碼頭風(fēng)險的研究
    珠江水運(2019年9期)2019-06-02 17:00:04
    旺角暴亂嫌犯被禁止離港
    寧波梅山港區(qū)進港航道將于今年建成
    水道港口(2014年1期)2014-04-27 14:14:35
    石家庄市| 读书| 逊克县| 卢氏县| 中阳县| 炎陵县| 沾益县| 海丰县| 吴旗县| 新营市| 津市市| 东宁县| 蒙城县| 安岳县| 吐鲁番市| 辽阳县| 东兰县| 绥阳县| 互助| 隆尧县| 平舆县| 璧山县| 拉孜县| 左权县| 出国| 苏州市| 瓮安县| 疏勒县| 子长县| 连云港市| 云霄县| 乐平市| 常州市| 万源市| 大余县| 南昌市| 蓬溪县| 安义县| 中牟县| 新河县| 巴塘县|