吳子軒,張寧,高凱燁,彭銳
1.廈門航空有限公司 數(shù)字委員會(huì),廈門 361006
2.北京信息科技大學(xué) 經(jīng)濟(jì)管理學(xué)院,北京 100192
3.中國科學(xué)院 數(shù)字與系統(tǒng)科學(xué)研究院,北京 100190
4.北京工業(yè)大學(xué) 經(jīng)濟(jì)管理學(xué)院,北京 100124
燃油成本是航空公司最大成本項(xiàng)之一,對航司盈利能力影響重大。通過提高燃料效率,不僅能提升航司盈利能力和運(yùn)行品質(zhì),還能有效降低航空運(yùn)輸市場的碳排放。鑒于航班對飛行的安全性和可靠性要求較高,通常情況下會(huì)攜帶過量的燃油。但是,如果航班的落地油量存在較高的剩余,不僅超額燃油存在“油燒油”的損耗,航班的有效商業(yè)載荷將會(huì)被擠占,從而嚴(yán)重縮小了航司的利潤空間。正常航班的起飛油量由:航程油量、備降燃油、滑行油量、政策油量、不可預(yù)期燃油和額外油量構(gòu)成。其中,航程油量是總加注油量的最重要組成部分,支撐航班在空中正常飛行所需的燃油消耗。因此,在商業(yè)航空運(yùn)輸快速增長的大背景下,合理優(yōu)化航程油的加注量,能顯著提升航班燃油經(jīng)濟(jì)性,從而改善航司的效益、促進(jìn)節(jié)能減排,對航空公司意義重大。
航空燃油的消耗機(jī)理復(fù)雜,受到飛機(jī)重量、飛機(jī)構(gòu)型、發(fā)動(dòng)機(jī)狀態(tài)、商業(yè)載荷、飛行距離、巡航高度層、空中速度、航線氣象條件、起降機(jī)場、飛行員的操控和其他人為活動(dòng)等因素的影響。過去有大量的學(xué)者利用傳統(tǒng)模型方法對航空燃油消耗進(jìn)行研究。例如,文獻(xiàn)[4]基于機(jī)載快速存取記錄器(Quick Access Recorder,QAR)的軌跡數(shù)據(jù),采用數(shù)據(jù)挖掘技術(shù),運(yùn)用BADA(Base of Aircraft DAta)模型和AEDT(Aviation Environmental Design Tool)軟件進(jìn)行燃油估算對比研究;文獻(xiàn)[5]介紹了一種基于飛行記錄儀(Flight Data Recorder,FDR)數(shù)據(jù)進(jìn)行工業(yè)大數(shù)據(jù)可視化的案例研究,以發(fā)現(xiàn)影響飛機(jī)燃油效率的因素。雖然已有各種油耗評估方法,但在預(yù)測上受困于模型的框架和假設(shè)前提條件,傳統(tǒng)機(jī)理模型的設(shè)計(jì)和驗(yàn)證成本很高,且建立在過去較遠(yuǎn)時(shí)間段的氣象和飛機(jī)性能數(shù)據(jù)基礎(chǔ)上,在當(dāng)前實(shí)用運(yùn)行場景下缺乏準(zhǔn)確性,難以有效地反映出航空燃油消耗的復(fù)雜機(jī)理和影響因素。目前,航司普遍采用的航程油量計(jì)算方法比較單一,主要是基于載荷、飛行軌跡和氣象信息,根據(jù)廠家提供的性能曲線和簽派員經(jīng)驗(yàn),由燃油計(jì)劃系統(tǒng)(Fuel Plan System,FPS)綜合計(jì)算出航班的航程油加注量。然而這一方法僅僅考慮了飛行計(jì)劃相關(guān)因素,而沒有考慮飛機(jī)性能變化、不同區(qū)域特有運(yùn)行環(huán)境和特殊氣象等因素,這導(dǎo)致了對航程油消耗的過高估計(jì),并由此帶來了較高的航班剩余落地油。
近年來,隨著大數(shù)據(jù)技術(shù)的進(jìn)步和普及,數(shù)據(jù)驅(qū)動(dòng)的預(yù)測方法相較于傳統(tǒng)方法有了明顯優(yōu)勢,推動(dòng)了機(jī)器學(xué)習(xí)在航空產(chǎn)業(yè)實(shí)踐當(dāng)中的廣泛應(yīng)用。不少學(xué)者基于航空運(yùn)行數(shù)據(jù),借助機(jī)器學(xué)習(xí)方法開展了航班油耗模型研究。文獻(xiàn)[6]根據(jù)美國運(yùn)輸統(tǒng)計(jì)局(Bureau of Transportation Statistics,BTS)飛行任務(wù)數(shù)據(jù)庫,生成了40種機(jī)型的燃油消耗數(shù)據(jù)庫,為每種機(jī)型導(dǎo)出了基于樣本的線性回歸模型。該文獻(xiàn)的驗(yàn)證結(jié)果表明,針對總?cè)加拖牧康念A(yù)測上,其所提出的模型相對傳統(tǒng)方法具有更好的擬合精度。文獻(xiàn)[11]利用支持向量機(jī)建立了飛機(jī)爬升階段燃油流量模型,為航空公司監(jiān)控燃油消耗提供參考。文獻(xiàn)[12]分析了燃油系統(tǒng)的飛行數(shù)據(jù),并基于此訓(xùn)練BP(Back Propagation)神經(jīng)網(wǎng)絡(luò),建立了飛機(jī)燃油估計(jì)模型。文獻(xiàn)[13]分析了燃油系統(tǒng)的飛行數(shù)據(jù),并基于此訓(xùn)練BP神經(jīng)網(wǎng)絡(luò),建立了飛機(jī)燃油估計(jì)模型。此外,當(dāng)燃油系統(tǒng)出現(xiàn)故障或發(fā)生故障時(shí),利用異常數(shù)據(jù),該模型可以檢測到燃油系統(tǒng)的異常狀況并警告飛行員。
盡管上述研究在航空燃油預(yù)測方面取得了一定突破,但這些研究通常都針對某一固定運(yùn)行場景或固定機(jī)型,考慮因素比較片面,無法推廣到更通用情況中。例如,文獻(xiàn)[4]建立的模型僅適用于B737型客機(jī)在航程結(jié)束后的燃油使用估算;文獻(xiàn)[11]建立模型僅可用于B777型客機(jī)在爬升階段的燃油流量預(yù)測。然而,當(dāng)前影響航班運(yùn)行的因素復(fù)雜,所采集的數(shù)據(jù)呈現(xiàn)出多源異構(gòu)的形式,因此,上述研究都沒能充分解決基于多元數(shù)據(jù)表征油耗變化的關(guān)系。
此外,上述研究還存在另一個(gè)重要的局限性:它們都沒有考慮航班燃油預(yù)測的安全性偏好。航班安全性的重要度要遠(yuǎn)大于航班經(jīng)濟(jì)性,航班如果在飛行中油量不足,可能導(dǎo)致非常嚴(yán)重的后果。因此,在制作飛行計(jì)劃時(shí),既要盡可能精準(zhǔn)估算油耗,也需要保證有一定的安全裕度,以應(yīng)對突發(fā)狀況,保證飛行安全,這就導(dǎo)致航班的油量加注是具有一定的風(fēng)險(xiǎn)偏好(通常會(huì)優(yōu)先規(guī)避安全風(fēng)險(xiǎn))。而上述研究中預(yù)測模型的系數(shù)不能夠充分根據(jù)航班的風(fēng)險(xiǎn)偏好進(jìn)行調(diào)整。這些問題會(huì)很大程度降低油耗預(yù)測的準(zhǔn)度、精度和實(shí)用性。
針對這些局限性,隨機(jī)森林(Random Forest,RF)算法被認(rèn)為是一種較為有效的解決方法。RF是一種經(jīng)典的、高度靈活且穩(wěn)定的機(jī)器學(xué)習(xí)算法。RF 算法由決策樹理論發(fā)展而來,其本質(zhì)是利用多棵決策樹對樣本進(jìn)行訓(xùn)練并預(yù)測的一種分類器。隨機(jī)森林的優(yōu)點(diǎn)眾多,主要有:①對于大規(guī)模的數(shù)據(jù),它可以產(chǎn)生高準(zhǔn)確度的分類器;②它可以處理大量的輸入變量;③它可以在決定類別時(shí),評估變量的重要度;④它可以有效地估計(jì)缺省值,并且在缺省值較多時(shí)仍可維持準(zhǔn)確度;⑤它計(jì)算了各例中的親近度,能夠幫助數(shù)據(jù)挖掘、偵測離群點(diǎn)和將資料視覺化;⑥學(xué)習(xí)過程相對較快。
RF算法的上述優(yōu)點(diǎn)能夠有效地解決當(dāng)前基于機(jī)器學(xué)習(xí)進(jìn)行航空燃油預(yù)測的2個(gè)瓶頸,即數(shù)據(jù)的多元異構(gòu)性和對風(fēng)險(xiǎn)的偏好性。有小部分研究已經(jīng)嘗試將RF 算法應(yīng)用于航空領(lǐng)域,如文獻(xiàn)[12]。但是該研究并未徹底解決數(shù)據(jù)的異構(gòu)性,也沒能實(shí)現(xiàn)基于風(fēng)險(xiǎn)偏好調(diào)整的預(yù)測。
因此,為了實(shí)現(xiàn)對航班航程油量進(jìn)行精準(zhǔn)推理并給出額外油建議量值,本文針對當(dāng)前研究中的缺失,基于經(jīng)典的機(jī)器學(xué)習(xí)算法——RF,使用大量的多元異構(gòu)歷史航班數(shù)據(jù)做融合處理與分析,挖掘航班數(shù)據(jù)的規(guī)律,在平衡經(jīng)濟(jì)性與安全性的條件下,利用風(fēng)險(xiǎn)偏好系數(shù)調(diào)整(Adjustment of Risk Preference Coefficient,ARPC)設(shè)置擬合目標(biāo),提出一種帶ARPC 的RF 算法。本文各章節(jié)安排如下:第1節(jié)對研究問題進(jìn)行描述與分析;第2節(jié)展示了本研究模型的構(gòu)造;第3節(jié)將模型應(yīng)用到實(shí)際數(shù)據(jù)中;第4節(jié)對本研究進(jìn)行總結(jié)和展望。
給飛機(jī)加注過量的燃油影響航班的經(jīng)濟(jì)性和有效商業(yè)載荷,添加的燃油不足則威脅飛行安全。因此,精準(zhǔn)預(yù)測航班所需的航程油量意義重大,下面對本文的研究問題進(jìn)行描述并探索數(shù)據(jù)的規(guī)律。
航程油量:飛機(jī)從出發(fā)機(jī)場起飛到目的地機(jī)場降落過程中所消耗的燃油量。
影響航班航程油消耗量的因素眾多,包括:飛機(jī)性能、飛機(jī)重量、發(fā)動(dòng)機(jī)性能、商業(yè)載荷、總飛行距離、巡航階段高度層、速度、風(fēng)速及風(fēng)向、所處高度層的空氣溫度和飛行員的操控習(xí)慣等。此外,在進(jìn)行航程油量預(yù)測時(shí),航班的額外油添加量也是一個(gè)關(guān)鍵因素。額外油量指簽派員根據(jù)航線上出現(xiàn)的特殊情況,酌情添加的油量。額外油量的影響因素包括雷雨、流控和軍事活動(dòng)等。由于FPS在航程油量計(jì)算上受制于模型的框架和飛機(jī)性能曲線,不能準(zhǔn)確給出航程油量。因此需要簽派員根據(jù)當(dāng)時(shí)運(yùn)行情況,憑借經(jīng)驗(yàn)添加額外油,當(dāng)前實(shí)際加注的航程油量為“FPS計(jì)算航程油+額外油”?;谶@一事實(shí)判斷,本文綜合使用上述與航程油和額外油消耗量相關(guān)的影響因素,構(gòu)建航程油量預(yù)測模型。本文所采用的相關(guān)數(shù)據(jù)來自某航司(以下稱X 航)。
通過對所收集數(shù)據(jù)的初步探索,確定其屬于多元的結(jié)構(gòu)化數(shù)據(jù),特征間以非線性關(guān)系為主,部分具有一定線性關(guān)系。此外數(shù)據(jù)的主要類型是以連續(xù)性數(shù)值型,其他少量文本型數(shù)據(jù)也可通過特征編碼轉(zhuǎn)換為離散數(shù)值型數(shù)據(jù)。這種情況下,多元連續(xù)數(shù)值型數(shù)據(jù)能夠以航班ID 為主鍵進(jìn)行關(guān)聯(lián),進(jìn)而以向量化的形式對航班進(jìn)行特征描述。通過在諸多特征項(xiàng)和航程油消耗量之間建立回歸關(guān)系,表征出不同運(yùn)行場景(飛行航線、運(yùn)行時(shí)段和氣象條件)下每個(gè)航班的油耗變化。因此,航程油量預(yù)測問題可歸結(jié)為一類多元數(shù)據(jù)的回歸分析問題,而該問題的核心是構(gòu)造航班油耗表征向量。
由上述的問題描述和數(shù)據(jù)探索可知,航程油量計(jì)算是面向多場景的、非線性的結(jié)構(gòu)化復(fù)雜決策問題。而傳統(tǒng)方法往往難以準(zhǔn)確地描述這種復(fù)雜的非線性特征。由于當(dāng)前航空公司的數(shù)據(jù)倉庫已積累了豐富的涵蓋各類場景的航班運(yùn)行數(shù)據(jù),使得該問題適合于使用機(jī)器學(xué)習(xí)算法構(gòu)造回歸模型進(jìn)行決策。本文將構(gòu)造航班油耗的表征向量,結(jié)合風(fēng)險(xiǎn)偏好的特點(diǎn),改進(jìn)RF 算法解決該回歸分析問題,最終提出一個(gè)新的航程油量預(yù)測模型。
由于航班航程油消耗量及其影響因子可通過行向量的形式表示,且已有特征項(xiàng)大多數(shù)為數(shù)值型或可用數(shù)值編碼表示的字符型數(shù)據(jù),本文結(jié)合航程油量預(yù)測問題的特點(diǎn)選取特征項(xiàng)和評價(jià)指標(biāo),具體如下。
2.1.1 特征項(xiàng)
在模型特征變量上,參與決策的特征項(xiàng)涉及航班執(zhí)飛時(shí)段和運(yùn)行環(huán)境的特征:①執(zhí)飛月份,②執(zhí)飛時(shí)刻,③航線編碼;涉及航班載荷的特征:④商業(yè)載荷,⑤乘客數(shù)量;涉及執(zhí)飛飛機(jī)性能相關(guān)的特征:⑥飛機(jī)構(gòu)型,⑦機(jī)齡,⑧左引擎齡,⑨右引擎齡,⑩發(fā)動(dòng)機(jī)性能參數(shù);涉及飛行情報(bào)信息的:○1 航段距離,○12 起降階段環(huán)境風(fēng)險(xiǎn)值,○13 巡航階段綜合風(fēng)險(xiǎn)值,○14 航線平均高度,○15 航線平均風(fēng)。此外,為了提升模型在多場景下的擬合精度,本文模型將參考FPS決策數(shù)據(jù),引用:○16 計(jì)劃航段時(shí)間,○17 計(jì)劃油量,○18 是否加注額外油參與模型決策。特征項(xiàng)如表1所示。
表1 模型特征項(xiàng)的典型值及上下界Table 1 Features and their typical example values in proposed model
2.1.2 評價(jià)指標(biāo)
在模型擬合目標(biāo)上,過往研究主要關(guān)注模型的擬合精度,常用的數(shù)學(xué)評價(jià)指標(biāo)有:均方根誤差值(Root Mean Squared Error,RMSE)、平均絕對誤差(Mean Absolute Error,MAE)和確定系數(shù)(Coefficient of Determination),?;貧w分析預(yù)測值通常是圍繞著擬合目標(biāo)上下分布。一般認(rèn)為RMSE、MAE和達(dá)到最優(yōu)的模型既是優(yōu)秀。
經(jīng)濟(jì)性方面,由于航班的燃油效益與航程油剩余量和航班額外多帶油量直接相關(guān),本研究通過計(jì)算航班落地后的航程油剩余量和平均每班多帶油量,衡量航班帶油量的經(jīng)濟(jì)性。
安全性方面,民航運(yùn)行始終將安全放在第一位。若航程油量預(yù)測值低于實(shí)際航程油消耗量,即出現(xiàn)因航程油量部分不足而消耗其他油量(如額外油)的情況,從業(yè)務(wù)的角度認(rèn)為這是存在潛在安全風(fēng)險(xiǎn)的,面向民航的航程油量預(yù)測問題應(yīng)在考慮安全性的基礎(chǔ)上追求經(jīng)濟(jì)性。基于安全性的考慮并結(jié)合業(yè)務(wù)實(shí)踐經(jīng)驗(yàn),本研究對模型做出一個(gè)限制:因預(yù)測模型推理得到的航程油量不足而使用到額外油大于100 kg的比例不應(yīng)大于FPS得到結(jié)果的使用比例。
基于上述討論,本文擬采用7 個(gè)評價(jià)指標(biāo)。其中,數(shù)學(xué)評價(jià)指標(biāo)有3個(gè):RMSE、MAE 和。業(yè)務(wù)評價(jià)指標(biāo)有4個(gè):經(jīng)濟(jì)性指標(biāo)(Economic Index,EcoI),包括LD—落地航程油剩余,和MMB—平均每班多帶油;安全性指標(biāo)(Safety Index,SI),包括SY—使用額外油的航班比例,以及SY100—使用額外油>100 kg比例。
RF算法是著名學(xué)者Breiman提出的一種集成學(xué)習(xí)方法,其中元學(xué)習(xí)器為分類回歸決策樹
(Classification And Regression Trees,CART)。RF 引入重采樣技術(shù)(Bootstrap Aggregating,Bagging)和隨機(jī)選擇分裂屬性,其核心思想是并列生成多顆決策樹組成森林通過廣度的增加來防止過擬合,達(dá)到最優(yōu)分類或回歸,解釋輸入特征項(xiàng),,,…x 對標(biāo)簽項(xiàng)的作用,使其泛化性能相較元學(xué)習(xí)器得到顯著的提升。大量的理論和實(shí)證研究都證明了RF算法具有較高的預(yù)測準(zhǔn)確率,對異常值和噪聲具有很好的容忍度,且能有效規(guī)避過擬合。RF 適應(yīng)性廣,不僅能處理連續(xù)變量數(shù)據(jù),也能處理離散變量數(shù)據(jù)。此外,RF參數(shù)相對較少,可調(diào)優(yōu)空間大,支持并行化運(yùn)算,在處理大規(guī)模的結(jié)構(gòu)化數(shù)據(jù)時(shí)表現(xiàn)出優(yōu)異的性能和較高的效率。
基于RF算法,本文模型框架構(gòu)建如下。特征項(xiàng)x 的回歸樹模型可以表示為
對于回歸樹(x ),在訓(xùn)練數(shù)據(jù)集D所在的輸入空間中,遞歸地將每個(gè)區(qū)域劃分為2個(gè)子區(qū)域并決定每個(gè)子區(qū)域上的輸出值,構(gòu)建二叉決策樹。具體步驟如下:
選擇最優(yōu)切分變量與切分點(diǎn),求解:
求解方式為:遍歷變量,對固定的切分變量掃描切分點(diǎn),選擇使式(2)達(dá)到最小值的(,)。
2 用步驟1中選定的(,)劃分區(qū)域并決定相應(yīng)的輸出值:
重復(fù)對2個(gè)子區(qū)域調(diào)用次步驟1和步驟2,直至完成。
將輸入空間劃分為個(gè)區(qū)域,,…,R ,生成決策樹式(1)。
隨機(jī)森林算法將訓(xùn)練數(shù)據(jù)集,按樣本隨機(jī)和特征隨機(jī)的方式劃分成個(gè)隨機(jī)特征向量,,,…,D,分別使用決策樹執(zhí)行回歸分析,并得到個(gè)決策結(jié)果,最后通過投票的方式?jīng)Q定最優(yōu)結(jié)果。圖1顯示了基于RF算法的航程油量預(yù)測模型結(jié)構(gòu)。
圖1 基于RF的航程油量預(yù)測模型結(jié)構(gòu)示意圖Fig.1 Structure of trip fuel prediction model for flight based on RF
式中:和為偏好系數(shù)。應(yīng)用ARPC 法,可以根據(jù)對不同航線的不同風(fēng)險(xiǎn)偏好,通過系數(shù)設(shè)定,間接影響不同種模型的預(yù)測結(jié)果。當(dāng)>代表較小的風(fēng)險(xiǎn)偏好,反之風(fēng)險(xiǎn)偏好較大。若=0,=1表示按實(shí)際油耗訓(xùn)練模型,代表最大風(fēng)險(xiǎn)偏好,=1,=0表示按FPS計(jì)劃油耗訓(xùn)練模型,代表最小風(fēng)險(xiǎn)偏好。例如,面向航線情報(bào)明晰、飛行環(huán)境正常、傾向于更低的落地油量冗余的情況,可在(0.5,1]的區(qū)間內(nèi)設(shè)置;若希望由ARF 完全依賴歷史航班油耗數(shù)據(jù)做出航程油量推理,可設(shè)置=0,=1。這樣,該模型可以針對目標(biāo)的風(fēng)險(xiǎn)偏好調(diào)整系數(shù),以使模型能夠滿足不同風(fēng)險(xiǎn)偏好的優(yōu)先級。
然后,對設(shè)置的模型進(jìn)行訓(xùn)練。由于航程油量預(yù)測是典型的回歸問題,而在訓(xùn)練模型時(shí),實(shí)現(xiàn)RF回歸要求RF 的每棵決策樹是CART。結(jié)點(diǎn)的分裂規(guī)則是影響隨機(jī)森林最重要的一個(gè)因素,針對本文問題,擬采用最大化均方誤差下降量作為結(jié)點(diǎn)的分裂規(guī)則。
設(shè)當(dāng)前結(jié)點(diǎn)的樣本集為={(v ,y )|=1,2,…,},其中v為航程油量的特征項(xiàng)構(gòu)成的影響因數(shù)(如表1所示),y 是航程油加注量。的一個(gè)劃分=∪,∩=?,均方誤差下降量定義為
式中:Var為樣本集與航程油量特征項(xiàng)相關(guān)的均方誤差。最大化均方誤差下降量規(guī)則表示為
式中:為所有可能的劃分集合。
為驗(yàn)證模型的準(zhǔn)確性和有效性,本研究采集了X 航2018年1月1日—2019年12月31日之間的部分國內(nèi)航線的飛行計(jì)劃、航班運(yùn)行、風(fēng)險(xiǎn)風(fēng)控和飛機(jī)性能數(shù)據(jù)。針對這些數(shù)據(jù),按模型所需的結(jié)構(gòu)進(jìn)行預(yù)處理并剔除異常航班,最終得到約50萬行有效航班數(shù)據(jù),包含18項(xiàng)特征和1項(xiàng)標(biāo)簽,如表1 所示。所有數(shù)據(jù)被隨機(jī)分成3 部分:80%的數(shù)據(jù)用于模型訓(xùn)練,16%的數(shù)據(jù)用于模型測試,綜合考慮樣本規(guī)模和航司的業(yè)務(wù)實(shí)踐,取4%的數(shù)據(jù)(某自然月)用于業(yè)務(wù)驗(yàn)證。
在全量樣本上評估模型的擬合能力,設(shè)置=0,=1,引入線性回歸模型(Linear Regression,LR)和二次多項(xiàng)回歸模型(Polynomial Regression of Degree Two,2DPR)模型作為對比。其中,LR 使用的是最小二乘法來實(shí)現(xiàn),從線性關(guān)系的角度評估航程油量模型;2DPR 是通過從系數(shù)構(gòu)造多項(xiàng)式特征項(xiàng),以實(shí)現(xiàn)在數(shù)據(jù)的非線性函數(shù)上訓(xùn)練線性模型,達(dá)到快速特征擴(kuò)張,訓(xùn)練更大范圍數(shù)據(jù)的效果。對ARF 進(jìn)行5 折交叉檢驗(yàn),并使用GridSearch對基決策樹數(shù)量和分裂深度進(jìn)行參數(shù)尋優(yōu)。在測試集上,計(jì)算各模型的RMSE、MAE和值,并記錄訓(xùn)練模型所消耗的時(shí)間,以評價(jià)模型的擬合能力和效能。實(shí)驗(yàn)結(jié)果如表2所示。
從表2 結(jié)果可以看出,ARF 模型的RMSE和MAE在3個(gè)模型中最小(248和185)。這說明ARF模型的預(yù)測誤差是3種模型當(dāng)中最小的。而ARF模型的在3個(gè)模型當(dāng)中最大(0.9828)說明了ARF模型相比于另外2種模型更準(zhǔn)確地解釋了航程油消耗量的變化,對航程油量預(yù)測問題具有更好的擬合能力。然而,ARF模型的訓(xùn)練時(shí)間是3 種模型中最長的(365 s)。這說明了ARF模型的構(gòu)造需要較多的時(shí)間。考慮到航程油量預(yù)測模型不需要實(shí)時(shí)在線更新,因此,365 s(約6 min)是可以接受的。此外,LR 模型相比2DPR 模型取得了更好的航程油量預(yù)測效果,說明已有特征項(xiàng)和油耗標(biāo)簽項(xiàng)之間具有一定的線性相關(guān)關(guān)系,構(gòu)造額外的二次特征項(xiàng)并不能有效提升模型擬合精度??傮w來說,ARF 模型在RMSE、MAE和上均優(yōu)于LR 和2DPR 模型,表現(xiàn)出相對較好的模型性能,說明其對航程油量具有較好的擬合能力和泛化能力。
表2 模型對比測試實(shí)驗(yàn)Table 2 Comparing test for different models
為了進(jìn)一步驗(yàn)證ARPC 的有效性,以及模型在實(shí)際業(yè)務(wù)中的表現(xiàn),在此使用2.1.2節(jié)中提出的兩方面評價(jià)指標(biāo):EcoI和SI。EcoI評估在航線上應(yīng)用文本模型后相對FPS能節(jié)省多少帶油量,包括總節(jié)省量和平均每班節(jié)省量;SI評估航班因航程油量不足而使用到額外油量的航班占總驗(yàn)證航班集的比例及使用量超出100 kg的數(shù)量。在X航司2個(gè)經(jīng)典航向上(南北向和東西向)分別取一條航班量相對較大的熱點(diǎn)航線,即:航線A(南北向)和B(東西向)做驗(yàn)證集(1 個(gè)自然月航班量)。使用ARF 分別建模并與現(xiàn)有FPS計(jì)劃的油量進(jìn)行對比分析。ARF 模型設(shè)置如下:①以落地剩油最低為目標(biāo),設(shè)置=0,=1,作為ARF-1;②以均衡落地剩油量和安全性為目標(biāo),設(shè)置=05,=05,作為ARF-2。分別計(jì)算各模型的RMSE、MAE和,以及EcoI、SI相關(guān)指標(biāo),結(jié)果如表3所示。
表3 針對航線A和B的模型評估Table 3 Assessment for different models by scheduled routes A and B
從表3 可以看出,針對航線A,ARF-1 和ARF-2的數(shù)學(xué)指標(biāo)皆優(yōu)于FPS,對不同場景下的油耗變化具有更好的表征能力。在經(jīng)濟(jì)上,ARF-1的總落地剩油量最低(23 t),平均每班僅多帶101 kg。而ARF-2 模型相較FPS 每月能減少攜帶54.47 t燃油,平均每班少帶361 kg,也取得了不錯(cuò)的節(jié)油效果。在安全性上,ARF-2 模型僅使12.12%的航班需使用到額外油,且額外油使用量大于100 kg的航班僅占5.22%,而FPS計(jì)劃的這2個(gè)數(shù)據(jù)分別為16.52%和7.20%,這說明使用ARF 模型進(jìn)行預(yù)測的整體安全性要高于FPS。而在經(jīng)濟(jì)性上表現(xiàn)較好的ARF-1 則顯露出了較大的潛在安全隱患,若單純追求經(jīng)濟(jì)性(=0,=1),將使大約27.53%的航班可能因加注的航程油量不夠而使用到其他階段的油量。
針對航線B,在數(shù)學(xué)指標(biāo)上,基于ARF 的模型相較FPS 皆表現(xiàn)出了優(yōu)越性。在經(jīng)濟(jì)性上,ARF-1的節(jié)帶油效果最為顯著,總落地剩油僅為1.87 t。ARF-2相較FPS每月能減少48.87 t燃油攜帶量。在安全性方面,ARF-1的安全性不能令人滿意。雖然ARF-2相較FPS有更多航班使用到額外油(23.28%vs 14.66%),但是ARF-2更少的航班使用額外油大于100 kg(6.25%vs 5.17%),考慮到該航線總的燃油攜帶量,以當(dāng)前的燃油政策加注儲(chǔ)備油量遠(yuǎn)遠(yuǎn)多于100 kg,足以應(yīng)付。
為了更好展示計(jì)劃航程油量、實(shí)際航程油消耗量和預(yù)測航程油量間的數(shù)量關(guān)系,從航線A 的驗(yàn)證集中抽取了36條航班油量預(yù)測數(shù)據(jù),繪制成示例圖,如圖2所示。
圖2 計(jì)劃、實(shí)際與預(yù)測航程油量對比Fig.2 Comparison between planned,actual and predicted trip fuel
綜上所述,使用帶ARPC的RF算法,在不同的系數(shù)設(shè)置之下,表現(xiàn)出了不同的風(fēng)險(xiǎn)偏好。所提出的模型相較FPS在更精準(zhǔn)擬合航程油量的同時(shí),也克服了傳統(tǒng)RF 模型沒有考慮安全性的缺陷,在經(jīng)濟(jì)性和安全性上取得了良好的平衡。數(shù)據(jù)實(shí)驗(yàn)結(jié)果驗(yàn)證了本文提出的模型設(shè)計(jì)目標(biāo)。
為了提升燃油的經(jīng)濟(jì)性并同時(shí)保障航班的安全性,本文利用機(jī)器學(xué)習(xí)的方法,從多源異構(gòu)的歷史數(shù)據(jù)出發(fā),提出了基于帶ARPC 的隨機(jī)森林算法的航班航程油量預(yù)測模型。根據(jù)X 航已有的飛行計(jì)劃、航班運(yùn)行、風(fēng)控風(fēng)險(xiǎn)、飛機(jī)性能等數(shù)據(jù),通過對問題解析分析,將航程油量預(yù)測問題歸結(jié)為一類基于多元航空數(shù)據(jù)的回歸分析問題。利用來自X 航的實(shí)際運(yùn)行數(shù)據(jù)同時(shí)對本文所提出的模型和傳統(tǒng)的FPS算法做了數(shù)據(jù)實(shí)驗(yàn)。結(jié)果表明,與傳統(tǒng)的FPS算法相比,該模型能夠有效表征出多場景下的航程油消耗,模型具有更好的燃油擬合能力,對應(yīng)航班表現(xiàn)出更好的燃油經(jīng)濟(jì)性和安全性。該模型在提出后已經(jīng)被應(yīng)用于X 航部分航班的飛行計(jì)劃制作和節(jié)能減排分析中,在航前使用模型推理航班航程油量,為簽派員加注航班燃油提供重要參考,并在航后與實(shí)際消耗量進(jìn)行對比分析,不斷訓(xùn)練并優(yōu)化模型。
在未來的研究中可嘗試使用多模型組成復(fù)合模型,充分利用不同模型的優(yōu)點(diǎn),通過兩階段推理的方式,進(jìn)一步提升航班航程油量的預(yù)測精度。