• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于二次分解重構(gòu)策略的航空客流需求預(yù)測

      2022-12-18 08:11:38栗慧琳李洪濤
      計算機應(yīng)用 2022年12期
      關(guān)鍵詞:客流復(fù)雜度分量

      栗慧琳,李洪濤,李 智

      (蘭州交通大學(xué) 交通運輸學(xué)院,蘭州 730070)

      0 引言

      隨著中國經(jīng)濟的快速發(fā)展和人民生活水平的逐步提升,大眾出行方式的選擇發(fā)生了重要變化,航空運輸業(yè)以其快速、舒適、便捷等特點日益受到人們的青睞。近年來,我國的航空客運需求不斷增長,給航空運輸保障工作、機場建設(shè)規(guī)劃管理以及航空公司市場發(fā)展帶來了一系列的機遇和挑戰(zhàn)。各國政府和市場參與者必須準(zhǔn)確預(yù)判航空客流需求的變化情況,對未來發(fā)展做出戰(zhàn)略性規(guī)劃,在合理利用資源、滿足運輸需求的同時,為航空所在地區(qū)創(chuàng)造更大的經(jīng)濟和社會價值[1];而航空客流需求受諸多復(fù)合因素共同影響,在數(shù)據(jù)上呈現(xiàn)一定的波動性、不規(guī)則性和不穩(wěn)定性,這使得準(zhǔn)確預(yù)測航空客流需求成為一項艱巨的任務(wù)。

      在此背景下,國內(nèi)外眾多學(xué)者對航空客運需求預(yù)測進行了研究,取得了若干成果。當(dāng)前對航空客運需求的研究主要集中在定量預(yù)測方面,常用的方法有計量經(jīng)濟模型(如Holt-Winters[2]、自回歸單整移動平均(AutoRegressive Integrated Moving Average,ARIMA)模型[3]、自回歸單整移動平均季節(jié)(Seasonal ARIMA,SARIMA)模型[4]、廣義自回歸條件異方差(Generalized AutoRegressive Conditional Heteroscedasticity,GARCH)模 型[5]和全局 向量自回歸(Global Vector AutoRegression,GVAR)模型[6]等)和人工智能模型(如反向傳播神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network,BPNN)[7]、支持向量機(Support Vector Machine,SVM)[8]、回聲狀態(tài)網(wǎng)絡(luò)(Echo State Network,ESN)[9]、長短期記憶(Long Short-Term Memory,LSTM)網(wǎng)絡(luò)[10]等)。上述研究成果都為航空運輸業(yè)的發(fā)展提供了一定參考價值,然而經(jīng)濟發(fā)展、地理人口、市場結(jié)構(gòu)以及政策調(diào)整等諸多因素都會影響航空客流需求數(shù)據(jù)。為了提高預(yù)測方法的準(zhǔn)確性和有效性,克服單一模型的缺陷,研究者提出了綜合集成模型理論,即利用不同方式將具有各類優(yōu)勢的單一模型進行綜合集成。常見的綜合集成模型有兩種方式:第一種是不同模型間組合以獲得更優(yōu)的預(yù)測效果,如ARIMA 模型和灰色預(yù)測模型通過賦權(quán)法進行組合[11],BPNN、LSTM、ESN 和門回 歸單元(Gated Recurrent Unit,GRU)模型的線性組合[12]等;第二種是數(shù)據(jù)分解后將不同分解模態(tài)預(yù)測結(jié)果集成,主要利用不同分解方法來識別和提取時間序列的內(nèi)部特征。如Jin 等[13]利用變分模態(tài)分解(Variational Mode Decomposition,VMD)對原始數(shù)據(jù)進行分解,根據(jù)平穩(wěn)性測試結(jié)果采用自回歸移動平均(AutoRegressive Moving Average,ARMA)模型和核極限學(xué)習(xí)機(Kernel based Extreme Learning Machine,KELM)模型對不同特征分量進行預(yù)測,最后采用KELM 模型非線性集成得到預(yù)測結(jié)果。梁小珍等[14]使用奇異譜分析(Singular Spectrum Analysis,SSA)對原始數(shù)據(jù)進行分解重構(gòu),依據(jù)重構(gòu)序列的復(fù)雜度分別使用粒子群算法和布谷鳥算法雙優(yōu)化的支持向量回歸(Particle Swarm Optimization Cuckoo Search algorithm Support Vector Regression,PSOCSSVR)模型和ARIMA 模型進行預(yù)測,并線性集成預(yù)測結(jié)果。此外,常用的數(shù)據(jù)分解方法還有經(jīng) 驗?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)[15]、集成經(jīng)驗?zāi)B(tài)分解(Ensemble EMD,EEMD)[8]等。實驗結(jié)果表明,采用數(shù)據(jù)分解方法在降低數(shù)據(jù)復(fù)雜度的同時,也較為明顯地改善了模型的預(yù)測性能。

      近年來,有學(xué)者在分解集成思想的基礎(chǔ)上提出了二次分解模型,通過組合不同分解方法,將復(fù)雜度相對較高的分量進行二次分解,以達到充分提取有用信息、降低預(yù)測難度的目的。如梁小珍等[16]采用X12-ARIMA 方法提取了原始數(shù)據(jù)的季節(jié)成分,進而利用改進的自適應(yīng)噪聲互補集成經(jīng)驗?zāi)B(tài)分 解(Improved Complete EEMD with Adaptive Noise,ICEEMDAN)技術(shù)二次分解剩余分量,通過FCM-FTS(Fuzzy C-Means Fuzzy Time Series)模型對各分量序列進行預(yù)測,將預(yù)測結(jié)果線性相加得到最終預(yù)測值。然而,已有的二次分解模型大多并未在二次分解后考察分量特征,直接將各個分量進行了相同處理,這可能導(dǎo)致預(yù)測模型的選取不合理,從而降低模型預(yù)測精度。

      綜上所述,本文提出了一種新的基于二次分解重構(gòu)策略的綜合集成模型(STL-CEEMDAN-SAAKAB)用于航空客流需求預(yù)測。首先,采用STL(Seasonal and Trend decomposition using Loess)分解方法對航空客流量數(shù)據(jù)進行分解,得到相應(yīng)的季節(jié)分量、趨勢分量以及殘余分量,再利用自適應(yīng)噪聲互補集成經(jīng)驗?zāi)B(tài)分解(Complete EEMD with Adaptive Noise,CEEMDAN)對殘余分量進一步分解;然后,根據(jù)相關(guān)特征檢驗結(jié)果,將二次分解后的部分分量與趨勢分量相結(jié)合,重構(gòu)得到新的趨勢分量,同時將其余分量基于復(fù)雜度結(jié)果分為低復(fù)雜度分量和高復(fù)雜度分量;再者,分析不同分量的不同特性,基于模型匹配策略分別采用SARIMA、ARIMA、KELM、雙向長短期記憶(Bidirectional LSTM,BiLSTM)網(wǎng)絡(luò)模型進行預(yù)測,其中KELM 和BiLSTM 模型的超參數(shù)通過自適應(yīng)樹Parzen 估計(Adaptive Tree of Parzen Estimators,ATPE)算法確定;最后,線性集成得到最終預(yù)測結(jié)果。

      本文的創(chuàng)新和特色之處在于:1)STL 和CEEMDAN 相結(jié)合的二次分解策略在充分考慮航空客運量數(shù)據(jù)季節(jié)性特征的同時,還充分挖掘了復(fù)雜分量中的有用信息;2)分析二次分解后不同分量的不同特征,合理進行分量重構(gòu),同時基于模型匹配策略有針對性地選擇預(yù)測模型,提升了綜合集成模型的預(yù)測性能;3)將具有高波動性的殘余分量分為低復(fù)雜度分量和高復(fù)雜度分量,分別采用神經(jīng)網(wǎng)絡(luò)模型KELM 和深度學(xué)習(xí)模型BiLSTM 進行預(yù)測,得到更加精確和穩(wěn)定的預(yù)測效果;4)采用ATPE算法對KELM和BiLSTM模型的超參數(shù)進行確定。

      1 方法與原理

      1.1 分解模型

      1.1.1 STL模型

      STL 是典型的時間序列加性分解方法,該方法相較于傳統(tǒng)的季節(jié)分解方法(如X12-ARIMA、比率移動平均法等)在處理異常值時具有更強的魯棒性[17]。對于航空客流數(shù)據(jù)Yt(t=1,2,…,n),STL 基于Loess 將原始數(shù)據(jù)Yt分解為季節(jié)成分St、趨勢成分Tt和殘余成分Rt,其分解表達式如下:

      STL 是一種由內(nèi)循環(huán)和外循環(huán)兩個遞歸過程組成的迭代方法。每一次內(nèi)循環(huán)分別包含一個更新季節(jié)成分的季節(jié)性平滑和一個更新趨勢成分的趨勢平滑。內(nèi)循環(huán)完成后,計算外循環(huán)中的魯棒權(quán)值并將其應(yīng)用于減少外循環(huán)對下一個內(nèi)循環(huán)中季節(jié)成分和趨勢成分更新的影響。在第k+1 次迭代的外循環(huán)中,用內(nèi)循環(huán)中得到的趨勢成分和季節(jié)成分計算殘余分量。對于Rt中的任何過大值都被視為異常值,并基于異常值計算一個權(quán)值,在下一次內(nèi)循環(huán)的迭代中,權(quán)重被用來降低上一次外循環(huán)迭代中識別出的異常值的影響。

      1.1.2 CEEMDAN模型

      EMD 技術(shù)作為一種自適應(yīng)數(shù)據(jù)分析方法,主要應(yīng)用于分析非線性和非平穩(wěn)數(shù)據(jù),它可將復(fù)雜數(shù)據(jù)分解為有限個本征模態(tài)函數(shù)(Intrinsic Mode Function,IMF)。但該方法容易出現(xiàn)模態(tài)混淆現(xiàn)象,即在某個IMF 中存在不同模式的信號成分,或者相似模式信號出現(xiàn)在不同IMF 中。為解決此問題,EEMD 方法被提出,該方法在原始數(shù)據(jù)中加入高斯白噪聲,從而緩解模態(tài)混淆的問題;但因多次反復(fù)加入白噪聲會造成最終數(shù)據(jù)分解成分中包含殘留噪聲且無法徹底消除,同時新數(shù)據(jù)序列因加入不同的白噪聲在分解過程中可能產(chǎn)生不同數(shù)量的分量,導(dǎo)致新的問題生成。為此,CEEMDAN 方法被提出,該方法解決了EEMD 方法中存在的問題,獲得了更好的自適應(yīng)性和收斂性[18]。相較于EMD 和EEMD 方法,CEEMDAN 方法在每次分解時引入懲罰系數(shù)ω來控制噪聲水平。在逐步分解過程中,CEEMDAN 方法通過M次對剩余分量r(t)和噪聲ε(t)重新組合分解的方式,以此來消除噪聲的干擾。對于一個原始數(shù)據(jù)Y(t),該方法將Y(t)分解為N個IMF 分量和一個殘余分量R,表達式如下:

      1.2 特征分析

      1.2.1 樣本熵

      樣本熵(Sample Entropy,SE)作為近似熵的改進版,是一種用來衡量時間序列復(fù)雜度的方法,具有較強的魯棒性。SE 的核心思想是通過衡量重建后時間序列的子向量之間的距離來測量復(fù)雜度,子向量之間的距離越近則時間序列的復(fù)雜度越低[19]。對于一個長度為n的時間序列x(t),首先計算重建子序列對應(yīng)元素間的絕對值距離,根據(jù)距離值來衡量其概率Cm(r),最終確定x(t)的樣本熵值:

      其中:m為重建時間序列移動窗口的嵌入維數(shù),本文設(shè)定為2;r為寬容度,基于x(t)的標(biāo)準(zhǔn)差SD來確定的,具體為r=0.2 ×SD(x(t))。

      1.2.2 最大信息系數(shù)

      最大信息系數(shù)(Maximal Information Coefficient,MIC)用來描述大數(shù)據(jù)下任意兩組隨機變量之間的相關(guān)程度,它不易受異常值影響,具有普適性和公平性的數(shù)據(jù)測量特點[20]。如果兩 個變量X={xi,i=1,2,…,n} 和Y={yi,i=1,2,…,n}之間存在某種關(guān)系,則可作為一個有序集合D=(x,y),然后將x和y在數(shù)據(jù)X和Y方向上采取某種方式以網(wǎng)格方式劃分,這就可以使得大多數(shù)點集中落在單元格里,由此可計算兩組變量的MIC 值:

      其中:B(n)=nα為樣本數(shù)n的函數(shù),代表搜索網(wǎng)格的上界,α為一個自定義參數(shù),本文設(shè)定為0.6;I(D,X,Y)是在X和Y網(wǎng)格上由D產(chǎn)生的分布的所有最大互信息。如果兩組變量X和Y之間相關(guān)程度越強,則MIC(D)越趨近于1;反之,越接近0,則說明兩變量越有可能為獨立變量。

      1.3 預(yù)測模型

      1.3.1 ARIMA模型

      ARIMA 是Box 和Jenkins 提出的用于非季節(jié)性平穩(wěn)時間序列數(shù)據(jù)分析和預(yù)測的模型[21]。該模型由自回歸項(AR)的階數(shù)p、移動平均項(MA)的階數(shù)q和使時間序列平穩(wěn)化的差分階數(shù)d組成,可簡寫為ARIMA(p,d,q)。具體表達式為:

      其中:{xi}(i=1,2,…,N)為一個平穩(wěn)序列,αi為自相關(guān)系數(shù),βi為誤差項系數(shù),δ為常量,εt為白噪聲序列。其中前半部分為AR 項,用來描述當(dāng)前時間序列數(shù)據(jù)值與歷史時間序列數(shù)據(jù)值之間的關(guān)系,用變量自身的歷史數(shù)據(jù)預(yù)測未來值;后半部分為MA 項,主要是通過移動平均法消除預(yù)測中的隨機波動造成的誤差累加。

      1.3.2 SARIMA模型

      SARIMA 具體包括非季節(jié)項ARIMA(p,d,q)和季節(jié)項(P,D,Q)s,可簡寫為SARIMA(p,d,q)(P,D,Q)s。其中季節(jié)項的P、D和Q分別代表季節(jié)AR 項、季節(jié)差分項和季節(jié)MA 項,通過對一個s周期的時間序列數(shù)據(jù)進行季節(jié)項分析其季節(jié)波動規(guī)律[22]。該模型的一般表達式為:

      其中:ΦP(Ls)為季節(jié)P階自回歸算子、ΘQ(Ls)為季節(jié)Q階移動平均算子,μt為白噪聲過程。對于時間序列x(t),L為后移算子,即Ls=y(t-s)/y(t)。

      1.3.3 KELM模型

      極限學(xué)習(xí)機(Extreme Learning Machine,ELM)是快速單隱層前饋神經(jīng)算法的一種特殊變體,由于輸入權(quán)值和偏差是隨機產(chǎn)生的,因此計算速度很快(如圖1 所示)。根據(jù)ELM 原則,采用線性方程組的最小二乘法求解Hβ=T可推導(dǎo)為β=H?T,其中H?=HT(HHT)-1是矩陣H的Moore-Penrose 廣義逆矩陣。然而,在廣義逆矩陣H?中,由于HHT的多重共線性會導(dǎo)致其不是一個非奇異矩陣,這可能造成預(yù)測結(jié)果不準(zhǔn)確的問題。為了克服ELM 的隨機輸出,提高其泛化性能,提出了一種引入正則化和核函數(shù)的方案來改進ELM,即KELM 模型[23]。因此,在優(yōu)化階段,可采用正則化系數(shù)C獲得權(quán)重向量β,即:

      圖1 KELM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 KELM neural network structure

      其中:I代表一個N維的單位矩陣;HHT(i,j)=K(xi,xj)代表ELM 的核矩陣(記為ΩELM),K(·)代表核函數(shù)。對于一個給定的訓(xùn)練樣本(xi,yi),其隱含層激活函數(shù)為h(x),則KELM 的輸出函數(shù)推導(dǎo)為:

      其中:核函數(shù)K(·)根據(jù)不同的訓(xùn)練數(shù)據(jù)進行調(diào)整,常用的有四種核函數(shù),即徑向基核函數(shù)、線性核函數(shù)、多項式核函數(shù)和小波核函數(shù)。

      1.3.4 BiLSTM模型

      LSTM 是傳統(tǒng)前饋神經(jīng)網(wǎng)絡(luò)的一種擴展(如圖2 所示)。LSTM 相較于其他循環(huán)神經(jīng)模型最明顯的優(yōu)點是它能夠處理消失和爆炸梯度問題[24]。

      圖2 LSTM單元結(jié)構(gòu)Fig.2 LSTM unit structure

      LSTM 通過迭代地從一系列構(gòu)建塊中更新內(nèi)存狀態(tài),從順序的結(jié)構(gòu)化數(shù)據(jù)中捕獲長期依賴關(guān)系。每個構(gòu)件塊都以一個存儲單元狀態(tài)為中心,該狀態(tài)由通過使用S 型激活函數(shù)σ的3 個功能門過濾的循環(huán)輸入信息進行更新。遺忘門通過遺忘或記憶循環(huán)輸入控制當(dāng)前記憶狀態(tài)的更新,輸入門和輸出門通過擦除或保持當(dāng)前單元狀態(tài)控制循環(huán)輸入流。BiLSTM 是基于兩個LSTM 層開發(fā)的(如圖3 所示)。

      圖3 BiLSTM結(jié)構(gòu)Fig.3 BiLSTM structure

      BiLSTM 擁有兩個可在兩個方向上處理數(shù)據(jù)的LSTM 層,因此能夠?qū)碜韵惹昂秃罄m(xù)信息進行數(shù)據(jù)依賴性建模[25]。對于BiLSTM 計算t時刻的輸出yt,需要包含前向序列的隱藏狀態(tài)和向序列的隱藏狀態(tài),具體表達式為:

      其中:W分別為前向和后向隱藏狀態(tài)的權(quán)重矩陣,b為偏差向量。

      1.4 基于二次分解重構(gòu)策略的航空客流需求預(yù)測模型

      基于航空客流需求的數(shù)據(jù)特征以及上述各模型的基本原理,本文提出了一個基于二次分解重構(gòu)策略的綜合集成模型(STL-CEEMDAN-SAAKAB)用于月度航空客流需求的預(yù)測。該模型主要包括二次分解及重構(gòu)階段和模型匹配預(yù)測及集成階段,基本流程如圖4 所示。主要步驟歸納如下。

      圖4 航空客流需求預(yù)測模型Fig.4 Air passenger demand forecasting model

      1)二次分解。根據(jù)航空客流量數(shù)據(jù)的季節(jié)性特征,采用STL 方法對原始數(shù)據(jù)進行分解,得到季節(jié)分量、趨勢分量和殘余分量。然后利用CEEMDAN 對殘余分量進行二次分解以獲得未提取出的有效信息,得到n個具有不同時間尺度特征的IMF 分量(記作IMF1,IMF2,…,IMFn)。

      2)基于特征分析的重構(gòu)。分析二次分解獲得的各分量的基本數(shù)據(jù)特征,根據(jù)數(shù)據(jù)復(fù)雜度(SE 值)以及各分量與趨勢分量的相關(guān)度(MIC 值),選擇部分二次分解分量與趨勢分量重構(gòu)為新趨勢分量;然后,將剩余分量依據(jù)所設(shè)定的復(fù)雜度閾值重構(gòu)為低復(fù)雜度分量和高復(fù)雜度分量。至此,所有二次分解分量重構(gòu)為季節(jié)分量、新趨勢分量、低復(fù)雜度分量和高復(fù)雜度分量四類。

      3)模型匹配預(yù)測。分析重構(gòu)后各分量的數(shù)據(jù)特征,有針對性地選擇不同的模型進行預(yù)測。具體地,對有明顯周期性、數(shù)據(jù)波動比較規(guī)律的季節(jié)分量選用SARIMA 模型進行預(yù)測;對復(fù)雜度低、變化曲線較光滑的新趨勢分量采用ARIMA模型來預(yù)測;對具有相對較低波動性的低復(fù)雜度分量選用神經(jīng)網(wǎng)絡(luò)模型KELM 進行預(yù)測;而對具有明顯非線性非平穩(wěn)特征的高復(fù)雜度分量采用深度學(xué)習(xí)模型BiLSTM 進行建模與預(yù)測。同時,為進一步提高預(yù)測精度,本文采用ATPE 算法優(yōu)化了KELM 和BiLSTM 模型中的超參數(shù),分別記為AK(ATPE-KELM)、AB(ATPE-BiLSTM)。將這一預(yù)測步驟簡寫為SAAKAB(即季節(jié)分量SARIMA、新趨勢分量ARIMA、低復(fù)雜度分量AK、高復(fù)雜度分量AB)。

      4)集成。最后將季節(jié)分量、新趨勢分量、低復(fù)雜度分量和高復(fù)雜度分量的預(yù)測結(jié)果線性相加,得到航空客流量的最終預(yù)測值。

      此外,為了衡量模型在多步預(yù)測下的表現(xiàn),本文采用了多輸入多輸出策略對每個模型(·)進行建模預(yù)測,該策略相較于常見的直接策略具有建模任務(wù)簡單且耗時短的優(yōu)勢[26]。假設(shè)一個模型的嵌入維度和零均值的噪聲項分別為d和ε,需做h步預(yù)測,則預(yù)測向量集合(φt+1,φt+2,…,φt+h),可具體表示為:

      2 實驗與結(jié)果分析

      2.1 數(shù)據(jù)描述

      為充分驗證本文所提模型的預(yù)測性能,本文選取了北京首都國際機場、深圳寶安國際機場和??诿捞m國際機場的航空客流量數(shù)據(jù)作為研究對象進行實證分析。這3 個機場所在城市的地理位置、人口規(guī)模、產(chǎn)業(yè)結(jié)構(gòu)以及經(jīng)濟狀況等均有不同,而且航空客流量數(shù)據(jù)大小也有一定差異。其中,北京首都國際機場作為我國三大門戶復(fù)合樞紐之一,航空客流量大,屬于特大型機場;深圳寶安國際機場是干線樞紐型機場,航空客流量較大,屬于大型機場;??诿捞m國際機場為旅游城市機場,受旅游業(yè)發(fā)展影響較大,航空客流量相對較小。因此,本文選擇上述3 個機場的樣本數(shù)據(jù)進行預(yù)測可以更客觀、系統(tǒng)地評價STL-CEEMDAN-SAAKAB 模型的有效性和穩(wěn)定性。

      本文收集了上述3 個機場2006 年1 月 至2019 年12 月的航空客流需求月度數(shù)據(jù)(如圖5 所示),共計168 個數(shù)據(jù),其基本統(tǒng)計描述見表1。此外,按照8∶2 的比例將原始數(shù)據(jù)劃分為訓(xùn)練集和測試集,即2006 年1 月至2017 年2 月設(shè)為訓(xùn)練集(共134 個數(shù)據(jù)),2017 年3 月至2019 年12 月設(shè)為測試集(共34 個數(shù)據(jù)),數(shù)據(jù)來源于Wind 數(shù)據(jù)庫(www.wind.com.cn)。

      圖5 3個機場的航空客流需求月度數(shù)據(jù)Fig.5 Monthly air passenger demand data of three airports

      表1 3個機場航空客流需求月度數(shù)據(jù)的基本統(tǒng)計描述 單位:萬人次Tab.1 Basic description statistics of monthly air passenger demand data of three airports unit:104

      2.2 評價準(zhǔn)則

      本文采用均方根誤差(Root Mean Square Error,RMSE)、平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE)、決定系 數(shù)(R2)以及方 向預(yù)測精度(Direction Accuracy,DA)作為評價指標(biāo)從不同角度評估模型的預(yù)測性能,具體公式如表2 所示。其中,RMSE、MAPE 越小,表明預(yù)測值越接近真實值,模型的預(yù)測精度越高;R2越接近1,表明模型的擬合程度越高;DA 越大,表明模型的趨勢判斷越準(zhǔn)確,方向預(yù)測精度越高。

      表2 評價指標(biāo)Tab.2 Evaluation indicators

      此外,為了進一步比較模型間的差異性,本文從統(tǒng)計視角引入了DM(Diebold Mariano )檢驗評價所提模型與基準(zhǔn)模型預(yù)測精度的差異顯著程度。本文以均方誤差(Mean Square Error,MSE)作為損失函數(shù),原假設(shè)為所提模型的MSE 值不小于基準(zhǔn)模型,即提出模型的預(yù)測性能低于基準(zhǔn)模型。具體的DM 統(tǒng)計量定義如下:

      2.3 北京首都國際機場實例

      2.3.1 二次分解重構(gòu)

      本文采用STL 分解技術(shù)對航空客流量數(shù)據(jù)進行分解,提取原始時間序列的季節(jié)成分和趨勢成分,并進一步得到殘余成分(如圖6(a)所示)。從圖6(a)中可以看出,北京首都國際機場客流量數(shù)據(jù)分解所得的季節(jié)分量波動極為規(guī)律,反映了航空客流需求在一年內(nèi)的周期性變化(如每年8 月暑假期間,旅游人數(shù)增加,季節(jié)分量呈現(xiàn)上升狀態(tài));趨勢分量波動平緩,逐年增長趨勢明顯,反映了在經(jīng)濟增長、行業(yè)發(fā)展影響下航空客流需求的長期變化情況;殘差分量受各類不確定性因素影響較大(如2008 年8 月受北京奧運會影響,殘差分量有明顯突變),波動情況較為復(fù)雜,無明顯規(guī)律性。

      圖6 二次分解及重構(gòu)Fig.6 Dual decomposition and reconstruction

      在此基礎(chǔ)上,利用CEEMDAN 對殘余分量進行二次分解,得到不同振幅和頻率的8 個IMF 分量,分別計算各分量的SE 值,分析其復(fù)雜度,見圖6(b)及表3。可以發(fā)現(xiàn),各分解分量的波動頻率依次降低。波動頻率越高,該分量的非線性非平穩(wěn)性越明顯,復(fù)雜度越高;反之,波動頻率越低,該分量的變化趨勢越平穩(wěn),復(fù)雜度越低。進一步,本文分析并計算了各分量與趨勢分量的相關(guān)度MIC,從表3 的計算結(jié)果可知,復(fù)雜度越低的分量,對應(yīng)的MIC 值越大,表明該分量與趨勢項的波動狀態(tài)基本保持一致,說明殘余分量中包含了部分未充分提取的趨勢變化信息。

      表3 二次分解分量的基本特征統(tǒng)計值Tab.3 Basic characteristic statistical values of dual decomposition components

      根據(jù)各分量基本特征統(tǒng)計值及上述分析,同時考慮分量過多可能造成預(yù)測誤差的累加及計算成本的增加,本文依據(jù)各分量與趨勢項的相關(guān)度MIC,以及各分量的復(fù)雜度SE,將特征相似的分量進行了重構(gòu)。具體地,將MIC 值大于0.5 且SE 值小于0.1 的分量(即對于CEEMDAN 為IMF8,對于EMD 為IMF7-IMF8)與趨勢分量進行重構(gòu),作為新的趨勢分量。其余分量按照復(fù)雜度閾值為0.5 重構(gòu)為兩類,即低復(fù)雜度分量(即對于CEEMDAN 為IMF2和IMF5-IMF7,對于EMD 為IMF5-IMF6)和高復(fù)雜度分量(即對于CEEMDAN為IMF1和IMF3-IMF4,對于EMD為IMF1-IMF4)。重構(gòu)后的結(jié)果如圖6(c)所示。

      2.3.2 各模型參數(shù)及超參數(shù)的確定

      在實證分析中,ARIMA、SARIMA 模型參數(shù)基于赤池信息準(zhǔn)則(Akaike Information Criterion,AIC)最小化準(zhǔn)則確定;KELM 模型的核函數(shù)及其對應(yīng)的核參數(shù),以及BiLSTM 模型的學(xué)習(xí)率(learning rate)、批處理大?。╞atch size)、隱藏層數(shù)(hidden layer size)和隱藏層單元數(shù)(hidden size)超參數(shù),均通過ATPE 算法確定。本文對訓(xùn)練集進行5 折交叉驗證,根據(jù)平均損失值最小原則確定最優(yōu)超參數(shù)。對于KELM 模型,本文最終確定采用線性核函數(shù),圖7(a)展示了KELM 模型懲罰參數(shù)的確定結(jié)果,從圖7(a)中可看出隨著懲罰參數(shù)增大,KELM 模型平均損失值不斷減小。BiLSTM 模型超參數(shù)確定的結(jié)果如圖7(b)和圖7(c)所示,可以看出當(dāng)BiLSTM 模型的隱藏層數(shù)增加、隱藏層單元數(shù)較少以及學(xué)習(xí)率較低的時候,該模型的平均損失值較低,而批處理大小對模型效果的影響較小。最終,各模型參數(shù)及超參數(shù)的具體結(jié)果見表4。

      表4 各模型參數(shù)及超參數(shù)Tab.4 Parameters and hyperparameters of different models

      圖7 KELM和BiLSTM模型的超參數(shù)尋優(yōu)Fig.7 Hyperparameter optimization of KELM and BiLSTM models

      2.3.3 預(yù)測結(jié)果與對比分析

      本文通過替換進行預(yù)測前使用的分解策略,設(shè)計了單一預(yù)測模型、一次分解模型和二次分解重構(gòu)模型這3 類對比模型,具體如下:1)為驗證綜合集成模型的優(yōu)越性,本文選擇了綜合集成模型中涉及到的4 種單一預(yù)測模型進行對比,即ARIMA、SARIMA、AK、AB 模型,均為航空客流需求預(yù)測領(lǐng)域中具有代表性的各類預(yù)測模型;2)為驗證二次分解重構(gòu)策略和模型匹配策略的有效性,本文在STL 分解結(jié)果的基礎(chǔ)上,分別選擇單一預(yù)測模型AK、AB 和模型匹配預(yù)測策略(即季節(jié)分量SARIMA、趨勢分量ARIMA、殘余分量AB)設(shè)計對比實驗,分別記為STL-AK、STL-AB、STL-SAAB;3)基于提出的預(yù)測模型,采用EMD 作為二次分解方法,比較不同分解方法的優(yōu)勢,即STL-EMD-SAAKAB 模型。

      本文主要采用了RMSE、MAPE、R2和DA 這4 個評價指標(biāo),以及DM 檢驗統(tǒng)計指標(biāo)對上述各類對比模型的預(yù)測結(jié)果進行評價。所有模型對北京首都國際機場航空客流量的預(yù)測結(jié)果具體見表5,提出模型對比其他模型的DM 檢驗結(jié)果見表6。從表5、6 可以發(fā)現(xiàn)如下結(jié)論。

      表5 各模型的1步、2步、3步預(yù)測結(jié)果(北京首都國際機場)Tab.5 One step,2 step and 3 step ahead prediction results of different models(Beijing Capital International Airport)

      表6 各模型1步、2步和3步預(yù)測的DM檢驗結(jié)果(北京首都國際機場)Tab.6 DM test results of 1 step,2 step and 3 step ahead prediction of different models(Beijing Capital International Airport)

      1)航空客流時序數(shù)據(jù)具有明顯的季節(jié)性特征且復(fù)雜度較高。對比計量經(jīng)濟模型(ARIMA 和SARIMA 模型)可發(fā)現(xiàn)SARIMA 模型預(yù)測效果優(yōu)于ARIMA 模型,這是航空客流數(shù)據(jù)的季節(jié)性特征導(dǎo)致的。對比各單一預(yù)測模型的RMSE 值,結(jié)合超參數(shù)優(yōu)化算法的深度神經(jīng)網(wǎng)絡(luò)AB 模型具有明顯的預(yù)測精度優(yōu)勢,在多步預(yù)測中優(yōu)于其他所有單一預(yù)測模型;且AB模型的擬合精度R2均是最高的,這是因為深度神經(jīng)網(wǎng)絡(luò)可較好地捕捉復(fù)雜數(shù)據(jù)內(nèi)在規(guī)律特征。

      2)基于STL 的分解集成模型優(yōu)于單一預(yù)測模型??紤]到航空客流需求數(shù)據(jù)內(nèi)在受多種特征影響,利用恰當(dāng)?shù)姆纸饧夹g(shù)處理數(shù)據(jù)再進行預(yù)測可獲得預(yù)測效果的提升,如STLAK 和STL-AB 的MAPE 值低于所有的單一預(yù)測模型。根據(jù)STL 分解下各分量的特征采用模型匹配策略可獲得更具優(yōu)勢的預(yù)測精度和方向精度,如在1 步預(yù)測中,STL-SAAB 的MAPE 值 為1.153 6%,DA 值 為0.903 2,均優(yōu)于STL-AK(MAPE 為2.410 0%,DA 為0.774 2)和STL-AB(MAPE 為1.724 2%,DA 為0.871 0)。

      3)二次分解重構(gòu)集成模型進一步挖掘了航空客流數(shù)據(jù)中的有效信息且獲得了更優(yōu)的預(yù)測性能。在STL 分解的基礎(chǔ)上,本文發(fā)現(xiàn)殘余分量中仍包含有未充分提取的有效信息,因此考慮采用分解技術(shù)進一步處理殘余分量并重構(gòu)各分解分量。在多步預(yù)測中,STL-EMD-SAAKAB 和STLCEEMDAN-SAAKAB 模型的預(yù)測精度和擬合效果均優(yōu)于其他所有對比模型,且方向精度也均超過0.900 0。從RMSE、MAPE 和R2這3 個誤差分析指標(biāo)來看,STL-CEEMDANSAAKAB 模型在1 步和2 步預(yù)測中的效果優(yōu)于STL-EMDSAAKAB 模型,但在3 步預(yù)測中的效果略差。

      4)從DM 統(tǒng)計檢驗角度來看,除STL-EMD-SAAKAB 模型外,本文提出的STL-CEEMDAN-SAAKAB 模型相較于其他對比模型在多步預(yù)測中的p 值遠(yuǎn)遠(yuǎn)小于0.100 0,也就是說該模型的預(yù)測性能在90%的置信水平下明顯優(yōu)于其他對比模型。而基于本文提出預(yù)測模型下的STL-EMD-SAAKAB 模型,從統(tǒng)計角度來說有著與STL-CEEMDAN-SAAKAB 模型相近的預(yù)測性能。

      總的來看,本文提出的STL-CEEMDAN-SAAKAB 模型,綜合了二次分解重構(gòu)策略和模型匹配策略的優(yōu)勢,在對北京首都國際機場航空客流量的預(yù)測中,相較于其他模型,無論從預(yù)測精度、方向精度和擬合效果還是從統(tǒng)計分析角度來看,都有著較優(yōu)的預(yù)測性能。

      2.4 其他機場實例

      為了更加全面、充分地評估所提模型的預(yù)測準(zhǔn)確性和有效性,進一步選擇客流量數(shù)據(jù)量級不同、特點不同的兩個機場(深圳寶安國際機場和??诿捞m國際機場)進行建模預(yù)測,在實證分析中,模型參數(shù)的確定方法、重構(gòu)依據(jù)以及對比模型的設(shè)置均與上文保持一致。兩個機場訓(xùn)練集誤差評價結(jié)果和DM統(tǒng)計檢驗值分別見表7、8和表9、10。

      表7 各模型的1步、2步、3步預(yù)測結(jié)果(深圳寶安國際機場)Tab.7 One step,2 step and 3 step ahead prediction results of different models(Shenzhen Bao’an International Airport)

      表8 各模型1步、2步和3步預(yù)測的DM檢驗結(jié)果(深圳寶安國際機場)Tab.8 DM test results of 1 step,2 step and 3 step ahead prediction of different models(Shenzhen Bao’an International Airport)

      表9 各模型的1步、2步、3步預(yù)測結(jié)果(??诿捞m國際機場)Tab.9 One step,2 step and 3 step ahead prediction results of different models(Haikou Meilan International Airport)

      從預(yù)測評價結(jié)果來看,本文所提的STL-CEEMDANSAAKAB 模型的總體效果優(yōu)于其他對比模型。在深圳寶安國際機場航空客流量的多步預(yù)測中,本文模型的擬合效果R2值均在0.98 以上,方向精度均為93.55%;而在??诿捞m國際機場的多步預(yù)測中,本文模型的RMSE、MAPE值均為最低,且R2值為最高,甚至在1、2步預(yù)測中方向精度DA值達到了100%。

      表10 各模型1步、2步和3步預(yù)測的DM檢驗結(jié)果(海口美蘭國際機場)Tab.10 DM test results of 1 step,2 step and 3 step ahead prediction of different models(Haikou Meilan International Airport)

      從DM 統(tǒng)計檢驗角度來看,除了STL-EMD-SAAKAB 模型外,本文模型在深圳寶安國際機場航空客流量預(yù)測中,預(yù)測性能在95%的置信水平下明顯優(yōu)于其他對比模型;而在??诿捞m國際機場航空客流量預(yù)測中,本文模型相較于其他對比模型在多步預(yù)測中DM 統(tǒng)計值的p 值遠(yuǎn)遠(yuǎn)小于0.100 0。值得注意的是,上述兩個機場在單一預(yù)測模型對比中,可發(fā)現(xiàn)SARIMA 模型的預(yù)測效果是最優(yōu)的,這說明深圳寶安國際機場和??诿捞m國際機場的航空客流量受季節(jié)影響較為明顯,季節(jié)性特征為主導(dǎo)因素,而其他不確定因素影響相比北京首都國際機場較低。其余結(jié)論均與北京首都國際機場實例中得到的一致,體現(xiàn)出本文提出的預(yù)測模型的有效性與優(yōu)越性。

      3 結(jié)語

      在當(dāng)前國民經(jīng)濟穩(wěn)步增長、航空運輸業(yè)快速發(fā)展的背景下,航空客流需求不斷增長,給相關(guān)管理工作帶來了新的挑戰(zhàn)。如何準(zhǔn)確預(yù)測航空客流需求,對實現(xiàn)航空運輸資源的優(yōu)化配置,提升航空運輸能力和質(zhì)量,都顯得尤為重要。為此,本文從數(shù)據(jù)特征驅(qū)動角度出發(fā),以“分而治之”思想為指導(dǎo),構(gòu)建了一個航空客流需求預(yù)測的綜合集成模型。該模型考慮了航空客流量數(shù)據(jù)的內(nèi)在發(fā)展規(guī)律,挖掘了需求序列的季節(jié)性特征和趨勢變化情況,采用二次分解重構(gòu)策略處理非線性非平穩(wěn)的殘余分量數(shù)據(jù),進而利用模型匹配策略依據(jù)數(shù)據(jù)復(fù)雜度有針對性地選擇合適的預(yù)測模型,集成得到最終預(yù)測結(jié)果。北京首都國際機場、深圳寶安國際機場以及??诿捞m國際機場的實驗結(jié)果表明,STL-CEEMDAN-SAAKAB 模型預(yù)測效果突出且穩(wěn)定,所提出的二次分解重構(gòu)策略和模型匹配策略是有效的航空客流需求分析和預(yù)測方法,對航空客運業(yè)的發(fā)展甚至其他研究領(lǐng)域都有借鑒意義。雖然,通過結(jié)合神經(jīng)網(wǎng)絡(luò)模型預(yù)測得到了較高的預(yù)測精度,但預(yù)測結(jié)果缺乏一定的可解釋性,后續(xù)工作將嘗試融合多源數(shù)據(jù),進行特征提取以此來獲得具有可解釋性的預(yù)測模型。

      猜你喜歡
      客流復(fù)雜度分量
      客流增多
      帽子的分量
      一物千斤
      智族GQ(2019年9期)2019-10-28 08:16:21
      一種低復(fù)雜度的慣性/GNSS矢量深組合方法
      論《哈姆雷特》中良心的分量
      分量
      求圖上廣探樹的時間復(fù)雜度
      基于自學(xué)習(xí)補償?shù)氖覂?nèi)定位及在客流分析中的應(yīng)用
      某雷達導(dǎo)51 頭中心控制軟件圈復(fù)雜度分析與改進
      人工免疫算法在電梯客流時段劃分的應(yīng)用
      罗平县| 临泽县| 岳阳市| 济宁市| 大埔县| 肇庆市| 西昌市| 个旧市| 德令哈市| 沙湾县| 朔州市| 江安县| 凌云县| 双鸭山市| 扬州市| 祥云县| 武宁县| 芜湖市| 乳源| 莎车县| 烟台市| 太白县| 申扎县| 漯河市| 顺义区| 克拉玛依市| 六安市| 应用必备| 潼南县| 鹤庆县| 张家港市| 宜都市| 垦利县| 恩平市| 教育| 夹江县| 海安县| 宜丰县| 蓝山县| 辽阳县| 莆田市|