隨著社會(huì)的發(fā)展,科技的進(jìn)步,飛機(jī)成為了人們越來越喜歡的交通工具,航空運(yùn)輸量規(guī)模和增長速度成為衡量我國民航發(fā)展的重要指標(biāo)。據(jù)中國民航運(yùn)輸局統(tǒng)計(jì)數(shù)據(jù)顯示,2018 年,全年完成了旅客運(yùn)輸量61 173.77 萬人次,比2017 年增長了10.9%;全年運(yùn)輸飛行小時(shí)約1 153.52 萬小時(shí),比2017 年,增長8.9%;運(yùn)輸起飛架次425.95 萬次,比2017 年增長了7.6%。這些數(shù)據(jù)表明我國的民航事業(yè)在快速的發(fā)展,國家實(shí)力也在不斷增強(qiáng)。因此,對(duì)民航客運(yùn)量進(jìn)行精準(zhǔn)預(yù)測,對(duì)中國民航事業(yè)的發(fā)展有重要的意義。
目前關(guān)于ELM 的預(yù)測模型已經(jīng)有了很多的應(yīng)用,如能源、農(nóng)業(yè)、網(wǎng)絡(luò)等方面。袁開銀等[1]通過相空間重構(gòu)把網(wǎng)絡(luò)流量變?yōu)橛幸?guī)律的數(shù)據(jù),然后用極限學(xué)習(xí)機(jī)算法對(duì)這些數(shù)據(jù)進(jìn)行仿真模擬,從而實(shí)現(xiàn)網(wǎng)絡(luò)流量的準(zhǔn)確預(yù)測。由于風(fēng)能資源成為了可再生能源發(fā)電資源之一,朱抗等[2]用超極限學(xué)習(xí)機(jī)來對(duì)短期風(fēng)速進(jìn)行仿真預(yù)測,進(jìn)而對(duì)風(fēng)力發(fā)電進(jìn)行預(yù)測,更好地利用風(fēng)能,該方法與傳統(tǒng)的方法相比,預(yù)測速度快,精度高??锪恋萚3]人提出了一種優(yōu)化極限學(xué)習(xí)機(jī)的果園濕度預(yù)測方法,有效地提高了果園濕度預(yù)測的精度,克服了傳統(tǒng)水蜜桃種植過程中環(huán)境監(jiān)測實(shí)時(shí)性差、人力物力浪費(fèi)嚴(yán)重的現(xiàn)狀的問題。Hua Xu 等[4]發(fā)現(xiàn)碳排放價(jià)格波動(dòng)趨勢與碳排放交易市場有效性的發(fā)揮有關(guān)系,因此利用時(shí)間序列復(fù)雜網(wǎng)絡(luò)分析技術(shù)和超極限學(xué)習(xí)機(jī)的方法,對(duì)碳排放進(jìn)行預(yù)測,該方法預(yù)測結(jié)果和真實(shí)值較近。Aranildo R. Lima 等[5]提出了一種在線順序極限學(xué)習(xí)機(jī),該方法結(jié)構(gòu)簡單,可以不斷地更新數(shù)據(jù),節(jié)約成本,對(duì)加拿大大不列顛和哥倫比亞省的小流域進(jìn)行預(yù)測,結(jié)果表明該方法更新的頻率高、誤差小,預(yù)測結(jié)果和實(shí)際值更接近。以上文獻(xiàn)大多將極限學(xué)習(xí)機(jī)算法用到能源,農(nóng)業(yè)等其他領(lǐng)域,達(dá)到了理想的預(yù)測效果,但是鮮有將其運(yùn)用到民航客流量預(yù)測上。
本文基于超極限學(xué)習(xí)機(jī)的預(yù)測模型,以國內(nèi)生產(chǎn)總值、外國人入境游客人數(shù)、定期航班航線里程、鐵路客運(yùn)量、第三產(chǎn)業(yè)增加值五個(gè)影響因素[6]作為輸入值,民航客運(yùn)量作為輸出值,通過ELM 模型,對(duì)中國民航客流量進(jìn)行預(yù)測,并分析預(yù)測值和實(shí)測值的關(guān)系,計(jì)算誤差,試圖為我國航空運(yùn)輸發(fā)展和企業(yè)進(jìn)行經(jīng)營決策提供一些有價(jià)值的預(yù)測結(jié)果和相關(guān)信息。
極限學(xué)習(xí)機(jī)算法(Extreme Learning Machine,ELM)[7-8]是一種針對(duì)單隱含層前饋神經(jīng)網(wǎng)絡(luò)(SLFN) 的新算法,其網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示,它的特點(diǎn)是隨機(jī)產(chǎn)生輸入層與隱含層間的連接權(quán)值以及隱含層神經(jīng)元的閾值,而且在實(shí)驗(yàn)的過程中只需要設(shè)置隱含層神經(jīng)元的個(gè)數(shù),無需調(diào)整其他數(shù)值,便可以獲得唯一最優(yōu)解。
圖1 ELM 網(wǎng)絡(luò)結(jié)構(gòu)圖
該算法有三層數(shù)據(jù),輸入層、隱含層、輸出層,且輸入層和隱含層,隱含層與輸出層神經(jīng)元之間全連接。ELM 模型的算法步驟:輸入層有n個(gè)神經(jīng)元,對(duì)應(yīng)有n個(gè)神經(jīng)元,對(duì)應(yīng)的輸入矩陣為X=[xi1,xi2,…,xin]T,隱含層有L個(gè)神經(jīng)元,輸出層有m個(gè)神經(jīng)元,對(duì)應(yīng)有m個(gè)輸出,對(duì)應(yīng)的輸出矩陣為Y=[yi1,yi2,…,yim]T。激勵(lì)函數(shù)為g(x)的ELM 模型為:
其中:βi為隱含層第i個(gè)節(jié)點(diǎn)與輸出層節(jié)點(diǎn)的權(quán)重;ωi為輸入層節(jié)點(diǎn)與隱含層第i 個(gè)節(jié)點(diǎn)的權(quán)重;bi為第i 個(gè)隱含層節(jié)點(diǎn)的閾值;oj為網(wǎng)絡(luò)的實(shí)際輸出值。
網(wǎng)絡(luò)輸出可以表達(dá)為:Hβ=T',T'為矩陣的轉(zhuǎn)置;H稱為神經(jīng)網(wǎng)絡(luò)的隱含層輸出矩陣。其中H可以表示為:
若L=N具有L個(gè)隱含層神經(jīng)元網(wǎng)絡(luò)的輸出值可以逼近N個(gè)訓(xùn)練樣本,SLFN 可以零誤差逼近訓(xùn)練樣本。即:
當(dāng)N足夠大時(shí),ELM 的輸出誤差逼近一個(gè)任意值ε<0,β 可通過最小二乘法求解,得
采集1999~2018 年每一年的國內(nèi)生產(chǎn)總值、外國人入境游客、定期航班航線里程、鐵路客運(yùn)量、第三產(chǎn)業(yè)增加值,數(shù)據(jù)如表1 所示。
由于影響民航客流量的因素不同,在數(shù)據(jù)處理時(shí),要求不改變原來的物理意義且把數(shù)據(jù)映射到(0,1) 的區(qū)間內(nèi),將有剛量化轉(zhuǎn)變?yōu)闊o剛量化,因此可對(duì)采集的數(shù)據(jù)進(jìn)行歸一化處理,目的是輸入變量的不平等使用,以及對(duì)數(shù)據(jù)歸一化處理后,可以防止輸入的數(shù)據(jù)的絕對(duì)值過大,保證輸出數(shù)據(jù)中小的數(shù)據(jù)不被覆蓋,加快訓(xùn)練網(wǎng)絡(luò)的收斂性。
將所收集處理過的120 個(gè)數(shù)據(jù)分成20 組6 維數(shù)據(jù),每組的前5 維數(shù)據(jù),為樣本輸入,每組的第6 維數(shù)據(jù)為預(yù)測數(shù)據(jù)。前15 組6 維數(shù)據(jù)為模型訓(xùn)練數(shù)據(jù),后5 組6 維數(shù)據(jù)為測試數(shù)據(jù),利用Matlab 搭建ELM 預(yù)測模型,進(jìn)行試驗(yàn)仿真。通過ELM 仿真預(yù)測民航客運(yùn)量與實(shí)際客運(yùn)量的對(duì)比(如圖2),ELM 模型的擬合度為0.93315,均方誤差誤差為0.041544,和實(shí)際結(jié)果很相近。
本文針對(duì)中國民航客流量及其影響因素,建立ELM 預(yù)測模型,通過仿真實(shí)驗(yàn)可以看出ELM 模型所獲得的預(yù)測值更加接近真實(shí)值。文中預(yù)測模型可以在其他領(lǐng)域推廣。
表1 1999~2018 年民航客運(yùn)量及其相關(guān)影響因素?cái)?shù)據(jù)
圖2 ELM 預(yù)測值和真實(shí)值對(duì)比