摘 要隨之全球社會(huì)經(jīng)濟(jì)的發(fā)展,航空業(yè)已經(jīng)在國(guó)民經(jīng)濟(jì)活動(dòng)中起到越來(lái)越大的作用,航班準(zhǔn)確率一直是整個(gè)機(jī)場(chǎng)服務(wù)品質(zhì)的重要標(biāo)準(zhǔn)之一,如何提升機(jī)場(chǎng)運(yùn)行效率解決航班延誤問(wèn)題,也成為目前民航業(yè)的重點(diǎn)研究課題。為了改善航班延誤問(wèn)題,提高航班保障能力,本文從功能設(shè)計(jì)和技術(shù)實(shí)現(xiàn)兩方面介紹了基于大數(shù)據(jù)的航班延誤管理系統(tǒng)的建設(shè)方案,重點(diǎn)研究系統(tǒng)的功能設(shè)計(jì)、技術(shù)架構(gòu)、數(shù)據(jù)架構(gòu)和業(yè)務(wù)模型,為國(guó)內(nèi)機(jī)場(chǎng)同類系統(tǒng)建設(shè)提供借鑒。
【關(guān)鍵詞】大數(shù)據(jù) 航班延誤
1 背景概述
航班延誤問(wèn)題是目前制約國(guó)內(nèi)民航服務(wù)質(zhì)量的焦點(diǎn)問(wèn)題,航班正常性工作已成為民航業(yè)內(nèi)的重中之重,不僅關(guān)乎民生,更是關(guān)乎民航整體運(yùn)行品質(zhì)。
為了提高民航資源(空域、跑道、航班)運(yùn)行效率,各空管局和機(jī)場(chǎng)相繼建設(shè)了CDM/A-CDM系統(tǒng)來(lái)協(xié)調(diào)空域流量資源和機(jī)場(chǎng)跑道資源,解決航班正點(diǎn)率低的問(wèn)題。但航班延誤是一個(gè)非常復(fù)雜的系統(tǒng)性問(wèn)題,航班飛行保障是個(gè)需要各方緊密協(xié)作的活動(dòng),涉及空管、機(jī)場(chǎng)和航空公司三方各種非正常性因素的起因和疊加,除了天氣、軍事活動(dòng)等不可控因素外,空域流量限制、航班計(jì)劃編排、航路時(shí)刻通行等多重因素交織,不是簡(jiǎn)單通過(guò)A-CDM系統(tǒng)就能徹底解決問(wèn)題,需要深入分析和研究清楚各機(jī)場(chǎng)的延誤特點(diǎn)和規(guī)律,找準(zhǔn)瓶頸和痛點(diǎn),才能針對(duì)性采取措施,從源頭上解決航班延誤問(wèn)題。
因此我們需要充分運(yùn)用大數(shù)據(jù)技術(shù)加強(qiáng)對(duì)航班正常性的分析工作,通過(guò)業(yè)務(wù)梳理和數(shù)據(jù)建模,從航班編排、空域協(xié)同、機(jī)場(chǎng)協(xié)同、航班保障等各個(gè)方面發(fā)現(xiàn)航班延誤關(guān)鍵癥結(jié),從而對(duì)現(xiàn)有的資源條件、保障情況和A-CDM系統(tǒng)的協(xié)同機(jī)制提出更加基礎(chǔ)、更趨完善的解決方案,為提高航班正常性提供智能支撐。
2 基于大數(shù)據(jù)的航班延誤管理系統(tǒng)功能設(shè)計(jì)
2.1 總體目標(biāo)
航班延誤管理系統(tǒng)是一個(gè)典型的行業(yè)大數(shù)據(jù)分析系統(tǒng),核心技術(shù)是航班運(yùn)行業(yè)務(wù)建模和智能數(shù)據(jù)挖掘算法技術(shù),依托強(qiáng)大的智能算法組件,以航班正常性為基準(zhǔn),通過(guò)民航生態(tài)值管理,對(duì)航班運(yùn)行的海量歷史數(shù)據(jù)和實(shí)時(shí)數(shù)據(jù)按照業(yè)務(wù)模型進(jìn)行挖掘分析處理,監(jiān)測(cè)分析機(jī)場(chǎng)航班延誤的特點(diǎn)和規(guī)律,以可視化的形式,全面、深刻、細(xì)致、準(zhǔn)確地還原影響航班延誤的各種因素及其相互作用關(guān)系,為從航班編排計(jì)劃、容量分配、機(jī)位分配等源頭和根本上解決或緩解航班延誤問(wèn)題提供切實(shí)可行的路徑。
2.2 主要功能模塊
基于大數(shù)據(jù)的航班延誤管理系統(tǒng)的功能模塊以延誤檢測(cè)、原因分析、優(yōu)化建議為主線,實(shí)現(xiàn)航班延誤監(jiān)測(cè)、運(yùn)行數(shù)據(jù)統(tǒng)計(jì)分析,并進(jìn)一步預(yù)測(cè)運(yùn)行趨勢(shì),提供優(yōu)化和決策依據(jù)。主要包括:生態(tài)值管理、延誤情況分析、延誤原因癥結(jié)分析、航班優(yōu)化、運(yùn)行報(bào)表等模塊。
2.2.1 生態(tài)值管理
包括機(jī)場(chǎng)航班的降落、滑入、??俊⒊?、地服、登機(jī)、上/撤輪檔、滑出、起飛、機(jī)位置機(jī)、機(jī)位使用、安檢、陸測(cè)交通等資源運(yùn)行管理的正常性值的計(jì)算與管理。
2.2.2 航班延誤情況分析
該模塊主要針對(duì)小延誤航班、大面積航班延誤、延誤航班、航線延誤情況進(jìn)行分析,具體如下:
(1)“小延誤航班分析”:指延誤時(shí)間在五分鐘之內(nèi)的航班,該類型航班特點(diǎn)是可以通過(guò)合并席位加快過(guò)站進(jìn)度等措施消除延誤,從而增加航班正常率;
(2)“大面積航班延誤分析”:研究分析旅客積壓人數(shù)與大面積延誤航班分布的關(guān)系,對(duì)大面積航班延誤進(jìn)行預(yù)警與預(yù)測(cè),并預(yù)測(cè)大面積航班延誤造成的經(jīng)濟(jì)損失;
(3)“延誤航班”分析:機(jī)場(chǎng)延誤航班中包括始發(fā)航班延誤和非始發(fā)航班延誤,始發(fā)航班延誤對(duì)后續(xù)航班的正常率具有明顯影響,所以延誤航班分析將重點(diǎn)對(duì)始發(fā)航班的延誤率走勢(shì)、始發(fā)航班延誤波及程度進(jìn)行分析;
(4)“航線延誤分析”:對(duì)航線延誤情況進(jìn)行分析,涉及各個(gè)航線排名、各個(gè)航線正常率、每個(gè)航線上正常率最低的航班、各個(gè)航線上延誤的架次等數(shù)據(jù),從而找到正常率極低的航線,以便采取有效的措施,提升航線正常率。
2.2.3 航班延誤原因癥結(jié)分析
對(duì)延誤原因進(jìn)行清單管理,按照來(lái)源因素可以單列出的延誤原因清單包括:不可抗拒因素(天氣、軍演、對(duì)方機(jī)場(chǎng))、空管因素(空中流量控制、近進(jìn)容量控制、跑道容量控制)、航司保障因素(飛機(jī)起降、滑行、飛機(jī)準(zhǔn)備、除冰、檢修、飲食、其他)、機(jī)場(chǎng)管理服務(wù)因素(計(jì)劃推出、放行、機(jī)位容量、機(jī)位置機(jī)、安檢)、地面服務(wù)因素(監(jiān)護(hù)、清潔、加油、客梯車、擺渡車、陸測(cè)交通)、旅客因素(遲到)等。
實(shí)際航班延誤的原因是很復(fù)雜的,各種延誤因素之間會(huì)傳導(dǎo)和相互影響,可能是一種或幾種原因(因素)造成的,或者上一個(gè)航班延誤或前一個(gè)航班保障服務(wù)節(jié)點(diǎn)延誤傳導(dǎo)過(guò)來(lái)的。而每個(gè)節(jié)點(diǎn)延誤都與管理或執(zhí)行主體的行為或制度密切相關(guān),該模塊對(duì)航班延誤進(jìn)行關(guān)聯(lián)分析,針對(duì)每類延誤原因,分析造成原因的主體對(duì)象、操作行為和管理制度,例如可能是航班編排計(jì)劃不合理、停機(jī)位分配不合理、機(jī)場(chǎng)放行時(shí)間ACOBT不合理、滑入滑出次序/線路不合理、起飛等待不合理等等各種會(huì)產(chǎn)生資源沖突的原因。
2.2.4 航班優(yōu)化分析
航班優(yōu)化是一個(gè)比較系統(tǒng)和復(fù)雜的問(wèn)題,系統(tǒng)性主要體現(xiàn)在優(yōu)化不是著力于一個(gè)點(diǎn)而是覆蓋整個(gè)面,包括航班時(shí)刻編排、停機(jī)位選擇、飛機(jī)推出與滑入等。該模塊針對(duì)航班延誤原因癥結(jié)分析的結(jié)果,通過(guò)大數(shù)據(jù)模型和算法,提供航班優(yōu)化的建議,例如航班時(shí)刻編排的削峰填谷、停機(jī)位使用效率的優(yōu)先選擇等,以幫助機(jī)場(chǎng)提高航班正點(diǎn)率。
3 系統(tǒng)技術(shù)實(shí)現(xiàn)
3.1 技術(shù)架構(gòu)
基于大數(shù)據(jù)的航班延誤管理系統(tǒng)采用分布式架構(gòu)搭建,總體架構(gòu)如圖1所示。
整個(gè)系統(tǒng)包括數(shù)據(jù)源層、數(shù)據(jù)采集層、數(shù)據(jù)存儲(chǔ)層、服務(wù)引擎層、應(yīng)用層以及展示互動(dòng)層等六個(gè)重要組成部分,對(duì)各部分的簡(jiǎn)述如下:
3.1.1 數(shù)據(jù)源層
基于大數(shù)據(jù)構(gòu)建航班延誤管理系統(tǒng)所需的相關(guān)數(shù)據(jù)源主要包括空管數(shù)據(jù)(航班計(jì)劃、流量容量、起降指令等);航司數(shù)據(jù)(航班運(yùn)行計(jì)劃和保障數(shù)據(jù)等);機(jī)場(chǎng)服務(wù)數(shù)據(jù)(機(jī)位分配、上撤輪擋、推出放行、值機(jī)安檢數(shù)據(jù)等);其他數(shù)據(jù)(天氣、陸測(cè)交通數(shù)據(jù)等)。
3.1.2 數(shù)據(jù)采集層
通過(guò)建立WebService數(shù)據(jù)接口,從現(xiàn)有的機(jī)場(chǎng)A-CDM系統(tǒng)、空管CDM系統(tǒng)等現(xiàn)有業(yè)務(wù)信息系統(tǒng)中采集源數(shù)據(jù),并利用ETL數(shù)據(jù)抽取工具對(duì)航班延誤相關(guān)數(shù)據(jù)進(jìn)行抽取、清洗轉(zhuǎn)換和加載,生成可用于航班延誤各種主題分析的數(shù)據(jù)集合。
3.1.3 數(shù)據(jù)存儲(chǔ)層
數(shù)據(jù)存儲(chǔ)層采用分布式的結(jié)構(gòu),使用主流的Hadoop、Spark和Storm三大分布式計(jì)算系統(tǒng)相結(jié)合的架構(gòu)來(lái)實(shí)現(xiàn)。其中Hadoop負(fù)責(zé)離線的復(fù)雜的大數(shù)據(jù)處理,Spark負(fù)責(zé)離線的快速的大數(shù)據(jù)處理,Storm負(fù)責(zé)在線的實(shí)時(shí)的大數(shù)據(jù)處理。而在Hadoop中,yarn負(fù)責(zé)協(xié)調(diào)并管理底層資源和調(diào)度作業(yè)的運(yùn)行,hdfs負(fù)責(zé)分布式存儲(chǔ),hive負(fù)責(zé)大數(shù)據(jù)的清洗、處理和計(jì)算,hbase負(fù)責(zé)大數(shù)據(jù)的實(shí)時(shí)查詢。最后,經(jīng)過(guò)大數(shù)據(jù)處理后的分析數(shù)據(jù)和業(yè)務(wù)數(shù)據(jù)被存儲(chǔ)在Mysql中,可以為這些數(shù)據(jù)的查詢提供快速響應(yīng)。
3.1.4 服務(wù)引擎層
該層建立航班數(shù)據(jù)分析的引擎服務(wù)對(duì)延誤數(shù)據(jù)體進(jìn)行分析挖掘,主要功能包括查詢服務(wù)、OLAP引擎、業(yè)務(wù)模型庫(kù)、預(yù)警預(yù)測(cè)、數(shù)據(jù)挖掘算法服務(wù)和業(yè)務(wù)模型庫(kù)等。
3.1.5 數(shù)據(jù)應(yīng)用層
基于航班延誤機(jī)理研究,開(kāi)發(fā)分析應(yīng)用模塊,主要包括:生態(tài)值分析模塊、延誤情況分析模塊、延誤原因分析模塊、延誤癥結(jié)分析模塊等。
3.1.6 展示互動(dòng)層
該層是將應(yīng)用層的模型結(jié)果進(jìn)行可視化展現(xiàn),既提供傳統(tǒng)的餅狀圖、柱狀圖、折線圖及數(shù)據(jù)表結(jié)合等展現(xiàn)形式,還提供大數(shù)據(jù)分析展現(xiàn)方式包括決策樹(shù)、地圖分布、駕駛艙、儀表盤、全景視圖和多維立方體等。
3.2 數(shù)據(jù)架構(gòu)
建立支持分布式航班延誤監(jiān)測(cè)與分析的數(shù)據(jù)資源體系,實(shí)現(xiàn)航班延誤監(jiān)測(cè)與分析數(shù)據(jù)的采集、加工、存儲(chǔ)和管理,數(shù)據(jù)架構(gòu)如圖2所示。
數(shù)據(jù)架構(gòu)采用從數(shù)據(jù)源、數(shù)據(jù)類型、指標(biāo)體系到數(shù)據(jù)主題、數(shù)據(jù)模型、元數(shù)據(jù)的架構(gòu)進(jìn)行管理,具體如下:
3.2.1 數(shù)據(jù)源
數(shù)據(jù)源主要來(lái)自:
(1)空管數(shù)據(jù):包括航班計(jì)劃審批數(shù)據(jù)、流量容量數(shù)據(jù)、起降指令數(shù)據(jù)等;
(2)航司數(shù)據(jù):包括航班運(yùn)行計(jì)劃、航班保障數(shù)據(jù);
(3)機(jī)場(chǎng)服務(wù)數(shù)據(jù):包括機(jī)位分配、加油、除冰、上撤輪擋、推出放行、安檢等數(shù)據(jù);
(4)其他相關(guān)數(shù)據(jù):包括天氣、陸測(cè)交通數(shù)據(jù)等信息。
3.2.2 數(shù)據(jù)類型
主要分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)、實(shí)時(shí)數(shù)據(jù)和非實(shí)時(shí)數(shù)據(jù),具體來(lái)說(shuō)可分為文件流型數(shù)據(jù)、事件型數(shù)據(jù)、周期型數(shù)據(jù)以及圖片、視頻等多媒體型數(shù)據(jù)。
3.2.3 指標(biāo)體系
根據(jù)業(yè)務(wù)主題來(lái)劃分不同的指標(biāo)體系,例如空管指標(biāo)體系、航班運(yùn)行與保障指標(biāo)體系、機(jī)場(chǎng)管理服務(wù)指標(biāo)體系、航班延誤指標(biāo)體系、延誤原因指標(biāo)體系等。
3.2.4 數(shù)據(jù)主題
根據(jù)不同的應(yīng)用目的,將數(shù)據(jù)分為不同的主題,例如航班運(yùn)行數(shù)據(jù)、保障數(shù)據(jù)、延誤數(shù)據(jù)、延誤原因數(shù)據(jù)、延誤癥結(jié)數(shù)據(jù)等。
3.2.5 數(shù)據(jù)模型
為了滿足不同的分析場(chǎng)景,利用數(shù)據(jù)處理、統(tǒng)計(jì)分析和數(shù)據(jù)挖掘等算法構(gòu)建不同的數(shù)據(jù)模型。
3.2.6 元數(shù)據(jù)
關(guān)于數(shù)據(jù)的數(shù)據(jù),用于對(duì)數(shù)據(jù)進(jìn)行描述和數(shù)據(jù)編目,形成數(shù)據(jù)的資源目錄體系,便于管理。
3.3 業(yè)務(wù)建模
業(yè)務(wù)建模包括生態(tài)值模型設(shè)計(jì)、延誤情況統(tǒng)計(jì)分析模型、延誤原因分析模型、延誤原因癥結(jié)分析模型等內(nèi)容。
3.3.1 生態(tài)值模型設(shè)計(jì)
生態(tài)值指的是資源在正常條件下運(yùn)行的數(shù)值,由于各種干擾和意外因素影響,資源實(shí)際運(yùn)行值往往會(huì)偏離正常值。民航生態(tài)值包括航班的降落、滑入、???、除冰、地服、登機(jī)、上/撤輪檔、滑出、起飛、機(jī)位置機(jī)、機(jī)位使用、安檢、陸測(cè)交通等資源運(yùn)行生態(tài)值,生態(tài)值計(jì)算符合統(tǒng)一的均值方差標(biāo)準(zhǔn)模型。建立生態(tài)值模型的目的是為了計(jì)算資源當(dāng)前運(yùn)行的正常性范圍,為量化監(jiān)測(cè)和分析資源運(yùn)行的非正常性提供基準(zhǔn)依據(jù)。
3.3.2 延誤情況統(tǒng)計(jì)分析模型
航班延誤情況分析的目的是了解當(dāng)前機(jī)場(chǎng)航班延誤波及的資源范圍、程度、分布和趨勢(shì)情況,包括按時(shí)間、航線、航空公司、航班、機(jī)場(chǎng)、停機(jī)位分析航班延誤率、延誤時(shí)間程度分布,總結(jié)延誤規(guī)律,為延誤原因分析和解決延誤問(wèn)題提供途徑依據(jù),該模型需要體現(xiàn)對(duì)延誤情況分析的全覆蓋、分層次、分時(shí)段、分級(jí)別等特征,如圖3所示。
3.3.3 延誤原因分析模型
分析航班延誤原因的目的是為了了解各種因素對(duì)航班延誤的影響范圍、影響特點(diǎn)和影響程度,對(duì)各種航班延誤來(lái)源因素進(jìn)行定量考量和分類排序,為減少或消除來(lái)源因素對(duì)航班延誤的影響提供途徑依據(jù)。該模型支持按時(shí)間、航線、航空公司、航班、機(jī)場(chǎng)、停機(jī)位統(tǒng)計(jì)分析航班延誤的各種原因分布,對(duì)于每類原因,統(tǒng)計(jì)航班延誤的次數(shù)、延誤程度情況、影響范圍。
3.3.4 延誤原因癥結(jié)分析模型
延誤原因癥結(jié)分析需要建立原因關(guān)聯(lián)航班節(jié)點(diǎn)模型、航班節(jié)點(diǎn)延誤關(guān)聯(lián)模型、延誤原因制度關(guān)聯(lián)模型等三個(gè)基礎(chǔ)模型。其中原因關(guān)聯(lián)航班節(jié)點(diǎn)模型如圖4所示,用以解決延誤原因是如何施加到航班節(jié)點(diǎn)上的問(wèn)題;航班節(jié)點(diǎn)延誤關(guān)聯(lián)模型用以解決時(shí)間延誤是如何在各航班節(jié)點(diǎn)之間傳導(dǎo)的問(wèn)題;延誤原因制度關(guān)聯(lián)模型用以解決延誤操作是哪個(gè)主體的哪個(gè)行為產(chǎn)生的,該行為依據(jù)了哪個(gè)管理制度,這為通過(guò)改進(jìn)制度和操作辦法來(lái)減少延誤提供了技術(shù)支持。如圖4所示。
3.3.5 航班優(yōu)化模型
航班優(yōu)化主要體現(xiàn)在航班時(shí)刻編排、停機(jī)位、飛機(jī)滑入滑出方面的優(yōu)化,因?yàn)榻?jīng)濟(jì)原因大多數(shù)航班都集中在“黃金時(shí)刻”,這就造成了航班編排時(shí)刻不合理。在一天中某個(gè)時(shí)段航線特別擁擠,導(dǎo)致航班的正常性降低。對(duì)航班時(shí)刻的優(yōu)化方案采用削峰填谷的方式,可以在降低經(jīng)濟(jì)效益最低的基礎(chǔ)上最大程度地提高航班正常率。對(duì)于機(jī)場(chǎng)停機(jī)位與飛機(jī)推出方面的優(yōu)化也有助于提高航班正常性。
4 總結(jié)
將大數(shù)據(jù)技術(shù)運(yùn)用于航班延誤管理,有助于分析清楚導(dǎo)致機(jī)場(chǎng)航班延誤的各種原因及責(zé)任主體,為從源頭上解決航班延誤問(wèn)題提供了方案依據(jù),建立基于大數(shù)據(jù)的航班延誤管理系統(tǒng)對(duì)于促進(jìn)空管、航空公司、機(jī)場(chǎng)三大運(yùn)行主體的協(xié)調(diào)運(yùn)行,減少航班延誤,提高機(jī)場(chǎng)資源利用率,提升旅客服務(wù)質(zhì)量等方面具有重要作用。
參考文獻(xiàn)
[1]Tom White.Hadoop權(quán)威指南:大數(shù)據(jù)的存儲(chǔ)與分析[M].北京:清華大學(xué)出版社,2017.
[2]馮思軼,胡曉蕓,李沁.基于CDM的航班綜合信息應(yīng)用平臺(tái)研究[A].上??崭?,2014.
[3]施瓦茨,扎伊采夫,特卡琴科.高性能MySQL[M].北京:電子工業(yè)出版社,2017.
作者簡(jiǎn)介
馮思軼,碩士學(xué)位。工程師,主要從事機(jī)場(chǎng)信息集成系統(tǒng)的運(yùn)行管理工作。
作者單位
上海機(jī)場(chǎng)(集團(tuán))有限公司虹橋國(guó)際機(jī)場(chǎng)公司 上海市 200335