何俊
摘 要:大數(shù)據(jù)作為計(jì)算機(jī)互聯(lián)網(wǎng)技術(shù)發(fā)展的特征與產(chǎn)物,對(duì)人們的工作、生活和學(xué)習(xí)等各個(gè)方面影響日益顯著。在智慧機(jī)場建設(shè)過程中,大數(shù)據(jù)為自動(dòng)化運(yùn)維帶來海量數(shù)據(jù),為航班正常性提升創(chuàng)造可能、為機(jī)場旅客提供個(gè)性化服務(wù),但也面臨著互聯(lián)互通存在障礙、數(shù)據(jù)價(jià)值稀疏分布以及信息安全問題凸顯的實(shí)際挑戰(zhàn)。因此文章提出了建立統(tǒng)一層次架構(gòu)數(shù)據(jù)平臺(tái),運(yùn)用技術(shù)手段加強(qiáng)分析挖掘,多種措施并舉保障網(wǎng)絡(luò)安全。
關(guān)鍵詞:大數(shù)據(jù);智慧機(jī)場建設(shè);數(shù)據(jù)分析
0 引言
民航局在《中國民航四型機(jī)場建設(shè)行動(dòng)綱要(2020—2035年)》文件中指出,綜合運(yùn)用大數(shù)據(jù)、人工智能等新技術(shù),收集、融合、統(tǒng)計(jì)和分析各類數(shù)據(jù),最終實(shí)現(xiàn)機(jī)場智慧化運(yùn)行。大數(shù)據(jù)從本質(zhì)上看是一種超過普通計(jì)算機(jī)硬件和軟件物理存儲(chǔ)空間和運(yùn)行計(jì)算能力的海量數(shù)據(jù)集合,由于其蘊(yùn)含著人們生產(chǎn)生活進(jìn)步的潛在知識(shí)和價(jià)值,對(duì)大數(shù)據(jù)的分析使用成為民航高質(zhì)量發(fā)展和民航強(qiáng)國建設(shè)的重要組成部分。智慧機(jī)場建設(shè)作為實(shí)現(xiàn)未來“四型機(jī)場”的關(guān)鍵路徑和重要支撐,要積極適應(yīng)大數(shù)據(jù)所帶來的時(shí)代機(jī)遇和應(yīng)用挑戰(zhàn)。
1 大數(shù)據(jù)時(shí)代智慧機(jī)場建設(shè)面臨的機(jī)遇
1.1? 為自動(dòng)化運(yùn)維帶來海量數(shù)據(jù)
國際數(shù)據(jù)公司(IDC)在其《數(shù)據(jù)時(shí)代2025》白皮書指出,伴隨著傳統(tǒng)產(chǎn)業(yè)與移動(dòng)互聯(lián)網(wǎng)技術(shù)深度融合,傳統(tǒng)產(chǎn)品不斷數(shù)字化轉(zhuǎn)型,數(shù)字經(jīng)濟(jì)不斷崛起,核心數(shù)據(jù)、邊緣數(shù)據(jù)、終端數(shù)據(jù)將快速增長,到2025年全球數(shù)據(jù)量預(yù)計(jì)達(dá)到175ZB,數(shù)據(jù)總量將會(huì)是現(xiàn)在的4倍以上。如果將這些數(shù)據(jù)存儲(chǔ)至普通固態(tài)硬盤當(dāng)中并首尾相連擺放,是地球赤道長的12倍多。在大數(shù)據(jù)時(shí)代中,紙質(zhì)書籍通過掃描識(shí)別成為數(shù)據(jù),交流談話通過模數(shù)變換成為數(shù)據(jù),秀美風(fēng)光通過動(dòng)態(tài)感應(yīng)成為數(shù)據(jù),當(dāng)一切現(xiàn)象都被數(shù)據(jù)化并抓取后,大量數(shù)據(jù)就會(huì)被收集存儲(chǔ)起來,供使用者進(jìn)行分析挖掘[1]。對(duì)于智慧機(jī)場而言,候機(jī)樓溫度和亮度傳感信息的收集分析,有助于動(dòng)態(tài)調(diào)節(jié)冷暖設(shè)備和照明設(shè)備的使用功率,在提升旅客舒適性的同時(shí)有效降低能耗;航空器離港進(jìn)港數(shù)據(jù)和機(jī)場機(jī)位信息的挖掘處理,有利于平衡過夜機(jī)位資源,促使區(qū)域內(nèi)機(jī)場機(jī)位合理設(shè)計(jì)規(guī)劃。大數(shù)據(jù)倚靠海量抓取和分布存儲(chǔ)提供了傳統(tǒng)方式難以獲取和收集的海量、客觀、真實(shí)數(shù)據(jù),為智慧機(jī)場高效、環(huán)保、精細(xì)的自動(dòng)化運(yùn)維奠定基礎(chǔ)。
1.2 為航班正常性提升創(chuàng)造可能
數(shù)據(jù)有著顯著的時(shí)效性特征,對(duì)于連續(xù)發(fā)生運(yùn)動(dòng)變化的事物,只有在最快的時(shí)間單位內(nèi)進(jìn)行解析,才能更好地利用其中難以挖掘的價(jià)值。大數(shù)據(jù)擁有對(duì)數(shù)據(jù)高速處理的獨(dú)有能力,百度運(yùn)用大數(shù)據(jù)技術(shù),在1秒鐘之內(nèi)就能對(duì)全國人民? ? ? ?1 000萬次的密集服務(wù)器請求進(jìn)行處理,并保證手機(jī)APP應(yīng)用和網(wǎng)站服務(wù)訪問穩(wěn)定流暢。2010—2019年,全國定期航班航線由1 880條增加至5 521條,年旅客吞吐量100萬人次以上的運(yùn)輸機(jī)場由51個(gè)上漲至106個(gè),但航班正常率僅從75.8%提高至81.65%,正常率相比穩(wěn)定的公路運(yùn)輸和鐵路運(yùn)輸仍具有一定差距。借助大數(shù)據(jù)對(duì)天氣信息、空域流量、航空器位置、候機(jī)樓旅客人數(shù)等動(dòng)態(tài)數(shù)據(jù)采取實(shí)時(shí)監(jiān)控,利用相關(guān)關(guān)系分析建模,合理預(yù)測可能發(fā)生的延誤情況,在關(guān)鍵時(shí)間節(jié)點(diǎn)進(jìn)行主動(dòng)預(yù)警。一方面可以讓機(jī)場服務(wù)人員提前進(jìn)行應(yīng)急預(yù)案,預(yù)先采取應(yīng)對(duì)措施,幫助減少大規(guī)模滯留旅客情形;另一方面也可以讓航空公司及時(shí)應(yīng)對(duì),合理調(diào)配資源,降低因各種意外事件而導(dǎo)致航班延誤的經(jīng)濟(jì)損失[2]。大數(shù)據(jù)高速分析數(shù)據(jù)的特性使得智慧機(jī)場提升航班正常性成為可能。
1.3 為機(jī)場旅客提供個(gè)性化服務(wù)
大數(shù)據(jù)萬物皆可量化的特性使其內(nèi)容包涵了人們?yōu)g覽網(wǎng)頁歷史、餐廳消費(fèi)記錄、微博微信評(píng)論等,最難能可貴的是這些信息避免了傳統(tǒng)問卷調(diào)查可能造成的主觀影響,是人們內(nèi)心所思所想、動(dòng)態(tài)變化的真實(shí)寫照。在大數(shù)據(jù)背景下,智慧機(jī)場“以體驗(yàn)為導(dǎo)向”的建設(shè)運(yùn)營理念更容易得以實(shí)現(xiàn),來源各異的旅客行為軌跡經(jīng)過清洗和建模形成獨(dú)一無二的“旅客畫像”,從而進(jìn)行有針對(duì)性服務(wù)內(nèi)容推送。例如,對(duì)行李較少、時(shí)間緊促的旅客適當(dāng)提早推送值機(jī)提醒,并在其到達(dá)候機(jī)樓時(shí)提示使用自助值機(jī)和通過快速安檢通道的路線;對(duì)消費(fèi)較高、時(shí)間寬松的商務(wù)旅客推薦專車接送、貴賓室候機(jī)服務(wù);對(duì)空鐵聯(lián)程旅客則及時(shí)發(fā)送航班執(zhí)行情況、鐵路列車運(yùn)行時(shí)刻和公共交通工具線路,幫助他們提前做出規(guī)劃,實(shí)現(xiàn)綠色便捷出行。通過大數(shù)據(jù)收集分析和互聯(lián)共享技術(shù),機(jī)場部門、航空公司、商業(yè)實(shí)體、駐場單位等各個(gè)模塊可以緊密聯(lián)系,深度合作,實(shí)現(xiàn)“千人千面”的個(gè)性化服務(wù),讓旅客體驗(yàn)全面突破。
2 大數(shù)據(jù)時(shí)代智慧機(jī)場建設(shè)面臨的挑戰(zhàn)
2.1 互聯(lián)互通存在障礙
當(dāng)前機(jī)場部署運(yùn)行了包括民航管理部門、本場部門、航空公司、駐場保障單位的協(xié)同決策、運(yùn)行控制、離港航班等各種信息服務(wù)系統(tǒng),每日收集處理著航班起降、貨物轉(zhuǎn)運(yùn)、現(xiàn)場監(jiān)控等紛繁復(fù)雜的大量數(shù)據(jù)。大數(shù)據(jù)加劇了不同數(shù)據(jù)格式、數(shù)據(jù)維度、數(shù)據(jù)類型的差異性,減少了同一平臺(tái)進(jìn)行數(shù)據(jù)加工分析的兼容性,降低了采用規(guī)?;苫侄蔚目赡苄浴M瑫r(shí),不同系統(tǒng)中提取、去重、轉(zhuǎn)換的大數(shù)據(jù)清理流程和手段造成了質(zhì)量各異的數(shù)據(jù),這些信息定義不一、解釋模糊,缺乏統(tǒng)一嚴(yán)格的數(shù)據(jù)標(biāo)準(zhǔn),無法在多機(jī)器進(jìn)行消息互聯(lián)互通時(shí)保證其正確性、精準(zhǔn)性和可信度,數(shù)據(jù)價(jià)值大大下降。此外,各方對(duì)數(shù)據(jù)資源的管理權(quán)、使用權(quán)和共享義務(wù)暫不明確,數(shù)據(jù)擁有者自成體系、各行為政,數(shù)據(jù)交換通道狹窄,邊界效應(yīng)明顯,信息壁壘森嚴(yán);數(shù)據(jù)使用者往往需要經(jīng)歷復(fù)雜漫長的申請審批流程才能獲得原始內(nèi)容,難以挖掘利用具有時(shí)效性的數(shù)據(jù)。
2.2 數(shù)據(jù)價(jià)值稀疏分布
一方面,隨著人們對(duì)數(shù)據(jù)的認(rèn)知不斷更新和計(jì)算機(jī)軟硬件設(shè)備不斷迭代,來自航站樓的環(huán)境溫度濕度感測,來自機(jī)坪的工作人員軌跡數(shù)據(jù)、和來自倉庫物品分揀路徑信息等AOBD精細(xì)化數(shù)據(jù)也被大數(shù)據(jù)自動(dòng)化系統(tǒng)和多陣列硬盤所記錄和存儲(chǔ),數(shù)據(jù)總量不斷增大,數(shù)據(jù)厚度不斷提升。這些數(shù)據(jù)狀態(tài)不一、內(nèi)容各異,包含的價(jià)值也不盡相同,有助于提升智慧機(jī)場建設(shè)的有效信息往往只是異構(gòu)多態(tài)大數(shù)據(jù)的滄海一粟,需要運(yùn)用算法進(jìn)行分析挖掘。另一方面,集成網(wǎng)絡(luò)架構(gòu)和無人值守設(shè)備的大量投入雖然降低了機(jī)房煩瑣人工運(yùn)營成本,但讓日常調(diào)試信息、設(shè)備告警提示、服務(wù)異常報(bào)告等冗余數(shù)據(jù)日積月累。同時(shí),由于傳統(tǒng)介質(zhì)年久失修,部分記錄了航班起降歷史、設(shè)備性能狀態(tài)、旅客出港記錄的紙張和磁盤破損失效,經(jīng)過量化后錯(cuò)誤進(jìn)一步增加,具有特定價(jià)值的數(shù)據(jù)比例持續(xù)降低。大數(shù)據(jù)時(shí)代數(shù)字信息價(jià)值密度稀疏,從數(shù)據(jù)提取出為特定目標(biāo)精準(zhǔn)的有效信息難度加大。
2.3 信息安全問題凸顯
在旅客吞吐量迅猛增加的背景下,民航重要信息系統(tǒng)中的離港系統(tǒng)、安監(jiān)系統(tǒng)、運(yùn)維系統(tǒng)、廣播系統(tǒng)等各種子系統(tǒng)均存儲(chǔ)著海量高維度數(shù)據(jù),這些數(shù)據(jù)內(nèi)容不同、相互依賴、關(guān)系錯(cuò)綜復(fù)雜,其中不免包含了旅客身份識(shí)別、個(gè)人消費(fèi)習(xí)慣、機(jī)位調(diào)度信息、貨運(yùn)交互數(shù)據(jù)等大量重要信息。2017年? 2月,紐約斯圖爾特國際機(jī)場包含了電子郵件、政府文件和交易密碼的750GB內(nèi)部敏感數(shù)據(jù)被泄露至互聯(lián)網(wǎng)上;2020年? ?1月,國航員工通過提取航班數(shù)據(jù)將部分明星的乘機(jī)信息、活動(dòng)軌跡等私人信息發(fā)布至微博;2020年3月,舊金山國際機(jī)場的兩個(gè)網(wǎng)站被黑客攻破,備用航線、機(jī)場運(yùn)營、機(jī)場建設(shè)信息被不法人士獲取。大數(shù)據(jù)背景下,越來越多的終端通過無線信號(hào)和電纜光纖連接至服務(wù)器上,設(shè)備“接入點(diǎn)”數(shù)量增加、范圍擴(kuò)大,傳統(tǒng)的內(nèi)外分開、風(fēng)險(xiǎn)隔離的邊界防護(hù)被打破,一旦出現(xiàn)物理設(shè)備故障、信息系統(tǒng)被攻擊、通信線路干擾等,都會(huì)使信息安全受到嚴(yán)重威脅,輕者會(huì)造成非正常航班增加、部分旅客信息泄露,重者會(huì)危及飛行安全甚至國家安全。
3 大數(shù)據(jù)時(shí)代智慧機(jī)場建設(shè)的策略
3.1 建立統(tǒng)一層次架構(gòu)數(shù)據(jù)平臺(tái)
應(yīng)構(gòu)建以機(jī)場為中心的統(tǒng)一智慧大數(shù)據(jù)處理應(yīng)用平臺(tái),自上而下分為5個(gè)層級(jí),其中包括具體應(yīng)用層、門戶界面層、支撐服務(wù)層、感知接入層和基礎(chǔ)資源層。具體應(yīng)用層為基于機(jī)場、航空公司的旅客服務(wù)、安全生產(chǎn)等業(yè)務(wù)需求而定制開發(fā)的各項(xiàng)服務(wù)應(yīng)用;門戶界面層給不同權(quán)限的平臺(tái)應(yīng)用人員和系統(tǒng)支撐人員提供管理接口界面,便于訪問和檢索多維度數(shù)據(jù);支撐服務(wù)層承載平臺(tái)收集清洗、變換分析、挖掘建模的大數(shù)據(jù)技術(shù)核心應(yīng)用,同時(shí)運(yùn)行面向事務(wù)消息和過程隊(duì)列的中間件,提供資源管理、負(fù)載均衡、故障恢復(fù)等必要服務(wù);感知接入層集合無線局域網(wǎng)、Bluetooth mesh、NB-IoT多途徑通訊模塊,為各種接入設(shè)備建立覆蓋廣闊、安全穩(wěn)定、低延遲低功耗的數(shù)據(jù)傳輸通道;基礎(chǔ)資源層包括客戶端、服務(wù)器硬件設(shè)備資源,基礎(chǔ)操作系統(tǒng)、分布式計(jì)算系統(tǒng)及環(huán)境配置等軟件資源,以及結(jié)構(gòu)化和非結(jié)構(gòu)化存在的數(shù)據(jù)資源。同時(shí)還要綜合實(shí)際業(yè)務(wù)需求、硬件設(shè)備計(jì)算能力和預(yù)留未來需要,制定標(biāo)準(zhǔn)化的數(shù)據(jù)采集、處理、儲(chǔ)存的處理流程,規(guī)定數(shù)據(jù)在常用應(yīng)用場景的語義解釋,在平臺(tái)內(nèi)建立統(tǒng)一數(shù)據(jù)視圖來減輕和消除數(shù)據(jù)差異,為大數(shù)據(jù)技術(shù)助力智慧機(jī)場建設(shè)奠定堅(jiān)實(shí)基礎(chǔ)。
3.2 運(yùn)用技術(shù)手段加強(qiáng)分析挖掘
在智慧機(jī)場建設(shè)的過程中訂座系統(tǒng)、地服系統(tǒng)、監(jiān)控平臺(tái)積累了數(shù)以萬計(jì)的數(shù)據(jù)和信息,要運(yùn)用大數(shù)據(jù)技術(shù)手段對(duì)其進(jìn)行處理分析,使數(shù)據(jù)在交叉復(fù)用中發(fā)揮更大價(jià)值。對(duì)于設(shè)備運(yùn)行數(shù)據(jù),將服務(wù)器滾動(dòng)日志、門禁動(dòng)態(tài)數(shù)據(jù)、硬件告警事件等海量信息進(jìn)行實(shí)時(shí)聚類分析,快速定位異常離群點(diǎn),智能調(diào)度維護(hù)人員,提高管理效率,減少運(yùn)維成本;同時(shí)采用相關(guān)關(guān)系分析,找到與系統(tǒng)故障出現(xiàn)高度關(guān)聯(lián)的“標(biāo)示值”,加強(qiáng)對(duì)特定數(shù)據(jù)的采集監(jiān)控及管控,促使故障發(fā)生率降低。對(duì)于航班狀態(tài)數(shù)據(jù),借助決策樹和隨機(jī)森林算法,使飛行路線、機(jī)場服務(wù)、氣象預(yù)報(bào)、交通管制數(shù)據(jù)流在清洗和轉(zhuǎn)換后經(jīng)個(gè)體學(xué)習(xí)和集成學(xué)習(xí),建立航班預(yù)測模型,根據(jù)實(shí)際情況細(xì)化各個(gè)流程的閾值,在超過時(shí)間節(jié)點(diǎn)時(shí)主動(dòng)實(shí)施響應(yīng)措施,實(shí)現(xiàn)航班延誤由“事后處理”到“事前干預(yù)”的轉(zhuǎn)變。對(duì)于人員流動(dòng)數(shù)據(jù),一方面利用離港信息、位置定位、人臉數(shù)據(jù)的互聯(lián)互通,實(shí)現(xiàn)候機(jī)樓旅客的全流程自助無紙化通關(guān)和便捷改簽機(jī)票;另一方面可以使用邏輯回歸把個(gè)人基本信息、航班日期時(shí)間、交通方式偏好、餐食飲用習(xí)慣等特征映射到向量空間,利用貝葉斯算法構(gòu)建屬于個(gè)人獨(dú)一無二的“旅客畫像”,借助畫像標(biāo)簽推薦旅客采購當(dāng)?shù)靥厣a(chǎn)品,運(yùn)用協(xié)同過濾將擁有相似特征旅客的出行工具、便捷通道、貴賓廳服務(wù)進(jìn)行同步推送,采用自然語言處理分析微信微博中旅程評(píng)價(jià)的情感傾向,提供個(gè)性化服務(wù),完善人性化措施。
3.3 多種措施并舉保障網(wǎng)絡(luò)安全
首先,要加強(qiáng)網(wǎng)絡(luò)攻擊檢測和應(yīng)對(duì)。在日常網(wǎng)絡(luò)維護(hù)管理時(shí)需要進(jìn)一步加固系統(tǒng),及時(shí)更新軟件版本、關(guān)閉危險(xiǎn)端口、使用掃描工具進(jìn)行安全巡檢。同時(shí),運(yùn)用系統(tǒng)運(yùn)行日志、監(jiān)控狀態(tài)記錄、異常行為表現(xiàn)進(jìn)行關(guān)聯(lián)分析,建立攻擊檢測模型框架從而對(duì)APT攻擊、DDoS洪泛攻擊等針對(duì)大數(shù)據(jù)系統(tǒng)的常見網(wǎng)絡(luò)攻擊進(jìn)行識(shí)別,以便形成快速響應(yīng)特殊情況,最大程度減少損失。其次,要完善數(shù)據(jù)訪問控制。大數(shù)據(jù)場景下,用戶跨系統(tǒng)、跨安全域訪問操作增多,信息流轉(zhuǎn)、分析挖掘等處理流程煩瑣,必須采取有效的訪問控制手段確保數(shù)據(jù)免遭非法用戶的讀取與改寫。基于屬性的訪問控制改變了以服務(wù)提供商為分配管理中心的常規(guī)模式,利用主體與客體之間的屬性關(guān)系將訪問結(jié)構(gòu)與密文密鑰高度關(guān)聯(lián),數(shù)據(jù)擁有者只需要通過修改訪問結(jié)構(gòu)即可實(shí)現(xiàn)靈活多變的權(quán)限管理[3]。它解決了面對(duì)龐大用戶群體頻繁訪問服務(wù)器的問題,無須逐一分發(fā)屬性密鑰,實(shí)現(xiàn)了由“一對(duì)一”管理向“一對(duì)多”管理,有效降低計(jì)算開銷和傳輸壓力。最后,要確保數(shù)據(jù)服務(wù)隱私保護(hù)及關(guān)鍵信息脫敏。機(jī)場在進(jìn)行數(shù)據(jù)共享和挖掘時(shí)不免涉及旅客個(gè)人身份、航空器位置、設(shè)備運(yùn)行日志等隱私信息和關(guān)鍵信息,采用高效可靠的隱私保護(hù)與數(shù)據(jù)脫敏技術(shù),為解決隱私泄露問題提供堅(jiān)實(shí)保障??梢栽谛畔⒔粨Q分析時(shí)引入脫敏和k-匿名方法,對(duì)數(shù)據(jù)中可以定位到個(gè)人的標(biāo)示符值進(jìn)行保留格式加密或直接刪除,對(duì)具有潛在風(fēng)險(xiǎn)的準(zhǔn)標(biāo)示符值運(yùn)用泛化和壓縮脫敏,再將全體數(shù)據(jù)歸為若干個(gè)等價(jià)組,每個(gè)等價(jià)組最小包含k條數(shù)據(jù),防止不法分子通過大數(shù)據(jù)鏈?zhǔn)焦魺o法確定與特定用戶相關(guān)的記錄,保護(hù)個(gè)人隱私。
[參考文獻(xiàn)]
[1][英]維克托·邁爾·舍恩伯格,肯尼思·庫克耶.大數(shù)據(jù)時(shí)代[M].杭州:浙江人民出版社,2013.
[2]孫召利,董桂枝,吳艷,等.大數(shù)據(jù)在民航領(lǐng)域應(yīng)用的初步研究[J].空運(yùn)商務(wù),2014(2):11-16,64.
[3]毋濤,張帆.云計(jì)算下基于屬性的訪問控制方法[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2016(2):231-234.
(編輯 傅金睿)