鄭海飛 徐有成 郝 蓮 陸 軍 楊 波
(上海飛機(jī)設(shè)計(jì)研究院,上海 201210)
面向持續(xù)適航工程數(shù)據(jù)的大數(shù)據(jù)采集和處理技術(shù)初探
鄭海飛 徐有成 郝 蓮 陸 軍 楊 波
(上海飛機(jī)設(shè)計(jì)研究院,上海 201210)
國(guó)產(chǎn)某型飛機(jī)在持續(xù)適航階段開(kāi)展事件收集、風(fēng)險(xiǎn)評(píng)估、工程調(diào)查和措施制定等工作時(shí),需要機(jī)型資料、機(jī)隊(duì)信息、運(yùn)營(yíng)記錄、事故事件、局方信息等工程數(shù)據(jù)提供輸入、參考以及輔助分析。研究了持續(xù)適航工程數(shù)據(jù)與大數(shù)據(jù)之間的關(guān)系,初步規(guī)劃了面向持續(xù)適航工程數(shù)據(jù)的大數(shù)據(jù)系統(tǒng)架構(gòu),并通過(guò)以下自動(dòng)化方式實(shí)現(xiàn)了相關(guān)數(shù)據(jù)的采集與處理,形成了持續(xù)適航工程數(shù)據(jù)庫(kù):首先利用網(wǎng)絡(luò)爬蟲(chóng)數(shù)據(jù)采集技術(shù)實(shí)時(shí)準(zhǔn)確地獲取一些國(guó)內(nèi)外公開(kāi)數(shù)據(jù);其次應(yīng)用VBA語(yǔ)言對(duì)已獲得數(shù)據(jù)進(jìn)行整理與自定義處理;最后基于大數(shù)據(jù)的映射分析方法對(duì)這些工程數(shù)據(jù)進(jìn)行分析。該持續(xù)適航工程數(shù)據(jù)庫(kù)已有效應(yīng)用于某型國(guó)產(chǎn)飛機(jī)持續(xù)適航體系的日常運(yùn)行工作。
持續(xù)適航;工程數(shù)據(jù);大數(shù)據(jù);風(fēng)險(xiǎn)評(píng)估;數(shù)據(jù)抓??;數(shù)據(jù)處理;映射分析
國(guó)產(chǎn)某型飛機(jī)在持續(xù)適航階段開(kāi)展事件收集、安全風(fēng)險(xiǎn)評(píng)估、工程調(diào)查和制定改正改進(jìn)措施等工作時(shí),需要工程數(shù)據(jù)庫(kù)為風(fēng)險(xiǎn)評(píng)估工作提供數(shù)據(jù)輸入、數(shù)據(jù)參考以及分析結(jié)論。目前,應(yīng)用大數(shù)據(jù)采集和處理技術(shù),持續(xù)適航體系已初步建立“持續(xù)適航工程數(shù)據(jù)庫(kù)”,并在持續(xù)完備中。該數(shù)據(jù)庫(kù)包含多種數(shù)據(jù)類(lèi)型:(1) 針對(duì)特有機(jī)型的數(shù)據(jù):設(shè)計(jì)需求數(shù)據(jù)、設(shè)計(jì)要求數(shù)據(jù)、設(shè)計(jì)規(guī)范(英文)、詳細(xì)設(shè)計(jì)報(bào)告、結(jié)構(gòu)或系統(tǒng)CATIA數(shù)模、審定計(jì)劃,適航符合性報(bào)告(MOC1-MOC9)、交聯(lián)系統(tǒng)——專項(xiàng)審定計(jì)劃、技術(shù)出版物以及飛機(jī)在運(yùn)營(yíng)階段的事件、事故癥候和事故,以及相關(guān)的客戶服務(wù)文件、適航指令;(2) 針對(duì)國(guó)內(nèi)外不同機(jī)型的數(shù)據(jù):國(guó)內(nèi)外不同機(jī)型的事故、事故癥候數(shù)據(jù),國(guó)內(nèi)外不同機(jī)型的適航指令數(shù)據(jù)。
該數(shù)據(jù)庫(kù)的主要使用目的為:(1) 為持續(xù)適航事件的風(fēng)險(xiǎn)評(píng)估提供飛機(jī)型號(hào)數(shù)據(jù)輸入,包括設(shè)計(jì)數(shù)據(jù)、三維結(jié)構(gòu)數(shù)據(jù)、安全性分析數(shù)據(jù)、運(yùn)營(yíng)維修數(shù)據(jù)等,為風(fēng)險(xiǎn)評(píng)估中的潛在不安全狀態(tài)分析提供數(shù)據(jù)依據(jù);(2) 利用反證法或引證法,為持續(xù)適航事件的風(fēng)險(xiǎn)評(píng)估提供參考依據(jù);(3) 實(shí)現(xiàn)內(nèi)網(wǎng)搜索查詢、實(shí)現(xiàn)跨庫(kù)搜索查詢和支持輔助分析的功能。
持續(xù)適航工程數(shù)據(jù)庫(kù)的數(shù)據(jù)量化指標(biāo)如表1所示。
表1 持續(xù)適航工程數(shù)據(jù)庫(kù)的數(shù)據(jù)量化指標(biāo)
綜上所述,持續(xù)適航工程數(shù)據(jù)的特征與大數(shù)據(jù)的特征極為相似[1]。大數(shù)據(jù)的五大特征與特性為:數(shù)據(jù)體量大(Volume)、數(shù)據(jù)處理速度快(Velocity)、數(shù)據(jù)類(lèi)別多(Variety)、數(shù)據(jù)真實(shí)性強(qiáng)(Veracity)、數(shù)據(jù)潛在價(jià)值高(Value),簡(jiǎn)稱為“5V”特征[2-8]。為了確保航空器的安全運(yùn)營(yíng)以及運(yùn)營(yíng)的經(jīng)濟(jì)性,持續(xù)適航體系要求針對(duì)航空器的運(yùn)營(yíng)過(guò)程中出現(xiàn)的任何事件,要做出及時(shí)、迅速的風(fēng)險(xiǎn)評(píng)估,以及分析出航空器的潛在不安全狀態(tài),因此要求快速地對(duì)持續(xù)適航工程數(shù)據(jù)進(jìn)行處理與分析,并得出有效的措施建議;持續(xù)適航工程數(shù)據(jù)與大數(shù)據(jù)類(lèi)似,其數(shù)據(jù)來(lái)源于航空器的設(shè)計(jì)、制造、試飛與日常運(yùn)營(yíng)過(guò)程中,均為原始數(shù)據(jù),因此具有很強(qiáng)的真實(shí)性。可以看出,持續(xù)適航工程數(shù)據(jù)是大數(shù)據(jù)在民航制造業(yè)、民航運(yùn)輸業(yè)的具體體現(xiàn),站在大數(shù)據(jù)層面,從大數(shù)據(jù)的視角,在持續(xù)適航工程數(shù)據(jù)的采集、存儲(chǔ)及分析處理方面引入大數(shù)據(jù)理念,可以更好、更快、更有效地支持并服務(wù)于持續(xù)適航體系的運(yùn)行。
基于大數(shù)據(jù)的理念分析處理持續(xù)適航工程數(shù)據(jù),就需要一個(gè)完備的持續(xù)適航工程數(shù)據(jù)大數(shù)據(jù)系統(tǒng)。持續(xù)適航體系提出了關(guān)于持續(xù)適航工程數(shù)據(jù)的大數(shù)據(jù)系統(tǒng)的系統(tǒng)架構(gòu),主要包括數(shù)據(jù)架構(gòu)和管理架構(gòu)兩部分。持續(xù)適航工程數(shù)據(jù)庫(kù)基礎(chǔ)架構(gòu)的數(shù)據(jù)架構(gòu)和管理架構(gòu)如圖1、圖2所示。
2.1 數(shù)據(jù)架構(gòu)
主要基于數(shù)據(jù)層、功能層、應(yīng)用層和外觀層搭建持續(xù)適航工程數(shù)據(jù)庫(kù)的數(shù)據(jù)架構(gòu),實(shí)現(xiàn)數(shù)據(jù)庫(kù)的工程數(shù)據(jù)輸入、輸出和處理及人機(jī)交互等功能。
1) 數(shù)據(jù)層包括型號(hào)資料數(shù)據(jù)模塊、機(jī)隊(duì)信息數(shù)據(jù)模塊、試飛信息數(shù)據(jù)模塊和運(yùn)營(yíng)數(shù)據(jù)模塊,以及可輸出分析數(shù)據(jù)的專題分析數(shù)據(jù)模塊。
2) 功能層包括字段搜索(含數(shù)據(jù)下載功能)、報(bào)告上傳、數(shù)據(jù)增刪和模塊增刪四個(gè)基礎(chǔ)功能模塊,數(shù)據(jù)統(tǒng)計(jì)分析和數(shù)據(jù)關(guān)聯(lián)兩個(gè)延伸功能模塊,數(shù)據(jù)預(yù)測(cè)和人工智能兩個(gè)高階功能模塊,功能層總共包含八個(gè)功能模塊。
字段搜索功能模塊(含數(shù)據(jù)下載功能)對(duì)數(shù)據(jù)層進(jìn)行關(guān)鍵字段檢索,從而輸出相應(yīng)持續(xù)適航工程數(shù)據(jù);報(bào)告上傳功能模塊僅針對(duì)專題分析數(shù)據(jù)模塊進(jìn)行工程數(shù)據(jù)分析報(bào)告的上傳;數(shù)據(jù)增刪功能模塊針對(duì)數(shù)據(jù)層中數(shù)據(jù)的實(shí)效性、正確性進(jìn)行更新、更正的操作;模塊增刪功能模塊針對(duì)數(shù)據(jù)層中數(shù)據(jù)模塊的實(shí)效性、正確性進(jìn)行更新、更正及拓展的操作;統(tǒng)計(jì)分析功能模塊具有數(shù)據(jù)的科學(xué)統(tǒng)計(jì)、處理分析功能,并將分析處理后的數(shù)據(jù)套用專題分析數(shù)據(jù)模塊中的分析報(bào)告模板進(jìn)行分析報(bào)告輸出;數(shù)據(jù)關(guān)聯(lián)功能模塊將關(guān)聯(lián)數(shù)據(jù)之間的相似性、矛盾性等具有工程研究?jī)r(jià)值的關(guān)系與映射;數(shù)據(jù)預(yù)測(cè)和人工智能將通過(guò)對(duì)現(xiàn)有數(shù)據(jù)及數(shù)據(jù)之間的關(guān)聯(lián)的運(yùn)算與分析,得出具有工程研究?jī)r(jià)值和實(shí)際操作價(jià)值的結(jié)論和建議。
3) 應(yīng)用層包括風(fēng)險(xiǎn)評(píng)估、事件篩選、工程調(diào)查和經(jīng)驗(yàn)總結(jié)等服務(wù)項(xiàng)目,服務(wù)于持續(xù)適航體系的運(yùn)營(yíng)。
4) 外觀層包括文字輸出、圖表輸出、圖形輸出、3D人機(jī)交互及報(bào)告輸出五個(gè)應(yīng)用模塊。3D人機(jī)交互是為了實(shí)現(xiàn)持續(xù)適航工程數(shù)據(jù)的3D交互式可視化,高效、便捷地為持續(xù)適航體系運(yùn)行提供數(shù)據(jù)支持。
2.2 管理架構(gòu)
主要基于訪問(wèn)層、訪問(wèn)層(會(huì)員)、操作層以及維護(hù)層搭建持續(xù)適航工程數(shù)據(jù)庫(kù)的管理架構(gòu),實(shí)現(xiàn)工程數(shù)據(jù)輸入、輸出和處理以及數(shù)據(jù)庫(kù)更新、維護(hù)的流程化和權(quán)限化管理(權(quán)限向上兼容)。
1) 訪問(wèn)層具有對(duì)數(shù)據(jù)庫(kù)的字段搜索(含數(shù)據(jù)下載權(quán)限)權(quán)限和統(tǒng)計(jì)分析權(quán)限,可以得到文字、圖表、圖形及報(bào)告的輸出;
2) 會(huì)員具有對(duì)數(shù)據(jù)庫(kù)的報(bào)告上傳及統(tǒng)計(jì)分析權(quán)限,對(duì)專題分析數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)補(bǔ)充;工程數(shù)據(jù)庫(kù)會(huì)員擁有個(gè)人賬戶,可以實(shí)現(xiàn)對(duì)自己已有數(shù)據(jù)的關(guān)聯(lián),亦可對(duì)已關(guān)聯(lián)的其他會(huì)員數(shù)據(jù)的關(guān)聯(lián),即多層次的數(shù)據(jù)關(guān)聯(lián);
3) 操作層對(duì)持續(xù)適航工程數(shù)據(jù)進(jìn)行實(shí)時(shí)跟蹤,具有對(duì)數(shù)據(jù)庫(kù)數(shù)據(jù)的增加和刪減權(quán)限;
4) 維護(hù)層具有對(duì)數(shù)據(jù)庫(kù)數(shù)據(jù)模塊的增加、刪減和拓展權(quán)限。
建立持續(xù)適航工程數(shù)據(jù)的大數(shù)據(jù)系統(tǒng),首先需要獲得數(shù)據(jù),利用網(wǎng)絡(luò)爬蟲(chóng)的數(shù)據(jù)采集技術(shù)可以高效準(zhǔn)確地獲取一些國(guó)內(nèi)外公開(kāi)數(shù)據(jù);其次是對(duì)已獲得數(shù)據(jù)的整理與處理,以便后續(xù)分析使用;最后是利用大數(shù)據(jù)的分析方法,例如線性回歸、決策樹(shù)、支持向量機(jī)、貝葉斯網(wǎng)絡(luò)、k均值以及Apriori關(guān)聯(lián)等算法[9-10],對(duì)系統(tǒng)中的數(shù)據(jù)進(jìn)行分析,因此需要建立針對(duì)不同應(yīng)用場(chǎng)合的輔助分析方法。已實(shí)現(xiàn)的大數(shù)據(jù)技術(shù)方案如下所述。
3.1 基于網(wǎng)絡(luò)爬蟲(chóng)的數(shù)據(jù)采集技術(shù)
持續(xù)適航的工程數(shù)據(jù)具有體量大的特點(diǎn),包括飛機(jī)型號(hào)數(shù)據(jù)和國(guó)外相似機(jī)型數(shù)據(jù)。因此數(shù)據(jù)的采集不能靠人工來(lái)實(shí)現(xiàn)。
利用網(wǎng)絡(luò)數(shù)據(jù)抓取技術(shù),包括開(kāi)源網(wǎng)絡(luò)數(shù)據(jù)爬蟲(chóng)抓取技術(shù)或者Python語(yǔ)言自編譯數(shù)據(jù)抓取技術(shù),建立高效、準(zhǔn)確的抓取規(guī)則,執(zhí)行持續(xù)適航工程數(shù)據(jù)的抓取工作?;诰W(wǎng)絡(luò)爬蟲(chóng)數(shù)據(jù)采集的關(guān)鍵技術(shù)是抓取規(guī)則的建立,其技術(shù)方案如圖3所示。
持續(xù)適航工程數(shù)據(jù)是不斷更新的,不能使用不具有時(shí)效性的數(shù)據(jù)。利用網(wǎng)絡(luò)數(shù)據(jù)抓取技術(shù)以及上述的數(shù)據(jù)抓取規(guī)則模型,建立數(shù)據(jù)更新的抓取規(guī)則,實(shí)現(xiàn)持續(xù)適航工程數(shù)據(jù)的定時(shí)更新。采集的數(shù)據(jù)均來(lái)自FAA、EASA以及NTSB的公開(kāi)數(shù)據(jù),因此數(shù)據(jù)的真實(shí)性是可以保證的。
針對(duì)采集數(shù)據(jù)的重復(fù)性,在應(yīng)用3.2節(jié)的數(shù)據(jù)處理技術(shù)之后,利用Excel工具中自帶的“刪除重復(fù)數(shù)據(jù)”功能,即可實(shí)現(xiàn)數(shù)據(jù)的去重復(fù)性。
3.2 基于VBA語(yǔ)言的數(shù)據(jù)處理技術(shù)
持續(xù)適航工程數(shù)據(jù)的數(shù)據(jù)量較大,數(shù)據(jù)存儲(chǔ)量已達(dá)到數(shù)十GB,數(shù)據(jù)條數(shù)已有三十多萬(wàn)條,人工手動(dòng)處理是不現(xiàn)實(shí)的,必須開(kāi)發(fā)數(shù)據(jù)自動(dòng)化批處理技術(shù)。因此本文提出了基于VBA語(yǔ)言的數(shù)據(jù)處理技術(shù),其關(guān)鍵技術(shù)是數(shù)據(jù)處理的核心代碼,如圖4和圖5所示。
圖4和圖5展示了核心代碼主體框架,中間具體算法已省略;可根據(jù)數(shù)據(jù)結(jié)構(gòu)的變化,制定不同的算法,從而實(shí)現(xiàn)基于VBA語(yǔ)言的數(shù)據(jù)處理技術(shù)。
3.3 基于映射分析的數(shù)據(jù)精確定位方法
持續(xù)適航工程數(shù)據(jù)系統(tǒng)的數(shù)據(jù)量已達(dá)到數(shù)十萬(wàn)條,同時(shí)具備了基本的查詢、關(guān)鍵詞搜索功能。但是,查詢和搜索的精度還較低。查詢和搜索結(jié)果經(jīng)常為數(shù)十條或者幾百條,而真正與持續(xù)適航事件切合的數(shù)據(jù)就隱藏在這些查詢結(jié)果中,往往需要人工查閱這些查詢結(jié)果才能進(jìn)行有效數(shù)據(jù)的定位,不利于工作效率的提升,不符合持續(xù)適航事件快速處理的原則。因此開(kāi)展“基于映射分析的持續(xù)適航工程數(shù)據(jù)精確定位方法”的研究。
持續(xù)適航工程數(shù)據(jù)系統(tǒng)中的外部數(shù)據(jù)絕大部分為英文數(shù)據(jù),而在持續(xù)適航事件風(fēng)險(xiǎn)評(píng)估工作過(guò)程中接觸的數(shù)據(jù)均為中文數(shù)據(jù),因此需要應(yīng)用“映射分析法”,建立BigTable數(shù)據(jù)庫(kù)——映射關(guān)系數(shù)據(jù)庫(kù)。該數(shù)據(jù)庫(kù)中包含多種數(shù)據(jù)映射表,例如“飛機(jī)結(jié)構(gòu)/系統(tǒng)部件數(shù)據(jù)映射關(guān)系表”、“飛機(jī)安全性數(shù)據(jù)映射關(guān)系表”等多種數(shù)據(jù)映射表。
“基于映射分析的持續(xù)適航工程數(shù)據(jù)精確定位方法”的實(shí)現(xiàn)路徑有兩種:一是基于某型飛機(jī)結(jié)構(gòu)或者系統(tǒng)部件的映射分析數(shù)據(jù)精確定位法;二是基于某型飛機(jī)安全性數(shù)據(jù)的映射分析數(shù)據(jù)精確定位法。如圖6所示。
1) 方法一
根據(jù)接收到的某型飛機(jī)持續(xù)適航事件,從事件中提取出涉及的飛機(jī)結(jié)構(gòu)或者系統(tǒng)相關(guān)的數(shù)據(jù),依據(jù)提取的數(shù)據(jù)在“某型飛機(jī)機(jī)型數(shù)據(jù)”中進(jìn)行飛機(jī)結(jié)構(gòu)或者系統(tǒng)數(shù)據(jù)的精確、全面定位,為風(fēng)險(xiǎn)評(píng)估做充分輸入。
依據(jù)提取的飛機(jī)結(jié)構(gòu)或系統(tǒng)的精確、全面數(shù)據(jù),使用“BigTable數(shù)據(jù)庫(kù)”,定位國(guó)內(nèi)外其他機(jī)型的映射關(guān)系,為在“持續(xù)適航工程數(shù)據(jù)外部數(shù)據(jù)”中進(jìn)行數(shù)據(jù)定位提供輸入?!癇igTable數(shù)據(jù)庫(kù)”中的飛機(jī)結(jié)構(gòu)/系統(tǒng)部件映射關(guān)系表如圖7所示。以防冰系統(tǒng)為例。
從圖中可以看出,映射關(guān)系表不僅包含某型飛機(jī)中英文映射關(guān)系,還包含常見(jiàn)機(jī)型(737、A320)的映射關(guān)系。根據(jù)映射關(guān)系查詢結(jié)果,使用“持續(xù)適航工程數(shù)據(jù)外部數(shù)據(jù)”,可進(jìn)行國(guó)內(nèi)外相關(guān)機(jī)型事故、事故癥候的初步精確定位——標(biāo)題、概述定位;在初步定位結(jié)果不滿足需求的情況下,可進(jìn)行深度精確定位——調(diào)查報(bào)告、適航指令報(bào)告的全文搜索定位。從而實(shí)現(xiàn)數(shù)據(jù)的精確定位功能,為持續(xù)適航事件的風(fēng)險(xiǎn)評(píng)估工作提供驗(yàn)證性依據(jù)。
2) 方法二
根據(jù)接收到的某型飛機(jī)持續(xù)適航事件,從事件中提取出涉及的飛機(jī)安全性指標(biāo)相關(guān)的數(shù)據(jù),依據(jù)提取的數(shù)據(jù)在“某型飛機(jī)機(jī)型數(shù)據(jù)”中進(jìn)行飛機(jī)安全性分析數(shù)據(jù)的精確、全面定位,為風(fēng)險(xiǎn)評(píng)估做充分輸入。
依據(jù)提取的飛機(jī)安全性分析數(shù)據(jù)的精確、全面數(shù)據(jù),使用“BigTable數(shù)據(jù)庫(kù)”,定位國(guó)內(nèi)外其他機(jī)型的映射關(guān)系,為在“持續(xù)適航工程數(shù)據(jù)外部數(shù)據(jù)”中進(jìn)行數(shù)據(jù)定位提供輸入?!癇igTable數(shù)據(jù)庫(kù)”中的飛機(jī)安全性分析數(shù)據(jù)映射關(guān)系表如圖8所示。以防冰系統(tǒng)為例。
從圖中可以看出包含某型飛機(jī)座艙壓調(diào)系統(tǒng)FHA的中英文映射關(guān)系。根據(jù)映射關(guān)系查詢結(jié)果,使用“持續(xù)適航工程數(shù)據(jù)外部數(shù)據(jù)”,可進(jìn)行國(guó)內(nèi)外相關(guān)機(jī)型事故、事故癥候的初步精確定位——標(biāo)題、概述定位,例如根據(jù)FHA數(shù)據(jù)可進(jìn)行初步精確定位;在初步定位結(jié)果不滿足需求的情況下,可進(jìn)行深度精確定位——調(diào)查報(bào)告、適航指令報(bào)告的全文搜索定位,例如根據(jù)FMEA、FTA數(shù)據(jù)進(jìn)行深度精確定位。從而實(shí)現(xiàn)數(shù)據(jù)的精確定位功能,為持續(xù)適航事件的風(fēng)險(xiǎn)評(píng)估工作提供驗(yàn)證性依據(jù)。
依據(jù)確定的持續(xù)適航工程數(shù)據(jù)大數(shù)據(jù)系統(tǒng)的系統(tǒng)架構(gòu),利用基于網(wǎng)絡(luò)爬蟲(chóng)的數(shù)據(jù)采集技術(shù)、基于VBA語(yǔ)言的數(shù)據(jù)處理技術(shù)和基于映射分析的數(shù)據(jù)精確定位方法,已形成了大數(shù)據(jù)系統(tǒng)的初步形態(tài),持續(xù)適航工程數(shù)據(jù)庫(kù)已有效應(yīng)用于國(guó)產(chǎn)某型飛機(jī)持續(xù)適航體系的日常運(yùn)行工作中。
在之后的工作,需要在以下兩個(gè)方面開(kāi)展研究工作:(1) 數(shù)據(jù)的更新與迭代,系統(tǒng)內(nèi)的數(shù)據(jù)必須能夠體現(xiàn)出當(dāng)前民航運(yùn)輸和航空工業(yè)的最新?tīng)顟B(tài);
(2) 針對(duì)持續(xù)適航技術(shù)工作的,更深層次的大數(shù)據(jù)輔助分析方法的研究,包括事件相似度研究、風(fēng)險(xiǎn)識(shí)別方法研究、風(fēng)險(xiǎn)后果嚴(yán)重性等級(jí)輔助分析方法研究和風(fēng)險(xiǎn)概率輔助分析方法研究。
[1] 鄭海飛, 陸軍. 民機(jī)持續(xù)適航工程數(shù)據(jù)的大數(shù)據(jù)視角[J]. 航空科學(xué)技術(shù), 2017, 28(5): 53-58.
[2] 靳小龍, 王元卓, 程學(xué)旗. 大數(shù)據(jù)的研究體系與現(xiàn)狀[J]. 信息通信技術(shù), 2013, 6: 35-43.
[3] 馬建光, 姜巍. 大數(shù)據(jù)的概念、特征及其應(yīng)用[J]. 國(guó)防科技, 2013, 34(2): 10-17.
[4] 張引, 陳敏, 廖小飛. 大數(shù)據(jù)應(yīng)用的現(xiàn)狀與展望[J]. 計(jì)算機(jī)研究與發(fā)展, 2013, 50(9): 216-233.
[5] 李戰(zhàn)懷, 王國(guó)仁, 周傲英. 從數(shù)據(jù)庫(kù)視角解讀大數(shù)據(jù)的研究進(jìn)展與趨勢(shì)[J]. 計(jì)算機(jī)工程與科學(xué), 2009, 35(10): 1-11.
[6] 程學(xué)旗, 靳小龍, 王元卓, 郭嘉豐, 張鐵贏, 李國(guó)杰. 大數(shù)據(jù)系統(tǒng)和分析技術(shù)綜述[J]. 軟件學(xué)報(bào), 2011, 25(9): 1889-1908.
[7] 鐘瑛, 張恒山. 大數(shù)據(jù)的緣起、沖擊及其應(yīng)對(duì)[J]. 現(xiàn)代傳播(中國(guó)傳媒大學(xué)學(xué)報(bào)), 2013, 7: 104-109.
[8] 何非, 何克清. 大數(shù)據(jù)及其科學(xué)問(wèn)題與方法的探討[J]. 武漢大學(xué)學(xué)報(bào)(理學(xué)版), 2014, 60(1): 1-12.
[9] 袁梅宇. 數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)[M]. 北京: 清華大學(xué)出版社, 2016.
[10] 范明, 范宏建. 數(shù)據(jù)挖掘?qū)д揫M]. 北京: 人民郵電出版社, 2011.
A Preliminary Study on Big-data Acquisition and Processing Technology for Continuous Airworthiness Engineering Data
/ ZHENG Haifei XU Youcheng HAO Lian LU Jun YANG Bo
(Shanghai Aircraft Design and Research Insitute, Shanghai 201210, China)
When an aircraft in continuous airworthiness phase, the airplane maker needs to do the work of event collection, risk assessment, engineering survey and measure establishment, and then needs plenty of engineering data provided as input information, reference, also can provide the auxiliary analysis, these engineering data such as model data, fleet information, operation records, accident and events, and Airworthiness Directive. This paper studies the relationship between the continued airworthiness engineering data and Big Data, preliminary planning for the continued airworthiness engineering data system structure based on Big Data concept, and through the following automated way to realize the data acquisition and processing, to form the continuous airworthiness engineering database: first of all, using web crawler data acquisition technology to accurately obtain some public data. Secondly, the data is collected and processed by VBA language. Finally, analyzes the engineering data based on the mapping analysis method. The continuous airworthiness engineering database has been used for the daily operation of the continuous airworthiness system.
continuous airworthiness; engineering data; big data; risk assessment; data acquisition; data processing; mapping analysis method
10.19416/j.cnki.1674-9804.2017.03.014
鄭海飛男,博士,工程師。主要研究方向:持續(xù)適航工程數(shù)據(jù)的采集、處理技術(shù)以及分析方法,E-mail:zhenghaifei@comac.cc
V221+.91
:A
徐有成男,碩士,研究員。主要研究方向:適航技術(shù)與管理研究,E-mail:xuyoucheng@comac.cc
郝蓮女,碩士,研究員。主要研究方向:適航技術(shù)研究,E-mail:haolian@comac.cc
陸軍男,博士,高級(jí)工程師。主要研究方向:持續(xù)適航事件風(fēng)險(xiǎn)評(píng)估方法與技術(shù),E-mail:lujun1@comac.cc
楊波男,碩士,助理工程師。主要研究方向:SMS安全管理系統(tǒng),E-mail:yangbo2@comac.cc