王軍林,張正成,王棟梁,楊文龍,李凡聰
(中國兵器工業(yè)試驗測試研究院,陜西 華陰 714200)
武器裝備試驗數(shù)據(jù)主要是指武器裝備在研制、定型、鑒定、批生產(chǎn)抽樣檢查各階段中存在的各類數(shù)據(jù),諸如被試產(chǎn)品信息、組織指揮數(shù)據(jù)、試驗安全分析、測試測量數(shù)據(jù)、環(huán)境構設數(shù)據(jù)、分析評估數(shù)據(jù)等數(shù)據(jù)信息,具有類別多、型號多、保障信息多等特征。試驗數(shù)據(jù)作為試驗工作的直接產(chǎn)物,是基本的定量描述,更是武器裝備評估的重要依據(jù)和有效支撐。裝備研制生命周期內(nèi)需要多種試驗數(shù)據(jù),才能作為武器裝備評估的有力支撐。在不同的武器裝備研制階段中,其試驗科目也具有不同特征。
隨著武器裝備升級,武器系統(tǒng)性、智能性逐漸加強,試驗過程也隨之愈加復雜,伴隨著試驗數(shù)據(jù)呈現(xiàn)大規(guī)模、多樣化的趨勢。如何通過分享和應用歷史試驗數(shù)據(jù),挖掘數(shù)據(jù)的價值,分析評估試驗裝備性能的重要性愈發(fā)突出。近年來,大數(shù)據(jù)應用技術已經(jīng)在商業(yè)領域發(fā)揮了巨大作用,利用龐大的數(shù)據(jù)正改變著人類發(fā)現(xiàn)問題、解決問題的基本方式。在科技領域,通過統(tǒng)計分析算法,將大量數(shù)據(jù)直接交給計算機處理,得出某些傳統(tǒng)方法難以得到的規(guī)律和結(jié)論。以數(shù)據(jù)為中心,分析海量復雜數(shù)據(jù)的相關性,將打破千百年來從結(jié)果出發(fā)探究原因的科研模式。
然而,武器裝備試驗領域受客觀因素及各單位保密約束影響,還未展開數(shù)據(jù)標準化、數(shù)據(jù)治理、數(shù)據(jù)應用實施等具有基礎性作用的數(shù)據(jù)挖掘相關研究。因此,如何利用大數(shù)據(jù)技術開展挖掘海量試驗數(shù)據(jù)信息中蘊含的同種通用類型數(shù)據(jù),研究分類、分層次、分階段數(shù)據(jù)的相關性,打破武器裝備從實物試驗研究結(jié)果中出發(fā)探究原因的科研模式,探索以大規(guī)模復雜數(shù)據(jù)為基礎的新型科研模式,提高經(jīng)濟效益和集約效益、縮短研制周期、減少科研資源浪費,是目前亟待研究解決的問題。
在武器裝備研制領域,試驗是一個不斷驗證、完善、再驗證的循環(huán)往復過程。由圖1武器裝備研制流程可以看出,試驗研究貫穿整個研制階段,并伴隨產(chǎn)生海量試驗數(shù)據(jù)。試驗數(shù)據(jù)在不同類型武器裝備、試驗科目中可按照試驗檔案資料、環(huán)境物理場數(shù)據(jù)、模型與仿真數(shù)據(jù)、測試數(shù)據(jù)等進行區(qū)分,其中,試驗檔案資料包含參試產(chǎn)品和陪試產(chǎn)品信息、試驗方法的描述、試驗活動記錄等;環(huán)境物理場數(shù)據(jù)包含安全分析、場區(qū)電磁環(huán)境、高空氣象數(shù)據(jù)、地形地貌等;模型與仿真數(shù)據(jù)包含被試和參試產(chǎn)品仿真建模數(shù)據(jù)、靶標結(jié)構等結(jié)構數(shù)據(jù);測試數(shù)據(jù)是在不同試驗科目(項目)中武器裝備測試數(shù)據(jù),例如,對于火炮射擊試驗,通常有內(nèi)彈道測試膛壓、彈丸初速、膛內(nèi)運動參數(shù)、外彈道數(shù)據(jù)等。通過對以上武器裝備試驗數(shù)據(jù)的數(shù)據(jù)處理、邏輯組合、綜合分析,最終達到武器裝備性能評定的目的。
圖1 武器裝備研制流程
隨著武器裝備日趨呈現(xiàn)體系化、智能化,產(chǎn)生的多樣性試驗數(shù)據(jù)極易造成非結(jié)構化數(shù)據(jù)、半結(jié)構化數(shù)據(jù)的大量產(chǎn)生,這就對試驗數(shù)據(jù)存儲和分析方式提出較高的要求。以承擔常規(guī)武器綜合試驗靶場任務的中國兵器工業(yè)試驗測試研究院為例,其在多兵種、多軍工單位的武器裝備研制、定型、生產(chǎn)全階段中均承擔重要任務,在不同領域中具有海量數(shù)據(jù)資源,是武器裝備試驗研制過程中重要的“寶藏”。對其試驗數(shù)據(jù)現(xiàn)狀進行分析,我們可以發(fā)現(xiàn),雖然試驗院已開展多年的信息化建設工作,但大量的試驗數(shù)據(jù)還是以傳統(tǒng)的紙質(zhì)和分散介質(zhì)存儲模式存儲。這種傳統(tǒng)的數(shù)據(jù)存儲和數(shù)據(jù)分析方式的局限性,極易導致信息系統(tǒng)間產(chǎn)生孤島效應,使得武器裝備系統(tǒng)之間無法進行有效的數(shù)據(jù)共享,通過實踐分析,我們得出目前亟待解決的問題:
1)數(shù)據(jù)規(guī)范性
試驗過程中,測試數(shù)據(jù)的多類型、測試項目的改變都會造成非結(jié)構化數(shù)據(jù)、半結(jié)構化數(shù)據(jù)的大量出現(xiàn),其規(guī)模和復雜度都超越現(xiàn)有常規(guī)技術能夠處理分析的范圍,而建立完整、規(guī)范、可追溯的試驗數(shù)據(jù)體系是試驗數(shù)據(jù)分析與應用的基本要求。因此,在試驗數(shù)據(jù)的標準化建設時,必須滿足以下要求:完整定義試驗數(shù)據(jù)結(jié)構,全面表現(xiàn)試驗管理和試驗過程信息;存儲或記錄格式遵從規(guī)范;測試數(shù)據(jù)要盡量減少和避免人工或系統(tǒng)產(chǎn)生的錯誤、誤差等影響。
2)武器裝備系統(tǒng)性和層次關聯(lián)性確定
武器裝備系統(tǒng)性和層次關聯(lián)性是確定武器裝備試驗數(shù)據(jù)之間在不同試驗階段上存在邏輯上和時間上的關聯(lián),而試驗數(shù)據(jù)的孤島效應產(chǎn)生原因就是系統(tǒng)性和層次關聯(lián)性不明晰。這就要求在武器裝備試驗數(shù)據(jù)體系構建時,要按照時序性、中心性、層次性、關聯(lián)性的條件來進行建立,并在全試驗階段明確試驗數(shù)據(jù)關系。
3)試驗數(shù)據(jù)共享互通
大部分單位在研制武器裝備時,受保密性、競爭關系影響,工程試驗數(shù)據(jù)主要來源于本單位所積累的試驗數(shù)據(jù)。如武器系統(tǒng)在研制時,加大對試驗數(shù)據(jù)共享、系統(tǒng)數(shù)據(jù)融合,這就使本身具有模糊的、隨機的試驗數(shù)據(jù)挖掘出潛在的信息和知識。以數(shù)據(jù)為中心,分析歷史和多源數(shù)據(jù)下的相關性,挖掘特定信息,可以在產(chǎn)品鑒定和定型、產(chǎn)品的改進改型、故障維修、部隊訓練中發(fā)揮數(shù)據(jù)的重要作用。
元數(shù)據(jù)是“關于數(shù)據(jù)的數(shù)據(jù)”,其實質(zhì)是對潛在信息資源對象的描述。在實際運用中,元數(shù)據(jù)能夠定義、描述和解釋數(shù)據(jù)生產(chǎn)過程中產(chǎn)生的各類實體統(tǒng)計數(shù)據(jù)本身及其生產(chǎn)過程,并定義完整的字段、描述與數(shù)據(jù)源的對應關系,建立不同數(shù)據(jù)來源元數(shù)據(jù)間的映射關系。構建元數(shù)據(jù)是大數(shù)據(jù)工程中數(shù)據(jù)標準化的重要活動,其目的是將數(shù)據(jù)轉(zhuǎn)化為信息,解決數(shù)據(jù)管理和數(shù)據(jù)工程中的實際問題,為分析應用提供數(shù)據(jù)服務。同時,通過執(zhí)行規(guī)范統(tǒng)一的統(tǒng)計元數(shù)據(jù)標準,可以將不同專業(yè)、不同單位之間的元數(shù)據(jù)交換,以便于數(shù)據(jù)交叉融合以及進一步分析,發(fā)揮數(shù)據(jù)資源價值。
元數(shù)據(jù)研究過程中,國外元數(shù)據(jù)建設起步相對較早,并已制定多個協(xié)議和標準。具有代表性的有通用統(tǒng)計業(yè)務流程模型(GSBPM)、通用統(tǒng)計信息模型(GSIM)、統(tǒng)計數(shù)據(jù)和元數(shù)據(jù)交換(SDMX)。我國的國家統(tǒng)計局借鑒國外元數(shù)據(jù)建設經(jīng)驗,參照國際SDMX標準,也建立和更新了元數(shù)據(jù)庫,制定了元數(shù)據(jù)相關標準。在建立數(shù)據(jù)系統(tǒng)時,應用領域不同,元數(shù)據(jù)的建設的體系、質(zhì)量標準也有所不同。因此,在建立時,要根據(jù)數(shù)據(jù)維度、用戶、使用角度等方面進行評估構建。圖2所示為通用的元數(shù)據(jù)通用分類,對元數(shù)據(jù)通用分類通常有組織信息資源型、描述對象差異型、評價型元數(shù)據(jù)三類。
圖2 通用的元數(shù)據(jù)通用分類
試驗數(shù)據(jù)來源廣泛、數(shù)據(jù)量大、格式不統(tǒng)一,且大多數(shù)由圖像、音頻、視頻、模型等非結(jié)構化數(shù)據(jù)構成??梢钥闯?,傳統(tǒng)的數(shù)據(jù)庫數(shù)據(jù)管理方式已無法滿足試驗數(shù)據(jù)的可擴展、可利用、靈活等要求。隨著云計算、移動互聯(lián)網(wǎng)等技術發(fā)展,元數(shù)據(jù)廣闊運用在數(shù)據(jù)存儲處理、數(shù)據(jù)分析、數(shù)據(jù)應用管理、數(shù)據(jù)應用服務等多方面。雖然元數(shù)據(jù)在軍事領域中存在一些成果,武器裝備試驗領域的元數(shù)據(jù)構建仍然需要進行此特定領域的專業(yè)性研究,才能得出針對性的工程建設意見。由此可見,基于元數(shù)據(jù)體系構建武器裝備試驗數(shù)據(jù)體系是挖掘試驗數(shù)據(jù)中蘊含的有價值信息的關鍵步驟,而如何利用元數(shù)據(jù)的科學管理資源和統(tǒng)計信息化是研究武器裝備試驗數(shù)據(jù)的首要問題。
針對試驗數(shù)據(jù),建立完善的元數(shù)據(jù)體系,不僅是對數(shù)據(jù)自身屬性的描述和語義描述,還能增強參與系統(tǒng)性管理和機器自我學習的能力,從而在信息交換中保證信息的有效性、一致性、完整性。因此,武器裝備試驗數(shù)據(jù)的元數(shù)據(jù)體系建設過程中要明確其他要素,例如,“吃透”產(chǎn)品試驗大綱,掌握參試產(chǎn)品原理性能和系統(tǒng)組成,實時跟蹤產(chǎn)品階段性能。這就要求在試驗數(shù)據(jù)體系構建時,要遵循“頂層規(guī)劃,業(yè)務牽引,底層構建,定期修訂”的原則,通過不斷歸納總結(jié)武器裝備試驗數(shù)據(jù)的共性因素,迭代優(yōu)化形成完善的元數(shù)據(jù)體系。
因此,武器試驗數(shù)據(jù)構建時,需要覆蓋所有數(shù)據(jù),以便建立一體化數(shù)據(jù)模型。通過對現(xiàn)有數(shù)據(jù)分析總結(jié)后,我們將數(shù)據(jù)類型按照試驗檔案資料、環(huán)境物理場數(shù)據(jù)、模型與仿真數(shù)據(jù)、測試數(shù)據(jù)、分析評估進行分類。在元數(shù)據(jù)體系構建過程中,通過數(shù)據(jù)標準化及模型構建、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)相關性、數(shù)據(jù)歸檔這四層流程,完成試驗元數(shù)據(jù)體系構建。試驗數(shù)據(jù)經(jīng)過以上流程和方法后,可以消除試驗數(shù)據(jù)海量、多源、異構、關聯(lián)性弱等特點帶來的影響,從而有效支撐跨武器裝備的互聯(lián)、互通、互操作。由圖3所示,試驗元數(shù)據(jù)體系中數(shù)據(jù)標準化及模型建立是對原始數(shù)據(jù)按照對應的數(shù)據(jù)標準進行數(shù)據(jù)預處理后,通過特定數(shù)據(jù)格式,如信息型、功能型等發(fā)布信息,分類映射到不同試驗裝備元數(shù)據(jù),以完成試驗數(shù)據(jù)在統(tǒng)計系統(tǒng)中系統(tǒng)化、有序化的基礎工作。數(shù)據(jù)轉(zhuǎn)換是為易于進行數(shù)據(jù)相關性建立及數(shù)據(jù)挖掘所進行的數(shù)據(jù)儲存形式。在大量的信息交換平臺中,常利用XML的平臺無關性、可擴展性以及自描述性特點,作為異構系統(tǒng)間或異構數(shù)據(jù)源之間的數(shù)據(jù)交換手段。數(shù)據(jù)相關性是對數(shù)據(jù)相關分析后,將武器裝備試驗數(shù)據(jù)按不同階段進行相似度聚類的過程,按照聚類算法主要可以分為層次聚類算法、分割聚類算法、基于約束的聚類算法、機器學習中的聚類算法、用于高維數(shù)據(jù)的聚類算法。數(shù)據(jù)歸檔是對預先規(guī)定好的數(shù)據(jù)進行儲存的最終步驟。
圖3 試驗元數(shù)據(jù)體系示意圖
如圖4所示,武器裝備試驗數(shù)據(jù)管理系統(tǒng)采取基于元對象機制(Meta Object Facility,MOF),對主體業(yè)務分為數(shù)據(jù)治理、數(shù)據(jù)中心、數(shù)據(jù)交換、數(shù)據(jù)應用四個模塊來建立。
圖4 武器裝備試驗數(shù)據(jù)管理框架
數(shù)據(jù)治理模塊是對原始數(shù)據(jù)信息建模與信息組織的過程。通過對原始數(shù)據(jù)按照特定數(shù)據(jù)標準分類處理后,對試驗檔案資料、環(huán)境物理場數(shù)據(jù)、模型與仿真數(shù)據(jù)、測試數(shù)據(jù)分析評估后按照相對應數(shù)據(jù)模型進行提取和解析。經(jīng)過治理后的無序數(shù)據(jù),能充分發(fā)揮存儲、清理、整合的作用,提高信息的利用效率。然后,將分類完成的數(shù)據(jù)分發(fā)至數(shù)據(jù)元數(shù)據(jù)及服務元數(shù)據(jù),最終通過接入數(shù)據(jù)搜索、分析、復盤引擎完成數(shù)據(jù)治理。數(shù)據(jù)中心模塊是完成數(shù)據(jù)及數(shù)據(jù)安全管理的服務支撐模塊,可為系統(tǒng)運行提供有效的信息支撐和安全保障。其主要完成數(shù)據(jù)的收集、儲存、更新、維護、擴展,并在系統(tǒng)運行過程中提供用戶權限、運行日志、安全控制等安全保障操作。數(shù)據(jù)交換模塊是建立數(shù)據(jù)之間邏輯關系的算法層。該模塊通過適宜的算法模型,經(jīng)過多元數(shù)據(jù)整合、數(shù)據(jù)挖掘的數(shù)據(jù)操作后,將打破不同武器裝備試驗數(shù)據(jù)的時序、空間性,消除信息系統(tǒng)間存在的孤島效應,加大不同武器裝備系統(tǒng)之間數(shù)據(jù)共享,為數(shù)據(jù)應用服務奠定基礎。數(shù)據(jù)應用模塊由數(shù)據(jù)可視化監(jiān)控、數(shù)據(jù)分析及數(shù)據(jù)應用組成,以實現(xiàn)將不同試驗數(shù)據(jù)應用到特定的試驗數(shù)據(jù)服務領域。
隨著武器裝備領域科技含量逐漸增加,武器日趨體現(xiàn)出體系化、智能化,單一式的試驗模式將被聯(lián)合試驗、體系試驗所替代。因此,傳統(tǒng)的試驗評估機制與技術亟須進行統(tǒng)一規(guī)劃和實施。本文分析了當前常規(guī)靶場的試驗數(shù)據(jù)現(xiàn)狀,基于元數(shù)據(jù)模型,從武器裝備研制各階段的試驗檔案資料、環(huán)境物理場數(shù)據(jù)、模型與仿真數(shù)據(jù)、測試數(shù)據(jù)中提出相應的數(shù)據(jù)治理方案,并建立了一個試驗數(shù)據(jù)管理框架,對數(shù)據(jù)治理、數(shù)據(jù)中心、數(shù)據(jù)交換、數(shù)據(jù)應用進行設計,分析如何進行武器裝備試驗數(shù)據(jù)的應用,這對提高數(shù)據(jù)運用價值,消除信息系統(tǒng)間存在的孤島效應有積極作用。