陳婭婷,張淑鳳,李佳澤,單琳
(中核戰(zhàn)略規(guī)劃研究總院,北京,100043)
自20世紀50年代起步以來,裝備科技信息工作發(fā)揮了重要的“耳目、尖兵和參謀”作用,為全面推進國防和軍隊武器裝備現(xiàn)代化建設做出重大貢獻[1]。目前,國家安全環(huán)境日趨復雜,傳統(tǒng)的裝備科技信息工作面臨著巨大挑戰(zhàn),正處于創(chuàng)新發(fā)展的新時代。隨著信息技術飛速發(fā)展,大數(shù)據(jù)等前沿技術在軍事領域的廣泛應用,裝備科技信息工作也迎來了新的機遇[2,3]。如何在當前復雜環(huán)境下推動裝備科技信息工作創(chuàng)新發(fā)展,如何利用先進的信息技術手段從海量數(shù)據(jù)中獲取有價值的信息,如何借助大數(shù)據(jù)技術構建有效的裝備科技信息服務系統(tǒng)架構,是裝備科技信息工作當前亟待研究的問題。
裝備科技信息是指與武器裝備建設、管理和運用直接相關的可供交流的科技信息或科技知識,包括國內(nèi)外武器裝備建設、軍事技術發(fā)展以及國防科研、生產(chǎn)活動中產(chǎn)生的科技報告、技術資源等各類科技信息[4]。國防科技和武器裝備發(fā)展建設規(guī)劃、計劃的制定,軍事技術發(fā)展方向、重點的確定,武器裝備和技術發(fā)展項目的擬定,都要有相應的科技信息作為依據(jù)[5]。裝備科技信息工作對于提高裝備管理決策效率、促進裝備科技創(chuàng)新發(fā)展和加快新裝備形成戰(zhàn)斗力等方面發(fā)揮著重要作用。當前,在裝備科技信息工作實際研究過程中,仍存在一系列阻礙因素和問題困難。
在大數(shù)據(jù)時代,數(shù)據(jù)成為了整個時代發(fā)展的核心,為加速裝備科技信息工作的進步提供了前所未有的機遇[6]。數(shù)據(jù)急劇增多使得裝備科技信息工作擺脫了信息匱乏的局面,但涉及不同領域和平臺、分布廣泛的信息資源大大增加了信息采集、分析處理的難度。目前,裝備科技信息工作技術手段落后,科研工作人員人工處置應接不暇,疲于奔命,無法全面搜集、深入處理信息,導致出現(xiàn)信息流失、低效、重復與失真等情況。然而,裝備科技信息工作追求快速、準確和全面,迫切需要高效的信息技術手段提高工作效率和成果質(zhì)量。大數(shù)據(jù)、云計算、人工智能、自然語言處理等先進的信息技術以其自動化、智能化的功能和高效性,當仁不讓地成為可靠的中堅力量。
同時,由于裝備科技信息工作所使用的信息資源分布在不同的領域和平臺上,大量信息數(shù)據(jù)掌握在部門或個人內(nèi)部,形成諸多孤立的小型信息庫,信息孤島嚴重,數(shù)據(jù)利用率低,無法發(fā)揮信息資源共享共用的最大效能,使裝備科技信息工作成果缺乏準確性和可信性。因此,加強裝備科技信息資源的溝通與合作,建立資源共享平臺,擴展信息資源并實現(xiàn)信息資源共享共用與裝備科技信息工作協(xié)同發(fā)展至關重要。
大數(shù)據(jù)環(huán)境下的裝備科技信息工作建立在數(shù)據(jù)集中的基礎上,朝著數(shù)字化、智能化、平臺化方向邁進,如圖1所示。
圖1 大數(shù)據(jù)環(huán)境下的裝備科技信息工作全流程示意圖
為裝備科技創(chuàng)新發(fā)展提供準確、可靠的決策服務需要大量、全面的數(shù)據(jù)支持。在裝備科技信息工作發(fā)展過程中,已積累了很多數(shù)據(jù),部分已形成數(shù)據(jù)庫,如裝備科技成果庫、裝備科技項目庫等結(jié)構化數(shù)據(jù)集,但大部分為半結(jié)構化、非結(jié)構化的數(shù)據(jù)集,如文本類數(shù)據(jù)、圖形圖像數(shù)據(jù)、音視頻數(shù)據(jù)等。這些數(shù)據(jù)資源規(guī)模越來越大,結(jié)構多樣,存儲位置和形式不一致,但通過關聯(lián)與融合,呈現(xiàn)出巨大的分析挖掘與決策的參考價值。
大數(shù)據(jù)環(huán)境下的裝備科技信息工作,依托云存儲、分布式文件存儲等大數(shù)據(jù)存儲技術,構建裝備科技信息工作統(tǒng)一的存儲體系,將在傳統(tǒng)基礎設施中長期保存的分散、多樣的電子數(shù)據(jù)和紙質(zhì)文件數(shù)字化,并存儲在存儲設施中進行統(tǒng)一管理,取代了傳統(tǒng)的存儲方式,實現(xiàn)對非結(jié)構化數(shù)據(jù)的特征提取和半結(jié)構化數(shù)據(jù)的內(nèi)容檢索,便于對裝備科技信息工作的各類數(shù)據(jù)進行整理、交叉分析、對比和深度挖掘。
裝備科技信息工作歷來以信息收集、處理、分析與提供決策服務為主。在大數(shù)據(jù)環(huán)境下,數(shù)據(jù)來源激增給裝備科技信息工作帶來了豐富的信息資源,使信息多元化、廣泛化,但規(guī)模巨量的數(shù)據(jù)、多樣的數(shù)據(jù)類型、復雜的數(shù)據(jù)來源以及數(shù)據(jù)價值密度的降低也給裝備科技信息工作帶來了新的挑戰(zhàn)[7,8]。傳統(tǒng)的分析處理手段已無法處理海量的結(jié)構化、半結(jié)構化和非結(jié)構化的數(shù)據(jù),大數(shù)據(jù)時代開啟了裝備科技信息工作新范式,人工智能、機器學習等新興信息技術使得研究范式向著以數(shù)據(jù)分析為主導的方向轉(zhuǎn)移。從傳統(tǒng)的提出問題、搜集相關信息、分析并生成研究成果轉(zhuǎn)變?yōu)橹鲃硬杉瘮?shù)據(jù)、根據(jù)規(guī)劃進行數(shù)據(jù)挖掘分析、生成研究成果。
依托大數(shù)據(jù)技術,裝備科技信息工作可以更好地構建服務系統(tǒng),借助先進的信息技術和方法工具,在大量采集裝備科技信息數(shù)據(jù)的基礎上,對裝備科技信息數(shù)據(jù)進行科學有效地組織、存儲、數(shù)據(jù)分析挖掘、成果展示等,從而發(fā)現(xiàn)國內(nèi)外武器裝備建設、軍事技術發(fā)展可能出現(xiàn)的變化,對國防科技和武器裝備發(fā)展建設規(guī)劃提供有力的決策支持,從而促進裝備科技信息工作創(chuàng)新發(fā)展。
大數(shù)據(jù)環(huán)境下,利用大數(shù)據(jù)技術開展裝備科技信息工作,建立數(shù)據(jù)驅(qū)動型智能裝備科技信息服務系統(tǒng),通過知識庫、采集和處理系統(tǒng)精確滿足用戶需求[9]?;诖髷?shù)據(jù)技術的裝備科技信息服務系統(tǒng)的架構如圖2所示,主要為信息采集、信息共享共用、信息智能搜索、信息智能分析和成果展示提供統(tǒng)一管理和使用的平臺。該系統(tǒng)以裝備科技信息共享共用平臺為核心,依賴于巨量數(shù)據(jù)的分析挖掘獲得研究成果,利用了機器學習、自然語言處理等信息技術,實現(xiàn)了裝備科技信息工作從信息采集到應用的全流程各環(huán)節(jié)的智能化、規(guī)范化功能。整個系統(tǒng)綜合考慮了大數(shù)據(jù)的特性以及對接第三方應用系統(tǒng),使得出的結(jié)果更加貼近實際,并符合科研工作人員的需求。
圖2 基于大數(shù)據(jù)技術的裝備科技信息服務系統(tǒng)架構
裝備科技信息需求規(guī)劃平臺提供用戶個性化信息采集需求定制服務和海量站點統(tǒng)一管理服務。用戶個性化信息采集需求定制服務:用戶統(tǒng)一規(guī)劃信息采集需求,系統(tǒng)根據(jù)用戶提供的信息采集對象、類型、范圍等需求進行數(shù)據(jù)自動采集工作。海量站點統(tǒng)一管理服務:實現(xiàn)對眾多信息采集渠道進行統(tǒng)一管理的功能,構建官方、社會、網(wǎng)絡等多維度信息采集對象,采用先進的信息技術對海量站點進行統(tǒng)一監(jiān)督和自動實時的信息采集,通過人工智能等信息技術對海量站點進行訪問結(jié)果監(jiān)督和反饋,例如監(jiān)督站點的可用性,自動清理故障站點;監(jiān)督站點關聯(lián)站點,豐富資源獲取渠道;監(jiān)督站點的訪問和資源下載效率。
裝備科技信息共享共用平臺提供知識庫管理服務和權限管理服務。知識庫管理服務:在基礎數(shù)據(jù)庫的基礎上,根據(jù)裝備科技信息資源的類別,利用深度學習算法完成關鍵詞匹配,將數(shù)據(jù)重新分類后形成知識庫。通過將所具有的信息資源以及成果按照統(tǒng)一的分類系統(tǒng),組織和存儲到統(tǒng)一的信息資源庫,并對同一事項形成的系統(tǒng)信息進行統(tǒng)一存儲和管理,消滅信息孤島,實現(xiàn)信息的有效共享,為管理者和決策者提供全方位的信息,以便于其作出正確的決斷。權限管理服務:考慮裝備科技信息的特殊性,提供精確的信息共享服務,用戶可根據(jù)裝備科技信息資源和成果的屬性、分類、知悉范圍等要素,對裝備科技信息資源和成果進行訪問控制設置,將操作權限細粒度化,實現(xiàn)信息共享的同時,保障知悉范圍可控和數(shù)據(jù)安全。
裝備科技信息智能搜索平臺提供用戶個性化檢索推薦服務。系統(tǒng)通過記錄用戶檢索信息的行為和習慣,將這些記錄進行分類和排序,利用深度學習方法,給用戶塑造檢索行為畫像,從而根據(jù)用戶的興趣點提供檢索優(yōu)先排序,達到精準推薦的目的。
裝備科技信息智能分析平臺提供在線數(shù)據(jù)加工服務。利用提供的機器學習算法,用戶自定義數(shù)據(jù)挖掘模型,對采集的數(shù)據(jù)進行智能分類、統(tǒng)計,根據(jù)用戶目標進行綜合態(tài)勢、重點熱點等方向的關聯(lián)分析,從時間、人物、背景、項目動態(tài)、技術動態(tài)等多維度對資源進行畫像,從而在海量數(shù)據(jù)資源中挖掘潛在信息,為科研工作人員提供內(nèi)容更深入、范圍更廣闊、聯(lián)系更清晰、分析更細致的智能分析服務,從而獲得準確、科學、可信的結(jié)果
裝備科技信息成果展示平臺提供可視化服務。根據(jù)用戶需要,運用可視化技術,將裝備科技信息研究成果以圖表、報告、畫像、知識圖譜等多種形式展現(xiàn),加快用戶對數(shù)據(jù)的理解,便于快捷、清晰的提供裝備科技信息服務。
信息采集是裝備科技信息工作流程中最重要的也是最基礎的環(huán)節(jié)。然而,目前裝備科技信息的采集由科研工作人員獨自組織管理,缺少系統(tǒng)規(guī)范的采集程序,在信息采集范圍、質(zhì)量、實用性以及時效性等方面沒有明確的要求。同時,由于科研工作人員技術水平高低不同,導致采集的信息的質(zhì)量、準確度和實用性難以保證,不能客觀真實地反映出數(shù)據(jù)的結(jié)果。建立規(guī)范、統(tǒng)一的信息采集程序,有助于保證系統(tǒng)能夠收集到足夠全面的信息,大大提高信息的收集速度,以及保證信息的及時性和有效性。
大數(shù)據(jù)環(huán)境下,數(shù)據(jù)的存儲和傳輸方面都存在著許多的安全問題,一旦觸發(fā)很有可能引發(fā)一系列嚴重問題,造成極大的經(jīng)濟損失,因此無論是政府機關還是企業(yè),都需要對信息安全問題加以重視[10]。裝備科技信息服務系統(tǒng)的開放性和共享性,會加大病毒感染、數(shù)據(jù)泄露、數(shù)據(jù)強行上傳下載、數(shù)據(jù)惡意刪除、黑客侵擾等危害發(fā)生幾率,為此需加大安全技術投入力度,降低該系統(tǒng)安全故障發(fā)生幾率。目前常規(guī)的運維管理方式已經(jīng)無法滿足大數(shù)據(jù)環(huán)境的快速變化,在實施信息安全防護工作的時候需要考慮到當前的信息安全技術發(fā)展,利用跟蹤監(jiān)測技術、加密技術、數(shù)字簽名等先進技術建立安全防范機制,對數(shù)據(jù)信息進行保護,從而確保信息系統(tǒng)的安全性,避免數(shù)據(jù)信息遭受到破壞和盜竊。
人才是信息化建設發(fā)展的根本,裝備科技信息服務系統(tǒng)的建立和維護必須要有一支集數(shù)據(jù)分析挖掘與裝備科技信息研究等方面的復合型人才隊伍。因此,要建立完善的培訓機制和人才激勵機制,在引進高技術人才的同時,積極培養(yǎng)能夠掌握信息化技術和裝備科技信息研究的學習型人才,使工作人員除擁有專業(yè)高效的裝備科技信息工作能力外,還善用互聯(lián)網(wǎng)技術,為信息資源共享共用提供良好的技術環(huán)境,確保系統(tǒng)的穩(wěn)定、健康發(fā)展。
大數(shù)據(jù)環(huán)境下信息資源豐富,存在著巨大的價值,構建基于大數(shù)據(jù)技術的裝備科技信息服務系統(tǒng),有助于高效、準確的全面收集數(shù)據(jù),挖掘潛藏的信息,為用戶提供準確科學的裝備科技信息服務。