,
隨著數(shù)據(jù)采集、處理、存儲技術(shù)的發(fā)展,收集數(shù)據(jù)已經(jīng)成為一種自動化的行為。數(shù)據(jù)的采集沒有明確目的,并且數(shù)據(jù)體量巨大、類型繁雜,經(jīng)過長期積累就形成了“大數(shù)據(jù)”。這些大數(shù)據(jù)通常都是隨著事物運行自動采集和存儲的,其中隱藏的有用信息并非顯而易見,需要研究人員去挖掘和分析數(shù)據(jù)特征和內(nèi)涵,發(fā)現(xiàn)事物運行的規(guī)律,為準確判斷和預測事物發(fā)展趨勢提供依據(jù)。因此,大數(shù)據(jù)及數(shù)據(jù)挖掘技術(shù)能夠幫助我們在不易弄清事物運行原理的場景下,從大量的歷史數(shù)據(jù)中總結(jié)出規(guī)律和經(jīng)驗,讓計算機或裝備能夠基于此進行自主判斷,從而獲得智能。
“大數(shù)據(jù)”是1980年由托夫勒在其所著的《第三次浪潮》中首先提出的。經(jīng)過30多年的發(fā)展,它已經(jīng)在生物學、物理學、金融學、軍事學等學科中得到廣泛應用。近年來,人工智能技術(shù)發(fā)展迅猛,大數(shù)據(jù)作為其底層技術(shù),再一次迎來了發(fā)展高潮[1]。2011年,麥肯錫全球研究給出的“大數(shù)據(jù)”的定義:一種規(guī)模大到在獲取、存儲、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合,主要具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類型和價值密度低等特征[2]。
起初的數(shù)據(jù)都是針對特定的目的采集的,但隨著數(shù)據(jù)的加速積累,有效信息經(jīng)常會淹沒在浩如煙海的數(shù)據(jù)中。由于數(shù)據(jù)的低價值密度屬性和對信息存儲空間的要求越來越大,大數(shù)據(jù)一度為我們帶來了很大的困擾。近年來興起的機器學習技術(shù)為人們挖掘大數(shù)據(jù)信息提供了有效的手段,使發(fā)現(xiàn)數(shù)據(jù)相關(guān)性、規(guī)律性成為可能,在此基礎(chǔ)上發(fā)展出的預測能力是大數(shù)據(jù)的真正價值之所在。
大數(shù)據(jù)中包含的信息類型多樣、來源廣泛。如對一種裝備的使用,我們通過裝備管理、油料保障、裝備維修等部門都可能獲得其信息。這些信息相互聯(lián)系、互為佐證,能夠完善我們對事物的多方面認知,是我們做決策時的重要依據(jù)。將這些數(shù)據(jù)結(jié)構(gòu)化、代碼化,讓機器去學習、去發(fā)現(xiàn)事物之間的相關(guān)關(guān)系,從而達到預測的目的,便形成了當前的熱門技術(shù)——人工智能??梢哉f,基于大數(shù)據(jù)的人工智能是目前為止大數(shù)據(jù)最有前途的應用之一,它必將為科技發(fā)展、社會進步帶來更加深刻的變革。
以往,我們一直試圖模擬人腦的思考模式實現(xiàn)人工智能,以期基于對事物本質(zhì)的了解進行預測,然而這方面的理論很難突破。進入大數(shù)據(jù)時代,我們可以通過對呈現(xiàn)出的數(shù)據(jù)進行分析,去發(fā)現(xiàn)各種現(xiàn)象的相關(guān)關(guān)系,并據(jù)此建立模型進行預測,其核心就是變智能問題為數(shù)據(jù)問題?;诖髷?shù)據(jù)的人工智能的實現(xiàn)過程如圖1所示。
圖1 基于大數(shù)據(jù)的人工智能的實現(xiàn)過程
統(tǒng)計學又稱為數(shù)理統(tǒng)計,是在概率論基礎(chǔ)上,收集、處理和分析數(shù)據(jù),找到數(shù)據(jù)內(nèi)在的關(guān)聯(lián)性和規(guī)律性。根據(jù)契比雪夫不等式:
我們知道,n(也就是樣本量)越大,則預測得越準確;當n趨于無窮大,即覆蓋全部樣本的時候,預測結(jié)果完全準確。
當今的大數(shù)據(jù)潮流使我們能夠輕易獲得海量的數(shù)據(jù),雖然全面但會有很多冗余,呈現(xiàn)“一方面數(shù)據(jù)很豐富,另一方面有用信息又很匱乏”的現(xiàn)象。統(tǒng)計學的意義體現(xiàn)在對于具有價值的數(shù)據(jù)進行專業(yè)化的處理,即在樣本幾乎等于總體的情況下,選取具有代表性的數(shù)據(jù),去冗分類,去粗取精,科學總結(jié)并發(fā)現(xiàn)其中蘊藏的規(guī)律和模式,并結(jié)合源源不斷的動態(tài)數(shù)據(jù)去預測事物未來的發(fā)展趨勢。但是對于復雜系統(tǒng)的運行預測,是非常困難的。因為每個現(xiàn)象的影響因素極多,假如出現(xiàn)一個故障,需在成百上千的因素中找到主要原因。因此,發(fā)展出許多基于高維、大數(shù)據(jù)的統(tǒng)計方法,如包括CURE算法、ROCK算法、CHAMELEON算法等的層次聚類算法;包括DBSCAN算法、DENCLUE算法等的分割聚類算法;包括概率聚類算法、K-Means算法、SVM算法、主成分分析算法等的基于平方誤差的迭代重分配聚類算法[3],都為從大數(shù)據(jù)中去粗取精提供了手段。
數(shù)據(jù)的作用自古有之,而到近年來才發(fā)揮出巨大作用。其原因首先是積累數(shù)據(jù)所需時間太長,其次是有效信息與數(shù)據(jù)之間通常是間接關(guān)系,需要通過不同數(shù)據(jù)之間的相關(guān)性才能體現(xiàn)出來。之前要想了解事物運行的規(guī)律一直依賴其內(nèi)在的因果關(guān)系,如果找不出確定的因果關(guān)系,則無法進行推測。并且,事物內(nèi)部運行往往錯綜復雜,造成一個事件的原因通常不是顯而易見,尤其是復雜系統(tǒng)的運行機制就像一個黑箱,我們很難把握其原理,只能通過觀察到的現(xiàn)象進行猜測。進入大數(shù)據(jù)時代,我們可以采用機器學習的方法通過分析數(shù)據(jù)的相關(guān)性,從以往的數(shù)據(jù)中找出各種現(xiàn)象的相關(guān)關(guān)系,這對于我們在無法摸清事物運行原理的情況下,了解事物的運行具有很強的現(xiàn)實意義。將這些相關(guān)關(guān)系進行總結(jié)歸納,就可以形成事物的運行規(guī)律,這將作為先驗經(jīng)驗存儲起來用于構(gòu)建預測模型。
目前的機器學習算法主要分為監(jiān)督式學習、非監(jiān)督式學習、半監(jiān)督式學習、深度學習、寬度學習等等,都是在有限的數(shù)據(jù)樣本上發(fā)掘盡可能多的數(shù)據(jù)相關(guān)性,找到人們直觀上不易發(fā)現(xiàn)的潛在規(guī)律[2-3]。
經(jīng)過以上對大數(shù)據(jù)的處理,已經(jīng)在龐雜的數(shù)據(jù)中提取了許多有用、可靠的先驗數(shù)據(jù),這為擬合數(shù)學模型提供了條件。基于大數(shù)據(jù)去擬合數(shù)學模型和模型參數(shù)的方法得益于計算機技術(shù)的進步。盡管在一開始數(shù)據(jù)量不足、計算能力不夠時,顯得有點粗糙,但是隨著時間推移計算機的計算能力、對數(shù)據(jù)的存儲和處理能力呈指數(shù)增長,如摩爾定律所顯示,當價格不變時,集成電路上可容納的元器件的數(shù)目,約每隔18~24個月便會增加一倍,性能也將提升一倍。因此,這種由數(shù)據(jù)驅(qū)動模型的方法將越來越準確。
目前,各行各業(yè)都在爭相發(fā)展人工智能技術(shù),并取得了很大的經(jīng)濟利益和社會價值。我們在軍事應用中也應借助先進技術(shù),提高軍事理論、軍事裝備、管理體制的現(xiàn)代化、智能化水平。
大數(shù)據(jù)、人工智能技術(shù)的進步和應用必將催生出新的作戰(zhàn)理論、智能化的裝備,并對現(xiàn)代戰(zhàn)爭形式、戰(zhàn)場環(huán)境產(chǎn)生深刻的影響。在可以預見的未來,隨著人工智能技術(shù)進入軍事領(lǐng)域,裝備的自動化水平和軍事決策效率將顯著提高,人類在戰(zhàn)爭中將由前臺轉(zhuǎn)向幕后,戰(zhàn)爭形態(tài)可能發(fā)展為人類設(shè)計戰(zhàn)爭,智能裝備執(zhí)行作戰(zhàn)任務,人與智能裝備互相輔助完成任務。智能化是當前人工智能技術(shù)發(fā)展的大勢所趨,將為國防事業(yè)帶來極大的經(jīng)濟和軍事效益[4]。
裝備管理工作直接關(guān)系到裝備的完好率和作戰(zhàn)效能,涉及裝備的采購、入庫、領(lǐng)用、使用、維修、報廢等多個環(huán)節(jié),加上未來裝備日趨復雜,對裝備進行精益管理是非常困難的,且耗時費力。大數(shù)據(jù)和人工智能技術(shù)能夠為改善裝備管理水平、降低管理成本提供有效的解決方案。未來隨著智能裝備投入使用,其自動化的信息采集技術(shù)能夠采集其自身方面的信息和其他非智能裝備的信息,從而實現(xiàn)對裝備的動態(tài)監(jiān)控,使管理人員能夠及時、準確地掌握所有裝備的使用情況和狀態(tài)[5]。其具體應用有以下3方面。
一是裝備的全壽命智能化管理。每個智能裝備在全壽命周期中會產(chǎn)生大量的數(shù)據(jù),再綜合其他智能裝備產(chǎn)生的數(shù)據(jù),應用機器學習算法分析這些數(shù)據(jù)挖掘出裝備管理和使用中的各種潛在規(guī)律,可用于指導其他裝備的全壽命管理。二是實時動態(tài)監(jiān)管。智能裝備的信息采集技術(shù)可以實時監(jiān)控查詢裝備數(shù)量、使用情況等,便于維護補充,使裝備時刻保持最佳作戰(zhàn)狀態(tài)。三是精細化維護保養(yǎng)。裝備可實現(xiàn)智能化的日常檢查,根據(jù)大數(shù)據(jù)分析結(jié)果制定保養(yǎng)計劃并監(jiān)督實施,降低裝備在使用過程中的故障率。此外,智能裝備還可以從大數(shù)據(jù)中學習其他裝備的使用經(jīng)驗,進行預防性維修提示,可最大限度延長各種裝備的使用年限,降低裝備的購置、維護、使用和管理費用。
以往的故障診斷主要基于機械的運行過程,基于出現(xiàn)的故障反向找出具體原因。這非常依賴維修人員的經(jīng)驗,對單一過程、單一故障和漸發(fā)性故障有較好的診斷效果,而對于復雜系統(tǒng)、多過程、突發(fā)性故障的診斷則效率低下,甚至無法找出故障原因[6]。此時,基于大數(shù)據(jù)的人工智能為快速準確的故障診斷提供了解決方案。首先,積累故障類型,分析故障特征,建立故障示例集合;其次,根據(jù)裝備系統(tǒng)中各傳感器收集到的裝備各個組成部分的狀態(tài)信息,與故障類型和特征進行相關(guān)性分析;第三,經(jīng)過機器學習歸納形成故障規(guī)則,并結(jié)合維修人員的經(jīng)驗制定故障維修策略;最后,形成裝備的智能化故障診斷模型,用于對其他裝備進行故障診斷(圖2)。
圖2 基于人工智能的故障診斷模型
基于人工智能技術(shù)的故障診斷可以將各類信息采集技術(shù)、信號處理技術(shù)和故障診斷方法有效融合,而不需要我們完全掌握故障形成的具體過程,只需要在相關(guān)性分析中得到形成故障的最可能原因。此外,我們可以根據(jù)需要,隨意擴大數(shù)據(jù)相關(guān)性分析的范圍。這不僅有利于找出故障的直接原因,還可以得到故障的潛在影響因素,以便于及時采取維修策略,進行預防性維修[5-6]。
基于目前的裝備和作戰(zhàn)樣式,作戰(zhàn)人員一方面需要熟練掌握裝備操作技能,另一方面需要接收、處理大量戰(zhàn)場信息,快速分析判斷并迅速做出決策。面對復雜的裝備和瞬息萬變的戰(zhàn)場環(huán)境,作戰(zhàn)人員很難兼顧,因此存在決策失誤的風險。進入大數(shù)據(jù)時代,各種傳感器實時收集大量戰(zhàn)場和裝備信息,再利用人工智能技術(shù)對大數(shù)據(jù)進行分析利用,將極大地提高作戰(zhàn)效能。其優(yōu)勢表現(xiàn)在以下3 個方面。
一是作戰(zhàn)人員能夠充分借鑒以往的經(jīng)驗。通過對以往大數(shù)據(jù)的相關(guān)性分析,作戰(zhàn)人員能夠充分發(fā)掘決策成功或失敗的影響因素和不容易直接觀察到的潛在影響因素,并歸納出規(guī)律。對于多方案決策能夠通過數(shù)學運算,很快選取出最優(yōu)方案,從而有利于快速做出科學、可行、成功率高的決策。
二是提高裝備自主作戰(zhàn)效能。隨著大數(shù)據(jù)、人工智能技術(shù)在裝備中的應用,未來裝備勢必能夠像人一樣相互協(xié)作完成任務。其模式識別、容錯控制、協(xié)同作業(yè)、智能偽裝、識別雷達、戰(zhàn)場數(shù)據(jù)挖掘等功能使裝備具有了自主決策、智能毀傷的能力,極大地擴展了裝備的作戰(zhàn)效能。
三是突破作戰(zhàn)人員生理、心理極限。基于人工智能的決策系統(tǒng)和裝備可以創(chuàng)造一個避免敵我作戰(zhàn)人員直接接觸的作戰(zhàn)環(huán)境,從而降低作戰(zhàn)人員生理和心理限制的影響,減少由于作戰(zhàn)人員體力不濟、精神疲倦、情緒波動、判斷失誤等造成的致命性影響。
目前我軍已配備了智能決策支持系統(tǒng),充分發(fā)揮了專家系統(tǒng)以知識推理形式定性分析問題的優(yōu)勢,以及計算機系統(tǒng)以作戰(zhàn)模擬形式定量分析問題的優(yōu)勢,使解決問題的能力得到了較大的提高。但是隨著作戰(zhàn)數(shù)據(jù)、訓練數(shù)據(jù)、戰(zhàn)場環(huán)境數(shù)據(jù)的積累,需利用更多的信息去做出更全面、客觀、科學的決策。通過對多種來源數(shù)據(jù)的挖掘和分析,我們的決策不再僅依賴于經(jīng)驗和模擬,在現(xiàn)實中真實發(fā)生的事物之間的強相關(guān)關(guān)系也被充分發(fā)掘,加之各個渠道數(shù)據(jù)的互相印證,有利于去偽存真,將最有價值的信息篩選出來,將這些關(guān)鍵信息加入決策,必將使決策更加客觀全面、更加符合戰(zhàn)場實際情況。
從人工智能的優(yōu)勢和軍事需求來看,將日益成熟的人工智能技術(shù)應用于軍事領(lǐng)域是大勢所趨。裝備和決策的智能化、自主化水平的提高必將影響甚至主導未來陸、海、空各個戰(zhàn)場的作戰(zhàn)方式和作戰(zhàn)效能。由于大數(shù)據(jù)技術(shù)是現(xiàn)階段人工智能技術(shù)的基礎(chǔ),因此它是軍事裝備和軍事決策走向智能的必經(jīng)之路。我們應該從頂層謀劃大數(shù)據(jù)的采集、存儲,形成全面的、可讀性強的數(shù)據(jù)庫;借助先進的數(shù)據(jù)挖掘技術(shù),深入挖掘數(shù)據(jù)中蘊含的大量信息,形成知識庫;針對各種應用建立相應的數(shù)學模型,利用從數(shù)據(jù)中發(fā)現(xiàn)的規(guī)律指導我們的決策。