■ 尹江輝
隨著信息技術(shù)、網(wǎng)絡(luò)技術(shù)、大數(shù)據(jù)技術(shù)等先進技術(shù)的迅猛發(fā)展,人類已經(jīng)從信息化時代逐步邁入智能化時代。數(shù)據(jù)作為智能化所不可或缺的基礎(chǔ)支撐,已經(jīng)成為推動經(jīng)濟社會發(fā)展、科技進步與軍事變革的重要戰(zhàn)略資源;同時,大數(shù)據(jù)技術(shù)也成為智能化時代的主要推動力之一,是人工智能技術(shù)集的核心關(guān)鍵技術(shù)。當(dāng)前,世界各國都在搶占大數(shù)據(jù)的軍事制高點。大數(shù)據(jù)技術(shù)的快速發(fā)展與廣泛應(yīng)用對于軍事情報理論研究與實踐工作產(chǎn)生了深遠的影響,如何應(yīng)對影響從而贏得未來的競爭與挑戰(zhàn)值得深入思考。
大數(shù)據(jù)(Big Data)概念早已出現(xiàn),2008 年,《自然》推出以大數(shù)據(jù)為主題的專刊,探討了大數(shù)據(jù)帶來的科研形態(tài)的變化,認為“以數(shù)據(jù)為準繩的理念指導(dǎo),以及強大的計算能力支撐,正在驅(qū)動著一次科學(xué)研究方法論的革命。”一些專家據(jù)此提出了“大數(shù)據(jù)是繼實證實驗、理論推導(dǎo)、建模仿真之后,科學(xué)研究的第四范式”等觀點[1]。
大數(shù)據(jù)是指具有規(guī)模龐大、類型多樣、處理時效緊、數(shù)據(jù)來源可靠性低等綜合屬性的數(shù)據(jù)集合。大數(shù)據(jù)通常具有“4V”特征[2]:一是數(shù)據(jù)規(guī)模龐大(Volume),一般在TB、PB 乃至EB;二是數(shù)據(jù)類型多樣性(Variety),信息種類多,并以數(shù)字、表格、網(wǎng)頁、圖片、視頻等結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化等形態(tài)存在,數(shù)據(jù)關(guān)聯(lián)度較低;三是數(shù)據(jù)處理要求響應(yīng)速度快(Velocity),數(shù)據(jù)流高速產(chǎn)生,并需要快速、持續(xù)地實時傳輸與處理;四是數(shù)據(jù)價值密度低(Value),規(guī)模巨大與類型多樣帶來了高價值低密度特點,增加了挖掘難度。
大數(shù)據(jù)的核心與內(nèi)涵:一是確實“數(shù)據(jù)很大”。這是一個基本前提,沒有大量的數(shù)據(jù)不能稱為大數(shù)據(jù)。二是大數(shù)據(jù)種類多源、相互關(guān)聯(lián)、具有整體性。大數(shù)據(jù)的數(shù)據(jù)主體并不是單一的結(jié)構(gòu)化數(shù)據(jù),而是來源廣泛、種類繁多的多媒體數(shù)據(jù)。大數(shù)據(jù)的“關(guān)鍵”不僅僅是“大”,更在于“多源”以及多源數(shù)據(jù)之間的聯(lián)系,這樣就可以多方印證。三是大數(shù)據(jù)還要體現(xiàn)出價值是否被“挖出”和利用。大數(shù)據(jù)的關(guān)鍵難點在于缺乏好的數(shù)據(jù)挖掘、分析算法,制約著能否從數(shù)據(jù)中挖掘出有價值的內(nèi)容。
目前,大數(shù)據(jù)技術(shù)與工具取得了長足的發(fā)展,形成了比較完善的大數(shù)據(jù)處理生態(tài)體系,包括大規(guī)模分布式計算技術(shù)、內(nèi)存計算技術(shù)、流處理技術(shù)等;相應(yīng)的軟件產(chǎn)品包括大數(shù)據(jù)批處理計算軟件Hadoop、快速分析軟件Spark、流處理軟件Storm 等。這些軟件與傳統(tǒng)的數(shù)據(jù)庫相比,能夠有效滿足針對大數(shù)據(jù)的存儲、管理、分析與處理需求,在可伸縮性、健壯性、計算性能與成本上具有明顯優(yōu)勢。
隨著軍事信息化的高速發(fā)展,戰(zhàn)場廣布的雷達、電子戰(zhàn)裝備等傳感器無時無刻不在產(chǎn)生著海量的空情、陸情、海情等情報數(shù)據(jù),以往困惑決策者的戰(zhàn)場感知與情報獲取能力已經(jīng)得到了極大的提升。同時,由于戰(zhàn)場偽裝、情報欺騙等敵方對抗原因,以及數(shù)據(jù)類型、數(shù)據(jù)精度等裝備能力差異,通過各類手段形成的數(shù)據(jù)洪流實際上包羅萬象、內(nèi)容繁雜、虛實混雜、真?zhèn)坞y辨,具有高價值低密度等大數(shù)據(jù)典型特點。如何從軍事情報大數(shù)據(jù)中挖掘與提煉出準確、高價值的情報信息,挑戰(zhàn)著軍事情報分析系統(tǒng)、分析人員與決策者的能力,成為迫切需要解決的問題。
通過大數(shù)據(jù)技術(shù)升級改造軍事情報分析系統(tǒng)至關(guān)重要。2017 年4 月,美國防部啟動“Maven 計劃”(即算法戰(zhàn)跨功能團隊),用于加速美軍對人工智能與機器學(xué)習(xí)技術(shù)的集成,通過快速認知戰(zhàn)場態(tài)勢大數(shù)據(jù),自動生成支援作戰(zhàn)行動的情報產(chǎn)品。該計劃首先將開發(fā)用于目標探測、識別與預(yù)警的計算機視覺算法,提高對無人機所收集全動態(tài)視頻的處理、利用與分發(fā)能力,減輕人力負擔(dān)。具備戰(zhàn)場態(tài)勢感知、全域信息融合、數(shù)據(jù)深度挖掘、機器自動處理、多源情報印證的軍事情報分析系統(tǒng),將成為決策者實施精準決策、快速決策的重要支撐工具。
近年來,開源情報(OSINT)的重要性與地位得到了情報界的廣泛認可。相比于傳統(tǒng)的情報手段,開源情報具有信息來源廣泛、收集信息成本低廉、共享程度高、敏感情報資產(chǎn)暴露風(fēng)險低等獨特優(yōu)勢。據(jù)統(tǒng)計,開源情報提供情報界使用信息的80%~95%。Google 地球提供的地理空間情報(GEOINT)比大多數(shù)政府提供的地理信息數(shù)據(jù)更詳細、更真實。
尤其是隨著互聯(lián)網(wǎng)技術(shù)、大數(shù)據(jù)技術(shù)的發(fā)展,門戶網(wǎng)站、個人網(wǎng)站、博客、推特、微信等媒介的泛濫,“互聯(lián)網(wǎng)+大數(shù)據(jù)”為情報分析人員提供了新的且更為豐富的情報來源與分析手段。通過國際互聯(lián)網(wǎng)公開渠道獲取的信息,在經(jīng)過分布式數(shù)據(jù)采集、自動機數(shù)據(jù)過濾、聯(lián)合多維數(shù)據(jù)關(guān)聯(lián)分析等大數(shù)據(jù)技術(shù)處理之后,能夠快速、實時生成各種類型的情報信息,并以可視化的方式展現(xiàn)給決策者與情報分析人員。
大數(shù)據(jù)時代的到來使內(nèi)嵌人工智能算法的智能化系統(tǒng)不斷拓展和延伸分析人員的人類智能成為現(xiàn)實,在情報來源更加多源、高價值情報獲取處理更加困難的同時,也給從業(yè)人員帶來了新的挑戰(zhàn)。軍事情報人員不僅要研究掌握新興的開源情報獲取與分析方法、大數(shù)據(jù)分析的商用現(xiàn)代工具,還要發(fā)揮人的主觀能動性、創(chuàng)造性,才能真正成為大數(shù)據(jù)時代要求的軍事情報人才,才能更好地從大數(shù)據(jù)中“洞察”真實情況,指導(dǎo)決策與行動。
為了充分利用大數(shù)據(jù)技術(shù)分析開源情報、秘密情報,更高層次的跨界復(fù)合情報分析人才團隊得以成立,不僅僅局限于軍事人員和信息技術(shù)人員,還包括人文科學(xué)家、語言學(xué)家、地理學(xué)家、心理學(xué)家、經(jīng)濟學(xué)家以及金融學(xué)家等各界頂尖人才,以擴寬與提升團隊在政治、經(jīng)濟、軍事戰(zhàn)略、科學(xué)技術(shù)、人文、生態(tài)等領(lǐng)域的知識、能力。美國的大數(shù)據(jù)挖掘公司帕蘭提爾科技公司(Palantir Technologies)為美國追捕本·拉登、敘利亞反恐、掃毒禁毒等行動,提供了眾多極為重要的情報分析,起到了關(guān)鍵作用。該公司的聯(lián)合創(chuàng)始人、現(xiàn)任CEO Alex Karp獲得了哲學(xué)博士學(xué)位,卻完全不懂編程與數(shù)據(jù)分析。但是,他能夠?qū)碜匀宋?、?jīng)濟、統(tǒng)計學(xué)、計算機等領(lǐng)域的眾多頂尖人員,打造成一個復(fù)合型大數(shù)據(jù)團隊,不斷獲得來自美國國防部、中央情報局、空中客車集團的大項目,充分體現(xiàn)了跨界復(fù)合高層次人才對于軍事情報的重要作用。
大數(shù)據(jù)前沿理論與關(guān)鍵算法等基礎(chǔ)研究水平的高低,將直接決定著大數(shù)據(jù)技術(shù)的發(fā)展上限,也直接決定著軍事情報的發(fā)展?jié)摿εc水平。當(dāng)前,我國在機器學(xué)習(xí)、深度挖掘、信息融合等大數(shù)據(jù)技術(shù)的基礎(chǔ)研究領(lǐng)域與國外先進水平尚有一定差距,嚴重制約了我國大數(shù)據(jù)技術(shù)的可持續(xù)發(fā)展。大數(shù)據(jù)核心技術(shù)的自主性、安全性、可靠性,將是我國數(shù)據(jù)安全的根本保證。我國需要將推動大數(shù)據(jù)的基礎(chǔ)理論創(chuàng)新與發(fā)展上升到國家戰(zhàn)略層面,立足長遠需求,科學(xué)籌劃部署,不斷加強技術(shù)積累。應(yīng)支持國內(nèi)條件較好的單位協(xié)力開展研究,不斷加大大數(shù)據(jù)領(lǐng)軍人才培養(yǎng)、引進力度,重點加快大數(shù)據(jù)框架、AI 芯片、智能挖掘算法、CPU、GPU 等軟硬件關(guān)鍵技術(shù)突破,在大數(shù)據(jù)的存儲設(shè)備和技術(shù)方面實現(xiàn)自主可控,進一步縮小我國與強國在大數(shù)據(jù)和軍事情報等領(lǐng)域的差距。
認真研究大數(shù)據(jù)技術(shù)帶來的革命性變化,充分挖掘并保護大數(shù)據(jù)中蘊含的情報價值。一方面要加強對大數(shù)據(jù)情報來源的甄別,充分掌握和利用社交媒體等平臺,通過數(shù)據(jù)篩選、清洗實現(xiàn)情報可視化。合理利用現(xiàn)成商用工具,如機器學(xué)習(xí)和自然語言處理工具等,根據(jù)軍事情報特定目的和需求設(shè)計大數(shù)據(jù)情報分析處理系統(tǒng),確保適配并為軍事情報帶來更大的價值,提高工作效率。另一方面,要做好數(shù)據(jù)開源的控制和防護,盡可能地切斷敵對勢力通過國際互聯(lián)網(wǎng)等對我國敏感信息的窺探與收集的開源情報渠道。加強基于生物特征的個人隱私加密技術(shù)、面向大數(shù)據(jù)的數(shù)據(jù)加密技術(shù)、可信計算技術(shù)等網(wǎng)絡(luò)安全防護技術(shù),完善社交網(wǎng)絡(luò)數(shù)據(jù)收集與應(yīng)用相關(guān)法律、法規(guī),綜合運用技術(shù)、政策、法律與標準等手段保證國家信息基礎(chǔ)設(shè)施數(shù)據(jù)和個人隱私行為特征敏感數(shù)據(jù)的安全。
建設(shè)軍事強國、情報強國的關(guān)鍵在于人才,高層次人才是軍事情報領(lǐng)域的核心競爭力。要下大力氣解決大數(shù)據(jù)軍事情報高端人才培養(yǎng)、使用和團隊建設(shè)問題。要為高端人才創(chuàng)造良好的政策環(huán)境、科研環(huán)境與工作環(huán)境,并從薪酬待遇、發(fā)展前景等多個方面加大力度吸引、留住國內(nèi)甚至國際頂尖人才。要做好大數(shù)據(jù)、互聯(lián)網(wǎng)、人工智能、心理學(xué)、經(jīng)濟學(xué)、法學(xué)等多學(xué)科交叉融合,推動政府、高校、科研機構(gòu)、企業(yè)與軍事部門在大數(shù)據(jù)軍事情報領(lǐng)域的對接協(xié)作,軍民融合形成合力,形成規(guī)模,才能有所突破,參與國際競爭。
[1] 胡曉峰.戰(zhàn)爭科學(xué)論[M].北京:科學(xué)出版社,2019.
[2] 郭繼光,黃勝.基于大數(shù)據(jù)的軍事情報分析與服務(wù)系統(tǒng)架構(gòu)研究[J].遠望周刊,2017,12(4):389-393,413.