褚旭龍
(1.北京航空航天大學公共管理學院, 北京 100191; 2.科學技術部高技術研究發(fā)展中心, 北京 100044)
無人機(unmanned aerial vehicles,UAV)具備使用限制少、敏捷性強以及效費比高等優(yōu)異特性,使得其成為各國軍事發(fā)展的重點[1]。2022年俄烏沖突中,無人機作為重要裝備力量深入?yún)⑴c到現(xiàn)代戰(zhàn)爭中,在情報偵察、作戰(zhàn)群體通信、火力分配與打擊、以及電子干擾等方面均展現(xiàn)出奇效,強勢成為影響戰(zhàn)爭進程發(fā)展,甚至主導戰(zhàn)爭成敗的關鍵要素[2]。
聚焦無人機智能化作戰(zhàn)應用發(fā)展,近年來,美國、英國和中國等國家均開展了人工智能在無人機軍事領域應用領域相關的戰(zhàn)略研究與部署。美國通過制定一系列的專項規(guī)劃,為其無人機的軍事應用發(fā)展提供了長遠、全面和持續(xù)的指導[3],美國陸軍于2017年提出新版《機器人及自主系統(tǒng)戰(zhàn)略》,旨在2030年實現(xiàn)無人機系統(tǒng)蜂群作戰(zhàn);美國防部于2018年8月,發(fā)布《2017—2042年無人系統(tǒng)綜合路線圖》,提出了無人機智能作戰(zhàn)的系統(tǒng)規(guī)劃。英國于2022年3月10日發(fā)布新版《機器人與自主系統(tǒng)戰(zhàn)略》,旨在盡快將無人作戰(zhàn)系統(tǒng)與有人作戰(zhàn)系統(tǒng)高度集成,快速形成作戰(zhàn)打擊能力。中國于2019年7月發(fā)表《新時代的中國國防白皮書》,提出“以信息技術為核心的軍事高新技術日新月異,武器裝備遠程精確化、智能化、隱身化、無人化趨勢更加明顯,戰(zhàn)爭形態(tài)加速向信息化戰(zhàn)爭演變”[4]。
智能無人機作戰(zhàn)應用方面,人工智能(artificial intelligence,AI)作為顛覆性技術,逐漸賦能于無人機作戰(zhàn)領域,帶動了空戰(zhàn)算法和機器視覺等技術的發(fā)展,對無人機的作戰(zhàn)樣式、指揮控制等方面產(chǎn)生了變革性影響,并逐漸貫穿作戰(zhàn)的全周期,包括前期的情報偵察,中期目標跟蹤與尋的,后期的博弈對抗與目標打擊,其智能化發(fā)展運用程度逐漸成為改變戰(zhàn)場局勢的關鍵性因素。人工智能賦能下的無人機作戰(zhàn)具備顛覆戰(zhàn)爭規(guī)則,改變戰(zhàn)爭形態(tài)的能力。因此,加速推進人工智能與無人機軍事領域的融合創(chuàng)新,對推進國防和軍隊現(xiàn)代化發(fā)展,搶占未來戰(zhàn)爭制高點,起到至關重要的作用。
鑒于此,開展中外人工智能在無人機軍事領域應用發(fā)展現(xiàn)狀、發(fā)展脈絡以及前沿熱點研究和系統(tǒng)梳理,選用CiteSpace軟件開展可視化分析,數(shù)據(jù)源為2013—2023年WOS(Web of Science)核心數(shù)據(jù)庫相關文獻,對分析結(jié)果進行系統(tǒng)總結(jié)與分析。研究成果為中國人工智能與無人機作戰(zhàn)融合創(chuàng)新發(fā)展提供相關參考,提升研究水平。
選取WOS核心數(shù)據(jù)庫收錄的期刊文獻作為文獻檢索數(shù)據(jù)源,為保證所檢索文獻的全面性和高質(zhì)量性,分別在檢索策略和文獻篩選環(huán)節(jié)進行了研究設計。
檢索策略設計上,依據(jù)研究主題,分別從人工智能技術、無人機和軍事作戰(zhàn)應用逐一開展設定。首先是人工智能技術關鍵詞設定方面,主要從算法的分類關系和技術應用類型兩方面進行檢索關鍵詞的分解設定。算法分類方面,人工智能的主流算法為機器學習,機器學習可分為監(jiān)督學習、半監(jiān)督學習以及無監(jiān)督學習等類型,監(jiān)督學習又可分為回歸、分類,同時,添加具體常用的算法包括神經(jīng)網(wǎng)絡、支持向量機、決策樹、隨機森林、強化學習、遺傳算法、集成學習等;另一主流算法為深度學習,又可分為卷積神經(jīng)網(wǎng)絡、循環(huán)神經(jīng)網(wǎng)絡等;深度強化學習也是無人機應用的熱點。人工智能技術應用類型方面,參考相關文獻,設計檢索關鍵詞包括機器視覺、群體智能、多智能體系統(tǒng)、專家系統(tǒng)、自主系統(tǒng)等。
其次是無人機關鍵詞設定方面,主要包括無人機、無人駕駛飛機和無人作戰(zhàn)飛機等。無人機軍事作戰(zhàn)應用方面,按照軍事作戰(zhàn)概念和典型作戰(zhàn)任務兩部分開展分解設定。首先是作戰(zhàn)概念方面,包括國防、軍事、作戰(zhàn)等基礎檢索詞,還包括空戰(zhàn)、聯(lián)合作戰(zhàn)、空地一體戰(zhàn)、蜂群作戰(zhàn)、多域戰(zhàn)等;典型作戰(zhàn)任務方面,主要包括態(tài)勢感知、情報偵察、目標識別、任務規(guī)劃、火力分配、電子對抗等。
最后考慮同義詞、單復數(shù)和縮寫等情況并按照邏輯“與”的關系將上述3部分組合進行檢索。經(jīng)過多次嘗試,最終檢索策略設定為[(TS=(“artificial intelligence” OR “AI” OR “machine learning” OR “ML” OR “deep learning” OR “DL” OR “neural network” OR “reinforcement learning” OR “genetic algorithm” OR “support vector machine” OR “SVM” “decision tree” OR “random forest” OR “unsupervised learning” OR “swarm intelligence” OR agent OR “machine vision” OR “expert system” OR “autonomous system” OR “ensemble learning” OR “deep reinforcement learning” OR “DRL”)) AND TS=(“unmanned aerial vehicle” OR UAV* OR “unmanned aerial vehicles” OR UCAV* OR “unmanned combat air vehicle” OR drone*)) AND TS=(combat OR military OR “joint operations” OR “Intelligence reconnaissance” OR “air combat” OR “national defense” OR “reconnoitre” OR “distributed Wargame” OR “situational awareness” OR “Swarm warfare” OR “target identification” OR “distribution of firepower” OR “task planning” OR “autonomous technology” OR “electronic countermeasures” OR ECM)]。檢索方式設定為主題檢索。期刊發(fā)表年份范圍設置為“2013—2023年”。共計檢索出相關期刊文獻713篇。
為了保證數(shù)據(jù)源的高質(zhì)量性,文獻篩選環(huán)節(jié)上采取多重操作。對所檢索出的文獻進行逐一篩選,去除會議通知、書稿序言、綜述類數(shù)據(jù);去除包括農(nóng)業(yè)類、人文教育類、智慧城市類、城市交通類等與研究主題相關度不高的文獻;最后運用CiteSpace軟件對剩余的文獻數(shù)據(jù)進行去重操作。通過上述3步驟,共去除246篇無效數(shù)據(jù),最終得到467篇高質(zhì)量文獻作為本文的研究數(shù)據(jù)源。
選用CiteSpace軟件,以知識圖譜的方式直觀展示出目標研究領域內(nèi)在的相關主題間的邏輯關系,進而開展研究現(xiàn)狀、發(fā)展脈絡以及研究熱點的解讀分析[5]。文獻導出時,以純文本格式進行下載。研究要素方面,分別從國家、機構、關鍵詞、被引文獻等不同方面開展分析,對應CiteSpace軟件設置為“Country”“Institution”“Keyword”“Reference”。
最終,對納入的467篇高質(zhì)量文獻從時間分布、空間分布、研究機構分布、關鍵節(jié)點核心文獻、關鍵詞共現(xiàn)、關鍵詞聚類和時間線7個方面進行分析,梳理人工智能在無人機作戰(zhàn)應用的研究現(xiàn)狀、發(fā)展脈絡和研究熱點,總結(jié)梳理該領域的關鍵研究內(nèi)容,旨在為相關領域的研究提供參考。
依據(jù)年發(fā)文量開展領域研究的時間分布特征分析,能夠一定程度了解人工智能在無人機軍事領域應用發(fā)展的總體趨勢情況。
基于所檢索的467 篇文獻數(shù)據(jù)開展發(fā)文量分析,相關結(jié)果如圖1所示??梢钥闯?人工智能在無人機軍事領域應用的文獻發(fā)文量呈現(xiàn)穩(wěn)中有升的發(fā)展趨勢。且以2017年為分界點,該領域的相關研究可分為兩個階段。第一個階段為2017年以前,該領域的年度平均發(fā)文量約為15篇。第二階段為 2017—2022年,該領域的年度發(fā)文量約為76篇,且逐年發(fā)文量展現(xiàn)出增長趨勢。2023年1—3月發(fā)文量為8篇。
圖1 2013—2023 年發(fā)文量Fig.1 Number of published papers from 2013 to 2023
2016年被稱為“人工智能元年”,人工智能開啟了突破發(fā)展與廣泛應用,相關理論和共性技術得到了發(fā)展,一定程度上推動了其在無人機軍事領域應用的科技創(chuàng)新突破,因此,2017年后領域研究成果快速增長[6]。
空間分布特征主要依據(jù)國家合作關系開展分析,如圖2所示。國家合作網(wǎng)絡圖譜能夠一定程度的了解研究領域的地理分布和合作情況。圖譜中國家節(jié)點數(shù)為24個,合作關系連線為23條。
圖2 國家合作關系圖Fig.2 Map of national partnerships
圖2中的節(jié)點和字體大小代表國家發(fā)表論文數(shù)量的多少,越大代表發(fā)文量越多。深色程度表示中心性大小,即關鍵節(jié)點排序??梢钥闯?中國在該領域研究中發(fā)文量排第一位,為177篇。美國發(fā)文量排名第二,為73篇,但中心性排第一位,取值為0.55。詳細排名信息如表1所示。
表1 國家發(fā)文量居于前10 位分布情況Table 1 Top 10 of the national publications
如圖3所示,對納入的467篇文獻開展機構發(fā)文量統(tǒng)計分析,以了解人工智能在無人機軍事領域應用發(fā)展研究的重要研究機構。
圖3 發(fā)文機構分布圖Fig.3 Distribution diagram of the institutions publishing papers
排名前10的研究機構中,中國的研究機構占比80%。其中,西北工業(yè)大學在該領域的發(fā)文量排名第1,為25篇;國防科技大學發(fā)文量排名第2,為20篇;北京航空航天大學排名第3,為17篇。
同時,使用CiteSpace軟件進行研究機構合作網(wǎng)絡圖譜分析,旨在展示出研究領域的核心研究群體,如圖4所示。按照研究機構節(jié)點數(shù)不小于4進行篩選,共形成了4個合作較強的研究機構群體。規(guī)模最大的研究群體1涉及36個節(jié)點,包含4個主干節(jié)點且均所屬中國,分別為西北工業(yè)大學、國防科技大學、北京航空航天大學和南京航空航天大學。規(guī)模排名第2的研究群體2包含5個研究機構,以華中科技大學和香港科技大學為主干節(jié)點。研究群體3包含4個英國研究機構,分別為牛津大學、諾丁漢大學、南安普敦大學、帝國理工學院。研究群體4包含3個韓國研究機構(世宗大學、亞洲大學、韓國電子通信研究院)和1個英國研究機構(考文垂大學)。
圖4 研究機構合作關系Fig.4 Partnership of research institution
研究機構合作集群可以一定程度上反應該領域研究的跨國合作情況??傮w而言,人工智能在無人機軍事領域的研究跨國合作關系不明顯,主要以本國的研究機構合作為主,同時,研究群體主要以大學院校為主,比較突出的是軍工類院校占有很大比例。中國涉及該領域研究的機構占比以及合作關系規(guī)模突出,也在一定程度上反映出中國在該領域?qū)W術研究具備較大的貢獻度和影響力。
關鍵節(jié)點文獻是基于文獻共被引分析程序統(tǒng)計得出的重要文獻,具有高被引、高中心度等特征,能夠反映出研究者所關注的焦點或熱點方向[7]。通過對467篇文獻的被引頻次進行統(tǒng)計,梳理2013—2023年WOS數(shù)據(jù)庫中人工智能在無人機軍事領域應用發(fā)展相關研究排名前10的關鍵節(jié)點文獻,如表2所示[8-17]。
表2 前10 位關鍵節(jié)點文獻[8-17]Table 2 Top 10 of the key literatures[8-17]
通過總結(jié)分析關鍵節(jié)點文獻,可以發(fā)現(xiàn)這些文獻主要在2015—2020年集中涌現(xiàn),均具有較高的被引頻次,在理論創(chuàng)新和應用等方面奠定了堅實的基礎??傮w來說,上述10篇關鍵節(jié)點文獻按照無人機作戰(zhàn)應用方向進行劃分,主要分為目標識別與跟蹤和作戰(zhàn)決策兩種類型。目標識別與跟蹤對應于機器視覺技術方向,涉及5篇關鍵節(jié)點文獻,排名為第2~6名。作戰(zhàn)決策對應于空戰(zhàn)算法技術方向,涉及5篇關鍵節(jié)點文獻,排名為第1名和第7~10名。
其中,機器視覺方向的關鍵節(jié)點文獻屬于共性關鍵技術類成果,主要為目標檢測方向的重大理論研究突破,主要包括經(jīng)典的區(qū)域卷積神經(jīng)網(wǎng)絡(region-convolutional neural network,R-CNN)、SSD(single shot multibox detector)、YOLO(you only look once)模型研究。R-CNN系列目標檢測模型技術發(fā)展脈絡主要涉及R-CNN、Fast-RCNN(fast-region convolutional neural network)、Faster-RCNN(faster-region convolutional neural network)。經(jīng)典的循環(huán)神經(jīng)網(wǎng)絡(recurrent neural network,RNN)算法按照工作流程劃分,主要包含區(qū)域候選、特征提取、分類和位置精修,其存在的顯著缺點是重復計算導致模型訓練空間和時間成本高。Fast-RCNN在R-CNN基礎上實現(xiàn)了優(yōu)化,其將特征提取、分類和位置精修融合到一個網(wǎng)絡里面,節(jié)省了空間,并把多個任務的損失函數(shù)集成到一起,使用統(tǒng)一的全連接層同時執(zhí)行分類與位置精修,縮短了模型的計算時間,但由于候選區(qū)域算法仍與R-CNN模型一致,速度提升不明顯。表2排名第2的為Ren等[9]于2017年發(fā)表的關于Faster-RCNN成果,區(qū)別于Fast-RCNN,引入?yún)^(qū)域建議網(wǎng)絡RPN和anchor box概念,有效降低了運算時間并提升了預測準確率。YOLO是Redmon等[11]在CVPR2016提出的一種目標檢測算法(表2中排名第4),區(qū)別于Faster-RCNN模型將目標檢測分為分類和回歸兩個問題,其將目標檢測問題同意按照回歸類問題進行求解,使用單獨的端到端網(wǎng)絡,完成從原始圖像的輸入物體位置和類別的輸出,其優(yōu)點為背景的誤檢率低且運算速度快,但缺點為識別小物體能力相對較差。排名第5的為Redmon等[12]于2018年發(fā)表的YOLOv3模型相關成果,該模型相較于YOLO模型,優(yōu)化提升了模型預測準確率以及小物體檢測的能力。排名第3的為Liu等[10]于2016年發(fā)表的SSD模型成果,其相較于YOLO模型實現(xiàn)了改進優(yōu)化,融合不同卷積層特征實現(xiàn)了多尺度目標檢測,提升了小目標檢測能力,引入anchor box概念提升了目標檢測準確率。排名第6的為He等[13]于2016年發(fā)表的深度殘差學習相關成果,解決了深度神經(jīng)網(wǎng)絡隨著網(wǎng)絡層數(shù)的增多出現(xiàn)的網(wǎng)絡消失/爆炸和網(wǎng)絡退化問題,顯著提升了特征提取的準確率。
空戰(zhàn)算法方向的關鍵節(jié)點文獻中包含重大原創(chuàng)性突破和實際應用類成果。2015年,Volodymyr等[8]在Nature發(fā)表了關于深度強化學習方法的論文,解決了傳統(tǒng)強化學習動作空間和樣本空間都很小的局限性。在實際應用中,作戰(zhàn)環(huán)境復雜多變,機動狀態(tài)連續(xù)且動態(tài)變化,產(chǎn)生出高維度數(shù)據(jù)量,傳統(tǒng)的強化學習很難處理。面對此種情況,深度強化學習能夠通過深度學習的特征提取進行數(shù)據(jù)降維,并與強化學習的序貫決策能力結(jié)合,從而能夠解決更加復雜的任務。2016年,Silver等[15]在Nature發(fā)表了第一代AlphaGo相關理論成果論文,闡述了AlphaGo的模型過程和訓練方法,主要包含監(jiān)督學習、強化學習、策略網(wǎng)絡、值網(wǎng)絡以及蒙特卡羅搜索等,在博弈對抗中表現(xiàn)優(yōu)異,以4∶1的高分擊敗了圍棋世界大師級冠軍李世石,反響強烈。上述兩篇發(fā)表于NATURE期刊上的高質(zhì)量文獻屬于原創(chuàng)性理論突破類論文,同時,表2中還包含深度強化學習在無人機、無人作戰(zhàn)飛機智能決策中的應用類論文。 Liu等[17]于2017提出,基于DQN(deepQ-learning network)算法高維度數(shù)據(jù)下的作戰(zhàn)智能決策,并進行了仿真驗證。Yang等[14]于2020年提出基于深度強化學習的短程空戰(zhàn)無人機機動決策,仿真驗證表明可獲得有效的對抗決策策略。
論文的關鍵詞往往能夠概況性的體現(xiàn)出該論文的核心研究主題,而同時存在于一篇文章中的幾個關鍵詞,其間會存在邏輯關聯(lián)關系,這種關系為共現(xiàn)頻次。通過對某個領域的相關文獻所涉及的關鍵詞進行共現(xiàn)頻次分析,能夠一定程序上反映出該領域的研究熱點[18]。
使用CiteSpace軟件,以關鍵詞為研究要素,開展關鍵詞共現(xiàn)分析,結(jié)果如圖5、表3所示。圖5為生成的關鍵詞共現(xiàn)圖譜,其中,關鍵詞節(jié)點N為49個,關鍵詞間的連線數(shù)量E為59條。在關鍵詞共現(xiàn)圖譜(圖5)中,關鍵詞字體的大小反映了其出現(xiàn)頻次數(shù)量的不同,頻次大小與可視化節(jié)點的字體大小成正比;關鍵詞間連線的粗細程度反映了關鍵詞之間的聯(lián)系程度,其間的連線越粗代表關鍵詞聯(lián)系越緊密。
表3 關鍵詞詞頻居于前20 位分布情況Table 3 Top 20 of keywords in terms of word frequency
圖5 關鍵詞共現(xiàn)Fig.5 Co-occurrence of keywords
其中網(wǎng)絡詞頻居于前20位的關鍵詞分布情況如表3所示。前10位的關鍵詞分別為:無人機(143 次)、深度學習(41 次)、遺傳算法(32 次)、機器學習(29 次)、強化學習(26 次)、算法(24 次)、優(yōu)化(23次)、目標檢測(22 次)、系統(tǒng)(20 次)、深度強化學習(12 次)。關鍵詞出現(xiàn)頻次越高,表明該關鍵詞為熱點問題。
通過CiteSpace軟件開展關鍵詞時間線圖分析,旨在明晰人工智能在無人機作戰(zhàn)應用中的熱點領域、研究發(fā)展脈絡與趨勢,結(jié)果如圖6所示。
圖6 關鍵詞時間線圖Fig.6 Keyword timeline
聯(lián)系緊密的一組關鍵詞可以構成獨立的研究領域或研究方向,有助于開展對象研究的熱點分析跟蹤[19],首先對467篇文獻數(shù)據(jù)關鍵詞進行聚類分析,如圖6所示,共呈現(xiàn)出10大聚類,主要包括#0多目標優(yōu)化、#1數(shù)據(jù)匯集、#2目標跟蹤、#3機器視覺、#4軌跡、#5武器目標分配、#6群體、#7卷積神經(jīng)網(wǎng)絡、#8強化學習、#9空中成像。評估聚類結(jié)果的科學性指標包括聚類模塊值(Q)和聚類平均輪廓值(S)。一般認為Q>0.3意味著聚類結(jié)構顯著,S>0.5代表聚類結(jié)果是合理的。如圖6所示,Q為0.541 8,S為0.535 4,說明結(jié)果的科學有效性。
對每類聚類結(jié)果i,選取頻次排名前5的被引文獻關鍵詞進行統(tǒng)計分析。其中,#0多目標優(yōu)化包含的關鍵詞為算法、深度強化學習、多智能體系統(tǒng)、游戲、任務分析;#1數(shù)據(jù)匯集包含的關鍵詞為人工智能、群體智能、無人機、通信、自主系統(tǒng);#2目標跟蹤包含的關鍵詞為機器學習、模型、空戰(zhàn)、計算機視覺、機動決策;#3機器視覺包含的關鍵詞為遺傳算法、優(yōu)化、路徑規(guī)劃、導航、避障;#4軌跡包含的關鍵詞為自主控制飛行器、飛行器、搜索、跟蹤、軌跡;#5武器目標分配包含的關鍵詞為神經(jīng)網(wǎng)絡、設計、飛機、深度學習、分配;#6群體包含的關鍵詞為網(wǎng)狀系統(tǒng)、安全、互聯(lián)、群體、無人機;#7卷積神經(jīng)網(wǎng)絡包含的關鍵詞為無人機、深度學習、目標探測、卷積神經(jīng)網(wǎng)絡、監(jiān)控;#8強化學習包含的關鍵詞為強化學習、無人戰(zhàn)斗機、遷移學習、DDPG(deep deterministic policy gradient)算法、MADDPG(multi-agent DDPG)算法;#9空中成像包含的關鍵詞為系統(tǒng)、空中成像、行為、自動配準、數(shù)據(jù)融合。
綜合分析關鍵節(jié)點文獻、關鍵詞共現(xiàn)、關鍵詞聚類、突現(xiàn)詞以及關鍵詞時間線圖結(jié)果,結(jié)合高被引文獻的研讀,對人工智能在無人機軍事領域應用的研究熱點進行歸納總結(jié),包括技術發(fā)展脈絡、研究方向的困難點、技術路徑的優(yōu)缺點等??傮w上,歸納為3個熱點研究主題,分別為軍事偵察、任務規(guī)劃和自主作戰(zhàn)決策。
2.7.1 情報偵察
戰(zhàn)場態(tài)勢信息的快速的、準確地獲取,是有效開展作戰(zhàn)的第一步,起到克敵制勝的關鍵作用。其為作戰(zhàn)任務規(guī)劃、指揮決策與打擊提供信息輸入。人工智能賦能下的無人機,能夠開展戰(zhàn)略、戰(zhàn)役以及戰(zhàn)術偵察,使得其成為一大研究熱點,主要包括目標識別與目標跟蹤,包含聚類#1、#2、#7和#9。
目標識別的熱點研究方向為機器視覺。目前,應用較多的探測方式多為雷達和紅外探測,但容易收到干擾。隨著技術的發(fā)展,基于圖像或視頻信息的機器視覺技術成為了無人機目標識別應用的熱點研究方向。主要算法類型包括以決策樹、支持向量值、神經(jīng)網(wǎng)絡等算法為代表的機器學習和以Faster-RCNN、YOLO、SSD等算法為代表的深度學習。通過總結(jié)技術發(fā)展趨勢可知,區(qū)別于民用上的目標檢測,戰(zhàn)場環(huán)境存在背景信息的復雜性、目標的多樣性以及高度機動動態(tài)變化等問題,提升了目標的識別難度無人機智能化目標識別難度,如果魯棒性不佳,將導致識別率低,無法掌握戰(zhàn)場上的敵方情報;如果算法運行的速度慢,將不能實現(xiàn)期望的作戰(zhàn)效能。學者們主要以算法的實時性和魯棒性優(yōu)化為目標開展了算法的迭代優(yōu)化或機制創(chuàng)新[19-20]。
目標跟蹤的熱點研究方向為以深度學習為主體的算法研究。典型的基于視覺的目標跟蹤主要是通過提取目標的特征信息并預測其在未來時間序列內(nèi)的位置信息實現(xiàn)跟蹤效果。總結(jié)技術發(fā)展趨勢可知,目標跟蹤的主要技術路徑從生成類向跟蹤方法向判別類跟蹤方法發(fā)展。相比于生成類算法在復雜目標跟蹤表現(xiàn)出的局限性,基于深度學習的判別類算法能夠提取目標中更多的價值信息,從而提高跟蹤效果[21]。無人機作戰(zhàn)背景下的目標跟蹤面臨的主要困難包括相機抖動、光照變化、視角變化、模糊運動、遮擋丟失、算力依賴以及實時性要求高等問題,總結(jié)具體研究成果可知,學者們主要從采樣策略、區(qū)域生成、數(shù)據(jù)增強、尺度估計、無人機群數(shù)據(jù)信息融合以及與強化學習結(jié)合等方向提升目標跟蹤性能[22]。同時,基于多無人機群協(xié)同跟蹤的研究也逐漸受到關注,通過全局數(shù)據(jù)融合、覆蓋率優(yōu)化等方面的算法優(yōu)化,能夠有效地提高目標跟蹤準確性和高效性[23]。
值得一提的是,部分學者以無人機為識別跟蹤對象開展了反無人研究。隨著無人機技術和群智能技術的快速發(fā)展,數(shù)百架小規(guī)模、低成本的無人機集群執(zhí)行復雜的作戰(zhàn)任務,給低空空域防御帶來了巨大的威脅和挑戰(zhàn)[24]。利用目標識別與跟蹤技術來探測和跟蹤來襲的無人機群,是反無人機戰(zhàn)略的前提,同時部分學者基于群體智能算法、強化學習算法、深度學習算法,開展了無人機群的攔截策略的研究,得到了多無人機防空問題的解決方案[25]。
2.7.2 任務規(guī)劃
任務規(guī)劃是無人機軍事領域研究的重點環(huán)節(jié)之一,以情報偵察信息為基礎,以作戰(zhàn)目標為牽引,綜合考慮敵情(目標數(shù)量、類型以及威脅程度等)、我情(集群數(shù)量、載荷能力、物理運動能力等)以及戰(zhàn)場環(huán)境(天氣、地形等)等多方因素約束,開展無人機/無人機群的作戰(zhàn)計劃制定,是一個復雜的大規(guī)模約束多目標優(yōu)化問題,很大程度上決定了無人機執(zhí)行任務的效率。人工智能驅(qū)動下的無人機自主任務規(guī)劃是一大研究熱點,主要分為路徑規(guī)劃和任務分配,包含聚類#0、#3和#5。
總結(jié)分析相關高被引文獻可知,群體智能算法是人工智能在無人機任務規(guī)劃(路徑規(guī)劃和任務分配)方面的研究熱點。路徑規(guī)劃方面,逐漸從以精確方法和啟發(fā)式方法為代表的傳統(tǒng)算法(窮舉法、動態(tài)規(guī)劃、工勢場法、A*算法等)向以群智能算法(蟻群算法、粒子群算法、遺傳算法等)為代表的人工智能算法演進[26]。傳統(tǒng)方法在多無人機任務規(guī)劃以及復雜任務等情況下展現(xiàn)出諸多局限性。如精確方法只適用于小場景簡單任務下的路徑規(guī)劃問題,在目標函數(shù)以及約束條件較多時,難以形成有效的路徑規(guī)劃結(jié)果;啟發(fā)類算法在大規(guī)模作戰(zhàn)場景下,往往容易出現(xiàn)局部最小值問題,影響全局最優(yōu)目標的實現(xiàn)。同時,傳統(tǒng)類算法在群體無人機協(xié)同任務路徑規(guī)劃等方面也表現(xiàn)不理想。群體智能算法在解決多目標優(yōu)化問題方面的卓越性促進了智能化技術在無人機群路徑規(guī)劃的應用發(fā)展[27-29]。主要研究方向為3類群體智能算法的應用,分別為基于物種遺傳交叉變異進化論的遺傳算法,模仿自然界鳥類捕食群體智能行為的粒子群算法和模仿蟻群覓食群體智能行為的蟻群算法。任務分配方面,主要以實現(xiàn)無人機組全局效能最大化為目標開展的偵察、打擊、干擾等任務的設定。學者們在群體智能算法基礎上開展了算法的改進、組合等研究,取得了系列成果[30]。進一步,部分學者開展了群體智能算法與深度學習算法的結(jié)合應用,綜合群體智能算法的隨機搜索能力和深度學習算法的特征提取表征能力,取得了很好的任務分配效果并縮減了運算時間[31]。同時,基于強化學習在序貫決策優(yōu)化問題上的優(yōu)勢,部分學者也發(fā)表了其在無人機群路徑規(guī)劃方面的研究成果,具備路徑動態(tài)快速規(guī)劃的能力[32]。
2.7.3 自主作戰(zhàn)決策
日趨復雜的戰(zhàn)場環(huán)境和戰(zhàn)場態(tài)勢,使得空戰(zhàn)決策具有強對抗、高動態(tài)等特點,對無人機自主作戰(zhàn)提出了挑戰(zhàn)?;谌斯ぶ悄艿姆椒ㄙx予無人機學習和自我擴展的能力,使智能無人機具備靈活性、適應性更強的作戰(zhàn)決策能力,是無人機作戰(zhàn)應用研究中的熱點與難點,包含聚類#4、#6和#8。
總結(jié)技術發(fā)展脈絡可知,主要算法類型包括強化學習、深度強化學習、多智能體深度強化學習等類型。強化學習主要用于解決序貫決策問題,其核心思路是智能體在與環(huán)境的持續(xù)交互中進行試錯學習,即根據(jù)環(huán)境反饋學習最佳策略,使得智能體從環(huán)境中獲取的累積回報達到最大,是開展無人機自主作戰(zhàn)決策的熱點算法之一[33]。然而,現(xiàn)代戰(zhàn)爭復雜戰(zhàn)場態(tài)勢下高緯度數(shù)據(jù)問題造成了強化學習應用效果的不佳,維度災難下的有效特征表示是其所面臨的主要難題。隨著計算能力的提升和算法的持續(xù)演進,深度學習技術在物體檢測、信號分析等領域應用成果十分矚目。將具有表征優(yōu)勢的深度學習和決策優(yōu)勢的強化學習相結(jié)合,深度強化學習能夠有效解決空戰(zhàn)背景下的高維、連續(xù)狀態(tài)空間和復雜作戰(zhàn)機動空間的復雜問題,并取得了巨大的成功[34]。隨著單智能體作戰(zhàn)決策能力的提升以及無人機蜂群作戰(zhàn)等新式作戰(zhàn)戰(zhàn)法的應用需求,深度強化學習與多智能體系統(tǒng)結(jié)合下的多智能體深度強化學習逐漸成為新興研究熱點,已在博弈對抗、機器人避障、無人機編隊等諸多領域得到了成功的應用,并成為研究多智能體系統(tǒng)中群體智能涌現(xiàn)的關鍵方法[35]。
總結(jié)具體研究成果可知,學者們主要以提升無人機自主決策能力為目標開展了算法的收斂性、魯棒性、可遷移性以及泛化能力等方面優(yōu)化工作,主要包括主體參數(shù)設計、態(tài)勢評估方法、獎勵函數(shù)設計、策略探索機制、模型訓練方法等具體的研究方向。Lee等[36]將自我模仿學習方法和分層強化學習方法相結(jié)合,提升了無人機策略探索能力,使得無人機在執(zhí)行最短飛行路徑規(guī)劃下能夠有效避開敵方導彈攻擊。Yang等[37]基于人類從簡單到復雜逐漸學習理念,提出模型分層訓練方法,有效解決了DQN方法在高度動態(tài)和不確定機動的近距離空戰(zhàn)下訓練負載大、訓練時間長的問題。Gong等[38]提出了空戰(zhàn)協(xié)同戰(zhàn)略框架,將專家協(xié)同空戰(zhàn)經(jīng)驗與多智能體深度強化學習獎勵函數(shù)相結(jié)合,提高了無人機群的協(xié)同作戰(zhàn)能力。部分學者也開展了人工智能與其他技術的融合創(chuàng)新研究,如與數(shù)字孿生技術相結(jié)合,提高了作戰(zhàn)單元的運動參數(shù)的真實性[39];與虛擬現(xiàn)實技術相結(jié)合,以三維可視化方式展示模型的對抗訓練過程[40]。
采用CiteSpace軟件對WOS數(shù)據(jù)庫收錄的人工智能在無人機軍事領域應用相關的467篇高質(zhì)量文獻從時間分布、空間分布、研究機構分布、關鍵節(jié)點核心文獻、關鍵詞共現(xiàn)、關鍵詞聚類和關鍵詞時間線7個方面進行分析,得出以下結(jié)論。
(1)總體情況方面,近10年人工智能在無人機軍事領域應用研究的發(fā)文量總體上呈現(xiàn)穩(wěn)中有升的發(fā)展趨勢,且以2017年為分界點,逐年發(fā)文上升趨勢幅度變大。2013—2017年,是人工智能在無人機軍事領域的應用發(fā)展的基礎研究階段。同時,隨著算力的進步和算法的衍進,人工智能技術實現(xiàn)突破發(fā)展,因此,其在無人機軍事領域的研究成果隨著時間的推移而持續(xù)快速增長,說明某一關鍵技術的理論性突破或發(fā)展對科技創(chuàng)新具有強大的推動作用。
(2)中國在人工智能在無人機軍事領域的應用發(fā)展領域具備突出的研究活躍度和產(chǎn)出量,在該領域研究中發(fā)文量排第一,發(fā)文量排名前10的研究機構占比為80%,且形成了節(jié)點數(shù)最多的研究機構合作集群,一定程度上反映出中國在該領域?qū)W術研究具備較大的貢獻度和影響力。美國在該領域空間分布的中心性排名第一,在國際合作方面占據(jù)優(yōu)勢。
(3)對人工智能在無人機軍事領域應用的研究熱點進行了歸納總結(jié)。按照作戰(zhàn)應用方向劃分,歸納了軍事偵察、任務規(guī)劃、自主作戰(zhàn)決策3大熱點研究主題。對每一熱點主題分別進行了技術發(fā)展脈絡、研究方向的困難點、技術路徑的優(yōu)缺點的總結(jié),旨在為相關領域的研究工作提供參考。