王文竹 李智 來嘉哲 方宇強(qiáng)
1.航天工程大學(xué)北京101416
隨著空間目標(biāo)數(shù)量不斷增加和空間環(huán)境日益復(fù)雜,空間態(tài)勢感知領(lǐng)域(Space Situational Awareness,SSA)面臨著越來越大的挑戰(zhàn)[1].SSA 的主要任務(wù)是對影響空間行動的空間態(tài)勢要素進(jìn)行識別、描述和理解,并結(jié)合相關(guān)情報信息對空間態(tài)勢的發(fā)展趨勢進(jìn)行預(yù)測和分析.其中,空間目標(biāo)特性分析是空間態(tài)勢感知的重要內(nèi)容之一,主要完成目標(biāo)屬性特征的分類識別,從而支撐身份確認(rèn)、異常預(yù)警和行為預(yù)測等指揮控制,對空間態(tài)勢的理解和掌握發(fā)揮著重要作用[2?3].
空間目標(biāo)特性數(shù)據(jù)是利用雷達(dá)和光學(xué)等設(shè)備獲取的目標(biāo)探測數(shù)據(jù),與目標(biāo)形態(tài)、狀態(tài)和軌道等特征密切相關(guān),因而可以利用目標(biāo)特性數(shù)據(jù)對其特征進(jìn)行分析.聚類算法是一類重要的機(jī)器學(xué)習(xí)算法,能夠?qū)A繑?shù)據(jù)進(jìn)行無監(jiān)督分類和識別[4?5],從中獲得有價值的信息和結(jié)論.尤其是在缺少訓(xùn)練樣本和先驗(yàn)知識的情況下,聚類算法也能有效實(shí)現(xiàn)空間目標(biāo)的分析和識別,對目標(biāo)類型、身份、行為等特征的初步判斷發(fā)揮重要作用.因此,隨著新進(jìn)空間目標(biāo)數(shù)量的不斷增加,利用聚類方法進(jìn)行目標(biāo)特性分析將成為判斷目標(biāo)基本特征的重要手段.
然而,由于目標(biāo)特性數(shù)據(jù)具有類型維度多樣、特征不易辨識等問題,給聚類分析帶來了一定的挑戰(zhàn),造成類別特征不明顯、聚類結(jié)果準(zhǔn)確率低等問題[6].隨著卷積神經(jīng)網(wǎng)絡(luò)技術(shù)的快速發(fā)展[7?8],在實(shí)現(xiàn)海量數(shù)據(jù)高效識別分類的同時,也為數(shù)據(jù)特征提取帶來了新的方法和手段[9].本文利用卷積神經(jīng)網(wǎng)絡(luò)的特征提取能力,首先對空間目標(biāo)特性數(shù)據(jù)進(jìn)行特征提取,從而提高其特征的辨識度,有利于進(jìn)行聚類分析;而后,利用K-means 聚類算法對特征數(shù)據(jù)開展聚類分析和研究工作;最后,對原始數(shù)據(jù)和特征數(shù)據(jù)的聚類分析結(jié)果進(jìn)行實(shí)驗(yàn)驗(yàn)證和對比.實(shí)驗(yàn)結(jié)果表明,本文提出的基于卷積神經(jīng)網(wǎng)絡(luò)聚類分析方法,能夠大大提高目標(biāo)分類識別的準(zhǔn)確率和性能,從而有效增強(qiáng)指揮決策的計劃和制定能力.
空間目標(biāo)特性是指空間目標(biāo)自身的屬性和特點(diǎn),包括形狀、材質(zhì)、姿態(tài)和軌道等.在不考慮復(fù)雜環(huán)境因素影響的前提下,基于雷達(dá)、光學(xué)和電子等設(shè)備獲取的目標(biāo)特性數(shù)據(jù),加之可行的分析技術(shù)手段,就能夠反演、計算或模擬得到目標(biāo)的相關(guān)屬性,從而在客觀上反映其不同的屬性和特征[10?11].
圖1 空間目標(biāo)特性數(shù)據(jù)曲線
目前,較為常用的空間目標(biāo)光電特性數(shù)據(jù)有光學(xué)散射截面(Optical Cross Section,OCS)和雷達(dá)散射截面(Radar Cross Section,RCS)兩種.其中,OCS 是用于表征目標(biāo)對照射光波散射能力的物理量,其結(jié)果取決于目標(biāo)的表面材質(zhì)、幾何結(jié)構(gòu)、姿態(tài)以及太陽光方位和探測器接收方位等諸多因素.RCS 表征了雷達(dá)目標(biāo)對照射電磁波散射能力的物理量,根據(jù)電磁波傳播時電場矢量的不同,RCS 又包含垂直極化(RCS-VV)和水平極化(RCS-HH)等.圖1所示為在一個時間序列內(nèi),某一空間目標(biāo)OCS、RCS-VV 和RCS-HH 的特性數(shù)據(jù)曲線.
一般而言,每個目標(biāo)的特性數(shù)據(jù)都有其自身的規(guī)律和特點(diǎn),通過反演和計算目標(biāo)特性數(shù)據(jù),能夠有效分析得到其相關(guān)的特征屬性.但由于空間目標(biāo)數(shù)量不斷增加和空間環(huán)境日益復(fù)雜,目標(biāo)特性數(shù)據(jù)的特征辨識度不斷降低,給相關(guān)特征的分析也帶來了新的挑戰(zhàn).
由于OCS 和RCS 特性數(shù)據(jù)具有維度低、特征不明顯和受環(huán)境影響等因素,往往不太容易直接進(jìn)行目標(biāo)特性的識別和確認(rèn).聚類分析是一類無監(jiān)督機(jī)器學(xué)習(xí)算法,能夠?qū)崿F(xiàn)數(shù)據(jù)的智能劃分和識別.例如,當(dāng)給出樣本空間{xi}(i= 1,2,···,n)時,通過計算可以將每個樣本劃分到1,2,···,k中的不同簇內(nèi).劃分完成后,同一簇內(nèi)的樣本之間具有相似屬性,而不同簇之間的樣本之間屬性相差較大.
圖2所示為基于聚類分析方法的空間態(tài)勢感知指揮與決策技術(shù)框架.其中,一個時序內(nèi)的特性數(shù)據(jù),作為目標(biāo)特性分析的基本數(shù)據(jù)單元.由于空間目標(biāo)具有其自身的屬性特征,因此,聚類方法能夠?qū)⒕哂邢嗨铺卣鞯哪繕?biāo)劃分到同一簇內(nèi),將特征差異較大的目標(biāo)劃分在不同的簇,進(jìn)而能夠?qū)δ繕?biāo)特征進(jìn)行類別的初步判斷和分析,在一定程度上彌補(bǔ)了直接分析所帶來的挑戰(zhàn),能夠支持空間態(tài)勢感知的指揮控制與輔助決策.
圖2 基于聚類分析的空間態(tài)勢感知指揮與決策技術(shù)框架
近年來,人工智能技術(shù)取得了快速發(fā)展,在圖像識別、金融和自然語言處理等領(lǐng)域取得了成功應(yīng)用.基于機(jī)器學(xué)習(xí)的數(shù)據(jù)分析也成為了研究熱點(diǎn)之一,相關(guān)學(xué)者和機(jī)構(gòu)在空間態(tài)勢的智能分析領(lǐng)域開展了諸多研究,包括目標(biāo)機(jī)動行為識別預(yù)測研究[12]、目標(biāo)行為變化和翻滾率等行為指示告警[13]、以及空間態(tài)勢智能感知模型[14]等.在軍事應(yīng)用方面,DARPA 的Hallmark 項(xiàng)目提出了“太空態(tài)勢與智能化”的基本架構(gòu)[15],通過專家知識、人工智能和大數(shù)據(jù)處理等先進(jìn)技術(shù),完成態(tài)勢感知、快速評估、輔助決策等功能.2019年8月,BAE 系統(tǒng)公司取得了Hallmark 的第2階段合同,大幅增加了機(jī)器學(xué)習(xí)和人工智能技術(shù),讓空間操作員能夠識別異?;顒雍皖A(yù)測可能的威脅,從而在日益復(fù)雜的太空環(huán)境中快速評估、規(guī)劃和執(zhí)行作戰(zhàn)行動.可見,智能分析方法在未來空間態(tài)勢感知指揮領(lǐng)域?qū)l(fā)揮越來越重要的作用.
由于空間目標(biāo)體積小、距離地基探測設(shè)備遠(yuǎn)、以及受環(huán)境影響等因素,目標(biāo)特性數(shù)據(jù)之間特征相互重疊,較難進(jìn)行辨識.而如果對特性數(shù)據(jù)進(jìn)行人工特征提取,對于龐大且復(fù)雜的數(shù)據(jù)體系來說,存在定義難度大、準(zhǔn)確率不高和效率低等問題.可見,在對空間目標(biāo)進(jìn)行聚類分析時,如何針對多維融合的目標(biāo)特性數(shù)據(jù)進(jìn)行有效的特征分析,成為聚類分析面臨的主要挑戰(zhàn).
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)在傳統(tǒng)神經(jīng)網(wǎng)絡(luò)算法上進(jìn)行了優(yōu)化和改進(jìn),通過局部連接和權(quán)值共享等方法,有效解決了經(jīng)典神經(jīng)網(wǎng)絡(luò)算法中參數(shù)量過大、過擬合嚴(yán)重和計算復(fù)雜度高等問題,大大提高了神經(jīng)網(wǎng)絡(luò)的訓(xùn)練性能和識別精度.在訓(xùn)練樣本質(zhì)量和數(shù)量都能得到滿足的前提下,CNN 能夠取得較為理想的識別精度.
CNN 每一層結(jié)構(gòu)都對數(shù)據(jù)進(jìn)行卷積、池化和非線性激活等處理,每個卷積核都可以看作是一個特征提取器,整個網(wǎng)絡(luò)在從底層到高層過程中,能夠不斷提取和組合越來越顯著的高級特征.因此,利用CNN 技術(shù)能夠?qū)?shù)據(jù)進(jìn)行有效的特征提取.例如,在Alpha Zero 系統(tǒng)中,通過將圍棋的棋局特征進(jìn)行提取和分類,從而對下一步落子位置和局勢進(jìn)行決策判斷[16].因此,本文僅利用神經(jīng)網(wǎng)絡(luò)的特征提取能力,獲取目標(biāo)特性數(shù)據(jù)的高級特征,并利用特征數(shù)據(jù)進(jìn)行聚類分析.
數(shù)據(jù)特征提取過程是對數(shù)據(jù)格式、數(shù)值等進(jìn)行變換,以突出該數(shù)據(jù)中具有代表性的特征.例如,給出數(shù)據(jù)集{xi},其中xi為式(1)所示的特性數(shù)據(jù)矩陣:
用函數(shù)ψ 表示特征提取過程,那么{xi}經(jīng)過特征提取后變?yōu)閧ψ(xi)},其中ψ(xi)為式(2)所示的特征向量:
基于卷積神經(jīng)網(wǎng)絡(luò)的特征提取過程就是構(gòu)建特征提取模型ψ.因此,本文基于原始數(shù)據(jù)的矩陣維度、輸出特征的維度需求、以及典型卷積神經(jīng)網(wǎng)絡(luò)的模型結(jié)構(gòu)特點(diǎn),設(shè)計了如圖3所示的特征提取網(wǎng)絡(luò)結(jié)構(gòu).
該模型輸入數(shù)據(jù)包含了OCS、RCS-VV 和RCSHH 3 種浮點(diǎn)類型的特性數(shù)據(jù),基本構(gòu)建單元為(1×3)維的[OCS,RCS-VV,RCS-HH]向量,300 組基本單元構(gòu)成了(30×30)維輸入矩陣,表征了一個時序內(nèi)的目標(biāo)特性數(shù)據(jù)集合.
圖3 基于卷積神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)特征提取
輸入矩陣經(jīng)過多個卷積、池化和激活函數(shù)等計算后,在第7 層輸出(1×64)維的特征向量.由于卷積神經(jīng)網(wǎng)絡(luò)模型具有優(yōu)良的泛化能力,輸出特征向量不僅在維度上大幅降低,并且具有更好的特征屬性,易于進(jìn)行相關(guān)算法的分析研究.雖然卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練時間較長,但在數(shù)據(jù)特征提取時不需要反向傳播計算過程,前向計算的特征提取性能較高,能夠有效應(yīng)對數(shù)據(jù)量不斷增加的挑戰(zhàn).
聚類分析又稱群分析,是數(shù)據(jù)挖掘中的一類重要算法.其中,k均值聚類算法(K-means)是一種迭代求解的分析方法,其步驟是隨機(jī)選取k個對象作為初始的聚類中心,然后計算每個對象與各個種子聚類中心之間的距離,并把每個對象分配給距離其最近的聚類中心.算法1 為K-means 算法流程,展示了將n個樣本{xi}(i=1,2,···,n)劃分到k個簇中的過程.
其中,步驟1 是在所有節(jié)點(diǎn)中隨機(jī)選取k個中心節(jié)點(diǎn),并將節(jié)點(diǎn)進(jìn)行初始化.步驟2 是更新節(jié)點(diǎn)所歸屬于的簇標(biāo)簽,這一過程主要是通過計算節(jié)點(diǎn)與中心節(jié)點(diǎn)之間的相似度完成的.節(jié)點(diǎn)之間的相似度可以用多種方法進(jìn)行計算,包括歐式距離、曼哈頓距離和切比雪夫距離等.由于本文研究的數(shù)據(jù)為矩陣和向量類型,因此,選擇了歐式距離作為相似度的計算方法.步驟3 是在當(dāng)前劃分好的簇內(nèi)選擇新的中心節(jié)點(diǎn),其方法是將簇內(nèi)所有節(jié)點(diǎn)相加后取平均值,結(jié)果將作為下一次簇分析的中心節(jié)點(diǎn).步驟4 是算法的完成條件,即在所有簇的中心節(jié)點(diǎn)不再發(fā)生變化,或達(dá)到預(yù)定義的收斂精度時,算法將完成計算.
算法1.K-means 聚類算法
1.選擇k個簇中心節(jié)點(diǎn),并賦初值μ1,μ2,···,μk.
2.更新樣本x1,x2,···,xn對應(yīng)的簇標(biāo)簽y1,y2,···,yn,其中
3.更新各個簇的中心節(jié)點(diǎn)μ1,μ2,···,μk
其中,ny為屬于簇y的樣本總數(shù).
4.重復(fù)步驟2 和3,直到簇標(biāo)簽達(dá)到收斂精度.
為了開展空間目標(biāo)聚類分析研究,首先選取空間目標(biāo)的原始特性數(shù)據(jù),并構(gòu)建基于時間序列的(30×30)維分析矩陣.而后,利用卷積神經(jīng)網(wǎng)絡(luò)特征提取后,獲得(1×64)維的特征向量.利用K-means算法分別對原始數(shù)據(jù)和特征數(shù)據(jù)分別進(jìn)行聚類分析.
圖4 不同簇內(nèi)節(jié)點(diǎn)的聚類分析對比
圖4展示了兩個節(jié)點(diǎn)的聚類分析對比,其中左側(cè)是原始特性數(shù)據(jù),右側(cè)是提取后的特征數(shù)據(jù).在實(shí)際情況中,兩者的外形、材質(zhì)等存在一定差異,應(yīng)劃分到不同簇內(nèi).但由于原始數(shù)據(jù)特征不易辨識,K-means 算法將其劃分到同一簇內(nèi),導(dǎo)致分析結(jié)果錯誤.而在對特征數(shù)據(jù)進(jìn)行分析時,K-means 算法能夠正確地將其劃分到不同簇內(nèi).從圖4右側(cè)可以看到,經(jīng)過特征提取后原始數(shù)據(jù)發(fā)生了明顯的變化,其結(jié)果就是放大了數(shù)據(jù)的主要特征,使向量所表征的特性更明顯,同時利用稀疏方法降低了干擾因素的影響.在兩組特征數(shù)據(jù)的對比中,由于圈內(nèi)的數(shù)值存在較大的差異,因此,聚類算法能夠正確地計算出特性差異,將其劃分到不同的簇內(nèi),提高分析結(jié)果的正確率.
經(jīng)過聚類分析后,每個簇代表了空間目標(biāo)相應(yīng)的屬性特征,因此,能夠判斷被劃分到同一簇內(nèi)的節(jié)點(diǎn)具有相似屬性.在指揮過程中,尤其是針對非合作目標(biāo),在指揮初期階段對其進(jìn)行特征分析和判斷時,聚類方法能夠給出較為直觀的結(jié)論和建議.不同于卷積神經(jīng)網(wǎng)絡(luò)的不可解釋性,聚類方法通過節(jié)點(diǎn)之間的相似度差異的計算,在一定程度上能夠?qū)Ψ治鼋Y(jié)論進(jìn)行解釋,這在指揮控制過程中具有非常重要的意義.
為了驗(yàn)證算法的結(jié)果和性能,搭建了配置為8 核Intel i7 3.6 GHz 處理器、16 GB 內(nèi)存和銀河麒麟系統(tǒng)的實(shí)驗(yàn)環(huán)境.利用TensorFlow2.0 搭建用于特征提取的卷積神經(jīng)網(wǎng)絡(luò)模型,并利用Python3.7 實(shí)現(xiàn)驗(yàn)證程序和聚類算法.
實(shí)驗(yàn)數(shù)據(jù)來自于10 個不同的空間目標(biāo),原始數(shù)據(jù)為OCS、RCS-VV 和RCS-HH 構(gòu)建的9 000 組(30×30)維浮點(diǎn)型矩陣,相應(yīng)的特征數(shù)據(jù)為9 000 組(1×64)維浮點(diǎn)型特征向量.最后,分別使用原始數(shù)據(jù)和特征數(shù)據(jù)進(jìn)行聚類分析,并將實(shí)驗(yàn)結(jié)果進(jìn)行對比.
在進(jìn)行聚類分析時,聚類的收斂指標(biāo)是舊中心節(jié)點(diǎn)與新中心節(jié)點(diǎn)之間的歐式距離.當(dāng)所有簇的中心節(jié)點(diǎn)不再發(fā)生變化時算法終止,在進(jìn)行聚類分析時,分別記錄了特征數(shù)據(jù)和原始數(shù)據(jù)的收斂指標(biāo),實(shí)驗(yàn)結(jié)果如圖5所示.
從圖5中可以看到,原始數(shù)據(jù)的收斂速度較慢,這主要是由于原始數(shù)據(jù)的特征辨識度較低,導(dǎo)致節(jié)點(diǎn)歸屬簇的標(biāo)簽頻繁震蕩,簇中心節(jié)點(diǎn)無法快速確定.相比之下,特征數(shù)據(jù)的聚類過程能夠較準(zhǔn)確地計算出節(jié)點(diǎn)歸屬的簇,減少了節(jié)點(diǎn)簇標(biāo)簽的震蕩,因此,收斂速度較快.總的來說,特征數(shù)據(jù)的收斂速度比原始數(shù)據(jù)提高了6.32 倍.
圖5 聚類收斂過程對比
聚類算法結(jié)果的驗(yàn)證程序分為兩組,第1 組使用特征數(shù)據(jù)進(jìn)行聚類分析,第2 組使用原始數(shù)據(jù)進(jìn)行聚類分析.由于目標(biāo)特性數(shù)據(jù)是某一時刻目標(biāo)對探測設(shè)備的反饋信息,由目標(biāo)的軌道、材質(zhì)、形狀、姿態(tài)和周圍環(huán)境等因素決定,因此,基于分析目標(biāo)屬性的綜合考慮,將10 個目標(biāo)劃分為4 種不同類型,即k=4.運(yùn)算過程中,記錄兩組聚類算法的準(zhǔn)確率和迭代次數(shù),實(shí)驗(yàn)結(jié)果如圖6所示.
圖6 聚類分析結(jié)果對比
在聚類分析的準(zhǔn)確率方面,特征數(shù)據(jù)準(zhǔn)確率為89.7%,原始數(shù)據(jù)準(zhǔn)確率為45.5%,準(zhǔn)確率提高了97%.這主要是由于經(jīng)過特征提取后,數(shù)據(jù)的特征辨識度更高,因此,提高了聚類分析中相似度計算的準(zhǔn)確率.此外,特征數(shù)據(jù)的迭代次數(shù)為22 次,原始數(shù)據(jù)為139 次,這也說明特征數(shù)據(jù)質(zhì)量更高,聚類過程對節(jié)點(diǎn)錯誤劃分次數(shù)更少.
聚類算法性能的驗(yàn)證程序分為兩組運(yùn)行,第1 組使用特征數(shù)據(jù)進(jìn)行聚類分析,第2 組使用原始數(shù)據(jù)進(jìn)行聚類分析.運(yùn)算過程中,分別記錄兩組程序的運(yùn)行時間,實(shí)驗(yàn)結(jié)果如圖7所示.
圖7 聚類分析時間對比
在算法性能方面,雖然特征提取產(chǎn)生了額外的時間開銷,但得到的特征數(shù)據(jù)卻能提高算法的整體性能.一方面是將分析數(shù)據(jù)進(jìn)行了降維變換,從而降低聚類分析中相似度計算的算法復(fù)雜度;另一方面是提高了數(shù)據(jù)質(zhì)量,有效降低聚類分析的收斂速度,提高算法的總體運(yùn)行效率.總體來說,基于原始數(shù)據(jù)的聚類算法時間為25.39 s,基于特征提取的聚類算法總時間為13 s,性能整體提高了48.8%.
隨著空間環(huán)境日益復(fù)雜,空間目標(biāo)聚類分析在空間態(tài)勢指揮決策中將發(fā)揮越來越重要的作用.研究了基于卷積神經(jīng)網(wǎng)絡(luò)的空間目標(biāo)特性聚類分析技術(shù),能夠有效解決原始特性數(shù)據(jù)特征不易辨識的挑戰(zhàn),提取后的特征向量在聚類分析中能夠獲得更好的分析效果.經(jīng)過實(shí)驗(yàn)驗(yàn)證,該方法在收斂性、正確率和性能上均優(yōu)于原始數(shù)據(jù)聚類分析,從而為快速、精準(zhǔn)的空間目標(biāo)聚類分析提供有效解決方案,能更好地支撐指揮決策的計劃與制定.