余舟川,龐殿松,龔 誠
(中國人民解放軍91001部隊,北京 100841)
隨著信息技術的不斷發(fā)展,信息化戰(zhàn)爭中,海上目標信息獲取手段不斷增加,信息來源種類多,差異大,呈現(xiàn)出多源異構的特點?!岸嘣础敝傅氖菙?shù)據的來源有多個源頭。海戰(zhàn)場信息中,有雷達、電子對抗等傳感器設備探測得到的數(shù)據,有偵察衛(wèi)星、光電探測設備等通過成像得到的信息,有從互聯(lián)網、人工情報等方式中提取的信息等,情報來源多樣。“異構”指的是數(shù)據結構的不等價性。對于非同源數(shù)據,數(shù)據通常異構,且差異明顯。海戰(zhàn)場中,雷達等傳感器提供的是目標實時航跡數(shù)據,衛(wèi)星、光電等設備提供的是圖像、視頻數(shù)據,互聯(lián)網和人工手段提供的是文字、圖片數(shù)據。其中,航跡數(shù)據為結構化數(shù)據,文字、圖片、視頻等為非結構化數(shù)據。海上目標信息多源、異構、多模態(tài)的特點對數(shù)據分析和處理提出了新的要求。當前,國內海上目標信息處理研究主要集中在結構化數(shù)據方面,并取得了不少研究成果,但對非結構化數(shù)據的智能處理研究還不多,特別是在軍事運用領域,尚難以滿足多源異構數(shù)據的運用需求。
近年來,國內學術界對多源異構數(shù)據進行了相關研究,并取得了一定的研究成果。多源異構數(shù)據融合方法主要分為基于貝葉斯網絡的深度學習融合方法和基于證據理論的多源信息融合方法。在基于深度學習的多源異構信息融合方面,張?zhí)煊钜赃w移學習和貝葉斯網絡相結合的方式,提出了一種綜合利用雷達、AIS和可見光進行海上目標識別的方法;賀雅琪提出了一種基于ELM極限學習機的多源異構數(shù)據融合方法,周鋼等提出了一種基于集成學習的多源信息融合算法等。基于深度學習的方法在模型合適的條件下,可取得較準確的融合效果,但對于軍事領域中的海上目標識別問題而言,該方法存在計算復雜度高,實時性不強,需要大量訓練樣本等缺點,現(xiàn)階段難以在工程領域實際應用。在基于證據理論的多源異構信息融合方面,陳雁飛提出了幾種針對海上目標識別的基本概率賦值方法,王成平、吳明雨、陳致遠等人就證據理論在空中和海面目標識別中的應用進行了研究,基于證據理論的多源異構信息融合方法清晰明了,且對先驗信息要求較少,適用于工程實際,但是,當前對證據理論的研究主要集中于利用幾組關聯(lián)信息對目標屬性進行識別,未能達到對多源異構數(shù)據的充分利用。
針對充分利用多源異構信息實現(xiàn)對海上目標快速準確識別的需求,本文提出了一種基于D-S證據理論和時空編碼的海上目標綜合識別方法,對于圖像、文字、視頻等非結構化數(shù)據,提取目標的發(fā)現(xiàn)時間、當前位置和關鍵屬性,進行航行軌跡預測推演和時空編碼,形成規(guī)范的格式化信息,然后,作為證據理論中的一條證據,與目標的結構化探測數(shù)據進行證據合成,得出海上目標綜合識別結果。通過應用實例表明,本文所提算法可充分利用各類多源異構情報信息,快速準確地給出海上目標的綜合識別結果,具有較高的工程應用價值。
海上目標綜合識別可以分為數(shù)據級、特征級和決策級三個層級。數(shù)據級綜合識別的信息為未經處理的原始信息,如雷達、電子偵察設備獲取的原始信息,通過融合,使信息更加清晰、準確;特征級目標識別的信息是信息源經過特征提取獲得的目標矢量信息,每個信息源獨立地提取目標特征,由這些特征生成一個共同的特征空間用于目標分類;決策層目標綜合識別將各信息源獨立完成目標觀測和特征提取后的目標識別結論進行關聯(lián)處理,形成決策級目標綜合識別結果。
以往研究大多集中于數(shù)據級目標識別的層級,本文將重點研究特征級和決策級目標識別。
D-S證據理論是由Dempster提出,經Shafer改進完善形成的一種理論。該理論把問題和證據分解成若干個子問題、子證據,通過定義信任函數(shù)的概念,確定相應的基本概率賦值,將多組證據以組合規(guī)則進行融合,得出不確定問題的解。D-S證據理論可以用比較符合人的邏輯思維的方式處理不確定問題,能夠明確描述“不確定”“不知道”等概念,不需要先驗概率就可以對證據進行融合。
D-S證據理論定義了一個互不相容的完備集合,稱為辨識框架。命題是包含于框架中的獨立命題,有
Θ={,,…,}
(1)
映射2→[0,1]為辨識框架上的基本概率分配函數(shù),滿足:
(2)
其中,()表示證據對命題的支持程度,D-S證據理論的證據合成規(guī)則為:
(3)
多個證據的合成公式為:
(4)
式(4)中,可以保證每條證據對辨識框架中概率支持度的和為1,對新合成證據體為空集的概率支持度為0,用歸一化因子保證歸一性和非負性。為沖突因子,表示各證據之間的沖突程度。
海上目標識別過程中的非結構化數(shù)據主要為衛(wèi)星偵察、人工情報等手段獲取的海上目標當前位置、時間、屬性、意圖等信息。與結構化數(shù)據相比,非結構化數(shù)據具有格式差異大,更新間隔長,時效性較低等特點。當前,對非結構化數(shù)據的處理主要靠人工推理研判,效率較低,而基于多源異構數(shù)據融合理論的研究主要集中于處理實時的非結構化數(shù)據,與實際應用場景偏差較大。為了解決上述問題,本文提出了一種基于時空編碼的非結構化數(shù)據處理方法,將非結構化數(shù)據統(tǒng)一至同一維度,并對非結構化數(shù)據中目標的航行軌跡進行推理編碼,解決非結構化數(shù)據時效性不強的問題。
時空編碼方法是在全球網格模型的基礎上,引入時間劃分的概念,利用時空編碼表示當前的地理位置,形成統(tǒng)一的信息索引,方便快速進行數(shù)據查找和關聯(lián)。
空間編碼采用全球方格坐標模型,時間編碼的基本時間元為船以巡航速度穿越單個最小方格所需的時間,記為,單位為h。時間編碼計算自當日零時開始,24時結束,則日內可劃分為(24/+1)個時間單元。目標時空編碼的基本格式為
當日日期+日時間單元序號+空間方格序號
例如,某艘艦艇的時空編碼為D0327T12G35,代表該艦艇在3月27日12至13時段內位于35號方格位置。
建立時空編碼規(guī)則后,對于接收到的非格式化信息,先進行智能信息抽取,獲得目標當前位置、偵察時間、目標屬性等關鍵信息,其中,目標當前位置和偵察時間用于建立時空編碼,目標屬性是時空編碼指向的信息內容,通過時空編碼可快速對目標信息進行查找檢索,又叫時空索引碼。由于非結構化的文字、圖像信息提取后的有效內容一般可歸結為某年某月某時在某海域發(fā)現(xiàn)某目標的形式,時效性不強,難以與雷達、電子偵察設備掌握的航跡進行實時關聯(lián),因此,需要基于時空編碼對目標的活動軌跡進行推理。
推理的方式為:先將目標與本地知識庫中該目標的歷史航跡進行匹配,若能成功匹配出相似的歷史航跡,則認為該目標繼續(xù)沿該歷史航跡經過方格為高概率事件,下一時間單元內該目標進入歷史航跡所在方格內的概率為預設的最高概率,目標向其他方格行駛的概率均分,即為(1-),代表該目標可能經過的其他方格。若未能成功匹配出相似的歷史航跡,則以該目標向目的地最近的航線作為高概率事件,若仍無法獲知該目標目的地,則認為該目標下一時刻進入所有相鄰方格的機會均等。概率劃分如圖1所示。
圖1 下一時刻編碼概率分配圖
在時空索引碼后引入目標出現(xiàn)概率,構成完整的時空索引碼,代表該目標在該時間段出現(xiàn)于該方格的概率,假定非格式化信息中,目標在月日第個時刻出現(xiàn)在方格G35,依照歷史航跡,下一時刻將進入方格G34,概率為60%,另外,該目標還有可能進入G24、G25、G44、G45,概率均等,則該目標在(+1)時刻可生成如下索引碼:
DMNT(+1)G34P60
DMNT(+1)G24P08
DMNT(+1)G25P08
DMNT(+1)G35P08
DMNT(+1)G44P08
DMNT(+1)G45P08
然后,可繼續(xù)為該目標的+2,+3,…,+時刻進行時空編碼。目標在+時刻在高概率航線對應方格停留的概率始終保持為,假定目標在+-1時刻,除了進入高概率方格外,還可能進入個其他方格,而目標在至+時間段內,總共還可能到達個其他方格(包含該目標已經過的方格),則認為目標在個其他方格停留的概率為
(5)
在其余個方格內停留的概率為
(6)
當雷達或電子偵察設備發(fā)現(xiàn)目標后,即可根據發(fā)現(xiàn)目標的時間和位置,通過查找索引碼,快速獲取在時空位置處可能出現(xiàn)的目標信息,實現(xiàn)結構化與非結構化情報信息的互相關聯(lián)印證。
1)根據雷達探測信息和電子偵察設備獲取的目標方位信息,進行關聯(lián)和融合計算,獲取當前海上目標的位置。當前,對雷達信息與目標方位信息的關聯(lián)方法已有較為深入的研究。
2)根據電子偵察設備的輻射源分析結果,推斷海上目標的可能類型。不同型號、級別的艦船搭載的電子偵察設備的工作參數(shù)均不一致,因此,利用預先建立的特征數(shù)據庫,根據艦船裝載的輻射源情況,可對該目標的類型進行初步推斷,并根據該輻射源搭載在不同平臺上的概率,確定對應的概率分配函數(shù)。
3)根據該目標所處的時間和位置,通過時空索引碼,獲取該目標可能的目標類型,如果存在多個非實時情報信息對應的目標,則依據各自對應的概率,預先進行歸一化處理。
4)應用證據理論對雷達數(shù)據、電子偵察數(shù)據和非實時數(shù)據進行證據組合,得到最終的海上目標識別結果。
假設我方獲取一條如下文字形式的動向偵察情報:“3月27日,一艘F型驅逐艦L時自S位置出發(fā),前往D位置執(zhí)行巡邏任務”。首先將目標的當前時間和位置進行時空轉換,假設S位置位于方格34中,D位置位于方格11中,L時位于當日的第個時間間隔內,如圖2所示。
圖2 目標位置編碼示意圖
圖中曲線表示系統(tǒng)從知識庫中匹配得出的該目標的歷史航跡,根據知識庫中的信息,目標依照歷史航跡行駛的概率為60%,則在發(fā)現(xiàn)時刻,F型驅逐艦目標對應的時空編碼為
D0327TXG34P100
接下來,預測目標在第+1個時間間隔內的位置,根據歷史航跡數(shù)據,目標進入方格33的概率為60%,除此之外,目標若不按照歷史航跡行駛,則可能在下一個時間間隔內進入方格23、24、34、43、44,進入周圍其他5個方格的概率為
(7)
則第+1個時間間隔內該目標的時空編碼為:
D0327T(+1)G33P60
D0327T(+1)G23P08
D0327T(+1)G24P08
D0327T(+1)G34P08
D0327T(+1)G43P08
D0327T(+1)G44P08
然后,繼續(xù)預測目標在+2時間段的位置,根據高概率保持原則,目標在+2時間段進入G23的概率仍為60%。由于+1時間段目標位于G33,并優(yōu)先考慮目標處于前進狀態(tài),則+2時間段目標可能進入的位置為G22、G32、G33、G42、G43,概率為
(8)
此外,自出發(fā)點計算,+2時間段目標可能到達的其他方格包括G14、G24、G34、G44,概率為
(9)
因此,在+2時間段,F型驅逐艦對應的時空編碼為:
D0327T(+2)G23P60
D0327T(+2)G22P05
D0327T(+2)G32P05
D0327T(+2)G33P05
D0327T(+2)G42P05
D0327T(+2)G43P05
D0327T(+2)G14P04
D0327T(+2)G24P04
D0327T(+2)G34P04
D0327T(+2)G44P04
同理,可繼續(xù)依次計算F型驅逐艦在+3,…,+時間段內對應的時空編碼。
假設在3月27日,我方艦艇雷達在第個時間段內于G12海域探測發(fā)現(xiàn)一批不明目標,并通過電子偵察設備截獲該目標的雷達信號,經過全脈沖分選和脈內特征提取,再與本地知識庫中已知的雷達特征參數(shù)進行比對后,判斷該雷達為R型對海警戒雷達,裝載R型對海警戒雷達的艦艇有F、G型驅逐艦和H型護衛(wèi)艦,按照附近海域各型艦艇數(shù)量進行基本概率分配,得出目標輻射源參數(shù)的基本概率分配,如表1所示。
表1 目標輻射源參數(shù)的基本概率分配
然后,可依照雷達回波對目標類別進一步推理。假設從雷達回波分析,該目標是大型目標,而F、G型驅逐艦是大型目標,H型護衛(wèi)艦是小型目標,因此,可得目標大小的基本概率分配,如表2所示。
表2 目標大小的基本概率分配
應用證據理論對和進行第一次證據合成,首先計算目標的沖突系數(shù):
(10)
則可計算第一次證據合成后的概率分配函數(shù)為:
(11)
(12)
(13)
因此,第一次證據合成后目標的基本概率分配如表3所示。
表3 第一次證據合成后的基本概率分配
然后,根據目標“第個時間段內于G12海域”的情報,通過時空編碼D0327TLG12搜索對應的非格式化情報信息。假設通過搜索,編碼D0327TLG12對應如下3條信息:D0327TLG12P60,對應信息為F型驅逐艦;D0327TLG12P65,對應目標為H型護衛(wèi)艦;D0327TLG12P10,對應目標為G型驅逐艦。則歸一化后非格式化情報的基本概率分配函數(shù),如表4所示。
表4 非格式化情報的基本概率分配
將第一次證據合成后的基本概率分配函數(shù)與再次進行證據合成,得出證據合成結果如表5所示。
表5 第二次證據合成后的基本概率分配
第二次證據合成后,可以得出目標為F型驅逐艦的合成概率最高。因此,經過雷達、電子偵察設備和非格式化情報綜合識別后,可得出目標識別結果為F型驅逐艦,可信度約為65%。
針對當前海上目標識別中結構化和非結構化的多源異構信息未有效整合利用,識別過程主要依靠人工研判的缺點,本文提出了一種將非結構化信息進行時空編碼統(tǒng)一至相同維度,再利用D-S證據理論與結構化信息進行合成的方法,該方法邏輯清晰,計算量小,具有較高的工程實用價值。