包 磊,楊 樂,羅 兵
(海軍工程大學電子工程學院,湖北 武漢 430033)
戰(zhàn)場情報態(tài)勢數(shù)據(jù)規(guī)模大、版本多、隨時間不斷累積且使用期很短,相對于戰(zhàn)場中各類傳感器不斷產(chǎn)生的巨大數(shù)據(jù)量,指揮決策人員的數(shù)據(jù)閱讀和理解能力是非常有限的。態(tài)勢數(shù)據(jù)的生產(chǎn)、傳輸、復制和累積,已超出了現(xiàn)有指揮系統(tǒng)以及指揮決策人員的分析、理解和應用能力。大量的數(shù)據(jù)無法得到有效利用,數(shù)據(jù)流失情況嚴重。如何對情報態(tài)勢的時空數(shù)據(jù)模式挖掘技術進行研究,提供自動化或者半自動化的手段,幫助指揮人員從海量數(shù)據(jù)中提取信息,把數(shù)據(jù)轉(zhuǎn)變?yōu)榭捎玫闹R,是領域內(nèi)需要研究的重點課題。
本文研究在海量歷史情報態(tài)勢數(shù)據(jù)中,以查詢的方式發(fā)現(xiàn)有價值的事件以及模式的技術,為新一代指揮信息系統(tǒng)的作戰(zhàn)籌劃、復盤分析提供有效的輔助決策能力。戰(zhàn)場情報態(tài)勢的評估與分析常常是一種交互式的理解與分析過程,所研究的技術利用支持自由時空事件查詢的數(shù)據(jù)引擎,使指揮人員可以像使用傳統(tǒng)關系數(shù)據(jù)庫一樣對各類時空事件和事件的發(fā)生模式進行自由查詢分析,進而生成對態(tài)勢的理解。
從具有海量、高維和不確定性等特性的情報態(tài)勢數(shù)據(jù)中提取出隱含的、人們事先不知道的、但又潛在有用的事件模式,是典型的時空數(shù)據(jù)挖掘問題。相關研究主要有兩大類:基于數(shù)據(jù)挖掘的時空模式發(fā)現(xiàn)方法和基于查詢的時空分析方法。
基于數(shù)據(jù)挖掘的時空模式發(fā)現(xiàn)方法通過定義時空關聯(lián)模式的語義,采用特定算法發(fā)現(xiàn)時空數(shù)據(jù)中的模式,如頻繁模式、周期模式、共現(xiàn)模式、拓撲關系模式等。這些模式的發(fā)現(xiàn)能協(xié)助完成關于態(tài)勢對象的分析、預測等任務。相關研究工作大部分是通過對時空序列的轉(zhuǎn)換,采用類Apriori算法在時間維上進行遍歷來完成模式的挖掘,并利用時空對象的空間信息進行合理的算法優(yōu)化。如美國陸軍拓撲計算實驗室提出的MDCOP 算法[1]和 FDCOP 算法[2]解決態(tài)勢對象在空間和時間處于近鄰關系的時空共現(xiàn)模式(co-occurrence pattern)發(fā)現(xiàn)問題,用于甄別移動對象的意圖和行為模式,還可用來預測對象未來的移動方向。文獻[3]通過對時空數(shù)據(jù)在時間維上的直接遍歷和歸納計算得到時空對象在固定的時間區(qū)間內(nèi)總是遵循相同或近似相同的運動路線所展現(xiàn)的周期模式進行挖掘。還有研究對群體移動模式(motion pattern)[4]、流動模式(flow pat-tern)[5]、遷移模式(migration pattern)[6]以及匯聚模式(convergence pattern)[7]等時空模式進行研究并提出了相關的算法。
基于查詢的時空模式發(fā)現(xiàn)以時空數(shù)據(jù)庫相關技術為基礎,采用復雜時空查詢來發(fā)現(xiàn)時空模式。根據(jù)所采用算法基礎不同相關研究主要有3大類。一類基于K最近鄰軌跡檢索算法,主要以K最近鄰軌跡檢索算法為主要基礎獲得基本的時空分析結(jié)果,再以此為基礎采用各類經(jīng)典知識發(fā)現(xiàn)算法發(fā)現(xiàn)時空模式[8]。另一類是基于語義軌跡的時空模式查詢方法,這種技術提出把空間進行分區(qū)并進行標識,然后以標識構(gòu)成的字符串對運動軌跡進行語義注解,從而利用字符串的識別技術把時空運動模式的發(fā)現(xiàn)轉(zhuǎn)化為基本時空分析操作的組合[9-10]。第三類研究采用以時空謂詞描述的時空查詢來表達所需發(fā)現(xiàn)的時空模式,通過各類謂詞所對應的基本時空分析操作算法按照模式蘊含的方式組合實現(xiàn)對該時空模式的挖掘[11]。還有研究提出可利用一些可視化的手段,通過與查詢者的交互,結(jié)合一些數(shù)據(jù)變換和可視化技術,完成對時空模式的描述與查詢[12]。
基于數(shù)據(jù)挖掘的時空模式發(fā)現(xiàn)技術一般針對某類關聯(lián)模式設計,挑戰(zhàn)性主要來自空間維度上的高維度數(shù)據(jù)關聯(lián)性計算以及時間維度上的針對性處理。由于這些算法的針對性很強,因此算法的通用性和一般性較差,一般一種算法只能解決某一類問題。與基于數(shù)據(jù)挖掘的時空模式發(fā)現(xiàn)算法相比,時空模式查詢技術具有通用性上的優(yōu)勢。盡管基于挖掘的算法在處理特定時空模式時的效率較高,但是采用算法前必須先具備待挖模式的先驗知識。而戰(zhàn)場情報態(tài)勢的評估與分析常常是一種交互式的理解與分析過程,指揮人員往往事先不了解將分析什么樣的時空模式,需要在分析過程中多次進行嘗試,并根據(jù)過程中的交互信息對模式的結(jié)構(gòu)進行調(diào)整。利用支持自由時空模式查詢的數(shù)據(jù)引擎,指揮人員可以像使用傳統(tǒng)關系數(shù)據(jù)庫一樣對時空運動模式進行自由查詢分析,滿足態(tài)勢分析的通用性要求。
基于事件查詢的情報態(tài)勢分析技術采用基于查詢的時空模式發(fā)現(xiàn)方法,以基本時空數(shù)據(jù)引擎為基礎,把復雜時空模式解析成基本時空數(shù)據(jù)查詢,通過時空模式的查詢處理后執(zhí)行獲得態(tài)勢信息的分析結(jié)果,如圖1所示。
圖1 基于查詢的情報態(tài)勢數(shù)據(jù)時空模式挖掘總體技術方案
基本時空數(shù)據(jù)引擎根據(jù)所建時空數(shù)據(jù)模型,把經(jīng)初級融合后形成的戰(zhàn)場情報態(tài)勢數(shù)據(jù)進行庫化存儲處理,提供基本空間拓撲分析操作,如“相交”、“包含”、“相離”、“相接”、“覆蓋”,并提供基本時空分析操作,包括時空拓撲分析操作、時空聚集操作以及時空投影與選擇操作等。時空模式查詢處理負責建立對各種時空模式的統(tǒng)一描述方式,并提供時空模式到基本時空分析操作的解析方法。時空模式查詢優(yōu)化根據(jù)各時空模式的共性特點,面對大數(shù)據(jù)量下的查詢優(yōu)化問題,建立相應的索引結(jié)構(gòu)以及查詢執(zhí)行策略,對所解析生成的基本時空查詢?nèi)蝿招蛄羞M行裁剪和優(yōu)化。
在技術方案中,時空數(shù)據(jù)引擎是基礎,其核心是一個完備的時空數(shù)據(jù)類型系統(tǒng),能夠?qū)Ω黝悤r空對象進行存儲和處理,并能夠提供一個完備的時空分析操作集合,用于組合實現(xiàn)各類態(tài)勢分析需求。由于目前還沒有可用的商用時空數(shù)據(jù)庫系統(tǒng),針對戰(zhàn)場態(tài)勢數(shù)據(jù)的特點,為了處理時空查詢,在南京航空航天大學的NHSTDB[13]時空數(shù)據(jù)引擎的基礎上,本文設計了一個時空數(shù)據(jù)類型系統(tǒng),定義了戰(zhàn)場態(tài)勢中移動點、區(qū)域等主要3種數(shù)據(jù)類型,實現(xiàn)了基本數(shù)據(jù)類型以及空間、時空數(shù)據(jù)類型,以謂詞形式定義了基本時空分析操作,包括時空投影、聚集、以及拓撲分析操作等,對其中的主要謂詞進行了算法實現(xiàn)。如表1所示,這些基本謂詞是實現(xiàn)事件與時空模式查詢的基礎。
態(tài)勢事件一般為復合時空事件組成,可由對象間的時空關系組合而成,把各類需要進行查詢的事件解析成為一系列基本時空查詢,通過時空數(shù)據(jù)引擎可以對各類態(tài)勢事件進行查詢和檢索。事件查詢一般由基本時空查詢在時間維上按一系列的先后約束關系組合起來,例如疑似海盜的行為模式可描述為:“與商船距離小于5000m的持續(xù)時間超過1h(跟蹤),與商船相接持續(xù)(行動),最后以高速離開商船(逃離)”。圖2給出了態(tài)勢事件的查詢系統(tǒng)的結(jié)構(gòu)。
圖2 態(tài)勢事件的查詢
在時空數(shù)據(jù)引擎提供的基礎時空分析操作基礎上,規(guī)定時空謂詞的組成與連接準則,可建立起時空查詢的構(gòu)造方法。表1列出了主要空間、時間以及時空連接謂詞。
表1 主要謂詞表
表1中,空間謂詞主要由時空數(shù)據(jù)引擎提供,完成對對象的空間關系進行分析計算,包括求距離(DIST)、求角度(ANGLE)、包含(CONT)、相離(DISJ)、相交(INTE)、相等(EQUA)。時間謂詞描述戰(zhàn)場目標之間或目標與場所之間空間關系的時間約束,其中KEEP描述空間關系的持續(xù)時間,OCCU描述空間關系的發(fā)生時間。比較謂詞用來判斷空間謂詞值或時間謂詞值。時空事件模式由時空事件組成,連接謂詞是把多個時空事件組成復合時空事件的連接詞,有并、或、非、任意、順序等,這些連接謂詞的語義如下:
設t為時空事件的觸發(fā)時間,e為時空事件,則
并(AND)連接謂詞:
即此事件的產(chǎn)生必須要求所有包含的原子時空事件都發(fā)生;
或(OR)連接謂詞:
即此事件的產(chǎn)生只需要所包含的任意原子時空事件發(fā)生;
非(NOT)連接謂詞:
即此事件的產(chǎn)生,必須e1,e3已經(jīng)產(chǎn)生,并且e2不在e1,e3之間發(fā)生;
任意(ANY)連接謂詞:
即此事件的產(chǎn)生,只要其中任意m個原子事件發(fā)生;
順序(SEQ)連接謂詞:
即此事件的產(chǎn)生,必須所有原子事件按序發(fā)生。
利用連接謂詞,可將時空事件模式分解為原子時空事件的組合,CSTE(CP({e})),其中e既可以是原子事件,也可以是復合事件,{e}表示事件集合,CP表示連接謂詞。通過各類連接謂詞,可把復合時空事件表達為原子事件的組合。
例如疑似海盜行為模式,可描述為
Suspect-Pirate=SEQ(KEEP((DIST(p,m) <5000)>60),KEEP(CONT(p,m)=True) >0),KEEP((DIST(p,m)=True) >0))
根據(jù)SQL語句的文法,可以進一步給出對應的時空查詢語句,提交時空數(shù)據(jù)引擎進行查詢,例如疑似海盜行為模式的查詢型如:
在該查詢語句中,模式查詢由3個時空事件查詢組成,分別指代“跟蹤”、“行動”與“逃離”事件,在3個事件間,滿足SEQ連接關系,在查詢執(zhí)行時,將按照SEQconstraint控制子查詢的執(zhí)行以及查詢結(jié)果的連接。
根據(jù)設計的技術框架,利用NHSTDB時空數(shù)據(jù)管理引擎,演示驗證原型系統(tǒng)以某聯(lián)合護航編隊的輔助分析為應用案例,以時空數(shù)據(jù)查詢的方式對情報態(tài)勢進行查詢分析,輔助編隊指揮人員決策。在場景中,設置了模擬數(shù)據(jù),時空對象實體包括護航艦艇、商船、漁船、海盜船,各艦船使用運動點對象存儲,國際推薦航道、護航艦艇保護區(qū)域、海盜船威脅區(qū)域使用運動區(qū)域?qū)ο蟠鎯?。國際推薦航道為半徑2nm的沿岸狹長區(qū)域;護航艦艇保護區(qū)域、海盜船威脅區(qū)域分別為護航艦艇、海盜船為中心,以一定半徑形成的圓形區(qū)域。各類數(shù)據(jù)為由數(shù)據(jù)生成程序產(chǎn)生的模擬數(shù)據(jù),所有時空數(shù)據(jù)跨度24h,時間切片粒度為10min,每個時空對象實體具有144個時空快照。根據(jù)各類艦船行為模擬產(chǎn)生了南岸各國護航艦艇20艘、通行商船100艘和1000艘身份不明的漁船。各類船只的最大速度按實際情況設置。
圖3 場景靜態(tài)展示
圖4 運動軌跡疊加效果
圖3中顯示區(qū)域紅色點表示護航艦艇,黃色點表示商船,白色點表示身份未知的目標,綠色透明狹長區(qū)域為國際推薦航道(國際推薦航道主要有南北兩條,系統(tǒng)中只對南岸的一條主要航道進行顯示和分析)。圖4中顯示的是24h內(nèi)的各個運動目標軌跡的疊加效果圖。
系統(tǒng)的核心功能在于時空查詢分析,在時空數(shù)據(jù)引擎的支持下,可以按照給出的SQL的格式對態(tài)勢中的簡單時空關系進行查詢,基本時空查詢可以針對態(tài)勢中的簡單事件進行查詢,將滿足查詢條件的對象篩選出來。
查詢1:
Select p1.no
From ships p1,p2
Where KEEP(CONT(p1.trajectory,p2.threatenarea)) >20 AND p2.class=pirate
可將場景中累計處于疑似海盜可控范圍內(nèi)持續(xù)超過20min的目標檢索出來。
通過將查詢1中的基本時空查詢進行簡單拓展,可完成查詢2所示的特定的時空模式查詢。
查詢2:
Select p1.no
From ships p1,p2,p3
Where CONT(p1.trajectory,p2.threatenarea)AND p2.class=pirate
AND Min(DIST(p1.trajectory,p3.trajectory)) > 30000 AND p3.class=warship;
查詢返回態(tài)勢中所有的危險商船,這里“危險商船”指處在可疑海盜船可控范圍內(nèi)且距離最臨近軍艦較遠,短時間軍艦無法前往援助的商船。首先通過可疑海盜威脅區(qū)與所有商船的Contain操作判斷,得到疑似海盜威脅下的商船集,對商船集中每個目標與軍艦進行距離上的聚集計算,判斷距離,最后得到高危商船的查詢結(jié)果,圖5中給出了該查詢的查詢結(jié)果圖示。
圖5 簡單時空關系查詢分析
也可以將時空查詢進一步復合組合,按上文中方法對特定的時空模式進行查詢分析。
查詢3:
該查詢將疑似海盜模式的船只檢索出來。其中時空模式可以根據(jù)專家知識自由進行設定,這里使用的海盜模式描述為:“目標與商船距離小于5000m的最大持續(xù)時間大于60min,接著目標與商船接觸,然后目標與商船相離”。如圖6給出了查詢結(jié)果圖示。
圖6 時空模式查詢分析
在作戰(zhàn)指揮活動中,理解與識別態(tài)勢是指揮人員面臨的最大的挑戰(zhàn),尤其是面對長期積累的大量歷史態(tài)勢數(shù)據(jù),由于其中往往蘊含重要的作戰(zhàn)規(guī)律與知識,而其數(shù)據(jù)量之大又往往無法由人工來進行有效的分析和評估。基于時空事件查詢的態(tài)勢分析技術可以為指揮人員提供一種自由度高的手段,幫助指揮人員理解與分析態(tài)勢,從海量態(tài)勢大數(shù)據(jù)中獲得知識與規(guī)律,快速形成決策。利用時空數(shù)據(jù)查詢來實際解決態(tài)勢的分析、挖掘與評估問題仍有很長的路要走,當前亟需研究的是大規(guī)模態(tài)勢時空數(shù)據(jù)的采集與存儲的方法,及早實現(xiàn)構(gòu)筑態(tài)勢大數(shù)據(jù)的存儲處理平臺,提供基本的時間、空間乃至時空檢索與分析能力,在任意的時間、任意的地點、為任意的用戶,提供任意數(shù)據(jù)集的任意服務。
[1] Celik M,Shekhar S.Mixed-drove spatiotemporal co-occurrence pattern mining[J].IEEE Trans on Knowledge and Data Engineering,2008,20(10):1322-1335
[2] Zhang Z,Wu W.Composite spatio-temporal co-occurrence pattern mining[C].LNCS 5258:Proc of the 3rd Int Conf on Wireless Algorithms,Systems,and Applications.Berlin:Springer,2014:454-465
[3] Hoyoung J,Qing L.A hybrid prediction model for moving objects[C].Proc of the 24th Int Conf on Data Engineering.Piscataway,NJ:IEEE,2008:70-79
[4] Hyunjin Y,Shahabi C.Accurate discovery of valid convoys from moving object trajectories[C].Proc of the IEEE Int Conf on Data Mining Workshops(ICDMW'09).Piscataway,NJ:IEEE,2009:636-643
[5] Wang J,Hsu W.FlowMiner:Finding flow patterns in spatiotemporal databases[C].Proc of the 16th IEEE Int Conf on Tools with Artificial Intelligence.Piscataway,NJ:IEEE,2004:14-21
[6] Du X,Jin R.Migration motif:A spatial-temporal pattern mining approach for financial markets[C].Proc of the 15th ACM SIGKDD Int Conf on Knowledge Discovery and Data Mining.New York:ACM,2009:1135-1144
[7] Gudmundsson J.,Kreveld M.Efficient detection of motion patterns in spatio-temporal data sets[C].In GIS’04:Proceedings of the 12th annual ACM International Workshop on Geographic Information Systems,New York,NY:IEEE,2004:250-257.
[8] Güting RH,Behr T.Efficient k-nearest neighbor search on moving object trajectories[J].VLDB J(online first).
[9] YAN Z,CHAKRABORTY D.Semantic Trajectories:Mobility Data Computation and Annotation[J].ACM Transactions on Intelligent Systems andTechnology,2012,9(4):1-34.
[10]向隆剛,吳濤.面向地理空間信息的軌跡模型及時空模式查詢[J].測繪學報,2014,43(9):982-988.
[11] SAKR M,GUTING R H.Spationtemporal Pattern Queries[J].Geoinformatics,2011,15(3):497-540.
[12] Andrienko N.Designing visual analytics methods for massive collections of movement data[J].Cartographica,2007,42(2):117-138.
[13]鄒永娟.時空數(shù)據(jù)庫數(shù)據(jù)模型和查詢語言的研究與實現(xiàn)[D].南京:南京航空航天大學,2009:34-60.