婁洋歌 鄒錦濤 周學(xué)平
(中國電子科技集團(tuán)公司第二十八研究所 南京 210007)
在現(xiàn)代防空作戰(zhàn)中,隨著探測(cè)偵察手段的不斷豐富,偵獲的非格式化動(dòng)向情報(bào)越來越多,將準(zhǔn)實(shí)時(shí)動(dòng)向情報(bào)與實(shí)時(shí)航跡目標(biāo)進(jìn)行關(guān)聯(lián)識(shí)別的需求尤為迫切。動(dòng)向情報(bào)關(guān)聯(lián)識(shí)別的前提是能夠?qū)墒盏膭?dòng)向情報(bào)進(jìn)行運(yùn)動(dòng)趨勢(shì)預(yù)測(cè),建立準(zhǔn)實(shí)時(shí)動(dòng)向情報(bào)與實(shí)時(shí)航跡的關(guān)聯(lián)關(guān)系,為目標(biāo)識(shí)別的推理提供依據(jù)。
一般來說,傳統(tǒng)的預(yù)測(cè)方法可以劃分為定性和定量?jī)深悾?]。定性法主要是參考?xì)v史資料,利用個(gè)人經(jīng)驗(yàn)、專業(yè)知識(shí)和綜合研判能力,對(duì)事物將來的發(fā)展情況進(jìn)行分析預(yù)測(cè),該分析法缺點(diǎn)是主觀性較強(qiáng)。定量法主要是融入基于數(shù)學(xué)算法的預(yù)測(cè)理論,通過數(shù)學(xué)方法對(duì)獲取的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)、分析,以預(yù)測(cè)事物的發(fā)展趨勢(shì)[2]。
目前,基于數(shù)學(xué)模型的預(yù)測(cè)方法主要有線性回歸法、非線性回歸法、Logistic函數(shù)擬合法、指數(shù)曲線擬合法、灰色系統(tǒng)預(yù)測(cè)法等[3]。后來,許多科研院所學(xué)者在已有方法的基礎(chǔ)上,通過融入新的方法提出了新的數(shù)學(xué)預(yù)測(cè)模型。陳玉金、劉永健等人在神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上提出了回歸分析組合模型[4];于振明等人在組合預(yù)測(cè)模型方法的基礎(chǔ)上融入情景規(guī)劃分析的方法[5];芮海田等人提出在指數(shù)平滑算法的基礎(chǔ)上通過利用馬爾科夫模型預(yù)測(cè)客運(yùn)量的方法[6]。
然而,以上研究基本上有大致相同的局限性,且數(shù)學(xué)模型復(fù)雜導(dǎo)致模型求解困難,在實(shí)際工程運(yùn)用中要達(dá)到較快的運(yùn)算速度和較高的計(jì)算精度,仍存在較大的難度。此外,現(xiàn)有文獻(xiàn)中很少提及將預(yù)測(cè)方法用于動(dòng)向目標(biāo)運(yùn)動(dòng)趨勢(shì)預(yù)測(cè)。
本文提出了利用隱馬爾科夫模型(Hidden Mar?kov Model,HMM)對(duì)動(dòng)向目標(biāo)運(yùn)動(dòng)趨勢(shì)進(jìn)行預(yù)測(cè)的算法處理模型。首先,對(duì)實(shí)際獲取的動(dòng)向情報(bào),提取動(dòng)向要素。然后,利用基于決策樹的方法對(duì)目標(biāo)的動(dòng)向要素進(jìn)行關(guān)聯(lián)聚類處理。最后,建立隱馬爾科夫模型對(duì)動(dòng)向目標(biāo)的運(yùn)動(dòng)趨勢(shì)進(jìn)行目標(biāo)狀態(tài)預(yù)測(cè)。
圖1 動(dòng)向目標(biāo)運(yùn)動(dòng)趨勢(shì)預(yù)測(cè)流程
偵收的動(dòng)向情報(bào)是非格式化的文本形式,預(yù)處理的基本任務(wù)就是從非格式化的動(dòng)向文本中提取格式化的動(dòng)向要素,通過預(yù)處理構(gòu)建基于動(dòng)向要素的特征向量,利用基于語義的決策樹實(shí)現(xiàn)對(duì)動(dòng)向要素的關(guān)聯(lián)聚類處理,最終形成機(jī)器可認(rèn)知的格式化結(jié)構(gòu),為動(dòng)向目標(biāo)的運(yùn)動(dòng)趨勢(shì)預(yù)測(cè)提供支持[7~8]。
假設(shè)給定的一個(gè)非格式化動(dòng)向情報(bào)內(nèi)容如下所示。
2014年08月29日05時(shí)59分,位我當(dāng)面島礁東南30°方共偵獲美艦1艘,坐標(biāo)310406N1260654E,研判為美驅(qū)逐艦。
可將上述動(dòng)向情報(bào)內(nèi)容表征為以<發(fā)生時(shí)間、發(fā)生地點(diǎn)、目標(biāo)行為、關(guān)聯(lián)平臺(tái)、關(guān)聯(lián)機(jī)構(gòu)>等表示的格式化動(dòng)向情報(bào)。動(dòng)向要素主要包括結(jié)構(gòu)化的時(shí)空信息和主體目標(biāo)信息,采用分詞系統(tǒng)對(duì)獲取的原始文字情報(bào)進(jìn)行分詞處理,然后進(jìn)行目標(biāo)動(dòng)向?qū)嶓w識(shí)別,提取動(dòng)向情報(bào)中的時(shí)空信息和目標(biāo)信息。在計(jì)算目標(biāo)實(shí)體關(guān)聯(lián)前,需要對(duì)各類獲取的數(shù)據(jù)分別進(jìn)行時(shí)空化的數(shù)據(jù)對(duì)準(zhǔn)處理以統(tǒng)一數(shù)據(jù)格式,如圖2所示。通常以模板方式來體現(xiàn)實(shí)體要素的表示方式,比如通過時(shí)間模板表示。模板為:數(shù)字+時(shí)|分|秒|點(diǎn),例如,下午14hh:30mm:25ss。
圖2 時(shí)空化數(shù)據(jù)分類處理
動(dòng)向要素提取主要采用基于概念樹的處理方法,從根結(jié)點(diǎn)到葉子結(jié)點(diǎn)的排列來分類動(dòng)向樣本實(shí)例。
本文主要采用構(gòu)造數(shù)字型概念樹[9]的方法,具體的方法可以描述為將動(dòng)向要素?cái)?shù)據(jù)放入二維數(shù)據(jù)表中,利用動(dòng)向要素?cái)?shù)據(jù)的關(guān)系視圖R={C}i=1r以及k-means聚類算法(聚類個(gè)數(shù)k為關(guān)系視圖中R的某一概念數(shù)層的節(jié)點(diǎn)總數(shù)),將動(dòng)向要素的數(shù)據(jù)分別劃分成對(duì)應(yīng)的集合以便關(guān)聯(lián)關(guān)系視圖中的節(jié)點(diǎn)概念。
如圖3所示,對(duì)于目標(biāo)動(dòng)向要素的所屬文字,概念樹的各個(gè)結(jié)點(diǎn)代表了文字中目標(biāo)動(dòng)向要素的所屬分類。決策樹的上層節(jié)點(diǎn)一般是概念數(shù)中最有助于分類目標(biāo)動(dòng)向?qū)嵗膶傩?,所以概念?shù)的根結(jié)點(diǎn)一般可以表示特征向量中最優(yōu)的屬性。
圖3 動(dòng)向要素關(guān)聯(lián)聚類示意圖
隱馬爾科夫模型[10~11]可以通過數(shù)學(xué)符號(hào)λ=(A,B,π)表示,其中A={aij}是狀態(tài)轉(zhuǎn)移矩陣,aij為t時(shí)刻從狀態(tài)Si轉(zhuǎn)移到狀態(tài)Sj的數(shù)學(xué)概率;概率分布矩陣B={bik};初始狀態(tài)概率πi=P(q1=si),它表示在初始時(shí)刻選擇某個(gè)狀態(tài)的概率。該模型的具體算法流程如圖4所示。
圖4 隱馬爾科夫模型算法流程圖
一個(gè)已知的HMM能夠形成觀測(cè)序列O={o1,o2,…,oT},ot表示在t時(shí)狀態(tài)為Sj的觀察值。隱藏狀態(tài)序列Q和可觀察狀態(tài)序列O的聯(lián)合概率為
其中,P(O,Q|λ)為觀察序列O的概率,P(Q|λ)為隱藏狀態(tài)序列Q在該HMM下的概率。由于式(1)的計(jì)算量很大,本文通過利用后向算法減少式(1)計(jì)算量大的問題。隱馬爾科夫模型λ,在時(shí)刻t且狀態(tài)為qi時(shí),從t+1到T的部分觀測(cè)序列Ot+1,Ot+2,…,OT的概率為后向概率,公式為
本文采用隱馬爾科夫模型作為對(duì)動(dòng)向目標(biāo)運(yùn)動(dòng)趨勢(shì)進(jìn)行預(yù)測(cè)的系統(tǒng)模型,利用語義決策樹對(duì)動(dòng)向要素進(jìn)行聚類得到幾個(gè)隱含狀態(tài),實(shí)現(xiàn)將動(dòng)向目標(biāo)運(yùn)動(dòng)趨勢(shì)轉(zhuǎn)化為動(dòng)向目標(biāo)的運(yùn)動(dòng)狀態(tài)預(yù)測(cè)。用動(dòng)向目標(biāo)相對(duì)應(yīng)的真實(shí)的空間位置表示觀測(cè)對(duì)象,建立隱馬爾科夫模型,由式(3)得到預(yù)測(cè)序列的概率。
本文實(shí)現(xiàn)維特比算法計(jì)算動(dòng)向目標(biāo)的最優(yōu)狀態(tài)序列:
輸入:λ=(A,B,π)和觀測(cè)序列S=xt1,xt2,…,xtN;輸出:最優(yōu)狀態(tài)序列。
最后,根據(jù)動(dòng)向目標(biāo)的趨勢(shì)概率分布,系統(tǒng)采用扇形波門的形式,構(gòu)建關(guān)聯(lián)區(qū)域,扇形關(guān)聯(lián)區(qū)域表現(xiàn)形式如圖5所示。
最終的概率公式為
圖5 扇形關(guān)聯(lián)區(qū)
本實(shí)驗(yàn)主要以偵獲的空中動(dòng)向目標(biāo)為基礎(chǔ),利用基于隱馬爾科夫模型對(duì)動(dòng)向目標(biāo)的運(yùn)動(dòng)趨勢(shì)進(jìn)行預(yù)測(cè)。然后采用均方根誤差來計(jì)算衡量模型預(yù)測(cè)的位置精度。實(shí)驗(yàn)中,每隔1min預(yù)測(cè)一次,然后分別計(jì)算預(yù)測(cè)的經(jīng)度和緯度與觀測(cè)值的均方根誤差的值。
均方根誤差公式表示為
Xmodel,i是下一時(shí)刻位置的觀測(cè)值,Xobs,i是預(yù)測(cè)值,n是預(yù)測(cè)次數(shù),RMSE的值越小說明模型越好。
觀測(cè)值與預(yù)測(cè)值之間距離的公式表示為
其中,(x1,y1)為觀測(cè)值的坐標(biāo),(x2,y2)為預(yù)測(cè)值的坐標(biāo)。
對(duì)動(dòng)向目標(biāo)運(yùn)動(dòng)趨勢(shì)進(jìn)行預(yù)測(cè)的預(yù)測(cè)值與觀測(cè)值的比較曲線如圖 6(a)所示,從圖6(a)中可以看出,本文提出的基于模型預(yù)測(cè)的動(dòng)向目標(biāo)運(yùn)動(dòng)趨勢(shì)的預(yù)測(cè)值在經(jīng)過多次預(yù)測(cè)后較接近于觀測(cè)值,能較好地反映真實(shí)目標(biāo)的運(yùn)動(dòng)趨勢(shì)。
該模型對(duì)應(yīng)的預(yù)測(cè)精度的均方根誤差曲線如圖6(b)、(c)所示,從圖6(b)、(c)中可以看出,在進(jìn)行多次預(yù)測(cè)之后,經(jīng)度和緯度的均方根誤差逐漸收斂。
圖6 預(yù)測(cè)值與觀測(cè)值比較及對(duì)應(yīng)的經(jīng)緯度均方根誤差
對(duì)動(dòng)向目標(biāo)的運(yùn)動(dòng)趨勢(shì)進(jìn)行預(yù)測(cè)后,需與實(shí)時(shí)目標(biāo)進(jìn)行位置關(guān)聯(lián)[12~13],本文采用的關(guān)聯(lián)門限定義如下:
1)預(yù)測(cè)值與觀測(cè)值的距離在0~5km為確定關(guān)聯(lián);
2)預(yù)測(cè)值與觀測(cè)值的距離在5km~10km為模糊關(guān)聯(lián);
3)預(yù)測(cè)值與觀測(cè)值的距離在大于10km為不關(guān)聯(lián)。
基于上述定義的位置關(guān)聯(lián)門限,統(tǒng)計(jì)實(shí)驗(yàn)中屬于確定關(guān)聯(lián)、模糊關(guān)聯(lián)和不關(guān)聯(lián)的具體點(diǎn)數(shù),具體點(diǎn)數(shù)如表1所示,本文定義處于模糊關(guān)聯(lián)的點(diǎn)可認(rèn)為為關(guān)聯(lián)點(diǎn)。
表1 動(dòng)向目標(biāo)與實(shí)時(shí)目標(biāo)關(guān)聯(lián)點(diǎn)數(shù)統(tǒng)計(jì)
由表1可知,確定關(guān)聯(lián)和模糊關(guān)聯(lián)的點(diǎn)數(shù)和為25,占總點(diǎn)數(shù)的86.2%。可見,動(dòng)向目標(biāo)的運(yùn)動(dòng)趨勢(shì)預(yù)測(cè)結(jié)果能夠?yàn)榕c實(shí)時(shí)目標(biāo)的關(guān)聯(lián)提供有效依據(jù)。
在對(duì)提取的動(dòng)向要素建立特征向量的基礎(chǔ)上,本文提出了基于隱馬爾科夫模型的動(dòng)向目標(biāo)運(yùn)動(dòng)趨勢(shì)的預(yù)測(cè)方法。經(jīng)過實(shí)驗(yàn)驗(yàn)證,該模型預(yù)測(cè)的動(dòng)向目標(biāo)的運(yùn)動(dòng)趨勢(shì)與觀測(cè)值接近,在進(jìn)行多次狀態(tài)預(yù)測(cè)之后,誤差增長(zhǎng)趨于平緩。此外,在本文提出的關(guān)聯(lián)規(guī)則中,動(dòng)向目標(biāo)運(yùn)動(dòng)趨勢(shì)的預(yù)測(cè)結(jié)果能夠?yàn)閯?dòng)向目標(biāo)與實(shí)時(shí)目標(biāo)的關(guān)聯(lián)提供依據(jù)。
由于空中目標(biāo)機(jī)動(dòng)時(shí)的航向、速度變化較大且較快,該模型不適應(yīng)機(jī)動(dòng)目標(biāo)的運(yùn)動(dòng)趨勢(shì)預(yù)測(cè),在后續(xù)研究中,可以進(jìn)一步開展機(jī)動(dòng)目標(biāo)的運(yùn)動(dòng)趨勢(shì)預(yù)測(cè)研究。