張 彤
(成都理工大學(xué) 工程技術(shù)學(xué)院,四川 樂山 614000)
隨著雷達(dá)技術(shù)的不斷發(fā)展與進(jìn)步,不同領(lǐng)域都將該技術(shù)進(jìn)行了很好的應(yīng)用,如軍事領(lǐng)域、農(nóng)業(yè)畜牧等領(lǐng)域,他們通過(guò)該技術(shù)得到了具有豐富信息且非常清晰的圖像[1]。雷達(dá)圖像中存在著許許多多的目標(biāo),其中不乏一些復(fù)雜的,識(shí)別這些復(fù)雜的圖像是非常困難的,雷達(dá)技術(shù)最基礎(chǔ)的功能和應(yīng)用就是對(duì)所需目標(biāo)進(jìn)行識(shí)別,所以對(duì)如何利用雷達(dá)技術(shù)識(shí)別所需目標(biāo)是一個(gè)備受矚目的焦點(diǎn)[2]。目標(biāo)的不同特性和變化多端的天氣對(duì)雷達(dá)在進(jìn)行探測(cè)時(shí)的效能有著非常大的影響,雷達(dá)所探測(cè)的信息中夾雜著許多雜波信息,很難得到具有一定影響價(jià)值的規(guī)律和模式,也就導(dǎo)致了“數(shù)據(jù)豐富,知識(shí)貧乏”的出現(xiàn)[3]。
雷達(dá)探測(cè)目標(biāo)的誤差測(cè)量技術(shù)不僅非常深?yuàn)W復(fù)雜,而且是一種具有系統(tǒng)性的工作,主要是由“白箱”建模和“黑箱”建模兩種基本的方法組成,所謂“白箱”就是通過(guò)理論分析推導(dǎo),進(jìn)而得出機(jī)理模型,也就是對(duì)之前已經(jīng)經(jīng)過(guò)驗(yàn)證的知識(shí)進(jìn)行推導(dǎo);“黑箱”是,通過(guò)測(cè)試?yán)走_(dá)系統(tǒng)所輸入/出的數(shù)據(jù)信息,并作出相應(yīng)的判斷的方法。當(dāng)今主要是用傳統(tǒng)的方法進(jìn)行“黑箱”建模,即數(shù)理統(tǒng)計(jì)的方法進(jìn)行仿真雷達(dá)探測(cè),但是這種方式不能反映出真實(shí)的誤差的特性,而是只能進(jìn)行誤差總體上的規(guī)律的反映,對(duì)整體測(cè)量技術(shù)的真實(shí)性有比較大的影響,因?yàn)樵摲椒ǖ玫降南到y(tǒng)誤差和標(biāo)準(zhǔn)差只是通過(guò)分析歷史上存有的誤差數(shù)據(jù)資料和對(duì)通過(guò)對(duì)比模仿得到的,比對(duì)模型是高斯白噪聲模型。數(shù)據(jù)挖掘是指對(duì)隱含且未知的數(shù)據(jù)進(jìn)行提取的過(guò)程,所選數(shù)據(jù)是隨機(jī)的、數(shù)量龐大的且不清晰的,但這些信息確認(rèn)是潛在的且有用的,所以提出了建立于該方法之上的雷達(dá)探測(cè)目標(biāo)誤差測(cè)量技術(shù)。
數(shù)據(jù)挖掘技術(shù)的激光雷達(dá)圖像識(shí)別思想為:最開始要進(jìn)行圖像的去噪,在小波變換下進(jìn)行去噪處理,接著提取圖像的Zernike不變矩陣的特征進(jìn)行,最后建立深度的網(wǎng)絡(luò)層進(jìn)行識(shí)別模型[4]。
圖像切割:如果把具有極其復(fù)雜性的圖像直接輸入到分類器里面,分類器會(huì)隨之變得非常復(fù)雜。所以,需要切割整個(gè)完整的圖像,切割步驟為:1)確定圖像的閥值,即從眾多閥值中選擇適合的數(shù)值;2)對(duì)圖像做二值化處理和平滑處理[5]。從水平的方向開始掃描圖像,計(jì)算從第一行起的圖像中白色像素的數(shù)量,如果數(shù)量大于N(已設(shè)閥值)時(shí),需要對(duì)此進(jìn)行特殊的標(biāo)記。若與它相鄰的兩行仍然出現(xiàn)這種情況,即白色像素的數(shù)量大于已設(shè)閥值,那么視為之前的標(biāo)記為合理標(biāo)記,否則的話,就要從頭開始再次操作[6]。若出現(xiàn)合理的標(biāo)記時(shí),就要開始改為向下的掃描。接著計(jì)算以最后一行起的每行中白色像素的數(shù)量,如果數(shù)量大于N,就要將這一整行進(jìn)行特殊標(biāo)記。然后接著做向上的掃描,若相鄰兩行仍是白色像素的數(shù)量大于N,同上需要視之前的標(biāo)注為合理的,且重新進(jìn)行該操作[7]。若過(guò)程中有合理標(biāo)記出現(xiàn),就要停下水平方向的掃描。垂直方向同理,需在水平方向的掃描區(qū)進(jìn)行[8]。
一般需要在分類器中輸入圖像之前對(duì)其進(jìn)行歸一化處理,包括位置、大小等的歸一化處理。
1)位置歸一化。主要是將目標(biāo)移動(dòng)到所規(guī)定的位置,以達(dá)到位置偏差的消除目的。有下面兩種比較簡(jiǎn)單的歸一化方法:(1)對(duì)目標(biāo)的質(zhì)心進(jìn)行計(jì)算,隨后將其移動(dòng)到指定的位置,該方法被稱為建立于質(zhì)心之上的歸一化方法;(2)對(duì)目標(biāo)的外邊框進(jìn)行計(jì)算,然后尋找重心,再將其移動(dòng)到指定位置,該方法稱之為建立于目標(biāo)外邊框之上的位置歸一化方法[9]。
2)大小歸一化。進(jìn)行變換大小不一的目標(biāo),使其大小相同,該變換過(guò)程為大小歸一化。主要有下面兩種方法:(1)為了使目標(biāo)符合規(guī)定,需對(duì)目標(biāo)外框進(jìn)行放大或者縮小,縮放過(guò)程要按照比例進(jìn)行;(2)根據(jù)目標(biāo)在水平和垂直兩個(gè)方向的分布進(jìn)行大小歸一化[10]。
如何在向量機(jī)中進(jìn)行目標(biāo)圖像特征的輸入,并對(duì)其進(jìn)行分類和預(yù)測(cè),主要有下面3個(gè)步驟:
1)建模,也就是向量機(jī)模型的建立。模型中的核函數(shù)為徑向基函數(shù)。該函數(shù)在模型選擇時(shí)由以下兩個(gè)參數(shù)決定:懲罰因子和核參數(shù)。分類器的性質(zhì)和預(yù)測(cè)能力受到該參數(shù)的直接影響[11]。
2)學(xué)習(xí),通過(guò)樣本進(jìn)行訓(xùn)練以對(duì)向量機(jī)提出支持。用于目標(biāo)圖像識(shí)別的支持向量機(jī)的學(xué)習(xí)過(guò)程如圖1所示。
圖1 支持向量機(jī)的學(xué)習(xí)過(guò)程
由圖1可知,通過(guò)目標(biāo)圖像識(shí)別樣本,對(duì)目標(biāo)識(shí)別圖像進(jìn)行前期處理后,計(jì)算目標(biāo)識(shí)別圖像的特征矩,并對(duì)特征矩進(jìn)行歸一化處理,再輸入到初始支持向量機(jī)中進(jìn)行訓(xùn)練,得到訓(xùn)練后的支持向量機(jī)。
3)預(yù)測(cè),在向量機(jī)中輸入未經(jīng)分類的圖像特征,并對(duì)此做出分類和預(yù)測(cè)。
根據(jù)上述內(nèi)容,設(shè)計(jì)具體識(shí)別流程如圖2所示。
圖2 雷達(dá)圖像的識(shí)別流程
由圖2可知,雷達(dá)圖像的識(shí)別流程為錄取實(shí)際測(cè)量點(diǎn)的數(shù)據(jù),分別提取實(shí)際測(cè)量點(diǎn)的數(shù)據(jù)特征,再對(duì)實(shí)際測(cè)量點(diǎn)的數(shù)據(jù)進(jìn)行訓(xùn)練后,分類識(shí)別目標(biāo)圖像樣本,并輸出目標(biāo)圖像識(shí)別結(jié)果。
在進(jìn)行數(shù)據(jù)挖掘時(shí),必不可少的一步為數(shù)據(jù)的預(yù)處理。因?yàn)楸煌诰虻脑紨?shù)據(jù)有著冗雜多余且空洞無(wú)用的特點(diǎn),在進(jìn)行數(shù)據(jù)挖掘時(shí)要對(duì)其進(jìn)行加工,處理其中的噪聲,這就是所謂的數(shù)據(jù)預(yù)處理[12]。數(shù)據(jù)預(yù)處理流程如圖3所示。
圖3 數(shù)據(jù)預(yù)處理流程
預(yù)處理的主要流程為:
1)將所需處理的數(shù)據(jù)進(jìn)行相應(yīng)的轉(zhuǎn)換、集成和匹配。要想實(shí)現(xiàn)數(shù)據(jù)挖掘,就要將目標(biāo)雷達(dá)所得到的實(shí)際測(cè)量數(shù)據(jù)和真實(shí)航跡數(shù)據(jù)進(jìn)行對(duì)比,并獲得差值。但是上述兩種數(shù)據(jù)在采集時(shí)的步長(zhǎng)是不同的,并且被存放在不同的文件中,所以要對(duì)二者做航跡匹配處理,并且為了二者步長(zhǎng)變得一樣,還需要對(duì)數(shù)據(jù)進(jìn)行三點(diǎn)插值處理。
2)將數(shù)據(jù)處理成一致的。目的是保證挖掘結(jié)果的精確度和干凈整潔,且具備一致性的特點(diǎn)。
3)讀取雷達(dá)數(shù)據(jù)文件,并將其裝入數(shù)組之中,指針指向數(shù)組初始位置,數(shù)組是否為計(jì)算機(jī)保留的值?如果是,則結(jié)束程序;如果不是,則查看數(shù)據(jù)是否為模式數(shù)據(jù)?如果是,則需解碼,并將結(jié)果存儲(chǔ)到計(jì)算機(jī)指令之中,否則直接查看解碼時(shí)間信息;將解碼結(jié)果存儲(chǔ)到模式數(shù)據(jù)庫(kù)之中,查看解碼時(shí)間信息,并將結(jié)果存儲(chǔ)到時(shí)間表之中,解碼方位信息,并將結(jié)果存儲(chǔ)成AZ格式。不斷重復(fù)上述步驟,直到獲取所需數(shù)據(jù)。
雷達(dá)探測(cè)誤差數(shù)據(jù)挖掘需要輸入和預(yù)測(cè)屬性,前者為真值距離和真值方位,后者為距離和方位誤差,而誤差模型的建立還要依靠決策樹來(lái)完成,評(píng)估樹的準(zhǔn)確性還要依據(jù)保留測(cè)試法來(lái)實(shí)現(xiàn)。保留測(cè)試法對(duì)樣本數(shù)據(jù)集進(jìn)行劃分,劃分為訓(xùn)練和測(cè)試數(shù)據(jù)集,并且二者是互不相交的。
在SQL Server 2005中進(jìn)行誤差數(shù)據(jù)的挖掘,為了選擇適合且可用的決策樹算法,需要選擇挖掘模型參數(shù)。決策樹-即樹形結(jié)構(gòu)的流程圖,屬性的測(cè)試由內(nèi)部節(jié)點(diǎn)表示,測(cè)試結(jié)果由分支表示,類別則由葉節(jié)點(diǎn)表示,根節(jié)點(diǎn)即樹的最高層,如圖4所示。
圖4 決策樹樹形結(jié)構(gòu)圖
為了形成決策樹,需要進(jìn)行訓(xùn)練樣本子集的選擇,若該樹不能給出任何對(duì)象正確答案,則要將沒有得到正確答案的特殊情況添加到該樹中,一直重復(fù)上述操作,直到正確決定集的出現(xiàn)為止。完成一個(gè)符合要求決策樹,即每個(gè)葉子都可以代表一個(gè)類別,每一個(gè)節(jié)點(diǎn)都代表一個(gè)屬性,每一個(gè)分支都代表一個(gè)屬性所對(duì)應(yīng)可能值。
進(jìn)行熵計(jì)算方法下的拆分分?jǐn)?shù)計(jì)算,和節(jié)點(diǎn)的拆分,拆分方法為二分法。通過(guò)以上操作,挖掘模型會(huì)分別生成距離和方位誤差的決策樹。通過(guò)對(duì)包含在葉節(jié)點(diǎn)中的最少的樣本數(shù)的設(shè)定進(jìn)行決策樹的剪枝和修剪,并對(duì)其進(jìn)行評(píng)估,評(píng)估需要根據(jù)測(cè)試數(shù)據(jù)集完成,確定了距離誤差決策樹在樣本數(shù)最少時(shí)生成預(yù)測(cè)性能比較好。
基于數(shù)據(jù)挖掘的雷達(dá)探測(cè)目標(biāo)誤差測(cè)量技術(shù)實(shí)現(xiàn)流程如圖5所示。
圖5 雷達(dá)探測(cè)目標(biāo)誤差測(cè)量流程
由于雷達(dá)探測(cè)目標(biāo)通常是通過(guò)相關(guān)指令實(shí)現(xiàn)目標(biāo)探測(cè)的,相應(yīng)獲取的雷達(dá)運(yùn)行軌跡誤差圖像真實(shí)反應(yīng)了從雷達(dá)指令發(fā)布的完整信息。通過(guò)信號(hào)源為被探測(cè)目標(biāo)提供所需要的信號(hào),利用多傳感器融合相關(guān)數(shù)據(jù)參數(shù),再通過(guò)數(shù)據(jù)采集卡,將模擬信號(hào)轉(zhuǎn)化為數(shù)字信號(hào),傳輸?shù)絇C端,以此建立雷達(dá)探測(cè)目標(biāo)誤差測(cè)量的虛擬基準(zhǔn)。利用數(shù)據(jù)挖掘方法分離出各個(gè)誤差分量,并且分析出產(chǎn)生誤差的根本原因。根據(jù)探測(cè)結(jié)果,還可以優(yōu)化雷達(dá)探測(cè)位置,提高測(cè)量精準(zhǔn)度。
針對(duì)基于數(shù)據(jù)挖掘的雷達(dá)探測(cè)目標(biāo)誤差測(cè)量技術(shù)研究,進(jìn)行仿真實(shí)驗(yàn)驗(yàn)證。
雷達(dá)信號(hào)中存在的孤立點(diǎn)需通過(guò)挖掘分離處理,使用數(shù)據(jù)挖掘技術(shù)在后期處理時(shí)主要通過(guò)以下兩種方法得以應(yīng)用。
1)進(jìn)行原始的雷達(dá)信號(hào)和已經(jīng)被處理過(guò)且孤立點(diǎn)已經(jīng)被刪除的信號(hào)之間的比較,將其送到雷達(dá)終端,雷達(dá)終端會(huì)將目標(biāo)點(diǎn)跡圖顯示出來(lái),以達(dá)到有效性確定的目的。
圖6 雷達(dá)目標(biāo)點(diǎn)軌跡
從以上點(diǎn)跡圖可以很明顯地看出經(jīng)過(guò)處理和未經(jīng)處理的雷達(dá)信號(hào)的區(qū)別。兩幅圖由于是在不同的時(shí)間段采集的,會(huì)有略微的區(qū)別,但是前后兩幅圖因采集數(shù)據(jù)的時(shí)段不同略有差異,但是可以看出原始點(diǎn)擊圖中顯示的航線附近非常多的干擾點(diǎn)在處理過(guò)的圖中得到了明顯的解決,可以斷定該處理有效過(guò)濾且去除了價(jià)目表的信號(hào)。
2)進(jìn)行提取孤立點(diǎn)信號(hào),并將其送到終端顯示器上,接著對(duì)其進(jìn)行觀察,確定其規(guī)律后,做出合理的處理。通過(guò)以上方法,提取了4種類型:
(1)出現(xiàn)在25 km的半徑范圍內(nèi),該范圍是以雷達(dá)站為圓心計(jì)算的,除此之外, 25~50 km之間偶爾也會(huì)有假目標(biāo)出現(xiàn)。真假目標(biāo)距雷達(dá)站有著相同的距離;假目標(biāo)數(shù)量比較多,一般在2~3個(gè),情況很糟糕時(shí)甚至?xí)霈F(xiàn)4~5個(gè)之多,分布為扇形,并且會(huì)出現(xiàn)在真目標(biāo)的順/逆時(shí)針方向。
(2)出現(xiàn)在半徑50~120 km之內(nèi),出現(xiàn)更加頻繁的位置是65 km和100 km附近,而且30~50 km、120~180 km的范圍之間也會(huì)有假目標(biāo)的出現(xiàn)。真假目標(biāo)距雷達(dá)站有著相同的距離;多數(shù)情況下是一個(gè),惡劣時(shí)會(huì)出現(xiàn)兩個(gè)。若假目標(biāo)在真目標(biāo)的逆時(shí)針方向出現(xiàn),從雷達(dá)矩陣引兩條夾角為40°的射線到真目標(biāo)和假目標(biāo)上面。反之,如果假目標(biāo)在真目標(biāo)的順時(shí)針方向出現(xiàn),則所需射線的夾角為30°。
(3)出現(xiàn)在270~280 km方位一般情況下是一個(gè)假目標(biāo),不好的情況會(huì)出現(xiàn)兩個(gè),二者之間離的非常近,且夾角也比較小。
(4)假目標(biāo)很偶爾的會(huì)出現(xiàn),且沒有規(guī)律,不會(huì)長(zhǎng)時(shí)間的出現(xiàn)。
根據(jù)上述4種假設(shè)目標(biāo)類型,對(duì)雷達(dá)運(yùn)動(dòng)軌跡展開分析,如圖7所示。
圖7 4種假設(shè)目標(biāo)類型雷達(dá)目標(biāo)點(diǎn)軌跡
用圖7所示的目標(biāo)點(diǎn)軌跡,將傳統(tǒng)方法與基于數(shù)據(jù)挖掘方法的雷達(dá)探測(cè)目標(biāo)誤差測(cè)量精準(zhǔn)度進(jìn)行對(duì)比分析,結(jié)果如表1~4所示。
表1 第一類假設(shè)情況下兩種方法測(cè)量精準(zhǔn)度對(duì)比結(jié)果
表2 第二類假設(shè)情況下兩種方法測(cè)量精準(zhǔn)度對(duì)比結(jié)果
表3 第三類假設(shè)情況下兩種方法測(cè)量精準(zhǔn)度對(duì)比結(jié)果
表4 第4類假設(shè)情況下兩種方法測(cè)量精準(zhǔn)度對(duì)比結(jié)果
由上述表內(nèi)容可知,采用傳統(tǒng)方法雷達(dá)探測(cè)目標(biāo)誤差測(cè)量精準(zhǔn)度與實(shí)際值相差較大,最大誤差為16.8 km;而基于數(shù)據(jù)挖掘方法雷達(dá)探測(cè)目標(biāo)誤差測(cè)量精準(zhǔn)度與實(shí)際值相差較小,最大誤差為2.0 km。
建立于數(shù)據(jù)挖掘之上的雷達(dá)探測(cè)方法可以有效地分析和測(cè)量目標(biāo)誤差,提出了在這方面研究的新路徑。在以后的研究中,為了能夠得到更加具有真實(shí)性的雷達(dá)探測(cè)誤差的結(jié)果,會(huì)對(duì)與誤差探測(cè)有關(guān)的機(jī)制、環(huán)境等影響因素進(jìn)行研究。
有幾個(gè)問(wèn)題在做研究的時(shí)候發(fā)現(xiàn)依然需要想出解決辦法,主要問(wèn)題是:1)在進(jìn)行孤立點(diǎn)分析算法時(shí)發(fā)現(xiàn)維度越高,時(shí)間的復(fù)雜度也會(huì)隨之增高;2)如何在如今手工選擇不同時(shí)段數(shù)據(jù)以得到所需參數(shù)的方法之上,建立更加便捷動(dòng)態(tài)高效的參數(shù)選擇方法;3)如何提高信息挖掘的真實(shí)可靠性和準(zhǔn)確率。當(dāng)數(shù)據(jù)比較密集時(shí),經(jīng)常會(huì)出現(xiàn)真實(shí)的目標(biāo)信號(hào)被誤認(rèn)為假的信號(hào)的情況。接下來(lái)為了建立更加真實(shí)有效的挖掘模型,將會(huì)進(jìn)行雷達(dá)數(shù)據(jù)挖掘方法的更進(jìn)一步的研究與探討。