劉 軒,王衛(wèi)紅,唐曉斌,李 鵬
(電子科學(xué)研究院 綜合電子信息研究所,北京 100041)
在SAR-ATR 研究中,目標(biāo)鑒別是一個重要階段,其主要目的是對目標(biāo)檢測后獲得的感興趣區(qū)域(ROI)進(jìn)行進(jìn)一步處理,去除只含有雜波的ROI 切片,保留目標(biāo)ROI 切片,從而減小目標(biāo)分類和識別的代價[1-2]。目標(biāo)鑒別工作主要分為:首先提取一些對目標(biāo)、雜波有一定區(qū)分度的特征,組成初始特征集;然后針對不同的鑒別需求,對初始特征集進(jìn)行選擇,選擇出最優(yōu)的特征序列;最后利用相應(yīng)的鑒別器和適應(yīng)度函數(shù)對選擇出的特征序列進(jìn)行決策[3]。其中,特征選擇是影響目標(biāo)鑒別性能的關(guān)鍵步驟[4]。
早期的特征選擇主要依靠專家的經(jīng)驗知識。后來隨著問題的深入和目標(biāo)鑒別技術(shù)的發(fā)展,越來越多的特征選擇方法涌現(xiàn)出來。文獻(xiàn)[5]中提到一種基于特征相關(guān)性的特征選擇方法,文獻(xiàn)[6]中提出一種量子進(jìn)化理論的特征選擇方法。遺傳算法(GA)由于其本身屬于一種全局優(yōu)化隨機(jī)搜索算法[7],在鑒別特征選擇上也得到了實際應(yīng)用。最早將遺傳算法應(yīng)用到鑒別特征選擇上的是Bhanu[8]研究小組,國防科技大學(xué)高貴博士在Bhanu 小組的工作基礎(chǔ)上,對Bhanu 小組設(shè)定的適應(yīng)度函數(shù)進(jìn)行了改進(jìn),提出了一種對特征優(yōu)劣評價更全面的特征選擇算法[9-10],但在適應(yīng)度函數(shù)權(quán)值設(shè)定方面仍存在一定的不足?;诖?,本文對文獻(xiàn)[9]提出的適應(yīng)度函數(shù),在權(quán)值設(shè)定方面進(jìn)行了改進(jìn),提出一種新的適應(yīng)度函數(shù)。對比研究結(jié)果表明,采用本文提出的特征選擇算法評價更準(zhǔn)確,且目標(biāo)鑒別率也得到提高。
特征提取是解決目標(biāo)鑒別問題的一種有效方法。這是由于在SAR 圖像中,目標(biāo)和雜波虛警在散射特征和外形特征上,呈現(xiàn)出明顯的差異性。文中一共提到了19 個特征,其中有8 個特征是林肯實驗室在解決目標(biāo)鑒別問題中所使用過的,其余11 個也是目標(biāo)鑒別常用特征[9-11]。
(1)標(biāo)準(zhǔn)差特征(Standard Deviation Feature)。該特征是對SAR 圖像像素點長度的統(tǒng)計測量,其反映了圖像切片中目標(biāo)區(qū)域像素值的起伏程度。
(2)分形維特征(Fractal Dimension Feature)。該特征反映了經(jīng)過二值化處理后圖像中強(qiáng)像素點的緊密程度。
(3)聚集特征(Mass Feature)。該特征反映了圖像中像素點的數(shù)量。
(4)對角線特征(Diameter Feature)。該特征反映了圖像出目標(biāo)的尺寸信息。
(5)~(6)對比差異特征,包括最大恒虛警特征和均值恒虛警特征。
(7)CFAR 最亮百分比特征(Percent Bright CFAR Feature)。該特征反映了經(jīng)CFAR 處理后像素點的強(qiáng)度特征。
(8)計數(shù)特征(Count Feature)。該特征反映了圖像中像素點的強(qiáng)度特征。
(9)~(14)相鄰特征。該特征描述是圖像中不同區(qū)域(陰影,背景,目標(biāo))中點的分布情況。
(15)最大距離特征。該特征體現(xiàn)了強(qiáng)像素點分布的離散程度。
(16)~(19)空間邊界屬性特征,其中包括:像素質(zhì)量平均值特征、像素空間離散度特征、拐點特征和加速度特征。
遺傳算法是模擬生物在自然選擇中的遺傳進(jìn)化過程而形成的一種全局優(yōu)化隨機(jī)搜索算法[6],算法的實現(xiàn)主要包括以下幾個步驟[8-10]:
(1)定義染色體。
圖1 特征序列染色體編碼
遺傳算法采用二進(jìn)制編碼,如圖1 所示,其中的一個0 或1 可稱為一個基因,對應(yīng)由0 ~1 組成的二進(jìn)制編碼可稱其為染色體。其中若染色體中第i 位的基因為1,則代表對應(yīng)的第i 個特征被選中參加鑒別,反之若第i 位的基因為0,則代表對應(yīng)位置的特征在選擇中被剔除。因此,染色體代表的是特征的選擇情況。
(2)生成初始種群。初始種群是隨即生成的長度為l 的染色體集合,其中l(wèi) 是總特征數(shù)。種群大小N表示集合中元素的個數(shù),由于本文使用的特征數(shù)較多,為保證種群中個體的多樣性,故取N=200。
(3)設(shè)計適應(yīng)度函數(shù)。特征選擇的目的是為了在保證鑒別精度的前提下,選擇一個特征維數(shù)最小的特征序列用于鑒別。適應(yīng)度函數(shù)的設(shè)定正是用來評估所選特征序列的鑒別效果,一般而言,鑒別效果的評價主要考慮以下因素:特征總數(shù)l 為候選特征的總數(shù);描述長度k 為經(jīng)過特征選擇后,被選中用于鑒別的特征個數(shù)??倶颖緮?shù)n 為實驗樣本中目標(biāo)和雜波的總數(shù);總錯誤數(shù)ne為經(jīng)特征鑒別后,目標(biāo)誤判為虛警的個數(shù)與虛警誤判為目標(biāo)的個數(shù)之和;目標(biāo)的樣本數(shù)m 為實驗樣本中目標(biāo)數(shù)據(jù)的數(shù)量;漏報數(shù)me為目標(biāo)誤判為虛警的個數(shù);目標(biāo)鑒別率pr=1-me×m-1;總鑒別率pz=1-ne×n-1;基于上述因素考慮,Bhanu 研究小組設(shè)計的適應(yīng)度函數(shù)為
該適應(yīng)度函數(shù)在評價特征子序列的鑒別性能時,只考慮了總錯誤數(shù)和描述長度這兩個因素,是不全面的?;诖?,國防科技大學(xué)的高貴博士在設(shè)計適應(yīng)度函數(shù)上不僅考慮了前兩個因素,還著重加入了漏報數(shù)一項,如式(2)所示,該適應(yīng)度函數(shù)對鑒別特征選擇結(jié)果的評價更全面,并取得了更好的效果[10]
但對于候選特征數(shù)較多的情況,該適應(yīng)度函數(shù)缺乏準(zhǔn)確性,這是由于:1)隨著候選特征數(shù)量的增加,被選中特征數(shù)k 對適應(yīng)度函數(shù)值的影響越大。2)隨著新特征的加入,總鑒別率和目標(biāo)鑒別率明顯提高,即總錯誤數(shù)ne和漏報數(shù)me在逐漸減小,但優(yōu)選出的特征序列維數(shù)k 并未明顯減小,反之在一定的特征維數(shù)區(qū)間內(nèi),k 值還有上升的趨勢?;诖耍疚膶ξ墨I(xiàn)[10]提出的適應(yīng)度函數(shù)做了局部修正,如下式
式中,將高貴提出的適應(yīng)度函數(shù)的第一項權(quán)值k 適當(dāng)減小,變?yōu)閗/l,大幅減小了所選特征數(shù)對適應(yīng)度函數(shù)值的影響,保證了優(yōu)選特征序列的鑒別性能,加快了遺傳算法的收斂速度。
(4)確定遺傳算子。設(shè)置初始的交叉算子為0.8,變異算子為0.01。為降低程序的運(yùn)算時間并防止發(fā)生種群早熟現(xiàn)象,在整個搜索過程中,若最優(yōu)個體的適應(yīng)度函數(shù)值超過3 代未增加,則以0.02 的幅度按代增加變異率。待重新出現(xiàn)最優(yōu)個體時,初始化變異率為0.01。
(5)設(shè)定終止條件。當(dāng)適應(yīng)度函數(shù)滿足預(yù)設(shè)定目標(biāo)值或迭代次數(shù)達(dá)到最終代數(shù)時,終止算法,并輸出結(jié)果。本文由于候選特征數(shù)較多,設(shè)定遺傳代數(shù)為200 代。
根據(jù)上述的5 個步驟,設(shè)計算法流程如圖2 所示。
圖2 基于遺傳算法的特征選擇流程圖
為驗證本文所提算法的可行性和有效性,這里進(jìn)行了兩類實驗:(1)單特征可分性實驗。(2)特征選取算法對比實驗。
實驗數(shù)據(jù)使用RADARSAT-2 數(shù)據(jù)庫內(nèi)的目標(biāo)和雜波圖像,圖像分辨率為3 m×3 m,極化方式為HH;工作波段為C 波段;入射角30°~40°;圖像尺寸為128×128。訓(xùn)練樣本和測試樣本的數(shù)量如表1 所示,實驗采用二次距離鑒別器。
表1 實驗圖像數(shù)據(jù)
對所有訓(xùn)練樣本進(jìn)行特征提取,根據(jù)樣本中特征值的變化對單一特征的可分性進(jìn)行分析,如圖3 所示,為了構(gòu)圖,其中橫坐標(biāo)為155 個自動生成的隨機(jī)數(shù),代表每幅圖像在坐標(biāo)內(nèi)的位置??v坐標(biāo)為該圖像對應(yīng)的特征值。由于特征數(shù)量較多,在此只展示前4 個特征。由此可看出,對于不同的特征、目標(biāo)和雜波其所對應(yīng)的特征值有明顯的差異性。
圖3 前4 個特征的可分性
根據(jù)上圖所示。盡管單個特征對雜波、目標(biāo)有一定的區(qū)分能力,但難以得到滿意的鑒別結(jié)果。這是由于單個特征只能表現(xiàn)出目標(biāo)的一部分特性,但對目標(biāo)整體的特征缺乏概括性。
采用高貴提出的適應(yīng)度函數(shù)和本文改進(jìn)的適應(yīng)度函數(shù)進(jìn)行對比研究,實驗分為3 步。
第1 步 采用高貴提出的適應(yīng)度函數(shù)對上述19個特征進(jìn)行選擇,實驗次數(shù)為10 次,特征選擇后的結(jié)果如表2 所示。
表2 高貴提出的適應(yīng)度函數(shù)對19 個特征的選擇結(jié)果
由表2 的結(jié)果可見:
(1)適應(yīng)度函數(shù)最大值為-7.204 9,與此對應(yīng)的特征序列有2 組,分別為[f3、f8、f9、f17]和[f3、f8、f9、f18],其總鑒別率均為0.991 87。但根據(jù)表2,維數(shù)為4的特征序列鑒別效果明顯劣于維數(shù)為6 的特征序列。這樣的結(jié)果在一定程度上說明,當(dāng)候選特征數(shù)目較多時,文獻(xiàn)[10]中提到的適應(yīng)度函數(shù)存在一定的局限。
(2)特征選擇后選擇出的特征序列是多樣的,這主要是由于參選的特征數(shù)目較多,滿足鑒別要求的特征序列不唯一。且出于對算法計算時間的考慮,選擇的種群規(guī)模和遺傳代數(shù)有限,可能不足以保證每一次實驗均達(dá)到全局收斂。
第2 步 采用本文提出的適應(yīng)度函數(shù)對19 個特征進(jìn)行特征選擇,實驗次數(shù)為10 次,特征選擇后的結(jié)果如表3 所示。
表3 本文提出的適應(yīng)度函數(shù)對19 個特征的選擇結(jié)果
由表3 的結(jié)果可見:
(1)適應(yīng)度函數(shù)的最大值為-0.336 51,與此對應(yīng)的第2、7、8 次實驗均找到了維數(shù)為5 的特征序列,同時鑒別率均為1。優(yōu)于利用文獻(xiàn)[10]中適應(yīng)度函數(shù)得到的實驗結(jié)果。
(2)依靠高貴提出的適應(yīng)度函數(shù)理論上也能找出維數(shù)為5 的最優(yōu)特征序列,但由于其評價函數(shù)設(shè)計缺乏準(zhǔn)確性,在每一代的選擇中有可能將錯誤的個體誤判為最優(yōu)個體保留。錯誤地引導(dǎo)種群的進(jìn)化,導(dǎo)致遺傳算法的全局收斂速度變慢。
第3 步 采用前兩步得出的特征序列對測試樣本進(jìn)行實驗研究。由于最優(yōu)序列不唯一,從每組實驗結(jié)果中隨機(jī)抽取一組序列進(jìn)行驗證,如表4 所示。
表4 兩個特征序列在測試樣本中的實驗結(jié)果
測試樣本驗證的結(jié)果表明,采用本文所提適應(yīng)度函數(shù)后總鑒別率達(dá)到0.991 76、目標(biāo)鑒別率達(dá)到1。均優(yōu)于采用文獻(xiàn)[10]適應(yīng)度函數(shù)時獲得的結(jié)果。
綜上所述,本文提出的適應(yīng)度函數(shù)更適用于候選特征數(shù)目較多的情況。優(yōu)選出的特征數(shù)目更少且鑒別率更高。同時評價效果更全面,算法的收斂速度也更快。
本文針對SAR 圖像鑒別特征選擇的應(yīng)用,在已有算法的基礎(chǔ)上提出了一種基于遺傳算法的鑒別特征選擇算法。該方法通過對原有算法中適應(yīng)度函數(shù)權(quán)值的修改,使得算法對實際問題適用性更為廣泛。理論分析與實際驗證均表明,該算法比文獻(xiàn)[10]所提方法具有更高的準(zhǔn)確性,收斂速度更快。
[1] DUDGEON D E,LACOSS R T.An overview of automatic target recognition[J].The Lincoln Laboratory Journal,1993,6(1):2-10.
[2] DUDGEON D E,ZELNIO E G.Discriminating targets from clutter[J].The Lincoln Laboratory Journal,1993,6(1):25-51.
[3] BURL M C,BURL,G J.OWIRKA L M.Texture discrimination in synthetic aperture radar imagery[C].Proceeding of Twenty-Third Asilomar Conference on Signals,Systems and Computers,1989:399-404.
[4] NOVAK L M,OWIRKA G J,BROWER W S,et al.The automatic target-recognition system in SAIP[J].The Lincoln Laboratory Journal,1997,10(2):187-202.
[5] 李禹.SAR 圖像機(jī)動目標(biāo)檢測與鑒別技術(shù)研究[D].長沙:國防科學(xué)技術(shù)大學(xué),2007.
[6] 王培偉.基于量子進(jìn)化特征選擇的SAR 圖像分割[D].西安:西安電子科技大學(xué),2010.
[7] 李敏強(qiáng).遺傳算法的基本理論與應(yīng)用[M].北京:科學(xué)出版社,2002.
[8] BHANU B,LIN Y.Genetic algorithm based feature selection for target detection in SAR images[J].Image and Vision Computing,2003,21(7):591-608.
[9] 高貴.SAR 圖像目標(biāo)ROI 自動獲取技術(shù)研究[D].長沙:國防科學(xué)技術(shù)大學(xué),2007.
[10]高貴,周蝶飛,張軍,等.基于遺傳算法的SAR 圖像目標(biāo)鑒別特征選擇[J].電子學(xué)報,2008,36(6):1041-1046.