施裕升, 王曉科, 劉 鑫, 楊革文, 高方君
(1.上海機電工程研究所,上海 201000; 2.上海航天技術研究院,上海 201000)
雷達精度是衡量雷達探測的重要戰(zhàn)術指標之一[1-2]。近年來,隨著雷達隱身技術的持續(xù)發(fā)展和低空突防技術的實戰(zhàn)應用,低空小目標在防空領域帶來的威脅與日俱增。由于此類目標具有飛行高度低、自身散射面積較小等特點,防空雷達對其探測精度嚴重下降。在此嚴峻形勢下,傳統(tǒng)雷達誤差補償方法的劣勢逐漸突出。因此,對自適應能力強、適用范圍廣、補償效果好的雷達誤差補償技術進行研究已然成為未來提高雷達探測精度的重點方向之一。
當前,國內學者圍繞雷達精度主要開展了兩方面的研究。一是建立幾何模型補償誤差。例如:文獻[3]建立了制導雷達誤差模型估計雷達誤差;文獻[4]建立了艦船的姿態(tài)測量誤差模型分析雷達探測精度。但幾何模型需要特定的場景才有效,環(huán)境適應性差。二是結合ADS-B估計系統(tǒng)誤差。例如:文獻[5]采用ADS-B將雷達誤差分段求平均值;文獻[6]等采用最小二乘(LS)法結合ADS-B估計雷達的系統(tǒng)誤差。但沒有考慮到隨機誤差對補償方法的影響,對于超低空目標或者機動目標,該補償方法的適用性差。
隨著人工智能技術的發(fā)展,神經網絡因具有自適應學習能力、較強的環(huán)境適應性、優(yōu)越的非線性能力,在復雜環(huán)境中處理非線性問題的優(yōu)勢顯著。因此,為了提高雷達誤差補償方法的適應性與適用性,本文采用BP神經網絡用于雷達誤差的估計與補償。但BP神經網絡的初始權值和閾值是隨機值,導致訓練的時間長;此外,訓練時易陷入局部最優(yōu)[7],導致BP神經網絡的估計精度低。因此,本文采用改進粒子群(PSO)算法尋找BP網絡的最優(yōu)初始權值和閾值,憑借改進粒子群算法的全局尋優(yōu)能力解決BP神經網絡的缺陷。
首先,引入收斂因子,約束粒子速度,避免粒子陷入局部最優(yōu);其次,基于目標函數動態(tài)自適應調節(jié)慣性權重,陷入局部最優(yōu)時,可以及時跳出,縮短收斂時間;最后,將改進的粒子群算法用于優(yōu)化BP神經網絡的初始權值和閾值,能夠更精確地估計雷達誤差,并對雷達的量測值進行補償,提高雷達精度。
BP神經網絡的組成結構為輸入層、若干隱含層和輸出層。如圖1所示,以3個輸入層、3個隱含層、1個輸出層為例進行說明。
圖1 BP神經網絡訓練流程圖Fig.1 Training flow chart of BP neural network
在正向傳播過程中,第k′個隱含層節(jié)點的輸出yk和輸出層的輸出Y分別為
(1)
(2)
式中:i為輸入層節(jié)點數;k′為隱含層節(jié)點數;j為輸出層節(jié)點數;xi為第i個輸入層節(jié)點的輸入;Wi k′為第i個輸入層節(jié)點連接第k′個隱含層節(jié)點的權值;Wk′ j為第k′個隱含層節(jié)點連接第j個輸出層節(jié)點的權值;f(·)和g(·)為非線性激勵函數。
在反向傳播過程中,以期望值和輸出值間的均方誤差為梯度,采用梯度下降法不斷反向尋找權值和閾值的最優(yōu)值,使實際輸出Y值逐漸收斂于期望值P[8]。BP神經網絡通過權值與閾值的不斷修正實現對樣本的訓練,當訓練完成后,網絡參數會保持不變。
由于BP神經網絡的輸入與輸出存在某種關系,因此,采用BP神經網絡估計雷達誤差的前提是了解誤差的影響因素。經查閱文獻和分析得知:距離誤差影響因素為目標高度和目標速度[9]。其中:目標高度由目標距離和目標俯仰角確定;方位角誤差影響因素為目標高度、目標速度和方位角[9-10];俯仰角誤差影響因素為目標高度和目標速度[9]。
將誤差影響因素作為BP神經網絡的訓練輸入,將雷達測量值與真值的誤差作為訓練輸出,反復訓練BP神經網絡使權值與閾值趨于穩(wěn)定。按照此方案訓練出3種估計網絡,分別為距離、方位角和俯仰角誤差的估計網絡,其結構分別如圖2~4所示。
圖2 基于BP神經網絡的距離誤差估計Fig.2 Distance error estimation based on BP neural network
圖3 基于BP神經網絡的方位角誤差估計Fig.3 Azimuth error estimation based on BP neural network
圖4 基于BP神經網絡的俯仰角誤差估計Fig.4 Pitch error estimation based on BP neural network
BP神經網絡的初始權值和閾值是隨機值,會導致上文中提到的梯度下降法易陷入局部最優(yōu),因此,本文在傳統(tǒng)粒子群算法的基礎上引入自適應慣性權重和收斂因子提高粒子群算法的全局尋優(yōu)能力,優(yōu)化BP神經網絡的初始權值和閾值。
傳統(tǒng)的粒子群算法是在解的空間內初始化一群隨機粒子,通過不斷地迭代更新粒子速度和位置計算目標函數的全局最優(yōu)值[11](適應度)。粒子速度、位置的第k+1次迭代算式分別為
Vk+1=wVk+c1γ1(Pk-Xk)+c2γ2(Gk-Xk)
(3)
Xk+1=Xk+Vk+1
(4)
式中:w為慣性權重;c1,c2為加速度常數;γ1,γ2為兩個隨機數;Pk,Gk分別為迭代次數為k時的個體極值和群體極值。
在BP神經網絡中,粒子位置表示BP神經網絡的初始權值和閾值的取值,粒子速度表示初始權值和閾值的變化量,待優(yōu)化的目標函數即BP神經網絡中均方誤差的算式為
(5)
式中:n為訓練樣本數;on為當前權值和閾值下神經網絡對第n個樣本輸出的估計值;pn為第n個樣本的期望值。
傳統(tǒng)粒子群算法的粒子速度在式(4)中沒有被約束,容易陷入局部最優(yōu)。此外,式(3)中慣性權重為定值,而慣性權值決定著粒子的搜索能力,因此無法自適應調節(jié)全局搜索和局部搜索,導致收斂速度慢[12]。故本文引入收斂因子和自適應慣性權重調節(jié)改進粒子群算法。
為了避免陷入局部最優(yōu)點,本文在式(4)的基礎上進行改進,引入收斂因子λ,改進后的算式為
Xk+1=Xk+λVk+1
(6)
(7)
若陷入局部最優(yōu),為了讓粒子群算法在局部最優(yōu)中盡快跳出,提高收斂速度,縮短迭代時間,采用一種基于目標函數的動態(tài)自適應慣性權重,即
(8)
w=exp(-δ(k)/δ(k-1))
(9)
式中:k為當前迭代次數;δ(k)為衡量慣性權重變化的平滑程度;fgbest(PSi(k))為第i個粒子在第k次更新位置時對應的個體極值適應度值;fzbest(PSi(k))為第i個粒子在第k次更新位置時對應的最優(yōu)粒子對應的極值適應度值;w為慣性權重。
該算法在每次迭代中都會計算個體極值和群體極值之間的差異,即平滑程度。若相鄰兩次迭代的平滑程度差異很大,說明此時可能陷入局部最優(yōu),應盡量增大慣性權重,從而擴大粒子搜索范圍。因此,相比傳統(tǒng)算法能夠及時跳出局部最優(yōu)。
本文采用改進粒子群算法優(yōu)化BP神經網絡,解決BP神經網絡易陷入局部最優(yōu)及訓練時間長的問題,并將改進型BP神經網絡應用于雷達的誤差補償?;诟倪M型BP神經網絡的雷達誤差補償流程如圖5所示。
圖5 雷達誤差補償流程圖Fig.5 Flow chart of radar error compensation
具體算法流程如下:
1) 確定雷達距離、方位角、俯仰角的誤差影響因素,作為神經網絡的輸入;
2) 初始化神經網絡的拓撲結構;
3) 采用本文提出的算法改進粒子群算法;
4) 采用改進PSO算法迭代尋找BP神經網絡的最優(yōu)初始權值和閾值;
5) 訓練雷達的先驗探測數據,學習雷達的誤差特性,訓練結束后神經網絡內部的權值參數會固定;
6) 基于改進型BP神經網絡估計距離、方位角、俯仰角各自對應的誤差值;
7) 將誤差的估計值與雷達量測值相加,輸出處理后的量測數據。
選取某雷達的實測數據作為樣本,其中包含超低空目標的量測數據。對所有的樣本數據進行歸一化處理,并隨機抽取100個樣本數據用于神經網絡的性能測試,余下的樣本數據用于神經網絡的訓練;將訓練好的神經網絡用于距離、方位角和俯仰角的誤差估計與補償。因保密原因,本文中誤差指標以a,b,c量化處理。
將距離誤差補償前后的絕對值進行比較,結果如圖6所示。從精度上看,未補償的誤差平均值為3.1a,而補償后的誤差平均值為0.38a,精度提高了87.7%;從起伏性看,未補償的誤差標準差為1.592a,而補償后的誤差標準差為0.26a,誤差波動穩(wěn)定性提高了83.67%。
圖6 距離誤差補償前后的絕對值對比圖Fig.6 Comparison of absolute values before and after distance error compensation
將方位角誤差補償前后的絕對值進行比較,結果如圖7所示。從精度上看,未補償的誤差平均值為1.65b,而補償后的誤差平均值為0.18b,精度提高了89.09%;從起伏性看,未補償的誤差標準差為b,而補償后的誤差標準差為0.183b,誤差波動穩(wěn)定性提高了81.7%。
圖7 方位角誤差補償前后的絕對值對比圖Fig.7 Comparison of absolute value before and after azimuth error compensation
將俯仰角誤差補償前后的絕對值進行比較,結果如圖8所示。從精度上看,未補償的誤差平均值為1.44c,而補償后的誤差平均值為0.11c,精度提高了92.36%;從起伏性看,未補償的誤差標準差為0.8c,而補償后的誤差標準差為0.1c,誤差波動穩(wěn)定性提高了87.5%。
圖8 俯仰角誤差補償前后的絕對值對比圖Fig.8 Comparison of absolute value before and after pitch error compensation
選取與上述相同的100個樣本數據,采用文獻[6]中的最小二乘(LS)法線性估計雷達的距離、方位角和俯仰角誤差,并與PSO-BP神經網絡進行對比,另外,將未優(yōu)化的BP神經網絡與PSO-BP神經網絡進行對比,對比標準為估計值與雷達真實誤差的均方根誤差,即
(10)
式中:Δr為雷達的真實誤差值;Δp為雷達的誤差估計值。
各算法的誤差估計效果對比結果如表1所示。
表1 各算法的誤差估計效果對比Table 1 Comparison of error estimation effects of various algorithms
從表1中可以看出,線性最小二乘估計性能較差,說明線性估計不是解決雷達誤差估計的理想方案。相比而言采用BP神經網絡進行非線性估計后,估計精度明顯提升。相比傳統(tǒng)粒子群算法優(yōu)化的BP神經網絡,本文算法進一步提升了距離、方位角和俯仰角的估計精度,并縮短了線下訓練時間,表明本文算法是合理、有效的。此外,本文算法的線上運行時間略優(yōu)于傳統(tǒng)誤差補償算法,具有工程應用前景。
本文將改進PSO算法與BP神經網絡相結合,縮短了訓練時間,提高了傳統(tǒng)BP神經網絡的估計精度,并將該神經網絡應用于雷達的誤差補償。采用雷達的實測數據進行了仿真驗證,結果表明,補償后的距離、方位角、俯仰角的精度以及誤差起伏性均有大幅改善,與傳統(tǒng)的誤差補償方法相比補償效果更好,工程應用性和推廣應用性更強,更適應未來防空作戰(zhàn)環(huán)境。