傅蔚陽,劉以安,薛松
嚴(yán)格來講,目標(biāo)威脅估計是一個NP困難問題[1]。在進行威脅估計時,給出一個各種因素與威脅程度的函數(shù)關(guān)系困難很大。文獻[2]使用BP神經(jīng)網(wǎng)絡(luò)處理目標(biāo)威脅估計問題獲得了不錯的結(jié)果,但BP神經(jīng)網(wǎng)絡(luò)也有著明顯缺點,比如訓(xùn)練時間長、易陷入局部極值、學(xué)習(xí)率η選擇敏感等。所以本文提出了改進的磷蝦群算法(oppositionbased learning Krill Herd optimization, OKH)優(yōu)化極限學(xué)習(xí)機的目標(biāo)威脅估計模型。磷蝦群算法是2012年由Gandomi等[3]提出的一種新的仿生優(yōu)化算法。由于其參數(shù)少、模型簡單、算法性能好而獲得大量運用。但是在處理復(fù)雜的優(yōu)化問題時,其易陷入局部極值和出現(xiàn)算法后期收斂速度變慢的問題[4]。極限學(xué)習(xí)機[5-6]是一種針對單隱含層前饋神經(jīng)網(wǎng)絡(luò)(single-hidden layer feedforward neural netwark, SLFN)的算法。該算法與傳統(tǒng)訓(xùn)練方法相比,具有學(xué)習(xí)速度快、泛化性能好的優(yōu)點,但對初始權(quán)值與閾值過度依賴[7]。為解決上述缺點,本文提出了OKH算法,利用收集到的目標(biāo)威脅度數(shù)據(jù)建立了目標(biāo)威脅估計模型 (extrem learning machine,ELM) ,并使用反向磷蝦群算法優(yōu)化ELM模型的初始參數(shù)。為了驗證本模型的可靠性,將本模型與其他幾種神經(jīng)網(wǎng)絡(luò)模型作了對比研究。
KH算法是基于自然界磷蝦群尋找食物和相互通信的模擬,采用拉格朗日模型模擬磷蝦的移動且引入了遺傳算子來提高物種多樣性[8-9]。在KH算法中,每個磷蝦都代表了n維解空間中的一個潛在解,磷蝦食物代表了算法尋優(yōu)需要找到的全局最優(yōu)解。與其他仿生算法相比,磷蝦群算法實現(xiàn)起來較為容易,除了時間間隔依據(jù)需求人為設(shè)定,剩余參數(shù)都取自真實生態(tài)的研究結(jié)果,所以有效避免了因參數(shù)設(shè)置不當(dāng)而導(dǎo)致的算法性能下降問題[10]。該算法具體流程如下。
1)磷蝦個體的速度更新公式為
式中:Xi為磷蝦的狀態(tài);Ni為受誘導(dǎo)運動的速度矢量;Fi為覓食行為的速度矢量;Di為隨機擾動的速度矢量;下標(biāo)i表示第i只磷蝦。
2)受誘導(dǎo)運動:
3)覓食行為:
式中:Finew表示覓食行為產(chǎn)生的速度矢量;Vf是覓食速度,一般取0.02 m/s;ωf(0,1)是覓食行為的慣性權(quán)重;βifood是食物的吸引力;βibest是從迭代開始到當(dāng)前時刻個體i的最優(yōu)狀態(tài);Fiold是上一次覓食行為產(chǎn)生的速度矢量。
4)隨機擾動:
式中:Dmax∈[0.002,0.010] m/s是最大擾動速度;δ為每個變量服從(–1,1)均勻分布的方向矢量。
5)狀態(tài)更新:
式中: Δ t為時間間隔,必須根據(jù)實際問題進行選擇。
最后,重復(fù)進行受誘導(dǎo)運動、覓食行為、隨機擾動,直到滿足最大迭代次數(shù)后尋優(yōu)停止。
研究可以發(fā)現(xiàn),對于標(biāo)準(zhǔn)磷蝦群算法,隨著迭代次數(shù)的不斷增加,所有磷蝦個體都朝同方向運動,使得磷蝦群趨同性變得嚴(yán)重[11-12]。本文采用反向?qū)W習(xí)策略[13-14]對標(biāo)準(zhǔn)磷蝦群算法的初始種群與迭代后的種群進行改進,成功改善了磷蝦個體的分布特性和算法的尋優(yōu)范圍,使得算法精度和收斂速度得到較大提高。本算法主要有以下兩點改進。
1)優(yōu)化初始種群位置
即使沒有先驗知識的情況下,利用反向點,也能獲得一組較好的初始候選解(初始種群)。過程如下:
①隨機初始化種群P。②計算反向種群OP,即
式 中 : a =1,2,···,Np; b =1,2,···,n ; O Pa,b和 Pa,b分 別表示反向種群位置與種群位置中a維第b個變量的值;分別表示第a維元素的最大值和最小值。
③分別計算P與OP中個體的適應(yīng)度,從中取適應(yīng)度值較好的n個體生成新的初始種群NP。
2)優(yōu)化迭代過程中的種群位置
同理,如果在迭代的過程中也使用類似的反向?qū)W習(xí)方法,就能夠提高算法的全局搜索能力。算法迭代開始前,設(shè)置反向?qū)W習(xí)優(yōu)化選擇概率p。每當(dāng)完成一次迭代,計算出新的種群位置后,依據(jù)p來決定是否對種群進行反向?qū)W習(xí)優(yōu)化(p的大小根據(jù)實際需要決定)。過程如下:
①生成一個隨機數(shù)rand(0,1)。如果rand(0,1)<p,則轉(zhuǎn)入②,否則,直接進入算法下一輪迭代。
②計算動態(tài)反向種群OP:
式中, M inta與 M axta分別表示第t次迭代第a維元素的最小值與最大值。
③使用適應(yīng)度評價函數(shù)計算P和與其對應(yīng)的OP中個體的適應(yīng)度值。如果,則用OPi替代Pi,全部比較、替換后的種群P就是新的種群。其中,、分別表示第i個個體和與其對應(yīng)的反向個體的適應(yīng)度值,OPi表示第i個反向個體。
④進入下一輪OKH迭代。
隨著搜索進程的深入,當(dāng)前迭代的搜索區(qū)間遠(yuǎn)小于最初的搜索區(qū)間,使得種群快速逼近最優(yōu)解。
OKH算法流程:①參數(shù)初始化,即最大迭代次數(shù)I、種群規(guī)模N、最大擾動速度Dmax、時間間隔以及優(yōu)化選擇概率p;②初始化種群位置并利用反向?qū)W習(xí)優(yōu)化初始種群位置;③計算此時每個磷蝦個體對應(yīng)的適應(yīng)度值;④分別計算受誘導(dǎo)運動、覓食行為、隨機擾動所產(chǎn)生的個體位置變化量;⑤使用公式(5)更新磷蝦位置;⑥生成rand(0,1),如果 rand (0,1) < p,根據(jù)公式 (7)計算動態(tài)反向種群并計算P與OP中個體的適應(yīng)度值。如果,則用OPi替代Pi,生成新的種群,否則直接進入⑦;⑦計算磷蝦個體新位置矢量的適應(yīng)度,然后重復(fù)④~⑦,直到達到最大迭代次數(shù),算法結(jié)束;⑧輸出最終的迭代結(jié)果,即最優(yōu)解。
為了驗證OKH算法,選擇6個基準(zhǔn)測試函數(shù)進行仿真分析并與標(biāo)準(zhǔn)KH算法、PSO算法作比較。測試函數(shù)見表1。
表1 測試函數(shù)Table 1 Test functions
OKH算法和KH算法的參數(shù)設(shè)置一致:最大擾動速度Dmax=0.005 m/s,覓食速度Vf=0.02 m/s,最大誘導(dǎo)速度Nmax=0.01 m/s。特別的,OKH中反向?qū)W習(xí)優(yōu)化選擇概率p=0.5。PSO參數(shù)設(shè)置為學(xué)習(xí)因子c1=c2= 1.5。為保證公平性,3種算法的其他參數(shù)一致:初始種群規(guī)模為30,最大迭代次數(shù)為200,維數(shù)為10,運行次數(shù)為10。將10次尋優(yōu)的最優(yōu)值、最差值、平均值以及均方差記錄下來。實驗結(jié)果如表2所示。
表2 3種算法的性能比較Table 2 Comparison of three algorithms
由表2可以發(fā)現(xiàn),相較于KH算法、PSO算法,OKH算法具有更好的尋優(yōu)效果。尤其在多峰函數(shù)中表現(xiàn)更為優(yōu)異,不僅搜索精度更高而且跳出局部最優(yōu)的能力更強。從均方差可知,OKH算法的魯棒性也優(yōu)于另外兩種算法。
目標(biāo)威脅估計問題需要統(tǒng)籌的因素很多,比如天氣、地形、敵、我、鄰軍的戰(zhàn)斗力及兵力部署和指戰(zhàn)員作戰(zhàn)風(fēng)格等[15-16]。進行威脅估計時,通常需考慮以下的因素:
1)目標(biāo)類型:大型目標(biāo)(強擊機、轟炸機等)、小型目標(biāo)(隱身飛機、空地導(dǎo)彈等)、武裝直升機。
2)目標(biāo)速度:如 30 m/s、44 m/s、120 m/s等。
3)目標(biāo)方位角:如 3°、6°、9°等。
4)目標(biāo)高度:如低空、中空、高空。
5)目標(biāo)抗干擾能力:如無、弱、中、強。
6)目標(biāo)距離:如50 km、100 km、150 km等。
對于隨機產(chǎn)生初始輸入權(quán)值和閾值的極限學(xué)習(xí)機,很難保證訓(xùn)練的ELM模型擁有較好的泛化能力和較高的預(yù)測精度[17-18]。針對以上不足,本文在采用極限學(xué)習(xí)機建立目標(biāo)威脅估計模型的基礎(chǔ)上,利用OKH算法優(yōu)化ELM初始輸入權(quán)重和偏置,提出了基于OKH-ELM的目標(biāo)威脅估計模型。模型優(yōu)化過程如圖1所示。
1)數(shù)據(jù)預(yù)處理
收集105組數(shù)據(jù),大型目標(biāo)、小型目標(biāo)和武裝直升機各35組。隨機選擇大型目標(biāo)、小型目標(biāo)和武裝直升機各30組,共90組,做訓(xùn)練集,剩余15組做測試集。部分?jǐn)?shù)據(jù)如表3所示。
使用9級量化理論對威脅屬性量化[19]。對定性屬性做如下預(yù)處理。
①目標(biāo)高度:超低、低、中、高,依次量化為2、4、6、8。
②目標(biāo)抗干擾能力:強、中、弱、無,依次量化為 2、4、6、8。
③目標(biāo)類型:大型目標(biāo)、小型目標(biāo)、武裝直升機依次量化為 3、5、8。
對于目標(biāo)距離、目標(biāo)方向角和目標(biāo)速度則直接進行歸一化操作。
2)確定ELM網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)
ELM隱含層神經(jīng)元個數(shù)與訓(xùn)練集樣本個數(shù)有關(guān),經(jīng)多次實驗,設(shè)置20個神經(jīng)元預(yù)測結(jié)果較好。ELM三層網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)為6-20-1,輸入層與隱含層間連接權(quán)值及隱含層神經(jīng)元閾值的尋優(yōu)范圍均為[-1,1],隱含層激活函數(shù)為Sigmoid。
圖1 基于OKH-ELM的目標(biāo)威脅估計模型Fig. 1 Model of target threat assessment using OKH-ELM
表3 部分?jǐn)?shù)據(jù)Table 3 Parts of data
3)OKH參數(shù)初始化
OKH算法的參數(shù)設(shè)置與1.3節(jié)的OKH參數(shù)設(shè)置相同。
4)OKH初始化種群
個體編碼方法采用實數(shù)編碼,用實數(shù)串表示每個個體。該實數(shù)串由ELM輸入層與隱含層之間的權(quán)值和隱含層的閾值兩部分組成。因為ELM網(wǎng)絡(luò)結(jié)構(gòu)為6-20-1,所以磷蝦個體的編碼長度為 6×20+20=140。
5)目標(biāo)適應(yīng)度函數(shù)
式中:n為測試樣本數(shù),yi為模型的訓(xùn)練輸出威脅度,oi為實際威脅度,k為常數(shù)。
6)執(zhí)行OKH算法
OKH算法流程與1.2節(jié)的OKH算法流程相同。
7)預(yù)測輸出
利用OKH算法優(yōu)化好的初始權(quán)值與閾值來構(gòu)造ELM。將測試集數(shù)據(jù)輸入已經(jīng)訓(xùn)練過的ELM,預(yù)測目標(biāo)威脅度。
為測試OKH-ELM目標(biāo)威脅估計模型的有效性,將測試數(shù)據(jù)分別輸入OKH-ELM、ELM、KHELM、KH-BP、PSO-ELM模型比較預(yù)測輸出。
KH-ELM模型、PSO-ELM模型的建立與OKH-ELM相似,僅將優(yōu)化函數(shù)分別改成標(biāo)準(zhǔn)KH算法和PSO算法。KH-BP模型利用KH算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)初始的全部權(quán)值和閾值[20],采用6-11-1的網(wǎng)絡(luò)結(jié)構(gòu),磷蝦個體編碼長度為6×11+11+11+1=89。采用訓(xùn)練好的上述5種模型分別對相同的威脅度測試集進行預(yù)測,實驗結(jié)果如圖2、圖3和表4所示。
圖2 OKH-ELM的預(yù)測威脅值與真實威脅值對比Fig. 2 Comparison between forecasting values and real threat values based on OKH-ELM
圖3 5種模型的預(yù)測誤差絕對值Fig. 3 Absolute predictive error for five models
表4 5種優(yōu)化方法的絕對預(yù)測誤差平均值Table 4 Average of absolute predictive errors of five optimization methods
由圖2可知,OKH-ELM模型輸出的預(yù)測威脅值與真實威脅值擬合度很高。由圖3、表4可知,OKH-ELM威脅估計模型的預(yù)測誤差平均值小于其他4種威脅估計模型,預(yù)測結(jié)果最接近真實值。除了在第4、5、15個樣本處,OKH-ELM模型預(yù)測誤差不是最小(但也十分接近最小誤差),其余樣本點預(yù)測誤差均最小。5種模型的優(yōu)異度排序為:OKH-ELM>KH-ELM>KH-BP>PSOELM>ELM。實驗結(jié)果顯示,本文構(gòu)造的OKHELM目標(biāo)威脅估計模型能夠較好地應(yīng)對目標(biāo)威脅估計問題,模型性能優(yōu)于另外4種模型。
本文針對多源信息融合中目標(biāo)威脅估計的特點,利用改進磷蝦群算法與極限學(xué)習(xí)機,建立了一種基于改進磷蝦群算法優(yōu)化極限學(xué)習(xí)機的目標(biāo)威脅估計模型,并提出了該模型的算法。文中選取影響目標(biāo)威脅估計的6個典型指標(biāo),采集了105組數(shù)據(jù)用于仿真實驗。結(jié)果表明,相比于ELM、PSO-ELM、KH-BP、KH-ELM,OKH-ELM模型能夠更加準(zhǔn)確、有效地預(yù)測目標(biāo)威脅值,為目標(biāo)威脅估計提供了一種新的方法。