石宸睿, 田 露, 徐 湛, 職如昕, 陳晉輝
(北京信息科技大學(xué)信息與通信工程學(xué)院, 北京 100101)
應(yīng)急通信感知裝備的效能是指應(yīng)急感知裝備體系面對突發(fā)事故災(zāi)難時,滿足實際需求程度的度量,與各裝備單元的效能及其形成的整體功能結(jié)構(gòu)有關(guān)。應(yīng)急通信感知裝備效能評價對應(yīng)急通信感知裝備發(fā)展戰(zhàn)略研究中的發(fā)展方案設(shè)計具有重要的支撐作用,而且應(yīng)急通信感知裝備效能評價是支撐應(yīng)急通信感知裝備體制論證與建設(shè)規(guī)劃論證的重要手段。此外,效能評價與重大裝備系統(tǒng)發(fā)展論證也有緊密的聯(lián)系。
針對裝備的綜合評價,文獻[2]提出了一種基于加權(quán)與評價相結(jié)合的二維評價模型,該模型由靜態(tài)評價模型和動態(tài)評價模型組成,對裝備的性能進行評價。文獻[3]提出了一種主客觀混合的一級配電網(wǎng)設(shè)備評價方法,將主成分分析法和層次分析法(analytic hierarchy process, AHP)相結(jié)合,利用相對熵原理對主客觀評價結(jié)果進行權(quán)重分配。上述模型在評價時主觀性較強且不具備自適應(yīng)性。國內(nèi)外學(xué)者針對其他的評價對象也建立了多種綜合評價模型,如AHP、模糊評價法、證據(jù)理論、粒子群優(yōu)化算法(particle swarm optimization, PSO)、神經(jīng)網(wǎng)絡(luò)等。其中,傳統(tǒng)反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)是一種基于誤差BP的多層前饋訓(xùn)練網(wǎng)絡(luò),可自動提取輸入的指標(biāo)數(shù)據(jù)與輸出的效能值之間的關(guān)系,并且將其自適應(yīng)地儲存于網(wǎng)絡(luò)的權(quán)值中,隨著樣本的增加,還可不斷自適應(yīng)地完善評價模型。與現(xiàn)有效能評價方法相比,具有高度自學(xué)習(xí)和自適應(yīng)的能力,因此被廣泛應(yīng)用于綜合評價。然而BP神經(jīng)網(wǎng)絡(luò)模型易陷入局部最優(yōu),因此BP神經(jīng)網(wǎng)絡(luò)模型在使用過程中常結(jié)合遺傳算法、包絡(luò)分析和Bootstrap法、PSO算法等。本文提出基于PSO-BP的應(yīng)急通信感知裝備評價方法,不僅可以利用BP神經(jīng)網(wǎng)絡(luò)克服通信感知裝備評價時的主觀性,還利用粒子群算法克服陷入局部最小值的問題,該模型旨在構(gòu)建一種有效的應(yīng)急通信感知裝備效能評價模型,對應(yīng)急通信感知裝備體系的優(yōu)化發(fā)展具有現(xiàn)實意義。
《應(yīng)急指揮信息化與通信保障能力建設(shè)規(guī)范》標(biāo)準(zhǔn)將應(yīng)急通信裝備類型分為4類,包括信息采集類裝備、信息傳輸類裝備、現(xiàn)場指揮類裝備和配套保障類裝備。本文綜合考慮應(yīng)急通信感知裝備在實戰(zhàn)中執(zhí)行任務(wù)時所面臨的挑戰(zhàn),以及應(yīng)急感知通信裝備智能化的發(fā)展趨勢,將機動平臺能力作為其中一項指標(biāo)。對于標(biāo)準(zhǔn)中的現(xiàn)場指揮類裝備,其關(guān)鍵能力是對所采集信息的處理。故將對應(yīng)急通信感知裝備的評價主要分為信息采集能力、信息處理能力、信息傳輸能力、輔助保障能力和機動平臺能力,以此建立起的基本應(yīng)急通信感知裝備評價指標(biāo)體系框架圖如圖1所示,評價指標(biāo)體系包含5個一級評價指標(biāo)和16個二級評價指標(biāo)。
圖1 基本應(yīng)急通信感知裝備評價指標(biāo)體系框架圖Fig.1 Framework diagram of evaluation index system for basic emergency communication and sensing equipment
其中,信息采集能力主要提供災(zāi)后救援工作中用于探測感知受災(zāi)人群與受災(zāi)環(huán)境的功能,具體包括溫度感知能力、濕度感知能力、氣壓感知能力、有毒氣體感知能力、生命體征感知能力和三維地物場景感知能力,信息采集模塊一般裝備于無人機動平臺或救援人員,為救援人員深入災(zāi)區(qū)救援提供基礎(chǔ)信息。信息處理能力主要包括在信息采集裝備處信息的處理能力以及在指揮中心信息融合處理的能力,所采集的信息經(jīng)過處理后為應(yīng)急救援決策提供參考。信息傳輸能力體現(xiàn)在通信裝備的性能上,具體包括有效性、可靠性及設(shè)備性能,通信裝備可在戰(zhàn)時為應(yīng)急救援指揮中心傳遞災(zāi)情現(xiàn)場所采集到的信息。輔助保障能力主要包括輔助定位能力等,通過攜帶的定位裝備,為應(yīng)急裝備和救援人員提供輔助手段。機動平臺能力主要體現(xiàn)在應(yīng)急救援中無人機動平臺的性能,主要包括伴隨式無人車性能、自主式無人車性能、微型無人機性能及單兵可穿戴裝備性能,用于災(zāi)情發(fā)生后先于救援人員深入災(zāi)區(qū)探測災(zāi)區(qū)情況。
本文主要采用神經(jīng)網(wǎng)絡(luò)算法實現(xiàn)應(yīng)急通信感知裝備的效能評價。數(shù)據(jù)處理時首先通過主成分分析法將多維樣本數(shù)據(jù)映射到低維空間,通過幾個保留有效信息較多的綜合因子代替樣本各維度樣本數(shù)據(jù),再通過訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)得到最終的應(yīng)急通信感知裝備BP神經(jīng)網(wǎng)絡(luò)評價模型,如圖2所示。
圖2 基于BP神經(jīng)網(wǎng)絡(luò)的評價模型結(jié)構(gòu)流程圖Fig.2 Flow chart of evaluation model structure based on BP neural network
BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)越復(fù)雜,樣本數(shù)據(jù)越多,其精度越高、處理非線性問題的能力越強。通過應(yīng)急通信感知裝備評價數(shù)據(jù)樣本訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)模型,構(gòu)建應(yīng)急通信感知裝備BP神經(jīng)網(wǎng)絡(luò)評價模型。由于三層BP神經(jīng)網(wǎng)絡(luò)模型就具有很好的非線性映射能力,因此隱藏層選擇一層,輸入層輸入為主成分分析法得到的綜合因子,輸出層輸出為應(yīng)急通信感知裝備效能評分。應(yīng)急通信感知裝備的BP神經(jīng)網(wǎng)絡(luò)評價模型結(jié)構(gòu)如圖3所示。
圖3 應(yīng)急通信感知裝備BP神經(jīng)網(wǎng)絡(luò)評價模型結(jié)構(gòu)Fig.3 BP neural network evaluation model structure of emergency communication and sensing equipment
BP神經(jīng)網(wǎng)絡(luò)的隱藏層節(jié)點數(shù)也會對BP神經(jīng)網(wǎng)絡(luò)最終的評價精度造成較大的影響。如果節(jié)點數(shù)過少,則神經(jīng)網(wǎng)絡(luò)很難完成對學(xué)習(xí)樣本的學(xué)習(xí)要求,從而不能準(zhǔn)確評價;節(jié)點數(shù)過多,網(wǎng)絡(luò)又容易造成過擬合現(xiàn)象,導(dǎo)致網(wǎng)絡(luò)泛化能力變差。BP神經(jīng)網(wǎng)絡(luò)的最佳隱藏層節(jié)點數(shù)選擇所下所示:
(1)
式中:為隱藏層節(jié)點數(shù);為輸入層節(jié)點數(shù);為輸出層節(jié)點數(shù);為0~10之間的常數(shù)。隱藏層節(jié)點數(shù)的選擇首先通過式(1)來確定節(jié)點數(shù)的大概范圍,然后通過試湊的方法來確定最佳的節(jié)點數(shù)。
最終模型的性能可以使用均方誤差(mean square error, MSE)衡量。MSE是指參數(shù)估計值與參數(shù)值之差平方的期望值,是衡量誤差的一種較簡單方便的評價方法,可評價數(shù)據(jù)的變化程度,其值越小,說明該評價模型所得到評價值更為精確。
當(dāng)增加新的評價數(shù)據(jù)樣本時,只需在原模型的基礎(chǔ)上進行訓(xùn)練,無需從頭開始訓(xùn)練。隨著應(yīng)急救援效果評估研究的不斷發(fā)展與政策的調(diào)整,本模型可適應(yīng)模型變化。當(dāng)評價指標(biāo)體系中新增一項指標(biāo)時,只需增加一個輸入神經(jīng)元,再進行模型訓(xùn)練即可。而面對相同情況,在傳統(tǒng)的AHP中,需要重新進行專家打分來構(gòu)造判斷矩陣。故相較于傳統(tǒng)的模型,BP神經(jīng)網(wǎng)絡(luò)模型具備更強的適應(yīng)性。
BP神經(jīng)網(wǎng)絡(luò)模型在其多個神經(jīng)元的綜合作用后,使網(wǎng)絡(luò)具有很強的非線性擬合能力,而且BP神經(jīng)網(wǎng)絡(luò)具有很強的理論性并在實際問題中被廣泛應(yīng)用,決定了其在人工神經(jīng)網(wǎng)絡(luò)中具有重要的意義,但是其算法本身仍然存在一些不足。BP神經(jīng)網(wǎng)絡(luò)是一種前饋型的神經(jīng)網(wǎng)絡(luò),其最終實際輸出值取決于網(wǎng)絡(luò)的輸入值和權(quán)重矩陣構(gòu)成的網(wǎng)絡(luò)誤差。BP神經(jīng)網(wǎng)絡(luò)的誤差曲面有以下特點:① 網(wǎng)絡(luò)誤差的全局最小點可能有多個;② 網(wǎng)絡(luò)誤差存在一些平坦的區(qū)域,在此區(qū)域內(nèi)誤差變化量較小,因此神經(jīng)網(wǎng)絡(luò)對此區(qū)域的映射能力有些不足;③ 誤差曲面存在多處局部極小點。
面對局部極小點的問題,可采用結(jié)合PSO算法的方式來解決,PSO算法是進化算法的一種,基本原理是:首先從隨機解出發(fā),通過靠近當(dāng)前搜索到的最優(yōu)解,經(jīng)多次迭代以尋找全局最優(yōu)解。以下是具體解決方法。
首先,對BP神經(jīng)網(wǎng)絡(luò)的全部權(quán)值和閾值進行編碼處理,然后隨機產(chǎn)生一組具有個粒子的粒子群,粒子群中每個粒子代表一個神經(jīng)網(wǎng)絡(luò)的全部初始權(quán)值和閾值分布,每個粒子中的一個維度表示一個神經(jīng)網(wǎng)絡(luò)的一個權(quán)值或者一個閾值,則每個粒子的維度為神經(jīng)網(wǎng)絡(luò)的全體權(quán)值個數(shù)和閾值個數(shù),即
=+++
(2)
式中:為輸入層神經(jīng)元個數(shù);為隱藏層神經(jīng)元個數(shù);為輸出層神經(jīng)元個數(shù)。
粒子數(shù)量對最終優(yōu)化結(jié)果有較大影響。若值太小,則搜索范圍有限,不能很好地對全局尋優(yōu),且粒子多樣性較差,容易“早熟”,過早終止算法。若值太大,則算法復(fù)雜度太高,降低優(yōu)化效率。一般情況下,值取50~100。
誤差函數(shù)可以設(shè)置為實際輸出值與期望值之間的MSE,MSE越小則表示該網(wǎng)絡(luò)性能好。因此,適應(yīng)度函數(shù)可以設(shè)置為
(3)
結(jié)合PSO算法時,首先隨機初始化每個粒子的速度向量=(1,2,…,)和空間位置向量=(1,2,…,),通過每次迭代搜索將產(chǎn)生第個粒子的個體最優(yōu)解=(1,2,…,)和整個粒子群當(dāng)前最優(yōu)解=(1,2,…,)。粒子更新速度和位置的公式如下所示:
(4)
(5)
粒子的速度決定了粒子在空間中的探索能力,最大速度取值即為粒子在每次更新中可能的最大移動距離,取值越大,粒子的搜索能力越強,但容易造成粒子跳過較好的解;取值越小,容易使粒子陷入局部最優(yōu)。通常設(shè)置為位置取值的10%~20%。
慣性因子體現(xiàn)了當(dāng)前粒子的搜索速度對于進化后粒子速度的影響程度,從而控制PSO算法全局和局部搜索的性能。一般情況下,在算法進化前期,主要對全局進行搜索以盡快達到較優(yōu)區(qū)域,取較大的值。算法進化后期主要對較優(yōu)區(qū)域進行搜索以盡快找到最優(yōu)解,此時取較小值。然而在進化后期,粒子逐漸趨于集中,若一直采用較小的慣性因子,容易發(fā)生早熟的現(xiàn)象,無法跳出局部極值。
在此,使用動態(tài)自適應(yīng)慣性權(quán)重以滿足在進化后期粒子相對集中時,粒子群仍具有一定的全局搜索能力,可以對較優(yōu)區(qū)域進行搜索,以避免陷入局部極值。
為描述粒子群的離散程度,將第代粒子群與第-1代粒子群適應(yīng)度的標(biāo)準(zhǔn)差之比定義為進化離散度():
(6)
式中:Std為標(biāo)準(zhǔn)差,F(xiàn)it()為求第代的適應(yīng)度。
聯(lián)合進化離散度()與Sigmoid函數(shù),設(shè)置動態(tài)自適應(yīng)慣性權(quán)重因子為
()=+(-)·()
(7)
(8)
式中:為當(dāng)前迭代次數(shù);為最大迭代次數(shù);和為最大、最小慣性權(quán)重,一般情況下,=09,=04;為阻尼因子,一般取值為[0,1]。
PSO算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的基本流程如圖4所示。
圖4 基于PSO算法的BP神經(jīng)網(wǎng)絡(luò)Fig.4 BP neural network based on PSO algorithm
在應(yīng)急通信感知中,對于環(huán)境溫度的感知尤為重要,關(guān)乎到救援人員的安全以及救援方案的選取。而在實戰(zhàn)中,溫度傳感能力主要由溫度傳感器實現(xiàn)。針對基本應(yīng)急通信感知評價指標(biāo)體系中的溫度感知能力,細化評價指標(biāo)體系,如圖5所示。實例中具體的樣本數(shù)據(jù)由AHP導(dǎo)出。
圖5 溫度感知能力評價指標(biāo)體系Fig.5 Evaluation index system of temperature sensing ability
AHP的基本原理是將位于同一層次的每個要素相較于上一層準(zhǔn)則的相對重要性進行兩兩比較,從而建立起判斷矩陣,然后依據(jù)判斷矩陣計算各要素相較于上一層準(zhǔn)則的相對權(quán)重。而且判斷矩陣建立后需要進行一致性檢驗計算。最后,計算所有最底層要素相對于研究問題的合成權(quán)重,并最終得出所研究問題的計算模型。
構(gòu)建應(yīng)急通信感知裝備效能評價模型時,首先將各項評價指標(biāo)分為1~10共10個等級,對應(yīng)急通信感知裝備的各項指標(biāo)分別進行評分,并將其與通過AHP得到的權(quán)重向量相乘,得到效能評分值,構(gòu)成樣本數(shù)據(jù)。
針對溫度傳感能力的性能指標(biāo)及結(jié)構(gòu)指標(biāo),分別構(gòu)造判斷矩陣后得出各指標(biāo)權(quán)值,如表1和表2所示。設(shè)定性能指標(biāo)權(quán)重為0.65,結(jié)構(gòu)指標(biāo)權(quán)重為0.35。故組合權(quán)重如表2所示。
表1 性能指標(biāo)判斷矩陣Table 1 Matrix of performance index
表2 結(jié)構(gòu)指標(biāo)判斷矩陣Table 2 Judgment matrix of structural index
隨機抽取30種不同的溫度傳感器,由專家對其評分,將評分結(jié)果組成的分值矩陣,乘以表3中各指標(biāo)的權(quán)值構(gòu)成的權(quán)值矩陣,得到最終的效能分值,結(jié)果如表4所示。
表3 組合權(quán)重Table 3 Combination weight
表4 溫度傳感器指標(biāo)評分情況Table 4 Temperature sensor index score
將上述數(shù)據(jù)通過主成分分析法降維后,可以得到3個綜合因子,并以此作為學(xué)習(xí)樣本集合,從而建立神經(jīng)網(wǎng)絡(luò)評價模型。分析BP神經(jīng)網(wǎng)絡(luò)模型及PSO-BP模型的評價效果間的差異。神經(jīng)網(wǎng)絡(luò)訓(xùn)練時,可采用交叉驗證法,首先將數(shù)據(jù)按層次劃分為10個互斥的子集,以保證每個子集數(shù)據(jù)間差異性較小。訓(xùn)練時,每次任意選擇其中9個子集作為訓(xùn)練集,余下的子集作為測試集。從而可以進行10次網(wǎng)絡(luò)訓(xùn)練與測試,最終返回10次測試的MSE和。
具體仿真條件如下:輸入層神經(jīng)元個數(shù)為3,輸出層神經(jīng)元個數(shù)為1,根據(jù)式(1),隱藏層神經(jīng)元個數(shù)的取值范圍為2~12,建立BP的神經(jīng)網(wǎng)絡(luò)模型,在每個不同的神經(jīng)元個數(shù)取值下,進行10次測試,最終的MSE如表5和圖6所示。
表5 不同隱藏層節(jié)點數(shù)下BP神經(jīng)網(wǎng)絡(luò)的MSETable 5 MSE of BP neural network under different hidden layer nodes
圖6 不同隱藏層節(jié)點數(shù)下BP神經(jīng)網(wǎng)絡(luò)的MSEFig.6 MSE of BP neural network under different hidden layer nodes
經(jīng)過試湊可知隱藏節(jié)點數(shù)取值為5時,MSE最小,故取隱藏層神經(jīng)元個數(shù)為5,學(xué)習(xí)速率取0.05,訓(xùn)練目標(biāo)取0.000 01。PSO-BP模型中,粒子群中粒子個數(shù)為50,粒子維度為=+++=3×5+5×1+5+1=26。由圖7可知,50代之后,MSE減小已不再明顯,綜合考慮結(jié)果精度與時間復(fù)雜度,此實例中迭代次數(shù)選取50即可,個體學(xué)習(xí)因子為2.8,群體學(xué)習(xí)因子為1.3,速度取值范圍是-0.15~0.15。神經(jīng)網(wǎng)絡(luò)中初始權(quán)值閾值均為-1與1之間的隨機數(shù),隱藏層和輸出層神經(jīng)元的傳遞函數(shù)分別為tansig與purelin,網(wǎng)絡(luò)訓(xùn)練采用traingd函數(shù),使用上述兩種模型分別進行10次評價后,模型的評價結(jié)果如表6所示,并將其繪制為圖8的折線圖。
圖7 不同迭代次數(shù)MSEFig.7 MSE of different iteration times
表6 BP神經(jīng)網(wǎng)絡(luò)與PSO-BP神經(jīng)網(wǎng)絡(luò)仿真結(jié)果Table 6 Simulation results of BP neural network and PSO-BP neural network
圖8 BP神經(jīng)網(wǎng)絡(luò)與PSO-BP模型的MSEFig.8 MSE of BP neural network and PSO-BP model
通過圖8可以看出,即使由于權(quán)值與閾值設(shè)置時的隨機性,PSO-BP神經(jīng)網(wǎng)絡(luò)與BP神經(jīng)網(wǎng)絡(luò)得到的結(jié)果均有波動,但PSO-BP神經(jīng)網(wǎng)絡(luò)相比于BP神經(jīng)網(wǎng)絡(luò),均方誤差降低約28.18%,結(jié)果表明,PSO-BP神經(jīng)網(wǎng)絡(luò)評價更準(zhǔn)確。
在此僅以溫度感知能力這一項二級指標(biāo)為例,進行評價。實際面向應(yīng)急通信感知裝備效能評估指標(biāo)體系時,須將體系中所有最底層指標(biāo)的訓(xùn)練數(shù)據(jù)代入輸入層,輸出為相應(yīng)裝備體系的效能評分,以此來訓(xùn)練PSO-BP神經(jīng)網(wǎng)絡(luò),得到最終效能評價模型。
BP神經(jīng)網(wǎng)絡(luò)評價方法是一種基于非線性系統(tǒng)的預(yù)測方法,可以自動提取輸入指標(biāo)數(shù)據(jù)與輸出評價結(jié)果間的“合理規(guī)則”,并自適應(yīng)地將所學(xué)習(xí)內(nèi)容記憶于網(wǎng)絡(luò)的權(quán)值中,還可隨著樣本的增加不斷自適應(yīng)的修改完善效能評價模型,具有高度自學(xué)習(xí)和自適應(yīng)的能力,可用于效能評價問題,但存在局部極小值問題等。本文分析了BP神經(jīng)網(wǎng)絡(luò)及其存在的不足后,采用粒子群算法以解決BP數(shù)據(jù)網(wǎng)絡(luò)中的局部最小值問題。從實際問題的對比分析結(jié)果來看,PSO-BP模型在評價準(zhǔn)確性上優(yōu)于標(biāo)準(zhǔn)BP神經(jīng)網(wǎng)絡(luò)模型,因此,可作為應(yīng)急通信感知裝備評價的一個新的方法。