孫中華, 傅正財, 劉亞坤, 陳 堅, 畢曉蕾, 劉 娟
(1.上海交通大學(xué)電力傳輸與功率變換控制教育部重點實驗室,上海 200030;2.中國石化青島安全工程研究院化學(xué)品安全國家重點實驗室,山東 青島 266101)
雷暴云在形成到消亡的過程中,云中電荷聚集和釋放會使得地面電場發(fā)生劇烈變化,因此,可基于地面電場特征開展雷電預(yù)警和雷電防護(hù)研究[1-2]。雷暴個體特征差異明顯,基于傳統(tǒng)電場閾值分析原理的雷電預(yù)警方法存在適應(yīng)性差、命中率低等問題。為提高雷電預(yù)警的準(zhǔn)確度,相關(guān)學(xué)者采用時序差分[3]、快慢抖動分析[4]、集合經(jīng)驗?zāi)B(tài)分解(Ensemble Empirical Mode Decomposition,EEMD)[5]、希爾伯特黃變換(HHT變換)[6]等方法對大氣電場數(shù)據(jù)進(jìn)行處理,也有學(xué)者將地面大氣電場與雷電定位和氣象雷達(dá)資料相結(jié)合[7-8],實現(xiàn)了雷電預(yù)警效果的改善。
雷暴云發(fā)展過程中地面電場特征變化復(fù)雜,基于地面電場觀測數(shù)據(jù)的雷暴云信息提取方法仍需研究。已有學(xué)者應(yīng)用BP神經(jīng)網(wǎng)絡(luò)處理地面電場信息并進(jìn)行雷電預(yù)警[9-11],但存在可用數(shù)據(jù)量少、訓(xùn)練不易開展的問題。深度學(xué)習(xí)方法能在大數(shù)據(jù)中自動學(xué)習(xí),認(rèn)識復(fù)雜樣本的深層次特征信息,已在圖像識別、語音處理等領(lǐng)域展現(xiàn)出了巨大的優(yōu)勢。將深度學(xué)習(xí)算法應(yīng)用在雷暴環(huán)境下地面電場大數(shù)據(jù)研究中是一種有效挖掘雷暴云信息、提高雷電預(yù)警效率的方法。
筆者基于雷暴云的偶極子模型,研究不同天氣情況下地面電場的特征,通過卷積神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練大量地面電場數(shù)據(jù)樣本,提出基于深度學(xué)習(xí)的雷暴云地面電場識別方法和雷電預(yù)警等級劃分方案,討論卷積神經(jīng)網(wǎng)絡(luò)模型在地面電場特征識別和雷暴區(qū)域信息獲取中的應(yīng)用可行性,所建卷積神經(jīng)網(wǎng)絡(luò)模型實現(xiàn)了含噪地面電場的學(xué)習(xí)和識別。
偶極子雷暴云模型下地面電場分析
雷暴云的電荷結(jié)構(gòu)主要有偶極子模型[12]、三極模型[13]、多極模型[14-15]等多種模型,其中,偶極子模型電荷結(jié)構(gòu)明晰、可較好地模擬典型雷暴云電荷特征,并有大量觀測結(jié)果驗證。因此,筆者采用偶極子模型研究雷暴云的地面電場特征。
依據(jù)圖1所示,典型雷暴云電荷結(jié)構(gòu)中正電荷中心QP和負(fù)電荷中心QN距離地面的高度分別為hP和hN,設(shè)定雷暴云電荷中心的垂直投影為(x0,y0)??紤]大地的電場鏡像作用,被監(jiān)測區(qū)域(xi,yi)處的地面電場[16]可由公式(1)計算可得。
(1)
式中,Enoise(xi,yi)表示被監(jiān)測區(qū)域(xi,yi)處的背景噪聲電場。
圖1 雷暴云的偶極子模型Fig.1 Dipole model of thunderstorm cloud
由式(1)可知,當(dāng)Enoise=0時,偶極子模型雷暴云下地面的電場由正、負(fù)電荷中心及其距離地面的高度參數(shù)共同決定,與正電荷中心QP和負(fù)電荷中心QN成線性關(guān)系。以兩組實例化數(shù)據(jù)來觀察荷電參數(shù)對雷暴云下地面電場的影響,得到不同電荷參數(shù)下距雷電云電荷中心地面投影±20 km區(qū)域內(nèi)的地面電場分布,計算結(jié)果見圖2。對比圖2(a)和2(b)可以發(fā)現(xiàn),偶極子雷暴云正負(fù)電荷的高度差越大,雷暴云在地面投影處產(chǎn)生的電場值就越大,其幅值能從-3.8 kV/m變到-17.7 kV/m;地面電場分布中電場陡升區(qū)域的面積則會變小,其半徑從12 km減少至5 km。
基于地面電場觀測的雷電預(yù)警系統(tǒng)多采用少數(shù)觀測點上的測量數(shù)據(jù)進(jìn)行分析和處理,易出現(xiàn)雷暴云空間電場分布特征部分丟失的問題,并存在由背景電場干擾引起的虛報和漏報的現(xiàn)象。提高雷電預(yù)警的效果需要全面獲取整個監(jiān)測區(qū)域內(nèi)的電場信息及其特征,因此,所提深度學(xué)習(xí)算法基于整片監(jiān)測區(qū)域內(nèi)的電場數(shù)據(jù)樣本開展訓(xùn)練。
考慮如圖3所示的被監(jiān)測區(qū)域,圖3中不規(guī)則圖形表示需要雷電監(jiān)測預(yù)警的區(qū)域,如油庫、化工廠等。采用二維幾何逼近方法將所監(jiān)測區(qū)域規(guī)則化為圖3所示的正方形虛框,其尺寸為6 km×6 km,依據(jù)0.5 km的水平距離將其劃分網(wǎng)格,得到13×13的子監(jiān)測區(qū)域,并將各子監(jiān)測區(qū)域的電場進(jìn)行矩陣數(shù)組處理。依據(jù)與被監(jiān)測區(qū)域中心(原點O)的距離,將雷暴云判斷目標(biāo)區(qū)域劃分為R0=5 km和R1=10 km、R2=20 km 3個等級,分別命名O~R0、R0~R1和R1~R2為A1、A2、A3。
圖3 電場監(jiān)測區(qū)域示意圖Fig.3 Schematic diagram of the electric field monitoring areas
根據(jù)已有學(xué)者研究得到的晴天地面大氣電場特征及其變化規(guī)律[17-18],本研究選取陸地晴天情況下大氣電場的典型值19~310 V/m作為晴天地面電場的參考值。不同地區(qū)陰雨天情況下地面電場的變化范圍較大[19-21],受積雨云下部負(fù)電荷影響,陰雨天情況下地面電場多呈現(xiàn)負(fù)值,可選取0至-3 kV/m作為陰雨天地面電場的參考值。此外,地面電場會受到周圍建筑物等環(huán)境的影響,可采用偏移倍率0~0.4進(jìn)行修正[22-23]。依據(jù)不同天氣情況下地面電場的峰值范圍,整片被監(jiān)測區(qū)域某時刻t的電場均值可由式(2)確定,其中被監(jiān)測區(qū)域各地點的電場值由式(3)確定。在實際環(huán)境中,若存在大功率的電力設(shè)備等,會出現(xiàn)局部地面電場的畸變現(xiàn)象,此特殊情況下,電場畸變偏移范圍可以2~3 kV/m示例。綜上,模擬晴天、陰雨天和特殊情況下被監(jiān)測區(qū)域某一時刻t的背景電場見圖4(a)、(c)和(e)。
Et=rand(Emin,Emax)
(2)
式中,Et表示t時刻被監(jiān)測區(qū)域的電場均值,Emin表示地面電場的最小值,Emax表示地面電場的最大值。
Et(xi,yj)=E(t)·(rand(0,0.4)+1)
(3)
式中,Et(xi,yj)表示t時刻位置(xi,yj)的電場。
其后,對不同情況下地面電場數(shù)據(jù)進(jìn)行歸一化處理,在數(shù)據(jù)歸一化處理過程中,雷暴云下被監(jiān)測區(qū)域的電場數(shù)值分布范圍大,電場數(shù)據(jù)離散性強(qiáng),因而,對每個模擬背景電場樣本進(jìn)行獨立的歸一化處理,處理方法如式(4)所示。同時,對電場樣本進(jìn)行了可視化處理,將被監(jiān)測區(qū)域的電場信息轉(zhuǎn)化為規(guī)格為13×13、色彩取值范圍為0~255的二維灰度圖,見圖4(b)、(d)和(f)。
(4)
式中,Et,s表示被監(jiān)測區(qū)域的位置(xi,yi)處的地面電場,Et,s表示t時刻被監(jiān)測區(qū)域的第s個樣本數(shù)組。
圖4 不同情況下地面電場及其二維灰度圖Fig.4 Electric fields in different conditions and the associated 2-D grey images
研究設(shè)定(QP,QN,hP,hN,x0,y0)的取值范圍對應(yīng)為(30~60 C, -30~60 C, 8~15 km, 1~7 km, 0 km2≤x02+y02≤202km2),隨機(jī)雷暴云相關(guān)參數(shù),計算得到不同雷暴云參數(shù)下被監(jiān)測區(qū)域的地面電場訓(xùn)練樣本。根據(jù)式(1)將雷暴云參數(shù)分別實例化為例1(50, -49, 15, 7, 2,3)、例2(30, -32, 10, 2, -7, 7)、例3(40, -38, 8, 4, 15, 10),得到不同雷暴云參數(shù)實例化下被監(jiān)測區(qū)域的地面電場分布,見圖5。
圖5 隨機(jī)雷暴云參數(shù)實例在被監(jiān)測區(qū)域的地面電場及其二維灰度圖Fig.5 Ground electric field of monitored areas in randomly selected thunderstorm cloud examples and the associated 2-D grey images
在圖5中,參數(shù)實例1、參數(shù)實例2和參數(shù)實例3分別對應(yīng)雷暴云位于圖3所示區(qū)域A1、A2、A3的情形,其中,參數(shù)實例1的雷暴云地面電場考慮了陰雨天的環(huán)境影響,參數(shù)實例2的雷暴云地面電場考慮了陰雨天和特殊背景的環(huán)境影響,參數(shù)實例3考慮了晴天的環(huán)境影響。分析圖(5)可以發(fā)現(xiàn),雷暴云位于不同區(qū)域時被監(jiān)測區(qū)域的地面電場差別明顯,在A1區(qū)域時,被監(jiān)測區(qū)域的地面電場在偶極子下部負(fù)電荷的影響下整體呈現(xiàn)負(fù)值,電場變化的梯度較大;在A2區(qū)域時,雷暴云與被監(jiān)測區(qū)域的距離增大,被監(jiān)測區(qū)域的地面電場值整體逐漸減小,甚至個別位置出現(xiàn)電場極性反轉(zhuǎn)的現(xiàn)象;在A3區(qū)域時,雷暴云與被監(jiān)測區(qū)域距離進(jìn)一步增大,地面電場受偶極子上部正電荷的影響逐漸增強(qiáng),被監(jiān)測區(qū)域的地面電場呈現(xiàn)正值。在地面電場二維灰度圖中,雷暴云在被監(jiān)測區(qū)域產(chǎn)生的地面電場可視化圖像出現(xiàn)白→黑均勻過渡現(xiàn)象,與圖4所示不同情況下地面電場相比,表現(xiàn)出了明顯的灰度過渡特征。
研究設(shè)計了基于不同情況下地面電場樣本的約束隨機(jī)生成算法,產(chǎn)生包含不同情況下地面電場的隨機(jī)綜合訓(xùn)練樣本,總樣本量為30 000個地面電場矩陣組。對于雷暴云訓(xùn)練樣本,首先隨機(jī)初始化雷暴云參數(shù),同時疊加隨機(jī)的晴天或陰雨天背景電場,并變隨機(jī)概率耦合特殊背景電場,從而得到雷暴云下被監(jiān)測區(qū)域的地面電場樣本集。對于晴天或陰雨天的訓(xùn)練樣本,以變隨機(jī)概率模式疊加特殊背景電場,得到晴天或陰雨天下被監(jiān)測區(qū)域的地面電場樣本集。在總樣本量的雷暴云所處區(qū)域考慮中,根據(jù)雷暴云與被監(jiān)測區(qū)域中心的距離(如圖3所示劃分區(qū)域),在各區(qū)域內(nèi)(A1,A2,A3)共隨機(jī)生成了15 000個考慮特殊背景電場存在情況下的雷暴云下被監(jiān)測區(qū)域的地面電場樣本、7 500個考慮特殊背景電場存在情況下的晴天地面電場樣本和7 500個考慮特殊背景電場存在情況下的陰天地面樣本。
卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一種前饋型的神經(jīng)網(wǎng)絡(luò),卷積層提取數(shù)據(jù)特征,池化層完成數(shù)據(jù)局部子抽樣,具有可高效濾除無關(guān)信息和關(guān)聯(lián)識別局部數(shù)據(jù)的優(yōu)點。依據(jù)本研究對象特點,所處理的數(shù)據(jù)為大量地面電場矩陣組,并需考慮局部電場數(shù)據(jù)的空間梯度關(guān)系,適合用卷積神經(jīng)網(wǎng)絡(luò)處理識別。
依據(jù)前述對不同情況下地面電場的特征分析,分類處理樣本,將不包含雷暴云信息的晴天和陰雨天的地面電場樣本(即對立樣本)的標(biāo)簽設(shè)為0,將包含背景噪聲的A1、A2、A3區(qū)域內(nèi)的雷暴云下被監(jiān)測區(qū)域的地面電場樣本的標(biāo)簽分別設(shè)為1、2、3。其后,建立基于LeNet模型[24]的CNN網(wǎng)絡(luò)訓(xùn)練結(jié)構(gòu),見圖6。在圖6中,C1由32個不同的2×2的卷積核和2×2的最大池化組成,C2由64個不同的2×2的卷積核和2×2的最大池化組成,C3由64個不同的2×2的卷積核組成,這3層主要用來對電場數(shù)據(jù)的特征進(jìn)行提取。在分類時,利用flatten層完成卷積數(shù)據(jù)的一維數(shù)組轉(zhuǎn)化,再對其進(jìn)行兩個全連接層處理。其中,隱藏層D1含有64個神經(jīng)元,D2由softmax函數(shù)激活且完成含4個輸出的樣本分類識別。卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的損失函數(shù)選擇分類交叉熵,采用RMSProp優(yōu)化算法更新網(wǎng)絡(luò)的權(quán)重。
圖6 CNN網(wǎng)絡(luò)結(jié)構(gòu)Fig.6 The network structure of CNN
以位于A1區(qū)的雷暴云下被監(jiān)測區(qū)域的地面電場樣本數(shù)據(jù)為例,將其輸入到所建卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行訓(xùn)練,得到C1卷積核的2通道和32通道的特征見圖7,從圖7中可以發(fā)現(xiàn),2通道主要對中心區(qū)域的數(shù)據(jù)特征進(jìn)行提取,32通道主要對邊緣及4個邊角上的數(shù)據(jù)特征進(jìn)行提取。
圖7 訓(xùn)練模型中間層的可視化Fig.7 Visualization of the middle layer in training model
本研究訓(xùn)練的樣本由27 000個地面電場矩陣組組成,包含了A1、A2、A3區(qū)的雷暴云下被監(jiān)測區(qū)域的地面電場樣本各4 500個,晴天和陰雨天的背景電場樣本各6 750個。驗證數(shù)據(jù)集由3 000個地面電場矩陣組樣本組成,其中,A1、A2、A3區(qū)的雷暴云樣本各500個,晴天和陰雨天的背景電場樣本各750個。圖8和圖9分別是訓(xùn)練集的損失值下降曲線和驗證集的準(zhǔn)確率。依據(jù)圖8可以發(fā)現(xiàn),訓(xùn)練次數(shù)達(dá)到180次左右時,訓(xùn)練集的損失值下降減緩,對應(yīng)的驗證集準(zhǔn)確率也達(dá)到相對穩(wěn)定的位置,穩(wěn)定值高于93%,表明所提CNN方法能夠較好地區(qū)分背景地面電場樣本與雷暴云下地面電場樣本。
在分類識別中,采用精確率Precision和召回率Recall作為檢驗指標(biāo),其計算方法如式(5)和式(6)所示。
Precision=TP/(TP+FP)
(5)
Recall=TP/(TP+FN)
(6)
式中,TP表示預(yù)測為正、實際為正的樣本,F(xiàn)P表示預(yù)測為正、實際為負(fù)的樣本,F(xiàn)N表示預(yù)測為負(fù)、實際為正的樣本。
圖8 訓(xùn)練集損失值Fig.8 Loss of the training set
圖9 驗證集準(zhǔn)確率Fig.9 Accuracy of the validation set
驗證后所得的混淆矩陣見表1,計算得到各類別的精確率和召回率見表2。在表2中,類別0表示非雷暴云樣本(即環(huán)境樣本)的精確率和召回率分別是98.47%和96.73%,各個區(qū)域地面電場樣本識別的精確率分別為98.20%、90.20%和77.80%,表明所提CNN方法可準(zhǔn)確地區(qū)分雷暴云與非雷暴云下的地面電場樣本并進(jìn)行區(qū)域分類。分析混淆矩陣可見,500個類別1的樣本中有491個樣本被正確識別,識別錯誤的9個樣本處于A1與A2的交界處。23個類別0的樣本被誤識別為類別3,50個類別3的樣本被識別為類別0,這些誤判主要是受到陰雨天背景電場的影響。
表1 驗證集的混淆矩陣Table 1 Confusion matrix of the validation set
表2 驗證集的精確率和召回率Table 2 Precision rate and recall rate of the validation set %
根據(jù)雷暴云與監(jiān)測區(qū)域中心之間的距離范圍劃分雷電預(yù)警等級,將A1、A2和A3區(qū)域內(nèi)識別出的雷暴信息分別劃分為第一、二和三級的雷電預(yù)警等級。采用探測概率(Percent of Doom,POD)、虛警率(False Alarm Rate,FAR)和臨界成功指數(shù)(Critical Success Index,CSI) 評價雷電預(yù)警效率,其計算公式見式(7)-(9)。
(7)
(8)
(9)
式中,X為實際發(fā)生閃電并準(zhǔn)確預(yù)警的次數(shù);Y為實際發(fā)生閃電而未預(yù)警的次數(shù);Z為預(yù)警而無閃電發(fā)生的次數(shù)。
依據(jù)本研究劃分的雷電預(yù)警方法,得到基于CNN地面電場識別結(jié)果的雷電預(yù)警效率評價指標(biāo)分別為POD=88.73%,F(xiàn)AR=8.21%,CSI=87.39%。對比已有文獻(xiàn)中基于電場絕對值判定的雷電預(yù)警方法,得到如表3所示的不同閾值下預(yù)警效率的評價指標(biāo)。依據(jù)表3可得,電場閾值越低,POD就越大,但對應(yīng)的FAR就會增大。權(quán)衡POD和FAR結(jié)果,以CSI指標(biāo)的最大值來選取閾值,得到表3中4 kV/m電場閾值對應(yīng)的POD、FAR和CSI分別為64.00%、4.48%和62.11%。與CNN方法相比,本研究所提方法對地面電場樣本的識別更精準(zhǔn)。
表3 驗證集在不同閾值下的預(yù)警效率Table 3 Warning efficiency of the validation set under different thresholds %
圖10中,在t1時刻雷暴云剛進(jìn)入預(yù)警范圍,此時判定被監(jiān)測區(qū)域施行第三級預(yù)警;在t2時刻,雷暴云進(jìn)入A2區(qū)域,判定被監(jiān)測區(qū)域施行第二級預(yù)警;在t3時刻,雷暴云進(jìn)入A1區(qū)域的邊界,判定被監(jiān)測區(qū)域施行第一級預(yù)警。
筆者研究了基于偶極子電荷結(jié)構(gòu)模型下雷暴云的地面電場特征,訓(xùn)練了27 000個隨機(jī)的地面電場樣本,建立了可識別地面電場的CNN網(wǎng)絡(luò)結(jié)構(gòu),對各類地面電場樣本進(jìn)行了區(qū)分識別,得到:
1)所提CNN方法區(qū)分各類地面電場樣本的整體準(zhǔn)確率高于93%,區(qū)分雷暴云和非雷暴云樣本的精確率和召回率分別為98.47%和96.73%。
2)基于CNN識別的雷電預(yù)警探測概率POD、虛警率FAR、臨界成功指數(shù)CSI分別可達(dá)88.73%、8.21%和87.39%。
3)所提方法對雷暴云所處區(qū)域識別的精確率分別為98.20%、90.20%和77.80%,召回率均高于85%,據(jù)此可劃分雷電預(yù)警等級,為局部區(qū)域的雷電預(yù)警提供參考。