張瀟藝,王彩霞,田楊萌,楊 輝
(1. 北京信息科技大學(xué),北京100192;2. 南方海洋科學(xué)與工程廣東省實驗室(廣州),廣東 廣州511458;3. 南方科技大學(xué),廣東 深圳518055)
雷電是非常常見的一種氣象災(zāi)害,一般在雨季比較頻發(fā),對人們的生活和生產(chǎn)都有很大的影響[1],被聯(lián)合國有關(guān)部門列為最嚴(yán)重的十種自然災(zāi)害之一,其自身產(chǎn)生的高溫、猛烈的沖擊波以及強(qiáng)烈的電磁輻射等物理效應(yīng),能在瞬間產(chǎn)生巨大的破壞作用,對人身安全、基礎(chǔ)設(shè)施、工業(yè)生產(chǎn)、建筑物、森林生態(tài)、國防事業(yè)等都具有非常大的危害,由此雷電的觀測與監(jiān)測將成為防雷減災(zāi)工作的重要組成部分[2]。由于雷暴發(fā)生時雷電探測網(wǎng)具有多個觀測站且每個站觀測到的電場數(shù)據(jù)量龐大,單靠人工去識別會很難分辨并且耗時較長,也很難做到實時定位。雷電進(jìn)行識別分類后可以根據(jù)得到的不同類型閃電做出相應(yīng)的防護(hù)措施,現(xiàn)有的利用模糊識別技術(shù)[3]對地閃信號和云閃信號進(jìn)行識別,但是適當(dāng)?shù)碾`屬度函數(shù)往往難以建立, 故限制了它的應(yīng)用;還有閔可夫斯基距離法[4],該方法需首先提取多個云閃信號和地閃信號, 將其平均值作為對應(yīng)類型閃電的標(biāo)準(zhǔn)值,但該方法不允許樣品有相當(dāng)程度的干擾,否則會很大程度的影響識別結(jié)果;田茂教授設(shè)計了一種能夠完成幀-幀背景去除算法的閃電識別系統(tǒng)[5],該系統(tǒng)能夠?qū)崿F(xiàn)2.88Gbps焦面數(shù)據(jù)的實時接收與處理, 主要完成高速數(shù)據(jù)流的接收, 背景信號評估、背景信號去除、閾值選擇、閃電信號判斷、閃電強(qiáng)度排序和閃電事件編碼等工作[6]。閃電識別系統(tǒng)最重要的任務(wù)就是從高速的背景信號中檢測出閃電事件[7], 并輸出閃電事件的位置、強(qiáng)度、背景評估值[8]和閾值等信息。但是由于所需設(shè)備過于繁瑣,步驟不夠簡潔,導(dǎo)致識別效率不高;李鵬君[9]采用多層BP網(wǎng)絡(luò)來識別閃電類型的方法,BP網(wǎng)絡(luò)得名于誤差反向傳播算法(Back Propagation Algorithm)[10],該方法從采集到的數(shù)據(jù)中獲得到光電同步數(shù)據(jù),總體識別效果基本能夠達(dá)到要求, 但是由于云間放電過程比較復(fù)雜,采集到的電場信號數(shù)據(jù)少,這在一定程度上影響了識別結(jié)果。
平時看的書、車輛的車牌、股票的走勢圖等各種文字及線條圖形,為了方便計算機(jī)的運(yùn)算和編輯,需要把這些轉(zhuǎn)為計算機(jī)中的字符格式[11],但是傳統(tǒng)的人工識別方法已經(jīng)遠(yuǎn)遠(yuǎn)不能滿足對該圖像的識別的需求,速度慢、人工成本高,這時能夠?qū)ψ詣訉D像進(jìn)行識別的算法是迫切所要得到的。在人工智能技術(shù)不斷發(fā)展的時代背景下,圖像識別作為人工智能的一個重要方面,在各個領(lǐng)域得到了廣泛應(yīng)用[12]。卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN) 是一類包含卷積計算的具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),其核心為卷積層,層參數(shù)由內(nèi)核和濾波器組成。神經(jīng)網(wǎng)絡(luò)CNN算法相對于傳統(tǒng)圖像識別算法和基于區(qū)域的目標(biāo)檢測算法在對于電場波形更為適用,但卷積神經(jīng)網(wǎng)絡(luò)具有多種算法模型,如 AlexNet、MobileNet、ResNet、VG-GNet和GoogleNet等均為CNN的主流算法,這些算法都可針對圖像對象進(jìn)行識別。相比其它算法,CNN算法比較簡潔明了,并且模型訓(xùn)練時間快,該算法的時間開銷很小,預(yù)測效果好,并且對異常值不敏感?;谝陨戏治?提出建立基于深度學(xué)習(xí)算法的圖像識別模型,對于獲取較多的電場波形數(shù)據(jù),選用機(jī)器學(xué)習(xí)CNN算法[13]實現(xiàn)對雷電電場波形的快速識別和分類。
同時為提升模型識別效果,本論文在使用Lenet5模型的基礎(chǔ)上進(jìn)一步研究Resnet模型對雷電電場波形的識別效果。 其次在自然閃電探測方面,對雷電的類型進(jìn)行分類記錄是其中的一個重要內(nèi)容,利用中科院大氣物理研究所雷電探測網(wǎng)2008年夏季在北京清河、懷柔兩個站點的大量原始觀測數(shù)據(jù),在時域波形上統(tǒng)計分析了閃電快電場信號的特點,選取5個特征值作為數(shù)據(jù)集分類的判定標(biāo)準(zhǔn)。另外數(shù)據(jù)集中的圖片大小固定,利用數(shù)據(jù)增強(qiáng)也可以輔助性的提升一部分的圖片性能以使得訓(xùn)練的時候更加穩(wěn)定,更加容易收斂。這將有助于現(xiàn)場實時性數(shù)據(jù)的采集和記錄,并對采集到的圖像數(shù)據(jù)進(jìn)行及時的判斷反饋,以快速獲取雷電定位信息達(dá)到實時定位目的,這對雷電、雷暴過程觀測預(yù)報預(yù)警等具有非常重要的現(xiàn)實意義。
近年來,深度學(xué)習(xí)已成為學(xué)術(shù)研究熱點,其中研究最多的是卷積神經(jīng)網(wǎng)絡(luò)模型,卷積神經(jīng)網(wǎng)絡(luò)是一種監(jiān)督學(xué)習(xí)算法,廣泛應(yīng)用于模式識別領(lǐng)域。一般是將原始信號處理變換成時域圖像、頻域圖像或時頻圖像,然后用卷積神經(jīng)網(wǎng)絡(luò)對這些圖像進(jìn)行分類識別。
卷積神經(jīng)網(wǎng)絡(luò)基本架構(gòu)為Lenet5,模型包括輸入層、隱藏層和輸出層,其基本結(jié)構(gòu)如圖1所示:
圖1 卷積神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)示意圖
1)輸入層:在使用CNN網(wǎng)絡(luò)進(jìn)行圖像識別時,需要將具有寬度、高度、深度的圖片集輸入。在這里深度為圖像存儲每個像素所用位數(shù),輸入圖片大小可以根據(jù)需要進(jìn)行設(shè)置。
2)卷積層:卷積層由若干卷積核組成。卷積核可以提取輸入圖片的不同特征,淺層卷積層只能提取一些低級的特征如角、線型和邊緣等,深層的網(wǎng)絡(luò)可以從低級特征中迭代提取更復(fù)雜的特征。
3)激活層:激活層可通過非線性環(huán)節(jié)來加強(qiáng)模型的擬合能力,突出圖像的特征,有利于實現(xiàn)后續(xù)的特征識別,也有效解決了梯度消失而造成神經(jīng)網(wǎng)絡(luò)的收斂速度過慢的問題。依據(jù)不同的模型選擇不同的激活函數(shù),常見的激活函數(shù)有Sigmond,Tanh,Relu。本文使用Relu做為激活函數(shù),因為Relu函數(shù)可以有效避免梯度消失并加速模型收斂。
4)池化層:在卷積后使用池化操作來降低圖像矩陣的維度,并且保持大部分重要信息。池化有最大值池化(Max Pooling)和平均值池化(Average Pooling)。最大值池化是將圖像平均分割,每個分割塊取最大值;平均值池化則是取每個分割塊的平均值。采用池化并不會影響識別結(jié)果,且可有效保留圖像特征信息,極大提升訓(xùn)練效率。
5)全連接層:全連接層中每個神經(jīng)元與前一層的所有神經(jīng)元進(jìn)行全連接,可以進(jìn)行數(shù)據(jù)降維,并整合卷積層中具有類別區(qū)分性的局部信息起到分類器的作用。
6)目標(biāo)函數(shù)及優(yōu)化函數(shù):本文使用交叉熵?fù)p失函數(shù)做為目標(biāo)函數(shù)使用Adam做為優(yōu)化函數(shù),首先通過不同類型間的概率分布計算出損失值并通過反向傳播求得各節(jié)點梯度。最后通過可動態(tài)調(diào)整學(xué)習(xí)率的Adam函數(shù)對各節(jié)點數(shù)值進(jìn)行優(yōu)化并往復(fù)執(zhí)行此過程直至到達(dá)停止條件。
為提升模型識別效果,本論文在使用Lenet5模型的基礎(chǔ)上進(jìn)一步研究Resnet模型對雷電電場波形的識別效果。Resnet模型[14]它有效解決了堆疊更多網(wǎng)絡(luò)層但不能提升網(wǎng)絡(luò)性能的問題。其利用殘差連接的方式在多層卷積中添加短接,使得網(wǎng)絡(luò)層的整體表現(xiàn)不會因為層數(shù)增加而衰減變差。如圖2所示,x為估計值(也就是上一層Resnet輸出的特征映射),F(x)為殘差映射函數(shù),F(x)+x為觀測值,圖中weight layer代表著卷積操作,一般一個殘差部分包含2-3個卷積操作,將卷積后的特征圖與x相加得到新的特征圖。
圖2 Resnet殘差卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖
在對自然閃電探測方面,對雷電的類型進(jìn)行分類記錄是其中的一個重要內(nèi)容,目前多數(shù)探測網(wǎng)主要是使用閃電電場時域信號的一些特征進(jìn)行分類[15]。本文利用中科院大氣物理研究所雷電探測網(wǎng)2008年夏季在北京清河、懷柔兩個站點的原始觀測數(shù)據(jù),在時域波形上統(tǒng)計分析了閃電快電場信號的特點(如圖3中波形所示)選取5個特征值,即信號持續(xù)時間、到達(dá)峰值(90%極大值)時間、脈沖上升沿(10%~90%極大值)時間和脈沖寬度(半寬)時間,信號上升陡度[16],作為數(shù)據(jù)集分類的判定標(biāo)準(zhǔn)且保證數(shù)據(jù)量充足[17],將電場信號分類如圖3所示,每一類由觀測數(shù)據(jù)制作的樣本如表1所示。在制作數(shù)據(jù)集的時候利用預(yù)處理層對原始數(shù)據(jù)進(jìn)行規(guī)范化處理,數(shù)據(jù)集中的圖片大小固定,圖片尺寸為224×224。另外利用數(shù)據(jù)增強(qiáng)也可以輔助性的提升一部分的圖片性能以使得訓(xùn)練的時候更加穩(wěn)定,更加容易收斂。
表1 自定義數(shù)據(jù)集分類
圖3 電場波形分類展示
另外,制作的數(shù)據(jù)集將其分成三部分:訓(xùn)練集、驗證集和測試集,各個部分的樣本劃分分別如表1所示。
基于最初構(gòu)建的CNN網(wǎng)絡(luò)模型基礎(chǔ)上得到的電場波形識別準(zhǔn)確率僅為40%左右,該準(zhǔn)確率過低。通過對識別錯誤的圖片特征進(jìn)行分析,發(fā)現(xiàn)這可能由于下面的原因造成,其一所采集到的電場數(shù)據(jù)波形因為受到一些外界的干擾,如附近通信信號干擾、高壓電力塔及變電站內(nèi)的電力設(shè)施等干擾,會導(dǎo)致波形產(chǎn)生一定的畸變;另外當(dāng)采集雷電電場波形數(shù)據(jù)的過程中,難以保證閃電的單一性,可能幾個閃電過程會同時發(fā)生,產(chǎn)生疊加效果,這時測得的電場是疊加電場波形,也會造成波形與分類標(biāo)準(zhǔn)波形產(chǎn)生偏差,影響分類準(zhǔn)確率。其二,最初搭建的CNN網(wǎng)絡(luò)模型結(jié)構(gòu)為Lenet5模型,其首先通過卷積層與池化層提取數(shù)據(jù)特征最終經(jīng)過全連接神經(jīng)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)分類,但由于模型結(jié)構(gòu)過于簡單在訓(xùn)練中容易出現(xiàn)過擬合從而無法達(dá)到訓(xùn)練目標(biāo)。
由于最初構(gòu)建的CNN網(wǎng)絡(luò)模型在電場波形識別研究中識別準(zhǔn)確率過低,故這里考慮對網(wǎng)絡(luò)模型進(jìn)行優(yōu)化以提高識別率,最終選用結(jié)構(gòu)更為復(fù)雜的Resnet殘差卷積神經(jīng)網(wǎng)絡(luò)作為網(wǎng)絡(luò)模型。為提高模型識別準(zhǔn)確率與模型泛化能力,分別從數(shù)據(jù)集優(yōu)化與模型訓(xùn)練兩個方面對模型識別結(jié)果進(jìn)行提升。
數(shù)據(jù)集優(yōu)化部分首先擴(kuò)充雷電數(shù)據(jù)集,獲取更多精準(zhǔn)雷電電場波形數(shù)據(jù),接著對已有數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化(Normalize)操作,然后對已有數(shù)據(jù)進(jìn)行隨機(jī)剪裁(RandomRotation)操作。其中擴(kuò)充雷電數(shù)據(jù)集可以增加數(shù)據(jù)多樣性,同時降低波形中的干擾噪聲,提高模型識別準(zhǔn)確率。數(shù)據(jù)標(biāo)準(zhǔn)化其作用是將數(shù)據(jù)按比例縮放使之標(biāo)準(zhǔn)化到一個小的特定區(qū)間,從而縮短訓(xùn)練所需時間并提升模型準(zhǔn)確率。旋轉(zhuǎn)圖片數(shù)據(jù),通過對數(shù)據(jù)的旋轉(zhuǎn)操作有利于提升模型泛化能力。
模型訓(xùn)練優(yōu)化首先通過優(yōu)化批大小(BatchSize)、學(xué)習(xí)率(LearningRate)、添加BatchNorm2d函數(shù)層,添加正則化系數(shù)等操作逐步實現(xiàn)圖像識別率的提升。首先,將訓(xùn)練集中全部樣本訓(xùn)練次數(shù)(epoch)設(shè)置為30,調(diào)整批大小參數(shù)對模型識別結(jié)果進(jìn)行優(yōu)化,如圖4(a)所示,當(dāng)批大小選擇64時模型識別準(zhǔn)確率最高達(dá)到56.82%。其次,調(diào)整學(xué)習(xí)率參數(shù)對模型識別準(zhǔn)確率進(jìn)行優(yōu)化,結(jié)果如圖4(b)所示。當(dāng)學(xué)習(xí)率選擇0.001時模型識別準(zhǔn)確率最高達(dá)到64.77%。再次,對模型添加BatchNorm2d函數(shù)層并對模型識別準(zhǔn)確率進(jìn)行優(yōu)化結(jié)果如圖4(c)所示。通過觀察可以得出增加BatchNorm2d函數(shù)層可提升模型識別準(zhǔn)確率到70.45%。隨后,對模型添加正則化項,優(yōu)化結(jié)果如圖4(d)所示。通過圖4(b)可以發(fā)現(xiàn)當(dāng)epoch=30且加入正則化項后出現(xiàn)了欠擬合,通過實驗發(fā)現(xiàn)當(dāng)epoch提升至50時最高準(zhǔn)確率出現(xiàn)在epoch為38時,即加入正則化項且當(dāng)epoch=38時取得最好成績,其識別準(zhǔn)確率為72.16%。
圖4 模型訓(xùn)練及逐步優(yōu)化結(jié)果對比
最后,引入殘差卷積神經(jīng)網(wǎng)絡(luò)(Resnet)預(yù)訓(xùn)練模型,將模型識別準(zhǔn)確率達(dá)到90.17%,如圖4(e)所示。
由圖4可知隨著模型的逐步調(diào)整及優(yōu)化,模型訓(xùn)練的識別率在逐步提升,由最初的40%左右到90%以上,說明模型優(yōu)化具有必要性且具有很好的提升識別率的效果,提升效果非常明顯,基本能夠達(dá)到專業(yè)方面的實際需求。
本文針對雷電電場波形分類識別問題,搭建了基于機(jī)器學(xué)習(xí)的Resnet卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練檢測模型,并對模型進(jìn)行逐步優(yōu)化使識別率不斷提升,給出了一種識別率較高的卷積神經(jīng)網(wǎng)絡(luò)圖像識別方法。得到的結(jié)論如下:
1)使用機(jī)器學(xué)習(xí)框架搭建Resnet卷積神經(jīng)網(wǎng)絡(luò)模型,通過3200 張來自現(xiàn)場采集的雷電電場波形圖像構(gòu)建數(shù)據(jù)集進(jìn)行訓(xùn)練與測試,并通過多項優(yōu)化,最終該模型識別分類的準(zhǔn)確率可達(dá)到 90.70%,說明該方法可有效用于現(xiàn)場雷電分類識別,有助于實現(xiàn)快速獲取雷電定位信息,達(dá)到實時的定位目的。這將對雷電、雷暴過程觀測預(yù)報預(yù)警等具有非常重要的應(yīng)用價值。
2)將深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)技術(shù)與雷電電場波形分類相結(jié)合,提出針對雷電、雷暴現(xiàn)場監(jiān)測及預(yù)警的前期解決方案。未來此技術(shù)可應(yīng)用于其它雷電現(xiàn)場不安全因素的識別,進(jìn)一步實現(xiàn)雷電安全監(jiān)管的自動化與智能化。
致謝:感謝中科院大氣物理研究所2008年夏季在北京地區(qū)進(jìn)行雷電探測網(wǎng)觀測的所有參與人員及相關(guān)單位和老師。本課題由國家自然科學(xué)基金(41974122,41375012)、南方海洋科學(xué)與工程廣東省實驗室(廣州)人才團(tuán)隊引進(jìn)重大專項(GML2019ZD0203)、深圳市科技計劃資助(項目編號:KQTD20170810111725321)共同資助。