周少輝 蔣海昆 李 健 曲均浩
鄭晨晨1) 李亞軍1) 張志慧1) 郭宗斌1)
隨著社會(huì)經(jīng)濟(jì)的快速發(fā)展,近年來各種組合爆破、礦區(qū)塌陷以及地質(zhì)災(zāi)害等非天然地震事件的記錄逐漸增多,僅2018年就發(fā)生多次造成重大人員傷亡和財(cái)產(chǎn)損失的非天然地震事件,如山東鄆城龍鄆煤礦 “10·20”沖擊地壓事件、金沙江兩岸滑坡致堰塞湖事件等。與此同時(shí),隨著中國數(shù)字地震觀測系統(tǒng)技術(shù)的高速發(fā)展,臺(tái)站密度逐漸增大,地震監(jiān)測能力明顯提高,除能夠監(jiān)測各類天然地震事件外,也能夠有效捕獲到更多各類震動(dòng)事件的信號(hào)。然而一直以來,各類事件發(fā)生后的快速識(shí)別主要是靠監(jiān)測速報(bào)人員根據(jù)自身經(jīng)驗(yàn)判定,并沒有普適的事件類型判據(jù),故曾多次出現(xiàn)天然地震與非天然地震識(shí)別困難的情況,如2015年山東平邑ML3.9石膏礦塌陷事件等。為了在震后第一時(shí)間向政府和社會(huì)提供準(zhǔn)確的信息并平息不必要的社會(huì)恐慌,有必要探尋震后快速識(shí)別各類事件的方法。
近年來,許多學(xué)者對天然與非天然地震的識(shí)別分類方法開展了相關(guān)研究,例如運(yùn)用多變量統(tǒng)計(jì)分析、BP神經(jīng)網(wǎng)絡(luò)、v-SVC算法、逐步代價(jià)最小決策法等識(shí)別地震和工業(yè)爆破(邊銀菊等,2002; Fahetal.,2002; 黃漢明等,2010; 張博,2013; 王軍,2018),采用可視化方法來識(shí)別地震與人工爆破(田野,2015),利用卷積神經(jīng)網(wǎng)絡(luò)通過對梅爾頻率倒譜圖的學(xué)習(xí)識(shí)別地震與爆破(陳潤航等,2019)等。
以上研究各有特色,均取得了良好效果。但由于問題本身的復(fù)雜性,以上研究并未將事件記錄的全部信息直接用于事件判定,而是首先從事件記錄中提取某些特征,即對數(shù)據(jù)進(jìn)行了降維處理,這不但增加了處理過程的復(fù)雜性,且損失了大量的原始信息,易陷入局部最優(yōu)的情形。同時(shí),以上研究找尋出的識(shí)別判據(jù)往往需要確定事件的時(shí)空等基本參數(shù)后才能進(jìn)一步通過計(jì)算求得,響應(yīng)及時(shí)性不高。因此,為盡可能縮短事件發(fā)生到確認(rèn)事件類型所需的時(shí)間,有必要從事件記錄的全部信息中直接提取可識(shí)別天然地震與非天然地震事件的特征,系統(tǒng)研究天然地震與非天然地震之間具有普適特點(diǎn)的識(shí)別標(biāo)準(zhǔn),并將其實(shí)用化,為實(shí)際地震速報(bào)工作提供技術(shù)支撐。
目前,深度學(xué)習(xí)在圖像識(shí)別、語音檢測、機(jī)器翻譯、自動(dòng)駕駛等領(lǐng)域均取得了較好的應(yīng)用效果。對于圖像信號(hào)分類判定,深度學(xué)習(xí)可直接對圖像記錄所包含的全部組合信息進(jìn)行學(xué)習(xí),信息量更足,且比人工提取的單一特征更接近實(shí)際(孫志軍等,2012; Moyano,2017; 孫瑜陽,2018)。三通道的測震連續(xù)波形數(shù)據(jù)在數(shù)據(jù)量和數(shù)據(jù)特征上與圖像數(shù)據(jù)有一定的相似性; 同時(shí),國內(nèi)外已有部分學(xué)者率先將深度學(xué)習(xí)方法應(yīng)用于直接從原始地震波形中提取震相特征以識(shí)別地震信號(hào)(Peroletal.,2018; Rossetal.,2018; 賈佳等,2019; 趙明等,2019)。蔣一然等(2019)利用深度學(xué)習(xí)技術(shù)設(shè)計(jì)出2種分類器,并實(shí)現(xiàn)了地震P波、S波震相與到時(shí)的精確識(shí)別拾取。以上研究表明,利用深度學(xué)習(xí)識(shí)別非天然事件具有可行性。
為快速高效識(shí)別天然與非天然地震事件,本文在前人研究的基礎(chǔ)上應(yīng)用深度學(xué)習(xí)技術(shù),嘗試使用可自動(dòng)提取并可組合底層特征的卷積神經(jīng)網(wǎng)絡(luò)模型(付超等,2018)實(shí)現(xiàn)對事件原始波形記錄的學(xué)習(xí)。研究中,選取記錄質(zhì)量較高、未被噪聲淹沒的包含事件記錄全部信息的地震波形作為模型訓(xùn)練與測試的輸入數(shù)據(jù)進(jìn)行深度學(xué)習(xí)訓(xùn)練,而非預(yù)先提取若干判據(jù)或部分?jǐn)?shù)據(jù)進(jìn)行降維使用。之后,使用訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)建立識(shí)別天然地震與爆破、塌陷事件類型的分類器,并對其進(jìn)行以單個(gè)事件為單元的事件類型判定測試,全面評(píng)估卷積神經(jīng)網(wǎng)絡(luò)在事件類型判定識(shí)別中的實(shí)際效果,為事件類型的自動(dòng)識(shí)別提供相關(guān)參考。
卷積神經(jīng)網(wǎng)絡(luò)是人工神經(jīng)網(wǎng)絡(luò)的延伸與發(fā)展,其通過反向傳播算法訓(xùn)練網(wǎng)絡(luò)中各個(gè)參數(shù)的權(quán)重,進(jìn)而實(shí)現(xiàn)對原始數(shù)據(jù)的深度學(xué)習(xí)并獲取其普適特征(陳超等,2019)。卷積神經(jīng)網(wǎng)絡(luò)除具有容錯(cuò)性較好、自適應(yīng)性與自學(xué)能力較強(qiáng)等傳統(tǒng)神經(jīng)網(wǎng)絡(luò)所具備的優(yōu)點(diǎn)外,其自身具有可將圖像直接作為網(wǎng)絡(luò)輸入、可自動(dòng)識(shí)別圖像特征、參數(shù)估計(jì)數(shù)量較少、采用權(quán)值共享網(wǎng)絡(luò)結(jié)構(gòu)以降低模型復(fù)雜度等優(yōu)勢,使得其識(shí)別圖像的效率和準(zhǔn)確度均非常高。
卷積神經(jīng)網(wǎng)絡(luò)的主要模型結(jié)構(gòu)由卷積層、降采樣層(也稱池化層、下采樣層)與全連接層構(gòu)成。在卷積層中,主要使用可學(xué)習(xí)的卷積核與上一層輸出的特征圖進(jìn)行卷積運(yùn)算,然后通過激活函數(shù)傳遞給下一層。卷積層中各輸出特征圖可通過式(1)計(jì)算:
(1)
在降采樣層中實(shí)現(xiàn)對輸入特征圖的降采樣操作,以減少網(wǎng)絡(luò)需要學(xué)習(xí)的參數(shù)量且需同時(shí)保證保留有用的圖片特征信息。一般而言,常用的降采樣方法主要有最大池化法(取局部接受域中值最大的點(diǎn))、均值池化法(取局部接受域中的所有值的均值)和隨機(jī)池化法(隨機(jī)選取局部接受域中的某一值)等。降采樣層中各輸出特征圖可通過式(2)計(jì)算:
(2)
其中,down為降采樣函數(shù),每一輸出特征圖均對應(yīng)一個(gè)b與權(quán)重系數(shù)β。
全連接層位于網(wǎng)絡(luò)結(jié)構(gòu)的尾端,實(shí)現(xiàn)對前面逐層變換與映射提取特征的回歸分類處理; 每個(gè)神經(jīng)元通過一組權(quán)值被連接到上一層特征面的局部區(qū)域,隨后對該局部區(qū)域進(jìn)行加權(quán)并傳遞給激活函數(shù)即可獲得相應(yīng)輸出,現(xiàn)有研究往往采用softmax函數(shù)提供分類輸出功能。
目前性能較好的主流卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)主要有LeNet-5(LeCunetal.,1998,2014)、AlexNet(Krizhevskyetal.,2012)、VGG(Simonyanetal.,2014)和GoogLeNet(Szegedyetal.,2015)等。其中,早期研發(fā)的LeNet-5結(jié)構(gòu)雖然在手寫字符識(shí)別領(lǐng)域取得了巨大成功,但其所需訓(xùn)練集規(guī)模較大,且存在過擬合以及對計(jì)算機(jī)硬件要求高等問題,并不適用于理論研究過程中的圖片識(shí)別。因此,本文采用AlexNet、VGG和GoogLeNet 3種結(jié)構(gòu)進(jìn)行訓(xùn)練測試對比。
1.1.1 AlexNet卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)模型
Krizhevsky等(2012)提出的AlexNet卷積網(wǎng)絡(luò)結(jié)構(gòu)主體包含8個(gè)學(xué)習(xí)層、5個(gè)卷積層和3個(gè)全連接層,共包含約65萬個(gè)神經(jīng)元以及6i000萬個(gè)可訓(xùn)練參數(shù)。同時(shí),為實(shí)現(xiàn)訓(xùn)練更深的網(wǎng)絡(luò),其采用RELU函數(shù)作為激活函數(shù),以此避免在訓(xùn)練過程中當(dāng)輸入的x過大或過小時(shí)函數(shù)輸出趨于飽和(即非常接近1或-1)的問題; 同時(shí),由于RELU函數(shù)屬于非線性的非飽和函數(shù),這種扭曲線性函數(shù)不但保留了非線性的表達(dá)能力,而且由于其具有線性性質(zhì),能夠有效避免斜率過小導(dǎo)致的收斂速度慢等問題,提高了訓(xùn)練速度。此外,為防止加深網(wǎng)絡(luò)時(shí)引起過擬合現(xiàn)象,在訓(xùn)練過程中采用Dropout技術(shù)將中間層的某些神經(jīng)元隨機(jī)置為0(即刪除某些神經(jīng)元),使模型更具有穩(wěn)健性,進(jìn)而減少過擬合及陷入局部最優(yōu)的問題,保證卷積神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力和泛化性能。
在該方法中,圖像特征的提取與分類通過訓(xùn)練一個(gè)端對端的卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn),且采用Dropout技術(shù)解決網(wǎng)絡(luò)在訓(xùn)練過程中的過擬合以及陷入局部最優(yōu)的問題。值得注意的是,Dropout技術(shù)需在圖像處理過程中不斷增加訓(xùn)練集樣本,大量實(shí)驗(yàn)證明,l20萬個(gè)訓(xùn)練樣本才足以成功訓(xùn)練一個(gè)網(wǎng)絡(luò),這顯然對計(jì)算機(jī)硬件要求很高,故AlexNet卷積網(wǎng)絡(luò)結(jié)構(gòu)采用多GPU并行訓(xùn)練的方法將網(wǎng)絡(luò)分布在2個(gè)GPU上,即每個(gè)GPU中放置一半核(或神經(jīng)元)。這種結(jié)構(gòu)使模型的訓(xùn)練速度提升了幾倍,大大減少了訓(xùn)練時(shí)間,提高了圖像識(shí)別的效率。
1.1.2 VGG卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)模型
增加網(wǎng)絡(luò)結(jié)構(gòu)的深度能夠有效提升圖像分類的準(zhǔn)確率(Bengioetal.,2013),理論上深度網(wǎng)絡(luò)結(jié)構(gòu)不僅可以促進(jìn)特征的重復(fù)利用,同時(shí)也能夠獲取高層表達(dá)中更抽象的特征。Simonyan等(2014)在AlexNet的基礎(chǔ)上進(jìn)一步開發(fā)出一種全新的網(wǎng)絡(luò)結(jié)構(gòu)模型——VGG,該模型主要通過在現(xiàn)有的網(wǎng)絡(luò)結(jié)構(gòu)中不斷增加具有3×3卷積核的卷積層以增加網(wǎng)絡(luò)的深度。大量實(shí)驗(yàn)表明,VGG模型的網(wǎng)絡(luò)層數(shù)為16~19層時(shí)(即VGG16~VGG19網(wǎng)絡(luò)結(jié)構(gòu)模型)模型的性能最優(yōu)。
VGG模型的結(jié)構(gòu)非常簡潔,其使用連續(xù)的幾個(gè)3×3卷積核代替AlexNet中一個(gè)具有較大卷積核的卷積層。顯然,對于給定的輸入圖片,使用更小的卷積核多次掃描圖片以組合特征的性能遠(yuǎn)遠(yuǎn)優(yōu)于單純使用一個(gè)大卷積核。因此,VGG模型不僅可減少參數(shù)的數(shù)量,且能夠使決策函數(shù)更具判別性,在一定程度上提升了神經(jīng)網(wǎng)絡(luò)的效果。但由于VGG模型的深度較深,網(wǎng)絡(luò)結(jié)構(gòu)也較為復(fù)雜,因此,在訓(xùn)練過程中需耗費(fèi)更多的計(jì)算資源,訓(xùn)練時(shí)間長,并且不能無限制地加深網(wǎng)絡(luò),因?yàn)樵诰W(wǎng)絡(luò)加深到一定層數(shù)之后就會(huì)出現(xiàn)訓(xùn)練效果退化、梯度消逝或梯度爆炸等問題。
1.1.3 GoogLeNet卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)模型
AlexNet、VGG等結(jié)構(gòu)往往通過增大網(wǎng)絡(luò)結(jié)構(gòu)的深度以獲取最佳訓(xùn)練效果,但一味地增加深度也會(huì)帶來很多負(fù)面作用。因此,Szegedy等(2015)提出從其他角度來提升訓(xùn)練效果,即高效利用計(jì)算資源,基于相同的計(jì)算量提取出更多特征,進(jìn)而提升訓(xùn)練效果。
為提取更多的圖片特征,GoogLeNet卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)分別采用1×1、3×3、5×5i3種不同類型的卷積核,首先找尋圖像的最優(yōu)局部稀疏結(jié)構(gòu),隨后通過增加網(wǎng)絡(luò)的寬度和深度,最終實(shí)現(xiàn)在保持計(jì)算量基本不變的前提下提取更多特性,進(jìn)而提升訓(xùn)練效果。同時(shí),為了優(yōu)化網(wǎng)絡(luò)質(zhì)量,采用Hebbian原理和多尺度處理,該結(jié)構(gòu)大大提升了計(jì)算資源的利用率。但該結(jié)構(gòu)的網(wǎng)絡(luò)結(jié)構(gòu)比較復(fù)雜,對硬件要求較高,訓(xùn)練時(shí)間長。
快速高效識(shí)別天然地震和爆破、塌陷事件的分類器主要由2個(gè)模塊組成: 基于單個(gè)事件的單個(gè)臺(tái)站波形記錄的訓(xùn)練模塊和基于單個(gè)事件的多個(gè)臺(tái)站波形記錄的測試模塊。
圖1 基于單個(gè)事件的單個(gè)臺(tái)站波形記錄的訓(xùn)練模塊圖Fig. 1 Training block of a single station waveform record based on a single event.
圖1 為基于單個(gè)事件的單個(gè)臺(tái)站波形記錄的訓(xùn)練模塊圖,訓(xùn)練模塊的核心步驟主要包括:
(1)從研究數(shù)據(jù)中以單個(gè)事件的單個(gè)臺(tái)站記錄波形為基本單位截取波形,且提取其中記錄較好、特征明顯的有效波形,進(jìn)而形成訓(xùn)練波形。
(2)對訓(xùn)練波形添加相應(yīng)的事件類型標(biāo)簽。
(3)對各類型事件波形按8︰2的比例隨機(jī)分為訓(xùn)練集與測試集。
(4)分別使用不同結(jié)構(gòu)的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練與測試。在單次識(shí)別訓(xùn)練過程中,根據(jù)迭代次數(shù)隨機(jī)選擇計(jì)算測試集代價(jià)函數(shù)Loss(所有樣本點(diǎn)預(yù)測值與真實(shí)值之差的和,也稱測試集Loss)和準(zhǔn)確率的次數(shù)。當(dāng)測試集代價(jià)函數(shù)曲線不再下降且其識(shí)別準(zhǔn)確率幾乎不變時(shí)停止訓(xùn)練。隨后根據(jù)訓(xùn)練結(jié)果,通過改進(jìn)迭代次數(shù)、梯度下降速度等參數(shù)反復(fù)訓(xùn)練,直至每一類網(wǎng)絡(luò)取得最優(yōu)識(shí)別結(jié)果為止。
(5)評(píng)估各類卷積網(wǎng)絡(luò)結(jié)構(gòu)的效能。
根據(jù)上述訓(xùn)練結(jié)果,即可初步獲得各類卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)對各類事件自動(dòng)識(shí)別的效果,進(jìn)而選擇最優(yōu)卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的訓(xùn)練結(jié)果建立天然地震事件與爆破、塌陷事件的波形識(shí)別分類器,對各類事件進(jìn)行識(shí)別判定。
圖2 為基于單個(gè)事件的多個(gè)臺(tái)站波形記錄的測試模塊圖,測試模塊的核心步驟主要包括:
(1)以單個(gè)事件為基本單元,通過預(yù)處理獲取震中距最小的5個(gè)臺(tái)站的波形記錄,組成測試波形部分。
(2)使用訓(xùn)練模塊得到的分類器,以事件為識(shí)別單元對測試波形進(jìn)行分類識(shí)別。對每個(gè)事件均采用綜合判定方法進(jìn)行識(shí)別,5個(gè)臺(tái)站中有3個(gè)以上臺(tái)站的波形被識(shí)別出的事件類型即為本事件的判定類型。
(3)分析一系列事件的最終判定結(jié)果并計(jì)算出該卷積神經(jīng)網(wǎng)絡(luò)分類器識(shí)別事件類型的準(zhǔn)確率,評(píng)估該方法的實(shí)際效果。
圖2 基于單個(gè)事件多個(gè)臺(tái)站波形記錄的測試模塊圖Fig. 2 Test block of multiple station waveform records based on a single event.
本文利用山東地震臺(tái)網(wǎng)中心2015年1月—2018年12月記錄的M>0.7事件的波形記錄進(jìn)行訓(xùn)練,觀測臺(tái)站為128個(gè),各臺(tái)站記錄的波形均包括垂直、EW、SN 三分向。2015年1月—2018年12月山東地震臺(tái)網(wǎng)記錄的M>0.7事件共1i653個(gè)(圖3),其中包括天然地震1i384個(gè)、爆破132個(gè)、塌陷137個(gè)。近年來,山東地區(qū)存在長島震群、乳山震群及鄒城塌陷等短時(shí)間內(nèi)集中發(fā)生的事件。2015年1月—2018年12月,長島震群共包括798個(gè)M>0.7地震,乳山震群共包括257個(gè)M>0.7地震,鄒城塌陷共包括100個(gè)M>0.7塌陷事件。為避免由于某一區(qū)域的事件過多而淹沒其他區(qū)域事件的識(shí)別特征并保證訓(xùn)練過程中樣本的普適性,在長島震群、乳山震群、鄒城塌陷事件中分別隨機(jī)選取20個(gè)事件的記錄波形進(jìn)行訓(xùn)練,最終共選取558個(gè)事件記錄進(jìn)行訓(xùn)練。
圖3 2015年1月—2018年12月山東臺(tái)網(wǎng)記錄的M≥0.7各類事件的空間分布圖Fig. 3 Spatial distribution of M ≥0.7 events recorded by Shandong seismic network from Jan. 2015 to Dec. 2018.
為滿足快速識(shí)別的要求、盡可能縮短事件判定所需時(shí)間,本文只選取每個(gè)事件P波到時(shí)最早的5個(gè)臺(tái)站的波形記錄為訓(xùn)練數(shù)據(jù),波形時(shí)間窗為30s,基本能包含全部P、S波,以其三分量波形組成一組訓(xùn)練數(shù)據(jù)同時(shí)進(jìn)行訓(xùn)練,以保證數(shù)據(jù)的客觀性。在預(yù)處理階段去除由于噪聲干擾等明顯為無效信號(hào)的單臺(tái)記錄后,共得到1i446份有效波形記錄,其中屬于天然地震事件的有848份、人工爆破事件386份、塌陷事件212份。
表1 各類卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的訓(xùn)練結(jié)果統(tǒng)計(jì)表Table1 Statistical table of training results of various CNN structures
圖4 AlexNet卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的訓(xùn)練結(jié)果Fig. 4 Training result of the AlexNet.
表1 為AlexNet、VGG16、VGG19、GoogLeNet 4種結(jié)構(gòu)的卷積神經(jīng)網(wǎng)絡(luò)的最終訓(xùn)練結(jié)果統(tǒng)計(jì)??梢姡罱K各類結(jié)構(gòu)對訓(xùn)練集與測試集的識(shí)別準(zhǔn)確率均達(dá)到93%以上。其中,AlexNet網(wǎng)絡(luò)結(jié)構(gòu)的識(shí)別準(zhǔn)確率最高,其訓(xùn)練集準(zhǔn)確率高達(dá)100%,測試集為98.51%,且未發(fā)生過擬合(圖4); VGG16、VGG19網(wǎng)絡(luò)結(jié)構(gòu)的準(zhǔn)確率次之,而GoogLeNet網(wǎng)絡(luò)結(jié)構(gòu)的識(shí)別準(zhǔn)確率相對較低。對于各類結(jié)構(gòu)的訓(xùn)練集與測試集的代價(jià)函數(shù)而言,其最終均低于0.194。因此,利用人工智能深度學(xué)習(xí)可以很好地實(shí)現(xiàn)天然地震與爆破、塌陷等事件類型的自動(dòng)識(shí)別,且AlexNet結(jié)構(gòu)的卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練效果最佳。
圖4—7分別為AlexNet、VGG16、VGG19、GoogLeNet 4種結(jié)構(gòu)卷積神經(jīng)網(wǎng)絡(luò)的詳細(xì)訓(xùn)練過程圖(訓(xùn)練集和測試集的準(zhǔn)確率及代價(jià)函數(shù)隨訓(xùn)練次數(shù)的變化曲線)。由圖可知,隨著訓(xùn)練次數(shù)的增加,各個(gè)網(wǎng)絡(luò)的訓(xùn)練集與測試集的準(zhǔn)確率及代價(jià)函數(shù)的走勢曲線基本一致; 所有網(wǎng)絡(luò)的訓(xùn)練集和驗(yàn)證集的準(zhǔn)確率均隨著訓(xùn)練次數(shù)的增加逐漸上升并超越90%,最終穩(wěn)定在某一數(shù)值附近; 與此同時(shí),代價(jià)函數(shù)曲線快速下降并最終穩(wěn)定在相對較小的數(shù)值附近不再變化; 值得注意的是,從訓(xùn)練集和測試集的代價(jià)函數(shù)曲線也可明顯看出,VGG16、VGG19、GoogLeNet分別在300、450、300次迭代訓(xùn)練后出現(xiàn)過擬合現(xiàn)象,且在這此后測試集的準(zhǔn)確率和代價(jià)函數(shù)趨于穩(wěn)定,幾乎未發(fā)生明顯變化; 而AlexNet未出現(xiàn)明顯過擬合現(xiàn)象。
圖5 VGG16卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的訓(xùn)練結(jié)果Fig. 5 Training result of the VGG16.
圖6 VGG19卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的訓(xùn)練結(jié)果Fig. 6 Training result of the VGG19.
圖7 GoogLeNet卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的訓(xùn)練結(jié)果Fig. 7 Training result of the GoogLeNet.
上述訓(xùn)練結(jié)果的準(zhǔn)確率只是各個(gè)網(wǎng)絡(luò)結(jié)構(gòu)在刪除質(zhì)量較差的波形記錄后,以單個(gè)臺(tái)站的單個(gè)波形記錄為基本單元進(jìn)行訓(xùn)練識(shí)別的結(jié)果。其識(shí)別準(zhǔn)確率是理想化條件下的結(jié)果,并不完全貼近地震臺(tái)網(wǎng)實(shí)際運(yùn)行中事件類型實(shí)時(shí)判定的情形,因而有必要開展以單個(gè)事件為單元、基于多個(gè)臺(tái)站波形記錄綜合判定事件類型的測試,以更全面地評(píng)估卷積神經(jīng)網(wǎng)絡(luò)在事件類型識(shí)別中的實(shí)際效果。
為檢驗(yàn)深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)在數(shù)字地震臺(tái)網(wǎng)實(shí)時(shí)運(yùn)行過程中的事件判別效能,選取2019年4月1日—7月31日期間山東臺(tái)網(wǎng)實(shí)時(shí)觸發(fā)的所有M≥0.7事件(海域事件只選取距離陸地線50km范圍內(nèi)的事件)進(jìn)行以事件為單元的類型判定測試。為盡可能接近實(shí)時(shí)判別模式,保證判定過程的時(shí)間效率,針對每個(gè)事件只選擇震中距最小的5個(gè)臺(tái)站(不考慮臺(tái)站波形記錄的質(zhì)量)進(jìn)行判斷,如果有3個(gè)以上臺(tái)站的波形被判定為某類事件則認(rèn)定其為該類事件; 反之,如果出現(xiàn)分別有2個(gè)臺(tái)站波形被判定為某類事件,而最后1個(gè)臺(tái)站認(rèn)為其屬于另一類型,則認(rèn)定該事件的類型難以判定。
2019年4月1日—7月31日期間,山東臺(tái)網(wǎng)共實(shí)時(shí)觸發(fā)并記錄110個(gè)M≥0.7事件,其中天然地震事件71個(gè)、爆破事件33個(gè)、塌陷事件6個(gè)。表2 為山東臺(tái)網(wǎng)2019年4—7月實(shí)時(shí)觸發(fā)M≥0.7事件的識(shí)別情況統(tǒng)計(jì)。整體而言,共有89個(gè)事件的類型識(shí)別準(zhǔn)確,準(zhǔn)確率約為80.9%; 16個(gè)事件識(shí)別錯(cuò)誤,5個(gè)事件類型難以識(shí)別。具體到各個(gè)類型事件中,天然地震共有53個(gè)事件識(shí)別準(zhǔn)確,準(zhǔn)確率約為74.6%; 14個(gè)事件識(shí)別錯(cuò)誤,4個(gè)類型難以識(shí)別; 爆破事件共有30個(gè)事件識(shí)別準(zhǔn)確,準(zhǔn)確率約為90.9%; 2個(gè)事件識(shí)別錯(cuò)誤,1個(gè)事件類型難以識(shí)別; 6個(gè)塌陷事件均準(zhǔn)確識(shí)別,準(zhǔn)確率為100%。
表2 2019年4月1日—7月31日山東臺(tái)網(wǎng)實(shí)時(shí)觸發(fā)M≥0.7事件識(shí)別情況統(tǒng)計(jì)表Table2 Statistical table of identification of real-time triggering of M≥0.7 events of the Shandong seismic network in the period from Apr.1 to Jul.31,2019
(1)為快速高效地識(shí)別天然地震與爆破、塌陷事件的類型,本文應(yīng)用深度學(xué)習(xí)技術(shù)中的卷積神經(jīng)網(wǎng)絡(luò)模型,設(shè)計(jì)了基于單個(gè)事件單個(gè)臺(tái)站波形記錄的深度學(xué)習(xí)訓(xùn)練模塊和基于單個(gè)事件多個(gè)臺(tái)站波形記錄的實(shí)時(shí)測試模塊; 在保證數(shù)據(jù)全面客觀原始的基礎(chǔ)上,以每個(gè)事件P波到時(shí)最早的5個(gè)臺(tái)站記錄到的三分量波形為輸入,采用目前主流的幾類卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行學(xué)習(xí)測試,并對比分析不同網(wǎng)絡(luò)結(jié)構(gòu)的學(xué)習(xí)效果,進(jìn)而選取其中訓(xùn)練識(shí)別效果較好的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)對其進(jìn)行以單個(gè)事件為單元、基于多個(gè)臺(tái)站波形記錄綜合判定事件類型的測試,以期更全面地評(píng)估卷積神經(jīng)網(wǎng)絡(luò)在事件類型識(shí)別中的實(shí)際效果。
(2)雖然本研究的樣本數(shù)據(jù)量較少,但為保證3類事件訓(xùn)練樣本選取的科學(xué)性,并未盲目地對所有記錄進(jìn)行學(xué)習(xí),而是選取其中記錄較好且能明顯反映出所屬事件波形特征的記錄進(jìn)行樣本訓(xùn)練。因此,能夠在較小的樣本量下獲得很高的準(zhǔn)確率和較強(qiáng)的泛化能力,并降低人工標(biāo)注的成本,在數(shù)據(jù)量不是絕對大的情況下可體現(xiàn)出明顯的優(yōu)勢。在各類卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的訓(xùn)練過程中,各個(gè)網(wǎng)絡(luò)的訓(xùn)練集與測試集的準(zhǔn)確率及代價(jià)函數(shù)走勢曲線基本一致,準(zhǔn)確率隨訓(xùn)練次數(shù)的增加逐漸上升并超越90%,最終穩(wěn)定在某一數(shù)值附近; 而代價(jià)函數(shù)曲線隨著訓(xùn)練次數(shù)的增加快速下降并最終穩(wěn)定在相對較小的數(shù)值附近不再變化。同時(shí),除AlexNet之外的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)均在訓(xùn)練過程中出現(xiàn)過擬合現(xiàn)象。最終各類結(jié)構(gòu)對訓(xùn)練集與測試集的識(shí)別準(zhǔn)確率均達(dá)到93%以上,其中AlexNet網(wǎng)絡(luò)結(jié)構(gòu)的識(shí)別準(zhǔn)確率最高,VGG16、VGG19網(wǎng)絡(luò)結(jié)構(gòu)的準(zhǔn)確率次之,而GoogLeNet網(wǎng)絡(luò)結(jié)構(gòu)的識(shí)別準(zhǔn)確率相對較低; 各類結(jié)構(gòu)訓(xùn)練集與測試集的代價(jià)函數(shù)最終均低于0.194。由此可知,理論上利用人工智能深度學(xué)習(xí)可以很好地實(shí)現(xiàn)天然地震與爆破、塌陷等事件類型的自動(dòng)識(shí)別。
(3)為檢驗(yàn)深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)在數(shù)字地震臺(tái)網(wǎng)實(shí)時(shí)運(yùn)行過程中的事件判別效能,開展了以單個(gè)事件為單元的基于多個(gè)臺(tái)站波形記錄綜合判定事件類型的測試,以此更全面地評(píng)估卷積神經(jīng)網(wǎng)絡(luò)在事件類型識(shí)別中的實(shí)際效果。最終測試結(jié)果顯示,在山東臺(tái)網(wǎng)實(shí)時(shí)觸發(fā)并記錄的110個(gè)M≥0.7事件中,最終共有89個(gè)事件的類型被準(zhǔn)確識(shí)別,準(zhǔn)確率約為80.9%; 16個(gè)事件識(shí)別錯(cuò)誤,5個(gè)事件類型難以識(shí)別。具體到各個(gè)類型事件中,天然地震共有53個(gè)事件被準(zhǔn)確識(shí)別,準(zhǔn)確率約為74.6%; 爆破事件共有30個(gè)事件被準(zhǔn)確識(shí)別,準(zhǔn)確率約為90.9%; 6個(gè)塌陷事件均被識(shí)別準(zhǔn)確,準(zhǔn)確率為100%。
可以明顯看出,塌陷與爆破事件的識(shí)別準(zhǔn)確率較高,基本已達(dá)到或超過目前地震臺(tái)網(wǎng)日常工作中人工判定的識(shí)別準(zhǔn)確率。天然地震的識(shí)別準(zhǔn)確率相對較低,主要原因可能是由于為了盡可能接近實(shí)時(shí)判別模式、縮短判定所需時(shí)間,在本次單個(gè)事件識(shí)別模塊中選取震中距最小的5個(gè)臺(tái)站記錄時(shí)并未前置波形記錄質(zhì)量判定模塊,即使波形失真(如被背景噪聲干擾淹沒的真實(shí)事件波形,波形漂移、缺失某一分量的波形等)的臺(tái)站記錄也參與判定。而對于震級(jí)較小的天然地震,相對于爆破與塌陷事件而言其波形記錄往往極易被噪聲所淹沒,這類被噪聲淹沒真實(shí)事件波形的臺(tái)站記錄在判定過程中幾乎都會(huì)被判定為爆破,進(jìn)而許多天然地震事件的事件類型最終被系統(tǒng)誤判定為爆破。在18個(gè)錯(cuò)誤識(shí)別的天然地震中,有高達(dá)13個(gè)事件都是因?yàn)椴糠峙_(tái)站記錄波形失真而被判定為爆破或難以識(shí)別(5個(gè)臺(tái)站記錄中判定為爆破與地震的臺(tái)站各占2個(gè)),若刪除這類波形失真事件,則天然地震的識(shí)別準(zhǔn)確率將提高至91.4%,而整體所有事件的識(shí)別準(zhǔn)確率也將由80.9%變?yōu)?1.7%。同時(shí),由于部分天然事件發(fā)生在礦區(qū),而礦區(qū)的地質(zhì)條件往往為采空區(qū),其事件波形在傳播過程中經(jīng)過采空區(qū)域時(shí)高頻成分被吸收,最終臺(tái)站的波形記錄會(huì)部分表現(xiàn)出類似塌陷事件的波形記錄特征,故最終被誤判為塌陷。
綜上所述,基于卷積神經(jīng)網(wǎng)絡(luò)的方法對天然地震與爆破、塌陷事件進(jìn)行事件類型識(shí)別的識(shí)別準(zhǔn)確率約為90%,與目前地震臺(tái)網(wǎng)日常工作中人工判定的識(shí)別準(zhǔn)確率接近。但值得注意的是,由于訓(xùn)練樣本和測試樣本較少,本次所得的結(jié)果并不一定能代表卷積神經(jīng)網(wǎng)絡(luò)的實(shí)際應(yīng)用效果。此外,本文人工選取的樣本原始事件必然會(huì)對訓(xùn)練結(jié)果產(chǎn)生一定的影響。因此,在未來的研究中需選取更多的相關(guān)數(shù)據(jù)進(jìn)行系統(tǒng)訓(xùn)練,以提高卷積神經(jīng)網(wǎng)絡(luò)的識(shí)別精度并盡可能地消除人工選取所帶來的主觀性影響。