(上海工程技術(shù)大學(xué) 電子電氣工程學(xué)院,上海 201620)
傳統(tǒng)地震儀可以提供地震發(fā)生時間、地震波相關(guān)數(shù)據(jù)等必要信息,能幫助迅速判斷地震震級等內(nèi)容,為預(yù)警與后續(xù)救災(zāi)措施提供幫助。但是寬頻帶地震儀在需要密切關(guān)注的強震預(yù)測方面表現(xiàn)不佳。文獻(xiàn)[1]中指出強震會導(dǎo)致傳統(tǒng)地震儀數(shù)據(jù)缺失,無法完整反映相關(guān)數(shù)據(jù),且難以準(zhǔn)確獲得地殼形變信息,并提出引入強震儀數(shù)據(jù)作為補充手段,完善預(yù)警能力。文獻(xiàn)[2]中同樣提到了了強震儀數(shù)據(jù)對傳統(tǒng)地震儀的補足能力。文獻(xiàn)[3]給出了利用長短期神經(jīng)網(wǎng)絡(luò)對補全GPS 數(shù)據(jù)的辦法。而在深度學(xué)習(xí)方面,文獻(xiàn)[4]早已證實卷積神經(jīng)網(wǎng)絡(luò)與長短期神經(jīng)網(wǎng)絡(luò)的聯(lián)合使用,并加以驗證。文獻(xiàn)[5]則是機器學(xué)習(xí)領(lǐng)域在地震預(yù)警方面的應(yīng)用,結(jié)合分類算法與數(shù)學(xué)優(yōu)化算法來嘗試解決復(fù)雜的地震預(yù)測問題。
本文認(rèn)為可以通過把卷積神經(jīng)網(wǎng)絡(luò)出色的特征提取能力與長短期記憶神經(jīng)網(wǎng)絡(luò)在時間序列數(shù)據(jù)方面的學(xué)習(xí)能力結(jié)合在一起,學(xué)習(xí)地震監(jiān)測時間序列數(shù)據(jù)與震級之間的關(guān)系。借鑒孿生神經(jīng)網(wǎng)絡(luò)的設(shè)計思想,來快速預(yù)測震級。以下將就該神經(jīng)網(wǎng)絡(luò)模型如何實現(xiàn)進(jìn)行說明。
將地震震級預(yù)測看成一個多分類問題來求解。
考慮到數(shù)據(jù)分傳統(tǒng)GPS 數(shù)據(jù)與strong-motion(強震)數(shù)據(jù),因此作為將兩個輸入作為一組樣本,一起放入神經(jīng)網(wǎng)絡(luò)模型中進(jìn)行訓(xùn)練與測試。由于GPS 數(shù)據(jù)與strong-motion數(shù)據(jù)在時間間隔、基站經(jīng)緯度,甚至部分海拔高度也不盡相同,因此,包括與地震波相關(guān)的N、E、U三個方向上的差異量在內(nèi),額外增加經(jīng)度、緯度、海拔高度、時間間隔等共七個特征數(shù)據(jù),形成時間序列,以地震震級作為標(biāo)簽。在神經(jīng)網(wǎng)絡(luò)模型上,借鑒孿生神經(jīng)網(wǎng)絡(luò)的設(shè)計,內(nèi)部采用卷積神經(jīng)網(wǎng)絡(luò)(CNN)與長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)聯(lián)合使用的方式來處理。
首先介紹本文使用的幾個神經(jīng)網(wǎng)絡(luò)具體實現(xiàn),接著說明選取的損失函數(shù)。實驗整體框架如圖1 所示。
圖1 實驗整體框架
孿生神經(jīng)網(wǎng)絡(luò)(Siamese Network)用于衡量兩個輸入的相似程度,其最大的特點是兩個神經(jīng)網(wǎng)絡(luò)權(quán)重相同且完全相同。這兩個神經(jīng)網(wǎng)絡(luò)分別將輸入映射到新的空間,形成輸入在新的空間中的表示,最終通過損失函數(shù)計算來評判輸入相似度。最早出現(xiàn)在支票上的簽名驗證[5]。隨著發(fā)展,也有偽孿生神經(jīng)網(wǎng)絡(luò)(Pseudo-Siamese Network),特點在于兩邊不共享權(quán)值。本實驗?zāi)P椭黧w參考傳統(tǒng)孿生神經(jīng)網(wǎng)絡(luò)設(shè)計。傳統(tǒng)孿生神經(jīng)網(wǎng)絡(luò)如圖2 所示。
圖2 傳統(tǒng)孿生神經(jīng)網(wǎng)絡(luò)
人工智能發(fā)展至今,卷積神經(jīng)網(wǎng)絡(luò)可以說是最廣為人知,也是最具代表性的神經(jīng)網(wǎng)絡(luò)之一。這主要得益于它在圖像特征提取方面上非常出色的表現(xiàn)。也正是通過這一特點,讓它在與圖像特征提取相關(guān)的應(yīng)用場景都有著難以撼動的地位并取得了許多卓越成就。近些年,其主要與其他神經(jīng)網(wǎng)絡(luò)聯(lián)合使用以進(jìn)一步提高準(zhǔn)確度。
長短期記憶網(wǎng)絡(luò)是一種時間遞歸神經(jīng)網(wǎng)絡(luò),適合于處理和預(yù)測時間序列中間隔和延遲相對較長的重要事件。作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的變體,它保留了RNN 的功能:向前傳遞相關(guān)信息,同時處理當(dāng)前信息。變化在于,它在這基礎(chǔ)上增加了遺忘門、輸入門、輸出門,通過這三個門獲得了保留或者遺忘信息的能力。因此,LSTM 擁有著記住長期信息的能力。本文實驗主要是卷積神經(jīng)網(wǎng)絡(luò)與長短期記憶神經(jīng)網(wǎng)絡(luò)的聯(lián)合運用。本文神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖3 所示。
圖3 本文神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
對于一個二分類問題,一般做法是將神經(jīng)網(wǎng)絡(luò)節(jié)點的輸出通過某一個激勵函數(shù)轉(zhuǎn)化為屬于某一類的概率。多分類問題神經(jīng)網(wǎng)絡(luò)最常用的方法是根據(jù)類別個數(shù)n,設(shè)置n個輸出節(jié)點,這樣每個樣本神經(jīng)網(wǎng)絡(luò)都會給出一個n維數(shù)組作為輸出結(jié)果。
本文將地震震級預(yù)測可以看作為一個多分類問題,因此,在網(wǎng)絡(luò)模型后將softmax 作為激勵函數(shù),將交叉熵(Cross entropy)作為損失函數(shù)?,F(xiàn)在大多數(shù)框架都將兩個函數(shù)合并在一起使用,使代碼實現(xiàn)變得十分簡單。
本文主要以海外地震相關(guān)信息作為數(shù)據(jù)進(jìn)行研究,且較少量數(shù)據(jù)情況下,也能取得較好的預(yù)測結(jié)果。數(shù)據(jù)有5 172組的情況下,有效準(zhǔn)確率在87.12%。