中圖分類號:TP183;TP39;P315. 7 2 + 6 文獻標識碼:A
文章編號:2096-4706(2025)08-0041-05
Abstract: This research proposes an anomaly detection method in earthquake precursor gravity data based on the CNNLSTM-CBAMmodel.The anomalydetection inearthquake precursor gravitydata is crucial for improving the timelinessof earthquakepredictions.Itextracts spatial features ofthegravitydata using CNN,anduses theLSTMtocapture long-term dependencyrelationships inthe time series.The CBAMisintroduced toenhance the model's abilityto focusonimportant features,thereby improving anomaly detection performance.Experimental comparisons with the anomaly detection methods suchas AutoEncoder,CNN,LST,andCNN-LSTmethodsshowthattheproposedmodelinthispaperoutperformsotrsin metrics such as MAE,MSE,RMSE,and .This model effectively identifies potential and abnormal dataand providesa reliable foundation forearthquakeriskmanagementandearly waming.Thisresearchofersnewinsights into theanalysisofearthquake precursor data.
Keywords: earthquake precursor anomaly; gravity data; time series; LSTM; Atention Mechanism
0 引言
在印度板塊與歐亞板塊相互作用及太平洋板塊影響下,中國是板塊內地震活動最強烈、頻率最高的地區(qū)之一{I]。隨著對地震預報理解的深入,地震前兆被認為是地震發(fā)生的直接標志,因此尋找前兆異常在預報研究中具有重要意義[。大規(guī)模數(shù)字地震臺網(wǎng)平臺能夠收集形變、流體、地磁等海量前兆觀測資料,為相關研究提供關鍵數(shù)據(jù)。
目前的數(shù)據(jù)檢查主要依賴人工方法,存在煩瑣和低效的問題,不同臺站的異常判定標準不一,導致結果中存在主觀因素[3]。因此,結合現(xiàn)有異常檢測算法,提出針對前兆數(shù)據(jù)的自動異常檢測方法,可以顯著提高工作效率,減輕工作強度,減少人為主觀影響,確保數(shù)據(jù)客觀性。
現(xiàn)有大多數(shù)前兆異常檢測方法主要基于統(tǒng)計方法,例如通過計算正常數(shù)據(jù)的基線和變化率,判定超出范圍的觀測為異常[4]。此外,還有小波變換[5]和經(jīng)驗模態(tài)分解[等數(shù)字信號分析技術,這些方法通過時域到頻域的轉換進行異常分析。然而,這些技術僅適用于特定類型的時間序列異常,且不同類型的重力異常常常重疊,使得高精度檢測所有異常的推廣具有挑戰(zhàn)性。因此,需要一種能夠統(tǒng)一識別大多數(shù)異常的新方法。
深度學習技術已成為流行的機器學習方法,通過自學習提取深度特征,在有監(jiān)督和無監(jiān)督學習中表現(xiàn)優(yōu)異[7-8]。地震前兆重力數(shù)據(jù)是典型的時間序列,LSTM網(wǎng)絡能夠處理長期依賴關系,捕獲深層特征,從而提高地震異常自動識別的準確性。然而,LSTM在處理長序列時可能面臨梯度消失或爆炸的問題,影響其學習效果,仍需改進以適應地震異常檢測的需求。
由于前兆數(shù)據(jù)特殊的觀測目標和自身獨有的特點,目前基于深度學習的異常檢測算法在前兆數(shù)據(jù)中的應用仍較少,本文嘗試引入基于CNN-LSTM-CBAM的異常檢測模型,對前兆重力數(shù)據(jù)進行檢測,以解決臺網(wǎng)海量數(shù)據(jù)人工檢測效率低下和人為主觀影響的問題,探索地震前兆數(shù)據(jù)分析與異常檢測的新方法。
1前兆重力數(shù)據(jù)預處理
1.1 數(shù)據(jù)介紹
本文研究所用的連續(xù)觀測重力數(shù)據(jù)由江蘇省地震局提供,主要圍繞重力儀的秒采樣數(shù)據(jù)展開,時間范圍為2022年1月1日至2022年1月31日。
在對前兆數(shù)據(jù)進行分析之前,必須進行科學有效的數(shù)據(jù)存儲。由于前兆數(shù)據(jù)包含多種觀測指標且數(shù)據(jù)量日益增長,規(guī)范的數(shù)據(jù)編制對于保證科學存儲至關重要。規(guī)范的要點包括數(shù)據(jù)類型、臺站、測點、測項和采樣率等指標。在文件命名時,各項要點應以下劃線形式隔開,例如:DYU32011_F_21210_02.txt,其中:DYU表示預處理前兆數(shù)據(jù);32011表示具體臺站;F表示臺站的某個具體測點(每套儀器對應一個測點);21210表示具體的測項,2xx指代地形變觀測,即對由地殼運動引起的垂直形變、水平形變、斷裂錯動、重力及應力應變等變化量的觀測;21210特指重力潮汐變化測項,表示測量臺站重力數(shù)據(jù);02表示采樣率為秒。
此外需要特別注意的是,當儀器無法采集數(shù)據(jù)或數(shù)據(jù)上傳過程中出現(xiàn)問題時,檢測儀會自動填補缺失數(shù)據(jù),但這些填補的數(shù)據(jù)可能顯著高于或低于正常數(shù)據(jù)的數(shù)倍甚至百倍,缺失數(shù)據(jù)的標志值默認為999999。測項對應的編號及說明如表1所示。
1.2 重采樣
前兆重力數(shù)據(jù)作為一組秒采樣的時間序列數(shù)據(jù),一天的數(shù)據(jù)量為86400條數(shù)據(jù),數(shù)據(jù)量較大。為方便后續(xù)分析與可視化,對預處理后的前兆重力數(shù)據(jù)進行重采樣,重采樣為每30分鐘1個數(shù)據(jù)點,這意味著每個重采樣后的數(shù)據(jù)將包含1800條秒級數(shù)據(jù)。重采樣后數(shù)據(jù)的平滑程度和整體趨勢更為明顯,有助于我們更好地識別潛在的異常變化和趨勢,為異常識別提供可靠的基礎。重采樣前后的數(shù)據(jù)如圖1和圖2所示。
1.3 數(shù)據(jù)標注
在對重采樣后的數(shù)據(jù)進行異常檢測前,采用人工標注的方法來識別異常數(shù)據(jù)。基于原始數(shù)據(jù),新增了label列,其中正常數(shù)據(jù)被標注為0,而異常數(shù)據(jù)則被標注為1。經(jīng)過標注處理后的數(shù)據(jù)如圖3所示,其中虛線代表被標記為異常的數(shù)據(jù)點。
2 CNN-LSTM-CBAM網(wǎng)絡模型結構
本文提出的CNN-LSTM-CBAM異常檢測模型結合了卷積神經(jīng)網(wǎng)絡(CNN)、長短期記憶網(wǎng)絡(LSTM)和通道-空間注意力模塊(CBAM),旨在有效檢測地震前兆重力數(shù)據(jù)中的異常。這一模型不僅能夠捕捉時間序列數(shù)據(jù)中的時序特征,還能增強對數(shù)據(jù)內部結構的解釋能力,從而提高異常檢測的精度。
CNN作為深度學習的一個重要組成部分,廣泛應用于時間序列預測等領域。其結構包括卷積層、池化層和全連接層[9。在卷積層中,模型通過對一維矩陣提取最佳特征,生成卷積輸出,如式(1)所示:
其中 表示卷積輸出,tanh表示激活函數(shù),
表示輸入值,
表示權重,
表示偏置。
從而為后續(xù)處理提供有效信息。池化層則通過最大池化等方式,減少特征維度并保留重要信息。最終,全連接層對經(jīng)過處理的數(shù)據(jù)進行分類或回歸任務。
在地震前兆重力數(shù)據(jù)的應用中,CNN通過自動提取重力數(shù)據(jù)中的關鍵特征,幫助識別可能的異常模式。
LSTM是一種改進的循環(huán)神經(jīng)網(wǎng)絡(RNN),專門設計用于處理長期依賴問題和梯度消失問題[10]。它通過輸入門、遺忘門和輸出門的門控機制,有效地管理信息流,決定在每個時間步應保留多少信息,如圖4所示。
LSTM的設計使其在處理時間序列數(shù)據(jù)時具有顯著優(yōu)勢,能夠捕捉數(shù)據(jù)的動態(tài)變化和非線性關系。
一個標準的LSTM單元包括三個門:遺忘門 決定要遺忘多少先前的數(shù)據(jù);輸入門
,用于計算要寫入單元存儲器的信息;輸出門
,決定如何計算當前信息的輸出,如式(2)~式(4)所示:
其中, W, R 和 變量表示可訓練的矩陣和向量參數(shù)。
LSTM單元定義,如式(5)~式(8)所示:
候選細胞狀態(tài) 是使用輸入數(shù)據(jù)
和前一個隱藏狀態(tài)
計算的。細胞記憶或當前細胞狀態(tài)
是使用遺忘門
前一個細胞狀態(tài)
、輸入門
和候選細胞狀態(tài)
計算的。Hadamard積 ? 表示所涉及矩陣的元素積。輸出
是通過將相應的權重(
和
)應用于隱藏狀態(tài)
來計算的。
在地震前兆重力數(shù)據(jù)的分析中,LSTM能夠對通過CNN提取的特征進行時間序列建模,學習數(shù)據(jù)中的時間依賴性,從而更準確地預測異常事件的發(fā)生。
CBAM是一種有效的注意力機制,旨在通過選擇性地聚焦于重要特征,增強模型的表達能力[]。在CBAM中,通道注意力模塊和空間注意力模塊相輔相成,分別對特征的通道和空間維度進行加權處理,從而提高網(wǎng)絡的利用率和異常檢測能力,其結構如圖5所示。
通道注意力和空間注意力的計算如式(9)~式(10)所示:
其中, 表示通道注意力模塊計算因子,
表示空間注意力模塊計算因子, ε 表示Sigmoid激活函數(shù),MLP表示多層感知器, F 表示特征向量,unit表示通道組合,conv表示卷積操作。
在地震前兆重力數(shù)據(jù)中,CBAM通過增強重要特征的權重,減少低效信息的影響,從而提升模型對異常情況的敏感性和識別能力。
結合以上三個模塊,CNN-LSTM-CBAM模型能夠在時間序列數(shù)據(jù)處理上實現(xiàn)更高的效果。CNN層提取輸入重力數(shù)據(jù)的高維卷積特征,LSTM層對這些特征進行序列建模,學習其內部的時間依賴性,而CBAM模塊則動態(tài)調整每個通道和空間位置的加權系數(shù),進一步提升模型的擬合精度和適應性。
通過這種組合,模型能夠有效捕捉地震前兆重力數(shù)據(jù)中的時序特征和動態(tài)變化,顯著提高異常檢測的準確性。模型的整體結構如圖6所示。
3 實驗結果及分析
3.1 實驗流程
基于CNN-LSTM-CBAM模型的地震重力前兆重力異常檢測算法的整體流程如圖7所示。
在本研究中,首先對地震前兆重力數(shù)據(jù)進行標注,將數(shù)據(jù)劃分為正常數(shù)據(jù)和異常數(shù)據(jù)。正常數(shù)據(jù)不包含異常情況,用于訓練模型以學習正常模式;異常數(shù)據(jù)則包含異常樣本,用于測試模型性能。此外, 1 5 % 的數(shù)據(jù)被劃分為驗證集,以平衡模型訓練和驗證的需求。
接下來,構建CNN-LSTM-CBAM模型,并使用訓練數(shù)據(jù)進行訓練。訓練完成后,模型將對測試數(shù)據(jù)進行預測,通過輸入前一段時間的重力數(shù)據(jù),預測接下來的重力變化。模型的性能通過均方誤差(MSE)[12]、平均絕對誤差(MAE)[13]、均方根誤差(RMSE)[14]和決定系數(shù) )等指標進行評估[15]。
異常分數(shù)的計算基于模型預測值與實際重力數(shù)據(jù)之間的差異,常用的距離度量包括均方誤差和絕對誤差。計算后的異常分數(shù)經(jīng)過標準化處理,范圍調整為0到1,便于比較。異常分數(shù)越接近1,表示數(shù)據(jù)越可能是異常值。
設定合理的閾值以標記異常數(shù)據(jù)。例如,若閾值設為0.5,則所有異常分數(shù)高于該值的數(shù)據(jù)將被標記為異常。最終,通過檢測到的異常分數(shù)繪制異常檢測圖示,以便于分析人員快速識別和響應異?,F(xiàn)象。
3.2 實驗分析
為了更好地評估CNN-LSTM-CBAM模型的前兆重力數(shù)據(jù)異常檢測算法的有效性,本文選擇了經(jīng)典的異常檢測算法作為對比模型,具體包括AutoEncoder(自編碼器)、CNN、LSTM和CNN-LSTM。
本文提出的CNN-LSTM-CBAM模型在CNN-LSTM的基礎上引入了通道和空間注意力機制,進一步增強了模型對重要特征的關注能力。通過這種方式,模型能夠更精準地捕捉異常數(shù)據(jù),提高檢測效果。
各模型的異常檢測的實驗結果如表2所示。
從實驗結果來看,AutoEncoder的重建誤差相對較高,顯示其對數(shù)據(jù)特征的學習能力有限。盡管能夠檢測到一些異常,但整體效果較差,特別是在復雜數(shù)據(jù)場景中。相比之下,CNN顯著提升了檢測性能,其強大的局部特征提取能力使得異常識別更加準確,但仍缺乏處理時間序列信息的能力。
LSTM在處理時間序列數(shù)據(jù)方面表現(xiàn)出色,能夠有效捕捉數(shù)據(jù)中的時序特征。盡管在誤差指標上與CNN相似,但在動態(tài)數(shù)據(jù)分析中,LSTM更能識別潛在的異常模式。結合CNN和LSTM優(yōu)勢的CNN-LSTM模型在空間特征提取和時間序列處理上都有所增強,其 值的提升表明該模型能夠更準確地識別異常情況,顯著降低了重建誤差。
引入CBAM后,CNN-LSTM-CBAM模型表現(xiàn)出色,所有性能指標均達到了最佳水平。該模型在特征選擇上更為精細,能夠更有效地關注關鍵特征,進一步提升了異常檢測的準確性。
綜上所述,CNN-LSTM-CBAM模型在異常檢測任務中展現(xiàn)了最高的性能,尤其是在 值上達到了0.887,表明其對數(shù)據(jù)異常的捕捉能力極強。相比于其他模型,該算法在處理復雜數(shù)據(jù)時能夠更精準地識別潛在異常。實驗結果清楚地表明,結合空間和通道注意力機制的CNN-LSTM-CBAM模型顯著優(yōu)于傳統(tǒng)的單一模型,為異常檢測提供了更為有效的解決方案。
為了進一步優(yōu)化異常檢測過程,本文設置了一個合理的閾值,用于將異常分數(shù)與該閾值進行比較。當樣本的異常分數(shù)高于這一閾值時,對應的重力數(shù)據(jù)將被標記為異常。例如,將閾值設為0.5,所有異常得分高于0.5的樣本將被視為異常。這種方法使得異常檢測過程更加系統(tǒng)化,并有效減少了誤報。得到的異常分數(shù)如圖8所示。
根據(jù)異常檢測分數(shù)的結果,將高于設定閾值的點標記為異常。基于重采樣數(shù)據(jù),標記檢測到的異常并繪制了異常檢測圖示,如圖9所示,其中虛線代表被檢測為異常的數(shù)據(jù)。這種可視化方式便于分析人員快速識別異常,提升了對重力數(shù)據(jù)異常的響應效率,同時也有助于進一步追蹤和研究這些異?,F(xiàn)象的潛在原因及后果。
4結論
本研究提出的CNN-LSTM-CBAM模型在地震前兆重力數(shù)據(jù)的異常檢測中表現(xiàn)出色。該模型通過結合CNN和LSTM,有效捕捉多維時序數(shù)據(jù)中的潛在非線性關系和長期特征。CNN負責提取重力數(shù)據(jù)的空間特征,而LSTM則專注于學習時間序列的動態(tài)變化。引入的CBAM注意力機制進一步增強了特征提取能力,使模型能夠更精準地關注重要特征。這種綜合方法不僅提高了異常檢測的準確性,還能有效識別潛在的異常數(shù)據(jù),為地震前兆信號的監(jiān)測提供了可靠依據(jù)。
模型通過其高效的特征學習和異常檢測能力,為地震前兆的研究提供了一種科學、系統(tǒng)的方法,增強了對地震風險的管理能力,助力于提升地震預測的準確性和及時性,研究人員和決策者可以更有效地利用這些數(shù)據(jù)進行前期預警和防災減災工作。
參考文獻:
[1]李艷娥.基于孕震過程追蹤的強震預測方法研究[D].北京:中國地震局地球物理研究所,2023.
[2]徐錫統(tǒng).地震擾動下地球多圈層異常分析及其演化模式研究[D].長春:吉林大學,2024.
[3]池成全.鉆孔應變前兆觀測數(shù)據(jù)分析與異常提取研究[D].長春:吉林大學,2020.
[4]辛建村,方煒,楊宜海,等.2021年酒泉阿克塞縣MS(S下標)5.5地震前地電場變化分析[J].地震,2023,43(4):153-168.
[5]劉杰.基于循環(huán)神經(jīng)網(wǎng)絡的汶川地震地下流體前兆識別方法研究[D].成都:成都理工大學,2021.
[6]孫一書.城市拖電瞬變電磁數(shù)據(jù)降噪與反演方法研究[D].長春:吉林大學,2023.
[7]王洪洲.基于深度學習的地震勘探數(shù)據(jù)去噪及速度模型反演技術研究[D].長春:吉林大學,2024.
[8] KAVIANPOUR P,KAVIANPOUR M,JAHANI E,etal.ACNN-BiLSTMModelwithAttentionMechanism forEarthquake Prediction [J].Journal of Supercomputing,2023,79(17):19194-19226.
[9] ZHANG H,ZHAI H,LIU T T,et al. Short-termComprehensive Prediction Method for Regional EarthquakesBased on Multi-source Information Fusion [J].Proceedings of theIndian National Science Academy,2024 (prepublish):1-11.
[10]BUDAKC,GIDERV.LSTMBasedForecastingof theNext Day's Values of Ionospheric Total Electron Content (TEC)as an Earthquake Precursor Signal [J].Earth Science Informatics,2023,16(3):2323-2337.
[11] LIHY,LIJH,LIXG,et al. Seismic PickingAttention Module[J].IEEE TransactionsonGeoscienceandRemote Sensing,2024,62:1-6.
[12] MOUDDEN TEL,AMNAI M,CHOUKRIA,etal. Artificial Intelligence for Assessing the Planets' Positions asa Precursor to Earthquake Events [J].Journal of Geodynamics,2024,162:102057.
[13]羅旭辰.基于多源深度學習的地震預測模型研究[D].成都:電子科技大學,2023.
[14] ZHANGJY,SUNK,ZHUJQ,et al.ApplicationofModel-based Time Series Prediction of Infrared Long-waveRadiation Data for Exploring the Precursory Patterns Associatedwith the 2021 Madoi Earthquake[J].Remote Sensing,2023,15(19):1-22.
[15]史翔宇.基于機器學習回歸算法的地震預測研究及其在中國地震科學實驗場的應用[D].北京:中國地震局地震預測研究所,2021.
作者簡介:邢乾龍(1999一),男,漢族,河南商丘人,碩士在讀,研究方向:地震前兆異常、大數(shù)據(jù)處理、深度學習;通信作者:劉慶杰(1978一),男,漢族,河南洛陽人,教授,碩士,研究方向:大數(shù)據(jù)處理。