關(guān)鍵詞: 微地震監(jiān)測,事件檢測,數(shù)據(jù)增廣,殘差網(wǎng)絡(luò),深度學(xué)習(xí)
0 引言
近年來,水力壓裂技術(shù)被廣泛用于頁巖氣、煤層氣等非常規(guī)油氣資源開發(fā)[1?5]。在水力壓裂過程中,通過檢測巖石破裂產(chǎn)生的微地震信號,可以反演震源位置、震源機(jī)制解、震級等參數(shù),從而監(jiān)測裂縫的發(fā)育過程并評估壓裂效果[6?11]。地面監(jiān)測和井中監(jiān)測是兩種常用的監(jiān)測方式。與地面監(jiān)測相比,井中監(jiān)測的檢波器記錄具有較高的信噪比,可通過拾取P 波和S 波到時(shí)進(jìn)行微地震定位[12]。野外記錄通常為連續(xù)的波形,對微地震信號的識別直接決定了微地震定位的準(zhǔn)確度和可靠性。
目前,微地震事件自動檢測主要應(yīng)用于天然地震領(lǐng)域,方法包括基于振幅的長短時(shí)窗比法(Short TermAverage/Long Term Average , STA/LTA)[13?16]、基于Akaike 信息準(zhǔn)則(Akaike Information Criteria,AIC)的方法[17?18]以及基于波形相似性的波形互相關(guān)法[19?22]等。目前,應(yīng)用較為廣泛的為STA/LTA 算法,其基本原理是通過計(jì)算短、長時(shí)間窗內(nèi)波形的平均能量值比值來評估信號的能量變化。該方法原理簡單、計(jì)算效率高,地震學(xué)家對該方法做了一系列的改進(jìn)。例如,Withers 等[13]實(shí)現(xiàn)了一種自適應(yīng)窗口的STA/LTA 算法,結(jié)合地震圖頻譜特性滿足事件檢測與定位的要求。宋維琪等[14]在STA/LTA 算法的基礎(chǔ)上,討論了基于特征值分析且抗噪能力較強(qiáng)的識別方法。邱磊等[15]通過建立閾值和背景噪聲之間的關(guān)系,提出了兩種基于參考閾值拾取地震波初至的方法,拾取結(jié)果的正確率比傳統(tǒng)STA/LTA 方法有所提高。劉晗等[16]對STA/LTA 算法和改進(jìn)的加權(quán)系數(shù)法、多窗口算法和修正能量比法進(jìn)行了對比,了解了時(shí)窗長度、觸發(fā)閾值和特征函數(shù)對算法性能的影響特征及其選取規(guī)律。STA/LTA 法具有較好的通用性且高效,但其拾取結(jié)果受閾值影響較大,依賴人工經(jīng)驗(yàn),同時(shí)該方法對中強(qiáng)度背景噪聲十分敏感,容易出現(xiàn)漏檢事件。
近年來,隨著計(jì)算機(jī)領(lǐng)域人工智能的發(fā)展,深度學(xué)習(xí)相關(guān)技術(shù)在計(jì)算機(jī)視覺、自然語言處理、語音識別、醫(yī)學(xué)圖像處理等多個(gè)領(lǐng)域取得了巨大的成功[23?24]。機(jī)器學(xué)習(xí)算法也被廣泛地應(yīng)用在地震勘探領(lǐng)域,尤其是地震信號的檢測和拾取,發(fā)展了一系列的智能算法[25?35]。例如,Mousavi 等[36]采用卷積神經(jīng)網(wǎng)絡(luò)以及循環(huán)神經(jīng)網(wǎng)絡(luò)搭建模型,形成了CRED 模型,用于噪聲與地震事件分類,該模型對于背景噪聲、非地震脈沖有著極高魯棒性,能夠高效地處理海量地震數(shù)據(jù)。趙明等[37]使用汶川地震余震事件構(gòu)建訓(xùn)練數(shù)據(jù)集,利用卷積神經(jīng)網(wǎng)絡(luò)方法進(jìn)行訓(xùn)練,并用未參與模型訓(xùn)練的汶川余震事件作為檢測數(shù)據(jù)集,其訓(xùn)練和檢測準(zhǔn)確率均達(dá)到95% 以上。Zhao 等[38]采用卷積神經(jīng)網(wǎng)絡(luò)對連續(xù)數(shù)據(jù)進(jìn)行時(shí)窗分割并分類,其輸入為一維的地震數(shù)據(jù),驗(yàn)證集精度達(dá)到93%。Zhang 等[39]構(gòu)建了基于卷積神經(jīng)網(wǎng)絡(luò)的微地震檢測網(wǎng)絡(luò),通過比較分析多種微地震檢測分類方法,論證了深度學(xué)習(xí)算法在微地震事件檢測中具有較高的準(zhǔn)確度,展示了在微地震實(shí)時(shí)監(jiān)測領(lǐng)域中良好的應(yīng)用前景。王維波等[40]利用卷積神經(jīng)網(wǎng)絡(luò)算法構(gòu)建微地震檢測二分類模型,通過水力壓裂實(shí)際監(jiān)測的微地震信號構(gòu)建訓(xùn)練樣本集,訓(xùn)練得到的網(wǎng)絡(luò)模型具有較好的抗噪性。隨后,王維波等[41]又提出利用殘差網(wǎng)絡(luò)對微地震監(jiān)測數(shù)據(jù)的地震發(fā)射層析成像數(shù)據(jù)進(jìn)行處理, 實(shí)現(xiàn)微地震事件自動識別。
深度學(xué)習(xí)算法可以直接從訓(xùn)練數(shù)據(jù)中挖掘地震事件特征。預(yù)測新的數(shù)據(jù)時(shí),只需要將微震事件分割成相互獨(dú)立的窗口,然后輸入到訓(xùn)練好的模型中即可迅速進(jìn)行事件檢測,節(jié)省大量的計(jì)算時(shí)間?,F(xiàn)有的基于深度學(xué)習(xí)的微地震事件檢測方法通常把事件檢測看作圖像二分類問題,需要對連續(xù)監(jiān)測的波形數(shù)據(jù)按照一定時(shí)窗長度進(jìn)行分割。通常,相鄰時(shí)窗會有部分重疊以盡量減少漏檢。這種處理方法不僅增加了計(jì)算時(shí)間,降低了運(yùn)算效率,同時(shí)如何選取重疊時(shí)窗大小也決定了分類結(jié)果的準(zhǔn)確度。因此,本文提出一種基于深度學(xué)習(xí)的微震事件五分類檢測方法。首先,把野外采集的連續(xù)記錄波形等分,人工標(biāo)定為噪聲、完整的P 波和S 波、只含有P 波、只含有S 波和多個(gè)微震事件五類; 其次,通過研究數(shù)據(jù)增廣方法,利用較少的原始標(biāo)定樣本獲得多樣性的訓(xùn)練集數(shù)據(jù)進(jìn)行模型訓(xùn)練; 最后,將訓(xùn)練得到的五分類模型應(yīng)用于實(shí)際微震數(shù)據(jù)檢測,通過對檢測得到的微震事件進(jìn)行到時(shí)拾取和震源定位評估檢測精度,并與二分類算法結(jié)果進(jìn)行對比驗(yàn)證。
1 數(shù)據(jù)處理
本文使用了東方地球物理公司(BGP)提供的一套單井監(jiān)測的水力壓裂數(shù)據(jù),共有12 個(gè)三分量檢波器分布在深度為2800~3020 m 的監(jiān)測井中,間隔為20 m,檢波器位于壓裂井段的上方。圖1 為本文使用的P 波和S 波速度模型,參數(shù)經(jīng)測井?dāng)?shù)據(jù)提取并利用射孔事件校正。數(shù)據(jù)的時(shí)間采樣率為0. 5 ms。
1. 1 樣本標(biāo)定
本文把微地震事件檢測視為五分類問題:圖2a為噪聲,被歸為第一類,簡稱C1;圖2b 為一個(gè)完整的微震事件,包含完整的P 波和S 波信息,被歸為第二類,簡稱C2;圖2c 只含有完整的P 波信息,被歸為第三類,簡稱C3;圖2d 只含有完整的S 波信息,被歸為第四類,簡稱C4;第五類較為復(fù)雜,定義為在一個(gè)樣本窗口中包含多個(gè)微震事件(圖2e)。此外,樣本中同時(shí)包含一個(gè)微震事件和另一個(gè)事件的P 波或者S 波也被歸為第五類,簡稱C5。
1. 2 數(shù)據(jù)增廣
數(shù)據(jù)增廣可以提高模型的泛化能力和魯棒性,有助于減少過擬合問題。在訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型時(shí),通常需要大量的訓(xùn)練數(shù)據(jù),但是大多數(shù)地球物理的數(shù)據(jù)集比較有限。通過數(shù)據(jù)增廣,能夠擴(kuò)展數(shù)據(jù)集,增加訓(xùn)練樣本的多樣性。常見的數(shù)據(jù)增廣方法包括旋轉(zhuǎn)、翻轉(zhuǎn)、裁剪、平移、縮放、添加噪聲等[23, 37]。針對井下微震事件檢測,本文參考Zhang 等[42]提出的方法進(jìn)行數(shù)據(jù)增廣。其中,針對C2 樣本的增廣方法共有5 種。圖3 為原始樣本的三分量數(shù)據(jù)波形記錄,圖4 為對圖3 數(shù)據(jù)增廣后的結(jié)果。
圖4a 為顛倒檢波器順序:微震事件可能發(fā)生在檢波器陣列的上方或下方,顛倒檢波器順序可以模擬發(fā)生在不同位置的微震事件。
圖4b 為旋轉(zhuǎn)分量:微震事件可能發(fā)生在不同的方位角和不同的震源機(jī)制作用下。不同的方位角導(dǎo)致波形數(shù)據(jù)中的粒子運(yùn)動變化。旋轉(zhuǎn)分量可以模擬具有不同偏振角產(chǎn)生的復(fù)雜波形的微地震事件[42]。
圖4c 為移動P 波或S 波相位:P 波與S 波的到時(shí)差與檢波器的幾何分布、地下速度模型以及事件發(fā)生的位置等因素有關(guān)。通過隨機(jī)移動P 波和S 波波形來模擬由各種物理因素引起的到時(shí)差。本文從? 15 ms 到15 ms 之間隨機(jī)選擇一個(gè)值進(jìn)行移動P波到時(shí)或者S 波到時(shí)。此外,為了防止移動后S 波的到時(shí)早于P 波到時(shí),選擇最小P、S 波到時(shí)差為25 ms。
圖4d 為調(diào)整P 波振幅:調(diào)整P 波振幅有助于提高模型的泛化能力。我們選擇對S 波之前的P 波波形隨機(jī)乘以值為0. 2~1. 2 的因子。當(dāng)因子較小時(shí),樣本主要顯示S 波波形,可模擬單震相事件。
圖4e 為添加噪聲:信噪比是影響微地震事件檢測精度的一個(gè)重要因素。噪聲類型的多樣性有利于提高網(wǎng)絡(luò)模型的檢測準(zhǔn)確度。本文選擇了4 種不同類型的噪聲改變事件的信噪比。第一種為實(shí)際數(shù)據(jù)噪聲。首先從原始的監(jiān)測數(shù)據(jù)中截取了50 個(gè)噪聲窗口,隨機(jī)選擇一個(gè)噪聲窗口疊加到微震事件波形中。
通過隨機(jī)設(shè)置信噪比模擬被不同程度噪聲污染的事件。第二種為高斯白噪聲。本文選擇的高斯白噪聲約為信號最大值的5×10?3~5×10?2 倍。第三種添加脈沖噪聲。脈沖噪聲絕對值為1,脈沖出現(xiàn)的概率范圍為10?2~10?3。第四種添加正弦波噪聲,正弦波頻率為3~6 Hz,振幅為0. 05~0. 30 個(gè)單位。
C3 與C4 樣本的數(shù)據(jù)增廣方法通過截取C2 樣本實(shí)現(xiàn)。以C2 樣本中所有檢波器中最后的P 波到時(shí)與最初的S 波到時(shí)的平均值為基點(diǎn),隨機(jī)選擇? 25 ms~25 ms 的擾動,拆分窗口。分別得到一個(gè)C3 樣本以及一個(gè)C4 樣本。然而,拆分的樣本不滿足時(shí)窗長度要求,需要對P、S 波前后的噪聲進(jìn)行插值或截?cái)?,得到滿足時(shí)窗長度要求數(shù)據(jù)集。
針對C5 的數(shù)據(jù)增廣方法一共兩種:
(1) 兩個(gè)C2 樣本疊加。從C2 樣本中隨機(jī)選取兩個(gè)事件進(jìn)行疊加。如果兩個(gè)選取的C2 樣本距離較近,則疊加后的樣本難以區(qū)分是C2 或是C5,因此本文規(guī)定兩個(gè)疊加事件的P 波到時(shí)差需要超過100 ms。
此外,通過乘以值為0. 5~1. 0 的一個(gè)因子改變振幅,更加貼合實(shí)際情況。
(2) 一個(gè)C2 樣本與一個(gè)C3 或者C4 樣本疊加。具體做法是將一個(gè)位于時(shí)窗前部S 波與一個(gè)任意位置的C2 樣本疊加,或者是一個(gè)位于時(shí)窗后部的P 波與一個(gè)任意位置的C2 樣本疊加。
本文從野外原始記錄的波形數(shù)據(jù)中分別截取5種數(shù)據(jù)樣本,并通過以上數(shù)據(jù)增廣方法進(jìn)行數(shù)據(jù)增廣,數(shù)據(jù)集增廣前、后個(gè)數(shù)如表1 所示。數(shù)據(jù)集個(gè)數(shù)從91 增加到22431,5 種數(shù)據(jù)樣本的比例分別為19. 83%,20. 28%,19. 97%,20. 01% 以及19. 98%。最后將數(shù)據(jù)集按8:2 的比例劃分為訓(xùn)練集以及驗(yàn)證集,訓(xùn)練集與驗(yàn)證集個(gè)數(shù)分別為17944、4487。
2 方法與訓(xùn)練結(jié)果
2. 1 殘差學(xué)習(xí)模塊
傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)層數(shù)增加時(shí),易出現(xiàn)梯度消失的問題。He 等[24]在傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,增加跨層數(shù)據(jù)通路(圖5 黑色折線),加強(qiáng)了層與層之間的溝通,該神經(jīng)網(wǎng)絡(luò)被稱為殘差網(wǎng)絡(luò)(Residual Net?work,簡稱ResNet)。該網(wǎng)絡(luò)主要由殘差塊堆疊而成。圖5 是本文所使用的殘差塊結(jié)構(gòu),輸入x 依次進(jìn)入卷積層、批量規(guī)范化層(Batch NormalizationLayer, 簡稱BN 層)、ReLU 激活層、卷積層、BN 層以及ReLU 層,同時(shí)在最后一個(gè)ReLU 層之前,加入了跨層連接,得到映射函數(shù)F(x)+x。需要注意的是,殘差塊的輸入x 與最終輸出的數(shù)據(jù)形狀是相同的。
2. 2 殘差網(wǎng)絡(luò)結(jié)構(gòu)
圖6 為本文殘差模型的架構(gòu)。模型的輸入大小為 n×1001×36( n 為訓(xùn)練樣本個(gè)數(shù),1001 為時(shí)間采樣點(diǎn),36 為12 個(gè)三分量檢波器的道數(shù))的波形數(shù)據(jù)。其中,第二個(gè)通道的排列順序?yàn)椋旱? 個(gè)檢波器的N、E、Z 分量;第2 個(gè)檢波器的N、E、Z 分量;以此類推。首先,模型第一層是通道數(shù)為64、步長為2 的7 × 7 的卷積層,隨后依次進(jìn)入BN 層、RuLU 層、以及步長為2 的3 × 3 的最大池化層。此時(shí)的輸出將進(jìn)入堆疊的殘差塊。按順序包括3 個(gè)通道數(shù)為64、3 個(gè)通道數(shù)為128、3 個(gè)通道數(shù)為256 和3 個(gè)通道數(shù)為512 的殘差塊。由于每個(gè)殘差塊包含2 個(gè)卷積層,再加上第一層7 × 7 的卷積層,該網(wǎng)絡(luò)一共包含了25 個(gè)卷積層。其中,第1、第8、第14 和第20 層的卷積層步長為2,其余步長均為1。隨后,輸出與全局池化層相連。最后,使用包含5 個(gè)神經(jīng)元的全連接層并使用Softmax 分類器輸出5 個(gè)值,分別對應(yīng)輸入樣本為C1、C2、C3、C4、C5 的概率,其中最大概率值對應(yīng)的類別即為該網(wǎng)絡(luò)的預(yù)測結(jié)果。
深度學(xué)習(xí)的損失函數(shù)與地球物理反演中的目標(biāo)函數(shù)十分相似,用于估計(jì)模型的預(yù)測值與真實(shí)值的差別程度。在分類問題中,多使用交叉熵?fù)p失函數(shù)衡量輸入的真實(shí)概率分布p 和預(yù)測概率分布q 之間的差異H ( p,q),即
式中: xi 表示第i 個(gè)數(shù)據(jù); N 代表數(shù)據(jù)總數(shù)。損失函數(shù)可使用Adam 優(yōu)化算法迭代求解,每次迭代后,卷積核和權(quán)重將會被更新。
2. 3 訓(xùn)練過程和模型評估
模型在RTX3060 圖像處理器上進(jìn)行訓(xùn)練,訓(xùn)練時(shí)長約為145 min。經(jīng)過100 次迭代后,訓(xùn)練集和驗(yàn)證集的準(zhǔn)確度損失曲線均得到收斂(圖7)。其中,訓(xùn)練集準(zhǔn)確度達(dá)到99. 96%,訓(xùn)練集損失值約為0. 0017;驗(yàn)證集準(zhǔn)確度達(dá)到99. 82%,驗(yàn)證集損失值約為0. 0082。
本文使用歸一化的混淆矩陣(Confusion Matrix)進(jìn)一步分析了模型性能?;煜仃囌故玖艘粋€(gè)分類器對樣本進(jìn)行分類時(shí)產(chǎn)生的錯(cuò)誤,即真實(shí)類別被分為其他類別的錯(cuò)誤。圖8 為五分類模型驗(yàn)證集的歸一化混淆矩陣,矩陣主對角線為預(yù)測標(biāo)簽與真標(biāo)簽吻合的概率值。在驗(yàn)證集中C1 與C3 樣本全部預(yù)測正確,個(gè)數(shù)分別為890 與896,所以對應(yīng)的主對角線的值為1;C2 個(gè)數(shù)為個(gè)910 個(gè),其中被正確預(yù)測的個(gè)數(shù)為908,占比為99. 8%; 898 個(gè)C4 樣本中有897 個(gè)預(yù)測正確,占比99. 9%;893 個(gè)C5 樣本中有887 個(gè)預(yù)測正確,占比99. 4%,其中有6 個(gè)C5 樣本被錯(cuò)誤預(yù)測為C2 樣本。
2. 4 數(shù)據(jù)降維可視化
降維可視化是將高維數(shù)據(jù)轉(zhuǎn)換為二維或三維的可視化展示,有助于更好地理解和分析數(shù)據(jù),從而找到數(shù)據(jù)中的模式和規(guī)律。
神經(jīng)網(wǎng)絡(luò)可以把高維度復(fù)雜的數(shù)據(jù)輸出為線性可分的語義特征,最后只需要一層線性分類器即可把數(shù)據(jù)進(jìn)行分類,這說明倒數(shù)第二層的語義特征在高維度中線性可分。本文使用 T?SNE( t?Distributed Sto?chastic Neighbor Embedding)降維方法。T ? SNE 是一種用于高維數(shù)據(jù)降維可視化的算法,其主要思想是將高維數(shù)據(jù)映射到低維空間中,使數(shù)據(jù)點(diǎn)之間的相對距離在低維空間中保持不變或最大化。
本文將驗(yàn)證集在倒數(shù)第二層(全局池化層)輸出的語義特征進(jìn)行降維(圖9)。雖然個(gè)別事件被錯(cuò)誤分類,但五分類數(shù)據(jù)集確實(shí)線性可分。
3 五分類算法檢測流程與應(yīng)用
3. 1 五分類事件檢測流程
本文提出的五分類算法將輸入樣本預(yù)測為噪聲、完整的微震事件、只含P 波、只含S 波、多個(gè)微震事件五類。但在實(shí)際應(yīng)用中,最終需要獲得同時(shí)包含P 波和S 波的微地震事件,而五分類算法中的C3 與C4樣本并不是完整的微震事件。因此,需要通過移動時(shí)窗再次處理C3 與C4 樣本,從而得到完整的微震事件用于震源定位。
首先,把野外采集的連續(xù)波形記錄(圖10a)按照長度為1001 的時(shí)窗( 約為500 ms)進(jìn)行切分( 圖10b),不同于二分類模型,五分類樣本的時(shí)窗沒有重疊。得到規(guī)定長度時(shí)窗后,進(jìn)行歸一化處理,輸入到訓(xùn)練好的模型中進(jìn)行分類;然后利用訓(xùn)練好的ResNet 模型把時(shí)窗預(yù)測為C1、C2、C3、C4 和C5 五類(圖10c)。C2 類型可直接用于微地震定位。通過分析可知,若相鄰兩個(gè)樣本預(yù)測結(jié)果為C3 和C4,則大概率是一個(gè)微地震事件被截?cái)喑蓛刹糠?,將C3 樣本向后時(shí)移或者C4 樣本向前時(shí)移即可。本文選取200 ms 進(jìn)行時(shí)窗移動能夠獲得完整的微震事件。如果C3 或C4 類型單獨(dú)出現(xiàn),同樣向后或者向前移動200 ms,然后用于微地震定位。此外,C5 樣本情況較為復(fù)雜,可以對樣本進(jìn)行人工處理后再用于定位。
3. 2 五分類模型應(yīng)用
隨機(jī)選取未用于模型訓(xùn)練的原始波形記錄作為測試數(shù)據(jù)進(jìn)行模型測試, 數(shù)據(jù)長度為17517 ms( 圖11)。該段數(shù)據(jù)的水力壓裂事件較為密集,信噪比范圍較廣,可充分測試五分類模型性能。首先,把該測試數(shù)據(jù)按1001 數(shù)據(jù)點(diǎn)的時(shí)窗大小截取,可以得到35 個(gè)樣本。所有樣本經(jīng)過歸一化處理后,輸入到ResNet 模型中進(jìn)行預(yù)測。通過人工檢查,測試數(shù)據(jù)中一共包括23 個(gè)微地震事件。
把預(yù)測結(jié)果按照順序并把不同類別標(biāo)簽的時(shí)窗用不同顏色標(biāo)注出來(圖12a)。據(jù)統(tǒng)計(jì),五分類模型預(yù)測結(jié)果為:9 個(gè)C2、5 個(gè)C3、5 個(gè)C4 以及3 個(gè)C5。其中,相鄰兩個(gè)樣本預(yù)測結(jié)果為C3 和C4 的情況有3次,為了防止反復(fù)拾取,此時(shí)只移動C4,故從C3 和C4 中一共得到7 個(gè)微地震事件。經(jīng)過人工檢查,3 個(gè)C5 事件一共包含7 個(gè)微地震事件,故成功拾取的微地震事件個(gè)數(shù)為23。
圖12b 與圖12c 是圖12a 中的兩個(gè)紅色虛線框位置的放大圖,分別是預(yù)測結(jié)果為C2 與C5 的低信噪比事件。該結(jié)果表明,ResNet 模型有很強(qiáng)的抗噪能力。
然后,將訓(xùn)練好的五分類模型應(yīng)用到該套水力壓裂數(shù)據(jù)的第14 個(gè)壓裂段的微地震事件檢測中。第14個(gè)壓裂段的壓裂時(shí)長約為135 min,把該數(shù)據(jù)按1001數(shù)據(jù)點(diǎn)(約為500 ms)的時(shí)窗大小截取,得到16204 個(gè)樣本。經(jīng)過統(tǒng)計(jì),該壓裂段樣本的預(yù)測結(jié)果為:10889個(gè)C1、2830 個(gè)C2、955 個(gè)C3、824 個(gè)C4 以及706 個(gè)C5。預(yù)測時(shí)間為82 s。本文還利用不重疊時(shí)窗的二分類模型對該16204 個(gè)樣本進(jìn)行預(yù)測,預(yù)測結(jié)果為:12440 個(gè)C1、3764 個(gè)C2。
為了評估微地震檢測的準(zhǔn)確度,利用Zhang 等[42]提出的微地震到時(shí)拾取泛化模型對檢測出的事件進(jìn)行P、S 波到時(shí)拾取。該泛化模型的輸入為12 道三分量波形數(shù)據(jù),輸出為12 道的P 波、S 波和噪聲的概率分布。對于輸入時(shí)窗的任意一道,可以將兩個(gè)最大概率值所在橫坐標(biāo)作為拾取的P 或S 波到時(shí)。Zhang等[42]規(guī)定這兩個(gè)拾取點(diǎn)之間的距離需要大于高斯分布半徑(20 ms),且拾取點(diǎn)的概率值大于0. 7。由于很多檢測的事件信噪比較低,拾取模型[42]的泛化能力不足夠完全正確拾取P 波和S 波到時(shí)。為了保證定位的準(zhǔn)確性,需要剔除拾取結(jié)果較差的事件。剔除標(biāo)準(zhǔn)為:①拾取網(wǎng)絡(luò)只拾取到單震相;②拾取的P 波或S波走時(shí)個(gè)數(shù)少于3 個(gè);③時(shí)窗內(nèi)包含多個(gè)事件。
經(jīng)過剔除拾取結(jié)果較差的事件后,最終定位得到的五分類和二分類微震事件數(shù)分別為2844 個(gè)和1789 個(gè)。文中利用網(wǎng)格搜索的方法進(jìn)行微地震定位。震源搜索深度為2900~3500 m ,水平方向?yàn)?~500 m,搜索間隔為2 m。定位結(jié)果如圖13 所示。定位結(jié)果分布在壓裂井的附近,較為合理,表明兩種模型的檢測結(jié)果均具有較高的準(zhǔn)確度。但五分類檢測方法檢測出了更多數(shù)量的微震事件,進(jìn)而可更好地監(jiān)測壓裂過程和評估壓裂效果。
4 結(jié)論與認(rèn)識
本文提出了一種基于殘差網(wǎng)絡(luò)的微地震事件五分類檢測方法。通過有針對性的數(shù)據(jù)增廣方法,用較少的標(biāo)注數(shù)據(jù)獲得了較高精度的訓(xùn)練模型,模型訓(xùn)練集精度達(dá)到99. 96%,驗(yàn)證集精度達(dá)到99. 82%。分別采用五分類與二分類算法對野外監(jiān)測的連續(xù)數(shù)據(jù)進(jìn)行檢測,并對檢測結(jié)果進(jìn)行到時(shí)拾取,用于微地震定位。測試結(jié)果表明,五分類檢測方法檢測出了更多數(shù)量的微震事件。
值得注意的是,針對信噪比較差的實(shí)際數(shù)據(jù),如果人工難以給出標(biāo)簽,可以先通過繞射疊加算法(不需要拾取P 波和S 波到時(shí))進(jìn)行部分震源定位[43],然后將能定位出事件的時(shí)窗作為訓(xùn)練樣本,并通過數(shù)據(jù)增廣方法擴(kuò)充數(shù)據(jù)集,從而用于模型的訓(xùn)練和后續(xù)壓裂數(shù)據(jù)的處理。此外,本文提出的五分類檢測算法的泛化性有待進(jìn)一步測試,未來可針對不同壓裂監(jiān)測數(shù)據(jù)特征進(jìn)行重新訓(xùn)練或者使用遷移學(xué)習(xí)算法以提高網(wǎng)絡(luò)模型的泛化能力。處理新的工區(qū)數(shù)據(jù)時(shí),只需獲得較少的微地震事件,通過文中采用的數(shù)據(jù)增廣方法,便可進(jìn)行模型訓(xùn)練。