戴永壽 高倩倩 孫偉峰 萬 勇 吳莎莎
(中國石油大學(華東)海洋與空間信息學院,山東青島 266580)
中國油氣勘探目標已由中、淺層逐漸轉(zhuǎn)入深層、超深層[1-2]。在西部地區(qū),以巖溶縫洞型、礁灘孔隙型、白云巖孔隙型和裂縫型為代表的特殊油氣藏,多具有圈閉復雜和儲層多樣的特征[3-4],對地球物理勘探技術(shù)提出了嚴峻的挑戰(zhàn),包括地表、地下“雙復雜”構(gòu)造的成像、地震信號隨深度增加發(fā)生非線性吸收衰減、低信噪比導致低頻有效信號受損等。低頻有效信號的缺失會導致地震剖面上出現(xiàn)虛假的高分辨率現(xiàn)象,從而降低后續(xù)地震反演、解釋的精度。因此人們提出了諸多地震數(shù)據(jù)低頻補償方法。
基于模型驅(qū)動的低頻補償方法主要分為三類。第一類為基于褶積模型的低頻補償方法。毛博等[5]利用不同區(qū)間內(nèi)反射系數(shù)序列與整體反射系數(shù)序列近似的這一現(xiàn)象,直接在頻域?qū)⒁阎硬ǖ牡皖l分量與缺失低頻成分的某區(qū)間內(nèi)反射系數(shù)相乘得到重構(gòu)的低頻分量;Yang等[6]通過求解L1范數(shù)正則化線性反問題估計格林函數(shù),再將格林函數(shù)與假設(shè)子波褶積重構(gòu)低頻數(shù)據(jù)。該類方法依賴子波為已知的假設(shè)。第二類為基于壓縮感知的低頻補償方法。韓立國等[7]和宋亞民等[8]利用壓縮感知求得反射系數(shù)振幅譜,再截取反射系數(shù)的低頻部分與原始信號其他部分的振幅譜進行幅值匹配,進而補償?shù)卣饠?shù)據(jù)低頻成分;丁燕等[9]在壓縮感知理論基礎(chǔ)上提出自適應(yīng)L1范數(shù)權(quán)重因子求取方法并構(gòu)建改進的寬帶俞式低通整形濾波器。第三類為基于波動方程的低頻補償方法。依賴地震記錄的包絡(luò)包含豐富的低頻信號[10],王鵬[11]通過提取地震數(shù)據(jù)中反映大尺度信息的地震包絡(luò)對常規(guī)地震數(shù)據(jù)的低頻成分進行補償。另外,妥軍軍等[12]針對三維地震數(shù)據(jù)提出二元插值方法,該方法適用于對空間上劇烈變化的目的層段的低頻補償處理;張紅軍等[13]應(yīng)用GeoEast系統(tǒng)形成了一套低頻配套處理技術(shù);公亭等[14]提出基于掃描信號的頻寬補償方法,該方法通過對零相位化后的理論與實際輸出進行匹配處理得到整形算子,再進行補償。雖然上述方法可以有效補償?shù)皖l,但仍存在依賴嚴格假設(shè)、參數(shù)調(diào)整不靈活或成本較高的問題,以致低頻補償效率較低,在實際中應(yīng)用受限。
深度學習近年來在各個領(lǐng)域中的應(yīng)用已較為成熟,這種基于數(shù)據(jù)驅(qū)動的方法也逐漸應(yīng)用于地震數(shù)據(jù)處理領(lǐng)域。Ovcharenko等[15]利用人工神經(jīng)網(wǎng)絡(luò),通過中高頻數(shù)據(jù)外推低頻數(shù)據(jù),但由于模型參數(shù)調(diào)整的局限性,容易導致補償后高頻段細節(jié)信息的損失;Sun等[16]利用深層卷積神經(jīng)網(wǎng)絡(luò)(CNN)從帶限數(shù)據(jù)中自動恢復缺失的低頻;毛博[17]利用CNN通過地震記錄中頻成分分別外推低頻和高頻成分;Ovcharenko等[18]利用U-Net網(wǎng)絡(luò)將中頻段時域圖像分段映射到低頻段實現(xiàn)低頻補償;Wang等[19]利用U-Net網(wǎng)絡(luò)針對不同頻帶和采樣間隔的地震數(shù)據(jù)進行低頻補償;Ovcharenko等[20]提出采用遷移學習方法通過重新訓練輕量化網(wǎng)絡(luò)MobileNet減少最優(yōu)架構(gòu)搜索和初始網(wǎng)絡(luò)訓練的計算量,以從單炮集的頻域中推斷出低頻數(shù)據(jù),并根據(jù)正則化反演對低頻成分進行有效且準確的判斷;Nakayama等[21]利用U-Net網(wǎng)絡(luò),輸入三維矩陣訓練,可同時實現(xiàn)信噪分離、缺失道重建和低頻補償。
由于單道地震記錄訓練樣本集的幅值差異較小,且均方誤差(MSE)損失函數(shù)求得的網(wǎng)絡(luò)輸出和標簽之間誤差的數(shù)量級也較小。因此,CNN在低頻補償中的應(yīng)用仍有兩個亟需解決的問題,一是梯度消失導致低頻欠補償;二是網(wǎng)絡(luò)容易過早收斂導致低頻補償精度低。為解決CNN在低頻補償中存在的不足,并進一步提高網(wǎng)絡(luò)的特征提取能力,本文提出一種結(jié)合改進CNN和雙約束損失函數(shù)的疊前地震數(shù)據(jù)低頻補償方法。對合成地震數(shù)據(jù)和中國西部X地區(qū)實際疊前地震數(shù)據(jù)進行低頻補償,并與基于CNN的低頻補償方法和反褶積結(jié)合寬帶俞式低通濾波器的低頻補償方法對比,驗證本文方法補償?shù)牡皖l有效信號優(yōu)勢。
本文提出的地震數(shù)據(jù)低頻補償方法分為神經(jīng)網(wǎng)絡(luò)訓練階段和實際地震數(shù)據(jù)處理階段。首先,使用高通濾波器濾除合成地震記錄低頻成分,建立缺失低頻的地震記錄訓練樣本集;然后,將訓練樣本集輸入到改進CNN模型進行訓練,得到可以實現(xiàn)低頻補償?shù)木W(wǎng)絡(luò)模型;最后,將缺失低頻地震數(shù)據(jù)輸入該網(wǎng)絡(luò),獲得低頻補償后的高分辨率地震數(shù)據(jù)。
由于時域地震記錄缺失低頻成分,導致低頻補償前、后幅值差異較小,往往需要采用深層CNN提取更高層次的特征。而隨著網(wǎng)絡(luò)層數(shù)的增加,網(wǎng)絡(luò)每一層提取的信息越來越多、參數(shù)量急劇增長,采用梯度下降法更新網(wǎng)絡(luò)參數(shù)時容易出現(xiàn)梯度消失問題,使權(quán)重和偏置無法繼續(xù)得到更新,以致網(wǎng)絡(luò)難以學習到細微差異,從而導致低頻欠補償。
為解決上述問題,提出一種對網(wǎng)絡(luò)結(jié)構(gòu)的改進方法,在不提高CNN計算復雜度的前提下,加入可直接學習輸入與輸出之間殘差特征的網(wǎng)絡(luò)單元,將其定義為殘差塊[22-23],主要由卷積(Conv)層、批歸一化(BN)層和跳躍連接組成。如圖1所示,x表示上一層網(wǎng)絡(luò)的輸出即殘差塊(ResBlock)的輸入,f(x)表示單個殘差塊中卷積層的輸出,F(xiàn)(x)=f(x)+x為殘差塊的輸出,經(jīng)非線性激活函數(shù)Relu后作為下一層輸入。右側(cè)是x的跳躍連接,可使網(wǎng)絡(luò)某一層的輸出不僅作為下一層的輸入,而且可以跨過幾層作為后面層的輸入,從而緩解層數(shù)增加帶來的梯度消失問題。同時,殘差塊中使用的BN層可在每層輸出對采樣的一小批數(shù)據(jù)都進行數(shù)據(jù)歸一化處理,使下一層的輸入數(shù)據(jù)量綱一致,使網(wǎng)絡(luò)對細微特征變化更敏感,從而提高網(wǎng)絡(luò)的收斂速度并降低模型對網(wǎng)絡(luò)初始化的要求。
圖1 殘差塊結(jié)構(gòu)
本文構(gòu)建的網(wǎng)絡(luò)架構(gòu)如圖2所示。在經(jīng)過兩部分卷積層處理后初步提取到地震記錄的低層次幅值特征,然后加入殘差塊,使網(wǎng)絡(luò)可以提取到更高層次幅值特征,并減少多層卷積、池化(MaxPool)的壓縮、采樣操作帶來的特征損失,避免梯度消失。最后經(jīng)全連接層(Fully Connected Layers, FC)恢復至原始數(shù)據(jù)維度后輸出。
圖2 改進的CNN網(wǎng)絡(luò)架構(gòu)
損失函數(shù)是計算網(wǎng)絡(luò)預測值和真實值之間誤差的函數(shù),是深度學習中用來衡量網(wǎng)絡(luò)模型品質(zhì)的指標之一,決定了反向傳播過程中梯度下降的方向,通過不斷地訓練、優(yōu)化使損失函數(shù)值達到最小,最終得到最優(yōu)的網(wǎng)絡(luò)模型。地震數(shù)據(jù)的低頻補償屬于非線性回歸問題,通常使用均方誤差作為損失函數(shù),即
(1)
式中:n表示地震記錄長度;di和Di分別表示原始地震記錄d和低頻補償后的地震記錄D在i時刻的值。
均方誤差損失函數(shù)雖然可以較好地反映預測值和真實值之間的差異,但由于時域地震信號的幅值差異數(shù)量級較小,梯度變化不明顯,造成網(wǎng)絡(luò)過早收斂從而陷入局部最優(yōu),導致低頻補償精度低。為解決這一問題,以原始與低頻補償后地震記錄的差異和相關(guān)度為優(yōu)化目標,提出一種改進的損失函數(shù),即通過均方誤差與皮爾遜距離的加權(quán)和建立雙約束條件下的損失函數(shù)計算補償誤差。
皮爾遜相關(guān)系數(shù)是用來度量兩個信號之間的相關(guān)度。首先通過計算協(xié)方差函數(shù)求得相關(guān)度,然后除以標準差是為了將變量統(tǒng)一到相同數(shù)量級下,避免數(shù)據(jù)量綱差異導致?lián)p失函數(shù)的振蕩,影響網(wǎng)絡(luò)的學習能力,可用來衡量原始與低頻補償后地震數(shù)據(jù)的相關(guān)度,其表達式為
(2)
由于皮爾遜相關(guān)系數(shù)值越大,相關(guān)度越高,而神經(jīng)網(wǎng)絡(luò)訓練時損失函數(shù)的值越小模型越優(yōu),因此使用皮爾遜距離1-ρd,D作為損失函數(shù)的一部分,與MSE的加權(quán)和作為損失函數(shù)
L=λ1MSE+λ2(1-ρd,D)
(3)
式中λ1和λ2為權(quán)重系數(shù)。
在保證MSE和皮爾遜距離所求值數(shù)量級一致的前提下,分配不同的權(quán)重進行加權(quán)求和,使二者對梯度的影響一致,避免梯度變化傾向于單個損失函數(shù),從而使模型對數(shù)據(jù)分布的大小和位置等特征都具備學習能力。參考熵值法根據(jù)各評價指標的影響進而確定權(quán)重的原理,分別對訓練過程中均方誤差和皮爾遜距離損失值的變化進行觀察,通過變化情況分配權(quán)重,損失變化小的分配較低的權(quán)重,損失變化大的分配較大的權(quán)重。由于二者變化程度相當,因此設(shè)置權(quán)重系數(shù)λ1和λ2均為1。采用梯度下降法使該損失函數(shù)取最小值時,可使網(wǎng)絡(luò)輸出和標簽之間的誤差變大,梯度變化更明顯,保證網(wǎng)絡(luò)在梯度下降過程中可跳出局部最優(yōu),從而提高低頻補償精度。
本文的結(jié)合改進CNN和雙約束條件下?lián)p失函數(shù)的地震數(shù)據(jù)低頻補償方法的實現(xiàn)步驟如下:
(1)使用高通濾波器濾除低頻成分以建立單道地震記錄訓練樣本集;
(2)為解決梯度消失導致低頻欠補償,在深層CNN中加入殘差塊和BN層構(gòu)建網(wǎng)絡(luò)模型;
(3)為提高網(wǎng)絡(luò)的收斂性能,將樣本集進行歸一化后輸入構(gòu)建的網(wǎng)絡(luò)模型;
(4)在雙約束條件下進行訓練,使梯度變化更明顯從而網(wǎng)絡(luò)跳出局部最優(yōu),提高補償精度;
(5)訓練完成后得到可以實現(xiàn)地震數(shù)據(jù)高精度補償?shù)木W(wǎng)絡(luò)模型;
(6)將合成地震記錄和實際疊前地震記錄輸入到網(wǎng)絡(luò)模型,驗證低頻成分的補償效果及對中、高頻信息的保護程度。
為驗證本文方法對地震數(shù)據(jù)低頻補償?shù)男Ч瑢铣傻卣饠?shù)據(jù)和中國西部X地區(qū)實際疊前地震數(shù)據(jù)進行低頻補償,并分別與基于CNN低頻補償方法(方法Ⅰ)、反褶積結(jié)合寬帶俞式低通濾波器的低頻補償方法(方法Ⅱ)進行對比。
為驗證方法的可行性和有效性,對合成地震數(shù)據(jù)進行了仿真實驗并對結(jié)果進行分析。由于實際地震數(shù)據(jù)低頻成分的缺失,無法作為標簽數(shù)據(jù),因此選取多個不同類型的合成地震炮記錄共15000道,每道截取750個樣點作為標簽。根據(jù)X地區(qū)實際疊前地震數(shù)據(jù)低頻缺失特點,用高通濾波器濾除10Hz以下低頻后作為網(wǎng)絡(luò)輸入。使用改進的CNN這種“端到端”網(wǎng)絡(luò)架構(gòu)提取地震記錄幅值特征,并考慮時頻分布,逐道進行濾波和補償,則網(wǎng)絡(luò)更注重地震數(shù)據(jù)的細節(jié)信息。網(wǎng)絡(luò)訓練過程中將批大小設(shè)置為50,初始學習率設(shè)置為10-4,訓練迭代次數(shù)為2000,每訓練200次學習率縮小10倍。這樣自動調(diào)整學習率,可以保證穩(wěn)定訓練的前提下,達到合理的訓練效率,并減少訓練時間。訓練結(jié)束后,對合成地震數(shù)據(jù)進行處理,通過對比低頻補償前、后的時域波形、頻譜曲線、子波波形和地震剖面驗證補償?shù)挠行院蜏蚀_性。
首先,驗證加入殘差塊對提高網(wǎng)絡(luò)特征提取能力的有效性。圖3為加入殘差塊前、后損失函數(shù)隨迭代次數(shù)的變化曲線,可以看出,加入殘差后損失函數(shù)值下降更快,表明網(wǎng)絡(luò)對細微變化的特征提取能力更強,從而提高了訓練效率。
圖3 加入殘差塊前、后損失函數(shù)變化曲線對比
然后,在網(wǎng)絡(luò)加入殘差塊后,對損失函數(shù)改進前、后的低頻補償結(jié)果進行對比。圖4為迭代次數(shù)為500時使用雙約束損失函數(shù)與僅使用MSE作為損失函數(shù)的低頻補償時域波形對比,可以明顯看出,使用改進后損失函數(shù)訓練得到的網(wǎng)絡(luò)模型低頻補償后的地震記錄(圖4b)與原始地震記錄之間的誤差更小,相似度更高,表明低頻補償精度更高。
圖4 損失函數(shù)改進前(a)、后(b)單道地震記錄低頻補償結(jié)果的波形對比
最后,分別與方法Ⅰ和方法Ⅱ的低頻補償結(jié)果進行對比,如圖5和表1所示。本文方法處理后的地震記錄與原始地震記錄之間的MSE和平均絕對誤差(MAE)都最小,補償后地震記錄波形主瓣振幅下降且旁瓣振蕩幅度減小。由低頻補償前、后頻譜曲線(圖6)可以明顯看出,三種方法都可以對低頻成分進行一定的補償,但本文方法處理后,低頻補償?shù)木雀?,即在補償?shù)皖l成分的同時不會損傷中、高頻信息,從而保證了補償后的有效信號中不增加噪聲干擾。利用基于經(jīng)驗?zāi)B(tài)分解的子波提取方法[24]提取低頻補償前、后的子波波形(圖7),對比可見,低頻補償處理后,子波主瓣幅度上升,旁瓣振蕩幅度減小,且本文方法低頻補償處理后的子波與原始子波形態(tài)最接近。
圖5 合成數(shù)據(jù)三種方法低頻補償前、后波形對比
表1 合成數(shù)據(jù)三種方法補償結(jié)果時域準確性對比
圖6 合成數(shù)據(jù)三種方法低頻補償前、后頻譜對比
圖7 合成數(shù)據(jù)三種方法低頻補償前、后子波波形對比
地震數(shù)據(jù)低頻信號反映地質(zhì)體整體包絡(luò),中頻信號反映地質(zhì)體內(nèi)部的基本形態(tài),高頻信號反映地質(zhì)體構(gòu)造細節(jié)[25]。圖8a為原始合成地震剖面,圖8b為經(jīng)過10Hz高通濾波后的結(jié)果。利用本文方法、方法Ⅰ和方法Ⅱ?qū)D8b數(shù)據(jù)進行低頻補償,結(jié)果如圖9所示,可見,本文方法能在不損失有效信號的前提下,使補償后的剖面同相軸能量增強(圖9a紅框和黃框所示)。三種方法低頻補償結(jié)果與原始合成數(shù)據(jù)的差值剖面如圖10所示,與方法Ⅰ(圖10b)和方法Ⅱ(圖10c)相比,本文方法補償?shù)牡皖l成分誤差更小(圖10a),有效低頻信號能量得到增強,同時地層細節(jié)信息也得到較好的保留。利用結(jié)構(gòu)相似度(SSIM)和整體MSE作為定量評價指標(表2),與方法Ⅰ和方法Ⅱ相比,本文方法處理結(jié)果的SSIM分別高出1.1%和2.4%,MSE分別低95.9%和87.7%,從整體差異和結(jié)構(gòu)兩個方面都說明了與原始地震剖面更具相似性。上述分析表明,本文方法更準確、更優(yōu)越。
圖8 合成數(shù)據(jù)地震剖面(a)及其高通濾波結(jié)果(b)
圖9 合成數(shù)據(jù)三種方法低頻補償結(jié)果對比
表2 合成數(shù)據(jù)三種方法補償結(jié)果統(tǒng)計
圖10 合成數(shù)據(jù)三種方法低頻補償結(jié)果與原始合成數(shù)據(jù)的差值剖面對比
對比X地區(qū)本文方法低頻補償前、后單道地震記錄的時域波形(圖11a)可以看出,低頻補償后波形的空間位置并未發(fā)生明顯變化,且波形振蕩幅度減?。粚Ρ鹊皖l補償前、后頻譜曲線(圖11b)可以看出,低頻成分得到了一定的補償,且中、高頻成分基本不變保持;提取補償前、后的地震子波(圖11c),可見,低頻補償后子波主瓣幅度上升,旁瓣減少且振蕩幅度減小。圖12為低頻補償前、后的地震道集及差值,可見,低頻補償后豐富了同相軸信息,且同相軸更細、更清晰、更連續(xù)(圖12b紅框和黃框所示),表明地震數(shù)據(jù)的低頻能量得到有效提高,能夠更準確地反映地層結(jié)構(gòu)。差值道集的能量強度表明,補償后,豐富了有效低頻信號,提高了整體分辨率,說明本文方法能夠有效且準確地補償實際地震數(shù)據(jù)的低頻信息。
圖11 實際地震數(shù)據(jù)本文方法低頻補償前、后對比
圖12 實際地震道集本文方法低頻補償結(jié)果
本文提出一種結(jié)合改進CNN和雙約束損失函數(shù)的疊前地震數(shù)據(jù)低頻補償方法。首先,在CNN中引入殘差塊和批歸一化層,解決了增加網(wǎng)絡(luò)層數(shù)提取高層次特征時出現(xiàn)的梯度消失問題,使網(wǎng)絡(luò)對細微變化更敏感,提高了網(wǎng)絡(luò)特征提取能力和收斂速度。其次,利用均方誤差和皮爾遜距離建立雙約束條件下的損失函數(shù),提升了網(wǎng)絡(luò)輸出和標簽之間的差距,使梯度變化更明顯,保證梯度下降過程中跳出局部最優(yōu),網(wǎng)絡(luò)模型得到進一步優(yōu)化,解決了均方誤差損失函數(shù)數(shù)量級較小導致網(wǎng)絡(luò)過早收斂的問題,提高了低頻補償精度。合成地震數(shù)據(jù)和中國西部地區(qū)實際疊前地震數(shù)據(jù)的處理結(jié)果都驗證了本文方法的有效性和準確性。與基于CNN的低頻補償方法及反褶積結(jié)合寬帶俞式低通濾波器的低頻補償方法相比,本文方法的補償精度更高,具有一定的實際應(yīng)用價值。