張巖,周一帆,宋利偉,董宏麗
(1.東北石油大學(xué)計(jì)算機(jī)與信息技術(shù)學(xué)院,黑龍江大慶 163318; 2.東北石油大學(xué)物理與電子工程學(xué)院,黑龍江大慶 163318; 3.東北石油大學(xué)人工智能能源研究院,黑龍江大慶 163318)
當(dāng)今油氣資源勘探的重心逐漸向復(fù)雜構(gòu)造、碳酸鹽巖和非常規(guī)儲(chǔ)層等領(lǐng)域轉(zhuǎn)移[1-2],對(duì)地下構(gòu)造成像質(zhì)量的要求越來(lái)越高。在地震勘探中,頻帶寬度對(duì)地震數(shù)據(jù)十分重要,特別是地震數(shù)據(jù)低頻部分?jǐn)y帶信息的可靠度要遠(yuǎn)大于高頻部分。低頻成分的質(zhì)量很大程度上決定了深部地層的成像效果[3-7]。
目前,速度分析、層析成像和全波形反演是利用采集到的地震數(shù)據(jù)進(jìn)行物性反演的主要方法。其中全波形反演綜合利用地震波場(chǎng)的運(yùn)動(dòng)學(xué)特征與動(dòng)力學(xué)特征,是目前公認(rèn)的地震勘探領(lǐng)域精度最高的反演方法[8]。全波形反演是強(qiáng)非線性的,極其依賴(lài)初始條件,如初始速度模型和地震數(shù)據(jù)的低頻分量[9-11]。然而在實(shí)際地震數(shù)據(jù)采集過(guò)程中,由于大地的濾波作用和人工震源自身局限性,以及檢波器畸變等干擾,采集到的地震數(shù)據(jù)通常損失大量低頻成分,使全波形反演結(jié)果易陷入局部極小值,極大降低了地震信號(hào)處理與解釋的精度。
盡管在解決地震數(shù)據(jù)低頻信息缺失問(wèn)題上,新的低頻可控震源取得較大進(jìn)展,實(shí)現(xiàn)可控震源的寬頻激發(fā),并采用“兩寬一高”地震勘探技術(shù)進(jìn)行地震數(shù)據(jù)采集、處理,大幅度提高了地震資料品質(zhì)[12],但由于其施工成本較高而無(wú)法作為常規(guī)震源。對(duì)于大量通過(guò)常規(guī)震源和技術(shù)采集到的地震數(shù)據(jù),進(jìn)行低頻恢復(fù)主要有兩類(lèi)方法:
(1)基于模型驅(qū)動(dòng)的方法??刹殚喌拇硇晕墨I(xiàn)包括:管路平等[13]利用可靠的中間頻帶對(duì)低頻部分做自回歸預(yù)測(cè),通過(guò)正向、反向誤差和最小原則進(jìn)行頻譜外推[14]; Smith等[15]利用連續(xù)小波變換拓展地震數(shù)據(jù)的有效帶寬,補(bǔ)償?shù)卣饠?shù)據(jù)低頻段; 韓立國(guó)等[16]基于壓縮感知理論建立并求解L1范數(shù)約束的稀疏反演問(wèn)題,實(shí)現(xiàn)地震數(shù)據(jù)的低頻補(bǔ)償; 張盼等[17]通過(guò)利用被動(dòng)源地震數(shù)據(jù)的低頻信息重構(gòu)主動(dòng)源地震數(shù)據(jù)的低頻缺失部分,實(shí)現(xiàn)能量匹配的低頻補(bǔ)償,但被動(dòng)源噪聲干擾嚴(yán)重而難以去除; 魏繼東[18]利用反褶積方法恢復(fù)低頻成分,但同時(shí)增加了相應(yīng)(有效頻段外)的噪聲,降低了數(shù)據(jù)的信噪比,應(yīng)用難度較大; 丁燕等[2]基于壓縮感知理論,通過(guò)自適應(yīng)計(jì)算L1范數(shù)權(quán)重因子并構(gòu)建改進(jìn)的俞式低通整形濾波器以補(bǔ)償?shù)卣鸬皖l信息; 毛博等[19]通過(guò)相似性現(xiàn)象結(jié)合褶積與反褶積原理重構(gòu)地震低頻數(shù)據(jù)。此類(lèi)低頻恢復(fù)方法的基本原理為利用地震波傳播過(guò)程物理參數(shù)(振幅、頻譜)的變化規(guī)律進(jìn)行建模并求解。實(shí)際應(yīng)用時(shí)容易出現(xiàn)子波求取困難、噪聲干擾嚴(yán)重、參數(shù)求解復(fù)雜等問(wèn)題。
(2)基于數(shù)據(jù)驅(qū)動(dòng)的方法。目前深度學(xué)習(xí)的方法在地球物理領(lǐng)域得到快速發(fā)展,在巖性識(shí)別[20]、斷層識(shí)別[21]、數(shù)據(jù)去噪[22]等領(lǐng)域都取得相應(yīng)研究成果,表明深度學(xué)習(xí)方法在地球物理應(yīng)用中具有很強(qiáng)的適應(yīng)性。Ovcharenko等[23]對(duì)隨機(jī)地下模型的海洋地震勘探進(jìn)行數(shù)值模擬并利用深度卷積神經(jīng)網(wǎng)絡(luò)完成中高頻—低頻的映射,通過(guò)波數(shù)分析得到單炮二維地震數(shù)據(jù)比單道一維地震數(shù)據(jù)低頻外推具有更廣泛的適用性。Fang等[24]構(gòu)建了12層的CNN網(wǎng)絡(luò),通過(guò)輸入中高頻的二維模擬地震數(shù)據(jù)預(yù)測(cè)相應(yīng)的低頻數(shù)據(jù),并在反演測(cè)試中取得了較好的應(yīng)用結(jié)果; Ovcharenko等[25]利用U-Net神經(jīng)網(wǎng)絡(luò)完成二維地震數(shù)據(jù)從中高頻—低頻的非線性映射,實(shí)現(xiàn)了地震數(shù)據(jù)的低頻恢復(fù)。毛博[26]通過(guò)搭建卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)單道地震數(shù)據(jù)的低頻拓展,網(wǎng)絡(luò)的輸出與真實(shí)地震數(shù)據(jù)低頻分量較接近。Nakayama 等[27]在監(jiān)督學(xué)習(xí)框架下設(shè)計(jì)深度卷積神經(jīng)網(wǎng)絡(luò),通過(guò)時(shí)域進(jìn)行地震數(shù)據(jù)低頻外推,外推頻率與先前存在的頻率之間的誤差較小。隨后,Sun等[28]合成多分量彈性波低頻地震數(shù)據(jù),設(shè)計(jì)卷積神經(jīng)網(wǎng)絡(luò)并通過(guò)擴(kuò)大卷積獲取大的感受野,利用粒子速度的垂直分量和水平分量?jī)蓚€(gè)數(shù)據(jù)集在時(shí)域做數(shù)據(jù)低頻外推且獲得較好效果。Jin等[29]基于稀疏促進(jìn)帶寬拓展算法提出了低頻外推漸進(jìn)式遷移深度學(xué)習(xí)算法,具有較高效率和精度,并有較強(qiáng)泛化能力。Zhang等[30]通過(guò)將測(cè)井?dāng)?shù)據(jù)與地震數(shù)據(jù)相結(jié)合,利用深度卷積神經(jīng)網(wǎng)絡(luò)的非線性映射能力將疊后地震數(shù)據(jù)映射到更寬頻帶并得到阻抗,取得了較好效果。上述深度學(xué)習(xí)網(wǎng)絡(luò)可較好地恢復(fù)低頻地震數(shù)據(jù)的時(shí)域信息,主要問(wèn)題在于忽略了地震波傳播過(guò)程頻率與相位等物理參數(shù)的變化規(guī)律,導(dǎo)致恢復(fù)的地震數(shù)據(jù)低頻部分中頻率和相位信息的精度不高。
針對(duì)該問(wèn)題,為了提高地震數(shù)據(jù)低頻延拓的精度,本文根據(jù)物理模型約束數(shù)據(jù)驅(qū)動(dòng)的思想,提出改進(jìn)殘差模塊的U-Net卷積神經(jīng)網(wǎng)絡(luò),通過(guò)地震信號(hào)傳播過(guò)程的物理參數(shù)聯(lián)合約束,在提高信噪比的同時(shí),保持低頻地震信號(hào)頻率、相位信息。
深度學(xué)習(xí)的應(yīng)用領(lǐng)域不斷拓展,在地震數(shù)據(jù)處理方面得到廣泛使用。目前應(yīng)用深度卷積神經(jīng)網(wǎng)絡(luò)解決地震數(shù)據(jù)低頻延拓問(wèn)題的方法過(guò)程歸納如下。
1.1.1 樣本組織
設(shè)網(wǎng)絡(luò)模型為Net,通過(guò)監(jiān)督學(xué)習(xí)大量中高頻地震數(shù)據(jù)與低頻地震數(shù)據(jù)的非線性映射關(guān)系,得到訓(xùn)練好的網(wǎng)絡(luò)模型。輸入中高頻地震測(cè)試數(shù)據(jù),生成預(yù)測(cè)的低頻地震數(shù)據(jù)
(1)
式中θ為網(wǎng)絡(luò)參數(shù)。
1.1.2 神經(jīng)網(wǎng)絡(luò)拓頻原理
在有監(jiān)督學(xué)習(xí)過(guò)程中,神經(jīng)網(wǎng)絡(luò)通過(guò)訓(xùn)練大量樣本數(shù)據(jù)學(xué)習(xí)與標(biāo)簽的映射關(guān)系,它以S上的平均損失作為經(jīng)驗(yàn)風(fēng)險(xiǎn),記為
(2)
式中:L為損失函數(shù);Ns為訓(xùn)練集樣本數(shù)量。神經(jīng)網(wǎng)絡(luò)算法以最小化經(jīng)驗(yàn)風(fēng)險(xiǎn)為目標(biāo),通過(guò)大量數(shù)據(jù)為驅(qū)動(dòng)而建立模型。低頻延拓的目標(biāo)是從已知的大量中高頻地震數(shù)據(jù)和低頻地震數(shù)據(jù)中建立非線性映射關(guān)系,然后對(duì)未知樣本進(jìn)行回歸預(yù)測(cè)。因此,在經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化的指導(dǎo)下,用于地震數(shù)據(jù)低頻延拓的網(wǎng)絡(luò)優(yōu)化目標(biāo)函數(shù)J為
(3)
針對(duì)J,直接求取卷積神經(jīng)網(wǎng)絡(luò)的最優(yōu)解相對(duì)困難,通常使用梯度下降法利用迭代思想逼近最優(yōu)解,并將網(wǎng)絡(luò)參數(shù)θt+1表示為
θt+1=θt+μ[θi=1,2,…,tJ(x,θi,y)]
(4)
式中:θt為第t次迭代后神經(jīng)網(wǎng)絡(luò)參數(shù);μ指更新方向;θi=1,2,…,t為J相對(duì)于參數(shù)θi的梯度。
1.1.3 損失函數(shù)設(shè)計(jì)
神經(jīng)網(wǎng)絡(luò)在訓(xùn)練學(xué)習(xí)期間,用損失函數(shù)表征模型預(yù)測(cè)輸出的低頻成分與真實(shí)的低頻成分的擬合程度。常見(jiàn)的損失函數(shù)的計(jì)算方法有平均絕對(duì)值誤差(Mean Absolute Error,MAE)和均方誤差(Mean Square Error,MSE),分別稱(chēng)為L(zhǎng)1loss和L2loss,具體定義式分別為
(5)
(6)
目前此類(lèi)純數(shù)據(jù)驅(qū)動(dòng)的、利用深度學(xué)習(xí)模型進(jìn)行地震數(shù)據(jù)低頻恢復(fù)的方法,避免了傳統(tǒng)方法假設(shè)條件苛刻、求取參數(shù)復(fù)雜等問(wèn)題,并且結(jié)果具有一定可靠性。但深度學(xué)習(xí)本質(zhì)是一個(gè)優(yōu)化問(wèn)題,求解地震勘探中低頻延拓具有多解性,將地震波傳輸過(guò)程中的物理參數(shù)變化規(guī)律作為約束降低多解性是一個(gè)重要方法。
全波形反演將地質(zhì)勘探中的反演問(wèn)題,轉(zhuǎn)換為以正演模擬數(shù)據(jù)和觀測(cè)數(shù)據(jù)殘差的L2范數(shù)誤差最小的優(yōu)化問(wèn)題,屬于一個(gè)強(qiáng)非線性問(wèn)題。通過(guò)Born近似[31],將地震數(shù)據(jù)的擾動(dòng)與地下介質(zhì)模型參數(shù)的擾動(dòng)線性化。由Born近似可知,全波形反演的誤差主要由高階散射引起,高階散射場(chǎng)對(duì)總場(chǎng)影響越小,Born近似越容易滿足。因此,低頻波場(chǎng)在Born近似下的誤差較小,有利于全波形反演的進(jìn)行。
地震波是非平穩(wěn)信號(hào),波形、頻率和相位實(shí)際上是隨時(shí)間具有一定的變化規(guī)律。這種變化規(guī)律反映地震波在地下傳播介質(zhì)的位置、結(jié)構(gòu)和地層巖性等信息[32],且頻率和相位信息對(duì)精確的反演同樣十分重要[33]。在地震勘探逐漸向高精度、高保真發(fā)展的情況下,準(zhǔn)確地恢復(fù)地震數(shù)據(jù)的波形、頻率和相位是一個(gè)發(fā)展趨勢(shì)。
傅里葉變換是地震數(shù)據(jù)頻譜分析的主要工具??焖俑道锶~變換(Fast Fourier Transform,F(xiàn)FT)是利用計(jì)算機(jī)實(shí)現(xiàn)離散傅里葉變換(Discrete Fourier Transform,DFT)的高效、快速計(jì)算方法。設(shè)第i道地震數(shù)據(jù)xi的采樣點(diǎn)數(shù)為N,采樣頻率為Fs,其傅里葉變換后展開(kāi)為復(fù)數(shù)形式
k=0,1,…,N-1
(7)
由歐拉定理可得實(shí)部和虛部分別為
(8)
(9)
那么振幅譜和相位譜計(jì)算公式分別為
|f[k]|
(10)
(11)
式中:|f[k]|為每一道地震數(shù)據(jù)中不同頻率對(duì)應(yīng)波形能量;φ[k]為不同頻率對(duì)應(yīng)的相位值。
由圖1可見(jiàn):地震信號(hào)在時(shí)域上的信息僅描述波形能量隨時(shí)間變化規(guī)律; 而振幅譜包含主要波形的頻率成分信息,更重要的是與信號(hào)的相位譜描述一定的頻譜成分和波形的運(yùn)動(dòng)狀態(tài),三者結(jié)合可更完備地表征地震信號(hào)的信息。
圖1 一維信號(hào)的波形(a)、振幅譜(b)和相位譜(c)
地球物理勘探領(lǐng)域的應(yīng)用場(chǎng)景相對(duì)于傳統(tǒng)深度學(xué)習(xí)領(lǐng)域而言,更具有復(fù)雜性??紤]地震數(shù)據(jù)樣本的特殊性,有針對(duì)性地改進(jìn)傳統(tǒng)通用網(wǎng)絡(luò)模型可有效提高結(jié)果的準(zhǔn)確性。
U-Net網(wǎng)絡(luò)是Ronneberger等[34]在2015年提出的網(wǎng)絡(luò)結(jié)構(gòu),最初用于醫(yī)學(xué)圖像分割,是一種經(jīng)典的編—解碼器結(jié)構(gòu),該網(wǎng)絡(luò)在地震數(shù)據(jù)超分辨率[35]、地震斷層檢測(cè)[36-37]和地震相識(shí)別[38]等應(yīng)用中具有較好效果。
U-Net網(wǎng)絡(luò)結(jié)構(gòu)包括三個(gè)主要部分: ①下采樣——網(wǎng)絡(luò)中前半部分進(jìn)行4次下采樣,每次由兩個(gè)3×3的卷積層、兩個(gè)ReLU激活函數(shù)及一個(gè)最大池化層組成,主要功能是進(jìn)行特征提取與壓縮; ②上采樣——后半部分進(jìn)行4次上采樣,每次由兩個(gè)3×3的卷積層、兩個(gè)ReLU激活函數(shù)及一個(gè)反卷積操作組成,主要功能是進(jìn)行數(shù)據(jù)恢復(fù)與重建; ③特征融合——U-Net網(wǎng)絡(luò)在每一次上采樣后都會(huì)與對(duì)應(yīng)特征提取部分相同尺度的特征圖在通道上進(jìn)行拼接。但淺層網(wǎng)絡(luò)描述的是結(jié)構(gòu)特征,與上采樣部分的高級(jí)語(yǔ)義特征具有一定的差別,直接拼接容易影響網(wǎng)絡(luò)的后續(xù)處理效果。
為保持低頻信息的主要特征,本文對(duì)U-Net網(wǎng)絡(luò)進(jìn)行以下改進(jìn)(圖2):
(1)通過(guò)對(duì)稱(chēng)補(bǔ)零操作使卷積前后的數(shù)據(jù)大小不變,避免特征融合時(shí)的裁剪操作,加強(qiáng)對(duì)地震數(shù)據(jù)邊緣特征的提取;
(2)在卷積層與激活函數(shù)之間加入批標(biāo)準(zhǔn)化層(Batch Normalization layer,BN),以加快網(wǎng)絡(luò)收斂速度,減小對(duì)初始化參數(shù)的依賴(lài),提高網(wǎng)絡(luò)泛化能力;
(3)激活函數(shù)用來(lái)提高神經(jīng)網(wǎng)絡(luò)模型的非線性表達(dá)能力,考慮到地震數(shù)據(jù)的類(lèi)型為實(shí)數(shù),而使用ReLU激活函數(shù)會(huì)使網(wǎng)絡(luò)中過(guò)多的神經(jīng)元失活(輸出為0),因此本文使用LeakyReLU激活函數(shù);
(4)利用殘差模塊(圖2中Res部分)縮小下采樣與上采樣的語(yǔ)義差別,使網(wǎng)絡(luò)模型能更容易學(xué)習(xí)低頻信息特征。圖3所示殘差模塊結(jié)構(gòu)由兩組卷積、BN和LeakyReLU激活函數(shù)構(gòu)成,以提高網(wǎng)絡(luò)特征融合的效果,改進(jìn)傳統(tǒng)U-Net的跳躍連接。
圖2 本文改進(jìn)的U-Net網(wǎng)絡(luò)模型
圖3 Res殘差塊結(jié)構(gòu)
損失函數(shù)是深度神經(jīng)網(wǎng)絡(luò)優(yōu)化目標(biāo)的學(xué)習(xí)準(zhǔn)則,在一定程度上決定了網(wǎng)絡(luò)的優(yōu)化方向與解空間的大小,因此損失函數(shù)與實(shí)際問(wèn)題的關(guān)聯(lián)程度非常重要。本文通過(guò)設(shè)計(jì)聯(lián)合損失函數(shù)實(shí)現(xiàn)地震波物理參數(shù)多維度的約束,進(jìn)一步提高改進(jìn)后U-Net網(wǎng)絡(luò)模型的低頻延拓效果。
聯(lián)合損失函數(shù)由時(shí)域、頻率、相位3個(gè)維度的誤差組成。其中,時(shí)域誤差使用L2loss計(jì)算方法,而在頻率、相位損失上使用L1loss計(jì)算方法,保證網(wǎng)絡(luò)能充分學(xué)習(xí)到地震波傳播過(guò)程中的3個(gè)維度物理參數(shù)及其變換規(guī)律?;谖锢砑s束的聯(lián)合損失函數(shù)由加權(quán)平均的形式定義為
(12)
式中:f、φ分別為振幅譜和相位譜算子;α、β分別是振幅譜和相位譜的權(quán)重系數(shù)。本文整體的網(wǎng)絡(luò)處理流程如圖4所示。
圖5 樣本數(shù)據(jù)展示
本文基于Pytorch框架搭建網(wǎng)絡(luò)模型,網(wǎng)絡(luò)訓(xùn)練采用Adam算法優(yōu)化目標(biāo)函數(shù),學(xué)習(xí)率設(shè)置為0.01。迭代次數(shù)(Epoch)為300,批大小為8,網(wǎng)絡(luò)輸入輸出均為400×200?;謴?fù)效果的衡量標(biāo)準(zhǔn)用均方誤差MSE和信噪比(Signal to Noise Ratio,SNR)表征,對(duì)應(yīng)表達(dá)式為
(13)
(14)
兩式中:M為時(shí)間采樣總數(shù);N此處為地震道采樣總數(shù);yt,s為y中坐標(biāo)為(t,s)的采樣點(diǎn)值。
3.3.1 約束函數(shù)測(cè)試
本文將物理約束通過(guò)損失函數(shù)結(jié)合到深度學(xué)習(xí)網(wǎng)絡(luò)中并對(duì)權(quán)重參數(shù)進(jìn)行調(diào)整,在保證延拓的低頻地震數(shù)據(jù)時(shí)域部分具有較好恢復(fù)效果的基礎(chǔ)上,提高振幅譜和相位譜的效果。而多約束聯(lián)合損失函數(shù)優(yōu)化在機(jī)器學(xué)習(xí)中屬于多任務(wù)學(xué)習(xí)范疇,通過(guò)利用相關(guān)任務(wù)訓(xùn)練特征中包含的特定維度信息(振幅譜和相位譜)改善網(wǎng)絡(luò)性能及泛化。由于不同約束的損失值對(duì)網(wǎng)絡(luò)的影響不同,對(duì)應(yīng)的數(shù)量級(jí)很可能存在較大差異,因此將各部分聯(lián)合損失直接相加的方式可能導(dǎo)致多任務(wù)學(xué)習(xí)過(guò)程被某個(gè)任務(wù)所主導(dǎo)而偏離網(wǎng)絡(luò)的逼近方向。本文結(jié)合多任務(wù)學(xué)習(xí)的思想與實(shí)踐經(jīng)驗(yàn)實(shí)現(xiàn)地震數(shù)據(jù)低頻延拓聯(lián)合約束損失函數(shù)的權(quán)重參數(shù)分析與調(diào)整。
首先測(cè)試地震波物理參數(shù)對(duì)網(wǎng)絡(luò)模型的約束效果。將只采用時(shí)域約束的模型Ⅰ、聯(lián)合相位譜約束的模型Ⅱ、聯(lián)合振幅譜約束的模型Ⅲ及同時(shí)聯(lián)合振幅譜、相位譜約束的模型Ⅳ進(jìn)行對(duì)比測(cè)試,各約束的損失函數(shù)權(quán)重參數(shù)均設(shè)為1。訓(xùn)練時(shí)在時(shí)域上初次損失值達(dá)到104~105數(shù)量級(jí),而在振幅譜和相位譜上初次損失值數(shù)量級(jí)在102。在訓(xùn)練集上每訓(xùn)練3次在驗(yàn)證集上驗(yàn)證1次,共驗(yàn)證100次。驗(yàn)證集上SNR曲線如圖6所示,可見(jiàn)模型Ⅱ和模型Ⅲ的SNR高于模型Ⅰ,但模型Ⅲ的SNR曲線整體波動(dòng)幅度較大; 而模型Ⅳ的SNR略高于模型Ⅰ,說(shuō)明加入物理參數(shù)約束對(duì)模型效果產(chǎn)生一定的影響。具體在時(shí)域、振幅譜和相位譜上的MSE指標(biāo)如表1所示。
圖6 不同模型SNR曲線對(duì)比
表1 不同模型測(cè)試結(jié)果MSE
由表1可見(jiàn)模型Ⅱ、模型Ⅲ在時(shí)域、振幅譜、相位譜的MSE均低于模型Ⅰ,且具有較高的SNR,說(shuō)明網(wǎng)絡(luò)在低頻地震信號(hào)恢復(fù)處理過(guò)程中,結(jié)合振幅譜、相位譜約束的引導(dǎo)具有較好效果,但后者約束的有效性高于前者。原因在于,震源激發(fā)的地震波在地下介質(zhì)中傳播過(guò)程中,在地質(zhì)界面處發(fā)生散射和反射后由檢波器接收,振幅譜體現(xiàn)的是不同頻率成分的能量,同類(lèi)地質(zhì)模型和震源條件下觀測(cè)得到的地震數(shù)據(jù)振幅譜分布具有一定的相似性,而相位譜反映信號(hào)在空間的狀態(tài)信息,可更充分表征地下介質(zhì)的差異。模型Ⅳ在時(shí)域和振幅譜的MSE低于模型Ⅰ,高于模型Ⅱ、模型Ⅲ,原因在于多約束條件下結(jié)果偏向均衡化,影響低頻延拓整體結(jié)果,通過(guò)進(jìn)一步研究不同約束權(quán)重的合理比例,提高最終效果。
2.3.2 權(quán)重比例設(shè)置
為考察不同權(quán)重參數(shù)對(duì)網(wǎng)絡(luò)性能的影響,分別進(jìn)行不同比例實(shí)驗(yàn)測(cè)試。對(duì)于模型Ⅱ,分析各約束損失值的數(shù)量級(jí),要保證時(shí)域損失為主要loss,因此β值控制在100以?xún)?nèi)。通過(guò)分段評(píng)估的方法,相位譜約束權(quán)重β分別設(shè)置為5、10、20、50、100進(jìn)行對(duì)比,結(jié)果如表2所示,可以看出:
表2 模型Ⅱ不同權(quán)重時(shí)MSE與SNR
(1)當(dāng)β=5、10、20、50時(shí),相位的MSE均低于β=1時(shí),β=10時(shí)最小,β=5時(shí)時(shí)域和振幅譜MSE值最小,但隨著權(quán)重的增大,時(shí)域與振幅譜MSE有升高的趨勢(shì),導(dǎo)致SNR降低,其中在β=50時(shí)時(shí)域和振幅譜MSE值相對(duì)較大;
(2)當(dāng)β=100時(shí),時(shí)域、振幅譜和相位譜的MSE都有增加的趨勢(shì),導(dǎo)致SNR相對(duì)較低。
為方便展示實(shí)驗(yàn)效果,給出β=1、10、100時(shí)網(wǎng)絡(luò)訓(xùn)練過(guò)程中后60次驗(yàn)證在時(shí)域上的loss值曲線和100次驗(yàn)證在相位上的loss值曲線(未乘β,圖7)。由圖7a可知,當(dāng)β=1時(shí),時(shí)域的loss曲線有小幅波動(dòng),當(dāng)β為10和100時(shí),loss曲線波動(dòng)較大但后期較為平穩(wěn),且當(dāng)β=10時(shí)loss最??; 同樣圖7b相位譜loss曲線中,β=10時(shí)曲線下降最快。由此也說(shuō)明β過(guò)大會(huì)影響時(shí)域和相位譜的恢復(fù)效果,但適當(dāng)增大可以在保證時(shí)域恢復(fù)的情況下提高相位譜的恢復(fù)效果。
圖7 模型Ⅱ不同權(quán)重在時(shí)域(a)和相位譜(b)上的驗(yàn)證loss曲線
結(jié)果表明,合理設(shè)定β取值范圍(100以?xún)?nèi))模型效果優(yōu)于不聯(lián)合物理約束情況,地震數(shù)據(jù)低頻延拓效果得到相應(yīng)提升,再次說(shuō)明物理約束的有效性。而在調(diào)節(jié)β取值時(shí)發(fā)現(xiàn),當(dāng)β≤20時(shí)相較于不加物理約束,結(jié)果在時(shí)域、振幅譜和相位譜上的誤差均有大幅度減小;雖然和β=1相比,在時(shí)域和振幅譜上的誤差有上升趨勢(shì),但在相位譜上誤差有相應(yīng)的減小,且減小幅度相對(duì)較大,使得低頻延拓在相位譜恢復(fù)上的效果較好。
顯然,適當(dāng)提高β的比例(20以?xún)?nèi)較為合理)可以強(qiáng)化低頻延拓結(jié)果在相位譜上的精度,但β的比例過(guò)大(50、100)會(huì)較大影響時(shí)域與振幅譜的效果,甚至對(duì)相位譜的恢復(fù)會(huì)起到反作用。
為進(jìn)一步分析振幅譜和相位譜聯(lián)合約束的合理性,在模型Ⅳ的基礎(chǔ)上分別對(duì)振幅譜約束權(quán)重參數(shù)與相位譜約束權(quán)重參數(shù)β,進(jìn)行不同的配比測(cè)試,α∶β=1∶1為初始權(quán)重,共設(shè)置了13組對(duì)比實(shí)驗(yàn),結(jié)果如表3。對(duì)比表3中結(jié)果可得出:
表3 模型Ⅳ不同權(quán)重下MSE與SNR
(1)當(dāng)α<β時(shí),相位譜的MSE比初始權(quán)重情況下有所降低,當(dāng)α∶β=5∶10時(shí)降低到最小,且在時(shí)域和振幅譜上的MSE低于初始權(quán)重。在α∶β為5∶10和20∶50時(shí),時(shí)域、振幅譜、相位譜的整體誤差低于模型Ⅱ。
(2)當(dāng)α≥β,振幅譜與相位譜MSE在α∶β為10∶5和10∶10時(shí),下降相對(duì)明顯;在α∶β為20∶5、50∶20、80∶50、100∶100情況下,時(shí)域、振幅譜、相位譜誤差變化較小且有增加的趨勢(shì)。
分別給出網(wǎng)絡(luò)訓(xùn)練過(guò)程中后60次迭代驗(yàn)證時(shí)域loss曲線和100次迭代驗(yàn)證相位譜loss曲線(未乘α、β)如圖8所示??芍?dāng)α∶β=5∶10時(shí),在時(shí)域和相位譜上均下降最快收斂最好,而α∶β=100∶100時(shí)下降緩慢,時(shí)域loss曲線波動(dòng)較大,說(shuō)明當(dāng)權(quán)重過(guò)大時(shí),網(wǎng)絡(luò)訓(xùn)練在時(shí)域上的收斂性有所下降,擬合效果不理想,最終在時(shí)域恢復(fù)及SNR上表現(xiàn)較差,同時(shí)也影響到了相位譜上loss的收斂效果,導(dǎo)致在相位譜上的MSE值有所上升。
圖8 模型Ⅳ不同權(quán)重在時(shí)域(a)和相位譜(b)上驗(yàn)證loss曲線
以上實(shí)驗(yàn)表明,加入振幅譜和相位譜的物理約束與無(wú)物理約束相比有明顯提升,且在調(diào)節(jié)α∶β的取值時(shí)發(fā)現(xiàn),α與β取值50以?xún)?nèi)時(shí)在時(shí)域、振幅譜和相位譜上誤差均有減小的趨勢(shì),但和只有相位譜約束的模型Ⅱ相比部分實(shí)驗(yàn)效果接近。當(dāng)α≤20、β≤50且α<β時(shí),模型預(yù)測(cè)結(jié)果在時(shí)域、振幅譜和相位譜上誤差降低幅度較明顯,SNR相對(duì)較高,對(duì)地震數(shù)據(jù)低頻延拓效果有大提升??梢?jiàn),聯(lián)合振幅譜與相位譜的約束后,通過(guò)調(diào)節(jié)α和β權(quán)重參數(shù)比例,可達(dá)到同時(shí)提高地震數(shù)據(jù)低頻延拓結(jié)果在時(shí)域、振幅譜與相位譜上的效果。綜合比較,取α∶β=5∶10相對(duì)合理,SNR達(dá)到31.807dB,且時(shí)域、振幅譜與相位譜綜合MSE達(dá)到最小。
3.4.1 改進(jìn)殘差模塊測(cè)試
為證明改進(jìn)U-Net殘差塊的網(wǎng)絡(luò)結(jié)構(gòu)對(duì)低頻延拓的有效性,與傳統(tǒng)U-Net網(wǎng)絡(luò)進(jìn)行性能對(duì)比,SNR結(jié)果如圖9所示。在模型Ⅰ中使用改進(jìn)殘差跳躍連接整體波動(dòng)性更小,具有較高的SNR。模型Ⅳ(權(quán)重比例為5∶10)下,使用殘差跳躍連接后收斂較快,迭代75次后就逐漸趨于平穩(wěn)且收斂于較高的SNR。
圖9 改進(jìn)殘差模塊的網(wǎng)絡(luò)SNR曲線對(duì)比
3.4.2 網(wǎng)絡(luò)處理過(guò)程分析
為了直觀分析數(shù)據(jù)在提出的網(wǎng)絡(luò)處理過(guò)程中的特征變化,研究網(wǎng)絡(luò)模型的中間狀態(tài),任選1個(gè)測(cè)試集樣本(圖10)在模型Ⅳ(5∶10)第1、3、4次下采樣的特征提取階段和第2、4次上采樣的特征恢復(fù)中的部分特征圖進(jìn)行可視化輸出(圖11)。從圖11a~圖11c中可見(jiàn),在下采樣過(guò)程中可以有效提取測(cè)試樣本的主要特征,且隨著網(wǎng)絡(luò)的加深,提取的特征從淺層的形狀紋理信息逐漸抽象。從圖11d~圖11e可見(jiàn),在上采樣過(guò)程中,逐步將壓縮的樣本特征進(jìn)行映射恢復(fù),恢復(fù)的特征隨著網(wǎng)絡(luò)的加深,從抽象特征逐漸恢復(fù)出低頻信息,最終輸出延拓的低頻地震數(shù)據(jù)。輸出結(jié)果如圖12,可見(jiàn)網(wǎng)絡(luò)可以較好地從地震數(shù)據(jù)中高頻部分,學(xué)習(xí)延拓低頻成分的非線性逼近關(guān)系,并具有較高的恢復(fù)精度。
圖10 測(cè)試數(shù)據(jù)
圖11 五種采樣方式下網(wǎng)絡(luò)不同層的部分特征
圖12 網(wǎng)絡(luò)測(cè)試結(jié)果及殘差圖
圖13是第105道地震信號(hào)的時(shí)域、頻率、相位延拓結(jié)果(相位譜中由于相位本身計(jì)算方式和精度問(wèn)題導(dǎo)致有效頻率外有誤差產(chǎn)生),可見(jiàn)本文網(wǎng)絡(luò)模型恢復(fù)地震低頻信號(hào)過(guò)程中,在保持時(shí)域與頻率恢復(fù)效果的同時(shí),具有較高的相位恢復(fù)精度。
圖13 第105道地震數(shù)據(jù)的時(shí)域波形(a)、振幅譜(b)和相位譜(c)
圖14展示U-Net網(wǎng)絡(luò)中傳統(tǒng)跳躍連接下的特征融合結(jié)果和本文所用殘差跳躍連接下的特征融合結(jié)果。可見(jiàn)相較于U-Net的傳統(tǒng)跳躍連接,殘差跳躍連接特征融合結(jié)果有更完整的特征信息。殘差模塊的添加改善了下采樣特征與上采樣特征間的語(yǔ)義差別,使得低頻延拓效果有進(jìn)一步提高。
圖14 普通跳躍連接(U-Net)與本文使用殘差的跳躍連接網(wǎng)絡(luò)特征融合恢復(fù)結(jié)果對(duì)比
現(xiàn)將本文提出的模型Ⅳ(α∶β=5∶10)與當(dāng)前比較先進(jìn)的同類(lèi)算法:原始U-Net網(wǎng)絡(luò)、VDSR網(wǎng)絡(luò)、文獻(xiàn)[24]的網(wǎng)絡(luò)模型及文獻(xiàn)[26]的低頻延拓網(wǎng)絡(luò)模型的輸出效果進(jìn)行對(duì)比。使用相同的數(shù)據(jù)集訓(xùn)練后,在驗(yàn)證集上MSE結(jié)果如表4,可見(jiàn)本文網(wǎng)絡(luò)模型在時(shí)域、振幅譜、相位譜上的誤差均小于其他四個(gè)模型。用測(cè)試數(shù)據(jù)(圖10)進(jìn)行測(cè)試,圖15可見(jiàn)VDSR網(wǎng)絡(luò)的輸出結(jié)果相對(duì)模糊,信息損失嚴(yán)重; 文獻(xiàn)[24]中網(wǎng)絡(luò)的輸出結(jié)果較VDSR有所提升,但細(xì)節(jié)處仍有較嚴(yán)重的損失; 文獻(xiàn)[26]中網(wǎng)絡(luò)模型由于輸入、輸出的是單道地震數(shù)據(jù),因此最后拼接出的二維地震數(shù)據(jù)有明顯豎紋,未考慮地震道間的相關(guān)性; U-Net網(wǎng)絡(luò)輸出結(jié)果與本文模型Ⅳ(α∶β=5∶10)在時(shí)域、振幅譜和相位譜上相對(duì)較差。對(duì)比時(shí)域、振幅譜、相位譜的誤差,本文網(wǎng)絡(luò)模型效果相對(duì)較好。抽取第160道地震數(shù)據(jù)在時(shí)域、振幅譜、相位譜上進(jìn)行對(duì)比(圖16),可知在時(shí)域、振幅譜恢復(fù)上,本文網(wǎng)絡(luò)模型優(yōu)于其他方法,且在相位的恢復(fù)效果方面具有大幅度提升。
圖15 不同算法對(duì)地震低頻數(shù)據(jù)的恢復(fù)效果對(duì)比
圖16 不同模型第160道地震數(shù)據(jù)的時(shí)域波形(a)、頻率譜(b)、相位譜(c)效果對(duì)比
表4 各模型MSE結(jié)果與SNR值對(duì)比
考慮到實(shí)際地震樣本難以獲得,容易導(dǎo)致訓(xùn)練樣本特征覆蓋不充分的問(wèn)題。為測(cè)試本文模型的應(yīng)用前景,選取一個(gè)深層斷裂速度模型(圖17),通過(guò)有限差分正演生成地震數(shù)據(jù)作為測(cè)試地震樣本,以遷移學(xué)習(xí)的方法采用本文預(yù)訓(xùn)練好的模型參數(shù)初始化網(wǎng)絡(luò)權(quán)重,然后利用少量中、高頻地震數(shù)據(jù)和低頻地震數(shù)據(jù)對(duì)網(wǎng)絡(luò)模型進(jìn)行再訓(xùn)練(圖18),經(jīng)過(guò)微調(diào)參數(shù)后再對(duì)地震數(shù)據(jù)進(jìn)行低頻延拓。
圖17 速度模型
圖18 遷移學(xué)習(xí)訓(xùn)練數(shù)據(jù)
網(wǎng)絡(luò)模型經(jīng)再訓(xùn)練精調(diào)參數(shù)后,樣本測(cè)試發(fā)現(xiàn)網(wǎng)絡(luò)能較準(zhǔn)確地延拓出低頻地震數(shù)據(jù)。另外,對(duì)主頻為20和30 Hz的雷克子波生成的地震數(shù)據(jù)進(jìn)行測(cè)試(表5)??梢?jiàn)模型對(duì)不同主頻的雷克子波生成的地震數(shù)據(jù)有較好恢復(fù)作用,具有一定泛化能力。
圖19 15 Hz雷克子波生成地震數(shù)據(jù)測(cè)試結(jié)果
表5 不同主頻雷克子波下延拓結(jié)果MSE
由表5可見(jiàn),使用遷移學(xué)習(xí)方法可在一定程度上減小因訓(xùn)練數(shù)據(jù)與實(shí)際測(cè)試數(shù)據(jù)的差異,而對(duì)本文模型產(chǎn)生的不利影響,且在實(shí)際應(yīng)用中憑借相對(duì)少量訓(xùn)練樣本和訓(xùn)練時(shí)間,就可得到較準(zhǔn)確結(jié)果。
本文提出一種基于物理約束的改進(jìn)U-Net網(wǎng)絡(luò)進(jìn)行地震資料低頻恢復(fù)的方法,得出以下結(jié)論:
(1)聯(lián)合時(shí)域、振幅譜與相位譜信息,可以利用地震波的物理參數(shù)約束多維度的恢復(fù)效果,考慮到權(quán)重比例對(duì)網(wǎng)絡(luò)模型結(jié)果的影響,通過(guò)大量實(shí)驗(yàn)得出較好的權(quán)重比例,使網(wǎng)絡(luò)在聯(lián)合約束下延拓出的低頻地震數(shù)據(jù)不僅具有較高的時(shí)域恢復(fù)效果,還能保持頻率與相位恢復(fù)特征。
(2)使用殘差模塊改進(jìn)U-Net網(wǎng)絡(luò)的跳躍連接部分,通過(guò)中間層分析可見(jiàn),改進(jìn)后的網(wǎng)絡(luò)模型提高下采樣與上采樣間的語(yǔ)義差別,使網(wǎng)絡(luò)恢復(fù)的特征更豐富,增強(qiáng)恢復(fù)效果。
(3)遷移學(xué)習(xí)與本文網(wǎng)絡(luò)模型的結(jié)合,使其具有較高的實(shí)用性,可以利用少量樣本延拓出相對(duì)精確的低頻地震數(shù)據(jù),節(jié)省制作樣本標(biāo)簽時(shí)間和人力成本,實(shí)現(xiàn)高效、自動(dòng)化地震數(shù)據(jù)低頻延拓。
綜上所述,本文網(wǎng)絡(luò)模型具有較好的地震資料低頻恢復(fù)效果,在提升時(shí)域與頻率恢復(fù)的基礎(chǔ)上,著重提升了網(wǎng)絡(luò)模型在相位方面的恢復(fù)效果。