韓明亮 鄒志輝*② 馬 銳③
(①中國海洋大學(xué)海洋地球科學(xué)學(xué)院海底科學(xué)與探測技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室,山東青島266100;②青島海洋科學(xué)與技術(shù)國家實(shí)驗(yàn)室海洋礦產(chǎn)資源評價(jià)與探測技術(shù)功能實(shí)驗(yàn)室,山東青島266061;③星環(huán)信息科技(上海)有限公司,上海200030)
地震速度建模影響地震波成像精度,對地質(zhì)構(gòu)造解釋具有指導(dǎo)作用。人們基于地震波形和走時(shí)數(shù)據(jù)提出了多種地震速度建模方法。其中,疊加速度分析是油氣勘探中最為常用的速度建模方法,該方法可以建立平緩層狀構(gòu)造的地震速度模型,但基于水平層狀速度結(jié)構(gòu)的假設(shè),它在地層非水平、橫向速度變化、含低速層等情況下精度不高[1]。偏移速度分析是一種將速度分析與偏移成像相結(jié)合的速度建模方法,基于射線理論的偏移速度建模雖然效率高、穩(wěn)定性強(qiáng),但在復(fù)雜構(gòu)造情況下精度較低[2]。走時(shí)層析成像是一種適用于速度變化平緩的復(fù)雜構(gòu)造的速度建模方法,一般用于淺部速度建模[3-5]。采用大炮檢距地震初至旅行時(shí)的走時(shí)層析成像可以對深部速度結(jié)構(gòu)建模[6-9],但對速度突變和小尺度異常的構(gòu)造成像效果不佳。為了解決復(fù)雜速度結(jié)構(gòu)的建模問題,Tarantola[10]提出了波形反演方法,并從理論研究推廣到實(shí)際應(yīng)用。全波形反演利用地震波場的運(yùn)動(dòng)學(xué)和動(dòng)力學(xué)信息構(gòu)建地下速度模型,建模精度高且可以實(shí)現(xiàn)多參數(shù)建模[11]。但迭代的方式使全波形反演強(qiáng)烈依賴于初始模型和先驗(yàn)信息,容易受實(shí)際數(shù)據(jù)中低頻信息缺失的影響[12],且迭代過程較復(fù)雜,耗時(shí)較長[13-14]。另外,隨著勘探區(qū)塊地下結(jié)構(gòu)復(fù)雜程度的增加,高密度采集、節(jié)點(diǎn)地震采集和廣角寬方位三維地震采集等技術(shù)得到了推廣應(yīng)用,地震數(shù)據(jù)量也快速增大。因此,有必要進(jìn)一步提高速度建模方法的穩(wěn)定性和精度,并提高其在數(shù)據(jù)量增大情況下的計(jì)算效率。
深度學(xué)習(xí)為速度建模提供了一種高效且可以準(zhǔn)確利用大量地震數(shù)據(jù)的手段。Araya-polo等[15]采用速度譜作為數(shù)據(jù)集,基于常規(guī)的卷積神經(jīng)網(wǎng)絡(luò)提出了一種將深度學(xué)習(xí)引入地震速度建模的方法。Mosser等[16]基于深度卷積生成對抗網(wǎng)絡(luò)的深度學(xué)習(xí)方法,將反演問題看作不同域之間的轉(zhuǎn)換,實(shí)現(xiàn)了地震數(shù)據(jù)域與速度模型域之間的轉(zhuǎn)換。Li等[17]基于深度神經(jīng)網(wǎng)絡(luò)的地震反演網(wǎng)絡(luò)(SeisInvNet),使用所有地震道數(shù)據(jù)和全局地震剖面重構(gòu)速度模型。Zhang等[18]開發(fā)了一種基于實(shí)時(shí)數(shù)據(jù)驅(qū)動(dòng)技術(shù)的速度建模對抗網(wǎng)絡(luò)(VelocityGAN),用以提高速度模型精度。Yuan等[19]在已知初始速度和數(shù)據(jù)的情況下,用全卷積神經(jīng)網(wǎng)絡(luò)(FCN)實(shí)現(xiàn)了時(shí)移數(shù)據(jù)與目標(biāo)速度變化之間的映射。Yang等[20]基于FCN提出了直接使用全波形地震數(shù)據(jù)建立速度模型的方法。Park等[21]實(shí)現(xiàn)了用卷積神經(jīng)網(wǎng)絡(luò)和遷移學(xué)習(xí)進(jìn)行自動(dòng)速度分析的工作流程。Fabien-ouellet等[22]基于深度卷積神經(jīng)網(wǎng)絡(luò),利用共中心點(diǎn)道集反演均方根速度和層速度。Wang等[23]基于FCN的井間觀測系統(tǒng),利用縱波速度建模。Chen等[24]提出了一種用骨架化數(shù)據(jù)求解波動(dòng)方程的速度建模方法。孫宇航等[25]基于GRU神經(jīng)網(wǎng)絡(luò),提出了一種用儲(chǔ)層參數(shù)預(yù)測橫波速度的方法。張昊等[26]提出了一種基于深度學(xué)習(xí)的地震速度譜自動(dòng)拾取方法。張玉璽[27]等用深度學(xué)習(xí)方法實(shí)現(xiàn)了對鹽丘的自動(dòng)識(shí)別。
上述深度學(xué)習(xí)速度建模方法通過神經(jīng)網(wǎng)絡(luò)框架對數(shù)據(jù)空間進(jìn)行全局搜索,克服了線性反演方法中初始模型準(zhǔn)確度和先驗(yàn)信息的限制,是一種非常有應(yīng)用前景的地震速度建模技術(shù)。另外,深度學(xué)習(xí)還是一種高效的速度建模手段,深度神經(jīng)網(wǎng)絡(luò)模型只需要訓(xùn)練一次就可以開展多次速度建模,而建模過程耗時(shí)很少,在需要大量開展速度建模的地區(qū)可以有效減少速度建模所需時(shí)間,相比于傳統(tǒng)方法計(jì)算效率更高。
然而,上述深度學(xué)習(xí)速度建模方法所采用的數(shù)據(jù)集會(huì)降低建模精度和穩(wěn)定性。如果直接使用地震波形作為數(shù)據(jù)集,深度學(xué)習(xí)速度建模會(huì)出現(xiàn)不穩(wěn)定的問題[19];如果僅采用速度譜作為數(shù)據(jù)集,那么速度譜的水平地層假設(shè)條件將限制其對橫向變化速度結(jié)構(gòu)的估計(jì)能力,難以刻畫速度模型的細(xì)節(jié)[15]。速度譜通過地震反射數(shù)據(jù)水平疊加實(shí)現(xiàn)了地震記錄中層狀速度結(jié)構(gòu)信息的稀疏化表達(dá),將其作為數(shù)據(jù)集有助于提高速度建模的穩(wěn)定性。鑒于速度譜訓(xùn)練集有助于提高建模穩(wěn)定性、地震波形數(shù)據(jù)集有助于提高建模精度,因而可以把速度譜和地震數(shù)據(jù)波形融合為統(tǒng)一的深度學(xué)習(xí)特征數(shù)據(jù)集,以同時(shí)提高速度建模的穩(wěn)定性和精度。
另外,深度學(xué)習(xí)速度建模對訓(xùn)練集的要求較高,即要求訓(xùn)練集能夠體現(xiàn)模型中的關(guān)鍵細(xì)節(jié)。常規(guī)的做法是通過生成大量的隨機(jī)訓(xùn)練樣本,增加訓(xùn)練集的特征覆蓋能力。Wang等[23]在設(shè)計(jì)訓(xùn)練集模型時(shí),采用了完全隨機(jī)的方式,基于隨機(jī)的照片生成大量的訓(xùn)練樣本,保證了速度建模方法可以應(yīng)用于任意地質(zhì)條件,在井間數(shù)值實(shí)驗(yàn)中取到了較好的效果,但對于地震數(shù)據(jù)集的要求較高,預(yù)測結(jié)果主要依賴直達(dá)波。人們在利用深度學(xué)習(xí)進(jìn)行地震速度建模時(shí),多是先確定訓(xùn)練集樣本速度模型的種類(如層狀模型、斷層模型等),然后在這一類模型中設(shè)置不同的參數(shù),隨機(jī)生成大量的訓(xùn)練樣本[15,17-18,20],這樣可以使訓(xùn)練樣本包含同一類型速度模型的多種情況,從而得到豐富的樣本特征。由于預(yù)測結(jié)果依賴于訓(xùn)練集速度模型,因此訓(xùn)練集應(yīng)盡量包含較多的特征以增強(qiáng)速度建模的準(zhǔn)確性和穩(wěn)定性。層析成像中的多尺度參數(shù)化方法[28]將速度模型分解為包含不同尺度網(wǎng)格的子模型,每個(gè)子模型覆蓋整個(gè)模型區(qū)域,單個(gè)子模型中網(wǎng)格大小不同。這種參數(shù)化方法考慮了不同大小異常體適應(yīng)不同網(wǎng)格的情況,使層析反演可以更好地刻畫異常體的邊界。本文結(jié)合層析成像中的多尺度參數(shù)化方式采用常規(guī)分類生成隨機(jī)訓(xùn)練集的方法,將速度模型中的特征進(jìn)行多尺度分解,生成包含不同尺度特征的訓(xùn)練集速度模型,構(gòu)建多尺度訓(xùn)練集。這種方法增加了訓(xùn)練集的特征覆蓋能力,一定程度上緩解了深度學(xué)習(xí)對于訓(xùn)練集的依賴,提高了建模精度。
利用深度神經(jīng)網(wǎng)絡(luò)構(gòu)建地震數(shù)據(jù)與速度模型之間的映射關(guān)系,可以實(shí)現(xiàn)基于深度學(xué)習(xí)的地震速度建模。
FCN將傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)的全連接層替換為卷積層,支持任意尺寸的輸入數(shù)據(jù),在圖像識(shí)別領(lǐng)域達(dá)到了可預(yù)測單個(gè)像素的精度[29]?;贔CN改進(jìn)的U-Net具有編碼—解碼的“U”型結(jié)構(gòu),它先通過下采樣提取輸入數(shù)據(jù)的特征,然后通過上采樣將特征信息傳遞給后面分辨率更高的層,得到更精細(xì)的結(jié)果[30]。地震速度建模是從地震資料中提取地下速度信息的過程,與U-Net提取輸入數(shù)據(jù)特征信息的特點(diǎn)十分契合。因此,本文選取U-Net作為深度學(xué)習(xí)速度建模的基礎(chǔ)神經(jīng)網(wǎng)絡(luò)框架。同時(shí),改進(jìn)原始U-Net,使針對圖像識(shí)別領(lǐng)域設(shè)計(jì)的U-Net適用于地震速度建模。
首先,針對輸入地震數(shù)據(jù)與輸出速度模型之間大小不一致的問題,利用U-Net實(shí)現(xiàn)了不對稱大小之間的映射。常規(guī)用于圖像識(shí)別的U-Net的輸入和輸出都在圖像域,且需要大小相同。然而,地震速度建模的輸入數(shù)據(jù)在時(shí)間域,而輸出的速度模型在深度域,這就造成了輸入與輸出數(shù)據(jù)之間的不匹配。在基于深度學(xué)習(xí)的地震速度建模過程中,地震數(shù)據(jù)被映射為速度模型,而輸入與輸出數(shù)據(jù)之間的不匹配會(huì)導(dǎo)致神經(jīng)網(wǎng)絡(luò)的輸入與輸出在大小和存儲(chǔ)方式上的明顯差異,因此神經(jīng)網(wǎng)絡(luò)難以完成訓(xùn)練。針對該問題,聯(lián)合地震反射波形和速度譜作為深度神經(jīng)網(wǎng)絡(luò)的輸入,并將它們通過重采樣的方式統(tǒng)一到與輸出神經(jīng)網(wǎng)絡(luò)的速度模型相近的大小。地震反射波形由地震記錄去除直達(dá)波得到;速度譜通過地震反射數(shù)據(jù)水平疊加得到。速度譜可以看作是層狀速度結(jié)構(gòu)信息的稀疏化表達(dá),將其作為深度學(xué)習(xí)的特征有利于提高神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練的穩(wěn)定性。將反射波形數(shù)據(jù)和速度譜分別以多個(gè)炮集和多個(gè)共中心點(diǎn)集的格式存儲(chǔ),再通過重采樣調(diào)整它們的長度和寬度,將每個(gè)炮集反射波形數(shù)據(jù)和每個(gè)共中心點(diǎn)集速度譜統(tǒng)一為相同大小的二維矩陣,然后將所有二維矩陣聯(lián)合成為一個(gè)三維矩陣。最后就可以實(shí)現(xiàn)將不同炮集的反射波形數(shù)據(jù)和不同共中心點(diǎn)位置的速度譜從不同的通道聯(lián)合輸入深度神經(jīng)網(wǎng)絡(luò)。U-Net在編碼、解碼的過程中訓(xùn)練自身,完成了地震數(shù)據(jù)向速度模型的映射,可以實(shí)現(xiàn)基于數(shù)據(jù)驅(qū)動(dòng)的深度學(xué)習(xí)速度建模。雖然神經(jīng)網(wǎng)絡(luò)的輸入和輸出分別是時(shí)間域的數(shù)據(jù)和深度域的速度模型,但是該方法通過從時(shí)間域輸入數(shù)據(jù)提取信息,用深度神經(jīng)網(wǎng)絡(luò)建立了時(shí)間域信息與模型域采樣點(diǎn)之間的映射,沒有明顯時(shí)深問題建模的局限。
其次,為了防止深度學(xué)習(xí)速度建模產(chǎn)生過擬合,在U-Net中添加了兩個(gè)隨機(jī)失活(Dropout)層,從而提高了深度神經(jīng)網(wǎng)絡(luò)模型的泛化能力。神經(jīng)網(wǎng)絡(luò)的隱層是除輸入層和輸出層外的其他層,它是對輸入特征多層次的抽象,但神經(jīng)元較多的隱層更容易讓神經(jīng)網(wǎng)絡(luò)的預(yù)測結(jié)果產(chǎn)生過擬合。而Dropout層在訓(xùn)練過程中將深度神經(jīng)網(wǎng)絡(luò)隱層的神經(jīng)元根據(jù)相應(yīng)的概率隨機(jī)重置為0,從而使網(wǎng)絡(luò)模型更具魯棒性,降低過擬合。同時(shí),還可以降低網(wǎng)絡(luò)整體結(jié)構(gòu)的復(fù)雜程度,大大減少運(yùn)算量。
在深度神經(jīng)網(wǎng)絡(luò)中添加和取消Dropout層可以分析Dropout層對過擬合現(xiàn)象的影響。用相同的層狀模型訓(xùn)練集分別采用添加和不添加Dropout層的深度神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。然后用兩組測試樣本進(jìn)行實(shí)驗(yàn)。第一組測試樣本包含25個(gè)與訓(xùn)練樣本重復(fù)的速度模型,第二組測試樣本包含25個(gè)與訓(xùn)練樣本不重復(fù)的速度模型。兩組測試樣本的預(yù)測結(jié)果與真實(shí)模型之間的歸一化均方根誤差(NRMS,指相對誤差)如表1所示。在不添加Dropout層時(shí),與訓(xùn)練樣本不重復(fù)的測試樣本的建模結(jié)果誤差大于與訓(xùn)練樣本重復(fù)的測試樣本。這說明在沒有Dropout層的情況下,深度神經(jīng)網(wǎng)絡(luò)存在過擬合現(xiàn)象,此時(shí)深度學(xué)習(xí)過程傾向于輸出與訓(xùn)練集中模型比較相近的模型。而在添加了Dropout層后,無論測試樣本是否與訓(xùn)練樣本重復(fù),建模結(jié)果的誤差都相差不大,因而可以降低過擬合。因此,添加Dropout層可以改善網(wǎng)絡(luò)結(jié)構(gòu),提高地震速度建模的準(zhǔn)確性。
表1 添加Dropout層前后預(yù)測模型與真實(shí)模型的歸一化均方根誤差
本文構(gòu)建的深度學(xué)習(xí)速度建模的神經(jīng)網(wǎng)絡(luò)架構(gòu)如圖1所示。該網(wǎng)絡(luò)的輸入是由19個(gè)大小為128×240的地震反射波形數(shù)據(jù)和17個(gè)大小為128×240的速度譜聯(lián)合而成的大小為128×240×36的三維矩陣。神經(jīng)網(wǎng)絡(luò)的輸出是大小為128×200的二維地震速度模型。共有24個(gè)卷積層(藍(lán)色矩形)、4個(gè)池化層(黃色矩形)、4個(gè)上采樣層(綠色矩形)、2個(gè)Dropout層(紫色矩形)和1個(gè)裁剪層(黑色虛線)。卷積層采用ReLU激活函數(shù),卷積核大小為3×3。最大池化層中的下采樣因子大小為2×2。上采樣層中的上采樣因子大小為2×2。Dropout層以50%的概率重置隱層中神經(jīng)元。深度神經(jīng)網(wǎng)絡(luò)共有4個(gè)下采樣過程和4個(gè)上采樣過程,既保證了網(wǎng)絡(luò)有足夠的深度,可以對速度特征進(jìn)行提取,又不會(huì)使網(wǎng)絡(luò)模型過于復(fù)雜。
圖1 改進(jìn)的全卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)
在深度學(xué)習(xí)中,直接對神經(jīng)網(wǎng)絡(luò)的最優(yōu)解進(jìn)行求取是十分困難的,常規(guī)的做法是通過迭代的方式逼近最優(yōu)解。因此深度學(xué)習(xí)的本質(zhì)可以看作是建立最優(yōu)化模型,通過最優(yōu)化方法迭代求出損失函數(shù)的最小值,從而訓(xùn)練出最佳的網(wǎng)絡(luò)模型。這個(gè)過程可以表示為
(1)
式(1)給出了損失函數(shù)最小情況下參數(shù)ω的取值。本文采用二范數(shù)度量真實(shí)速度模型與預(yù)測速度模型之間的誤差,式(1)可寫為
(2)
梯度下降法是深度學(xué)習(xí)中最常用的一種優(yōu)化算法。它的基本思想是:用當(dāng)前位置最快下降的方向,即當(dāng)前位置的負(fù)梯度方向作為搜索方向去接近目標(biāo)值,從而使損失函數(shù)逐漸減小,最終達(dá)到最小值。
假設(shè)一個(gè)深度學(xué)習(xí)問題中的損失函數(shù)L是每一個(gè)樣本損失函數(shù)l的總和,即
(3)
(4)
梯度下降法更新神經(jīng)網(wǎng)絡(luò)的參數(shù)ω的過程可以表示為
(5)
式中:ωt代表第t次迭代后的神經(jīng)網(wǎng)絡(luò)參數(shù);η為學(xué)習(xí)率,是一個(gè)小常數(shù)。
從式(5)可以看出,每次進(jìn)行迭代更新網(wǎng)絡(luò)參數(shù)ω時(shí),都要對全部N個(gè)樣本進(jìn)行計(jì)算。而在深度學(xué)習(xí)中,神經(jīng)網(wǎng)絡(luò)參數(shù)的數(shù)量十分龐大,同時(shí)為了逼近網(wǎng)絡(luò)的最優(yōu)解,迭代次數(shù)往往也很大,這使梯度下降法在應(yīng)用于深度學(xué)習(xí)時(shí)運(yùn)算量巨大。因此,隨機(jī)梯度下降法[31]應(yīng)運(yùn)而生。隨機(jī)梯度下降法的基本思路是:通過隨機(jī)提取小批量的樣本B={X(1),…,X(M)}獲取梯度,從而對神經(jīng)網(wǎng)絡(luò)參數(shù)進(jìn)行更新。M是小批量樣本的總個(gè)數(shù),一般取值較小,且不隨迭代次數(shù)變化,因此在很大程度上減少了運(yùn)算成本。隨機(jī)梯度下降法中梯度為
(6)
隨機(jī)梯度下降法更新神經(jīng)網(wǎng)絡(luò)的參數(shù)ω的過程可以表示為
(7)
與梯度下降法不同,隨機(jī)梯度下降法在每次迭代時(shí),只計(jì)算當(dāng)前的一小批樣本,它的下降方向在局部上并不穩(wěn)定,但在整體上卻是穩(wěn)定的,結(jié)果會(huì)出現(xiàn)在全局最優(yōu)的附近。這種方法計(jì)算效率高,且對內(nèi)存的需求較小,但樣本在輸入前需要打亂順序,保證足夠的隨機(jī)性。
本文采用隨機(jī)梯度下降法對深度神經(jīng)網(wǎng)絡(luò)模型參數(shù)的最優(yōu)化問題進(jìn)行求解。
將地震速度模型作為深度學(xué)習(xí)的標(biāo)簽,即深度神經(jīng)網(wǎng)絡(luò)的輸出;將地震波形和速度譜作為深度學(xué)習(xí)的特征數(shù)據(jù)集,即深度神經(jīng)網(wǎng)絡(luò)的輸入,可以構(gòu)建深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練集。本文首先針對沉積地層和孤立異常速度體兩種類型,分別設(shè)置簡單的數(shù)值實(shí)驗(yàn);然后截取BP鹽丘模型[32]生成深度學(xué)習(xí)地震速度建模的訓(xùn)練集,測試本文方法在復(fù)雜構(gòu)造情況下的建模效果。
在設(shè)計(jì)的數(shù)值實(shí)驗(yàn)中,地震速度模型被離散化為二維離散網(wǎng)格,每個(gè)網(wǎng)格大小相同。模型的橫向和垂向網(wǎng)格數(shù)分別為200和128,單個(gè)網(wǎng)格尺寸為20m×20m。根據(jù)實(shí)際界面形態(tài)和異常速度體分布,改變地震速度模型的速度界面形態(tài)和異常體的大小、位置,構(gòu)成訓(xùn)練集。
針對不同的地下地質(zhì)結(jié)構(gòu),在數(shù)值實(shí)驗(yàn)中把速度模型訓(xùn)練集分為三組,分別是簡單的層狀模型、孤立異常體模型以及含有兩者特征的復(fù)雜模型。
(1)第一組數(shù)值實(shí)驗(yàn)(針對沉積地層)。訓(xùn)練集由73個(gè)雙層速度模型構(gòu)成,所有模型的上層速度均為2000m/s,下層速度均為3500m/s。系統(tǒng)改變地層界面的位置、形狀和傾角三個(gè)參數(shù),生成一系列不同的層狀速度模型。首先,在地層界面上選擇3個(gè)控制點(diǎn),坐標(biāo)分別為(1.0km,1.2km)、(2.0km,1.2km)和(3.0km,1.2km)(圖2中的三個(gè)紅點(diǎn));然后,順序改變界面的三個(gè)控制點(diǎn)的位置,并按照0.15的斜率間隔改變控制點(diǎn)兩側(cè)地層界面的傾斜程度;最后,通過不同控制點(diǎn)位置和地層界面斜率的組合,形成包含73個(gè)雙層地震速度模型的訓(xùn)練集。
圖2 層狀速度模型訓(xùn)練集示意圖
(2)第二組數(shù)值實(shí)驗(yàn)(針對孤立異常速度體)。訓(xùn)練集由654個(gè)包含單個(gè)矩形異常體的速度模型構(gòu)成。圖3展示了速度模型的生成過程,即設(shè)定矩形異常體尺寸,并將其按一定方向移動(dòng),每移動(dòng)一次產(chǎn)生一個(gè)速度模型;改變異常體大小,并重復(fù)上述過程,就可以生成不同尺寸的訓(xùn)練集速度模型。該生成訓(xùn)練集的過程類似于地震層析成像的多尺度參數(shù)化[28],因此稱這樣的訓(xùn)練集為多尺度訓(xùn)練集。
圖3 孤立異常體速度模型訓(xùn)練集示意圖
該訓(xùn)練集中異常體速度值和背景速度值都可以改變,不失一般性,把異常體的速度均設(shè)為3500m/s,背景速度均設(shè)為2000m/s。異常體包括邊長分別為400、800、1200、1600和2400m的正方形和大小為4000m×2560m(整個(gè)速度模型區(qū)域)的矩形。
第一個(gè)模型中異常體的左上角位于(0,0)處,之后依次向右移動(dòng)10個(gè)網(wǎng)格,即200m的距離,直到異常體的右邊界到達(dá)模型的右邊界;然后把異常體移至最左側(cè),再向下移動(dòng)10個(gè)網(wǎng)格的距離,并按照前面相同的右移步驟完成一次水平向移動(dòng);依此類推,直到異常體的下邊界超過模型的下邊界。其他尺度的孤立異常體速度模型也按照相同的方式生成。多個(gè)包含不同單尺度孤立異常體模型的訓(xùn)練集構(gòu)成了多尺度模型訓(xùn)練集。為了與多尺度速度模型訓(xùn)練集的結(jié)果進(jìn)行對比,本研究還建立了只包含邊長為400m異常體的單尺度速度模型訓(xùn)練集。
(3)第三組數(shù)值實(shí)驗(yàn)(針對較為復(fù)雜的含有沉積地層和孤立異常體兩種類型的BP鹽丘模型)。如圖4所示,分別采用3個(gè)不同尺度的矩形窗口在圖4c中順序移動(dòng),共截取得到450個(gè)速度模型。不同尺度的矩形窗口在截取速度模型時(shí)都從圖4c的左上角開始,然后按照從左到右、從上到下的順序移動(dòng)相同的距離,一直截取到圖4c的右下角。最后將截取到的每個(gè)速度模型都抽取為128×200的相同大小。
圖4 BP鹽丘速度模型訓(xùn)練集示意圖
根據(jù)訓(xùn)練集中的地震速度模型,通過偽譜法聲波正演模擬[33-34]可以生成地震反射波形和速度譜聯(lián)合的特征數(shù)據(jù)集。正演模擬采用主頻為15Hz的雷克子波作為震源子波,時(shí)間采樣間隔為2ms,每道記錄的長度為3.2s。共采用19個(gè)炮點(diǎn)和240個(gè)檢波點(diǎn),炮間距為200m,道間距為20m。正演模擬獲得共炮集地震記錄后,去除每個(gè)地震記錄中的直達(dá)波,形成反射波形數(shù)據(jù);然后,抽取共中心點(diǎn)集,將x軸800m處選作第一個(gè)共中心點(diǎn)位置,沿模型x軸方向每隔200m確定一個(gè)共中心點(diǎn),一直到4000m處,總共得到17個(gè)共中心點(diǎn)道集;對共中心點(diǎn)道集進(jìn)行動(dòng)校疊加,動(dòng)校正的速度掃描范圍為1500~5500m/s,由此得到與共中心點(diǎn)道集對應(yīng)的17個(gè)速度譜;之后,對每個(gè)共炮集地震反射波形數(shù)據(jù)和每個(gè)速度譜歸一化,使其值范圍為[-1,1];最后,在時(shí)間域重新采樣,聯(lián)合波形數(shù)據(jù)和速度譜,生成一系列128×240×36的三維矩陣,從而建立特征數(shù)據(jù)集。
為了測試本文方法優(yōu)越性,分別將沒有聯(lián)合的地震波形數(shù)據(jù)和速度譜作為特征進(jìn)行訓(xùn)練,并將訓(xùn)練結(jié)果與本文(聯(lián)合)方法進(jìn)行比較。沒有聯(lián)合的情況下,地震波形特征數(shù)據(jù)集和速度譜特征數(shù)據(jù)集分別是大小為128×240×19和128×240×17的三維矩陣。
本文設(shè)計(jì)的三組訓(xùn)練集分別用于訓(xùn)練深度神經(jīng)網(wǎng)絡(luò),得到三個(gè)不同的神經(jīng)網(wǎng)絡(luò)參數(shù)。訓(xùn)練時(shí),采用的迭代次數(shù)(Epochs)為500次,批大小(Batch Size)為32。
用三組測試集分別對訓(xùn)練好的三個(gè)網(wǎng)絡(luò)模型進(jìn)行測試。測試集速度模型是未用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)的速度模型,它與訓(xùn)練集速度模型不重復(fù),僅只是用于測試深度神經(jīng)網(wǎng)絡(luò)的速度建模效果。假設(shè)測試集地震速度模型未知,將速度模型正演得到的反射波形數(shù)據(jù)和速度譜經(jīng)處理后輸入到訓(xùn)練好的深度神經(jīng)網(wǎng)絡(luò)中,得到預(yù)測地震速度模型。深度學(xué)習(xí)地震速度建模的效果可以通過對比預(yù)測模型與真實(shí)模型進(jìn)行評價(jià),二者之間的誤差用NRMS值表示。NRMS值越小,說明真實(shí)模型與預(yù)測模型之間的誤差越小,速度建模結(jié)果越準(zhǔn)確。真實(shí)模型與預(yù)測模型之間的NRMS值為
(8)
本文深度神經(jīng)網(wǎng)絡(luò)架構(gòu)基于以Tensorflow為后端的Keras框架進(jìn)行搭建,并用Python代碼進(jìn)行編譯。硬件環(huán)境配置為:CPU Intel-Core-i9-9900k@3.5GHz;內(nèi)存32G;顯卡GFORCE GTX2080Ti。
在層狀模型的數(shù)值實(shí)驗(yàn)中,測試集速度模型是通過改變速度分界面傾角和位置而建立的,包含50個(gè)雙層速度模型。圖5顯示了4個(gè)典型的測試集速度模型。由圖可以看出,利用未加噪聲的測試集數(shù)據(jù)進(jìn)行速度建模時(shí),三種特征數(shù)據(jù)集都能較好地重構(gòu)出雙層地震速度模型的地層界面;但添加25%的高斯噪聲后,只使用反射波形作為特征數(shù)據(jù)集的預(yù)測模型(圖5f)出現(xiàn)了明顯的假象,而本文方法和只使用速度譜的方法都表現(xiàn)出較強(qiáng)的抗噪性能。
圖5 典型層狀模型測試集建模結(jié)果
由圖6可見,輸入未加噪數(shù)據(jù)時(shí),使用反射波形作為特征數(shù)據(jù)集的方法建模準(zhǔn)確性最高,本文(聯(lián)合)方法次之,只使用速度譜的方法最差。但用加噪數(shù)據(jù)進(jìn)行速度建模時(shí),只使用反射波形作為特征數(shù)據(jù)集的方法誤差最大,抗噪性較差。綜合來說,本文方法最好,在能保證較高的速度建模準(zhǔn)確性的同時(shí),疊加速度分析是一種常規(guī)的地震速度建模方法。該方法通過拾取速度譜中的能量團(tuán)獲得疊加速度場,然后利用Dix公式計(jì)算得到層速度。從圖5b、圖5h可以看到,深度學(xué)習(xí)方法和常規(guī)的疊加速度分析方法都可以有效構(gòu)建層狀速度模型。但疊加速度分析方法拾取速度譜耗時(shí)較長,速度建模的效率較低。而深度學(xué)習(xí)方法只需要對深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練一次,就可以快速地對包含訓(xùn)練集速度模型特征的地下地質(zhì)結(jié)構(gòu)進(jìn)行建模。在本文中,將準(zhǔn)備好的數(shù)據(jù)輸入訓(xùn)練好的深度神經(jīng)網(wǎng)絡(luò),生成一個(gè)地震速度模型的用時(shí)不超過1s。這相對于常規(guī)方法而言,建模效率很高。因此在需要大量開展速度建模的地區(qū),深度學(xué)習(xí)方法可以有效減少速度建模所需時(shí)間。
圖6 層狀速度模型測試集預(yù)測模型與真實(shí)模型之間的e NRMS值
為了測試震源子波頻帶范圍對本文方法速度建模結(jié)果的影響,分別應(yīng)用主頻為10、15和20Hz的雷克子波作為震源子波,正演得到50個(gè)測試集速度模型的反射波形和速度譜構(gòu)成特征數(shù)據(jù)集。其中,15Hz主頻的雷克子波是生成訓(xùn)練集數(shù)據(jù)的震源子波。用不同頻率子波得到的特征數(shù)據(jù)集預(yù)測速度模型,預(yù)測模型與真實(shí)模型之間的eNRMS值如圖7所示。由圖可見,震源子波主頻率的改變僅導(dǎo)致eNRMS值的變化小于1%,因而對于本文所論及方法的速度建模結(jié)果影響不大;在這些方法中,子波主頻變化對本文方法影響最小,對只用反射波形作為特征數(shù)據(jù)集的方法影響最大,這也反映了本文方法具有更高的穩(wěn)定性。
圖7 子波主頻改變時(shí)預(yù)測模型與真實(shí)模型之間的e NRMS值
孤立異常體模型測試集由5個(gè)速度模型構(gòu)成。測試集模型與訓(xùn)練集模型的背景速度、異常體速度相同,但在異常體的大小和數(shù)量方面有所不同。測試集各個(gè)模型用于測試不同特征數(shù)據(jù)集對異常體形狀、位置和異常體空間分布樣式的重構(gòu)能力。速度建模結(jié)果如圖8所示。前兩個(gè)測試集速度模型中都只有一個(gè)異常體,異常體大小分別為1600m×400m和400m×1600m。中間兩個(gè)測試集速度模型中各包含了2個(gè)大小均為400m×400m的高速異常體。最后一個(gè)測試集速度模型中包含了2個(gè)大小分別為400m×400m和1200m×1200m的高速異常體。
對比圖8b和圖8c可知,與單尺度訓(xùn)練集相比,使用多尺度訓(xùn)練集(由多個(gè)不同尺度的單尺度訓(xùn)練集構(gòu)成)的速度模型重構(gòu)結(jié)果更加接近真實(shí)模型;使用單尺度訓(xùn)練集的速度建模結(jié)果中,無論異常體數(shù)目增多與否,異常體的位置和速度都與真實(shí)模型較接近,但大小卻都與單尺度訓(xùn)練集中400m×400m的異常體相近;這也從側(cè)面說明了深度學(xué)習(xí)的方法以數(shù)據(jù)為驅(qū)動(dòng)進(jìn)行速度建模時(shí),對訓(xùn)練集的依賴程度較大;而圖8c中的異常體形狀都與真實(shí)模型較接近,既可以重構(gòu)出長、寬差異大的異常體,也可以同時(shí)重構(gòu)出兩個(gè)不同大小的異常體,這說明多尺度異常體訓(xùn)練集緩解了深度學(xué)習(xí)速度建模對于訓(xùn)練集的依賴。
速度譜雖然在層狀模型的重構(gòu)中表現(xiàn)很好,但在重構(gòu)異常體時(shí),建模結(jié)果與真實(shí)模型差異很大(圖8e),這可能是受到速度分析過程中疊加的影響,導(dǎo)致網(wǎng)絡(luò)模型的泛化能力降低。
圖8 孤立異常體模型測試集建模結(jié)果
BP鹽丘模型既具有沉積地層結(jié)構(gòu)的層狀速度特征,也具有孤立異常體的橫向速度劇烈變化的特征,是測試本文方法的理想模型。測試集包含50個(gè)從圖4c中隨機(jī)截取的速度模型,但截取窗口的位置、大小與訓(xùn)練集不同。圖9為其中一個(gè)測試集模型的速度建模結(jié)果。在未加噪聲時(shí),聯(lián)合特征數(shù)據(jù)集的方法(本文方法)與只用反射波形的方法都可以較準(zhǔn)確地確定速度模型中高速鹽丘的位置、形狀(圖9b、圖10c),而只用速度譜作為特征數(shù)據(jù)集時(shí),異常體形狀和速度的重構(gòu)效果都不如前兩種方法(圖9d)。加噪(5%高斯噪聲)后,以反射波形為特征數(shù)據(jù)集的速度建模結(jié)果在鹽丘異常體的附近出現(xiàn)了較明顯的假象(圖9f)。
圖9 BP鹽丘模型測試集建模結(jié)果
圖10 BP鹽丘模型測試集不同方法建模結(jié)果的速度曲線對比
圖10對比了圖9a~圖9d速度模型特定位置的速度剖面,抽取了水平距離為2km和3km以及深度為1.2km和1.8km共四個(gè)速度剖面進(jìn)行對比。由圖可以看出,本文方法的速度建模結(jié)果(紅色實(shí)線)與真實(shí)模型最為接近。
由圖11可見,只使用反射波形作為特征數(shù)據(jù)集時(shí),相比于其他兩種方法數(shù)據(jù)加噪后的預(yù)測模型與真實(shí)模型之間的誤差有明顯的增大,這說明只用反射波形作為深度學(xué)習(xí)的特征數(shù)據(jù)集時(shí),速度建模受噪聲的影響比其他兩種方法大,抗噪能力較弱。而聯(lián)合反射波形和速度譜作為數(shù)據(jù)集的方法(本文方法)不但誤差較小,而且有較強(qiáng)的抗噪能力。
圖11 BP模型測試集預(yù)測模型與真實(shí)模型之間的e NRMS值
本文通過聯(lián)合地震反射波形與速度譜作為特征數(shù)據(jù)集,采用多尺度速度模型構(gòu)成訓(xùn)練集,并在FCN中加入Dropout層,構(gòu)建了一種深度學(xué)習(xí)速度建模方法。對簡單層狀結(jié)構(gòu)和孤立異常體以及復(fù)雜的BP鹽丘模型的數(shù)值實(shí)驗(yàn)結(jié)果顯示,結(jié)合地震反射資料和多尺度訓(xùn)練集的深度學(xué)習(xí)速度建模方法可以有效重構(gòu)模型的主要特征。得到的認(rèn)識(shí)和結(jié)論如下。
(1)通過以加入Dropout層的FCN作為深度神經(jīng)網(wǎng)絡(luò)框架,深度學(xué)習(xí)方法能夠重構(gòu)層狀結(jié)構(gòu)和異常體結(jié)構(gòu),而且泛化能力較強(qiáng)。
(2)相較于單獨(dú)使用地震波形或速度譜,聯(lián)合地震波形和速度譜作為深度學(xué)習(xí)的特征數(shù)據(jù)集能夠兼顧兩者作為特征數(shù)據(jù)集的優(yōu)勢,不僅可以提高速度模型重構(gòu)的精度,而且還能夠降低數(shù)據(jù)的冗余和計(jì)算難度,提高速度建模的穩(wěn)定性。
(3)多尺度訓(xùn)練集有助于提高深度學(xué)習(xí)速度建模的穩(wěn)定性。多尺度訓(xùn)練集包含了不同尺度速度結(jié)構(gòu)的信息,可提高深度學(xué)習(xí)速度建??坍嫯惓sw形態(tài)的準(zhǔn)確性。