關(guān)鍵詞:深度學(xué)習(xí),數(shù)據(jù)處理,多次波壓制,Pix2Pix網(wǎng)絡(luò)
0 引言
在地震資料的分析過程中,多次波常常干擾了地震數(shù)據(jù)的成像與解釋[1],特別是對于海洋勘探數(shù)據(jù),由于海面和海底等強(qiáng)波阻抗界面的存在,生成的強(qiáng)多次波會與有效信號混合在一起,生成錯誤的偽影,降低偏移圖像的分辨率。多次波與有效一次波在特征形態(tài)上極為相似,難以被有效區(qū)分。因此,開發(fā)高效可行的多次波壓制技術(shù)一直是地震勘探領(lǐng)域持續(xù)關(guān)注的熱點(diǎn)問題之一[2-3]。
主流的多次波壓制方法主要分為三大類:濾波法、波動方程預(yù)測相減法和機(jī)器學(xué)習(xí)類方法[4-8]。濾波法主要根據(jù)多次波和一次波在不同數(shù)據(jù)域內(nèi)的特征差異,用信號處理技術(shù)分割和切除多余的多次波信息。這類方法在一次波和多次波之間的特征差異較為清晰時(例如簡單的層狀介質(zhì)中)具有較高的成功率和處理效率,但當(dāng)?shù)刭|(zhì)結(jié)構(gòu)較復(fù)雜時,該方法的壓制效果會相應(yīng)降低[5-7]。
波動方程預(yù)測相減法分為預(yù)測和相減兩個階段。首先通過數(shù)值模擬預(yù)測相應(yīng)的多次波信息,然后再與實(shí)際數(shù)據(jù)匹配相減,去除相應(yīng)的多次波。相較于濾波法,該方法更適合壓制復(fù)雜地質(zhì)區(qū)域的多次波,但計(jì)算成本相對較高[8]。
近年來,機(jī)器學(xué)習(xí)方法被越來越多地應(yīng)用于地球物理和地震學(xué)等領(lǐng)域的數(shù)據(jù)處理中[9-10]。在多次波壓制方面,深度學(xué)習(xí)類方法的優(yōu)勢是可以自主發(fā)掘和學(xué)習(xí)數(shù)據(jù)的共有特征,不需要提供額外的地下介質(zhì)模型信息,且訓(xùn)練好的網(wǎng)絡(luò)具有極高的處理效率。例如,王坤喜等[11]在相關(guān)研究中使用數(shù)據(jù)增廣訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò),基于遷移學(xué)習(xí)方案對多次波進(jìn)行了高效快速的壓制;Li等[12]使用了全卷積神經(jīng)網(wǎng)絡(luò)變形形式(U-Net網(wǎng)絡(luò))壓制多次波,該結(jié)構(gòu)具有較強(qiáng)的抗噪能力,提升了網(wǎng)絡(luò)的預(yù)測效果;宋歡等[13]使用深層神經(jīng)網(wǎng)絡(luò)(DNN)壓制多次波,對復(fù)雜地質(zhì)區(qū)域的觀測數(shù)據(jù)具有較好的處理效果;劉小舟等[14]結(jié)合了去噪卷積神經(jīng)網(wǎng)絡(luò)(DnCNN)和U-Net網(wǎng)絡(luò)實(shí)現(xiàn)了層間多次波的壓制,具有較高的抗噪能力。此外,在對自由表面多次波的壓制研究方面,卷積神經(jīng)網(wǎng)絡(luò)(CNN)[15]、生成對抗神經(jīng)網(wǎng)絡(luò)(GAN)[16]和自注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)[17]都表現(xiàn)出了良好的處理效果。以上深度學(xué)習(xí)類方法在訓(xùn)練網(wǎng)絡(luò)時通常輸入含有多次波的原始數(shù)據(jù),將不含多次波的數(shù)據(jù)作為目標(biāo),訓(xùn)練網(wǎng)絡(luò)輸出有效的一次波信息,這一訓(xùn)練過程為一對一的單任務(wù)轉(zhuǎn)換[18-19]。
本文針對自由表面多次波壓制問題,將地震數(shù)據(jù)處理任務(wù)視為相應(yīng)的圖像轉(zhuǎn)譯任務(wù),設(shè)置了多任務(wù)的輸出結(jié)構(gòu),以提升網(wǎng)絡(luò)的輸出效果。首先,采用在圖像轉(zhuǎn)譯領(lǐng)域表現(xiàn)優(yōu)秀的Pix2Pix網(wǎng)絡(luò)[20]處理地震數(shù)據(jù)。該網(wǎng)絡(luò)能較好地學(xué)習(xí)圖片像素點(diǎn)與點(diǎn)之間的關(guān)聯(lián)性,對應(yīng)地震數(shù)據(jù),有助于識別相鄰道集間的連續(xù)同相軸信息,使處理后的數(shù)據(jù)在道集間保持良好的連續(xù)性。其次,對于多任務(wù)輸出,將目標(biāo)數(shù)據(jù)集由常規(guī)單一的一次波形式修改為包含原始數(shù)據(jù)、一次波和多次波三種數(shù)據(jù)組合在一起的多輸出形式。這一改進(jìn)不僅能夠利用多任務(wù)訓(xùn)練更好地發(fā)揮網(wǎng)絡(luò)的數(shù)據(jù)處理潛力,提升輸出效果,而且可以根據(jù)目標(biāo)數(shù)據(jù)間的關(guān)聯(lián)性,設(shè)計(jì)額外的損失函數(shù),進(jìn)一步限制和優(yōu)化網(wǎng)絡(luò)的輸出。最后,基于數(shù)值模型對方法定量測試,證明方法的有效性。
1 條件生成對抗神經(jīng)網(wǎng)絡(luò)
本文使用Pix2Pix網(wǎng)絡(luò)實(shí)現(xiàn)地震數(shù)據(jù)的自由表面多次波壓制。該網(wǎng)絡(luò)是一種條件生成對抗神經(jīng)網(wǎng)絡(luò)(cGAN)[20-21],屬于GAN家族中的眾多分支之一。Pix2Pix使用神經(jīng)網(wǎng)絡(luò)取代了常規(guī)的L2或L1損失函數(shù)對輸出效果進(jìn)行評價(jià),在處理數(shù)據(jù)時,能得到更高分辨率的輸出結(jié)果[20]。
GAN是一種基于對抗訓(xùn)練進(jìn)行自監(jiān)督和無監(jiān)督學(xué)習(xí)的深度學(xué)習(xí)方法[22]。如圖1所示,GAN由一個生成器和一個判別器組成,通過不斷迭代和優(yōu)化生成器和判別器,網(wǎng)絡(luò)的最終目的是訓(xùn)練生成器生成難以被判別器區(qū)分的,具有和目標(biāo)數(shù)據(jù)共有特征的合成數(shù)據(jù)。
具體而言,圖1中判別器D的任務(wù)是盡可能地區(qū)分生成器G輸出的合成數(shù)據(jù)和真實(shí)的目標(biāo)數(shù)據(jù),并給出具體的概率評分;生成器G的任務(wù)則是盡可能地生成能夠迷惑判別器D的合成數(shù)據(jù),合成數(shù)據(jù)盡可能與目標(biāo)數(shù)據(jù)具有足夠多的相同特征。訓(xùn)練過程中,生成器和判別器相互競爭優(yōu)化,最終使生成器生成與目標(biāo)數(shù)據(jù)足夠類似,難以被優(yōu)化后的判別器分辨出的合成數(shù)據(jù)。
傳統(tǒng)的無條件GAN將隨機(jī)噪聲作為輸入,生成帶有目標(biāo)數(shù)據(jù)特征的任意數(shù)據(jù),這意味著輸入與輸出數(shù)據(jù)間沒有明確的對應(yīng)關(guān)系[22]。對于數(shù)據(jù)處理類任務(wù),希望輸出與輸入存在一定的關(guān)聯(lián)性(處理前后依然屬于同一份數(shù)據(jù))。因此,條件生成對抗神經(jīng)網(wǎng)絡(luò)被提出[21],并被用于解決類似問題,包括了本文所使用的Pix2Pix網(wǎng)絡(luò)[20]。
與GAN相比,cGAN在網(wǎng)絡(luò)的輸入和判別器的判別過程中都加入了額外的條件項(xiàng)來限制和指導(dǎo)網(wǎng)絡(luò)的輸出。cGAN的網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示,具體的目標(biāo)函數(shù)形式為
式中:G為生成器;D為判別器;x為條件;y為目標(biāo);z為隨機(jī)噪聲;E為數(shù)學(xué)期望。該損失函數(shù)的前半部分為判別器D判斷目標(biāo)數(shù)據(jù)為真的概率,這一項(xiàng)為固定的常數(shù)項(xiàng);后半部分則是判別器D判斷生成器G輸出數(shù)據(jù)為假的概率,生成器G的目的就是使其盡可能的小,以使總損失函數(shù)最小化,即
式中:λ為權(quán)重系數(shù),額外的L1損失項(xiàng)用于計(jì)算生成器G的輸入與輸出項(xiàng)之間的差別,目的是使網(wǎng)絡(luò)的輸出盡可能依賴輸入,直接使用帶額外損失函數(shù)的網(wǎng)絡(luò)進(jìn)行訓(xùn)練可能導(dǎo)致網(wǎng)絡(luò)難以收斂。
2 訓(xùn)練數(shù)據(jù)集
與常見的卷積神經(jīng)網(wǎng)絡(luò)(CNN)類似,本文使用的Pix2Pix也是一種監(jiān)督學(xué)習(xí)類方法。這類方法需要一一對應(yīng)的帶標(biāo)簽數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集,即輸入和目標(biāo)數(shù)據(jù)都來自同一炮點(diǎn)。其優(yōu)勢是數(shù)據(jù)間具有明確的對應(yīng)關(guān)系,不足是由于實(shí)測地震數(shù)據(jù)質(zhì)量普遍較低,目前只能應(yīng)用合成數(shù)據(jù)進(jìn)行訓(xùn)練。
合理地設(shè)計(jì)訓(xùn)練數(shù)據(jù)集能更好地提升網(wǎng)絡(luò)的輸出效果。對于地震數(shù)據(jù)的多次波壓制問題,深度學(xué)習(xí)類方法在訓(xùn)練階段設(shè)置的輸入數(shù)據(jù)集通常為帶有一次波和多次波信息的原始數(shù)據(jù),目標(biāo)數(shù)據(jù)集則為去除了多次波的有效一次波數(shù)據(jù)。
本文將地震數(shù)據(jù)處理任務(wù)視為圖像優(yōu)化任務(wù),將數(shù)據(jù)轉(zhuǎn)換為圖片進(jìn)行多任務(wù)處理。其優(yōu)勢是相較于傳統(tǒng)的最小二乘形式的損失函數(shù),Pix2Pix利用判別器D構(gòu)建了更為靈活的損失判別方式(式2),網(wǎng)絡(luò)在處理圖像時能兼顧像素點(diǎn)與點(diǎn)之間的關(guān)聯(lián)性,保證圖像結(jié)構(gòu)的連續(xù)性。對于地震數(shù)據(jù),這一特點(diǎn)能很好地保證處理前后數(shù)據(jù)中反射同相軸的連續(xù)性。
如圖3所示,我們將地震數(shù)據(jù)分別存儲在R、G、B三個通道中,并將其轉(zhuǎn)換為對應(yīng)的圖像。首先,對地震數(shù)據(jù)逐道歸一化至[-1,1]區(qū)域內(nèi),再映射到相應(yīng)的圖像區(qū)間[0,255];其次,將輸入圖像固定為原始數(shù)據(jù)(一次波+多次波)存貯于R通道中,G和B通道設(shè)置為128;最后,不同于一般的訓(xùn)練方案,目標(biāo)數(shù)據(jù)不再被設(shè)置為單一的一次波,而是包含了原始數(shù)據(jù)、一次波和多次波組合在一起的目標(biāo)圖像數(shù)據(jù)。
測試結(jié)果表明,多任務(wù)輸出的數(shù)據(jù)間具有一定的關(guān)聯(lián)性,能提升網(wǎng)絡(luò)的輸出效果;輸出數(shù)據(jù)間的關(guān)聯(lián)性允許添加額外的損失函數(shù),以進(jìn)一步優(yōu)化網(wǎng)絡(luò)的輸出精度。圖4為與圖3相對應(yīng)的將地震數(shù)據(jù)轉(zhuǎn)換為圖片后的輸入和目標(biāo)圖片。
3 額外損失函數(shù)
根據(jù)原始數(shù)據(jù)、一次波和多次波間的關(guān)聯(lián)性(原始數(shù)據(jù)=一次波+多次波)設(shè)計(jì)一個額外的損失函數(shù),限制網(wǎng)絡(luò)的輸出,以進(jìn)一步提升Pix2Pix網(wǎng)絡(luò)對多次波的壓制效果。損失函數(shù)的具體形式為
式中:α為權(quán)重系數(shù),經(jīng)過大量測試驗(yàn)證我們將其設(shè)置為0.2;dR、dG和dB分別對應(yīng)三個輸出圖像通道R、G、B中的原始數(shù)據(jù)。通過最小化上述損失函數(shù)矯正網(wǎng)絡(luò)的輸出圖像,提升多次波壓制效果。
需要注意的是在網(wǎng)絡(luò)的訓(xùn)練過程中,并不直接應(yīng)用這一損失函數(shù)進(jìn)行訓(xùn)練,而是先基于原始的損失函數(shù)(式(2))進(jìn)行網(wǎng)絡(luò)預(yù)訓(xùn)練;等網(wǎng)絡(luò)收斂后,再基于改進(jìn)后的損失函數(shù)(式(4))進(jìn)一步額外訓(xùn)練。這一過程與遷移學(xué)習(xí)方案類似,經(jīng)過大量測試,該訓(xùn)練方式有助于提升網(wǎng)絡(luò)的收斂效率。
4 數(shù)值測試
4.1 模型設(shè)置
為了驗(yàn)證方法的有效性,使用Marmousi模型(圖5)生成的合成數(shù)據(jù)測試。數(shù)值模擬方法采用有限差分法,在交錯網(wǎng)格上使用聲波方程模擬地震波場的傳播[23]。觀測系統(tǒng)設(shè)置了720個炮點(diǎn),每個炮點(diǎn)對應(yīng)120個檢波點(diǎn)(圖6);炮間距為20m,道間距為20m,炮檢距為200m;震源為主頻15Hz的雷克子波,水層深度為0.5km,炮點(diǎn)和檢波點(diǎn)都位于水面下0.1km處;采樣時間為3.5s,采樣間隔為1ms。選取位于模型左側(cè)的540個炮點(diǎn)作為訓(xùn)練數(shù)據(jù)集,選取右側(cè)的180個炮點(diǎn)作為驗(yàn)證數(shù)據(jù)集測試,圖5中用紅色虛線劃分了模型相應(yīng)的訓(xùn)練和測試區(qū)間。
基于相同的觀測系統(tǒng),分別在含有自由表面和將自由表面修改為吸收邊界條件下的模型進(jìn)行數(shù)值模擬,并使用在完全水層中模擬的數(shù)值結(jié)果去除初至波。最終經(jīng)過4次數(shù)值模擬,得到不含初至的原始數(shù)據(jù)和相應(yīng)的去除自由表面多次波后的數(shù)據(jù)。
用以下三種網(wǎng)絡(luò)訓(xùn)練方式對比和測試。第一種是將目標(biāo)數(shù)據(jù)集設(shè)置為單一的一次波的一般形式;第二種是將目標(biāo)數(shù)據(jù)集設(shè)置為如圖3所示的復(fù)合形式;第三種是在復(fù)合目標(biāo)數(shù)據(jù)集基礎(chǔ)上,添加額外的損失函數(shù)的形式。為敘述簡便,下文分別將這三種方案用M1、M2和M3代指。其中M1和M2用于對比單一和復(fù)合形式的目標(biāo)數(shù)據(jù)集對網(wǎng)絡(luò)輸出結(jié)果的影響;M2和M3則用于對比額外損失函數(shù)對網(wǎng)絡(luò)輸出的提升效果。
對于網(wǎng)絡(luò)的訓(xùn)練方式,M1和M2都直接使用原始的Pix2Pix網(wǎng)絡(luò),300次迭代后完成訓(xùn)練;M3的訓(xùn)練方式則為先使用原始的Pix2Pix網(wǎng)絡(luò)進(jìn)行200次預(yù)訓(xùn)練,然后添加額外的損失函數(shù)后,再進(jìn)行100次的遷移訓(xùn)練。三種方案的總迭代訓(xùn)練次數(shù)保持一致。
4.2 層狀模型測試
為了更清晰地展示網(wǎng)絡(luò)對多次波的壓制效果,本文使用訓(xùn)練好的網(wǎng)絡(luò)處理簡單的層狀模型(圖7)所生成的數(shù)據(jù),將層狀模型生成的一次波(1和6)和能量較強(qiáng)的自由表面多次波(2、3、4和5)標(biāo)記在模型和觀測數(shù)據(jù)中,如圖7和圖8a所示。圖8為輸入的原始數(shù)據(jù)、網(wǎng)絡(luò)處理后輸出的一次波結(jié)果和相應(yīng)的準(zhǔn)確結(jié)果。直觀上M3的輸出效果最佳,最接近準(zhǔn)確結(jié)果,如圖中用紅色箭頭標(biāo)記相應(yīng)的一次波信息。網(wǎng)絡(luò)的輸出與準(zhǔn)確結(jié)果之間的均方根誤差(RMSE)定量顯示在圖片的正下方,各方法間誤差關(guān)系有M3lt;M2lt;M1,誤差統(tǒng)計(jì)結(jié)果表明提出的改進(jìn)措施可以減少輸出數(shù)據(jù)的誤差。
圖9進(jìn)一步展示了原始數(shù)據(jù)和M3網(wǎng)絡(luò)輸出數(shù)據(jù)對應(yīng)的共炮檢距道集結(jié)果(離炮點(diǎn)最近的檢波點(diǎn),炮檢距為0.2km)。從共炮檢距道集圖像中可明顯看出,數(shù)據(jù)經(jīng)過網(wǎng)絡(luò)處理后,對應(yīng)的炮檢圖像中由自由表面多次波引起的虛假反射層被徹底地去除,基于M3輸出數(shù)據(jù)的共炮檢距道集結(jié)果準(zhǔn)確地對0.5s和1.5s處的反射層清晰成像(圖中使用紅色箭頭標(biāo)記了相應(yīng)層位),證明了方法對簡單模型的有效性。
4.3 復(fù)雜模型測試
更進(jìn)一步,統(tǒng)計(jì)圖5右側(cè)區(qū)域180炮驗(yàn)證數(shù)據(jù)集的測試結(jié)果。如圖10所示,M1、M2和M3的平均均方根誤差(RMSE)分別為8.6%、7.2%和4.2%,其中相較于傳統(tǒng)單一形式的訓(xùn)練方案(M1),改進(jìn)后的多任務(wù)方案(M2)整體降低了約1/8的誤差,而在此基礎(chǔ)上進(jìn)一步結(jié)合了額外損失函數(shù)的M3方案,其誤差僅為M1方案的一半左右。
圖11為測試數(shù)據(jù)集中第一個炮點(diǎn)的炮集記錄圖像,包括了網(wǎng)絡(luò)的輸入和輸出,以及對應(yīng)的準(zhǔn)確結(jié)果。對于更復(fù)雜的模型生成的數(shù)據(jù),訓(xùn)練好的Pix2Pix網(wǎng)絡(luò)依然表現(xiàn)出良好的多次波壓制能力。M3輸出的結(jié)果直觀上與準(zhǔn)確結(jié)果非常相近(圖11d、圖11e),均方根誤差僅為4.2%,表明網(wǎng)絡(luò)具有良好的多次波壓制能力。
圖12為不同數(shù)據(jù)所對應(yīng)的共炮檢距道集結(jié)果,圖13為圖12對應(yīng)放大后的圖像,其中原始數(shù)據(jù)所對應(yīng)的共炮檢距道集結(jié)果(圖12a和圖13a)中存在明顯的虛假反射層(圖中紅色箭頭)。M1對應(yīng)的結(jié)果(圖12b和圖13b)對虛假反射層的壓制效果并不明顯,圖中仍然存在較多的虛假反射。改進(jìn)后的M3方案對應(yīng)的結(jié)果(圖12c和圖13c)對自由表面多次波所造成的虛假反射有較好的壓制效果,如對于1s左右較為明顯的虛假反射層,且圖像整體與準(zhǔn)確的共炮檢距道集結(jié)果(圖12d和圖13d)接近,證明提出的多次波壓制方案有效提升了共炮檢距道集圖像的準(zhǔn)確性和清晰度。
4.4 抗干擾測試
訓(xùn)練方案不變,在輸入數(shù)據(jù)中添加額外的干擾項(xiàng),以測試輸入數(shù)據(jù)質(zhì)量較低時網(wǎng)絡(luò)的處理效果。如圖14所示,隨機(jī)將原始數(shù)據(jù)20%的道集歸零,模擬實(shí)際可能存在的壞道,并添加隨機(jī)噪聲將數(shù)據(jù)的信噪比降至5dB。添加干擾后網(wǎng)絡(luò)的輸入數(shù)據(jù)如圖14b所示,使用存在干擾的數(shù)據(jù)作為輸入重新訓(xùn)練網(wǎng)絡(luò)。網(wǎng)絡(luò)訓(xùn)練好后,輸出結(jié)果如圖14c和圖14d所示,其中圖14c為網(wǎng)絡(luò)輸出的原始數(shù)據(jù),展示了網(wǎng)絡(luò)對數(shù)據(jù)的去噪和補(bǔ)全能力。網(wǎng)絡(luò)很好地重構(gòu)了輸入數(shù)據(jù)中相應(yīng)的缺失信息,處理后的數(shù)據(jù)在道集之間具有良好的連續(xù)性。此外,從圖中紅色方框標(biāo)記的區(qū)域可以發(fā)現(xiàn),由于網(wǎng)絡(luò)并非通過簡單的插值方式補(bǔ)全數(shù)據(jù),而是基于從訓(xùn)練數(shù)據(jù)集中所學(xué)習(xí)到的更復(fù)雜的特征信息,對數(shù)據(jù)進(jìn)行了合適的補(bǔ)充,因此直觀上網(wǎng)絡(luò)輸出數(shù)據(jù)在道集間的連續(xù)性上表現(xiàn)良好,整體與準(zhǔn)確結(jié)果相近。保持?jǐn)?shù)據(jù)的連續(xù)性是GAN網(wǎng)絡(luò)在處理數(shù)據(jù)時的優(yōu)勢之一,這增加了網(wǎng)絡(luò)的實(shí)際應(yīng)用價(jià)值。
圖14d為網(wǎng)絡(luò)輸出的一次波結(jié)果,展示了網(wǎng)絡(luò)在輸入數(shù)據(jù)存在干擾時對多次波的壓制效果。整體上,網(wǎng)絡(luò)展現(xiàn)出了良好的處理效果,處理后的數(shù)據(jù)完整性強(qiáng)且很好地壓制了噪聲干擾。但需要注意的是,在部分區(qū)域網(wǎng)絡(luò)的輸出也客觀存在一定的不足,如圖14d和圖14e中紅色方框所示,當(dāng)輸入數(shù)據(jù)存在部分道集缺失時,網(wǎng)絡(luò)輸出的一次波信息在能量上會有一定的損耗。其原因可能是網(wǎng)絡(luò)在補(bǔ)充缺失信息時對總體能量進(jìn)行了平均化處理,從而一定程度降低了相應(yīng)的幅值信息。
統(tǒng)計(jì)輸入和輸出的原始數(shù)據(jù)與準(zhǔn)確結(jié)果間的均方根誤差(圖15a),并通過誤差大小評價(jià)方法的去噪和數(shù)據(jù)補(bǔ)全能力。統(tǒng)計(jì)結(jié)果表明,經(jīng)過網(wǎng)絡(luò)處理,去除干擾后的輸入數(shù)據(jù),平均誤差從9.1%降至了5.6%,誤差減少了接近一半。對于網(wǎng)絡(luò)輸出的一次波數(shù)據(jù),相較于無干擾的輸入(圖15b中紅色實(shí)線)對應(yīng)的結(jié)果,存在干擾的情況下其平均誤差增加了1%左右(圖15b中紅色虛線),較小的誤差增長同樣證明了方法的可靠性。
如圖16所示,網(wǎng)絡(luò)處理后的數(shù)據(jù)對應(yīng)的共炮檢距道集結(jié)果更直觀地展示了網(wǎng)絡(luò)的去噪和數(shù)據(jù)補(bǔ)全能力,以及相應(yīng)的多次波壓制能力。相較于網(wǎng)絡(luò)輸入的原始數(shù)據(jù)所對應(yīng)的結(jié)果(圖16a),網(wǎng)絡(luò)輸出數(shù)據(jù)對應(yīng)的共炮檢距道集結(jié)果(圖16b)具有更好的連續(xù)性和清晰度,較好地驗(yàn)證了方法的有效性。
5 討論
本文分別使用了540張輸入和目標(biāo)圖片作為網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù)集。網(wǎng)絡(luò)訓(xùn)練的迭代次數(shù)為300次,平均耗時約為2h。訓(xùn)練好的網(wǎng)絡(luò)在處理驗(yàn)證數(shù)據(jù)集的180張輸入圖片時,耗時約為5s。由此可見深度學(xué)習(xí)類方法的主要計(jì)算成本集中在網(wǎng)絡(luò)的訓(xùn)練階段,訓(xùn)練好的網(wǎng)絡(luò)在應(yīng)用時具有非常高的處理效率。
對于方法的泛化問題,訓(xùn)練出一個能處理任意輸入數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)是非常具有挑戰(zhàn)性的。一種更易實(shí)現(xiàn)的方案是對某一特定勘探區(qū)域的觀測數(shù)據(jù)訓(xùn)練與之對應(yīng)的特定處理網(wǎng)絡(luò)。對于特定勘探區(qū)域內(nèi)的數(shù)據(jù),通常已知震源和檢波點(diǎn)的深度、排列或水層深度,未知信息主要為地下速度結(jié)構(gòu)的分布情況??梢愿鶕?jù)已知信息生成對應(yīng)的訓(xùn)練數(shù)據(jù)集,針對性訓(xùn)練網(wǎng)絡(luò),提升其對特定區(qū)域觀測數(shù)據(jù)的處理能力。
目前,機(jī)器學(xué)習(xí)類方法還在不斷快速發(fā)展,與Pix2Pix網(wǎng)絡(luò)類似的圖像處理類方法還包括了CycleGAN、StarGAN和擴(kuò)散模型等。這些圖像轉(zhuǎn)譯類方法在處理數(shù)據(jù)時所關(guān)注的區(qū)域不再局限于單一的數(shù)據(jù)點(diǎn),而是擴(kuò)展到圖像某一小范圍內(nèi)整體的優(yōu)化程度,相關(guān)研究已證明這類方案能很好地提升網(wǎng)絡(luò)預(yù)測結(jié)果的分辨率,這也是本文將地震數(shù)據(jù)處理轉(zhuǎn)換為圖像處理任務(wù)的原因之一。在后續(xù)研究中,筆者也將嘗試更多前沿方法,進(jìn)一步提升多次波壓制效果。
6 結(jié)論
對于地震數(shù)據(jù)的多次波壓制問題,本文將數(shù)據(jù)處理任務(wù)視為圖像轉(zhuǎn)譯任務(wù),引入了相應(yīng)領(lǐng)域表現(xiàn)優(yōu)秀的Pix2Pix網(wǎng)絡(luò)實(shí)現(xiàn)多次波的壓制,這類方法的優(yōu)勢是能關(guān)注和學(xué)習(xí)到相鄰區(qū)域間數(shù)據(jù)的連續(xù)特征,有助于處理具有連續(xù)性特征的地震數(shù)據(jù)。在這一過程中,對目標(biāo)數(shù)據(jù)集和損失函數(shù)進(jìn)行了優(yōu)化,包括:①使用了復(fù)合形式的目標(biāo)數(shù)據(jù)集進(jìn)行多任務(wù)訓(xùn)練;②添加了額外的限制性損失函數(shù)項(xiàng)。數(shù)值測試結(jié)果表明,本文方案有效可行,訓(xùn)練好的Pix2Pix網(wǎng)絡(luò)能快速有效地壓制輸入數(shù)據(jù)中的多次波干擾,且具有較強(qiáng)的抗噪、抗數(shù)據(jù)缺失能力。