王倩倩, 宋鵬,2,3*, 華清峰, 劉保華, 李官保, 王紹文, 都國(guó)寧
1 中國(guó)海洋大學(xué)海洋地球科學(xué)學(xué)院, 青島 266100 2 嶗山實(shí)驗(yàn)室, 海洋礦產(chǎn)資源評(píng)價(jià)與探測(cè)技術(shù)功能實(shí)驗(yàn)室, 青島 266100 3 中國(guó)海洋大學(xué)海底科學(xué)與探測(cè)技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室, 青島 266100 4 自然資源部第一海洋研究所, 青島 266061
Tarantola(1984)在20世紀(jì)80年代提出全波形反演(Full Waveform Inversion, FWI)理論,其可用于獲得地下地層速度模型信息.基于最小二乘反演理論,FWI將模擬地震記錄與實(shí)際地震記錄之間的殘差平方和作為反演的目標(biāo)函數(shù),使用伴隨狀態(tài)法計(jì)算目標(biāo)函數(shù)的梯度,并對(duì)給定的初始速度模型進(jìn)行迭代更新直至得到高分辨率的速度反演結(jié)果.由于FWI具有準(zhǔn)確刻畫地下復(fù)雜結(jié)構(gòu)速度模型的潛力,該方法引起了業(yè)界的廣泛關(guān)注并且成為地球物理領(lǐng)域的研究熱點(diǎn).為克服周期跳躍的影響,Bunks等(1995)提出了多尺度FWI策略,即將地震數(shù)據(jù)劃分為由低到高的不同頻率成分.除此之外,低波數(shù)信息對(duì)于避免局部極小值問(wèn)題至關(guān)重要,因此需要從地震數(shù)據(jù)中提取低波數(shù)信息并研究多種方法來(lái)有效避免局部極小值(Wu et al., 2014; 張文生等, 2015; 陳生昌和陳國(guó)新, 2017; Lian et al., 2018; Wu and Alkhalifah, 2018; Yao et al., 2019a,b; Sun and Alkhalifah, 2019; He and Liu, 2020; Li and Alkhalifah, 2021; 李振春等, 2022).FWI已經(jīng)被應(yīng)用于黏聲介質(zhì)(Kamath et al., 2021; 鄒鵬和程玖兵, 2020; Wang and Qu, 2021),彈性介質(zhì)(Mora, 1987, 1988; Xu and McMechan, 2014; Ren and Liu, 2015, 2016; Qu et al., 2020),VTI介質(zhì)(Zhang and Alkhalifah, 2017; Feng et al., 2021; 唐杰等, 2022),各向異性介質(zhì)(張盼等, 2018; Oh and Alkhalifah, 2019),黏聲各向異性介質(zhì)(Qu et al., 2017)等.
經(jīng)過(guò)幾十年的發(fā)展,FWI在反演精度和計(jì)算效率方面都取得了巨大的進(jìn)展,已有學(xué)者發(fā)展了反射波波形反演(Yao and Wu, 2017; Yao et al., 2019a,b; 胡勇等, 2021; 孫思宇等, 2021)等方法來(lái)提高反演精度.然而,常規(guī)FWI仍然存在著一個(gè)問(wèn)題:目前FWI采用的大多數(shù)梯度求解算法,如共軛梯度算法(Polyak, 1969; Witte et al., 2018),L-BFGS算法(Nocedal and Wright, 2006)和截?cái)嗯nD算法(Nash, 2000)等,即使其梯度再經(jīng)過(guò)預(yù)處理,在深部地層的收斂效率和精度依然不高(Alkhalifah et al., 2018).此外,這些梯度類算法在每次更新模型時(shí)還需要額外的波場(chǎng)計(jì)算來(lái)獲得一個(gè)合適的迭代步長(zhǎng),進(jìn)一步降低了FWI的計(jì)算效率.
以卷積神經(jīng)網(wǎng)絡(luò)(Hinton and Salakhutdinov, 2006)為代表的深度學(xué)習(xí)技術(shù)發(fā)展迅速,其為解決常規(guī)FWI問(wèn)題提供了新的解決方案(李燕梅等, 2022; 王竟儀等, 2023).神經(jīng)網(wǎng)絡(luò)的優(yōu)化過(guò)程本質(zhì)上也是一個(gè)基于梯度優(yōu)化算法參數(shù)的迭代更新過(guò)程,對(duì)于含有數(shù)百萬(wàn)個(gè)待優(yōu)化參數(shù)的神經(jīng)網(wǎng)絡(luò),其優(yōu)化必須依靠高效的梯度優(yōu)化算法.目前已有部分學(xué)者(Sun et al., 2020; Bernal-Romero and Iturrarán-Viveros, 2021)嘗試將RMSProp(Hinton et al., 2012),Adam和AdaMax(Kingma and Ba, 2017)等具有橢球約束的一階置信域(Adolphs et al., 2020)梯度優(yōu)化算法引入FWI中,實(shí)驗(yàn)結(jié)果表明這些算法在反演精度和收斂效率方面均具有明顯優(yōu)勢(shì).
Adam算法為目前較為常用的深度學(xué)習(xí)梯度優(yōu)化算法,其迭代步長(zhǎng)和超參數(shù){β1,β2}的取值對(duì)于梯度的優(yōu)化效果至關(guān)重要(Ma and Yarats, 2019),然而深度學(xué)習(xí)框架所提供的默認(rèn)參數(shù)并沒(méi)有針對(duì)FWI進(jìn)行優(yōu)化.鑒于此,Sun等(2020)分析了迭代步長(zhǎng)的取值對(duì)于梯度的優(yōu)化影響,并給出了迭代步長(zhǎng)的取值原則,Kuldeep和Shekar(2021)分析了{(lán)β1,β2}等超參數(shù)對(duì)于反演的影響,并給出了一個(gè)相對(duì)保守的取值范圍來(lái)使損失曲線保持平穩(wěn).本文通過(guò)Marmousi模型數(shù)據(jù)和Overthrust模型數(shù)據(jù)的實(shí)驗(yàn),系統(tǒng)分析了{(lán)β1,β2}等超參數(shù)的取值對(duì)于FWI的優(yōu)化效果,并給出了優(yōu)化的參數(shù)值.
在密度恒定的二維各向同性介質(zhì)中,時(shí)域聲波方程為
(1)
FWI是以合成數(shù)據(jù)和觀測(cè)數(shù)據(jù)的整體差異最小作為約束條件,基于梯度迭代方法來(lái)優(yōu)化模型參數(shù),最終重構(gòu)能夠表征地下介質(zhì)構(gòu)造的模型參數(shù).最小二乘意義下的目標(biāo)泛函可以表示為
(2)
其中,m為模型參數(shù),在常密度聲波方程中為地下介質(zhì)的聲波速度v(x);E(m)為FWI需要優(yōu)化的目標(biāo)函數(shù),dobs和dsyn分別代表觀測(cè)數(shù)據(jù)和模擬數(shù)據(jù).
基于伴隨狀態(tài)法可得到FWI的梯度計(jì)算公式為
(3)
其中,下標(biāo)k為第k次迭代,mk為第k次迭代的模型參數(shù),Ns為震源總數(shù),Nt為離散時(shí)間采樣點(diǎn)數(shù),ψ(x,t;xr)表示基于mk模型,在xr點(diǎn)處以合成地震記錄與觀測(cè)地震記錄之差的殘差地震記錄為擾動(dòng)的逆時(shí)波場(chǎng),u(x,t;xs)表示基于mk模型,在xs點(diǎn)處通過(guò)波動(dòng)方程數(shù)值正演模擬獲得的正傳波場(chǎng).
對(duì)于常規(guī)的FWI,通過(guò)公式(3)計(jì)算得到的梯度通常還需要基于共軛梯度法(CG)、L-BFGS法(Liu and Nocedal, 1989; Moghaddam et al., 2013; Huang et al., 2017)、截?cái)嗯nD法(Yang et al., 2016; Matharu and Sacchi, 2019)等算法進(jìn)行梯度優(yōu)化,以達(dá)到更高精度的收斂效果.此外,一些梯度預(yù)處理方法,如基于波場(chǎng)能量的梯度預(yù)處理算法等(Zhang et al., 2011, 2012; Song et al., 2019)也常用來(lái)進(jìn)一步提高梯度精度,進(jìn)而提高深層部分的反演精度.
基于常規(guī)算法的FWI,其模型參數(shù)更新過(guò)程可以表示為
mk=mk-1-αkPgk,
(4)
其中,P表示梯度預(yù)處理算子,αk表示第k次迭代的迭代步長(zhǎng),其通常需要用線搜索策略(Gauthier et al., 1986; Virieux and Operto, 2009)來(lái)獲得滿足Wolfe條件的步長(zhǎng)取值(Bernal-Romero and Iturrarán-Viveros, 2021).基于常規(guī)算法的FWI反演流程如圖1所示.
圖1 常規(guī)FWI計(jì)算流程Fig.1 The workflow of conventional FWI
傳統(tǒng)FWI中線搜索和梯度預(yù)處理都需要額外的正演模擬計(jì)算,其降低了FWI的計(jì)算效率.此外,即使每次迭代中都使用梯度預(yù)處理算子進(jìn)行預(yù)處理,其梯度值也并未得到足夠優(yōu)化,這會(huì)降低FWI的收斂效率與反演精度(Alkhalifah et al., 2018).
深度學(xué)習(xí)領(lǐng)域其神經(jīng)網(wǎng)絡(luò)的優(yōu)化過(guò)程本質(zhì)上也是一個(gè)基于梯度優(yōu)化算法參數(shù)的迭代更新過(guò)程,對(duì)于含有數(shù)百萬(wàn)個(gè)待優(yōu)化參數(shù)的神經(jīng)網(wǎng)絡(luò),其優(yōu)化必須依靠高效的梯度優(yōu)化算法.Adam算法是目前較為常用的深度學(xué)習(xí)梯度優(yōu)化算法,其結(jié)合了AdaGrad(Duchi et al., 2011)和RMSProp(Tieleman and Hinton, 2012)的優(yōu)點(diǎn),具有算法穩(wěn)定、收斂效率高等優(yōu)點(diǎn),目前已有部分學(xué)者實(shí)現(xiàn)了基于Adam算法梯度優(yōu)化的FWI(Sun et al., 2020; Bernal-Romero and Iturrarán-Viveros, 2021).
基于Adam算法的FWI,其迭代步長(zhǎng)均由算法本身計(jì)算得到,因此在計(jì)算步長(zhǎng)時(shí)不需要額外的波場(chǎng)延拓計(jì)算;此外,基于Adam算法的優(yōu)化梯度均是由歷史梯度的指數(shù)加權(quán)平均來(lái)獲取,其不需要應(yīng)用基于波場(chǎng)能量的梯度預(yù)處理等算法進(jìn)行后續(xù)處理,這意味著非??捎^的計(jì)算量節(jié)約.
在Adam算法中,其梯度的一階矩估計(jì)的計(jì)算公式為
(5)
(6)
基于Adam算法的模型參數(shù)更新量的公式為
(7)
式中,Δmk為第k次迭代的模型更新量.ε為保持?jǐn)?shù)值穩(wěn)定的常數(shù),其值一般為1×10-10.αk為第k次迭代的迭代步長(zhǎng).本文通過(guò)常規(guī)算法計(jì)算了第一次迭代步長(zhǎng)值,并設(shè)定初始迭代步長(zhǎng)值為α1,然后在后續(xù)的迭代中對(duì)初始步長(zhǎng)施加一個(gè)衰減系數(shù)為0.99的指數(shù)衰減來(lái)計(jì)算其余迭代步長(zhǎng),如公式(8)所示.通過(guò)公式(8)計(jì)算所得的步長(zhǎng)與Sun等(2020)所提出的步長(zhǎng)有效范圍一致:
αk=max{‖Δm0‖}/2*γk-1,
(8)
其中,‖Δm0‖為模型第一次迭代時(shí)基于常規(guī)算法計(jì)算所得的模型更新量的絕對(duì)值,γ=0.99為迭代步長(zhǎng)的指數(shù)衰減系數(shù).
基于Adam算法的FWI計(jì)算流程圖如圖2所示.與常規(guī)算法對(duì)比(如圖1所示),Adam算法可以直接從梯度獲得優(yōu)化后的模型更新量,避免了迭代步長(zhǎng)和梯度預(yù)處理算子P的求取,從而提高FWI的計(jì)算效率.
圖2 基于Adam優(yōu)化算法的FWI計(jì)算流程Fig.2 Workflow of FWI based on Adam algorithm
Adam算法的迭代步長(zhǎng)和超參數(shù){β1,β2}的取值對(duì)于梯度的優(yōu)化效果至關(guān)重要,當(dāng)使用Adam算法的默認(rèn)參數(shù)進(jìn)行反演的時(shí)候,其反演精度是相近的(Bernal-Romero and Iturrarán-Viveros, 2021).由于這些默認(rèn)參數(shù)是基于深度學(xué)習(xí)的任務(wù)進(jìn)行設(shè)計(jì)的,因此其在FWI應(yīng)用中還有改進(jìn)的空間.Sun等(2020)分析了迭代步長(zhǎng)的取值對(duì)于梯度的優(yōu)化影響,并給出了迭代步長(zhǎng)的取值原則,但目前尚未有對(duì)于超參數(shù){β1,β2}的取值對(duì)于FWI影響的系統(tǒng)分析.本文基于Marmousi模型來(lái)系統(tǒng)測(cè)試超參數(shù){β1,β2}的取值影響,并最終給出最優(yōu)的參數(shù)取值,來(lái)最大限度的提升基于Adam算法的FWI的收斂效率和反演精度.
本文所采用的Marmousi模型的水平距離和模型深度分別為9.2 km和2.4 km,橫向網(wǎng)格間距和縱向網(wǎng)格間距均為20 m,真實(shí)速度模型和初始速度模型分別如圖3a、b所示.雷克子波的主頻為10 Hz,其記錄長(zhǎng)度為4 s,采樣間隔為1 ms.觀測(cè)數(shù)據(jù)共有100炮,每炮共有461道進(jìn)行接收,由時(shí)間二階、空間十階的有限差分進(jìn)行模擬得到,邊界條件使用混合吸收邊界條件(Xie et al., 2020).炮點(diǎn)和檢波點(diǎn)的深度為20 m,其中檢波點(diǎn)的位置是固定的,炮點(diǎn)位置為從左向右進(jìn)行移動(dòng).
圖3 Marmousi模型(a) 真實(shí)模型; (b) 初始模型.Fig.3 Marmousi model(a) Real model; (b) Initial model.
考慮到梯度優(yōu)化與數(shù)據(jù)頻帶無(wú)關(guān),本文測(cè)試選取了0~5 Hz的頻帶范圍進(jìn)行測(cè)試.為系統(tǒng)測(cè)試Adam參數(shù)對(duì)于反演的影響,首先分別給出如表1和表2的β1和β2參數(shù)取值,其中β1由0.9均勻降至0.1共9個(gè)值,β2從0.999逐漸減小至0.1共10個(gè)值.測(cè)試分析時(shí),以表1中β1的值為基準(zhǔn),共測(cè)試9組;每組中β1的取值固定,β2分別取自表2中的各個(gè)值,共10次反演測(cè)試,分別記為Adam1~Adam10,各組試驗(yàn)的目標(biāo)函數(shù)曲線分別如圖4a—i所示.
表1 各組β1的值Table 1 Values of β1 of different sets
表2 每組的β2值Table 2 Values of β2 in each set
圖4 9組實(shí)驗(yàn)(a—i)的目標(biāo)函數(shù)曲線Fig.4 The objective functions for 9 sets of experiments (a—i)
圖4中各條曲線的平滑度一定程度上可反映反演的穩(wěn)定性,最終目標(biāo)函數(shù)值反映出反演的精度,因此相對(duì)平滑且最終值較小目標(biāo)函數(shù)曲線可被認(rèn)為對(duì)應(yīng)于1組相對(duì)較優(yōu)的參數(shù){β1,β2}.鑒于以上分析,由于圖4f—i(即β1≤0.4)中的目標(biāo)函數(shù)曲線震蕩較為劇烈且最終的值大于圖4a—e的結(jié)果,因此更適合于FWI的Adam參數(shù)應(yīng)該存在于1組到5組實(shí)驗(yàn)中.
在第1組到5組中選擇最優(yōu)的1~2個(gè)參數(shù)組合,重新繪制目標(biāo)函數(shù)曲線如圖5所示,其所對(duì)應(yīng)的參數(shù)如表3所示.
表3 第1組至第5組的參數(shù)值Table 3 Suboptimal values of parameters from group 1 to group 5
圖5中的藍(lán)色曲線代表β1=0.9、β2=0.999,其為大多數(shù)深度學(xué)習(xí)訓(xùn)練過(guò)程中經(jīng)常使用的參數(shù)值(Chollet, 2018),然而由圖5可以看出,這組參數(shù)并不是FWI的最優(yōu)參數(shù),當(dāng)β1=0.6、β2≥0.5時(shí),其反演結(jié)果是所有測(cè)試中最優(yōu)的,若想提高反演收斂的穩(wěn)定性,可將β2設(shè)置為接近1的值,若想提高反演的收斂效率,可將β2設(shè)置為接近0.5的值.因此參數(shù)β1=0.6、β2≥0.5這個(gè)范圍是適合于FWI的最優(yōu)Adam算法參數(shù)范圍.為了提高反演的收斂效率,在本文的模型實(shí)驗(yàn)中,將β2的值均設(shè)置為0.5.
本文分別基于L-BFGS算法、默認(rèn)參數(shù)Adam算法和優(yōu)化參數(shù)的Adam算法,應(yīng)用Marmousi模型(與第2節(jié)中使用的模型一致)和Overthrust模型進(jìn)行FWI實(shí)驗(yàn),反演頻帶范圍依然為0~5 Hz.
由于基于Adam梯度優(yōu)化算法的FWI可以直接獲得優(yōu)化后的模型,不需要計(jì)算迭代步長(zhǎng)和基于波場(chǎng)能量的梯度預(yù)處理,其計(jì)算效率高于基于L-BFGS算法FWI的計(jì)算效率,按照波場(chǎng)延拓次數(shù)比較基于L-BFGS算法的FWI其計(jì)算成本約為基于Adam算法FWI的1.5倍.因此為對(duì)比相同計(jì)算效率下的反演收斂效率和精度,本文不比較二者迭代次數(shù)相同時(shí)的反演結(jié)果,而是比較相同波場(chǎng)延拓次數(shù)下的反演結(jié)果,因此基于L-BFGS算法的FWI進(jìn)行了12次迭代,基于Adam算法的FWI進(jìn)行了20次迭代.
通過(guò)計(jì)算,基于Adam算法FWI的初始迭代步長(zhǎng)為45.73,且每次迭代的步長(zhǎng)均在Sun等(2020)給出的參數(shù)范圍之內(nèi).圖6a、b、c分別為基于含梯度預(yù)處理的L-BFGS算法、基于默認(rèn)參數(shù)Adam算法與基于最優(yōu)參數(shù)Adam算法的FWI在經(jīng)過(guò)6000次波場(chǎng)延拓計(jì)算后的反演結(jié)果.此時(shí),基于L-BFGS算法的FWI進(jìn)行了12次迭代,而基于Adam算法的FWI進(jìn)行了20次迭代.由圖6可知,基于Adam算法的FWI反演精度明顯優(yōu)于基于L-BFGS算法FWI的反演精度,尤其是深層地區(qū)(如黑色虛線圈所示).此外,與基于默認(rèn)參數(shù)Adam算法的FWI相比,基于最優(yōu)參數(shù)Adam算法的FWI在淺部區(qū)域具有更高的反演精度(如圖6中白色虛線圈所示).
圖6 不同算法的Marmousi模型反演結(jié)果(a) L-BFGS算法; (b) 默認(rèn)參數(shù)Adam算法; (c) 最優(yōu)參數(shù)Adam算法.Fig.6 Inversion results of Marmousi model based on(a)The L-BFGS algorithm result; (b) The Adam algorithm with default parameters; (c) The Adam algorithm with optimal parameters.
將圖6中5.2 km處速度反演結(jié)果進(jìn)行抽道并與真實(shí)速度曲線進(jìn)行對(duì)比(如圖7所示).在圖7中,黑色曲線代表真實(shí)速度模型,藍(lán)色曲線代表基于L-BFGS算法FWI的反演結(jié)果,紅色曲線代表基于默認(rèn)參數(shù)Adam算法FWI的反演結(jié)果,綠色曲線代表基于最優(yōu)參數(shù)Adam算法FWI的反演結(jié)果.圖7表明,與基于L-BFGS算法和基于默認(rèn)參數(shù)Adam算法的FWI相比,基于最優(yōu)參數(shù)Adam算法FWI的速度曲線更接近于真實(shí)速度,說(shuō)明我們上述選擇的最優(yōu)參數(shù)Adam算法FWI與其他兩種算法相比,具有更高的反演精度和收斂效率.
圖7 5.2 km處速度縱向切片對(duì)比Fig.7 Velocity profiles at location 5.2 km
圖8和圖9分別顯示了三種反演方法的目標(biāo)函數(shù)對(duì)數(shù)迭代曲線與歸一化誤差迭代曲線.在圖8和圖9中,藍(lán)色曲線代表基于L-BFGS算法的FWI反演結(jié)果,紅色曲線代表基于默認(rèn)參數(shù)Adam算法的FWI反演結(jié)果,綠色曲線代表基于最優(yōu)參數(shù)Adam算法的FWI反演結(jié)果.圖8和圖9表明,當(dāng)反演目標(biāo)函數(shù)值相同時(shí),基于最優(yōu)參數(shù)Adam算法的FWI與其他兩種算法相比,其收斂速度更快(波場(chǎng)模擬次數(shù)更少).因此,基于最優(yōu)參數(shù)Adam算法的FWI在這三種算法中具有最快的收斂效率.
圖8 目標(biāo)函數(shù)對(duì)數(shù)迭代曲線(Simulations為波場(chǎng)模擬次數(shù))Fig.8 The curves of logarithmic objective function (Simulations are the number of wave field simulations)
圖9 歸一化誤差迭代曲線(Simulations為波場(chǎng)模擬次數(shù))Fig.9 The curves of normalized data error (Simulations are the number of wave field simulations)
本文基于一張Telsa-V100卡分別對(duì)基于L-BFGS算法、基于默認(rèn)參數(shù)Adam算法、基于最優(yōu)參數(shù)Adam算法的FWI進(jìn)行計(jì)算,基于L-BFGS算法12次迭代計(jì)算時(shí)間與基于Adam算法20次迭代計(jì)算時(shí)間如表4所示.由表4可知,基于Adam算法的FWI其迭代20次所需時(shí)間與基于L-BFGS算法的FWI迭代12次所需時(shí)間基本一致.由此可知,基于Adam算法的FWI其計(jì)算效率要高于基于L-BFGS算法的FWI,這是其不需要進(jìn)行基于地震波能量預(yù)處理和計(jì)算梯度步長(zhǎng)而節(jié)省的2次波場(chǎng)延拓計(jì)算時(shí)間所致.
表4 不同算法相同波場(chǎng)延拓次數(shù)下的FWI迭代時(shí)間Table 4 Computation time of different algorithms and same simulations
為了進(jìn)一步驗(yàn)證基于最優(yōu)參數(shù)Adam算法的收斂效率,本文還采用深度為4.0 km、寬度為12.5 km的Overthrust模型進(jìn)行測(cè)試,其真實(shí)速度模型和初始速度模型分別如圖10a、b所示.時(shí)間采樣間隔為0.002 s,網(wǎng)格間距為25 m,我們通過(guò)100炮的合成地震數(shù)據(jù),基于L-BFGS算法、默認(rèn)參數(shù)Adam算法以及最優(yōu)參數(shù)Adam算法進(jìn)行迭代反演.通過(guò)計(jì)算,基于Adam算法FWI的初始迭代步長(zhǎng)為56.28,且每次迭代的步長(zhǎng)均在Sun等(2020)給出的參數(shù)范圍之內(nèi).
圖10 Overthrust速度模型(a) 真實(shí)模型; (b) 初始模型.Fig.10 The Overthrust velocity model(a) The true model; (b) The initial model.
本文同樣比較經(jīng)過(guò)6000次波場(chǎng)模擬計(jì)算后的反演結(jié)果,其中L-BFGS算法進(jìn)行了12次迭代,Adam算法進(jìn)行了20次迭代.圖11a為基于梯度預(yù)處理L-BFGS算法FWI的反演結(jié)果,圖11b、c分別為基于默認(rèn)參數(shù)Adam算法和基于最優(yōu)參數(shù)Adam算法FWI的反演結(jié)果.與基于L-BFGS算法相比,基于Adam算法的反演結(jié)果(圖11b、c)具有更高的反演精度,尤其是在深部地層(如圖11中的黑色虛線圈所示).
圖11 Overthrust模型迭代反演結(jié)果(a) L-BFGS算法; (b) 默認(rèn)參數(shù)Adam算法; (c) 最優(yōu)參數(shù)Adam算法.Fig.11 Inversion results of Overthrust model(a) L-BFGS; (b) Adam with default parameters; (c) Adam with optimal parameters.
圖11中4.8 km和10.1 km處反演結(jié)果縱向切片對(duì)比如圖12所示.為了便于比較,將真實(shí)速度曲線用黑色表示.由圖12可知,基于Adam算法的反演結(jié)果比基于L-BFGS算法的反演結(jié)果反演精度更高,此外,與基于默認(rèn)參數(shù)Adam算法相比,基于最優(yōu)參數(shù)Adam算法進(jìn)一步提高了深部地層的反演精度.
圖12 速度縱向切片對(duì)比(a) 4.8 km; (b) 10.1 km.Fig.12 Velocity profiles at locations
圖13和圖14為Overthrust模型的目標(biāo)函數(shù)對(duì)數(shù)迭代曲線與歸一化誤差迭代曲線.從圖中可以看出,與L-BFGS算法和默認(rèn)參數(shù)Adam算法相比,優(yōu)化參數(shù)Adam算法仍然具有最好的收斂效率和反演精度,由此可知,基于Marmousi模型所選擇的最優(yōu)參數(shù)也同樣適用于其他復(fù)雜模型.
圖13 目標(biāo)函數(shù)對(duì)數(shù)迭代曲線(Simulations為波場(chǎng)模擬次數(shù))Fig.13 The curves of logarithmic objective function (Simulations are the number of wave field simulations)
圖14 歸一化誤差迭代曲線(Simulations為波場(chǎng)模擬次數(shù))Fig.14 The curves of normalized model error (Simulations are the number of wave field simulations)
本文在詳細(xì)論述基于Adam梯度優(yōu)化算法的FWI原理和實(shí)現(xiàn)步驟的基礎(chǔ)上,通過(guò)大量的模型數(shù)據(jù)測(cè)試,系統(tǒng)分析了超參數(shù){β1,β2}的取值對(duì)FWI的收斂性和反演精度的影響,并給出了更適合于FWI的優(yōu)化參數(shù).通過(guò)參數(shù)測(cè)試與分析優(yōu)化,得到當(dāng)β1=0.6、β2≥0.5時(shí),其反演結(jié)果是所有測(cè)試中最優(yōu)的,且若想提高反演收斂的穩(wěn)定性,可將β2設(shè)置為接近1的值,若想提高反演的收斂效率,可將β2設(shè)置為接近0.5的值.基于Marmousi模型和Overthrust模型的數(shù)值實(shí)驗(yàn)表明,相比于基于L-BFGS算法和基于默認(rèn)參數(shù)Adam算法的FWI,基于最優(yōu)參數(shù)Adam算法的FWI其具有更高的收斂效率和反演精度.
當(dāng)然,考慮到實(shí)際數(shù)據(jù)的反演還會(huì)受到模型低頻信息缺失,初始模型精度不夠,地下構(gòu)造過(guò)于復(fù)雜(如鹽丘模型和我國(guó)西部的逆沖斷層模型)等眾多因素的影響,在這種情況下基于優(yōu)化參數(shù)的Adam算法在實(shí)際數(shù)據(jù)資料應(yīng)用中不一定可以達(dá)到最優(yōu),因此將該算法引入實(shí)際數(shù)據(jù)的反演中,通過(guò)實(shí)際數(shù)據(jù)反演測(cè)試進(jìn)一步提高該算法的實(shí)用性與精度將是我們下一步的工作重點(diǎn).