關鍵詞: 地震儲層預測,深度學習,地震反演,地震烴類檢測,有監(jiān)督學習,無監(jiān)督學習
0 引言
傳統(tǒng)地震儲層預測技術是通過反演從地震資料中獲取縱波速度、橫波速度、波阻抗及彈性模量、泊松比等參數(shù),然后根據(jù)測井數(shù)據(jù)回歸分析,建立物性參數(shù)與彈性參數(shù)的巖石物理模型或經驗公式,從而實現(xiàn)儲層物性參數(shù)的定量評價。
隨著油氣勘探程度的不斷提高,基于線性假設和經驗公式的傳統(tǒng)地震儲層預測方法已無法滿足儲層精細定量評價的要求[1],主要問題有:①大多數(shù)情況下,儲層孔隙結構復雜,非均質性較強,難以滿足儲層為各向同性孔隙充填的假設條件,這導致預測結果的可靠性降低[2];②物性參數(shù)與彈性參數(shù)之間存在復雜的非線性關系,難以建立精準的經驗公式,并且參數(shù)的選擇受主觀因素的影響較大[3],降低了定量評價的精度;③每一種經驗公式都有其適用范圍,增加了巖石物理分析工作量。
充分挖掘地震彈性參數(shù)與儲層物性參數(shù)之間的非線性關系對提高儲層定量評價精度至關重要。深度學習技術具有強大的特征提取和高維數(shù)據(jù)處理能力,可以在大量的數(shù)據(jù)中有效挖掘更深層的特征[4];對復雜非線性關系的學習能力強,可以更準確地逼近地震數(shù)據(jù)與目標之間復雜的非線性關系[5]。與傳統(tǒng)的神經網絡算法相比,深度學習網絡(Deep Neural Net?work,DNN)在反演精度、分辨率和抗噪能力等方面具有更顯著的優(yōu)勢[6],因此它在地震反演和儲層預測方面均有著巨大的應用潛力[7?8]。為此,本文深入討論深度學習技術在地震儲層預測領域的研究進展,分析它在實際應用中面臨的挑戰(zhàn),并提出未來的發(fā)展方向。
1 深度學習技術及其特點
1. 1 方法原理
深度學習網絡由輸入層、隱藏層和輸出層組成。與傳統(tǒng)機器學習方法相比,深度學習技術最大的特點是網絡結構深度的增加,通常包含3 個以上的隱藏層,經過隱藏層的逐層特征提取和轉換,可將樣本特征從原空間變換為新的高維空間,從而建立由輸入到輸出高維的映射關系。因此,深度學習具有強大的特征提取能力,能夠解決復雜的非線性問題。
深度學習技術和傳統(tǒng)機器學習相同,均具有三種學習方式:監(jiān)督學習(Supervised Learning)、無監(jiān)督學習(Unsupervised Learning)和半監(jiān)督學習(Semi?Su?pervised Learning)。
深度學習技術的應用包括了分類和回歸,二者都屬于監(jiān)督學習,不同點在于:①輸出不同。分類的輸出是離散型變量,為定性輸出;而回歸的輸出是連續(xù)型變量,為定量輸出。②目的不同。分類的目的是尋找決策面,對集中的數(shù)據(jù)進行分類;而回歸的目的是尋找最優(yōu)擬合,通過回歸算法得到一個最優(yōu)擬合線,可以最好地接近數(shù)據(jù)集中的各個點。③評價結果的標準不同。分類的結果只有對與錯之分,回歸的結果則以是否更接近真實值作為標準,而不是簡單的判斷對與錯。④使用場景不同。在地球物理領域,分類通常用于識別、分類地下儲層類型、巖性、地質體等,從而提高資料解釋的工作效率;而回歸通常用于預測連續(xù)性的地下屬性,如速度、密度等物性參數(shù),可以根據(jù)已知的屬性數(shù)據(jù),通過深度學習訓練,構建地球物理數(shù)據(jù)與屬性之間的映射模型,從而預測未知位置的屬性值。因此,回歸是預測地下物性的重要工具。
1. 2 技術特點
區(qū)別于傳統(tǒng)的模型驅動方法,深度學習技術是一種數(shù)據(jù)驅動的方法,即通過大量數(shù)據(jù)的訓練,有效融合地球物理數(shù)據(jù)與地質信息,求解數(shù)據(jù)與目標之間復雜的非線性映射模型。在完成地震儲層預測任務中,深度學習具有3 個方面優(yōu)勢:①數(shù)據(jù)驅動,無需明確測井數(shù)據(jù)與地震數(shù)據(jù)之間的物理關系;②非線性,克服了傳統(tǒng)地震反演中不合理的線性假設,可以更精準地建立地震數(shù)據(jù)與物性參數(shù)之間的聯(lián)系;③在測井數(shù)據(jù)充足的情況下,可以通過測井數(shù)據(jù)和地震數(shù)據(jù)的訓練,建立物性參數(shù)與地震數(shù)據(jù)之間的聯(lián)系,從而直接由地震數(shù)據(jù)反演物性參數(shù),并且可以同時反演多種物性參數(shù);④數(shù)據(jù)驅動的方法雖然在訓練階段需要花費較多的時間,但在實際預測階段所需的時間非常少,因此,模型一旦建立好,就可以大大減少地震儲層預測的計算時間,提高工作效率。
2 深度學習技術在地震儲層預測中的應用
在地震儲層預測中,深度學習技術的應用主要包括3 個方面:烴類定性檢測、非線性地震反演和儲層參數(shù)預測。其中,烴類定性檢測屬于分類,非線性地震反演和儲層參數(shù)預測屬于回歸。
2. 1 烴類定性檢測
基于疊后地震資料的“亮點”技術和基于疊前地震資料的AVO 屬性分析技術等都是烴類檢測常用的手段。但部分非烴類巖性表現(xiàn)出與油氣相似的振幅特征,部分含烴地層未表現(xiàn)為明顯的強振幅異常,而是弱振幅響應。如致密砂巖氣藏具有低孔、低滲、非均質的特點,導致氣藏與圍巖的地震響應差異較小[9?11]。因此,利用地震資料精準識別油氣儲層仍然面臨巨大的挑戰(zhàn)。
深度學習在烴類檢測中取得了良好的應用效果[9, 12?15]。林年添等[12]提出了一種在小樣本條件下基于卷積神經網絡(Convolution Neural Network,CNN)的儲層預測方法,有效識別了超致密氣藏,并與測井數(shù)據(jù)具有較高的吻合度。Gao 等[14]針對標簽數(shù)據(jù)不足的問題,提出了一種基于CNN 和遷移學習的氣藏識別方法。Júnior 等[15]提出了一種基于卷積長短期記憶模型和粒子群優(yōu)化算法的天然氣富集區(qū)檢測方法,在最佳條件下準確率達99. 42%。Xue 等[9]針對致密砂巖氣藏弱地震響應的特點,提出了基于量子神經網絡(Quantum Gate Set Neural Network,QGSNN)的地震多屬性油氣檢測方法。由圖1 可見,氣藏(圓圈處)表現(xiàn)為弱地震響應特征(圖1a),利用QGSNN 算法的預測結果(圖1d)與反向傳播神經網絡(Back Propagation Neural Network,BPNN) 算法(圖1c)相比準確性更高,能夠更精準定位常規(guī)方法(圖1b)無法識別的弱地震響應氣藏。
疊前AVO 分析需要大量的預處理工作,如角度數(shù)據(jù)生成、噪聲衰減、AVO 屬性提取和分析等,非常耗時,而利用深度學習技術可以有效提高效率。Lim等[16]開發(fā)了一套基于CNN 架構的自動AVO 分析算法,可以直接應用于CMP 道集數(shù)據(jù),無需角道集數(shù)據(jù)轉換,準確識別了Ⅲ類AVO 異常。
縱波地震數(shù)據(jù)的檢測結果存在多解性。對于多分量地震數(shù)據(jù),可以利用縱波與橫波的差異進行烴類檢測以減少多解性[11]。Zhang 等[10]提出了一種基于深度學習的多分量地震致密砂巖氣藏識別方法,相比于僅使用縱波數(shù)據(jù),其預測結果與鉆井吻合度更高。
監(jiān)督式深度學習技術依賴于標簽數(shù)據(jù)的數(shù)量和質量,當缺乏標簽數(shù)據(jù)時,難以獲得精準的烴類檢測結果。無監(jiān)督聚類技術可以從高維地震屬性空間自動識別具有相似特征的聚類,為烴類檢測提供模式,從而提高烴類檢測的準確性和可靠性[11]。例如,Zhang 等[11]提出了一種基于無監(jiān)督學習自組織映射(Self Organizing Maps,SOM)算法的多分量地震數(shù)據(jù)氣藏識別方法,并成功用于致密砂巖氣藏弱地震信號的識別。地震相分析是地震儲層定性預測的重要方法之一,無監(jiān)督學習在地震相分析中得到了廣泛的應用。張?等[17]提出了一種基于SOM 和粒子群優(yōu)化(Particle Swarm Optimization,PSO) 的K 均值聚類地震相分析方法,既減小了計算量,又具有全局尋優(yōu)能力,有效避免了陷入局部極小值,取得了較好的效果。Wang 等[18]引入譜聚類技術實現(xiàn)了無監(jiān)督的地震相分析,將地震數(shù)據(jù)視為空間中的點與邊所構成的圖,通過對圖進行最優(yōu)化切割,以實現(xiàn)地震數(shù)據(jù)聚類。結果表明該方法無需任何假設,就可適應多種形態(tài)的地震數(shù)據(jù)分析,同時計算結果的準確性和運算效率都能夠滿足應用需求。因此,無監(jiān)督學習可以從未標記的數(shù)據(jù)中發(fā)現(xiàn)隱藏的模式和特征,在復雜地質條件下提高了效率和模型的預測能力。
2. 2 非線性地震反演
地震反演是一個非線性問題?;谀P偷膫鹘y(tǒng)地震反演方法是把非線性問題近似為線性問題,通過多次迭代求取最優(yōu)解,這容易陷入局部最優(yōu)解。深度學習可以實現(xiàn)非線性反演。
2. 2. 1 基于監(jiān)督式學習的地震反演
在基于監(jiān)督式學習的地震反演中, CNN 應用最為廣泛。CNN 是一種前饋網絡(圖2),卷積層提取地震數(shù)據(jù)的有效特征,非線性激活函數(shù)用于支撐CNN的復雜性和非線性,在疊后波阻抗反演[7, 19?20]和疊前彈性參數(shù)反演[21]等方面均取得了良好的效果。但是,在實際應用中,傳統(tǒng)的CNN 可能存在難以收斂、訓練速度慢的問題,因此出現(xiàn)了一些基于CNN 的變體網絡結構,比如殘差卷積神經網絡(Residual ConvolutionNeural Network,ResCNN)。與CNN 相比,ResCNN增加了跳躍式連接,可以更好地解決深層次網絡訓練時出現(xiàn)的梯度消失問題,提高了模型的穩(wěn)定性和泛化能力。
除CNN 之外,循環(huán)神經網絡(Recurrent NeuralNetwork ,RNN)也是反演中常用的網絡結構, RNN模型包括長短時記憶(Long Short?Term Memory,LSTM)[22] 和門控循環(huán)單元(Gate Recurrent Unit,GRU)[23]等。RNN 與CNN 的區(qū)別在于其網絡不但與輸入、輸出存在聯(lián)系,而且信息可以在回路中循環(huán),是一種可以處理時間序列數(shù)據(jù)的深度學習模型。因此,與基于CNN 的地震反演方法相比,基于RNN 的地震反演方法具有以下優(yōu)勢:①可以處理時序數(shù)據(jù)。傳統(tǒng)地震反演方法通常將地震數(shù)據(jù)作為靜態(tài)的多維向量,但實際上地震數(shù)據(jù)是一種動態(tài)的時序數(shù)據(jù)。針對時序信息,RNN 可以更好地進行建模和預測。② 具有長期記憶功能。RNN 存在記憶狀態(tài),能夠較好地處理長時間跨度的時序信息,并且能夠利用這些信息獲得更準確的反演結果。而CNN 通常只考慮局部信息,無法處理全局的時序關系。③訓練效果更穩(wěn)定。CNN 中存在參數(shù)共享和梯度消失等,訓練過程可能會出現(xiàn)收斂速度慢、容易陷入局部最優(yōu)解等問題。而RNN 具有門控機制,用于解決梯度消失問題,訓練效果更加穩(wěn)定。④更容易擴展到多種輸入數(shù)據(jù),有效融合地震多屬性信息,反演結果的精度和穩(wěn)定性更高。
監(jiān)督式深度學習需要大量標簽數(shù)據(jù)集以保證網絡的泛化能力,這在實際應用中難以滿足。訓練樣本的不足會導致模型過擬合,是制約深度學習應用的瓶頸。因此,學者們開展了三個方面的研究:①正演模擬。以巖石物理和地質統(tǒng)計為基礎,以已有的測井和地質資料為約束,構建多樣化的地質模型,合成相應的地震記錄,從而擴展標簽數(shù)據(jù)[7]。②遷移學習。雖然合成記錄可以擴充訓練數(shù)據(jù),彌補標簽數(shù)據(jù)不足的缺陷,但訓練獲得的預測模型不能直接應用于實際地震數(shù)據(jù),而使用遷移學習策略,利用少量的測井和地震數(shù)據(jù)對模型進行更新和優(yōu)化,可以提高模型的魯棒性[19]。③數(shù)據(jù)增強技術。以現(xiàn)有標簽數(shù)據(jù)為約束,采用合理的算法進行數(shù)據(jù)擴展,生成符合原始樣本空間的訓練數(shù)據(jù),為模型訓練提供充足的訓練樣本。常用的數(shù)據(jù)增強技術包括灰度系統(tǒng)理論[24]、基于特征提取的方法[25]和虛擬樣本生成技術[1]等。其中,虛擬樣本生成技術是按照一定的規(guī)律挖掘現(xiàn)有數(shù)據(jù)中的隱藏信息,在數(shù)據(jù)空間添加新的虛擬樣本,從而擴展樣本數(shù)據(jù),提高預測模型的準確性,在地震反演中取得了較好的效果[1]。
2. 2. 2 基于無監(jiān)督或半監(jiān)督學習的地震反演
為了彌補標簽數(shù)據(jù)不足帶來的過擬合缺陷,學者們提出了基于無監(jiān)督或半監(jiān)督學習的地震反演方法,利用未標記的數(shù)據(jù)或分別利用標記數(shù)據(jù)與未標記數(shù)據(jù)同時訓練,從而在標簽數(shù)據(jù)有限的情況下提高反演精度和魯棒性。常用的算法包括自編碼器(Autoen?coder,AE)、生成對抗網絡(Generative AdversarialNetwork,GAN)等。
AE 網絡架構由編碼器和解碼器組成,編碼器可以自適應地對輸入數(shù)據(jù)降維,并提取輸入數(shù)據(jù)中的重要特征;解碼器用于將編碼器生成的特征向量重構為原始數(shù)據(jù)的表達形式,通過最小化輸入數(shù)據(jù)與重構數(shù)據(jù)之間的誤差進行學習和訓練。因此,AE 網絡無需特定的輸出層,可處理未標記的數(shù)據(jù)集,并且數(shù)據(jù)降維可有效地減少模型參數(shù)的數(shù)量,減少訓練所需的數(shù)據(jù)量,從而提高模型的訓練速度和泛化能力。
除單一網絡架構外,結合CNN 與AE 的各自優(yōu)勢,可有效提高無監(jiān)督或半監(jiān)督地震反演的精度。Yang 等[8]利用在CNN 中引入自編碼器的方法,建立了全卷積神經網絡引導的速度建模(Fully Convolu?tional Neural Network Velocity Model Building,F(xiàn)CNVMB)方法,進行特征提取和降維,提高了速度反演的精度。Liu 等[26]結合殘差網絡與卷積自編碼器(Residual Neural Network Convolutional Autoen?coder,ResNet?CAE)實現(xiàn)了疊前地震無監(jiān)督速度反演。該方法首先使用卷積自編碼器對地震數(shù)據(jù)進行特征提取,并將其轉換為低維特征空間,然后使用殘差網絡對特征空間進行處理,從而實現(xiàn)地震速度反演(圖3)。與FCNVMB 方法相比,該方法具有更高的反演精度(圖4)。
GAN 由生成器和判別器組成。其中,生成器用于生成與真實數(shù)據(jù)相似的合成數(shù)據(jù);判別器用于區(qū)分真實數(shù)據(jù)與合成數(shù)據(jù)。在訓練過程中只需使用未標記的真實數(shù)據(jù)作為訓練數(shù)據(jù),比較真實數(shù)據(jù)與合成數(shù)據(jù)之間的差異進行網絡優(yōu)化,就可以有效避免標簽不足而導致的樣本不均衡問題。Araya ? Polo 等[27]將GAN 應用于地球物理反演,建立了基于GAN 的地球物理反演技術流程。后來,基于GAN 算法的一些變體也用于地震反演,如循環(huán)生成對抗網絡(Cycle?GAN) [28]、基于Wasserstein 距離的Wcycle ? GAN(Wasserstein CycleGAN) [29]以及雙重Wcycle? GAN(Dual ? Wcycle ? GAN) [30] 等。其中,Dual ? Wcycle ?GAN 網絡包含了2 個生成網絡和2 個判別網絡( 圖5),分別進行地震正演和反演,從而形成由地震數(shù)據(jù)到目標參數(shù)的閉環(huán),并且在網絡中引入條件輸入模塊(Dual?WGAN?C),使少量的有標簽數(shù)據(jù)與大量無標簽數(shù)據(jù)共同訓練,通過生成網絡與判別網絡的相互博弈,構建地震反演預測模型。測試結果(圖6)表明,Dual?Wcycle?GAN 網絡能夠準確地預測地下介質的縱波阻抗信息,同時對于含噪地震數(shù)據(jù)的反演具有較高的魯棒性。另一方面,由于GAN 具有生成特性,也是一種有效的數(shù)據(jù)增強技術[31],可以用于合成地震記錄[32],從而擴展現(xiàn)有數(shù)據(jù)集,提高模型的泛化能力。
2. 2. 3 物理引導與數(shù)據(jù)驅動相結合的地震反演
大多數(shù)基于深度學習的地震反演方法完全由數(shù)據(jù)驅動。深度學習網絡中沒有加入地球物理約束,其本質相當于一個黑匣子,無法了解和干預其學習過程,也不確定映射關系是否符合地球物理學的理論基礎,導致預測結果不可控,缺乏物理可解釋性[23,33]。Raissi 等[34]提出了基于物理信息的神經網絡結構(Physics?Informed Neural Networks,PINN),結合訓練數(shù)據(jù)和物理方程約束,解決涉及非線性偏微分方程的正、反問題。隨后,地球物理學家們在PINN 的框架下提出了物理引導與數(shù)據(jù)驅動相結合的地震反演模型。Vashisth 等[35]提出了一種基于PINN 的弱監(jiān)督模型架構,直接由地震道集數(shù)據(jù)估計孔隙度。在深度學習網絡中加入巖石物理模型約束網絡訓練,不僅可以提高反演結果的可解釋性,還可以實現(xiàn)無監(jiān)督或半監(jiān)督學習,克服標簽數(shù)據(jù)不足帶來的過擬合。因此,基于物理引導的深度學習地震反演方法成為了近年來的熱點。
構建基于物理引導的地震反演深度學習網絡包含兩個方面[23]:①建立包含地球物理理論約束的網絡架構,如圖7 所示。②建立具有地球物理約束的損失函數(shù)。其中,網絡架構類似AE 和GAN 的思路,它們的區(qū)別在于AE 中的編碼器和GAN 中的生成網絡都是神經網絡模型,需要通過訓練去構建;而物理引導網絡中是由基于地球物理理論的地震正演取代編碼器或生成器[36],將預測結果進行正演以獲得合成地震記錄,并在損失函數(shù)中將合成地震數(shù)據(jù)與輸入的真實地震數(shù)據(jù)進行比較,然后通過最小化二者之間的差值以實現(xiàn)網絡的更新和優(yōu)化,從而獲得更準確的預測結果。
Biswas 等[33]利用物理引導的思路實現(xiàn)了地震資料疊后(圖8)和疊前(圖9)無監(jiān)督反演。網絡架構分為兩個部分:第一部分由CNN 組成,實現(xiàn)由輸入的地震數(shù)據(jù)預測彈性參數(shù),并在模型中加入低頻模型作為約束;第二部分為基于褶積模型的地震正演,首先由CNN 網絡的輸出計算反射系數(shù),然后將反射系數(shù)與地震子波卷積計算得到合成地震記錄,用于與實際地震數(shù)據(jù)比較,從而更新CNN 的模型參數(shù)。網絡的輸入是地震數(shù)據(jù)、低頻模型和地震子波,可以在沒有標簽數(shù)據(jù)的情況下實現(xiàn)地震反演。同時,在物理引導網絡的輸入中加入少量的標簽數(shù)據(jù),實現(xiàn)半監(jiān)督學習,可進一步提高預測精度[23]。Zhang 等[23]結合物理引導與Cycle?GAN 構建了一個用于波阻抗反演的半監(jiān)督深度學習網絡架構(SeisInv ? GycleGan)。Cycle ?GAN 由2 個生成器和2 個判別器組成,利用褶積模型地震正演代替GAN 中用于由波阻抗數(shù)據(jù)生成地震數(shù)據(jù)的生成網絡,并將損失函數(shù)與地球物理理論相結合以約束網絡訓練。采用5 種不同的反演方法對Marmousi 模型進行試驗和定量評價,結果表明,Seis?Inv?GycleGan 的預測結果在精度方面和符合地球物理規(guī)律的程度上都優(yōu)于其他方法。
2. 3 儲層物性參數(shù)定量評價
目前,深度學習技術已用于儲層物性參數(shù)的預測,并取得了良好的效果[37]。Feng 等[38]基于CNN 實現(xiàn)了儲層孔隙度反演。Zhong 等[39]構建了一個基于Cycle-GAN 的時移地震反演工作流程,并應用于碳封存CO2 遷移的動態(tài)監(jiān)測。李明軒等[40]提出了一種基于數(shù)據(jù)分布域變換和貝葉斯神經網絡的滲透率預測方法,利用貝葉斯神經網絡的數(shù)據(jù)分布特性,在滲透率預測的同時進行了不確定性估計。利用深度學習技術可以有效融合地震多屬性數(shù)據(jù),充分挖掘地震屬性中包含的隱藏信息。Hampson 等[41]通過屬性優(yōu)選和多屬性變換,優(yōu)選與反演目標相關性最佳的地震屬性組合,建立地震多屬性數(shù)據(jù)與目標數(shù)據(jù)之間的非線性關系,實現(xiàn)了儲層參數(shù)的有效預測,提高了預測精度。
上述方法都是基于單任務深度學習完成一種目標預測。如果需要預測的目標類型較多,就會導致多種任務的重復訓練,并且忽略了目標之間豐富的關聯(lián)信息。此時,需要引入多任務學習算法同步反演多個儲層參數(shù)[42?44]。Song 等[6]提出一種基于多任務學習的半監(jiān)督反演算法,在深度學習網絡架構中引入巖石物理正演,利用反演結果生成合成地震數(shù)據(jù),通過對比合成地震數(shù)據(jù)與真實地震數(shù)據(jù)之間的差異實現(xiàn)網絡更新,應用該反演方法利用疊前地震數(shù)據(jù)同步反演孔隙度、泥質含量和流體飽和度等物性參數(shù),無需進行彈性參數(shù)反演以及物性參數(shù)換算,避免了經驗公式不準確帶來的預測誤差。在深度學習網絡中引入巖石物理模型作為約束,一方面可以減少對標簽數(shù)據(jù)的依賴,避免標簽數(shù)據(jù)不足導致的過擬合問題;另一方面可以為深度學習網絡賦予物理意義,提高可解釋性。
2. 4 不確定性分析
深度學習的不確定性分析對于確保模型預測結果的可靠性至關重要。然而,基本的深度學習訓練過程通常僅能估計一組模型參數(shù),這意味著對于給定的每個輸入觀測數(shù)據(jù)只有一個固定的預測值,而量化輸出的不確定性需要得到預測值的方差。為了量化深度學習預測結果的不確定性,國內外學者做了大量的研究[45?48],其基本思想是:在模型訓練中加入概率分布,使訓練得到的模型參數(shù)不是確定的值,而是服從概率分布;通?;谪惾~斯近似的方法,通過學習參數(shù)后驗概率分布,量化預測參數(shù)的不確定性。目前最受歡迎的貝葉斯近似方法主要包括:拉普拉斯近似、變分推斷法[45]、蒙特卡洛dropout 算法[46]等。
在儲層預測領域,應用最多的是蒙特卡洛dropout算法,其利用dropout 的正則化技術逼近貝葉斯推理,分析模型參數(shù)的后驗不確定性。比如,Aleardi 等[21]將蒙特卡洛算法引入CNN 地震反演模型,獲得從疊前地震數(shù)據(jù)中預測巖石物理參數(shù)的不確定性近似值,驗證了蒙特卡洛算法用于量化深度學習地震反演模型不確定性的可行性。但通過實驗對比認為,蒙特卡洛dropout 算法無法獲得巖石物理性質小尺度的變化,明顯低估了對巖石物理預測的不確定性,預測精度較低[37]。生成對抗網絡也可以用于不確定性分析。Feng 等[47]通過改變潛在的輸入向量,利用生成對抗網絡獲得預測數(shù)據(jù)集的分布,從而進行不確定性分析。與蒙特卡洛算法相比,生成對抗網絡可以納入巖石物理模型約束,將馬爾可夫鏈―蒙特卡洛算法引入生成對抗網絡進行不確定性分析,進一步提高了確定性分析的精度[28]。Zou 等[48]提出了一種基于隨機森林的多地震屬性預測孔隙度分布的不確定性量化方法,同時利用量化的不確定性優(yōu)化和校正預測模型,提高了孔隙度預測的精度。
3 實際應用中面臨的挑戰(zhàn)
盡管深度學習技術在定性和定量儲層預測中都取得了較好的效果,但仍面臨諸多挑戰(zhàn),主要體現(xiàn)在數(shù)據(jù)可用性和深度學習技術的局限性兩個方面。
3. 1 數(shù)據(jù)可用性
在實際應用中,深度學習的模型非常依賴數(shù)據(jù),面臨主要問題為:
(1)缺乏足夠的標簽數(shù)據(jù)。雖然地震數(shù)據(jù)量很大,但可用的標簽數(shù)據(jù)卻非常有限。一方面,目前標簽數(shù)據(jù)的獲取仍然以手工為主,非常耗時且成本昂貴,而且能夠公開訪問的帶有標簽的地震數(shù)據(jù)集非常少;另一方面,對于儲層定量預測而言,訓練標簽為測井數(shù)據(jù),成本高昂。尤其海上工區(qū),通常僅有幾口井或者沒有鉆井資料,因此測井數(shù)據(jù)無法滿足深度學習模型訓練對數(shù)據(jù)量的需求。
(2)樣本數(shù)據(jù)不均衡。針對儲層定性預測,非儲層的樣本數(shù)量可能遠大于儲層的樣本數(shù)量,這導致模型在預測中偏向占多數(shù)的類別,而對于少數(shù)類別的預測性能較差。
(3)數(shù)據(jù)質量的影響。地震數(shù)據(jù)在采集和處理過程中可能受到各種因素的影響,如噪聲、干擾、缺失和不完整性等,導致深度學習獲得不準確或誤導性的模型。因此,在使用深度學習技術進行地震儲層預測時,需要對數(shù)據(jù)進行嚴格的質量控制,包括噪聲壓制、異常值檢測、數(shù)據(jù)插值和校正等,以確保數(shù)據(jù)的準確性和可靠性。
(4)數(shù)據(jù)的不確定性。主要體現(xiàn)在地震數(shù)據(jù)解釋結果的不確定性。解釋結果通常是主觀的,可能存在誤差或錯誤。利用錯誤的地震解釋結果進行模型訓練,不可避免地導致模型的不確定性。另外,地震數(shù)據(jù)是時間域數(shù)據(jù),測井數(shù)據(jù)為深度域數(shù)據(jù),時深關系的不準確會導致數(shù)據(jù)的拉伸或壓縮,影響數(shù)據(jù)的準確性[49]。
針對數(shù)據(jù)的可用性問題,許多學者提出了解決方案,主要包括合成地震記錄、數(shù)據(jù)增強技術和深度學習算法優(yōu)化等。遷移學習[16]、半監(jiān)督算法[2]以及引入物理約束的深度學習方法[33]等都在一定程度上緩解了數(shù)據(jù)壓力,提高了模型的泛化能力。為了解決時深關系不準確會帶來的數(shù)據(jù)不確定性問題,Song 等[49]提出了一種基于動態(tài)時間規(guī)整的閉環(huán)CNN 算法,有效提高了反演精度和空間連續(xù)性。雖然在解決數(shù)據(jù)可用性方面已取得了一定的進展或成效,但該問題仍然是目前深度學習技術全面應用于地震儲層預測領域所面臨的最大挑戰(zhàn)。
3. 2 深度學習技術的局限性
(1)高計算成本。與淺層機器學習算法相比,深度學習需要更大量的計算資源和更長的計算時間,尤其針對三維地震數(shù)據(jù),還需要更多存儲資源。如果計算機配置有限,在訓練過程中經常會出現(xiàn)系統(tǒng)崩潰的情況。
為了降低計算量,通常采用一階優(yōu)化算法,但一階優(yōu)化算法的訓練效率較低,容易陷入局部極小值而無法尋找全局最優(yōu)解。而且,當深度學習網絡反向傳播時,信號經過多層傳播后可能會產生梯度消失或梯度爆炸的問題,從而導致訓練不穩(wěn)定。采用更先進的算法可以在一定程度上提高優(yōu)化能力,但同時也會帶來更大的計算量。在實際應用中,需要綜合考慮目標的復雜性、數(shù)據(jù)規(guī)模和計算資源,以平衡優(yōu)化算法和計算量。
(2)地震數(shù)據(jù)的復雜性和高維性。地震多屬性數(shù)據(jù)的復雜性和高維性給深度學習模型訓練帶來了挑戰(zhàn)。雖然深度學習強大的特征學習能力使其在處理高維數(shù)據(jù)中具有明顯的優(yōu)勢,但高維數(shù)據(jù)往往是稀疏的。對于地震數(shù)據(jù)而言,每個維度對應不同的地震屬性或特征,由于地質結構的復雜性,很多特征可能缺失或冗余,影響模型的訓練和預測能力。
針對地震數(shù)據(jù)的復雜性和高維性,通常采取屬性優(yōu)選與融合、稀疏表征[18]等技術以減少特征的維度并提高模型的泛化能力。常用的屬性優(yōu)選方法包括逐步回歸法[41]、遺傳算法、主成分分析等。另一方面,選擇適當?shù)木W絡架構、損失函數(shù)和優(yōu)化算法,可以提取地震數(shù)據(jù)中的有用特征,減少冗余和噪聲的影響。
(3)缺乏物理可解釋性。深度學習模型通常以“黑匣子”的形式呈現(xiàn),在訓練過程中無法進行人工干預,缺乏對結果的物理解釋[33]。地質學家無法了解結果是如何預測的,也無法得知預測結果是否符合地球物理規(guī)律、能否與地質解釋相結合等,這會造成地質學家對深度學習結果的不信任。
(4)不確定性評價。一是在定性預測模型的評價標準方面,目前沒有明確的標準評估預測模型的準確性和通用性;二是在不確定性的量化方面,需要更為精細的量化算法以提高不確定性分析的精度。
4 結論與展望
與傳統(tǒng)方法相比,深度學習技術應用于地震儲層預測的優(yōu)勢在于:可以通過大數(shù)據(jù)的訓練,無限逼近地震數(shù)據(jù)與儲層物性參數(shù)之間的非線性關系,從而提高預測精度,且模型訓練成功后,可大幅提高工作效率。但在實際應用中,仍面臨數(shù)據(jù)可用性不高、計算成本高、物理可解釋性差等挑戰(zhàn)。未來的研究應致力于解決當前深度學習技術在地震儲層預測中面臨的挑戰(zhàn),以發(fā)揮更重要的作用。
(1) 數(shù)據(jù)增強技術。綜合考慮數(shù)據(jù)多樣性和一致性的平衡、生成數(shù)據(jù)的質量以及計算成本和工作效率等方面,改進數(shù)據(jù)生成算法,推動數(shù)據(jù)增強技術的發(fā)展和應用。在數(shù)據(jù)增強技術中引入物理引導,使數(shù)據(jù)更符合地球物理特征。
(2) 多源數(shù)據(jù)融合和跨尺度建模。將地震數(shù)據(jù)與其他地質數(shù)據(jù)(如測井數(shù)據(jù)、地質等)進行融合,利用多源數(shù)據(jù)的互補提高儲層預測的精度。同時,應考慮多尺度建模,從局部到全局,跨尺度進行儲層預測。
(3) 深度學習和知識圖譜相結合。構建地球物理知識圖譜,融合、共享地質、地球物理和測井等多源數(shù)據(jù)、知識,將深度學習模型和知識圖譜相結合,擴充訓練數(shù)據(jù),增強原始數(shù)據(jù)的語義信息以及模型的可解釋性。
(4) 數(shù)據(jù)驅動與物理驅動的融合。將數(shù)據(jù)驅動的深度學習方法與傳統(tǒng)物理驅動的方法相結合,充分利用各自的優(yōu)勢,緩解數(shù)據(jù)壓力,提高模型的泛化能力,增強預測結果的物理解釋性。
(5) 深度學習的可視化。在基于深度學習的地震儲層預測中實現(xiàn)可視化,有助于地質學家有效掌握模型的結構和計算過程,更好地指導儲層預測結果的可解釋性和不確定性評價,提高決策制定的準確性和效率。
(6) 模型優(yōu)化和自適應學習。改進深度學習模型的架構和訓練算法,探索更有效的模型優(yōu)化算法、自適應學習策略和損失函數(shù)的設計,提高模型的泛化能力和魯棒性,節(jié)省計算成本。
(7) 深度學習與其他機器學習技術相結合。將深度學習與其他機器學習相結合,比如支持向量機、隨機森林、主動學習和反饋強化學習等,充分利用不同機器學習技術的優(yōu)勢,取長補短,提高模型的性能、魯棒性和泛化能力。
綜上所述,在地震儲層預測領域,深度學習技術的應用得到迅速發(fā)展,未來可通過更多的跨學科合作,通過不斷地研究和創(chuàng)新,為油氣資源勘探與開發(fā)提供更準確、可靠的技術支持。