劉彥鋒,段太忠,黃 淵,張文彪,李 蒙
(中國石化 石油勘探開發(fā)研究院,北京 102206)
三維地質模型是勘探開發(fā)決策的重要依據。地質建模的基本原則是綜合應用地質、測井、地震和生產動態(tài)等各類數據和知識,但深層油氣藏可用的資料相對較少、分辨率低,對地質建模的方法要求高[1-2],地質知識需要發(fā)揮更大的作用。40 年來,地質建模大致經歷了兩點地質統計、多點地質統計建模階段[3-4],隨著大數據和人工智能技術的發(fā)展,目前進入了以深度學習為代表的人工智能地質建模發(fā)展階段。從地質建模技術發(fā)展歷程看,知識在地質建模中的作用越來越大。
在傳統的兩點地質統計學中,知識通過變差函數的方式參與地質建模,以概率統計的形式體現地質體的長、寬、厚度和方向等參數[5]?;谀繕说慕7椒梢越o出更多的關于幾何形態(tài)的地質認識,比如彎曲度、長寬比、厚度范圍等參數,用來模擬更具象的地質模型[6]。多點地質統計學建模通過訓練圖像表達概念性地質知識,表達的內容比變差函數更豐富,表達的方式比單純的幾何參數更靈活[7]?;诘刭|過程的建模是定量化地質知識驅動的建模方法,地質知識以微分方程的形式內嵌于地質建模算法之中,是純粹的地質知識驅動。以深度學習為代表的人工智能地質建模方法以大規(guī)模訓練樣本為基礎,地質知識蘊含在大規(guī)模訓練樣本中,相比于多點地質統計學,可以從訓練樣本中挖掘更豐富的地質知識,建立更符合地質規(guī)律的地質模型,并且在同類地質問題中可以一次訓練多次應用。
生成對抗網絡(GAN)是目前深度學習地質建模中采用的主要神經網絡[8],分為非條件和條件化生成對抗網絡。非條件生成對抗網絡與非條件地質建模類似,條件化生成對抗網絡與條件化地質建模類似。非條件地質建模通過變差函數、訓練圖像或目標體長、寬、高等少量參數輸入得到一系列三維模型,這些模型不考慮與條件數據的吻合情況,但能夠體現較為真實的地質認識。生成對抗網絡深度學習體現了類似過程。標準的生成對抗網絡[9],即非條件生成對網絡,其目標是訓練出一個性能良好的生成網絡,輸入一個低維的隨機數序列生成到高維的網絡層(地質模型),通過訓練學習地質模式,利用訓練后的生成網絡可以得到滿足地質認識的非條件模擬結果[10]。在生成對抗網絡的地質模式重現能力得到廣泛認可之后,眾多學者將研究重點轉移到對條件化生成對抗網絡(cGAN)的地質建模上,以期在實用性方面取得更大突破。
目前生成對抗網絡地質建模的條件化主要有兩種途徑:一是先訓練非條件生成對抗網絡,再二次條件化,比如預訓練的生成器通過啟發(fā)式迭代優(yōu)化進行條件化,或者訓練過程中通過正則化方法進行條件化,前人用卷積生成對抗網絡建立了條件化的河流相地質模型[11-12];另一種是通過條件化生成對抗網絡,直接在網絡的輸入參數中加入條件化數據,比如井數據、地震數據以及砂地比等參數[13-14],這種方法通用性更強,更受青睞。
目前,深度學習地質建模方法整體上仍處于探索階段,實際工業(yè)落地應用難,面臨的主要問題之一是缺少樣本[15],采用人工合成樣本是目前比較可行的方式。盡管多點地質統計建模中訓練圖像獲取的方法也適用于深度學習地質建模,包括手繪地質模式圖、野外露頭、衛(wèi)星圖像分析、地質條件類似的密井網區(qū)塊、基于目標的模擬方法和基于沉積過程的模擬方法等??紤]到深度學習對樣本的需求量大,基于目標模擬和沉積過程模擬是可選的方法。
沉積過程模擬與深度學習建模相結合可以實現優(yōu)勢互補?;诔练e過程模擬的建模方法可以更好地體現地質知識的約束,與地質統計學建模方法相比,井間預測更符合地質規(guī)律。但是,由于沉積模擬的輸入數據通常都難以直接測量,不確定性較大,模擬結果與井數據、地震數據等條件數據吻合難度大,需要大量的手動調整工作,通常需耗時1~2 個月才能獲取與觀測數據吻合度較高的模型,效率較低。深度學習建模對樣本的需求量大,目前的技術還無法直接得到大規(guī)模地下實際模型用于深度神經網絡訓練。但沉積模擬恰好具備大規(guī)模樣本生成能力,有效彌補了訓練樣本不足問題。本文試圖將兩種方法結合起來,建立沉積過程數值模擬驅動的深度學習地質建模方法,并利用普光氣藏主力區(qū)塊地質剖面對其進行驗證。
將沉積過程模擬技術和深度學習相結合,可以將沉積模擬中蘊含的地質知識以訓練樣本的形式賦予深度學習的神經網絡參數,間接實現知識驅動的地質建模。定量化領域知識與深度學習結合的方式有多種[16-17],最直接的方法是將定量化可微分的公式直接嵌入到神經網絡的隱藏層,或嵌入到神經網絡的目標函數;還有一種是為神經網絡提供大規(guī)模訓練圖像。后者屬于間接的知識驅動方法,解耦性好,不同類型的領域知識和神經網絡可以靈活組合。
地層沉積過程正演數值模擬通過數值計算的方式,考慮各種地質因素的影響,再現地層形成過程,最終得到完整的二維或三維沉積模型[18-19]。前人對地層沉積模擬進行了大量研究[20-21],提出了多種沉積模擬方法,涵蓋了大部分的沉積相類型。代表性的沉積模擬軟件有法國石油研究院的Dinoisos,斯坦福大學的Sedsim,斯倫貝謝公司的GPM 等。地層沉積過程正演模型描述了可容空間、沉積物剝蝕、供給、生產、搬運、堆積以及壓實作用,輸出結果是模擬地層和一系列古環(huán)境條件,比如整個演化歷程的古地貌、沉積間斷、沉積相等。地層沉積數值模擬模型可以表示為:
式中:M表示模擬結果,即地質模型;F表示正演模擬方程,通常是描述沉積物沉積搬運和沉淀的數學物理方程;s1,s2,s3,…,sn表示n個模擬的輸入參數。由于沉積模擬輸入參數多,且大部分難以直接測量,如地質歷史時期的海平面曲線、碳酸鹽產率、搬運速度、基底沉降速度等,導致模擬結果不確定性大。為了得到與實際的鉆井或地震數據吻合度較高的模型,往往需要通過試錯法或參數優(yōu)化方法反復調整輸入參數[22-25]。
沉積過程模擬驅動的深度學習地質建?;舅悸啡缦拢▓D1)。針對某個區(qū)塊,綜合資料分析,獲取初始地形、海平面曲線、碳酸鹽產率、沉積物剝蝕搬運等相關參數,開展初步沉積模擬研究。以觀測數據為基礎,不斷修改沉積模擬的輸入,縮小其可能的取值區(qū)間,降低參數的不確定性,獲得每個參數可能的最小值和最大值。根據超立方采樣的參數采樣方法,獲取一定規(guī)模的等概率的參數組合,把這些參數的模擬結果(沉積模擬地質模型)作為訓練樣本提供給深度學習網絡。利用訓練后的生成網絡,直接輸入條件數據,即可得到該區(qū)塊的地質模型。搭建訓練條件化生成對抗網絡時需要考慮實際沉積條件數據的情況,以地質模型上抽提的虛擬井數據,甚至基于地質模型合成地震數據作為訓練輸入,地質模型作為輸出,具體方法見1.2 節(jié)的描述。
圖1 沉積模擬驅動的深度學習地質建模技術流程Fig.1 Workflow showing deep learning-based geological modeling driven by sedimentary process simulation
1.2.1 生成對抗網絡地質建模原理
在深度學習框架下,地質建模是一個生成式問題。按照訓練目標的特點,神經網絡分為判別式網絡和生成式網絡:前者由高維神經網絡層通過一系列的隱藏層得到低維輸出層,比如分類、聚類等;后者輸入低維網絡層得到高維神經網絡層,如輸入低維的隨機數據得到清晰的語音、圖像、文字等[26]。油氣藏地質建模通常是輸入稀疏的、高精度的井點數據,在稠密的、相對低精度的地震數據約束條件下建立高精度三維網格模型,可視為生成式神經網絡問題。相對于判別式問題,生成式問題的機器學習難度大,直到生成式對抗網絡的出現[9,27],才大大加快了生成式問題的解決。該技術迅速在圖像和語音合成領域得到普及,并應用到了地質建模領域[28-29]。
生成對抗網絡(GAN)由生成網絡(G)和判別網絡(D)組成,采用對抗學習的策略進行訓練,目標是獲取生成表達能力強的生成網絡G。該訓練框架中,生成網絡(G)將從先驗分布p(z)采樣的隨機向量z映射到地質模型空間,鑒別網絡(D)將輸入地質模型映射到似然概率(判斷真假的概率)。G的作用是生成大量讓D認為“真實”的模型,而D起著對抗的作用,即判斷由G生成的模型為假,而來自樣本庫的模型為真,G和D在相互競爭中學習,因此稱為生成對抗網絡。標準生成對抗網絡的目標函數如下:
式中:x是來自pdata分布的樣本;pdata是全部的訓練樣本;D(x)是判別網絡對樣本的判別;z是潛在空間上的隨機向量;G(z)是生成的地質模型;D(G(z))是判別網絡對生成的地質模型的判別;E是一組樣本已判別結果的期望。
通過大規(guī)模的訓練可以得到生成網絡G,它體現了隨機向量z到地質模型的映射。變換不同的z可以得到相應的地質模型,但是z沒有明確的物理意義。往往需要二次的條件化才能建立具有實際地質意義的模型[11]。條件化生成網絡輸入有明確物理意義的建模參數[30],輸出結果更容易被解釋。
1.2.2 條件化生成對抗網絡地質建模
條件化生成對抗網絡地質建模直接把井、震等條件數據作為網絡的輸入得到二維或三維地質模型。標準GAN提出之后,為了約束生成的結果,使其更加可控,很快就出現了條件化GAN,稱為cGAN[31]。cGAN 是GAN的擴展,它的生成網絡和判別網絡都利用條件數據y,條件數據可以是任意類型,比如類型標簽(相類型、是否為陡坡沉積、是否發(fā)育生物等),或者儲層分布的條件約束(波阻抗、砂體發(fā)育概率等),同時參與到生成網絡和判別網絡的訓練。在生成網絡中,通常把條件數據作為y和隨機向量z一起作為網絡的輸入層;在判別網絡中,樣本標簽數據x和條件數據y同時作為輸入層(圖2)。cGAN的目標函數可以表示為如下的形式:
圖2 條件化生成對抗網絡基本結構Fig.2 Basic architecture of a cGAN
在條件化生成對抗網絡的基本框架下,在不同領域的應用,產生了不同的網絡結構。地質模型具有多尺度復雜特征,需要生成網絡具備更強的生成能力,U-Net 神經網絡[32]具有多尺度卷積和跨層連接的特點,在刻畫多尺度結構特征方面具有較強能力,把它作為cGAN 的生成網絡,可以用于生成二維和三維高精度地質模型。通常,在判別網絡中不只是對整個輸出結果做單一的判別,而是考慮地質模型的多尺度結構化特征,進行多尺度判別。
2.1.1 碳酸鹽巖地層沉積正演模擬器
地層沉積模擬可以生成沉積規(guī)律約束的二維和三維地質模型。碳酸鹽沉積體系的形成、演化和消亡除了受構造活動、海平面變化、氣候條件、海洋環(huán)境和水動力條件等因素的直接或間接控制外,還尤其受到體系中生物與生態(tài)因素控制[33-35]。我們采用了自主研發(fā)的產碳酸鹽地層沉積正演模擬方法[36]和CarbSIMS 軟件,考慮了最新的碳酸鹽巖工廠、生態(tài)可容空間和層序地層學等基本原理。把地層形成過程視為生物能、勢能和水體動能這3 種能量場相互耦合的過程,生物能體現為碳酸鹽巖生物的生長,動能表現為風能和風能引起的波浪能,勢能主要以地形的形式體現。模型的具體細節(jié)參考文獻[35]。
CarbSIMS 軟件中的地層沉積正演模擬技術,包含碳酸鹽巖原位生長模型、水體能量分布模型和沉積物搬運模型,可以模擬碳酸鹽巖沉積物剝蝕、搬運和沉積作用,形成并展示碳酸鹽巖體系的幾何形態(tài)、沉積層序展布,還可以通過沉積反演模擬技術自動匹配沉積過程模擬結果與觀測數據[21-22]。該軟件可以模擬臺緣帶、緩坡、孤立臺地以及復雜地形下的碳酸鹽巖沉積體系。
在該模型中,輸入參數包括4大類12小類。這4大類包括可容空間類、沉積物供給類、沉積物搬運剝蝕類和水體動能分布類,其涉及的每一小類又包括多個具體參數。下表列出了主要參數類型和推薦的分析方法(表1)。
表1 碳酸鹽巖沉積模擬主要參數類型及分析方法Table 1 Main parameter types and analytical methods of sedimentary process simulation of carbonates
2.1.2 普光區(qū)塊沉積正演模型基本框架
前人對該地區(qū)的層序地層、沉積特征、地質建模方法進行了大量研究[37-39],為沉積過程模擬參數獲取和深度學習地質建模方法分析奠定了基礎。普光氣藏位于川東斷褶帶雙石廟—普光NE 向背斜構造帶上,是川東北地區(qū)已探明的大型碳酸鹽巖構造-巖性氣藏[40]。普光氣藏主要含氣層系是上二疊統長興組和下三疊統飛仙關組,處于有利的臺地邊緣沉積相帶。其中,長興組臺地邊緣生物礁及飛仙關組臺地邊緣顆粒灘為該區(qū)最有利的沉積相,是模擬的主要層位。
碳酸鹽巖結合地質分析和前人研究成果,初步獲得該地區(qū)海平面變化、構造沉降、碳酸鹽產率等參數,對主產區(qū)垂直臺地邊緣的7 口井開展了沉積模擬框架下的沉積相解釋,指導正演模擬參數的調整。搭建了該地區(qū)的地層沉積過程模擬基本框架,構建了樣本庫的沉積模擬基礎模型(圖3)。沉積模擬范圍為19.0 km × 8.8 km,時間跨度為3.5 Ma,平面網格數為129 ×129,總時間步數為200。
圖3 手動參數調整的沉積正演模擬剖面與井資料對比Fig.3 Comparison of stratigraphic forward modeling by manual parameter adjustment with well data
根據深度學習對泛化能力的要求,需要訓練樣本庫涵蓋盡可能多的地質模式,因此對基礎模型要求不高,不要求與井數據完全吻合,甚至允許有些井有較大差別,只要模擬出整體的沉積規(guī)律即可。
2.1.3 樣本庫構建
為了保證神經網絡模型的泛化能力,在手動調整沉積模型的基礎上,應使樣本庫涵蓋更多的沉積特征。在樣本庫構建過程中,針對不確定性參數,在計算量允許的情況下,以基礎模型參數為基礎盡量擴大參數擾動范圍,獲取盡量多的樣本。
根據該地區(qū)前期的資料分析,我們認為初始地形的不確定性較低,采用確定值。海平面曲線、碳酸鹽產率、沉積物搬運等相關參數共計41個,不確定性較大,以手動調整的參數值為基礎,分析不同參數變化區(qū)間中樣本地質模式的多樣性,最終確定50 %參數變化區(qū)間(表2)。這41 個參數中,參數名字的最后一個數字指示這類參數的第一個參數,有些參數考慮了時間的變化,比如根據時間段再劃分為3個,其中長興組2 個,飛仙關1 個。具體參數意義如下:參數1—6 與海平面曲線有關(分別表示三級和四級海平面旋回正弦函數的振幅、周期和相位,以及線性約束),第7 個參數與構造沉降有關(給定構造沉降面數據的系數),參數8—11 與沉積物搬運有關(分別是勢能和動能在X和Y方向引起的沉積物搬運系數),參數12—27 與碳酸鹽產率有關(分別是勢能產率最大幅度、勢能產率遞減系數、透光帶厚度、動能產率系數、動能產率基準值,以及勢能相關產率的權重),參數28—41 與水體動能有關(即動能幅度、波浪能下降系數、地形消浪能系數、浪基面和風能系數)。
表2 沉積反演模擬參數區(qū)間Table 2 Parameter ranges of stratigraphic inverse modeling
考慮上述41 個不確定性較大的參數,在確定的參數區(qū)間內,通過超立方隨機采樣的方式生成大量的參數組合,構建深度學習所需的樣本庫。本實例中,樣本庫為地質模型二維剖面。模型以二維矩陣表示,矩陣尺寸為128 × 128,通過人工和自動篩選,去除模擬結果明顯不合理的少量樣本后,該樣本庫共計樣本11 503個,訓練集和測試集隨機劃分,通常80 %用于訓練,20 %用于測試。從訓練集中隨機抽取幾個樣本,如圖4 所示(不同顏色表示不同的沉積相帶),可以看出它們具備不同的沉積相結構樣式,體現了樣本包含的沉積模式的多樣性。
圖4 從訓練集隨機抽取的一組訓練樣本Fig.4 A group of training samples randomly selected from the training dataset
在條件化生成對抗網絡的框架下,搭建井數據約束的深度學習地質模型網絡,以U-net 網絡作為生成網絡的基本結構,多尺度卷積網絡作為判別網絡,目標函數為判別損失加上帶權重的第一范式損失(L1 損失),具體的網絡結構見圖5。其中L1損失的權重是超參,需要人為給定,對模擬結果有一定影響。上采樣和下采樣作為基本的網絡層單元,由卷積(轉置卷積)層、丟棄層、歸一化層和非線性化層組成。生成網絡由一系列的下采樣和上采樣層組成,通過不斷下采樣捕捉更大尺度的結構化特征,然后再通過上采樣獲取更小尺度的地質特征,同時通過跨層連接實現信息跨尺度融合,提高生成模型的分辨率。判別網絡由一系列的下采樣組成,最后得到14×14的判別結果,即對模擬結果給出196個判別指標,分別指示不同區(qū)域,并配合L1損失進行綜合判別。
圖5 條件化生成對抗網絡中生成網絡G和判別網絡D的結構Fig.5 Architectures of generative(G)and discriminative(D)networks of cGAN
該生成網絡以從沉積模擬樣本中抽取的虛擬井數據為輸入,二維地質模型為輸出。設置最大訓練輪次為200,通常迭代30 輪次能得到比較理想的效果。從生成網絡基本結構可以知道,按照多尺度結構化特征,以井數據為基礎,先通過卷積運算刻畫不同尺度的宏觀特征,然后通過反卷積刻畫小尺度特征,并通過跨尺度連接實現大尺度對小尺度的約束,生成新的地質模型,生成的地質模型整體上符合沉積過程模擬的地質規(guī)律。圖6 是訓練的生成網絡在測試集上的表現,圖中a1到a9,a1'到a9'共計9 組圖形,分別為正演模擬器和生成網絡模擬結果,兩者基本一致。
圖6 訓練后的生成網絡模型在隨機挑選的測試集上的模擬結果Fig.6 Results of applying the trained generative network model on randomly selected test dataset
把實際觀測的井上解釋的沉積相數據作輸入訓練后的生成網絡,得到該區(qū)塊的模擬結果。分析了不同情況下的模擬結果,可以看出基于生成對抗網絡的地質建模在井數據處與井上觀測數據完全吻合,井間的沉積相分布符合地質規(guī)律。同時分析了深度學習地質建模與多點地質統計學建模效果的差異,在此基礎上測試了改變訓練樣本數量及損失函數中L1 損失權重時的模擬結果。
圖7 對比了深度學習地質建模與多點地質統計學建模的效果,兩者均以Cy84 和PG8 等8 口井數據為硬數據。圖7a是本文提出的深度學習地質建模,圖7b是基于直接采樣法的多點地質統計學建模,以上述沉積模擬基礎模型為訓練圖像(圖3),可以看出兩種方法得到的相帶整體分布規(guī)律一致,自左向右均表現出深水、斜坡、臺緣和開闊臺地的沉積相帶特征。分析認為多點地質統計學地質統計學和深度學習地質建模各有優(yōu)勢。在相帶分布的細節(jié)刻畫方面,通常深度學習建模方法優(yōu)于多點建模方法。多點地質統計學建模只需一個訓練圖像,深度學習方法需要大規(guī)模樣本,在實際應用中前者更容易實施,另外對抗生成網絡訓練不容易收斂,也進一步限制了該方法的應用潛力。
圖7 深度學習地質建模(a)與多點地質統計學建模(b)比較Fig.7 Comparison of deep learning-based geologic modeling(a)and multi-point geostatistics-based modeling(b)
圖8和圖9對比分析了訓練樣本量和不同L1損失權重情況下的模擬結果,為了不遮擋模擬結果,4 個子圖只有一個顯示了井上條件數據。
圖8 訓練樣本量不同時生成網絡模擬結果Fig.8 Results of generative network modeling with training datasets of different scales
圖9 損失函數L1權重不同時生成網絡模擬結果Fig.9 Results of generative network modeling with different weights of L1 loss
實際應用時應該增加樣本,盡量減少過擬合現象,同時降低不合理樣本對訓練的影響。圖8 中4 個子圖采用的樣本量分別占總樣本的80 %,60 %,40 %和20 %,可以看出:訓練集占總樣本的60 %和80 %時模擬效果差別不大;40 %時出現明顯差異,特別是少井區(qū)域;20 %時模擬結果明顯不合理,完全不具備地質規(guī)律,預測失敗,說明樣本量過少,存在嚴重的過擬合現象。需要說明的是,圖8d 中沒有疊加顯示井數據,井所在位置顯示的是模擬結果,可以看出即使在神經網絡過擬合,井間預測不合理的情況下,井點處也能保證和條件數據吻合。
面向地質建模的條件化生成對抗網絡中總的損失函數包含判別損失和L1 損失。添加L1 損失的目的是增加模型的分辨率,圖9 中4 個子圖分別是L1 損失權重取值為100,50,10和1時的模擬結果,可以看出降低L1 損失的權重會降低生成模型的分辨率,導致預測結果中散點增多。但是,過度增加L1損失的權重會導致判別器對模型的真假識別能力降低,權重值的確定需要根據實際的樣本量和地質模式的復雜度,通過反復測試后確定。
深度學習地質建模有廣闊的應用前景。目前階段面臨的主要問題是樣本需求量大而實際地質模型樣本不足,地層沉積過程模擬技術可以有效緩解這一難題,但不可忽視采用沉積模擬方法生成大規(guī)模樣本時存在的不確定性。
首先應明確選用的沉積正演模擬器是否能夠刻畫目標區(qū)塊的主要沉積過程,錯誤的或過度簡化的正演模擬器不可能給出符合沉積規(guī)律的地質模型作為樣本。其次是輸入數據的不確定性,假設兩個極端情況,即所有參數均不確定和所有參數均確定。前者將產生無限量樣本的訓練集,后者只產生一個模型用來訓練。但實際情況是總能通過有限的觀測數據和區(qū)域地質分析獲得一些比較確定性的認識,降低參數的不確定性。但是,我們不可能獲得足夠數據以確定全部參數,因此需要設置一定的參數擾動區(qū)間,基本原則是在計算量允許的范圍內越大越好,以降低人為影響。還有一部分不確定性由測井數據的人工解釋引起,這部分反映了地質認識的綜合不確定性,屬于可接受的范圍。
基于對上述3 種不確定性的理解,可以進一步分析該方法的使用范圍。基于沉積模擬的深度學習地質建模方法依賴兩個基本假設:①沉積正演模擬采用的數學物理方程可以比較準確地刻畫地層沉積形成的基本過程;②沉積正演模擬輸入參數的不確定性在合理區(qū)間內。適合用該方法建立合理地質模型的區(qū)塊需要滿足這兩個基本假設。很明顯,地質過程正演模擬方法并不是要精細刻畫每一個地質過程,而是模擬主要地質特征,忽略不必要的細節(jié)。因為一般的地質體都經歷了百萬年甚至上億年的演化,歷經非常復雜的物理、化學作用,正演模擬器只要能刻畫預期的主要特征,就滿足了第一個基本假設。在充分理解所選沉積正演模擬器的基礎上,結合地質分析,獲取輸入參數的可能取值范圍。有些參數不確定性較低,有些參數不確定性較高,需要利用鉆井數據和地震數據進行標定;在參數不確定性分析的基礎上構建針對目標區(qū)塊的訓練樣本庫。
深度學習在各個行業(yè)落地應用的過程中,與專業(yè)領域知識的結合是必然要求。數據密集場景率先進行了智能化升級,比如測井相識別、地震數據解釋、產量遞減曲線分析等。地質領域傳統上以概念和定性的知識為主,定量化的數據較少,智能化的發(fā)展相對緩慢。但是智能化離不開定量化,為了使地質知識更好地服務于深層油氣藏勘探開發(fā)的實踐,有必要對沉積過程、成巖過程、溶蝕過程、構造過程及地應力過程等地質過程進行定量化模擬。同時探索小樣本和基于符號的機器學習方法也是發(fā)展的重要方向,可以直接把地質領域的知識融入到智能化地質建模之中。
1)智能化地質建模是地質建模技術的重要發(fā)展方向,訓練樣本獲取難度大是該領域面臨的主要問題之一。沉積過程模擬與深度學習建模的結合可以實現優(yōu)勢互補,解決沉積正演模擬與觀測數據吻合難度大和深度學習地質建模缺少樣本的問題。
2)通過在普光氣藏主力區(qū)塊典型地質剖面上的測試應用,該方法的可靠性得到了驗證,構建了10 000多個地質模型組成的樣本庫,并以樣本上抽取的虛擬井數據作為條件輸入,以地質模型作為輸出,進行網絡訓練和測試。利用訓練后的生成網絡,輸入7 口實際的觀測井數據作為條件數據,建立了同時滿足井數據和碳酸鹽巖沉積成因模式的地質模型。
3)深度學習在油氣藏地質領域的落地應用需要充分利用專業(yè)領域知識,有必要加強沉積模擬、成巖模擬、溶蝕模擬、構造演化以及應力模擬等地質知識的定量化研究,促進地質知識直接驅動的智能化地質建模。