曹志民 吳 云 韓 建 呂秀麗 宋鴻梅 趙麗華
(1.東北石油大學電子科學學院;2.大慶油田博士后科研工作站)
測井數(shù)據(jù)巖相分類的機器學習方法和大數(shù)據(jù)巖相分類探討①
曹志民1,2吳 云1韓 建1呂秀麗1宋鴻梅1趙麗華1
(1.東北石油大學電子科學學院;2.大慶油田博士后科研工作站)
對現(xiàn)有測井數(shù)據(jù)巖相分類的機器學習方法進行歸納總結,并針對大數(shù)據(jù)巖相分類的相關問題進行探討。
機器學習 巖相分類 儲層預測 測井數(shù)據(jù) 大數(shù)據(jù)
巖相是指一定沉積環(huán)境下形成的一系列具有特殊巖性(如礦物組成、沉積結構及幾何結構等)的巖石或巖石組。準確可靠的巖相分析對于地層特性分析、地層學小層對比及儲層預測等油氣田勘探開發(fā)應用來說至關重要[1~4]。巖相分類是油氣田開發(fā)中地層特性分析、小層對比及儲層預測等應用的關鍵環(huán)節(jié)。顯然,通過取心井提取巖心進行巖相分析的精確度和可靠性是最高的,但是這種方法不但費時,而且成本非常高;特別的,對于密井網(wǎng)獲取的大量數(shù)據(jù)來說,這種方法根本就行不通。測井技術通過利用不同物理屬性(如自然伽馬、電阻率、自然電位、聲波速度、巖石體積密度、巖石中子減速及俘獲信息等)的測井手段可以獲取能夠直接反映地下連續(xù)巖相地質信息的測井響應數(shù)據(jù)(信息)??梢姡瑴y井數(shù)據(jù)(信息)能夠直接用于巖相分析。然而,實際獲取的測井數(shù)據(jù)不可避免的會受到采集、記錄及地層環(huán)境等多種內在或外在因素造成的噪聲和失真的干擾,從而導致測井信號降質,而且不同巖相的測井響應往往具有一定的重疊特性,這就造成了利用測井曲線進行巖相分類解譯往往依賴于解譯人員的經(jīng)驗,且解譯成果具有一定的多解性,而且人工測井數(shù)據(jù)巖相分類的效率還是太低。為此,在過去的20年里,樸素貝葉斯(Na?ve Bayes,NB)分類器[5]、人工神經(jīng)網(wǎng)絡(Artificial Neural Networks,ANNs)[6~11]、決策樹(Decision Tree,DT)[12]、支持向量機(Support Vector Machine,SVM)[13~15]、聯(lián)合/集成分類器(Combined Classifier,CC)[16,17]等(有監(jiān)督)機器學習方法不斷被成功應用于各種不同地質環(huán)境的巖相分類和識別應用中。
隨著我國大部分油氣田已經(jīng)進入開發(fā)后期,地層結構越來越復雜,油氣開發(fā)成本越來越高,各種應用都對巖相分類的精度和可靠性提出了越來越高的要求。為此,越來越多的機器學習方法被應用到測井數(shù)據(jù)巖相分類的研究中。筆者對現(xiàn)有的主要巖相分類機器學習方法進行歸納總結,并針對大數(shù)據(jù)巖相分類的機器學習方法存在的問題進行了較為詳細的分析。
一般的,機器學習方法的基本流程如圖1所示。
圖1 機器學習方法基本流程
由圖1可知,在選定分類器的情況下,分類器分類性能直接取決于訓練數(shù)據(jù)的構建和特征提取/選擇。現(xiàn)對基于ANNs分類器、基于SVM分類器和基于聯(lián)合/集成分類器3種典型的巖相分類機器學習方法,分別從分類器基本原理和典型應用的訓練數(shù)據(jù)構建及特征提取/選擇等方面進行介紹。
1.1 ANNs法
ANNs方法采用的是一種并行的分布式處理網(wǎng)絡結構,通過多層神經(jīng)元結構的加權組合構成的前饋神經(jīng)網(wǎng)絡或誤差反向傳播神經(jīng)網(wǎng)絡(BP神經(jīng)網(wǎng)絡)在巖相分類等地質和地球物理勘探中都得到了較好的應用。顯然,神經(jīng)網(wǎng)絡的基本元素是神經(jīng)元,圖2a給出了神經(jīng)元的基本結構,以此為基礎,可以構造如圖2b所示的多層神經(jīng)網(wǎng)絡,圖2b中的每個圓形結構代表一個圖2a給出的神經(jīng)元結構。
圖2 神經(jīng)網(wǎng)絡基本結構示意圖
由圖2可知,ANNs網(wǎng)絡的成功應用需要對網(wǎng)絡中的參數(shù)組{Wi,Bi}進行精確學習,而這些參數(shù)精確學習的基礎是質量良好的訓練樣本。
文獻[9]在對法國拉希奧塔附近的南省盆地La Ciotat-1號井進行巖相分析時采用孔隙度、密度、P波速度、S1波速度、S2波速度、礦化基質體積模量、礦化基質剪切模量及各種礦物含量等19種特征,對石灰?guī)r、石英、純凈砂巖及碳酸鹽砂巖等巖相進行分類。所采用的ANNs網(wǎng)絡為一個三層BP ANNs:一個輸入層,一個隱層和一個輸出層。實驗結果表明該井的ANNs巖相預測精度達到了85.62%。
盡管ANNs法可以通過學習實現(xiàn)較高的分類精度,但仍然具有對不同數(shù)據(jù)集的泛化能力很弱、參數(shù)過多,以及學習時間長甚至達不到學習效果等缺陷。
1.2 SVM法
SVM法是一種基于經(jīng)驗風險最小化等嚴格理論基礎的間隔最大準則下的分類方法,如圖3所示。
SVM法的判別函數(shù)f(x)=ωTx+b,在間隔最大準則下通過引入支持向量的概念,最優(yōu)判別參數(shù)求解的優(yōu)化問題通過對偶轉化為易于求解的如下二次規(guī)劃問題:
圖3 SVM法分類劃分示意圖
s.t.yi(ωTxi+b)≥1,i=1,…,N
(1)
構造拉格朗日函數(shù):
(2)
s.t. αi≥0,i=1,…,N
(3)
最終,可以根據(jù)下式給出最優(yōu)SVM參數(shù):
(4)
上述SVM分類原理是針對線性SVM分類器而言的,對于非線性分類問題,僅需引入核函數(shù),通過對上述優(yōu)化問題進行核擴展即可。顯然,SVM方法與ANNs方法相比,學習參數(shù)要少很多,并且具有更好的泛化性能。
文獻[13]在對中東某砂巖儲層開展的關于測井曲線巖相分類研究中,以井徑CAL、自然伽馬GA、光電PEF、中子孔隙度NPHI、聲吶孔隙度DT、體積密度RHOB、深側向電阻率LLD、淺側向電阻率LLS和微球聚焦電阻率MSFL共9種測井曲線為輸入特征,對純凈砂巖、砂礫巖和砂頁巖3種巖相進行分類。結果表明,與ANNs法相比,SVM法具有更好的分類性能。
SVM法雖然已經(jīng)較為成功地應用于巖相分類等應用中,但是面對復雜數(shù)據(jù)集,核函數(shù)的選擇等問題制約了該方法的泛化能力。
1.3 聯(lián)合/集成學習法
雖然各種專家系統(tǒng)和單分類器機器學習系統(tǒng)在測井曲線巖相識別、分類等研究中已經(jīng)取得了較多的成功經(jīng)驗,然而,隨著大多數(shù)油氣田開發(fā)已經(jīng)進入中晚期,地層地質環(huán)境越來越復雜,儲層預測難度和開采成本不斷增加,為了更好地實現(xiàn)對復雜環(huán)境下專家知識和實際測試數(shù)據(jù)的有效集成,有必要開展更復雜的機器學習方法來提高系統(tǒng)預測和分析的準確度和可靠性。
聯(lián)合/集成機器學習法是通過多個同類或異類學習機器構成一個學習網(wǎng)絡,進而,通過綜合各個學習機器的判決結果實現(xiàn)最終判決,圖4給出了該類方法的基本框圖。
圖4 聯(lián)合/集成機器學習方法基本框圖
可見,該類方法主要由兩部分組成,即學習機器的選擇和決策規(guī)則的制定。根據(jù)學習機器的構成情況,可以有神經(jīng)網(wǎng)絡委員會法、集成學習法及異構機器聯(lián)合學習法等。
文獻[17]對巴西亞馬遜油田相關儲層進行的巖相識別研究中,利用自然伽馬GR、感應測井ILD、聲吶DT和密度RHOB共4種測井曲線進行砂屑灰?guī)r、無水石膏、頁巖和巖鹽4種巖相,分別采用多層感知器、SVM、kNN、決策樹J48及邏輯回歸等單個分類法以及所有這些方法集成的集成分類法進行巖相分類研究。實驗結果表明,集成分類法在6組測試中的4組分類精度最高,而且相關統(tǒng)計結果表明,在改變訓練數(shù)據(jù)的情況下,集成分類法的性能最穩(wěn)定。
隨著勘探開發(fā)進程的推進,國內外油氣田勘探開發(fā)均已進入大數(shù)據(jù)時代[18~20]。所謂大數(shù)據(jù)就是指數(shù)據(jù)量和數(shù)據(jù)屬性變化已經(jīng)超出現(xiàn)有數(shù)據(jù)庫與相關軟件工具的采集、存儲、管理和分析能力的數(shù)據(jù)集。具體的,大數(shù)據(jù)主要體現(xiàn)為數(shù)據(jù)量大、數(shù)據(jù)質量不統(tǒng)一及數(shù)據(jù)結構多樣化等多源、異構且多時相特點。顯然,油氣田勘探開發(fā)過程中測井數(shù)據(jù)本身就是一種大數(shù)據(jù),利用測井數(shù)據(jù)可以進行巖相分類、巖相相關的沉積微相分類、小層對比等多種任務,且不同開發(fā)區(qū)塊,不同沉積相下的巖相種類變化多樣等問題,都為機器學習方法在測井數(shù)據(jù)巖相分類等應用中的大數(shù)據(jù)分析提出了很多亟待解決的難題。
綜合考慮,面對大數(shù)據(jù)的應用需求,傳統(tǒng)機器學習方法主要存在如下問題:
a. 機器學習分類方法的魯棒性問題。利用某個數(shù)據(jù)庫或數(shù)據(jù)域的樣本訓練得到的學習機器很難適用于其他數(shù)據(jù)庫或數(shù)據(jù)域中的數(shù)據(jù)。
b. 類別確定性問題。傳統(tǒng)機器學習方法的訓練數(shù)據(jù)往往是針對有限已知類別進行的,而隨著數(shù)據(jù)的快速變化,類別多變性問題很難得到解決。
c. 傳統(tǒng)機器學習方法一般是針對單任務學習,不適合大數(shù)據(jù)環(huán)境下的多任務學習和知識遷移的需求。
顯然,大數(shù)據(jù)分類技術需要重點著眼于多領域表示學習技術,在數(shù)據(jù)聯(lián)合表示、聯(lián)合特征提取與選擇、跨領域知識遷移等方面進行深入研究。
面對日益復雜的地質地理條件,測井數(shù)據(jù)在巖相分類相關應用的研究中越來越迫切的需要人工智能與機器學習方法的參與。針對測井數(shù)據(jù)巖相分類問題,對現(xiàn)有機器學習方法進行了歸納,重點對ANNs、SVM和聯(lián)合/集成分類法進行了介紹,并對測井數(shù)據(jù)巖相分類大數(shù)據(jù)分析的機器學習方法存在的問題進行了探討。顯然,聯(lián)合/集成學習方法是今后勘探開發(fā)大數(shù)據(jù)分析的一個主流發(fā)展方向,在特征選擇、分類器選擇及分類決策等多方面還存在較多問題需要解決。而對于測井大數(shù)據(jù)來說,重點在于多任務聯(lián)合特征和知識的應用潛能挖掘。
[1] Rogers S J,Fang J H,Karr C L,et al.Determination of Lithology from Well Logs Using a Neural Network[J].AAPG Bulletin,1992,5(5):731~739.
[2] A Kadkhodaie Ilkhchi,Rezaee M,Moallemi S A.A Fuzzy Logic Approach for Estimation of Permeability and Rock Type from Conventional Well Log Data:An Example from the Kangan Reservoir in the Iran Offshore Gas Field[J]. Journal of Geophysics & Engineering,2006,3(4):356~369.
[3] Dong S Q,Wang Z Z,Zeng L B.Lithology Identification Using Kernel Fisher Discriminant Analysis with Well Logs[J].Journal of Petroleum Science and Engineering,2016,143:95~102.
[4] 趙顯令,王貴文,周正龍,等.地球物理測井巖性解釋方法綜述[J].地球物理學進展,2015,30(3):1278~1287.
[5] Li Y M,Richard A S.Facies Identification from Well Logs:A Comparison of Discriminant Analysis and Na?ve Bayes Classifier[J].Journal of Petroleum Science and Engineering,2006,53(3-4):149~157.
[6] Derek H,Johns R,Pasternack E.Comparative Study of a Backpropagation Neural Network and Statistical Pattern Recognition Techniques in Identifying Sandstone Lithofacies[C].Processdings 1990 Conference on Artificial Intelligence in Petroleum Exploration and Production.Houston,TX(United States):Knowledge Systems, Inc,1990:41~49.
[7] Bhatt A,Helle H.Determination of Facies from Well Logs Using Modular Neural Networks[J].Pet Geosci,2002,8(3):217~228.
[8] Dubois M K,Bohling G C,Chakrabarti S.Comparison of Four Approaches to a Rock Facies Classification Problem[J].Computers & Geosciences,2007,33(5):599~617.
[9] Adrielle A S,Irineu A L.Artificial Neural Networks to Support Petrographic Classification of Carbonate-Siliciclastic Rocks Using Well Logs and Textural Information[J].Journal of Applied Geophysics,2015,117:118~125.
[10] 張強,許少華,富宇.基于過程神經(jīng)網(wǎng)絡的儲層微觀孔隙結構類型預測[J].化工自動化及儀表,2015,42(8):893~897.
[11] Sasmita S,Madan K J.Pattern Recognition in Lithology Classification:Modeling Using Neural Networks,Self-Organizing Maps and Genetic Algorithms[J].Hydrogeol J(Springer Online),2016,(1):20.
[12] 石寧,李洪奇,羅偉平.數(shù)據(jù)挖掘與測井解釋:應用于礫巖儲層[J].應用地球物理(英文版),2015,12(2):263~272.
[13] Anazi A A,Gates I D.On the Capability of Support Vector Machines to Classify Lithology from Well Logs[J].Natural Resources Research,2010,19(2):125~139.
[14] Sebtosheikh M A,Motafakkerfard R.Support Vector Machine Method,A New Technique for Lithology Prediction in an Iranian Heterogeneous Carbonate Reservoir Using Petrophysical Well Logs[J].Carbonates Evaporites,2015,30:59~68.
[15] Fatai A,Suli A.Integrating Seismic and Log Data for Improved Petroleum Reservoir Properties Estimation Using Non-linear Feature-selection Based Hybrid Computational Intelligence Models[J].Journal of Petroleum Science and Engineering,2016,145:230~237.
[16] Christopher M G,Arvin A.Collaborative Multi-agent Rock Facies Classification from Wireline Well Log Data[J].Engineering Applications of Artificial Intelligence,2010,23:1158~1172.
[17] Joacir Marques de Oliveira Jnior,Eulanda Miranda dos Santos.Ensemble of Heterogeneous Classifiers Applied to Lithogacies Classification Using Logs from Different Wells[C].Neural Networks (IJCNN),The 2013 International Joint Conference on.Piscataway,NJ:IEEE,2013:1~6.
[18] 崔海福,何貞銘,王寧.大數(shù)據(jù)在石油行業(yè)中的應用[J].石油化工自動化,2016,52(2):43~45.
[19] 李洪奇,郭海峰,郭海敏,等.復雜儲層測井評價數(shù)據(jù)挖掘方法研究[J].石油學報,2009,30(4):542~548.
[20] Johnston J,Guichard A.New Findings in Drilling and Wells Using Big Data Analytics[C].Offshore Technology Conference.Calgary,Canada:Society of Petroleumn Engineers(SPE),2015:OTC-26021-MS 1~8.
MachineLearningMethodsforLogDataLithofaciesClassificationandBigDataLithologyClassificationDiscussion
CAO Zhi-min1,2, WU Yun1, HAN Jian1, LV Xiu-li1, SONG Hong-mei1, ZHAO Li-hua1
(1.SchoolofElectronicScience;NortheastPetroleumUniversity;2.PostdoctoralResearchStation,DaqingOilfield)
The existing machine learning methods for lithofacies classification of the log data were summarized and issues relating to big data lithofacies classification were discussed.
machine learning, lithofacies classification, reservoir prediction, log data, big data
TH865
A
1000-3932(2017)08-0717-05
2016-12-28,
2017-04-20)
曹志民(1980-),講師,博士后,從事多源信號融合及模式識別、大數(shù)據(jù)儲層預測及油藏描述的研究,dahai0464@sina.com。