李建國(guó) 張衛(wèi)東 劉冠男
摘 要:深度學(xué)習(xí)也被稱(chēng)為深度神經(jīng)網(wǎng)絡(luò),是機(jī)器學(xué)習(xí)的最新研究結(jié)果,在2006年Geoffrey Hinton提出訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)的方法以后,其在語(yǔ)音和圖像處理的領(lǐng)域迅速發(fā)展,并取得了很好的成績(jī)。由于深度學(xué)習(xí)優(yōu)良的特征提取性質(zhì),所以在這里把深度學(xué)習(xí)用在地球物理測(cè)井巖性的識(shí)別中,對(duì)四川西部川科1井的巖性進(jìn)行識(shí)別。
關(guān)鍵詞:深度學(xué)習(xí);測(cè)井;巖性識(shí)別;儲(chǔ)層預(yù)測(cè)
引言
儲(chǔ)層預(yù)測(cè)是尋找油氣資源,評(píng)估油氣儲(chǔ)量基礎(chǔ)的工作之一。由于井下地質(zhì)構(gòu)造的復(fù)雜性和測(cè)井參數(shù)分布的模糊性,傳統(tǒng)的巖性識(shí)別方法往往識(shí)別精度有限,很多時(shí)候?qū)θ说慕?jīng)驗(yàn)要求比較高。前人應(yīng)用神經(jīng)網(wǎng)絡(luò)在測(cè)井巖性識(shí)別上做了大量的研究,取得了很好的結(jié)果,但是前人的研究中主要是使用BP神經(jīng)網(wǎng)絡(luò)對(duì)巖性預(yù)測(cè),盧新衛(wèi),金章東對(duì)勝利油田某測(cè)井巖性用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行識(shí)別[1],以及范訓(xùn)禮等用BP網(wǎng)絡(luò)對(duì)塔里木油田TZ4測(cè)井的巖性進(jìn)行了自動(dòng)識(shí)別[2],侯俊勝、王穎利用BP網(wǎng)絡(luò)對(duì)煤氣層測(cè)井資料進(jìn)行了定量解釋識(shí)別[3],識(shí)別準(zhǔn)確率不是很高。BP神經(jīng)網(wǎng)絡(luò)有一個(gè)致命的缺點(diǎn)就是容易陷入局部最小值,特別是隨著神經(jīng)網(wǎng)絡(luò)層數(shù)的增加,其陷入局部最小值的可能性大大增加,相對(duì)而言深度學(xué)習(xí)就可以很好的克服這個(gè)缺點(diǎn),取得很好的結(jié)果。
1 深度學(xué)習(xí)發(fā)展
在Geoffrey Hinton 2006年提出深度學(xué)習(xí)[4]之后的短短數(shù)年里,深度學(xué)習(xí)就以其強(qiáng)大的對(duì)數(shù)據(jù)內(nèi)部結(jié)構(gòu)的表征能力贏得了國(guó)際學(xué)術(shù)界的廣泛重視,各個(gè)互聯(lián)網(wǎng)巨頭如:百度,google,騰訊,紛紛成立深度學(xué)習(xí)的研究實(shí)驗(yàn)室,美國(guó)國(guó)防高級(jí)研究計(jì)劃局也于2009年成立了深度學(xué)習(xí)項(xiàng)目組。微軟公司已經(jīng)成功地將深度學(xué)習(xí)方法應(yīng)用于自己的語(yǔ)音識(shí)別系統(tǒng)當(dāng)中,它能夠?qū)卧~錯(cuò)誤率相較之前的最優(yōu)方法降低約30%。 因此,深度學(xué)習(xí)被認(rèn)為是繼1997年的隱馬爾科夫(Hidden Markov Model, HMM)模型之后,語(yǔ)音識(shí)別領(lǐng)域的又一次重大突破[5]。
2 深度學(xué)習(xí)理論簡(jiǎn)介
到目前為止深度學(xué)習(xí)主要有三種方法:卷積神經(jīng)網(wǎng)絡(luò),限制玻爾茲曼機(jī),自動(dòng)編碼機(jī),在這里我們主要使用的是受限玻爾茲曼機(jī)(RBM)。
RBM是第一個(gè)由統(tǒng)計(jì)力學(xué)推導(dǎo)出來(lái)的多層學(xué)習(xí)機(jī),機(jī)器的命名認(rèn)可了神經(jīng)網(wǎng)絡(luò)的自身動(dòng)力學(xué)行為和RBM原始關(guān)于統(tǒng)計(jì)熱力學(xué)工作形式上的等價(jià)性?;旧险f(shuō),RBM可以對(duì)給定數(shù)據(jù)集的固有概率的分布進(jìn)行建模,這樣在諸如模式完備和模式分類(lèi)的任務(wù)中所使用的條件分布就可以推導(dǎo)出來(lái)了。在對(duì)比散度出現(xiàn)以前我們一般用MCMC求解,但是那樣的話(huà)其學(xué)習(xí)過(guò)程是慢得難以忍受,所以在這以前其根本沒(méi)有任何實(shí)用價(jià)值,直到Hinton發(fā)明對(duì)比散度以后其才得以飛速發(fā)展,特別是在語(yǔ)音和圖像上取得了很大的成功。
3 能量模型作用
在RBM中使用了能量模型,其原因有幾個(gè):
(1)RBM網(wǎng)絡(luò)是一種無(wú)監(jiān)督學(xué)習(xí)的方法,無(wú)監(jiān)督學(xué)習(xí)的目的是最大可能的擬合輸入數(shù)據(jù),所以學(xué)習(xí)RBM網(wǎng)絡(luò)的目的是讓RBM網(wǎng)絡(luò)最大可能地?cái)M合輸入數(shù)據(jù)。
(2)在馬爾科夫隨機(jī)場(chǎng)(MRF)中能量模型主要扮演著兩個(gè)作用:全局解的度量(目標(biāo)函數(shù)),和能量最小時(shí)的解(各種變量對(duì)應(yīng)的配置)為目標(biāo)解。換句話(huà)說(shuō),使用能量模型使得學(xué)習(xí)一個(gè)數(shù)據(jù)的分布變得容易可行了。能否把最優(yōu)解嵌入到能量函數(shù)中至關(guān)重要,決定著我們具體問(wèn)題求解的好壞。統(tǒng)計(jì)模式識(shí)別主要工作之一就是捕獲變量之間的相關(guān)性,同樣能量模型也要捕獲變量之間的相關(guān)性,變量之間的相關(guān)程度決定了能量的高低。把變量的相關(guān)關(guān)系用圖表示出來(lái),并引入概率測(cè)度方式就構(gòu)成了概率圖模型的能量模型。RBM作為一種概率圖模型,引入了概率就可以使用采樣技術(shù)求解,在對(duì)比散度算法中采樣部分扮演著模擬求解梯度的角色。能量模型需要一個(gè)定義能量函數(shù),RBM的能量函數(shù)的定義如下:
這個(gè)能量函數(shù)的意思就是,每個(gè)可視節(jié)點(diǎn)和隱藏節(jié)點(diǎn)之間的連接結(jié)構(gòu)都有一個(gè)能量,通俗來(lái)說(shuō)就是可視節(jié)點(diǎn)的每一組取值和隱藏節(jié)點(diǎn)的每一組取值都有一個(gè)能量。
4 公式推導(dǎo)
在這里我們的能量函數(shù)不是以前的二項(xiàng)分布的能量函數(shù)了,而是具有高斯分布的能量函數(shù)了,如下所示:
寫(xiě)成向量的形式如下:
因?yàn)樵谶@里我們的V是高斯分布,其是連續(xù)分布的不是二項(xiàng)分布的,所以
經(jīng)過(guò)很多步化簡(jiǎn)可以得到以下結(jié)果
由以上公式可以推導(dǎo)出:
所以可視節(jié)點(diǎn)是由u=bi+?撞jwi,jhj?滓i為均值,?滓i為方差的高斯分布。
5 研究結(jié)果
本次研究以川西地區(qū)川科1井來(lái)驗(yàn)證巖性的識(shí)別結(jié)果,川科1井是開(kāi)拓四川盆地海相勘探新領(lǐng)域具有重要戰(zhàn)略意義的科學(xué)探索井。選擇了聲波測(cè)井(AC),井徑1(CAL1), 井徑2(CAL2),密度(DEN),自然伽瑪(GR),5條測(cè)井曲線(xiàn)作為研究對(duì)象,選取有巖芯資料的樣本45個(gè),作為深度學(xué)習(xí)的輸入樣本,在這45個(gè)樣。
文章中我們以30個(gè)作為訓(xùn)練的樣本,15個(gè)作為測(cè)試的樣本在這個(gè)神經(jīng)網(wǎng)絡(luò)中通過(guò)不同的參數(shù)對(duì)深度學(xué)習(xí)的影響,選擇最優(yōu)的參數(shù),最后得出結(jié)果,當(dāng)層數(shù)為5層時(shí),每層的節(jié)點(diǎn)個(gè)數(shù)為10個(gè)時(shí)所得到的結(jié)果最好。個(gè)別樣本測(cè)試結(jié)果的誤差較大,其余的與期望輸出值完全一致,巖性識(shí)別正確率高達(dá)90%以上。
6 結(jié)束語(yǔ)
在通過(guò)大量的測(cè)試發(fā)現(xiàn)深度學(xué)習(xí)可以得到很好的結(jié)果,相對(duì)于的傳統(tǒng)BP網(wǎng)絡(luò)其克服了收斂慢和發(fā)散的問(wèn)題,也體現(xiàn)了其特征提取的優(yōu)越性。但是由于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)參數(shù)初始化的隨機(jī)性,有時(shí)候相同的測(cè)試參數(shù)可能得到不同的測(cè)試結(jié)果,所以深度學(xué)習(xí)訓(xùn)練有一定的困難性。
研究表明采用深度學(xué)習(xí)來(lái)進(jìn)行測(cè)井巖性識(shí)別,方法簡(jiǎn)單易操作,且識(shí)別準(zhǔn)確率相當(dāng)高。這為測(cè)井資料地質(zhì)解釋提供了一個(gè)全新的方法,對(duì)于探尋和鑒別含油氣地層的精確性,在油氣資源開(kāi)發(fā)領(lǐng)域非常具有實(shí)用意義。
參考文獻(xiàn)
[1]盧新衛(wèi),金章東.前饋神經(jīng)網(wǎng)絡(luò)的巖性識(shí)別方法[J].石油與天然氣地質(zhì),1999,3.
[2]范訓(xùn)禮,戴航,張新家,等.神經(jīng)網(wǎng)絡(luò)在巖性識(shí)別中的應(yīng)用[J].測(cè)井技術(shù),1999,1.
[3]侯俊勝,王穎.神經(jīng)網(wǎng)絡(luò)方法在煤氣層測(cè)井資料解釋中的應(yīng)用[J].地質(zhì)與勘探,1999,5.
[4]Hinton,G.E.Osindero,S.and Teh,Y.A fast learning algorithm for deep belief nets[J].Neural Computation,2006,18:1527-1554.
[5]曾黃麟,虞厥邦,曾謙.基于主成分分析的特征簡(jiǎn)化[J].四川輕化工學(xué)院學(xué)報(bào),1999,12(1).
作者簡(jiǎn)介:李建國(guó)(1987-),男,成都理工大學(xué)地球物理學(xué)院在讀碩士研究生,地球探測(cè)與信息技術(shù),主要研究方向?yàn)樯疃葘W(xué)習(xí)在地球物理方面的應(yīng)用。