宋延杰,王 團(tuán),付 健,鄧 鑫
(東北石油大學(xué)地球科學(xué)學(xué)院,黑龍江大慶163318)
隨著遼河油田雷家地區(qū)勘探開(kāi)發(fā)程度的不斷深入,雷64區(qū)塊沙三段已成為勘探開(kāi)發(fā)的主要目的層,由于該區(qū)塊目的層內(nèi)非均質(zhì)性嚴(yán)重、巖性復(fù)雜多變、不同巖性的測(cè)井響應(yīng)存在一定重疊的特點(diǎn).因此如何有效的識(shí)別巖性,對(duì)于后期的測(cè)井評(píng)價(jià)、尋找地下油氣資源、計(jì)算油氣儲(chǔ)量發(fā)揮著不可替代的作用.
針對(duì)不同類型的巖性,傳統(tǒng)的識(shí)別方法是通過(guò)繪制其敏感測(cè)井響應(yīng)的直方圖和交會(huì)圖來(lái)進(jìn)行巖性識(shí)別.如可以利用測(cè)井響應(yīng)交會(huì)圖來(lái)識(shí)別礫巖、砂礫巖、砂巖、泥巖[1-4],也可以利用測(cè)井響應(yīng)直方圖和交會(huì)圖識(shí)別不同種類的火成巖[5-6]和碳酸鹽巖[7],雖然測(cè)井響應(yīng)直方圖和交會(huì)圖能夠直觀的劃分不同類型的巖性,但是由于測(cè)井響應(yīng)直方圖和交會(huì)圖只是簡(jiǎn)單的利用一種或兩種測(cè)井響應(yīng)進(jìn)行巖性識(shí)別,因此只能用來(lái)區(qū)分巖性比較單一,且不同類型巖性的測(cè)井響應(yīng)有明顯區(qū)分的巖性.近幾年,可以通過(guò)引入一些基于數(shù)據(jù)挖掘和分類思想的數(shù)學(xué)方法,同時(shí)利用計(jì)算機(jī)來(lái)進(jìn)行巖性的自動(dòng)識(shí)別,這些方法克服了傳統(tǒng)的測(cè)井響應(yīng)交會(huì)圖法存在的信息量小、所涉及到的敏感測(cè)井響應(yīng)少的缺點(diǎn),主要的數(shù)學(xué)算法有聚類分析、模糊數(shù)學(xué)、神經(jīng)網(wǎng)絡(luò)、貝葉斯網(wǎng)絡(luò)、決策樹(shù)等[8-11].其中神經(jīng)網(wǎng)絡(luò)在測(cè)井資料巖性識(shí)別中已經(jīng)得到很廣泛的應(yīng)用,但神經(jīng)網(wǎng)絡(luò)最大的缺點(diǎn)就是容易對(duì)訓(xùn)練樣本進(jìn)行過(guò)度擬合,方法的可變參數(shù)太多,如果給足夠的時(shí)間,它幾乎可以“記住”任何事情,這樣建立的模型就會(huì)脫離地球物理的背景,而且神經(jīng)網(wǎng)絡(luò)、貝葉斯網(wǎng)絡(luò)還有一個(gè)共同的缺點(diǎn)就是預(yù)測(cè)的模型都屬于“黑盒”,樣本的數(shù)據(jù)和屬性之間以怎樣的方式和關(guān)系擬合是看不到的,而決策樹(shù)[12-15]最大的特點(diǎn)是能夠高度自動(dòng)化的建立起易于用戶所理解的模型,并且模型屬于“白盒”封存,用戶可以直接讀取并能夠利用背景知識(shí)進(jìn)行“屬性-值”的相關(guān)分析,幫助理解模型并發(fā)現(xiàn)新的知識(shí)和規(guī)律.并且決策樹(shù)算法穩(wěn)定,對(duì)于信息量大的數(shù)據(jù)來(lái)說(shuō),可以自動(dòng)分析各個(gè)參數(shù)的敏感性,通過(guò)參數(shù)權(quán)重來(lái)建立非線性的決策樹(shù)模型,判別準(zhǔn)確率高.基于“物以聚類”思想的聚類分析方法[16-19],主要是通過(guò)計(jì)算各個(gè)樣本(變量)之間的相似程度,然后把相似程度高的樣本(變量)歸為一類.如果要區(qū)分的樣本(變量)之間的相似程度比較高,就不能用聚類分析的方法.而雷64區(qū)塊沙三段儲(chǔ)層非均質(zhì)性嚴(yán)重、巖性復(fù)雜多變、不同巖性對(duì)應(yīng)的測(cè)井響應(yīng)存在交叉和重疊.傳統(tǒng)的測(cè)井響應(yīng)交會(huì)圖法和數(shù)理統(tǒng)計(jì)方法難以準(zhǔn)確反映測(cè)井資料與不同巖性之間的非線性映射關(guān)系,而具有自組織、自學(xué)習(xí)、推理思維能力和高精度非線性建模的決策樹(shù)能很好地解決這個(gè)問(wèn)題.本文首先基于取心數(shù)據(jù)和測(cè)井響應(yīng)數(shù)據(jù),采用統(tǒng)計(jì)方法將該區(qū)塊的巖性統(tǒng)一劃分為兩大類:砂質(zhì)細(xì)礫巖和不等粒砂巖.通過(guò)優(yōu)選識(shí)別兩類巖性的敏感測(cè)井曲線,分別采用了測(cè)井響應(yīng)交會(huì)圖法、決策樹(shù)模型、系統(tǒng)聚類模型對(duì)該區(qū)塊的砂質(zhì)細(xì)礫巖和不等粒砂巖進(jìn)行判別,并且將判別結(jié)果和實(shí)際取心對(duì)比,給出識(shí)別該區(qū)塊兩大類巖性的最佳方法.
從雷17井、雷60井、雷64井、雷65井、雷71井的巖心觀察看,雷64區(qū)塊砂礫巖儲(chǔ)層巖性復(fù)雜,有砂礫巖、細(xì)礫巖、細(xì)砂巖、小礫巖、含礫細(xì)砂巖、粉砂巖等.為了更加方便、有效的對(duì)該區(qū)塊的巖性進(jìn)行描述,將該區(qū)塊的巖性統(tǒng)一劃分為2大類:砂質(zhì)細(xì)礫巖和不等粒砂巖.其中砂質(zhì)細(xì)礫巖包括砂礫巖、細(xì)礫巖、小礫巖等,不等粒砂巖包括細(xì)砂巖、粉砂巖、含礫細(xì)砂巖、礫狀砂巖等.
基于上述5口取心井的取心數(shù)據(jù),通過(guò)分小層讀取深側(cè)向電阻率、聲波時(shí)差、密度、補(bǔ)償中子、自然伽馬、自然電位的測(cè)井響應(yīng)數(shù)據(jù)(不等粒砂巖15層、砂質(zhì)細(xì)礫巖35層),并且進(jìn)行統(tǒng)計(jì)分析(見(jiàn)表1),發(fā)現(xiàn)區(qū)分砂質(zhì)細(xì)礫巖和不等粒砂巖最明顯的測(cè)井響應(yīng)為補(bǔ)償中子、深側(cè)向電阻率和聲波時(shí)差.除此之外,這兩類巖性在自然伽馬和密度上也有一定程度的區(qū)分.在自然電位上,這兩類巖性的測(cè)井響應(yīng)幾乎完全重合,不能用來(lái)區(qū)分砂質(zhì)細(xì)礫巖和不等粒砂巖.
1)深側(cè)向電阻率測(cè)井:砂質(zhì)細(xì)礫巖為高值,不等粒砂巖為低值;
2)三孔隙度曲線:砂質(zhì)細(xì)礫巖具有低中子、低聲波時(shí)差、高密度的特點(diǎn),不等粒砂巖具有高中子、高聲波時(shí)差、低密度的特點(diǎn);
3)自然伽馬曲線:砂質(zhì)細(xì)礫巖為低值,不等粒砂巖為高值.
表1 兩類巖性測(cè)井響應(yīng)數(shù)據(jù)統(tǒng)計(jì)表
基于巖性識(shí)別的敏感測(cè)井響應(yīng)優(yōu)選,將補(bǔ)償中子、深側(cè)向電阻率、聲波時(shí)差作為識(shí)別砂質(zhì)細(xì)礫巖和不等粒砂巖的主成分曲線,制作測(cè)井響應(yīng)交會(huì)圖版(見(jiàn)圖1~3).從圖中看出,砂質(zhì)細(xì)礫巖和不等粒砂巖在補(bǔ)償中子、深側(cè)向電阻率、聲波時(shí)差上有明顯的的區(qū)分,但是仍然有一些點(diǎn)存在交叉和重疊的現(xiàn)象.表2給出了利用補(bǔ)償中子、深側(cè)向電阻率、聲波時(shí)差區(qū)分這兩類巖性界限值.由界限值判可知,用測(cè)井響應(yīng)交會(huì)圖法識(shí)別砂質(zhì)細(xì)礫巖和不等粒砂巖的準(zhǔn)確率為62.0%.
表2 兩類巖性在中子-電阻率-聲波時(shí)差上界限值
圖1 補(bǔ)償中子-深側(cè)向電阻率交會(huì)圖
圖2 補(bǔ)償中子-聲波時(shí)差交會(huì)圖
圖3 聲波時(shí)差-深側(cè)向電阻率交會(huì)圖
決策樹(shù)是眾多數(shù)據(jù)挖掘分類算法中使用最多,也是很有用的一種方法.決策樹(shù)作為一種分類算法,它采用“自上而下,分而治之”的遞歸方式把訓(xùn)練數(shù)據(jù)集分成若干互不相交的子集,并形成預(yù)測(cè)模型或分類器,可以對(duì)未知數(shù)據(jù)進(jìn)行預(yù)測(cè)、分類.
決策樹(shù)的生成由兩個(gè)階段組成:1)建樹(shù)階段.利用訓(xùn)練數(shù)據(jù)建立樹(shù)狀分類模型.2)調(diào)整階段.利用測(cè)試數(shù)據(jù)檢驗(yàn)所建立的決策樹(shù)是不是能夠最大限度的分類訓(xùn)練數(shù)據(jù),否則對(duì)以建好的決策樹(shù)進(jìn)行調(diào)整,直到建立一個(gè)規(guī)模較小、分類精度較高的決策樹(shù),決策樹(shù)的生成過(guò)程見(jiàn)圖4.
本文使用的是決策樹(shù)C4.5算法,其基本思想是把連續(xù)值屬性離散化.若屬性A是在連續(xù)區(qū)間取值的連續(xù)型屬性,首先將訓(xùn)練集X根據(jù)屬性A的值按升序排列;然后按已排好的順序逐個(gè)將兩個(gè)分類不同、相鄰樣本的屬性A的平均值作為分割點(diǎn);最后對(duì)每個(gè)劃分分別計(jì)算增益比率,選擇增益比率最大的劃分來(lái)對(duì)相應(yīng)的屬性進(jìn)行離散化.
由于雷64區(qū)塊沙三段砂礫巖儲(chǔ)層的測(cè)井?dāng)?shù)據(jù)來(lái)源于3700測(cè)井系列、小數(shù)控測(cè)井系列、標(biāo)準(zhǔn)測(cè)井系列,從而導(dǎo)致了只有部分井三孔隙測(cè)井曲線齊全,而絕大部分井只有聲波時(shí)差一種孔隙度測(cè)井曲線.因此構(gòu)建了兩類決策樹(shù)模型:一類是基于三孔隙測(cè)井的決策樹(shù)模型,另一類是基于聲波時(shí)差測(cè)井的決策樹(shù)模型,從而保證對(duì)該區(qū)塊所有的井都能夠進(jìn)行巖性識(shí)別.
圖4 決策樹(shù)的生成過(guò)程
基于巖性識(shí)別的敏感測(cè)井響應(yīng)優(yōu)選,將補(bǔ)償中子、深側(cè)向電阻率、聲波時(shí)差、自然伽馬、密度作為識(shí)別砂質(zhì)細(xì)礫巖和不等粒砂巖的敏感測(cè)井曲線,參與決策樹(shù)的構(gòu)建,建立了基于三孔隙測(cè)井的決策樹(shù)模型(見(jiàn)圖5),綜合識(shí)別準(zhǔn)確率為94%,建立的決策樹(shù)模型從根節(jié)點(diǎn)深側(cè)向電阻率開(kāi)始對(duì)數(shù)據(jù)樣本進(jìn)行測(cè)試,從上而下共計(jì)4個(gè)層次.樹(shù)的每個(gè)節(jié)點(diǎn)代表一個(gè)屬性,每個(gè)分支代表巖性判別的一個(gè)規(guī)則.
圖5 基于三孔隙測(cè)井的巖性判別樹(shù)狀圖
基于巖性識(shí)別的敏感測(cè)井響應(yīng)優(yōu)選,將深側(cè)向電阻率、聲波時(shí)差、自然伽馬、密度作為識(shí)別砂質(zhì)細(xì)礫巖和不等粒砂巖的敏感測(cè)井曲線,參與決策樹(shù)的構(gòu)建,建立了基于聲波時(shí)差測(cè)井的決策樹(shù)模型(見(jiàn)圖6).該模型將深側(cè)向電阻率、聲波時(shí)差、自然伽馬作為識(shí)別識(shí)別砂質(zhì)細(xì)礫巖和不等粒砂巖的敏感測(cè)井曲線,參與決策樹(shù)的構(gòu)建.模型的綜合識(shí)別準(zhǔn)確率為92%,建立的決策樹(shù)模型從根節(jié)點(diǎn)深側(cè)向電阻率開(kāi)始對(duì)數(shù)據(jù)樣本進(jìn)行測(cè)試,從上而下共計(jì)3個(gè)層次.樹(shù)的每個(gè)節(jié)點(diǎn)代表一個(gè)屬性,每個(gè)分支代表巖性判別的一個(gè)規(guī)則.
圖6 基于聲波時(shí)差測(cè)井的巖性判別樹(shù)狀圖
基于巖性識(shí)別的敏感測(cè)井響應(yīng)優(yōu)選,將能體現(xiàn)巖性變化的補(bǔ)償中子、深側(cè)向電阻率、聲波時(shí)差、自然伽馬、密度曲線作為識(shí)別巖性的主要參數(shù),建立了系統(tǒng)聚類模型(見(jiàn)圖7).
圖7 系統(tǒng)聚類分析圖
從圖7中可以看出,當(dāng)距離為0時(shí),每個(gè)樣本為單獨(dú)的一類;當(dāng)距離為1時(shí),50個(gè)樣本被聚為13類;當(dāng)距離為2時(shí),50個(gè)樣本被聚為7類;當(dāng)距離為3時(shí),50個(gè)樣本被聚為5類;當(dāng)距離為4時(shí),50個(gè)樣本被聚為4類;當(dāng)距離為6時(shí),50個(gè)樣本被聚為3類;當(dāng)距離為8時(shí),50個(gè)樣本被聚為2類;最終,當(dāng)聚類標(biāo)準(zhǔn)擴(kuò)大到25時(shí),50個(gè)樣本被聚為一類.并且當(dāng)距離為 2 時(shí),樣本 2、4、5、7、6 被聚為一類;樣本 1、3、8、9、10、13、14、15 與樣本 16、17、18、19、20、21、22、23、26、27、32 被聚為一類;樣本 11、12 與樣本 37、38、30、49、50、39、45、41、47、40、42、28被聚為一類;而樣本1~15為不等粒砂巖,應(yīng)該被聚為一類;16~50為砂質(zhì)細(xì)礫巖,應(yīng)該被聚為另一類.之所以出現(xiàn)這么大的誤差,是由于該區(qū)塊巖性復(fù)雜,不同巖性對(duì)應(yīng)的測(cè)井響應(yīng)存在交叉和重疊的現(xiàn)象,而系統(tǒng)聚類主要是通過(guò)計(jì)算各個(gè)樣本之間的相似程度,然后把相似程度高的樣本歸為一類.通過(guò)對(duì)聚類結(jié)果進(jìn)行分析發(fā)現(xiàn),用系統(tǒng)聚類模型識(shí)別砂質(zhì)細(xì)礫巖和不等粒砂巖的準(zhǔn)確率為80.0%.
通過(guò)對(duì)上述三種模型進(jìn)行研究,發(fā)現(xiàn)對(duì)于判別砂質(zhì)細(xì)礫巖和不等粒砂巖,測(cè)井響應(yīng)交會(huì)圖法的準(zhǔn)確率為62.0%,系統(tǒng)聚類模型的準(zhǔn)確率為80%,基于三孔隙測(cè)井的決策樹(shù)模型的準(zhǔn)確率為94.0%,基于聲波時(shí)差測(cè)井的決策樹(shù)模型的準(zhǔn)確率為92.0%,決策樹(shù)模型的精度遠(yuǎn)高于測(cè)井響應(yīng)交會(huì)圖法和系統(tǒng)聚類模型.因此識(shí)別雷64區(qū)塊砂質(zhì)細(xì)礫巖和不等粒砂巖最優(yōu)方法是決策樹(shù)模型.
圖8是用所構(gòu)建的兩種決策樹(shù)模型對(duì)雷71井的巖性識(shí)別剖面圖,該井的取心井段為2 240.8~2 254.0 m,總長(zhǎng) 13.2 m,用基于三孔隙測(cè)井構(gòu)建的決策樹(shù)模型識(shí)別巖性錯(cuò)誤的巖心長(zhǎng)度為1.92 m,正確率為86.0%,用基于聲波時(shí)差測(cè)井構(gòu)建的決策樹(shù)模型識(shí)別巖性錯(cuò)誤的巖心長(zhǎng)度為2.0 m,正確率為85.0%.這說(shuō)明所建立的決策樹(shù)模型對(duì)雷64區(qū)塊砂礫巖儲(chǔ)層識(shí)別巖性的效果較好,可以用于該區(qū)塊的巖性識(shí)別.
圖8 雷71井巖性識(shí)別剖面圖
巖性識(shí)別過(guò)程中不吻合之處可能是以下幾種原因引起:1)巖性識(shí)別方法對(duì)夾層不敏感,夾層越薄,識(shí)別效果越不明顯;2)在研究過(guò)程中有過(guò)渡層的干擾,各種過(guò)渡層的出現(xiàn)使得判別誤差增大;3)巖性本身就有一定的相似性,砂質(zhì)細(xì)礫巖和不等粒砂巖在巖性上相差不大.
1)識(shí)別雷64區(qū)塊砂質(zhì)細(xì)礫巖和不等粒砂巖最明顯的測(cè)井曲線為補(bǔ)償中子、深側(cè)向電阻率、聲波時(shí)差.此外,這兩類巖性在自然伽馬和密度上也有一定程度的區(qū)分.在自然電位上,這兩類巖性的測(cè)井響應(yīng)幾乎完全重合,不能用來(lái)區(qū)分砂質(zhì)細(xì)礫巖和不等粒砂巖.
2)通過(guò)分析比較所建立的3種巖性識(shí)別模型,發(fā)現(xiàn)對(duì)于識(shí)別復(fù)雜巖性、非均質(zhì)性強(qiáng)的儲(chǔ)層來(lái)說(shuō),通過(guò)自動(dòng)分析巖性敏感參數(shù)進(jìn)而建立非線性映射的決策樹(shù)模型的精度要高于傳統(tǒng)的測(cè)井響應(yīng)交會(huì)圖法和基于研究“物以聚類”而建立系統(tǒng)聚類模型.
3)利用建立的三孔隙決策樹(shù)模型和聲波時(shí)差決策樹(shù)模型對(duì)雷71井取心層段進(jìn)行巖性識(shí)別,正確率均大于85%,表明所建立的決策樹(shù)模型可以很好的用于該區(qū)塊的巖性識(shí)別.
[1]顧玉君,申曉娟,吳愛(ài)紅,等.泌陽(yáng)凹陷南部陡坡帶砂礫巖儲(chǔ)層巖性識(shí)別研究[J].石油地質(zhì)與工程,2009,23(2):40-42.
[2]李偉才,姚光慶,黃銀濤,等.文昌13-1油田低阻油層測(cè)井巖性識(shí)別方法研究[J].石油天然氣學(xué)報(bào),2012,34(12):81-85.
[3]張麗華,潘保芝,劉思慧,等.梨樹(shù)斷陷東南斜坡帶砂礫巖巖性識(shí)別方法研究[J].測(cè)井技術(shù),2012,36(4):370-372.
[4]HAMADA G M,AI-AWAD M N J,ALMALIK M S.Log evaluation of low -resistivity sandstone reservoirs[C]//Midland:Society of Petroleum Engineers,2001.
[5]張曉峰,范曉敏.交會(huì)圖和Carbon軟件在火山碎屑巖識(shí)別中的應(yīng)用[J].吉林大學(xué)學(xué)報(bào)(地球科學(xué)版),2007,37(增刊):102-104.
[6]范宜仁,黃隆基,代詩(shī)華.交會(huì)圖技術(shù)在火山巖巖性與裂縫識(shí)別中的應(yīng)用[J].測(cè)井技術(shù),1999,23(1):53-56.
[7]王 瑞,朱筱敏,王禮常.用數(shù)據(jù)挖掘方法識(shí)別碳酸鹽巖巖性[J].測(cè)井技術(shù),2012,36(2):197-201.
[8]楊 輝,黃健全,胡雪濤,等.BP神經(jīng)網(wǎng)絡(luò)在致密砂巖氣藏巖性識(shí)別中的應(yīng)用[J].油氣地球物理,2013,11(1):39-42.
[9]張治國(guó),楊毅恒,夏立顯.自組織特征映射神經(jīng)網(wǎng)絡(luò)在測(cè)井巖性識(shí)別中的應(yīng)用[J].地球物理學(xué)進(jìn)展,2005,20(2):332-336.
[10]楊立強(qiáng),王志章,熊琦華.復(fù)雜巖性儲(chǔ)層參數(shù)評(píng)價(jià)中神經(jīng)網(wǎng)絡(luò)技術(shù)的應(yīng)用[J].地球物理學(xué)進(jìn)展,2003,18(1):44-48.
[11]張 平,潘保芝,張 瑩,等.自組織神經(jīng)網(wǎng)絡(luò)在火成巖巖性識(shí)別中的應(yīng)用[J].石油物探,2009,48(1):53-56.
[12]李洪奇,譚鋒奇,許長(zhǎng)福,等.基于決策樹(shù)方法的礫巖油藏巖性識(shí)別[J].測(cè)井技術(shù),2010,34(1):16-21.
[13]田苗苗.數(shù)據(jù)挖掘之決策樹(shù)方法概述[J].長(zhǎng)春大學(xué)學(xué)報(bào),2004,14(6):48-51.
[14]QUINLAN J R.C4.5:Programs for Machine learning[M].CA:Morgan Kauffman Publishers Inc,1993.
[15]魯國(guó)明.東營(yíng)凹陷深層砂礫巖巖性測(cè)井綜合識(shí)別技術(shù)[J].測(cè)井技術(shù),2010,34(2):168-171.
[16]王祝文,劉菁華,任 莉.基于K均值動(dòng)態(tài)聚類分析的地球物理測(cè)井巖性分類方法[J].東華理工大學(xué)學(xué)報(bào):自然科學(xué)版,2009,32(2):152-156.
[17]尋知鋒,余繼峰.聚類和判別分析在測(cè)井巖性識(shí)別中的應(yīng)用[J].山東科技大學(xué)學(xué)報(bào):自然與科學(xué)版,2008,27(5):10-13.
[18]王 駿,王士同,鄧趙紅.聚類分析研究中的若干問(wèn)題[J].控制與決策,2012,27(3):321-328.
[19]WANG Q,YE Y,HUANG J Z.Fuzzy k - means with variable weighting in high dimensional data analysis[C]//Zhangjiajie:Proc of the 6th Int Conf on Web-Age Information Management,2008.