李鐵軍,薛玲,郭大立,杜國峰,許江文
(1.西南石油大學(xué)研究生院,四川 成都610500;2.中國石油新疆油田公司勘探公司,新疆 克拉瑪依834000)
在油氣勘探過程中,利用測井、錄井等技術(shù)采集的儲層數(shù)據(jù)量較大,且數(shù)據(jù)信息具有嚴(yán)重的非正態(tài)性及多維性,如何挖掘其內(nèi)在信息是后期儲層綜合評價的難點和關(guān)鍵。本文將粗糙集理論引入儲層評價,通過對復(fù)雜的數(shù)據(jù)、信息進行分析推理,揭示其間的內(nèi)在關(guān)系。利用布爾邏輯和粗糙集理論相結(jié)合的離散化算法[1],對訓(xùn)練樣本集條件屬性值進行離散化處理;將粗糙集理論與遺傳算法相結(jié)合,進行知識約簡;在此基礎(chǔ)上,綜合利用常規(guī)測井、核磁測井和錄井?dāng)?shù)據(jù),對儲層含油氣性進行識別。
粗糙集理論是由波蘭數(shù)學(xué)家Z.Pawlak 于1982年提出的一種數(shù)據(jù)分析理論,其主要思想是在保持分類能力不變的前提下,根據(jù)屬性間的依賴關(guān)系,通過知識約簡,導(dǎo)出問題的決策或分類規(guī)則[2-5]。
1.1.1 知識表達(dá)系統(tǒng)
知識表達(dá)系統(tǒng)可表示為S=(U,A,V,f),其中:U為論域,表示對象的非空有限集合;A 為屬性集合,由條件屬性集C 和決策屬性集D 組成,A=C∪D,C∩D =?;V 為屬性的值域集,對于?a∈A,對應(yīng)一個屬性值域Va,因此;f 為信息函數(shù),它為每個對象的每個屬性賦予一個信息值,表示U×A→V,即?a∈A,x∈U,存在f(x,a)∈V。
1.1.2 屬性約簡
屬性約簡是粗糙集理論的核心內(nèi)容,其在保持知識分類能力不變的條件下,刪除知識表達(dá)系統(tǒng)中不相關(guān)或不重要的屬性,從而有助于快速作出正確的決策。屬性約簡的基礎(chǔ)是屬性間的相互關(guān)系,條件屬性C 對決策屬性D 的支持度kC(D)定義為
對于集合Q(Q?C),如果posQ(D)=posC(D),則稱Q 是C 的一個D 約簡。條件屬性C 中所有D 必要的原始屬性構(gòu)成的集合,稱為C 的D 核,簡稱相對核,記為coreD(C)。
其中
布爾邏輯與粗糙集理論相結(jié)合的離散化算法,是在不改變信息系統(tǒng)不可分辨關(guān)系的前提下,盡可能以最小數(shù)目的斷點,對所有實例間的不可分辨關(guān)系進行區(qū)分。
遺傳算法[6]是一種自適應(yīng)全局優(yōu)化概率的搜索算法,具有全局優(yōu)化和隱含并行性等優(yōu)點,適用于粗糙集理論中屬性約簡問題的求解。求解最小約簡的原則,一是屬性約簡的程度盡可能高,二是約簡的條件屬性對決策屬性的支持度較高。由此確定約簡算法的具體步驟為:
1)利用式(1),計算知識表達(dá)系統(tǒng)S=(U,A,V,f)中,條件屬性C 對決策屬性D 的支持度kC(D)。
2)假設(shè)coreD(C)=?,對于每一個條件屬性c∈C,利用式(3)計算其對決策屬性D 的重要性若,則令coreD(C)=coreD(C)∪{c },最終得到C 對D 的相對核。當(dāng)kcoreD(C)(D)=kC(D)時,coreD(C)即為最小約簡;否則kcoreD(C)(D) 式中:β 為罰因子;α 為函數(shù)求解過程中設(shè)定的系數(shù),α>0;sup(x)為支持度;sup0為預(yù)設(shè)的支持度。 4)利用輪盤賭方法選擇種群中的個體,根據(jù)交叉概率pc和變異概率pm產(chǎn)生新一代群體,變異時保持核屬性對應(yīng)的基因位不發(fā)生變異。 其中,交叉概率pc和變異概率pm分別為 式中:k1,k2,k3,k4均為[0,1 ]的隨機數(shù);Fmax為群體中最大的適應(yīng)值;Favg為群體的平均適應(yīng)值;F′為要交叉?zhèn)€體中的最大適應(yīng)值;F 為要變異個體的適應(yīng)值。 5)依據(jù)最優(yōu)個體保護策略,取每代種群中適應(yīng)值最大的個體,原封不動地復(fù)制到下一代種群中,以保存最優(yōu)個體。當(dāng)最優(yōu)個體的適應(yīng)值不再提高時,終止計算,并輸出最優(yōu)個體,否則重新轉(zhuǎn)步驟4)。 根據(jù)粗糙集理論,知識表達(dá)系統(tǒng)S=(U,A,V,f)經(jīng)遺傳算法約簡后得到的每一個決策規(guī)則,是具有一定決策概率的不精確判別規(guī)則。對于?x∈U,其對應(yīng)的決策規(guī)則rx的價值,可采用支持度sup(rx)、置信度con(rx)和覆蓋度cov(rx)等3 個指標(biāo)進行衡量: 式中: C(x),D(x)分別為x 的C 等價類和D 等價類。 其中,支持度用于衡量決策規(guī)則的強度,反映了論域中支持此決策規(guī)則的對象占全體對象的比例; 置信度用于衡量規(guī)則中條件類分配到?jīng)Q策類中的精度,反映了決策規(guī)則的可信性; 覆蓋度用于評估決策規(guī)則的質(zhì)量,反映了決策規(guī)則的條件類對決策類的覆蓋程度。 利用布爾邏輯和粗糙集理論相結(jié)合的離散化算法[1],對訓(xùn)練樣本集條件屬性值進行離散化處理; 運用基于遺傳算法的粗糙集屬性約簡算法,提取儲層評價規(guī)則;將檢驗樣本與生成的規(guī)則進行匹配,若與規(guī)則匹配,則應(yīng)用規(guī)則進行儲層評價,否則應(yīng)用最近相鄰法進行儲層評價。具體步驟如圖1所示。 圖1 儲層識別流程 屬性約簡后得到的最小約簡表為一組邏輯規(guī)則的集合,利用其對樣本數(shù)據(jù)進行處理,得到?jīng)Q策規(guī)則。利用支持度、置信度和覆蓋度等規(guī)則評價指標(biāo)對生成的決策規(guī)則進行過濾,提取有效的儲層識別規(guī)則集。利用判別規(guī)則對新檢驗樣本進行儲層識別時,可能出現(xiàn)4種匹配情況: 1)1 個新樣本與1 個規(guī)則匹配,新樣本的預(yù)測結(jié)果唯一。 2)1 個新樣本與1 個以上的規(guī)則匹配,匹配規(guī)則的結(jié)果屬性同屬于1 個儲層類型,預(yù)測結(jié)果亦唯一。 3)1 個新樣本與1 個以上的規(guī)則匹配,匹配規(guī)則的結(jié)果屬性不屬于同一個儲層類型。此時,為了對新樣本的儲層類型做出判斷,采用多數(shù)優(yōu)先推理方法消除沖突。即假設(shè)有2 條不一致的規(guī)則r1和r2,與1 個新樣本匹配后,預(yù)測結(jié)果分別為γ1和γ2,此時若con(r1)=con(r2),則新樣本的最終預(yù)測結(jié)果采用條件屬性基數(shù)較大的規(guī)則的預(yù)測結(jié)果;若con(r1)≠con(r2),則當(dāng)C(1) > C(2) ,con(r1)>con(r2) 時,新樣本的最終預(yù)測結(jié)果選擇γ1,當(dāng)C(1) > C(2) ,con(r1) 4)一個新樣本無法與任何規(guī)則進行匹配時,可采用最近相鄰法進行儲層類型的判別。設(shè)新樣本x′ 的條件屬性C= {c′1,c′2,…,c′t},則其與規(guī)則r 的距離l 可表示為1 式中:ki為屬性c′i的權(quán)重,i=1,2,…,t;c′imax,c′imin分別為c′i的最大值和最小值。 設(shè)各屬性的權(quán)重相同,選擇d 值最小的規(guī)則所對應(yīng)的儲層類型作為新樣本的預(yù)測結(jié)果。 選擇新疆地區(qū)準(zhǔn)東區(qū)塊和西北緣區(qū)塊具有常規(guī)測井、核磁測井及錄井資料的126 口井進行研究。將參數(shù)不全及數(shù)據(jù)異常的井去除,最終利用其中的80 口井作為訓(xùn)練樣本,19 口井作為模型的檢驗樣本。借鑒國內(nèi)前期的研究成果及儲層識別參數(shù)的選擇方法,從數(shù)據(jù)資料中53 種不同的參數(shù)屬性中,選取地層電阻率(c1)、自然電位(c2)、自然伽馬(c3)、聲波時差(c4)、補償中子(c5)、密度(c6)、可動流體孔隙度(c7)、滲透率(c8)、有效孔隙度(c9)、全烴增幅(c10),以及與地層中油氣含量相關(guān)的氣測五組分中C2/C1的增幅(c11)、C3/C1的增幅(c12)、iC4/C1的增幅(c13)、nC4/C1的增幅(c14)和C2/C3的增幅(c15)等15 個指標(biāo)變量作為條件屬性,構(gòu)成條件屬性集C={c1,c2,c3,…,c15},進行儲層識別[8-20]。決策屬性D 為產(chǎn)油量,根據(jù)儲層是否達(dá)到工業(yè)油流標(biāo)準(zhǔn),將儲層分為干層、水層和油層,屬性值分別用0,1,2 表示,即D={d=i,i=0,1,2}。 利用80 口井的15 個條件屬性值和1 個決策屬性值構(gòu)建決策系統(tǒng)表(見表1),其中省略了部分井的數(shù)據(jù)。利用布爾邏輯和粗糙集理論相結(jié)合的離散化算法,對每個條件屬性ci(i=1,2,…,15)進行離散化處理。例如,根據(jù)c1的離散點11.505 和23.025,將c1分為3 個離散區(qū)間,落在不同區(qū)間時的取值分別為0,1 和2。結(jié)合表1,得到離散后的決策信息系統(tǒng)表(見表2)。 利用基于粗糙集的遺傳算法對屬性數(shù)據(jù)進行約簡,共產(chǎn)生432 條識別規(guī)則。其中,有些規(guī)則缺乏代表性與典型性。為此,按照置信度、覆蓋度、支持度分別不小于80%,0.02,4 的標(biāo)準(zhǔn),從中挑選出56 條規(guī)則,形成儲層識別規(guī)則集,選擇其中的10 條規(guī)則列于表3。 利用80 個訓(xùn)練樣本得到的儲層識別規(guī)則集,對19 個檢驗樣本進行儲層類型識別。結(jié)合2.2 中的儲層評價判別方法,得出檢驗樣本的最終預(yù)測結(jié)果。 表1 80 口研究井儲層原始數(shù)據(jù) 表2 離散化后的儲層數(shù)據(jù) 表3 儲層識別規(guī)則 在此過程中,出現(xiàn)了4 種情況:1)有3 個檢驗樣本與1 個規(guī)則匹配,識別結(jié)果唯一,其中1 個預(yù)測結(jié)果與實際不符,正確率為66.67%;2)有6 個檢驗樣本與1個以上的規(guī)則匹配,識別結(jié)果為同一個儲層類型,且預(yù)測結(jié)果與實際全部相符,正確率為100%;3)有7 個檢驗樣本與1 個以上的規(guī)則匹配,識別結(jié)果為不同的儲層類型,采用第3 種判別方法進行判別后,有2 個預(yù)測結(jié)果與實際不符,正確率為71.43%;4)有3 個樣本不與任何規(guī)則匹配,采用第4 種判別方法進行判別后,有2 個預(yù)測結(jié)果與實際不符,正確率僅為33.33%。 在19 個檢驗樣本中,16 個樣本找到了與之相匹配的規(guī)則,匹配率為84.21%。將檢驗樣本的最終預(yù)測結(jié)果與實際測試解釋結(jié)果進行對比(見表4),可以看出,該儲層識別方法預(yù)測油層的正確率較高。 表4 儲層識別模型準(zhǔn)確性分析 通過綜合應(yīng)用布爾邏輯、遺傳算法及粗糙集理論,實現(xiàn)了基礎(chǔ)數(shù)據(jù)的離散化處理、條件屬性的約簡,以及儲層識別規(guī)則的提取,使得儲層的含油氣性識別變得簡單易行,且識別的正確率較高,為油氣層的進一步分析評價構(gòu)建了必要的基礎(chǔ),對油氣田開發(fā)方案的制定具有重要的指導(dǎo)作用。 [1]侯利娟,王國胤,聶能.粗糙集理論中的離散化問題[J].計算機科學(xué),2000,27(12):89-94. [2]呂軍,馮博琴,李波.基于遺傳算法的屬性約簡[J].微電子學(xué)與計算機,2006,23(7):150-153. [3]李偉生,易哲.基于遺傳算法的粗糙集屬性約簡算法[J].微電子學(xué)與計算機,2010,27 (3):71-74. [4]楊帆.粗糙集約簡算法及其應(yīng)用的研究[D].武漢:武漢科技大學(xué),2005. [5]楊波,徐章艷,舒文豪.一種快速的Rough 集屬性約簡遺傳算法[J].小型微型計算機系統(tǒng),2012,33(1):140-144. [6]劉克文.基于GA 的神經(jīng)網(wǎng)絡(luò)設(shè)計及其應(yīng)用[J].斷塊油氣田,2000,7(4):41-42. [7]柯孔林,馮宗憲.基于粗糙集與遺傳算法集成的企業(yè)短期貸款違約判別[J].系統(tǒng)工程理論與實踐,2008,28(4):27-34. [8]于紅巖,李洪奇,張萬龍,等.敖南油田水平井測井解釋方法研究[J].石油天然氣學(xué)報,2012,34(1):84-87. [9]楊啟明,高劍峰.多參數(shù)相關(guān)性分析在識別油氣層中的應(yīng)用[J].斷塊油氣田,2000,7(3):44-45. [10]趙軍.模糊灰關(guān)聯(lián)分析法在測井識別油氣水層中的應(yīng)用[J].測井技術(shù),2000,24(5):337-339. [11]何宏.氣測錄井檢測評價油氣儲層技術(shù)研究[D].天津:天津大學(xué),2003. [12]賈煥軍.油氣層神經(jīng)網(wǎng)絡(luò)識別方法研究[D].大慶:大慶石油學(xué)院,2003. [13]楊福成,光興毅,張放東,等.錫林好來地區(qū)復(fù)雜儲層測井綜合識別及應(yīng)用[J].斷塊油氣田,2013,20(2):268-272. [14]楊思通,孫建孟,馬建海,等.低孔低滲儲層測錄井資料油氣識別方法[J].石油與天然氣地質(zhì),2007,28(3):407-412. [15]孫娜.遼河油田灘海地區(qū)油氣層識別及評價方法[J].斷塊油氣田,2007,14(5):85-87. [16]姚美蘭,王超,蔣恒豐,等.利用常規(guī)測井資料定性識別凝析油氣層[J].油氣田地面工程,2013,32(1):22-24. [17]李漢林,連承波,馬士坤,等.基于氣測資料的儲層含油氣性識別方法[J].中國石油大學(xué)學(xué)報:自然科學(xué)版,2006,30(4):21-23. [18]徐向陽.新疆塔北低阻油氣層錄井識別方法[J].海洋地質(zhì)動態(tài),2009,25(5):33-36. [19]王俊駿,桂志先,謝曉慶,等.蘇里格氣田儲層識別敏感參數(shù)分析及應(yīng)用[J].斷塊油氣田,2013,20(2):175-177. [20]朱江華,李海波,潘豐.基于遺傳算法和模糊粗糙集的知識約簡[J].計算機仿真,2007,24(1):86-89.1.4 決策規(guī)則的評價
2 儲層識別方法
2.1 識別模型的構(gòu)建思路
2.2 儲層的評價判別
3 實例應(yīng)用
3.1 數(shù)據(jù)離散化
3.2 儲層識別規(guī)則
3.3 模型預(yù)測準(zhǔn)確性分析
4 結(jié)束語