陸智卿, 李忠偉
(中國石油大學(xué)(華東) 計算機與通信工程學(xué)院,青島 266580)
沉積相是油氣儲層研究的基礎(chǔ),對預(yù)測砂體分布及儲層物性差異具有指導(dǎo)意義。單井相分析是沉積相研究的關(guān)鍵環(huán)節(jié)之一,而利用巖心標(biāo)定的典型測井相識別沉積微相是單井相分析的最常用方法。但是依靠人工識別測井相并解釋沉積微相,存在兩個問題:①工作量大;②對研究人員的經(jīng)驗要求高,結(jié)果的主觀性強。
筆者以辮狀河三角洲為例,將本體和語義識別的方法應(yīng)用于測井相識別及沉積微相解釋,探討基于本體信息量的單井辮狀河三角洲沉積微相語義識別方法,建立沉積微相的自動解釋方法,在東海凹陷X氣田的辮狀河三角洲沉積中實驗驗證應(yīng)用,取得了良好效果,從而驗證方法的有效性。
隨著沉積學(xué)和巖相古地理學(xué)的發(fā)展,沉積相研究也不斷完善,形成了一套成熟的沉積相劃分體系。該體系按照“相-亞相-微相”劃分三個不同的級次。辮狀河三角洲可細(xì)分為三個亞相:①辮狀河三角洲平原;②辮狀河三角洲前緣;③前辮狀河三角洲亞相[1-2]。辮狀河三角洲的沉積物較粗,砂和含礫砂為主,砂/泥比高,通常大于1。辮狀河三角洲平原主要發(fā)育辮狀河道和泛濫平原。辮狀河道主要發(fā)育砂巖,也常見礫巖或含礫砂巖。辮狀河道內(nèi)部往往發(fā)育多個砂壩及其復(fù)合體。辮狀河三角洲前緣與正常三角洲一樣,水下分流河道活躍,其沉積物在前緣亞相中往往占總量的90%以上。前三角洲沉積物一般粒度較細(xì),以泥質(zhì)沉積物為主。
巖性和測井曲線是地下儲層沉積相研究中最常用的資料[3]。其中巖性信息主要來自于巖心和巖屑錄井等,包含了反映沉積環(huán)境及其產(chǎn)物的最直接信息,包括顏色、粒度、結(jié)構(gòu)等信息[4-5]。在利用測井信息進(jìn)行沉積相研究中,測井相發(fā)揮著重要的作用,在常用自然伽馬、電阻率、自然電位等測井曲線上,不同的沉積體及其組合被模式化為幾種典型的形態(tài)類型,也就是所謂的“測井相”,這些典型的曲線形態(tài)類型包括箱形、鐘形、漏斗形、齒形、指形、復(fù)合形以及直線形等[6]。在區(qū)域沉積相背景和巖心分析的基礎(chǔ)上,利用常見的巖石粒度和自然伽馬、電阻率及自然電位等測井曲線形態(tài)可以確定沉積相類型[7]。在辮狀河三角洲中,三角洲前緣亞相的水下分流河道沉積微相,巖性往往以砂巖為主,而且電阻率、自然伽馬和自然電位的曲線形態(tài)以箱形與鐘形的復(fù)合形態(tài)為主,在沉積環(huán)境背景確定的基礎(chǔ)上,通過巖性和測井相可以直接識別沉積微相類型。
在實際單井沉積相劃分工作中,前面所述的巖性信息以及三種常用曲線常存在資料不齊全或者某一項特征不典型的情況,尤其是在沉積相自動識別中,制約了沉積相識別結(jié)果的可靠性。另外,在實際測井工作中,每種測井方法的成本代價都不低,不可能對每口井測量使用每一種測井技術(shù)。通過缺項實驗(實際作用是降維),可以實現(xiàn)減少對單井的一種測井方法的測量,從而節(jié)約實際工程中的成本。所以,筆者提出一種基于本體信息量的單井辮狀河三角洲沉積微相語義推理方法。首先,根據(jù)辮狀河三角洲相劃分體系以及上述特征,建立辮狀河三角洲相本體。在此基礎(chǔ)上,將每種沉積微相的上述四項特征依次計算概率、信息量,得到每種微相的四維信息量矢量。最后,在缺項實驗中,通過設(shè)計的語義距離公式,得到沉積相語義推理結(jié)果。該方法提供了一種單井沉積相自動識別的有效途徑。
本體是一種能在語義和知識層次上描述信息系統(tǒng)的概念模型建模工具[8]。OWL2 Web本體語言于2009年10月成為一項W3C(World Wide Web Consortium)的推薦標(biāo)準(zhǔn)。通過本體的無歧義性(用特定的形式化語言對本體模型進(jìn)行描述),使機器和用戶都能達(dá)到統(tǒng)一的理解[9]。
領(lǐng)域本體是用于描述指定領(lǐng)域知識的一種專門本體[10]。它明確了領(lǐng)域內(nèi)共同認(rèn)可的概念術(shù)語,利用領(lǐng)域知識的語義模型表達(dá)了概念含義,并在內(nèi)部層次當(dāng)中規(guī)定了這些概念之間的關(guān)系,為知識獲取以及表示奠定了基礎(chǔ)。領(lǐng)域本體是一個五元組,記作O={C,A,R,I,M}[11]。其中,C是概念集,指特定領(lǐng)域中屬于概念的集合;A是屬性集,主要用來表現(xiàn)概念自身的特征;R是關(guān)系,指領(lǐng)域中概念間的相互作用;I為實例集;M是實例與概念之間的映射關(guān)系集合。
辮狀河三角洲相本體是包含辮狀河三角洲相在識別分類的總結(jié)與知識的經(jīng)驗性模型。在沉積相本體中,C即是各種沉積微相,A為包括巖性和測井響應(yīng)特征的在內(nèi)各種屬性,R即為各種沉積相之間的關(guān)系集合,I為實際油氣田中的劃分的地層或沉積相,M為I集合中各類劃分的地層的巖性和測井響應(yīng)參數(shù)。
根據(jù)斯坦福大學(xué)開發(fā)的七步法[12],利用Protégé工具,結(jié)合沉積相領(lǐng)域知識和知識體系的特點,構(gòu)建辮狀河三角洲相本體。實現(xiàn)過程如下:
1)確定辮狀河三角洲相本體的知識范疇,劃分出一個能夠清楚表達(dá)和解釋沉積相內(nèi)各類現(xiàn)象與專業(yè)術(shù)語的知識范圍。
2)根據(jù)相關(guān)搜索與考查,沒有可以復(fù)用的現(xiàn)有的辮狀河三角洲相本體。
3)列出沉積相中的重要術(shù)語,主要包括:相、相標(biāo)志、沉積類型、沉積巖類型以及各類測井方法和特征。
4)定義各類相和相之間的等級體系,采用目前公認(rèn)度最高的“相-亞相-微相”三級體系。首先,以辮狀河三角洲相為相級別的沉積相類型。其次,根據(jù)地形相對位置,劃分前三角洲亞相、三角洲平原亞相和三角洲前緣亞相,建立亞相級別的沉積相類型。最后,建立對應(yīng)亞相下所有可能存在的微相級別的沉積相類型。如圖1所示,本體中辮狀河三角洲前緣亞相下的席狀砂微相、水下分流河道、水下分流間灣、遠(yuǎn)砂壩和河口壩。其中,箭頭代表分屬關(guān)系。
5)定義沉積相的屬性,包括巖性特征,測井響應(yīng)特征(自然伽馬、電阻率、自然電位)等。
圖1 辮狀河三角洲相及其亞相微相
6)定義屬性之間的關(guān)系和分面,各個特征之間的相互獨立,且規(guī)定屬性特征取值范圍。
7)加入實例,將實際油田中已知劃分好的沉積相實例加入到辮狀河三角洲相本體。
語義識別是以事物的描述邏輯為基礎(chǔ),根據(jù)事物相關(guān)屬性特征以及之間的關(guān)聯(lián)規(guī)則,得到事物的判斷結(jié)果即分類結(jié)果的一個過程。其中,語義相似度和語義距離是主要的衡量標(biāo)準(zhǔn)。語義相似度表示相同真實對象或想法的兩個文本表達(dá)式之間的相似度[13]。語義相似度和語義距離之間成反比關(guān)系:兩個概念的語義距離越大,其相似度越低;反之,兩個概念的語義距離越小,其相似度越大。
目前,基于本體的語義相似度計算方法主要劃分為3類:①基于結(jié)構(gòu)距離的計算方法;②基于內(nèi)容的計算方法;③基于屬性的計算方法[14-16]。其中,基于結(jié)構(gòu)距離的計算方法的基本思想是通過兩個概念在本體樹狀分類體系中的路徑長度量化它們之間的語義距離,從而得到相似度?;趦?nèi)容的計算方法的基本思想是如果兩個概念詞共享的信息越多,兩者之間的語義相似度也越大;反之,共享的信息越少,相似度也越小?;趯傩缘挠嬎惴椒ǖ幕舅枷胧鞘挛镏g的關(guān)聯(lián)程度與其所具有的公共屬性數(shù)相關(guān)。事物由其屬性特征反映其本身,人們用以辨識或區(qū)分該事物的標(biāo)志就是屬性特征。對于兩個被比較概念而言,公共屬性項越多,相似度越大[17]。
筆者提出的基于本體信息量的語義識別方法是上述方法的結(jié)合,其基本思想是根據(jù)每個結(jié)點上對應(yīng)相同屬性特征里的內(nèi)容,統(tǒng)計概率,進(jìn)而,引入信息量公式[18,19],計算其信息量,用信息量代表其屬性,通過語義距離公式得到語義相似度。同樣,語義距離越小,代表相似度越大。相似度最大的沉積相類型即為語義識別的分類結(jié)果[20-21]。
這里提出的語義識別方法分為四個個步驟:
1)根據(jù)之前對沉積特征的描述,巖石粒度可劃分為礫、砂、粉砂和泥四個級別,自然伽馬、電阻率和自然電位曲線形態(tài)有箱形、鐘形和漏斗形等共七種形狀。建立的辮狀河三角洲相本體中包含每種沉積相所對應(yīng)的巖性特征和測井響應(yīng)特征。因此,結(jié)合沉積相本體,統(tǒng)計實際油田數(shù)據(jù)中每種形狀和粒度級別在每個屬性特征中出現(xiàn)的頻率,得到相應(yīng)的出現(xiàn)概率Pi(i=1,2,3,4),其中,i代表用到的四種特征。
2)由信息量公式可知,事件發(fā)生的概率可以轉(zhuǎn)換為該事件含有的信息量,并且一個事件發(fā)生的概率越小,代表其信息量越大。因此,將所得到的概率Pi代入信息量公式,得到每種形狀和粒度級別所對應(yīng)的信息量Ii(i=1,2,3,4),公式中a為底數(shù),通常取為自然數(shù)e。
Ii=-loga(Pi)i=1,2,3,4
(1)
3)用得到的信息量Ii代替沉積特征,結(jié)合辮狀河三角洲相本體,進(jìn)而,每種沉積相得到一個以信息量為坐標(biāo)的四維向量So={I1,I2,I3,I4}。在計算兩個沉積相向量之間的語義相似度時,比如Sp={Ip1,Ip2,Ip3,Ip4}和Sp={Iq1,Iq2,Iq3,Iq4},將其帶入語義距離計算公式(2),從而,得到兩者之間的語義距離Lw。公式中k為語義參數(shù),通常k取為0.5。該公式在語義識別測試數(shù)據(jù)時,取Sp為未知的測試數(shù)據(jù)相,依次將該未知相的四維向量Sp與已知沉積微相類型相的四維向量Sp帶入語義距離公式(2)。
(2)
逐次計算,依次得到該未知相與每種沉積微相之間的語義距離Lw,其中語義距離最小者,即語義相似度最大者,即為最終的語義識別的沉積相類型。
為了驗證方法和本體模型的有效性,取東海凹陷X氣田的砂質(zhì)辮狀河三角洲的相關(guān)巖性和測井?dāng)?shù)據(jù),對提出的沉積微相語義識別方法,進(jìn)行缺項實驗驗證和交叉缺項實驗驗證。
實驗所用的數(shù)據(jù)是該氣田花崗組地層中約700 m長度,共4口井的巖性和測井相關(guān)數(shù)據(jù)。經(jīng)過專家和工作人員的勘探分析,對這些數(shù)據(jù)進(jìn)行了沉積相類型劃分。其中,主要以辮狀河三角洲前緣亞相下的各種水下沉積微相為主,詳細(xì)統(tǒng)計見表1。其中,數(shù)字代表該種微相在每口井中出現(xiàn)的次數(shù),總共101條數(shù)據(jù)。
根據(jù)語義識別方法的前兩步,統(tǒng)計頻率,得到概率Pi(i=1,2,3,4),計算信息量Ii(i=1,2,3,4),可以得到四種特征出現(xiàn)頻率、概率和信息量表,見表2。在此基礎(chǔ)上,結(jié)合建立的辮狀河三角洲相本體,進(jìn)行第三步,得到辮狀河三角洲前緣亞相下的所有存在的沉積微相的四維信息量向量,見表3。在此基礎(chǔ)上,進(jìn)行缺項實驗驗證。缺項實驗是指隨機在上述101條數(shù)據(jù)中抽取一條,作為測試相So。隨機將So的一個沉積特征設(shè)為未知,比如,將自然伽馬曲線形態(tài)設(shè)為未知,即得到一條測試數(shù)據(jù)So={I1,未知,I3,I4}。將So與表3中的各種沉積微相類型Si(i=a,b,c,d,e)依次通過語義距離公式,計算語義距離Lw,取語義距離最小者,即作為語義識別的沉積相類型結(jié)果。
TOP-1代表著方法計算出分?jǐn)?shù)最高的對象A是實際所需要對象的概率統(tǒng)計,是一種準(zhǔn)確率。在本文中,準(zhǔn)確率來自于缺項驗證實驗。取已有地質(zhì)認(rèn)識的沉積相的巖性和測井響應(yīng)數(shù)據(jù),每組數(shù)據(jù)都對應(yīng)一個沉積微相類型。以該劃分的沉積相結(jié)果作為正確的標(biāo)簽。然后,每組數(shù)據(jù)中隨機丟棄一個特征,通過文中提出的語義識別方法,得到與每種沉積微相之間的語義距離。默認(rèn)語義距離最小的沉積微相為得到的TOP-1結(jié)果,默認(rèn)語義距離最小和第二小的沉積微相為得到的TOP-2結(jié)果。圖2展示了一條測試相So={砂,箱形,未知,箱形}與辮狀河三角洲前緣亞相下各個微相之間的語義距離。由圖可知,席狀砂沉積微相為TOP-1結(jié)果,水下分流
表1 實驗數(shù)據(jù)統(tǒng)計表
表2 沉積特征出現(xiàn)頻率、概率與信息量表
表3三角洲前緣微相的四維信息量表
Tab. 3 Four-dimensional information scale table of delta front microfacies
沉積微相類型巖性GRSPRS水下分流間灣0.9260.9020.9260.902水下分流河道0.5210.7440.7440.765席狀砂0.5210.9260.9020.765遠(yuǎn)砂壩0.9262.0480.7650.765河口壩0.5212.0482.0482.130
河道沉積微相與席狀砂沉積微相為TOP-2結(jié)果。
在上述基礎(chǔ)上,遍歷101條數(shù)據(jù),進(jìn)行缺項實驗驗證。最終,語義識別TOP-1準(zhǔn)確率為91.1%,語義識別TOP-2準(zhǔn)確率為100%。
圖2 測試相So與各種沉積微相之間的語義距離
表4 交叉驗證與交叉缺項驗證準(zhǔn)確率結(jié)果表
圖3 部分實驗驗證結(jié)果
為了進(jìn)一步證明語義推理方法的有效性,在上述實驗數(shù)據(jù)上進(jìn)行交叉驗證和交叉缺項驗證。由于數(shù)據(jù)取自同一地層且長度規(guī)格一致。所以交叉驗證時,采用3口井的數(shù)據(jù),通過語義識別方法,結(jié)合辮狀河三角洲本體,得到三角洲前緣亞相下各種沉積微相的四維信息量向量。然后去語義識別預(yù)測另一口井的沉積微相類型。
在此基礎(chǔ)上,進(jìn)行交叉缺項驗證,任意在測試井?dāng)?shù)據(jù)中取So為測試相,隨機將一個沉積特征設(shè)為未知,即得到測試數(shù)據(jù)So。通過語義距離計算公式,計算So與每個沉積相之間的語義距離Lw,取距離最小者,即相似度最大者,即推理結(jié)果。重復(fù)上述驗證過程,部分實驗結(jié)果如圖3所示。
經(jīng)交叉驗證和交叉缺項驗證的沉積相語義推理分類預(yù)測實驗,實驗結(jié)果準(zhǔn)確率如表4所示。由表4中結(jié)果分析可知,在4維特征都知道的情況下,交叉驗證的語義識別預(yù)測結(jié)果為100%,也就是說每個特征結(jié)點的信息量都沒有丟失,從而證明了用4維信息量向量表示某一種沉積微相類型是可行的。然后,進(jìn)一步的交叉缺項驗證實驗的平均準(zhǔn)確率為83.3%。
但是存在某一口井準(zhǔn)確率波動較大的情況。可能的原因是,整體語義識別實驗環(huán)境和條件是一致的。在一個工區(qū)的沉積環(huán)境可能由于短時間內(nèi)發(fā)生沉積過程突變(地震、泥石流等),導(dǎo)致在某一小塊橫向區(qū)域內(nèi)同一深度區(qū)段內(nèi)測井響應(yīng)特征上發(fā)生突變,從而影響了某一口井的語義推理預(yù)測準(zhǔn)確率。
筆者針對單井辮狀河三角洲環(huán)境下的沉積微相識別問題,尤其是測井資料不完整(缺少一項特征)情況下的識別問題,利用本體和語義距離計算的相關(guān)技術(shù),并將兩者結(jié)合,提出了基于本體信息量的單井辮狀河三角洲沉積微相語義識別方法。經(jīng)過缺項實驗驗證,識別結(jié)果與已有的地質(zhì)認(rèn)識的對比準(zhǔn)確率為91.1%,交叉缺項實驗驗證的平均準(zhǔn)確率為83.3%,基本滿足單井沉積相研究工作中的需要,方便且較為準(zhǔn)確的為相關(guān)研究人員提供一定的參考。
在適用性方面上,該方法對同一地層下發(fā)育比較穩(wěn)定且單一沉積體系下的沉積微相識別效果較好。在應(yīng)用該方法時,仿照本文對辮狀河三角洲的實驗為例,只需對所研究的數(shù)據(jù),劃分出合適的分類體系,進(jìn)而建立相對應(yīng)的本體,最終進(jìn)行沉積相語義識別工作。對于多種沉積相與亞相頻繁更換的情況,該方法具有一定的局限性??傊摴ぷ鳛檫M(jìn)一步的連井沉積相研究打下基礎(chǔ),對實際地質(zhì)勘探與研究有一定的意義。