楊文豪,趙軍龍,楊嘉慧,毛樊晶
(1.西安石油大學(xué)地球科學(xué)與工程學(xué)院,陜西西安 710065;2.西安石油大學(xué)陜西省油氣成藏地質(zhì)學(xué)重點(diǎn)實(shí)驗(yàn)室,陜西西安 710065)
近年來,隨著石油探勘工作的不斷深入,致密砂巖儲(chǔ)層在石油勘探中的占比逐漸增加[1]。致密砂巖儲(chǔ)層勘探開發(fā)對(duì)于我國能源安全保障十分重要,在低孔低滲砂巖儲(chǔ)層油氣勘探關(guān)鍵技術(shù)中,致密砂巖儲(chǔ)層的流體性質(zhì)識(shí)別問題顯得尤為重要。
儲(chǔ)層流體性質(zhì)識(shí)別通常借助聲波時(shí)差、電阻率測(cè)井特征等來研究[2]。而低孔低滲致密砂巖儲(chǔ)層流體性質(zhì)識(shí)別與常規(guī)儲(chǔ)層流體性質(zhì)識(shí)別有所不同[3-7],低孔低滲儲(chǔ)層流體性質(zhì)識(shí)別難度較大[8-10],常用的低孔低滲儲(chǔ)層流體性質(zhì)識(shí)別方法有電阻率特征判別法[11-13]、曲線重疊法[14-15]、參數(shù)交會(huì)圖法[16-18]、核磁共振測(cè)井法[19-21]、機(jī)器學(xué)習(xí)法等[22-23]。楊克兵等[13]采用深側(cè)向電阻率與沖洗帶電阻率的比值來識(shí)別油水層,應(yīng)用到低阻油層的識(shí)別上效果好。黃濤梅[14]利用由密度、中子、聲波曲線求取的不同孔隙度進(jìn)行重疊識(shí)別氣層效果較好。秦杰[18]采用束縛水飽和度與含水飽和度交會(huì)圖法和“無侵線”圖版法在淡水泥漿侵入條件下識(shí)別油水層,提高了吉林油區(qū)低阻油層的識(shí)別精度。梁則亮等[20]采用核磁共振測(cè)井法來研究致密砂巖儲(chǔ)層孔隙結(jié)構(gòu),并進(jìn)一步計(jì)算出儲(chǔ)層孔隙結(jié)構(gòu)評(píng)估的參數(shù),識(shí)別出研究區(qū)的有效儲(chǔ)層。秦敏等[22]在決策樹、支持向量機(jī)、隨機(jī)森林和極端梯度提升等算法的融合下,建立了一種Stacking 模型,通過交叉驗(yàn)證法對(duì)各個(gè)算法進(jìn)行迭代優(yōu)化,使模型達(dá)到最優(yōu),在應(yīng)用到高溫、高壓儲(chǔ)層流體性質(zhì)識(shí)別取得了良好效果。
隴東油田長8 致密砂巖儲(chǔ)層為目標(biāo)儲(chǔ)層,流體性質(zhì)識(shí)別難度較大。為了破解研究區(qū)長8 儲(chǔ)層流體性質(zhì)識(shí)別難題,本文在使用致密砂巖儲(chǔ)層流體性質(zhì)常規(guī)識(shí)別方法的基礎(chǔ)上,尋找合適的機(jī)器學(xué)習(xí)算法應(yīng)用于研究區(qū)流體性質(zhì)識(shí)別,通過對(duì)比優(yōu)選出適合該研究區(qū)的流體性質(zhì)識(shí)別方法。
常規(guī)儲(chǔ)層的流體性質(zhì)識(shí)別主要通過不同流體的測(cè)井曲線特征差異進(jìn)行識(shí)別,其中區(qū)分油水層主要通過電阻率測(cè)井曲線進(jìn)行識(shí)別。而低孔低滲致密砂巖儲(chǔ)層的流體測(cè)井響應(yīng)特征差異模糊,增加了流體性質(zhì)識(shí)別難度[3],研究區(qū)位于隴東油田,主力油層為長8 致密砂巖儲(chǔ)層,低孔低滲致密砂巖儲(chǔ)層流體性質(zhì)識(shí)別困難的主要原因分析如下:
(1)低孔低滲儲(chǔ)層的宏觀成因主要有巖性、泥質(zhì)含量及膠結(jié)物、砂泥巖薄互層等[4]。低孔低滲儲(chǔ)層的巖性對(duì)電阻率的影響較大,一般來說細(xì)砂巖的電阻率低于粉砂巖的電阻率,巖性不同會(huì)導(dǎo)致流體性質(zhì)識(shí)別困難[5];泥質(zhì)含量以及膠結(jié)物含量與常規(guī)儲(chǔ)層相比含量較高,泥質(zhì)含量的增多會(huì)導(dǎo)致低孔低滲儲(chǔ)層的電性發(fā)生變化,低孔低滲儲(chǔ)層的電性與含油性關(guān)系復(fù)雜,雖然利用常規(guī)的曲線特性和區(qū)域經(jīng)驗(yàn)對(duì)儲(chǔ)層流體性質(zhì)識(shí)別方面有一定效果,但針對(duì)低孔低滲儲(chǔ)層流體性質(zhì)識(shí)別效果一般[6];砂泥巖薄互層會(huì)導(dǎo)致低分辨率測(cè)井值精準(zhǔn)度降低,在砂巖段泥質(zhì)較多的情況下,測(cè)井響應(yīng)的特殊性造成油水層識(shí)別困難[7]。研究區(qū)長8 儲(chǔ)層巖性多為中、細(xì)砂巖,泥質(zhì)含量較高以及砂泥巖薄互層較多,這些因素是造成研究區(qū)流體性質(zhì)識(shí)別困難的部分原因。
(2)低孔低滲儲(chǔ)層的微觀成因受復(fù)雜孔隙結(jié)構(gòu)影響較大。低孔低滲儲(chǔ)層本身的孔隙度較小,孔隙結(jié)構(gòu)差,巖石孔隙的表面會(huì)形成更多的微孔,此外礦物溶解引起的復(fù)雜孔隙結(jié)構(gòu)也會(huì)造成流體性質(zhì)識(shí)別困難[8],復(fù)雜孔隙結(jié)構(gòu)會(huì)造成儲(chǔ)層喉道更為扭曲進(jìn)而使得在相同孔隙度條件下具有復(fù)雜孔隙結(jié)構(gòu)的水層與常規(guī)油層具有相近的電阻率,導(dǎo)致油水層難以區(qū)分。長8 致密砂巖儲(chǔ)層的巖石潤濕性也會(huì)影響地層的電阻率,一般情況下巖石潤濕性是均勻的,整個(gè)巖石表面對(duì)水或油具有均一的分子親和力,也有巖石的潤濕性是非均質(zhì)的,巖石表面的不同區(qū)域?qū)λ蛴途哂胁煌姆肿佑H和力,而長8 儲(chǔ)層巖石主要表現(xiàn)為弱親油特征,當(dāng)儲(chǔ)層的含水飽和度較低時(shí),弱油濕巖石會(huì)影響導(dǎo)電性,造成電阻率升高給流體性質(zhì)識(shí)別工作帶來較大的困難[9]。研究區(qū)長8 儲(chǔ)層的孔隙結(jié)構(gòu)較為復(fù)雜,孔隙度約為10%,屬于低孔低滲儲(chǔ)層,導(dǎo)致流體性質(zhì)識(shí)別困難。
(3)從孔隙流體性質(zhì)方面來看,低孔低滲儲(chǔ)層成因受地層水及泥漿濾液性質(zhì)的影響較大。長8 致密砂巖儲(chǔ)層的地層水礦化度大,除了在微觀上可以提高地層的導(dǎo)電能力外,也會(huì)對(duì)地層電阻率產(chǎn)生影響,地層水礦化度會(huì)隨著區(qū)域的不同存在差異,一般來說,地層水礦化度相對(duì)高的區(qū)域,地層電阻率相對(duì)較低,地層水礦化度相對(duì)低的區(qū)域,地層電阻率相對(duì)較高,由于地層水礦化度存在的區(qū)域差異影響了地層電阻率的測(cè)井響應(yīng),進(jìn)而影響流體性質(zhì)的識(shí)別,此外強(qiáng)烈的非均質(zhì)性也會(huì)增加儲(chǔ)層中束縛水含量導(dǎo)致儲(chǔ)層電阻率降低。低孔低滲儲(chǔ)層中束縛水飽和度相對(duì)較高,油氣飽和度相對(duì)較低,油層電阻率與水層電阻率的差異不大,尤其是采用淡水泥漿鉆井時(shí),由于鉆井液侵入導(dǎo)致水層電阻率升高,甚至出現(xiàn)水層電阻率高于油層、氣層的情況,從而導(dǎo)致使用圖版法識(shí)別流體性質(zhì)時(shí)界限模糊,解釋符合率下降[10]。研究區(qū)長8 儲(chǔ)層的地層水礦化度存在差異,沒有統(tǒng)一的礦化度,這一因素同樣影響到流體性質(zhì)識(shí)別問題。
綜上可知低孔低滲致密砂巖儲(chǔ)層的成因十分復(fù)雜,往往是由一種或多種因素共同作用導(dǎo)致,而不同地區(qū)或不同儲(chǔ)層類型的巖石物理特征不同,導(dǎo)致低孔低滲儲(chǔ)層的成因機(jī)理也存在差異,進(jìn)而導(dǎo)致識(shí)別低孔低滲儲(chǔ)層流體性質(zhì)時(shí)難度較大。
研究低孔低滲致密砂巖儲(chǔ)層的流體性質(zhì)識(shí)別問題較為復(fù)雜,而低孔、低滲油氣藏往往反映為低對(duì)比度特征,因此低孔低滲儲(chǔ)層流體性質(zhì)識(shí)別問題就可以視為低對(duì)比度流體性質(zhì)識(shí)別研究。
表1 對(duì)不同的流體性質(zhì)識(shí)別方法進(jìn)行了分類,并且系統(tǒng)的分析了它們的識(shí)別原理、適用條件和局限性。電阻率特征判別法與曲線重疊法使用條件較為簡(jiǎn)單,可以直接判識(shí)油水層,其中電阻率特征判別法適用于電阻率特征差異明顯的地區(qū),在低孔低滲儲(chǔ)層使用效果一般;曲線重疊法的好處是識(shí)別氣層相對(duì)容易,但需要盡量選擇巖性穩(wěn)定的井段。參數(shù)交會(huì)圖法與無侵線法的關(guān)鍵在于參數(shù)選擇,這一過程容易受到人為影響導(dǎo)致判別標(biāo)準(zhǔn)不同,此外無侵線法主要依賴于鉆井液的侵入特性,普適性不強(qiáng)。核磁共振測(cè)井法精準(zhǔn)性高,但在全區(qū)域使用該方法成本較大。模糊識(shí)別法在研究油、水層時(shí)效果較好,但是建立的油層和水層標(biāo)準(zhǔn)模型在研究區(qū)適用,應(yīng)用到其他地區(qū)還需修改模型。機(jī)器學(xué)習(xí)法的應(yīng)用前景較好,但需要基于巖石物理實(shí)驗(yàn)的數(shù)據(jù)和測(cè)井解釋方法原理進(jìn)一步學(xué)習(xí)和預(yù)測(cè)研究區(qū)儲(chǔ)層流體類型。
表1 常用流體性質(zhì)識(shí)別方法表(據(jù)文獻(xiàn)整理總結(jié))
研究區(qū)位于鄂爾多斯盆地隴東油田,長8 致密砂巖儲(chǔ)層為該區(qū)主力油層,長8 儲(chǔ)層孔隙度在10%附近分布較多,滲透率在0.5×10-3μm2附近分布較多,屬于低孔低滲儲(chǔ)層。本區(qū)流體主要分為三類:油層、油水層、水層。根據(jù)巖心分析及試油資料可知分類標(biāo)準(zhǔn)為:油層:Sw<50%、油水同層:50%<Sw<70%、水層:Sw>70%,并將三類流體分別編碼:油層為1,油水同層為2,水層為3。這里擬用電阻率特征判別法、參數(shù)交會(huì)圖法和機(jī)器學(xué)習(xí)法等開展流體性質(zhì)識(shí)別。
電阻率特征判別法是使用不同探測(cè)深度的電阻率曲線進(jìn)行比較區(qū)分出油水層。本文擬使用深感應(yīng)電阻率RILD 與中感應(yīng)電阻率RILM 進(jìn)行比較。遵循的原理是油層多為低侵特征,中感應(yīng)電阻率小于深感應(yīng)電阻率;水層多為高侵特征,中感應(yīng)電阻率大于深感應(yīng)電阻率。將深感應(yīng)電阻率與中感應(yīng)電阻率進(jìn)行比較。電阻率特征判別法識(shí)別流體性質(zhì)結(jié)果與試油結(jié)果對(duì)比見圖1,利用該區(qū)8 口井300 個(gè)數(shù)據(jù)點(diǎn)開展流體性質(zhì)識(shí)別分析,由于區(qū)分水層和含油氣層較好,無法精準(zhǔn)區(qū)分油層和油水同層,識(shí)別正確率為58%。
圖1 Y642-95 井電阻率特征判別法解釋結(jié)論圖
不同流體的測(cè)井響應(yīng)特征可以在圖版上顯示[22],能夠用于圖版法的測(cè)井信息眾多,但是建立圖版需要選擇的測(cè)井曲線以及測(cè)井曲線組合的形式需根據(jù)不同流體類型變換。本文擬使用雙孔隙度交會(huì)圖版法來判別流體性質(zhì)。含水孔隙度Φw根據(jù)阿爾奇公式利用電阻率測(cè)井?dāng)?shù)據(jù)反算得出,孔隙度Φ 由聲波測(cè)井孔隙度計(jì)算得出。
該區(qū)Y642-95 井含水孔隙度與總孔隙度交會(huì)圖見圖2,該交會(huì)圖遵循的油水層識(shí)別標(biāo)準(zhǔn)和試油結(jié)論的標(biāo)準(zhǔn)一致。從圖2 可以看出,油層主要在圖版的左上部,水層主要分布在圖版45°線附近,油水同層主要分布在水層和油層的中間部分。值得指出,圖中油層識(shí)別效果較好,但是油水同層與含水層有交會(huì)點(diǎn)重疊情況,導(dǎo)致油水同層和水層識(shí)別精度下降。該區(qū)流體性質(zhì)雙孔隙度交會(huì)圖版法識(shí)別結(jié)果與試油結(jié)果的對(duì)比(部分結(jié)果)見表2。共在該區(qū)8 口井300 個(gè)數(shù)據(jù)點(diǎn)開展識(shí)別分析,使用交會(huì)圖識(shí)別正確率為64%。
表2 雙孔隙度交會(huì)圖識(shí)別流體性質(zhì)結(jié)果(部分結(jié)果)(續(xù)表)
圖2 Y642-95 井雙孔隙度交會(huì)圖
表2 雙孔隙度交會(huì)圖識(shí)別流體性質(zhì)結(jié)果(部分結(jié)果)
由于使用電阻率特征判別法識(shí)別流體性質(zhì)時(shí)對(duì)水層識(shí)別效果較好,但無法準(zhǔn)確區(qū)分出油層和油水同層問題,使用參數(shù)交會(huì)圖版法識(shí)別流體性質(zhì)無法有效區(qū)分出水層和油水同層,而且工作量和難度都明顯上升。為了解決上述問題,快速精準(zhǔn)的完成流體性質(zhì)識(shí)別的任務(wù),需要使用到機(jī)器學(xué)習(xí)來輔助測(cè)井解釋人員完成工作。本文擬使用GBDT 梯度提升樹算法,通過學(xué)習(xí)輸入的測(cè)井曲線信息與已知流體類別間的關(guān)系來預(yù)測(cè)未知流體的類別。
3.3.1 GBDT 梯度提升樹原理 GBDT(Gradient Boosting Decision Tree)梯度提升樹是一種迭代的決策樹算法,該算法由多棵決策樹組成,將所有樹的結(jié)論累加起來的結(jié)果當(dāng)作最終答案[23]。GBDT 中的樹是回歸樹,可以用來做回歸預(yù)測(cè),經(jīng)過調(diào)整后也可以用來分類。GBDT梯度提升樹的優(yōu)勢(shì)在于計(jì)算速度快,處理數(shù)據(jù)的泛化能力和表達(dá)能力較強(qiáng),而流體性質(zhì)識(shí)別問題就需要對(duì)多種數(shù)據(jù)的分析和分類,最終綜合各種數(shù)據(jù)得出結(jié)論。本文擬使用GBDT 決策樹中的分類和回歸部分來研究流體性質(zhì)識(shí)別問題。
一個(gè)完整的決策樹學(xué)習(xí)算法包含三個(gè)主要步驟:
(1)特征的選擇:本文以測(cè)井資料中的GR、SP、AC、RILD、RILM 和Φ 為輸入特征,以1(代表油層)、2(代表油水同層)、3(代表水層)為輸出特征。輸入特征重要性分析見圖3。
圖3 輸入特征重要性分析圖
(2)決策樹的生成:GBDT 決策樹的初始狀態(tài)只有一個(gè)葉子節(jié)點(diǎn),該節(jié)點(diǎn)為所有樣本的初始預(yù)測(cè)值。
式中:F0為模型的初始狀態(tài),上述公式代表:找到一個(gè)γ,使所有樣本的Loss(損失函數(shù))最小。初始化完成后開始進(jìn)行循環(huán)過程,循環(huán)過程首要是確定樹的上限。
通過計(jì)算確定樹的上限。此處為使用m-1 棵樹的模型,計(jì)算每個(gè)樣本的殘差γim,這里樹的個(gè)數(shù)設(shè)置為100。對(duì)每個(gè)葉子節(jié)點(diǎn)j,計(jì)算γim:
在剛構(gòu)建的樹m 中,找到每個(gè)節(jié)點(diǎn)j 的輸出γim,能使該節(jié)點(diǎn)的Loss 最小。找到葉子節(jié)點(diǎn)之后通過多輪迭代,每輪迭代產(chǎn)生一個(gè)弱分類器,每個(gè)分類器在上一輪分類器的殘差基礎(chǔ)上進(jìn)行訓(xùn)練。
(3)決策樹的剪枝。決策樹的剪枝過程是自下而上的,為了將樹變得更加簡(jiǎn)單,從而使它具有更好的泛化能力,解決過度擬合問題,這一過程主要依靠Loss 損失函數(shù),通過極小化決策樹整體的損失函數(shù)來完成剪枝過程。
主要流程步驟如下:
(1)初始化GBDT 決策樹,并準(zhǔn)備由測(cè)井曲線數(shù)據(jù)和流體編碼組成的樣本訓(xùn)練集。
(2)找到葉子節(jié)點(diǎn)之后進(jìn)行多輪迭代,每次迭代過程產(chǎn)生一個(gè)弱分類器,確定出每個(gè)分類器的概率殘差。
(3)將概率殘差當(dāng)作訓(xùn)練目標(biāo),通過多次迭代的分類樹進(jìn)行樣本分類和學(xué)習(xí)。
(4)訓(xùn)練之后得到基于概率殘差的概率模型,利用該模型預(yù)測(cè)樣本集,得到所有樣本的流體分類預(yù)測(cè)值。
(5)將預(yù)測(cè)得到的流體分類值與試油結(jié)果編碼的流體分類值進(jìn)行對(duì)比,確定GBDT 決策樹算法的精度。
基于GBDT 決策樹識(shí)別流體性質(zhì)結(jié)果與試油結(jié)果對(duì)比見表3。
表3 基于GBDT 決策樹的流體性質(zhì)識(shí)別結(jié)果(部分結(jié)果)
共在該區(qū)8 口井300 個(gè)數(shù)據(jù)點(diǎn)開展識(shí)別分析,通過學(xué)習(xí)已知試油結(jié)果,經(jīng)過回歸和分類預(yù)測(cè)出流體的類型,與試油結(jié)果對(duì)比發(fā)現(xiàn)效果理想,精度可達(dá)95%。
(1)致密砂巖儲(chǔ)層流體性質(zhì)識(shí)別難度較大,從儲(chǔ)層宏觀結(jié)構(gòu)來看,容易受到巖性、泥質(zhì)含量及膠結(jié)物、砂泥巖薄互層等因素的影響;從儲(chǔ)層微觀結(jié)構(gòu)來看,復(fù)雜孔隙結(jié)構(gòu)也會(huì)造成流體性質(zhì)識(shí)別困難;從孔隙流體性質(zhì)方面來看,容易受到地層水及泥漿濾液的影響。其中主要原因?yàn)榈涂椎蜐B儲(chǔ)層的測(cè)井響應(yīng)不明顯,油水層電阻率區(qū)別度不大。
(2)常用的致密砂巖儲(chǔ)層的流體性質(zhì)識(shí)別方法有多種。電阻率特征判別法與曲線重疊法使用較為簡(jiǎn)單,參數(shù)交會(huì)圖法和無侵線法需要研究人員根據(jù)地區(qū)的不同選用合適的參數(shù),核磁共振測(cè)井法成本較高,模糊識(shí)別法和機(jī)器學(xué)習(xí)法應(yīng)用前景較好。
(3)基于GBDT 決策樹的流體性質(zhì)識(shí)別方法的準(zhǔn)確性依賴于輸入?yún)?shù)的選擇,在考慮輸入?yún)?shù)時(shí)需要參考輸入?yún)?shù)對(duì)結(jié)果的影響效果,盡可能選擇對(duì)結(jié)果影響較大的參數(shù)當(dāng)作輸入?yún)?shù)。同常規(guī)的流體性質(zhì)識(shí)別方法相比,基于GBDT 決策樹的流體性質(zhì)識(shí)別方法準(zhǔn)確率高、穩(wěn)定性好,同時(shí)考慮了低對(duì)比度油層的測(cè)井響應(yīng)特征,通過學(xué)習(xí)敏感參數(shù)的概率殘差,來對(duì)流體類別進(jìn)行預(yù)測(cè),識(shí)別結(jié)果與試油結(jié)果較為接近。