孫 巋
(中國石油遼河油田分公司,遼寧 盤錦 124010)
近年來,在探索遼河坳陷興隆臺潛山太古界潛山內(nèi)幕油氣藏過程中,多口探井在太古界上覆的中生界層段見到良好油氣顯示,部分老井在該層試油獲得高產(chǎn)[1]。經(jīng)論證,認為興隆臺潛山是中生界和太古界組成的雙元結構復合型潛山[2],中生界發(fā)育礫巖型油氣藏,整體勘探程度較低,勘探前景廣闊。但中生界地層的發(fā)育受古地貌的控制作用明顯,橫向上地層厚度變化大,縱向上可劃分為3個巖性旋回段,儲層非均質(zhì)性較強。其中,位于中生界下部的Ⅲ段主要發(fā)育雜色花崗質(zhì)角礫巖和混合角礫巖,中部的Ⅱ段主要發(fā)育雜色砂礫巖和混合角礫巖,上部Ⅰ段巖性偏細,以砂礫巖、砂巖為主,局部地區(qū)受火山噴發(fā)活動的影響,發(fā)育基性的玄武巖及玄武質(zhì)角礫巖,零星見火山凝灰?guī)r。復雜的巖性組合對基于常規(guī)測井資料的儲層評價帶來較大困難。截至目前,該區(qū)鉆遇中生界探井及開發(fā)井共計205口,應用測井交會圖版法識別巖性工作量大并且精度偏低,無法滿足成熟探區(qū)精細勘探需求。因此,亟需建立一套滿足興隆臺中生界地層的測井巖性預測的高效方法,解決有利巖性巖相的分布識別難問題。
利用測井信息進行巖性分類的方法包括測井交會圖版法、成像測井方法及機器學習方法等。交會圖版法通過統(tǒng)計分析不同巖性之間的測井響應特征差異,提取特征參數(shù),建立二維或三維交會圖,基于圖版信息劃分不同巖性的測井參數(shù)上下限[3];在復雜巖性地區(qū),不同巖性的測井參數(shù)存在較大的重疊區(qū)域,導致交會圖版法的適用性差。利用成像測井資料識別巖性比較直觀,分辨率高,特別適用于識別儲層的微構造信息[4],但成像測井成本昂貴,在興隆臺地區(qū),僅近年的重點探井有成像測井資料,大部分老井只有常規(guī)測井資料,無法依據(jù)成像測井完成全區(qū)巖性巖相的劃分對比工作,因此,成像測井資料只能作為輔助判斷手段。針對上述問題,提出基于機器學習的自動化算法的思路,采取人工智能方法充分挖掘常規(guī)測井資料的隱含信息,低成本高效率地建立符合區(qū)域地質(zhì)特點的測井巖性識別方法。目前,機器學習算法在測井領域的應用越發(fā)廣泛[5-8],包括有監(jiān)督的機器學習算法,例如KNN算法[9-10]、支持向量機(SVM)[11-12]、決策數(shù)算法[13-14]、隨機森林算法[15-16],無監(jiān)督的K-means聚類方法[17]、圖論推理算法[18-20]等,均廣泛應用于測井巖性巖相識別與劃分、儲層分類評價等方面,并取得較好效果。
針對遼河坳陷興隆臺地區(qū)中生界儲層的地質(zhì)特點,基于KNN算法,提出一種改進后的新方法用于巖性預測。首先,在取心井巖心薄片鑒定的基礎上,建立巖石地質(zhì)分類方案,依據(jù)主要造巖礦物含量及其測井響應特征,確定測井參數(shù)可識別、同時滿足地質(zhì)評價需求的地質(zhì)-測井巖性分類方案。在此基礎上,通過測井交會圖版優(yōu)選巖性敏感參數(shù),然后基于MKNN算法,對中生界重點井巖性進行快速有效識別,明確中生界不同巖性巖相縱橫向上的分布變化規(guī)律,指導有利儲層預測工作。
興隆臺潛山中生界地層埋藏深度較深,普遍在3 800 m左右,受多期構造運動及火山噴發(fā)等地質(zhì)事件影響,巖性類型復雜,除沉積巖類外,局部地區(qū)見火山巖。目前,鉆遇中生界的205口井中,取心井有20口,巖心長度共93.9 m;開展掃描電鏡分析、X衍射全巖分析以及薄片鑒定等巖石礦物分析共432塊。
按照巖礦分析結果,將中生界地層巖性劃分為碎屑巖和火山巖兩大類,其中,碎屑巖類包括礫巖類、砂巖類及泥巖等,火山巖類包括火山熔巖和火山碎屑巖等,進一步依據(jù)礦物類型、成分含量以及結構等特征可細分為24種基本巖石類型(表1)。但依據(jù)傳統(tǒng)地質(zhì)學上的巖石分類無法與測井響應特征一一對應,測井識別十分困難,如中-粗砂巖和中-細粒砂巖的測井響應值接近,測井細分識別難度較大,可統(tǒng)一歸為砂巖類;花崗質(zhì)礫巖和花崗質(zhì)角礫巖的巖石成分類型基本一樣,測井響應變化趨勢相同,都可作為有利儲層,只是由于相帶上存在一定差異,導致巖石粒度、分選程度不同,儲層物性條件稍有差異,可將其歸為花崗質(zhì)礫巖類。同理,將混合砂礫巖和混合角礫巖歸為混合礫巖類。因此,在巖礦地質(zhì)分類的指導下,依據(jù)礦物類型接近、成因上有聯(lián)系、滿足地質(zhì)評價需求、測井響應特征類似的原則,確定地質(zhì)-測井巖性分類方案,最終將中生界地層劃分為花崗質(zhì)礫巖、混合礫巖、砂巖、泥巖、玄武巖及凝灰?guī)r等6種(表1)。由于凝灰?guī)r在研究區(qū)內(nèi)零星分布,且單層厚度較薄,不是研究區(qū)的主要巖石類型,并且凝灰?guī)r取心資料較少,用于機器學習的有效訓練樣本不足,在此次研究中暫不予考慮。
研究區(qū)主要巖石類型的典型測井響應特征如圖1所示。由圖1可知,自然伽馬曲線對泥質(zhì)含量反應敏感,泥巖的自然伽馬值往往大于100 API,泥質(zhì)砂巖的自然伽馬值一般為70~100 API,巖性相對較純的砂巖自然伽馬值一般小于80 API;花崗質(zhì)礫巖主要成分為花崗質(zhì)巖,填隙物以細碎屑為主,其自然伽馬值一般為75~100 API;混合礫巖類的主要成分中,花崗質(zhì)巖和中性火成巖含量接近,礫石間填隙物為砂質(zhì)和泥質(zhì)雜基,其自然伽馬值往往大于100 API;玄武巖是巖漿噴發(fā)到地表后冷卻凝固形成,巖石較致密,局部見杏仁氣孔構造,自然伽馬值表現(xiàn)出明顯的低值異常,在該區(qū)一般小于60 API,蝕變后會略有升高。自然電位曲線在該區(qū)適用條件一般,僅作為定性判斷泥巖段的輔助手段,無定量識別巖性標準。
由電性曲線可以看出,泥巖的電阻率最低,深側向電阻率一般小于8 Ω·m,泥質(zhì)砂巖及砂巖的深側向電阻率為6~12 Ω·m,混合礫巖的深側向電阻率通常大于50 Ω·m,花崗質(zhì)礫巖的深側向電阻率一般大于55 Ω·m;由于礫巖類裂縫比較發(fā)育,深淺側向曲線上也表現(xiàn)出明顯的泥漿低侵特征,存在一定的正幅度差;玄武巖的深側向電阻率大都為20~100 Ω·m。
由物性曲線可以看出,泥巖的中子孔隙度最大,一般大于23%,砂巖的中子孔隙度一般小于25%,花崗質(zhì)礫巖和混合礫巖的中子孔隙度較小,大部分小于10%,玄武巖的中子孔隙度為20%~30%;泥巖的聲波時差最大,一般大于262 μs/m,砂巖的聲波時差為229~328 μs/m,花崗質(zhì)礫巖、混合礫巖和玄武巖的聲波時差值較接近,一般小于80 μs/m,表現(xiàn)出相對致密的特點。
由密度曲線可以看出,研究區(qū)泥巖的密度一般小于2.30 g/cm3,砂巖的密度多數(shù)小于2.60 g/cm3;混合角礫和花崗質(zhì)角礫密度相對較高,并且較為接近,受裂縫發(fā)育情況影響,密度值范圍跨度較大,一般大于2.50 g/cm3;玄武巖的密度一般大于2.55 g/cm3。
由電成像測井圖可以看出,研究區(qū)花崗質(zhì)礫巖的高阻塊狀特征明顯,構造裂縫較發(fā)育;混合礫巖大小不一,可見微裂縫,局部殘余粒間孔發(fā)育;砂巖的巖性較細,高阻背景下見微孔;泥巖電阻值表現(xiàn)出一定的成層性,局部見波狀層理特征,反應泥質(zhì)不純的特點;玄武巖表現(xiàn)出明顯的高阻特征,局部可見微裂縫。
圖1 典型巖性測井響應特征
不同類型巖石的礦物組分、孔隙結構及流體類型導致其巖石物理性質(zhì)存在差異。測井曲線即是綜合利用巖石的聲、電、放射性等物理性質(zhì)的差異,進行地層巖性巖相的連續(xù)識別與表征[21]。因此,要實現(xiàn)測井曲線對巖性的準確識別與表征,首先要分析對比研究區(qū)主要巖石類型的巖石物理性質(zhì)差異,優(yōu)選出可定量區(qū)分巖性的測井參數(shù)。
在應用測井資料前,首先要完成巖心刻度測井的基礎工作,盡量選取有系統(tǒng)取心、巖礦分析資料及測井系列較全,能代表該區(qū)地層分布特點的重點井作為分析對象。關鍵井確定后,要完成巖心數(shù)據(jù)與測井數(shù)據(jù)的深度歸位工作,確保巖性與測井曲線特征能夠一一對應。在此基礎上,選取有取心及薄片鑒定、巖性明確的井段作為敏感參數(shù)分析的測井數(shù)據(jù)源。經(jīng)初步分析,優(yōu)選出自然伽馬(GR)、深側向電阻率(Rt)、密度(DEN)、聲波時差(AC)和補償中子(CNL)等5條測井曲線,分別作GR-Rt、GR-AC、GR-CNL、DEN-Rt、CNL-DEN、CNL-AC交會圖版(圖2)。由圖2可知,GR-Rt、GR-AC巖性區(qū)分效果較好,CNL-AC、GR-CNL效果次之,DEN-Rt、CNL-DEN效果一般。玄武巖相比其他巖性,GR值特別低,較好區(qū)分;泥巖具有高GR、低Rt、高AC的特點,區(qū)分度較高;砂巖與礫巖之間AC、Rt存在一定差異;混合礫巖和花崗質(zhì)礫巖在GR、CNL和DEN上重疊嚴重,區(qū)分效果一般;受巖礦組成成分上的差異影響,花崗質(zhì)礫巖Rt最大,混合礫巖次之,另外,混合礫巖相比花崗質(zhì)礫巖粒間充填物泥質(zhì)含量更高,AC相對大一些。據(jù)此,確定研究區(qū)典型巖性的測井敏感性參數(shù)排序由高至低依次為GR、Rt、AC、CNL、DEN。
圖2 測井參數(shù)交會圖版
KNN算法,即K最鄰近值法(K- Nearest Neighbor),該方法最早由Cover等人提出[22],經(jīng)過近50 a的發(fā)展應用,其理論算法十分成熟,在數(shù)據(jù)挖掘及機器學習方面應用廣泛[22-27]。KNN算法是一種有監(jiān)督的懶惰機器學習算法,通過遍歷已知訓練集樣本,計算測試數(shù)據(jù)與訓練樣本點屬性間的距離,找到與測試數(shù)據(jù)最近的K個樣本點,采取少數(shù)服從多數(shù)的原則確定測試數(shù)據(jù)的類別[23],因此, KNN算法在分類決策時十分依賴K值的選擇。在訓練樣本量較大并且樣本之間的差異性相對顯著時,KNN算法優(yōu)勢比較明顯,準確度非常高。然而KNN算法也存在先天不足,當樣本類別大于2時,即使K為奇數(shù),也可能出現(xiàn)投票數(shù)相同的情況,造成誤判;其次,當訓練樣本類別數(shù)量不均衡時,判別時極易傾向于數(shù)量多的樣本類型。
在興隆臺地區(qū)的測井數(shù)據(jù)中,具有巖心薄片鑒定資料、巖性分類準確的訓練樣本大都集中在重點儲層段,非儲層段及隔夾層的樣本點相對較少,樣本數(shù)據(jù)類別不均衡矛盾突出。其次,巖石的測井屬性值通常服從正態(tài)分布,不同類型巖性之間測井屬性交叉重疊面積較大,僅依靠簡單的投票原則很難給出測試樣本的準確分類。為解決該問題,提出一種基于測井屬性加權的剪切鄰近算法(MKNN)。屬性加權是指在計算測試點與樣本點之間的距離時,給距離加上權重Wi,Wi的確定與屬性類型有關,例如,根據(jù)巖性敏感參數(shù)分析結果,研究區(qū)GR對巖性最敏感,Rt、AC的識別效果要優(yōu)于CNL和DEN,因此,可以將GR權重設置為0.30,Rt、AC的權重設置為0.20,CNL和DEN的權重設置為0.15,得到最終的權重向量[GR,AC,Rt,CNL,DEN]為[0.30,0.20,0.20,0.15,0.15]。基于權重的新的距離計算公式為:
(1)
式中:Wi為不同測井屬性組成的歸一化權重向量;Di為第i個測井參數(shù)的測試點與樣本點的歸一化空間距離;f(x)為屬性加權后的歸一化距離;i為測井參數(shù)序號;n為總的測試參數(shù)個數(shù)。
從GR-AC交會圖(圖3a)可以看出,砂巖、混合礫巖和花崗質(zhì)礫巖的交叉重疊面積較大,當重疊區(qū)域內(nèi)的數(shù)據(jù)點用于訓練樣本進行KNN分類時,該部分樣本點是錯誤率的主要來源。因此,為減小算法的誤判率,提出剪切鄰近法(MKNN)。算法的主要步驟為: ①將訓練樣本集A重新分為N組,依次取其中1組作為測試樣本Ti,剩下N-1組作為新的訓練樣本集B; ②利用新的訓練樣本集B,采用基于距離加權的KNN算法對測試樣本Ti進行分類,如果分類結果與之前不同,則將其從訓練集A中剔除; ③重復步驟①和②若干次后,若訓練集樣本數(shù)量不再變化,代表剪切完成。將剪切后的樣本點作為最終的訓練集C。圖3b是剪切后的訓練集C的GR-AC交會圖。由圖3b可以看出,相比剪切前訓練集A(圖3a),剪切后的訓練樣本重疊區(qū)域明顯減小。
圖3 訓練集剪切前后GR-AC交會圖
為測試MKNN算法相比KNN算法具有的優(yōu)越性,根據(jù)巖性敏感性參數(shù)分析結果,選取mt1、mt6、mt11、mg14、mg7等5口井的GR、Rt、CNL、DEN、AC5個測井參數(shù)作為機器學習特征參數(shù)。訓練集與測試集樣本建立前,需進行測井數(shù)據(jù)預處理。由于不同井測井年代及測井系列不同,同一測井參數(shù)間存在系統(tǒng)偏差,除此之外,不同測井參數(shù)量綱及數(shù)據(jù)范圍差異巨大,會導致距離計算時,量級較大的參數(shù)權重過大,影響判斷準確率。以穩(wěn)定的泥巖段為標志層,采取歸一化方法對5口井的測井曲線進行標準化。然后,選取目的層段巖性定名準確的測井數(shù)據(jù)建立初始數(shù)據(jù)集M,共1 883個樣本點,其中,包括泥巖樣本點249個,砂巖樣本點313個,混合礫巖樣本點473個,花崗質(zhì)礫巖樣本點566個,玄武巖樣本點282個。將初始數(shù)據(jù)集M隨機打亂重排,取其中70%的樣本點作為訓練集A,剩下30%樣本點作為測試集B。對比不同K值條件下,MKNN方法和KNN方法對測試集B預測的誤差(圖4)。由圖4可知,隨著K值的增加,誤差表現(xiàn)出先快速下降,后緩慢上升的過程。相比于KNN方法,MKNN算法誤差明顯減小,并且當K=7時,MKNN方法的誤差最小為6.3%,而KNN算法在K=9時,才出現(xiàn)最小誤差(8.2%),說明MKNN方法收斂更快,在較小的K值下巖性預測準確率更高,能夠有效地提高程序運行效率。
圖4 MKNN與KNN識別誤差與K值關系
當K=7時,分巖性統(tǒng)計了540個測試樣本集的預測準確率(表2)。由表2可知,KNN算法的總體準確率為89.8%,其中,玄武巖樣本測試準確率為100.0%,樣本數(shù)量占比較少的泥巖及砂巖的測試準確率較低,分別為85.9%和84.8%,樣本數(shù)量最多的花崗質(zhì)礫巖準確率達到89.5%。相比之下,MKNN算法受樣本類型數(shù)量不均衡影響較小,總體準確率為93.7%,其中,泥巖預測準確率達到94.4%,砂巖準確率達到91.3%,花崗質(zhì)礫巖準確率達到92.6%。測試結果表明,相比KNN算法,MKNN算法受樣本不均衡及測井屬性值重疊影響較小,準確率更高,更適用于研究區(qū)的巖性預測。
表2 KNN和MKNN算法巖性預測結果對比
基于MKNN和KNN算法,對研究區(qū)13口井共計5 830個樣本點進行機器學習分類,其中,1 207個樣本點有取心或者巖心薄片資料定名結果。將機器學習分類結果與巖屑錄井、取心及巖心薄片鑒定結果對比,MKNN算法和KNN算法對巖性識別的準確率分別為88.7%和82.3%。相比于KNN算法,MKNN算法與巖屑錄井結果及測井曲線特征吻合度更高,有效地提高了研究區(qū)中生界復雜巖性的測井識別精度。以mg3X井和mg6X井為例,具體分析MKNN和KNN算法對不同巖性識別的差異。
圖5為mg3X井的預測結果。由圖5可知,在巖性發(fā)育比較穩(wěn)定、厚度相對較大時,識別效果較好。在上部3 704.0~3 716.0 m井段,巖心薄片鑒定及巖屑錄井定名為玄武巖,KNN和MKNN算法均準確識別為玄武巖;在3 716.0~3 728.0 m井段,巖心薄片鑒定及巖屑錄井定名為深色泥巖,KNN和MKNN算法也準確識別為泥巖。然而在薄層處識別效果存在一定誤差,在3 728.0~3 730.0 m井段,巖屑錄井鑒定為泥巖與粉砂巖薄互層特征,GR和Rt測井曲線也呈鋸齒狀,表現(xiàn)出典型的薄互層特點,但受測井儀器縱向分辨率的影響,GR曲線的值介于泥巖與砂巖之間,給機器學習帶來一定難度,導致KNN算法識別為泥巖,MKNN算法識別為砂巖;在3 750.0~3 751.5 m井段,錄井巖性為泥巖,KNN算法識別為砂巖,MKNN算法識別為泥巖,在3 760.0~3 762.0 m井段,錄井及薄片鑒定為花崗質(zhì)礫巖,KNN算法識別為混合礫巖,MKNN算法識別為花崗質(zhì)礫巖。
圖6為mg6X井的預測結果,mg6X井的中生界地層埋藏較深,在4 000 m左右,物性條件變差,三孔隙曲線對巖性的識別能力減弱。錄井巖性表明上部為玄武巖,中部為砂巖夾薄層泥巖,下部為花崗質(zhì)礫巖。在3 932.0~3 948.0 m井段,錄井巖性為玄武巖,KNN和MKNN算法均能準確識別。在中部泥質(zhì)砂巖、砂礫巖和泥巖互層段,KNN和MKNN算法對巖性識別的準確性存在差異,如3 968.0~3 987.0 m井段,錄井巖性為泥質(zhì)砂巖,薄片鑒定為砂巖,KNN算法僅預測出2套薄層砂巖,總計厚度為4.3 m,MKNN算法預測出3套砂巖,總計厚度為9.8 m;在4 016.0~4 060.0 m井段,巖性為花崗質(zhì)礫巖,KNN和MKNN算法識別能力相當,但在4 025.0 m附近,孔隙度曲線和GR曲線均存在一個小的尖峰變化,KNN和MKNN算法均預測為混合礫巖,與錄井巖性不一致。因此,基于MKNN算法,對興隆臺潛山的重點探井進行了巖性二次解釋,重新落實了研究區(qū)中生界的巖性分布規(guī)律:中生界Ⅲ組的礫巖主要分布于興古高潛山的東側及南部的馬古6塊附近,其次為陳古潛山的軸部,由東向西過渡為砂礫巖相;中生界Ⅱ組主要發(fā)育砂礫巖及砂巖,厚度中心位于潛山主體的興古10塊和南部的馬古3塊,北部陳古潛山巖性相對較細,以砂巖為主;針對中生界Ⅰ組的火山巖,受訓練樣本限制,此次研究只預測了玄武巖類,其厚度中心位于南部的馬古潛山北側,在興古潛山和陳古潛山局部區(qū)域也有分布。MKNN算法的應用提高了研究區(qū)測井巖性預測的效率及精度,首次明確了中生界優(yōu)勢巖性的分布特征,為儲層評價及井位部署提供了支撐依據(jù)。
圖5 mg3X井測井巖性識別結果
圖6 mg6X井測井巖性識別結果
(1) 巖性的準確識別是測井儲層分類評價的重要基礎,將興隆臺中生界地層劃分為花崗質(zhì)礫巖、混合礫巖、砂巖、泥巖、玄武巖及凝灰?guī)r等6種。通過測井參數(shù)交會圖版分析可知,GR-Rt和GR-AC圖版對中生界巖性區(qū)分度最高,CNL-AC和GR-CNL次之,DEN-Rt和CNL-DEN較差。對巖性敏感的測井參數(shù)排序依次為GR、Rt、AC、CNL和DEN。
(2) 基于測井屬性加權的剪切鄰近算法(MKNN)具有收斂快、精度高的特點,受測井樣本不均衡及屬性重疊影響較小,能夠準確地識別出中生界花崗質(zhì)礫巖、混合礫巖、砂巖、泥巖、玄武巖等5類巖性。
(3) 13口井的實際應用效果表明,MKNN算法巖性識別準確率達到88.7%,高效地解決了遼河坳陷興隆臺地區(qū)中生界復雜巖性的測井精細評價問題。
(4) MKNN算法巖性識別結果表明,興隆臺中生界優(yōu)勢巖性花崗質(zhì)礫巖和混合礫巖的厚度中心位于興古高潛山東側及南部的馬古6塊以及北部陳古潛山的軸部。Ⅱ組的砂礫巖和砂巖的厚度中心位于馬古3塊和興古10塊,陳古潛山相對減薄。