李樹博,郭旭光,鄭孟林,王澤勝,劉新龍
(中國石油新疆油田分公司勘探開發(fā)研究院,新疆克拉瑪依 834000)
隨著油氣勘探的不斷深入,常規(guī)碎屑巖油氣藏已經(jīng)難以滿足現(xiàn)實(shí)需求,近十幾年來,準(zhǔn)噶爾盆地、松遼盆地、塔里木盆地等火山巖油氣勘探相繼獲得了突破,引起了石油工作者的重視。實(shí)踐證明,火山巖油氣藏勘探正逐步成為油氣產(chǎn)量、儲量新的重要增長點(diǎn)[1-3]?;鹕綆r礦物成分、結(jié)構(gòu)等取決于不同火山作用、巖漿類型和后期構(gòu)造運(yùn)動的疊加改造,其測井響應(yīng)特征規(guī)律性較差[4-5],巖性識別難度較大,解決巖性識別問題是火山巖油氣藏成功勘探的關(guān)鍵[6-7],只有在準(zhǔn)確地識別火山巖巖性的基礎(chǔ)上,才能有效地開展儲層評價研究,進(jìn)而提高勘探成功率。
傳統(tǒng)的巖性識別方法有巖屑錄井識別、鉆井取心鑒定及測井資料識別等,其中巖屑錄井識別的精度直接取決于錄井質(zhì)量,然而鉆井取心不僅很難對目標(biāo)地層做出完整的描述[9-10],成本還比較高,不能在生產(chǎn)中大規(guī)模普及應(yīng)用。測井資料種類豐富,成本低易于獲得,具備縱向連續(xù)、橫向?qū)Ρ刃詮?qiáng)的特點(diǎn)[11],因此,測井資料識別法是目前識別火山巖巖性的主要手段。由于不同測井曲線之間攜帶的巖性信息具有一定的相關(guān)性和重疊性,僅運(yùn)用常規(guī)巖性交會圖版難以對復(fù)雜巖性進(jìn)行全面而精確地識別。為了充分運(yùn)用測井資料,隨著多元數(shù)據(jù)挖掘方法的快速發(fā)展,利用聚類[12-13]、判別[14-15]和降維[16-18]等數(shù)據(jù)挖掘方法對測井資料進(jìn)行精細(xì)分析已成為識別復(fù)雜巖性的常用方法。自準(zhǔn)噶爾盆地東部西泉地區(qū)石炭系火山巖油氣藏發(fā)現(xiàn)至今,專家學(xué)者對該區(qū)域火山巖巖性識別方法的探索腳步從未停止。具有代表性的有:張麗華等[19]在巖心歸位和巖性復(fù)查的基礎(chǔ)上,利用常規(guī)測井資料,提出基于二維和三維巖性識別圖版的識別流程;馬尚偉等[20-21]采用全巖主量元素分析結(jié)合巖心、鏡下薄片和成像測井進(jìn)行巖性劃分;黃力等[22]利用主成分分析法從巖石測井響應(yīng)敏感性角度定量識別巖性。由于研究區(qū)石炭系火山巖測井響應(yīng)多解性強(qiáng),前人的成果中未能有效解決不同巖性測井響應(yīng)特征相似所帶來的識別誤差,針對未知火山巖巖性未能建立有效的定量判識方法。
本次研究充分利用巖心資料和鏡下薄片鑒定成果,確保測井響應(yīng)特征的代表性,利用主成分分析法對復(fù)雜數(shù)據(jù)進(jìn)行有效降維方面的優(yōu)點(diǎn),對目標(biāo)測井曲線進(jìn)行數(shù)據(jù)優(yōu)化,提高不同巖性之間測井響應(yīng)特征差異的敏感性,并結(jié)合典型判別函數(shù)在判別未知樣本歸屬方面的顯著優(yōu)勢,首次在研究區(qū)嘗試運(yùn)用復(fù)合數(shù)據(jù)挖掘方法識別石炭系火山巖巖性,并建立不同巖性定量判別模型,以期為研究區(qū)石炭系火山巖巖性識別提供參考依據(jù)。
西泉地區(qū)位于準(zhǔn)噶爾盆地東部隆起西翼北三臺凸起西斜坡[23-24][圖1(a)],為凸起上規(guī)模最大的近東西向鼻狀構(gòu)造[25]。北三臺凸起東接吉木薩爾凹陷、西臨阜康凹陷、南抵阜康斷裂帶,北連沙奇凸起,是自晚海西期開始發(fā)育,又歷經(jīng)印支期、燕山期和喜馬拉雅期共4 期大的構(gòu)造運(yùn)動形成的繼承性古凸起[26]。其中受海西期構(gòu)造運(yùn)動的影響,北三臺凸起在中—晚石炭世發(fā)生了大規(guī)模強(qiáng)烈火山噴發(fā)活動,形成石炭系火山巖地層;早—中二疊世受南部博格達(dá)山擠壓隆升作用,北三臺基底凸起形成,石炭系經(jīng)歷強(qiáng)烈持續(xù)性風(fēng)化-淋濾-剝蝕作用,導(dǎo)致部分中—晚石炭統(tǒng)和早—中二疊統(tǒng)缺失[26]。
根據(jù)已鉆探井資料及地震解釋成果,將西泉地區(qū)石炭系自下而上分為:下序列松喀爾蘇下亞組火山巖段(C1sa)、中序列松喀爾蘇上亞組火山沉積巖段(C1sb)和上序列巴塔瑪依內(nèi)山組火山巖段(C2b),其中C1sa主要由火山熔巖類組成,C1sb主要由火山沉積巖和沉積巖呈互層狀組成,C2b主要由火山熔巖類和火山碎屑巖類組成[圖1(b)]。自2006 年西泉1 井石炭系火山巖油藏發(fā)現(xiàn)以來,西泉地區(qū)已累計(jì)提交石炭系探明儲量近7 000 萬t,且在石炭系3 個地層序列中均有油氣發(fā)現(xiàn),展現(xiàn)了該區(qū)域石炭系火山巖廣闊的油氣勘探前景。
準(zhǔn)噶爾盆地東部西泉地區(qū)石炭系火山熔巖類、火山碎屑巖類和火山沉積巖類均有發(fā)育[27-28]。通過篩選研究區(qū)內(nèi)51 口石炭系鉆遇厚度大且連續(xù)性好的鉆井,以精細(xì)歸位校正后的266 塊巖心資料和鏡下薄片鑒定樣品為基礎(chǔ),對巖性單一、厚度較大且測井曲線穩(wěn)定性相對較好的井段進(jìn)行數(shù)據(jù)提取,如表1所列,提取出玄武巖、安山巖、英安巖、火山角礫巖、凝灰?guī)r、含角礫凝灰?guī)r、凝灰質(zhì)砂礫巖、凝灰質(zhì)泥巖和炭質(zhì)泥巖共9 種火山巖巖性的自然伽馬(GR)、地層真電阻率(Rt)、沖洗帶電阻率(Rxo)、密度測井(DEN)、中子孔隙度(CNL)和聲波時差(AC)共計(jì)6 條常規(guī)測井曲線數(shù)據(jù),并以各不同巖性測井曲線值作為主要變量進(jìn)行不同巖性樣本均值及方差的計(jì)算。安山巖和英安巖的地層真電阻率(Rt)和沖洗帶電阻率(Rxo)存在方差值極大異常,表明這2 種巖性電阻率變化較大,難以利用電阻率相關(guān)曲線有效表征巖性分布。除此之外,其余大部分巖性對應(yīng)測井曲線方差值較小,可以作為有效數(shù)據(jù)來識別巖性。
表1 西泉地區(qū)石炭系不同巖性火山巖的測井響應(yīng)值Table 1 Log response values of Carboniferous volcanic rocks with different lithologies in Xiquan area
主成分分析法的基本思想是考慮各變量指標(biāo)間的相關(guān)性,利用降維方法將參與運(yùn)算的多個變量指標(biāo)通過數(shù)學(xué)方法轉(zhuǎn)換成少數(shù)幾個互不相關(guān)的指標(biāo),且每個指標(biāo)能代表多個原始變量,從而使研究變成一種更簡單的統(tǒng)計(jì)學(xué)方法。典型判別分析法的基本思想是投影[29-32],通過建立一種線性組合,即最優(yōu)化的數(shù)學(xué)模型來概括不同變量間的差異性,同時根據(jù)已知樣本分類判斷未知待判斷的變量樣本歸屬的統(tǒng)計(jì)學(xué)方法。由于這2 種方法在數(shù)據(jù)處理和變量類型判別中的顯著優(yōu)勢,已經(jīng)在地學(xué)界得到了廣泛的運(yùn)用,尤其是在復(fù)雜巖性識別和儲層評價等方面[33-35],準(zhǔn)確性得到了提高。
假設(shè)樣本數(shù)為n,每個樣本對應(yīng)的變量數(shù)為P,得到n×p維原始樣本陣Xn×p。根據(jù)前期樣本選取的結(jié)果,建立原始數(shù)據(jù)集X560×6
(1)由于所選取的6 個變量具有量級和量綱的差異性,為了使原始變量的量級和量綱保持在同一個維度上,須對原始變量進(jìn)行標(biāo)準(zhǔn)化處理,得到新的無量綱數(shù)據(jù)序列:ZGR,ZRt,ZRxo,ZDEN,ZCNL和ZAC,其均值為0,方差為1(表2)。
表2 西泉地區(qū)石炭系不同巖性火山巖的測井響應(yīng)值(標(biāo)準(zhǔn)化后)Table 2 Log response values of Carboniferous volcanic rocks with different lithologies in Xiquan area(after standardization)
對標(biāo)準(zhǔn)化后的數(shù)據(jù)集進(jìn)行相關(guān)系數(shù)矩陣計(jì)算
式中:R為樣本相關(guān)系數(shù)矩陣;x'為樣本標(biāo)準(zhǔn)化矩陣。
根據(jù)式(2)得到研究區(qū)石炭系的變量相關(guān)系數(shù)矩陣(表3),正相關(guān)關(guān)系中ZAC與ZCNL的相關(guān)性最好,為顯著相關(guān),相關(guān)系數(shù)為0.911;負(fù)相關(guān)關(guān)系中ZAC與ZDEN的相關(guān)性最好,為顯著相關(guān),相關(guān)系數(shù)為-0.915,除此之外,ZCNL與ZDEN,ZRt與ZRxo,ZCNL,ZAC,ZGR與ZRt,ZCNL之間亦具有較好的相關(guān)關(guān)系,這表明不同參數(shù)間存在不同程度的信息重疊現(xiàn)象,這就使得在識別研究區(qū)火山巖巖性中常規(guī)雙變量交會圖版不僅無法反映出所有變量間的相關(guān)性,還存在著或多或少的信息重疊。
表3 西泉地區(qū)石炭系變量相關(guān)系數(shù)矩陣Table 3 Correlation coefficient matrix of Carboniferous variables in Xiquan area
各巖性中ZAC曲線的標(biāo)準(zhǔn)差值相對較?。▍⒁姳?),結(jié)合相關(guān)系數(shù)矩陣中各曲線的相關(guān)性,選取AC與CNL、DEN進(jìn)行三參數(shù)散點(diǎn)交會分析(圖2),巖性識別效果不理想,巖性間普遍存在邊界不清晰,巖性重疊現(xiàn)象較嚴(yán)重,所以僅通過常規(guī)交會圖版很難將巖性區(qū)分清楚。
(2)利用Jacobi 線性變換方程對相關(guān)系數(shù)矩陣進(jìn)行計(jì)算,求解該相關(guān)系數(shù)矩陣非負(fù)特征值λi(i=1,2,3,…,m)和特征向量式中:Im為單位矩陣;λi為相關(guān)系數(shù)矩陣R的非負(fù)特征值,同時也是主成分Yi(i=1,2,…,m)的方差,方差越大,說明主成分Yi包合變量x1,x2,…,xm包含信息的能力越強(qiáng)。
將λi按由大到小的順序排列,即λ1>λ2>…λm>0(表4)。
表4 特征值及方差貢獻(xiàn)率計(jì)算結(jié)果Table 4 Calculation results of eigenvalue and variance contribution rate
(3)主成分P值一般選取累計(jì)方差貢獻(xiàn)率≥80%或特征值λi>1 的前P個特征值。由表4 可知,滿足λi>1 的主成分變量為Y1和Y2,其特征值分別為4.173 和1.035,且Y1+Y2累計(jì)方差貢獻(xiàn)率為86.798%,利用Y1和Y2這2 個主成分變量可充分表征6 個原始變量所反映的大部分信息,達(dá)到了對變量降維處理的目的。主成分Y1和Y2的特征向量計(jì)算結(jié)果如表5 所列。
表5 主要特征值特征向量計(jì)算結(jié)果Table 5 Calculation results of main eigenvalue eigenvector
根據(jù)表5,得到對應(yīng)的主成分方程
利用主成分方程F1和F2所做的散點(diǎn)交會圖版識別研究區(qū)石炭系巖性(圖3),識別精度得到了有效提高,各類巖性樣本有了較為明顯的區(qū)分界線:玄武巖、安山巖、英安巖、凝灰?guī)r和炭質(zhì)泥巖巖性分布界線清晰;凝灰質(zhì)泥巖、含角礫凝灰?guī)r、凝灰質(zhì)砂礫巖和火山角礫巖也可以在交會圖版中看到一定的區(qū)分規(guī)律。與常規(guī)雙變量交會圖版中大量巖性重疊現(xiàn)象相比,主成分交會圖已經(jīng)可以進(jìn)行初步的巖性劃分,說明在西泉地區(qū)利用主成分分析有利于解決火山巖巖性各變量樣本間存在的相關(guān)性問題。
典型判別分析法是一種依據(jù)方差分析原理建立的判別方法。針對P維空間中的點(diǎn)Xi=(Xi1,Xi2,…,Xip),i=1,2,…,n通過一組線性函數(shù)將P維空間中的全部觀測點(diǎn)統(tǒng)一轉(zhuǎn)化到m維空間,然后在m維空間中對樣本集進(jìn)行分類,在此過程中采用方差分析思想,依據(jù)使組間均方差與組內(nèi)均方差之比最大的原則,選擇最優(yōu)的有效線性函數(shù)。
式中:ym(xi)為判別指標(biāo);ci為各變量的系數(shù),也稱為判別系數(shù);xij為反映研究對象特征的變量。
(1)基于前期對原始變量進(jìn)行主成分分析優(yōu)化的結(jié)果,結(jié)合典型判別分析法在根據(jù)已知樣本分類來判斷未知樣本歸屬方面的優(yōu)勢,建立判別主成分模型
式中:Gi為研究區(qū)石炭系第i種巖性的判別函數(shù);a,b,c分別為各巖性判別函數(shù)系數(shù)或常數(shù),取值如表6所列。
表6 西泉地區(qū)各巖性判別函數(shù)系數(shù)和常數(shù)Table 6 Coefficients and constants of each lithology discriminant function in Xiquan area
由式(7)得到典型判別函數(shù)特征值、方差貢獻(xiàn)率和相關(guān)性指標(biāo)(表7),其中典型判別函數(shù)1 和2特征值的累計(jì)方差貢獻(xiàn)率達(dá)到100%,說明利用典型判別函數(shù)1 和2 即可包含絕大部分變量的信息[36]。
表7 典型判別函數(shù)相關(guān)指標(biāo)Table 7 Related indicators of canonical discriminant function
(2)把主成分方程F1和F2帶入式(7),建立研究區(qū)石炭系不同巖性的判別模型
(3)用巖性判別模型對原始巖性數(shù)據(jù)進(jìn)行回判可靠性檢驗(yàn)(表8),判別模型對91.8%的原始變量進(jìn)行了正確判別,針對全部原始變量進(jìn)行交叉驗(yàn)證(交叉驗(yàn)證中,每個原始變量均由該變量之外的其他變量所屬判別模型進(jìn)行再次分類),準(zhǔn)確率達(dá)到91.4%。其中玄武巖、安山巖、英安巖、凝灰?guī)r、含角礫凝灰?guī)r、凝灰質(zhì)泥巖和炭質(zhì)泥巖的判別分析準(zhǔn)確率較高,均在89.0%以上;火山角礫巖和凝灰質(zhì)砂礫巖判別分析準(zhǔn)確率相對較低,經(jīng)交叉驗(yàn)證后準(zhǔn)確率均在70.0%以上,所有判別模型達(dá)到初步識別巖性的要求。
表8 西泉地區(qū)各巖性定量判別模型可靠性驗(yàn)證Table 8 Reliability verification of quantitative discrimination models for each lithology in Xiquan area
以準(zhǔn)噶爾盆地東部西泉地區(qū)石炭系巖性判別模型為基礎(chǔ),對主要預(yù)探井段進(jìn)行巖性識別,先對未知巖性段對應(yīng)的連續(xù)測井曲線值進(jìn)行統(tǒng)一標(biāo)準(zhǔn)化,再將每一點(diǎn)標(biāo)準(zhǔn)化曲線值帶入巖性判別模型進(jìn)行計(jì)算,根據(jù)最大相似性原則進(jìn)行比較,計(jì)算結(jié)果最大者即為該點(diǎn)所對應(yīng)判別巖性。
以研究區(qū)A 井為例(圖4),對3 275.0~3 279.0 m井段進(jìn)行巖性判斷,錄井解釋3 275.0~3 278.0 m為凝灰質(zhì)泥巖,3 278.0~3 279.0 m 為炭質(zhì)泥巖,而綜合巖性判別模型解釋3 275.0~3 275.3 m 為凝灰質(zhì)泥巖,3 275.3~3 275.8 m 為凝灰?guī)r,3 275.8~3 277.0 m為火山角礫巖,3 277.0~3 277.7 m為凝灰?guī)r,3 277.7~3 278.0 m 為凝灰質(zhì)泥巖,3 278.0~3 278.8 m 為炭質(zhì)泥巖,3 278.8~3 279.0 m 為凝灰?guī)r,綜合巖性判別模型解釋結(jié)果與微電阻率成像顯示結(jié)果吻合率更高,這說明綜合巖性判別模型解釋的火山巖巖性比錄井解釋的巖性更加精細(xì),與薄片鑒定和微電阻率成像對應(yīng)效果更好,同時通過此方法對火山巖薄互層識別也更加精確,表明該巖性識別方法在研究區(qū)具有一定的可靠性和適用性,在缺少石炭系鉆井巖心資料的深度段可以有效地進(jìn)行巖性識別。
(1)準(zhǔn)噶爾盆地東部西泉地區(qū)石炭系火山巖的類型復(fù)雜多樣,利用常規(guī)雙變量交會圖版進(jìn)行巖性識別的效果不理想,存在巖性邊界不清晰,不同巖性重疊等問題,而利用以主成分分析和典型判別分析為主的綜合數(shù)據(jù)挖掘方法既消除了不同特征測井曲線攜帶巖性信息中的相關(guān)性和重疊性,又充分綜合了更多測井曲線的信息,提高了研究區(qū)石炭系火山巖巖性識別的準(zhǔn)確性和實(shí)用性。
(2)基于主成分特征值大于1 且主成分累計(jì)方差貢獻(xiàn)率大于80%的原則,構(gòu)建出適用于準(zhǔn)噶爾盆地西泉地區(qū)火山巖巖性識別的綜合主成分變量Y1和Y2,結(jié)合典型判別分析法解釋的火山巖巖性較錄井解釋的巖性更加精細(xì),與薄片鑒定及成像測井資料的對應(yīng)效果更好,對火山巖薄互層的識別能力也有了較大程度的提高。