趙洪帥,周 文,張?zhí)鞊?,林亞?/p>
1成都理工大學(xué),四川 成都
2成都理工大學(xué),油氣藏地質(zhì)及開(kāi)發(fā)工程國(guó)家重點(diǎn)實(shí)驗(yàn)室,四川 成都
頁(yè)巖氣是指以吸附態(tài)、游離態(tài)賦存于富有機(jī)質(zhì)泥頁(yè)巖及其夾層中的非常規(guī)天然氣,伴隨近年來(lái)頁(yè)巖氣勘探開(kāi)發(fā)過(guò)程中的多個(gè)重大發(fā)現(xiàn),頁(yè)巖氣已經(jīng)在中國(guó)天然氣產(chǎn)量增長(zhǎng)中發(fā)揮舉足輕重的作用[1] [2] [3]??傆袡C(jī)碳(TOC)含量是評(píng)價(jià)烴源巖品質(zhì)和生烴潛力的重要參數(shù)之一,通過(guò)間隔取樣并進(jìn)行實(shí)驗(yàn)測(cè)試分析所獲得的TOC 含量數(shù)據(jù)較為精準(zhǔn),但是得到的實(shí)測(cè)數(shù)據(jù)為離散數(shù)據(jù),無(wú)法反映全孔或者某段目的層泥頁(yè)巖的總體特征[4]。全取心方案可以獲得連續(xù)的樣品,然而由于頁(yè)巖質(zhì)純性脆的特點(diǎn),取心的難度和成本會(huì)提高。富有機(jī)質(zhì)泥頁(yè)巖儲(chǔ)層具有典型的測(cè)井曲線特征[5],因此如何綜合連續(xù)的測(cè)井參數(shù)對(duì)TOC 含量進(jìn)行定量解釋成為當(dāng)下重要的研究方向。
我國(guó)頁(yè)巖氣勘探開(kāi)發(fā)起步較晚。在通過(guò)測(cè)井曲線線性預(yù)測(cè)總有機(jī)碳含量這方面,Passey 等人(1990) [6]利用電阻率測(cè)井曲線和聲波時(shí)差測(cè)井曲線建立了ΔlogR 法方法計(jì)算TOC。杜文鳳等(2016) [7]發(fā)現(xiàn)在煤系烴源巖中總有機(jī)碳含量測(cè)井響應(yīng)特征與自然伽馬、聲波時(shí)差、密度、電阻率和中子孔隙度相關(guān)性強(qiáng),建立TOC 含量預(yù)測(cè)模型。王祥等(2020) [8]在此基礎(chǔ)上提出一種考慮密度因素的廣義ΔlogR 法預(yù)測(cè)總有機(jī)碳含量方法。
由于頁(yè)巖氣儲(chǔ)層總有機(jī)碳含量受多種地質(zhì)因素及巖性純度和特殊礦物組分的影響,它們之間的關(guān)系可能不是單純的測(cè)井參數(shù)與TOC 的線性關(guān)系。季少聰?shù)?2018) [9]結(jié)合三維地震數(shù)據(jù)建立測(cè)井預(yù)測(cè)TOC含量與井旁道地震屬性之間的神經(jīng)網(wǎng)絡(luò)模型,計(jì)算TOC 數(shù)據(jù)體。殷梅等(2020) [4]基于貝葉斯判別建立了總有機(jī)碳含量的自動(dòng)判別分類模型。趙巒嘯等(2021) [10]在地質(zhì)導(dǎo)向約束下通過(guò)隨機(jī)森林算法生成學(xué)習(xí)網(wǎng)絡(luò)來(lái)預(yù)測(cè)總有機(jī)碳含量。
基于上述研究現(xiàn)狀,筆者同時(shí)選取了常用的三種預(yù)測(cè)方法,包括多元回歸法、ΔlogR 方法、支持向量機(jī)回歸(SVR)。在工區(qū)的目的層位進(jìn)行了應(yīng)用,并對(duì)這三種方法的預(yù)測(cè)結(jié)果進(jìn)行評(píng)比分析。
威遠(yuǎn)頁(yè)巖氣田位于四川盆地西南部,面積約1.2 × 104km2。區(qū)內(nèi)地表為侏羅~白堊系紅色地層所覆蓋,在盆地周緣廣泛出露下古生界及其以下地層,海拔在1000 m~1200 m 之間,西部為平原,中部為丘陵,海拔在300 m~600 m 之間。威遠(yuǎn)地區(qū)下志留統(tǒng)龍馬溪組地層經(jīng)歷多期構(gòu)造運(yùn)動(dòng)見(jiàn)圖1,大斷層雖然不發(fā)育,但小、微斷層數(shù)量多,利于裂縫發(fā)育帶的形成[11]。
龍馬溪組頁(yè)巖埋深1500 m~4000 m。威遠(yuǎn)地區(qū)發(fā)育一東西向的(水下)古隆起,影響該區(qū)域優(yōu)質(zhì)頁(yè)巖的厚度展布及沉積環(huán)境,進(jìn)而影響到頁(yè)巖儲(chǔ)層品質(zhì)和水平井產(chǎn)量。威遠(yuǎn)地區(qū)五峰組頁(yè)巖以深色頁(yè)巖為主,TOC 普遍含量較低(TOC < 2%)。
Figure 1. Schematic diagram of paleostructure of Longmaxi formation in the Sichuan Basin and surrounding areas圖1. 四川盆地及周緣龍馬溪組古構(gòu)造示意圖
回歸分析是通過(guò)分析判斷來(lái)確定相關(guān)變量之間內(nèi)在關(guān)系的一種統(tǒng)計(jì)方法。如果存在2 個(gè)或多個(gè)不相關(guān)自變量與因變量存在較好相關(guān)性的情況下,多元回歸分析的結(jié)果通常會(huì)優(yōu)于單個(gè)因素分析結(jié)果[12]。
該方法的基本原理是通過(guò)測(cè)井曲線與實(shí)測(cè)數(shù)據(jù)的相關(guān)性分析優(yōu)選與TOC 相關(guān)度高的測(cè)井參數(shù),將這些相關(guān)性高的獨(dú)立的測(cè)井參數(shù)進(jìn)行多元擬合,通過(guò)建立多元回歸模型來(lái)預(yù)測(cè)烴源巖中的TOC。
本文用到的常規(guī)測(cè)井曲線主要包括聲波時(shí)差(AC)、井徑(CAL)、中子(CNL)、(DEN)、(GR)、(K)、(KTH)、(PE)、(RT)、(TH)、(U)共11 條測(cè)井曲線,實(shí)驗(yàn)室對(duì)W1 井龍馬溪組279 個(gè)深度點(diǎn)的巖樣做了總有機(jī)碳含量測(cè)試分析。將實(shí)測(cè)TOC 與對(duì)應(yīng)深度下各種測(cè)井曲線做相關(guān)性分析,得到其相關(guān)系數(shù)R2見(jiàn)圖2。
Figure 2. Correlation coefficient R2 between TOC and each logging curve圖2. TOC 與各測(cè)井曲線相關(guān)系數(shù)R2
相關(guān)性是?1 和1 之間的統(tǒng)計(jì)度量,表示兩組點(diǎn)之間線性關(guān)系的強(qiáng)度。相關(guān)性為1 是一條完美的直線,而相關(guān)性為0 則表示沒(méi)有任何線性關(guān)系。從表1 中可以看出TOC 含量與鈾相關(guān)性最強(qiáng)且呈正相關(guān),相關(guān)系數(shù)為0.64,鈾含量越高,TOC 含量越高;中子孔隙度,鉀,伽馬,無(wú)鈾伽馬表現(xiàn)出與TOC 含量較好的相關(guān)性,依次為?0.62,0.61,0.54,?0.53,將相關(guān)性大于0.6 的三條測(cè)井曲線,與279 個(gè)實(shí)測(cè)樣本TOC值進(jìn)行多元回歸,得到計(jì)算TOC 的三元回歸表達(dá)式
兩式比較認(rèn)為,式(2)較式(1)多了GR,KTH 兩條與實(shí)測(cè)TOC 相關(guān)性介于0.5~0.6 的測(cè)井曲線,然而擬合效果R 僅從0.69 上升到0.72,說(shuō)明這兩條曲線對(duì)最終擬合值的影響較CNL,K,U 三條曲線相對(duì)小很多,故采用CNL,K,U 三元擬合回歸。
ΔlogR 方法由??松?Exxon)和埃索(Esso)公司研發(fā),由Passey 等提出的利用聲波時(shí)差曲線和電阻率曲線重疊來(lái)定量計(jì)算TOC 的一種方法,適用于碎屑巖和碳酸鹽巖中烴源巖的定性識(shí)別和定量計(jì)算[6]。
ΔlogR 法基本原理:將孔隙度測(cè)井曲線(一般是聲波時(shí)差曲線)與電阻率曲線疊加。利用聲波時(shí)差和電阻率對(duì)于不同巖性層段的差異響應(yīng),將兩條曲線的非烴源巖段通過(guò)調(diào)節(jié)坐標(biāo)值來(lái)使其重疊并定義此非烴源巖段為基線段。該方法假定巖性基本不變,認(rèn)為孔隙度和電阻率測(cè)井曲線僅僅是由有機(jī)質(zhì)含量改變而引起的。ΔlogR 即兩條曲線的幅度差與TOC 呈線性關(guān)系并且是成熟度(LOM)的函數(shù)。
依據(jù)Passey 等[6]提出的聲波,電阻率疊加計(jì)算ΔlogR 的數(shù)學(xué)表達(dá)式為
式中,ΔlogR 是以對(duì)數(shù)電阻率循環(huán)測(cè)量的曲線間距,R 是用測(cè)井工具測(cè)量的電阻率,單位是Ω?m,Δt 是測(cè)量傳輸?shù)穆暡〞r(shí)差,單位是微秒每英尺μs/m,Rbaseline是電阻率曲線位于非烴源巖段基線處的電阻率值,與Δtbaseline的值相一致。
依據(jù)Passey 等[6]提出的ΔlogR 從測(cè)井曲線計(jì)算富含粘土的巖石中總有機(jī)碳的經(jīng)驗(yàn)公式為
式中總有機(jī)碳含量以重量百分比計(jì)算,單位是%,LOM 是成熟度,LOM 為7 對(duì)應(yīng)傾油干酪根成熟的開(kāi)始,LOM 為12 對(duì)應(yīng)傾油干酪根過(guò)成熟的開(kāi)始。
根據(jù)威202 的實(shí)際測(cè)井?dāng)?shù)據(jù),基于該方法可以得到預(yù)測(cè)總有機(jī)碳含量的模型,根據(jù)ΔlogR 法預(yù)測(cè)得到的總有機(jī)碳含量見(jiàn)圖3。圖中紅色點(diǎn)為實(shí)測(cè)的總有機(jī)碳含量值,藍(lán)色曲線為ΔlogR 法預(yù)測(cè)模型預(yù)測(cè)的總有機(jī)碳含量值,可以看出該法可以一定程度上刻畫泥巖中總有機(jī)碳含量的縱向變化趨勢(shì),但是無(wú)法識(shí)別異常的局部極值點(diǎn)。
通過(guò)把聲波時(shí)差曲線(AC)與電阻率(RT)曲線進(jìn)行重疊,電阻率曲線為對(duì)數(shù)刻度,刻度值為0.035~350(Ω?m),聲波曲線的刻度值為200~0 μs/m,最終確定RT 基線值是8.419 Ω?m,AC 的基線值是79.647 μs/m。
Figure 3. ΔlogR method superimposes acoustic time difference curve and resistivity curve圖3. ΔlogR 法疊合聲波時(shí)差曲線和電阻率曲線圖
支持向量機(jī)(Support Vector Machine, SVM)是一種機(jī)器學(xué)習(xí)算法,最早由Vapnik 于1995 年提出。SVM的核心思想是通過(guò)使用核,隱含地將數(shù)據(jù)投射到高維特征空間,將線性算法轉(zhuǎn)化為非線性算法。SVM 遵循了完備的統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)和結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理(SRM),是一種基于和的學(xué)習(xí)方法或大間隔分類器。SVM 基于嚴(yán)格的理論基礎(chǔ),結(jié)構(gòu)簡(jiǎn)單,直觀易于理解和精確實(shí)現(xiàn),訓(xùn)練過(guò)程等于求解一個(gè)凸二次規(guī)劃問(wèn)題,僅需調(diào)節(jié)少數(shù)幾個(gè)可調(diào)參數(shù)來(lái)獲得全局最優(yōu)解,高效的優(yōu)化算法會(huì)使SVM 訓(xùn)練速度非???。
SVR 超參數(shù)包括如下。Kernel 為指定要在算法中使用的內(nèi)核類型,degree 為多項(xiàng)式核函數(shù)的次數(shù),gamma 為“rbf”的核系數(shù),coef0 為核函數(shù)中的獨(dú)立項(xiàng),C 為錯(cuò)誤術(shù)語(yǔ)的懲罰參數(shù)。本次對(duì)該模型超參數(shù)的調(diào)節(jié)使用的是“Grid Search”,針對(duì)每種可能參數(shù)的組合情況,進(jìn)行模型訓(xùn)練,然后模型評(píng)價(jià),根據(jù)評(píng)價(jià)結(jié)果,尋找取最大值時(shí)的參數(shù)取值情況。
支持向量機(jī)回歸就是使得最優(yōu)分類平面兩側(cè)的樣本到平面的總距離最小,從而實(shí)現(xiàn)輸入?yún)?shù)的擬合。支持向量回歸就是建立一個(gè)最優(yōu)分類的超平面,使得樣本分類的間隔距離能夠最大化,進(jìn)而等價(jià)為核函數(shù)的內(nèi)風(fēng)險(xiǎn)函數(shù)在式(5)最小化問(wèn)題。式中,C為懲罰參數(shù),ξ為松弛變量,ξ?是某i個(gè)松弛因子,w為空間特征中的權(quán)向量。
本文在建立支持向量機(jī)回歸模型時(shí),輸入威遠(yuǎn)區(qū)塊所有井位測(cè)井?dāng)?shù)據(jù),篩選了特征表征性強(qiáng)的測(cè)井曲線AC,CAL,CNL,DEN,GR,KTH,PE,TH,U,剔除了測(cè)井?dāng)?shù)據(jù)異常值,對(duì)所有井直接測(cè)井曲線進(jìn)行了標(biāo)準(zhǔn)化處理,測(cè)井模型的核函數(shù)為高斯核函數(shù),建立模型時(shí),隨機(jī)70%數(shù)據(jù)用以模型建立,30%數(shù)據(jù)用以模型驗(yàn)證,通過(guò)調(diào)節(jié)超參數(shù)C、gamma,使訓(xùn)練分?jǐn)?shù)(Train score)達(dá)到0.92,同時(shí)測(cè)試數(shù)據(jù)(Test score)達(dá)0.80,將此模型應(yīng)用到W1 井得到TOC 預(yù)測(cè)數(shù)據(jù)見(jiàn)圖4。
Figure 4. Effect diagram of TOC prediction by support vector regression圖4. 支持向量回歸法預(yù)測(cè)TOC 效果圖
此次研究分析了三種誤差,包括平均絕對(duì)誤差(MAE),均方根誤差(RMSE)和平均相對(duì)誤差(MRE)。根據(jù)誤差計(jì)算公式,3 類預(yù)測(cè)結(jié)果的誤差見(jiàn)表1:
Table 1. Comparison of prediction errors of three models表1. 3 種模型預(yù)測(cè)誤差比較
相比較與多元回歸法和ΔlogR 法,支持向量機(jī)回歸法的預(yù)測(cè)結(jié)果能更好的擬合實(shí)測(cè)值,預(yù)測(cè)誤差小,平均絕對(duì)誤差0.2603,均方根誤差為0.21,平均相對(duì)誤差為0.1836,說(shuō)明其測(cè)量值和真實(shí)值整體偏離最小,預(yù)測(cè)效果更好。
根據(jù)W1 井實(shí)測(cè)資料結(jié)合測(cè)井曲線,利用多元回歸法,ΔlogR 法,支持向量機(jī)回歸法計(jì)算TOC 并得到實(shí)測(cè)TOC 與計(jì)算TOC 的交會(huì)圖見(jiàn)圖5,由圖可以看出支持向量回歸的計(jì)算TOC 與實(shí)測(cè)TOC 相關(guān)性最好(R2為0.690,R 為0.8342)。
利用測(cè)井曲線,使用不同方法對(duì)總有機(jī)碳含量進(jìn)行了縱向預(yù)測(cè)對(duì)比可以看出支持向量機(jī)回歸法與實(shí)測(cè)數(shù)據(jù)有更好的匹配關(guān)系見(jiàn)圖6,說(shuō)明支持向量機(jī)法可以更為精準(zhǔn)的刻畫總有機(jī)碳含量在空間上縱向變化規(guī)律。常規(guī)測(cè)井中所反映的總有機(jī)碳含量信息可能被地層中其他信息所干擾覆蓋,使得相關(guān)性變差,然而借助支持向量回歸的數(shù)據(jù)挖掘能力對(duì)總有機(jī)碳含量進(jìn)行預(yù)測(cè),可以處理一些線性經(jīng)驗(yàn)公式對(duì)局部極值點(diǎn)估算不足的缺陷。
Figure 5. Comparison diagram of correlation R2 between TOC predicted value and measured value of three methods圖5. 三種方法TOC 預(yù)測(cè)值與實(shí)測(cè)值相關(guān)性R2 對(duì)比圖
Figure 6. Comparison of prediction results of total organic carbon content of logging data by different methods圖6. 利用不同方法進(jìn)行測(cè)井?dāng)?shù)據(jù)總有機(jī)碳含量預(yù)測(cè)的結(jié)果對(duì)比
1) 本文以威遠(yuǎn)地區(qū)測(cè)井?dāng)?shù)據(jù)和巖石地化測(cè)試數(shù)據(jù)為基礎(chǔ),使用多元回歸法,ΔlogR 法和支持向量機(jī)回歸法預(yù)測(cè)了威遠(yuǎn)地區(qū)W1 井龍馬溪組的總有機(jī)碳含量(TOC);
2) 根據(jù)三種方法做了做了預(yù)測(cè)TOC 和實(shí)測(cè)TOC 的誤差分析來(lái)評(píng)價(jià)模型性能,得到以下結(jié)論:支持向量機(jī)回歸法是這些方法中預(yù)測(cè)效果最好的方法,平均相對(duì)誤差在20%以內(nèi),能夠提高預(yù)測(cè)TOC 的精度;
3) 在進(jìn)行方法推廣時(shí),應(yīng)當(dāng)對(duì)研究區(qū)的地質(zhì)背景作足夠的調(diào)查,結(jié)合當(dāng)?shù)氐貐^(qū)經(jīng)驗(yàn)進(jìn)行參數(shù)的選取和調(diào)整,采取多種方法進(jìn)行橫向?qū)Ρ龋瑑?yōu)選合適的精度較高的方法。