郭建宏,杜婷,張占松,肖航,秦瑞寶,余杰,王燦
(1.長(zhǎng)江大學(xué) 地球物理與石油資源學(xué)院,湖北 武漢 430100; 2.長(zhǎng)江大學(xué) 油氣資源與勘探技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430100; 3.中海油研究總院,北京 100027; 4.湖北省地質(zhì)局 水文地質(zhì)工程地質(zhì)大隊(duì),湖北 荊州 434020)
我國(guó)煤炭資源豐富且擁有廣闊的開發(fā)前景,煤層氣勘探也是近年來(lái)非常規(guī)油氣資源開發(fā)的重點(diǎn)研究方向[1-2]。煤巖煤體結(jié)構(gòu)的多樣性與復(fù)雜性一直是煤層氣資源開發(fā)的制約因素[3],不同煤體結(jié)構(gòu)對(duì)煤層的儲(chǔ)氣能力、吸附能力,物性、巖石力學(xué)性質(zhì)及后續(xù)開采中壓裂等施工方案存在較大影響[4-7],因而有效評(píng)價(jià)、預(yù)測(cè)煤體結(jié)構(gòu)對(duì)煤層氣開發(fā)尤為關(guān)鍵。
最早識(shí)別煤體結(jié)構(gòu)相對(duì)直接有效的方法有煤心編錄或井下直接判別,但煤層取心過(guò)程中由于其機(jī)械強(qiáng)度差容易破碎,取心率低,且煤井下條件受限,因而這類相對(duì)直接的方法獲得的巖心數(shù)據(jù)等資料完整度差且資料數(shù)量受限[8]。地球物理測(cè)井技術(shù)在煤體結(jié)構(gòu)識(shí)別中的應(yīng)用也一直是研究熱點(diǎn)[9],相對(duì)于利用AVO反演[10]等三維地震技術(shù)劃分煤體結(jié)構(gòu)的高成本方法,地球物理測(cè)井技術(shù)具有連續(xù)性強(qiáng)、可靠性高且性價(jià)比突出的優(yōu)勢(shì),并且已取得了較為豐碩的成果,這類方法總體可概括為三大類,分別為曲線形態(tài)分析法,定量計(jì)算法與數(shù)學(xué)統(tǒng)計(jì)法。曲線形態(tài)分類法即是早期學(xué)者利用煤層測(cè)井資料呈現(xiàn)的響應(yīng)趨勢(shì)結(jié)合取心實(shí)驗(yàn)結(jié)果,繪制圖版[11],二分類[12]等方法識(shí)別原生煤與構(gòu)造煤,取得了一定效果。定量計(jì)算法是在測(cè)井曲線形態(tài)分析法的基礎(chǔ)上,將定性與定量方法相結(jié)合,這類方法相比曲線形態(tài)分析法能提升煤體結(jié)構(gòu)識(shí)別精度,例如利用地球物理測(cè)井資料與煤巖骨架參數(shù)計(jì)算煤體結(jié)構(gòu)指數(shù)[13],以及利用電阻率與井徑測(cè)井資料響應(yīng)變化結(jié)合其他測(cè)井資料進(jìn)行煤體結(jié)構(gòu)識(shí)別[14]。也有學(xué)者分析地球物理測(cè)井資料在不同煤體結(jié)構(gòu)段的響應(yīng)差異,結(jié)合實(shí)驗(yàn)參數(shù)及響應(yīng)機(jī)理找到對(duì)應(yīng)區(qū)塊趨勢(shì),并以此為基礎(chǔ),結(jié)合公式構(gòu)建新的評(píng)價(jià)參數(shù),例如CI指數(shù)法[15]等這類方法,這類方法多以放大不同煤體結(jié)構(gòu)在測(cè)井資料響應(yīng)上的差異為主。數(shù)學(xué)統(tǒng)計(jì)法目前也被較多地引入煤層煤體結(jié)構(gòu)識(shí)別,主要包括多元回歸法與機(jī)器學(xué)習(xí)法。多元回歸法中有學(xué)者將地質(zhì)強(qiáng)度因子(GSI)引入并利用多元回歸建模以識(shí)別煤體結(jié)構(gòu)[16],或利用對(duì)應(yīng)分析技術(shù)識(shí)別多類煤體結(jié)構(gòu)[17]等,但煤層極其復(fù)雜,對(duì)應(yīng)地球物理測(cè)井資料響應(yīng)受眾多因素影響,其與煤體結(jié)構(gòu)為非線性關(guān)系。機(jī)器學(xué)習(xí)方法對(duì)非線性問(wèn)題有明顯優(yōu)勢(shì)[18],目前已有學(xué)者將機(jī)器學(xué)習(xí)應(yīng)用于煤體結(jié)構(gòu)識(shí)別中,主要使用BP神經(jīng)網(wǎng)絡(luò)法,例如將煤體結(jié)構(gòu)與聲波測(cè)井等資料構(gòu)建BP神經(jīng)網(wǎng)絡(luò)模型[19],或通過(guò)因子分析對(duì)地球物理測(cè)井資料中的曲線進(jìn)行優(yōu)選后,結(jié)合地質(zhì)強(qiáng)度因子與地球物理測(cè)井資料的BP神經(jīng)網(wǎng)絡(luò)模型[20]。
相比之下,在定性識(shí)別煤體結(jié)構(gòu)的研究中,地球物理測(cè)井資料體現(xiàn)出的規(guī)律性可適用于同煤階的多區(qū)塊,但準(zhǔn)確性相對(duì)較低;定量識(shí)別法能有效提高精度,但這一方法由于區(qū)塊間地球物理測(cè)井資料呈現(xiàn)的響應(yīng)差異難以進(jìn)行推廣,泛化性較差;數(shù)學(xué)統(tǒng)計(jì)法對(duì)樣本數(shù)據(jù)量要求相對(duì)較大,難以表征復(fù)雜變量與目標(biāo)間的非線性關(guān)系;BP神經(jīng)網(wǎng)絡(luò)在非線性逼近關(guān)系上存在優(yōu)勢(shì),但也存在對(duì)樣本需求量大、參數(shù)選擇復(fù)雜、目標(biāo)函數(shù)優(yōu)化過(guò)程繁瑣且易出現(xiàn)過(guò)擬合現(xiàn)象的缺點(diǎn)。煤層由于機(jī)械強(qiáng)度差導(dǎo)致取心率低,對(duì)應(yīng)資料數(shù)量少,結(jié)合前人利用支持向量機(jī)(Support Vector Machine,以下簡(jiǎn)稱SVM)這一對(duì)數(shù)據(jù)量要求較小的算法在煤層參數(shù)評(píng)價(jià)中取得良好的應(yīng)用效果[21],本文將SVM結(jié)合地球物理測(cè)井資料對(duì)煤體結(jié)構(gòu)進(jìn)行評(píng)價(jià)識(shí)別,并對(duì)該方法的有效性進(jìn)行評(píng)價(jià)。
煤體結(jié)構(gòu)是宏觀上對(duì)煤體構(gòu)造變形程度的一種描述方式,指的是地下煤層因構(gòu)造運(yùn)動(dòng)形成的結(jié)構(gòu)特征,是煤層各組成部分對(duì)應(yīng)的顆粒大小、形態(tài)特征及組合關(guān)系的一種表現(xiàn)。對(duì)煤體結(jié)構(gòu)的劃分國(guó)際上提出了許多標(biāo)準(zhǔn),國(guó)內(nèi)通常根據(jù)煤體結(jié)構(gòu)在宏觀上的破碎程度進(jìn)行劃分,大體上可分為原生結(jié)構(gòu)煤與構(gòu)造煤。相對(duì)原生結(jié)構(gòu)煤,構(gòu)造煤受地下地質(zhì)構(gòu)造作用,經(jīng)擠壓、摩擦、拉張、剪切及破碎,其理化性質(zhì)發(fā)生改變,構(gòu)造煤包含碎裂煤、碎粒煤及糜棱煤[22-23]。
本次研究沁水煤田柿莊北地區(qū)參數(shù)井3號(hào)煤層數(shù)據(jù),沁水煤田為石炭—二疊紀(jì)煤田,資源儲(chǔ)量豐富,開發(fā)潛力巨大[24]。沁水盆地為大型復(fù)式向斜構(gòu)造,柿莊北區(qū)塊位于沁水盆地東南部的斜坡上,地層較平緩,該區(qū)塊先后經(jīng)歷了印支期、燕山期和喜山期構(gòu)造運(yùn)動(dòng),構(gòu)造線多為 NE—NNE 走向[25]。柿莊北區(qū)3號(hào)層厚度相對(duì)較大且分布穩(wěn)定,埋深在830~1 600 m。通過(guò)對(duì)取心得到的煤樣進(jìn)行觀測(cè),得到對(duì)應(yīng)煤體結(jié)構(gòu)種類,包含原生結(jié)構(gòu)、碎裂結(jié)構(gòu),碎粒結(jié)構(gòu)及極少糜棱結(jié)構(gòu)。經(jīng)對(duì)不同煤體結(jié)構(gòu)儲(chǔ)層的孔裂隙特征及其滲透率間的關(guān)系實(shí)驗(yàn)與實(shí)際生產(chǎn)開發(fā)中得到的結(jié)果認(rèn)為,碎裂結(jié)構(gòu)煤與原生結(jié)構(gòu)煤對(duì)煤層氣產(chǎn)出相對(duì)有利[26],原生結(jié)構(gòu)煤裂隙系統(tǒng)完整,碎裂結(jié)構(gòu)煤適度的變形產(chǎn)生的裂隙系統(tǒng)對(duì)儲(chǔ)層滲透率的提供有益,而碎粒結(jié)構(gòu)煤及糜棱結(jié)構(gòu)煤破壞程度大,滲透率極低且改造工藝難度大,制約對(duì)應(yīng)煤層的產(chǎn)能提升[27]。從以上因素考慮,將煤體結(jié)構(gòu)分為Ⅰ類結(jié)構(gòu)(原生結(jié)構(gòu))、Ⅱ類結(jié)構(gòu)(碎裂結(jié)構(gòu))以及Ⅲ類結(jié)構(gòu)(碎粒結(jié)構(gòu)和糜棱結(jié)構(gòu)),其中Ⅰ類結(jié)構(gòu)煤與Ⅱ類結(jié)構(gòu)煤為有利產(chǎn)出煤,Ⅲ類結(jié)構(gòu)煤為不利產(chǎn)出煤,其特征如表1所示。
對(duì)參與研究的參數(shù)井進(jìn)行測(cè)井曲線標(biāo)準(zhǔn)化處理,結(jié)合煤層取心報(bào)告及現(xiàn)場(chǎng)圖片,提取對(duì)應(yīng)深度段地球物理測(cè)井資料響應(yīng),并對(duì)提取出的地球物理測(cè)井資料響應(yīng)進(jìn)行數(shù)據(jù)預(yù)處理,預(yù)處理內(nèi)容包括深度校正,對(duì)受擴(kuò)徑因素影響的測(cè)井系列進(jìn)行擴(kuò)徑校正,并對(duì)數(shù)據(jù)進(jìn)行清洗,主要清洗夾矸高灰段,半幅點(diǎn)等響應(yīng)值。此外,由于樣本數(shù)量不均衡,Ⅲ類結(jié)構(gòu)煤數(shù)量極少,結(jié)合取心長(zhǎng)度與測(cè)井曲線采樣間隔進(jìn)行數(shù)據(jù)擴(kuò)充,共得到不同結(jié)構(gòu)煤的測(cè)井資料響應(yīng)數(shù)據(jù)117組,其中Ⅰ類結(jié)構(gòu)煤37組,Ⅱ類結(jié)構(gòu)煤與Ⅲ類結(jié)構(gòu)煤均為40組。表2為各類煤體結(jié)構(gòu)對(duì)應(yīng)的地球物理測(cè)井資料響應(yīng)范圍,圖1為其箱線圖。
下面通過(guò)理論結(jié)合實(shí)際測(cè)井資料響應(yīng),分析不同煤體結(jié)構(gòu)與地球物理測(cè)井資料響應(yīng)間的關(guān)系。在巖性測(cè)井系列中,多使用井徑測(cè)井與自然伽馬測(cè)井識(shí)別煤體結(jié)構(gòu)。井徑測(cè)井表征的是鉆孔直徑。煤巖中煤體結(jié)構(gòu)類型存在差異,對(duì)應(yīng)裂縫體系不同,導(dǎo)致不同煤體結(jié)構(gòu)對(duì)應(yīng)煤巖段在鉆井過(guò)程中坍塌程度不一[28],理論上煤體破壞程度越高,對(duì)應(yīng)結(jié)構(gòu)相對(duì)疏松,越容易出現(xiàn)井壁垮塌導(dǎo)致井徑測(cè)井曲線響應(yīng)出現(xiàn)擴(kuò)徑現(xiàn)象,因而通過(guò)觀察井徑測(cè)井資料,響應(yīng)值越大,對(duì)應(yīng)煤體結(jié)構(gòu)破碎程度越大來(lái)區(qū)分煤巖煤體結(jié)構(gòu)[11]。但根據(jù)柿莊北區(qū)3號(hào)煤層實(shí)際測(cè)井資料響應(yīng)發(fā)現(xiàn),三類煤體結(jié)構(gòu)對(duì)應(yīng)的測(cè)井資料響應(yīng)中均出現(xiàn)明顯擴(kuò)徑現(xiàn)象。圖1b中展示的為井徑響應(yīng)范圍,鉆頭直徑為21.59 cm,發(fā)現(xiàn)三類結(jié)構(gòu)對(duì)應(yīng)的深度段均出現(xiàn)不同程度的擴(kuò)徑,且每一類結(jié)構(gòu)也存在未擴(kuò)徑段。以Ⅱ類結(jié)構(gòu)煤與Ⅲ類結(jié)構(gòu)煤為例,隨著煤體結(jié)構(gòu)破壞程度的增加,井徑擴(kuò)徑范圍僅略微增加,但Ⅰ類結(jié)構(gòu)煤變化趨勢(shì)不明顯,難以從二維角度區(qū)分,這可能是由于三類結(jié)構(gòu)煤鏡質(zhì)組含量相對(duì)較高所致,也可能與當(dāng)時(shí)煤層鉆井中井壁加固技術(shù)不成熟存在關(guān)系。
表1 柿莊北區(qū)3號(hào)煤層煤體結(jié)構(gòu)類型Table 1 Coal structure types of No.3 Coal Seam in Shizhuang north area
表2 不同煤體結(jié)構(gòu)對(duì)應(yīng)的地球物理測(cè)井資料響應(yīng)范圍Table 2 Response range of geophysical logging data corresponding to different coal structures
自然伽馬測(cè)井表征的是巖層中自然伽馬射線的強(qiáng)度,多用于計(jì)算放射性元素含量。理論上,煤巖自然放射性會(huì)由于孔、裂隙變化導(dǎo)致的放射性物質(zhì)含量改變而出現(xiàn)響應(yīng)差異,即煤巖的放射性多與泥質(zhì)含量、黏土礦物以及灰分于沉積過(guò)程中吸附的次生放射性物質(zhì)相關(guān)。煤體結(jié)構(gòu)破碎程度增大一定程度上表明構(gòu)造活動(dòng)強(qiáng)度增加,可能導(dǎo)致對(duì)應(yīng)煤巖與圍巖及其流體中的溶解物質(zhì)和沉淀物質(zhì)間的交換作用更活躍,而煤巖本身放射性低,這一現(xiàn)象會(huì)使得煤巖放射性大,對(duì)應(yīng)自然伽馬測(cè)井資料響應(yīng)值增大[14]。結(jié)合實(shí)際數(shù)據(jù)分析,如圖1a展示,三類煤體結(jié)構(gòu)隨著破壞程度增加,自然伽馬測(cè)井資料響應(yīng)值略有上升趨勢(shì),三類結(jié)構(gòu)煤的響應(yīng)范圍重合段較多,這與煤巖非均質(zhì)性密不可分,僅能從整體上得到變化趨勢(shì),且不同區(qū)塊自然伽馬測(cè)井響應(yīng)值變化趨勢(shì)不一定相同,研究區(qū)塊3號(hào)層自然伽馬測(cè)井響應(yīng)趨勢(shì)與上述理論情況不相悖。
在三孔度測(cè)井系列中,多使用補(bǔ)償密度測(cè)井資料和聲波時(shí)差測(cè)井資料判別煤體結(jié)構(gòu),補(bǔ)償中子測(cè)井資料難以用于煤體結(jié)構(gòu)識(shí)別。補(bǔ)償中子測(cè)井反映的是地層含氫指數(shù),結(jié)合其變化程度反映含水量繼而計(jì)算孔隙度。煤巖含氫元素較多,組成煤的碳?xì)浠衔锏暮瑲渲笖?shù)與水幾乎無(wú)差異[29-30],煤巖中裂隙越發(fā)育,水越容易填充,但并不會(huì)引起含氫指數(shù)的變化,結(jié)合實(shí)際數(shù)據(jù)箱線圖1d也可以發(fā)現(xiàn)三類煤體結(jié)構(gòu)對(duì)應(yīng)補(bǔ)償中子測(cè)井響應(yīng)無(wú)明顯區(qū)分度。
補(bǔ)償密度測(cè)井用于評(píng)價(jià)地層密度,這類測(cè)井資料與煤巖儲(chǔ)層孔、裂隙發(fā)育關(guān)系密切。由于煤體結(jié)構(gòu)破碎程度增大使得結(jié)構(gòu)疏松,且裂隙系統(tǒng)發(fā)育越好,水也越容易填充,且破碎程度越大的煤體結(jié)構(gòu)比表面積相對(duì)大,對(duì)氣的吸附能力更強(qiáng),均使得對(duì)應(yīng)結(jié)構(gòu)煤密度減小,因而隨著煤體結(jié)構(gòu)破壞程度增加,補(bǔ)償密度測(cè)井資料響應(yīng)多呈減小趨勢(shì)[31]。結(jié)合實(shí)際數(shù)據(jù)箱線圖1e可分析得到,實(shí)際數(shù)據(jù)變化趨勢(shì)與理論相符,但也存在數(shù)據(jù)點(diǎn)重合。
聲波時(shí)差測(cè)井資料表征的是地層剖面的巖石聲學(xué)性質(zhì)。不同種類的巖石由于各方面差異導(dǎo)致其聲波傳播速度、衰減規(guī)律與頻率特征存在較大區(qū)別,理論上,由于煤體結(jié)構(gòu)破碎程度增加,結(jié)構(gòu)相對(duì)更為疏松,聲波傳播速度減小,時(shí)差增大[12,32]。結(jié)合實(shí)際數(shù)據(jù)箱線圖1c,發(fā)現(xiàn)三類煤體結(jié)構(gòu)隨著破碎程度增加變化趨勢(shì)增大,但Ⅰ類結(jié)構(gòu)與Ⅱ類結(jié)構(gòu)重合部分較多,Ⅲ類結(jié)構(gòu)聲波時(shí)差測(cè)井資料響應(yīng)值為高值數(shù)據(jù)點(diǎn)較多,整體趨勢(shì)較復(fù)雜,這也與巖石密度、圍壓,含水量和含氣性相關(guān)。
圖1 三類煤體結(jié)構(gòu)對(duì)應(yīng)地球物理測(cè)井資料響應(yīng)值范圍Fig.1 Response range of geophysical logging data corresponding to three types of coal structure
在電阻率測(cè)井系列中,多用能反映原狀地層的深側(cè)向電阻率測(cè)井系列來(lái)識(shí)別煤體結(jié)構(gòu)。電阻率測(cè)井資料表征的是地層電阻率的變化情況。理論上有學(xué)者認(rèn)為隨著隨煤體破碎程度增加,煤巖中水分等增加,煤體中自由基濃度及小分子含量增加,其與煤巖中水分子共同作用使其導(dǎo)電性能增強(qiáng)[33],電阻率減小;但也有學(xué)者認(rèn)為隨著煤體結(jié)構(gòu)破碎程度增大,煤體比表面積增大,吸附的煤層氣更多,而煤層氣含量的增加會(huì)使得電阻率上升,且高階煤中煤巖強(qiáng)度相對(duì)大,破碎程度的增加對(duì)其裂隙結(jié)構(gòu)和含水性變化產(chǎn)生的影響可能較小,因而認(rèn)為電阻率測(cè)井曲線的變化趨勢(shì)更適用于中階煤煤體結(jié)構(gòu)識(shí)別[34]。事實(shí)上電阻率受多因素影響,響應(yīng)極為復(fù)雜,不同區(qū)塊間煤層電阻率都存在較大差異,在標(biāo)準(zhǔn)化過(guò)程中也存在人為修正因素帶來(lái)的誤差,因而不同煤體結(jié)構(gòu)的電阻率響應(yīng)值變化趨勢(shì)難以確定。結(jié)合本區(qū)塊實(shí)際數(shù)據(jù)箱線圖1f可以發(fā)現(xiàn),柿莊北區(qū)電阻率值均較高,但其中隨著煤體結(jié)構(gòu)破碎程度的增加,Ⅱ類結(jié)構(gòu)煤與Ⅲ類結(jié)構(gòu)煤出現(xiàn)了電阻率特低值,對(duì)應(yīng)取心資料中發(fā)現(xiàn)取心巖樣中存在侵入狀況,使得部分取心樣品段對(duì)應(yīng)的電阻率測(cè)井響應(yīng)值相對(duì)減小。
綜上分析,不同煤體結(jié)構(gòu)在地球物理測(cè)井資料上呈現(xiàn)出的響應(yīng)變化存在一定差異,但在煤儲(chǔ)層中,裂隙結(jié)構(gòu)與其分布特點(diǎn)、礦物質(zhì)含量、含水性及煤層氣含量等均會(huì)對(duì)測(cè)井響應(yīng)產(chǎn)生影響。結(jié)合實(shí)際數(shù)據(jù)分析發(fā)現(xiàn),不同煤體結(jié)構(gòu)在自然伽馬、補(bǔ)償密度、聲波時(shí)差、深側(cè)向電阻率及井徑測(cè)井資料上雖然存在一定趨勢(shì),但不同結(jié)構(gòu)類型煤對(duì)應(yīng)的測(cè)井資料響應(yīng)范圍重復(fù)度較大,為非線性響應(yīng)。當(dāng)實(shí)際數(shù)據(jù)響應(yīng)與理論情況下響應(yīng)差異較大時(shí),利用線性關(guān)系方法放大不同煤體結(jié)構(gòu)間測(cè)井響應(yīng)趨勢(shì)難以準(zhǔn)確判別。因而使用機(jī)器學(xué)習(xí)方法,結(jié)合高維特征空間數(shù)據(jù),建立非線性關(guān)系識(shí)別煤體結(jié)構(gòu)更為合適,由于數(shù)據(jù)樣本相對(duì)較少,使用SVM進(jìn)行分類研究。
SVM是基于統(tǒng)計(jì)學(xué)習(xí)理論發(fā)展出的一種模式識(shí)別方法,具有通用性、魯棒性,計(jì)算簡(jiǎn)單等優(yōu)點(diǎn)[35],尤其在面對(duì)小樣本、非線性以及高特征維度識(shí)別問(wèn)題中優(yōu)勢(shì)明顯,相較于BP神經(jīng)網(wǎng)絡(luò),該方法具有人為參數(shù)設(shè)置少、能找到全局最優(yōu)解的優(yōu)點(diǎn)[36]。SVM主要思想為通過(guò)建立決策面將正例與反例分隔開,本質(zhì)上是一個(gè)兩類分類器,但實(shí)際應(yīng)用中需要解決多分類問(wèn)題,因而通過(guò)分解機(jī)重構(gòu)將多分類問(wèn)題轉(zhuǎn)變至二分類問(wèn)題。針對(duì)柿莊北區(qū)3號(hào)煤層煤體結(jié)構(gòu)特點(diǎn),本文應(yīng)用SVM二分類與“一對(duì)多”分類模式解決煤體結(jié)構(gòu)識(shí)別問(wèn)題。
2.1.1 二分類
SVM通過(guò)非線性映射θ(x)將輸入向量xi映射至高維特征空間中的向量zi,并在高維空間中找到最優(yōu)超平面(圖2)。在特征空間中利用式(1)即可實(shí)現(xiàn)對(duì)變化后的線性分類[37]:
K(xi,xj)=θ(xi)·θ(xj)。
(1)
2.1.2 “一對(duì)多”分類
“一對(duì)多”分類[38],即在構(gòu)造第一類分類器時(shí)將歸屬該類的樣本標(biāo)記為正,其余所有訓(xùn)練樣本定位負(fù),得到分類器S1,隨后按上述步驟構(gòu)造其他類別分類器,按照需要得到相應(yīng)個(gè)數(shù)的分類器,后將測(cè)試數(shù)據(jù)輸入至對(duì)應(yīng)分類器,結(jié)構(gòu)如圖3所示?!耙粚?duì)多”分類應(yīng)用相對(duì)廣泛,這類方法分類速度快,不會(huì)出現(xiàn)分類重疊和錯(cuò)誤累積現(xiàn)象,但可能會(huì)出現(xiàn)不可分現(xiàn)象[39]。相對(duì)于二分類方法,此類方法需要兩個(gè)參數(shù):核函數(shù)(kernel function)與懲罰因子(C)。核函數(shù)多分為多項(xiàng)式內(nèi)積函數(shù)、RBF核函數(shù)與Sigmoid核函數(shù)。本文使用的為RBF核函數(shù),RBF核函數(shù)相對(duì)多分類問(wèn)題準(zhǔn)確率高且受控參數(shù)少,其公式為:
(2)
式中:σ為核函數(shù)參數(shù)。在實(shí)際使用中,需對(duì)核函數(shù)參數(shù)σ與懲罰因子C進(jìn)行尋值,即利用“網(wǎng)格搜索”尋值,在給定的范圍內(nèi),根據(jù)各組參數(shù)分類正確率的高低,判斷是否為最優(yōu)參數(shù),當(dāng)出現(xiàn)多組參數(shù)預(yù)測(cè)正確率均為最高時(shí),為避免泛化性能力降低,通常選取懲罰因子C最小的組。這一過(guò)程的實(shí)現(xiàn)可利用matlab工具包實(shí)現(xiàn)。
圖2 低維特征向量映射至高緯特征空間Fig.2 Mapping low dimensional feature vector to high latitude feature space
圖3 “一對(duì)多”方法結(jié)構(gòu)Fig.3 Structure diagram of “one to many” method
結(jié)合SVM原理和柿莊北區(qū)3號(hào)煤層煤體結(jié)構(gòu)類型特點(diǎn),使用兩種模式進(jìn)行煤體結(jié)構(gòu)識(shí)別分類。方法一為結(jié)合煤體結(jié)構(gòu)類型使用雙二分類模式,即是經(jīng)過(guò)兩次二分類進(jìn)行判別,其結(jié)構(gòu)圖見(jiàn)圖4a。首先利用二分類方法確定有利產(chǎn)出煤與不利產(chǎn)出煤(Ⅲ類結(jié)構(gòu)煤),在有利產(chǎn)出煤中再次使用二分類對(duì)Ⅰ類結(jié)構(gòu)煤與Ⅱ類結(jié)構(gòu)煤進(jìn)行區(qū)分。方法二為直接利用“一對(duì)多”方法對(duì)三類結(jié)構(gòu)煤進(jìn)行區(qū)分,結(jié)構(gòu)圖見(jiàn)圖4b。
圖4 煤體結(jié)構(gòu)判別流程結(jié)構(gòu)Fig.4 Flow chart of coal structure discrimination
結(jié)合柿莊北區(qū)參數(shù)井3號(hào)煤層地球物理測(cè)井資料,選取井徑、自然伽馬、補(bǔ)償密度,聲波時(shí)差與深側(cè)向電阻率這5個(gè)與煤體結(jié)構(gòu)存在相關(guān)趨勢(shì)的測(cè)井序列作為特征向量,利用SVM建立煤體結(jié)構(gòu)識(shí)別模型。為了有效評(píng)估SVM模型的有效性,利用交叉驗(yàn)證(cross validation)進(jìn)行檢測(cè)。K折(K-CV)交叉驗(yàn)證,即將原始數(shù)據(jù)分為k組,對(duì)應(yīng)每組子集均作為一次測(cè)試集,則另外k-1組子集為訓(xùn)練集,這樣共可得到k個(gè)模型,然后利用上述k個(gè)模型的測(cè)試集預(yù)測(cè)得到結(jié)果,k個(gè)誤差和平均即為k折交叉驗(yàn)證誤差。本文使用4折交叉驗(yàn)證,流程圖見(jiàn)圖5a。結(jié)合實(shí)際分類問(wèn)題,用預(yù)測(cè)正確率進(jìn)行表征。結(jié)合實(shí)際工區(qū)數(shù)據(jù),Ⅰ類結(jié)構(gòu)煤37組,Ⅱ類結(jié)構(gòu)煤與Ⅲ類結(jié)構(gòu)煤均為40組。為了保證能正確評(píng)價(jià)模型的有效性,用于最終驗(yàn)證的樣本集不參與建模。隨機(jī)選出3類煤體結(jié)構(gòu)數(shù)據(jù)各16組作為驗(yàn)證集,將剩余三類煤體結(jié)構(gòu)數(shù)據(jù)均分至4個(gè)組,除第4組Ⅰ類結(jié)構(gòu)煤相較于其他組多1個(gè)外,各組各類煤體結(jié)構(gòu)數(shù)量一致,交叉驗(yàn)證結(jié)果如圖5b所示。雙二分類模式與“一對(duì)多”分類模式交叉驗(yàn)證結(jié)果分別為78.2% 和84.1%,結(jié)果并未出現(xiàn)較大波動(dòng),交叉驗(yàn)證中測(cè)試集預(yù)測(cè)結(jié)果的錯(cuò)誤個(gè)數(shù)大多在1~2個(gè)間,由此可見(jiàn)用SVM判別煤體結(jié)果具有有效性與泛化性。
圖5 交叉驗(yàn)證流程圖與結(jié)果Fig.5 Cross validation flow chart and results
將用于交叉驗(yàn)證的所有數(shù)據(jù)作為訓(xùn)練集,對(duì)驗(yàn)證集進(jìn)行煤體結(jié)構(gòu)預(yù)測(cè)評(píng)價(jià)。結(jié)合取心結(jié)果,雙二分類模式與“一對(duì)多”分類模式的正確率分別為 83.3%與89.6%,其具體預(yù)測(cè)結(jié)果分別如混淆矩陣表3所示。
兩種模式均能對(duì)煤體結(jié)構(gòu)進(jìn)行判別,在煤樣取心中由于存在破碎煤心,煤層部分段煤體結(jié)構(gòu)未知。在對(duì)已知結(jié)構(gòu)的煤層段煤體結(jié)構(gòu)的識(shí)別結(jié)果中,“一對(duì)多”分類方式與煤心結(jié)果匹配度相對(duì)高,尤其在Ⅲ類結(jié)構(gòu)煤的識(shí)別上準(zhǔn)確率明顯較高,雙二分類模式在Ⅰ類結(jié)構(gòu)煤判別的準(zhǔn)確率來(lái)說(shuō)相對(duì)較高,三類煤體結(jié)構(gòu)識(shí)別能力相對(duì)較弱。即在實(shí)際數(shù)據(jù)驗(yàn)證中,利用SVM與常規(guī)測(cè)井?dāng)?shù)據(jù)相結(jié)合識(shí)別煤體結(jié)構(gòu)具有準(zhǔn)確性與實(shí)用性,在無(wú)其他特殊測(cè)井資料的情況下具有適用性。柿莊北區(qū)塊參數(shù)井及非參數(shù)井開采時(shí)間較早,技術(shù)與使用的測(cè)井方法相對(duì)匱乏,本文利用SVM結(jié)合常規(guī)地球物理測(cè)井資料能有效識(shí)別煤層不同類型的煤體結(jié)構(gòu),實(shí)用性較強(qiáng),且對(duì)后續(xù)區(qū)塊產(chǎn)能評(píng)價(jià)具有指導(dǎo)意義。
表3 SVM對(duì)煤體結(jié)構(gòu)識(shí)別結(jié)果Table 3 Recognition results of coal structure based on SVM
針對(duì)SVM模型在驗(yàn)證集上的表現(xiàn),“一對(duì)多”分類模式相對(duì)雙二分類模式精度更高。雙二分類模式在實(shí)現(xiàn)過(guò)程中,區(qū)分有利產(chǎn)出煤與不利產(chǎn)出煤時(shí),兩者數(shù)量存在較大差距,且第一次二分類時(shí)會(huì)產(chǎn)生誤差,使得第二次二分類時(shí)存在誤差累積。結(jié)合驗(yàn)證集結(jié)果的混淆矩陣,雙二分類模式在有利產(chǎn)出煤與不利產(chǎn)出煤的判別上存在誤差,而“一對(duì)多”分類模式未產(chǎn)生類似誤差,僅在判別有利產(chǎn)煤中兩類結(jié)構(gòu)煤存在較小誤差,就性能而言,“一對(duì)多”分類模式精度更高。
對(duì)單井整層段結(jié)果而言,誤差多來(lái)自于不同煤體結(jié)構(gòu)交會(huì)處,這取決于測(cè)井方法在縱向上的分辨率,尤其是針對(duì)厚度較小的煤體結(jié)構(gòu)段,這類誤差較為明顯。此外,煤層夾矸段對(duì)測(cè)井資料響應(yīng)的影響也會(huì)導(dǎo)致判別出現(xiàn)誤差。在實(shí)際煤巖中,大段煤層會(huì)存在泥質(zhì)夾矸,對(duì)應(yīng)測(cè)井資料會(huì)呈現(xiàn)出自然伽馬測(cè)井響應(yīng)值與補(bǔ)償密度測(cè)井響應(yīng)值為異常高值,電阻率測(cè)井資料會(huì)呈現(xiàn)減小趨勢(shì),具體趨勢(shì)變化程度取決于夾矸厚度對(duì)測(cè)井資料響應(yīng)的影響。這一異常趨勢(shì)容易導(dǎo)致判別結(jié)果出現(xiàn)偏差,這也是造成煤體結(jié)構(gòu)識(shí)別正確率下降的原因之一。
本文通過(guò)煤層取心資料,結(jié)合產(chǎn)能效益,總結(jié)了柿莊北區(qū)3號(hào)層各類煤體結(jié)構(gòu)類型,通過(guò)測(cè)井資料分析測(cè)井曲線與煤體結(jié)構(gòu)間的響應(yīng)特征,應(yīng)用SVM雙二分類模式和“一對(duì)多”分類模式有效識(shí)別各類煤體結(jié)構(gòu),并用實(shí)際井資料進(jìn)行判別,達(dá)到了煤體結(jié)構(gòu)識(shí)別的目的,并得到以下結(jié)論:
1) 柿莊北區(qū)塊3號(hào)煤層煤體結(jié)構(gòu)可分為3類,將3類煤體結(jié)構(gòu)對(duì)應(yīng)的地球物理測(cè)井資料響應(yīng)進(jìn)行分析,可以得到自然伽馬測(cè)井資料、補(bǔ)償密度測(cè)井資料、聲波時(shí)差測(cè)井資料,深側(cè)向電阻率測(cè)井資料與井經(jīng)曲線在響應(yīng)上和煤體結(jié)構(gòu)存在非線性關(guān)系。
2) 利用SVM兩種模式結(jié)合相關(guān)測(cè)井資料,可以有效識(shí)別煤體結(jié)構(gòu),交叉驗(yàn)證結(jié)果也表明這類方法具有泛化性,且“一對(duì)多”分類模式正確率高于雙二分類分類模式。
3) SVM誤差主要由測(cè)井手段分辨率的限制與夾矸段導(dǎo)致。
4) SVM兩種分類模式的樣本空間是基于常規(guī)測(cè)井資料建立的,在無(wú)其他特殊測(cè)井資料時(shí)仍具有適用性。
利用SVM結(jié)合地球物理測(cè)井資料能有效識(shí)別煤體結(jié)構(gòu),對(duì)實(shí)際生產(chǎn)開發(fā)具有指導(dǎo)意義,有廣闊的應(yīng)用前景。