安 林,韓保山,李 鵬,2,代振華,3,王新苗
(1.中煤科工集團(tuán)西安研究院有限公司,陜西 西安 710077;2.西安科技大學(xué) 地質(zhì)與環(huán)境學(xué)院,陜西 西安 710054;3.煤炭科學(xué)研究總院,北京 100013)
煤礦智能化、少人化是實現(xiàn)煤礦安全的重要途徑之一。目前,煤礦智能化建設(shè)的新高潮正在全國興起[1-2]。煤礦智能化經(jīng)歷可視遠(yuǎn)程干預(yù)、工作面自動找直、基于透明工作面智能割煤、全智能化自適應(yīng)開采4 個階段[3-4],目前正處于透明工作面智能割煤技術(shù)關(guān)鍵階段。透明工作面智能割煤技術(shù)通過三維地震、井巷和鉆孔測量等探測手段獲取工作面的實際展布情況,在分析上述數(shù)據(jù)后,利用不同的插值算法建立工作面模型,進(jìn)而指導(dǎo)采煤機(jī)開采工作[5]。在三維地質(zhì)建模過程中,采樣數(shù)據(jù)是工作面建模的基礎(chǔ),插值是工作面模型實現(xiàn)的必經(jīng)途徑。采樣數(shù)據(jù)量的大小和插值算法在不同程度上影響工作面模型的精確度,定量研究工作面模型精確度影響因素將對插值算法優(yōu)選和采樣數(shù)據(jù)獲取量提供重要的參考價值。
空間插值是一種通過這些離散的空間采樣數(shù)據(jù)計算未知空間數(shù)據(jù)的方法[6-7],目前常用的空間插值方法有函數(shù)插值[8]、克里金插值[9-11]和光滑離散插值(Discrete Smooth Interpolation,DSI)。由于地質(zhì)信息的不確定性,函數(shù)插值算法在地學(xué)模擬上鮮有應(yīng)用。而克里金算法較為符合地學(xué)規(guī)律,因此,目前運用于地學(xué)建模軟件的插值多以克里金插值算法為主。DSI 插值算法[12-13]是依賴于網(wǎng)格節(jié)點的拓?fù)潢P(guān)系,不以空間坐標(biāo)為參數(shù),是一個無維數(shù)的插值方法,能夠很好地解決逆斷層、陷落柱等多Z(同一位置具有多個Z值)的插值問題,但實現(xiàn)難度較大,鮮有應(yīng)用。目前,行業(yè)內(nèi)對于地質(zhì)模型精確性主要集中在插值算法對模型精確度的影響研究[13-14],因而存在著數(shù)據(jù)量越大模型越精確的共識,但鮮有人定量研究數(shù)據(jù)量對于模型精度的影響。
筆者在收集工作面探測資料的基礎(chǔ)上,通過交叉驗證的方法,計算函數(shù)插值、DSI 插值、克里金插值平均絕對誤差和均方根誤差,對比分析不同插值算法對模型精度的影響。為分析數(shù)據(jù)量大小對模型精度的影響,提出了相對間距誤差。通過計算1%~90%數(shù)據(jù)量的相對間距誤差,得到數(shù)據(jù)量大小與相對間距誤差之間的關(guān)系,從而為不同網(wǎng)格間距下最低采樣數(shù)據(jù)量提供參考。
透明工作面建模[15-16]主要包括3 個部分:實測數(shù)據(jù)獲取、地質(zhì)資料分析、地質(zhì)模型建立。首先,通過巷道實測、地面鉆孔、本煤層鉆孔、孔中雷達(dá)、三維地震、槽波探測等方法獲取實測數(shù)據(jù)。然后根據(jù)工作面的沉積條件、構(gòu)造起伏等地質(zhì)條件分析工作面內(nèi)是否存在地質(zhì)異常。最后在實測數(shù)據(jù)導(dǎo)入和地質(zhì)分析的基礎(chǔ)上,通過插值計算,建立工作面透明模型。
1) 函數(shù)插值算法
函數(shù)插值的基本原理是:假定區(qū)間[a,b]上的實值函數(shù)f(x) 在該區(qū)間上n+1 個互不相同點x0,x1,···,xn處的值是f(x0),f(x1),···,f(xn),要求估算f(x)在[a,b]中某點x*的值。基本思路是:找到一個函數(shù)P(x),在x0,x1,···,xn的節(jié)點上與f(x)函數(shù)值相同(有時,甚至一階導(dǎo)數(shù)值也相同),用P(x*)的值作為函數(shù)f(x*)的近似。比如反距離加權(quán)(Inverse Distance Weighted,IDW) 插值法[17]、趨勢面法[18]、樣條函數(shù)法[19]等。
2) 克里金插值算法
克里金插值算法也稱為空間自協(xié)方差最佳插值法,它是以南非礦業(yè)工程師D.G.Krige[20]的名字命名的一種最優(yōu)內(nèi)插法,以變異函數(shù)理論和結(jié)構(gòu)分析為基礎(chǔ),適用于區(qū)域化變量存在空間相關(guān)性。假設(shè)存在空間相關(guān)性且所有隨機(jī)誤差都具有二階平穩(wěn)性。其表達(dá)式為:
3) DSI 插值算法
DSI 插值算法是法國南錫大學(xué)J.L.Mallet 教授[12-13]提出的。通過對一個離散化的自然體模型,建立相互之間聯(lián)絡(luò)的網(wǎng)絡(luò),如果網(wǎng)絡(luò)上的點的值滿足某種約束條件,則未知結(jié)點的值可以通過解一個線性方程組得到。該方法依賴于網(wǎng)格節(jié)點間的拓?fù)潢P(guān)系,不以空間坐標(biāo)為參數(shù),是一個無維數(shù)的插值方法。
針對網(wǎng)格節(jié)點上φ值的估計問題,DSI 插值算法建立了計算網(wǎng)格節(jié)點φ最優(yōu)解目標(biāo)函數(shù):
式中:R(φ)為 全局粗糙度函數(shù),ρ(φ)為線性約束違反度函數(shù)。
為使目標(biāo)函數(shù)R*(φ)達(dá)到最小,需要達(dá)到以下2 個條件:(1) 使全局粗糙度函數(shù)R(φ)達(dá)到最小,從而盡可能使在任意節(jié)點上的函數(shù)值逼近該點鄰域內(nèi)節(jié)點的均值,即使每個節(jié)點的φ值盡可能平滑。(2) 將原始采樣數(shù)據(jù)轉(zhuǎn)化成定義在一些節(jié)點上的線性約束,使線性約束的違反度ρ(φ)達(dá)到最小,即使線性約束符合程度達(dá)到最大,從而使相關(guān)節(jié)點的φ值盡可能逼近采樣數(shù)據(jù)。
本次研究通過采用交叉驗證[20]的方法來評價插值方法的優(yōu)劣。該方法首先假設(shè)某些值未知,用周圍站點的實測數(shù)據(jù)通過空間插值來估算該待估點的值,輪流變換待估點,如此反復(fù)之后,得出與實測值一一對應(yīng)的值。將實測值和預(yù)測值的均方根誤差(ERMS)、平均絕對誤差(EMA)作為結(jié)果的檢驗標(biāo)準(zhǔn)[21-22],EMA可以估算預(yù)測值可能的誤差范圍,ERMS可以反映利用樣點數(shù)據(jù)的估值靈敏度和極值效應(yīng)。因此,通過計算平均絕對誤差和均方根誤差,可為基于模型精度的插值算法優(yōu)選提供參考。
式中:ERMS為均方根誤差,EMA為平均絕對誤差,xi為第i個點的預(yù)測值,yi為第i個點的實測值,n為檢驗點的個數(shù)。
工作面模型要求精度較高,網(wǎng)格大小要求厘米級甚至毫米級。在這種情況下,對網(wǎng)格上全部點進(jìn)行采樣,進(jìn)而分析數(shù)據(jù)量的大小對插值誤差的影響是不切實際的。因此,本文利用衛(wèi)星高程數(shù)據(jù)模擬地層高程進(jìn)行等間距取樣,以此研究數(shù)據(jù)量的大小對于模型精度的影響。
為了消除衛(wèi)星高程數(shù)據(jù)采樣密度大(通常為120、90、30 m)與實際工作面間距不匹配,難以用絕對平均誤差和均方根誤差評價模型誤差大小。因此,本文提出相對間距誤差(EWA),作為評價模型精確度的方法,用于表明在同等間距條件下,不同數(shù)據(jù)量大小對模型精度的影響。并且可以通過相對間距誤差計算工作面采樣密度下的模型誤差大小,以此為采樣數(shù)據(jù)密度和采樣數(shù)據(jù)量提供參考。
式中:L為網(wǎng)格間距。
利用全站儀獲取某工作面的平面坐標(biāo)和高程,工作面長度為800 m,每隔20 m 獲取1 個點,全站儀測量誤差為0.001 m,平均高程為838.326 m,最小高程為826.893 m,最大高程為849.142 m,共81 個數(shù)據(jù)點。
對這81 個點按順序進(jìn)行編號,依次抽取3、11、19、27、35、43、51、59、67、75 號點,將剩余的71 個高程點分別作為10 個數(shù)據(jù)組。這10 組數(shù)據(jù)利用函數(shù)插值、克里金插值和DSI 插值3 種插值算法計算得到抽出點的高程值,將3 種插值算法計算得到的估計值與實際值進(jìn)行對比。
其中,函數(shù)插值和克里金插值由surfer 軟件計算生成??死锝鸩逯捣椒ㄟx用的是簡單克里金插值,默認(rèn)插值參數(shù);函數(shù)插值選用的插值方法是多項式插值(Polynomial Regression),參數(shù)設(shè)置選用三次曲面(Cubic Surface);DSI 插值使用自編的Matlab 程序,設(shè)置各點權(quán)函數(shù)值為1。通過3 種插值算法得到各點估計值,計算結(jié)果對比如圖1 所示。
從圖1 可以發(fā)現(xiàn),通過3 種插值算法得到的估計值與實際值相差較小,這是由于采樣距離間距小,煤層起伏變化不大。為進(jìn)一步分析3 種插值算法對模型精確度的影響,按照式(3)、式(4)分別計算3 種不同插值算法的平均絕對誤差和均方根誤差,結(jié)果見表1。
圖1 不同插值算法計算結(jié)果對比Fig.1 Comparison of interpolation results of different methods
通過分析表1,可以得到:DSI 插值的平均絕對誤差EMA、均方根誤差ERMS值要小于函數(shù)插值和克里金插值,因此,DSI 插值算法的可靠性最好,獲得的插值曲線更光滑,與地層的實際情況更加相符。
表1 不同插值算法誤差計算結(jié)果Table 1 Error calculation results of different interpolation algorithms 單位:m
獲取未經(jīng)插值某地衛(wèi)星高程原始數(shù)據(jù),數(shù)據(jù)采樣密度為90 m×90 m,共206 080 個數(shù)據(jù)高程點。將上述高程數(shù)據(jù)進(jìn)行均勻采樣,獲取采樣比例分別為1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、40%、70%、90%的13 組數(shù)據(jù)。由于克里金插值算法相對DSI 插值算法更加成熟,計算量更大,而兩者誤差比較接近。因此,將13 組數(shù)據(jù)分別進(jìn)行克里金插值計算,得到與原始數(shù)據(jù)量同等大小的估算數(shù)據(jù)。
為進(jìn)一步分析數(shù)據(jù)量對模型精度的影響,按照式(5)分別計算不同采樣比例下的EWA值,得到不同采樣數(shù)據(jù)量的相對間距誤差分析圖,如圖2 所示。
圖2 不同采樣數(shù)據(jù)量的相對間距誤差分析Fig.2 Analysis of relative spacing error of different sample data volume
由圖2 和式(5)分析可知:
(1) 隨著采樣數(shù)據(jù)量的增加,模型的相對間距誤差逐漸減小。當(dāng)采樣數(shù)據(jù)量為1%時,相對間距誤差在60%以上;當(dāng)采樣數(shù)據(jù)量大于30%時,相對間距誤差降至10%以下。而且當(dāng)采樣數(shù)據(jù)量大小為1%時,如果模型網(wǎng)格密度為1 m,模型的誤差大于0.6 m。因此,可以看出采樣數(shù)據(jù)量對插值誤差的影響很大。
(2) 當(dāng)采樣數(shù)據(jù)量小于10%時,相對間距誤差下降幅度很大;但當(dāng)采樣數(shù)據(jù)量大于10%時,其下降幅度趨于平緩,因此,建議在構(gòu)建工作面模型時選取數(shù)據(jù)量大于10%。
在透明工作面實際構(gòu)建過程中,工作面模型精度對透明工作面效果具有重要的影響。插值算法和數(shù)據(jù)量大小是工作面模型精度2 個重要因素。因此,建議在透明工作面構(gòu)建過程中,一方面,宜采用DSI 插值算法;另一方面,需要提高工作面數(shù)據(jù)量,為高精度模型提供數(shù)據(jù)支撐。
插值算法的選用容易實現(xiàn),如何提高工作面數(shù)據(jù)量實現(xiàn)較為困難。根據(jù)相對間距誤差分析可知,對于300 m×1 000 m 的工作面,如果模型誤差要求為0.1 m,假設(shè)網(wǎng)格密度為1 m,所需數(shù)據(jù)量大于10%,則要選取采樣點大于30 000 個采樣點。而目前工作面兩巷的數(shù)據(jù)按照10 m 一個測量點計算,兩巷與切眼的測量數(shù)據(jù)總共為230 個點,相對于能夠達(dá)到目標(biāo)精度所需的采樣點數(shù)量,目前已有數(shù)據(jù)量低于1%,達(dá)不到目標(biāo)精度所需數(shù)據(jù)量。
因此,在構(gòu)建地質(zhì)模型過程中,必須要對模型進(jìn)行局部動態(tài)更新,提高模型局部數(shù)據(jù)量,以此提高模型精度。隨著工作面不斷回采,不斷采集切眼處的數(shù)據(jù),從而使工作面局部數(shù)據(jù)量得到增加,局部區(qū)域達(dá)到目標(biāo)所需的數(shù)據(jù)量。如圖3 所示,a 區(qū)域的單位面積內(nèi)數(shù)據(jù)量大于b 區(qū)域單位面積內(nèi)的數(shù)據(jù)量,因此,插值后a區(qū)域的模型精度大于b 區(qū)域的模型精度。即切眼處的數(shù)據(jù)量大于工作面內(nèi)部的數(shù)據(jù)量。為保證模型的精度,可以在回采過程中,不斷地補(bǔ)充切眼的數(shù)據(jù),提高局部數(shù)據(jù)量,對模型進(jìn)行更新。
圖3 工作面地質(zhì)模型采樣數(shù)據(jù)Fig.3 Schematic diagram of the sampling data of the working surface geological model
在構(gòu)建地質(zhì)模型過程中,為了采樣數(shù)據(jù)量大于10%,可以根據(jù)工作面長、寬,計算得到最佳更新距離和切眼數(shù)據(jù)采樣間距。例如,對300 m 寬的工作面(模型誤差要求為0.1 m,假設(shè)網(wǎng)格密度為10 m),距離切眼50 m 范圍內(nèi),數(shù)據(jù)總量為180 個點,采樣數(shù)據(jù)大于10%,即采樣數(shù)據(jù)大于18 個點,兩巷具有12 個數(shù)據(jù)點,因此,在切眼采樣數(shù)應(yīng)大于6 個,切眼采樣間距應(yīng)小于50 m 進(jìn)行采樣。
a.根據(jù)交叉驗證法,對比分析克里金插值算法、函數(shù)插值算法、DSI 插值算法的平均絕對誤差、均方根誤差,得到3 種插值算法的穩(wěn)定性:DSI 插值算法的可靠性最好、克里金插值算法次之,函數(shù)差值算法最差。
b.采用提出的相對間距誤差,分析采樣數(shù)據(jù)量對模型精度的影響,研究發(fā)現(xiàn):采樣數(shù)據(jù)量對插值誤差的影響較大;建議在構(gòu)建工作面模型時,采樣數(shù)據(jù)量大于總數(shù)據(jù)量的10%。這解決了透明工作面建模采樣量大的問題,滿足了透明工作面建模高精度要求。
c.在實際構(gòu)建地質(zhì)模型過程中,宜采用DSI 插值算法作為透明工作面的插值算法。同時,為了采樣數(shù)據(jù)量大于總數(shù)據(jù)量的10%,可根據(jù)工作面長、寬,采樣數(shù)據(jù)量分析得到最佳更新距離和切眼數(shù)據(jù)采樣間距,提高工作面的局部數(shù)據(jù)量,對模型進(jìn)行更新,提高模型精度。