楊 峰,海 玲,劉 文,2
(1.新疆工程學(xué)院,新疆 烏魯木齊 830000;2.新疆暢森數(shù)據(jù)科技有限公司,新疆 烏魯木齊 830000)
在礦井水文地質(zhì)的災(zāi)害中,水害是當(dāng)前急需處理的問題,開采煤礦時導(dǎo)致含水層遭到破壞,水力平衡無法維持。在水壓的作用下,地下水以滴淋方式或以大量地下水的形式向巷道和開采場涌入,導(dǎo)致礦井水害的發(fā)生[1]。水害事故的發(fā)生,讓礦工的生命安全受到威脅,給礦區(qū)的環(huán)境造成了嚴(yán)重破壞,也給國家經(jīng)濟(jì)帶來了影響,導(dǎo)致后續(xù)的煤礦開采不能正常開展[2]。
隨著礦區(qū)開采工作的深入發(fā)展,水害的威脅也越來越大,因此對水文地質(zhì)大數(shù)據(jù)水害的預(yù)測是非常重要的[3]。
貝葉斯分類算法使用概率統(tǒng)計的方式對大數(shù)據(jù)進(jìn)行預(yù)測,具有結(jié)合先驗概率和后驗概率的特點,既避免了只使用先驗概率的主觀偏見,也可以對單獨(dú)使用樣本時易造成的過擬合現(xiàn)象進(jìn)行避免[4]。本文采用貝葉斯分類算法對礦井涌水量數(shù)據(jù)進(jìn)行分析[5]。
大數(shù)據(jù)不是一種固定的產(chǎn)品,所謂大數(shù)據(jù)不只是在時代變化數(shù)據(jù)增長的情況下生成的產(chǎn)物,也是如今這個充滿數(shù)據(jù)的社會化的一種現(xiàn)象。
大數(shù)據(jù)的特點在表現(xiàn)形式上具有多元,快速,價值高、海量等特點;這些特點是與以往的數(shù)據(jù)相比體現(xiàn)出來的特點,而大數(shù)據(jù)在實際上應(yīng)是具有變化性、可視化、真實性和不穩(wěn)定性。
本文針對伊犁一礦進(jìn)行相關(guān)探討,伊犁一礦的煤層存儲量巨大,僅僅12.4m就有600多億噸。據(jù)勘探資料顯示,伊犁一礦的開采條件與我國東部地區(qū)的礦區(qū)差異很大,因此面臨的水文地質(zhì)問題有很多。
在大數(shù)據(jù)社會中數(shù)據(jù)挖掘是一個關(guān)鍵技術(shù),就是從不規(guī)律、不完整的海量大數(shù)據(jù)中篩取出人們所需要的信息或規(guī)律。
根據(jù)不同類型的數(shù)據(jù)挖掘,數(shù)據(jù)挖掘的方法也不相同,數(shù)據(jù)挖掘的方法如表1所示。
表1 數(shù)據(jù)挖掘技術(shù)方法分析
貝葉斯分類算法以概率統(tǒng)計學(xué)為基礎(chǔ),由于其誤判率低,計算方式結(jié)合先驗概率與后驗概率。故貝葉斯算法在進(jìn)行運(yùn)算時可以避免只使用先驗概率時的主觀偏見,同時對避免單獨(dú)使用樣本時的過擬合現(xiàn)象。面對大數(shù)據(jù)計算時仍具有很高的準(zhǔn)確率,運(yùn)行計算時的過程也相對簡單,所以被廣泛使用于各個領(lǐng)域行業(yè)中。
貝葉斯分類算法主要是以概率統(tǒng)計為原理進(jìn)行計算。當(dāng)事件發(fā)生的概率已知時,可以依據(jù)數(shù)學(xué)理論的方式預(yù)測將要發(fā)生的概率。假設(shè)數(shù)據(jù)樣本集合為是事件A的概率,是事件B的概率。事件A和事件B同時發(fā)生的概率用表示。那么當(dāng)事件A已發(fā)生時概率為
貝葉斯算法的定理可以用數(shù)學(xué)公式進(jìn)行表示,即為貝葉斯公式。具體如下所示:
貝葉斯預(yù)測方式的目的是為了能夠的得到一個準(zhǔn)確的判別。傳統(tǒng)的預(yù)測方式是先根據(jù)過去的信息建立模型,再進(jìn)行預(yù)測,這種方式只是將輸入的以往信息轉(zhuǎn)變成現(xiàn)在輸出的信息,處理方式比較單一,不能處理異常發(fā)生的情況;貝葉斯預(yù)測能夠很好的處理這方面的問題,不僅可以處理以往的信息,還可以應(yīng)對突發(fā)異常的情況。
據(jù)查閱資料顯示,在伊犁一礦的數(shù)據(jù)中新生代的地層中以第四系為主,第四系的地層在全礦區(qū)分布廣泛,并且由南向北逐漸加深,有砂土、礫石等組成,沉積物的粒度由大變小,地形由陡峭變平緩。統(tǒng)計第四系的含水層厚度如表2所示。
表2 含水層參數(shù)選取
由表2可得,在伊犁一礦的開采區(qū)的含水層厚度是3.40至52.43之間,平均厚度為20.47。對表2進(jìn)行統(tǒng)計,分別為試采區(qū)中部北部跟南部三部分,從而進(jìn)行直觀的看出含水層的統(tǒng)計宏觀變化特征,如表3所示。
表3 含水層厚度統(tǒng)計表
由表3可知,試采區(qū)南部的第四系的含水層平均厚度最小,而從南到北的厚度逐漸增加,因為南部的沉積顆粒比較大,所以滲透性比較好,地下水的流速比較快。
對礦區(qū)含水層進(jìn)行求參可得如表4所示。
表4 含水層求參
由表4可知,第四系的含水層的富水性中等,滲透性比較好。第四系含水層水量補(bǔ)給充沛,透水性好,所以會容易對礦區(qū)的開采造成很大的影響。
因為第四系含水層是非承壓的含水層,所以先采用穩(wěn)定流理論公式進(jìn)行涌水量的計算。公式如(2)所示。
計算的涌水量為南部試采區(qū),所以根據(jù)表3可得含水層平均的厚度為11.17m。引用半徑帶數(shù)值為250m,當(dāng)?shù)谒南档牡叵滤咳朐嚥蓞^(qū)時,含灰層中的水將會被疏通,所以h應(yīng)該為0m。據(jù)資料顯示,滲透系數(shù)為K=1.47,影響半徑為300m,最大涌水量的變化系數(shù)是1.5。將這些數(shù)據(jù)代入穩(wěn)定流理論公式可得Q(正常)=60m3/h,Q(最大)=93m3/h。
由上可得,正常情況下的涌水量為60m3/h,最大涌水量為93m3/h。當(dāng)超過正常涌水量時就會容易發(fā)生突水水害。
用貝葉斯分類算法進(jìn)行涌水量的預(yù)測,首先要進(jìn)行突水的概率計算分析,也就是先驗概率。表示后驗概率,也就是在B已知的情況下A事件表示發(fā)生突水的概率,表示的是先驗概率,就是A事件本身發(fā)生的概率。在這里以往發(fā)生突水的概率用A事件表示。涌水量超過正常值用B事件表示。
運(yùn)用貝葉斯分類算法預(yù)測將來會發(fā)生突水的概率,公式如下:
本文從大數(shù)據(jù)介紹,數(shù)據(jù)挖掘方式,貝葉斯算法簡介,涌水量預(yù)測四個方式進(jìn)行介紹。通過貝葉斯算法的先驗概率來驗證后驗概率的性質(zhì)對水文地質(zhì)的涌水量進(jìn)行預(yù)測,預(yù)測結(jié)果為80%,從預(yù)測結(jié)果來看發(fā)生水害的概率很大應(yīng)提前做好預(yù)防措施。