扶祥祥,江澤標(biāo), ,余照陽, ,郭亞玲,吳少康
(1.貴州大學(xué) 礦業(yè)學(xué)院, 貴州 貴陽 550025;2.貴州省非金屬礦產(chǎn)資源綜合利用重點實驗室, 貴州 貴陽 550025)
在煤礦的生產(chǎn)過程中,礦井突水事故是礦井安全事故中危害最大的自然災(zāi)害之一[1?2]。當(dāng)?shù)V井突水事故時,及時、有效、準(zhǔn)確地判別突水水源的種類是預(yù)防和解決突水事故的重要前提。因此,準(zhǔn)確判斷突水水源類型,預(yù)測其涌水量,對于礦井水害防治和礦井生產(chǎn)安全具有十分重要的意義。
利用水文地球化學(xué)數(shù)據(jù)進(jìn)行判別分析突水水源的方法,得到廣泛的應(yīng)用和研究,取得了一些進(jìn)步和發(fā)現(xiàn)[3?4]。水文地球化學(xué)數(shù)據(jù)的差異性是水源的本質(zhì)特征,通過這些有差異性的數(shù)據(jù)結(jié)合各種方法來判別分析突水水源類別必然十分快捷、有效[5?6]。聶榮花等[7]以邢臺煤礦為研究對象,通過Bayes逐步判別法建立了礦山涌水快速判別模型。張春雷等[8]以淮南顧橋礦為例,結(jié)果表明,貝葉斯多類線性判別模型優(yōu)于神經(jīng)網(wǎng)絡(luò)模型,其計算過程簡單,模型結(jié)構(gòu)穩(wěn)定。徐星等[9]用逐步 Bayes 判別方法判別突水水源,結(jié)果表明其具有易建模、準(zhǔn)確率高的優(yōu)點。曲興玥等[10]用因子分析和距離判別法判別突水水源,提高了判別準(zhǔn)確率。
本文采用PCA法和Bayes逐步判別法建立Bayes逐步判別模型和PCA-Bayes綜合判別模型對福建煤礦突水水源進(jìn)行判別分析,通過結(jié)果預(yù)測對比,PCA-Bayes綜合判別法比Bayes逐步判別法更準(zhǔn)確。
突水水源的含水層中的水源水化學(xué)成分眾多。本文選取Na++K+、Ca2+、Mg2+、Cl?、SO42?、HCO3?等6種離子及酸堿度共7項指標(biāo)的組分作為預(yù)測礦井突水的判別因子。
以文獻(xiàn)[11]中福建典型煤礦的35個水源數(shù)據(jù)為樣本,其中老空水13份,灰?guī)r水7份,地表水6份,裂隙水9份。隨機(jī)選取樣本編號為2,5,10,17,25為待測樣本,以剩余樣本為訓(xùn)練樣本。樣本數(shù)據(jù)見表1。
利用SPSS軟件[12]對訓(xùn)練的樣本數(shù)據(jù)進(jìn)行Bayes逐步判別處理,可以得到4種水源的判別分類函數(shù),其函數(shù)表達(dá)式:
表1 福建典型煤礦突水水源數(shù)據(jù)
式中,S1、S2、S3、S4分別為老空水、裂隙水、灰?guī)r水以及地表水的判別函數(shù)值;X1、X2、X3分別為碳酸氫根離子濃度、硫酸根離子濃度、pH值。
將每一組樣本數(shù)據(jù)代入表達(dá)式,得到最大值的樣本數(shù)據(jù)歸于該類。由SPSS判別的分類結(jié)果可知,第1類水源誤判率為0,第2類水源誤判率為37.5%,即有3個第2類水源被判為第3類水源,第3類水源誤判率為0,第4類水源誤判率為0,在該模型下判別正確率為90.0%。
2.2.1 訓(xùn)練樣本的主成分分析
先對原始樣本數(shù)據(jù)進(jìn)行因子分析,從因子分析的結(jié)果中可知KMO的值為0.647,顯著性值為0,小于0.05,說明變量間存在相關(guān)關(guān)系,適合進(jìn)行因子分析,亦適合進(jìn)行主成分分析。
各主成分的解釋總方差見表2,從表2中可知,提取3個主成分累積貢獻(xiàn)率已達(dá)到86.18%,提取3個成分即可,可以達(dá)到降維的目的。
表2 解釋的總方差
根據(jù)主成分分析的成分矩陣可以得到特征向量矩陣,從而得到成分矩陣和特征向量矩陣(見表3),從而可以得到PCA處理的綜合指標(biāo)數(shù)據(jù)的表達(dá)式:
式中,X1、X2、X3、X4、X5、X6、X7分別代表鈉鉀離子濃度、鈣離子濃度、鎂離子濃度、氯離子濃度、碳酸氫根離子濃度、硫酸根離子濃度、pH值。
表3 成分矩陣和特征向量矩陣
將原始數(shù)據(jù)標(biāo)準(zhǔn)化處理后,代入函數(shù)表達(dá)式,即可得到主成分分析后的綜合指標(biāo)數(shù)據(jù)(見表4),用于建立綜合模型。
2.2.2 PCA-Bayes綜合模型
用PCA處理過的綜合指標(biāo)數(shù)據(jù)在SPSS軟件上進(jìn)行Bayes判別處理,可以得到4類突水水源的判別分類函數(shù)表達(dá)式:
表4 PCA處理得到的綜合指標(biāo)數(shù)據(jù)
式中,W1、W2、W3、W4分別為老空水、裂隙水、灰?guī)r水以及地表水的判別函數(shù)值;X1、X2分別為綜合指標(biāo)Z1、Z2的值。
由SPSS判別的分類結(jié)果可知,第1類水源誤判率為18.2%,一個判別為2類水源,一個判別為3類水源;第2類水源誤判率為0;第3類水源誤判率為0;第4類水源誤判率為0。所以該樣本數(shù)據(jù)在PCA-Bayes綜合判別模型下判別正確率為93.3%。
首先將待測樣本代入Bayes逐步判別模型得到判別函數(shù),然后將待測函數(shù)進(jìn)行主成分分析并將所得到的主成分樣本數(shù)據(jù)代入PCA-Bayes綜合判別模型得到判別函數(shù)(見表5)。
由表5可知,5個待測樣本在Bayes逐步判別模型中有一個判別錯誤,判別的正確率為80%,5個待測樣本在PCA-Bayes綜合判別模型下的判別全部正確,判別正確率為100%。
(1)本文對福建典型礦的突水水源建立Bayes判別模型和PCA-Bayes綜合判別模型,并對待判樣本進(jìn)行判別。
(2)運用Bayes逐步判別模型對訓(xùn)練樣本的回判正確率為90%,待測樣本的判別正確率為80%;運用PCA-Bayes綜合判別模型對訓(xùn)練樣本的回判正確率為93.3%,待測樣本的判別正確率為100%。
(3)從兩個模型的對比分析可以看出,通過PCA降維的PCA-Bayes綜合判別法的正確率要優(yōu)于單一的Bayes逐步判別法,PCA-Bayes綜合判別法是一種對突水水源判別快捷、準(zhǔn)確、有效的方法。
表5 待測樣本模型驗證