閻 馨,朱永浩,屠乃威,吳書(shū)文,王雨虹
(遼寧工程技術(shù)大學(xué)電氣與控制工程學(xué)院,遼寧葫蘆島 125105)
煤炭開(kāi)采時(shí)常發(fā)生工作面煤和瓦斯突出事故,這對(duì)我國(guó)經(jīng)濟(jì)造成極大損失。采用突出預(yù)防方法可以防止事故的發(fā)生,其首要工作是突出預(yù)測(cè)。經(jīng)過(guò)數(shù)十年發(fā)展,國(guó)內(nèi)外研究者針對(duì)事故發(fā)生提出多種預(yù)測(cè)方法,如鉆孔涌出初速度方法[1-2]、鉆屑指標(biāo)方法[3-4]、綜合指標(biāo)方法[5]、電磁輻射法[6]、邏輯回歸法[7]、神經(jīng)網(wǎng)絡(luò)方法[8-10]、支持向量機(jī)方法[11-13]、樸素貝葉斯方法[14-15]等。這些方法對(duì)工作面突出預(yù)測(cè)具有一定的積極作用,但存在一些不足,如瓦斯涌出初速度、鉆屑量指標(biāo)、綜合指標(biāo)和電磁輻射監(jiān)測(cè)方法預(yù)測(cè)時(shí)不能綜合考慮多種影響因素,因而難以準(zhǔn)確確定指標(biāo)臨界值與突出時(shí)指標(biāo)變化趨勢(shì)的特征。部分指標(biāo)數(shù)據(jù)常存在噪聲,不能保證突出預(yù)測(cè)的準(zhǔn)確性。神經(jīng)網(wǎng)絡(luò)方法考慮工作面煤與瓦斯突出多種影響因素,根據(jù)訓(xùn)練樣本數(shù)據(jù)構(gòu)建預(yù)測(cè)模型,此模型具有隨機(jī)性,因此該方法常存在訓(xùn)練失敗問(wèn)題。支持向量機(jī)方法適于小規(guī)模數(shù)據(jù)建模,從而構(gòu)建模型實(shí)現(xiàn)突出危險(xiǎn)性預(yù)測(cè)。樸素貝葉斯分類方法將工作面煤與瓦斯突出預(yù)測(cè)問(wèn)題歸結(jié)為分類問(wèn)題,利用樣本數(shù)據(jù)構(gòu)建突出預(yù)測(cè)模型進(jìn)行突出預(yù)測(cè)。但該模型在假設(shè)模型輸入變量(分類變量)間相互獨(dú)立條件下構(gòu)建的,而實(shí)際構(gòu)成分類變量的突出影響因素是相互的,因此模型預(yù)測(cè)的準(zhǔn)確性不高。研究發(fā)現(xiàn)在樸素貝葉斯模型中考慮分類變量對(duì)分類影響的權(quán)重,構(gòu)成權(quán)重貝葉斯模型,改進(jìn)后的模型能有效提高分類的準(zhǔn)確性[16-18]。
本文將主成分分析(Principal ComponentAnalysis,PCA)和權(quán)重貝葉斯模型結(jié)合,構(gòu)建工作面煤與瓦斯突出預(yù)測(cè)的權(quán)重貝葉斯模型。該模型的預(yù)測(cè)方法具有較高的預(yù)測(cè)準(zhǔn)確性,可以快速獲得突出預(yù)測(cè)結(jié)果。利用主成分分析確定構(gòu)建突出預(yù)測(cè)模型輸入變量的突出影響因素(分類變量)權(quán)重,再構(gòu)建煤與瓦斯突出預(yù)測(cè)的權(quán)重貝葉斯模型。
工作面煤與瓦斯突出是多種因素共同作用的結(jié)果。通常情況下,突出危險(xiǎn)性與開(kāi)采深度、瓦斯放散初速度、瓦斯壓力呈正相關(guān);與煤層堅(jiān)固性系數(shù)呈負(fù)相關(guān)。由不同地質(zhì)構(gòu)造的煤礦發(fā)生工作面煤與瓦斯突出的可能性也不同。其中,高瓦斯煤礦相對(duì)于低瓦斯煤礦更易發(fā)生工作面煤與瓦斯突出事故。
工作面煤與瓦斯突出預(yù)測(cè)看作是利用檢測(cè)到的工作面煤與瓦斯突出多種影響因素信息進(jìn)行突出危險(xiǎn)性等級(jí)劃分問(wèn)題。將瓦斯壓力、瓦斯放散初速度、地質(zhì)構(gòu)造、煤層堅(jiān)固性系數(shù)、開(kāi)采深度作為工作面煤與瓦斯突出預(yù)測(cè)分類模型的輸入變量,又稱分類變量[19]。由于后3 個(gè)分類變量是在開(kāi)采環(huán)境發(fā)生大變化時(shí)才會(huì)改變,而且煤層堅(jiān)固性系數(shù)和地質(zhì)構(gòu)造信息的檢測(cè)過(guò)程復(fù)雜且較長(zhǎng),因此采用離線檢測(cè)方式獲取信息數(shù)據(jù)。采用多傳感器在線檢測(cè)方式獲得瓦斯壓力、瓦斯放散初速度信息數(shù)據(jù),以提高獲取數(shù)據(jù)的可靠性和準(zhǔn)確性。
樸素貝葉斯(Naive Bayesian,NBS)模型假設(shè)分類變量間相互對(duì)立。權(quán)重貝葉斯模型是通過(guò)對(duì)分類變量權(quán)重考慮,從而消弱獨(dú)立性假設(shè)條件。如何確定分類變量權(quán)重是建立權(quán)重貝葉斯模型的關(guān)鍵。常用的權(quán)重確定方法有專家給定權(quán)重法、層次權(quán)重決策法、熵值確定法等。專家給定權(quán)重法和層次權(quán)重決策法受主觀影響較大,有時(shí)誤差會(huì)很大;熵值確定法對(duì)于異常數(shù)據(jù)過(guò)于敏感,實(shí)際操作時(shí)對(duì)某些結(jié)果影響較小的分類變量權(quán)重計(jì)算量過(guò)大,導(dǎo)致綜合權(quán)重不切實(shí)際。解決不足之處的有效方法是給每個(gè)指標(biāo)增加一個(gè)合理范圍限制。PCA 是通用的權(quán)重確定方法,在多個(gè)領(lǐng)域取得較好的應(yīng)用效果[20-22],因此應(yīng)用PCA 對(duì)突出預(yù)測(cè)模型的輸入變量(分類變量)進(jìn)行權(quán)重確定。工作面煤與瓦斯突出預(yù)測(cè)模型建立過(guò)程如圖1 所示。
圖1 工作面煤與瓦斯突出預(yù)測(cè)模型建立過(guò)程Fig.1 Prediction model building process of coal and gas outburst in mine working
整理瓦斯壓力、瓦斯放散初速度、地質(zhì)構(gòu)造、煤層堅(jiān)固性系數(shù)、開(kāi)采深度等信息數(shù)據(jù),形成樣本數(shù)據(jù)Xk={xk1,xk2,…,xko}和dk(k=1,2,…,m,o=5,m為樣本數(shù))。xk1,xk2,…,xk5分別為第k個(gè)樣本的5 種分類變量數(shù)據(jù),dk為第k個(gè)樣本的突出危險(xiǎn)性等級(jí)數(shù)據(jù)。
對(duì)樣本數(shù)據(jù)Xk={xk1,xk2,…,xko}進(jìn)行Z-Score 標(biāo)準(zhǔn)化處理,處理后的數(shù)據(jù)Y如式(1)所示:
對(duì)標(biāo)準(zhǔn)化處理后的數(shù)據(jù)Y進(jìn)行主成分分析,計(jì)算出瓦斯壓力、瓦斯放散初速度、地質(zhì)構(gòu)造、煤層堅(jiān)固性系數(shù)和開(kāi)采深度作為分類變量時(shí)的權(quán)重。確定以分類變量權(quán)重為基礎(chǔ),利用數(shù)據(jù)Y進(jìn)行貝葉斯學(xué)習(xí),完成類別的先驗(yàn)概率計(jì)算以及獲取條件概率公式。利用樸素貝葉斯的學(xué)習(xí)結(jié)果和分類變量權(quán)重構(gòu)建工作面煤與瓦斯突出預(yù)測(cè)的權(quán)重貝葉斯模型。
利用主成分分析,確定分類變量權(quán)重過(guò)程如下:
步驟1計(jì)算數(shù)據(jù)Y的相關(guān)系數(shù)矩陣R。R的表達(dá)式如式(2)所示:
步驟2計(jì)算相關(guān)系數(shù)矩陣R的特征值λi(i=1,2,…,o,λ1≥λ2≥…≥λo)和特征向量μij(i,j=1,2,…,o)。
步驟3根據(jù)式(3)確定主成分個(gè)數(shù)n。
其中,δ為參數(shù),表示主成分貢獻(xiàn)率閾值。
步驟4根據(jù)式(4)計(jì)算主成分因子載荷矩陣βij(βij代表第i個(gè)分類變量與第j個(gè)主成分間相關(guān)系數(shù),i=1,2,…,o,j=1,2,…,n)。
步驟5根據(jù)式(5)~式(7)計(jì)算得各分類變量的權(quán)重θi(i=1,2,…,o)。
由式(5)~式(7)可知,分類變量的權(quán)重與相關(guān)系數(shù)βij密不可分。一類分類變量在一個(gè)主成分上的影響權(quán)重由式(5)表示,|βij|越大,第i個(gè)分類變量與第j個(gè)主成分間相關(guān)系數(shù)越大,第i個(gè)分類變量對(duì)第j個(gè)主成分的影響就越大,即當(dāng)?shù)趇個(gè)分類變量發(fā)生定量變化,則第j個(gè)主成分相應(yīng)發(fā)生變化量越大。將煤與瓦斯突出事故發(fā)生時(shí)看作是o個(gè)分類變量(本文中是5 種分類變量)構(gòu)成系統(tǒng)相互作用的結(jié)果,而n個(gè)主成分構(gòu)成系統(tǒng)是o個(gè)分類變量構(gòu)成系統(tǒng)的另一種表達(dá),因此煤與瓦斯突出發(fā)生也是n個(gè)主成分構(gòu)成系統(tǒng)作用的結(jié)果。當(dāng)把在n個(gè)主成分上相加得到即一個(gè)分類變量對(duì)n個(gè)主成分構(gòu)成系統(tǒng)影響的量化,再對(duì)進(jìn)行歸一化得到該分類變量權(quán)重θi。θi越大,當(dāng)?shù)趇個(gè)分類變量發(fā)生定量變化,n個(gè)主成分構(gòu)成系統(tǒng)發(fā)生變化量越大,對(duì)煤與瓦斯突出危險(xiǎn)性影響的量化也就越大。
設(shè)工作面煤與瓦斯突出危險(xiǎn)性等級(jí)為B1,B2,…,Bf(f為突出危險(xiǎn)性等級(jí)數(shù)量),在m個(gè)樣本數(shù)據(jù)中,突出危險(xiǎn)等級(jí)為Bl(l=1,2,…,f)的樣本數(shù)量為Sl(l=1,2,…,f)。為避免出現(xiàn)頻率為0 的情況,影響煤與瓦斯突出預(yù)測(cè)的準(zhǔn)確性,引入拉普拉斯平滑計(jì)算,Bl(l=1,2,…,f)類的先驗(yàn)概率P(Bl)為:
對(duì)5 種分類變量采用數(shù)值化描述,而這些信息數(shù)據(jù)近似為正態(tài)分布,因此采用高斯函數(shù)確定條件概率。條件概率如式(9)所示:
工作面煤與瓦斯突出預(yù)測(cè)的權(quán)重貝葉斯模型如式(10)所示:
其中,B為貝葉斯最大后驗(yàn)概率值[23],對(duì)應(yīng)突出危險(xiǎn)性等級(jí)。通過(guò)計(jì)算每個(gè)突出危險(xiǎn)性等級(jí)的后驗(yàn)概率值,進(jìn)而比較得到最大后驗(yàn)概率值以及對(duì)應(yīng)的突出危險(xiǎn)性等級(jí)。
考慮工作面煤與瓦斯突出的多種影響因素,基于工作面煤與瓦斯突出預(yù)測(cè)的權(quán)重貝葉斯模型進(jìn)行突出危險(xiǎn)性等級(jí)預(yù)測(cè)。工作面煤與瓦斯突出預(yù)測(cè)的主要步驟如下:
步驟1通過(guò)多傳感器在線檢測(cè)或離線檢測(cè)方式,獲得反映工作面煤與瓦斯突出危險(xiǎn)性的5 種分類變量動(dòng)/靜態(tài)數(shù)據(jù)。
步驟2對(duì)所得檢測(cè)數(shù)據(jù)進(jìn)行Z-Score 標(biāo)準(zhǔn)化處理,得到無(wú)量綱數(shù)據(jù)qi(i=1,2,…,o)。
步驟3將無(wú)量綱數(shù)據(jù)qi(i=1,2,…,o)作為工作面煤與瓦斯突出預(yù)測(cè)的權(quán)重貝葉斯模型的輸入,計(jì)算得到工作面煤與瓦斯突出危險(xiǎn)性等級(jí)的預(yù)測(cè)值B。
步驟4輸出工作面煤與瓦斯突出預(yù)測(cè)的預(yù)測(cè)結(jié)果B,并將預(yù)測(cè)結(jié)果B存儲(chǔ)到數(shù)據(jù)庫(kù)。
工作面煤與瓦斯突出預(yù)測(cè)的過(guò)程如圖2 所示。工作面煤與瓦斯突出預(yù)測(cè)的權(quán)重貝葉斯模型準(zhǔn)確性與樣本數(shù)據(jù)的完備性密切相關(guān)。工作面煤與瓦斯突出具有多樣性、突發(fā)性、影響因素的不確定性、非線性等特點(diǎn),而完備性的樣本數(shù)據(jù)需要長(zhǎng)時(shí)間積累過(guò)程,因此基于樣本數(shù)據(jù)構(gòu)建的突出預(yù)測(cè)模型需要適時(shí)更新才能保證模型預(yù)測(cè)的準(zhǔn)確性。采用樣本更新后進(jìn)行模型重構(gòu)的方法來(lái)完成工作面煤與瓦斯突出預(yù)測(cè)的權(quán)重貝葉斯模型更新。
圖2 基于PCA 和權(quán)重貝葉斯的工作面煤與瓦斯突出預(yù)測(cè)Fig.2 Prediction of coal and gas outburst in mine working face based on PCA and weighted Bayesian
如果新數(shù)據(jù)與樣本數(shù)據(jù)有高相似度,則不進(jìn)行樣本數(shù)據(jù)更新;如果沒(méi)有相似度,則將新數(shù)據(jù)存儲(chǔ)到樣本數(shù)據(jù)中完成樣本數(shù)據(jù)的更新。
設(shè)新數(shù)據(jù)為Z={z1,z2,…,zo+1},z1,z2,…,zo為5 種分類變量,zo+1為突出危險(xiǎn)性等級(jí)數(shù)據(jù),第k個(gè)樣本的數(shù)據(jù)Xk={xk1,xk2,…,xko},則z1,z2,…,zo與Xk的相似度為:
其中,θi為分類變量權(quán)值,si(zi,xki)為新數(shù)據(jù)中第i個(gè)元素與第k個(gè)樣本的第i個(gè)元素的相似度。
當(dāng)新數(shù)據(jù)Z滿足式(13)時(shí),將新數(shù)據(jù)Z存儲(chǔ)到樣本數(shù)據(jù)中。
其中,φ為相似度閾值,sgn()為符號(hào)函數(shù),其表達(dá)式如式(14)所示:
整理國(guó)內(nèi)礦井工作面煤與瓦斯突出數(shù)據(jù)對(duì)本文方法進(jìn)行驗(yàn)證。整理前15 組數(shù)據(jù)作為突出預(yù)測(cè)建模時(shí)的訓(xùn)練樣本數(shù)據(jù),訓(xùn)練數(shù)據(jù)的平行坐標(biāo)如圖3所示。后8 組數(shù)據(jù)作為測(cè)試數(shù)據(jù)。
圖3 訓(xùn)練數(shù)據(jù)的平行坐標(biāo)圖Fig.3 Parallel coordinates plot of training data
采用Python 語(yǔ)言對(duì)本文方法進(jìn)行編程實(shí)現(xiàn)。令突出危險(xiǎn)性等級(jí)數(shù)量f=4,訓(xùn)練樣本數(shù)量m=15,分類變量數(shù)量o=5,主成分貢獻(xiàn)率閾值δ=0.8,相似度閾值φ=0.90。利用圖3 所示的訓(xùn)練數(shù)據(jù),構(gòu)建工作面煤與瓦斯突出預(yù)測(cè)的權(quán)重貝葉斯模型。其中,本文方法得到的分類變量權(quán)重為θ1=0.246 2,θ2=0.146 5,θ3=0.258 4,θ4=0.212 1,θ5=0.136 7 測(cè)試數(shù)據(jù)及其預(yù)測(cè)結(jié)果如表1所示。
本文方法對(duì)煤與瓦斯突出預(yù)測(cè)具有較高的準(zhǔn)確率,采用圖3 所示的訓(xùn)練數(shù)據(jù),構(gòu)建工作面煤與瓦斯突出預(yù)測(cè)的樸素貝葉斯(NBS)模型和專家給定分類變量權(quán)重的權(quán)重貝葉斯(EWBS)模型,并對(duì)測(cè)試數(shù)據(jù)進(jìn)行突出危險(xiǎn)性預(yù)測(cè)。利用NBS 模型進(jìn)行突出預(yù)測(cè)的方法記為NBS 方法,而利用EWBS 模型進(jìn)行突出預(yù)測(cè)的方法記為EWBS 方法。EWBS 方法與本文方法都是利用式(10)所示模型進(jìn)行突出危險(xiǎn)性預(yù)測(cè)。兩種方法的區(qū)別在于分類變量權(quán)重確定方法不同,EWBS 方法的分類變量權(quán)重具有主觀性,受專家經(jīng)驗(yàn)知識(shí)影響,而本文方法的分類變量權(quán)重是通過(guò)對(duì)突出數(shù)據(jù)的主成分分析獲得,具有客觀性和科學(xué)性,對(duì)突出數(shù)據(jù)有一定的依賴性。NBS 方法可以看作是本文方法的特殊情況,即各分類變量權(quán)重值都為1 的預(yù)測(cè)方法。煤與瓦斯突出的發(fā)生受多種因素共同影響,但各因素對(duì)突出的影響不同。因此NBS方法是在較理想條件下實(shí)現(xiàn),本文方法更符合實(shí)際。NBS 和EWBS 方法對(duì)測(cè)試數(shù)據(jù)的預(yù)測(cè)結(jié)果如表1 所示。EWBS 方法中的θ1=0.16,θ2=0.16,θ3=0.30,θ4=0.19,θ5=0.19。
表1 測(cè)試數(shù)據(jù)及其預(yù)測(cè)結(jié)果Table 1 Testing data and prediction results
由表1 可知,本文與EWBS 方法所得的預(yù)測(cè)結(jié)果與實(shí)際完全一致,并優(yōu)于NBS 方法,NBS 方法的預(yù)測(cè)結(jié)果準(zhǔn)確率為75%。
本文方法和EWBS 方法針對(duì)測(cè)試數(shù)據(jù)進(jìn)行突出預(yù)測(cè)時(shí)得到最大后驗(yàn)概率值如表2 所示。本文方法得到最大后驗(yàn)概率值均大于EWBS 方法,且預(yù)測(cè)不確定性優(yōu)于EWBS 方法。相比專家給定方法,本文方法所確定的分類變量權(quán)重更合理。
表2 最大后驗(yàn)概率值Table 2 Maximum posterior probability value
NBS 方法和本文方法建模所需的時(shí)間如表3 所示。本文方法建模所需時(shí)間僅為2.5 s,比NBS 方法建模時(shí)間多了1.1 s。而實(shí)際利用所建模型進(jìn)行突出預(yù)測(cè)時(shí)間不超過(guò)10 ms,滿足工作面煤與瓦斯突出動(dòng)態(tài)預(yù)測(cè)的時(shí)間要求。
表3 建模時(shí)間Table 3 Time for building model s
本文將工作面煤與瓦斯突出預(yù)測(cè)問(wèn)題歸結(jié)為分類問(wèn)題,考慮突出的動(dòng)靜多種影響因素,提出一種基于PCA和權(quán)重貝葉斯的工作面煤與瓦斯突出預(yù)測(cè)方法。實(shí)驗(yàn)結(jié)果表明,與樸素貝葉斯與權(quán)重貝葉斯模型相比,該預(yù)測(cè)方法具有預(yù)測(cè)準(zhǔn)確性高、預(yù)測(cè)不確定性低、設(shè)置參數(shù)較少的特點(diǎn),可以快速獲得預(yù)測(cè)結(jié)果,為現(xiàn)場(chǎng)指導(dǎo)礦井工作面安全生產(chǎn)提供一定的參考。后續(xù)將在權(quán)重貝葉斯模型中融入電磁輻射、聲發(fā)射實(shí)時(shí)因素信息,進(jìn)一步提高突出預(yù)測(cè)準(zhǔn)確性。