王 丹
(晉能控股煤業(yè)集團 四老溝礦,山西 大同 037000)
礦井采空區(qū)遺煤自然發(fā)火不但對礦井安全生產(chǎn)有嚴(yán)重的威脅,而且可能會引發(fā)采空區(qū)瓦斯爆炸,嚴(yán)重威脅井下作業(yè)人員的生命安全[1-2]。有效地預(yù)防采空區(qū)遺煤自然發(fā)火是確保礦井安全生產(chǎn)的重要之舉,而準(zhǔn)確預(yù)測采空區(qū)遺煤的自然發(fā)火是降低煤自燃對安全生產(chǎn)威脅的關(guān)鍵。在煤自然發(fā)火時,采空區(qū)遺煤自然發(fā)火標(biāo)志性氣體的濃度因煤發(fā)生不同氧化程度而改變,所以利用檢測檢驗技術(shù)研究自燃階段各標(biāo)志性氣體濃度的變化對煤自燃溫度進行預(yù)測分析,實現(xiàn)準(zhǔn)確預(yù)測煤自然發(fā)火程度的目標(biāo)[3-5]。為此,科研工作者開展了大量的試驗研究,利用不同機器學(xué)習(xí)算法研究分析煤自然發(fā)火標(biāo)志性氣體濃度與煤自燃溫度之間的變化規(guī)律。
PAN Ke等[6]借助RBF神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法對自然發(fā)火標(biāo)志性氣體濃度與煤自燃溫度二者的關(guān)系進行研究;鄧軍等[7]針對目前預(yù)測采空區(qū)遺煤自然發(fā)火標(biāo)志性氣體種類多,且各氣體之間關(guān)系復(fù)雜,存在非線性關(guān)系,通過對支持向量機(SVM)進行改進,并與主成分分析理論(PCA)相結(jié)合,構(gòu)建預(yù)測采空區(qū)遺煤自然發(fā)火程度模型,開始預(yù)測煤自燃溫度,試驗結(jié)果證明:通過PCA降維改造后的SVM預(yù)測精確度明顯提高。
RBF神經(jīng)網(wǎng)絡(luò)方法在預(yù)測煤自燃過程中很容易進入局部最優(yōu),形成復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu);SVM核函數(shù)因受限于Mercer條件,在選擇參數(shù)方面非常敏感[8],因此常規(guī)的機器學(xué)習(xí)算法預(yù)測煤自燃溫度過程中會產(chǎn)生較大誤差。
綜上所述,本次研究將根據(jù)極大似然估計、貝葉斯等,引進相關(guān)向量機[9-10](RVM)預(yù)測模型對煤自燃程度進行分析,結(jié)合標(biāo)志性氣體濃度預(yù)測煤自然發(fā)火溫度。
RVM回歸指利用超參數(shù)引入,同時將權(quán)值向量假設(shè)為零,達(dá)到高斯先驗分布,實現(xiàn)模型的稀疏特點[11-12],通過最大邊緣似然方法來估計超參數(shù)[13]。輸入模型具體見式(1)。
(1)
式中:xi為訓(xùn)練集第i組的輸入向量;S為訓(xùn)練集樣本的數(shù)量;RD為D維的實數(shù)域。
t定義為由訓(xùn)練樣本輸出值ti結(jié)合而成的目標(biāo)向量t=[t1,t2,…,ti,…,ts]T,其中ti表示訓(xùn)練樣本第i個輸出值,i=1,2,…,S。
輸入與輸出相關(guān)向量機(RVM)回歸關(guān)系見式(2)、(3):
ti=y(w,xi)+εi
(2)
(3)
式中:w為由S+1維權(quán)值wj結(jié)合而成的向量,其中j=0,1,…,S,則w=[w0,w1,…,wi,…,ws]T;
εi為第i個噪聲誤差,εi:N(0,δ2),N(·)表示高斯分布,δ2表示噪聲方差;
y(w,xi)為通過權(quán)值計算得到的輸出值;
x為通過xi結(jié)合而成的矩陣,x=[x1,x2,…,xi,…,xs]T;
k(x,xi)表示由核函數(shù)k(xn,xi)結(jié)合而成的核向量,k(x,xi)=k(x1,xi),k(x2,xi),…,k(xi,xi),…,k(xS,xi),n=1,2,…,S。
在訓(xùn)練樣本輸出值ti各自獨立的條件下,訓(xùn)練樣本通過極大似然函數(shù)表示,具體見式(4):
(4)
式中:φ為由核函數(shù)k(xn,xi)結(jié)合而成的核矩陣,φ=[φ(x1),φ(x2),…,φ(xn),…,φ(xs)]T,φ(xn)=[1,k(xn,x1),k(xn,x2),…,k(xn,xi),…,k(xn,xS)]。
假如直接通過最大似然方法求解向量w與高斯噪聲方差δ2,那么可能發(fā)生“過擬合”問題,將w賦予為零均值、超參數(shù)為α先驗分布,具體見式(5):
(5)
式中:α為S+1維超參數(shù)向量,α=[α0,α1…,αj,…,αs]T。
根據(jù)馬爾科夫性質(zhì)[14]得到,x*(測試輸入矩陣)相對應(yīng)的y*(預(yù)測值)概率表達(dá)式,具體見式(6):
(6)
式中:P(w,α,δ2|t)=P(w|t,α,δ2)P(α,δ2|t)。
因P(α,δ2|t)∝P(t|α,δ2)P(α)P(δ2),“∝”為成比例關(guān)系,那么目標(biāo)向量t的條件分布,具體見式(7):
(7)
式中:Ω為目標(biāo)向量t條件分布協(xié)方差,Ω=δ2I+φA-1φT,其中對角陣A=diag(α0,α1,…,αj,…,αS),I為單位陣。
P(y*|t)的等價形式可用式(8)表示:
(8)
y*=μTφ(x*)
(9)
(10)
式中:μ為w后驗分布均值,μ=δ-2QφTt;(x*)為由測試樣本結(jié)合而成核矩陣;Q為w后驗分布協(xié)方差Q=(δ-2φTφ+A)-1。
圖1為采用RVM預(yù)測煤自燃的流程,大致可分為6步。
圖1 RVM預(yù)測煤自燃流程圖
1) 井下取一部分氣體,測定氣體濃度和煤自燃時的溫度。構(gòu)建訓(xùn)練集(x,t)以及測試集(x*,y*),x表示訓(xùn)練集的輸入矩陣、x*表示測試集的輸入矩陣;將數(shù)據(jù)集合元素屬性輸入,具體輸入數(shù)據(jù)為C(O2)、C(N2)、C(CO)、C(CO2)、C(CH4)、O(CO/CO2)及Vmax,C(·)表示采集氣體的濃度,O(a/b)表示2種氣體a、b的濃度比值,Vmax表示預(yù)測煤自燃期間的溫度,主要由兩部分組成:測試集的預(yù)測溫度y*和訓(xùn)練集的測量溫度t。
2) 建立xi(訓(xùn)練集輸入向量)的高斯核函數(shù),具體見式(11):
(11)
式中:xn為訓(xùn)練集中第n組的輸入向量;xi為訓(xùn)練集中第i組輸入向量;λ表示高斯核函數(shù)的寬度。
建立高斯核函數(shù)主要是為實現(xiàn)訓(xùn)練集的輸入矩陣x從低維空間向高維空間映射,達(dá)到更好的訓(xùn)練效果[15-16]。
3) 對超參數(shù)α與噪聲方差δ2進行初始化,之后開始迭代計算,具體見式(12)、(13)。
(12)
(13)
4) 迭代完成條件達(dá)到之后,一部分αj開始接近無窮大,相對應(yīng)的wi等于0;剩下的αj則開始接近有限值,相對應(yīng)的xj定義為相關(guān)向量;訓(xùn)練結(jié)束之后,即可獲得w和δ2的最佳值。
(14)
φ*=[φ*(x1),φ*(x2),…,φ*(xn),…,φ*(xs)]T
(15)
(16)
6) 通過訓(xùn)練集獲得w和δ2的最優(yōu)RVM模型,在模型中代入測試集和測試核矩陣,最終計算獲得煤自燃期間的預(yù)測溫度值y*及預(yù)測方差δ*2。
利用煤自燃模擬試驗裝置檢驗RVM在煤自燃預(yù)測過程中的準(zhǔn)確性,試驗地點選在晉能控股集團四老溝煤礦,因該礦使用放頂煤開采,采空區(qū)遺煤較多,存在遺煤自然發(fā)火的危險。為防止采空區(qū)遺煤自然發(fā)火,設(shè)計一種相似于四老溝煤礦井下遺煤供氧與蓄熱環(huán)境的裝置,驗證煤自然發(fā)火階段各指標(biāo)氣體濃度與溫度的變化規(guī)律。
通過設(shè)計的煤自燃試驗裝置——XK型煤自燃試驗裝置開展試驗。此裝置主要包括4個部分:氣路、爐體、檢測和控制,具體如圖2所示。爐體形狀為圓桶型,內(nèi)徑為0.12 m,裝煤最大高度達(dá)到0.15 m,最大裝煤量為1.5 kg;通過在爐體周圍設(shè)置保溫層以及控溫水層來確保爐內(nèi)煤樣擁有穩(wěn)定的蓄熱條件,進氣預(yù)熱紫銅管與電熱管子安設(shè)在水層內(nèi),取氣管安設(shè)在爐中心軸處。在爐體上下安裝氣流緩沖層,保證氣流能夠均勻穿過煤體,通過控溫水層加熱的空氣,其溫度能達(dá)到煤自燃時溫度,可營造一個模擬煤自燃時的環(huán)境,之后由爐體底部進入爐內(nèi)。同時在爐內(nèi)不同位置安設(shè)氣體采樣點和測溫探頭。借助SP3430型號的氣相色譜儀采集和分析氣體,此色譜儀包括3部分:自動取樣機、雙柱箱、色譜數(shù)據(jù)處理工作站,具體如圖3所示。
圖2 試驗裝置
圖3 氣相色譜儀裝置
借助SP3430型氣相色譜儀分析四老溝煤礦的煤自燃特征氣體的成分和濃度,結(jié)果見表1,挑選30組數(shù)據(jù)作為訓(xùn)練集,余下的8組數(shù)據(jù)為測試集。
表1 四老溝煤礦的煤自燃樣本數(shù)據(jù)
構(gòu)建3種煤自燃預(yù)測模型:RBF神經(jīng)網(wǎng)絡(luò)、SVM和RVM,3種模型參數(shù)設(shè)置見表2。
表2 模型參數(shù)設(shè)置
RVM模型預(yù)測煤自燃的實施流程:
1) 對超參數(shù)向量α及方差δ2進行初始化處理,同時對最大迭代次數(shù)進行設(shè)置。
2) 對最大值α進行設(shè)置,在RVM迭代階段,若α大于此最大值時,就判斷其接近無窮大,與其相對應(yīng)的w則為零,那么不再更新該部分值;對方差閾值進行設(shè)置,如果其方差的相對誤差比閾值小時,就判斷完成訓(xùn)練要求,循環(huán)結(jié)束,退出即可。
3) 通過迭代323次之后,此次試驗訓(xùn)練數(shù)據(jù)基本滿足精度要求,其中存在16個αj接近有限值,與其對應(yīng)的wj不為零,獲得RVM模型的最優(yōu)參數(shù)。
4) 利用已訓(xùn)練的模型計算測試樣本數(shù)據(jù),對工作面采空區(qū)煤自燃過程的溫度進行預(yù)測,同時將其和測量值進行比較分析。
圖4為3種方法的預(yù)測溫度值與測試集真實溫度值的對比情況。采用RVM方法預(yù)測煤自燃的結(jié)果圍繞實際值上下浮動,預(yù)測精度整體相對較高;采用SVM方法預(yù)測煤自燃的精度比RVM方法差一點;采用RBF方法預(yù)測煤自燃的結(jié)果與真實值相差較大,所預(yù)測精度較低,未達(dá)到預(yù)期效果。
圖4 預(yù)測結(jié)果
圖5為3種預(yù)測方法的相對誤差,其預(yù)測相對誤差均小于20%,其中RVM預(yù)測煤自燃方法的所有樣本的相對誤差都在10%以下,且體現(xiàn)為集中分布及誤差值較小,SVM、RBF預(yù)測煤自燃的方法分別存在2個樣本的相對誤差超過10%.
表3為3種預(yù)測方法的平均相對誤差。這3種預(yù)測方法中,SVM和RBF預(yù)測煤自燃的方法所得到的訓(xùn)練誤差值相對較低,而得到的測試誤差值較高,證明此兩種方法具有明顯的“過擬合”現(xiàn)象,泛化能力較低;RVM預(yù)測煤自燃的方法所得到的測試誤差值和訓(xùn)練誤差值二者差值較小,具有最大的預(yù)測精度。所以RVM預(yù)測煤自燃的效果比傳統(tǒng)方法(RBF和SVM預(yù)測煤自燃方法)要好很多。
圖5 預(yù)測相對誤差
表3 平均相對誤差
以四老溝煤礦煤樣為研究對象,模擬煤自燃規(guī)律,對自燃階段所產(chǎn)生的特征氣體及濃度、自燃溫度進行分析。根據(jù)相關(guān)理論建立RVM煤自燃預(yù)測模型,同時和SVM、RBF模型對比。試驗結(jié)果證明:SVM、RBF具有“過擬合”問題,泛化能力不高;而采用RVM預(yù)測煤自燃的方法泛化能力強、預(yù)測精度高、模型更稀疏、預(yù)測誤差小等優(yōu)勢。