劉寶, 穆坤, 葉飛, 汪帆, 王靜婷
(1.西安科技大學(xué) 電氣與控制工程學(xué)院, 陜西 西安 710054;2.西安翻譯學(xué)院 工程技術(shù)學(xué)院, 陜西 西安 710105)
煤自燃不僅給煤礦生產(chǎn)帶來極大不便,一旦發(fā)生爆炸,還會對礦工的生命安全造成極大威脅[1-2]。煤自燃的有效預(yù)防是煤礦安全生產(chǎn)的關(guān)鍵,對煤自燃程度的準(zhǔn)確預(yù)測是煤自燃預(yù)防的前提。煤自燃過程中,指標(biāo)氣體濃度會隨煤質(zhì)氧化的程度發(fā)生變化,因此,可通過檢測及分析該過程中指標(biāo)氣體濃度來預(yù)測煤自燃溫度,達(dá)到預(yù)測煤自燃程度的目的[3-5]。
近年來,學(xué)者們通過各種機(jī)器學(xué)習(xí)算法對指標(biāo)氣體濃度與煤自燃溫度的關(guān)系展開了研究。文獻(xiàn)[6]通過徑向基(Radial Basis Function, RBF)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法研究了氣體濃度與煤自燃溫度之間的關(guān)系。文獻(xiàn)[7]通過支持向量機(jī)(Support Vector Machine, SVM)的改進(jìn)算法對煤自燃溫度進(jìn)行預(yù)測。RBF神經(jīng)網(wǎng)絡(luò)方法用于預(yù)測煤自燃具有非線性映射能力與泛化能力強(qiáng)的優(yōu)點,然而易陷入局部最優(yōu),網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜;SVM雖可避免“維數(shù)災(zāi)難”,適用于小樣本數(shù)據(jù)集,但核函數(shù)受Mercer條件的限制,對參數(shù)的選擇敏感[8];傳統(tǒng)的機(jī)器學(xué)習(xí)算法對煤自燃溫度進(jìn)行預(yù)測時存在較大誤差。
針對上述問題,本文結(jié)合貝葉斯、極大似然估計等理論,提出了基于相關(guān)向量機(jī)[9-10](Relevance Vector Machine,RVM)的煤自燃程度預(yù)測方法,根據(jù)特征氣體濃度準(zhǔn)確地對煤自燃溫度進(jìn)行預(yù)測。
ti=y(w,xi)+εi
(1)
(2)
式中:y(w,xi)為由權(quán)值決定的輸出值;w為S+1維權(quán)值wj組成的向量,j=0,1,…,S,即w=[w0,w1,…,wj,…,wS]T;x是由xi組成的矩陣,即x=[x1,x2,…,xi,…,xS]T;εi為第i個噪聲誤差,εi~N(0,δ2),N(·)為高斯分布,δ2為高斯噪聲的方差;k(x,xi)為核函數(shù)k(xn,xi)組成的核向量,即k(x,xi)=[k(x1,xi),k(x2,xi),…,k(xi,xi),…,k(xS,xi)],n=1,2,…,S。
當(dāng)ti相互獨立時,訓(xùn)練樣本的極大似然函數(shù)為
(3)
式中φ為核函數(shù)k(xn,xi)組成的核矩陣,即φ=[φ(x1),φ(x2),…,φ(xn),…,φ(xS)]T,φ(xn)=[1,k(xn,x1),k(xn,x2),…,k(xn,xi),…,k(xn,xS)]。
若直接用最大似然法求w與δ2,會產(chǎn)生“過擬合”現(xiàn)象,可對w賦予均值為零、超參數(shù)為α的高斯先驗分布。
(4)
式中α為S+1維的超參數(shù)向量,α=[α0,α1,…,αj,…,αS]T。
由馬爾科夫性質(zhì)知,對于測試輸入矩陣x*,其對應(yīng)預(yù)測值y*的概率表達(dá)式為
(5)
式中P(w,α,δ2|t)=P(w|t,α,δ2)P(α,δ2|t)。
由于P(α,δ2|t)∝P(t|α,δ2)P(α)P(δ2),其中“∝”表示成比例,則t的條件分布為
(6)
式中Ω為t的條件分布協(xié)方差,Ω=δ2I+φA-1φT,I為單位陣,對角陣A=diag(α0,α1,…,αj,…,αS)。
P(y*|t)等價形式為
(7)
y*=μTφ(x*)
(8)
(9)
式中:μ為w的后驗分布均值,μ=δ-2QφTt;φ(x*)為測試樣本組成的核矩陣;Q為w的后驗分布協(xié)方差Q=(δ-2φTφ+A)-1。
基于RVM的煤自燃預(yù)測流程如圖1所示。
圖1 基于RVM的煤自燃預(yù)測流程Fig.1 Prediction process of coal spontaneous combustion based on RVM
(1) 采集氣體濃度與煤自燃溫度。建立訓(xùn)練集(x,t)和測試集(x*,y*),其中x和x*分別為訓(xùn)練集和測試集的輸入矩陣,輸入數(shù)據(jù)集合元素屬性包括C(O2),C(N2),C(CO),C(CO2),C(CH4)和O(CO/CO2),其中C(·)為氣體濃度,O(a/b)為a,b兩種氣體濃度之比,Vmax為煤自燃預(yù)測溫度,包括訓(xùn)練集的測量溫度t和測試集的預(yù)測溫度y*兩部分。
(2) 對訓(xùn)練集的輸入向量xi構(gòu)造高斯核函數(shù)
(10)
式中:λ為高斯核寬度;xn與xi分別表示訓(xùn)練集中第n組和第i組輸入向量。
構(gòu)造核函數(shù)的目的是將訓(xùn)練集的輸入矩陣x由低維空間映射到高維空間,以獲得更好的訓(xùn)練效果。
(3) 初始化超參數(shù)α與噪聲方差δ2,對α和δ2進(jìn)行迭代。
(11)
(12)
(4) 達(dá)到迭代終止條件后,部分αj會趨于無窮大,對應(yīng)的wi為0;其余的αj趨于有限值,對應(yīng)的輸入向量xj被稱為相關(guān)向量。完成訓(xùn)練后,得到最佳的w和δ2。
(13)
(6) 將測試集數(shù)據(jù)和測試核矩陣代入由訓(xùn)練集確定的最優(yōu)w和δ2的RVM模型中,即可得到煤自燃溫度的預(yù)測值y*和預(yù)測方差δ*2。
通過模擬煤自燃實驗,驗證基于RVM的煤自燃預(yù)測方法的可行性與準(zhǔn)確性。
陜西省長武縣亭南煤礦采用綜采放頂煤采煤工藝,在通風(fēng)不良的環(huán)境下易發(fā)生煤自燃現(xiàn)象。為了有效預(yù)防煤自燃災(zāi)害的發(fā)生,創(chuàng)造與亭南煤礦相似的供氧與蓄熱條件,檢測該過程中煤自燃溫度與指標(biāo)氣體濃度的變化。
利用XK型煤自燃實驗平臺進(jìn)行實驗,該平臺由爐體、氣路、控制及檢測4個部分組成,如圖2所示。爐體主體部分呈圓桶狀,最大裝煤高度為150 cm,內(nèi)徑為120 cm,總裝煤量可達(dá)1.5 t;爐體周圍的保溫層與跟蹤外層煤溫的控溫水層可保證爐內(nèi)煤體處于良好的蓄熱環(huán)境,水層中裝電熱管與進(jìn)氣預(yù)熱紫銅管,在爐中心軸處設(shè)有取氣管。爐體頂、底部均有氣流緩沖層,使氣流均勻通過煤體,空氣經(jīng)控溫水層預(yù)熱,創(chuàng)造與煤自燃溫度相同的環(huán)境,然后從爐體底部送入。此外,爐內(nèi)多處布置了測溫探頭和氣體采樣點。
圖2 煤自燃實驗臺Fig.2 Coal spontaneous combustion test bench
選用SP3430氣相色譜儀對氣體進(jìn)行采集與分析,如圖3所示。該氣相色譜儀主要由雙柱箱、自動取樣機(jī)、色譜數(shù)據(jù)處理工作站組成。
圖3 SP3430氣相色譜儀Fig.3 SP3430 gas chromatograph
通過SP3430氣相色譜儀檢測特征氣體的成分及濃度,亭南煤礦的煤自燃樣本數(shù)據(jù)見表1。選取其中30組樣本數(shù)據(jù)為訓(xùn)練集,剩余8組樣本數(shù)據(jù)為測試集。
表1 亭南煤礦的煤自燃樣本數(shù)據(jù)Table 1 Sample data of coal spontaneous combustion in Tingnan Coal Mine
構(gòu)建RBF神經(jīng)網(wǎng)絡(luò)、SVM、RVM 3種煤自燃預(yù)測模型。模型參數(shù)分別設(shè)置如下:RBF神經(jīng)網(wǎng)絡(luò)模型的擴(kuò)展速度為371;SVM模型高斯核函數(shù)的核寬度為19,正則化系數(shù)為4 583;RVM模型核函數(shù)的核寬度為579。
基于RVM煤自燃預(yù)測模型的實施步驟如下。
(1) 初始化超參數(shù)向量α及方差δ2并設(shè)置最大迭代次數(shù)。
(2) 設(shè)置α的最大值,在RVM迭代過程中,當(dāng)α超過該最大值時,便認(rèn)為其趨向于無窮大,對應(yīng)的w為0,則對該部分的值就不再更新;設(shè)置方差閾值,當(dāng)其方差的相對誤差小于閾值時,便認(rèn)為達(dá)到訓(xùn)練要求,退出循環(huán)。
(3) 本實驗訓(xùn)練數(shù)據(jù)經(jīng)過323次迭代后,最終達(dá)到精度要求,此時有16個αj趨于有限值,wj不為0,得到RVM最優(yōu)模型參數(shù)。
(4) 將測試樣本代入已訓(xùn)練的模型中,預(yù)測采空區(qū)煤自燃溫度值,并與測量值進(jìn)行比較分析。
測試集真實溫度值與3種方法的預(yù)測溫度值對比結(jié)果如圖4所示?;赗VM的煤自燃預(yù)測值在實際值附近上下波動,總體預(yù)測精度較高;基于SVM的煤自燃預(yù)測精度次之;基于RBF的煤自燃預(yù)測誤差偏大,預(yù)測精度不理想。
圖4 3種方法的預(yù)測結(jié)果Fig.4 Prediction results of three methods
3種方法的相對誤差如圖5所示。3種方法的預(yù)測相對誤差都在20%以內(nèi),基于RBF和SVM的煤自燃預(yù)測方法各有2個樣本相對誤差大于10%,基于RVM的煤自燃預(yù)測方法相對誤差均小于10%,較為集中且相對較小。
圖5 3種方法的預(yù)測相對誤差Fig.5 Prediction relative errors of three methods
3種方法的平均相對誤差見表2。在3種煤自燃預(yù)測方法中,基于RBF和SVM的煤自燃預(yù)測方法訓(xùn)練誤差較小,但測試誤差較大,說明這2種方法存在嚴(yán)重的“過擬合”現(xiàn)象,泛化能力差?;赗VM的煤自燃預(yù)測方法的訓(xùn)練誤差與測試誤差比較接近且預(yù)測精度最高。由此可知,RVM對煤自燃溫度預(yù)測的效果優(yōu)于傳統(tǒng)的基于RBF和SVM的煤自燃預(yù)測方法。
表2 3種方法的平均相對誤差Table 2 Average relative errors of three methods
通過模擬亭南煤礦煤樣自燃過程的環(huán)境,檢測并記錄該過程中特征氣體濃度值與煤自燃溫度值。結(jié)合貝葉斯、極大似然估計等理論構(gòu)建基于RVM的煤自燃預(yù)測模型,并與基于RBF神經(jīng)網(wǎng)絡(luò)和SVM的煤自燃預(yù)測模型進(jìn)行比較。結(jié)果表明,傳統(tǒng)的煤自燃溫度預(yù)測方法存在“過擬合”現(xiàn)象,而基于RVM的煤自燃預(yù)測方法預(yù)測精度高,且具有預(yù)測誤差小、泛化能力強(qiáng)、模型更稀疏等優(yōu)點,更適合于對煤自燃等復(fù)雜非線性問題的預(yù)測。