付家才,張鐵山,任 眾
(黑龍江科技學(xué)院,黑龍江 哈爾濱 150027)
我國(guó)是一個(gè)煤炭大國(guó),煤炭資源豐富,且煤炭消費(fèi)量逐年增加。為保證國(guó)民經(jīng)濟(jì)的持續(xù)健康發(fā)展,需要有計(jì)劃地大規(guī)模開(kāi)采煤炭資源。然而,我國(guó)在煤炭開(kāi)采中的安全事故經(jīng)常發(fā)生。其中,冒頂事故是最常見(jiàn)的安全事故之一,給國(guó)家和人民帶來(lái)了巨大的損失。而要避免和減少冒頂事故的發(fā)生,關(guān)鍵就是要對(duì)頂板的安全性能進(jìn)行及時(shí)、有效地檢測(cè),以便工程技術(shù)人員及時(shí)排除安全隱患。
敲幫問(wèn)頂(wall tapping and roof sounding)是依靠人耳極其靈敏的聽(tīng)覺(jué)系統(tǒng)和長(zhǎng)期的實(shí)踐經(jīng)驗(yàn)來(lái)判斷頂板的安全穩(wěn)定性的,是目前被廣泛沿用的對(duì)頂板進(jìn)行安全檢測(cè)的重要途徑。但這種方法對(duì)工人自身技能要求較高,且對(duì)工人的人身安全有一定的安全隱患。因此,研究新的檢測(cè)技術(shù)就顯得非常迫切。其中,基于模式識(shí)別的檢測(cè)是目前研究的重要方向之一。在應(yīng)用現(xiàn)代模式識(shí)別技術(shù)對(duì)頂板進(jìn)行狀態(tài)監(jiān)測(cè)和故障診斷中,功率特征提取和分類器模型設(shè)計(jì)是兩個(gè)至關(guān)重要的因素。本文采用基于聽(tīng)覺(jué)模型和支持向量機(jī)集成算法?;诼?tīng)覺(jué)模型的聲信號(hào)特征提取、分類、識(shí)別的研究,近年來(lái)得到了國(guó)內(nèi)外學(xué)者的高度重視,特別在語(yǔ)音信號(hào)處理方面。但是針對(duì)煤礦頂板敲擊聲音信號(hào)方面重視較少。支持向量機(jī)SVM(Support Vector Machines)是Vapnik等人根據(jù)統(tǒng)計(jì)學(xué)習(xí)理論中結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則提出的。而支持向量機(jī)集成SVME(Support Vector Machine Ensemble)可以提高支持向量機(jī)的分類性能[1-2]。
本文正是基于以上原因,針對(duì)小樣本、多類煤礦頂板,提出了基于支持向量機(jī)集成算法對(duì)煤礦頂板安全性能進(jìn)行檢測(cè)的方法。
人們通過(guò)對(duì)生理聲學(xué)、心理聲學(xué)和信號(hào)處理的研究和分析[3-4],建立了人耳聽(tīng)覺(jué)模型,并且利用此模型來(lái)對(duì)聲音信號(hào)進(jìn)行聽(tīng)覺(jué)譜特征提取。該聽(tīng)覺(jué)譜特征[5]提取過(guò)程如圖1所示。
通過(guò)對(duì)模仿人的聽(tīng)覺(jué)感知機(jī)理進(jìn)行分析,聽(tīng)覺(jué)譜特征提取算法主要有三個(gè)方面的處理:(1)臨界頻帶段分析處理;(2)等響度級(jí)預(yù)處理;(3)等響度轉(zhuǎn)換。利用臨界頻帶分析,計(jì)算模型考慮了耳蝸的分頻特性,由此可以反映人耳的掩蔽效應(yīng)。
圖1 聽(tīng)覺(jué)譜特征提取原理
頂板狀態(tài)模型為利用已知類別的頂板狀態(tài)樣本建立支持向量機(jī)分類器模型。首先給定n個(gè)獨(dú)立樣本,每個(gè)樣本xi有d個(gè)特征,樣本x分別屬于m類頂板狀態(tài)。
X={(xi,yi)}|{xi∈Rd,yi∈{1,2,…,m},i=1,2,…,n}
通過(guò)對(duì)給定的樣本集進(jìn)行訓(xùn)練得到一個(gè)分類器,利用此分類器對(duì)測(cè)試樣本集進(jìn)行分類的算法稱為機(jī)器學(xué)習(xí)算法。
為了提高支持向量機(jī)的分類性能和分類精度,可以把多個(gè)分類器集成起來(lái)。針對(duì)小樣本、多類頂板狀態(tài)診斷問(wèn)題,本文提出的支持向量機(jī)集成(SVME)算法,結(jié)合了敲擊聲音信號(hào)的人耳聽(tīng)覺(jué)譜特征,對(duì)頂板狀態(tài)進(jìn)行診斷。
SVME算法流程如圖2所示。
圖2 支持向量機(jī)集成(SVME)算法流程
如圖2所示,對(duì)于SVME算法而言,首先應(yīng)給定訓(xùn)練樣本集X和訓(xùn)練樣本的初始加權(quán)系數(shù)w1(i)=,i=1,2,…,n;然后,進(jìn)行一個(gè)循環(huán)函數(shù)以訓(xùn)練 T個(gè)個(gè)體SVMC。
在循環(huán)體中,首先從給出的訓(xùn)練樣本集X中按照一定的概率抽取樣本并獲得新的訓(xùn)練樣本Xt;然后,依據(jù)新獲得的訓(xùn)練樣本Xt來(lái)優(yōu)化選擇個(gè)體SVMC核函數(shù)參數(shù),并訓(xùn)練 SVM以獲得分類超平面 ft(Xt);再次,計(jì)算出該分類超平面的加權(quán)分類錯(cuò)誤率;最后,做出一個(gè)判斷:即判斷計(jì)算出的加權(quán)分類錯(cuò)誤率是否≥0.5或=1。如果條件成立,則結(jié)束該循環(huán),并運(yùn)用加權(quán)多數(shù)投票法集成個(gè)體SVMC;反之,則改變加權(quán)系數(shù),進(jìn)行下一輪循環(huán),直至條件成立,退出循環(huán)。
要想獲得一個(gè)高性能和高精度的支持向量機(jī)集成模型,就必需要對(duì)優(yōu)化不敏感損失函數(shù)ε、懲罰系數(shù)c和核參數(shù)γ等參數(shù)進(jìn)行優(yōu)化處理,而這些參數(shù)之間相互影響。實(shí)際上,選擇過(guò)程是一個(gè)優(yōu)化搜索的過(guò)程,由于深度優(yōu)先算法具有全局搜索性能力強(qiáng)、并行性和啟發(fā)式等優(yōu)點(diǎn),所以本文采用深度優(yōu)先算法對(duì)SVMC參數(shù)進(jìn)行尋優(yōu)。深度優(yōu)先算法[6]是一種基于圖論的優(yōu)化算法,其基本思想:為了求得問(wèn)題的解,先選擇某一種可能情況向前(子結(jié)點(diǎn))探索,在探索過(guò)程中,一旦發(fā)現(xiàn)原來(lái)的選擇不符合要求,則回溯至父親結(jié)點(diǎn)重新選擇另一結(jié)點(diǎn),繼續(xù)向前探索。如此反復(fù)進(jìn)行,直至求得最優(yōu)解。深度優(yōu)先搜索的實(shí)現(xiàn)方式可以采用遞歸或者棧來(lái)實(shí)現(xiàn)。
采用深度優(yōu)先搜索對(duì)SVMC參數(shù)c、γ和ε進(jìn)行優(yōu)化的具體步驟如下:
(1)對(duì)SVMC中的參數(shù) c、γ和ε進(jìn)行初始范圍的確定,按照步長(zhǎng)對(duì)參數(shù)c、γ和ε進(jìn)行等量劃分,以此獲得離散數(shù)組。
(2)首先利用LIBSVM軟件采用交叉驗(yàn)證方法對(duì)參數(shù)c、γ和ε進(jìn)行建立模型和預(yù)測(cè);然后對(duì)每組均方根誤差進(jìn)行比較;最后選擇最小的均方根誤差所對(duì)應(yīng)的參數(shù)為本次的SVMC最佳參數(shù)組合。
(3)將本次最優(yōu)參數(shù)和上一次最優(yōu)參數(shù)的均方根誤差進(jìn)行比較,如果均方根誤差小于上一次均方根誤差,則跳轉(zhuǎn)到步驟(4),否則跳轉(zhuǎn)到步驟(5)。
(4)根據(jù)上一次的最優(yōu)參數(shù),并且采用啟發(fā)式方式在該參數(shù)附近進(jìn)行參數(shù)范圍修改,從而加快參數(shù)搜索速度;然后跳轉(zhuǎn)到步驟(1),重新進(jìn)行遞歸運(yùn)算。
(5)參數(shù)優(yōu)化結(jié)束后,退出運(yùn)算,取此時(shí)的參數(shù) c、γ和ε為SVMC的最優(yōu)參數(shù)。
深度優(yōu)先搜索參數(shù)優(yōu)化流程圖如圖3所示。
圖3 深度優(yōu)先搜索參數(shù)優(yōu)化流程
本文實(shí)驗(yàn)數(shù)據(jù)是從我國(guó)東北某大型煤礦井下頂板上采集的,共有4類目標(biāo):一類是安全頂板,另3類是3種危險(xiǎn)頂板 (浮石、剝層和斷裂)。信號(hào)的采樣頻率是20 000 Hz,每個(gè)樣本長(zhǎng)度為4 096個(gè)點(diǎn)。安全頂板、浮石頂板、剝層頂板和斷裂頂板的樣本數(shù)目分別為2 000、200、500、150。 由于受到實(shí)驗(yàn)數(shù)據(jù)采樣頻率(20 000 Hz)的限制,本文只在20~10 000 Hz頻率范圍內(nèi) (即前 22個(gè)臨界頻帶內(nèi))提取了4類頂板的敲擊聲信號(hào)的聽(tīng)覺(jué)譜特征。
在分類實(shí)驗(yàn)中,訓(xùn)練樣本數(shù)目和測(cè)試樣本數(shù)目的比值是1﹕4,提取樣本的聽(tīng)覺(jué)譜特征后,分別用SVME算法和單個(gè)SVMC對(duì)4類目標(biāo)進(jìn)行頂板狀態(tài)診斷實(shí)驗(yàn)。為了避免樣本選取的隨機(jī)性對(duì)實(shí)驗(yàn)結(jié)果帶來(lái)的誤差,實(shí)驗(yàn)分別進(jìn)行了20次,最終結(jié)果為20次實(shí)驗(yàn)結(jié)果的平均值。檢測(cè)結(jié)果如表1所示。
從表1可以看出,支持向量機(jī)集成算法可以有效識(shí)別安全頂板和危險(xiǎn)頂板,并進(jìn)行狀態(tài)診斷,而且其識(shí)別4類目標(biāo)的正確識(shí)別率都比單個(gè)SVMC要高。特別是本文所提出的算法對(duì)危險(xiǎn)頂板的正確識(shí)別率比單個(gè)SVMC提高了2.57%~3.22%。實(shí)驗(yàn)結(jié)果證明,本文提出的支持向量機(jī)集成(SVME)算法是有效的,可以應(yīng)用于煤礦頂板狀態(tài)識(shí)別和故障診斷中。
表1 四類頂板檢測(cè)結(jié)果
本文提出了支持向量機(jī)集成(SVME)算法,采用了深度優(yōu)先搜索對(duì)支持向量機(jī)集成參數(shù)進(jìn)行優(yōu)化,并結(jié)合敲擊聲信號(hào)的人耳聽(tīng)覺(jué)譜特征用于頂板狀態(tài)的分類識(shí)別。實(shí)驗(yàn)證明,本文所提出的SVME算法識(shí)別率較高,可以滿足現(xiàn)場(chǎng)檢測(cè)的要求,為煤礦頂板狀態(tài)診斷提供了新的方法。
[1]VAPNIK V.The nature of statistical learning theory[M].New York: Springer-Verlag, 1999.
[2]楊宏暉,孫進(jìn)才.基于支持向量機(jī)集成的水下目標(biāo)自動(dòng)識(shí)別系統(tǒng)[J].測(cè)控技術(shù), 2006, 25(12).
[3]ZWICKER E,F(xiàn)ASTL H.Psychoacoustics facts and models[M].NewYork: Springer-Verlag,1999.
[4]HERMANSK H.Perceptual linear predictive(PLP)analysisof speech[J].Journal of the Acoustical Society ofAmeri-ca,1990, 87(4): 1738-1751.
[5]楊宏暉,侯宏,曾向陽(yáng).基于聲信號(hào)人耳聽(tīng)覺(jué)譜特征的風(fēng)機(jī)故障診斷[J].儀器儀表學(xué)報(bào),2009,30(1).
[6]李立紅,許元飛.深度優(yōu)先搜索的支持向量機(jī)參數(shù)優(yōu)化算法[J].計(jì)算機(jī)仿真,2011,28(7):216-219.
網(wǎng)絡(luò)安全與數(shù)據(jù)管理2012年17期