單亞峰,湯月,任仁,謝鴻
(遼寧工程技術(shù)大學(xué)電氣與控制工程學(xué)院,遼寧葫蘆島125105)
基于鄰域粗糙集與支持向量極端學(xué)習(xí)機(jī)的瓦斯傳感器故障診斷*
單亞峰*,湯月,任仁,謝鴻
(遼寧工程技術(shù)大學(xué)電氣與控制工程學(xué)院,遼寧葫蘆島125105)
針對(duì)于瓦斯傳感器故障診斷速度慢、診斷精度不高的問(wèn)題,以常見(jiàn)的沖擊型、漂移型、偏置型和周期型傳感器輸出故障作為研究對(duì)象,提出一種基于鄰域粗糙集(NRS)和支持向量極端學(xué)習(xí)機(jī)(SVM-ELM)的故障診斷方法。首先對(duì)瓦斯傳感器的特征屬性值進(jìn)行歸一化處理,然后利用NRS信息約簡(jiǎn)理論降低屬性維度,提取出影響瓦斯傳感器的關(guān)鍵屬性構(gòu)成約簡(jiǎn)集。將約簡(jiǎn)集作為SVM-ELM的輸入進(jìn)行訓(xùn)練,利用訓(xùn)練好的SVM-ELM對(duì)測(cè)試樣本進(jìn)行模式識(shí)別。最后通過(guò)實(shí)驗(yàn)對(duì)比驗(yàn)證該方法具有訓(xùn)練速度快、分類精度高的特點(diǎn),辨識(shí)正確率在95%以上,能夠顯著提高故障診斷的速度和準(zhǔn)確性。
瓦斯傳感器;鄰域粗糙集(NRS);支持向量極端學(xué)習(xí)機(jī)(SVM-ELM);故障診斷
EEACC:7230doi:10.3969/j.issn.1004-1699.2016.09.018
瓦斯傳感器作為煤礦安全監(jiān)測(cè)系統(tǒng)中的關(guān)鍵部件,它肩負(fù)著檢測(cè)礦井瓦斯?jié)舛鹊闹厝?,它輸出的信?hào)正確與否直接關(guān)系到整個(gè)煤礦瓦斯安全監(jiān)測(cè)系統(tǒng)的安全水平的高低和性能好壞[1],然而煤礦井下高溫、高壓等惡劣的環(huán)境,常常導(dǎo)致瓦斯傳感器輸出失真,靈敏度下降,準(zhǔn)確性、可靠性降低,從而導(dǎo)致誤報(bào)的情況[2]。作為煤礦安全檢測(cè)系統(tǒng)中重要部件,瓦斯傳感器發(fā)生故障后及時(shí)準(zhǔn)確地對(duì)其做出診斷和修復(fù),可以有效地保護(hù)人們生命財(cái)產(chǎn)的安全,因此,對(duì)瓦斯傳感器進(jìn)行故障檢測(cè)與診斷的研究是具有重要意義的。近年來(lái),眾多學(xué)者在故障診斷領(lǐng)域做了大量研究,并取得了一定的研究成果,采用的算法無(wú)非也是神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等,但經(jīng)實(shí)踐證明,這些方法存在一定的缺陷,文獻(xiàn)[3]將神經(jīng)網(wǎng)絡(luò)應(yīng)用于變壓器的故障診斷中,盡管該方法一定程度上提高了診斷的準(zhǔn)確性,但在小樣本學(xué)習(xí)訓(xùn)練上具有局限性,而瓦斯傳感器故障診斷訓(xùn)練樣本有限,無(wú)法達(dá)到分類精度高的要求。文獻(xiàn)[4]將支持向量機(jī)應(yīng)用于滾動(dòng)軸承的故障診斷中,雖然解決了小樣本問(wèn)題,彌補(bǔ)了神經(jīng)網(wǎng)絡(luò)的不足,但其性能對(duì)參數(shù)選擇的依賴性很高,在一定程度上影響了瓦斯傳感器故障診斷的速度。Huang等提出的極端學(xué)習(xí)機(jī)算法是近幾年應(yīng)用比較廣泛的新型機(jī)器學(xué)習(xí)方法[5],吸引了許多學(xué)者的目光,然而傳統(tǒng)的極端學(xué)習(xí)機(jī)存在隱含層節(jié)點(diǎn)個(gè)數(shù)選擇困難問(wèn)題,本文有效結(jié)合支持向量機(jī)中的核函數(shù)映射,構(gòu)建支持向量極端學(xué)習(xí)機(jī)模型算法,克服了傳統(tǒng)極端學(xué)習(xí)機(jī)的缺陷[6],為機(jī)器學(xué)習(xí)提供了理論依據(jù)。為了提高瓦斯傳感器故障診斷的精度和效率,有必要對(duì)提取的冗余特征信息進(jìn)行屬性約簡(jiǎn)。鄰域粗糙集數(shù)值型屬性約簡(jiǎn)算法[7]能夠直接處理數(shù)值型屬性,快速準(zhǔn)確地提取出關(guān)鍵屬性,無(wú)須對(duì)其進(jìn)行離散化處理,無(wú)論在選擇特征數(shù)量和分類精度方面都有較大的優(yōu)勢(shì)。
通過(guò)上述分析,本文將鄰域粗糙集與支持向量極端學(xué)習(xí)機(jī)有機(jī)結(jié)合,充分發(fā)揮兩者的優(yōu)勢(shì),提出一種有效的瓦斯傳感器故障診斷方法,通過(guò)MATLAB仿真實(shí)驗(yàn)對(duì)比分析驗(yàn)證該方法具有收斂速度快,分類精度高的優(yōu)點(diǎn)。
1.1鄰域粗糙集理論
鄰域粗糙集是胡清華[8]等人利用鄰域模型對(duì)經(jīng)典粗糙集理論的一種拓展模型,該模型以實(shí)數(shù)空間中的每一個(gè)點(diǎn)形成一個(gè)鄰域δ,δ鄰域族構(gòu)成了描述空間中任一概念的基本信息粒子。經(jīng)典粗糙集只能處理完備的信息,還要對(duì)樣本數(shù)據(jù)進(jìn)行離散化,這就不可避免地對(duì)數(shù)據(jù)的準(zhǔn)確性造成一定的信息影響,計(jì)算結(jié)果往往取決于離散化的效果。而鄰域粗糙集的最大優(yōu)點(diǎn)在于,可以直接處理數(shù)值型屬性,不需要進(jìn)行離散化,這樣就使得鄰域粗糙集在屬性約簡(jiǎn)和分類器的構(gòu)造上都有更大的優(yōu)勢(shì)。
1.2前向貪心數(shù)值屬性約簡(jiǎn)
鄰域粗糙集中前向搜索算法可以保證重要的屬性優(yōu)先被加入到約簡(jiǎn)的行列匯總,不損失重要的特征,而后向搜索就很難保證這樣的結(jié)果,因此就會(huì)使一些冗余特征的決策系統(tǒng)的一些重要屬性被刪除,從而致使系統(tǒng)的區(qū)分能力降低,因此文中選取前向貪心數(shù)值屬性約簡(jiǎn)算法。屬性的重要度由屬性本身、屬性相對(duì)屬性子集、決策變量組成的函數(shù)。此算法是根據(jù)屬性的重要度指標(biāo)來(lái)構(gòu)造貪心式屬性約簡(jiǎn)算法,簡(jiǎn)單地說(shuō)就是以空集為起點(diǎn),計(jì)算全部剩余知識(shí)屬性的屬性重要度,取最大重要度數(shù)值的屬性加入到約簡(jiǎn)集合中,直到剩余屬性的重要度全部為0時(shí)就不再加入新的屬性,即系統(tǒng)的依賴型函數(shù)不再發(fā)生任何變化。基于鄰域粗糙集模型的數(shù)值屬性約簡(jiǎn)算法如下:
在瓦斯?jié)舛葯z測(cè)過(guò)程中,瓦斯傳感器的輸出由風(fēng)速、風(fēng)量、溫度、CO2及其臨近測(cè)點(diǎn)的瓦斯?jié)舛戎倒餐瑳Q定[9],這些數(shù)據(jù)有著不同的工程單位,各變量的大小在數(shù)值上差異也很大,直接使用原始測(cè)量數(shù)據(jù)進(jìn)行計(jì)算可能丟失信息和引起數(shù)值計(jì)算的不穩(wěn)定,因此要對(duì)各參數(shù)進(jìn)行歸一化處理。所謂對(duì)數(shù)據(jù)的歸一化處理是對(duì)數(shù)據(jù)進(jìn)行尺度變換和預(yù)處理。尺度變換常常將它們變換到[-1,0]或[0,1]的范圍,這里數(shù)據(jù)的歸一化采用如下算式[10]:
式中,x,x′為歸一化前、后數(shù)據(jù),xMax、xMax為歸一化前數(shù)據(jù)的最大和最小值。
歸一化后的數(shù)據(jù)可以消除由于不同特征因子的量綱不同和數(shù)量級(jí)不同所帶來(lái)的影響。
2.1極端學(xué)習(xí)機(jī)(ELM)理論
ELM是一種新的前饋神經(jīng)網(wǎng)絡(luò)模型[11],克服了收斂速度慢,易陷入局部最優(yōu)等缺陷,其輸入權(quán)值和隱含層偏置值隨機(jī)生成且在訓(xùn)練中保持不變,僅需采用線性回歸的方法確定輸出權(quán)值,極大的提高了網(wǎng)絡(luò)泛化能力和學(xué)習(xí)速度,其結(jié)構(gòu)如圖1所示。
圖1 極端學(xué)習(xí)機(jī)結(jié)構(gòu)示意圖
ELM數(shù)學(xué)表達(dá)式為:
式中:m,M,n分別為網(wǎng)絡(luò)輸入層、隱含層和輸出層的節(jié)點(diǎn)數(shù);g(x)為激活函數(shù),一般取Sigmoid函數(shù)。設(shè)由N個(gè)不同的樣本(xi,yi),(1≤i≤N),其中yi=[yi,1,yi,2,…,yi,n]T∈Rn,ok=[ok,1,ok,2,…,ok,n]T為網(wǎng)絡(luò)輸出,αi=[α1,i,α2,i,…,αm,i]為輸入層和第i個(gè)隱含層的連接權(quán)值,bi為隱含層閾值,βi=[βi,1,βi,2,…,βi,n]T為第i個(gè)隱含層和輸出層的輸出權(quán)值。如果一個(gè)有M個(gè)隱含點(diǎn)的SLFNs能以接近于0的誤差來(lái)逼近這N個(gè)樣本,則存在αi,βi,bi有:
簡(jiǎn)化為:Hβ=Y式中:H為網(wǎng)絡(luò)隱含層輸出矩陣;β為輸出權(quán)值矩陣;Y為期望輸出矩陣。表示如下:
在訓(xùn)練開(kāi)始時(shí),輸入層到隱含層的連接權(quán)值α和隱含層閾值b隨機(jī)生成并保持固定,僅需訓(xùn)練確定輸出權(quán)值β。通常采用偽逆算法一步計(jì)算得
式中:H*是矩陣H的MP廣義逆。對(duì)?求解后,完成對(duì)ELM的網(wǎng)絡(luò)訓(xùn)練過(guò)程。
2.2極端學(xué)習(xí)機(jī)算法改進(jìn)
影響極端學(xué)習(xí)機(jī)建模性能的一個(gè)重要參數(shù)即隱含層節(jié)點(diǎn)個(gè)數(shù),通常需要根據(jù)訓(xùn)練任務(wù)的不同,采用較為繁瑣的交叉驗(yàn)證方法進(jìn)行選擇[12]。Schrauwen和Williams等學(xué)者已經(jīng)證明:具有無(wú)窮個(gè)隱節(jié)點(diǎn)的神經(jīng)網(wǎng)絡(luò)與支持向量機(jī)方法是等價(jià)的,而具有有限隱節(jié)點(diǎn)的神經(jīng)網(wǎng)絡(luò)可看作是支持向量機(jī)方法的低維逼近。為避免極端學(xué)習(xí)機(jī)模型中隱節(jié)點(diǎn)選擇問(wèn)題,本文將傳統(tǒng)極端學(xué)習(xí)機(jī)的隱含層節(jié)點(diǎn)映射h(x)擴(kuò)展為核方法中的核函數(shù)映射φ(x),對(duì)支持向量機(jī)進(jìn)行低維逼近,以此構(gòu)建支持向量極端學(xué)習(xí)機(jī)模型(SVM-ELM)。該模型有效結(jié)合了極端學(xué)習(xí)機(jī)訓(xùn)練簡(jiǎn)便和核方法的泛化性能好的優(yōu)勢(shì),且表現(xiàn)出較傳統(tǒng)極端學(xué)習(xí)機(jī)更好的學(xué)習(xí)能力。
在該極端學(xué)習(xí)機(jī)的特殊實(shí)現(xiàn)中,隱含層特征映射h()
x可以是未知的,可對(duì)極端學(xué)習(xí)機(jī)定義如下核矩陣:
因此,輸出函數(shù)為
式中C為正則化系數(shù),以平衡模型精度和模型復(fù)雜度。
核函數(shù)的選擇有以下3種:一是利用專家經(jīng)驗(yàn)選擇核函數(shù);二是核函數(shù)的選取時(shí),分別適用不同的核函數(shù),比較出誤差最小的核函數(shù)就是最好的核函數(shù);三是采用由Smits等提出的構(gòu)造混合核函數(shù)方法。根據(jù)長(zhǎng)久經(jīng)驗(yàn)及實(shí)踐證實(shí),徑向基核函數(shù)是目前應(yīng)用較廣泛的一種核函數(shù),本文選用該函數(shù)作為支持向量極端學(xué)習(xí)機(jī)的核函數(shù)。
NRS-SVM-ELM模型算法步驟:
步驟1 根據(jù)式(2)利用MATLAB軟件對(duì)各類傳感器采集的樣本數(shù)據(jù)進(jìn)行歸一化處理;
步驟2 運(yùn)用鄰域粗糙集方法,按照上述步驟進(jìn)行屬性約簡(jiǎn);
步驟3 確定K(u,v),初始化支持向量機(jī)極端學(xué)習(xí)機(jī);
步驟4 給定訓(xùn)練樣本集N,激活函數(shù)g(x)以及隱含層節(jié)點(diǎn)數(shù)M,隨機(jī)生成輸入層到隱含層的連接權(quán)值α和隱含層閾值b,根據(jù)偽逆算法確定輸出權(quán)值β,進(jìn)行訓(xùn)練;
步驟5 判斷
是否成立,若成立轉(zhuǎn)步驟6,否則轉(zhuǎn)步驟4;
步驟6利用訓(xùn)練好的支持向量極端學(xué)習(xí)機(jī)對(duì)測(cè)試樣本上進(jìn)行故障識(shí)別;
3.1實(shí)驗(yàn)配置
實(shí)驗(yàn)選取山西某煤礦正常工作面的傳感器采集到5類狀態(tài)下的各60組實(shí)測(cè)數(shù)據(jù),將前40組數(shù)據(jù)作為訓(xùn)練樣本集,后20組數(shù)據(jù)作為測(cè)試樣本集。用U={}1,2,…,60來(lái)表示60個(gè)樣本集合,以風(fēng)速V、溫度T、CO2濃度C、上隅角傳感器T0、回風(fēng)巷瓦斯傳感器T1、T2、T3、T4和進(jìn)風(fēng)巷瓦斯傳感器T5作為樣本集合U上的特征屬性A,A={V,T,C,T0,T1,T2,T3,T4,T5},以識(shí)別類型沖擊型、漂移型、偏置型、周期性和正常型作為決策屬性D,D={di},i=1,2,3,4,5。經(jīng)查閱文獻(xiàn),通過(guò)長(zhǎng)久經(jīng)驗(yàn)將前40組數(shù)據(jù)進(jìn)行預(yù)處理得到約簡(jiǎn)后的關(guān)鍵屬性集red={V,T,C,T1,T2},將約簡(jiǎn)集對(duì)應(yīng)的數(shù)據(jù)作為SVM-ELM的輸入進(jìn)行編碼和訓(xùn)練,完成網(wǎng)絡(luò)訓(xùn)練,然后用另外的20組測(cè)試樣本進(jìn)行測(cè)試。
另外,將支持向量極端學(xué)習(xí)機(jī)的輸出層節(jié)點(diǎn)設(shè)定為4,這5種狀態(tài)對(duì)應(yīng)關(guān)系如表1。根據(jù)約簡(jiǎn)集red可知輸入層節(jié)點(diǎn)個(gè)數(shù)為5,將隱含層節(jié)點(diǎn)數(shù)設(shè)定為6,則該支持向量極端學(xué)習(xí)機(jī)采用5-6-4的結(jié)構(gòu)。
表1 傳感器狀態(tài)與模型輸出映射關(guān)系
3.2結(jié)果分析
取5類狀態(tài)下的各20組實(shí)測(cè)數(shù)據(jù)進(jìn)行測(cè)試,由于篇幅限制只列出部分輸出結(jié)果,見(jiàn)表2,全部樣本診斷識(shí)別后的分類情況如圖2所示,可以看出每種故障的識(shí)別率都在95%以上,符合辨識(shí)分類的要求。因此,本文的設(shè)計(jì)方法可以有效地診斷出瓦斯傳感器的故障類型,達(dá)到了最初的設(shè)計(jì)目的。
圖2 樣本識(shí)別的分類結(jié)果
表2 實(shí)驗(yàn)輸出結(jié)果
3.3對(duì)比實(shí)驗(yàn)
為了驗(yàn)證本文提出的NRS和SVM-ELM相結(jié)合的故障診斷模型的的優(yōu)越性,進(jìn)行了如下對(duì)比實(shí)驗(yàn),分別將約簡(jiǎn)前后的原始數(shù)據(jù)輸入到OS-ELM[13],PCA-PSO-ELM[14]和SVM-ELM模型中,得到故障診斷結(jié)果對(duì)比見(jiàn)表3。其中極端學(xué)習(xí)機(jī)的輸入輸出節(jié)點(diǎn)個(gè)數(shù)及參數(shù)設(shè)置與文中3.1小節(jié)保持一致,同樣選取40組訓(xùn)練樣本,20組測(cè)試樣本,將訓(xùn)練時(shí)間,診斷時(shí)間和診斷正確率作為評(píng)價(jià)標(biāo)準(zhǔn),進(jìn)行分析。
表3 不同模型的屬性約簡(jiǎn)前后診斷結(jié)果對(duì)比表
從表3可以看出,支持向量極端學(xué)習(xí)模型與傳統(tǒng)的極端學(xué)習(xí)機(jī)和經(jīng)粒子群優(yōu)化的極端學(xué)習(xí)機(jī)算法相比,盡管在訓(xùn)練時(shí)間和診斷時(shí)間上并沒(méi)有太明顯的優(yōu)勢(shì),但診斷的準(zhǔn)確率明顯提高,無(wú)論是采用OS-ELM、PCA-PSO-ELM還是SVM-ELM模型,經(jīng)NRS進(jìn)行屬性約簡(jiǎn)后,三種模型的精度都有所提高,而且還極大的縮短了訓(xùn)練和診斷時(shí)間,診斷速度顯著提升。實(shí)驗(yàn)數(shù)據(jù)表明,本文提出的基于NRS與SVM-ELM的故障診斷模型算法要明顯優(yōu)于傳統(tǒng)的極端學(xué)習(xí)機(jī),具有更好的泛化能力,可應(yīng)用于其他工程領(lǐng)域。
本文將鄰域粗糙集與支持向量極端學(xué)習(xí)機(jī)相耦合,充分發(fā)揮兩者的優(yōu)勢(shì),提出一種能夠快速、準(zhǔn)確識(shí)別出故障類型的模型算法。鄰域粗糙集屬性約簡(jiǎn)算法相比于其它屬性約簡(jiǎn)算法能夠快速提煉出影響故障診斷精度的關(guān)鍵屬性,縮減了支持向量極端學(xué)習(xí)機(jī)的輸入空間規(guī)模,極大地減少了計(jì)算量,具有很好的泛化能力。支持向量極端學(xué)習(xí)機(jī)故障診斷模型克服了傳統(tǒng)極端學(xué)習(xí)機(jī)隱含層節(jié)點(diǎn)選擇困難的缺陷,使診斷速度更快,診斷精度更高。NRS與SVM-ELM兩種方法的結(jié)合不僅能夠擴(kuò)大系統(tǒng)處理信息的廣度,同時(shí)豐富了系統(tǒng)處理信息的方法,極大地提高了瓦斯傳感器故障診斷的準(zhǔn)確率,具有一定理論研究?jī)r(jià)值和工程應(yīng)用意義。
[1]黃凱峰,劉澤功,王其軍,等.基于ASGSO-SVR模型的瓦斯傳
單亞峰(1968-),男,副教授,遼寧阜新人,遼寧工程技術(shù)大學(xué)碩士研究生導(dǎo)師,1991年畢業(yè)于哈爾濱建筑工程學(xué)院電氣自動(dòng)化專業(yè)。多年來(lái)一直工作在科研和教學(xué)第一線,近年來(lái)發(fā)表論文10余篇,參編教材2部,主持承擔(dān)科研課題多項(xiàng)。主要研究方向?yàn)闄z測(cè)技術(shù)及其應(yīng)用,shanyf68@163.com;
湯月(1992-),女,遼寧錦州人,碩士研究生,主要研究方向?yàn)楝F(xiàn)代傳感技術(shù),764406729@qq.com。
Gas Sensor Fault Diagnosis Based on Neighborhood Rough Set Combined with Support Vector Machine and Extreme Learning Machine*
SHAN Yafeng*,TANG Yue,REN Ren,XIE Hong
(College of Electrical and Control Engineering,Liaoning Technical University,Huludao Liaoning 125105,China)
In order to solve the problem that the gas sensor diagnosis speed is slow and the diagnosis accuracy is not high,this paper takes the common type gas sensor fault such as impact,drift,bias and periodic fault as research ob?ject and proposes a pattern classification and identification of the fault diagnosis of gas sensor method based on neighborhood rough set(NRS)combined with support vector machine and extreme learning machine(SVM-ELM).First of all,normalize the feature attribute of the gas sensor,the reduction set is formed via reducing the attribute di?mension with NRS information reduction theory,including key attributes of the gas sensor.Train SVM-ELM taking the reduction set for input data and recognize the fault patterns using test samples.Finally,through experiment con?trast analysis,this method has the features of fast training speed,high accuracy of classification,and the identifica?tion correct rate is more than 95%.It can significantly improve the effectiveness and accuracy of the fault diagnosis.
gas sensor;neighborhood rough set;Support Vector Machine and Extreme Learning Machine(SVMELM);fault diagnosis
TP212;TP181
A
1004-1699(2016)09-1400-05
項(xiàng)目來(lái)源:國(guó)家自然科學(xué)基金項(xiàng)目(51274118);遼寧省科技攻關(guān)基金項(xiàng)目(2011229011);遼寧省教育廳基金項(xiàng)目(L2012119)
2016-03-14修改日期:2016-04-16