楊怡婷 歐陽名三
摘要:將粗糙集和支持向量機(jī)兩種理論相結(jié)合應(yīng)用于水泥回轉(zhuǎn)窯的小樣本故障診斷。首先介紹了粗糙集(RS)理論和支持向量機(jī)(SVM)理論的基本理論知識,然后將RS理論應(yīng)用于水泥回轉(zhuǎn)窯故障信息的知識約簡,再利用SVM理論對RS理論約簡后的數(shù)據(jù)進(jìn)行訓(xùn)練和分類。這種融合之后的診斷方法不僅充分發(fā)揮了兩種理論的優(yōu)點,同時克服了SVM對冗余信息和有用信息識別的局限性,有效地降低了SVM的輸入信息空間維數(shù),彌補(bǔ)了RS理論法對輸入信息中的噪聲敏感、抗干擾能力差的缺點,有效地提高了診斷的效率和準(zhǔn)確率。
關(guān)鍵詞:小樣本故障診斷;水泥回轉(zhuǎn)窯;粗糙集;支持向量機(jī)
中圖分類號:TP206.3 文獻(xiàn)標(biāo)志碼:A
文章編號:1672-1098(2015)01-0019-05
新型干法水泥生產(chǎn)中最重要的設(shè)備是回轉(zhuǎn)窯系統(tǒng),回轉(zhuǎn)窯的故障一般可以分為生產(chǎn)工藝故障和運行設(shè)備故障兩類,其中工藝故障是指在水泥生產(chǎn)過程中由于工藝的問題,導(dǎo)致許多工藝參數(shù)偏離正常幅值而引發(fā)的故障;設(shè)備故障是指設(shè)備的機(jī)械、電氣等方面的原因造成的故障。這兩種故障相比較,工藝故障的種類多而復(fù)雜,要將全部的工藝參數(shù)進(jìn)行分析較為困難,可以選取部分主要工藝參數(shù)及次要工藝參數(shù)對其故障進(jìn)行診斷。
粗糙集(Rough Sets,RS)理論是一種新的處理模糊和不確定性知識的數(shù)學(xué)工具。它不需要原始數(shù)據(jù)的任何初始或附加信息,其主要思想就是在保持分類能力不變的前提下,通過對數(shù)據(jù)屬性的約簡,導(dǎo)出最終決策或分類規(guī)則[1];支持向量機(jī)(Support Vector Machine,SVM)從本質(zhì)上講是一種核方法,在學(xué)習(xí)樣本數(shù)較少的情況下,支持向量機(jī)分類方法具有較強(qiáng)的適應(yīng)性、更好的分類能力和更高的計算效率,為設(shè)備故障診斷提供了很好的數(shù)據(jù)實時處理的手段。
以水泥回轉(zhuǎn)窯的小樣本故障數(shù)據(jù)為研究對象,運用RS-SVM診斷模型對回轉(zhuǎn)窯的故障進(jìn)行診斷[2],并選取同樣的數(shù)據(jù)樣本,與單一的SVM診斷模型對其診斷的結(jié)果做比較,證實該方法的優(yōu)點,具有很高的實時性、有效性和可靠性。
1粗糙集與支持向量機(jī)的基本理論
11粗糙集的基本理論
11.1粗糙集的基本定義
定義1給定知識庫(近似空間)K=(U,S),其中U為論域,S表示論域U上的等價關(guān)系簇,則XU和論域U上的一個等價關(guān)系R∈IND(K),定義子集X關(guān)于知識R的下近似和上近似分別為
R(X)={x|(x∈U)∧([x]RX)}=U{Y|(Y∈U/R)∧(YX)}
R(X)={x|(x∈U)∧([x]R∩X≠)}=U{Y|(Y∈U/R)∧(Y∩X≠)}
集合X的上近似和下近似如圖1所示。
圖1粗糙集上近似、下近似示意圖[3]
定義2給定論域U和其上的一個等價關(guān)系R,XU,若R(X)=R(X),稱集合X是關(guān)于論域U的相對于知識R的R-精確集;若
R(X)≠R(X),則稱集合X是關(guān)于論域U的相對于知識R的R-粗糙集。
112屬性約簡的差別矩陣方法
定義3設(shè)DT=(U,C∪D,V,f )是一個決策表,其中論域是對象的一個非空有限集合U={X1,X2,…,Xn},|U|=n,則定義
Mn×n=(cij)n×n=c11c12…c1n
c21c22…c2ncn1cn2…cnn=
c11c12…c1n*c22…c2n**…cnn=
c11*…*c21c22…*cn1cn2…cnn,為決策表的差別矩陣,其中i,j=1,2,…,n。
cij={a|(a∈C)∧(fa(xi)≠fa(xj))},fD(xi)≠fD(xj)
,fD(xi)≠fD(xj)∧fC(xi)=fC(xj)
-, fD(xi)=fD(xj)
常用下三角或上三角矩陣表示決策表的差別矩陣[4]。這種算法可以在Microsoft Visual FoxPro 60下運行程序矩陣算法.prg得到約簡結(jié)果,矩陣算法的程序流程如圖2所示。
圖2矩陣算法的程序流程圖
12支持向量機(jī)的基本理論
支持向量機(jī)是一種較新的統(tǒng)計學(xué)習(xí)方法,它實現(xiàn)了結(jié)構(gòu)風(fēng)險的最小化,是一種實用的數(shù)據(jù)挖掘方法。其解與樣本數(shù)據(jù)的分布有一定關(guān)系,最終可以得到全局最優(yōu)性的解。
121支持向量機(jī)的基本原理支持向量機(jī)的分類基本思想如圖3所示的最優(yōu)分類面,可以看出,這種分類方法不僅可以得到不同的兩類,并且兩類之間的間隔最大。距離最優(yōu)分類超平面最近的向量就叫支持向量(Support Vector,SV)。
圖3最優(yōu)分類面示意圖
通過對最優(yōu)問題的求解最終可以求出支持向量,再結(jié)合相關(guān)參數(shù),即可得到最終最優(yōu)判別函數(shù)式,也就是SVM。
f(x)=sgn[(w*)T(x)+b*]=sgn(∑ni=1a*i yiK(xi,x)+b*)(1)
若將以上函數(shù)式看成一個神經(jīng)網(wǎng)絡(luò),也可以得到如圖4所示的支持向量網(wǎng)絡(luò)。
圖4支持向量機(jī)工作原理示意圖
122SVM診斷模型的設(shè)計為了使SVM診斷模型更適應(yīng)于小樣本的數(shù)據(jù)信息,且增強(qiáng)其分類診斷能力,可以分以下四步來設(shè)計診斷模型:首先對小樣本數(shù)據(jù)信息進(jìn)行預(yù)處理;其次根據(jù)式(1)計算選擇合適的核函數(shù);再次進(jìn)行故障分類器的構(gòu)造和參數(shù)的選擇;最后,將預(yù)處理之后的數(shù)據(jù)信息應(yīng)用于該模型,最終求出診斷結(jié)果[5]。
1) 樣本的預(yù)處理。利用式(2)對樣本數(shù)據(jù)進(jìn)行歸一化操作,找出特征信息。
Xi=Xi-X minX max-X min(2)
2) 模型核函數(shù)的選擇。目前常用的核函數(shù)主要有三類:多項式核函數(shù)、徑向基核函數(shù)和S形核函數(shù)。本設(shè)計采用的是徑向基核函數(shù),其函數(shù)式為endprint
K(x,xi)=exp(-|x-xi|2σ2)(3)
3) 故障分類器的構(gòu)造和參數(shù)的選擇。為了實現(xiàn)其故障形式的分類識別,需要選擇多分類算法來構(gòu)造支持向量機(jī)多分類器[6]。使用一對余(1-a-r)方法,這種方法有較好的分類效果。
2回轉(zhuǎn)窯的故障診斷
21故障診斷原理和步驟
采用粗糙集和支持向量機(jī)理論相結(jié)合的方法對水泥回轉(zhuǎn)窯的小樣本故障數(shù)據(jù)進(jìn)行診斷,其診斷流程如圖5所示。
圖5基于RS和SVM的故障診斷流程圖
2.2實例驗證
221水泥回轉(zhuǎn)窯故障樣本數(shù)據(jù)這里選用36個水泥回轉(zhuǎn)窯的故障信息樣本(見表1)。決策屬性選取常見的工藝故障和正常狀態(tài)作為分析對象,分別為窯內(nèi)結(jié)大蛋、窯后結(jié)圈、跑生料、紅窯、篦冷機(jī)“堆雪人”和正常狀態(tài),對應(yīng)表1中的工況1、工況2、工況3、工況4、工況5、工況6;條件屬性選取7個,分別為窯主機(jī)電流、窯尾溫度、窯尾負(fù)壓、窯頭溫度、窯頭負(fù)壓、分解爐出口溫度、窯筒體溫度,用F1、F2、F3、F4、F5、F6、F7來表示。
22.2粗糙集預(yù)處理利用粗糙集方法對決策表進(jìn)行預(yù)處理,首先對信息表離散化處理,然后采用基于屬性差別矩陣的屬性約簡方法,在Microsoft Visual FoxPro 60下運行程序:矩陣算法.prg,獲得最優(yōu)的約簡為{F1,F(xiàn)2,F(xiàn)3,F(xiàn)7}。
223故障分類器的構(gòu)造和樣本的訓(xùn)練 歸一化操作后的故障信息如表2所示,將36組樣本數(shù)據(jù)信息分為2類,訓(xùn)練樣本選取其中的24組,測試樣本選取另12組。
以表2中的24個樣本數(shù)據(jù)作為訓(xùn)練樣本,所有分類器均采用高斯徑向基核函數(shù),采用1-a-r SVM多類分類算法。這里要注意的是LIBSVM軟件對輸入的數(shù)據(jù)有嚴(yán)格的格式要求,所以在進(jìn)行SVM計算之前要對樣本數(shù)據(jù)文件進(jìn)行轉(zhuǎn)換,使其符合LIBSVM輸入數(shù)據(jù)的格式要求[7]。1-a-r SVM:將正常狀態(tài)的4個樣本和其余5種故障的4×5=20個樣本作為分類器的兩類輸入,分別標(biāo)識為+1和-1,對應(yīng)6種工作狀態(tài)共建立6個兩類分類器SVM0、SVM1、SVM2、SVM3、SVM4、SVM5(其中SVMn代表n類與余類樣本之間建立的兩類支持向量機(jī))。1-a-r SVM多故障分類器[8]的流程如圖6所示,其中X是測試樣本。
圖61-a-r SVM多故障分類器流程圖
224診斷結(jié)果的分析與比較取6種狀態(tài)共計12個樣本數(shù)據(jù)進(jìn)行測試,將測試樣本輸入到6個1-a-r SVM分類器中。在分類測試中,取參數(shù)C=10,σ=0.2,分類結(jié)果如表3所示,該結(jié)果顯示1-a-r SVM的分類算法實現(xiàn)了對所有測試樣本的正確分類,識別結(jié)果完全正確。
表31-a-r SVM的分類結(jié)果
測試(樣本數(shù)目為2)工況1(0 0)工況2(1 1)工況3(2 2)工況4(3 3)工況5(4 4)工況6(5 5)
SVM0輸出1 1-1 -1-1 -1-1 -1-1 -1-1 -1
SVM1輸出-1 -11 1-1 -1-1 -1-1 -1-1 -1
SVM2輸出-1 -1-1 -11 1-1 -1-1 -1-1 -1
SVM3輸出-1 -1-1 -1-1 -11 1-1 -1-1 -1
SVM4輸出-1 -1-1 -1-1 -1-1 -11 1-1 -1
SVM5輸出-1 -1-1 -1-1 -1-1 -1-1 -11 1
為驗證模型在水泥回轉(zhuǎn)窯故障診斷中的有效性,論文選取相同的5個故障測試樣本,診斷結(jié)果如表4所示。
表4故障診斷結(jié)果比較
故障樣本診斷結(jié)果樣本實際故障
11(窯內(nèi)結(jié)大蛋)1(窯內(nèi)結(jié)大蛋)
22(窯后結(jié)圈)2(窯后結(jié)圈)
33(跑生料)3(跑生料)
44(紅窯)4(紅窯)
55(篦冷機(jī)堆雪人)5(篦冷機(jī)堆雪人)
由表4可見,診斷結(jié)果也全部正確,說明了此融合方法的可行性與有效性。為了論證此融合方法的效果,將這36組小樣本故障數(shù)據(jù)在相同的條件下,分別采用單一的支持向量機(jī)方法和粗糙集與支持向量機(jī)相結(jié)合的方法進(jìn)行試驗比較,得到結(jié)果如表5所示。
表5實驗結(jié)果比較
故障診斷模型故障樣本數(shù)正判數(shù)目診斷時間/s
RS-SVM模型36330.32
SVM模型36300.67
由表5的診斷結(jié)果可以明顯看出,在完全相同的外界條件下,從時間上分析,RS-SVM模型比單一的SVM模型要快一倍,且診斷的正判數(shù)目也較高。因此,RS-SVM的診斷模型更具備高準(zhǔn)確率的特點,更適用于實時的故障診斷。
3結(jié)語
本文介紹了粗糙集和支持向量機(jī)兩種理論方法,并將兩種方法融合后應(yīng)用于水泥回轉(zhuǎn)窯的小樣本故障診斷中去。事實證明,這種RS-SVM診斷模型更具有實效性。所提出的水泥回轉(zhuǎn)窯故障診斷方法,為回轉(zhuǎn)窯設(shè)備生產(chǎn)企業(yè)、水泥生產(chǎn)企業(yè)和相關(guān)科研院所之間故障診斷知識共享提供了一個平臺,提高實際的診斷能力,對生產(chǎn)能發(fā)揮很好的作用。
參考文獻(xiàn):
[1]李天瑞. 粗糙集理論及應(yīng)用[J].國際學(xué)術(shù)動態(tài),2013(2):13-15.
[2]吳立帥,葛玻,宋書中. 基于粗糙集與支持向量機(jī)的變壓器故障診斷[J].電源技術(shù),2014(4):768-770.
[3]王磊,李天瑞. 基于矩陣的粗糙集上下近似的計算方法[J].模式識別與人工智能, 2011(6):756-762.
[4]王平. 基于粗糙集屬性約簡的分類算法研究與應(yīng)用[D].大連:大連理工大學(xué), 2013:51-56.
[5]趙四軍,王少萍,吳柯銳. 基于粗糙集和支持向量機(jī)的航空液壓泵故障診斷[J].中北大學(xué)學(xué)報, 2010(3):238-242.
[6]董曉睿. 基于支持向量機(jī)的多分類模型的研究和設(shè)計[D].南昌:南昌大學(xué), 2013:30-52.
[7]郎許飛. 基于粗糙集與支持向量機(jī)的異步電動機(jī)轉(zhuǎn)子故障診斷的研究[D].黑龍江:東北林業(yè)大學(xué),2013:44-57.
[8]王金彪,周偉,王澍.基于集成支持向量機(jī)的故障診斷方法研究[J].電光與控制,2012(2):87-91.
(責(zé)任編輯:何學(xué)華,吳曉紅)endprint