劉 彬 劉永記 劉浩然 李 雷 孫美婷
1.燕山大學(xué)信息科學(xué)與工程學(xué)院 ,秦皇島,0660042.燕山大學(xué)電氣工程學(xué)院,秦皇島,066004
基于貝葉斯改進(jìn)結(jié)構(gòu)算法的回轉(zhuǎn)窯故障診斷模型研究
劉 彬1劉永記1劉浩然1李 雷2孫美婷1
1.燕山大學(xué)信息科學(xué)與工程學(xué)院 ,秦皇島,0660042.燕山大學(xué)電氣工程學(xué)院,秦皇島,066004
針對現(xiàn)有改進(jìn)互信息爬山(MI&HC)算法精度低、耗時(shí)長及簡化爬山(SHC)算法產(chǎn)生大量冗余邊的問題,提出一種新的結(jié)構(gòu)學(xué)習(xí)算法,即改進(jìn)爬山(IHC)算法。通過計(jì)算互信息鏈得到貝葉斯初始結(jié)構(gòu),利用條件獨(dú)立性測試以及對孤立節(jié)點(diǎn)進(jìn)行處理來加邊補(bǔ)充貝葉斯初始結(jié)構(gòu)得到完全結(jié)構(gòu),利用改進(jìn)的爬山搜索算子對完全結(jié)構(gòu)進(jìn)行搜索直到得出最優(yōu)結(jié)構(gòu)。將該算法與爬山(HC)算法、MI&HC算法、SHC算法進(jìn)行比較,仿真結(jié)果表明,IHC算法能夠得到較高準(zhǔn)確率的模型,時(shí)間開銷最小而且產(chǎn)生的冗余邊數(shù)遠(yuǎn)遠(yuǎn)少于SHC算法產(chǎn)生的冗余邊數(shù)。最后基于IHC算法,結(jié)合某回轉(zhuǎn)窯數(shù)據(jù)進(jìn)行訓(xùn)練,得到了回轉(zhuǎn)窯工藝參數(shù)的故障診斷模型,對回轉(zhuǎn)窯的燒成帶溫度實(shí)現(xiàn)了較為準(zhǔn)確的故障診斷。
改進(jìn)貝葉斯結(jié)構(gòu)算法;互信息及條件獨(dú)立性測試;故障診斷;水泥回轉(zhuǎn)窯
貝葉斯網(wǎng)絡(luò)是表示隨機(jī)變量之間相互依賴或獨(dú)立關(guān)系的網(wǎng)絡(luò)模型,它由節(jié)點(diǎn)集、有向邊、條件概率表組成,通過圖論和概率論相結(jié)合的方法來直觀地表述數(shù)據(jù)間的相互關(guān)系,目前已被廣泛應(yīng)用在數(shù)據(jù)挖掘和故障診斷等領(lǐng)域[1]。
貝葉斯網(wǎng)絡(luò)學(xué)習(xí)包括結(jié)構(gòu)學(xué)習(xí)和參數(shù)學(xué)習(xí),由結(jié)構(gòu)和數(shù)據(jù)集可確定參數(shù),因此結(jié)構(gòu)學(xué)習(xí)是貝葉斯網(wǎng)絡(luò)學(xué)習(xí)的核心[2]。CHENG等[3]利用互信息及條件獨(dú)立性測試的方法分三階段來訓(xùn)練貝葉斯結(jié)構(gòu),用雙層鄰域作為條件集進(jìn)行條件獨(dú)立性測試,其算法雖然簡單易實(shí)現(xiàn),但僅利用互信息與條件獨(dú)立性測試,計(jì)算代價(jià)較大而且得到的結(jié)構(gòu)準(zhǔn)確率較低;TSAMARDINOS等[4]提出了MMHC(max-min hill-climbing)算法,采用基于約束的局部學(xué)習(xí)和評分搜索方法對爬山(HC)算法的搜索空間加以限制,該算法雖然改善了檢索策略、降低了搜索空間復(fù)雜度,但搜索空間的縮小易導(dǎo)致局部最優(yōu);金焱等[5]針對HC算法易陷入局部最優(yōu)、時(shí)間開銷過大的問題提出了互信息和HC算法結(jié)合的MI&HC(mutual imforma-tion&hill-climbing)算法,利用互信息構(gòu)建初始結(jié)構(gòu)并在此基礎(chǔ)上進(jìn)行爬山搜索,該算法雖然避免了HC算法易陷入局部最優(yōu)的缺點(diǎn),精度與運(yùn)行速度有所提升,但仍不能滿足需求;劉浩然等[6]提出了SHC(simplify hill-climbing)算法,一定程度上解決了HC算法易陷入局部最優(yōu)、效率低的問題,但隨著節(jié)點(diǎn)增多會(huì)產(chǎn)生大量的冗余邊。貝葉斯網(wǎng)絡(luò)可以直接對大量的數(shù)據(jù)進(jìn)行訓(xùn)練建模,通過有向無環(huán)圖直接明了地表達(dá)變量之間的概率轉(zhuǎn)移關(guān)系,而且具有強(qiáng)大的推理功能[7],因此,貝葉斯網(wǎng)絡(luò)被廣泛應(yīng)用于水泥回轉(zhuǎn)窯系統(tǒng):利用結(jié)構(gòu)算法訓(xùn)練回轉(zhuǎn)窯數(shù)據(jù)并建立故障診斷模型,通過模型分析參數(shù)之間的相互影響,找出導(dǎo)致故障發(fā)生的原因并及時(shí)采取相應(yīng)措施[8]。
本文針對現(xiàn)有MI&HC算法、SHC算法存在的一些問題,提出了一種新的算法,即IHC算法。該算法首先計(jì)算節(jié)點(diǎn)間的互信息并利用互信息鏈構(gòu)建貝葉斯初始結(jié)構(gòu),利用條件獨(dú)立性測試尋找暗含邊并將暗含邊添加到初始結(jié)構(gòu)中得到初始完全結(jié)構(gòu),然后對可能出現(xiàn)的孤立節(jié)點(diǎn)進(jìn)行處理,進(jìn)一步對初始完全結(jié)構(gòu)進(jìn)行完善得到貝葉斯完全結(jié)構(gòu),最后在貝葉斯完全結(jié)構(gòu)的基礎(chǔ)之上利用改進(jìn)的爬山搜索算子進(jìn)行搜索,直到得出最優(yōu)結(jié)構(gòu)。該算法不需要節(jié)點(diǎn)序等先驗(yàn)信息,避免了HC算法易陷入局部最優(yōu)的缺點(diǎn),減小了僅利用互信息與條件獨(dú)立性測試帶來的巨大計(jì)算量,同時(shí)也將可能出現(xiàn)的孤立節(jié)點(diǎn)情況考慮在內(nèi)。與HC算法、MI&HC算法相比,本文算法能更加快速準(zhǔn)確地得到貝葉斯結(jié)構(gòu)。與SHC算法相比本文算法縮短了運(yùn)行時(shí)間、提高了準(zhǔn)確度、減少了冗余邊。最后利用IHC算法訓(xùn)練回轉(zhuǎn)窯數(shù)據(jù),建立了回轉(zhuǎn)窯工藝參數(shù)的故障診斷模型,對窯燒成帶溫度實(shí)現(xiàn)了較為準(zhǔn)確的故障診斷。
1.1IHC算法原理
IHC算法首先計(jì)算節(jié)點(diǎn)對之間的互信息,利用互信息鏈構(gòu)建貝葉斯初始結(jié)構(gòu),然后確定條件集元素進(jìn)行條件獨(dú)立性測試,若條件互信息大于閾值η,則說明節(jié)點(diǎn)對之間存在暗含邊,將暗含邊添加到初始結(jié)構(gòu),最后對可能出現(xiàn)的孤立節(jié)點(diǎn)進(jìn)行處理得到完全結(jié)構(gòu)。此時(shí)貝葉斯完全結(jié)構(gòu)不再缺少邊,為避免環(huán)狀結(jié)構(gòu)出現(xiàn),對完全結(jié)構(gòu)初步定向之后結(jié)合改進(jìn)的爬山搜索算子進(jìn)行結(jié)構(gòu)搜索,尋找最優(yōu)結(jié)構(gòu)?;バ畔⒋韮蓚€(gè)隨機(jī)變量X、Y的依賴關(guān)系[9],記作I(X,Y):
(1)
互信息具有非負(fù)對稱性,I(X,Y)=I(Y,X)≥0。大于0說明X、Y之間存在相互影響,在初始結(jié)構(gòu)中表現(xiàn)為兩節(jié)點(diǎn)之間存在邊;等于0說明兩節(jié)點(diǎn)獨(dú)立,兩節(jié)點(diǎn)之間不存在邊。通常設(shè)置一個(gè)臨界值ξ來判斷邊是否存在,若兩節(jié)點(diǎn)之間互信息I(X,Y)≤ξ,則在真實(shí)網(wǎng)絡(luò)中表現(xiàn)為兩節(jié)點(diǎn)之間不存在邊。
計(jì)算任意兩節(jié)點(diǎn)之間的互信息I(X,Y),將大于臨界值ξ的互信息按降序排列構(gòu)成互信息鏈:I(x1,y1)>I(x2,y2)>…>I(xn,yn)>ξ,依次將節(jié)點(diǎn)對(x1,y1),(x2,y2),…,(xn,yn)存儲在集合C中,并按互信息鏈中的順序依次取出一對節(jié)點(diǎn)判斷它們之間有無通路存在,不存在就在節(jié)點(diǎn)對之間添加一條無向邊并將節(jié)點(diǎn)對從集合C中刪除,由此構(gòu)建貝葉斯初始結(jié)構(gòu)。
對集合C剩余的節(jié)點(diǎn)對進(jìn)行條件獨(dú)立性測試,此時(shí)貝葉斯網(wǎng)絡(luò)可看作是一個(gè)表示獨(dú)立關(guān)系的網(wǎng)絡(luò)模型,通過條件獨(dú)立性測試可以找出數(shù)據(jù)集中每個(gè)變量之間的條件獨(dú)立性關(guān)系[10]。利用文獻(xiàn)[11]中條件獨(dú)立測試的方法添加暗含邊:首先確定條件集元素,若節(jié)點(diǎn)對X和Y之間不存在邊,則用A(X,Y)和a(X,Y)分別表示X和Y的鄰域中在X和Y通路上的鏈路節(jié)點(diǎn)集,令D(X,Y)=min(A(X,Y),a(X,Y))。此時(shí)用D(X,Y)作為條件集元素,然后利用條件互信息I(X,Y|D(X,Y))進(jìn)行獨(dú)立性檢驗(yàn)。通過設(shè)定正數(shù)η來判斷節(jié)點(diǎn)對之間的條件獨(dú)立性,若I(X,Y|D(X,Y))>η,則說明兩節(jié)點(diǎn)不滿足條件獨(dú)立性檢驗(yàn),節(jié)點(diǎn)間可能存在暗含邊;若I(X,Y|D(X,Y))≤η,則說明兩節(jié)點(diǎn)被條件集d-分離[11],節(jié)點(diǎn)間不存在暗含邊。I(X,Y|D(X,Y))具體形式如下:
(2)
互信息閾值的設(shè)定可能會(huì)導(dǎo)致一些相互影響較弱的邊被忽略,導(dǎo)致集合C缺少一些必要的節(jié)點(diǎn)對,所以利用集合C構(gòu)建的初始結(jié)構(gòu)可能會(huì)出現(xiàn)孤立節(jié)點(diǎn)的情況。此時(shí)對孤立節(jié)點(diǎn)的處理方法是計(jì)算該節(jié)點(diǎn)與其他節(jié)點(diǎn)之間的互信息,選擇互信息最大的節(jié)點(diǎn)與孤立節(jié)點(diǎn)無向邊連接。此時(shí)得到貝葉斯完全結(jié)構(gòu)。若集合C為空,則直接對孤立節(jié)點(diǎn)進(jìn)行處理。
得到完全結(jié)構(gòu)之后,結(jié)合改進(jìn)的爬山搜索算子進(jìn)行結(jié)構(gòu)搜索,對完全結(jié)構(gòu)初步定向來避免有向環(huán)的出現(xiàn)。由于此時(shí)完全結(jié)構(gòu)不再缺邊,故將爬山算法里面加邊、轉(zhuǎn)邊、減邊三個(gè)算子改為減邊、轉(zhuǎn)邊兩個(gè)算子,改進(jìn)之后可以避免因加邊搜索導(dǎo)致重復(fù)操作帶來的時(shí)間消耗。與此同時(shí),利用互信息、條件獨(dú)立測試構(gòu)建完全結(jié)構(gòu)可以避免爬山算法因隨機(jī)產(chǎn)生初始網(wǎng)絡(luò)而陷入局部最優(yōu)的問題。
1.2IHC算法實(shí)現(xiàn)
上文詳細(xì)介紹了IHC算法原理,下面以標(biāo)準(zhǔn)Asia網(wǎng)絡(luò)[12]為例分步說明IHC算法的具體實(shí)現(xiàn)步驟。
(1)計(jì)算各節(jié)點(diǎn)之間的互信息并將互信息按降序排列為互信息鏈,依次取出節(jié)點(diǎn)對構(gòu)造貝葉斯初始結(jié)構(gòu),如圖1所示。
圖1 貝葉斯初始結(jié)構(gòu)Fig.1 Initial Bayesian structure
(2)確定條件集元素,通過條件獨(dú)立性測試將暗含邊添加到初始結(jié)構(gòu)中,得到初步完全結(jié)構(gòu)如圖2所示,此時(shí)互信息的閾值設(shè)定導(dǎo)致了孤立節(jié)點(diǎn)4的出現(xiàn)。
圖2 初步完全結(jié)構(gòu)Fig.2 Initial complete structure
(3)對孤立節(jié)點(diǎn)4進(jìn)行處理,選擇與節(jié)點(diǎn)4互信息值最大的節(jié)點(diǎn)并將節(jié)點(diǎn)4與該節(jié)點(diǎn)用無向邊連接,得到貝葉斯完全結(jié)構(gòu)如圖3所示。
圖3 貝葉斯完全結(jié)構(gòu)Fig.3 Complete Bayesian structure
(4)為避免出現(xiàn)環(huán),進(jìn)行初步定向,假設(shè)由編號小的節(jié)點(diǎn)指向編號大的節(jié)點(diǎn),得到初步定向后的結(jié)構(gòu)如圖4所示。
圖4 初步定向后的結(jié)構(gòu)Fig.4 Initial oriented structure
(5)利用減邊、轉(zhuǎn)邊算子進(jìn)行最優(yōu)結(jié)構(gòu)搜索,得到最終的Asia網(wǎng)絡(luò)如圖5所示。
圖5 利用搜索算子得到的Asia網(wǎng)絡(luò)Fig.5 Asia network obtained by search operators
IHC算法流程如圖6所示。
圖6 IHC算法流程圖Fig.6 The flow chart of IHC algorithm
圖7 運(yùn)行時(shí)間對比(Asia網(wǎng)絡(luò))Fig.7 The running time comparison(Asia net)
以標(biāo)準(zhǔn)的Asia網(wǎng)絡(luò)、Car網(wǎng)絡(luò)、Alarm網(wǎng)絡(luò)[13]為基礎(chǔ)對IHC算法進(jìn)行仿真驗(yàn)證。并對HC算法、MI&HC算法、SHC算法、IHC算法的運(yùn)行時(shí)間、準(zhǔn)確度進(jìn)行對比。運(yùn)行時(shí)間、準(zhǔn)確度分別進(jìn)行多次實(shí)驗(yàn)取平均值。準(zhǔn)確度用漢明距離d來表示:d為準(zhǔn)確邊(CE)、反轉(zhuǎn)邊(RE)、冗余邊(AE)、丟失邊(ME)之和,漢明距離越小說明算法準(zhǔn)確度越高[14]。準(zhǔn)確邊數(shù)用c表示,冗余邊數(shù)用r表示。
利用Asia網(wǎng)絡(luò)隨機(jī)生成樣本容量為3000、5000、7000、9000、11000的數(shù)據(jù)樣本,分別利用IHC算法、HC算法、MI&HC算法以及SHC算法進(jìn)行結(jié)構(gòu)訓(xùn)練,運(yùn)行時(shí)間對比如圖7所示,漢明距離對比如圖8所示。隨機(jī)生成1000~9000組數(shù)據(jù),分別利用IHC算法與SHC算法進(jìn)行結(jié)構(gòu)訓(xùn)練,得到的準(zhǔn)確邊數(shù)與冗余邊數(shù)對比如圖9所示。
圖8 漢明距離對比(Asia網(wǎng)絡(luò))Fig.8 The hamming distance comparison(Asia net)
圖9 邊數(shù)對比(Asia網(wǎng)絡(luò))Fig.9 Edges comparison(Asia net)
由圖7可知:傳統(tǒng)HC算法的運(yùn)行時(shí)間最長,與HC算法相比,MI&HC算法的運(yùn)行時(shí)間有了明顯縮短,但I(xiàn)HC算法的運(yùn)行時(shí)間比MI&HC算法更短,而且與SHC算法相比,IHC算法在一定程度上縮短了運(yùn)行時(shí)間。由圖8可知:MI&HC算法改進(jìn)了HC算法,減小了漢明距離,但SHC算法和IHC算法的漢明距離遠(yuǎn)小于MI&HC算法的漢明距離,而且IHC算法的漢明距離要小于SHC算法的漢明距離,說明IHC算法性能更好一些。由圖9可知,利用IHC算法訓(xùn)練結(jié)構(gòu)產(chǎn)生的冗余邊數(shù)比SHC訓(xùn)練結(jié)構(gòu)產(chǎn)生的冗余邊數(shù)少,而且隨著數(shù)據(jù)量的增加利用IHC算法得到的準(zhǔn)確邊數(shù)逐漸趕超SHC算法得到的準(zhǔn)確邊數(shù)。
Car網(wǎng)絡(luò)具有12個(gè)節(jié)點(diǎn)、9條邊,比Asia網(wǎng)絡(luò)多4個(gè)節(jié)點(diǎn)、1條邊。利用Car網(wǎng)絡(luò)隨機(jī)產(chǎn)生樣本容量為500、1000、3000、7000、11 000的數(shù)據(jù)樣本,分別利用四種算法進(jìn)行結(jié)構(gòu)訓(xùn)練,運(yùn)行時(shí)間如圖10所示,漢明距離對比如圖11所示。通過生成3000~11 000組數(shù)據(jù)來觀察IHC算法和SHC算法的正確邊數(shù)與冗余邊數(shù),對比如圖12所示。
圖10 運(yùn)行時(shí)間對比(Car 網(wǎng)絡(luò))Fig.10 The running time comparison(Car net)
圖11 漢明距離對比(Car 網(wǎng)絡(luò))Fig.11 The hamming distance comparison(Car net)
圖12 邊數(shù)對比(Car 網(wǎng)絡(luò))Fig.12 Edges comparison(Car net)
由圖10可知:HC算法的運(yùn)行時(shí)間最長,MI&HC算法在一定程度上改善了HC算法的運(yùn)行速度,但I(xiàn)HC算法和SHC算法都比MI&HC算法運(yùn)行更快,隨著數(shù)據(jù)量的增加,IHC算法的運(yùn)行速度明顯優(yōu)于SHC算法的運(yùn)行速度。由圖11可知:隨著數(shù)據(jù)量的增加,四種算法的漢明距離都呈下降的趨勢,但I(xiàn)HC算法的漢明距離最小,說明隨著數(shù)據(jù)量的增多IHC算法的運(yùn)行程度性能最好。由圖12可知:利用IHC算法進(jìn)行結(jié)構(gòu)訓(xùn)練不僅準(zhǔn)確邊數(shù)多于SHC算法準(zhǔn)確邊數(shù),而且產(chǎn)生的冗余邊數(shù)也遠(yuǎn)遠(yuǎn)少于SHC算法產(chǎn)生的冗余邊數(shù),說明隨著節(jié)點(diǎn)數(shù)、數(shù)據(jù)量的增加,IHC算法不僅能縮短運(yùn)行時(shí)間而且能在減少SHC算法冗余邊數(shù)的同時(shí)增加準(zhǔn)確邊數(shù)。
標(biāo)準(zhǔn)Alarm網(wǎng)絡(luò)有37個(gè)節(jié)點(diǎn)、46條邊,如圖13所示,利用IHC算法訓(xùn)練隨機(jī)產(chǎn)生的2000組數(shù)據(jù)得到的Alarm網(wǎng)絡(luò)如圖14所示。由Alarm網(wǎng)絡(luò)隨機(jī)產(chǎn)生500、1000、1500、2000組數(shù)據(jù),比較IHC算法與SHC算法的準(zhǔn)確邊數(shù)與冗余邊數(shù),對比如圖15所示。
圖13 標(biāo)準(zhǔn)Alarm網(wǎng)絡(luò)Fig.13 The standard Alarm network
圖14 利用IHC算法得到的Alarm網(wǎng)絡(luò)(2000組數(shù)據(jù))Fig.14 Alarm network obtained by IHC algorithm (2000 groups of data)
圖15 IHC算法與SHC算法邊數(shù)對比Fig.15 IHC algorthm and SHC algorthm edges comparison
由圖13與圖14對比可知:利用IHC算法得到的Alarm網(wǎng)絡(luò)丟失了邊1-24、10-33,反轉(zhuǎn)了邊24-21,其余邊都與標(biāo)準(zhǔn)網(wǎng)絡(luò)一致。由圖15可知:IHC算法得到的準(zhǔn)確邊數(shù)多于SHC算法得到的準(zhǔn)確邊數(shù),產(chǎn)生的冗余邊數(shù)遠(yuǎn)遠(yuǎn)少于SHC算法產(chǎn)生的冗余邊數(shù),說明利用IHC算法訓(xùn)練節(jié)點(diǎn)數(shù)較多、構(gòu)造較為復(fù)雜的網(wǎng)絡(luò)時(shí)明顯優(yōu)于SHC算法。
3.1變量選取與診斷模型建立
水泥燒成系統(tǒng)又稱預(yù)分解窯系統(tǒng),重要生產(chǎn)設(shè)備有預(yù)熱器、分解爐、回轉(zhuǎn)窯及篦冷機(jī),結(jié)構(gòu)如圖16所示?;剞D(zhuǎn)窯為一筒裝設(shè)備,有一定斜度,在傳動(dòng)裝置下以一定速度旋轉(zhuǎn)。生料經(jīng)預(yù)熱分解后進(jìn)入回轉(zhuǎn)窯,在窯內(nèi)發(fā)生劇烈的物理化學(xué)反應(yīng),并在重力作用下由窯尾到窯頭移動(dòng),最終形成水泥熟料。回轉(zhuǎn)窯工藝參數(shù)模型通常分為機(jī)理模型和數(shù)據(jù)模型兩種方式,由于窯內(nèi)煅燒過程涉及的變量多且變量間呈強(qiáng)非線性,很難進(jìn)行機(jī)理建模,所以本文直接采用數(shù)據(jù)建模的方式。貝葉斯網(wǎng)絡(luò)具有強(qiáng)大的推理功能[15],且公式簡單,能有效地解決不確定問題,而且已被廣泛應(yīng)用在水泥回轉(zhuǎn)窯工藝參數(shù)的故障診斷中。利用貝葉斯進(jìn)行故障診斷時(shí),首先要確定節(jié)點(diǎn)變量,然后利用結(jié)構(gòu)算法訓(xùn)練數(shù)據(jù)得到診斷模型,最后利用參數(shù)學(xué)習(xí)、概率推理進(jìn)行故障診斷。
圖16 水泥燒成系統(tǒng)簡圖Fig.16 Schematic of cement burning system
水泥回轉(zhuǎn)窯工況極為復(fù)雜,變量眾多且影響錯(cuò)綜復(fù)雜,如:喂煤量影響窯溫度和尾氣中的氧氣含量,喂煤量偏大會(huì)使燒成帶溫度偏高、尾氣中氮氧化物濃度升高、氧氣濃度下降;氧氣濃度偏低會(huì)引起CO濃度升高等。相關(guān)性分析是分析兩個(gè)變量間相關(guān)程度的統(tǒng)計(jì)方法,是描述隨機(jī)信號的重要統(tǒng)計(jì)量,包括互相關(guān)函數(shù)和自相關(guān)函數(shù),分別表示兩個(gè)時(shí)間序列之間和同一個(gè)時(shí)間序列在任意兩不同時(shí)刻的取值之間的相關(guān)程度,利用相關(guān)函數(shù)可分析兩個(gè)變量的相關(guān)性[16],相關(guān)函數(shù)R如下式所示:
(3)
C(x1,x2)=E[(x1-μ1)(x2-μ2)]
μ1=E[x1],μ2=E[x2]
式中,x1、x2為變量;R(x1,x2)為相關(guān)函數(shù);C(x1,x2)為協(xié)方差;E(x1)、E(x2)為數(shù)學(xué)期望值。
利用相關(guān)函數(shù)法來分析喂煤量、喂料量等參數(shù)之間的相關(guān)程度,由于回轉(zhuǎn)窯工藝參數(shù)較多,對部分參數(shù)進(jìn)行相關(guān)性分析,選取10 000組數(shù)據(jù)進(jìn)行計(jì)算,得到的相關(guān)程度值如表1所示。
由表1可知回轉(zhuǎn)窯工藝參數(shù)之間的相關(guān)程度,由于實(shí)際生產(chǎn)中窯轉(zhuǎn)速基本不變,所以本文不考慮窯轉(zhuǎn)速,而將相關(guān)性較弱的CO濃度考慮在內(nèi),即選?。何沽狭縈、窯頭喂煤量C、窯電流I、氧氣含量w(O2)、氮氧化合物含量w(NOx)、一氧化碳含量w(CO)、風(fēng)機(jī)擋板開度B、燒成帶溫度T八個(gè)變量。變量的現(xiàn)場采集數(shù)據(jù)及對應(yīng)量化值如表2所示,對應(yīng)狀態(tài)如表3所示,利用IHC算法訓(xùn)練量化的數(shù)據(jù),得到的診斷模型如圖17所示。
表1 參數(shù)相關(guān)程度值Tab.1 The correlation degree of parameters
表2 部分?jǐn)?shù)據(jù)樣本及量化舉例Tab.2 Some data samples and quantitative examples
表3 變量狀態(tài)分類Tab.3 Variable state classification
圖17 利用IHC算法得到的診斷模型Fig.17 Diagnosis model obtained by IHC
然后利用傳統(tǒng)HC算法對回轉(zhuǎn)窯工藝參數(shù)量化后的數(shù)據(jù)進(jìn)行結(jié)構(gòu)訓(xùn)練,得到的診斷模型如圖18所示。
圖18 利用HC得到的診斷模型Fig.18 Diagnosis model obtained by HC
通過對比圖17和圖18可知:利用IHC算法得到的診斷模型更貼近于實(shí)際,利用HC算法構(gòu)建的模型錯(cuò)誤較多,如,利用HC算法構(gòu)建的模型忽略了喂煤量對氧氣的影響,錯(cuò)誤地添加了風(fēng)機(jī)擋板開度對窯電流的影響。
3.2參數(shù)學(xué)習(xí)與窯燒成帶溫度故障診斷研究
上文分別利用IHC算法、HC算法得到了回轉(zhuǎn)窯工藝參數(shù)的診斷模型,然后進(jìn)行貝葉斯參數(shù)學(xué)習(xí)確定條件概率表。參數(shù)學(xué)習(xí)也稱參數(shù)估計(jì),主要包括最大似然估計(jì)(maximum likelihood estimation, MLE)等方法[17],在本文利用MLE法確定除根節(jié)點(diǎn)外其余節(jié)點(diǎn)的條件概率表。然后利用變量消元法進(jìn)行診斷推理,尋找導(dǎo)致故障的原因。以圖17為例,模型中節(jié)點(diǎn)w(O2)對應(yīng)的條件概率表如表4所示,節(jié)點(diǎn)C對應(yīng)的先驗(yàn)概率如表5所示。
表4 節(jié)點(diǎn)w(O2)的條件概率Tab.4 Conditional probability of w(O2)
表5 節(jié)點(diǎn)C的先驗(yàn)概率Tab.5 Prior probability of C
窯燒成帶溫度是影響水泥質(zhì)量、控制環(huán)境污染的重要參數(shù),如燒成帶溫度偏大易導(dǎo)致水泥熟料過燒,降低水泥活性,產(chǎn)生大量氮氧化物,污染空氣;燒成帶溫度過低則易導(dǎo)致水泥煅燒不夠,容易斷裂,所以,本文針對燒成帶溫度T進(jìn)行故障診斷,如在某時(shí)刻T=3,由圖17可知,可能是C或B出現(xiàn)異常導(dǎo)致T=3。以500組數(shù)據(jù)為例,利用下式進(jìn)行診斷推理:
(4)
(5)
對后驗(yàn)概率α中的所有后驗(yàn)概率進(jìn)行比較,選取最大后驗(yàn)概率對應(yīng)的狀態(tài)作為故障原因,可知此時(shí)導(dǎo)致燒成帶溫度T=3主要原因是由喂煤量C=3引起,及時(shí)減少喂煤量,確保燒成帶溫度恢復(fù)到正常狀態(tài)。同理,分別利用HC算法、SHC算法以及IHC算法算法對回轉(zhuǎn)窯的燒成帶溫度T進(jìn)行故障診斷,所得診斷結(jié)果統(tǒng)計(jì)表如表6所示(由于篇幅有限僅列舉5組)。
表6 各算法診斷結(jié)果統(tǒng)計(jì)Tab.6 Diagnosis result statistics of each algorithm
然后選取測試集,分別利用HC算法、SHC算法、IHC算法進(jìn)行故障診斷測試,通過診斷結(jié)果可得到各算法在每一組測試集的正確診斷故障數(shù)|Dtrue|,如表7所示。
表7 各算法正確診斷故障數(shù)Tab.7 Correct diagnosis fault numbers
根據(jù)下式計(jì)算各算法故障診斷準(zhǔn)確率H:
(6)
式中,Dtext為測試集大小。
可以得到模型的診斷準(zhǔn)確率曲線,如圖19所示。
由圖19可知:利用傳統(tǒng)HC算法對窯燒成帶溫度進(jìn)行故障診斷的準(zhǔn)確率是最低的,SHC算法在一定程度上提高了準(zhǔn)確率,但利用IHC算法進(jìn)行故障診斷的準(zhǔn)確率高于SHC算法進(jìn)行故障診斷的準(zhǔn)確率。在實(shí)驗(yàn)室環(huán)境下,隨著數(shù)據(jù)量增多,利用IHC算法對燒成帶溫度進(jìn)行故障診斷的準(zhǔn)確率能夠達(dá)到80%以上。所以,利用IHC建??梢詽M足實(shí)際生產(chǎn)當(dāng)中回轉(zhuǎn)窯工藝參數(shù)故障診斷的要求。
本文提出一種改進(jìn)的貝葉斯結(jié)構(gòu)學(xué)習(xí)算法——IHC算法,該算法不需要節(jié)點(diǎn)序等先驗(yàn)信息且不易陷入局部最優(yōu),在運(yùn)行效率上遠(yuǎn)遠(yuǎn)優(yōu)于MI&HC算法和HC算法。隨著節(jié)點(diǎn)數(shù)的增多、網(wǎng)絡(luò)復(fù)雜度的增加,IHC算法得到的準(zhǔn)確邊數(shù)高于SHC算法得到的準(zhǔn)確邊數(shù),產(chǎn)生的冗余邊數(shù)遠(yuǎn)遠(yuǎn)少于SHC算法產(chǎn)生的冗余邊數(shù)。最后將IHC算法與實(shí)際的回轉(zhuǎn)窯系統(tǒng)進(jìn)行結(jié)合,對回轉(zhuǎn)窯工藝參數(shù)進(jìn)行數(shù)據(jù)建模,分析各參數(shù)之間的相互影響,利用構(gòu)建的模型對窯燒成帶溫度進(jìn)行故障診斷,實(shí)驗(yàn)結(jié)果證明利用IHC算法能更加準(zhǔn)確地查找導(dǎo)致窯燒成帶溫度故障的原因,避免了由于燒成帶溫度故障診斷不及時(shí)導(dǎo)致的水泥質(zhì)量變差、環(huán)境污染、能源浪費(fèi)等問題。因此算法具有一定的實(shí)際意義,同時(shí)也為今后的回轉(zhuǎn)窯工藝參數(shù)故障診斷提供了一種新的思路。
[1] 陳東寧,姚成玉,黨振,等.基于T-S模糊故障樹和貝葉斯網(wǎng)絡(luò)的多態(tài)液壓系統(tǒng)可靠性分析[J].中國機(jī)械工程,2013,24(7):899-905. CHEN Dongning, YAO Chengyu, DANG Zhen, et al. Reliability Analysis of Multi-state Hydraulic System Based on T-S Fuzzy Fault Tree and Bayesian Network[J].China Mechanical Engineering,2013,24(7):899-905.
[2] 馬德仲.基于貝葉斯網(wǎng)絡(luò)和多源信息構(gòu)建可靠性分析模型方法研究[D].哈爾濱:哈爾濱理工大學(xué),2015. MA Dezhong.Research on Constructing Reliability Analysis Model Based on Bayesian Networks and Multi-source Information[D]. Harbin:Harbin University of Science and Technology,2015.
[3] CHENG J, GREINER R, KELLY J,et al. Learning Bayesian Networks from Data: An Information-theory Based Approach[J]. Artificial Intelligence,1998,137(1/2):43-90.
[4] TSAMARDINOS I,BROWN L E, ALIFERIS C F.The Max-min Hill-climbing Bayesian Network Structure Learning Algorithm[J]. Machine Learning,2006,65(1):31-78.
[5] 金焱,胡云安,張瑾,等.互信息與爬山法相結(jié)合的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)[J].計(jì)算機(jī)應(yīng)用與軟件,2012,29(9):122-125. JIN Yan, HU Yun’an, ZHANG Jin, et al. Bayesian Network Structure Learning Combining Mutual Information with Hill Climbing Algorithm[J]. Computer Applications and Software,2012,29(9):122-125.
[6] 劉浩然,呂曉賀,李軒,等.基于Bayesian改進(jìn)算法的回轉(zhuǎn)窯故障診斷模型研究[J].儀器儀表學(xué)報(bào),2015,36(7):1554-1561. LIU Haoran, LYU Xiaohe, LI Xuan,et al. A study of Fault Diagnosis Model of Rotary Kiln Based on Improved Algorithm of Bayesian[J]. Chinese Journal of Scientific Instrument,2015,36(7):1554-1561.
[7] 鄧歆,孟洛明.基于貝葉斯網(wǎng)絡(luò)的通信網(wǎng)告警相關(guān)性和故障診斷模型[J].電子與信息學(xué)報(bào),2007,29(5):1182-1186. DENG Xin,MENG Luoming. Bayesian Networks Based Alarm Correlation and Fault Diagnosis in Communication Networks[J]. Journal of Electronics & Information Technology,2007,29(5):1182-1186.
[8] 劉浩然,馬明,李世昭,等.一種應(yīng)用于故障診斷中的高效推理算法[J].控制與決策,2015,30(11):2033-2040. LIU Haoran, MA Ming, LI Shizhao,et al. An Effective Inference Algorithm for Fault Diagnosis[J].Control and Decision,2015,30(11):2033-2040.
[9] LI B H, LI Z G. Improved Algorithm Based on Mutual Information for Learning Bayesian Network Structures in the Space of Equivalence Classes[J]. Multimedia Tools & Applications,2012,60(1):129-137.
[10] PENSAR J, NYMAN H,LINTUSAARI J, et al. The Role of Local Partial Independence in Learning of Bayesian Networks[J]. International Journal of Approximate Reasoning,2016,69(C):91-105.
[11] 關(guān)菁華.基于依賴分析的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)和分類器的研究與實(shí)現(xiàn)[D]. 長春:吉林大學(xué), 2005. GUAN Jinghua.Bayesian Network Structure Learning Based on Dependency Analysis and the Research and Realization of the Classifier[D]. Changchun:Jilin University,2005.
[12] 朱明敏, 劉三陽, 楊有龍.基于最大主子圖分解的貝葉斯網(wǎng)絡(luò)等價(jià)類學(xué)習(xí)算法[J].控制與決策,2012,27(10):1499-1504. ZHU Mingmin, LIU Sanyang,YANG Youlong. Structural Learning Bayesian Network Equivalence Classes Via Maximal Prime Decomposition[J], Control and Decision,2012,27(10):1499-1504.
[13] 李景囡.基于依賴分析的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)算法研究[D]. 西安:西安電子科技大學(xué),2014. LI Jingnan.Research on Dependence Analysis Based Algorithms for Bayesian Network Structure Learning[D]. Xi’an: Xidian University,2014.
[14] 高曉光, 趙歡歡, 任佳.基于蟻群優(yōu)化的貝葉斯網(wǎng)絡(luò)學(xué)習(xí)[J].系統(tǒng)工程與電子技術(shù),2010,32(7):1509-1512. GAO Xiaoguang, ZHAO Huanhuan, REN Jia. Bayesian Network Learning on Algorithm Based on Ant Colony Optimization[J]. Systems Engineers and Electronics,2010,32(7):1509-1512.
[15] 徐小力,劉秀麗,蔣章雷,等.基于主觀貝葉斯推理的多傳感器分布式故障檢測融合方法[J].機(jī)械工程學(xué)報(bào),2015,51(7):91-98. XU Xiaoli, LIU Xiuli, JIANG Zhanglei, et al. Multi-sensor Distributed Fault Detection Method Based on Subjective Bayesian Reasoning[J].Journal of Mechanical Engineering,2015,51(7):91-98.
[16] 郭峰.基于模糊ARX模型的水泥回轉(zhuǎn)窯預(yù)測控制算法研究[D]. 秦皇島:燕山大學(xué),2012. GUO Feng. Research of Predictive Control Algorithm on the Cement Rotary Kiln Based on Fuzzy ARX Model[D]. Qinhuangdao: Yanshan University,2012.
[17] 楊宇,高曉光,郭志高.小數(shù)據(jù)集條件下基于數(shù)據(jù)再利用的BN參數(shù)學(xué)習(xí)[J].自動(dòng)化學(xué)報(bào),2015,41(12):2058-2071. YANG Yu, GAO Xiaoguang, GUO Zhigao. Learning BN Parameters with Small Data Sets Based by Data Reutilization[J], Acta Automatica Sinica,2015,41(12):2058-2071.
(編輯王艷麗)
AStudyofFaultDiagnosisModelofRotaryKilnBasedonImprovedStructuralAlgorithmofBayesian
LIU Bin1LIU Yongji1LIU Haoran1LI Lei2SUN Meiting1
1.Information Science and Engineering College,Yanshan University, Qinhuangdao,Hebei,066004 2.Electrical Engineering College,Yanshan University, Qinhuangdao, Hebei,066004
The improved mutual information hill climbing algorithm (MI&HC) had less accuracy and time consuming, and the simplified hill-climbing(SHC) algorithm generated lots of redundant edges. Aiming at these problems, this paper proposed a new Bayesian structure learning algorithm, improved hill-climbing(IHC).Firstly,this algorithm calculated the mutual information chains to obtain the Bayesian initial structure.Secondly, this algorithm utilized conditional independence tests and dealt with isolated nodes to supplement the initial structures to obtain the completed structure.Finally,the algorithm utilized improved search operators of HC to search for the optimal structure based on completed structure.The simulation results show that:compared with hill-climbing(HC),MI&HC and SHC algorithm, the IHC algorithm may obtain a more accurate and more rapid model, the redundant edges generated by IHC are far less than SHC.In the end,based on IHC algorithm and combined with some rotary kiln operating data, the fault diagnosis model of processing parameters may be constructed and a precise fault diagnosis of burning zone temperature in the rotary kiln is realized.
improved structure learning algorithm of Bayesian;mutual information and conditional independence test;fault diagnosis;cement rotary kiln
2016-09-23
國家自然科學(xué)基金資助項(xiàng)目(51641609);河北省自然科學(xué)基金資助項(xiàng)目( F2016203354)
TH165
10.3969/j.issn.1004-132X.2017.18.001
劉彬,男,1953年生。燕山大學(xué)信息科學(xué)與工程學(xué)院教授、博士研究生導(dǎo)師。主要研究方向?yàn)樨惾~斯工業(yè)故障檢測。發(fā)表論文30余篇。E-mail:18331829576@163.com。劉永記,男,1991年生。燕山大學(xué)信息科學(xué)與工程學(xué)院碩士研究生。劉浩然,男,1980年生。燕山大學(xué)信息科學(xué)與工程學(xué)院教授。李雷,男,1990年生。燕山大學(xué)電氣工程學(xué)院碩士研究生。孫美婷,女,1992年生。燕山大學(xué)信息科學(xué)與工程學(xué)院碩士研究生。