韋古強(qiáng)杜冠洲凌俊斌
(1.都城偉業(yè)集團(tuán)有限公司,北京 100020;2.國網(wǎng)江蘇省電力公司經(jīng)濟(jì)技術(shù)研究院,江蘇 南京 210008)
基于隨機(jī)森林算法的風(fēng)電機(jī)組故障智能診斷預(yù)警模型
韋古強(qiáng)1杜冠洲1凌俊斌2
(1.都城偉業(yè)集團(tuán)有限公司,北京 100020;2.國網(wǎng)江蘇省電力公司經(jīng)濟(jì)技術(shù)研究院,江蘇 南京 210008)
文章針對(duì)清潔能源企業(yè)中風(fēng)電機(jī)組頻發(fā)問題,在行業(yè)內(nèi)風(fēng)電機(jī)組常見故障以及故障診斷技術(shù)進(jìn)行分析的基礎(chǔ)上,對(duì)某集團(tuán)風(fēng)電機(jī)組企業(yè)進(jìn)行實(shí)地調(diào)研,獲取影響故障發(fā)生的關(guān)鍵因素,構(gòu)建故障識(shí)別指標(biāo)體系,采用隨機(jī)森林算法構(gòu)建了風(fēng)電機(jī)組故障智能診斷預(yù)警模型。
隨機(jī)森林算法;風(fēng)電機(jī)組;故障診斷;預(yù)警模型;故障識(shí)別指標(biāo)體系
風(fēng)力發(fā)電作為新能源產(chǎn)業(yè)技術(shù)之一,其不污染環(huán)境、不消耗化石燃料的特點(diǎn),在當(dāng)今世界大力發(fā)展保護(hù)環(huán)境和走可持續(xù)發(fā)展道路的強(qiáng)大背景之下,已得到社會(huì)各方面的全面認(rèn)可,在過去的幾年里,風(fēng)力發(fā)電年增長率都保持穩(wěn)定上升的勢頭,已然成為世界公認(rèn)的增長最快的可再生能源。在我國,大部分風(fēng)力發(fā)電機(jī)組主要安裝在西部偏遠(yuǎn)、沿海等風(fēng)能充足地區(qū),由于自然環(huán)境和負(fù)荷不穩(wěn)定等因素,使得風(fēng)電機(jī)組運(yùn)行故障頻出,而機(jī)組故障會(huì)直接影響風(fēng)力發(fā)電的安全性和經(jīng)濟(jì)性。為了實(shí)現(xiàn)風(fēng)力發(fā)電的長期穩(wěn)定發(fā)展和提高自身的能源競爭力,就必須實(shí)現(xiàn)對(duì)風(fēng)力發(fā)電機(jī)組故障的提早預(yù)判和快速診斷,提高發(fā)機(jī)組效率,實(shí)現(xiàn)企業(yè)的經(jīng)濟(jì)利益最大化。
在風(fēng)電機(jī)組故障診斷過程中,想要通過診斷分析達(dá)到預(yù)定的目標(biāo),還必須對(duì)風(fēng)電機(jī)組的設(shè)備故障診斷方法有所了解。風(fēng)電機(jī)組故障診斷方法大體可以分為傳統(tǒng)診斷方法、數(shù)學(xué)診斷方法和智能故障診斷方法等。所謂的傳統(tǒng)診斷方法是指在狀態(tài)監(jiān)測技術(shù)之上,對(duì)其數(shù)據(jù)進(jìn)行分析,結(jié)合數(shù)據(jù)挖掘方法對(duì)風(fēng)電機(jī)組設(shè)備故障進(jìn)行診斷;數(shù)學(xué)診斷方法主要是采用一些數(shù)據(jù)理論基于數(shù)學(xué)公式,數(shù)學(xué)模型對(duì)機(jī)組故障進(jìn)行診斷,主要包括故障樹分析、小波分析、模糊診斷、灰色系統(tǒng)診斷以及分形幾何與混沌分析等;智能診斷方法主要是基于數(shù)據(jù)挖掘的算法,通過算法建立模型實(shí)現(xiàn)對(duì)風(fēng)電機(jī)組的故障診斷,主要的算法包括神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林、遺傳算法、蟻群算法、粒子群算法等。而本文就使用智能故障診斷方法中的隨機(jī)森林算法實(shí)現(xiàn)對(duì)風(fēng)電機(jī)組的故障智能診斷。
通過對(duì)風(fēng)電機(jī)組常見故障進(jìn)行分析,可以得知風(fēng)電機(jī)組故障來源是多方面的,每個(gè)部件的性能都直接影響風(fēng)電機(jī)組的正常運(yùn)行,另外,各部件運(yùn)行參數(shù)的采集技術(shù)也是受多種因素影響的。通過實(shí)際調(diào)研,我們選取了影響風(fēng)電機(jī)組故障發(fā)生的14個(gè)關(guān)鍵因素,涉及風(fēng)電機(jī)組的風(fēng)輪、齒輪箱、發(fā)電機(jī)、電氣系統(tǒng)、變槳系統(tǒng)等各個(gè)部件。具體如表1所示:
表1 風(fēng)電機(jī)組故障評(píng)價(jià)指標(biāo)
3.1 模型概述
隨機(jī)森林(RF)是一種分類性能良好的組合分類算法,它以決策樹回歸樹作為基分類器,通過裝袋(Bagging)的方法生成不同的訓(xùn)練樣本集。在決策樹的構(gòu)建過程中,采用隨機(jī)的方法劃分節(jié)點(diǎn)樣本集。隨機(jī)森林(RF)可以看作是樹分類器的集合,其中x是輸入向量,是服從獨(dú)立、同分布的隨機(jī)向量。關(guān)于分類問題,隨機(jī)森林的輸出為簡單多數(shù)投票方法的結(jié)果;關(guān)于回歸問題,隨機(jī)森林的輸出為決策樹輸出結(jié)果的簡單平均。隨機(jī)森林算法的具體實(shí)現(xiàn)步驟如下:
首先,通過裝袋(Bagging)的方法生成k個(gè)不同的訓(xùn)練樣本集。當(dāng)樣本數(shù)據(jù)容量很大時(shí),全樣本數(shù)據(jù)中有接近37%的樣本未被抽中,這些樣本數(shù)據(jù)被稱之為袋外數(shù)據(jù)(Out Of Bag,OOB),袋外數(shù)據(jù)用來評(píng)價(jià)隨機(jī)森林算法的性能。
其次,每個(gè)訓(xùn)練樣本集構(gòu)建一棵分類決策樹,k個(gè)訓(xùn)練樣本集產(chǎn)生了k個(gè)分類決策樹。設(shè)樣本的特征數(shù)為M,在每棵樹的劃分節(jié)點(diǎn)上,從M個(gè)特征變量中隨機(jī)地選取m(m<M)個(gè)特征變量,然后從m個(gè)特征變量中選出一個(gè)最優(yōu)的特征變量,依此作為分類決策樹節(jié)點(diǎn)分裂時(shí)的內(nèi)部節(jié)點(diǎn)。每棵決策樹的生長都不進(jìn)行剪枝。
最后,基于構(gòu)建好的多個(gè)分類決策樹,對(duì)新的未知樣本進(jìn)行預(yù)測,依據(jù)每個(gè)樹分類器投票結(jié)果的簡單多數(shù)投票法來決定未知樣本的分類結(jié)果。
信息熵與信息增益:
信息熵:表示了信息的不確定性(混亂程度),熵越大,信息越混亂,越難預(yù)測,則該指標(biāo)提供的信息量越小,該指標(biāo)的權(quán)重越小,越不重要。對(duì)分類系統(tǒng)來說,類別C是變量,它可能的取值是,而每一個(gè)類別出現(xiàn)的概率是,因此n就是類別的總數(shù)。此時(shí)分類系統(tǒng)的熵就可以表示為:
信息增益是針對(duì)一個(gè)一個(gè)的特征而言的,就是看一個(gè)特征t,系統(tǒng)有它和沒它的時(shí)候信息量各是多少,兩者的差值就是這個(gè)特征給系統(tǒng)帶來的信息量,即增益。系統(tǒng)含有特征t的時(shí)候信息量很好計(jì)算,就是剛才的式子,它表示的是包含所有特征時(shí)系統(tǒng)的信息量。
在分類系統(tǒng)中,屬性的選擇以及決策樹的分裂根據(jù)信息增益來進(jìn)行選擇,針對(duì)根節(jié)點(diǎn)以及子節(jié)點(diǎn)選擇信息增益最大的屬性變量,然后采用遞歸的方法構(gòu)建整個(gè)決策樹和隨機(jī)森林。針對(duì)風(fēng)電機(jī)組故障診斷問題,結(jié)合上節(jié)監(jiān)測數(shù)據(jù)指標(biāo),構(gòu)建基于隨機(jī)森林算法的風(fēng)電機(jī)組故障智能診斷預(yù)警模型。其構(gòu)建流程如圖1所示:
圖1 建模流程
3.2 實(shí)例分析
為了驗(yàn)證算法的有效性和準(zhǔn)確性,本文選取了風(fēng)電機(jī)組故障數(shù)據(jù),使用RStudio軟件進(jìn)行診斷應(yīng)用分析,依據(jù)前文構(gòu)建的指標(biāo)體系,樣本輸入屬性為13個(gè),風(fēng)電機(jī)組是否正常運(yùn)行作為輸出屬性,然后對(duì)數(shù)據(jù)進(jìn)行分析處理及模型求解。相關(guān)參數(shù)設(shè)置為:隨即森林算法選取500棵樹,訓(xùn)練樣本和測試樣本占比為(0.8,0.2),節(jié)點(diǎn)隨機(jī)分裂特征數(shù)量設(shè)置為5,通過分析,模型結(jié)果如下:
表2 模型輸出結(jié)果
圖2 隨機(jī)森林OOB錯(cuò)判率和決策樹棵數(shù)
從表2可以看出,針對(duì)風(fēng)電機(jī)組是否正常運(yùn)行,包外數(shù)據(jù)誤差率OOB為2.7%,說明模型的整體分類效果非常理想。隨機(jī)森林錯(cuò)判率隨著決策樹棵數(shù)的增加不斷的減小,最終收斂為一個(gè)較小的定值。模型診斷結(jié)果分析:
表3 數(shù)據(jù)診斷結(jié)果
通過對(duì)測試集的8條數(shù)據(jù)進(jìn)行診斷分析,預(yù)測全部正確,說明模型的診斷效果比較理想??梢缘弥焊鶕?jù)測試結(jié)果,第1、4、6、8個(gè)風(fēng)電機(jī)組正常運(yùn)行,第2、3、5、7個(gè)風(fēng)電機(jī)組發(fā)出預(yù)警信息,并且應(yīng)該馬上啟動(dòng)相應(yīng)的預(yù)案措施,防止發(fā)生更大的安全事故及經(jīng)濟(jì)損失。為了提高模型的性能,在實(shí)際應(yīng)用中,應(yīng)該盡可能收集風(fēng)電機(jī)組更多的歷史故障和正常數(shù)據(jù),使得模型盡可能覆蓋所有情況的特征,并且可以定期一個(gè)月對(duì)模型訓(xùn)練一次,及時(shí)更新模型,不斷提高模型的準(zhǔn)確性。
本文針對(duì)新能源風(fēng)電機(jī)組故障頻發(fā)問題進(jìn)行分析,構(gòu)建了風(fēng)電機(jī)組故障智能診斷預(yù)警模型,采用隨機(jī)森林算法對(duì)風(fēng)電機(jī)組歷史數(shù)據(jù)進(jìn)行訓(xùn)練學(xué)習(xí),挖掘出影響風(fēng)電機(jī)組故障發(fā)生的各因素的特征模式,確定出發(fā)生故障各指標(biāo)的閾值,根據(jù)設(shè)備實(shí)時(shí)運(yùn)行對(duì)風(fēng)電機(jī)組進(jìn)行在線故障診斷預(yù)警,為風(fēng)電機(jī)組故障的監(jiān)測起到一定的技術(shù)支撐,從而有效地降低風(fēng)電機(jī)組維修成本,提高風(fēng)電機(jī)組的利用效率。
[1]龍泉,劉永前,楊勇平.狀態(tài)監(jiān)測與故障診斷在風(fēng)電機(jī)組上的應(yīng)用[J].現(xiàn)代電力,2008,25(6).
[2]程洪機(jī),呂振.設(shè)備狀態(tài)監(jiān)測與故障診斷技術(shù)的基本原理與方法[J].山東建材,2000,(4).
[3]楊偉,賈石峰.基于RBF神經(jīng)網(wǎng)絡(luò)的風(fēng)力發(fā)電機(jī)組故障診斷研究[J].電氣傳動(dòng)自動(dòng)化,2009,31(2).
[4]李永東.中國風(fēng)力發(fā)電的發(fā)展現(xiàn)狀和前景[J].電氣時(shí)代,2006,(3).
[5]陳建華,李華,蔣錦峰.電力市場條件下發(fā)電設(shè)備可靠性與經(jīng)濟(jì)性關(guān)系探討[J].中國電力,2001,34(7).
(責(zé)任編輯:小 燕)
TH862
1009-2374(2017)07-0197-02
10.13535/j.cnki.11-4406/n.2017.07.093
韋古強(qiáng)(1986-),男,都城偉業(yè)集團(tuán)有限公司副主管,高級(jí)工程師,碩士,研究方向:房地產(chǎn)、公共建筑。
A