傅曉駿 孫海龍 章珈寧
摘?要:發(fā)電風(fēng)機(jī)葉片結(jié)冰故障診斷在國(guó)際上現(xiàn)在依舊在研發(fā)過(guò)程,大多數(shù)風(fēng)力發(fā)電廠都是葉片結(jié)冰影響運(yùn)行后進(jìn)停止發(fā)電,用各種方法去冰。針對(duì)這一現(xiàn)象,本文設(shè)想了一種采用數(shù)據(jù)驅(qū)動(dòng)型的結(jié)冰檢測(cè)方法,通過(guò)分析SCADA系統(tǒng)采集現(xiàn)場(chǎng)數(shù)據(jù),建立結(jié)冰預(yù)測(cè)模型。首先根據(jù)工業(yè)大數(shù)據(jù)的特點(diǎn),在預(yù)處理環(huán)節(jié),進(jìn)行剔除奇異值等操作;再通過(guò)機(jī)理分析,選擇合適特征;最后將特征數(shù)據(jù)帶入使用粒子群算法優(yōu)化參數(shù)的支持向量機(jī)中。實(shí)驗(yàn)表明對(duì)葉片結(jié)冰預(yù)測(cè)取得了顯著成果,這可能成為風(fēng)機(jī)葉片結(jié)冰狀態(tài)預(yù)測(cè)的新方法。
關(guān)鍵詞:風(fēng)機(jī)故障診斷;風(fēng)力發(fā)電;工業(yè)大數(shù)據(jù);支持向量機(jī)
葉片結(jié)冰是風(fēng)電領(lǐng)域的一個(gè)全球范圍難題。目前對(duì)風(fēng)力機(jī)結(jié)冰問(wèn)題研究上集中在及時(shí)發(fā)現(xiàn)葉片的結(jié)冰情況并在產(chǎn)生影響前除去冰,如果能對(duì)葉片結(jié)冰進(jìn)行早期預(yù)測(cè),也是防止葉片結(jié)冰對(duì)風(fēng)力發(fā)電產(chǎn)生影響的重要手段,現(xiàn)在也有通過(guò)紅外線檢測(cè)葉片溫度數(shù)據(jù)預(yù)測(cè)結(jié)冰狀態(tài)。然而上述這些方法,都需要對(duì)葉片進(jìn)行改造,裝設(shè)額外設(shè)備,降低了風(fēng)力發(fā)電效率。
SCADA系統(tǒng)在風(fēng)電行業(yè)已廣泛使用,系統(tǒng)每天產(chǎn)生大量的監(jiān)測(cè)數(shù)據(jù),而葉片結(jié)冰的信息往往蘊(yùn)含其中,本文設(shè)想通過(guò)數(shù)據(jù)驅(qū)動(dòng)角度,對(duì)SCADA系統(tǒng)監(jiān)視數(shù)據(jù)進(jìn)行處理,以實(shí)現(xiàn)對(duì)葉片結(jié)冰狀態(tài)的檢測(cè)和判斷,從過(guò)去被動(dòng)維護(hù)轉(zhuǎn)變?yōu)橹鲃?dòng)維護(hù),且不過(guò)分依賴于專(zhuān)業(yè)知識(shí)。
1 數(shù)據(jù)預(yù)處理
首先刪去訓(xùn)練集中的已知的無(wú)效樣本。
然后采用箱型圖方法可以剔除部分奇異點(diǎn):
(1)樣本被從小到大排列,按照某個(gè)變量;
(2)計(jì)算該變量的上四分位數(shù)Q2,下四分位數(shù)Q1,中位數(shù);
(3)計(jì)算上下限:
式中:Δ=Q2-Q1,k為控制限,但k=1.5時(shí)得到的奇異值是溫和的,當(dāng)k=3時(shí)得到的奇異值是極端的,這里我們需要極端奇異值;
(4)該變量奇異點(diǎn)所在的樣本被全部刪除;
(5)繼續(xù)以上方法計(jì)算,直到檢驗(yàn)完畢所有變量。
2 平衡數(shù)據(jù)集
通過(guò)一般的學(xué)習(xí)算法所獲得的分類(lèi)效果經(jīng)常不夠理想。因此我們嘗試通過(guò)在數(shù)據(jù)層面和算法層面進(jìn)行創(chuàng)新改進(jìn)來(lái)提升效果。數(shù)據(jù)層面主要是重采樣技術(shù),比如EasyEnsemble和BalanceCascade兩種知情欠采樣方式,合成少類(lèi)過(guò)采樣技術(shù)(SMOTE)技術(shù)等等。在算法層面的方法有基于代價(jià)敏感(Cost-Sensitive)、基于單類(lèi)學(xué)習(xí)(One-Class)、基于主動(dòng)學(xué)習(xí)(Active Learning)、基于集成分類(lèi)算法等幾個(gè)方法。
大樣本定長(zhǎng)欠采樣和小樣本Smote算法過(guò)采樣方法都在本文中被使用,從大數(shù)據(jù)中摘取有效數(shù)據(jù),把結(jié)冰和未結(jié)冰的樣本數(shù)據(jù)控制在20000以內(nèi),且基本相等。由于從大數(shù)據(jù)欠采樣到2萬(wàn)組,任何采樣方法失去很多有價(jià)值的樣本,本文結(jié)合風(fēng)力發(fā)電機(jī)運(yùn)行實(shí)際情況,總結(jié)出幾條規(guī)則,可以將樣本中明顯不結(jié)冰的數(shù)據(jù)先剔除。
經(jīng)過(guò)上述方法篩選后,去除了約5萬(wàn)條正常數(shù)據(jù)的樣本,14萬(wàn)樣本數(shù)量依舊太過(guò)龐大,進(jìn)一步分析,許多樣本之間的表征信息幾乎一致,下一步刪除冗余部分,該過(guò)程算法為:
具體過(guò)程為:
(1)原始樣本標(biāo)準(zhǔn)化,計(jì)算δ值;
(2)計(jì)算$x_{i}$和$x_{j}$(j>i)的相似度$R_{ij}$;
(3)定義一合適閾值ε,如果$R_{ij}>\\varepsilon$,刪去樣本$x_{j}$;
(4)重復(fù)以上步驟,直到所有樣本檢查完畢。
經(jīng)過(guò)上述步驟后,最后摘取到約2萬(wàn)組正常有效的樣本。
接下來(lái)處理非正常樣本,即我們得到的約1萬(wàn)結(jié)冰樣本數(shù)據(jù),為使樣本量增加一倍,我們采用了Smote算法。為達(dá)到平衡樣本的目的,在一些位置接近的數(shù)量較少的樣本中插入新樣本即是Smote算法的中心思想,以上方法不同于隨機(jī)過(guò)采樣的將樣本數(shù)據(jù)簡(jiǎn)單復(fù)制,而是為避免分類(lèi)器的過(guò)度擬合,通過(guò)增加創(chuàng)造出來(lái)的樣例。
經(jīng)過(guò)上述一系列操作,訓(xùn)練集兩類(lèi)數(shù)據(jù)一共約4萬(wàn)組樣本,且數(shù)量相等。
3 選擇特征
運(yùn)行中的風(fēng)力發(fā)電機(jī)葉片表面結(jié)冰,這是復(fù)雜的過(guò)程,這一過(guò)程受到許多環(huán)境因素影響的,想要建立精準(zhǔn)的預(yù)測(cè)風(fēng)機(jī)葉片結(jié)冰狀態(tài)的數(shù)學(xué)模型具有很大難度,而采用數(shù)據(jù)驅(qū)動(dòng)的方法,數(shù)量眾多的樣本還有檢測(cè)變量,都會(huì)使得運(yùn)算過(guò)程十分復(fù)雜,并且不能快速確定葉片的結(jié)冰狀態(tài)。所以,結(jié)合風(fēng)力發(fā)電原理以及葉片表面凍結(jié)過(guò)程,對(duì)風(fēng)機(jī)結(jié)冰整個(gè)過(guò)程的特征狀態(tài)進(jìn)行分析,并與機(jī)器學(xué)習(xí)的能力相結(jié)合,方可進(jìn)行有效預(yù)測(cè)。
所謂風(fēng)力發(fā)電,即風(fēng)力推動(dòng)葉片轉(zhuǎn)動(dòng),葉片帶動(dòng)發(fā)電機(jī)轉(zhuǎn)動(dòng),利用電磁感應(yīng)現(xiàn)象產(chǎn)生電能。但是葉片結(jié)冰后會(huì)改變運(yùn)動(dòng)特性,降低風(fēng)能到電能的轉(zhuǎn)化效率,雖然電能的產(chǎn)生效率不全依賴風(fēng)速,但風(fēng)能與電能的轉(zhuǎn)化效率在一定程度上可以反映葉片的結(jié)冰狀態(tài),結(jié)合正常情況和異常結(jié)冰數(shù)據(jù)功率散點(diǎn)和通過(guò)數(shù)據(jù)擬合正常數(shù)據(jù)獲得理論功率曲線,將該理論功率曲線作為葉片未凍結(jié)的理論曲線,把風(fēng)力發(fā)電機(jī)實(shí)際輸出功率與理論功率的殘差作為特征,通過(guò)分析,若兩者的殘差非常大,或者殘差不穩(wěn)定,表示葉片很大可能已出現(xiàn)結(jié)冰故障,需要處理。
從另一方面講,運(yùn)行中的風(fēng)機(jī)葉片表面出現(xiàn)凍結(jié)故障勢(shì)必會(huì)對(duì)風(fēng)能與電能的轉(zhuǎn)化效率造成不利影響,以上述方法,第二特征選擇擬合正常轉(zhuǎn)速曲線計(jì)算出的每組數(shù)據(jù)的轉(zhuǎn)速殘差。
另外,周?chē)鷾囟瓤隙ㄒ彩鞘种匾囊蛩?,溫度這一變量要被著重考慮,通過(guò)分析外部溫度與風(fēng)機(jī)內(nèi)部溫度的差別,我們發(fā)現(xiàn)這一差別與風(fēng)機(jī)葉片的是否結(jié)冰有著很大的關(guān)聯(lián)。
通過(guò)主成分分析技術(shù),我們可以分析樣本在主成分和非主成分方向的投影,通過(guò)這一技術(shù)可以進(jìn)一步構(gòu)造敏感特征的方法,分析風(fēng)速和實(shí)際功率在非主成分方向的投影。
最終經(jīng)過(guò)分析,把外部溫度,外部溫度,風(fēng)速,實(shí)際功率以及4個(gè)衍生變量作為選擇特征。
4 分類(lèi)器構(gòu)建及參數(shù)優(yōu)化
本文采用機(jī)器學(xué)習(xí)模型為支持向量機(jī),同時(shí)為了尋找最優(yōu)參數(shù),又引入粒子群算法,借以提高故障識(shí)別的性能。以下是計(jì)算過(guò)程:
在統(tǒng)計(jì)學(xué)中提出的機(jī)器學(xué)習(xí)方法即是SVM算法,這一算法的基礎(chǔ)是VC維理論和結(jié)構(gòu)最小化原理,通過(guò)超強(qiáng)的學(xué)習(xí)能力克服復(fù)雜的數(shù)學(xué)模型,為有效的解決線性不可分的這一難題引入核函數(shù),這一方法的效果非常顯著。過(guò)程可簡(jiǎn)單描述為:
我們按照要求取w,b的值。這一過(guò)程使該超平面到兩類(lèi)支持向量的幾何間隔最大,從而目標(biāo)函數(shù)及約束條件寫(xiě)作:
核函數(shù)類(lèi)型確定之后,結(jié)合粒子群算法進(jìn)行參數(shù)C和g尋優(yōu)。
5 結(jié)語(yǔ)
數(shù)據(jù)驅(qū)動(dòng)學(xué)習(xí)方法在工業(yè)領(lǐng)域有廣泛的應(yīng)用前景,本文在發(fā)電風(fēng)機(jī)葉片結(jié)冰領(lǐng)域,針對(duì)過(guò)去單純依靠機(jī)理分析或監(jiān)控可視化等手段,使用機(jī)器學(xué)習(xí)的方法,首先對(duì)現(xiàn)場(chǎng)實(shí)際數(shù)據(jù)進(jìn)行預(yù)處理,然后結(jié)合機(jī)理分析進(jìn)行特征提取,最后通過(guò)粒子群支持向量機(jī)模型實(shí)現(xiàn)對(duì)葉片結(jié)冰的預(yù)測(cè)。
參考文獻(xiàn):
[1]田鵬輝,羅衡強(qiáng),湯亞男.風(fēng)力機(jī)組葉片防覆冰技術(shù)發(fā)展現(xiàn)狀[J].電器工業(yè),2013,14(5):62-65.
[2]東喬天,金哲巖,楊志剛.風(fēng)力機(jī)結(jié)冰問(wèn)題研究綜述[J].機(jī)械設(shè)計(jì)與制造,2014,52(10):269-272.
[3]梁穎,方瑞明.基于SCADA和支持向量回歸的風(fēng)電機(jī)組狀態(tài)在線評(píng)估方法[J].電力系統(tǒng)自動(dòng)化,2013,37(14):7-12.
[4]劉強(qiáng),秦泗釗.過(guò)程工業(yè)大數(shù)據(jù)建模研究展望[J].自動(dòng)化學(xué)報(bào),2016,42(2):161-171.
作者簡(jiǎn)介:傅曉駿(1990—?),男,漢族,浙江桐廬人,本科,中級(jí)工程師,研究方向:自動(dòng)化。