姚萬業(yè), 姚吉行
(華北電力大學 控制與計算機工程學院,河北 保定 071003)
近些年來,以可再生能源為主要內(nèi)容的能源轉(zhuǎn)型是當今世界尋求穩(wěn)定持續(xù)發(fā)展的出路,對中國來講,若要實現(xiàn)綠色低碳等可持續(xù)發(fā)展就必須順應世界潮流,向發(fā)展可再生能源轉(zhuǎn)變。中國依據(jù)自身獨特的地理優(yōu)勢擁有著豐富的風資源,風力發(fā)電在我國發(fā)展迅速。
風電的發(fā)展帶動風電場的規(guī)模日益擴大,由于工作環(huán)境十分惡劣且工況復雜多變,風機極易發(fā)生故障。當風機發(fā)生故障后,故障診斷、維修需要耗費大量的人力、財力,對于重大故障事件會造成整個風機停機,進而影響整個風場的發(fā)電量,可謂損失巨大[1]。在風電企業(yè)高速發(fā)展的同時產(chǎn)生了海量的數(shù)據(jù),如何將這些信息轉(zhuǎn)化為資源,提升企業(yè)的經(jīng)濟效益,已經(jīng)成為行業(yè)關(guān)注的重點。在此背景下,基于海量數(shù)據(jù)信息的風機故障預警技術(shù)便應運而生了。
Hadoop是一個處理、存儲和分析海量的分布式、非結(jié)構(gòu)化數(shù)據(jù)的開源框架,以MapReduce為基礎(chǔ)發(fā)展而來,主要用來處理分布在多個并行節(jié)點的PB級和EB級數(shù)據(jù)集群。集群能從單個服務器擴展到數(shù)千個,每個服務器都可以提供本地計算和存儲,與依賴硬件提供高可用性相比,Hadoop在應用層檢測并處理故障,保障了集群的高可用性。Hadoop處理大數(shù)據(jù)的體系模塊如圖1所示。
圖1 Hadoop平臺處理模塊
1.2.1 顯著性差異分析方法
顯著性差異分析是統(tǒng)計學中對大量同工況下的數(shù)據(jù)樣本中具有顯著性差異的數(shù)據(jù)個體的分析、評價。在同工況下,這些離群個體可能是由于實驗條件處理不同而導致的異常點[2]。生產(chǎn)過程中,在相同工況下對于同一批次的設(shè)備,由于其工業(yè)設(shè)計、制造工藝和材質(zhì)等條件基本相同,設(shè)備在運行期間生成的數(shù)據(jù)雖有不同,但不應存在太大差異,否則,該數(shù)據(jù)差異有較大概率為早期故障信號。顯著性差異分析方法根據(jù)大量實驗數(shù)據(jù)統(tǒng)計故障概率,設(shè)置一個合理的靜態(tài)閾值對異常狀態(tài)進行有效的預警。
利用顯著性差異分析方法對樣本數(shù)據(jù)進行處理分析需滿足:
1)待分析數(shù)據(jù)必須來自于同一工況數(shù)據(jù)樣本總體。
2)樣本數(shù)據(jù)基本符合正態(tài)分布,即樣本概率密度函數(shù)應滿足正態(tài)分布函數(shù)。
參考GB/T4883-2008,在變量分布中,在顯著水平之外的離群點為具有顯著性差異的異常點。通過對離群點的分析,顯著性差異條件為:
u≥u1-α
(1)
在工程應用中,被觀測參數(shù)多表現(xiàn)為離散特性[3]。設(shè)共有n臺設(shè)備處于同一工況(不包含離群設(shè)備),對于某觀測狀態(tài)量X,其平均值為U,標準差為S,離群設(shè)備的當前測量值為x,其顯著性差異分析有如下幾種情況:
1) 當劣化表現(xiàn)為狀態(tài)量值減少時:x 2) 當劣化表現(xiàn)為狀態(tài)量值增加時:x>U+kS 3) 當劣化表現(xiàn)為狀態(tài)量值偏離初值時:x?{U-kS,U+kS} 其中,k的取值大小與所選取的設(shè)備臺數(shù)n的大小有一定的關(guān)系,具體關(guān)系根據(jù)現(xiàn)場工作人員的經(jīng)驗所得,如表1所示。 表1 k值與n的關(guān)系 1.2.2 多元線性回歸分析方法 一般來講,對于給定的p個變量x1,x2,…,xp能確定變量y,并且用某一種函數(shù)關(guān)系式y(tǒng)=f(x1,x2,…,xp)來表示。但在實際情況中,參數(shù)之間往往存在著無法詳細描述的非線性關(guān)系[4]。本文采用多元線性回歸分析方法對樣本數(shù)據(jù)進行建模預測,其一般形式如式(2)所示: y=β0+β1x1+β2x2+…+βpxp+ε (2) (3) E(ε)=0,Var(ε)=δ2 (4) 風場中風機的測點參數(shù)類型眾多,數(shù)量較大,故障類型也比較復雜[5]。對歷史故障信息數(shù)據(jù)統(tǒng)計分析,溫度類故障在歷史故障中發(fā)生比例較大,且風機設(shè)備溫度值變化表現(xiàn)為漸變特性,同工況下的風機溫度值表現(xiàn)有一定的正態(tài)特性[6]。鑒于箱式圖對于溫度參數(shù)具有獨特的處理優(yōu)勢,故選取風機的溫度指標作為故障預警的首選參數(shù)[7-11]。結(jié)合風機工作原理及現(xiàn)場SCADA系統(tǒng)歷史記錄,選取的風機預警指標體系如圖2所示。 圖2 風機預警指標 本文所選用的數(shù)據(jù)來自河北赤沽某大型風場共345臺風機中,風機提供廠商也有多家,機型眾多,運行工況也錯綜復雜。對于同型號的風機,不同的并網(wǎng)時間和停機時間對風機各部件的運行狀況影響不一樣,導致溫度類、電氣類參數(shù)的值也略有差別[12]。以10 s為采集單位對風機發(fā)電功率歷史數(shù)據(jù)進行分析,為觀察同機型風機的變化情況,對風機10 min的平均功率和功率變化方差進行分析。以75臺金風1.5 MW機型的風機為分析對象,對風機群落進行聚類劃分,為確保準確性,分別對6 m/s(啟動)、12 m/s(穩(wěn)定運行)、18 m/s(變槳運行)3種不同階段進行分析[13],聚類結(jié)果如圖3所示。 圖3 不同風速風機群落聚類結(jié)果 由圖3可以看出:在不同的風速下,風場中75臺金風1.5 MW機型的風機依據(jù)10 min內(nèi)的平均功率和功率方差劃分成了3個群落。在每個群落中,風機的運行特性相似,各子系統(tǒng)中部件的溫度類參數(shù)也在一定的范圍內(nèi)變化。對同一個風機群落中的風機采用箱式分布圖和顯著性差異分析的方法能夠提高異常識別率,增加預警準確性。 為了能夠?qū)︼L場中所有風機同時進行監(jiān)測,利用Hadoop平臺對風機群落進行信息分布式存儲和并行式計算,既保證了預警的全面性又增加了實時預警的快速性,其中對每個群落都采用圖4所示的預警流程。 圖4 風機群落預警流程 以群落1為分析對象,選取風場SCADA系統(tǒng)歷史故障前30 min時段的溫度體系參數(shù)值作為箱式分布對象。據(jù)查詢2016年4月5日13:34為故障發(fā)生時刻,選取30 min之前的數(shù)據(jù),采用箱式分布圖對變槳系統(tǒng)溫度評估模型體系進行分析,結(jié)果如圖5所示。 圖5 變槳系統(tǒng)溫度箱式分布圖 圖中就1#變槳電機溫度而言,在群落1中,12#和13#風機表現(xiàn)為離群風機;就變槳電池溫度而言,68#風機為離群風機;就變槳變頻器溫度而言,29#風機為離群風機。對機械傳動系統(tǒng)和發(fā)電系統(tǒng)同樣做箱式分布圖,結(jié)果分別如圖6和圖7所示。 圖6 機械傳動系統(tǒng)溫度箱式分布圖 圖7 發(fā)電機系統(tǒng)溫度箱式分布圖 對于離群風機進行顯著性差異分析,首先求出風機群落的溫度平均值和方差,再計算預警閾值來分析離群風機的異常與否。如表2所示。 在Hadoop平臺中對河北赤沽地區(qū)某風場所有風機的運行溫度類參數(shù)進行批量式處理。 Hadoop平臺共分數(shù)據(jù)采集層、數(shù)據(jù)存儲層、數(shù)據(jù)分析層、信息發(fā)布層4個層級,每個層級的功能作用如下: 數(shù)據(jù)采集層:該預警系統(tǒng)主要對整個風場中溫度類參數(shù)進行故障預警,考慮到溫度參數(shù)的漸變性和易測量性,采用溫度傳感器進行測量,以 5 s為采集單位實時采集溫度數(shù)據(jù)。 數(shù)據(jù)存儲層:鑒于風場存儲信息的復雜與龐大,數(shù)據(jù)存儲采用HDFS分布式存儲,數(shù)據(jù)存儲規(guī)則存儲在NameNode中固定區(qū)域,存儲規(guī)則為所有風機按照上文中劃分的群落來存儲。在每個群落中,按照風機子系統(tǒng)來集中存儲各溫度參數(shù),分別為變槳系統(tǒng)、機械傳動系統(tǒng)、發(fā)電機系統(tǒng)。采集的實時數(shù)據(jù)按照NameNode中的存儲規(guī)則來有序的存儲在DataNode中并實時更新NameNode中存儲規(guī)則。 表2 離群風機異常判斷表 數(shù)據(jù)分析層:按照上文中的箱式分布圖分析方法和顯著性差異分析法對每一個存儲模塊下的實時數(shù)據(jù)進行并行式計算,實時判斷每臺風機的異常與否。 信息發(fā)布層:經(jīng)過Hadoop平臺對風機溫度類參數(shù)的分布式存儲和并行式計算分析,最終可以得出每個群落中的異常風機。 鑒于上述描述預警規(guī)則,在Hadoop平臺對該風場風機群落實時溫度參數(shù)進行分析,結(jié)果如表3所示。由表3顯示結(jié)果表明,在Hadoop平臺中對整個風場下所有風機的溫度類參數(shù)進行并行計算分析,在上述時刻下群落1中32#風機的1#變槳電機溫度、群落5中84#風機的驅(qū)動軸承溫度、群落14中314#風機的發(fā)電機繞組溫度表現(xiàn)異常,可初步判定相應的風機中可能存在故障隱患。 表3 風機群落異常識別結(jié)果 依據(jù)上節(jié)Hadoop平臺計算結(jié)果,對異常風機的具體運行工況進行分析,本節(jié)以84#金風3.0 MW異常風機的齒輪箱溫度為研究對象。主要對在運期間齒輪箱溫度的實測值和預測值之間的偏差程度進行分析,通過在線監(jiān)測齒輪箱前期溫度的變化情況來及時發(fā)現(xiàn)隱藏故障。離線部分先對大量與齒輪箱相關(guān)參數(shù)進行數(shù)據(jù)分析,建立正常情況下的回歸預測模型。在線部分實時觀察預測值與實測值之間的殘差并依據(jù)現(xiàn)場經(jīng)驗設(shè)置合理的偏差閾值,當殘差超過設(shè)定的閾值后即發(fā)出報警信號并提示工作人員檢修設(shè)備。 通過對風電場SCADA系統(tǒng)47個參數(shù)的分析、篩選,結(jié)合對齒輪箱工作原理的機理分析,確定以下幾個與齒輪箱溫度變化密切相關(guān)的參數(shù)作為觀測向量: (1)機組輸出功率p:機組的輸出功率變化會影響齒輪箱載荷大小,當機組輸出功率升高時,齒輪承受的載荷變大,導致齒輪箱溫度上升。 (2)風速:作為風機工作的能量來源,風速的大小與整個風機的溫度參數(shù)變化呈正相關(guān)性。 (3)環(huán)境溫度:風電機組所處環(huán)境的溫度在短期(晝夜)或長期(周、月)內(nèi)可能會發(fā)生較大變化,如在春季3、4月份某些地區(qū)因大風寒潮等原因可能會導致溫差達20 ℃左右。在同一輸出功率和風速情況下,齒輪箱的溫度可能會因環(huán)境溫度的變化而改變。 (4)齒輪箱上一時刻溫度Tg(k-1):為了能夠追蹤齒輪箱溫度的變化趨勢,要預測下一采樣時刻的溫度需考慮當前時刻的齒輪箱溫度值。 (5)齒輪油在上3個時刻的溫度值(Tgo(k-1)、Tgo(k-2)、Tgo(k-3)); (6)齒輪軸承在上3個時刻的溫度值(Tgb(k-1)、Tgb(k-2)、Tgb(k-3)); (7)主軸承在上3個時刻的溫度值(Tl(k-1)、Tl(k-2)、Tl(k-3)); 根據(jù)上節(jié)所述建模理論,依據(jù)以上觀測向量建立齒輪箱溫度的回歸預測模型,如式(5): (5) 本文所使用的建模數(shù)據(jù)為該風場SCADA系統(tǒng)中#84風機齒輪箱溫度的歷史數(shù)據(jù),該風機的異常時刻為2016年7月11日9時17分,選擇異常時刻之前的正常數(shù)據(jù),考慮到風速的多變性以及季節(jié)的因素,時間跨度不應過大。選取6~7月的數(shù)據(jù),以5 min為采集單位,經(jīng)過預處理最終選擇200組正常數(shù)據(jù)作為處理對象。為了驗證多元線性回歸法對風電機組主要部件潛在故障的預測,采用前170組正常數(shù)據(jù)建立回歸預警模型,后30組數(shù)據(jù)作為驗證樣本,驗證結(jié)果分別如圖8和圖9所示。 圖8 正常運行模式下的齒輪箱溫度預警曲線 圖9 正常運行模式下的齒輪箱溫度預測殘差 據(jù)信息記錄查詢,在2016年6~7月份期間,#84風電機組持續(xù)正常工作,并無故障情況。對圖9預警曲線進行觀察分析,采用回歸分析方法建立#84風機的健康模型,預警曲線能夠很好地跟隨實際曲線,預測殘差波動范圍很小,在0.3 ℃以內(nèi),上述結(jié)果表明,采用線性回歸分析的方法能夠較好地對齒輪箱溫度進行預測。 采用上述所建線性回歸預測模型對#84風機異常時刻前后一段時間數(shù)據(jù)進行預測分析。以 5 min為時間采集單位,據(jù)現(xiàn)場經(jīng)驗設(shè)定預測殘差預警閾值為2 ℃,預測結(jié)果分別如圖10和圖11所示。 圖10 異常狀態(tài)下的齒輪箱溫度預警曲線 圖11 異常狀態(tài)下的齒輪箱溫度預測殘差 由圖10溫度預警曲線可以得出,在約第17個采集點時刻之前,實際溫度曲線能夠很好地跟隨預測曲線,溫度殘差浮動較小,浮動范圍在0.3 ℃之內(nèi)。在此之后實際測量溫度表現(xiàn)出異常特性,開始偏離預測曲線,這種偏離特性隨著時間推移表現(xiàn)得尤為明顯。其中,溫度預測殘差也逐步增大。由圖11可知,從大約第22個采集點開始,殘差值超過預警閾值,且呈增大趨勢,此時觸發(fā)報警,提醒工作人員該風機可能存在潛在故障,在此之后預警曲線的溫度繼續(xù)上升,故障特征已經(jīng)很明顯。 (1)依據(jù)箱式分布圖的方法確定風機群落中的異常風機。采用Hadoop大數(shù)據(jù)分析平臺對風場中所有群落溫度參數(shù)指標進行存儲、計算、分析,不僅充分利用了該平臺高存儲量、計算速度快的優(yōu)勢,還兼顧了計算分析的實時性與準確性。 (2)采用橫向分析的方法從整個風場層面對所有風機進行分析,確定出異常運行風機,再采用線性回歸預測分析的方法對異常風機進行縱向分析。選擇合適的參數(shù)集作為預測模型的輸入變量,結(jié)合一定的現(xiàn)場經(jīng)驗,設(shè)置合理的預測殘差預警閾值,觀察預測溫度的變化趨勢來進行故障預警最終確保了故障預警的準確性。 參考文獻: [1]劉軒,孫建平.風力發(fā)電機溫升故障預警方法研究[J].電力科學與工程,2016,32(6):38-43. [2]LIANG J, YANG J, WU Y, et al. Big data application in education: dropout prediction in edx MOOCs[C]// IEEE Second International Conference on Multimedia Big Data. IEEE, 2016:440-443. [3]LIU W, TANG B, JIANG Y.Status and problems of wind turbine structural health monitoring techniques in China[J].Renewable Energy, 2010,35(7):1414-1418. [4]孫建平,朱雯,翟永杰,等.基于MSET方法的風電機組齒輪箱預警仿真研究[J].系統(tǒng)仿真學報,2013,25(12):3009-3014. [5]詹長庚,萬書亭,王聰.風機傳動齒輪箱故障的Hilbert及倒譜綜合分析[J].電力科學與工程,2013,29(5):1-7. [6]李若昭. 風電機組綜合性能評估與運行特性分析[D]. 北京:華北電力大學,2009. [7]ANDREW K, ZHANG Z J,ANOOP V.Prediction,operations and condition monitoring in wind energy[J].Energy,2013:1-12. [8]BOUCHIKHI E H E, CHOQUESUE V, BENBOUEID M E H. Non-stationary spectral estimation for wind turbine induction generator faults detection[C]// Industrial Electronics Society, IECON 2013, Conference of the IEEE. IEEE, 2013:7376-7381. [9]童超,郭鵬.基于特征選擇和BP神經(jīng)網(wǎng)絡的風電機組故障分類監(jiān)測研究[J].動力工程學報,2014,34(4):313-317. [10]SCHIECHTINGEN M, SANTOS I F, ACHICHE S. Wind turbine condition monitoring based on SCADA data using normal behavior models. Part 1: System description[J]. Applied Soft Computing Journal, 2013, 13(1):259-270. [11]JING C,HOU J.SVM and PCA based on fault classification approaches for complicated industrial process[J].Neurocomputing,2015:636-642. [12]趙洪山,胡慶春,李志為.基于統(tǒng)計過程控制的風機齒輪箱故障預測[J].電力系統(tǒng)保護與控制,2012,40(13):67-73. [13]BUTLER S, RINGWOOD J, O'CONNOR F. Exploiting SCADA system data for wind turbine performance monitoring[C]// Control and Fault-Tolerant Systems. IEEE, 2014:389-394.2 基于Hadoop的風機群落異常風機識別
2.1 風機預警指標體系
2.2 風機群落規(guī)則分析與設(shè)計
2.3 風機群落異常風機識別案例分析
3 基于NEST的異常風機故障預警
3.1 NEST預測模型
3.2 基于NEST的異常風機故障預警案例分析
4 結(jié)論