(酒泉職業(yè)技術學院,甘肅酒泉市,735000)方占萍
為了改善風電場運維情況,就應通過大數(shù)據(jù)統(tǒng)計分析專業(yè)技術,來準確預測、評估機組設備的運行狀態(tài),并明確機組零部件的實際運行劣化趨勢,再智能化預警風電機組后續(xù)可能的異常現(xiàn)象,幫助風電場運維者做好預防性維護,有效避免機組出現(xiàn)故障。
在大數(shù)據(jù)時代下,各個行業(yè)均發(fā)展得越來越快。在迅速發(fā)展中,會產(chǎn)生大量的數(shù)據(jù)。為了充分發(fā)揮數(shù)據(jù)的作用,便應注意分析、計算數(shù)據(jù)。而通過大數(shù)據(jù)分析專業(yè)技術,便可以從各個行業(yè)內(nèi)部收集并存儲下來的數(shù)據(jù)出發(fā),按照各自的行業(yè)特征,以切實適合的方法,來科學地展開分析,并輔助提出正確決策。
大數(shù)據(jù)分析指的就是一個基于數(shù)據(jù),來整理、轉換、建模的整個過程,主要旨在找出有助于業(yè)務決策的信息。通過數(shù)據(jù)分析專業(yè)技術的應用,可提取出海量數(shù)據(jù)內(nèi)的有用信息,并基于數(shù)據(jù)分析結果正確做出決策。相較于傳統(tǒng)數(shù)據(jù),大數(shù)據(jù)表現(xiàn)出很明顯的數(shù)據(jù)量大、迅速響應、種類豐富多樣、不易識別、價值高及密度低等方面的特點。而以上這些特點也屬于大數(shù)據(jù)分析發(fā)展中的挑戰(zhàn),為了迎接這些挑戰(zhàn),大型互聯(lián)網(wǎng)公司便陸續(xù)推出了類型各異的大數(shù)據(jù)分析處理技術系統(tǒng)。在進一步發(fā)展大數(shù)據(jù)行業(yè)之中,先進的大數(shù)據(jù)分析專業(yè)技術也獲得了飛快的發(fā)展。而在風電行業(yè),面臨海量、復雜多變的機組設備數(shù)據(jù)監(jiān)測,為了控制數(shù)據(jù)分析處理的速度及精度,也有應用大數(shù)據(jù)分析專業(yè)技術,來達到預測風電行業(yè)設備異常方面的要求。
為了滿足預測風電設備各種異常數(shù)據(jù)在處理速率及日常預測精度上的要求,文中建立了一個預測風電設備各種異常的模型。在模型當中,主要涉及分析層、應用層、采集層、存儲層這些組成部分。
作為前饋多層網(wǎng)絡之一,從反向傳播誤差的算法專業(yè)訓練具有神經(jīng)網(wǎng)絡上的特征。因為神經(jīng)網(wǎng)絡可顯示非線性整體映射關系,所以在各個領域均獲得了很廣泛的應用。在實際應用神經(jīng)網(wǎng)絡中,不必提前了解映射關系的描述方程。在BP神經(jīng)的拓撲網(wǎng)絡結構內(nèi),主要涉及輸入輸出層、隱層等,且學習算法就是最速下降法。為了最小化神經(jīng)網(wǎng)絡上的誤差平方和,便應靈活調(diào)整好整個神經(jīng)網(wǎng)絡上的閾值及權值。據(jù)有關研究顯示,如果在BP神經(jīng)網(wǎng)絡上的隱含層內(nèi),幫助充足的神經(jīng)元,并且只含有唯一隱含層之類的BP神經(jīng)網(wǎng)絡,便可從任意精度,直接逼近一個連續(xù)不斷的非線性函數(shù)。為此,文中選擇的是只有一個隱含層類型的BP神經(jīng)網(wǎng)絡。就BP神經(jīng)網(wǎng)絡結構模型,為了縮短算法運行所耗時間,展開了并行運算?;诓⑿谢椒∕apReduce的大力支持,就各權值變化量,便可在Map環(huán)節(jié)順利運算并輸出來。針對權值各異的總變化量,便可在Reduce中完全統(tǒng)計,并科學地統(tǒng)一靈活調(diào)整配合權值,并可從批處理上展開訓練。
在季節(jié)性天氣變化及頻繁更改風速的作用下,風電場內(nèi)機組也應積極切換自己的運行工況。在反復切換風電機組工況的情況下,監(jiān)測設備狀態(tài)的數(shù)據(jù)也會經(jīng)常大幅波動幅值。所以不能利用幅值大小,來準確判斷風電機組的實際運行安全水平。為了順應風電機組的這個運行特征,當前在風電行業(yè)一般都采用的是閾值報警法。也就是在判斷風電機組的實際運行狀態(tài)時,采用監(jiān)測信號有沒有上升至報警閾值的判斷基礎。但是,該閾值報警法,在實際應用的過程當中,極易發(fā)生誤漏報等,所以預測風電設備的有關異常精確度較低。所以,文中通過殘差分析法,來判斷風電機組的實際運行狀態(tài)。大致的程序如下所示:“監(jiān)測歷史數(shù)據(jù)→開始預處理→選出可用歷史數(shù)據(jù)→做好歸一化→搭建BP神經(jīng)網(wǎng)絡專業(yè)訓練模型→設置網(wǎng)絡權值、形成閾值矩陣→建立BP神經(jīng)網(wǎng)絡專業(yè)預測模型”“監(jiān)測新數(shù)據(jù)→建立BP神經(jīng)網(wǎng)絡專業(yè)預測模型→算出殘差→有沒有超過殘差閾值→有→算出RMSE→有沒有超過RMSE閾值→有→異常狀態(tài)”,倘若殘差或RMSE未超過設定閾值,就表示風電設備在正常狀態(tài)下。
實際預測風電設備出現(xiàn)異常的過程:①選出正常運行下風電機組內(nèi)部的SCADA數(shù)據(jù),并長期有針對性的預處理措施,以獲得后續(xù)分析所需的監(jiān)測數(shù)據(jù)。根據(jù)一定的比例展開劃分環(huán)節(jié),以才獲得的監(jiān)測數(shù)據(jù)作為測試及訓練所需數(shù)據(jù)。②對訓練數(shù)據(jù),采取歸一化處理,并選擇六個狀態(tài)參數(shù)當作模型輸入所需參數(shù),依次就是振動機艙的值、發(fā)電機轉速值、風速大小、輪箱內(nèi)部油溫、振動傳感器X與Y。從輸入?yún)?shù)出發(fā),展開BP神經(jīng)網(wǎng)絡專業(yè)模型訓練,按照訓練結束基礎依據(jù),來控制輸出值誤差位于允許范圍。③從目標參數(shù)出發(fā),通過預測模型展開預測,比較實際值和參數(shù)預測結果,并得到殘差。一旦沒有發(fā)現(xiàn)殘差超過設定閾值,則可斷定參數(shù)下的風機設備一切正常。④比較實際值和參數(shù)預測結果,一旦殘差超過設定閾值,便應通過下式,來算出均方根RMSE誤差:
其中,D—均方根誤差;m—樣本數(shù);x—模型預測值;xi—實際值。以上的RMSE結果,還可用作衡量殘差改變的劇烈水平。為了準確體現(xiàn)殘差發(fā)展趨勢,還應按滑動窗口技術,根據(jù)每天計算,來獲得RMSE改變狀況。⑤從計算中獲得RMSE值,如果該值有超過設定閾值,便應判斷該風電設備位于異常狀態(tài)。
為了證實文中所提方法的正確實用性,建立起Hadoop平臺,并開始測試過程。其中使用的是兩從節(jié)點和一主節(jié)點形成的集群Hadoop。這些節(jié)點具有2G內(nèi)存,是基于Hyper-V應用管理器,建立的虛擬機。而內(nèi)含200G硬盤,通過Eclipse、Hive、HBase等專業(yè)技術來開發(fā)。從某風電場2019年1月~2020年1月具體的運行數(shù)據(jù)開始,這些數(shù)據(jù)源自SCADA體系33臺風電設備的數(shù)據(jù)。在測試中選出33臺機組設備中的15臺在2019年7月獲得的監(jiān)測數(shù)據(jù)。從監(jiān)測的15組數(shù)據(jù)出發(fā),選出訓練樣本,并執(zhí)行模型訓練。為了有效控制模型輸出中的誤差,設置各組訓練1 000次,獲得性能佳的BP神經(jīng)網(wǎng)絡專業(yè)預測模型。選擇一臺機組對應的2019年7月監(jiān)測產(chǎn)生的15組數(shù)據(jù)當作測試樣本,并預測下一時刻油溫均值,獲得比較模型預測值和監(jiān)測值的結果。據(jù)比較顯示,真實值大致吻合預測值,很好地證實了模型的有效性與精確度。
總之,在風電場,大數(shù)據(jù)分析專業(yè)技術能夠用于準確預測設備異常。所以,文中提出了相應的預測模型,以預測異常運行流程等。為了利用好大數(shù)據(jù)分析這種技術,還應注意引進評價實時可靠性的公式,兼顧風速短時波動與監(jiān)測數(shù)據(jù)信息的時序性,以確保預測的高可行性,進而有效促進風電行業(yè)的健康發(fā)展。