收稿日期:2021-12-24
基金項(xiàng)目:國(guó)家自然科學(xué)基金(61803329);中央引導(dǎo)地方科技發(fā)展資金(216Z2101G);河北省重點(diǎn)研發(fā)計(jì)劃(19214306D);河北省自然科學(xué) 基金(F2021203009)
通信作者:謝 平(1972—),女,博士、教授,主要從事智能信息處理方面的研究。pingx@ysu.edu.cn
DOI:10.19912/j.0254-0096.tynxb.2021-1581 文章編號(hào):0254-0096(2023)05-0368-08
摘 要:準(zhǔn)確可靠的異常檢測(cè)對(duì)于保障風(fēng)電機(jī)組安全高效運(yùn)行尤為重要。然而,由于風(fēng)電機(jī)組內(nèi)部結(jié)構(gòu)復(fù)雜,運(yùn)行工況復(fù)雜多變,導(dǎo)致所獲取的數(shù)據(jù)采集與監(jiān)控(SCADA)系統(tǒng)數(shù)據(jù)往往呈現(xiàn)出復(fù)雜的非線性和關(guān)聯(lián)耦合特性。為了更加有效地捕獲不同傳感器變量之間的空間相關(guān)性,提出基于空洞因果卷積網(wǎng)絡(luò)的風(fēng)電機(jī)組異常檢測(cè)方法,并采用Focal Loss改進(jìn)損失函數(shù)解決了數(shù)據(jù)不平衡問(wèn)題對(duì)模型性能的影響。該方法可通過(guò)不同的感受野大小從多尺度角度提取豐富的空間相關(guān)特征,有效建模并挖掘不同傳感器數(shù)據(jù)間存在的空間因果關(guān)系。同時(shí),該模型提供了一種端到端的異常檢測(cè)方案,可直接從原始SCADA數(shù)據(jù)中提取空間特征,建立數(shù)據(jù)與狀態(tài)標(biāo)簽之間的非線性映射關(guān)系,從而輸出異常檢測(cè)結(jié)果。通過(guò)某風(fēng)場(chǎng)的SCADA數(shù)據(jù)實(shí)例分析驗(yàn)證了所提出方法的可行性和有效性。
關(guān)鍵詞:風(fēng)電機(jī)組;因果卷積;空洞卷積;不平衡數(shù)據(jù);異常檢測(cè)
中圖分類(lèi)號(hào):TM721 " " " 文獻(xiàn)標(biāo)志碼:A
0 引 言
風(fēng)能作為清潔、可再生的綠色新能源之一,近幾年在全球范圍得到大規(guī)模開(kāi)發(fā)和利用,風(fēng)力發(fā)電已成為中國(guó)解決能源以及環(huán)境問(wèn)題的最優(yōu)方案之一,與此同時(shí)風(fēng)電機(jī)組裝機(jī)量呈逐年上升趨勢(shì)[1]。然而,由于風(fēng)電機(jī)組結(jié)構(gòu)復(fù)雜,多部件系統(tǒng)耦合,加上安裝環(huán)境一般較偏遠(yuǎn),且環(huán)境惡劣[2],導(dǎo)致機(jī)組穩(wěn)定性以及可靠性差,風(fēng)電機(jī)組事故頻發(fā),造成大量人力物力損失和帶來(lái)高昂的維護(hù)費(fèi)用[3]。如何提高和保障風(fēng)電機(jī)組的運(yùn)行可靠性、減小故障發(fā)生率和降低運(yùn)行維護(hù)成本成為當(dāng)前國(guó)內(nèi)外學(xué)術(shù)界和工程界關(guān)注的焦點(diǎn)問(wèn)題[4]。因此,準(zhǔn)確可靠的異常檢測(cè)對(duì)于保障機(jī)組安全可靠運(yùn)行顯得尤為重要。
為了及時(shí)準(zhǔn)確監(jiān)測(cè)風(fēng)電機(jī)組的健康運(yùn)行狀態(tài),目前風(fēng)電場(chǎng)已廣泛采用多種狀態(tài)監(jiān)測(cè)技術(shù),主要包括振動(dòng)監(jiān)測(cè)、聲發(fā)射監(jiān)測(cè)、油液監(jiān)測(cè)、數(shù)據(jù)采集與狀態(tài)監(jiān)視(supervisory control and data acquisition,SCADA)參數(shù)監(jiān)測(cè)等。其中,振動(dòng)、聲發(fā)射和油液監(jiān)測(cè)均需額外安裝傳感器,給風(fēng)電機(jī)組運(yùn)維數(shù)據(jù)采集工作增加了成本。而SCADA參數(shù)來(lái)自于機(jī)組預(yù)裝的監(jiān)視控制系統(tǒng),具有低成本和可用性等優(yōu)勢(shì),在風(fēng)電機(jī)組的狀態(tài)檢測(cè)中已得到廣泛應(yīng)用[5-6]。如景彤梅等[7]提出一種基于KECA-GRNN的性能監(jiān)測(cè)與評(píng)估方法,實(shí)現(xiàn)了對(duì)風(fēng)電機(jī)組齒輪箱的健康程度評(píng)價(jià);金曉航等[8]通過(guò)融合稀疏自編碼器和深度神經(jīng)網(wǎng)絡(luò)算法,提出一種基于SCADA數(shù)據(jù)的風(fēng)電機(jī)組在線運(yùn)行狀態(tài)監(jiān)測(cè)方法;顏永龍等[9]提出基于反向神經(jīng)網(wǎng)絡(luò)和最小二乘支持向量機(jī)的組合預(yù)測(cè)模型對(duì)SCADA狀態(tài)參數(shù)進(jìn)行建模,實(shí)現(xiàn)了對(duì)發(fā)電機(jī)軸承溫度異常的檢測(cè);黃榮舟等[10]使用長(zhǎng)短期記憶網(wǎng)絡(luò)融合SCADA數(shù)據(jù)計(jì)算出風(fēng)電機(jī)組齒輪箱狀態(tài)異常閾值進(jìn)行風(fēng)電齒輪箱狀態(tài)檢測(cè)。以上方法側(cè)重于對(duì)SCADA某一重要參數(shù)(如齒輪箱溫度或主軸承溫度)的預(yù)測(cè)建模分析,未充分考慮不同SCADA傳感器參數(shù)之間的多變量關(guān)聯(lián)性。
風(fēng)電機(jī)組是一類(lèi)典型的非線性、強(qiáng)耦合的機(jī)電系統(tǒng),其內(nèi)部結(jié)構(gòu)復(fù)雜,運(yùn)行工況復(fù)雜多變,導(dǎo)致所獲取的SCADA數(shù)據(jù)往往也呈現(xiàn)出復(fù)雜的非線性和關(guān)聯(lián)耦合特性。SCADA通常包含風(fēng)速、功率、環(huán)境溫度、部件溫度等不同傳感器類(lèi)型變量,由于機(jī)組內(nèi)不同子系統(tǒng)或部件的相互作用,從而不同傳感器變量之間也存在較為復(fù)雜的空間相關(guān)性。例如當(dāng)發(fā)電機(jī)某一部件發(fā)生故障時(shí),可能會(huì)引發(fā)多個(gè)相關(guān)傳感器監(jiān)測(cè)變量同時(shí)變化,進(jìn)而不同傳感器變量間的關(guān)系也會(huì)發(fā)生相應(yīng)變化。為挖掘SCADA數(shù)據(jù)中的多傳感器空間相關(guān)性,卷積神經(jīng)網(wǎng)絡(luò)近年來(lái)逐漸被應(yīng)用于SCADA數(shù)據(jù)的建模分析。江國(guó)乾等[11]提出利用去噪自編碼器來(lái)建模模擬不同傳感器之間的相關(guān)性,建立基于重構(gòu)殘差的異常監(jiān)測(cè)模型;孔子遷等[12]設(shè)計(jì)與傳感器變量數(shù)相同的一維卷積核來(lái)捕獲所有傳感器變量之間的全局相關(guān)性,進(jìn)一步通過(guò)循環(huán)門(mén)控單元來(lái)捕獲時(shí)序特征,實(shí)現(xiàn)了風(fēng)電齒輪箱的異常檢測(cè);何群等[13]設(shè)計(jì)了多尺度核卷積神經(jīng)網(wǎng)絡(luò),利用多個(gè)大小不同的卷積核實(shí)現(xiàn)了對(duì)傳感器空間關(guān)系的多尺度特征提取和風(fēng)電機(jī)組多分類(lèi)故障診斷。然而,以上方法只能捕獲相鄰傳感器的局部相關(guān)性和所有傳感器的全局相關(guān)性,難以有效挖掘非相鄰傳感器的相關(guān)性。
因此,為解決上述問(wèn)題而更有效提取不同傳感器變量之間的復(fù)雜空間耦合關(guān)系,提出一種基于空洞因果卷積網(wǎng)絡(luò)的風(fēng)電機(jī)組異常檢測(cè)方法。該方法受時(shí)間卷積網(wǎng)絡(luò)[14]的啟發(fā),將空洞卷積與因果卷積從時(shí)間維度應(yīng)用在空間維度上,來(lái)建模模擬不同傳感器變量的空間相關(guān)性,并建立風(fēng)電機(jī)組異常檢測(cè)分類(lèi)模型。同時(shí),考慮到實(shí)際風(fēng)電場(chǎng)中故障樣本相對(duì)于正常樣本嚴(yán)重缺乏而導(dǎo)致的數(shù)據(jù)不平衡性,引入Focal Loss損失函數(shù)[15]來(lái)降低不平衡數(shù)據(jù)對(duì)模型性能的影響。最后,通過(guò)某風(fēng)電場(chǎng)SCADA測(cè)試數(shù)據(jù)驗(yàn)證所提方法的有效性。
1 空洞因果卷積方法原理
1.1 空洞卷積
卷積神經(jīng)網(wǎng)絡(luò)是目前最流行的人工神經(jīng)網(wǎng)絡(luò)之一,在圖像處理、計(jì)算機(jī)視覺(jué)、故障診斷等多個(gè)領(lǐng)域均取得了很好的效果[16-17]??斩淳矸e又名膨脹卷積或擴(kuò)張卷積,是在傳統(tǒng)卷積的基礎(chǔ)上引入一個(gè)稱(chēng)為“膨脹率”的新參數(shù),這個(gè)參數(shù)定義了卷積核處理數(shù)據(jù)時(shí)各值的間距,即卷積核的間隔數(shù)量,正常的卷積網(wǎng)絡(luò)膨脹率為1[18]??斩淳矸e網(wǎng)絡(luò)作為循環(huán)卷積網(wǎng)絡(luò)的替代,近幾年在語(yǔ)義分割與目標(biāo)檢測(cè)等任務(wù)中得到廣泛應(yīng)用??斩淳矸e最初的提出是為了解決圖像分割問(wèn)題,常見(jiàn)的圖像分割算法通常使用池化層和卷積層來(lái)增加感受野,然后再利用上采樣還原圖像尺寸,特征圖縮小再放大的過(guò)程造成了精度上的損失,使得一定程度上結(jié)果不準(zhǔn)確。因此需一種操作可在增加感受野的同時(shí)保持特征圖的尺寸不變,從而代替下采樣和上采樣操作,而空洞卷積可很好地滿(mǎn)足上述需求。
空洞卷積運(yùn)算應(yīng)用到序列數(shù)據(jù)上能起到同樣的效果,對(duì)空間的建模長(zhǎng)度受限于卷積核的大小,若為捕獲更多變量間的相互依賴(lài)關(guān)系,獲得足夠大的感受野,則需增大卷積核的大小,或增加足夠多的卷積層數(shù)以及池化層再上采樣恢復(fù)特征圖大小,但這樣會(huì)增大運(yùn)算量,且會(huì)損失精度。因此,在序列數(shù)據(jù)中,空洞卷積同樣能較好地實(shí)現(xiàn)擴(kuò)大感受野而不損失精度的任務(wù)。
一維空洞卷積的計(jì)算原理如圖1所示,該網(wǎng)絡(luò)包含4層網(wǎng)絡(luò)結(jié)構(gòu):輸入層、2個(gè)空洞卷積特征映射層和輸出層。其中[si]([i]=1,2,…,[n])表示SCADA數(shù)據(jù)中的不同傳感器變量,為網(wǎng)絡(luò)的輸入層。第2層和第3層是前一層經(jīng)過(guò)空洞卷積計(jì)算得到的特征映射層,最后計(jì)算得到的輸出層為原始數(shù)據(jù)的深層特征表達(dá)。其中卷積核大小為3,第1層空洞卷積的膨脹率為1,第2層空洞卷積的膨脹率為2。從圖1中可看出,空洞卷積與傳統(tǒng)卷積計(jì)算的不同點(diǎn)在于非相鄰神經(jīng)元參與計(jì)算,因此輸出層能獲得更大的感受野。
對(duì)于一個(gè)長(zhǎng)序列輸入[x]和一個(gè)卷積濾波器[f],定義空洞卷積的計(jì)算過(guò)程如式(1)所示。由式(1)可知,空洞相當(dāng)于在每2個(gè)相鄰的卷積核之間加入一個(gè)固定的步長(zhǎng)。使用更大的膨脹系數(shù)可使輸出代表更大范圍的輸入,從而有效增加了卷積運(yùn)算的感受野。
[F(s)=(x*df)(s)=i=0k-1f(i)·xs-d·i] (1)
式中:[*d]——膨脹系數(shù)為d的卷積運(yùn)算符號(hào);[k]——卷積核大小;[s-d·i]——卷積計(jì)算進(jìn)行的方向。
使用空洞卷積主要能獲得以下優(yōu)點(diǎn):
1)擴(kuò)大感受野:在深度網(wǎng)絡(luò)中為增加感受野且降低計(jì)算量,需進(jìn)行降采樣,這樣雖然增加了感受野,但空間分辨率降低。為不丟失分辨率,且仍可擴(kuò)大感受野,可使用空洞卷積。如圖1所示,當(dāng)空洞率大于1時(shí),空洞卷積能捕獲SCADA數(shù)據(jù)中非相鄰傳感器之間的相關(guān)性特征。
2)捕獲多尺度信息:空洞卷積有一個(gè)膨脹系數(shù)可設(shè)置,具體就是在卷積核中填充0,因此,當(dāng)設(shè)置不同膨脹系數(shù)時(shí),具有不同的感受野,即能獲取對(duì)應(yīng)數(shù)據(jù)的多尺度信息。
1.2 因果卷積
因果卷積是一維卷積的變體,因果卷積提出的初衷就是要用卷積神經(jīng)網(wǎng)絡(luò)起到與循環(huán)卷積網(wǎng)絡(luò)相同的作用,用于處理時(shí)間序列數(shù)據(jù),使得使用卷積網(wǎng)絡(luò)也能不破壞序列數(shù)據(jù)之中隱含的因果性。因果卷積可將過(guò)去的信息保存在網(wǎng)絡(luò)結(jié)構(gòu)中,網(wǎng)絡(luò)深度越深,網(wǎng)絡(luò)中包含過(guò)去的信息越多,但是網(wǎng)絡(luò)深度增加,會(huì)影響模型的訓(xùn)練效率。為解決該問(wèn)題,通常需將因果卷積和空洞卷積聯(lián)合使用。SCADA數(shù)據(jù)中的傳感器變量維度較高,不同傳感器數(shù)據(jù)間存在隱藏的因果關(guān)系,因此,采用因果卷積來(lái)捕獲這種因果關(guān)系,從而建立更可靠的機(jī)組監(jiān)測(cè)模型。
一維因果卷積的結(jié)構(gòu)示意圖如圖2所示,與圖1類(lèi)似,同樣為4層網(wǎng)絡(luò)結(jié)構(gòu)。輸入層為SCADA數(shù)據(jù)中的不同傳感器變量[si]([i]=1,2,…,[n])。中間2層是前一層經(jīng)過(guò)因果卷積計(jì)算得到的特征映射層。其中卷積核大小為3。從圖2中可看出,對(duì)于某一層的輸出,因果卷積計(jì)算結(jié)果只依賴(lài)于其前一層對(duì)應(yīng)的傳感器及其之前已有的傳感器數(shù)據(jù),未使用到卷積計(jì)算之后多出來(lái)的變量參與到計(jì)算中,在實(shí)際模型的構(gòu)建中使用補(bǔ)0以及剪切來(lái)完成上述的因果卷積計(jì)算過(guò)程。因果卷積和傳統(tǒng)卷積計(jì)算的不同之處在于,傳統(tǒng)卷積計(jì)算輸出后的數(shù)據(jù)維度會(huì)發(fā)生變化,而因果卷積采用已存在的數(shù)據(jù)參與計(jì)算,是單向的結(jié)構(gòu)。由已存在的數(shù)據(jù)計(jì)算新的數(shù)據(jù),是一種嚴(yán)格的因果約束模型,因此被稱(chēng)為因果卷積。
2 基于空洞因果卷積的異常檢測(cè)方法
本文將風(fēng)電機(jī)組異常檢測(cè)問(wèn)題描述為一個(gè)二分類(lèi)問(wèn)題,即建立分類(lèi)模型來(lái)識(shí)別機(jī)組正常和異常2種狀態(tài)。為了更有效捕獲機(jī)組SCADA數(shù)據(jù)中多傳感器變量之間的空間相關(guān)性,提出基于空洞因果卷積的風(fēng)電機(jī)組異常檢測(cè)方法,主要包括模型離線訓(xùn)練和在線監(jiān)測(cè)2個(gè)階段,如圖3所示。其中離線訓(xùn)練階段主要是基于機(jī)組歷史監(jiān)測(cè)數(shù)據(jù)訓(xùn)練和建立異常檢測(cè)分類(lèi)模型,并將最優(yōu)模型保存。而在線監(jiān)測(cè)階段,只需將實(shí)時(shí)監(jiān)測(cè)得到的多傳感器數(shù)據(jù)輸入到訓(xùn)練好的異常檢測(cè)模型中,即可輸出相應(yīng)的監(jiān)測(cè)結(jié)果。
2.1 數(shù)據(jù)預(yù)處理
由于原始SCADA數(shù)據(jù)中傳感器變量(如風(fēng)速、功率和溫度等)類(lèi)型不同,量綱差異較大,直接用于建模會(huì)影響模型的性能。因此,采用均值方差歸一化方法對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。歸一化計(jì)算公式為:
[χscale=χ-μS] (2)
式中:[χscale]——?dú)w一化之后的值;[χ]——原始傳感器變量的取值;[μ]、[S]——原始數(shù)據(jù)樣本的平均值和標(biāo)準(zhǔn)差。
2.2 模型構(gòu)建
基于因果空洞卷積網(wǎng)絡(luò)的異常檢測(cè)模型如圖4所示。該模型包括輸入層、空洞因果卷積特征提取模塊、全連接層和分類(lèi)輸出層??斩匆蚬矸e是空洞卷積和因果卷積的組合,有效集成了兩者的優(yōu)勢(shì)。其中空洞因果卷積特征提取模塊由3層卷積計(jì)算構(gòu)成。為提取非線性特征,每個(gè)因果卷積層計(jì)算包括一維空洞因果卷積計(jì)算(1D Conv)、激活函數(shù)(ReLU)和Dropout層,其中Dropout是為了防止模型過(guò)擬合。3個(gè)空洞因果卷積層的膨脹率分別為1、2和3。該模型采用不同的膨脹率使得模型具有多尺度特征提取能力,可更好地捕獲變量的空間相關(guān)性和因果關(guān)系。經(jīng)過(guò)空洞因果卷積特征提取后,計(jì)算得到多尺度空間特征,再通過(guò)一個(gè)全連接層和一個(gè)Softmax分類(lèi)輸出層將學(xué)到的特征映射到狀態(tài)標(biāo)記空間,最后輸出狀態(tài)分類(lèi)結(jié)果。
2.3 模型訓(xùn)練
實(shí)際情況下,風(fēng)電機(jī)組大多時(shí)間運(yùn)行在正常狀態(tài)下,因此正常運(yùn)行時(shí)段數(shù)據(jù)量大,而機(jī)組異常時(shí)段數(shù)據(jù)量稀少,呈現(xiàn)出典型的數(shù)據(jù)不平衡[19]。針對(duì)此問(wèn)題,目前常用的方法主要分為2種[20]:數(shù)據(jù)層面,通過(guò)重采樣技術(shù),改變數(shù)據(jù)原始分布,使原始數(shù)據(jù)中各類(lèi)樣本達(dá)到平衡;在模型層面,改進(jìn)損失函數(shù),通過(guò)使用代價(jià)敏感函數(shù)處理數(shù)據(jù)不平衡性。其中重采樣方法會(huì)導(dǎo)致信息的丟失或不確定信息的增加。為了在不改變數(shù)據(jù)分布的基礎(chǔ)上盡可能利用全部數(shù)據(jù)信息來(lái)建立可靠的模型,本文引入Focal Loss[15]來(lái)處理數(shù)據(jù)不平衡問(wèn)題。Focal Loss是在傳統(tǒng)交叉熵?fù)p失函數(shù)的基礎(chǔ)上增加一定的約束和權(quán)重條件所提出的一種新的損失函數(shù)。其減少了擁有較多數(shù)量樣本的權(quán)值,改善了模型中由于數(shù)據(jù)不平衡所引起的問(wèn)題。其計(jì)算公式為:
[L(p)=-α(1-p)γlog2p] (3)
式中:[p]——預(yù)測(cè)某一類(lèi)型故障的概率;[α]——權(quán)重因子;[γ]——調(diào)焦因子[(1-p)]的聚焦參數(shù)。直觀地講,[(1-p)γ]因子可自動(dòng)降低訓(xùn)練過(guò)程中樣本較多的類(lèi)別的貢獻(xiàn),并快速將模型集中在樣本較少的類(lèi)別上。本文[γ]取值為2,[α]取值為0.25。
為優(yōu)化整個(gè)異常檢測(cè)模型,采用Adam優(yōu)化算法進(jìn)行模型訓(xùn)練。Adam算法通過(guò)計(jì)算梯度一階矩估計(jì)與二階矩估計(jì),動(dòng)態(tài)調(diào)整不同參數(shù)的學(xué)習(xí)率,參數(shù)更新不受梯度伸縮變換影響,同時(shí)具有計(jì)算效率高、內(nèi)存需求低等優(yōu)點(diǎn)。
3 案例分析
3.1 數(shù)據(jù)描述
本文所使用的SCADA數(shù)據(jù)[21]來(lái)自于某風(fēng)場(chǎng)一臺(tái)額定功率為3 MW的直驅(qū)型風(fēng)電機(jī)組,主要包括2個(gè)數(shù)據(jù)集:運(yùn)行數(shù)據(jù)集和狀態(tài)數(shù)據(jù)集。其中,運(yùn)行數(shù)據(jù)集記錄了從2014年5月—2015年4月間11個(gè)月數(shù)據(jù),共計(jì)49027條記錄。數(shù)據(jù)采樣間隔為10 min,共包含61個(gè)參數(shù)。這些參數(shù)包括風(fēng)速、環(huán)境溫度、功率參數(shù)(如有功功率和無(wú)功功率)、槳距角,以及發(fā)電機(jī)軸承溫度、轉(zhuǎn)子溫度、定子溫度等部件溫度的平均值、最小值和最大值??紤]到平均值能反映參數(shù)的變化趨勢(shì)并結(jié)合文獻(xiàn)[21]的參數(shù)選擇經(jīng)驗(yàn),本文最終選取29個(gè)參數(shù)用于模型建立,具體參數(shù)信息如表1所示。
首先,對(duì)SCADA運(yùn)行數(shù)據(jù)集預(yù)處理,包括剔除機(jī)組停機(jī)運(yùn)行時(shí)間段數(shù)據(jù),經(jīng)過(guò)處理后得到的有效數(shù)據(jù)為32623條記錄。狀態(tài)數(shù)據(jù)集記錄了風(fēng)電機(jī)組的健康狀態(tài)信息,主要包含1個(gè)正常狀態(tài)和5個(gè)故障狀態(tài),具體故障分類(lèi)如表2所示。本文將異常檢測(cè)問(wèn)題定義為二分類(lèi)問(wèn)題,因此將5種故障狀態(tài)全部標(biāo)記為異常。其中,正常狀態(tài)包括32056條記錄,而異常狀態(tài)共567條記錄,正常與故障的不平衡比率接近57∶1,可見(jiàn)該數(shù)據(jù)集存在嚴(yán)重不平衡,這將導(dǎo)致無(wú)故障數(shù)據(jù)的特征學(xué)習(xí)充足,而故障數(shù)據(jù)的特征學(xué)習(xí)不足,最終導(dǎo)致分類(lèi)結(jié)果的偏差??紤]到數(shù)據(jù)不平衡,采用分層抽樣的方式對(duì)數(shù)據(jù)集進(jìn)行劃分,選取80%作為訓(xùn)練集,剩余20%作為測(cè)試集。具體信息見(jiàn)表3。
3.2 性能評(píng)價(jià)指標(biāo)
在不平衡數(shù)據(jù)的結(jié)果評(píng)估中,常用的分類(lèi)評(píng)價(jià)中精度(A)指標(biāo)往往不能準(zhǔn)確的對(duì)結(jié)果進(jìn)行評(píng)價(jià)。為此,本文選用精確率(P)、召回率(R)、F1以及G這4個(gè)指標(biāo)[22]來(lái)評(píng)估模型的測(cè)試性能,這些指標(biāo)已被廣泛用于不平衡數(shù)據(jù)的性能評(píng)估。本文將故障樣本定義為正例樣本,正常樣本定義為負(fù)例樣本。其中精確率是指分類(lèi)正確的正例樣本數(shù)量占分類(lèi)器判定為正例樣本的樣本數(shù)量的比例。召回率是指分類(lèi)正確的正例樣本數(shù)量占真正的正例樣本數(shù)量的比例。F1是召回率和精確率的調(diào)和平均值。F1和G能綜合評(píng)價(jià)模型的分類(lèi)性能。各指標(biāo)的計(jì)算公式為:
[P=nTPnTP+nFP] (4)
[R=nTPnTP+nFN] (5)
[F1=2×P×RP+R] (6)
[G=nTPnTP+nFN×nTNnTN+nFP] (7)
式中:[nTP]——預(yù)測(cè)正確且為正例的樣本數(shù)量;[nFP]——錯(cuò)誤預(yù)測(cè)為正例的樣本數(shù)量;[nFN]——錯(cuò)誤預(yù)測(cè)為負(fù)例的樣本數(shù)量;[nTN]——預(yù)測(cè)正確且為負(fù)例的樣本數(shù)量。
3.3 結(jié)果分析
3.3.1 不同模型檢測(cè)結(jié)果對(duì)比分析
首先,確定基于空洞因果卷積的異常檢測(cè)模型的網(wǎng)絡(luò)結(jié)構(gòu)。根據(jù)數(shù)據(jù)集確定網(wǎng)絡(luò)的輸入為29,對(duì)應(yīng)表1中的傳感器變量數(shù)量。網(wǎng)絡(luò)中的空洞因果卷積特征提取模塊包括3個(gè)空洞因果卷積層,每層分別采用不同的膨脹率1、2和3,每層的卷積核大小為3,卷積核數(shù)量為128,激活函數(shù)為ReLU,全連接層的神經(jīng)元數(shù)量為128,輸出層為2,對(duì)應(yīng)正常和故障2種機(jī)組狀態(tài)。然后,采用訓(xùn)練集對(duì)該模型進(jìn)行訓(xùn)練。訓(xùn)練的初始學(xué)習(xí)率設(shè)置為0.0001,batch size為512,迭代訓(xùn)練次數(shù)為350。模型訓(xùn)練的平均損失曲線隨迭代次數(shù)的變化情況如圖5所示,可看出,隨著訓(xùn)練迭代次數(shù)的增加,損失在不斷減小,當(dāng)?shù)_(dá)到350次時(shí),整個(gè)網(wǎng)絡(luò)模型趨于收斂。
為了驗(yàn)證本文所提出的基于空洞因果卷積網(wǎng)絡(luò)的異常檢測(cè)模型的有效性,選取傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)、空洞卷積網(wǎng)絡(luò)和因果卷積網(wǎng)絡(luò)作為特征提取模塊,設(shè)計(jì)對(duì)應(yīng)的異常檢測(cè)模型進(jìn)行對(duì)比實(shí)驗(yàn)。根據(jù)前述分析,由于卷積計(jì)算方式的不同,導(dǎo)致不同特征提取模塊對(duì)傳感器之間的空間相關(guān)性捕獲能力不同。圖6給出了4種卷積特征模塊的感受野對(duì)比結(jié)果,其中每個(gè)網(wǎng)絡(luò)模塊的輸入均為29個(gè)傳感器變量。
由圖6可看出,傳統(tǒng)CNN卷積網(wǎng)絡(luò)的每個(gè)特征層神經(jīng)元只依賴(lài)于前一層相鄰3個(gè)神經(jīng)元而計(jì)算得到,這樣就只能固定提取相鄰3個(gè)傳感器變量之間的關(guān)系,無(wú)法捕獲其他非相鄰傳感器變量間的關(guān)系,最終輸出層的感受野為7個(gè)傳感器。同理,因果卷積網(wǎng)絡(luò)輸出層的感受野也是7個(gè)傳感器。而空洞卷積和空洞因果卷積網(wǎng)絡(luò)均采用空洞卷積的思想,如圖6c和圖6d所示,通過(guò)采用不同的膨脹率,在卷積核中加入空洞,可獲得更大的感受野,使得網(wǎng)絡(luò)能捕獲到非相鄰傳感器變量間的關(guān)系。因此,空洞卷積以及空洞因果卷積網(wǎng)絡(luò)的感受野為13個(gè)傳感器,如果想獲得更大的感受野只需增加網(wǎng)絡(luò)深度或增大空洞率即可。需指出的是,與單一的空洞卷積相比,空洞因果卷積由于采用因果卷積計(jì)算方式,還能學(xué)習(xí)到不同傳感器數(shù)據(jù)間存在的空間因果關(guān)系。
4種不同模型檢測(cè)結(jié)果的混淆矩陣如圖7所示。所有異常檢測(cè)模型均采用相同的參數(shù)進(jìn)行訓(xùn)練,損失函數(shù)均采用Focal Loss。從圖7中可看出,相比于其他3種網(wǎng)絡(luò),空洞因果卷積網(wǎng)絡(luò)對(duì)正常和故障狀態(tài)的檢測(cè)準(zhǔn)確率最高,分別為99.92%和91.15%。具體來(lái)說(shuō),對(duì)于空洞因果卷積網(wǎng)絡(luò),在113個(gè)故障樣本中僅有10個(gè)樣本被錯(cuò)誤的識(shí)別為正常樣本;而6412個(gè)正常樣本中有5個(gè)樣本被錯(cuò)誤的識(shí)別為故障樣本。因此,所提方法具有最低的誤報(bào)率和漏報(bào)率。進(jìn)一步,計(jì)算召回率、精確率、F1和G這4個(gè)評(píng)價(jià)指標(biāo),結(jié)果如表4所示。從表4可看出,空洞因果卷積網(wǎng)絡(luò)在4個(gè)指標(biāo)上均高于其他3種對(duì)比方法,能實(shí)現(xiàn)更為有效和可靠的故障檢測(cè),這進(jìn)一步證明了空洞因果卷積網(wǎng)絡(luò)在多傳感器數(shù)據(jù)空間相關(guān)性和因果性特征提取方面的優(yōu)勢(shì)。
3.3.2 不平衡處理策略有效性分析
為證明所提模型采用Focal Loss作為損失函數(shù)的有效性,與傳統(tǒng)交叉熵?fù)p失函數(shù)進(jìn)行對(duì)比。同時(shí),與降采樣不平衡處理策略進(jìn)行比較,降采樣主要對(duì)比例較大的正常樣本進(jìn)行降采樣使得兩類(lèi)樣本平衡。2種對(duì)比方法均采用相同的網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練參數(shù)。圖8給出了交叉熵和降采樣的混淆矩陣分類(lèi)結(jié)果。從圖8可看出,采用交叉熵?fù)p失函數(shù)對(duì)故障狀態(tài)的識(shí)別率僅為86.7%,其中15個(gè)故障樣本未被正確識(shí)別,因此會(huì)產(chǎn)生較高的漏報(bào)率,這說(shuō)明交叉熵?fù)p失難以從不平衡樣本中有效學(xué)習(xí)兩類(lèi)樣本的特征,由于故障樣本數(shù)量太少,模型對(duì)故障樣本特征學(xué)習(xí)不足,導(dǎo)致模型的漏報(bào)率過(guò)高。而降采樣方法盡管對(duì)故障的識(shí)別率達(dá)到93.8%,但是對(duì)于正常狀態(tài)的識(shí)別準(zhǔn)確率僅為92.7%,遠(yuǎn)低于其他方法。這由于降采樣方法未能充分利用所有正常樣本信息,導(dǎo)致模型對(duì)正常樣本識(shí)別的泛化能力較差,從而造成模型的誤報(bào)率大大提高,其中471個(gè)樣本被錯(cuò)誤的識(shí)別為故障樣本。進(jìn)一步,同樣計(jì)算2種對(duì)比方法的4個(gè)評(píng)價(jià)指標(biāo),結(jié)果如表5所示。對(duì)比表4和表5,從F1和G這2個(gè)綜合性指標(biāo)可明顯看出,F(xiàn)ocal Loss顯著優(yōu)于交叉熵?fù)p失和降采樣方法,該結(jié)果進(jìn)一步證明了針對(duì)不平衡數(shù)據(jù)使用代價(jià)敏感函數(shù)Focal Loss的優(yōu)勢(shì)。
4 結(jié) 論
針對(duì)風(fēng)電機(jī)組SCADA數(shù)據(jù)中不同傳感器變量間的復(fù)雜空間關(guān)系難以挖掘、故障特征提取難等問(wèn)題,本文提出一種基于空洞因果卷積網(wǎng)絡(luò)的異常檢測(cè)方法。該方法充分結(jié)合空洞卷積和因果卷積的優(yōu)勢(shì),通過(guò)不同的感受野大小從多尺度角度提取豐富的空間相關(guān)特征,有效建模和挖掘不同傳感器數(shù)據(jù)間存在的空間因果關(guān)系。而且,針對(duì)數(shù)據(jù)不平衡問(wèn)題,引入Focal Loss作為損失函數(shù),保持了原始數(shù)據(jù)的完整性,有利于充分挖掘數(shù)據(jù)的故障特征信息,建立更為有效可靠的異常檢測(cè)模型。通過(guò)與傳統(tǒng)卷積網(wǎng)絡(luò)、空洞卷積網(wǎng)絡(luò)、因果卷積網(wǎng)絡(luò)以及交叉熵?fù)p失函數(shù)和降采樣方法比較,實(shí)驗(yàn)結(jié)果證明:本文所提出的模型可從原始的不平衡SCADA數(shù)據(jù)中自動(dòng)學(xué)習(xí)空間維度相關(guān)性特征并進(jìn)行異常分類(lèi)檢測(cè),展示出了較高的檢測(cè)精度和準(zhǔn)確性,為實(shí)際風(fēng)電場(chǎng)機(jī)組異常檢測(cè)提供了一種新的解決方案。
[參考文獻(xiàn)]
[1] 龍霞飛, 楊蘋(píng), 郭紅霞, 等. 大型風(fēng)力發(fā)電機(jī)組故障診斷方法綜述[J]. 電網(wǎng)技術(shù), 2017, 41(11): 3480-3491.
LONG X F, YANG P, GUO H X, et al. Review of fault diagnosis" methods" "for" "large" wind" "turbines[J]." "Power system technology, 2017, 41(11): 3480-3491.
[2] 陳雪峰, 郭艷婕, 許才彬, 等. 風(fēng)電裝備故障診斷與健康監(jiān)測(cè)研究綜述[J]. 中國(guó)機(jī)械工程, 2020, 31(2): 175-189.
CHEN X F, GUO Y J, XU C B, et al. Review of fault diagnosis and health monitoring for wind power equipment[J]. Journal of mechanical engineering, 2020, 31(2): 175-189.
[3] 杜勉, 易俊, 郭劍波, 等. 神經(jīng)網(wǎng)絡(luò)技術(shù)在風(fēng)電機(jī)組SCADA數(shù)據(jù)分析中的應(yīng)用研究[J]. 電網(wǎng)技術(shù), 2018, 42(7): 2200-2205.
DU M, YI J, GUO J B, et al. Research on the application of neural networks on wind turbine SCADA data analysis[J]. Power system technology, 2018, 42(7): 2200-2205.
[4] 曾軍, 陳艷峰, 楊蘋(píng), 等. 大型風(fēng)力發(fā)電機(jī)組故障診斷綜述[J]. 電網(wǎng)技術(shù), 2018, 42(3): 849-860.
ZENG J, CHEN Y F, YANG P, et al. Review of fault diagnosis methods of large-scale wind turbines[J]. Power system technology, 2018, 42(3): 849-860.
[5] WANG Z Y, YAO L G, CAI Y W, et al. Mahalanobis semi-supervised mapping and beetle antennae search based support vector machine for wind turbine rolling bearings" fault" diagnosis[J]." Renewable" energy," 2020, 155: 1312-1327.
[6] JIN X H, XU Z W, QIAO W. Condition monitoring of wind turbine generators using SCADA data analysis[J]. IEEE transactions on sustainable energy, 2021, 12(1): 202-210.
[7] 景彤梅, 齊詠生, 劉利強(qiáng), 等. 基于KECA-GRNN的風(fēng)電機(jī)組齒輪箱狀態(tài)監(jiān)測(cè)與健康評(píng)估[J]. 太陽(yáng)能學(xué)報(bào), 2021, 42(6): 400-408.
JING T M, QI Y S, LIU L Q, et al. Condition monitoring and health assessment of wind turbine gearbox based on KECA-GRNN[J]. Acta energiae solaris sinica, 2021, 42(6): 400-408.
[8] 金曉航, 許壯偉, 孫毅, 等. 基于SCADA數(shù)據(jù)分析和稀疏自編碼神經(jīng)網(wǎng)絡(luò)的風(fēng)電機(jī)組在線運(yùn)行狀態(tài)監(jiān)測(cè)[J]. 太陽(yáng)能學(xué)報(bào), 2021, 42(6): 321-328.
JIN X H, XU Z W, SUN Y, et al. Online condition monitoring for wind turbines based on SCADA data analysis and sparse auto-encoder neural network[J]. Acta energiae solaris sinica, 2021, 42(6): 321-328.
[9] 顏永龍, 李劍, 李輝, 等. 采用信息熵和組合模型的風(fēng)電機(jī)組異常檢測(cè)方法[J]. 電網(wǎng)技術(shù), 2015, 39(3): 737-743.
YAN Y L, LI J, LI H, et al. A wind turbine anomaly detection method based on information entropy and combination model[J]. Power system technology, 2015, 39(3): 737-743.
[10] 黃榮舟, 湯寶平, 楊燕妮, 等. 基于長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)融合SCADA數(shù)據(jù)的風(fēng)電齒輪箱狀態(tài)監(jiān)測(cè)[J]. 太陽(yáng)能學(xué)報(bào), 2021, 42(1): 235-239.
HUANG R Z, TANG B P, YANG Y N, et al. Condition monitoring of wind turbine gearbox based on LSTM neural network fusing SCADA data[J]. Acta energiae solaris sinica, 2021, 42(1): 235-239.
[11] JIANG G Q, XIE P, HE Q, et al. Wind turbine fault detection using a denoising autoencoder with temporal information[J]." " " " IEEE/ASME" " " " transactions" " " " "on mechatronics, 2018, 23(1): 89-100.
[12] KONG Z Q, TANG B P, DENG L, et al. Condition monitoring of wind turbines based on spatio-temporal fusion of SCADA data by convolutional neural networks and gated recurrent units[J]. Renewable energy, 2020, 146: 760-768.
[13] PANG Y H, HE Q, JIANG G Q, et al. Spatio-temporal fusion neural network for multi-class fault diagnosis of wind turbines based on SCADA data[J]. Renewable energy, 2020, 161: 510-524.
[14] BAI S, KOLTER J Z, KOLTUN V. An empirical evaluation of generic convolutional and recurrent networks for sequence modeling[EB/OL]. https://arxiv.org/abs/1803.01271.
[15] LIN T Y, GOYAL P, GIRSHICK R, et al. Focal loss for dense" "object" "detection[C]//Proceedings" "of" "the" "IEEE International Conference on Computer Vision, Venice, Italy, 2017: 2980-2988.
[16] LECUN Y, BENGIO Y, HINTON G. Deep learning[J]. Nature, 2015, 521(7553): 436-444.
[17] 郝帥, 馬瑞澤, 趙新生, 等. 基于卷積塊注意模型的YOLOv3輸電線路故障檢測(cè)方法[J]. 電網(wǎng)技術(shù), 2021, 45(8): 2979-2987.
HAO S, MA R Z, ZHAO X S, et al. Fault detection of YOLOv3 transmission line based on convolutional block attention model[J]. Power system technology, 2021, 45(8): 2979-2987.
[18] SHI Z, LIN H, LIU L, et al. Deep attention gated dilated temporal convolutional networks with intra-parallel convolutional modules for end-to-end monaural speech separation[C]//INTERSPEECH Conference, Graz, Austria, 2019: 3183-3187.
[19] HE Q, PANG Y H, JIANG G Q, et al. A spatio-temporal multiscale neural network approach for wind turbine fault diagnosis" " with" " imbalanced" " SCADA" " data[J]." "IEEE transactions on industrial informatics, 2021, 17(10): 6875-6884.
[20] 高欣, 紀(jì)維佳, 趙兵, 等. 不平衡數(shù)據(jù)集下基于CVAE-CNN模型的智能電表故障多分類(lèi)方法[J]. 電網(wǎng)技術(shù), 2021, 45(8): 3052-3060.
GAO X, JI W J, ZHAO B, et al. Multi-classification method of smart meter fault types based on CVAE-CNN model under imbalanced dataset[J]. Power system technology, 2021, 45(8): 3052-3060.
[21] LEAHY K, HU R L, KONSTANTAKOPOULOS I C, et al. Diagnosing and predicting wind turbine faults from SCADA data using support vector machines[J]. International journal of prognostics and health management, 2018, 9(1): 1-11.
[22] HE H, GARCIA E A. Learning from imbalanced data[J]. IEEE transactions on knowledge and data engineering, 2009, 21(9): 1539-1548.
WIND TURBINE ANOMALY DETECTION BASED ON DILATED CAUSAL CONVOLUTION NETWORK
Jiang Guoqian1,Zhou Junchao1,Wu Xin2,Xu Xiangdong1,He Qun1,Xie Ping1
(1. School of Electrical Engineering, Yanshan University, Qinhuangdao 066004, China;
2. Jiangsu Guoke Intelligent Electric Co., Ltd., Nantong 226400, China)
Abstract:Accurate and reliable anomaly detection is of great significance to ensure the safe and efficient operation of wind turbines. However, due to the complex structure and variable operation conditions of wind turbines, the measure SCADA data usually present complex nonlinear and strongly correlated and coupling characteristics. To better capture spatial correlations among different sensor variables, a new wind turbine anomaly detection approach based on dilated causal convolution network is proposed. Specifically, Focal Loss is introduced to improve the traditional loss function to address the data imbalance issue. The proposed approach can extract effective multiscale spatially correlated features with different receptive field sizes and effectively model the hidden spatial causality among different sensor variables. Furthermore, it can provide an end-to-end anomaly detection solution for wind turbines, which can directly learn useful spatial features from raw SCADA data and build the nonlinear mapping relationship between original data space and condition label space, thus finally outputting the corresponding detection results. A real case study with SCADA data from a wind farm is used to verify the feasibility and effectiveness of the proposed approach.
Keywords:wind turbine; causal convolution; dilated convolution; imbalanced data; anomaly detection