郭 怡,王榮喜,高建民
(西安交通大學(xué) 機械制造系統(tǒng)工程國家重點實驗室,陜西 西安 710049)
為應(yīng)對全球氣候變化,我國提出做好“碳達峰、碳中和”工作、推動綠色低碳發(fā)展[1]。以風(fēng)力發(fā)電為代表的清潔能源發(fā)電方式,是除水力發(fā)電之外技術(shù)最成熟的一種可再生能源發(fā)電方式,隨著清潔能源的需求不斷增長[2],以及非水力可再生能源發(fā)電比例的擴大,建立和完善智慧運維系統(tǒng)是保證風(fēng)電機組工作效率、降低系統(tǒng)維護成本的基礎(chǔ),也是保障以風(fēng)機為代表的新一代電力系統(tǒng)健康發(fā)展的必然要求。然而,為滿足風(fēng)力需求,風(fēng)電機組常被安裝在山區(qū)、海上[3]和沙漠,工作環(huán)境較為惡劣,在追求更大功率、更高效率的同時,風(fēng)電機組系統(tǒng)的復(fù)雜程度也隨之增大。長時間在變風(fēng)載、大溫差等極端工況下工作,任何微小異常的積累或部件受到異常擾動都有可能導(dǎo)致系統(tǒng)故障的發(fā)生,增加系統(tǒng)維修維護成本。風(fēng)力發(fā)電機組本質(zhì)上是一種由多種結(jié)構(gòu)機構(gòu)、電氣設(shè)備,通過能量、控制信號等多介質(zhì)網(wǎng)絡(luò)耦合而成的復(fù)雜機電系統(tǒng)[4],其海量、高維的監(jiān)測數(shù)據(jù)[5]蘊含著豐富的狀態(tài)信息[6],運行狀態(tài)具有復(fù)雜多變的特點。然而,風(fēng)機智慧運維在處理海量、高維的風(fēng)機監(jiān)測數(shù)據(jù)時仍然存在數(shù)據(jù)挖掘不足的問題[7],且由于風(fēng)電機組運行狀態(tài)具有時變性,如何充分利用監(jiān)測數(shù)據(jù)、挖掘有效信息,實時監(jiān)測風(fēng)電機組的運行狀態(tài),是風(fēng)機智慧運維中亟待解決的問題。
為實時監(jiān)測風(fēng)機運行狀態(tài)的異常[8-9],從而有針對性地指導(dǎo)風(fēng)機維修,降低風(fēng)機檢修難度,合理的風(fēng)機運行狀態(tài)辨識方法[10]至關(guān)重要。風(fēng)機運行狀態(tài)辨識是實現(xiàn)風(fēng)機運行狀態(tài)實時監(jiān)測的核心步驟,而采用有效的特征提取方法[11]挖掘風(fēng)機海量、高維監(jiān)測數(shù)據(jù)中的信息,是風(fēng)機運行狀態(tài)辨識的關(guān)鍵環(huán)節(jié)[12]。現(xiàn)有的時間序列特征提取方法主要分為基于統(tǒng)計的特征提取方法和基于人工智能的特征提取方法兩類[13]?;谌斯ぶ悄艿奶卣魈崛》椒軌蛑苯犹幚頃r間序列,通過神經(jīng)網(wǎng)絡(luò)的多隱層結(jié)構(gòu)[14]提取和抽象時間序列的分布式特征。曹大理等[15]提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的刀具磨損量在線監(jiān)測模型,采用深度網(wǎng)絡(luò)自適應(yīng)地提取特征,并通過加深網(wǎng)絡(luò)進一步挖掘信號中隱藏的微小特征;熊紅林等[16]提出一種基于多尺度卷積神經(jīng)網(wǎng)絡(luò)(Multiscale Convolutional Neural Networks, MCNN)圖像識別模型,在劃痕缺陷和雜質(zhì)缺陷識別方面的準(zhǔn)確率較高;戴穩(wěn)等[17]建立了一種基于深度學(xué)習(xí)特征降維及特征后處理的布谷鳥優(yōu)化參數(shù)的最小二乘支持向量機預(yù)測模型,相比于傳統(tǒng)的特征選擇,擺脫了對先驗知識和經(jīng)驗需求的依賴,大幅提升了效率。因此,基于人工智能的特征提取方法泛化能力較強,應(yīng)用較廣泛,可以有效避免人為特征提取的局限,但是容易忽略時間序列不同維度之間的相關(guān)性,可解釋性較差[18];而基于統(tǒng)計分析的特征提取方法能夠兼顧時間序列的形狀特征和時間依賴特征[19],因此,該類方法可以有效地彌補人工智能方法在特征提取方面的不足。吳江波等[20]提出一種基于顯著度和統(tǒng)計特征的光譜信號檢測與提取算法,降低信號提取過程中背景噪聲、基線畸變等不利因素的影響;Wang等[21]應(yīng)用耦合去趨勢波動分析(Coupling Detrended Fluctuation Analysis, CDFA)研究了復(fù)雜機電系統(tǒng)的多變量耦合關(guān)系,分析并提取了分形特征;何濤等[22]針對個性化機械零件的不規(guī)則和自相似性,將分形方法與去趨勢波動分析相結(jié)合,提取零件特征進行缺陷識別。相較于人工智能方法,以統(tǒng)計分析、信號分析為代表的特征提取方法能夠提高特征的可解釋性,但精度和泛化能力較差[23]。因此,為充分利用風(fēng)機監(jiān)測數(shù)據(jù),以較高的精度提取數(shù)據(jù)與狀態(tài)之間的復(fù)雜特征關(guān)系[24],同時提高模型的泛化能力,本文提出一種融合分形特征[21]的CNN風(fēng)機運行狀態(tài)特征分析方法,即在人工智能特征提取之前,先以分形等統(tǒng)計方法建立樣本特征數(shù)據(jù)集,再以噪聲環(huán)境下基于密度的空間聚類(Density-Based Spatial Clustering of Applications with Noise, DBSCAN)[25]結(jié)果為狀態(tài)標(biāo)簽,選擇重要程度較高的特征訓(xùn)練CNN模型,建立一種風(fēng)機運行狀態(tài)辨識模型。該模型能夠?qū)崿F(xiàn)對風(fēng)機階段運行狀態(tài)的實時辨識,也為風(fēng)機狀態(tài)維修和“事前維修”模式[26]提供了科學(xué)參考和理論指導(dǎo),同時提高了風(fēng)電機組安全性和經(jīng)濟性,保障了風(fēng)電機組的安全可靠運行,為風(fēng)機運行階段性狀態(tài)監(jiān)測[27]與故障診斷[28]提供科學(xué)依據(jù)。
為了對風(fēng)機監(jiān)測數(shù)據(jù)進行全面、準(zhǔn)確的特征分析,首先對風(fēng)機各測點監(jiān)測數(shù)據(jù)進行整理。其中,齒輪箱是風(fēng)電機組傳動系統(tǒng)中的重要部件,其故障發(fā)生率較高且故障診斷難度較大[13],監(jiān)測風(fēng)機齒輪箱的運行狀態(tài)對風(fēng)機服役質(zhì)量狀態(tài)辨識具有重要意義。因此,本文以風(fēng)機齒輪箱中間軸[29]測點處監(jiān)測數(shù)據(jù)作為研究對象,進行數(shù)據(jù)預(yù)處理,建立監(jiān)測數(shù)據(jù)時間序列樣本數(shù)據(jù)集。因為風(fēng)機監(jiān)測數(shù)據(jù)具有自相似性,所以對數(shù)據(jù)集中的各時間序列樣本進行分形等統(tǒng)計特征分析,建立樣本特征數(shù)據(jù)集,以DBSCAN無監(jiān)督聚類方法對樣本狀態(tài)進行標(biāo)記。
分形特征分析包括分形維數(shù)特征分析和多重分形特征分析[21],表示組成系統(tǒng)的部分與整體的相似性。以風(fēng)機為代表的復(fù)雜機電系統(tǒng)中雖然存在復(fù)雜的耦合關(guān)系,但其確定性特征和自組織結(jié)構(gòu)可以通過自我分形挖掘出來,而多重分形通過對概率分布函數(shù)及其各階矩的計算,能夠?qū)Ψ中蔚膹?fù)雜性和不均勻性進行更細(xì)致的刻畫。因此,本節(jié)分別對風(fēng)機監(jiān)測數(shù)據(jù)集計算分形維數(shù)和Hurst指數(shù),用來描述該時間序列樣本的分形特征,同時采用多重分形譜函數(shù)從多個尺度全面反映系統(tǒng)的行為特征差異。
對監(jiān)測數(shù)據(jù)的時間序列樣本分別計算分形維數(shù)和Hurst指數(shù),使用CHHABRA等[30]提出的標(biāo)準(zhǔn)盒計數(shù)法計算分形維數(shù),其計算原理如式(1)所示。
(1)
式中:Dim(F)為盒維數(shù);Nδ(F)為集合F和坐標(biāo)網(wǎng)格立方體的相交個數(shù);D為無標(biāo)度區(qū)間內(nèi)(-logδ,logNδ(F))的雙對數(shù)圖的斜率;在無標(biāo)度區(qū)間內(nèi),-logδ與logNδ(F)滿足線性回歸方程,如式(2)所示。
logNδ(F)=-Dlogδ+b。
(2)
式中D和b分別為線性回歸方程的斜率和截距。經(jīng)過最小二乘法擬合,斜率D即為所求盒維數(shù),盒維數(shù)D可以由-logδ與logNδ(F)的關(guān)系唯一確定。
對監(jiān)測數(shù)據(jù)的時間序列樣本分別進行多重分形分析,多重分形譜α-f(α)是刻畫序列多重分形關(guān)系的有效方法,其中,α為奇異強度,f(α)反映了序列的維數(shù)隨奇異強度α的變化情況,其關(guān)系表達如下:
α=h(q)+qh′(q),
(3)
f(α)=q[α-h(q)]+1。
(4)
式中:q為指數(shù)變量,h(q)為廣義Hurst指數(shù)[31]。多重分形特征譜α-f(α)如圖1所示。
圖1中,橫坐標(biāo)α(q)和縱坐標(biāo)f(q)分別為關(guān)于指數(shù)變量q的函數(shù),通過分析奇異強度α與奇異譜f(α)的相關(guān)關(guān)系可以用來刻畫多重分形強度。根據(jù)分析結(jié)果,記錄Δf、αmax、αmin和Δα等多重分形特征的變化情況,其中:Δα=αmax-αmin描述多重分形譜覆蓋的局部holder指數(shù)的范圍,反映多重分形程度。Δα小,則信號趨于單一分形,反之則趨向于多重分形,α=1表示均勻的點分布,α<1表示“內(nèi)密外稀”類型的點分布,α>1表示“內(nèi)稀外密”類型的點分布。
通過運行狀態(tài)特征分析得到風(fēng)機監(jiān)測數(shù)據(jù)的內(nèi)在特征,相較于原始監(jiān)測數(shù)據(jù),分析后的結(jié)果更容易區(qū)分出正常和異常的特征樣本,從而通過異常特征樣本定位到具有異常的監(jiān)測時間序列段。
本節(jié)選用DBSCAN無監(jiān)督聚類方法對時間序列樣本進行狀態(tài)標(biāo)記,該方法為基于密度的聚類算法,即某點鄰域內(nèi)的樣本點數(shù)不小于最小樣本數(shù)MinPts時,則以該點為聚類中心進行聚類。對于特征分析得到的樣本特征數(shù)據(jù)集,規(guī)定在距離閾值ε內(nèi)的樣本點為正常,超出距離閾值ε的樣本點為異常。DBSCAN聚類方法相較于傳統(tǒng)的K-means聚類方法,不需要預(yù)先設(shè)定需要形成的簇類數(shù)量,只需給出合適的最小樣本數(shù)MinPts和距離閾值ε,就能夠找到密度相連對象的最大集合,從而有效處理噪聲點并發(fā)現(xiàn)任意形狀的空間簇類。選擇合適的參數(shù)MinPts和ε后,其具體過程及算法描述如下,DBSCAN聚類結(jié)果如圖2所示。
算法1DBSCAN算法。
初始化參數(shù):Minpts=6;ε=0.2;
輸入:樣本特征數(shù)據(jù)集D,最小樣本數(shù)MinPts,距離閾值ε;
輸出:簇集合(樣本狀態(tài)標(biāo)簽)。
1 首先將樣本特征數(shù)據(jù)集D中的所有對象標(biāo)記為未處理狀態(tài)5%-Co-Zn-B
2 for(數(shù)據(jù)集D中每個對象p)do
3 if(p已經(jīng)歸入某個簇或標(biāo)記為噪聲)then
4 Continue;
5 else
6 檢查對象p的Eps鄰域ε(p);
7 if(ε(p)包含的對象數(shù)小于MinPts)then
8 標(biāo)記對象p為邊界點或噪聲點;
9 else
10 標(biāo)記對象p為核心點,將p鄰域內(nèi)所有點加入新簇C
11 for(ε(p)中所有尚未被處理的對象q)do
12 若其Eps鄰域ε(q)包含至少MinPts個對象,則將ε(q)中未歸入任何一個簇的對象加入C;
13 end for
14 end if
15 end if
16 end for
圖2中,橫縱坐標(biāo)分別代表數(shù)據(jù)歸一化之后的測量值,因此沒有單位和具體的意義,通過DBSCAN方法聚類之后,沒有明顯的聚類中心。圖中不同的點形代表了不同的狀態(tài),其中,星形為正常類樣本點,圓形和十字形分別代表聚類結(jié)果中的噪聲點和邊界點,均歸為異常類樣本點。最終分別以0和1表示正常和異常兩類樣本點,完成對樣本的狀態(tài)標(biāo)記。
為充分利用風(fēng)機監(jiān)測數(shù)據(jù),從海量高維的監(jiān)測數(shù)據(jù)中準(zhǔn)確地學(xué)習(xí)到內(nèi)在特征,本章建立風(fēng)機服役質(zhì)量狀態(tài)辨識模型。首先對風(fēng)機原始監(jiān)測數(shù)據(jù)進行預(yù)處理,建立時間序列樣本的監(jiān)測數(shù)據(jù)集;然后提出一種新的風(fēng)機運行狀態(tài)特征分析方法,建立初始樣本特征數(shù)據(jù)集;以初始樣本特征數(shù)據(jù)集為依據(jù),采用DBSCAN方法標(biāo)記狀態(tài)標(biāo)簽,同時,通過正則化特征選擇[32],從初始樣本特征數(shù)據(jù)集中選擇重要程度最高的特征建立最終的樣本特征數(shù)據(jù)集;最后,以最終特征選擇以及狀態(tài)標(biāo)記結(jié)果對CNN狀態(tài)辨識模型進行訓(xùn)練和測試,實現(xiàn)風(fēng)機運行狀態(tài)辨識。研究路線如圖3所示。
按照采樣頻率和采樣時間采集并收集風(fēng)力發(fā)電機組齒輪箱中間軸測點對應(yīng)的監(jiān)測數(shù)據(jù),利用該測點的監(jiān)測數(shù)據(jù)建立原始數(shù)據(jù)集,其中,每一列為一個時間序列樣本,最終建立共包含n個時間序列樣本的監(jiān)測數(shù)據(jù)集D:
D=[X1,X2,…,XL]T=
其中:Xi為矩陣中每個樣本的第i個數(shù)據(jù)點;xi,j為矩陣中第j個時間序列樣本的第i個數(shù)據(jù)點;L為每個時間序列樣本的長度;n為時間序列樣本個數(shù)。
風(fēng)機運行狀態(tài)特征分析包括分形等統(tǒng)計特征分析,將特征分析結(jié)果整理成初始樣本特征數(shù)據(jù)集,并以此為對象進行DBSCAN無監(jiān)督聚類,完成狀態(tài)標(biāo)記。同時,初始樣本特征數(shù)據(jù)集中可能包含冗余特征,為降低后續(xù)訓(xùn)練模型的復(fù)雜程度,按照特征對模型的重要程度進行特征選擇,建立最終的樣本特征數(shù)據(jù)集。
2.2.1 風(fēng)機運行狀態(tài)特征分析
以監(jiān)測數(shù)據(jù)集D分析風(fēng)機齒輪箱中間軸測點處多個時間序列樣本的分形等統(tǒng)計特征。
在統(tǒng)計特征分析中,時域特征值是衡量監(jiān)測數(shù)據(jù)特征的重要指標(biāo)。對風(fēng)機齒輪箱中間軸測點處數(shù)據(jù)集中的各時間序列樣本進行時域統(tǒng)計分析,分別計算其均值、方差、標(biāo)準(zhǔn)差、均方值、均方誤差、峰峰值、方根幅值、平均幅值等統(tǒng)計指標(biāo)和有量綱參數(shù)指標(biāo)。其中,均方值為信號的二階矩,反映信號的能量;方差為二階中心矩,反映信號能量的動態(tài)分量以及數(shù)據(jù)的分散程度。經(jīng)計算,共得到c1個除分形特征外的統(tǒng)計特征。
分形特征分析包括分形維數(shù)特征和多重分形特征。不同時間序列樣本的分形維數(shù)之間有的存在差異,有的較為接近。其中,存在較大差異的樣本,其分形維數(shù)和Hurst指數(shù)能夠作為特征反映風(fēng)機服役質(zhì)量狀態(tài)的變化情況,而分形維數(shù)較為接近的樣本,則需要通過進一步提取多重分形特征進行分析。因此,計算監(jiān)測數(shù)據(jù)集D中的n個時間序列樣本分形維數(shù)和Hurst指數(shù),經(jīng)計算,得到上述兩個分形特征,即c2=2;對時間序列樣本進行多重分形分析,得到包括Δf、αmax、αmin和Δα在內(nèi)的c3個多重分形特征。
2.2.2 初始樣本特征數(shù)據(jù)集建立
綜合考慮分形等統(tǒng)計特征,將上述特征建立為初始的樣本特征數(shù)據(jù)集f:
f=[f1,f2,…,fn]T
其中:fi為矩陣中的第i個時間序列樣本的全部特征;fi,j為矩陣中第i個時間序列樣本的第j個特征;c為分析得到的全部特征的個數(shù),c=c1+c2+c3;n為時間序列樣本個數(shù)。
2.2.3 樣本狀態(tài)特征標(biāo)記
選擇DBSCAN無監(jiān)督聚類方法對時間序列樣本進行狀態(tài)特征標(biāo)記,選取適當(dāng)?shù)淖钚颖緮?shù)MinPts和鄰域的距離閾值ε參數(shù),按照鄰域內(nèi)點的個數(shù)不少于MinPts的原則進行聚類,得到正常和異常兩類樣本,分別以0和1表示,樣本狀態(tài)特征標(biāo)簽為y。
2.2.4 風(fēng)機運行狀態(tài)特征選擇
在以神經(jīng)網(wǎng)絡(luò)為代表的人工智能方法中,如果參數(shù)太多,則容易造成過擬合,使得模型在訓(xùn)練樣本中表現(xiàn)較好,而在實際測試樣本中表現(xiàn)較差。為解決上述問題,需要通過特征選擇[28]降低模型的復(fù)雜程度。本節(jié)應(yīng)用正則化特征選擇方法,該方法作為結(jié)構(gòu)風(fēng)險最小化的策略實現(xiàn),能夠有效抑制過擬合。可以從初始特征集中找到包含信息最多的特征,從而以更緊湊的形式表示原始數(shù)據(jù),提高模型的泛化能力。
通過L1正則化對初始化樣本特征數(shù)據(jù)集中的全部特征進行篩選,提取重要程度較高的特征,得到最終的樣本特征數(shù)據(jù)集,用于訓(xùn)練狀態(tài)辨識模型。L1正則化方法計算最小絕對收縮選擇算子(LASSO),其優(yōu)化目標(biāo)函數(shù)如式(3)所示。
(5)
式中:xi和yi為訓(xùn)練樣本及其相應(yīng)標(biāo)簽;ω為權(quán)重系數(shù)向量,通過最小化目標(biāo)函數(shù)實現(xiàn)權(quán)重系數(shù)向量ω的求解;λ為正則化參數(shù),且λ>0。
由式(3)可知,優(yōu)化目標(biāo)函數(shù)中包含訓(xùn)練樣本誤差項和正則化項兩部分,其中,正則化參數(shù)λ起權(quán)衡作用。
通過L1正則化特征選擇對當(dāng)前所分析的全部c個特征進行篩選,提取重要程度較高的特征,用于訓(xùn)練狀態(tài)辨識模型,提取出對模型貢獻度最高的8個特征,分別為:分形維數(shù)FD、Hurst指數(shù)h、均方幅值Xrms、平均值Xmean、峰峰值Xp、平均幅值Xr、分形譜Δf和分形譜Δα。上述特征構(gòu)成C維樣本特征數(shù)據(jù)集F:
F=[F1,F2,…,F8]T
其中C=8,對應(yīng)的狀態(tài)標(biāo)簽為Y。至此,最終的樣本特征數(shù)據(jù)集建立完成。
為充分挖掘和提取風(fēng)機監(jiān)測數(shù)據(jù)特征,表征特征與狀態(tài)之間的對應(yīng)關(guān)系,本節(jié)以樣本特征數(shù)據(jù)集訓(xùn)練CNN模型,通過filter不斷提取局部和總體特征,進而建立樣本特征與狀態(tài)標(biāo)簽的對應(yīng)關(guān)系,實現(xiàn)風(fēng)機運行狀態(tài)辨識。
CNN具有局部權(quán)值共享結(jié)構(gòu),在處理圖像和高維數(shù)據(jù)過程中可以并行學(xué)習(xí),從而降低網(wǎng)絡(luò)和特征提取過程中數(shù)據(jù)重建的復(fù)雜度。本節(jié)將C維樣本特征數(shù)據(jù)與其對應(yīng)狀態(tài)標(biāo)簽Y劃分成訓(xùn)練集和測試集,將訓(xùn)練集樣本特征數(shù)據(jù)集F作為狀態(tài)辨識模型的輸入,對應(yīng)的狀態(tài)標(biāo)簽為Y作為狀態(tài)辨識模型的輸出,訓(xùn)練基于CNN的狀態(tài)辨識模型,如圖4所示。
如圖4所示,該模型包含卷積層、池化層、全連接層,最后一層為分類器。以訓(xùn)練集數(shù)據(jù)作為模型的輸入,對應(yīng)的狀態(tài)標(biāo)簽作為輸出,訓(xùn)練CNN模型分類器,輸出狀態(tài)辨識結(jié)果;以測試集數(shù)據(jù)作為CNN狀態(tài)辨識模型的輸入,經(jīng)過分類器輸出狀態(tài)標(biāo)簽,輸出為0表示模型認(rèn)為當(dāng)前輸入數(shù)據(jù)對應(yīng)的狀態(tài)為正常狀態(tài),輸出為1表示模型認(rèn)為當(dāng)前輸入數(shù)據(jù)對應(yīng)的狀態(tài)為異常狀態(tài)。
收集風(fēng)機各測點的監(jiān)測數(shù)據(jù),取齒輪箱中間軸測點2020年10月17日的24組監(jiān)測數(shù)據(jù),將其劃分成包含1 536個時間序列樣本的監(jiān)測數(shù)據(jù)集D,每個時間序列樣本的長度為128;樣本數(shù)據(jù)均為風(fēng)機齒輪箱中間軸的振動監(jiān)測量,其物理含義為振幅,單位為mm。分析并選擇監(jiān)測數(shù)據(jù)集D中各樣本的特征值,建立樣本特征數(shù)據(jù)集并標(biāo)記狀態(tài)標(biāo)簽,用來訓(xùn)練和測試上述風(fēng)機服役質(zhì)量狀態(tài)辨識模型。
對每個時間序列樣本計算樣本特征,并采用L1正則化特征選擇方法選出重要程度最高的8個特征,建立最終的樣本特征數(shù)據(jù)集。經(jīng)計算,時間序列樣本的特征值見表2~表4。其中,表2為統(tǒng)計特征分析結(jié)果,包括均方幅值Xrms、平均值Xmean、峰峰值Xp、平均幅值Xr,列出部分計算結(jié)果如表1所示。
表1 時間序列樣本的統(tǒng)計特征分析計算結(jié)果
表2和表3為分形特征分析結(jié)果。采用Box維數(shù)(盒維數(shù))方法計算分形維數(shù),包括分形維數(shù)FD、Hurst指數(shù)h,列出部分分析結(jié)果如表2所示。
表2 時間序列樣本的分形維數(shù)特征分析結(jié)果
由表2可知,不同時間序列樣本的分形維數(shù)之間有的存在差異,有的較為接近,繼續(xù)對時間序列樣本進行多重分形特征分析,其中部分時間序列樣本的特征譜如圖5所示。
圖5中,不同時間序列樣本的多重分形譜的形狀和范圍存在差異,經(jīng)過特征選擇,提取多重分形特征包括分形譜Δf和分形譜Δα,部分計算結(jié)果如表3所示。
表3 時間序列樣本的多重分形特征分析結(jié)果
將上述樣本特征作為狀態(tài)辨識模型的輸入,對應(yīng)標(biāo)簽作為模型的輸出,訓(xùn)練并測試狀態(tài)辨識模型。CNN狀態(tài)辨識模型的測試結(jié)果如圖6所示。
在圖6中,狀態(tài)辨識模型準(zhǔn)確率為98.925%,其中圓形圖案表示輸入的特征經(jīng)過狀態(tài)辨識模型后輸出的狀態(tài)為正常狀態(tài),菱形圖案表示輸入的特征經(jīng)過狀態(tài)辨識模型后輸出的狀態(tài)為異常狀態(tài),星形圖案表示狀態(tài)辨識模型輸出的結(jié)果與實際狀態(tài)標(biāo)簽不相符。由圖6可知,模型的錯分率較低。
將輸出結(jié)果與真實狀態(tài)標(biāo)簽對比,記錄模型狀態(tài)辨識的準(zhǔn)確率。經(jīng)多次實驗訓(xùn)練,狀態(tài)辨識模型準(zhǔn)確率記錄如表4所示。
表4 本文狀態(tài)辨識模型準(zhǔn)確率
由表4可知,經(jīng)測試,狀態(tài)辨識模型的準(zhǔn)確率隨實驗次數(shù)上升,最高為99.283%,最終狀態(tài)辨識模型的準(zhǔn)確率穩(wěn)定在98.925%。
綜上所述,為驗證上述模型的可靠性,從風(fēng)力發(fā)電機組對應(yīng)測點獲取實時測點監(jiān)測數(shù)據(jù),進行預(yù)處理和階段性特征分析,得到樣本特征數(shù)據(jù)集。對重要程度最高的C個特征作為上述狀態(tài)辨識模型的輸入,并記錄模型輸出的標(biāo)簽,若輸出的狀態(tài)標(biāo)簽為0,表示當(dāng)前階段狀態(tài)為正常狀態(tài),則重復(fù)上述步驟,持續(xù)監(jiān)測風(fēng)機運行狀態(tài);若輸出的狀態(tài)標(biāo)簽為1,表示當(dāng)前階段狀態(tài)出現(xiàn)異常,則應(yīng)立即采取停機、維修等措施,避免重大事故發(fā)生。
本文建立的風(fēng)機服役質(zhì)量狀態(tài)辨識模型不同于直接使用監(jiān)測數(shù)據(jù)作為輸入的狀態(tài)辨識模型,該模型通過統(tǒng)計分析和分形分析,計算監(jiān)測數(shù)據(jù)中的相應(yīng)特征,能夠從風(fēng)機海量、高維數(shù)據(jù)中提取有效信息,基于時間序列樣本特征,訓(xùn)練CNN模型;而以監(jiān)測數(shù)據(jù)作為輸入的狀態(tài)辨識模型只能通過CNN卷積神經(jīng)網(wǎng)絡(luò)提取出有限的分布式特征,且可解釋性較差。因此,本文對上述兩種狀態(tài)辨識方法進行對比分析。
將風(fēng)機齒輪箱中間軸測點的監(jiān)測數(shù)據(jù)劃分成包含1 536個時間序列樣本的監(jiān)測數(shù)據(jù)集D,每個時間序列樣本的長度為128;對時間序列樣本,采用DBSCAN無監(jiān)督聚類方法,標(biāo)記狀態(tài)標(biāo)簽;將時間序列樣本數(shù)據(jù)直接作為CNN卷積神經(jīng)網(wǎng)絡(luò)模型,樣本對應(yīng)的狀態(tài)標(biāo)簽作為模型的輸出,訓(xùn)練并測試狀態(tài)辨識模型,測試結(jié)果如7圖所示。
在圖7中,狀態(tài)辨識模型準(zhǔn)確率為93.548%。其中,圓形和菱形圖案分別表示狀態(tài)辨識模型輸出的結(jié)果為正常和異常狀態(tài),星形圖案表示狀態(tài)辨識模型輸出的結(jié)果與實際狀態(tài)標(biāo)簽不相符。由圖7可知,以測點監(jiān)測數(shù)據(jù)直接輸入模型進行狀態(tài)辨識時,相較于本文提出的狀態(tài)辨識模型,錯分率更高。記錄該模型的測試準(zhǔn)確率如表5所示。
表5 以監(jiān)測數(shù)據(jù)作為輸入的狀態(tài)辨識模型準(zhǔn)確率
由表5可知,以監(jiān)測數(shù)據(jù)作為輸入的狀態(tài)辨識模型,其準(zhǔn)確率在89.6%~93.6%之間波動,準(zhǔn)確率最高為93.548%,后逐漸穩(wěn)定在93.190%,但隨著實驗次數(shù)的上升,準(zhǔn)確率開始下降。
綜上所述,以監(jiān)測數(shù)據(jù)作為輸入的狀態(tài)辨識模型,與本文建立的以數(shù)據(jù)特征作為輸入的風(fēng)機服役質(zhì)量狀態(tài)辨識模型不同,由于輸入數(shù)據(jù)較多,模型復(fù)雜度提高,造成模型泛化能力較差,此外,參數(shù)增加容易造成模型過擬合,使得測試樣本表現(xiàn)下降;而本文基于特征分析和特征提取的結(jié)果,建立樣本特征數(shù)據(jù)集,用于狀態(tài)辨識模型的訓(xùn)練,經(jīng)對比,該方法對海量、高維監(jiān)測數(shù)據(jù)處理更有效,對風(fēng)機服役質(zhì)量狀態(tài)辨識的效果更好,模型準(zhǔn)確率更高。
本文提出一種新的風(fēng)機服役質(zhì)量狀態(tài)辨識方法,首先基于非人工智能方法提取的時間序列樣本特征建立數(shù)據(jù)集,然后在此基礎(chǔ)上應(yīng)用CNN模型進一步提取分布式特征。針對風(fēng)機齒輪箱中間軸測點處的監(jiān)測數(shù)據(jù),應(yīng)用本文構(gòu)造的基于特征分析和特征提取的狀態(tài)辨識模型對風(fēng)機運行狀態(tài)進行辨識,結(jié)果表明,將特征提取結(jié)果作為模型輸入的狀態(tài)辨識方法準(zhǔn)確率明顯高于傳統(tǒng)的以監(jiān)測數(shù)據(jù)作為輸入的狀態(tài)辨識方法準(zhǔn)確率,且模型表現(xiàn)更穩(wěn)定。
(1)在風(fēng)機服役質(zhì)量狀態(tài)辨識過程中,本文提出的基于特征分析和特征提取的狀態(tài)辨識模型準(zhǔn)確率為98.925%,而以監(jiān)測數(shù)據(jù)作為輸入的狀態(tài)辨識模型準(zhǔn)確率不高于93.548%,且準(zhǔn)確率波動較大。
(2)本文提出的風(fēng)機服役質(zhì)量狀態(tài)辨識方法更加適應(yīng)監(jiān)測數(shù)據(jù)海量、高維的特點,能夠有效提取信息,將統(tǒng)計特征、分形特征與神經(jīng)網(wǎng)絡(luò)分布式特征相融合,相較于以監(jiān)測數(shù)據(jù)作為輸入的狀態(tài)辨識模型,準(zhǔn)確率提升5.377%。
(3)本文提出的風(fēng)機狀態(tài)辨識方法為實現(xiàn)風(fēng)機“事前維修”模式提供科學(xué)參考和理論指導(dǎo),可以有效地應(yīng)用于以風(fēng)機為代表的復(fù)雜機電系統(tǒng)服役質(zhì)量狀態(tài)辨識領(lǐng)域,為風(fēng)力發(fā)電機組以及其他復(fù)雜機電系統(tǒng)的數(shù)據(jù)挖掘和模式識別提供了基礎(chǔ)。
為兼顧時間序列樣本的時間跨度和樣本特征數(shù)據(jù)集的容量,本文將風(fēng)機原始監(jiān)測數(shù)據(jù)合并后直接分段劃分,該劃分方法雖然能夠通過異常特征定位異常段樣本,但忽略了時間序列樣本的連續(xù)性,可能會造成一定的信息損失。后續(xù)將針對該問題改進時間序列樣本的劃分方法,進一步提高風(fēng)機服役質(zhì)量狀態(tài)辨識的效果。