蘭朝鳳,宋博文,郭小霞
(哈爾濱理工大學(xué) 測控技術(shù)與通信工程學(xué)院,哈爾濱 150080)
隨著居民用電量的增加,電網(wǎng)的安全可靠性已經(jīng)成為了社會需要重視的一個問題。水力發(fā)電作為一種發(fā)電方式,保證水輪機安全穩(wěn)定地運行,就顯得至關(guān)重要。因此,及時為水輪機進行狀態(tài)預(yù)測,是目前要解決的一個難題。
目前,國內(nèi)外很多學(xué)者從理論研究、試驗研究、數(shù)值模擬3個角度出發(fā),進行水輪機運轉(zhuǎn)狀態(tài)識別[1-3],取得了較好的進展。然而,這部分學(xué)者并沒有直接展示水輪機信號與與水輪機運轉(zhuǎn)狀態(tài)的關(guān)系。從文獻[4-5]可以看出,要想直接展示水輪機信號與水輪機運轉(zhuǎn)狀態(tài)的關(guān)系,實現(xiàn)水輪機運轉(zhuǎn)狀態(tài)識別的話,就要以信號預(yù)處理、特征提取、運轉(zhuǎn)狀態(tài)識別模型的構(gòu)建為技術(shù)路線去實現(xiàn)。
合適的信號處理技術(shù)是信號預(yù)處理的重要部分。傳統(tǒng)的信號處理方法比如傅里葉變換(Fourier transformation,FT)[6],不能分析像水輪機信號這樣的非平穩(wěn)信號,為此,出現(xiàn)了像小波變換(wavelet transform,WT)[7]、經(jīng)驗?zāi)B(tài)分解(empirical mode decomposition,EMD)[8]、互補集合經(jīng)驗?zāi)B(tài)分解(complementary ensemble empirical mode decomposition,CEEMD)[9]這樣的信號處理技術(shù)。文獻[10]對信號進行CEEMD分解之后,用夾角余弦計算信號與IMF分量之間的相似度,判斷噪聲主導(dǎo)模態(tài)和信號主導(dǎo)模態(tài)之間的分界點,最后獲得了較好的去噪效果。文獻[11]用CEEMD,分析高水頭混流式水輪機的穩(wěn)定性。
水輪機故障的故障特征通常蘊含在水輪機信號里面,因此,要用合適的特征提取方法對水輪機信號進行特征提取。不少學(xué)者計算排列熵、能量矩、峭度等物理量以進行特征提取。其中,排列熵(permutation entropy,PE)是一種基于復(fù)雜性量度的非線性動力學(xué)參數(shù),能有效地反映系統(tǒng)的特征。文獻[12]用PE將IMF分量組成滾動軸承故障診斷模型的特征樣本集,以實現(xiàn)軸承故障診斷,正確率為99.285 7%。
除了合適的信號處理技術(shù)和合適的特征提取方法,合適的水輪機運轉(zhuǎn)狀態(tài)識別模型也至關(guān)重要,部分學(xué)者用概率神經(jīng)網(wǎng)絡(luò)(probabilistic neural network,PNN)[13]、極限學(xué)習(xí)機(extreme learning machine,ELM)[14]、小波神經(jīng)網(wǎng)絡(luò)(wavelet neural network,WNN)[15]進行水輪機運轉(zhuǎn)狀態(tài)識別。ELM相較于PNN和WNN出現(xiàn)較晚,是一類基于前饋神經(jīng)網(wǎng)絡(luò)(feedforward neuron network,FNN)構(gòu)建的機器學(xué)習(xí)方法,適用于監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)問題,在分類、模式識別等方面有一定的應(yīng)用[16]。ELM的權(quán)值和閾值影響其自身的性能,部分學(xué)者用PSO優(yōu)化ELM的權(quán)值和閾值[17]。然而,PSO存在易陷入局部最優(yōu)的缺點,這影響了PSO的性能。
針對上述文獻提出的問題,本文提出基于SA-PSO-ELM的水輪機運轉(zhuǎn)狀態(tài)識別模型。在CEEMD中融合皮爾遜相關(guān)系數(shù)和小波方法對水輪機信號進行去噪。去噪之后,再利用CEEMD,對去噪之后的水輪機信號進行特征提取以構(gòu)建水輪機運轉(zhuǎn)狀態(tài)識別模型的輸入特征向量。最后,利用SA-PSO優(yōu)化ELM的權(quán)值和閾值,將SA-PSO與ELM結(jié)合,提出基于SA-PSO-ELM的水輪機運轉(zhuǎn)狀態(tài)識別模型,并通過比較正確率、均方誤差、決定系數(shù)3個指標,評價了本文提出的SA-PSO-ELM模型的性能。
小波變換(wavelet transform,WT)在低頻時的時間分辨率較高,頻率分辨率較低;在高頻則相反,這符合低頻信號變化緩慢而高頻信號變化迅速的特點,是它優(yōu)于傅立葉變換的地方。
WT進行信號去噪已經(jīng)應(yīng)用廣泛。目前已經(jīng)有很多種小波去噪方法,如極大值去噪、小波系數(shù)相關(guān)性去噪等,其中閾值去噪是一種效果比較明顯、易于實現(xiàn)的去噪方法,其中又分為硬閾值和軟閾值。
本文選取含噪矩形波信號,利用小波軟閾值函數(shù)對其進行去噪并與硬閾值進行去噪進行對比,去噪前和去噪后的矩形波信號時域圖如圖1所示。
(a)含噪信號的時域圖
由圖1可知,小波軟閾值去噪效果更好,能減少噪聲對水輪機運轉(zhuǎn)狀態(tài)識別的干擾。
為了更好地分析水輪機信號,本文針對傳統(tǒng)EMD方法容易出現(xiàn)模態(tài)混疊的問題,利用CEEMD對水輪機信號進行成分分析。
經(jīng)過CEEMD法分解之后的原信號,可以看作是多個IMF分量和一個殘余量的和,即
(1)
式中,X(t)、t、r、IMFk分別為原信號、時間、殘余量、第i個IMF分量。CEEMD法的重構(gòu)誤差較小,能有效地進行特征提取。
信號經(jīng)CEEMD法分解后的所有IMF分量中,噪聲含量較高的分量叫噪聲主導(dǎo)模態(tài),含量較低的分量叫信號主導(dǎo)模態(tài)。本文用皮爾遜相關(guān)系數(shù)確定噪聲主導(dǎo)模態(tài)和信號主導(dǎo)模態(tài)的分界點,相關(guān)系數(shù)越大,IMF分量越與原始信號相似。皮爾遜相關(guān)系數(shù)的表達式為
(2)
式中,COV(X,Y)、ρX、ρY分別為協(xié)方差、變量X的方差、變量Y的方差。在判斷IMF分量與原始信號的相似度時,可把原始信號當作X,IMF分量當作Y。
在特征選取時所選擇的特征上,本文選排列熵作為CEEMD法所提取的特征參數(shù)。
2.1.1 粒子群算法
PSO源于對鳥類捕食行為的研究,有演化計算的優(yōu)勢。PSO首先在可解空間中初始化一群粒子,每個粒子都代表極值優(yōu)化問題的一個潛在最優(yōu)解,用位置、速度、適應(yīng)值三項指標表示該粒子特征,通過適應(yīng)度函數(shù)計算影響粒子優(yōu)劣的適應(yīng)值。PSO的流程圖如圖2所示。
圖2 粒子群算法流程圖Fig.2 Flow chart of particle swarm optimization algorithm
PSO的速度和位置更新可表示為
Vid=WVid+c1r1(Pid-Xid)+c2r2(Pgd-Xid)
(3)
Xid=Xid+Vid
(4)
式中:r1、r2在0~1之間隨機取值;Vid、Xid分別為粒子速度、粒子位置;Pid和Pgd分別是粒子的個體最優(yōu)值、全局最優(yōu)值;c1和c2為學(xué)習(xí)因子;W為慣性權(quán)重。
PSO在前期要加強全局搜索能力,后期要加強局部搜索能力。因此,粒子群的相關(guān)參數(shù)不應(yīng)一成不變,其慣性權(quán)重W和學(xué)習(xí)因子c1應(yīng)當逐漸減小,而學(xué)習(xí)因子c2應(yīng)當逐漸增大。學(xué)習(xí)因子的改進公式和文獻[18]相同。慣性權(quán)重的改進公式為
(5)
式中:Wini、Wend分別為初始慣性權(quán)重、最終慣性權(quán)重;k為迭代次數(shù);kmax為迭代次數(shù)最大值;?等于1。
PSO在解決多峰值問題時,容易出現(xiàn)早熟現(xiàn)象從而陷入局部最優(yōu)解。因此,如何避免PSO陷入局部最優(yōu)解,本文將在2.1.2節(jié)的研究中提出避免陷入局部最優(yōu)解的解決方法。
2.1.2 模擬退火算法
SA是基于物理中固體物質(zhì)的退火過程與一般組合優(yōu)化問題之間的相似性,SA從某一較高初溫出發(fā),伴隨溫度參數(shù)的不斷下降,結(jié)合概率突跳特性在解空間中隨機尋找目標函數(shù)的全局最優(yōu)解,即在局部最優(yōu)解能概率性地跳出并最終趨于全局最優(yōu)。SA的流程圖如圖3所示。
圖3 模擬退火算法流程圖Fig.3 Flow chart of simulated annealing algorithm
模擬退火算法能以一定概率接受較差解,具有跳出局部最優(yōu)解,進入全局最優(yōu)解區(qū)域的能力。因此,SA-PSO的算法精度較高,可一定程度上避免PSO容易陷入局部最優(yōu)的問題。
2.1.3 極限學(xué)習(xí)機
ELM是基于前饋神經(jīng)網(wǎng)絡(luò)構(gòu)建的機器學(xué)習(xí)系統(tǒng),ELM在故障診斷(比如機械故障診斷)中得到了較好的應(yīng)用。ELM的結(jié)構(gòu)圖如圖4所示。
圖4中,X1-Xn為ELM的輸入變量,Wij、βjk分別為輸入層和隱含層之間的輸入權(quán)值、隱含層輸出權(quán)值,Y1-Ym為ELM的輸出變量。在ELM中,一旦Wij和隱含層的偏置確定了,隱含層的輸出就確定了。在ELM中,只需要提前設(shè)定隱含層神經(jīng)元的個數(shù)即可。
圖4 ELM的結(jié)構(gòu)圖Fig.4 Structure diagram of ELM
由于ELM的輸入權(quán)值和隱含層閾值是隨機產(chǎn)生的,其穩(wěn)定性較差,進而影響了其自身的性能。因此,本文將SA-PSO利用均方誤差函數(shù)與ELM連接,通過SA-PSO優(yōu)化ELM的閾值和權(quán)值,當均方誤差不隨迭代次數(shù)的增加而下降時,輸出的權(quán)值和閾值即為優(yōu)化后的權(quán)值和閾值,近而構(gòu)建SA-PSO-ELM模型。
計算均方誤差函數(shù)的表達式可寫為
(6)
式中,yi、ti、及n分別為ELM的預(yù)測值、ELM的實際輸出值及優(yōu)化模型中訓(xùn)練集的樣本個數(shù)。
SA-PSO-ELM的流程圖如圖5所示。
圖5 SA-PSO-ELM流程圖Fig.5 SA-PSO-ELM flow chart
本文構(gòu)建的SA-PSO-ELM的演算過程如下:
步驟1ELM參數(shù)初始化;
步驟2由分類結(jié)果計算適應(yīng)度;
步驟3更新ELM參數(shù);
步驟4判斷尋優(yōu)曲線是否收斂且誤差是否滿足要求。如果收斂且滿足要求,輸出分類結(jié)果,否則返回步驟2。
尾水管的作用是引導(dǎo)進出轉(zhuǎn)輪的水流,是水輪機的主要通流部件,是水輪機壓力脈動測試時的主要部位,本文試驗數(shù)據(jù)來自于用壓力傳感器采集的水輪機的尾水管的7個主要部位的信號:蝸殼進口、無葉區(qū)+Y、無葉區(qū)-Y、錐管+Y0.3D2、錐管-Y0.3D2、肘管外側(cè)、肘管內(nèi)側(cè)。在采集數(shù)據(jù)的過程中,設(shè)置五種工況分別為正常狀態(tài)、預(yù)警狀態(tài)、報警狀態(tài)、異常狀態(tài)、故障狀態(tài)。試驗過程中,在每個部位安裝1個傳感器采集壓力脈動數(shù)據(jù),每個部位在每個運轉(zhuǎn)狀態(tài)下采集10 000個數(shù)據(jù),數(shù)據(jù)的采樣頻率為4 kHz,試驗裝置含尾水管部分的外形如圖6所示。
圖6 試驗裝置尾水管的外形Fig.6 Apparance of draft tube of test device
試驗因工況調(diào)整設(shè)有4個可變參數(shù):導(dǎo)葉開度(mm)、單位轉(zhuǎn)速(r/min)、流量(m3/s)、裝置空化數(shù)。其中,裝置空化數(shù)越小,水輪機的抗空化性能越差,當設(shè)置不同的工況參數(shù)時,水輪機運轉(zhuǎn)狀態(tài)從正常狀態(tài)向預(yù)警狀態(tài)、報警狀態(tài)、異常狀態(tài)、故障狀態(tài)依次過渡。本試驗中,采集水輪機信號時的水輪機的參數(shù)設(shè)置如表1所示。
表1 不同運轉(zhuǎn)狀態(tài)下的導(dǎo)葉開度、單位轉(zhuǎn)速、流量、裝置空化數(shù)Tab.1 Guide vane opening,unit speed,flow and cavitation number of the device under different operatingconditions
為確定模態(tài)分界點,用CEEMD法對水輪機信號進行分解。本文只展示蝸殼進口部位的信號在正常狀態(tài)下的CEEMD分解結(jié)果,分解成11個IMF,結(jié)果如圖7所示。
由圖7可知,從第3階IMF分量開始,噪聲含量逐漸下降,可近似認為分界點為3。為確定分界點估計的準確性,繪制IMF相關(guān)系數(shù)分布隨IMF分量階數(shù)變化的曲線,通過皮爾遜相關(guān)系數(shù)計算水輪機信號與IMF分量之間的相關(guān)性,分界點的選取準則為相似度曲線首次發(fā)生逆向轉(zhuǎn)折的位置,結(jié)果如圖8所示。
由圖8可知,IMF4的出現(xiàn),使相似度曲線的變化趨勢發(fā)生首次逆向轉(zhuǎn)折,分界點為3。可見,分界點估計的結(jié)果是正確的。
圖7 CEEMD分解結(jié)果Fig.7 CEEMD decomposition results
圖8 相關(guān)系數(shù)隨IMF分量階數(shù)變化的曲線Fig.8 Curve of correlation coefficient with IMF component order
為確定水輪機信號的頻率成分,對蝸殼進口部位在正常狀態(tài)下的水輪機信號去噪之后,繪制頻譜圖,結(jié)果如圖9所示。
圖9 去噪之后的頻譜Fig.9 Spectrum after denoising
由圖9可知,水輪機信號的頻率主要分布在0~60 Hz區(qū)間??梢娝啓C信號的頻率主要分布在低頻段,對水輪機信號進行特征提取時主要提取水輪機信號在低頻部分的特征。
為提取水輪機信號的特征,對去噪之后的水輪機信號進行CEEMD分解,分解為10個IMF分量,同樣選擇蝸殼進口部位在正常狀態(tài)下的水輪機信號。不同的IMF分量的頻率成分不同,從分解得到的所有IMF分量中選擇頻率成分和水輪機信號的頻率成分相近的IMF分量,進行特征提取。10個IMF分量的頻譜圖如10所示。
由圖10可知,IMF3~IMF7分量為水輪機信號的主要頻率成分,因此,進行特征提取時,選擇IMF3~IMF7這5個分量。
對選用的IMF分量計算排列熵,并以排列熵構(gòu)建水輪機運轉(zhuǎn)狀態(tài)識別模型的輸入特征向量,每個特征向量的每一維是一個IMF分量的排列熵。設(shè)置水輪機運轉(zhuǎn)狀態(tài)識別模型的輸入特征向量的個數(shù)為175個,每個運轉(zhuǎn)狀態(tài)的特征向量有35個,每個特征向量是5維的。
設(shè)置PSO的兩個學(xué)習(xí)因子的取值分別為2.8和1.3,最大迭代次數(shù)為180,初始慣性值和迭代至最大代數(shù)時的慣性值分別為0.9和0.3,微粒的最大速度是1,設(shè)置SA-PSO-ELM的退火常數(shù)慣性權(quán)重為0.5。
特征向量輸入個數(shù)為175個,選擇125個作為訓(xùn)練樣本,50個作為測試樣本。模型的ELM輸入層神經(jīng)元個數(shù)、隱含層神經(jīng)元個數(shù)、輸出層神經(jīng)元個數(shù)分別為5個、10個、1個。
為對比SA-PSO-ELM的正確率,繪制ELM、PSO-ELM、SA-PSO-ELM的分類結(jié)果圖,結(jié)果如圖11、圖12所示(縱坐標的1、2、3、4、5分別代表水輪機運轉(zhuǎn)狀態(tài)的正常狀態(tài)、預(yù)警狀態(tài)、報警狀態(tài)、異常狀態(tài)、故障狀態(tài))。
(a) IMF1的頻譜
圖11 SA-PSO-ELM的分類結(jié)果圖Fig.11 Classification results of SA-PSO-ELM
圖12 ELM、PSO-ELM的分類結(jié)果圖Fig.12 Classification results of ELM and PSO-ELM
由圖11、12可知,ELM在樣本編號為13-16、40預(yù)測錯誤,樣本共計5個,因此正確率為90%,同時,由圖11、12可知,PSO-ELM與SA-PSO-ELM的正確率為100%。
為定量分析ELM、PSO-ELM、SA-PSO-ELM的預(yù)測效果與均方誤差和決定系數(shù)的關(guān)系,進行試驗,結(jié)果如表2所示。
表2 不同模型下的預(yù)測結(jié)果Tab.2 Prediction results under different models
由表2可知,SA-PSO-ELM的均方誤差為1.399 20,比ELM和PSO-ELM均??;SA-PSO-ELM決定系數(shù)為0.922 96,比ELM和PSO-ELM均大,即精度最高。且結(jié)合圖11、12可知,SA-PSO-ELM的預(yù)測正確率為100%,由此表明本文提出的模型應(yīng)用在水輪機運轉(zhuǎn)狀態(tài)識別上,效果較好。
本文針對水輪機的運轉(zhuǎn)狀態(tài)識別,提出了基于SA-PSO-ELM的水輪機運轉(zhuǎn)狀態(tài)識別模型,并作出如下總結(jié):
(1) 用小波軟閾值去噪對矩形波信號進行去噪,并用小波硬閾值去噪做對比,通過比較含噪信號的時域圖和去噪后的時域圖,確定了小波軟閾值去噪較好的去噪效果。
(2) 利用皮爾遜相關(guān)系數(shù),繪制水輪機信號和IMF分量之間的相關(guān)系數(shù)隨IMF分量階數(shù)變化的曲線,確定了K值估計的準確性。
(3) 用SA-PSO優(yōu)化ELM的權(quán)值和閾值,構(gòu)建水輪機運轉(zhuǎn)狀態(tài)識別模型SA-PSO-ELM。正確率、均方誤差、決定系數(shù)分別為100%、1.399 20、0.922 96。同ELM、PSO-ELM相比,SA-PSO-ELM的正確率最高,均方誤差最小,決定系數(shù)最大,SA-PSO-ELM的性能要好于ELM、PSO-ELM,更適合于水輪機運轉(zhuǎn)狀態(tài)識別。
隨機森林(RF)、遷移學(xué)習(xí)在機械設(shè)備故障診斷中應(yīng)用廣泛,但是在水輪機故障診斷中應(yīng)用不足。因此,下一步的計劃是用RF或者遷移學(xué)習(xí)構(gòu)建水輪機運轉(zhuǎn)狀態(tài)識別模型,識別水輪機運轉(zhuǎn)狀態(tài),準確地診斷水輪機故障。