楊天玥,趙麗軍,徐健,厲偉,張國(guó)軍
(1.沈陽(yáng)工業(yè)大學(xué)電氣工程學(xué)院,遼寧 沈陽(yáng) 110870;2.華能遼寧清潔能源有限責(zé)任公司,遼寧 沈陽(yáng) 110015)
風(fēng)電機(jī)組的功率曲線是風(fēng)電機(jī)組控制系統(tǒng)設(shè)計(jì)的重要依據(jù),也是評(píng)估風(fēng)電機(jī)組性能及發(fā)電能力的重要指標(biāo)[1-2]。在風(fēng)電機(jī)組控制系統(tǒng)中,功率曲線直接影響控制策略以及控制過(guò)程中參數(shù)的調(diào)整。因此,功率曲線異常識(shí)別是十分有必要的。
風(fēng)電機(jī)組功率曲線異常識(shí)別及故障診斷是當(dāng)前的研究熱點(diǎn),國(guó)內(nèi)外學(xué)者已開(kāi)展相關(guān)工作并取得了一定的研究成果,其中風(fēng)電機(jī)組功率曲線數(shù)據(jù)識(shí)別的代表性成果有:文獻(xiàn)[3]通過(guò)采用分組最優(yōu)方差算法成功識(shí)別出功率曲線下方堆積型異常數(shù)據(jù),但該算法無(wú)法識(shí)別功率曲線上方堆積型異常數(shù)據(jù);文獻(xiàn)[4]基于Copula函數(shù)建立概率功率曲線模型,基于SCADA數(shù)據(jù)對(duì)風(fēng)電機(jī)組進(jìn)行故障診斷,模型可以對(duì)風(fēng)電機(jī)組葉片、偏航系統(tǒng)及變槳系統(tǒng)進(jìn)行早期故障預(yù)測(cè),但輸入變量只有風(fēng)速,無(wú)法準(zhǔn)確描述風(fēng)電機(jī)組整體運(yùn)行情況;文獻(xiàn)[5]通過(guò)建立功率曲線的非線性模型來(lái)識(shí)別異常數(shù)據(jù),但是需要大量的正常數(shù)據(jù)作為樣本,否則會(huì)使模型誤差變大,這將導(dǎo)致異常數(shù)據(jù)識(shí)別速度變慢;文獻(xiàn)[6]假設(shè)風(fēng)速、功率的概率密度函數(shù)服從正態(tài)分布,提出了基于3δ法則的異常數(shù)據(jù)識(shí)別與清洗方法,但該方法與實(shí)際風(fēng)電機(jī)組運(yùn)行中風(fēng)速功率的概率密度函數(shù)不符,其適應(yīng)性及異常數(shù)據(jù)識(shí)別效果欠佳;文獻(xiàn)[7]通過(guò)加權(quán)最小二乘支持向量機(jī)回歸模型建立的功率曲線模型檢測(cè)風(fēng)電機(jī)組的異常運(yùn)行,利用在線監(jiān)測(cè)不斷更新模型并剔除異常點(diǎn),結(jié)果表明該模型準(zhǔn)確性高于其他模型。
針對(duì)傳統(tǒng)的異常數(shù)據(jù)識(shí)別算法中存在的問(wèn)題,本文提出基于Copula函數(shù)的風(fēng)電機(jī)組異常識(shí)別方法,首先,對(duì)風(fēng)電機(jī)組正常運(yùn)行不同工況下功率曲線的影響因素進(jìn)行相關(guān)性分析,判斷出對(duì)功率曲線影響大的特征參量;其次,通過(guò)二元概率分布函數(shù)得到了風(fēng)電機(jī)組功率曲線上下邊界,對(duì)于上下邊界外的可疑點(diǎn)進(jìn)行時(shí)序分析;最后,通過(guò)計(jì)算可疑點(diǎn)與正常點(diǎn)之間各特征參量的歐氏距離判斷可疑點(diǎn)是否為異常點(diǎn),從而確定風(fēng)電機(jī)組故障位置?;赟VM線性回歸,采用某風(fēng)電機(jī)組的實(shí)測(cè)數(shù)據(jù)進(jìn)行仿真驗(yàn)證,結(jié)果表明混合Copula函數(shù)模型能夠準(zhǔn)確的識(shí)別異常數(shù)據(jù),具有較強(qiáng)的實(shí)用性。
將風(fēng)電機(jī)組運(yùn)行中最大風(fēng)能追蹤階段劃分為工況B,發(fā)電機(jī)轉(zhuǎn)矩控制階段劃分為工況C,定速變槳控制階段劃分為工況D,如圖1所示。分別對(duì)各工況下的風(fēng)速-功率、風(fēng)速-葉輪轉(zhuǎn)速、風(fēng)速-槳距角、風(fēng)速-偏航角進(jìn)行Kendall相關(guān)性分析,結(jié)果如表1所示,當(dāng)功率曲線出現(xiàn)異常時(shí)大概率是相關(guān)性較大的變量異常導(dǎo)致。由表1可見(jiàn),工況B下,風(fēng)速-功率、風(fēng)速-葉輪轉(zhuǎn)速、葉輪轉(zhuǎn)速-轉(zhuǎn)矩、葉輪轉(zhuǎn)速-有功功率、轉(zhuǎn)矩-有功功率相關(guān)系數(shù)均很高;工況C下,轉(zhuǎn)矩-有功功率相關(guān)系數(shù)最高;工況D下,風(fēng)速-槳距角相關(guān)系數(shù)最高。三個(gè)工況中,風(fēng)速-偏航角相關(guān)系數(shù)最低,說(shuō)明偏航角與風(fēng)速相關(guān)性較小。相關(guān)性分析所得結(jié)果與風(fēng)電機(jī)組的工作特性相吻合。因此,本文著重于風(fēng)速-功率、風(fēng)速-葉輪轉(zhuǎn)速、風(fēng)速-槳距角對(duì)風(fēng)電機(jī)組運(yùn)行狀態(tài)的影響進(jìn)行分析。
圖1 功率曲線工況劃分圖
表1 相關(guān)性分析
風(fēng)電機(jī)組的功率特性除取決于風(fēng)電機(jī)組的性能外,還取決于氣象環(huán)境條件以及風(fēng)電機(jī)組在風(fēng)電場(chǎng)中的排布等[8]。風(fēng)電機(jī)組在設(shè)計(jì)時(shí)假定空氣密度為常數(shù),實(shí)際上空氣密度會(huì)隨地理位置不同而不同,空氣密度所造成的誤差會(huì)在風(fēng)速中放大[9],因此每臺(tái)風(fēng)電機(jī)組正常運(yùn)行的輸出特性也不盡相同,所以直接使用風(fēng)電機(jī)組廠商提供的功率曲線對(duì)異常進(jìn)行狀態(tài)檢測(cè)存在較大的故障誤報(bào)風(fēng)險(xiǎn),需要基于每臺(tái)風(fēng)電機(jī)組的實(shí)際運(yùn)行數(shù)據(jù)來(lái)進(jìn)行功率曲線建模,為下一步的異常運(yùn)行狀態(tài)檢測(cè)提供基礎(chǔ)。
風(fēng)速和功率具有隨機(jī)性和波動(dòng)性,可將其視為具有相關(guān)性的兩個(gè)隨機(jī)變量,而Copula函數(shù)能夠反映兩個(gè)隨機(jī)變量之間的相關(guān)性[10]。
多元Sklar定理指出,對(duì)于邊緣分布函數(shù)F1(u1),F(xiàn)2(u2),…,F(xiàn)n(un),存在一個(gè) Copula 函數(shù)C滿足:
且當(dāng)F1(u1),F(xiàn)2(u2),…,F(xiàn)n(un)連續(xù)時(shí),Copula函數(shù)C是唯一確定的,其中F(u1,u2,…,un)是邊緣分布函數(shù)的聯(lián)合分布函數(shù)。
根據(jù)風(fēng)電機(jī)組正常運(yùn)行數(shù)據(jù),計(jì)算風(fēng)速V和輸出功率P的累積概率分布,利用能反映風(fēng)速和功率之間相關(guān)性的Copula函數(shù),在不同風(fēng)速值和置信度下,得到輸出功率的條件概率分布對(duì)應(yīng)的上下分位數(shù)值,最后在各個(gè)風(fēng)速值下對(duì)應(yīng)的輸出功率上下邊界值形成的兩條曲線就是概率功率曲線[11]。
設(shè)V、P分別為風(fēng)速、功率變量,F(xiàn)p(p)、Fv(v)分別為其核密度估計(jì)累積概率分布函數(shù),C用來(lái)描述由唯一Copula函數(shù)連接起來(lái)的V、P聯(lián)合分布函數(shù),F(xiàn)是風(fēng)速累積概率分布取值條件下的功率累積概率分布,即:
其中,V、P分別為工況 B、C、D下的風(fēng)速、功率變量。
在B、C、D工況下分別選取二元Gumbel Copula函數(shù)、二元Frank Copula函數(shù)和二元Clayton Copula函數(shù),選用混合Copula函數(shù)可得到更加精確的功率曲線上下邊界。依次設(shè)工況B、C、D的理論等效功率曲線的置信水平1-βi(i=1,2,3),采用非對(duì)稱概率區(qū)間確定輸出功率置信區(qū)間上下界,置信區(qū)間上下界的分位概率β′ij、β″ij,置信區(qū)間不對(duì)稱系數(shù)為κij分別為:
其中,κi-min為第i區(qū)域的不對(duì)稱系數(shù)的最小值;κi-max為第i區(qū)域的不對(duì)稱系數(shù)的最大值;li為第i區(qū)域的不對(duì)稱系數(shù)的變化率;j=1,2,…,m。
分別在工況B、C、D上,利用最大似然估計(jì)法分別求出風(fēng)速整體累積概率分布函數(shù)中的參數(shù)Fv(v;θ1)和第j段上功率累積概率分布函數(shù)中的參數(shù);當(dāng)測(cè)量風(fēng)速V取值已知時(shí),設(shè)條件概率分布F(Fp(p)|Fv(v))的對(duì)應(yīng)分位點(diǎn)分別為p1、p2,即p1、p2分別對(duì)應(yīng)第j段輸出功率累積概率分布的取值,分別對(duì)p1、p2求逆,得到在該風(fēng)速條件下,置信等效功率上下邊界值,對(duì)上下邊界求逆即可得到概率功率曲線[12],如圖2中實(shí)線所示。
圖2 風(fēng)電機(jī)組概率功率曲線
概率功率曲線上下邊界外的數(shù)據(jù)點(diǎn)為可疑點(diǎn),要確定其為異常點(diǎn)還需要進(jìn)一步進(jìn)行驗(yàn)證。
SVM線性回歸是一種基于統(tǒng)計(jì)學(xué)習(xí)的機(jī)器學(xué)習(xí)方法,在解決非線性、小樣本及高維度識(shí)別中占有較大優(yōu)勢(shì)。 設(shè)給定樣本為(xi,yi),i=1,2,…,l,x∈R。xi為第i個(gè)輸入量,yi為第i個(gè)輸出量,其基本思想是通過(guò)樣本集在樣本空間找到一個(gè)分類超平面,將具有不同特征的樣本分開(kāi),分類超平面可描述為[13]:
式中,wT為特征空間權(quán)系數(shù)向量,b為偏置。若樣本能夠按照各自類別被正確區(qū)分,且即對(duì)于yi=1,有wT·x+b≥1;對(duì)于yi=-1,有wT·x+b≤ -1。
在樣本空間中,樣本點(diǎn)到超平面的距離為
當(dāng)點(diǎn)到超平面的距離最大時(shí),說(shuō)明不同特征的數(shù)據(jù)集之間間隔最遠(yuǎn),模型分類效果最好。
為了驗(yàn)證上述異常數(shù)據(jù)識(shí)別模型的有效性,本文以某風(fēng)電場(chǎng)風(fēng)電機(jī)組的實(shí)際運(yùn)行數(shù)據(jù)作為研究對(duì)象,機(jī)組額定功率為1.5MW,選取10000個(gè)連續(xù)測(cè)量的風(fēng)速與功率數(shù)據(jù)對(duì),數(shù)據(jù)采樣間隔為10min。
基于Copula函數(shù)構(gòu)建的概率功率曲線如圖3所示,在概率功率曲線上下邊界外有概率可疑點(diǎn);相對(duì)應(yīng)的,從圖4的B、C、D工況下風(fēng)速與葉輪轉(zhuǎn)速、發(fā)電機(jī)轉(zhuǎn)矩、槳距角的時(shí)序圖中可以看出,在風(fēng)速未出現(xiàn)較大波動(dòng)的情況下,葉輪轉(zhuǎn)速與槳距角出現(xiàn)明顯波動(dòng)的數(shù)據(jù)點(diǎn)。
圖3 風(fēng)電機(jī)組實(shí)測(cè)風(fēng)速功率圖
圖4 時(shí)序圖
計(jì)算可疑點(diǎn)與相鄰正常點(diǎn)之間的歐式距離,并與相鄰兩個(gè)非可疑數(shù)據(jù)點(diǎn)相比較,結(jié)果如表2、3、4所示。由表可知,在工況B恒風(fēng)速下,葉輪轉(zhuǎn)速低于正常值時(shí),由于轉(zhuǎn)速與轉(zhuǎn)矩的高相關(guān)性,轉(zhuǎn)矩也會(huì)相應(yīng)下降,由風(fēng)速?zèng)Q定的槳距角仍處于正常范圍內(nèi),但有功功率由于轉(zhuǎn)矩的下降而低于正常值;工況C中歐式空間距離波動(dòng)范圍較小,沒(méi)有異常數(shù)據(jù),與混合Copula函數(shù)模型識(shí)別結(jié)果一致;在工況D恒風(fēng)速下,槳距角異常時(shí),葉輪轉(zhuǎn)速和轉(zhuǎn)矩均處于正常范圍,但有功功率低于正常值。因此可判定概率功率曲線上下邊界以外的數(shù)據(jù)確為異常點(diǎn)。
表2 葉輪轉(zhuǎn)速異常
表3 轉(zhuǎn)矩值正常
表4 槳距角異常
本文以殘差最小為原則,建立三個(gè)工況下相關(guān)性最大的特征參量:葉輪轉(zhuǎn)速,轉(zhuǎn)矩,槳距角的SVM線性回歸模型,對(duì)混合Copula函數(shù)模型進(jìn)行驗(yàn)證,具體過(guò)程如下:
(1)數(shù)據(jù)采集。分別采集風(fēng)電機(jī)組正常運(yùn)行時(shí)三個(gè)工況下的葉輪轉(zhuǎn)速、發(fā)電機(jī)轉(zhuǎn)矩和槳距角數(shù)據(jù)。采樣間隔為10min,每種工況下采樣點(diǎn)數(shù)為5000個(gè);并隨機(jī)選取其中前3000個(gè)數(shù)據(jù)作為預(yù)測(cè)模型的訓(xùn)練樣本,余下2000個(gè)數(shù)據(jù)作為測(cè)試樣本。
(2)建立預(yù)測(cè)模型。使用均方根誤差最小的40組數(shù)據(jù)集對(duì)模型進(jìn)行多次訓(xùn)練和測(cè)試,以RMSE最小為原則,建立精度較高的預(yù)測(cè)模型。建立模型時(shí),交叉驗(yàn)證選擇的原則是RMSE最小,根據(jù)訓(xùn)練好的模型,將混合Copula函數(shù)模型所識(shí)別出的數(shù)據(jù)及相鄰數(shù)據(jù)點(diǎn)作為測(cè)試樣本進(jìn)行檢驗(yàn),圖5為測(cè)試樣本的SVM線性回歸模型預(yù)測(cè)值與實(shí)際值對(duì)比情況及相應(yīng)特征變量的殘差圖,其中殘差圖控制上限UCL、控制下限LCL之間的距離為3σ。
圖5 SVM回歸模型結(jié)果
從圖5(a)、(b)中可以看出,工況B中第26個(gè)樣本點(diǎn),風(fēng)電機(jī)組的葉輪轉(zhuǎn)速偏離預(yù)測(cè)值且超出閾值下限,表明該樣本點(diǎn)確為異常數(shù)據(jù)點(diǎn),此時(shí)風(fēng)輪可能出現(xiàn)輕微故障;從圖5(c)、(d)可知,工況C中發(fā)電機(jī)轉(zhuǎn)矩樣本點(diǎn)均在閾值范圍內(nèi),沒(méi)有異常數(shù)據(jù)點(diǎn);從圖5(e)、(f)中可以看出,在工況D第16~21個(gè)樣本點(diǎn)之間,槳距角偏離預(yù)測(cè)值且超出閾值下限,表明該樣本點(diǎn)為異常點(diǎn),變槳系統(tǒng)可能出現(xiàn)故障,需要維修人員進(jìn)行檢查。
綜上,風(fēng)電機(jī)組各特征參量SVM回歸模型結(jié)果與混合Copula函數(shù)模型所得結(jié)果一致,驗(yàn)證了混合Copula函數(shù)模型的準(zhǔn)確性。
本文提出一種基于Copula函數(shù)的風(fēng)電機(jī)組異常識(shí)別方法,利用風(fēng)電機(jī)組實(shí)際運(yùn)行數(shù)據(jù)進(jìn)行仿真分析,得出以下結(jié)論:
(1)通過(guò)對(duì)概率功率曲線上下邊界外可疑點(diǎn)的時(shí)序分析和歐式距離計(jì)算,能夠準(zhǔn)確判斷可疑點(diǎn)是否為異常點(diǎn)。
(2)通過(guò)對(duì)不同工況下功率曲線影響因素的Kendall秩相關(guān)性分析,得到每個(gè)工況下影響較大的因素,有利于故障定位。
(3)通過(guò)建立SVM線性回歸模型,對(duì)混合Copula函數(shù)模型所確定的異常數(shù)據(jù)進(jìn)行檢驗(yàn),結(jié)果與混合Copula函數(shù)模型所得結(jié)果一致,表明混合Copula函數(shù)模型能夠準(zhǔn)確識(shí)別異常數(shù)據(jù),模型精確性較高。
本文提出的方法基于風(fēng)電機(jī)組歷史運(yùn)行數(shù)據(jù),構(gòu)建等效概率功率曲線并結(jié)合數(shù)據(jù)的時(shí)序特性進(jìn)行分析,能夠有效識(shí)別異常數(shù)據(jù),判斷機(jī)組故障位置,彌補(bǔ)傳統(tǒng)算法的不足,有較強(qiáng)的適應(yīng)性與實(shí)用性,為風(fēng)電機(jī)組異常數(shù)據(jù)識(shí)別提供了一種新方法。