摘 要:針對現(xiàn)有風(fēng)力機葉片結(jié)冰檢測方法未能充分利用無標(biāo)簽數(shù)據(jù),且分類性能差的問題,提出一種基于改進的三重訓(xùn)練和卷積神經(jīng)網(wǎng)絡(luò)(Tri-SE-CNN)的結(jié)冰檢測方法。首先建立基于最優(yōu)加權(quán)策略的三重訓(xùn)練(Tri-training)模型,對無標(biāo)簽樣本的狀態(tài)進行判別,用以擴充訓(xùn)練集;接著將壓縮與激勵(SE)模塊嵌入到卷積神經(jīng)網(wǎng)絡(luò)(CNN)中,并用SE-CNN分類器學(xué)習(xí)擴充后的樣本集。結(jié)合提取的葉片結(jié)冰主控特征,以2017年工業(yè)大數(shù)據(jù)創(chuàng)新競賽平臺中15號和21號風(fēng)力機數(shù)據(jù)為例進行仿真,并用云南某風(fēng)場歷史數(shù)據(jù)進行驗證。實驗結(jié)果表明,所提方法的準(zhǔn)確度優(yōu)于CNN、支持向量機等方法,在15號風(fēng)力機上達(dá)到99.96%,可為風(fēng)力機葉片結(jié)冰預(yù)警提供有益參考。
關(guān)鍵詞:風(fēng)電機組葉片;無標(biāo)簽數(shù)據(jù);卷積神經(jīng)網(wǎng)絡(luò);三重訓(xùn)練;壓縮和激勵網(wǎng)絡(luò);結(jié)冰檢測
中圖分類號:TM315 " " " " " " " " 文獻標(biāo)志碼:A
0 引 言
風(fēng)電在電力系統(tǒng)中所占比例逐年升高,風(fēng)電場廣泛分布于中國華北、華南、西南等地區(qū)。位于湖南、云南等地的風(fēng)力機裝置分布在高濕度和高海拔地區(qū),使得其葉片結(jié)冰成為影響冬季風(fēng)電出力的重要原因之一[1]。結(jié)冰不僅會降低風(fēng)力機的發(fā)電效率[2],還會降低葉片的氣動性能、加速葉片的疲勞、威脅人員的安全等[3]。因此,結(jié)冰故障的及時檢測和預(yù)警,對保障風(fēng)力機的安全性、穩(wěn)定性和可靠性具有積極影響。
傳統(tǒng)的葉片結(jié)冰檢測方法包括視覺檢測法[4]、聲波檢測法[5]、紅外線檢測法[6]等,上述方法只有在結(jié)冰達(dá)到一定程度才能準(zhǔn)確識別,難以在結(jié)冰早期做出預(yù)警[7]。
隨著風(fēng)電場監(jiān)控與數(shù)據(jù)采集(supervisory control and data acquisition,SCADA)系統(tǒng)[8]的普及,基于SCADA數(shù)據(jù)模擬冰型和厚度的數(shù)學(xué)模型逐漸被提出[9],但這些模型不具備廣泛適用性[10]。而機器學(xué)習(xí)在大數(shù)據(jù)分類領(lǐng)域具有高效性和適應(yīng)性[3],很多學(xué)者將其應(yīng)用于葉片結(jié)冰檢測研究。文獻[11]在對特征選擇的基礎(chǔ)上,構(gòu)建基于小波去噪的長短期記憶神經(jīng)網(wǎng)絡(luò)(wavelet denoising-long short term memory,WD-LSTM),對含標(biāo)簽的歷史數(shù)據(jù)進行學(xué)習(xí);文獻[12]將自適應(yīng)鄰近的混合取樣方法應(yīng)用于結(jié)冰狀態(tài)樣本的增強,通過粒子群算法優(yōu)化支持向量機(support vector machine,SVM),實現(xiàn)了對歷史標(biāo)記數(shù)據(jù)的分類;文獻[13]使用極限梯度提升樹(eXtreme Gradient Boosting, XGBoost)對歷史標(biāo)簽數(shù)據(jù)的特征變量進行提取和重構(gòu),將其用于一維卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)進行分類。
上述方法對葉片結(jié)冰檢測取得了一定效果。然而,受葉片的運行環(huán)境及天氣情況等因素的影響,對風(fēng)場眾多風(fēng)力機的葉片狀態(tài)識別具有較大挑戰(zhàn),因此SCADA數(shù)據(jù)中有大量時間點的葉片狀態(tài)未知。但上述模型對原始數(shù)據(jù)中的無標(biāo)簽樣本做了簡單剔除,未能充分利用這部分?jǐn)?shù)據(jù)的有效信息。
為提升模型的魯棒性,克服不利環(huán)境對數(shù)據(jù)標(biāo)記帶來的障礙,學(xué)者們開始對無標(biāo)簽數(shù)據(jù)加以利用。文獻[14]用皮爾遜相關(guān)系數(shù)(Pearson correlation coefficient, PCC)算法測量無標(biāo)簽數(shù)據(jù)與標(biāo)記數(shù)據(jù)之間的相似性,對無標(biāo)簽數(shù)據(jù)進行偽標(biāo)記,并結(jié)合兩部分樣本對時間卷積網(wǎng)絡(luò)(temporal convolutional network, TCN)進行訓(xùn)練,準(zhǔn)確度達(dá)到92.1%;文獻[15]提出一種新型深層不平衡半監(jiān)督(deep class-imbalanced semisupervise, DCISS)模型,集成了類不平衡和半監(jiān)督學(xué)習(xí),通過測量待標(biāo)記數(shù)據(jù)與標(biāo)記樣本之間的相似性,對無標(biāo)簽數(shù)據(jù)進行偽標(biāo)記,在此基礎(chǔ)上分類準(zhǔn)確度達(dá)到97.8%。上述模型利用樣本相似性對無標(biāo)簽數(shù)據(jù)進行偽標(biāo)記,當(dāng)標(biāo)簽出現(xiàn)誤判時,擴充的樣本集會加入噪聲,進而影響模型對正常和結(jié)冰樣本的分類性能。因此如何降低模型對未標(biāo)記數(shù)據(jù)的誤判,提升其對葉片結(jié)冰狀態(tài)的識別能力,是本文研究的主要內(nèi)容。
針對上述問題,本文結(jié)合對葉片結(jié)冰的主控特征分析,構(gòu)建了Tri-SE-CNN結(jié)冰狀態(tài)判別模型。以最優(yōu)加權(quán)策略為決策方式的Tri-training模型對無標(biāo)簽樣本偽標(biāo)記后,構(gòu)建含時間序列特性(時間戳間隔相等)的擴充樣本集,用其學(xué)習(xí)嵌入壓縮與激勵(squeeze and excitation, SE)注意力模塊的CNN網(wǎng)絡(luò),從而在提升網(wǎng)絡(luò)通道特征敏感性的基礎(chǔ)上提高樣本狀態(tài)判斷的準(zhǔn)確度。將風(fēng)力機歷史運行數(shù)據(jù)作為示例,用Tri-SE-CNN模型進行學(xué)習(xí),通過多項指標(biāo)對分類結(jié)果進行評價,從而驗證該方法在結(jié)冰檢測方面的可行性。
1 Tri-SE-CNN模型的構(gòu)建
Tri-SE-CNN模型包括最優(yōu)加權(quán)決策的三重訓(xùn)練(Tri-training)算法和SE-CNN網(wǎng)絡(luò)兩個部分:三重訓(xùn)練模型在第1層,用來處理無標(biāo)簽數(shù)據(jù);SE-CNN模型在第2層,用以對擴充的樣本集進行訓(xùn)練。Tri-SE-CNN的結(jié)構(gòu)如圖1所示。
1.1 最優(yōu)加權(quán)策略的Tri-training算法
Tri-training算法是文獻[16]為有效利用無標(biāo)簽數(shù)據(jù)而提出的一種半監(jiān)督分類器,其基本思想是利用協(xié)同訓(xùn)練策略對3個分類器進行集成,在數(shù)據(jù)偽標(biāo)記方面具有較好的魯棒性[16]。
傳統(tǒng)Tri-training模型用原始標(biāo)記樣本經(jīng)過三次可重復(fù)取樣得到的子數(shù)據(jù)集[Si(i=1, 2, 3)]分別訓(xùn)練同質(zhì)分類器,得到3個不同參數(shù)的個體學(xué)習(xí)器[hi]([i]同上)。對于其中任意2個分類器對當(dāng)前樣本的狀態(tài)判別,相同時賦予該樣本偽標(biāo)簽并用其擴充訓(xùn)練子樣本,否則將其放回?zé)o標(biāo)簽數(shù)據(jù)集中繼續(xù)迭代,直到訓(xùn)練集大小不再變化[16]。
風(fēng)力機運行工況中結(jié)冰和正常樣本耦合關(guān)系較強,同質(zhì)分類器對子樣本集的學(xué)習(xí)差異不顯著,影響其對樣本偽標(biāo)記的可信度[17]。因此本文用異質(zhì)Tri-training模型對無標(biāo)簽樣本進行偽標(biāo)記。在此情況下,用分類標(biāo)簽相等的投票原則(硬投票)確定該樣本的類別歸屬,不足以充分發(fā)揮異質(zhì)個體學(xué)習(xí)器的優(yōu)勢,加權(quán)策略比硬投票策略的表現(xiàn)更好[18]。故立足于不同分類器對結(jié)冰樣本的檢測效果,選擇隨機森林(random forest, RF)、XGBoost、輕量梯度提升機(light gradient boosting machine, LightGBM)作為個體學(xué)習(xí)器,并對其預(yù)測概率求加權(quán)平均?;诩訖?quán)策略的Tri-training算法決策過程如下:
[p=i=1npiwi] (1)
式中:[p]——未標(biāo)記數(shù)據(jù)的預(yù)測概率;[n]——分類器總數(shù);[pi]——第[i]個分類器的預(yù)測概率;[wi]——第[i]個分類器的權(quán)重。為了使對葉片狀態(tài)判斷有利的模型在數(shù)據(jù)標(biāo)記中所占權(quán)重更高,引入交叉熵?fù)p失函數(shù),建立個體分類器加權(quán)結(jié)果與真實標(biāo)簽的損失函數(shù):
[L(y,p)=-y·lni=1npi·wi-(1-y)·ln1-i=1npi·wi] (2)
式中:[L]——訓(xùn)練過程中的損失值;[y]——樣本的分類標(biāo)簽,[y∈0,1]。用各分類器對樣本集訓(xùn)練的精確度和召回率的交點作為其置信度,當(dāng)預(yù)測概率大于等于置信度,將樣本標(biāo)記為1(結(jié)冰狀態(tài)),否則將樣本標(biāo)記為0(正常狀態(tài))。因此,受置信度的制約,[wi]需要滿足以下條件:
[s.t.i=1nwi=10≤wi≤1, i=1, 2, …, n] (3)
式(2)為受約束的非線性損失函數(shù),其變量[w=w1,w2,…,wn]的維度較低。由于序列二次規(guī)劃(sequential quadratic programming, SQP)算法的全局收斂性和線性收斂速度,使其在解決小規(guī)模非線性優(yōu)化問題上具有一定優(yōu)勢[19]。故引入SQP求解加權(quán)策略下的最優(yōu)權(quán)重,其步驟如下:
1)給定迭代的初始點。
2)將式(3)線性化,并在迭代點處簡化式(2)為二次規(guī)劃子問題。
3)求解上述二次規(guī)劃問題,對最優(yōu)解進行更新。
4)如果達(dá)到迭代次數(shù),輸出最優(yōu)解;否則在該方向上繼續(xù)搜索,轉(zhuǎn)向步驟2)。
1.2 CNN分類原理
CNN網(wǎng)絡(luò)包含卷積層、池化層和全連接層[20](fully connected layer, FC)。其中卷積層相當(dāng)于濾波器的作用,其通過卷積運算對輸入的特征圖進行輸出:
[xrj=fxr-1i×krij+brj] (4)
式中:[xrj]——第[r]個卷積運算后得到的第[j]個輸出特征圖;[brj]——第[r]層網(wǎng)絡(luò)中第[j]個卷積核的偏置矢量;[krij]——與第[i]個輸入特征圖相運算的第[j]個卷積核;[f]——非線性激活函數(shù),本文選用ReLU函數(shù)。
池化層是一個下采樣過程,本文采用最大池化函數(shù)降低數(shù)據(jù)集的空間尺寸,減少網(wǎng)絡(luò)中參數(shù)的數(shù)量,從而有效防止過擬合現(xiàn)象。
全連接層對網(wǎng)絡(luò)中最后一個池化層的全部神經(jīng)元全連接操作,即:
[O(x)=f(ωx+b)] (5)
式中:[ω]——全連接層的權(quán)重矢量;[x]——全連接層的輸入;[b]——全連接層的偏執(zhí)矢量。
1.3 SE模塊原理
SE模塊是一個通道注意力網(wǎng)絡(luò),是一種端到端的網(wǎng)絡(luò)模塊,其通過對特征通道的融合,對樣本集中有效特征賦予更高的權(quán)重,從而提升模型的分類性能[21]。SE模塊的結(jié)構(gòu)如圖2所示。
由圖2可知,SE模塊主要包括壓縮和激勵兩個部分。壓縮操作首先將輸入[X∈RH×W×C]通過[Ftr]映射到[U∈RH×W×C] (其中:[H]、[W]、[C]和[H]、[W]、[C]分別是映射前和映射后特征圖的長、寬、通道數(shù)),隨后對每一個特征通道在[H×W]空間維度上壓縮:
[Zc=Fsq(Uc)=1H×Wi=1Hj=1WUc(i,j)] (6)
式中:[Zc]——通道[c]的壓縮特征,[c∈1,C];[Uc(i, j)]——通道[c]中第[i]行第[j]列的值。
激勵操作使用全連接層和激活函數(shù)學(xué)習(xí)每個通道的特征,以捕捉通道之間的關(guān)系。每個通道的權(quán)重向量由特征向量[Z]通過兩個全連接層得到:
[Sc=Fex(Z,W)=σ(g(Z,W))=σ(W2δ(W1,Z))] (7)
式中:[σ]——ReLU非線性激活函數(shù);[δ]——Sigmoid激活函數(shù);[W1]和[W2]——兩個全連接層的參數(shù),[W1∈RC×C],[W2∈RC×C];[C]——隱藏層神經(jīng)元的數(shù)量,[C=C16]。
最后,將學(xué)習(xí)到的每個通道特征應(yīng)用到原始輸入的特征通道:
[X=Fscale(Uc,Sc)=Uc?Sc] (8)
式中:[X]——SE網(wǎng)絡(luò)的輸出特征圖,即CNN網(wǎng)絡(luò)全連接層的輸入;[?]——逐元素依次相乘;[Sc∈R1×1×C]。
2 基于Tri-SE-CNN的葉片結(jié)冰檢測
2.1 葉片結(jié)冰主控特征的篩選與重構(gòu)
風(fēng)力發(fā)電裝置用葉片捕獲到的風(fēng)能驅(qū)動葉輪帶動主軸旋轉(zhuǎn),并在齒輪箱的作用下達(dá)到滿足電機額定運行的轉(zhuǎn)速條件。在理想狀態(tài)下,風(fēng)力機發(fā)出的額定功率為[8]:
[P=12ρaSrv3CPηtηg] (9)
式中:[Sr]——葉片旋轉(zhuǎn)面積;[ρa]——空氣密度;[v]——相對風(fēng)速;[ηt]和[ηg]——傳動裝置的機械功率和發(fā)電機的機械效率;[CP]——葉輪的功率系數(shù),其經(jīng)驗公式為[9]:
[CP=(0.44-0.0167β)sinπ(λ-3)15-0.3β-0.00184(λ-3)β] (10)
式中:[β]——槳距角;[λ]——葉尖速比,與葉輪旋轉(zhuǎn)角速度[ωr]、葉輪半徑[R]及來流風(fēng)速[v0]有關(guān),即[λ=ωrRv0]。
然而,在冬季相對濕度較高的氣候環(huán)境中,低溫的加持使得空氣中的水汽極易冷卻到露點溫度。此時水汽達(dá)到飽和,形成的凝露可能會撞擊風(fēng)力機葉片(撞擊系數(shù)為[α1]),進而附著在其表面上(黏著系數(shù)為[α2])。環(huán)境溫度在[-5 ℃]以下,過冷水滴在葉片表面會瞬間結(jié)冰,形成霧凇冰;當(dāng)葉片在[-5~0 ℃]的環(huán)境中旋轉(zhuǎn),過冷水滴碰撞葉片表面的過程中會隨著葉片的慣性逃逸,少數(shù)水滴經(jīng)過一定時間形成雨凇冰[10]。根據(jù)Makkonen物體表面結(jié)冰模型[22],冰質(zhì)量的增長與空氣中液態(tài)水含量[ρw]呈正比例關(guān)系:
[dMdt=α1α2α3ρwv0Sb] (11)
式中:[dM/dt]——單位時間內(nèi)覆冰質(zhì)量的變化;[α3]——冰增長系數(shù),與液態(tài)水含量、溫度、風(fēng)速等變量有關(guān);[Sb]——過冷水滴碰撞葉片的有效截面積。
正常狀態(tài)和結(jié)冰狀態(tài)(指結(jié)冰初期)風(fēng)力機出力相同的情況下,葉片的升力[FL][23]相等:
[FL=0.5CLρav2l] (12)
式中:[CL]——攻角(相對風(fēng)速與翼型弦長的夾角)[φ]下的升力系數(shù);[l]——葉素的弦長。
根據(jù)式(12),[ρa]與[v2]成反比例關(guān)系。風(fēng)以相同的來流速度和方向掠過葉片,相對于正常狀態(tài),結(jié)冰環(huán)境下的空氣密度更高且相對風(fēng)速更低。因此,在式(9)中傳動裝置的機械功率和機械效率不變的情況下,用[CP]補償[v3]的損失。由式(10)可知,葉尖速比[λ]相同的前提下,可通過改變?nèi)~槳距角來調(diào)節(jié)[CP]。在風(fēng)向改變時,風(fēng)力機的偏航控制系統(tǒng)會根據(jù)風(fēng)向標(biāo)的反饋自動調(diào)整偏航位置[θ],進而調(diào)整輸出功率[24]。結(jié)合上述分析,通過圖3來觀察不同變量對結(jié)冰的影響。
從圖3a和圖3c可看出,結(jié)冰樣本基本分布于風(fēng)速小于2 m/s的風(fēng)況下。圖3b展示出風(fēng)速的三次方與網(wǎng)側(cè)有功功率的正相關(guān)性,且結(jié)冰樣本大多集中分布于功率在[[-]0.5,0.5]的范圍內(nèi)。觀察圖3c可得,葉片槳距角可較明顯地區(qū)分正常樣本和結(jié)冰樣本的分布區(qū)域,且在[-2~2] m/s的風(fēng)速范圍內(nèi)二者可視為具有線性關(guān)系。圖3d和圖3e中從偏航位置和變槳速度可清晰看出兩種狀態(tài)樣本的分布規(guī)律。另外本文構(gòu)建了槳距角余弦值的三次方作為新增變量[8],從圖3f可看出在結(jié)冰樣本分布區(qū)域,兩種狀態(tài)的樣本槳距角余弦值的三次方與網(wǎng)側(cè)有功功率呈正相關(guān)。根據(jù)對環(huán)境溫度與機艙溫度和變槳電機溫度的分析,圖3g中環(huán)境溫度在[-2~0] ℃、變槳電機溫度在[-2.0~-0.5 ℃]范圍內(nèi)結(jié)冰樣本分布較集中,而圖3h中結(jié)冰樣本分布受機艙溫度的影響很小,可作為輔助特征加以判斷。基于此,本文構(gòu)建了新樣本集作為葉片結(jié)冰判別的基底,變量如表1所示。
2.2 葉片結(jié)冰檢測流程
為消除表1樣本間量綱的影響,用Min-Max公式對其歸一化處理:
式中:[x(i)]——歸一化后的樣本值;[x(i)]——原始樣本值;[xmax]和[xmin]——該變量序列中的最大值和最小值。
[x(i)=x(i)-xminxmax-xmin] (13)
用所構(gòu)建的標(biāo)準(zhǔn)化數(shù)據(jù)集作為Tri-SE-CNN模型的輸入,對葉片運行狀態(tài)進行判斷。Tri-SE-CNN模型的結(jié)冰檢測流程如圖4所示,具體步驟如下:
1)將有標(biāo)簽的風(fēng)力機運行數(shù)據(jù)集通過可重復(fù)取樣分為3個獨立子集[Si],用[Si]分別訓(xùn)練3個異質(zhì)個體學(xué)習(xí)器[hi],其中[i=1, 2, 3]。通過5折交叉驗證的方式確定個體分類器的超參數(shù),結(jié)果見表2。
2)初始化SPQ算法迭代點,賦值偽標(biāo)記樣本集[Li=?]。
3)用集成學(xué)習(xí)器在驗證集[S′i]上的分類精確度與召回率曲線的交點作為置信度[c]的初始值。
4)用1.1節(jié)SPQ算法求解個體學(xué)習(xí)器的最優(yōu)權(quán)重。
5)對[hi]作主分類器而言,其余兩個學(xué)習(xí)器分別預(yù)測無標(biāo)簽數(shù)據(jù)集[U]中樣本狀態(tài)的概率值,將兩個結(jié)果用式(1)求加權(quán)平均,根據(jù)置信度[c]判斷樣本的類別歸屬,并用其擴充偽標(biāo)記樣本集[Li]。
6)返回步驟3)用擴充的訓(xùn)練集繼續(xù)訓(xùn)練,并更新[c]和[w](見表2),直到訓(xùn)練集大小不再變化。
7)保存?zhèn)螛?biāo)記數(shù)據(jù)集,并將其填充回原數(shù)據(jù)集,構(gòu)建新的訓(xùn)練樣本集。
8)用更新的訓(xùn)練集對SE-CNN模型進行訓(xùn)練及調(diào)參,并保存最優(yōu)模型。結(jié)果如表3所示。
9)將測試樣本作為輸入,用最優(yōu)的SE-CNN模型對樣本狀態(tài)進行判斷。
2.3 模型評價指標(biāo)
用分類準(zhǔn)確度(accuracy)、[f1]分?jǐn)?shù)、召回率(recall)作為本文模型在結(jié)冰檢測方面性能的評價指標(biāo),分別記作[ia]、[if]、[ir],用混淆矩陣(見表4)中的值來計算。
[ia=tp+tntp+tn+fp+fn] (14)
[if=2tp2tp+fp+fn] (15)
[ir=tptp+fn] (16)
另外精確度[ip=tp(tp+fp)],用于協(xié)同[ir]判斷Tri-training及個體分類器的置信度。
3 算例分析
本文在64位8核Intel Core i5-11300 HCPU @ 3.10 GHz硬件上搭建實驗平臺,采用Pytorch環(huán)境來運行算法。
3.1 數(shù)據(jù)來源及預(yù)處理
實驗數(shù)據(jù)來自工業(yè)大數(shù)據(jù)創(chuàng)新競賽平臺,含某風(fēng)場15號(用于訓(xùn)練)和21號(用于驗證)風(fēng)力機的運行記錄及對應(yīng)的結(jié)冰情況,樣本均經(jīng)過脫敏處理。數(shù)據(jù)每7秒為一個時間戳,兩臺風(fēng)力機的采樣點數(shù)分別為393886和190494,均含有26個特征變量。
訓(xùn)練樣本中正常樣本和結(jié)冰樣本的比例為14.66。為了使樣本保留時間屬性,本文對原始樣本以滑動窗口為8,步長為1的方式采樣,即平均每分鐘選取一個樣本,保留47587個樣本,兩類樣本的比例為13.8,其中含待標(biāo)記樣本2467個。
3.2 樣本數(shù)據(jù)的有效性分析
為明確本文所選特征對結(jié)冰影響的重要程度,用LightGBM對原始樣本進行重要性排序,如圖5所示。從圖5可看出,對結(jié)冰影響較大的前10個變量與本文所篩選的特征基本吻合,剩余變量對結(jié)冰的影響幾乎可以忽略不計,因此將其歸結(jié)為冗余特征。為了檢驗輸入特征是否保留了歷史信息,將其用T分布隨機鄰域嵌入(T-distributed stochastic neighbor embedding, T-SNE)的方法降維可視化,如圖6所示。
在圖6中,將結(jié)冰樣本和正常樣本用兩種不同顏色的點在二維空間中表示。從樣本的整體分布規(guī)律不難看出,兩者呈集中散布態(tài)勢,這說明葉片在正常和結(jié)冰狀態(tài)下的運行工況存在一定程度的耦合關(guān)系。圖6a為原始樣本集的分布情況,正常樣本和結(jié)冰樣本點群相互堆疊,難以明顯區(qū)分。而圖6b中兩類樣本僅有少數(shù)存在重疊現(xiàn)象。由此可看出,提取的數(shù)據(jù)變量保留了原始數(shù)據(jù)的歷史信息,且降低了冗余特征對樣本判別的干擾。
此外,為判斷冗余特征對分類模型是否存在干擾,本文從分類準(zhǔn)確度、[f1]分?jǐn)?shù)和模型訓(xùn)練時間3個指標(biāo)進行比較,取Epochs(遍歷次數(shù))為50,結(jié)果如表5所示。
表5在10維特征和26維特征的分類準(zhǔn)確度上表現(xiàn)出0.19%的差異,在[f1]指標(biāo)上表現(xiàn)基本相同。但在訓(xùn)練時間上,降維后的樣本會提早128 s檢測到葉片的結(jié)冰狀態(tài),這對除冰或停機的及時判斷具有重要意義。由此可見,與葉片結(jié)冰關(guān)聯(lián)性較弱的參數(shù)會對模型的判斷產(chǎn)生些許干擾,且會延長模型的判別時間,即有效特征之外的變量在提升模型性能方面沒有積極作用。
3.3 結(jié)冰檢測結(jié)果分析
將更新后的樣本按照分層隨機抽樣劃分為3部分,其中訓(xùn)練集占70%,測試集占20%,剩余樣本對訓(xùn)練好的SE-CNN模型進行驗證,保留最優(yōu)參數(shù)。SE-CNN分類器在遍歷次數(shù)為500時的訓(xùn)練和測試過程如圖7所示。
從圖7a可看出,模型學(xué)習(xí)過程中的訓(xùn)練集樣本和驗證集樣本的損失變化情況相差不大,損失值基本在[0.0, 0.2]范圍內(nèi)變化,這反映出模型未出現(xiàn)過擬合。模型測試過程中在遍歷50次后準(zhǔn)確度基本穩(wěn)定,其最優(yōu)值在遍歷第317次時取得,為99.96%。另外召回率和[f1]分?jǐn)?shù)雖有一定程度的波動,但總體可控,召回率在遍歷第313次時達(dá)到100%,此時模型可以將所有結(jié)冰樣本的真實狀態(tài)檢測到;[f1]分?jǐn)?shù)在遍歷第317次時取最優(yōu)值99.69%。遍歷次數(shù)在318~500范圍內(nèi),模型對結(jié)冰檢測的準(zhǔn)確度沒有再增加,這表明在第320次左右時,模型已然最優(yōu)。整體來看,Tri-SE-CNN在對結(jié)冰進行檢測時穩(wěn)定性較好。
為驗證本文所提出的模型在其他風(fēng)力機上的結(jié)冰檢測效果,用21號風(fēng)力機歷史樣本對其進行泛化能力測試。以3.1節(jié)中的數(shù)據(jù)采樣方式對驗證樣本進行處理,確保樣本時間屬性不變,最終選取23810個樣本。遍歷次數(shù)為320,記錄模型的分類指標(biāo)變化,結(jié)果如圖8所示。
Tri-SE-CNN對21號風(fēng)力機樣本結(jié)冰識別中,準(zhǔn)確度、召回率、[f1]分?jǐn)?shù)最高分別達(dá)到99.71%、98.53%、99.26%,且隨著迭代次數(shù)的增加,3個指標(biāo)的變化幅度均不大。由此可見,本文所構(gòu)建的模型在不同的風(fēng)力機裝置上表現(xiàn)良好,具有一定的泛化能力。
3.4 不同模型對比實驗
為驗證本文對Tri-training模型的改進在數(shù)據(jù)偽標(biāo)記方面的可行性,用原始同質(zhì)Tri-training模型[16]、固定置信度的異質(zhì)Tri-training模型[17]、加權(quán)決策的同質(zhì)Tri-training模型[18]對樣本進行偽標(biāo)記,分別記作M1、M2、M3。其中M1和M3中的個體分類器為SVM,通過貝葉斯優(yōu)化和5折交叉驗證的方式確定其超參數(shù):錯誤懲罰參數(shù)為2.7696;參數(shù)γ取-0.0488;M3中分類器權(quán)重為0.5。M2異質(zhì)個體分類器及其超參數(shù)同表2,置信度取0.9[17]。將上述模型擴充的訓(xùn)練樣本作為SE-CNN的輸入,其受試者工作特性曲線(receiver operating characteristic curve, ROC)如圖9所示。
另外,為驗證SE-CNN模型在結(jié)冰樣本判別方面的性能,將擴充后的訓(xùn)練樣本用于SVM[12]、CNN[13]和BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)并與本文模型對比。上述模型分別記作M4、M5、M6,各模型的ROC曲線見圖9所示。對于模型在結(jié)冰分類上的表現(xiàn)而言,ROC曲線的拐點越靠近坐標(biāo)平面的左上方,AUC(ROC曲線下方與橫軸區(qū)域的面積)越大,意味著該模型的性能越好。
從圖9可看出,基于最優(yōu)加權(quán)策略的Tri-training模型比其他數(shù)據(jù)偽標(biāo)記模型表現(xiàn)更出色,而異質(zhì)Tri-Training模型比同質(zhì)模型對樣本的誤判度更低。SE-CNN模型與其他分類模型相比,其性能更優(yōu),而SVM表現(xiàn)較遜色。通過表6對上述模型及PCC-TCN[14]、DCISS[15]模型在15號和21號風(fēng)力機上的分類指標(biāo)進行對比。
除上述樣本外,本文選用我國云南某風(fēng)場的結(jié)冰數(shù)據(jù)來驗證Tri-SE-CNN模型在工程實際中的適應(yīng)性。該樣本集包含18990個時間戳,其間隔為30 s,正常與結(jié)冰樣本比例為1.39∶1,包含1000個無標(biāo)簽樣本。在篩選出表1中變量的基礎(chǔ)上,用式(13)對其進行歸一化處理,構(gòu)建新的樣本集作為Tri-SE-CNN的學(xué)習(xí)基底,樣本判別結(jié)果如表6所示。
在SE-CNN模型參數(shù)不變的情況下,可看出最優(yōu)加權(quán)策略的Tri-training分類器比置信度取0.9時數(shù)據(jù)偽標(biāo)記效果更好,準(zhǔn)確度提升了0.53個百分點;相對于多數(shù)投票原則的Tri-training模型提升了1.82個百分點;比權(quán)重取0.5時的同質(zhì)Tri-training模型提升了1.39個百分點。這表明在置信度和權(quán)重的自適應(yīng)策略下Tri-training模型能放大各個體分類器的優(yōu)勢,進而提高其學(xué)習(xí)能力。
在Tri-training模型參數(shù)不變的情況下,CNN分類器在結(jié)冰檢測方面比SE-CNN表現(xiàn)遜色,準(zhǔn)確度相差3.76個百分點,傳統(tǒng)的機器學(xué)習(xí)分類器SVM和BP神經(jīng)網(wǎng)絡(luò)分別落后于Tri-SE-CNN模型5.43和5.33個百分點。由此可見,將SE模塊嵌入CNN網(wǎng)絡(luò),可有效改善其分類性能。
從整體來看,與現(xiàn)有模型相比,Tri-SE-CNN模型在不同數(shù)據(jù)集上表現(xiàn)最優(yōu),其在15號風(fēng)力機上[ia]、[if]、[ir]分別比PCC-TCN提升6.06、8.73、10.12個百分點;比DCISS模型提升2.16、7.21、10.16個百分點。另外,從Tri-SE-CNN模型在云南某風(fēng)場工程實際數(shù)據(jù)的表現(xiàn)來看,其在多個指標(biāo)上表現(xiàn)最好,分類準(zhǔn)確度達(dá)到98.42%。這反映出本文所提模型能有效降低無標(biāo)簽數(shù)據(jù)的誤判,并充分利用這部分?jǐn)?shù)據(jù)輔助模型提高對正常和結(jié)冰兩類樣本的狀態(tài)識別能力,在工程實際中具有較好的適用性。
4 結(jié) 論
本文提出一種基于Tri-SE-CNN的風(fēng)電機組葉片結(jié)冰檢測模型。從葉片結(jié)冰機理的角度篩選并重構(gòu)新的特征變量,用最優(yōu)加權(quán)策略的Tri-training模型對其中的無標(biāo)簽樣本進行標(biāo)記,進而實現(xiàn)了SE-CNN對未標(biāo)記樣本的有效利用。經(jīng)過對比實驗分析,可得出以下主要結(jié)論:
1)通過T-SNE對壓縮樣本的可視化,發(fā)現(xiàn)所提取數(shù)據(jù)能夠有效保留原始數(shù)據(jù)的歷史信息,結(jié)合對樣本壓縮前后模型性能對比,證明用主控變量可縮短結(jié)冰狀態(tài)識別時間,對風(fēng)力機結(jié)冰及時預(yù)警有一定參考意義。
2)與傳統(tǒng)Tri-training模型相比,最優(yōu)加權(quán)策略的Tri-training模型實現(xiàn)了置信度和權(quán)重的自適應(yīng),可有效降低對無標(biāo)簽樣本的誤判。
3)與CNN、SVM等方法相比,SE模塊嵌入CNN網(wǎng)絡(luò)能夠融合與葉片結(jié)冰強關(guān)聯(lián)的通道特征,對貢獻較小的通道具有一定的抑制作用,可改善模型對風(fēng)力機運行狀態(tài)的識別精度。根據(jù)不同數(shù)據(jù)集對Tri-SE-CNN模型性能的驗證,模型分類準(zhǔn)確度表現(xiàn)均為最優(yōu),證明了本文模型在葉片結(jié)冰檢測方面較好的適應(yīng)性,可為寒冷氣候下風(fēng)力機運維監(jiān)測提供有益參考。
[參考文獻]
[1] ALI Q S, KIM M H. Design and performance analysis of an airborne wind turbine for high-altitude energy harvesting[J]. Energy, 2021, 230: 120829.
[2] 何玉林, 李俊, 董明洪, 等. 冰載對風(fēng)力機性能影響的研究[J]. 太陽能學(xué)報, 2012, 33(9): 1490-1496.
HE Y L, LI J, DONG M H, et al. Research on the effect of wind turbine performance under icing conditions[J]. Acta energiae solaris sinica, 2012, 33(9): 1490-1496.
[3] 朱津成, 丁云飛. 基于機器學(xué)習(xí)的風(fēng)機葉片結(jié)冰預(yù)測方法綜述[J]. 中國工程機械學(xué)報, 2022, 20(2): 129-133.
ZHU J C, DING Y F. A review of wind turbine blade icing prediction methods based on machine learning[J]. Chinese journal of construction machinery, 2022, 20(2): 129-133.
[4] SHU L C, LI H T, HU Q, et al. Study of ice accretion feature and power characteristics of wind turbines at natural icing environment[J]. Cold regions science and technology, 2018, 147: 45-54.
[5] 譚海輝, 李錄平, 靳攀科, 等. 風(fēng)力機葉片超聲波除冰理論與方法[J]. 中國電機工程學(xué)報, 2010, 30(35): 112-117.
TAN H H, LI L P, JIN P K, et al. Ultrasonic de-icing theory and method for wind turbine blades[J]. Proceedings of the CSEE, 2010, 30(35): 112-117.
[6] GóMEZ MU?OZ C Q, GARCíA MáRQUEZ F P, SáNCHEZ TOMáS J M, et al. Ice detection using thermal infrared " "radiometry " "on " "wind " "turbine " "blades[J]. Measurement, 2016, 93: 157-163.
[7] 劉慶超, 郭鵬, 張偉, 等. 多參數(shù)模型風(fēng)電機組葉片結(jié)冰監(jiān)測與預(yù)警研究[J]. 太陽能學(xué)報, 2022, 43(2): 402-407.
LIU Q C, GUO P, ZHANG W, et al. Study on muti-parameter model of wind turbine blade icing detection and warning[J]. Acta energiae solaris sinica, 2022, 43(2): 402-407.
[8] TAO T, LIU Y Q, QIAO Y H, et al. Wind turbine blade icing diagnosis using hybrid features and Stacked-XGBoost algorithm[J]. Renewable energy, 2021, 180: 1004-1013.
[9] DONG X H, GAO D, LI J, et al. Blades icing identification model of wind turbines based on SCADA data[J]. Renewable energy, 2020, 162: 575-586.
[10] CAO H Q, BAI X, MA X D, et al. Numerical simulation of icing on NREL 5-MW reference offshore wind turbine blades under different icing conditions[J]. China ocean engineering, 2022, 36(5): 767-780.
[11] 劉杰, 楊娜, 譚玉濤, 等. 基于WD-LSTM的風(fēng)電機組葉片結(jié)冰狀態(tài)評測[J]. 太陽能學(xué)報, 2022, 43(8): 399-408.
LIU J, YANG N, TAN Y T, et al. Assessment of icing state of wind turbine blades based on WD-LSTM[J]. Acta energiae solaris sinica, 2022, 43(8): 399-408.
[12] 海濤, 范恒, 王楷杰, 等. 基于PSO-SVM算法的風(fēng)電機組結(jié)冰故障診斷[J]. 智慧電力, 2021, 49(4): 1-6, 74.
HAI T, FAN H, WANG K J, et al. Icing fault diagnosis of wind turbines based on PSO-SVM algorithm[J]. Smart power, 2021, 49(4): 1-6, 74.
[13] YANG X Y, HUANG X X, GAO X X, et al. Icing diagnosis model for wind turbine blade based on feature optimization "and "1D-convolutional "neural "network[J]. Journal of renewable and sustainable energy, 2022, 14(3): DOI:10.1063/5.0078364.
[14] DING S Y, WANG Z J, ZHANG J E, et al. A PCC-Ensemble-TCN model for wind turbine icing detection using class-imbalanced and label-missing SCADA data[J]. International journal of distributed sensor networks, 2021, 17(11): DOI: 10.1177/15501477211057737.
[15] CHENG X, SHI F, LIU X F, et al. A novel deep class-imbalanced semisupervised model for wind turbine blade icing detection[J]. IEEE transactions on neural networks and learning systems, 2022, 33(6): 2558-2570.
[16] ZHOU Z H, LI M. Tri-training: exploiting unlabeled data using three classifiers[J]. IEEE transactions on knowledge and data engineering, 2005, 17(11): 1529-1541.
[17] TSEN C M, HUANG T W, LIU T J. Data labeling with novel "decision "module "of "tri-training[C]//2020 "2nd International Conference on Computer Communication and the Internet. Nagoya, Japan, 2020.
[18] XU H L, LI L Y, GUO P S. Semi-supervised active learning algorithm for SVMs based on QBC and tri-training[J]. Journal of ambient intelligence and humanized computing, 2021, 12(9): 8809-8822.
[19] 唐承, 郭書祥, 莫延彧, 等. 應(yīng)用粒子群-序列二次規(guī)劃算法的結(jié)構(gòu)可靠性優(yōu)化[J]. 空軍工程大學(xué)學(xué)報(自然科學(xué)版), 2016, 17(2): 107-111.
TANG C, GUO S X, MO Y Y, et al. An optimal design of structural reliability based on particle swarm optimization-sequential quadratic programming algorithm[J]. Journal of Air Force Engineering University(natural science edition), 2016, 17(2): 107-111.
[20] 夏睿, 高云鵬, 朱彥卿, 等. 基于SE-CNN模型的竊電檢測方法研究[J]. 電力系統(tǒng)保護與控制, 2022, 50(20): 117-126.
XIA R, GAO Y P, ZHU Y Q, et al. A detection method of electricity theft behavior based on an SE-CNN model[J]. Power system protection and control, 2022, 50(20): 117-126.
[21] 石重托, 姚偉, 黃彥浩, 等. 基于SE-CNN和仿真數(shù)據(jù)的電力系統(tǒng)主導(dǎo)失穩(wěn)模式智能識別[J]. 中國電機工程學(xué)報, 2022, 42(21): 7719-7731.
SHI Z T, YAO W, HUANG Y H, et al. Power system dominant instability mode identification based on convolutional neural networks with squeeze and excitation block and simulation data[J]. Proceedings of the CSEE, 2022, 42(21): 7719-7731.
[22] JIN X H, ZHANG X Y, CHENG X, et al. A physics-based and data-driven feature extraction model for blades icing detection of wind turbines[J]. IEEE sensors journal, 2023, 23(4): 3944-3954.
[23] 白旭, 杜越, 曹慧清, 等. 明冰對寒區(qū)海上風(fēng)力機葉片氣動性能影響的分析[J]. 中國造船, 2023, 64(1): 34-46.
BAI X, DU Y, CAO H Q, et al. Study on aerodynamic performance of offshore wind turbine blades under glaze ice condition in cold region[J]. Shipbuilding of China, 2023, 64(1): 34-46.
[24] 周玲, 任永. 大偏航角下基于IPC的風(fēng)力機變速率停機控制研究[J]. 太陽能學(xué)報, 2023, 44(3): 178-184.
ZHOU L, REN Y. Research on IPC-based variable-speed shutdown control of wind turbines under large yaw angles[J]. Acta energiae solaris sinica, 2023, 44(3): 178-184.
RESEARCH ON ICING DETECTION OF WIND TURBINE
BLADES BASED ON Tri-SE-CNN
Sun Jian1,2,Yang Yubing1
(1. School of Electrical and New Energy, China Three Gorges University, Yichang 443002, China;
2. Hubei Provincial Collaborative Innovation Center for New Energy Microgrid, China Three Gorges University, Yichang 443002, China)
Abstract:Aiming to address the issue of existing icing detection methods for wind turbine blades, which fail to fully utilize unlabeled data and have poor classification performance, we propose an approach called Tri-SE-CNN based on improved Tri-training and convolutional neural networks. Firstly, establish a Tri-training model based on an optimal weighted strategy to distinguish the state of unlabeled samples and expand the training set. The expanded sample set is learned by the SE-CNN model that embeds the Squeeze-and-Excite (SE) module into Convolutional Neural Networks (CNN). Combined with the strong correlation characteristics of blade icing, this paper utilizes the data from wind turbines No.15 and No.21, which were provided by the Industrial Big Data Innovation Competition Platform in China in 2017, for simulation. Additionally, data from a wind farm in Yunnan, China, are used for verification. The experimental results show that the proposed method achieves higher accuracy than CNN, support vector machine and other methods. Specifically, it achieves an accuracy of 99.96% on the No.15 wind turbine, which can provide valuable references for early warning systems regarding wind turbine blade icing.
Keywords:wind turbine blades; unlabeled data; convolutional neural networks; Tri-training; squeeze and excitation networks; icing detection