王 偉,王海云,黃曉芳
(1.新疆大學電氣工程學院,新疆 烏魯木齊 830046;2.新疆金風科技股份有限公司,新疆 烏魯木齊 830026)
為實現(xiàn)我們國家制定的雙碳目標,近年來風力發(fā)電產(chǎn)業(yè)蓬勃發(fā)展,電網(wǎng)中的認可度也越來越高,這一切都離不開風電技術的更新迭代[1-3]。風電技術的進步也在不斷提升風電機組運行的安全性和經(jīng)濟性[4-6]。風電機組所處的運行環(huán)境十分復雜多變,而且過去的十幾年間風機輪轂的高度越來越高,葉片也越來越大,風電機組的各個關鍵部位(例如葉根和偏航)更容易受到載荷的影響,這就給風電機組的結構安全以及風場的運維帶來了不小的壓力[7-8]。為此需要采用優(yōu)秀的預測手段對風電機組的載荷進行監(jiān)測和預測,以保障風電機組安全經(jīng)濟的運行。
近年來,隨著大數(shù)據(jù)技術和人工智能技術的發(fā)展,機器學習方法能夠從數(shù)據(jù)中“學習”總結出規(guī)律,有很強的處理非線性問題的能力[9]。因此,機器學習算法也被用于風電機組的載荷分析和預測中。付德義等[10]基于GH Bladed的仿真數(shù)據(jù),將BP神經(jīng)網(wǎng)絡應用于風電機組的載荷適應性評估,完成了在不同風況條件下對風電機組葉根和輪轂等關鍵部位的極限載荷以及等效疲勞載荷的預測。周士棟等[11]則是基于風機運行的SCADA數(shù)據(jù)搭建了BP神經(jīng)網(wǎng)絡模型,實現(xiàn)了對風機關鍵部位載荷的預測。許揚等[12]結合多因素權重法和BP神經(jīng)網(wǎng)絡有效預測并分析了各種環(huán)境參數(shù)對風機關鍵部位平均載荷和極限載荷的影響。章培成等[13]采用多元線性回歸的算法搭建了風機載荷預測模型,該模型在對風場多機位點評估時有著較高的準確性。上述文獻都對風電機組的疲勞載荷、平均載荷以及極限載荷進行了預測方法的研究,但是未涉及風電機組實時載荷的預測,而為了提升風機運行的效率,掌握風機的實時運行狀態(tài)是最有效的途徑[14-15]。盧曉光等[16]利用數(shù)字孿生技術創(chuàng)新性地對風電機組的載荷進行了實時預測,雖然總體預測效果良好,但是由于一次性預測的數(shù)據(jù)點過多即預測的是超長序列,難免會出現(xiàn)局部數(shù)據(jù)段的實際值和預測值的誤差較大的問題。因此,本文采用序列預測工具對風電機組載荷較長序列的預測。Informer模型由北京航空航天大學于2021年提出,專門設計用于長序列的預測。目前已經(jīng)有學者將Informer模型應用于不同領域的工程研究中,例如董浩等[17]將Informer模型應用于PM2.5濃度的預測;劉洪笑等[18]和賀春光等[19]使用Informer模型對用電量進行了預測;張友等[20]則在數(shù)據(jù)不完備的情況下使用Informer模型完成了對離心鼓風機故障趨勢的預測。
基于上述研究現(xiàn)狀,本文創(chuàng)新性地將Informer模型應用于風電機組葉根載荷的實時預測,并對預測結果進行科學評估,驗證該方法的可行性。同時,由于LSTM和GRU是目前處理序列數(shù)據(jù)常見且效果不錯的的深度學習算法,本文采用兩者進行對比實驗,以此驗證Informer模型在載荷實時預測中的更優(yōu)的預測性能。
葉素-動量理論(Blade element momentum,BEM)是當前風力機載荷計算最主要的方法[21],包含葉素理論和動量理論2個部分。
葉素理論是指將葉輪的葉片沿展向切割成n個沒有空氣動力相互作用的微段,稱這些微段為葉素,把作用在每個葉素上的力和力矩積分,便可得到葉輪上的力和力矩。與葉根距離為r、厚度為dr的葉素上受到的軸向推力dT和dM分別由如下公式計算得到
(1)
(2)
式中,Nb為葉輪的葉片數(shù);ρ為空氣密度;c為葉素弦長;v0為相對來流的風速;CL和CD分別為升、阻力系數(shù);φ為入流角。
動量理論是指基于動量守恒定律,獲得作用于葉輪上的力、力矩和動量、角動量之間的關系。同樣,與葉根距離為r、厚度為dr的葉素上受到的軸向推力dT和dM分別由如下公式計算得到
(3)
dM=4πρΩv1b(1-a)r3dr
(4)
式中,v1為無窮遠處來流風速;a和b分別是軸向和切向誘導因子;Ω為風輪轉速。
結合葉素理論和動量理論便可以求得作用在風機葉輪上的力、力矩和功率。
灰色關聯(lián)度分析法的基本思想是若影響因素與目標變量的變化趨勢一致,該影響因素與目標變量關聯(lián)度較高;反之,則關聯(lián)度較低。將灰色關聯(lián)度分析法與深度學習模型相結合,通過該分析方法篩選出與目標變量強相關的影響因素作為模型的輸入,從而避免模型因無效輸入太多導致其訓練效率過低的問題?;疑P聯(lián)度分析法的計算公式如下
(5)
(6)
式中,ξi(k)為第i個影響因素的第k條數(shù)據(jù)與目標變量第k條數(shù)據(jù)的關聯(lián)系數(shù);Δi(k)為第i個影響因素與目標變量的差序列;Δ(max)和Δ(min)分別為兩級最大差和兩級最小差;ρ為分辨系數(shù),范圍為(0,1),本文取0.5;ri為第i個影響因素與目標變量的關聯(lián)度;N為變量的數(shù)據(jù)個數(shù)。
Informer模型是基于注意力機制的深度學習模型,能夠更為準確地捕捉到長序列中輸入和輸出依賴關系,因此Informer模型的出現(xiàn)為解決長序列問題提供了新的方法。Informer模型主要由編碼器(Encoder)和解碼器(Decoder)2部分組成,具體結構如圖1所示。
圖1 Informer模型結構示意
注意力機制的計算主要由查詢向量矩陣Query(Q∈RLQ×d)、鍵向量矩陣Key(K∈RLK×d)和值向量矩陣Value(V∈RLV×d)3個向量組成,其中LQ為查詢向量矩陣序列維度;LK為鍵向量矩陣序列維度;LV是值向量矩陣序列維度;d為輸入維度。第i個Query的注意力系數(shù)的概率形式A表為
(7)
第i個Query的稀疏性得分M為
(8)
最終得到稀疏自注意力公式為
(9)
Encoder主要用于捕獲長序列的遠期依賴關系,將輸入送至多頭稀疏自注意力模塊,并且中間會通過蒸餾層進行蒸餾操作以減少網(wǎng)絡參數(shù),突出特征,蒸餾原理可表示為
Xj+1=MaxPool{σ[Conv1d([Xj]AB)]}
(10)
式中,MaxPool為最大池化操作;σ為激活函數(shù);Conv1d表示的是序列上的一維卷積操作。
Decoder的作用是進行前向計算并預測長序列輸出。此外,由于Informer使用的是生成式結構,能夠一次性生成全部的預測序列,極大地提高了預測解碼的效率。Decoder的輸入格式為
Xfeed_de=Concat(Xtoken,X0)∈R(Ltoken+Ly)×d
(11)
式中,Xtoken為開始字符;X0為占位字符;Concat則表示將Xtoken和X0連接合并。
同時,對于序列預測問題,數(shù)據(jù)間的順序非常重要,為了使數(shù)據(jù)輸入模型之后的順序結構不發(fā)生改變,需要對每個輸入數(shù)據(jù)的位置信息進行位置嵌入,嵌入原理由下式表示
(12)
(13)
式中,pos為序列次序;j∈(1,d/2),表示維度。
本文以某4.5 MW的服役直驅風電機組為實驗對象,該風電機組的額定風速為10.8 m/s;葉輪直徑為155 m。通過基于BEM的風機載荷計算軟件OpenFAST對該機組進行仿真得到葉根的載荷數(shù)據(jù)。
使用灰色關聯(lián)度分析法篩選出與葉根載荷變化有較強相關性的影響因素,以此作為模型預測的輸入。篩選出的影響因素及其相應的關聯(lián)度由表1給出。
表1 影響因素與葉根載荷關聯(lián)度
由表1可知,這些影響因素與葉根載荷的關聯(lián)度都高于0.5,說明對葉根載荷的影響較大,因此將表中10個影響因素作為輸入到Informer預測模型中的決策變量。
首先是標準化處理,因為不同的變量在量綱上有較大的差異,導致有些變量的方差很大,從而影響到模型的收斂和預測精度,所以需要對原始數(shù)據(jù)進行標準化處理,消除量綱差異。標準化的計算公式為
(14)
然后將標準化處理過的數(shù)據(jù)按照7∶1∶2的比例劃分為訓練集(21 000組)、驗證集(3 000組)和測試集(6 000組),供預測模型使用。
本文使用深度學習框架Pytorch搭建Informer模型,模型的編碼器輸入、輸出長度和預測長度分別為800、400和300;Batch-size為32;迭代次數(shù)為6;注意力頭數(shù)為8;優(yōu)化器為Adam;激活函數(shù)為gelu;Dropout為0.05;學習率選為0.000 1。
基于訓練集和驗證集的數(shù)據(jù),訓練得出使用過去800個數(shù)據(jù)點預測未來300個數(shù)據(jù)點的最佳葉根載荷預測模型后,用于測試集的測試,并對輸出結果采取逆標準化操作,最后得到葉根三個載荷分量的預測值。
參照國內(nèi)外研究中常用的預測精度的衡量方法,本文選用可決系數(shù)R2、平均相對誤差MAPE、均方根誤差RSME以及平均絕對誤差MAE作為模型的評估指標。各指標的計算公式為
(15)
(16)
(17)
(18)
式中,yi,pre為第i條數(shù)據(jù)的模型預測值;yi,real為第i條數(shù)據(jù)的實際值;ymean為實際數(shù)據(jù)的均值。這些誤差的數(shù)值越小,模型的準確度越高;R2的范圍是0~1,R2的值越大,模型預測的預測效果越好。
通過Informer模型對風電機組葉根Mx彎矩、葉根My彎矩和Mz彎矩未來300個數(shù)據(jù)點的預測,得到圖2的預測值與實際值的對比曲線。由圖2可知,Informer模型的預測值和實際值之間有較好的一致性,說明其對于葉根的實時載荷有較好的預測精度,也證明了將此長序列預測工具應用于風電機組實時載荷預測的可行性。
圖2 Informer預測結果
表2給出了Informer模型和LSTM以及GRU預測結果的對比數(shù)據(jù)。由表中數(shù)據(jù)可知,Informer模型的四項評價指標相較LSTM模型和GRU模型均有提升;其中Informer模型預測結果與實際值的擬合程度均在0.9以上,說明模型有較好的預測效果,也驗證了Informer模型在載荷實時預測更優(yōu)的性能。
表2 葉根載荷預測結果評估指標
本文創(chuàng)新性地將長序列預測工具Informer模型應用于風電機組葉根實時載荷的預測,基于OpenFAST的仿真數(shù)據(jù),通過灰色關聯(lián)度分析法篩選出對風機葉根載荷影響較大的因素作為模型的輸入,給出了模型預測值和實際值的對比結果,并通過對結果的分析證明了該方法的可行性;通過與LSTM和GRU兩種常規(guī)模型預測結果的對比,驗證了Informer模型在載荷實時預測中更優(yōu)的性能。