摘 要:復(fù)雜山地風(fēng)電場(chǎng)普遍存在觀測(cè)風(fēng)速數(shù)據(jù)質(zhì)量差引起風(fēng)資源評(píng)估誤差大、風(fēng)功率預(yù)測(cè)精度低的問題。而復(fù)雜山地風(fēng)速呈現(xiàn)較強(qiáng)的間隙性、波動(dòng)性和非平穩(wěn)性,導(dǎo)致常規(guī)質(zhì)量控制方法無法有效提高數(shù)據(jù)質(zhì)量。針對(duì)此,提出一種基于粒子群改進(jìn)變分模態(tài)分解和長(zhǎng)短期記憶網(wǎng)絡(luò)的集成學(xué)習(xí)算法(PVL),并應(yīng)用于復(fù)雜山地觀測(cè)風(fēng)速的質(zhì)量控制以提高風(fēng)速數(shù)據(jù)的質(zhì)量。以廣西某復(fù)雜山地風(fēng)場(chǎng)內(nèi)5基觀測(cè)塔2015—2016年逐10 min風(fēng)速數(shù)據(jù)為案例進(jìn)行PVL應(yīng)用效果檢驗(yàn),并與傳統(tǒng)單站及空間回歸法、反距離加權(quán)法進(jìn)行對(duì)比。應(yīng)用表明,PVL比傳統(tǒng)方法具有更高的尋誤率,且在異地形、多風(fēng)況上具有更強(qiáng)的適應(yīng)性。
關(guān)鍵詞:風(fēng)電場(chǎng);質(zhì)量控制;粒子群;變分模態(tài)分解;長(zhǎng)短期記憶網(wǎng)絡(luò)
中圖分類號(hào):TK89" " " " " " " " " "文獻(xiàn)標(biāo)志碼:A
0 引 言
在全球氣候變暖的大背景和“雙碳”目標(biāo)引導(dǎo)下,全球能源結(jié)構(gòu)低碳化轉(zhuǎn)型在加速推進(jìn),風(fēng)電等可再生能源發(fā)展步伐加快。隨著風(fēng)力發(fā)電的大規(guī)模開發(fā)建設(shè)和并網(wǎng),在“競(jìng)價(jià)/平價(jià)”、電力市場(chǎng)化交易等機(jī)制下,風(fēng)能的“間隙性”問題得到凸顯[1]。一方面,精準(zhǔn)的風(fēng)資源和發(fā)電量評(píng)估是風(fēng)場(chǎng)投資開發(fā)階段的迫切需要;另一方面,減少大規(guī)模風(fēng)電并網(wǎng)爬坡事件、增強(qiáng)新型電力市場(chǎng)交易競(jìng)爭(zhēng)力對(duì)在役風(fēng)場(chǎng)風(fēng)功率預(yù)測(cè)準(zhǔn)確率的提升提出更高的要求。風(fēng)速,作為影響風(fēng)能特征分布最主要、直接的因素,具有明顯的間隙性、波動(dòng)性和非平穩(wěn)性[2],這是風(fēng)能呈現(xiàn)“間隙性”的內(nèi)因,尤其是復(fù)雜地形情況下。復(fù)雜地形情況下風(fēng)電場(chǎng)的觀測(cè)風(fēng)數(shù)據(jù)是精細(xì)化評(píng)估的最主要參考依據(jù),其質(zhì)量直接關(guān)系到投資收益率及并網(wǎng)沖擊[3]。根據(jù)GB/T 18710—2002《風(fēng)電場(chǎng)風(fēng)能資源評(píng)估方法》(以下簡(jiǎn)稱《標(biāo)準(zhǔn)》)規(guī)定,用于風(fēng)場(chǎng)產(chǎn)能評(píng)估的風(fēng)速至少需一個(gè)完整年觀測(cè)周期,且數(shù)據(jù)有效完整率需達(dá)到90%以上[4]。如何提高復(fù)雜地形情況下風(fēng)速觀測(cè)資料的質(zhì)量,是“雙碳”目標(biāo)進(jìn)程中必須面對(duì)的挑戰(zhàn),其核心問題是質(zhì)量控制算法的構(gòu)建。
風(fēng)電場(chǎng)觀測(cè)風(fēng)速作為一種小尺度觀測(cè),本質(zhì)上是一種氣象觀測(cè)資料。中國地面氣象觀測(cè)資料質(zhì)量控制方法根據(jù)參考資料的差異分為單站和多站級(jí)質(zhì)量控制技術(shù)路線。多站質(zhì)量控制,即融合周邊觀測(cè)數(shù)據(jù)構(gòu)建相關(guān)模型進(jìn)行控制。近年來國內(nèi)外一些學(xué)者提出一些有效的方法??臻g回歸檢查法(spatial regression test,SRT)[5]、最佳內(nèi)插法[6]、反距離加權(quán)法(inverse distance weight IDW)[7]通過觀測(cè)值與理論值之間的差值來標(biāo)記可疑數(shù)據(jù);貝葉斯質(zhì)量控制法[8]引入貝葉斯理論,從觀測(cè)資料概率統(tǒng)計(jì)的角度進(jìn)行質(zhì)量控制。熊雄等[9]基于空間觀測(cè)資料差異,構(gòu)建空間差異方程來進(jìn)行質(zhì)量控制;葉小嶺等[10]以主成分分析優(yōu)化選擇參考站并通過隨機(jī)森林學(xué)習(xí)完成地面氣溫的質(zhì)量控制;葉星瑜等[11]引入時(shí)間卷積網(wǎng)絡(luò)來對(duì)鐵路沿線大風(fēng)樣本進(jìn)行質(zhì)量控制。然而,這些方法都嚴(yán)重依賴周邊觀測(cè)資料。復(fù)雜山地風(fēng)電場(chǎng)風(fēng)速觀測(cè)一般為小區(qū)域、短周期、單要素,其觀測(cè)時(shí)長(zhǎng)和觀測(cè)密度均較低,且受微地形及小氣候影響嚴(yán)重;各觀測(cè)塔數(shù)據(jù)存在儀器損壞、數(shù)據(jù)傳輸故障、結(jié)冰、倒塔等現(xiàn)象,產(chǎn)生大量的隨機(jī)誤差、系統(tǒng)誤差、微氣象誤差和粗大誤差,數(shù)據(jù)質(zhì)量差,且各觀測(cè)塔之間數(shù)據(jù)相關(guān)性差[12]。在這些觀測(cè)密度低、相關(guān)性差的山地風(fēng)電場(chǎng),想獲得高質(zhì)量的風(fēng)速觀測(cè)資料,探索和研究有效的單站級(jí)質(zhì)量控制方法顯得尤為重要[13]。
傳統(tǒng)單站質(zhì)量控制法包括格式檢驗(yàn)、范圍檢驗(yàn)、極值檢驗(yàn)和內(nèi)部一致性檢驗(yàn)的綜合法[14],是目標(biāo)資料無有效周邊參考信息時(shí)的有效性和準(zhǔn)確性的基本保障。《標(biāo)準(zhǔn)》內(nèi)對(duì)風(fēng)電場(chǎng)觀測(cè)風(fēng)速的質(zhì)量控制方法本質(zhì)上屬于傳統(tǒng)級(jí)單站控制范疇,其能有效地標(biāo)記出常規(guī)觀測(cè)資料中的疑誤數(shù)據(jù),如物理極限值、冰凍“僵值”等,但其對(duì)特定條件下的異常值缺乏有效的檢出,尤其在風(fēng)況復(fù)雜多變的山地觀測(cè)風(fēng)場(chǎng)。為進(jìn)一步提升復(fù)雜風(fēng)況下的質(zhì)量控制效果,本文從風(fēng)速時(shí)間序列非平穩(wěn)性及復(fù)雜度著手,提出一種PSO優(yōu)化VMD和LSTM的集成算法,構(gòu)造一種檢錯(cuò)率高、適用于復(fù)雜山地風(fēng)電場(chǎng)的觀測(cè)風(fēng)速的質(zhì)量控制算法(PVL_QC)。
1 方 法
1.1 VMD和LSTM集成算法及優(yōu)化
變分模態(tài)分解[15](variational modal decomposition,VMD)是一種尺度可變化的信號(hào)處理方法,對(duì)信號(hào)噪聲具有較好的魯棒性。相較于經(jīng)驗(yàn)?zāi)B(tài)分解方法,VMD避免了端點(diǎn)效應(yīng)和模態(tài)混疊問題,可降低復(fù)雜度高、非線性強(qiáng)的時(shí)間序列的復(fù)雜度[16-17]。
長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(long short-term memory,LSTM)[18]是一種時(shí)間遞歸神經(jīng)網(wǎng)絡(luò),可對(duì)時(shí)間狀態(tài)實(shí)現(xiàn)自動(dòng)保存與更新,是循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的變體,有效避免RNN的梯度消失或爆炸現(xiàn)象,多應(yīng)用在時(shí)間序列預(yù)測(cè)、分類、文本挖掘等領(lǐng)域[19-21],且呈現(xiàn)較好的效果。
考慮VMD和LSTM可降低時(shí)間序列的非平穩(wěn)性和復(fù)雜度,以及挖掘重構(gòu)的能力,本文集成VMD和LSTM。即,首先通過VMD方法及其參數(shù)的粒子群(particle swarm optimization,PSO)尋優(yōu)將時(shí)序風(fēng)速信號(hào)分解成一系列異構(gòu)模態(tài)分量,降低原風(fēng)速序列的非平穩(wěn)性和復(fù)雜性度;然后,對(duì)各個(gè)模態(tài)分量均建立LSTM學(xué)習(xí)網(wǎng)絡(luò)預(yù)測(cè)模型;最終將各子模態(tài)預(yù)測(cè)結(jié)果重構(gòu)為時(shí)間序列預(yù)測(cè)值并引入到質(zhì)量控制領(lǐng)域。
VMD的核心參數(shù)主要有原始信號(hào)分解的模態(tài)參數(shù)[K]、懲罰因子[α]。其中,模態(tài)參數(shù)取值過大,即過度分解,會(huì)造成原始信號(hào)的丟失;模態(tài)參數(shù)取值過小,欠分解,各分解模態(tài)相互影響,達(dá)不到降低信號(hào)的復(fù)雜性;懲罰因子取值關(guān)系強(qiáng)干擾信號(hào)下模態(tài)分解的正確性。一般情況下,[K]和[α]多根據(jù)實(shí)際情況進(jìn)行選擇,主觀性和不確定性較大。
考慮PSO算法[22]在復(fù)雜系統(tǒng)參數(shù)尋優(yōu)上表現(xiàn)出穩(wěn)健的全局收斂能力。因此,本文通過PSO最優(yōu)化[K]和[α]。優(yōu)化算法的主要思想是:將VMD的兩個(gè)參數(shù)[K]和[α]看成PSO的兩個(gè)粒子,將包絡(luò)熵[Ep]作為粒子的適應(yīng)度值[23],如式(1)所示。改進(jìn)算法流程圖如圖1所示。
[Ep=-iNpilgpipi=aiiNai] (1)
式中:[ai]——原始信號(hào)[f]經(jīng)希爾伯特變換解調(diào)后的包絡(luò)信號(hào);[pi]——[ai]的歸一化表達(dá)。
1.2 PVL質(zhì)量控制法
PVL_QC具體步驟如下:
1)記當(dāng)前[t]時(shí)刻,取其前[n]長(zhǎng)度的歷史風(fēng)速序列數(shù)據(jù)(本文取10 d,即[n=1440])[v(t-1),v(t-2),…,vt-(n-1)]。通過PSO最優(yōu)化[K]和[α]進(jìn)行VMD,得到[K]個(gè)子模態(tài)序列,對(duì)各子模態(tài)進(jìn)行重構(gòu)樣本向量,時(shí)間延遲取1,可得到[N]([N=n-1])個(gè)LSTM樣本。其中,[N-1]個(gè)作為訓(xùn)練樣本集和測(cè)試樣本集,即[Vktj,vktj+1, j=1,2,…,N-1];1個(gè)為待估樣本輸入矢量[Vt(j=N)],輸出即為[t]時(shí)刻子模態(tài)風(fēng)速。
2)根據(jù)[N-1]個(gè)訓(xùn)練、測(cè)試樣本集,運(yùn)用LSTM算法進(jìn)行訓(xùn)練,得到各子模態(tài)時(shí)間序列模型,即[vkjt=lstmkVktj, vktj+1(j=1,2,…,N-1)],則各子模態(tài)在[t]時(shí)刻的預(yù)測(cè)值記為[vkjt],[vkjt=lstmkVktj,vktj+1(j=N)]。
3)對(duì)各子模態(tài)預(yù)測(cè)進(jìn)行重構(gòu),可得[t]時(shí)刻風(fēng)速預(yù)測(cè)值[vt=k=1Kvkjt]。
4)將當(dāng)前[t]時(shí)刻的風(fēng)速觀測(cè)值[vt]與步驟2)中的無偏估計(jì)進(jìn)行對(duì)比,具體參照1.3節(jié)假設(shè)檢驗(yàn)方案進(jìn)行。
5)重復(fù)步驟1)~步驟4),對(duì)目標(biāo)觀測(cè)站下一時(shí)刻風(fēng)速時(shí)間序列進(jìn)行檢驗(yàn)。
1.3 假設(shè)檢驗(yàn)方案
為了檢驗(yàn)質(zhì)量控制方法的可行性,本文采用Hubbard等[5]在研究SRT方法時(shí)用到的假設(shè)檢驗(yàn)方法。根據(jù)驗(yàn)證數(shù)據(jù)即經(jīng)過嚴(yán)格質(zhì)量控制后的風(fēng)場(chǎng)原始風(fēng)速觀測(cè)數(shù)據(jù),利用隨機(jī)植入隨機(jī)誤差的方法模擬觀測(cè)值,稱為模擬觀測(cè)數(shù)據(jù);然后基于模型求得的預(yù)測(cè)值與模擬觀測(cè)值的比對(duì)完成質(zhì)量控制。具體地,模擬觀測(cè)數(shù)據(jù)如式(2)所示。
[vobs=v+vevel=slpl] (2)
式中:[vobs]——模擬觀測(cè)風(fēng)速;[v]——基準(zhǔn)觀測(cè)風(fēng)速;[ve]——模擬人工誤差;[p]——服從區(qū)間[[-3.5,3.5]],均值為0的均勻分布的隨機(jī)數(shù);[s]——被檢測(cè)觀測(cè)站風(fēng)速時(shí)間序列的標(biāo)準(zhǔn)差;[l]——誤差插入的位置。
進(jìn)一步地,假設(shè)質(zhì)量模型的無偏估計(jì)為[vest],則通過比較某時(shí)刻[vobs]與[vest],如式(3)所示。若式(3)成立,則認(rèn)為該觀測(cè)值存在疑誤;否則,通過檢驗(yàn)。
[vobst-vestt≥θ," t=1,2,…,Lθ=f?σ] (3)
式中:[θ]——質(zhì)量控制閾值;[f]——質(zhì)控因子,其值大小與質(zhì)量控制后的資料質(zhì)量有關(guān);[σ]——被檢觀測(cè)站觀測(cè)數(shù)據(jù)的標(biāo)準(zhǔn)差;[L]——觀測(cè)數(shù)據(jù)的采樣長(zhǎng)度。
1.4 質(zhì)量控制算法評(píng)估指標(biāo)
上述質(zhì)量控制方案可概括為兩個(gè)部分。一是根據(jù)基準(zhǔn)參考資料,通過質(zhì)量控制算法獲取被檢站的預(yù)測(cè)值(預(yù)測(cè)資料);二是根據(jù)預(yù)測(cè)資料對(duì)觀測(cè)資料做出正確或疑誤的判斷。所以,對(duì)一個(gè)質(zhì)量控制算法的性能評(píng)估應(yīng)從這兩部分入手,即預(yù)測(cè)模型的可靠性及質(zhì)量控制模型的有效性。
可靠性是質(zhì)量控制模型有效性的基礎(chǔ),是對(duì)預(yù)測(cè)模型正確性能的判斷。本文采用平均絕對(duì)誤差(mean absolute error,MAE)、均方根誤差(root mean squared error,RMSE)和納什效率系數(shù)(Nash等[24])(Nash-Sutcliffe model efficiency coefficient, NSC)評(píng)估。其中,NSC的值介于0~1,數(shù)值越接近1,模型的性能越好;RMSE和MAE為大于0的數(shù),越接近0,模型的性能越好。
有效性指標(biāo)是衡量質(zhì)量控制模型效果的主要指標(biāo),本文通過定義檢錯(cuò)率來評(píng)估。分析本文假設(shè)檢驗(yàn)方案,存在4種情況,見式(3):即兩種正確結(jié)論;另外兩種錯(cuò)誤結(jié)論,由質(zhì)量控制模型的失效導(dǎo)致,對(duì)應(yīng)統(tǒng)計(jì)學(xué)中的“兩類錯(cuò)誤”。不失一般性,記產(chǎn)生第一類錯(cuò)誤和第二類錯(cuò)誤的概率分別為[α]、[β],研究表明[25],當(dāng)樣本容量固定時(shí),[α]的減小將引起[β]的增加。在質(zhì)量控制領(lǐng)域研究中,如何權(quán)衡這兩類誤差是質(zhì)量控制領(lǐng)域不可避免的問題。屠其噗等[26]認(rèn)為,在控制第一類錯(cuò)誤的情況下,應(yīng)使第二類誤差盡可能小?;诖?,本文提出最小絕對(duì)誤差檢錯(cuò)率概念,給出衡量?jī)深愓`差的定量指標(biāo)。
由式(4)可知,檢錯(cuò)率是一個(gè)關(guān)于[α]、[β]以及[f]的函數(shù),則檢錯(cuò)率可表述為:
[δratio=ξαf,βf] (4)
式中:[ξ?]——某一函數(shù)映射關(guān)系;[αf]、[βf]——犯兩類錯(cuò)誤關(guān)于質(zhì)控因子[f]的函數(shù)。
基于Neymann-Pearson檢驗(yàn)原理,取兩類錯(cuò)誤絕對(duì)誤差最小時(shí)所對(duì)應(yīng)[f]值為最佳質(zhì)控因子,記為[fo],此時(shí)對(duì)應(yīng)的檢錯(cuò)率稱為最小絕對(duì)誤差檢錯(cuò)率(記為[δratioo])。[fo]及[δratioo]可表示為:
[fo=minαf, βfδratioo=ξαfo, βfo] (5)
2 案例分析
2.1 案例數(shù)據(jù)概況
本文選取廣西壯族自治區(qū)賀州市某山地風(fēng)場(chǎng)為驗(yàn)證案例的數(shù)據(jù)。該風(fēng)電場(chǎng)所處區(qū)域北部為高山余脈,東北偏北方向地勢(shì)低洼,東北方向?yàn)闁|北-西南走勢(shì)山體,東側(cè)、東南地勢(shì)開闊,南部、西部均為山體,如圖3(左側(cè))所示;風(fēng)場(chǎng)區(qū)內(nèi)有5座觀測(cè)塔,即58301#~58305#,其相對(duì)位置示意圖如圖3(右側(cè))所示。本文采用5座觀測(cè)塔2015—2016年70 m高度、時(shí)間分辨率為10 min的風(fēng)速作為實(shí)驗(yàn)驗(yàn)證數(shù)據(jù)。這些數(shù)據(jù)的質(zhì)量已進(jìn)行過控制,已消除了明顯離群值,可正確反映該風(fēng)電場(chǎng)區(qū)域風(fēng)速的分布,下文稱為基準(zhǔn)數(shù)據(jù)。
對(duì)風(fēng)速數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析可知:一方面,5座觀測(cè)塔2015—2016年各月風(fēng)速整體變化趨勢(shì)一致,但各觀測(cè)塔風(fēng)速差異較大,如圖4所示;另一方面,5座觀測(cè)塔的相關(guān)性差異較大,如圖5所示。這種風(fēng)速及相關(guān)性差異不僅源于海拔,還與周邊觀測(cè)地形、地貌相關(guān)。如58301#、58302#,前者比后者海拔低174 m,但年均風(fēng)速大0.474 m/s,如表1所示;再如58301#、58305#風(fēng)速與海拔整體呈正相關(guān),但皮爾遜相關(guān)性系數(shù)僅為0.465,屬于低相關(guān)性,如圖5。
結(jié)合地形地貌對(duì)各觀測(cè)塔進(jìn)行分析:58301#觀測(cè)塔正北、東北方向均為較高山體,北偏東方向?yàn)榇笮秃?,形成“峽口”微地形[27];正北來流往北偏東偏轉(zhuǎn),并得到加速,風(fēng)速威布爾分布呈明顯“雙峰”分布。58302#觀測(cè)塔正北是較高南北走勢(shì)山脈,處于“背風(fēng)”坡地形;正北來流被阻擋,“風(fēng)影區(qū)”風(fēng)速削弱明顯,且呈現(xiàn)強(qiáng)烈的波動(dòng)性。58203#觀測(cè)塔西側(cè)被較高山脈包圍,正北有多個(gè)海拔矮小孤峰,東側(cè)地勢(shì)開闊,小地形復(fù)雜。58204#觀測(cè)塔正北來流方向山峰遮擋,東北側(cè)地勢(shì)開闊,南依小型水庫,小氣候特征明顯[28]。58305#觀測(cè)塔為東北-西南走勢(shì)山脊的較高地,正北、正南方向開闊,氣流穩(wěn)定,風(fēng)速相對(duì)穩(wěn)定。
綜上,該風(fēng)場(chǎng)內(nèi)5座觀測(cè)塔屬于復(fù)雜地形觀測(cè),觀測(cè)風(fēng)速復(fù)雜多變,且相關(guān)間呈現(xiàn)出不同相關(guān)性強(qiáng)度。
2.2 可靠性分析
模型參數(shù)選擇參照表2。為驗(yàn)證PVL_QC的可靠性,即較好的預(yù)測(cè)性能,基于上述案例數(shù)據(jù)設(shè)計(jì)PVL_QC方法的對(duì)比性實(shí)驗(yàn)。LSTM指直接對(duì)風(fēng)速時(shí)間序列進(jìn)行預(yù)測(cè);VMD-LSTM指通過對(duì)風(fēng)速時(shí)間序列分解后的各模態(tài)分別進(jìn)行LSTM預(yù)測(cè)再重構(gòu);PSO-VMD-LSTM為VMD-LSTM的參數(shù)優(yōu)化模型。實(shí)驗(yàn)數(shù)據(jù)選取58301#觀測(cè)塔2015年逐10 min觀測(cè)風(fēng)速數(shù)據(jù),運(yùn)用3種方法進(jìn)行預(yù)測(cè)并以月為單位進(jìn)行結(jié)果統(tǒng)計(jì)分析。
圖6是集成及改進(jìn)前后算法各預(yù)測(cè)指標(biāo)月變化趨勢(shì)示意圖,圖7是集成及改進(jìn)前后算法各預(yù)測(cè)指標(biāo)年統(tǒng)計(jì)分布圖。從圖6可明顯看出,PSO-VMD-LSTM的預(yù)測(cè)性能最好,VMD-LSTM次之,LSTM最差;結(jié)合圖7可看出,PSO-VMD-LSTM預(yù)測(cè)指標(biāo)性能最高,且穩(wěn)定性較好,VMD-LSTM尤其LSTM波動(dòng)性較大。
風(fēng)速的分布直接影響風(fēng)資源評(píng)估的結(jié)果,即要求風(fēng)速預(yù)測(cè)序列的分布與背景場(chǎng)的偏差滿足正態(tài)分布。風(fēng)資源分析研究及業(yè)務(wù)中常用“雙參數(shù)”威布爾模型來定量刻畫風(fēng)速分布[30-31]。為進(jìn)一步說明本文算法具有更好的風(fēng)速分布還原性,分別對(duì)3種算法的風(fēng)速序列預(yù)測(cè)值進(jìn)行威布爾擬合,圖8為不同模型2015年風(fēng)速序列威布爾擬合示意圖;同時(shí)對(duì)各月風(fēng)速威布爾尺度參數(shù)[k]值與背景場(chǎng)進(jìn)行誤差分析,如圖9所示。
綜合分析圖8和圖9可得出,PSO-VMD-LSTM預(yù)測(cè)風(fēng)速序列分布誤差小,且波動(dòng)性較小,平均誤差0.84%,較VMD-LSTM和LSTM分別提升10.4%、3.5%;表明其具有較好且穩(wěn)定的描述風(fēng)速分布情況的性能。
綜上,PVL_QC具有更好的風(fēng)速預(yù)測(cè)性能,各預(yù)測(cè)性能指標(biāo)較穩(wěn)定;其預(yù)測(cè)風(fēng)速與觀測(cè)風(fēng)速威布爾分布擬合參數(shù)誤差較小,刻畫風(fēng)速分布更為吻合。
2.3 有效性分析
為驗(yàn)證PVL_QC的實(shí)際可行性,運(yùn)用該方法對(duì)58301#等5座觀測(cè)塔2015—2016年的風(fēng)速數(shù)據(jù)進(jìn)行質(zhì)量控制,并與《標(biāo)準(zhǔn)》內(nèi)單站控制方法(記為TS_QC)進(jìn)行對(duì)比,表3是本文方法在不同觀測(cè)點(diǎn)、不同年份的年平均檢錯(cuò)率,圖10是本文方法與TS_QC對(duì)比。從表3和圖10可明顯看出,相對(duì)于TS_QC,本文方法具有明顯優(yōu)勢(shì),5座觀測(cè)站檢錯(cuò)率水平均超過88%,較TS_QC提升60%以上,表明該方法檢錯(cuò)率高,小氣候和微地形適應(yīng)性強(qiáng);不同年份的同一觀測(cè)點(diǎn)的檢錯(cuò)率水平基本持平,偏差均值水平,表明PVL對(duì)同一氣候特征下的觀測(cè)數(shù)據(jù)具有相對(duì)的內(nèi)在穩(wěn)定性;不同觀測(cè)點(diǎn)的檢錯(cuò)率基本一致,但仍存在一定的差異性,這種差異主要可從微地形差異進(jìn)行分析解釋。
為了說明PVL_QC較傳統(tǒng)多站質(zhì)量控制效果的優(yōu)越性,分別使用3種方法對(duì)58301#觀測(cè)塔2015—2016年風(fēng)速觀測(cè)數(shù)據(jù)進(jìn)行質(zhì)量控制,SRT和IDW參照文獻(xiàn)[5,7]。圖11為這3種方法在58301#觀測(cè)塔2015—2016年觀測(cè)風(fēng)速的檢錯(cuò)效果對(duì)比。從圖11可看出,3種方法在58301#觀測(cè)塔不同年份的觀測(cè)數(shù)據(jù)的檢錯(cuò)效果基本一致,但PVL_QC檢錯(cuò)效果均明顯好于SRT和IDW方法,平均提升25.1%、28.8%。
為進(jìn)一步比較PVL_QC與SRT和IDW在不同觀測(cè)點(diǎn)的檢錯(cuò)效果,運(yùn)用3種方法分別對(duì)58301#等5基觀測(cè)點(diǎn)2015—2016年的觀測(cè)風(fēng)速數(shù)據(jù)進(jìn)行檢錯(cuò),圖12是3種方法在不同觀測(cè)點(diǎn)2015—2016年的檢錯(cuò)效果??擅黠@看出,不同觀測(cè)點(diǎn)PVL_QC的檢錯(cuò)效果均明顯優(yōu)于SRT和IDW質(zhì)量控制法,平均提升26.3%、34.7%。
2.4 不確定性分析
為進(jìn)一步研究PVL_QC的質(zhì)控因子參數(shù)的最佳取值[fo]在不同地形、氣候下的分布情況,對(duì)58301#等5座觀測(cè)塔2015—2016年風(fēng)速觀測(cè)數(shù)據(jù)以年和季度為單位進(jìn)行PVL_QC分析。圖13是各觀測(cè)塔2015—2016年[fo]值分布圖。圖14是各觀測(cè)塔各年份、各季度的最佳[fo]值分布圖。
從圖13可看出,PVL_QC在各觀測(cè)塔的取值具有一定的差異,但主要集中在0.35~0.50之間;從圖14可看出,每個(gè)觀測(cè)塔不同季度值也具有一定的差異,但同一觀測(cè)塔不同年份同一季度基本一致。
對(duì)PVL_QC的[fo]分析表明,通過構(gòu)造最小絕對(duì)誤差檢錯(cuò)率可平衡兩類統(tǒng)計(jì)學(xué)誤差;[fo]的取值在同一位置、同一氣候的觀測(cè)具有一定的穩(wěn)定性,同時(shí)在不同位置、不同氣候的觀測(cè)又具有差異性,可控及可移植性較好。
3 結(jié) 論
1)本文從風(fēng)速時(shí)間序列非平穩(wěn)性和復(fù)雜度出發(fā),集成變分模態(tài)分解技術(shù)(VMD)與長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM),并針對(duì)VMD中模態(tài)參數(shù)和懲罰因子的選取提出一種基于包絡(luò)熵的優(yōu)化選擇方法,即PVL集成學(xué)習(xí)算法,并運(yùn)用該學(xué)習(xí)算法對(duì)58301#觀測(cè)塔2015—2016年觀測(cè)風(fēng)速進(jìn)行預(yù)測(cè),通過多種預(yù)測(cè)指標(biāo)及風(fēng)速分布進(jìn)行驗(yàn)證,結(jié)果表明PVL集成學(xué)習(xí)算法具有較好的復(fù)雜山地觀測(cè)風(fēng)速時(shí)間序列預(yù)測(cè)能力。
2)PVL_QC適用于復(fù)雜山地,可解決孤立觀測(cè)或區(qū)域觀測(cè)相關(guān)性較低、風(fēng)速波動(dòng)性較大的風(fēng)速質(zhì)量控制問題;其較傳統(tǒng)質(zhì)量控制法相比,對(duì)于復(fù)雜地形和小氣候多變的觀測(cè)風(fēng)速均具有更好的疑誤標(biāo)識(shí)能力。
3)PVL_QC核心是智能優(yōu)化及學(xué)習(xí)重構(gòu)算法,決定了其具有較強(qiáng)的地形、氣候適應(yīng)性。PVL_QC在廣西某復(fù)雜山地風(fēng)場(chǎng)的58301#等5座觀測(cè)塔在不同微地形、小氣候下表現(xiàn)出一定的差異性,在同地形和氣候下具有一定的內(nèi)部健壯性。
4)本文在平衡檢錯(cuò)率與兩類誤差之間提出一種定量標(biāo)準(zhǔn),使質(zhì)控因子在不同位置和氣候呈現(xiàn)一定的自適應(yīng)性,增強(qiáng)了方法的可控及可移植性。
PVL_QC在本文僅在單要素、固定高度的風(fēng)速數(shù)據(jù)上簡(jiǎn)單應(yīng)用,對(duì)如風(fēng)向等其他觀測(cè)要素的普適應(yīng)還未分析,也未考慮時(shí)空約束耦合機(jī)理。在接下來的研究中,可從這些方面著手,構(gòu)造更符合風(fēng)速觀測(cè)塔多要素、時(shí)空分布的模型,更好地提高數(shù)據(jù)質(zhì)量,為風(fēng)資源、發(fā)電量的精準(zhǔn)評(píng)估和風(fēng)功率預(yù)測(cè)提供一套基礎(chǔ)入口數(shù)據(jù)。
[參考文獻(xiàn)]
[1] 歐陽志遠(yuǎn), 史作廷, 石敏俊, 等. “碳達(dá)峰碳中和”: 挑戰(zhàn)與對(duì)策[J]. 河北經(jīng)貿(mào)大學(xué)學(xué)報(bào), 2021, 42(5): 1-11.
OUYANG Z Y, SHI Z T, SHI M J, et al. Challenges and countermeasures of “carbon peak and carbon neutrality”[J]. Journal of Hebei University of Economics and Business, 2021, 42(5): 1-11.
[2] FU W L, FANG P, WANG K, et al. Multi-step ahead short-term wind speed forecasting approach coupling variational mode decomposition, improved beetle antennae search" "algorithm-based" "synchronous" "optimization" "and Volterra series model[J]. Renewable energy, 2021, 179: 1122-1139.
[3] SINGH S, BHATTI T S, KOTHARI D P. A review of wind-resource-assessment" "technology[J]." "Journal" "of" "energy engineering, 2006, 132(1): 8-14.
[4] GB/T 18710—2002, 風(fēng)電場(chǎng)風(fēng)能資源評(píng)估方法[S].
GB/T 18710—2002, Methodology of wind energy resource assessment for wind farm[S].
[5] HUBBARD K G, YOU J S. Sensitivity analysis of quality assurance using the spatial regression approach-a case study" of" the" "maximum/minimum" "air" "temperature[J]. Journal of atmospheric and oceanic technology, 2005, 22(10): 1520-1530.
[6] LORENC A C. A global three-dimensional multivariate statistical interpolation scheme[J]. Monthly weather review, 1981, 109(4): 701-721.
[7] WADE C G. A quality control program for surface mesometeorological data[J]. Journal of atmospheric and oceanic technology, 1987, 4(3): 435-453.
[8] LORENC A C, HAMMON O. Objective quality control of observations using Bayesian methods. Theory, and a practical implementation[J]. Quarterly journal of the royal meteorological society, 1988, 114(480): 515-543.
[9] 熊雄, 葉小嶺, 張穎超, 等. 基于空間觀測(cè)差異的地面氣溫資料質(zhì)量控制算法研究[J]. 地球物理學(xué)報(bào), 2017, 60(3): 912-923.
XIONG X, YE X L, ZHANG Y C, et al. A quality control method for the surface temperature based on the spatial observation diversity[J]. Chinese journal of geophysics, 2017, 60(3): 912-923.
[10] YE X L, YANG X, XIONG X, et al. A quality control method based on an improved random forest algorithm for surface" "air" "temperature" "observations[J]." Advances" "in meteorology, 2017, 2017: 1-15.
[11] 葉星瑜, 葉小嶺, 馬偉叁, 等. 基于LMD-TCN的高鐵沿線風(fēng)速觀測(cè)資料質(zhì)量控制算法研究[J]. 鐵道科學(xué)與工程學(xué)報(bào), 2022, 19(4): 849-856.
YE X Y, YE X L, MA W S, et al. Research on the quality control method of wind speed observation data along the high-speed railway line based on LMD-TCN[J]. Journal of railway science and engineering, 2022, 19(4): 849-856.
[12] 秦瓊, 劉樹潔, 賴旭, 等. GA優(yōu)化ELM神經(jīng)網(wǎng)絡(luò)的風(fēng)電場(chǎng)測(cè)風(fēng)數(shù)據(jù)插補(bǔ)[J]. 太陽能學(xué)報(bào), 2018, 39(8): 2125-2132.
QIN Q, LIU S J, LAI X, et al. Interpolation of wind speed data in wind farm based on GA optimized ELM neural network[J]. Acta energiae solaris sinica, 2018, 39(8): 2125-2132.
[13] 張穎超, 姚潤進(jìn), 熊雄, 等. PSO-PSR-ELM集成學(xué)習(xí)算法在地面氣溫觀測(cè)資料質(zhì)量控制中的應(yīng)用[J]. 氣候與環(huán)境研究, 2017, 22(1): 59-70.
ZHANG Y C, YAO R J, XIONG X, et al. Application of PSO-PSR-ELM-based ensemble learning algorithm in quality control of surface temperature observations[J]. Climatic and environmental research, 2017, 22(1): 59-70.
[14] MEEK D W, HATFIELD J L. Data quality checking for single" station" meteorological" databases[J]. Agricultural and forest meteorology, 1994, 69(1/2): 85-109.
[15] DRAGOMIRETSKIY K, ZOSSO D. Variational mode decomposition[J]. IEEE transactions on signal processing, 2014, 62(3): 531-544.
[16] WANG D Y, LUO H Y, GRUNDER O, et al. Multi-step ahead wind speed forecasting using an improved wavelet neural network combining variational mode decomposition and" phase" space" reconstruction[J]." Renewable" energy, 2017, 113: 1345-1358.
[17] SUN W, GAO Q. Short-term wind speed prediction based on variational mode decomposition and linear-nonlinear combination optimization model[J]. Energies, 2019, 12(12): 2322.
[18] HOCHREITER S, SCHMIDHUBER J. Long short-term memory[J]. Neural computation, 1997, 9(8): 1735-1780.
[19] SHEN F R, CHAO J, ZHAO J X. Forecasting exchange rate using deep belief networks and conjugate gradient method[J]. Neurocomputing, 2015, 167: 243-253.
[20] 鄧三鴻, 傅余洋子, 王昊. 基于LSTM模型的中文圖書多標(biāo)簽分類研究[J]. 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn), 2017, 1(7): 52-60.
DENG S H, FUYU Y Z, WANG H. Multi-label classification of Chinese books with LSTM model[J]. Data analysis and knowledge discovery, 2017, 1(7): 52-60.
[21] 馬遠(yuǎn)浩, 曾衛(wèi)明, 石玉虎, 等. 基于加權(quán)詞向量和LSTM-CNN的微博文本分類研究[J]. 現(xiàn)代計(jì)算機(jī)(專業(yè)版), 2018(25): 18-22.
MA Y H, ZENG W M, SHI Y H, et al. Research on text classification of weibo based on weighted word vectors and LSTM-CNN[J]. Modern computer, 2018(25): 18-22.
[22] EBERHART R, KENNEDY J. A new optimizer using particle swarm theory[C]//Proceedings of the Sixth International Symposium on Micro Machine and Human Science. Nagoya, Japan, 2002: 39-43.
[23] 唐貴基, 王曉龍. 參數(shù)優(yōu)化變分模態(tài)分解方法在滾動(dòng)軸承早期故障診斷中的應(yīng)用[J]. 西安交通大學(xué)學(xué)報(bào), 2015, 49(5): 73-81.
TANG G J, WANG X L. Parameter optimized variational mode decomposition method with application to incipient fault diagnosis of rolling bearing[J]. Journal of Xi’an Jiaotong University, 2015, 49(5): 73-81.
[24] NASH J E, SUTCLIFFE J V. River flow forecasting through conceptual models part I-a discussion of principles[J]. Journal of hydrology, 1970, 10(3): 282-290.
[25] ZHANG Y C, XIONG X, ZHANG Q D. An improved self-adaptive PSO algorithm with detection function for multimodal function optimization problems[J]. Mathematical problems in engineering, 2013, 2013: 1-8.
[26] 屠其璞, 王俊德, 丁裕國,等. 氣象應(yīng)用概率統(tǒng)計(jì)學(xué)[M]. 北京: 氣象出版社, 1984: 183-186.
TU Q P, WANG J D, DING Y G, et al. Meteorological application probability statistics[M]. Beijing: China Meteorological Press, 1984: 183-186.
[27] 席世平, 白凌霞, 趙培娟, 等. 2010年9月4日河南孟津罕見雷暴大風(fēng)過程的分析和預(yù)報(bào)[C]//第28屆中國氣象學(xué)會(huì)年會(huì): S3天氣預(yù)報(bào)災(zāi)害天氣研究與預(yù)報(bào). 廈門, 中國, 2011: 919-927.
XI S P, BAI L X, ZHAO P J, el al. Analysis and prediction of the rare thunderstorm Gale Process in Mengjin, Henan Province on September 4, 2010[C]//The 28th Annual Meeting of China Meteorological Society, Xiamen, China, 2011: 919-927.
[28] 華德尊, 李春艷, 蔡春苗. 二龍山水庫流域不同程度生態(tài)破壞對(duì)小氣候要素的影響[J]. 環(huán)境科學(xué)研究, 2002, 15(3): 16-18.
HUA D Z, LI C Y, CAI C M. The influence of ecological destruction on microclimatic factors in erlongshan reservoir watershed[J]. Research of environmental sciences, 2002, 15(3): 16-18.
[29] SHI Y H, EBERHART R C. Parameter selection in particle swarm optimization[M]. Berlin: Springer Berlin Heidelberg, 1998: 591-600.
[30] PISHGAR-KOMLEH S H, KEYHANI A, SEFEEDPARI P. Wind speed and power density analysis based on Weibull and Rayleigh distributions (a case study: Firouzkooh County of Iran)[J]. Renewable and sustainable energy reviews, 2015, 42: 313-322.
[31] 楊剛, 杜永賢, 陳鳴. 基于風(fēng)頻Weibull分布和風(fēng)機(jī)功率特性求解風(fēng)機(jī)發(fā)電量[J]. 電力學(xué)報(bào), 2008, 23(4): 276-278, 300.
YANG G, DU Y X, CHEN M. The calculation of energy provided by wind turbine based on its power characteristic and the wind frequency weibull distribution[J]. Journal of electric power, 2008, 23(4): 276-278, 300.
A QUALITY CONTROL ALGORITHM OF WIND SPEED OBSERVATIONS IN COMPLEX MOUNTAIN WIND FARM BASED ON PSO-VMD AND LSTM
Xiong Xiong1,Yao Runjin2,Cheng Shuaibing3,Li Wenlong4,Qian Dong1
(1. Jiangsu Collaborative Innovation Center of Atmospheric Environment and Equipment Technology, Information and Systems Science Institute, NUIST, Nanjing 210044, China;
2. Carbon Neutralization Research Institute, PowerChina Jiangxi Electric Power Construction Co., Ltd., Nanjing 210018, China;
3. Jiangsu Key Laboratory of Offshore Wind Power Blade Design and Manufacturing Technology, Nanjing 210000, China;
4. Jiangxi Branch, China Three Gorges New Energy (Group) Co., Ltd., Nanchang 330038, China)
Abstract:There are many problems in complex mountain wind farms, such as large errors of wind resource evaluation and low accuracy of wind power prediction caused by poor quality of observed wind speed data. Because of the strong intermittent, fluctuating, and non-stationary characteristics presented by the wind speed in complex mountain wind farms, conventional quality control methods cannot effectively improve data quality. For this situation, an integrated learning algorithm (PVL) based on particle swarm optimization improved variational modal decomposition improved by particle swarm optimization and long short-term memory is proposed and applied to the quality control of wind speed observations in complex mountainous areas to improve the quality of wind speed data. In order to assess the feasibility and applicability of the proposed method, the 10 minutes wind speed observed in five observation tower of a complex mountain wind farm in Guangxi from 2015 to 2016 were examined. Otherwise, we compared this method to spatial regression test(SRT) and inverse distance weighting method(IDW). The results show that the method can more effectively flag suspicious data, and it also has the advantages of high identification accuracy, strong adaptability to different terrains and wind conditions.
Keywords:wind farm; quality control; particle swarm optimization; variational modal decomposition; long short-term memory