黃武楓,鄭含博,杜齊,楊杭
(廣西大學 電氣工程學院, 南寧 530004)
風能作為 一種低碳、可再生且無污染的新能源,在世界范圍內(nèi)快速地發(fā)展。根據(jù)全球風能理事會2019年報告,全球風機新增裝機容量比2018年增長19%,增長了60.4 GW,累加風機裝機容量達到651 GW[1]。風能的大規(guī)模發(fā)展對風能利用技術(shù)提出了更高的要求,諸如風電輸送[2]、消納、儲能等問題被廣泛地研究。其中對風速特性與風能潛力進行評估是首要且重要的步驟。風速概率分布反映中長期的風速特性,其特征對評估某個地點的蘊藏風能潛力非常重要。文獻[3]指出,即使兩臺安裝在平均風速相近地區(qū)的風力渦輪機,由于風速特性的不同也會產(chǎn)生完全不同的功率輸出,這體現(xiàn)了風速概率分布研究的重要性。
研究風速特性主要有兩種方法,一種為風速時序模型[4-7],另一種為風速概率分布模型[8-17]。風速時序模型主要描述按時間發(fā)生的風速特性。主要有人工神經(jīng)網(wǎng)絡(luò)法[4]、支持向量機法[5-6]、灰色模型法[7]等。風速概率分布模型側(cè)重于描述中長期風速分布特征,主要應用于風能資源估計、風場規(guī)劃調(diào)度等領(lǐng)域。風速概率分布通常使用理論參數(shù)分布模型進行研究,瑞麗分布是較早用于擬合風速概率分布的參數(shù)分布模型[8]。瑞麗分布只有一個參數(shù)需要計算,因此其計算十分簡便,但也導致了擬合精度較低的缺點[9]。二參數(shù)伽馬分布廣泛地應用于歐洲地區(qū),并取得了較好的擬合效果。最廣為使用且并被認為最適合擬合風速概率分布的參數(shù)分布為二參數(shù)威布爾分布模型[10-12],威布爾分布通過調(diào)整形狀參數(shù)與尺寸參數(shù)以適應各種類型的風速分布。盡管如此,有研究發(fā)現(xiàn)威布爾分布在很多地區(qū)的擬合精度不佳[13]。對數(shù)正態(tài)分布在文獻[14]中被提出并與二參數(shù)威布爾分布在西班牙的20個地點進行了比較[15],其結(jié)果表明平均風速少于2 m/s時,對數(shù)正態(tài)分布比威布爾分布有著更高的擬合精度,平均風速大于2 m/s時威布爾的擬合表現(xiàn)更優(yōu)。為了更為精確地擬合風速概率分布,三參數(shù)廣義極值分布被提出并在印度進行了應用[16]。文獻[17]提出了混合威布爾分布用于擬合少見的雙峰類型的風速概率分布,該方法通過疊加兩個威布爾分布以描述雙峰特征。然而文獻[3]指出混合威布爾分布需要解五條非線性方程,計算復雜同時也容易產(chǎn)生過擬合問題。
Nakagami分布作為一種有效的移動無線電和衰落信道模型在通信中得到了廣泛的應用[18]。除此之外,Nakagami分布還應用于醫(yī)學[19]、水文科學[20]以及衛(wèi)星通訊[21]等領(lǐng)域。當前少有報道將Nakagami分布引入風速概率分布擬合研究領(lǐng)域。由于風速數(shù)據(jù)受地形影響巨大,因此本研究風速數(shù)據(jù)采集覆蓋美國西部海島、沿海以及山區(qū)的八個站點。多樣的采集地點避免了少數(shù)采樣地點以及相鄰地點風速研究產(chǎn)生過擬合的問題,并使得本研究結(jié)論更加可靠。
研究風速概率分布參數(shù)模型對風速特征以及潛在風能評估有著重要作用。Nakagami分布將與其它六種參數(shù)分布模型進行對比,分別為瑞麗分布、對數(shù)正態(tài)分布、伽馬分布、威布爾分布、廣義極值分布以及JohnsonSB分布。
文獻[22]指出極大似然法具有非常優(yōu)秀的性能,比最小二乘法法更加精確。為了更好地確定上述分布的參數(shù),使用極大似然法進行參數(shù)估計。
Nakagami分布的概率分布函數(shù)以及累積分布函數(shù)表達式為:
(1)
(2)
式中Gu表示上不完全伽馬函數(shù);Γ表示伽馬函數(shù)。其中的m和Ω分別表示Nakagami分布的形狀和尺寸參數(shù),兩個參數(shù)可以使用式(3)、式(4)進行估算:
(3)
(4)
當m<1/2時,表達式中v2m-1分量的冪(2m-1)為負數(shù),風速v趨于0時v2m-1值為無窮大,因此需要對形狀參數(shù)m取值范圍進行限制,即m≥1/2。
瑞麗分布只有一個參數(shù)需要估算,簡便的計算使其有著廣泛的應用。瑞麗分布本質(zhì)上是形狀參數(shù)固定為2的威布爾分布的特殊表現(xiàn)形式。瑞麗分布的概率分布表達式為:
(5)
瑞麗分布的累積分布函數(shù)表達式為:
(6)
式中v為風速,單位為m/s;為瑞麗分布的尺寸參數(shù)。
使用極大似然法估計瑞麗分布參數(shù),通過求解瑞麗分布的似然函數(shù),參數(shù)估計表達式為:
(7)
式中vi表示第i個風速數(shù)據(jù)。
伽馬分布的概率分布表達式為:
(8)
伽馬分布的累積分布表達式為:
(9)
式中α為伽馬分布的形狀參數(shù);β為伽馬分布的尺寸參數(shù),Γ為伽馬函數(shù)。兩者通過式(10)、式(11)進行計算:
(10)
(11)
式中n為數(shù)據(jù)樣本個數(shù);ψ為伽馬函數(shù)對數(shù)的導數(shù)函數(shù)即digamma函數(shù)。
對數(shù)正態(tài)分布的概率分布表達式為:
(12)
對數(shù)正態(tài)分布的累積分布函數(shù)為:
(13)
式中μ和σ分別為對數(shù)正態(tài)分布的尺寸參數(shù)與形狀參數(shù)。使用極大似然法對其進行計算,有:
(14)
(15)
威布爾分布是最為廣泛使用的參數(shù)分布模型,威布爾分布的概率分布表達式為:
(16)
威布爾分布的累積分布表達式為:
(17)
式中v為風速,單位為m/s;c為威布爾分布的尺寸參數(shù);k為威布爾分布的形狀參數(shù)。使用極大似然法進行上述參數(shù)的估計有[22]:
(18)
(19)
廣義極值分布是一個三參數(shù)分布模型,其概率分布函數(shù)與累積分布函數(shù)分別為:
(20)
(21)
使用極大似然法對其進行參數(shù)估計,由于沒有解析解,因此需要對似然函數(shù)進行迭代計算得到近似解。廣義極值分布的似然函數(shù)為:
(22)
JohnsonSB分布由Johnson通過向正態(tài)性的轉(zhuǎn)換引入,是Johnson分布系統(tǒng)三個族類之一。其概率分布函數(shù)為:
(23)
式中v∈[ξ,ξ+λ],且λ和δ大于0,ξ和λ分別為JohnsonSB分布的位置與尺寸參數(shù)。參數(shù)γ和δ會影響函數(shù)的形狀。特別地,增加γ的絕對值會引起偏度的增加,增加δ的值會導致峰度的增加。使用極大似然法對其進行參數(shù)估計,JohnsonSB分布的似然函數(shù)為:
(24)
可以使用牛頓拉夫遜迭代法或最大期望法對JohnsonSB分布的極大似然函數(shù)進行迭代求解。
校驗風速概率分布模型性能需要使用擬合優(yōu)度指標,決定系數(shù)(Coefficients of Determination, R2)、均方根誤差(Root Mean Square Error, RMSE)、誤差平方和(Sum of Squares of Errors, SSE)以及Kolmogorov-Smirnov (KS)是常用的風速概率分布擬合校驗指標。
R2是計算實際值與預測值之間的方差大小的指標,R2在風速概率分布擬合校驗中應用廣泛,其值越接近1表明擬合效果越好。決定系數(shù)的計算公式為:
(25)
RMSE通過實際概率和預測概率之間的逐項比較來確定模型的精度。均方根誤差校驗值越小,表明擬合效果越好,其計算公式如下:
(26)
SSE主要校驗實際值與預測值之間的誤差平方和,其值越小表明擬合效果越好,表達式為:
(27)
KS校驗表示實際累積分布與預測累積分布之間最大的誤差絕對值,對應的計算公式為:
(28)
選擇上述四個擬合指標作為校驗標準,多個擬合指標共同,使用使得校驗結(jié)果更加準確。
風速概率分布受地理位置影響極大,為了驗證某個參數(shù)分布的性能需要多樣化的數(shù)據(jù)采集。因此,選取美國西部八個站點的氣象數(shù)據(jù),覆蓋海島、沿海以及山區(qū)三類地形。其中,Rome(KREO)和Needles(KEED)兩個站點位于山區(qū),Fresno(KFAT)站點介于沿海與山區(qū)之間,Brookings Airport(KBOK)、Crescent City(KCEC)、Half Moon Bay Airport(KHAF)與South County Airport of Santa Clara County(KE16)四個站點位于沿海地帶,San Nicolas Island Naval Outlying Field(KNSI)則位于太平洋的海島上。上述八個站點覆蓋多種地形以及廣大的地理區(qū)域,使用參數(shù)分布模型對不同地形的風速數(shù)據(jù)進行擬合比較可以獲得較為準確的結(jié)論,同時避免選取單個或者相鄰幾個站點所引起的過擬合問題。特別地,站點括號內(nèi)為氣象站的編號信息。為了簡便表述,使用站點編號進行描述。所選站點所在的位置,如圖1所示。
圖1 美國西部所選氣象站點的位置
表1呈現(xiàn)八個站點的坐標、采樣時間周期、海拔高度、采樣間隔以及數(shù)據(jù)個數(shù)信息。采樣周期從2017年-2019年,大部分為2019年全年風速數(shù)據(jù)。海拔從17 m~1 235 m,數(shù)據(jù)采集間隔從5 min~60 min,數(shù)據(jù)個數(shù)最少為8 664個,最多達到113 764個。該數(shù)據(jù)樣本覆蓋范圍廣泛,而且采樣周期、海拔高度與數(shù)據(jù)量均不盡相同。這使得數(shù)據(jù)能代表不同數(shù)據(jù)采集時長、不同高度和地理位置的風速類型。
表1 采樣點的位置信息
表2提供了八個站點的數(shù)據(jù)統(tǒng)計信息,包括最大風速、平均風速、標準差、偏斜度與超值峰度。平均風速表示風速的算術(shù)平均值,標準差表示數(shù)據(jù)偏離均值的程度。其中位于海島的KNSI站點平均風速最高,沿海的KBOK站點平均風速最低。偏斜度定義為風速樣本的三階標準矩,表示數(shù)據(jù)樣本概率分布的不對稱性。
表2 風速數(shù)據(jù)的統(tǒng)計信息
八個站點的偏度均為正值表明所有數(shù)據(jù)的概率分布都右偏,這與圖2所示的實際分布情況是一致的。超值峰度反映概率分布的陡峭度,表2中所有超值峰度均為正值,表明風速概率分布均比正態(tài)分布更加陡峭。由此可推斷出風速概率分布多數(shù)具有尖峰肥尾(陡峭右偏)的特征。進一步地,由于風速概率分布有此特征,所以常用的正態(tài)對稱分布不適合擬合風速概率分布。
圖2 各站點實際風速概率分布與擬合模型
Nakagami分布、瑞麗分布、伽馬分布、威布爾分布、對數(shù)正態(tài)分布、廣義極值分布以及Johnson SB分布比正態(tài)分布更能描述風速概率分布的尖峰肥尾特性。將其用于八個站點的風速數(shù)據(jù)進行擬合,并使用極大似然法進行參數(shù)估計,各分布模型的參數(shù)值如表3所示。
表3 各站點分布參數(shù)
從表3中發(fā)現(xiàn),Nakagami分布的形狀參數(shù)大部分處于0.5~0.6之間,其尺寸參數(shù)值則波動較大。
將極大似然法所計算得到的參數(shù)值代入相應的概率密度分布表達式中,計算概率密度分布。各分布模型圖像統(tǒng)一繪制在實際概率分布的條形圖上,如圖2所示。結(jié)合圖2可以清晰地發(fā)現(xiàn),對數(shù)正態(tài)分布與實際分布之間有著較大的擬合誤差。但是,其余的分布模型擬合性能的好壞無法直觀從圖像得出,因此需要使用擬合校驗指標進行量化比較。
為了校驗理論分布模型的擬合優(yōu)度,使用到R2、RMSE、SSE以及KS四個擬合校驗指標。其中的R2的值越接近1表示擬合精確越高,其余三個擬合指標越小表明擬合效果越好。各分布模型的擬合指標如表4和表5所示。
表4 低參數(shù)分布模型的擬合精度
表5 多參數(shù)分布模型的擬合精度
由于Nakagami分布為二參數(shù)分布,因此首先與參數(shù)較少的一參數(shù)瑞麗分布與二參數(shù)對數(shù)正態(tài)、伽馬以及威布爾分布模型進行對比。如表4所示,校驗結(jié)果表明Nakagami分布在R2、RMSE、SSE以及KS四個擬合校驗指標均值中取得第一。二參數(shù)威布爾分布具有較優(yōu)的擬合精度,在四個指標均值比較中取得第二。同為二參數(shù)的Nakagami分布比威布爾分布擁有更高的擬合精度,所以其有潛力取代經(jīng)典的威布爾分布。特別地,一參數(shù)瑞麗分布在三個站點提供了最高精度,然而其余站點的擬合精度卻很低。這證明瑞麗分布在某些站點擬合效果精確,但對整體而言擬合效果十分不穩(wěn)定。
將Nakagami分布與三參數(shù)的廣義極值分布、四參數(shù)的JohnsonSB分布進行擬合比較。廣義極值分布在KCEC、KEED、KNSI以及KREO四個站點獲得最優(yōu)的擬合度,Nakagami分布則在KE16、KFAT、KHAF和KBOK獲得最佳的擬合度。在擬合指標均值中發(fā)現(xiàn),Nakagami分布的RMSE與SSE擬合指標中比廣義極值分布更精確。結(jié)合表2的風速數(shù)據(jù)統(tǒng)計信息與表4、表5的擬合精確度可以得到一項重要的發(fā)現(xiàn):當站點的平均風速小3 m/s時, Nakagami分布在該站點取得的擬合精度為所有分布中最高,如KE16、KBOK和KFAT三個站點。這表明Nakagami分布擬合平均風速低于3 m/s的風速概率分布時,具有非常優(yōu)秀的擬合性能。
值得注意的是,四參數(shù)的JohnsonSB分布沒有在任意站點取得最高的擬合精度,但是其平均精度卻是所有分布中最高。這表明,較少的數(shù)據(jù)樣本進行研究容易引起過擬合問題。此外,結(jié)合一參數(shù)瑞麗分布的平均擬合精度、二參數(shù)的威布爾分布、三參數(shù)的廣義極值分布以及四參數(shù)的JohnsonSB分布的平均擬合精度,可以得到參數(shù)越多分布模型擬合精度一般越高的結(jié)論。
然而,參數(shù)越多越容易引起計算上與應用上的困難。以JohnsonSB分布為例,JohnsonSB分布需要估計四個參數(shù)即需要求解四條非線性方程,計算復雜度遠高于二參數(shù)的Nakagami分布。Nakagami分布有固定的參數(shù)估計公式,計算十分簡便。在實際應用中發(fā)現(xiàn),JohnsonSB分布對某些風速樣本進行參數(shù)估計時極大似然法不能收斂,表明JohnsonSB分布不能擬合該樣本。Nakagami在擬合精確度比較中,R2值僅比JohnsonSB分布低0.009 527。綜合考慮擬合精度與計算難度,Nakagami分布更適合擬合風速概率分布。
引入Nakagami分布對美國西部覆蓋沿海、海島和內(nèi)陸八個站點的風速數(shù)據(jù)進行擬合研究,對比瑞麗分布、伽馬分布、對數(shù)正態(tài)分布、威布爾分布、廣義極值分布以及JohnsonSB分布。研究發(fā)現(xiàn),Nakagami分布與參數(shù)較少的分布進行擬合對比,在八個站點的四個擬合度指標中均取得最優(yōu)精度。與參數(shù)較多的廣義極值分布和JohnsonSB分布比較中,Nakagami分布在四個站點取得最優(yōu)。結(jié)合風速數(shù)據(jù)的統(tǒng)計信息發(fā)現(xiàn),當平均風速低于3 m/s時,Nakagami分布比其它所有分布具有更優(yōu)的擬合精度,表明Nakagami的低風速分布擬合性能非常優(yōu)秀。綜合考慮擬合精度與計算復雜度,Nakagami分布在擬合風速概率分布領(lǐng)域更具優(yōu)勢。