解 坤, 張俊芳
(南京理工大學 自動化學院, 南京 210094)
?
基于KMO-Bartlett典型風速選取的PCA-WNN短期風速預(yù)測
解 坤, 張俊芳
(南京理工大學 自動化學院, 南京 210094)
針對風電功率預(yù)測時風速信息冗余,導致神經(jīng)網(wǎng)絡(luò)難以把握內(nèi)在規(guī)律而影響訓練效率的問題,選取最佳風速數(shù)據(jù)進行主成分分析,采用改進小波-BP神經(jīng)網(wǎng)絡(luò)對風速進行預(yù)測。通過KMO和Bartlett球度雙檢驗選取最佳風速數(shù)據(jù),從而充分利用主成分分析法對風速數(shù)據(jù)進行提取以優(yōu)化神經(jīng)網(wǎng)絡(luò)的輸入,提高網(wǎng)絡(luò)收斂速度和預(yù)測精度。通過某風電場風速數(shù)據(jù)仿真分析,與其他預(yù)測方法進行對比,結(jié)果表明該模型預(yù)測精度高、泛化性能好,驗證了該預(yù)測方法的正確性和有效性。
風速預(yù)測; KMO檢驗; Bartlett球度檢驗; 主成分分析; 小波-BP神經(jīng)網(wǎng)絡(luò)
全球范圍內(nèi)環(huán)境問題日益嚴重以及資源日漸匱乏,各國都將開發(fā)和利用可再生能源作為應(yīng)對能源緊缺問題的重要手段。風力發(fā)電作為一種清潔高效的技術(shù),因獨特的自然優(yōu)勢、良好的產(chǎn)業(yè)基礎(chǔ)和明顯的經(jīng)濟優(yōu)勢,得到了廣泛應(yīng)用和發(fā)展[1-2]。風電裝機容量不斷增加,帶來一定的環(huán)境和經(jīng)濟效益,但是風能存在間歇性、波動性和不確定性,影響電力系統(tǒng)的安全穩(wěn)定運行,而解決該問題的有效途徑之一就是對風電功率進行準確預(yù)測[3]。
風電功率預(yù)測按時間尺度不同,分為超短期預(yù)測、短期預(yù)測和中長期預(yù)測,預(yù)測模型對象分為基于風速的間接預(yù)測法和基于功率的直接預(yù)測法[4]。常用的預(yù)測方法有空間相關(guān)法[5]、卡爾曼濾波[6]、支持向量機法[7-8]、神經(jīng)網(wǎng)絡(luò)法[9]等以及一些組合方法[10-11]。由于神經(jīng)網(wǎng)絡(luò)具有突出的非線性映射、自學習和自適應(yīng)能力而得到廣泛應(yīng)用與發(fā)展,如BP神經(jīng)網(wǎng)絡(luò)[12]、Elman神經(jīng)網(wǎng)絡(luò)[13]、Hopfield神經(jīng)網(wǎng)絡(luò)、RBF神經(jīng)網(wǎng)絡(luò)[14]等。近年來,國內(nèi)外學者對風電功率預(yù)測進行研究,并取得了一系列成果,但是對于風速數(shù)據(jù)選取和挖掘的研究較少,往往直接選取大量風速樣本數(shù)據(jù)進行預(yù)測,注重于預(yù)測精度的提高而忽略了預(yù)測所需時間成本問題。
筆者對歷史風速數(shù)據(jù)進行分析和挖掘,避免輸入數(shù)據(jù)信息冗余而導致預(yù)測效率低,將主成分分析法、小波分析與BP神經(jīng)網(wǎng)絡(luò)相結(jié)合,建立短期風速預(yù)測模型。針對單一BP神經(jīng)網(wǎng)絡(luò)存在學習效率低、收斂速度慢和易陷入局部最小狀態(tài)的問題進行改善。預(yù)測模型首先采用KMO和Bartlett球度檢驗,選取最佳風速樣本進行主成分分析,將主成分數(shù)據(jù)作為BP神經(jīng)網(wǎng)絡(luò)的輸入,將小波基函數(shù)Morlet以“緊致型”方式嵌入至隱含層,對未來24 h風速進行預(yù)測。將該預(yù)測模型應(yīng)用于某風電場風速數(shù)據(jù)進行仿真分析,并與相關(guān)預(yù)測方法進行對比,結(jié)果表明本方法能夠更加準確地對風速進行預(yù)測。
1.1 KMO和Bartlett球度檢驗
采用KMO和Bartlett球度檢驗對風速樣本進行相關(guān)性分析,選取適合主成分分析的樣本,以免造成風速數(shù)據(jù)信息丟失而無助于維度縮減。
1.1.1 KMO檢驗
KMO檢驗根據(jù)變量間簡單相關(guān)系數(shù)和偏相關(guān)系數(shù)的關(guān)系來檢驗變量數(shù)據(jù)。當所有變量的簡單相關(guān)系數(shù)平方和遠遠大于偏相關(guān)系數(shù)平方和時,變量間的相關(guān)性越強,越適合主成分分析;反之,則不適合主成分分析。
設(shè)(Xi,Yi)(i=1,2,……,n)為取自總體的樣本,則樣本的Pearson簡單線性相關(guān)系數(shù)計算公式為:
(1)
偏相關(guān)系數(shù)是在固定其余變量的影響下計算兩個變量之間的相關(guān)系數(shù)大小,可以反映任意兩個變量在固定其余變量的影響下的線性相關(guān)程度。偏相關(guān)系數(shù)的計算公式為:
式中:h為所固定的變量個數(shù);z1z2…zh為所固定的變量;rxy是變量x和y之間的簡單相關(guān)系數(shù)。
設(shè)變量的簡單相關(guān)系數(shù)平方和為P,偏相關(guān)系數(shù)平方和為R,則KMO檢驗統(tǒng)計量的計算公式為:
(3)
1.1.2 Bartlett球度檢驗
Bartlett球度檢驗以原有變量的相關(guān)系數(shù)矩陣為出發(fā)點,其原假設(shè)是相關(guān)系數(shù)矩陣為單位矩陣,Bartlett球度檢驗的統(tǒng)計量Φ是根據(jù)相關(guān)系數(shù)矩陣O的行列式得到,統(tǒng)計量計算公式為:
Φ=det(O)=|O|
(4)
根據(jù)自由度和統(tǒng)計量觀測值查詢卡方分布表,可近似得到相應(yīng)的相伴概率值。根據(jù)相伴概率p與顯著性水平α之間的關(guān)系來判定變量之間是否存在相關(guān)關(guān)系且適合主成分分析。
1.2 主成分分析
主成分分析是用盡可能少的信息來反映數(shù)據(jù)特征和規(guī)律,既保留原始數(shù)據(jù)的信息,又能夠?qū)崿F(xiàn)降維處理,降低數(shù)據(jù)自身復雜程度[15-16]。
設(shè)原始變量所得到的p個變量的n組樣本值矩陣為:
(5)
1.2.1 變量數(shù)據(jù)標準化處理
計算各變量的均值和標準差,均值和標準差的計算公式分別為:
(6)
(7)
1.2.2 建立協(xié)方差矩陣并計算特征值和特征向量
采用標準化處理后的數(shù)據(jù),得到協(xié)方差矩陣R的計算公式為:
(9)
將協(xié)方差矩陣R的特征值從大到小進行排序,假設(shè)特征值排列順序為λ1,λ2,…,λp,對應(yīng)的特征向量為li=[li1,li2,…,lip]T。
1.2.3 計算方差貢獻率和累計方差貢獻率
第m個成分的方差貢獻率計算公式為:
(10)
前m個成分的累計方差貢獻率計算公式為:
(11)
1.2.4 獲取主成分信息
原始變量數(shù)據(jù)的主成分信息計算公式為:
Z=X·l
(12)
式中:主成分矩陣Z為原始變量矩陣X的主成分部分。通常累計方差貢獻率在75%~95%時,選取前m個成分便包含原始變量的絕大部分信息,主成分個數(shù)就是m個,后面其他成分則可以舍棄[17]。
采用“緊致型”結(jié)合方式,將神經(jīng)網(wǎng)絡(luò)隱含層中神經(jīng)元的傳統(tǒng)激發(fā)函數(shù)用小波函數(shù)來代替,充分利用小波變換良好的時頻局部化性質(zhì)和聚焦特性以及神經(jīng)網(wǎng)絡(luò)自學習、自適應(yīng)的優(yōu)點[18]。
設(shè)小波-BP神經(jīng)網(wǎng)絡(luò)有m個輸入節(jié)點、N個輸出節(jié)點和n個隱含層節(jié)點。網(wǎng)絡(luò)的輸入和輸出數(shù)據(jù)分別用向量X和Y來表示,即X=(x1,x2,x3,…,xm)T,Y=(y1,y2,y3,…,yN)T。
假設(shè)xk(k=1,2,…,m)為輸入層的第k個輸入樣本,yi(i=1,2,…,N)為輸出層的第i個輸出值,ωij為連接輸出層節(jié)點i和隱含層節(jié)點j的權(quán)值,ωjk為連接隱含層節(jié)點j和輸入層節(jié)點k的權(quán)值,di是第i個輸出層節(jié)點閾值,dj是第j個隱含層節(jié)點閾值,aj是第j個隱含層節(jié)點的伸縮因子,bj是第j個隱含層節(jié)點的平移因子,則小波-BP神經(jīng)網(wǎng)絡(luò)的模型可以表示為:
(13)
(14)
式中:yi(t)為小波-BP神經(jīng)網(wǎng)絡(luò)模型的輸出值;ψa,b為小波基函數(shù)。
采用Morlet小波函數(shù)作為小波基函數(shù),Morlet小波函數(shù)計算公式為:
ψ(t)=cos (1.75t)exp(-t2/2)
(15)
由Morlet小波函數(shù)ψ(t)通過尺度因子a和平移因子b進行變換,得到小波-BP神經(jīng)網(wǎng)絡(luò)所采用的小波基函數(shù)為:
(16)
神經(jīng)網(wǎng)絡(luò)的權(quán)值、伸縮因子和平移因子根據(jù)誤差目標函數(shù)進行調(diào)整,使誤差目標函數(shù)達到最小。誤差目標函數(shù)為:
(17)
式中:Yi為樣本實際值;Ti為小波-BP神經(jīng)網(wǎng)絡(luò)預(yù)測值;N為輸出樣本數(shù)目。
針對神經(jīng)網(wǎng)絡(luò)傳統(tǒng)修正方法存在學習效率低、收斂速度慢和易陷入局部最小狀態(tài)的缺陷,筆者對神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)修正方法進行改進,以提高小波-BP神經(jīng)網(wǎng)絡(luò)的預(yù)測精度和計算效率。
根據(jù)誤差的變化情況自動對學習速率進行調(diào)整,以保證神經(jīng)網(wǎng)絡(luò)總是以最大的可接受的學習速率進行訓練,改善收斂性能,提高訓練效率。自適應(yīng)學習速率η的計算公式為:
(18)
為了進一步提高神經(jīng)網(wǎng)絡(luò)的收斂速度,采用附加動量法對神經(jīng)網(wǎng)絡(luò)參數(shù)進行修正,自適應(yīng)動量因子c的計算公式為:
采用動量-自適應(yīng)學習速率修正算法對神經(jīng)網(wǎng)絡(luò)的權(quán)值、伸縮因子和平移因子進行修正的計算公式為:
Δωij(t+1)=(1-c)ηey+cΔωij(t)
(20)
Δωjk(t+1)=(1-c)ηey+cΔωjk(t)
(21)
(22)
(23)
式中:e為神經(jīng)元節(jié)點的誤差值;y為神經(jīng)網(wǎng)絡(luò)輸出層的輸出值;E為訓練誤差目標函數(shù)。
神經(jīng)網(wǎng)絡(luò)模型評價指標采用平均百分比誤差(EMAPE)和均方根誤差(ERMSE),計算公式為:
(24)
(25)
基于主成分分析的小波-BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測流程見圖1,具體實現(xiàn)步驟如下:
(1) 對風速數(shù)據(jù)樣本總體進行KMO和Bartlett球度檢驗,根據(jù)各自的檢驗統(tǒng)計量來選取最佳風速數(shù)據(jù)樣本。
(2) 對最佳風速數(shù)據(jù)樣本進行主成分分析,得到風速主成分數(shù)據(jù)。
(3) 采用樣本主成分數(shù)據(jù)進行小波-BP神經(jīng)網(wǎng)絡(luò)訓練,根據(jù)誤差目標函數(shù)進行網(wǎng)絡(luò)修正,直至滿足訓練終止條件。
(4) 使用訓練結(jié)束的小波-BP神經(jīng)網(wǎng)絡(luò)模型進行預(yù)測,輸出風速預(yù)測結(jié)果。
圖1 基于主成分分析的小波-BP神經(jīng)網(wǎng)絡(luò)預(yù)測流程
4.1 KMO和Bartlett球度檢驗以及主成分分析
以我國某風電場2015年的全年風速監(jiān)測數(shù)據(jù)為例,日風速數(shù)據(jù)采樣間隔為30 min,日采樣點數(shù)目為48,總共選取12組風速數(shù)據(jù),每組風速數(shù)據(jù)為共20日內(nèi)的歷史風速數(shù)據(jù),分別進行KMO和Bartlett球度檢驗,得到12組風速數(shù)據(jù)的雙檢驗結(jié)果(見表1)。
表1 KMO和Bartlett球度檢驗結(jié)果
KMO檢驗衡量標準是檢驗統(tǒng)計量在0.5以上就可以進行主成分分析,越接近于1,則越適合進行主成分分析。Bartlett球度檢驗相伴概率小于顯著水平0.05或者0.01時,則適合進行主成分分析。因此,根據(jù)表1的檢驗結(jié)果,選取第8組風速樣本數(shù)據(jù)進行主成分分析,用于神經(jīng)網(wǎng)絡(luò)模型的訓練和預(yù)測。對第8組數(shù)據(jù)進行主成分分析,數(shù)據(jù)變量類型包括風速、風向、氣壓、相對濕度和溫度,計算數(shù)據(jù)主成分特征值及其對應(yīng)的方差貢獻率,分析結(jié)果見表2。
表2 主成分特征值及方差貢獻率
通過對20日的最佳歷史風速數(shù)據(jù)進行主成分分析,根據(jù)累計方差貢獻率大于85%為選取依據(jù),將風速預(yù)測影響因素降低為4個主要影響指標:風速、風向、氣壓和相對濕度。通過主成分分析對數(shù)據(jù)進行處理,既包含了原始數(shù)據(jù)樣本所提供的絕大部分信息,又避免了維數(shù)“災(zāi)難”,使神經(jīng)網(wǎng)絡(luò)的輸入維度降低,提高神經(jīng)網(wǎng)絡(luò)的訓練和預(yù)測效率。
4.2 短期風速預(yù)測
為了對PCA-WNN模型預(yù)測結(jié)果的準確性和有效性進行評估,采用BP神經(jīng)網(wǎng)絡(luò)、小波-BP神經(jīng)網(wǎng)絡(luò)與其對比分析預(yù)測精度和預(yù)測運行時間。使用Matlab-R2013a仿真平臺,計算機CPU為Intel i3,主頻2.13 GHz。
PCA-WNN預(yù)測模型將主成分風速數(shù)據(jù)作為模型輸入,模型結(jié)構(gòu)4-13-1,采用Morlet小波函數(shù)作為小波基函數(shù),訓練迭代次數(shù)8 000,動量因子0.95,學習速率0.05,采用動量-自適應(yīng)學習速率修正算法。未采用主成分分析法的BP預(yù)測模型和WNN預(yù)測模型結(jié)構(gòu)6-13-1,訓練迭代次數(shù)10 000,動量因子0.95,學習速率0.05,采用動量-自適應(yīng)學習速率修正算法。采用以上三種預(yù)測模型,對未來24 h風速進行預(yù)測,分別預(yù)測未來第1日、第2日、第3日三天的風速數(shù)據(jù)(見圖2~圖4)。
圖2 第1日的風速預(yù)測曲線
圖3 第2日的風速預(yù)測曲線
圖4 第3日的風速預(yù)測曲線
對以上三日的風速預(yù)測曲線結(jié)果以及預(yù)測誤差和運行時間進行分析,得到三種不同預(yù)測模型的預(yù)測誤差和預(yù)測運行時間的結(jié)果見表4和表5。
表4 三種模型的預(yù)測誤差和預(yù)測運行時間
表5 三種模型的平均預(yù)測誤差和預(yù)測運行時間
根據(jù)以上三種不同模型的預(yù)測誤差可以看出:PCA-WNN模型的預(yù)測精度明顯優(yōu)于BP模型和WNN模型,綜合對未來三日的預(yù)測結(jié)果,PCA-WNN模型比BP模型和WNN模型平均百分比誤差分別降低了21.122 1%和8.475%,均方根誤差分別降低了0.752 8 m/s和0.422 5 m/s,運行時間分別降低了10.139 9 s和37.517 1 s。由于WNN模型和BP模型的模型結(jié)構(gòu)一致,但是WNN模型比BP模型的修正訓練參數(shù)多了伸縮因子和平移因子,所以WNN模型預(yù)測運行時間長于BP模型,而PCA-WNN模型的模型結(jié)構(gòu)較前兩者模型進行了簡化,所以PCA-WNN模型的預(yù)測運行時間短于BP模型和WNN模型。仿真結(jié)果表明:采用KMO和Bartlett球度檢驗來選取最佳日風速歷史數(shù)據(jù),充分結(jié)合主成分分析后,小波-BP神經(jīng)網(wǎng)絡(luò)能夠更加準確、快速地把握風速內(nèi)在變化規(guī)律,能夠有效地對未來風速進行預(yù)測。
通過采用基于KMO-Bartlett典型風速選取的PCA-WNN短期風速預(yù)測模型進行測試和模擬計算,可以得到以下結(jié)論:
(1) 采用KMO-Bartlett雙檢驗對歷史風速數(shù)據(jù)進行挖掘分析,能夠有效選取最佳風速數(shù)據(jù)樣本,充分利用主成分分析對多維、互相關(guān)的風速數(shù)據(jù)樣本進行主成分提取,增強了數(shù)據(jù)間的相關(guān)性,簡化了神經(jīng)網(wǎng)絡(luò)模型。
(2) 對小波-BP神經(jīng)網(wǎng)絡(luò)的修正計算公式進行改進,在一定程度上提高了網(wǎng)絡(luò)的收斂速度,提高了神經(jīng)網(wǎng)絡(luò)的訓練效率。
(3) 通過算例仿真表明,該方法優(yōu)于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)預(yù)測模型,既提高了預(yù)測精度,又降低了預(yù)測運行時間,表明了該方法的有效性和實效性,能夠為風能資源評估、減少風電備用機組以及風電功率躉售提供相關(guān)依據(jù),而且對風電場的規(guī)劃設(shè)計、開停機計劃安排等均具有重要意義。
[1] 鄭婷婷,王海霞,李衛(wèi)東. 風電預(yù)測技術(shù)及其性能評價綜述[J]. 南方電網(wǎng)技術(shù),2013,7(2): 104-109.
[2] KHALID M, SAVKIN A V. A method for short-term wind power prediction with multiple observation points[J]. IEEE Transactions on Power Systems, 2012, 27(2): 579-586.
[3] 劉瑞葉,黃磊. 基于動態(tài)神經(jīng)網(wǎng)絡(luò)的風電場輸出功率預(yù)測[J]. 電力系統(tǒng)自動化,2012,36(11): 19-22,37.
[4] STATHOPOULOS C, KAPERONI A, GALANIS G, et al. Wind power prediction based on numerical and statistical models[J]. Journal of Wind Engineering and Industrial Aerodynamics, 2013, 112: 25-38.
[5] 陳妮亞,錢政,孟曉風,等. 基于空間相關(guān)法的風電場風速多步預(yù)測模型[J]. 電工技術(shù)學報,2013,28(5): 15-21.
[6] 楊明莉,劉三明,王致杰,等. 卡爾曼小波神經(jīng)網(wǎng)絡(luò)風速預(yù)測[J]. 電力系統(tǒng)及其自動化學報,2015,27(12): 42-46.
[7] 林常青,上官安琪,徐箭,等. 基于樣本熵和支持向量機的短期風速預(yù)測模型[J]. 電力科學與技術(shù)學報,2014,29(4): 12-17.
[8] 王程,雷金勇,許愛東,等. 基于誤差分類的分布式光伏超短期功率預(yù)測[J]. 南方電網(wǎng)技術(shù),2015,9(4): 41-46.
[9] 劉興杰,岑添云,鄭文書,等. 基于模糊粗糙集與改進聚類的神經(jīng)網(wǎng)絡(luò)風速預(yù)測[J]. 中國電機工程學報,2014,34(19): 3162-3169.
[10] 馬斌,張麗艷,郭成. 一種變權(quán)重風電功率最優(yōu)組合預(yù)測模型[J]. 電力系統(tǒng)保護與控制,2016,44(5): 117-121.
[11] 王愷,關(guān)少卿,汪令祥,等. 基于模糊信息?;妥钚《酥С窒蛄繖C的風電功率聯(lián)合預(yù)測建模[J]. 電力系統(tǒng)保護與控制,2015,43(2): 26-32.
[12] 師洪濤,楊靜玲,丁茂生,等. 基于小波-BP神經(jīng)網(wǎng)絡(luò)的短期風電功率預(yù)測方法[J]. 電力系統(tǒng)自動化,2011,35(16): 44-48.
[13] 尹東陽,盛義發(fā),蔣明潔,等. 基于粗糙集理論-主成分分析的Elman神經(jīng)網(wǎng)絡(luò)短期風速預(yù)測[J]. 電力系統(tǒng)保護與控制,2014,42(11): 46-51.
[14] 馬斌,張麗艷. 一種基于徑向基神經(jīng)網(wǎng)絡(luò)的短期風電功率直接預(yù)測方法[J]. 電力系統(tǒng)保護與控制,2015,43(19): 78-82.
[15] 何東,劉瑞葉. 基于主成分分析的神經(jīng)網(wǎng)絡(luò)動態(tài)集成風功率超短期預(yù)測[J]. 電力系統(tǒng)保護與控制,2013,41(4): 50-54.
[16] 周松林,茆美琴,蘇建徽. 基于主成分分析與人工神經(jīng)網(wǎng)絡(luò)的風電功率預(yù)測[J]. 電網(wǎng)技術(shù),2011,35(9): 128-132.
[17] 王麗婕,冬雷,高爽. 基于多位置NWP與主成分分析的風電功率短期預(yù)測[J]. 電工技術(shù)學報,2015,30(5): 79-84.
[18] 肖遷,李文華,李志剛,等. 基于改進的小波-BP神經(jīng)網(wǎng)絡(luò)的風速和風電功率預(yù)測[J]. 電力系統(tǒng)保護與控制,2014,42(15): 80-86.
Short-term Wind Speed Forecasting Using PCA-WNN Based on KMO-Bartlett Typical Wind Speed Selection
Xie Kun, Zhang Junfang
(School of Automation, Nanjing University of Science and Technology, Nanjing 210094, China)
Against the redundancy of wind speed information in wind power prediction that results in difficulties for neural network to get the inherent law and therefore affect the training efficiency, the optimal wind speed data were selected for principal component analysis (PCA), while improved wavelet-BP neural network (WNN) was adopted for wind speed prediction. Based on KMO and Bartlett’s test of sphericity, the optimal wind speed data were selected and then extracted using PCA to optimize the inputs of neural network, thus improving the convergence rate and prediction accuracy of the network. By comparing the simulation results on wind speed data of a wind farm with other methods, the wavelet-BP neural network model based on PCA is proved to have high prediction accuracy and good generalization performance, verifying the correctness and effectiveness of this method.
wind speed prediction; KMO test; Bartlett’s test of sphericity; principal component analysis; wavelet-BP neural network
2016-07-22;
2016-08-04
國家自然科學基金資助項目(51507080)
解 坤(1991—),男,在讀碩士研究生,研究方向為電力系統(tǒng)優(yōu)化、運行與控制。
E-mail: 15062255164@163.com
TM614
A
1671-086X(2017)02-0086-06
新能源