余 敖,陳 亮,彭敬濤
(東華大學(xué) 信息科學(xué)與技術(shù)學(xué)院,上海 201620)
基于遲滯ELM模型的短期風(fēng)速預(yù)測(cè)
余 敖,陳 亮,彭敬濤
(東華大學(xué) 信息科學(xué)與技術(shù)學(xué)院,上海 201620)
為了應(yīng)對(duì)能源危機(jī),許多國家開始大力發(fā)展最有發(fā)展前景之一的風(fēng)能,而風(fēng)速預(yù)測(cè)是進(jìn)行風(fēng)電場出力預(yù)測(cè)的前提條件。目前常用的風(fēng)速預(yù)測(cè)方法沒有得到很高的預(yù)測(cè)精度以及預(yù)測(cè)時(shí)間。為了改善風(fēng)速時(shí)間序列的預(yù)測(cè)精度和預(yù)測(cè)時(shí)間,提出了一種基于遲滯極速學(xué)習(xí)機(jī)(Extreme Learning Machine)模型的風(fēng)速預(yù)測(cè)方法。ELM算法是一種新型神經(jīng)網(wǎng)絡(luò),計(jì)算效率高,性能優(yōu)越,能避免局部最小化。通過改變神經(jīng)元激勵(lì)函數(shù)的方式將遲滯特性引入神經(jīng)網(wǎng)絡(luò)中,以增強(qiáng)歷史輸入對(duì)當(dāng)前響應(yīng)的影響,從而提高有用信息的利用率,提高風(fēng)速時(shí)間序列的預(yù)測(cè)性能。仿真結(jié)果表明,與ELM模型等方法相比,遲滯ELM模型能夠有效減小風(fēng)速時(shí)間序列的預(yù)測(cè)誤差,提高了預(yù)測(cè)精度以及減少了預(yù)測(cè)時(shí)間。
極速學(xué)習(xí)機(jī);遲滯;風(fēng)速預(yù)測(cè);機(jī)器學(xué)習(xí)
隨著世界經(jīng)濟(jì)的快速發(fā)展和人口的快速增長,世界各國對(duì)能源的需求量也日益增大,而傳統(tǒng)的不可再生能源將逐漸枯竭,這可能導(dǎo)致全球能源危機(jī)。為了應(yīng)對(duì)能源危機(jī),世界各國對(duì)風(fēng)能源產(chǎn)生了濃厚的興趣。風(fēng)能是一種清潔的可再生能源,風(fēng)能利用的主要形式是風(fēng)力發(fā)電,也是目前可再生能源中技術(shù)最成熟、最具規(guī)?;_發(fā)條件和商業(yè)化發(fā)展前景的發(fā)電方式之一[1]。
風(fēng)速的隨機(jī)性很強(qiáng),而這種隨機(jī)性給電力系統(tǒng)帶來很大的沖擊,對(duì)電能質(zhì)量、系統(tǒng)穩(wěn)定性、電力調(diào)度等有較大的影響。對(duì)風(fēng)力發(fā)電的出力進(jìn)行預(yù)測(cè)可以在很大程度上降低風(fēng)力發(fā)電的缺點(diǎn)對(duì)電網(wǎng)帶來的不利影響,而風(fēng)速預(yù)測(cè)是進(jìn)行風(fēng)電場出力預(yù)測(cè)的前提條件[2]。
風(fēng)速時(shí)間序列的預(yù)測(cè)研究在風(fēng)電并網(wǎng)、氣象監(jiān)測(cè)等許多領(lǐng)域具有廣泛的應(yīng)用前景,是當(dāng)前研究的熱點(diǎn)問題之一[3]。目前,常用的風(fēng)速時(shí)間序列預(yù)測(cè)分析方法有神經(jīng)網(wǎng)絡(luò)法、持續(xù)法、時(shí)間序列法、模糊邏輯法、卡爾曼濾波法、混沌時(shí)間序列預(yù)測(cè)分析法等[4-8]。這些預(yù)測(cè)方法運(yùn)用不同的理論對(duì)風(fēng)速序列展開預(yù)測(cè)研究,從不同的角度對(duì)風(fēng)速序列的預(yù)測(cè)性能起到改善作用,同時(shí)也證實(shí)了風(fēng)速序列預(yù)測(cè)的可行性。在這些方法中,由于本身的自適應(yīng)學(xué)習(xí)能力和靈活性,神經(jīng)網(wǎng)絡(luò)已經(jīng)越來越多地應(yīng)用于風(fēng)速預(yù)測(cè)[9]。神經(jīng)網(wǎng)絡(luò)方法在黑箱系統(tǒng)建模方面擁有很大的優(yōu)勢(shì),因此在時(shí)間序列預(yù)測(cè)分析中具有良好的預(yù)測(cè)性能。
極速學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)是一種新型的單隱層前饋神經(jīng)網(wǎng)絡(luò),ELM算法提供了一個(gè)結(jié)合支持向量機(jī)(SVM)、徑向基函數(shù)(RBF)以及標(biāo)準(zhǔn)的前饋神經(jīng)網(wǎng)絡(luò)優(yōu)勢(shì)的統(tǒng)一學(xué)習(xí)平臺(tái)。在計(jì)算方面,ELM算法克服了昂貴的學(xué)習(xí)代價(jià),比如反向傳播[10]。因?yàn)檫@些優(yōu)勢(shì),ELM算法或者基于ELM的改進(jìn)算法廣泛應(yīng)用于時(shí)間序列預(yù)測(cè)方面。Ronay A K等[11]利用ELM算法和最近鄰算法進(jìn)行短期風(fēng)速預(yù)測(cè)。王智慧[12]利用移動(dòng)加權(quán)ELM算法進(jìn)行股票預(yù)測(cè)以及帶有遺忘機(jī)制的在線序列ELM算法進(jìn)行股票預(yù)測(cè)。李彬等[13]利用ELM算法進(jìn)行混沌時(shí)間序列預(yù)測(cè)等。和傳統(tǒng)的學(xué)習(xí)算法相比,ELM算法不需要同時(shí)訓(xùn)練隱含層的參數(shù)以及輸出權(quán)值,只是隨機(jī)給定隱含層參數(shù),因此節(jié)省了大量的計(jì)算時(shí)間。由于ELM的快速學(xué)習(xí)和不嚴(yán)格遵守優(yōu)化原則,使得ELM的隨機(jī)分配更像生物神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)機(jī)制。同時(shí),ELM算法的訓(xùn)練過程是一個(gè)能夠直接得到輸出矩陣的廣義逆的線性的最小二乘法計(jì)算過程。
正是因?yàn)橐陨喜煌c(diǎn),使得ELM算法的計(jì)算復(fù)雜度遠(yuǎn)低于傳統(tǒng)算法。
但是,隨機(jī)給定隱含層的參數(shù),或多或少降低ELM算法的學(xué)習(xí)性能。除此之外,對(duì)隱含層節(jié)點(diǎn)的數(shù)量,并沒有準(zhǔn)確估計(jì)的方法,這是值得研究的一個(gè)點(diǎn)。在實(shí)際應(yīng)用中,可以由交叉驗(yàn)證,但由于技術(shù)花費(fèi)代價(jià)大,導(dǎo)致不能在線使用。
ELM神經(jīng)網(wǎng)絡(luò)的記憶能力和泛化性能主要取決于網(wǎng)絡(luò)的連接權(quán)值,ELM神經(jīng)網(wǎng)絡(luò)根據(jù)當(dāng)前輸入得到未來的輸出,而對(duì)于訓(xùn)練數(shù)據(jù)中所蘊(yùn)含的歷史變化趨勢(shì)等信息利用不夠充分,而在生物神經(jīng)網(wǎng)絡(luò)中普遍存在遲滯特性,這些遲滯特性可以提高神經(jīng)元對(duì)歷史變化信息的利用率[14],從而改善ELM神經(jīng)網(wǎng)絡(luò)的性能。
使用遲滯激勵(lì)函數(shù)的神經(jīng)元的輸出不僅取決于它的輸入,還取決于輸入的導(dǎo)數(shù)信息。最重要的是它為神經(jīng)元提供記憶的信息。除此之外,當(dāng)輸入卡住在傳統(tǒng)的Sigmoid激勵(lì)函數(shù)的飽和區(qū)域,遲滯函數(shù)可以在兩個(gè)遲滯Sigmoid激勵(lì)函數(shù)之間進(jìn)行自由切換,從而避免神經(jīng)元陷入局部最小值以及使得整個(gè)神經(jīng)網(wǎng)絡(luò)獲得更快的學(xué)習(xí)速度。
因此,提出了一種基于遲滯ELM模型的算法來預(yù)測(cè)短期風(fēng)速序列。利用遲滯ELM神經(jīng)網(wǎng)絡(luò)進(jìn)行短期風(fēng)速預(yù)測(cè),不僅可以使用當(dāng)前數(shù)據(jù)信息,而且還可以使用歷史數(shù)據(jù)信息,因此大大地提高了風(fēng)速預(yù)測(cè)的性能。
ELM算法是新加坡南陽理工大學(xué)的Huang教授等在2004年提出的一種神經(jīng)網(wǎng)絡(luò)模型[10,15]。前饋神經(jīng)網(wǎng)絡(luò)通常用于解決回歸問題和分類問題[16]。接下來,從回歸的角度來介紹其數(shù)學(xué)模型。
(1)
其中,ωi=[ωi1,ωi2,…,ωin]T為第i個(gè)隱含層節(jié)點(diǎn)的輸入權(quán)值;αi∈R為第i個(gè)隱含層節(jié)點(diǎn)的閾值;βi∈Rm為第i個(gè)隱含層節(jié)點(diǎn)的輸出權(quán)值;ωi·xj為ωi和xj的內(nèi)積;激勵(lì)函數(shù)g(x)通常選取Sigmoid函數(shù)。
式(1)的簡潔表達(dá)式如下:
Hβ=Y
(2)
其中
其中,H為隱含層輸出矩陣。
選取均方值誤差E(W)作為評(píng)價(jià)標(biāo)準(zhǔn)。在SLFN模型中,問題是找到最優(yōu)參數(shù)ω,α,β使得目標(biāo)函數(shù)E(W)最小。具體的數(shù)學(xué)表達(dá)式如下所示:
(3)
(4)
其中,εj=[εj1,εj2,…,εjm]為第j個(gè)誤差。
Huang[17]已經(jīng)證明:如果(ω,α)是隨機(jī)選定,那么隱含層輸出矩陣H也會(huì)確定。然后,式(3)的問題是一個(gè)標(biāo)準(zhǔn)的最小二乘法問題,其解決方案如下:
β*=H+Y
(5)
其中,H+是H的Moore-Penrose廣義逆。
Huang[17]把這種算法稱為ELM。
ELM算法表現(xiàn)出一些不同于傳統(tǒng)學(xué)習(xí)模式(比如誤差反向傳播算法)的地方:
(1)傳統(tǒng)的訓(xùn)練過程是一個(gè)復(fù)雜的非線性優(yōu)化問題,然而ELM算法的訓(xùn)練過程是一個(gè)能夠直接得到輸出矩陣的廣義逆的線性的最小二乘法計(jì)算過程。
(2)不像傳統(tǒng)的學(xué)習(xí)算法需要同時(shí)訓(xùn)練隱含層的參數(shù)(ω,α)以及輸出權(quán)值β,ELM算法只是隨機(jī)給定隱含層參數(shù),因此節(jié)省了大量的計(jì)算時(shí)間。
這種隨機(jī)分配也更像生物神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)機(jī)制。正是這些不同點(diǎn)使得ELM算法的計(jì)算復(fù)雜度遠(yuǎn)低于傳統(tǒng)算法。
由于ELM的快速學(xué)習(xí)和不嚴(yán)格遵守優(yōu)化原則,使得ELM的隨機(jī)分配更像生物神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)機(jī)制。但是,在這樣重要復(fù)雜的推導(dǎo)中,特別是隨機(jī)給定隱含層的參數(shù),或多或少降低了ELM算法的學(xué)習(xí)性能。除此之外,對(duì)隱含層節(jié)點(diǎn)的數(shù)量,也沒有準(zhǔn)確估計(jì)的方法,只是手動(dòng)嘗試。在實(shí)際應(yīng)用程序中,可以由交叉驗(yàn)證,但技術(shù)花費(fèi)代價(jià)大,不能在線使用。
3.1 遲滯函數(shù)
遲滯在自然界中是隨處可見的一種非線性現(xiàn)象。滯后的定義是一個(gè)滯后效應(yīng)由于力量作用于自身的變化。許多工程系統(tǒng)具有遲滯現(xiàn)象,例如機(jī)械結(jié)構(gòu)和鐵磁材料。滯后型非線性的識(shí)別也已經(jīng)研究了很多年[18]。遲滯特性分為離散遲滯和連續(xù)遲滯。對(duì)于離散遲滯神經(jīng)元模型來說:
(1)如果一個(gè)神經(jīng)元的輸入低于某個(gè)閾值(低于跳變點(diǎn)),神經(jīng)元的輸出是零。
(2)如果一個(gè)神經(jīng)元的輸入超過一個(gè)閾值(高于跳變點(diǎn)),就會(huì)使得神經(jīng)元的輸出為一個(gè)定值。
(3)如果一個(gè)神經(jīng)元的輸入在這兩個(gè)閾值之間,神經(jīng)元的輸出等于它的前一個(gè)值。
圖1(a)展示了離散遲滯。因?yàn)檩敵鲋挥袃煞N狀態(tài),也叫二進(jìn)制離散遲滯。離散遲滯應(yīng)用在Hopfield神經(jīng)網(wǎng)絡(luò)中比較多,可以求解組合優(yōu)化的問題(如N皇后問題[19]、旅行商問題[20]以及交叉開關(guān)分組交換問題[21]等等),同時(shí)離散遲滯也會(huì)引起系統(tǒng)的同步[22]。目前已有研究,并且已應(yīng)用于圖像著色的問題[23]。
對(duì)于連續(xù)遲滯神經(jīng)元模型來說:
(1)如果一個(gè)神經(jīng)元的輸入低于某個(gè)閾值(低于跳變點(diǎn)),神經(jīng)元的輸出是零。
(2)如果一個(gè)神經(jīng)元的輸入超過一個(gè)閾值(高于跳變點(diǎn)),就會(huì)使得神經(jīng)元的輸出為一個(gè)定值。
(3)如果一個(gè)神經(jīng)元的輸入在這兩個(gè)閾值之間,神經(jīng)元的輸出通過激勵(lì)函數(shù)的計(jì)算公式得到。
圖1(b)展示了連續(xù)遲滯。連續(xù)遲滯和離散遲滯相比,就是第三種情況不太一樣。連續(xù)遲滯用在Hopfield神經(jīng)網(wǎng)絡(luò)上也很廣泛。Bharitkar等[24]在2000年提出了連續(xù)遲滯Hopfield神經(jīng)網(wǎng)絡(luò)。該神經(jīng)網(wǎng)絡(luò)的激勵(lì)函數(shù)由兩個(gè)加了遲滯參數(shù)的Sigmoid函數(shù)組成(見圖1(b))。與普通的Sigmoid激勵(lì)函數(shù)相比,神經(jīng)元的輸出不僅依賴于輸入,而且也依賴于其輸入的導(dǎo)數(shù)。最重要的是它為神經(jīng)元提供記憶的信息。除此之外,在神經(jīng)網(wǎng)絡(luò)的訓(xùn)練中,遲滯特性還可以抑制故障飽和現(xiàn)象。連續(xù)遲滯Hopfield神經(jīng)網(wǎng)絡(luò)也已經(jīng)應(yīng)用于解決N皇后問題[24-25]、時(shí)分多址廣播調(diào)度問題[26]、風(fēng)速預(yù)測(cè)問題[27]、控制與優(yōu)化問題[28]等等。
圖1 遲滯函數(shù)
從上述內(nèi)容可以看到,遲滯主要是從Hopfield神經(jīng)網(wǎng)絡(luò)以及典型的動(dòng)力系統(tǒng)中引入的。
由于短期風(fēng)速預(yù)測(cè)適合連續(xù)的遲滯函數(shù),所以只介紹連續(xù)的遲滯函數(shù)。遲滯神經(jīng)元的激勵(lì)函數(shù)數(shù)學(xué)描述如下所示:
(6)
(7)
其中,x(t)為神經(jīng)元的輸入。
激勵(lì)函數(shù)由兩個(gè)加了遲滯參數(shù)的Sigmoid函數(shù)組成,a和b是最主要的參數(shù),ca和cb都是正斜率參數(shù)。當(dāng)a=b=0和ca=cb=1時(shí),該遲滯Sigmoid激勵(lì)函數(shù)就變成了普通的Sigmoid激勵(lì)函數(shù)。由圖1(b)可以看到,這種神經(jīng)元的輸出不僅取決于它的輸入,還取決于輸入的導(dǎo)數(shù)信息。最重要的是它為神經(jīng)元提供記憶的信息。除此之外,當(dāng)輸入卡住在傳統(tǒng)的Sigmoid激勵(lì)函數(shù)的飽和區(qū)域時(shí),遲滯函數(shù)可以從兩個(gè)遲滯Sigmoid激勵(lì)函數(shù)之間切換,從而避免神經(jīng)元陷入局部最小值以及使得整個(gè)神經(jīng)網(wǎng)絡(luò)獲得更快的學(xué)習(xí)速度。此外,要注意到遲滯神經(jīng)元的激勵(lì)函數(shù)有四個(gè)遲滯參數(shù),即a,b,ca,cb。所以與普通的神經(jīng)元相比,遲滯神經(jīng)元提供了更大的靈活性。
3.2 遲滯ELM神經(jīng)網(wǎng)絡(luò)模型
提出了一種改進(jìn)的遲滯ELM神經(jīng)網(wǎng)絡(luò)模型,通過采用遲滯激勵(lì)函數(shù)來提高泛化能力和聯(lián)想記憶功能,在某種程度上考慮到準(zhǔn)確率和效率,隨機(jī)給定隱含層節(jié)點(diǎn)的參數(shù)。
xaj=[xaj1,xaj2,…,xajn]T,xbj=[xbj1,xbj2,…,xbjn]T
yaj=[yaj1,yaj2,…,yajn]T,ybj=[ybj1,ybj2,…,ybjn]T
具體處理方法參考3.4節(jié)。
首先,隨機(jī)給定遲滯參數(shù)a,b,ca,cb。對(duì)于xaj=[xaj1,xaj2,…,xajn]T,yaj=[yaj1,yaj2,…,yajn]T來說,一個(gè)具有N個(gè)隱含層節(jié)點(diǎn)的單隱層前饋神經(jīng)網(wǎng)絡(luò)模型(SLFN)的具體描述如下:
(8)
其中,ωi=[ωi1,ωi2,…,ωin]T為第i個(gè)隱含層節(jié)點(diǎn)的輸入連接權(quán)值;αi∈R為第i個(gè)隱含層節(jié)點(diǎn)的閾值;βi∈Rm為第i個(gè)隱含層節(jié)點(diǎn)的輸出權(quán)值;ωi·xaj為ωi和xaj的內(nèi)積;激勵(lì)函數(shù)g(x)選取帶有遲滯特性的Sigmoid函數(shù)。
式(4)簡化為:
Hαβα=Yα
(9)
其中
H=
其中,Hα為隱含層輸出矩陣。
(10)
(11)
其中,εj=[εj1,εj2,…,εjm]為第j個(gè)誤差。
然后,式(9)的問題是一個(gè)標(biāo)準(zhǔn)的最小二乘法問題,其解決方案如下所示:
β*=H+Y
(12)
其中,H+是H的Moore-Penrose廣義逆。
根據(jù)該公式可以得到βα,同理得到βb。
最后,將βα和βb相加得到β。
β=βα+βb
(13)
3.3 遲滯參數(shù)調(diào)整
遲滯神經(jīng)元的激活函數(shù)有四個(gè)相關(guān)聯(lián)的遲滯參數(shù),即a,b,ca,cb,這些參數(shù)為神經(jīng)網(wǎng)絡(luò)提供了一個(gè)高度的靈活性。使用梯度下降法來優(yōu)化遲滯參數(shù)。對(duì)于第i個(gè)樣本來說,當(dāng)?shù)趇個(gè)隱含層神經(jīng)元處在上升分支的激勵(lì)響應(yīng)時(shí),遲滯參數(shù)的人工智能訓(xùn)練如下:
(14)
(15)
其中,t為第i次迭代;η為學(xué)習(xí)速率;E(W)和ε(j)同式(10)和式(11)。
對(duì)于第i個(gè)隱含層節(jié)點(diǎn)神經(jīng)元有:
neti=ωi·xj+αi
(16)
同樣地,當(dāng)?shù)趇個(gè)隱含層神經(jīng)元處在下降分支的激勵(lì)響應(yīng)時(shí),遲滯參數(shù)的人工智能訓(xùn)練如下:
(17)
(18)
(19)
(20)
遲滯網(wǎng)絡(luò)參數(shù)的優(yōu)化訓(xùn)練提高了神經(jīng)網(wǎng)絡(luò)適應(yīng)歷史輸入信息的能力,使網(wǎng)絡(luò)可以充分利用訓(xùn)練樣本中包含的有用信息,并能有效地改善泛化能力和聯(lián)想記憶能力。此外,有別于傳統(tǒng)的Sigmoid激勵(lì)函數(shù),在輸入飽和區(qū)域卡住,遲滯函數(shù)可以從兩個(gè)遲滯Sigmoid激勵(lì)函數(shù)之間切換,從而避免神經(jīng)元陷入局部最小值以及使得整個(gè)神經(jīng)網(wǎng)絡(luò)獲得更快的學(xué)習(xí)速度。
3.4 遲滯ELM算法的實(shí)現(xiàn)
與傳統(tǒng)ELM神經(jīng)網(wǎng)絡(luò)相比,遲滯ELM網(wǎng)絡(luò)的每個(gè)神經(jīng)元的激勵(lì)函數(shù)都具有遲滯參數(shù)。為了使網(wǎng)絡(luò)具有良好的泛化性能,遲滯神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過程中除了要進(jìn)行權(quán)值的訓(xùn)練,還要對(duì)遲滯參數(shù)進(jìn)行訓(xùn)練,這增加了神經(jīng)網(wǎng)絡(luò)訓(xùn)練的復(fù)雜性。
為此,提出一種網(wǎng)絡(luò)參數(shù)的混合訓(xùn)練方法,即先采用最小二乘法訓(xùn)練ELM神經(jīng)網(wǎng)絡(luò)的連接權(quán)值,后采用梯度下降法獲取最優(yōu)的遲滯參數(shù)。整體思路:先確定輸出權(quán)值,再確定遲滯參數(shù),再訓(xùn)練好的參數(shù)進(jìn)行短期風(fēng)速預(yù)測(cè)。
令xaj1=xj1,xbj1=0,yaj1=yj1,ybj1=0,然后再將xj2與xj1進(jìn)行對(duì)比,如果xj2大于或者等于xj1,那么令xaj2=xj2,xbj2=0,yaj2=yj2,ybj2=0。否則令xaj2=0,xbj2=xj2,yaj2=0,ybj2=yj2,一直循環(huán)到最后一個(gè)xjn,如果xjn大于或者等于xj(n-1),那么令xajn=xjn,xbjn=0,yajn=yj2,ybjn=0,否則令xajn=0,xbjn=xjn,yajn=0,ybjn=yjn。
整個(gè)遲滯ELM算法的具體實(shí)施步驟如圖2所示。
圖2 實(shí)施步驟
風(fēng)速時(shí)間序列具有很強(qiáng)的波動(dòng)性和隨機(jī)性,傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)由于神經(jīng)元響應(yīng)機(jī)制單一,很難適應(yīng)風(fēng)速的劇烈波動(dòng),因此預(yù)測(cè)結(jié)果并不理想。采用上述遲滯ELM神經(jīng)網(wǎng)絡(luò)開展風(fēng)速時(shí)間序列預(yù)測(cè)分析,與ELM模型的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比。
采取加拿大的ACADIA VALLEY地區(qū)的每小時(shí)的平均風(fēng)速數(shù)據(jù),時(shí)間跨度是從2015年1到7月的風(fēng)速數(shù)據(jù),利用1至6月的數(shù)據(jù)來預(yù)測(cè)7月風(fēng)速數(shù)據(jù),總共650組樣本數(shù)據(jù)。所有實(shí)驗(yàn)都是在同一臺(tái)標(biāo)準(zhǔn)PC上,該P(yáng)C使用的是2.60-GHz Intel Pentium(R) Dual-Core CPU 和2 G的運(yùn)行內(nèi)存,MATLAB版本是R2013a。遲滯ELM網(wǎng)絡(luò)采用3層結(jié)構(gòu),輸入層神經(jīng)元數(shù)量m=6,隱含層神經(jīng)元數(shù)量分別為5,10,20,50,100(在經(jīng)過預(yù)測(cè)結(jié)果對(duì)比之后采用10個(gè)神經(jīng)元),輸出層神經(jīng)元數(shù)量為1。在實(shí)驗(yàn)過程中,分別從隱含層節(jié)點(diǎn)數(shù)和訓(xùn)練樣本數(shù)進(jìn)行實(shí)驗(yàn),評(píng)價(jià)標(biāo)準(zhǔn)是均方誤差、最大誤差、平均誤差、訓(xùn)練時(shí)間、測(cè)試時(shí)間,其中均方誤差最重要。
實(shí)驗(yàn)結(jié)果如下:
(1)用第1組至第600組數(shù)據(jù)作為訓(xùn)練樣本,第601組至第650組作為測(cè)試樣本,求取50次的平均值作為計(jì)算結(jié)果,根據(jù)手動(dòng)實(shí)驗(yàn)對(duì)比,發(fā)現(xiàn)隱含層節(jié)數(shù)點(diǎn)為10時(shí),實(shí)驗(yàn)結(jié)果較好。隱含層節(jié)點(diǎn)數(shù)為10時(shí)的實(shí)驗(yàn)結(jié)果如圖3和圖4所示。
圖3 ELM
圖4 遲滯ELM
通過對(duì)表1中的數(shù)據(jù)進(jìn)行對(duì)比分析,可以得到:對(duì)于遲滯ELM算法來說,均方誤差、平均誤差和最大誤差均要比ELM算法好。它的訓(xùn)練時(shí)間和測(cè)試時(shí)間要比ELM算法稍微長點(diǎn),是因?yàn)樵谟?xùn)練階段引入梯度下降法來優(yōu)化遲滯函數(shù)的參數(shù)和在測(cè)試階段隨機(jī)給定隱含層神經(jīng)元連接參數(shù)。無論如何,遲滯ELM所耗費(fèi)的時(shí)間是可以承受的,均方誤差和泛化能力卻得到顯著提高。
表1 不同算法的性能比較
(2)用第1組至第300組數(shù)據(jù)作為訓(xùn)練樣本,第601組至第650組作為測(cè)試樣本,求取50次的平均值作為計(jì)算結(jié)果作為比較的第一組;用第300組至第600組數(shù)據(jù)作為訓(xùn)練樣本,第601組至第650組作為測(cè)試樣本,求取5次的平均值作為計(jì)算結(jié)果作為比較的第二組;兩組對(duì)比實(shí)驗(yàn)結(jié)果如表2所示。
表2 不同算法以及不同樣本數(shù)據(jù)的比較
通過對(duì)表2中的數(shù)據(jù)進(jìn)行對(duì)比分析,可以得到:不同的訓(xùn)練樣本對(duì)預(yù)測(cè)結(jié)果是有影響的,但是,對(duì)于同一樣本來說,遲滯ELM的預(yù)測(cè)均方誤差還是要小于ELM。
為了應(yīng)對(duì)由于世界經(jīng)濟(jì)的高速發(fā)展帶來的能源危機(jī),世界各國大力發(fā)展清潔的可再生的風(fēng)能。風(fēng)能的發(fā)展與風(fēng)電場的出力息息相關(guān),風(fēng)速預(yù)測(cè)又是進(jìn)行風(fēng)電場出力預(yù)測(cè)的前提條件。目前常用的風(fēng)速預(yù)測(cè)方法預(yù)測(cè)精度不高、預(yù)測(cè)時(shí)間較短。為了改善風(fēng)速時(shí)間序列的預(yù)測(cè)精度和預(yù)測(cè)時(shí)間,提出了一種基于遲滯ELM模型的風(fēng)速預(yù)測(cè)方法,并且進(jìn)行了對(duì)比實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,與利用ELM模型進(jìn)行短期風(fēng)速預(yù)測(cè)的結(jié)果相比,利用遲滯ELM模型進(jìn)行短期風(fēng)速預(yù)測(cè)的預(yù)測(cè)精度更高,預(yù)測(cè)時(shí)間更短。因此,遲滯ELM模型能夠有效減小風(fēng)速時(shí)間序列的預(yù)測(cè)誤差,提高預(yù)測(cè)精度以及減少預(yù)測(cè)時(shí)間,從效率上來說學(xué)習(xí)系統(tǒng)具有更好的誤差和泛化能力。
[1] 邵 璠.風(fēng)電場短期風(fēng)速預(yù)測(cè)研究[D].烏魯木齊:新疆大學(xué),2008.
[2] 韓 爽,楊勇平,劉永前.三種方法在風(fēng)速預(yù)測(cè)中的應(yīng)用研究[J].華北電力大學(xué)學(xué)報(bào),2008,35(3):57-61.
[3] 陳丹丹,李永光,張 瑩,等.風(fēng)電場風(fēng)速預(yù)測(cè)的研究方法[J].上海電力學(xué)院學(xué)報(bào),2011,27(3):247-251.
[4] 蔣金良,林廣明.基于ARIMA模型的自動(dòng)站風(fēng)速預(yù)測(cè)[J].控制理論與應(yīng)用,2008,25(2):374-376.
[5] 黃小華,李德源,呂文閣,等.基于人工神經(jīng)網(wǎng)絡(luò)模型的風(fēng)速預(yù)測(cè)[J].太陽能學(xué)報(bào),2011,32(2):193-197.
[6] 呂 濤,唐 巍,所 麗.基于混沌相空間重構(gòu)理論的風(fēng)電場短期風(fēng)速預(yù)測(cè)[J].電力系統(tǒng)保護(hù)與控制,2010,38(21):113-117.
[7] 谷興凱,范高鋒,王曉蓉,等.風(fēng)電功率預(yù)測(cè)技術(shù)綜述[J].電網(wǎng)技術(shù),2007,31(S2):335-338.
[8] 黃文杰,傅 礫,肖 盛.采用改進(jìn)模糊層次分析法的風(fēng)速預(yù)測(cè)模型[J].電網(wǎng)技術(shù),2010,34(7):164-168.
[9] Wang X,Guo P,Huang X.A review of wind power forecasting models[J].Energy Procedia,2011,12(39):770-778.
[10] Huang G B,Zhou H,Ding X,et al.Extreme learning machine for regression and multiclass classification[J].IEEE Transactions on Systems Man & Cybernetics Part B Cybernetics A Publication of the IEEE Systems Man & Cybernetics Society,2012,42(2):513-529.
[11] Ronay A K,Fink O.Two machine learning approaches for short-term wind speed time-series prediction[J].IEEE Transactions on Neural Networks & Learning Systems,2015,27(8):1734-1747.
[12] 王智慧.BP神經(jīng)網(wǎng)絡(luò)和ELM算法研究[D].杭州:中國計(jì)量學(xué)院,2012.
[13] 李 彬,李貽斌.基于ELM學(xué)習(xí)算法的混沌時(shí)間序列預(yù)測(cè)[J].天津大學(xué)學(xué)報(bào),2011,44(8):701-704.
[14] Wang X,Qiao Q,Wang Z.Solving optimization problems based on neural network with hysteretic activation function[C]//International symposium on advances in neural networks.[s.l.]:[s.n.],2005:745-749.
[15] Huang Guangbin.Extreme learning machine:a new learning scheme of feedforward neural networks[C]//IEEE international joint conference on neural networks.[s.l.]:IEEE,2004:985-990.
[16] Luzanin O,Plancak M.Hand gesture recognition using low-budget data glove and cluster-trained probabilistic neural network[J].Assembly Automation,2014,34(1):94-105.
[17] Huang G B,Zhu Q Y,Siew C K.Extreme learning machine:theory and applications[J].Neurocomputing,2006,70(1):489-501.
[18] Xie S L,Zhang Y H,Chen C H,et al.Identification of nonlinear hysteretic systems by artificial neural network[J].Mechanical Systems and Signal Processing,2013,34(1-2):76-87.
[19] Nakaguchi T,Jin No K,Tanaka M.Hysteresis neural networks for N-queens problems[J].IEICE Transactions on Fundamentals of Electronics Communications & Computerences,1999,82(9):1851-1859.
[20] Nakaguchi T,Jin’No K,Tanaka M.Hysteresis neural networks for solving traveling salesperson problems[C]//IEEE interna-tional symposium on circuits and systems.[s.l.]:IEEE,2000:153-156.
[21] Xia G P,Tang Z,Li Y,et al.A binary Hopfield neural network with hysteresis for large crossbar packet-switches[J].Neurocomputing,2005,67(1):417-425.
[22] Chen L,Lian D H,Wang T.Synchronization stability of a distributed hysteresis controlled system[C]//Industrial electronics and applications.[s.l.]:[s.n.],2012:1616-1620.
[23] Jin N K.Dynamical hysteresis neural networks for graph coloring problem[C]//Applications of nonlinear dynamics.[s.l.]:[s.n.],2009:331-340.
[24] Bharitkar S,Mendel J M.The hysteretic Hopfield neural network[J].IEEE Transactions on Neural Networks,2000,11(4):879-887.
[25] Thangavel P,Gladis D.Hysteretic Hopfield network with dynamic tunneling for crossbar switch and N-queens problem[J].Neurocomputing,2007,70:2544-2551.
[26] Sun M,Xu Y Q,Dai X F,et al.Noise-tuning-based hysteretic noisy chaotic neural network for broadcast scheduling problem in wireless multihop networks[J].IEEE Transactions on Neural Networks and Learning Systems,2012,23(12):1905-1918.
[27] Wang Hongfei,Xiu Chunbo.Hysteretic neural network and its application in the prediction of the wind speed series[C]//26th Chinese control and decision conference.[s.l.]:[s.n.],2014:985-990.
[28] 修春波,劉 暢,郭富慧,等.遲滯混沌神經(jīng)元/網(wǎng)絡(luò)的控制策略及應(yīng)用研究[J].物理學(xué)報(bào),2014,64(6):060504.
Short-term Wind Speed Forecasting by Using Hysteretic ELM Model
YU Ao,CHEN Liang,PENG Jing-tao
(College of Information Science and Technology,Donghua University,Shanghai 201620,China)
The wind,as one of the most promising energy,has been developed by many countries in response to the energy crisis,and the wind speed prediction is the premise of wind farm output prediction.Many wind speed prediction methods are adopted to get high prediction accuracy and prediction of time presently.In order to improve the prediction accuracy and time of wind speed time series,a wind speed prediction method based on hysteresis ELM algorithm has been proposed.ELM algorithm is a new type of neural network,and it has high computational efficiency and superior performance,which can avoid local minimum.Hysteresis characteristics have been introduced in neural network via changing neuronal excitation function to enhance influence of the response history to the current input and thus to improve the utilization rate of useful information and to promote the wind speed time series prediction performance.The simulation results show that compared with the ELM model,the hysteresis ELM model can reduce prediction error of wind speed time series effectively for improvement of prediction accuracy and decreasing of prediction time.
ELM;hysteresis;wind speed prediction;machine learning
2016-06-21
2016-09-22 網(wǎng)絡(luò)出版時(shí)間:2017-03-13
上海市自然科學(xué)基金資助項(xiàng)目(14ZR1400700)
余 敖(1990-),男,碩士研究生,研究方向?yàn)闄C(jī)器學(xué)習(xí)、圖像處理;陳 亮,副教授,研究方向?yàn)闄C(jī)器學(xué)習(xí)、圖像處理。
http://kns.cnki.net/kcms/detail/61.1450.TP.20170313.1547.104.html
TP391
A
1673-629X(2017)06-0130-06
10.3969/j.issn.1673-629X.2017.06.027