翁國慶 龔陽光 舒俊鵬 黃飛騰
(浙江工業(yè)大學(xué)信息工程學(xué)院 杭州 310023)
隨著分布式電源(DG)滲透率的不斷提升、智能計(jì)量和信息通信技術(shù)的快速發(fā)展,配電網(wǎng)由被動控制過渡到主動控制成為趨勢,主動配電網(wǎng)(active distribution network, ADN)已成為未來智能配電網(wǎng)最重要的發(fā)展模式之一[1,2]。但是,由于DG的廣泛接入以及ADN運(yùn)行特性靈活多變,ADN必將面對更加嚴(yán)峻的電能質(zhì)量(power quality,PQ)問題[3]。結(jié)合ADN自身“主動”特征,高水平的主動控制成為其電能質(zhì)量解決方案的最重要內(nèi)容[4]。而實(shí)現(xiàn)高性能的電能質(zhì)量態(tài)勢預(yù)測、評估和預(yù)警,是能夠有效進(jìn)行電能質(zhì)量主動控制的前提。
目前,針對電能質(zhì)量預(yù)測問題國內(nèi)外專家已開展了積極的探索,但系統(tǒng)深入的研究和取得的共識性成果尚少。文獻(xiàn)[5]提出了基于線性回歸法(LR)、隨機(jī)時(shí)間序列法(RTA)和灰色模型(GM)的組合預(yù)測模型,改善了單一方法的預(yù)測精度,但提高了權(quán)重確定及建模的難度。文獻(xiàn)[6]結(jié)合自回歸移動平均(ARIMA)模型與反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)進(jìn)行電能質(zhì)量指標(biāo)項(xiàng)預(yù)測,利用2者各自在非平穩(wěn)序列和高維非線性問題處理上的良好性能,但其對時(shí)序數(shù)據(jù)時(shí)間相關(guān)性的忽略使其在中長期預(yù)測時(shí)準(zhǔn)確性明顯降低。文獻(xiàn)[7]利用離散傅里葉分解與時(shí)間序列自回歸法(AR)相結(jié)合進(jìn)行預(yù)測,因其去除了一部分頻域分量,因此存在預(yù)測結(jié)果整體性缺失的缺陷。文獻(xiàn)[8]提出了一種基于動態(tài)時(shí)間規(guī)整(DTW)及Monte Carlo算法的預(yù)測法,該方法引入聚類思路有效提高了預(yù)測性能,但Monte Carlo算法引入的隨機(jī)性將導(dǎo)致電能質(zhì)量預(yù)測結(jié)果具有一定的不確定性。文獻(xiàn)[9]通過量化電能質(zhì)量指標(biāo)與溫度、儲能電池狀態(tài)等因素的關(guān)系,提出一種預(yù)測效果較好的隨機(jī)森林模型(RF)預(yù)測法,但由于其需考慮具體線路、設(shè)備參數(shù)及運(yùn)行信息,僅適用于某些特定場合。上述文獻(xiàn)所提方法各具特點(diǎn),但在未來具有DG高滲透率的主動配電網(wǎng)背景下,面對系統(tǒng)電能質(zhì)量多重影響因素和電能質(zhì)量各指標(biāo)項(xiàng)數(shù)據(jù)之間的高維、非線性關(guān)聯(lián)特性,如何更好地實(shí)現(xiàn)較長時(shí)間區(qū)段內(nèi)的電能質(zhì)量指標(biāo)項(xiàng)預(yù)測性能仍具有非常大的挑戰(zhàn)性。
近年來,隨著人工智能和機(jī)器學(xué)習(xí)的興起,包括卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)以及深度置信網(wǎng)絡(luò)(DBN)等深度學(xué)習(xí)模型在預(yù)測領(lǐng)域的各個(gè)方面得到了蓬勃發(fā)展和應(yīng)用[10],特別是長短時(shí)記憶網(wǎng)絡(luò)(long short-term memory, LSTM)模型在負(fù)荷預(yù)測等時(shí)間序列預(yù)測方向開始扮演越來越重要的角色。文獻(xiàn)[11]提出了一種基于LSTM神經(jīng)網(wǎng)絡(luò)的智能電網(wǎng)電力負(fù)荷預(yù)測方法,利用LSTM提取負(fù)荷數(shù)據(jù)在較長時(shí)間跨度上的依賴性,實(shí)現(xiàn)了不錯(cuò)的預(yù)測效果。文獻(xiàn)[12,13]提出了一種基于模態(tài)分解及長短時(shí)記憶網(wǎng)絡(luò)的負(fù)荷預(yù)測方法,首先對歷史負(fù)荷數(shù)據(jù)進(jìn)行模態(tài)分解,接著對每個(gè)模態(tài)分量建立LSTM模型,最后結(jié)合模型輸出重構(gòu)預(yù)測結(jié)果。文獻(xiàn)[14]提出了基于CNN-LSTM混合神經(jīng)網(wǎng)絡(luò)模型的負(fù)荷預(yù)測方法,首先使用卷積神經(jīng)網(wǎng)絡(luò)對由負(fù)荷影響因素構(gòu)造的連續(xù)特征圖進(jìn)行特征向量提取,接著利用提取的特征向量建立LSTM模型,最后進(jìn)行負(fù)荷預(yù)測。LSTM深度學(xué)習(xí)獨(dú)特的網(wǎng)絡(luò)特性及其強(qiáng)大的記憶功能,使其可以很好地記憶并充分考慮較長時(shí)間跨度內(nèi)海量多維時(shí)序數(shù)據(jù)的時(shí)間相關(guān)性,具有良好的時(shí)間序列預(yù)測功能。
本文提出了基于改進(jìn)K-means聚類和LSTM網(wǎng)絡(luò)深度學(xué)習(xí)模型的主動配電網(wǎng)電能質(zhì)量穩(wěn)態(tài)指標(biāo)預(yù)測方法。首先,提出基于聚類LSTM模型預(yù)測的系統(tǒng)框架;接著,對該框架中關(guān)鍵的功能模塊實(shí)現(xiàn)原理進(jìn)行詳細(xì)分析,包括基于輪廓系數(shù)法的最優(yōu)類別確定、基于K-means聚類方法的電能質(zhì)量關(guān)聯(lián)數(shù)據(jù)類別劃分、基于隨時(shí)間反向傳播(BPTT)算法和適應(yīng)性動量估計(jì)(Adam)梯度優(yōu)化算法的LSTM深度學(xué)習(xí)網(wǎng)絡(luò)模型構(gòu)建;然后,以偽代碼形式設(shè)計(jì)展示了所提基于聚類LSTM電能質(zhì)量預(yù)測模型的訓(xùn)練學(xué)習(xí)和性能評估實(shí)施算法;最后,通過IEEE-13節(jié)點(diǎn)含分布式電源的主動配電網(wǎng)仿真算例,分析驗(yàn)證了所提主動配電網(wǎng)電能質(zhì)量穩(wěn)態(tài)指標(biāo)預(yù)測方法的有效性和先進(jìn)性。
如圖1所示,基于K-means聚類及LSTM深度學(xué)習(xí)網(wǎng)絡(luò)模型的含DG主動配電網(wǎng)電能質(zhì)量預(yù)測模型的系統(tǒng)框架,主要包括PQ數(shù)據(jù)獲取、PQ數(shù)據(jù)聚類、LSTM模型訓(xùn)練與測試、PQ數(shù)據(jù)預(yù)測4個(gè)功能模塊。
圖1 基于聚類LSTM模型的PQ預(yù)測系統(tǒng)框架
各個(gè)功能模塊主要任務(wù)如下。
PQ數(shù)據(jù)獲取模塊。在含DG的主動配電網(wǎng)中合適位置,布置環(huán)境變量監(jiān)測裝置、負(fù)荷監(jiān)測儀、電能質(zhì)量監(jiān)測儀等智能儀表,獲取較長時(shí)間跨度內(nèi)系統(tǒng)光照強(qiáng)度、溫度等環(huán)境因素?cái)?shù)據(jù)、負(fù)荷數(shù)據(jù),以及對應(yīng)的電能質(zhì)量常用穩(wěn)態(tài)指標(biāo)項(xiàng)數(shù)據(jù),并以相同時(shí)間標(biāo)記為依據(jù)進(jìn)行關(guān)聯(lián)保存,作為預(yù)測模型的訓(xùn)練和性能評估數(shù)據(jù)源。
PQ數(shù)據(jù)聚類。對于已經(jīng)獲得的PQ關(guān)聯(lián)歷史數(shù)據(jù),在進(jìn)行歸一化預(yù)處理后,首先使用輪廓系數(shù)法確定其最優(yōu)分類數(shù),然后使用K-means聚類方法進(jìn)行PQ關(guān)聯(lián)數(shù)據(jù)的分類。
LSTM模型訓(xùn)練與測試。將聚類得到的每一類PQ關(guān)聯(lián)數(shù)據(jù)轉(zhuǎn)換為監(jiān)督學(xué)習(xí)序列,并將其按比例進(jìn)行訓(xùn)練集與測試集的劃分;構(gòu)建LSTM深度學(xué)習(xí)網(wǎng)絡(luò)模型,首先利用訓(xùn)練集中包含的輸入和輸出數(shù)據(jù)完成LSTM網(wǎng)絡(luò)訓(xùn)練,然后利用測試集中包含的輸入和輸出數(shù)據(jù)完成LSTM網(wǎng)絡(luò)模型的預(yù)測性能評估,直至確定各類LSTM預(yù)測模型。
PQ數(shù)據(jù)預(yù)測。獲取未來某時(shí)段目標(biāo)電網(wǎng)的環(huán)境因素預(yù)測數(shù)據(jù)和負(fù)荷預(yù)測數(shù)據(jù),并實(shí)施聚類確定其所屬類別;以其作為輸入數(shù)據(jù),并調(diào)用已完成訓(xùn)練的相應(yīng)類別的LSTM網(wǎng)絡(luò)模型進(jìn)行預(yù)測,模型輸出即為待求的目標(biāo)電網(wǎng)電能質(zhì)量穩(wěn)態(tài)指標(biāo)項(xiàng)的預(yù)測數(shù)據(jù)。
由于電能質(zhì)量各項(xiàng)指標(biāo)數(shù)據(jù)在不同時(shí)間段的歐式空間內(nèi)普遍呈現(xiàn)出相互靠近或相互遠(yuǎn)離的現(xiàn)象,而數(shù)據(jù)挖掘中的K-means硬聚類算法是以距離作為相似度的評價(jià)指標(biāo),因此,在實(shí)施電能質(zhì)量預(yù)測前對其歷史數(shù)據(jù)集進(jìn)行K-means聚類使其中特性相互接近的數(shù)據(jù)歸聚為一類[15],有利于提高系統(tǒng)電能質(zhì)量的預(yù)測精度。
常規(guī)K-means聚類法中對于聚類數(shù)K值是根據(jù)觀察進(jìn)行確定,具有一定的不確定性。針對這一缺陷,本文采用輪廓系數(shù)法進(jìn)行最佳聚類數(shù)Kopt值的選取確定。
對于數(shù)據(jù)集中的某個(gè)樣本點(diǎn)Pi,定義其輪廓系數(shù):
(1)
其中,a為凝聚度,表征Pi與同簇其他樣本的平均距離;c為分離度,表征Pi與最近簇中所有樣本的平均距離。
最近簇的定義為
(2)
其中,q是簇Dk中的某個(gè)樣本,n為Dk中的樣本個(gè)數(shù)。
LSTM神經(jīng)網(wǎng)絡(luò)是一種基于改進(jìn)時(shí)間循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的深度學(xué)習(xí)算法。由于記憶時(shí)間序列的長短期依賴信息是LSTM網(wǎng)絡(luò)的默認(rèn)行為,因此其特別適用于處理和預(yù)測時(shí)間序列中的間隔和延遲事件[16,17]。
LSTM神經(jīng)網(wǎng)絡(luò)由一個(gè)個(gè)內(nèi)部結(jié)構(gòu)相同的LSTM細(xì)胞單元鏈接而成,如圖2所示。在整個(gè)LSTM網(wǎng)絡(luò)結(jié)構(gòu)中, LSTM單元細(xì)胞狀態(tài){…,Ct-1,Ct,Ct+1,…}最為關(guān)鍵。圖2中上方從左貫穿到右的水平線像傳送帶一樣,將信息從上一個(gè)細(xì)胞單元傳送至下一個(gè)細(xì)胞單元,且和細(xì)胞單元中其他部分僅有很少的線性關(guān)聯(lián)。LSTM細(xì)胞單元內(nèi)部結(jié)構(gòu)中,網(wǎng)絡(luò)依靠一些“門”結(jié)構(gòu)讓信息有選擇性地影響循環(huán)神經(jīng)網(wǎng)絡(luò)中每個(gè)時(shí)刻的狀態(tài)[18]?!伴T”是一種能夠使信息選擇性通過的結(jié)構(gòu),由一個(gè)輸出值在[0,1]區(qū)間Sigmoid函數(shù)和點(diǎn)乘操作符組成,每個(gè)LSTM細(xì)胞單元均包含遺忘門、輸入門、輸出門,其各自的核心構(gòu)造、作用可由式(3)~(8)表征[19]。
圖2 LSTM細(xì)胞單元內(nèi)部結(jié)構(gòu)
遺忘門(forget gate)本質(zhì)是以上一個(gè)單元輸出ht-1和本單元輸入xt為輸入的Sigmoid函數(shù),其為Ct-1中的每一項(xiàng)產(chǎn)生一個(gè)在[0,1]內(nèi)的值,用以控制上一單元狀態(tài)被遺忘的程度。 圖2中,ft為Sigmoid函數(shù)的輸出序列:
ft=σ(Wf·[ht-1,xt]+bf)
(3)
式中,σ為Sigmoid激活函數(shù),Wf為權(quán)重系數(shù)矩陣,bf為偏置項(xiàng)。
it=σ(Wi·[ht-1,xt]+bi)
(4)
(5)
(6)
輸出門(output gate)用來控制當(dāng)前的單元狀態(tài)有多少被過濾掉。先將單元狀態(tài)激活,并為其中每一項(xiàng)產(chǎn)生一個(gè)在[0,1]內(nèi)的值,控制單元狀態(tài)被過濾的程度:
ot=σ(Wo·[ht-1,xt]+bo)
(7)
ht=ot·tanh(Ct)
(8)
圖3 Sigmoid與tanh函數(shù)曲線
LSTM深度學(xué)習(xí)網(wǎng)絡(luò)模型訓(xùn)練過程采用隨時(shí)間反向傳播(BPTT)算法[20],其主要步驟如下。
步驟1前向計(jì)算。按照前向計(jì)算方法計(jì)算式(3)~(8)中LSTM細(xì)胞的輸出值。
步驟2誤差反向傳播。反向計(jì)算每個(gè)LSTM細(xì)胞的誤差項(xiàng),其值不僅與輸出層有關(guān),而且與前后時(shí)間序列點(diǎn)的隱藏層有關(guān)。
步驟3梯度計(jì)算。根據(jù)相應(yīng)的誤差項(xiàng),計(jì)算每個(gè)權(quán)重的梯度。
步驟4權(quán)值更新。根據(jù)相應(yīng)誤差項(xiàng)以及每個(gè)權(quán)重的梯度,應(yīng)用基于梯度的優(yōu)化算法更新權(quán)值。
在步驟4中,采用適應(yīng)性動量估計(jì)(Adam)梯度優(yōu)化算法,其優(yōu)勢在于適合解決含大規(guī)模數(shù)據(jù)和參數(shù)以及包含很高噪聲或稀疏度的問題。
3.1.1 數(shù)據(jù)歸一化
使用多變量時(shí)間序列數(shù)據(jù)集進(jìn)行含DG主動配電網(wǎng)的電能質(zhì)量預(yù)測時(shí),需要考慮到影響電能質(zhì)量的各個(gè)變量具有不同的量綱,并且各個(gè)變量在各自的量綱內(nèi)數(shù)值差別較大,另外,還需考慮LSTM深度學(xué)習(xí)模型中非線性激活函數(shù)的輸入輸出范圍。因此,為避免LSTM模型中神經(jīng)元陷入飽和狀態(tài),同時(shí)為保證各項(xiàng)變量能夠平等地作用于電能質(zhì)量的變化預(yù)測,需要將各項(xiàng)變量以及電能質(zhì)量指標(biāo)項(xiàng)均進(jìn)行歸一化處理。
對溫度、光照、用電負(fù)荷變量項(xiàng)以及電能質(zhì)量指標(biāo)項(xiàng)均進(jìn)行歸一化處理,利用式(9)將其歸算至[0,1]之間。與之對應(yīng),經(jīng)LSTM模型得到的電能質(zhì)量指標(biāo)項(xiàng)預(yù)測數(shù)據(jù)也為歸一化數(shù)據(jù),為獲得具有實(shí)際物理意義的電能質(zhì)量數(shù)據(jù),需利用式(10) 對其進(jìn)行反歸一化處理。
(9)
x=x′×(xmax-xmin)+xmin
(10)
式中,x、x′分別表示歸一化前后的指標(biāo)項(xiàng)數(shù)值,xmax、xmin選取各指標(biāo)項(xiàng)在歷史數(shù)據(jù)集內(nèi)的最大與最小限值。
3.1.2 電能質(zhì)量數(shù)據(jù)聚類
圖4 聚類數(shù)與輪廓系數(shù)關(guān)系
3.1.3 數(shù)據(jù)分割
對于聚類處理后各類別的歷史數(shù)據(jù)(包含各影響因素?cái)?shù)據(jù)以及電能質(zhì)量指標(biāo)項(xiàng)數(shù)據(jù)),為獲得可實(shí)現(xiàn)電能質(zhì)量預(yù)測功能的LSTM深度學(xué)習(xí)模型,首先需要基于大量具體的輸入變量歷史數(shù)據(jù)和輸出電能質(zhì)量指標(biāo)歷史數(shù)據(jù)進(jìn)行學(xué)習(xí)訓(xùn)練以獲得LSTM網(wǎng)絡(luò)模型的內(nèi)部參數(shù)確定。其后,為評價(jià)所獲得LSTM模型的電能質(zhì)量預(yù)測性能,同樣需要數(shù)量可觀的具體歷史數(shù)據(jù)進(jìn)行測試、評估。因此,在選定用于確定電能質(zhì)量LSTM預(yù)測模型的歷史數(shù)據(jù)集后,需要對其進(jìn)行數(shù)據(jù)分割?;谝话阈栽瓌t,本文將采用的電能質(zhì)量歷史數(shù)據(jù)集按照時(shí)間順序劃分為訓(xùn)練集與測試集,其量值分別約占?xì)v史數(shù)據(jù)總集的70%與30%。這樣,既可保證LSTM預(yù)測模型可以充分學(xué)習(xí)歷史數(shù)據(jù)集中各輸入變量和輸出指標(biāo)項(xiàng)的關(guān)聯(lián)性和規(guī)律性,又能充分保障所獲得預(yù)測模型性能評估的有效性。
根據(jù)系統(tǒng)電能質(zhì)量訓(xùn)練集中已完成歸一化及聚類處理的輸入變量和電能質(zhì)量指標(biāo)歷史數(shù)據(jù),可進(jìn)行目標(biāo)主動配電網(wǎng)電能質(zhì)量預(yù)測的LSTM深度學(xué)習(xí)模型的網(wǎng)絡(luò)訓(xùn)練。聚類LSTM預(yù)測網(wǎng)絡(luò)模型的整體結(jié)構(gòu)如圖5所示,包含輸入層、隱藏層和輸出層。其中LSTM隱藏層中,每一個(gè)細(xì)胞單元的內(nèi)部詳細(xì)結(jié)構(gòu)如圖2所示。
圖5 LSTM網(wǎng)絡(luò)PQ預(yù)測模型整體結(jié)構(gòu)
與此對應(yīng),如表1中所示算法偽代碼,展示了使用聚類LSTM深度學(xué)習(xí)模型進(jìn)行含DG主動配電網(wǎng)的電能質(zhì)量預(yù)測的整體實(shí)施過程。
表1 基于聚類LSTM模型的ADN電能質(zhì)量預(yù)測實(shí)施算法
表1實(shí)施算法偽代碼中,series_to_supervised()是監(jiān)督學(xué)習(xí)中包裝好的一個(gè)集成函數(shù),作用在于處理時(shí)間序列數(shù)據(jù),可將原來的單一時(shí)間步長序列轉(zhuǎn)換為可調(diào)整預(yù)測步長的時(shí)間序列;Sequential()是深度學(xué)習(xí)Keras框架中的一個(gè)類,實(shí)質(zhì)為一個(gè)序貫?zāi)P停渲蠯eras框架是一個(gè)開源的高度模塊化的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)庫; LSTM() 模塊是一個(gè)包含若干個(gè)LSTM細(xì)胞單元的預(yù)測基礎(chǔ)模型,其優(yōu)點(diǎn)在于可以將算法計(jì)算過程整合到一個(gè)模塊中,便于調(diào)參,其次,直接調(diào)用該模型,能大程度上避免程序的復(fù)雜性;Dense()模塊代表LSTM網(wǎng)絡(luò)中的全連接隱藏層,可以根據(jù)輸出維度要求直接調(diào)節(jié)括號內(nèi)參數(shù);compile()模塊用于編譯模型,可以將源程序解釋為指令來交由CPU執(zhí)行,其參數(shù)‘mae’用于確定損失函數(shù)值;參數(shù)‘a(chǎn)dam’代表所選用的優(yōu)化算法,用于實(shí)現(xiàn)梯度優(yōu)化,可使梯度朝著期望的方向下降;fit()為擬合函數(shù),其作用在于尋求訓(xùn)練集中影響因素與目標(biāo)之間的表征關(guān)系。
為合理評估經(jīng)訓(xùn)練所確定聚類LSTM模型的預(yù)測性能,一方面需要進(jìn)一步借助相同類別中經(jīng)數(shù)據(jù)分割后另存的測試集數(shù)據(jù)進(jìn)行模型預(yù)測性能評估,其實(shí)施過程如表2中偽代碼所示;另一方面需要考慮模型算法的復(fù)雜度,其從預(yù)測結(jié)果分析以外反映了算法的性能。對于復(fù)雜度分析,可以從模型算法的時(shí)間復(fù)雜度和空間復(fù)雜度入手,時(shí)間復(fù)雜度可由算法的執(zhí)行時(shí)間反映,空間復(fù)雜度可由算法占用計(jì)算機(jī)內(nèi)存方面反映。
表2 聚類LSTM模型的預(yù)測性能評估實(shí)施算法
與表1所示的聚類LSTM預(yù)測模型訓(xùn)練過程相對應(yīng),對于經(jīng)聚類劃分的第i類別PQ歷史數(shù)據(jù)子集,讀其測試集中環(huán)境、負(fù)荷等影響因素?cái)?shù)據(jù)作為LSTM預(yù)測模型的輸入信息,然后通過調(diào)用predict()函數(shù)進(jìn)行基于已完成網(wǎng)絡(luò)訓(xùn)練的LSTM深度學(xué)習(xí)模型的電能質(zhì)量指標(biāo)項(xiàng)數(shù)值預(yù)測;對于LSTM模型輸出的任意j項(xiàng)電能質(zhì)量指標(biāo)數(shù)據(jù),均可將其與測試集中按時(shí)間標(biāo)記對應(yīng)的電能質(zhì)量指標(biāo)歷史數(shù)據(jù)進(jìn)行比對,通過調(diào)用rmse()函數(shù)和mae()函數(shù)計(jì)算其均方根誤差和平均絕對誤差,與此同時(shí),進(jìn)一步通過對模型算法的復(fù)雜度分析,以實(shí)現(xiàn)聚類LSTM預(yù)測模型的性能評估。
性能評估算法實(shí)現(xiàn)中,為綜合表征所得聚類LSTM預(yù)測模型的預(yù)測結(jié)果絕對誤差性能以及預(yù)測值誤差的實(shí)際情況,選用適用于評價(jià)回歸算法的均方根誤差(RMSE)和均方誤差(MSE)指標(biāo)項(xiàng),其計(jì)算公式分別為
(11)
(12)
為更好地體現(xiàn)所提LSTM預(yù)測模型在系統(tǒng)輸入變量及電能質(zhì)量指標(biāo)值具有較大波動特性下的各種網(wǎng)絡(luò)運(yùn)行場景中的有效性,本文以IEEE 13節(jié)點(diǎn)配電網(wǎng)拓?fù)浣Y(jié)構(gòu)為系統(tǒng)基本網(wǎng)絡(luò)架構(gòu),基于Matlab/Simulink軟件搭建分析算例的系統(tǒng)仿真模型,系統(tǒng)額定電壓等級和額定容量分別設(shè)定為10.5 kV和500 kVA,如圖6所示。系統(tǒng)中,為模擬含DG主動配電網(wǎng)網(wǎng)絡(luò)特征,在模型13節(jié)點(diǎn)處并網(wǎng)連接一個(gè)10%系統(tǒng)額定容量的光伏DG模型,在節(jié)點(diǎn)2處布置系統(tǒng)電能質(zhì)量在線監(jiān)測點(diǎn),實(shí)時(shí)監(jiān)測網(wǎng)絡(luò)各項(xiàng)電能質(zhì)量數(shù)據(jù)。
圖6 含DG主動配電網(wǎng)結(jié)構(gòu)
為獲得有效、豐富的多場景下的系統(tǒng)輸入變量和輸出電能質(zhì)量指標(biāo)項(xiàng)歷史數(shù)據(jù),如圖7所示,算例仿真模型中的光伏陣列模塊可以通過設(shè)置接入的溫度和光照參數(shù)的變化曲線,模擬外部環(huán)境因素變化以調(diào)整光伏DG的實(shí)時(shí)輸出功率。仿真時(shí),為更好體現(xiàn)數(shù)據(jù)真實(shí)性,以作者所在單位搭建的微電網(wǎng)實(shí)驗(yàn)平臺環(huán)境監(jiān)測裝置所采集記錄的2018年7、8、9三個(gè)月的現(xiàn)場光照強(qiáng)度和溫度數(shù)據(jù)作為模型中光伏陣列的輸入?yún)?shù)值。其中,8月份前3星期(共21天)的光照強(qiáng)度和溫度參數(shù)的變化曲線如圖8所示。同時(shí),將模型中的LD1~LD6設(shè)置為不同類型、
(a) 光照強(qiáng)度 (b) 溫度
不同特性的負(fù)載,并且所有負(fù)載單元均可根據(jù)設(shè)置的負(fù)荷曲線進(jìn)行定時(shí)投切變換以體現(xiàn)網(wǎng)絡(luò)結(jié)構(gòu)和運(yùn)行場景的多變性。
據(jù)此,共得3個(gè)月92組不同環(huán)境因素和系統(tǒng)負(fù)荷條件下的仿真數(shù)據(jù)。運(yùn)行仿真模型,并獲取每一組內(nèi)一天24 h內(nèi)的24組穩(wěn)態(tài)電能質(zhì)量各指標(biāo)項(xiàng)數(shù)據(jù)。按照3.1小節(jié)中的數(shù)據(jù)分割準(zhǔn)則,選取7、8兩個(gè)月份的環(huán)境、負(fù)荷輸入變量及對應(yīng)電能質(zhì)量穩(wěn)態(tài)指標(biāo)項(xiàng)數(shù)據(jù)作為LSTM預(yù)測模型的訓(xùn)練集,9月份的數(shù)據(jù)作為測試集。
為驗(yàn)證所提基于聚類LSTM電能質(zhì)量預(yù)測模型的優(yōu)越性,選取差分自回歸移動平均(ARIMA)、BP神經(jīng)網(wǎng)絡(luò)、無聚類LSTM等預(yù)測模型進(jìn)行對比分析。上述各個(gè)模型的基本特性和關(guān)鍵設(shè)置如下。
(1)ARIMA:統(tǒng)計(jì)模型中最常見的一種用以進(jìn)行時(shí)間序列預(yù)測的模型,模型整定涉及3個(gè)參數(shù)(p代表采用時(shí)序數(shù)據(jù)本身的滯后數(shù),d代表時(shí)序數(shù)據(jù)需要進(jìn)行幾階差分化后才能穩(wěn)定,q代表采用的預(yù)測誤差滯后數(shù))。本文采用的優(yōu)化對比模型為ARIMA(5,1,0)。
(2)BP神經(jīng)網(wǎng)絡(luò):作為典型的前饋型神經(jīng)網(wǎng)絡(luò),由輸入層、隱含層和輸出層構(gòu)成,其主要特點(diǎn)是信號前向傳輸、誤差反方向傳播,若誤差未達(dá)預(yù)期即通過誤差反饋機(jī)制不斷調(diào)整網(wǎng)絡(luò)權(quán)重和閾值,使得網(wǎng)絡(luò)平均誤差和最小。本文采用的優(yōu)化對比模型其動量因子設(shè)置為0.9,輸入層、隱藏層及輸出層神經(jīng)元個(gè)數(shù)分別設(shè)置為4、18、1。另外,考慮到學(xué)習(xí)率過大雖然可在開始階段加快收斂速度,但臨近最佳點(diǎn)時(shí)易產(chǎn)生動蕩致使無法收斂,故學(xué)習(xí)率選為較小值0.01。
(3)無聚類LSTM:即單獨(dú)采用LSTM深度學(xué)習(xí)模型,但數(shù)據(jù)預(yù)處理階段,不進(jìn)行按照歐式距離原則進(jìn)行的聚類劃分,僅以完整的數(shù)據(jù)集統(tǒng)一進(jìn)行電能質(zhì)量預(yù)測。
聚類LSTM預(yù)測模型輸出可包括各類電能質(zhì)量穩(wěn)態(tài)指標(biāo)項(xiàng),算例僅選取其中最常用的“電壓偏差”項(xiàng)作為所提預(yù)測算法性能的展示和對比項(xiàng)?;?018年9月連續(xù)30 d的環(huán)境、負(fù)荷輸入變量數(shù)據(jù)集,依據(jù)表2所示的性能評估實(shí)施算法,可進(jìn)行該時(shí)段電壓偏差指標(biāo)項(xiàng)的預(yù)測,并根據(jù)預(yù)測結(jié)果計(jì)算分析其均方根誤差及平均絕對誤差(MAE)。同時(shí),可與4.2節(jié)所提經(jīng)參數(shù)調(diào)優(yōu)的ARIMA模型、BP神經(jīng)網(wǎng)絡(luò)模型以及無聚類LSTM網(wǎng)絡(luò)模型的預(yù)測結(jié)果進(jìn)行性能對比。
基于同樣訓(xùn)練數(shù)據(jù)和評估數(shù)據(jù)條件下,ARIMA、BP神經(jīng)網(wǎng)絡(luò)、無聚類LSTM和聚類LSTM這4種不同預(yù)測模型各自預(yù)測結(jié)果的RMSE、MAE對比結(jié)果如表3所示。其中,根據(jù)圖4所示K-means聚類優(yōu)化結(jié)果,可將本算例中電能質(zhì)量歷史數(shù)據(jù)集按最優(yōu)類別數(shù)Kopt取值劃分3類,表3中第i(i=1,2,3)類LSTM預(yù)測模型采用“類i+LSTM”表示。此外,各種預(yù)測模型在其每一次訓(xùn)練中均存在隨機(jī)因素,由此將導(dǎo)致其預(yù)測輸出結(jié)果的不穩(wěn)定性。為盡可能減少該現(xiàn)象對各模型性能評估的影響,表3中對每種預(yù)測模型均進(jìn)行了3次測試并采用其平均值的應(yīng)對措施。
表3 各模型預(yù)測結(jié)果的RMSE、MAE對比
從表3可看出,對于含多輸入變量的主動配電網(wǎng)電能質(zhì)量預(yù)測,上述各模型的預(yù)測性能對比可簡要描述為:(1)BP神經(jīng)網(wǎng)絡(luò)的預(yù)測性能最差,其主要原因是在模型訓(xùn)練過程中,一方面因其本身缺乏記憶單元難以捕捉較長時(shí)間跨度上的信息,另一方面由于多影響因素輸入使得模型確立變得復(fù)雜;(2)ARIMA模型僅用時(shí)間作為變量因素,避免了多影響因素變化導(dǎo)致的復(fù)雜性,其預(yù)測表現(xiàn)稍好于BP網(wǎng)絡(luò),但是如若參數(shù)選取不當(dāng),該模型的訓(xùn)練復(fù)雜度和時(shí)間將會明顯增大;(3)標(biāo)準(zhǔn)LSTM網(wǎng)絡(luò)模型,由于其可以綜合考慮多變量影響因素以及PQ數(shù)據(jù)在時(shí)間跨度上的相關(guān)性,其預(yù)測性能明顯優(yōu)于BP網(wǎng)絡(luò)模型和ARIMA模型;(4)聚類LSTM網(wǎng)絡(luò)模型,由于其是在標(biāo)準(zhǔn)LSTM模型基礎(chǔ)上進(jìn)一步考慮了不同類別數(shù)據(jù)之間的差異性,實(shí)現(xiàn)按最優(yōu)聚類結(jié)果的分類網(wǎng)絡(luò)訓(xùn)練,其預(yù)測結(jié)果自然呈現(xiàn)出最佳的性能評估結(jié)果。
在30 d預(yù)測數(shù)據(jù)集中,隨機(jī)選取其中2天共48 h的預(yù)測結(jié)果數(shù)據(jù)進(jìn)行對比,其實(shí)際值(即模型仿真數(shù)據(jù)值)與各種預(yù)測模型的預(yù)測輸出值對比以及預(yù)測結(jié)果相對誤差對比分別如圖9、圖10所示。由圖可見,上述4種預(yù)測模型對于未來目標(biāo)時(shí)段內(nèi)的電壓偏差指標(biāo)項(xiàng)呈現(xiàn)出性能差異的預(yù)測功能:BP模型和ARIMA模型的預(yù)測值曲線與實(shí)際值曲線大體上滿足趨勢走向的一致性,但其擬合曲線波動性較嚴(yán)重,整體偏離值相對較大,在部分時(shí)間節(jié)點(diǎn)偏差顯著;標(biāo)準(zhǔn)LSTM模型一定程度上改善了BP模型和ARIMA模型的上述缺陷,但對于變化趨勢線中的峰值點(diǎn)跟隨性仍然欠佳,在部分時(shí)段內(nèi)預(yù)測誤差相對較大;基于K-means聚類及LSTM網(wǎng)絡(luò)的預(yù)測模型,其對于電壓偏差指標(biāo)項(xiàng)的趨勢預(yù)測最貼近實(shí)際值,預(yù)測時(shí)段內(nèi)全域無顯著偏差點(diǎn),且對于變化趨勢線中的峰值點(diǎn)跟隨性良好。
圖9 各個(gè)模型預(yù)測曲線與實(shí)際曲線對比
圖10 各模型預(yù)測結(jié)果相對誤差對比
對上述預(yù)測結(jié)果進(jìn)一步分析對比,各種預(yù)測模型的預(yù)測結(jié)果在不同相對誤差范圍內(nèi)的百分占比分布對比如表4所示。對比分析可以看出,在這隨機(jī)抽取的2天共48 h內(nèi),本文所提聚類LSTM方法的預(yù)測相對誤差波動最小,其值全落于15%以內(nèi),且近70%預(yù)測結(jié)果的相對誤差處于5%以內(nèi),顯示其對于電壓波動指標(biāo)項(xiàng)預(yù)測效果最佳。對比分析其他3種預(yù)測模型,其預(yù)測結(jié)果相對誤差波動峰值均超過25%,并且其相對誤差分布在5%以內(nèi)的相占比均不足50%概率,顯示其預(yù)測效果與聚類LSTM預(yù)測模型均具有較大差距。
表4 各模型預(yù)測結(jié)果相對誤差分布對比
經(jīng)測試分析,表4中各模型的執(zhí)行復(fù)雜度情況如表5所示。
表5 各模型的復(fù)雜度對比
表5中,Tc代表模型執(zhí)行的時(shí)間復(fù)雜度,Sc代表模型執(zhí)行的空間復(fù)雜度??梢钥吹?,聚類LSTM模型的Tc值最小,其Sc值與BP模型和LSTM模型相近;與之對應(yīng),ARIMA模型的Tc值最大,Sc值最小。經(jīng)分析可知,在當(dāng)前計(jì)算機(jī)存儲能力越來越強(qiáng)、高速化以及并行化已成為其主要特征的背景下,對于測試模型對應(yīng)的內(nèi)存占用,計(jì)算機(jī)處理較難具有顯著的區(qū)別度。因此,可主要通過時(shí)間復(fù)雜度對比,驗(yàn)證參與對比的4種不同預(yù)測模型中,所提聚類LSTM模型的效率最高、性能最佳。
本文針對未來含DG主動配電網(wǎng)中對于電能質(zhì)量態(tài)勢感知能力日益提高的需求,提出了基于K-means聚類及LSTM深度學(xué)習(xí)模型的電能質(zhì)量預(yù)測方法。通過改進(jìn)型K-means方法對系統(tǒng)電能質(zhì)量歷史數(shù)據(jù)進(jìn)行基于歐式距離的聚類劃分,然后針對各類別數(shù)據(jù)分別建立并訓(xùn)練其對應(yīng)的LSTM深度學(xué)習(xí)網(wǎng)絡(luò)預(yù)測模型。算例分析選擇其中“電壓波動”指標(biāo)項(xiàng)的預(yù)測結(jié)果表明,所提聚類LSTM預(yù)測模型優(yōu)勢顯著。
LSTM深度學(xué)習(xí)網(wǎng)絡(luò)特性及其獨(dú)特的“門”結(jié)構(gòu),可以記憶并充分考慮較長時(shí)間跨度內(nèi)海量多維時(shí)序數(shù)據(jù)的時(shí)間相關(guān)性,面對含DG主動配電網(wǎng)中復(fù)雜的電能質(zhì)量影響因素信息和變化特性,具有比傳統(tǒng)預(yù)測模型更出色的態(tài)勢感知和預(yù)測性能。
LSTM深度學(xué)習(xí)網(wǎng)絡(luò)具有可從多維信息中深度挖掘并擬合其復(fù)雜非線性關(guān)系的特性,非常適用于含多類型DG主動配電網(wǎng)電能質(zhì)量預(yù)測這種典型多輸入(各種環(huán)境變量、負(fù)荷變量等)、多輸出(多電能質(zhì)量指標(biāo)項(xiàng))預(yù)測應(yīng)用場景,有效保障預(yù)測性能。
采用改進(jìn)K-means聚類法可將系統(tǒng)中海量、多維的電能質(zhì)量時(shí)序關(guān)聯(lián)數(shù)據(jù)按照歐式距離原則進(jìn)行最優(yōu)聚類劃分,使得特性相近數(shù)據(jù)歸為同一類并按不同類別分別進(jìn)行LSTM網(wǎng)絡(luò)模型的訓(xùn)練和預(yù)測,可實(shí)現(xiàn)比標(biāo)準(zhǔn)LSTM模型更佳的電能質(zhì)量預(yù)測性能。
后繼工作中,為提高所提預(yù)測模型的普適性和預(yù)測精度,需進(jìn)一步考慮高維復(fù)雜輸入對于K-means聚類以及LSTM建模的影響。一方面,考慮到未來主動配電網(wǎng)中接入的DG類型多樣性,可增加預(yù)測模型的輸入變量類型,包括風(fēng)速、風(fēng)向、氣壓等環(huán)境變量以及DG控制方式等;另一方面,可考慮按季節(jié)、節(jié)假日、天氣類型等不同場景進(jìn)行更加合理的聚類劃分。充分結(jié)合K-means聚類和LSTM網(wǎng)絡(luò)模型兩者優(yōu)勢,通過研究構(gòu)建更加針對性、輕量化的預(yù)測模型,提高含DG主動配電網(wǎng)在各種場景下電能質(zhì)量預(yù)測的實(shí)時(shí)性及準(zhǔn)確性。