熊 寧,肖異瑤,姚志剛,鐘士元,舒 嬌
(1.國網(wǎng)江西省電力有限公司經(jīng)濟技術(shù)研究院,南昌 330096;2.華南理工大學電力學院,廣州 510641)
在鄉(xiāng)村振興發(fā)展戰(zhàn)略背景下,農(nóng)村及農(nóng)業(yè)產(chǎn)業(yè)的發(fā)展將促進農(nóng)村用電需求發(fā)展,并伴隨用電結(jié)構(gòu)的多樣性凸顯、季節(jié)性問題加劇、供電質(zhì)量要求提高等新階段下農(nóng)村用電需求的新特性。在此背景下,現(xiàn)有的電力負荷預(yù)測方法已難以適應(yīng)新時代農(nóng)村發(fā)展需求,因此,需要為農(nóng)村地區(qū)負荷分布預(yù)測提供更具適應(yīng)性的新方法。
電力系統(tǒng)的負荷預(yù)測就是依據(jù)系統(tǒng)內(nèi)存儲的歷史負荷數(shù)據(jù),通過一定的研究方法,得出負荷數(shù)據(jù)的變化規(guī)律,并且通過分析數(shù)據(jù)得出電力負荷與相關(guān)因素之間的聯(lián)系,進而對未來電力負荷進行一個在誤差允許范圍內(nèi)的科學預(yù)測。
目前,國內(nèi)外關(guān)于電力系統(tǒng)負荷預(yù)測方面的研究很多,從傳統(tǒng)的單耗法、彈性系數(shù)法、統(tǒng)計分析法,到經(jīng)典的回歸分析法[1-2]、時間序列分析法[3-4]、灰色預(yù)測法[5-6]和模糊數(shù)學法,甚至到現(xiàn)代的神經(jīng)網(wǎng)絡(luò)法[7]、優(yōu)選組合法[8]和小波分析法[9-10]等,不同的預(yù)測方法有其不同的適用場景,進而導致預(yù)測精度也各不相同。文獻[11]使用了廣義回歸神經(jīng)網(wǎng)絡(luò)進行中長期負荷預(yù)測;文獻[12]針對長期電力需求預(yù)測的特點,提出了分段最優(yōu)灰色系統(tǒng)預(yù)測模型;文獻[13]基于物元理論建立了電力系統(tǒng)物元模型預(yù)測未來負荷變化;文獻[14]使用改進的聚類算法對中長期負荷年份進行聚類,在此基礎(chǔ)上根據(jù)預(yù)測年份的屬性數(shù)據(jù)對電力負荷進行預(yù)測;文獻[15]基于偏最小二乘回歸分析的中長期電力負荷預(yù)測方法,該方法集主成分分析、典型相關(guān)分析和多元線性回歸分析于一體;文獻[16]采用了應(yīng)用最大模糊熵模型進行電力系統(tǒng)的負荷預(yù)測方法根據(jù)歷史數(shù)據(jù),對各歷史年進行分類,并分析得出各類的環(huán)境因素特征及負荷增長趨勢,通過特征比較得到預(yù)測年的負荷曲線。然而,這些方法均是針對城市配電網(wǎng)負荷的預(yù)測方法,并未考慮農(nóng)村負荷的特征。
由于農(nóng)村缺乏控制性詳規(guī),且地區(qū)發(fā)展易受政策等因素影響,負荷性質(zhì)、規(guī)模及增長趨勢缺乏規(guī)律,上述方法難以應(yīng)用于農(nóng)村地區(qū)。張志強[17]將農(nóng)村電力負荷分為大工業(yè)、商業(yè)、農(nóng)業(yè)、居民等6類,基于歷史負荷數(shù)據(jù)的分析,用時間序列法對各行業(yè)負荷展開預(yù)測。黃一凡[18]考慮農(nóng)村電網(wǎng)對負荷的壓制、電網(wǎng)健康程度改善時壓制負荷的恢復(fù)性增長,提出農(nóng)村負荷預(yù)測新方法。然而,時間序列法是利用過去負荷的規(guī)律來推測未來負荷的發(fā)展趨勢,僅適用于短期預(yù)測;電網(wǎng)健康程度改善對負荷恢復(fù)性增長的影響更適用于未來1~2年內(nèi)的負荷預(yù)測。因此,針對農(nóng)村中長期電力負荷預(yù)測的研究幾乎空白。
在已有研究的基礎(chǔ)上,本文考慮了國家政策規(guī)劃、經(jīng)濟、人口等影響農(nóng)村負荷變化的因素,提出一種基于農(nóng)村發(fā)展模式的電力負荷中長期預(yù)測方法。該方法分為農(nóng)村發(fā)展模式預(yù)測模塊以及電力負荷中長期預(yù)測模塊兩部分。首先,基于對農(nóng)村發(fā)展模式和農(nóng)村電力負荷特性的分析,改進了傳統(tǒng)的K-means聚類和K近鄰算法,提出了K-means-Robust聚類算法和加權(quán)自適應(yīng)K近鄰KNN(K-nearest neighbor)算法組成農(nóng)村發(fā)展模式預(yù)測模塊。在此基礎(chǔ)上,針對不同農(nóng)村發(fā)展模式,使用結(jié)合了灰色關(guān)聯(lián)度分析的正則化門控循環(huán)神經(jīng)網(wǎng)絡(luò)方法進行中長期電力負荷預(yù)測。算例表明:本文所提算法在實際農(nóng)村電力負荷數(shù)據(jù)集上的表現(xiàn)較好,準確率高于長短期記憶LSTM(long-short-term memory)網(wǎng)絡(luò)、支持向量機SVM(support vector machine)等常見電力負荷預(yù)測模型。
由于農(nóng)村在不同發(fā)展模式下具有不同的用電用戶類型分布,并且不同類型用電用戶也具有不同的用電模式,因此,本文從農(nóng)村用電數(shù)據(jù)出發(fā)挖掘了不同發(fā)展模式下的負荷類型分布,進而對農(nóng)村不同發(fā)展模式進行精細模擬并預(yù)測中長期負荷。
農(nóng)村用電負荷是指農(nóng)村居民日常用電、農(nóng)業(yè)生產(chǎn)用電、工業(yè)用電、商業(yè)負荷、學校和醫(yī)院等用電負荷,并且不同的負荷類型具有不同的特點。比如農(nóng)業(yè)負荷受氣候、季節(jié)、地理等自然條件的影響很大,整體負荷密度較小,這是由農(nóng)業(yè)生產(chǎn)的特點所決定的;居民負荷一定程度上和農(nóng)業(yè)負荷類似,且在傍晚、清晨有用電小高峰期;工業(yè)負荷所占的比重較大,其負荷特性受工廠行業(yè)的生產(chǎn)周期影響較大。綜合來講,重工業(yè)的負荷量大,且需求平穩(wěn);輕工業(yè)負荷相對較低,且峰谷差較大。同時,由于商業(yè)、學校、醫(yī)院等負荷相對較少,為了簡化分析,本文將該類負荷統(tǒng)稱為第三產(chǎn)業(yè)負荷。
對于電力負荷特性的研究有很多,按照時間可分為年負荷、月負荷和日負荷;而按照數(shù)據(jù)指標可分為最高利用小時、峰谷差等指標。然而,負荷日變化曲線可以很好地反映用戶一天內(nèi)的行為,因此本文采用負荷的日變化曲線作為負荷特性指標。
針對農(nóng)村在不同發(fā)展模式下具有不同的用電用戶類型分布,以及不同類型用電用戶具有的不同用電性質(zhì)的特點,有必要結(jié)合用戶用電類型分布和負荷特性,以及影響農(nóng)村電力負荷變化的因素劃分農(nóng)村發(fā)展模式類型。然而,影響農(nóng)村用電負荷變化的因素有經(jīng)濟、人口、國家政策導向、自然地理條件以及電價等眾多因素,因此在分析不同農(nóng)村發(fā)展模式下用電用戶負荷類型以及影響因素的基礎(chǔ)上,本文主要以經(jīng)濟水平、負荷類型和國家政策導向作為農(nóng)村發(fā)展模式的劃分依據(jù),并將農(nóng)村的發(fā)展模式分為以下3類[18]。
(1)農(nóng)村發(fā)展模式1。
以農(nóng)業(yè)生產(chǎn)用電負荷為主的農(nóng)村發(fā)展模式。該類發(fā)展模式特征為:農(nóng)村經(jīng)濟水平不高,發(fā)展政策導向不明確,農(nóng)業(yè)用電、居民日常用電負荷占主導地位,且電力負荷波動不明顯。
(2)農(nóng)村發(fā)展模式2。
以工業(yè)負荷為主的農(nóng)村發(fā)展模式。該類發(fā)展模式特征為:農(nóng)村經(jīng)濟水平較高,發(fā)展政策導向較為明確,工業(yè)、第三產(chǎn)業(yè)用電負荷增加,且電力負荷波動較為明顯。其中,發(fā)展模式按照發(fā)展速度可以劃分為中速發(fā)展模式和高速發(fā)展模式。
(3)農(nóng)村發(fā)展模式3。
以第三產(chǎn)業(yè)負荷為主的農(nóng)村發(fā)展模式。該類模式特征為:農(nóng)村經(jīng)濟水平很高,發(fā)展政策導向明確,工業(yè)、第三產(chǎn)業(yè)用電負荷猛增,且電力負荷波動很明顯。
為解決農(nóng)村用電負荷的分類以及不同農(nóng)村發(fā)展模式的分類問題,本文建立了農(nóng)村發(fā)展模型預(yù)測模型。首先,為了更好地利用電力負荷大數(shù)據(jù),提出了改進的K-means-Robust聚類模型對農(nóng)村用電負荷類型進行聚類分析;進而將聚類分析結(jié)果與農(nóng)村電力大數(shù)據(jù)結(jié)合,提出了加權(quán)自適應(yīng)KNN算法實現(xiàn)農(nóng)村發(fā)展模式預(yù)測。農(nóng)村發(fā)展模式預(yù)測模型流程圖如圖1所示。
圖1 農(nóng)村發(fā)展模式預(yù)測模型流程Fig.1 Flow chart of rural development mode forecasting model
2.1.1K-means-Robust農(nóng)村用電負荷聚類模型
1)K-means聚類算法
K-means聚類算法的核心思想是把每個元素聚集到其最近中心類,使同一聚類中的對象相似度較高,而不同聚類中的對象相似度較小。對于包含n個對象的數(shù)據(jù)集D={d1,…,dn},目的是把n個對象分配到k組不同的聚類簇中S={S1,…,Sk},其目標函數(shù)為
式中:S代表聚類結(jié)果;Cost(Si)為聚類簇Si中所有數(shù)據(jù)點到聚類中心的距離平方之和。
2)K-means-Robust聚類算法
雖然K-means算法具較高的準確性且易于實現(xiàn),但它依賴于初始化中心的選擇且受離群點的影響較大。在電力系統(tǒng)背景下,電力負荷的數(shù)據(jù)量較大且采集樣本往往包含大量離群值,因此有必要從速度和魯棒性角度改進K-means算法。本文在借鑒Elkan[19]提出的利用三角不等式提升K-means聚類速度方法,以及Olukanmi等[20]提出的K-meanssharp方法的基礎(chǔ)上,提出了K-means-Robust聚類算法。改進后的K-means使用了三角不等式加速數(shù)據(jù)點到每個質(zhì)心距離的計算過程;同時,在更新質(zhì)心時加入了離群值檢測,使得算法具有較好的魯棒性。因此,本文采用K-means-Robust聚類算法對農(nóng)村用電負荷進行預(yù)測。K-means-Robust聚類算法流程如下。
步驟1隨機選擇k個數(shù)據(jù)點作為初始質(zhì)心。
步驟2計算k個質(zhì)心間的距離,并使用哈希表保存每個質(zhì)心到其他質(zhì)心的最短距離,用d(Ci,Cj)表示,d(a,b)表示數(shù)據(jù)點a到b的距離。
步驟3遍歷每個數(shù)據(jù)點,如果數(shù)據(jù)點x不屬于任何簇,則將歸屬到最近的簇中;如果數(shù)據(jù)點x屬于質(zhì)心Ci所在的簇,且2d(Ci,x)≤d(Ci,Cj),則數(shù)據(jù)點x無需變動;否則繼續(xù)計算數(shù)據(jù)點x到現(xiàn)有k個質(zhì)心的距離并將x分配到新的簇。
步驟4重新計算質(zhì)心,在計算過程中僅使用與當前質(zhì)心距離在3個標準偏差內(nèi)的點進行計算,更新公式為
式中:xj為某一數(shù)據(jù)點;S(t)in為參與質(zhì)心更新計算的數(shù)據(jù)點集合;σ為樣本分布的標準差;T為參與質(zhì)心更新的閾值;MADx為每個點到中值點的距離組成的所有數(shù)據(jù)的中值點。
步驟5重復(fù)步驟2~4直至所有質(zhì)心不再變動。
2.1.2 加權(quán)自適應(yīng)KNN算法
KNN算法是一種機器學習領(lǐng)域常用的分類算法。由于KNN理論較為成熟,實現(xiàn)方法簡捷,能對復(fù)雜的決策空間有效建模,被廣泛用于各個領(lǐng)域。KNN算法的3個基本要素為:k值的選擇、距離度量及分類決策規(guī)則,其中分類決策規(guī)則通常是多數(shù)表決。
然而,在電力系統(tǒng)大數(shù)據(jù)背景下,運用傳統(tǒng)KNN算法預(yù)測農(nóng)村發(fā)展模式會導致較大預(yù)測誤差,原因在于農(nóng)村各維度特征對于農(nóng)村發(fā)展模式的影響程度不同,同時人工選擇的k值容易導致模型過擬合。因此,本文提出了加權(quán)k值自適應(yīng)KNN算法,該算法對樣本的每一維特征加權(quán),并使用梯度下降法優(yōu)化求解權(quán)重向量;同時,遍歷搜索k值得到最優(yōu)解。加權(quán)k值自適應(yīng)KNN算法的目標函數(shù)為
式中:yi為數(shù)據(jù)點i的類別值;y′i為數(shù)據(jù)點i的預(yù)測值;n為訓練樣本數(shù)量。
加權(quán)k值自適應(yīng)KNN算法流程如下:
步驟1在設(shè)定的取值空間內(nèi)遍歷k值,對于每一個k取值,重復(fù)步驟2和步驟3;
步驟2使用梯度下降法求解權(quán)重矩陣;
步驟3使用測試集測試模型性能并記錄;
步驟4根據(jù)測試集上的模型性能表現(xiàn)確定最優(yōu)k值及權(quán)重矩陣,性能度量指標使用所有類的平均準確率(mean precision)來度量。
相較于傳統(tǒng)KNN算法,本文提出的加權(quán)k值自適應(yīng)KNN算法在農(nóng)村發(fā)展模式預(yù)測任務(wù)具有更高的準確率。
針對不同農(nóng)村發(fā)展模式下影響用電負荷變化因素不同的問題,本文采用灰色關(guān)聯(lián)分析方法對農(nóng)村的具體發(fā)展模式下負荷數(shù)據(jù)進行分析,得到該發(fā)展模式下不同影響因素與用電負荷的關(guān)聯(lián)度,進而確定具體影響農(nóng)村負荷變化的主要因素,并作為門控循環(huán)神經(jīng)網(wǎng)絡(luò)預(yù)測模型的輸入。
2.2.1 灰色關(guān)聯(lián)分析
采用灰色關(guān)聯(lián)分析方法計算影響負荷變化的主要控制因素和其余因素的影響權(quán)重,計算過程如下。
步驟1各輸入屬性歸一化處理。對農(nóng)村不同類型的負荷分布、人口、經(jīng)濟、地理位置以及國家發(fā)展政策等信息進行歸一化處理,計算公式為
步驟2關(guān)聯(lián)系數(shù)計算。關(guān)聯(lián)系數(shù)是比較變量間相似程度的參數(shù),關(guān)聯(lián)系數(shù)越大,代表變量間關(guān)聯(lián)程度越大。關(guān)聯(lián)系數(shù)計算公式為
式中:ε0ij(k)為關(guān)聯(lián)系數(shù);Δ為同一輸入屬性在k時段內(nèi)的差值絕對值;ρ為分辨系數(shù)。
步驟3將大量關(guān)聯(lián)系數(shù)信息通過求取平均值的方式進行耦合,得到總體的量化關(guān)聯(lián)結(jié)果。關(guān)聯(lián)度計算公式為
式中:ζ0ij為關(guān)聯(lián)度;N為輸入屬性序列長度。
通過上述灰色關(guān)聯(lián)度的分析計算,可以得到各變量與負荷變化的關(guān)聯(lián)度及相關(guān)變量之間的耦合程度,并忽略次要因素,得到主要因素。
2.2.2 正則化門控循環(huán)神經(jīng)網(wǎng)絡(luò)負荷預(yù)測模型
隨著深度學習的飛速發(fā)展,循環(huán)神經(jīng)網(wǎng)絡(luò)RNN(recurrentneuralnetwork)因為擁有較好的擬合能力被廣泛應(yīng)用于時間序列預(yù)測問題。考慮到電力負荷數(shù)據(jù)具有時間序列屬性,本文使用深度學習中性能較強的門控循環(huán)單元GRU(gate recurrent unit)網(wǎng)絡(luò)來進行電力負荷預(yù)測。GRU神經(jīng)網(wǎng)絡(luò)是對LSTM網(wǎng)絡(luò)的改進網(wǎng)絡(luò),GRU網(wǎng)絡(luò)內(nèi)部信息流程如圖2所示。
圖2 GRU網(wǎng)絡(luò)內(nèi)部信息流程Fig.2 Flow chart of internal information of GRU network
與LSTM網(wǎng)絡(luò)相比,GRU網(wǎng)絡(luò)更為精簡。GRU網(wǎng)絡(luò)中舍去了細胞狀態(tài),同時把LSTM內(nèi)部的3個門控單元簡化為兩個,分別是重置門和更新門。重置門負責控制有多少前一狀態(tài)的信息需要保留,更新門負荷控制要舍棄哪些信息以及要添加的新信息。其中,zt確定是否要將當前狀態(tài)與先前的信息結(jié)合起來,而rt表示需要保留多少信息。GRU單元的更新公式為
式中:[]表示兩個向量相連;*表示矩陣的乘積;σ為sigmoid函數(shù);ht-1、ht分別為t-1、t時刻GRU單元的隱藏狀態(tài)向量;zt為t時刻更新門中間狀態(tài)向量;Wz為更新門權(quán)重矩陣;rt為t時刻重置門中間狀態(tài)向量;Wr為重置門權(quán)重矩陣;Wh為控制隱藏狀態(tài)更新的權(quán)重矩陣;為t時刻隱藏狀態(tài)的備選向量;tanh為雙曲正切激活函數(shù);yt為t時刻模型輸出;W0為輸出層權(quán)重矩陣。
網(wǎng)絡(luò)訓練中使用均方誤差MSE(mean-squared error)損失函數(shù),即
在模型的訓練階段,如果使用單樣本梯度下降法優(yōu)化參數(shù),模型容易受到個別異常樣本的影響。另一方面,由于模型的深度需要人工調(diào)參且通常為了避免過擬合選擇較淺的深度,直接使用式(16)的損失函數(shù)在一定程度上影響了模型的準確率。因此本文使用了兩種正則化方法優(yōu)化GRU模型,即在模型的訓練階段使用小批量方法訓練模型,并在模型的代價函數(shù)中加入模型的權(quán)重懲罰項,使得模型有效地避免過擬合,提高了模型泛化能力。
改進后的正則化GRU模型單次迭代的損失函數(shù)為
本文在考慮農(nóng)村負荷特性以及發(fā)展模式的基礎(chǔ)上,既考慮了國家政策規(guī)劃,也考慮了農(nóng)村實際自然地理條件,提出了一種基于農(nóng)村發(fā)展模式的電力負荷中長期預(yù)測方法。農(nóng)村中長期負荷預(yù)測方法流程圖如圖3所示。
圖3 農(nóng)村中長期負荷預(yù)測流程Fig.3 Flow chart of medium-long-term load forecasting in rural areas
本文選取中國江西省某地區(qū)300個自然農(nóng)村2016—2018年的歷史電力負荷數(shù)據(jù)作為算例。電力負荷數(shù)據(jù)的采集間隔為15 min,即每一天包含96個采集時間點的負荷值。為了驗證本文提出的預(yù)測方法,對該農(nóng)村采集的數(shù)據(jù)包括:①農(nóng)村電力負荷歷史數(shù)據(jù);②農(nóng)村人口分布情況;③農(nóng)村GDP歷史數(shù)據(jù);④農(nóng)村自然條件數(shù)據(jù),如海拔、溫度、離縣城中心距離、離二級高速路距離等;⑤農(nóng)村發(fā)展規(guī)劃,即工業(yè)園區(qū)規(guī)劃、農(nóng)業(yè)主導規(guī)劃、第三產(chǎn)業(yè)規(guī)劃如旅游業(yè)規(guī)劃;⑥農(nóng)村發(fā)展結(jié)果標簽數(shù)據(jù),即某一農(nóng)村3年發(fā)展結(jié)果,分為以農(nóng)業(yè)為主導、以工業(yè)為主導及以第三產(chǎn)業(yè)為主導。
首先,將所采集的農(nóng)村大數(shù)據(jù)各維數(shù)據(jù)歸一化,采用K-means-Robust聚類分析得到所有農(nóng)村的電力負荷類型分布,并將每一類負荷值作為某一農(nóng)村的一維特征。然后將電力負荷類型分布數(shù)據(jù)與上述采集的農(nóng)村數(shù)據(jù)結(jié)合進行整合,以6∶3∶1的比例切分所有數(shù)據(jù)集為訓練集、驗證集和測試集。使用訓練集和驗證集訓練加權(quán)自適應(yīng)KNN模型,并使用測試集確定最佳的模型參數(shù)?;谵r(nóng)村發(fā)展模式的預(yù)測結(jié)果,對于3種不同的發(fā)展模式,分別使用灰色關(guān)聯(lián)分析確定該發(fā)展模式下影響農(nóng)村發(fā)展的主要成分,并訓練對應(yīng)的多維GRU模型。最后,對于待預(yù)測農(nóng)村,利用訓練好的農(nóng)村發(fā)展模式預(yù)測模型和GRU模型對農(nóng)村電力負荷進行中長期負荷預(yù)測。
算例中K-means-Robust聚類分析使用的數(shù)據(jù)為100個農(nóng)村的2017年6月到2018年12月的歷史日用電負荷數(shù)據(jù)。將每一天的日用電負荷數(shù)據(jù)作為一個樣本,對每個農(nóng)村的日用電數(shù)據(jù)隨機采樣10次,取10次聚類的平均結(jié)果作為聚類結(jié)果。為了避免K-means-Robust需要手動設(shè)置類別數(shù)而使聚類結(jié)果受先驗知識影響,在聚類前使用Canopy聚類得到合適的聚類類別數(shù)。Canopy聚類是一種特殊的聚類算法,其特點是不需要人為設(shè)置聚類的類別數(shù)k值,對噪聲的抗干擾能力較強,但聚類準確度略低于K-means-Robust。某農(nóng)村電力負荷的Canopy聚類的結(jié)果如圖4所示。
圖4 電力負荷分類Canopy聚類結(jié)果Fig.4 Canopy clustering results of power load classification
由圖4聚類結(jié)果可知,Canopy聚類出了3個相對獨立的電力用戶類別。因此,設(shè)置k值為3,使用K-means-Robust對農(nóng)村大數(shù)據(jù)再次聚類分析,得到的聚類中心曲線如圖5所示。
由圖5可知,不同電力負荷的變化特點如下:
圖5 電力負荷分類聚類結(jié)果Fig.5 Clustering results of power load classification
(1)第1類負荷有兩個高峰用電區(qū)間,分別為07:00—12:00和17:00—22:00,且平均用電量較低,推測此類負荷為農(nóng)村居民用電負荷。
(2)第2類負荷的特點是24小時內(nèi)的平均用電量較高,相較于其他負荷在0:00—06:00和21:00—24:00仍保持較高用電量,推測此類負荷為工業(yè)用電負荷。
(3)第3類負荷的用電區(qū)間跨度較大,07:00—18:00間的用電較為穩(wěn)定,且高峰期為18:00—21:00,推測此類負荷為第三產(chǎn)業(yè)用電負荷。
對300個農(nóng)村的歷史用電負荷分別使用K-means-Robust聚類分析,得到歷史用電負荷類型分布,進而計算出4種負荷的年用電量。在此基礎(chǔ)上,結(jié)合采集的多維農(nóng)村數(shù)據(jù)訓練加權(quán)自適應(yīng)KNN模型,并以kd樹的格式儲存農(nóng)村發(fā)展模式數(shù)據(jù)。300個農(nóng)村數(shù)據(jù)中,農(nóng)業(yè)方向發(fā)展模式的有234個,工業(yè)方向發(fā)展模式的有19個,第三產(chǎn)業(yè)方向發(fā)展模式的有47個。其中,10個農(nóng)村的相關(guān)數(shù)據(jù)見表1,將發(fā)展規(guī)劃和發(fā)展結(jié)果數(shù)值化為0~3,分別代表沒有規(guī)劃方向、農(nóng)業(yè)發(fā)展方向、工業(yè)發(fā)展方向以及第三產(chǎn)業(yè)發(fā)展方向。
表1 10個農(nóng)村的相關(guān)數(shù)據(jù)Tab.1 Related data of ten rural villages
由表1中可知,政府的發(fā)展規(guī)劃對于農(nóng)村的發(fā)展方向有較大影響,并且不同發(fā)展方向的農(nóng)村用電特性也有較大差異,相同發(fā)展方向的農(nóng)村用電特征較為相似。對于待分析農(nóng)村,使用K-means-Robust聚類分析得到三類產(chǎn)業(yè)的用電負荷,再與其他農(nóng)村數(shù)據(jù)合并為特征向量。最后,使用訓練好的KNN模型得到該農(nóng)村的發(fā)展結(jié)果預(yù)測。
基于第1.2節(jié)中的發(fā)展模式分類,利用灰色關(guān)聯(lián)分析算法分析該模式下影響電力負荷的主要因素,對農(nóng)村電力大數(shù)據(jù)降維處理。對于不同發(fā)展模式的農(nóng)村,使用灰色關(guān)聯(lián)分析計算歷史負荷數(shù)據(jù)與其他變量數(shù)據(jù)的灰色關(guān)聯(lián)度,取所有該發(fā)展模式下農(nóng)村的灰色關(guān)聯(lián)度平均值如表2所示。
表2 不同發(fā)展模式下農(nóng)村大數(shù)據(jù)灰色關(guān)聯(lián)度統(tǒng)計Tab.2 Statistics of grey relevance degree of rural big data in different development modes
由表2可知,取各發(fā)展模式下與負荷灰色關(guān)聯(lián)度高于0.5的變量作為用于預(yù)測負荷的數(shù)據(jù),搭建并訓練相應(yīng)維度的GRU負荷預(yù)測模型,如:對于以第三產(chǎn)業(yè)為主的農(nóng)村發(fā)展模式,取GDP、溫度、電價時間序列數(shù)據(jù)和歷史負荷數(shù)據(jù)作為GRU的輸入,訓練GRU模型。
將待預(yù)測農(nóng)村2016—2018這3年的所有數(shù)據(jù)進行歸一化處理,并以8∶2的比例切分訓練集和測試集。在訓練過程中,選用批量梯度下降法訓練模型,批量設(shè)置為64,訓練周期設(shè)置為15。算例中比較了包括SGD、RMSP、Adam等優(yōu)化器,測試結(jié)果表明Adam優(yōu)化訓練的模型準確率最高。
為驗證本文提出預(yù)測方法的預(yù)測性能,在實驗中使用了普通GRU模型(不考慮農(nóng)村發(fā)展模式)、LSTM和SVM作為對比模型,本文提出的基于農(nóng)村發(fā)展模式的正則化GRU預(yù)測模型命名為Improved GRU。以某一個第三產(chǎn)業(yè)為主發(fā)展方向的農(nóng)村負荷為例,各預(yù)測模型在測試集上的預(yù)測結(jié)果如圖6所示。各預(yù)測模型在測試集上的性能用均方根誤差RMSE(root-mean-squared error)和標準均方根誤差 NRMSE(normalized root-mean-squared error)度量,如表3所示。
圖6 GRU負荷預(yù)測曲線Fig.6 Load forecasting curves of GRU
由表3可知,SVM模型在測試集上的表現(xiàn)最差,Improved GRU模型在測試集上的預(yù)測誤差最小,普通GRU模型和LSTM模型的預(yù)測誤差相差不大。因此,本文所提出的負荷預(yù)測模型對于農(nóng)村中長期電力負荷預(yù)測任務(wù)具有較高準確率。
表3 負荷預(yù)測模型性能比較Tab.3 Comparison of performance among load forecasting models
為實現(xiàn)電力負荷中長期負荷預(yù)測,將GRU模型的預(yù)測輸出加入到下一個時刻輸入向量中,從而實現(xiàn)電力負荷迭代預(yù)測。以第三產(chǎn)業(yè)為主發(fā)展的某農(nóng)村迭代預(yù)測曲線如圖7所示。
圖7 某農(nóng)村中長期負荷預(yù)測曲線Fig.7 Medium-long-term load forecasting curve of one rural area
本文提出一種基于農(nóng)村發(fā)展模式的中長期負荷預(yù)測方法,該方法考慮了影響農(nóng)村負荷變化的經(jīng)濟、人口、國家政策規(guī)劃等影響因素,提出了K-means-Robust聚類算法和加權(quán)自適應(yīng)KNN算法,搭建了農(nóng)村發(fā)展模式預(yù)測模型。在此基礎(chǔ)上,利用灰色關(guān)聯(lián)分析法挖掘不同農(nóng)村發(fā)展模式下影響負荷變化的主要特征,并利用主要特征訓練正則化的深度門控循環(huán)網(wǎng)絡(luò),從而實現(xiàn)農(nóng)村中長期負荷預(yù)測。在預(yù)測過程中,考慮了符合農(nóng)村發(fā)展實際的各方面因素,且考慮了農(nóng)村不同的發(fā)展模式,使得農(nóng)村負荷預(yù)測結(jié)果更準確、更切合實際。