田啟東林志賢鄭煒楠于兆一楊秀瑜
(深圳供電局有限公司,廣東 深圳 518000)
對(duì)特定區(qū)域進(jìn)行電力負(fù)荷與電能需求預(yù)測(cè)可以幫助電網(wǎng)等相關(guān)部門實(shí)現(xiàn)合理化的電力資源調(diào)度與規(guī)劃,有利于預(yù)防因電力資源調(diào)度不平衡所產(chǎn)生的非安全性事故的發(fā)生[1]。智能電表可以實(shí)時(shí)且高頻率地收集每個(gè)住戶的電力資源消耗數(shù)據(jù),為電力相關(guān)部門提供一個(gè)便捷的電力數(shù)據(jù)采集方式。大量相關(guān)工作利用歷史智能電表數(shù)據(jù),結(jié)合基于計(jì)量經(jīng)濟(jì)學(xué)或深度學(xué)習(xí)模型,比如(自動(dòng))回歸模型、(季節(jié)性)ARIMA 模型、AR-GARCH 模型、跳躍擴(kuò)散模型、因子模型和循環(huán)神經(jīng)網(wǎng)絡(luò)等[2-4],提出一系列電力相關(guān)預(yù)測(cè)方法。但是,廣泛用戶互動(dòng)已經(jīng)成為智能電網(wǎng)的重要特征,這使得電力市場(chǎng)隨著復(fù)雜的人群社會(huì)活動(dòng)充滿隨機(jī)性、時(shí)變性、復(fù)雜性,并導(dǎo)致基于智能電表數(shù)據(jù)的電力資源預(yù)測(cè)值不準(zhǔn)確、模型普適性差等問題。在現(xiàn)實(shí)用電場(chǎng)景下,天氣變量、實(shí)時(shí)電費(fèi)價(jià)格調(diào)整、人群流動(dòng)等,都會(huì)影響著區(qū)域內(nèi)電力資源消耗與需求。比如,當(dāng)前局部天氣變化可能會(huì)導(dǎo)致某區(qū)域內(nèi)空調(diào)設(shè)備使用率的大幅度提升,區(qū)域電費(fèi)價(jià)格調(diào)整可能導(dǎo)致家庭會(huì)頻繁使用大功率電器設(shè)備,人群移動(dòng)變化也會(huì)導(dǎo)致區(qū)域內(nèi)的用電總量產(chǎn)生變化。在多源異構(gòu)大數(shù)據(jù)環(huán)境下,探索特定區(qū)域內(nèi)總用電力資源消耗的變化趨勢(shì)與“電力-天氣-人群”深度耦合因素之間的具體聯(lián)系,探索并建立有效且高魯棒性的電量需求預(yù)測(cè)系統(tǒng)是當(dāng)務(wù)之急。
文中利用電力資源消耗、氣象和人群移動(dòng)這三大異構(gòu)化數(shù)據(jù)集,結(jié)合對(duì)應(yīng)的特征提取技術(shù)來對(duì)多源異構(gòu)數(shù)據(jù)進(jìn)行特征表征,最后設(shè)計(jì)分類算法來預(yù)估當(dāng)前區(qū)域內(nèi)下個(gè)時(shí)間段的電力資源消耗趨勢(shì)。智能電表可以用來實(shí)現(xiàn)不同時(shí)間刻度下的電力用戶實(shí)時(shí)耗電量。氣象局網(wǎng)站可以提供特定時(shí)間、地區(qū)內(nèi)的氣象數(shù)據(jù)(降水量、氣溫、風(fēng)、能見度、土壤水分等)。GPS 數(shù)據(jù)因?yàn)閭€(gè)人隱私問題導(dǎo)致電力用戶不會(huì)輕易公開自己的軌跡數(shù)據(jù),這也使得直接收集人群移動(dòng)數(shù)據(jù)變得十分困難。文中采用簽到信息、社交類軟件應(yīng)用的定位信息與蜂窩網(wǎng)絡(luò)中的呼叫詳細(xì)記錄等數(shù)據(jù)來刻畫人群移動(dòng)和人口分布變化。針對(duì)所有采集的多源異構(gòu)化數(shù)據(jù),文中首先將多源數(shù)據(jù)集在時(shí)間維度和空間維度上進(jìn)行切片,然后利用堆棧式去噪自編碼器(Stack Denoise Autoencoder,SDAE)[5]實(shí)現(xiàn)深度耦合式特征提取。長(zhǎng)短時(shí)記憶(Long Short Term Memory,LSTM)神經(jīng)網(wǎng)絡(luò)模型[6]被用于學(xué)習(xí)時(shí)間序列特征與電力資源消耗之間的關(guān)聯(lián)模式來建立電力資源需求預(yù)測(cè)模型。實(shí)驗(yàn)結(jié)果證明,依托于某地區(qū)的智能電表、氣象和人群移動(dòng)的多源異構(gòu)化數(shù)據(jù)集,所設(shè)計(jì)的基于深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的電量預(yù)測(cè)模型可以高精度地預(yù)測(cè)出未來時(shí)間段內(nèi)特定區(qū)域的總用電量變化趨勢(shì),并比僅使用歷史用電數(shù)據(jù)的傳統(tǒng)預(yù)測(cè)模型有著更魯棒的預(yù)測(cè)準(zhǔn)確性。
文中收集了三種來源的異構(gòu)歷史數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集(見表1),具體介紹如下:
表1 多源異構(gòu)數(shù)據(jù)
(1)電力資源消耗數(shù)據(jù):智能電表是智能電網(wǎng)數(shù)據(jù)采集的基本設(shè)備之一,可以實(shí)現(xiàn)原始電能數(shù)據(jù)的高效采集和傳輸,本文以每60 min 采樣一次的采樣頻率對(duì)某市所有電力用戶智能電表數(shù)據(jù)進(jìn)行采集。
(2)氣象數(shù)據(jù):本文從中國氣象數(shù)據(jù)網(wǎng)[7]收集了某市的歷史氣象數(shù)據(jù),包括氣壓、地面溫度、相對(duì)濕度、大氣密度、風(fēng)速、降水量和風(fēng)向等數(shù)據(jù),同時(shí)設(shè)置采樣頻率為每小時(shí)記錄一次。
(3)基站數(shù)據(jù):本文收集兩種數(shù)據(jù)來表征人群的移動(dòng)。第一是來自社交網(wǎng)絡(luò)軟件應(yīng)用的用戶位置信息數(shù)據(jù),第二是蜂窩網(wǎng)絡(luò)運(yùn)營(yíng)商的用戶呼叫詳細(xì)記錄(call detail records,CDR)[8]。其中社交網(wǎng)絡(luò)應(yīng)用都是通過移動(dòng)設(shè)備中自帶的GPS 模塊來精準(zhǔn)獲取用戶當(dāng)前的地理位置信息,CDR 數(shù)據(jù)是指用戶進(jìn)行撥打電話、發(fā)送短信、流量數(shù)據(jù)請(qǐng)求的數(shù)據(jù),接入到特定蜂窩基站時(shí)具有用戶本身和目標(biāo)地理位置信息。上述數(shù)據(jù)都將以小時(shí)為單位進(jìn)行時(shí)間切片。
(4)標(biāo)簽數(shù)據(jù):本文采用人工標(biāo)注的方式,對(duì)目標(biāo)區(qū)域中下一時(shí)間段總用電量變化等級(jí)進(jìn)行標(biāo)注。變化等級(jí)分為5 級(jí),分別是嚴(yán)重增加(等級(jí)1)、輕微增加(等級(jí)2)、保持不變(等級(jí)3)、輕微下降(等級(jí)4)、嚴(yán)重下降(等級(jí)5)。
在分析如何利用多源異構(gòu)的歷史數(shù)據(jù)進(jìn)行特定區(qū)域總電量消耗預(yù)測(cè)之前,定義一個(gè)合適的數(shù)據(jù)結(jié)構(gòu)是十分必要的。處理時(shí)空數(shù)據(jù)時(shí),使用矩陣作為數(shù)據(jù)表征是第一選擇。文中首先基于時(shí)空信息對(duì)數(shù)據(jù)集分別進(jìn)行時(shí)間和空間的離散化。對(duì)于時(shí)間維度,考慮到所收集的所有數(shù)據(jù)都是1 h 的采樣頻率,所以本文將每天按小時(shí)劃分成24 切片。對(duì)于空間維度,本文把某市按照經(jīng)度和維度(50 km×50 km)分成一個(gè)個(gè)單元。因此,本文會(huì)對(duì)每種數(shù)據(jù)源都有一個(gè)時(shí)間索引t,地域索引r;然后對(duì)每一個(gè)地域索引,利用T個(gè)歷史時(shí)間段去預(yù)測(cè)下一個(gè)時(shí)間段內(nèi)該地域的總用電量變化趨勢(shì)。
2.1.1 去噪自編碼器
去噪自編碼器(Denoise Autoenoder,DAE)是基于自編碼器的一種改進(jìn)模型,因?yàn)槿ピ胱跃幋a器在訓(xùn)練樣本時(shí)會(huì)主動(dòng)加入噪聲,可以強(qiáng)迫模型學(xué)習(xí)潛在的特征表示并輸出沒有噪聲的樣本。智能電表所收集的數(shù)據(jù)、基站所收集的數(shù)據(jù)無法避免地會(huì)存在噪音數(shù)據(jù)和缺失數(shù)據(jù)等情況。所以,去噪自編碼器所提取的特征具有更好的魯棒性。
具有dropout 的DAE 結(jié)構(gòu)如圖1 所示。DAE 以原始數(shù)據(jù)x∈Rd作為輸入,然后利用隨機(jī)映射的方式把原始數(shù)據(jù)轉(zhuǎn)換成具有噪聲的數(shù)據(jù)λ)。其中D是根據(jù)原始數(shù)據(jù)x的分布加入隨機(jī)噪聲的一種分布,λ為噪聲分布參數(shù)。在此模型中,采用高斯噪聲作為DAE 輸入的噪聲模型。然后將被映射成一個(gè)潛在的特征表示向量:
圖1 去噪自編碼器原理圖
當(dāng)dropout 技術(shù)被用于深度網(wǎng)絡(luò)中去優(yōu)化訓(xùn)練過程時(shí),自編碼器中的隱藏層神經(jīng)單元將以概率q進(jìn)行隨機(jī)丟棄,該丟棄概率服從伯努利分布。然后編碼器的特征表示y將轉(zhuǎn)化成丟棄后的特征表示
式中:m為隱藏向量,·表示數(shù)量積。Dropout 技術(shù)對(duì)于大型深度神經(jīng)網(wǎng)絡(luò)的優(yōu)化十分有幫助,所以在每次網(wǎng)絡(luò)參數(shù)迭代更新中,通過隨機(jī)丟棄隱藏層中的神經(jīng)元可以訓(xùn)練出具有高魯棒性的網(wǎng)絡(luò)。隱藏向量m中每一個(gè)數(shù)值都代表兩種選擇(0 為拋棄,1 為保留),所以加入dropout 技術(shù)的網(wǎng)絡(luò)在訓(xùn)練收斂時(shí)將會(huì)得到2|m|個(gè)網(wǎng)絡(luò)的一個(gè)平均表示,大大提高了后續(xù)的分類性能。
自編碼器的目標(biāo)是讓z與x盡可能的相似,所以本文采用歐氏距離去表示重構(gòu)誤差Γ(x,z)=‖x-z‖2。通過最小化重構(gòu)誤差,整個(gè)系統(tǒng)的最優(yōu)化超參數(shù)將會(huì)由下式計(jì)算得到:
為了使得模型所學(xué)習(xí)到的潛在特征更具備鑒別性,本文將稀疏約束添加到隱藏表示中將是稀疏表示的,其所有元素的平均值將近似為0。所以最終公式(4)目標(biāo)函數(shù)將修訂成:
式中:sparse()是一種稀疏約束,在本文模型中使用KL 距離[9]來表示。
2.1.2 堆棧式去噪自編碼器
去噪自編碼器可以被堆疊起來,形成一個(gè)深度網(wǎng)絡(luò),也就是堆棧式去噪自編碼器,將當(dāng)前去噪自編碼器的潛在特征作為下一層的輸入,進(jìn)一步去學(xué)習(xí)更深度的潛在特征。反向傳播被廣泛應(yīng)用在傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練中,也可以結(jié)合梯度優(yōu)化技術(shù)來訓(xùn)練深度網(wǎng)絡(luò)。但是反向傳播在堆棧式去噪自編碼器的訓(xùn)練過程中表現(xiàn)很差,因?yàn)槊恳粚佣加行畔G失,導(dǎo)致錯(cuò)誤無法正確地傳播。本文采用一種貪婪式的分層算法[10]用于訓(xùn)練堆棧式去噪自編碼器。該算法是一種自下而上的無監(jiān)督式預(yù)訓(xùn)練方法,每一層都被訓(xùn)練成一個(gè)去噪自編碼器,通過最小化重構(gòu)誤差公式來學(xué)習(xí)模型的超參數(shù)。一旦第k 層被訓(xùn)練完成,它可以繼續(xù)訓(xùn)練第k+1 層,因此潛在特征會(huì)被下一層進(jìn)行新一輪的計(jì)算。
當(dāng)堆棧式去噪自編碼器訓(xùn)練成功之后,本文利用其編碼器部分對(duì)多源異構(gòu)數(shù)據(jù)集進(jìn)行特征提取?;诙褩J阶跃幋a器的特征提取流程如圖2 所示,具體訓(xùn)練步驟如下:
圖2 堆棧式去噪自編碼器
(1)輸入原始數(shù)據(jù),通過最小化重構(gòu)誤差來訓(xùn)練第一層的去噪自編碼器,加入dropout 以防止當(dāng)前訓(xùn)練過擬合。
(2)將上一層編碼器的輸出作為下一層編碼器的輸入,然后通過最小化重構(gòu)誤差來進(jìn)行訓(xùn)練,加入dropout 以防止當(dāng)前訓(xùn)練過擬合。
(3)迭代步驟2,直到遍歷所有隱藏自編碼器層。
(4)將最后一層自編碼器的輸出作為最終學(xué)習(xí)到的特征向量,提供給后續(xù)的監(jiān)督式分類器進(jìn)行預(yù)測(cè)模型的訓(xùn)練。
2.2.1 長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)
本文的目標(biāo)是利用多源異構(gòu)數(shù)據(jù)去預(yù)測(cè)未來時(shí)間段內(nèi)電量變化的等級(jí),考慮到這些異構(gòu)數(shù)據(jù)的時(shí)空特性,循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)架構(gòu)的模型適合去捕捉時(shí)空數(shù)據(jù)上的演變過程。但是普通循環(huán)神經(jīng)網(wǎng)絡(luò)由于梯度消失和梯度爆炸的缺陷,無法獲取輸入序列數(shù)據(jù)的長(zhǎng)時(shí)間依賴性。本文采用長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)來完成對(duì)時(shí)間序列的預(yù)測(cè)任務(wù),LSTM 可以具備跨越長(zhǎng)/短時(shí)間的學(xué)習(xí)與記憶能力,并能夠自動(dòng)化地確定最優(yōu)化的時(shí)間跨度進(jìn)行預(yù)測(cè)。
LSTM 和RNN 一樣,是一種重復(fù)神經(jīng)網(wǎng)絡(luò)模塊的鏈?zhǔn)叫问?,具體見圖3。LSTM 網(wǎng)絡(luò)結(jié)構(gòu)可以用來作為時(shí)間序列的預(yù)測(cè)模型,具體來講就是輸入序列X=(x1,…,xT),通過下述公式組迭代式地計(jì)算網(wǎng)絡(luò)單元激活量,最終得到輸出預(yù)測(cè)值y。
圖3 LSTM 結(jié)構(gòu)示意圖
式中:i、f和o分別代表LSTM 中的輸入門、遺忘門和輸出門。c和m是每一個(gè)cell 和memory 模塊的激活向量,權(quán)重矩陣W和偏置向量b用來建立輸入層、輸出層和記憶模塊之間的聯(lián)系。這里,⊙表示兩個(gè)向量的數(shù)量積,σ(.)表示標(biāo)準(zhǔn)的logistics sigmoid函數(shù),g(.) 和h(.)表示cell 的輸入和輸出激活函數(shù),本文采用logistic sigmoid 函數(shù)。φ(.)是網(wǎng)絡(luò)輸出的激活函數(shù),本文采用softmax 函數(shù)。
整個(gè)預(yù)測(cè)模型的示意圖如圖4 所示,首先選擇當(dāng)前區(qū)域內(nèi)的多源異構(gòu)數(shù)據(jù)中多個(gè)時(shí)間切片,然后將每一個(gè)切片內(nèi)的數(shù)據(jù)輸入到堆棧式去噪自編碼器中,進(jìn)行特征提取,最后輸入到LSTM 網(wǎng)絡(luò)中。本文的LSTM 網(wǎng)絡(luò)設(shè)計(jì)為10 步,也就是利用前10 個(gè)時(shí)間切片的異構(gòu)數(shù)據(jù)去預(yù)測(cè)下一個(gè)時(shí)間切片的電力資源消耗趨勢(shì)。
圖4 預(yù)測(cè)模型示意圖
2.2.2 實(shí)驗(yàn)結(jié)果分析
實(shí)驗(yàn)收集了某區(qū)從2018 年3 月到2018 年9 月的電力資源、氣象、人群移動(dòng)這三個(gè)多源異構(gòu)數(shù)據(jù)集,文中將利用這些時(shí)空數(shù)據(jù)對(duì)預(yù)測(cè)模型進(jìn)行訓(xùn)練并評(píng)估其預(yù)測(cè)準(zhǔn)確率。
本文在訓(xùn)練深度模型時(shí)所使用的機(jī)器配置是:Intel Xeon CPU i7-4770,GPU NVIDIA Q4000 和16G RAM。所有實(shí)驗(yàn)對(duì)比數(shù)據(jù)均采用上述相同機(jī)器進(jìn)行計(jì)算。
2.3.1 SDAE 深度結(jié)構(gòu)參數(shù)
文中多源異構(gòu)數(shù)據(jù)集中每一類數(shù)據(jù)分別進(jìn)行歸一化,并將歸一化后的數(shù)據(jù)集輸入到SDAE 模型進(jìn)行無監(jiān)督預(yù)訓(xùn)練,并進(jìn)行特征提取。SDAE 網(wǎng)絡(luò)模型參數(shù)主要包括三個(gè)部分,分別是隱藏層數(shù)量、隱藏層中單元數(shù)量和高斯噪聲變量。在訓(xùn)練堆棧式去噪自編碼器時(shí),文中設(shè)置隱藏層參數(shù)為1~5,設(shè)置單元數(shù)量為[10,30,60,100,200],設(shè)置高斯噪聲變量為[0.2,0.4,0.6,0.8]。默認(rèn)參數(shù)設(shè)置分別為隱藏層數(shù)量為2,單元數(shù)量為60,高斯噪聲變量參數(shù)為0.4。為了得到SDAE 最佳的深度網(wǎng)絡(luò)結(jié)構(gòu),本文利用LSVM 作為網(wǎng)絡(luò)結(jié)構(gòu)性能的判斷依據(jù),對(duì)每個(gè)網(wǎng)絡(luò)結(jié)構(gòu)所提取的特征進(jìn)行分類準(zhǔn)確率對(duì)比。
當(dāng)其中一個(gè)參數(shù)被測(cè)試時(shí),其余參數(shù)設(shè)置為默認(rèn)參數(shù)。圖5~圖7 展示了參數(shù)分析的結(jié)果。結(jié)果發(fā)現(xiàn),對(duì)于隱藏層數(shù)量來說,使用SDAE 對(duì)多源異構(gòu)數(shù)據(jù)進(jìn)行特征提取,最佳的隱藏層數(shù)量是3;對(duì)于每個(gè)隱藏層的單元數(shù)量來說,最佳數(shù)量是100;對(duì)于高斯噪聲變量,結(jié)果發(fā)現(xiàn)SDAE 對(duì)此參數(shù)并不敏感,最佳變量為0.4。所以在接下來的特征提取算法對(duì)比實(shí)驗(yàn)中,SDAE 模型參數(shù)設(shè)置為:3 層隱藏層,100 個(gè)單元數(shù)量和0.4 的高斯噪聲參數(shù)。
圖5 隱藏層數(shù)量對(duì)SDAE 性能的影響
圖6 隱藏層中神經(jīng)單元數(shù)量對(duì)SDAE 性能的影響
圖7 噪聲分布對(duì)SDAE 性能的影響
2.3.2 特征提取算法對(duì)比
為了對(duì)比去噪自編碼器在特征提取中的表現(xiàn),本文選取了四種主流的特征提取方法進(jìn)行對(duì)比,分別是主成分分析(Principal Component Analysis,PCA)[11]、拉普拉斯特征映射(Laplacian Eigenmap,LE)[12]、局部線性嵌入(Locally Linear Embedding,LLE)[13]和線性判別分析(Linear Discriminant Analysis,LDA)[14]。前三種特征提取方法屬于非監(jiān)督式方法,LDA 屬于監(jiān)督式方法。PCA 和LDA 屬于線性方法,LE 和LLE 屬于非線性方法。本文對(duì)這四種方法所提取出的特征數(shù)量都設(shè)置為20。
當(dāng)通過PCA、LE、LLE、LDA 和SDAE 進(jìn)行多源異構(gòu)數(shù)據(jù)集的特征提取之后,文中采用SVM 分類器(LSVM 和RSVM)對(duì)特征數(shù)據(jù)進(jìn)行分類。除此之外,本文將不經(jīng)過特征提取的原始數(shù)據(jù)集輸入到SVM 分類器中,來分析特征提取方法的有效性。圖8 分別展示了這些特征提取方法結(jié)合LSVM 和RSVM 的整體精度,可以觀察出,相對(duì)于直接利用SVM 對(duì)原始數(shù)據(jù)進(jìn)行分類,前面提到的四種特征提取算法(PCA、LE、LLE 和LDA)反而降低了SVM 分類器的分類準(zhǔn)確率,這也說明這四種分類器方法無法準(zhǔn)確進(jìn)行有效的特征提取。SDAE 在所有特征提取算法中表現(xiàn)的最好,并相對(duì)于使用原始數(shù)據(jù)直接進(jìn)行分類的分類結(jié)果提升了7.2%的準(zhǔn)確率。最終,我們驗(yàn)證了基于SDAE 的特征提取方法確實(shí)能夠有效地提取特征,同時(shí)也說明使用單個(gè)時(shí)間切片進(jìn)行分類的結(jié)果并不滿意(73.6%)。
圖8 特征提取方法對(duì)比圖
當(dāng)堆棧式去噪自編碼器訓(xùn)練完成之后,便得到多源異構(gòu)數(shù)據(jù)的特征向量,文中結(jié)合傳統(tǒng)且常用的分類器對(duì)后續(xù)的LSTM 預(yù)測(cè)分類模型進(jìn)行對(duì)比評(píng)估。
在對(duì)整個(gè)預(yù)測(cè)系統(tǒng)進(jìn)行評(píng)估之前,本文先定義三種預(yù)測(cè)誤差指標(biāo),即平均絕對(duì)誤差(Mean Absolute Error,MAE)、平均相對(duì)誤差(Mean Relative Error,MRE)和均方根誤差(Root Mean Square,RMSE)。三個(gè)誤差公式分別如公式(6)-(8)所示:
本文選擇了決策樹(Decision Tree,DT),邏輯回歸(Logistic Regression,LR),線性支持向量機(jī)(Linear Support Vector Machine,LSVM)和循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)這四種主流分類器作為基準(zhǔn)算法,并與本文所采用的LSTM 算法進(jìn)行對(duì)比。所有分類器的輸入均為10 個(gè)歷史時(shí)間切片的特征數(shù)據(jù),其中RNN 模型也設(shè)置為10 步,且每步都輸入一個(gè)時(shí)間切片的特征向量。表2 列出了它們對(duì)應(yīng)的MAE、MRE 和RMSE 三個(gè)結(jié)果數(shù)值。結(jié)果表明所提模型的預(yù)測(cè)誤差相對(duì)于其他基準(zhǔn)算法來說最小。
表2 分類算法準(zhǔn)確率對(duì)比
文章提出一種新型的基于多源異構(gòu)數(shù)據(jù)驅(qū)動(dòng)的電量預(yù)測(cè)系統(tǒng),通過設(shè)計(jì)深度學(xué)習(xí)算法對(duì)目標(biāo)區(qū)域內(nèi)的總用電量變化趨勢(shì)等級(jí)進(jìn)行高精度預(yù)測(cè)。通過多源真實(shí)數(shù)據(jù)集(電力資源數(shù)據(jù)、氣象數(shù)據(jù)和人群移動(dòng)數(shù)據(jù))驗(yàn)證,所設(shè)計(jì)的堆棧式去噪自編碼器可以很好地提取異構(gòu)數(shù)據(jù)集間的深度耦合特征,同時(shí)長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)可以從歷史時(shí)間維度上捕捉特征之間的潛在關(guān)聯(lián)并實(shí)現(xiàn)高精度電力需求預(yù)測(cè)。最終,證明了利用多源異構(gòu)數(shù)據(jù)集可以更加全面地對(duì)區(qū)域性用電習(xí)慣進(jìn)行建模,為電力相關(guān)部門提供高效且低時(shí)延的電力需求預(yù)測(cè)信息。