姚長(zhǎng)征,張自強(qiáng),李玉杰,王選岐
(1.國(guó)網(wǎng)慶陽(yáng)供電公司,甘肅 慶陽(yáng) 745000;2.國(guó)網(wǎng)甘肅省電力公司,甘肅 蘭州 730000)
目前而言,居民用電量預(yù)測(cè)仍然是電力系統(tǒng)最為關(guān)注的研究課題之一,準(zhǔn)確的居民用電量預(yù)測(cè)同時(shí)有益于電力公司與普通居民。對(duì)電力公司來(lái)講,可以規(guī)范運(yùn)營(yíng)策略,提升服務(wù)質(zhì)量,降低營(yíng)銷成本;對(duì)普通居民來(lái)講,有助于規(guī)劃用電計(jì)劃,購(gòu)買合理的用電套餐,達(dá)到隨時(shí)隨地可監(jiān)控自己的用電量的效果。因此,居民用電量預(yù)測(cè)研究很有必要,其為電網(wǎng)規(guī)劃建設(shè)、市場(chǎng)開(kāi)拓、臺(tái)區(qū)三相負(fù)荷不平衡調(diào)整等提供科學(xué)的依據(jù)支撐。
國(guó)內(nèi)對(duì)用電量的預(yù)測(cè)研究大部分都停留在回歸分析等傳統(tǒng)方法,該方法預(yù)測(cè)精度不高,并且對(duì)變化趨勢(shì)反映遲鈍。近幾年,有些學(xué)者提出了數(shù)據(jù)挖掘算法如神經(jīng)網(wǎng)絡(luò)等進(jìn)行居民用電量預(yù)測(cè),但該方法要求樣本具有高的代表性,并且解釋過(guò)程相對(duì)困難,針對(duì)上述方法的不足,本文采用較為簡(jiǎn)單的時(shí)間序列算法對(duì)居民用電量預(yù)測(cè)研究,利用描述性統(tǒng)計(jì)對(duì)居民用電量敏感度進(jìn)行了分析。實(shí)現(xiàn)對(duì)居民用電量的精準(zhǔn)預(yù)測(cè),提升電力公司的服務(wù)質(zhì)量,降低95598關(guān)于居民用電量的投訴量,為營(yíng)銷居民用電管理提供決策參考利用居民日電量數(shù)據(jù)匯總生成縣區(qū)日電量數(shù)據(jù),結(jié)合氣象數(shù)據(jù),分析居民用電氣象敏感度,達(dá)到預(yù)警的作用。
本次分析電力內(nèi)部數(shù)據(jù)取自營(yíng)銷業(yè)務(wù)應(yīng)用系統(tǒng)、用電信息采集系統(tǒng),取數(shù)粒度到居民用電客戶層級(jí),數(shù)據(jù)周期為2018年1月至12月,總數(shù)據(jù)量約1.02 GB、數(shù)據(jù)記錄總數(shù)約7.19億條。
(1)可信度:日凍結(jié)電量來(lái)自于用采系統(tǒng),為一次數(shù)據(jù),具有較高的可信度。(2)完整性:日凍結(jié)電量因采集原因不存在重復(fù)情況,存在少量數(shù)據(jù)項(xiàng)缺失情況,整體字段完整度較高,不影響后續(xù)的數(shù)據(jù)挖掘分析。(3)數(shù)據(jù)質(zhì)量:日凍結(jié)電量主要存在數(shù)據(jù)為空或電量數(shù)值突變的情況。
對(duì)日凍結(jié)電量數(shù)據(jù)為空或數(shù)值幅度突變的情況,使用該數(shù)據(jù)臨近數(shù)據(jù)平移填補(bǔ);將12個(gè)月度日凍結(jié)電量寬表合成年度日凍結(jié)電量寬表,如圖1所示。
表1 年度日凍結(jié)電量寬表Tab.1 Annual daily frozen power meter
根據(jù)數(shù)據(jù)集中的用戶日電量匯總計(jì)算周電量、月電量、供電所日電量、縣區(qū)日電量。
居民個(gè)人日電量曲線波動(dòng)大,外界影響比較顯著。為減小外界因素影響、提高模型可行性和預(yù)測(cè)精確度,將用戶按照所屬供電所分類后,使用日電量求和計(jì)算得到的供電所每日用電量進(jìn)行預(yù)測(cè)。
由居民日用電量按照居民所屬供電所計(jì)算供電量日用電量,基于3次指數(shù)平滑算法對(duì)未來(lái)一周的日用電量進(jìn)行預(yù)測(cè),在確定最佳參數(shù)后,確定向后預(yù)測(cè)3 d效果最佳。
算法選擇
幾種算法比較,結(jié)果如表2所示。
表2 算法比較Tab.2 Comparison of algorithms
由表2可知,ARIMA要求數(shù)據(jù)既具有平穩(wěn)性又非白噪聲,部分?jǐn)?shù)據(jù)無(wú)法滿足需求,故而無(wú)法預(yù)測(cè),試用階段未完成計(jì)算;小波變化先將數(shù)據(jù)分解,分解得到的數(shù)據(jù)分別擬合、預(yù)測(cè),最終將各個(gè)預(yù)測(cè)結(jié)果合成,過(guò)程復(fù)雜,且分別擬合效果不佳,試用階段未完成計(jì)算;Fbprophet雖完成計(jì)算,但計(jì)算時(shí)間長(zhǎng),對(duì)大規(guī)模數(shù)據(jù)適應(yīng)性不好,總體效果在完成計(jì)算的3種方法中最差;LSTM、ExponentialSmoothing適應(yīng)大規(guī)模數(shù)據(jù),計(jì)算時(shí)間短,比較RMSE(均方根誤差)可知,ExponentialSmoothing更低,故最終選擇ExponentialSmoothing算法。
算法介紹
通常3次指數(shù)平滑算法分為累加和累乘2種方式,在本研究中使用累加形式的3次指數(shù)平滑算法,其用公式表示為:
=(--)+(1-)(-1+-1)
=?(--1)+(1-?)-1
=(-)+(1-)-
式中:為周期。
累加3次指數(shù)平滑的預(yù)測(cè)公式為:+=++-+(mod),其中,,是平滑參數(shù),是之前個(gè)數(shù)據(jù)的平滑值,變量來(lái)表示平滑后的趨勢(shì),是指“周期性”部分,是這個(gè)周期的長(zhǎng)度。
參數(shù)訓(xùn)練
3次指數(shù)平滑的主要參數(shù)有:smoothing_level(alpha值)、smoothing_slope(belta值)、smoothing_seasonal(gamma值)參數(shù)使用網(wǎng)格搜索調(diào)參。指數(shù)平滑算法中alpha值代表最近的歷史數(shù)據(jù)對(duì)預(yù)測(cè)結(jié)果的影響,考慮到用電量預(yù)測(cè)最近的歷史數(shù)據(jù)與未來(lái)相似程度最高,所以alpha值至少在0.9以上。本研究鑒于均方根誤差最小來(lái)確定最終參數(shù)值,當(dāng)smoothing_level為0.99,其余2個(gè)參數(shù)為None時(shí)效果最佳,其RMSE值最小為332.13。
模型調(diào)優(yōu)
在確定模型參數(shù)后,計(jì)算預(yù)測(cè)效果最佳天數(shù),使用模型參數(shù)向后預(yù)測(cè)7 d,通過(guò)使平均誤差控制在一定的范圍之內(nèi)確定最佳預(yù)測(cè)天數(shù)。
經(jīng)計(jì)算,未來(lái)7 d的平均預(yù)測(cè)誤差如表3所示。
表3 平均預(yù)測(cè)誤差Tab.3 Average forecast error
由平均預(yù)測(cè)誤差可知,前3 d預(yù)測(cè)誤差小于4%,預(yù)測(cè)精度較高,故選擇向后預(yù)測(cè)最佳天數(shù)為3 d。
分別分析溫度、風(fēng)力、相對(duì)濕度、降水量、極端天氣對(duì)用電量的影響,最后根據(jù)分析結(jié)果構(gòu)建相關(guān)圖表。
數(shù)據(jù)處理
數(shù)據(jù)處理包含2部分:氣象數(shù)據(jù)處理和用電量數(shù)據(jù)處理。
氣象數(shù)據(jù)處理時(shí)間周期為2018年1月1日至2019年6月30日,包含氣象、溫度、相對(duì)濕度、風(fēng)力、降水等信息,數(shù)據(jù)集中沒(méi)有重復(fù)值、異常值,但含有缺失值,通過(guò)其他形式查找缺失氣象數(shù)據(jù)填補(bǔ)缺失值(如以往的天氣預(yù)報(bào)值)。
用電量數(shù)據(jù)處理,首先將測(cè)量點(diǎn)標(biāo)識(shí)與該表所在區(qū)縣代碼一一對(duì)應(yīng),然后根據(jù)區(qū)縣代碼計(jì)算該區(qū)縣的用電量。
在對(duì)氣象數(shù)據(jù)和用電量數(shù)據(jù)處理完成后,按照對(duì)應(yīng)日期合成寬表。
溫度敏感度分析
溫度敏感度分析,結(jié)果如圖1所示。
(a)2018年西峰日用電量折線圖
從2018年西峰日用電量折線圖中可以看出,1~2月份用電量大,且波動(dòng)明顯;3~8月用電量趨勢(shì)總體略顯下降;9~12月用電量總體上升,從11月開(kāi)始用電量波動(dòng)增大。這也體現(xiàn)慶陽(yáng)市的特點(diǎn),夏季空調(diào)降溫用電量少,冬季采暖用電量高。
從2018年西峰氣溫折線圖可以看出白天和夜晚溫度總體趨勢(shì)大體相同,都呈現(xiàn)先上升再下降的趨勢(shì),為簡(jiǎn)化分析,只分析其中代表性較強(qiáng)的夜晚溫度。夜晚溫度折線圖中1~2月份、11~12月份溫度基本都在0度以下且震動(dòng)幅度很大,其他月份總起呈現(xiàn)先上升再下降的趨勢(shì),其中拐點(diǎn)出現(xiàn)在9月份。
溫度和用電量對(duì)比分析,結(jié)果如圖2所示。
圖2 溫度和用電量對(duì)比分析結(jié)果Fig. 2 Comparison analysis results of temperature and power consumption
由圖2可知,溫度和用電量總體呈負(fù)相關(guān)關(guān)系,部分呈正相關(guān)性。
將上述描述推廣到慶陽(yáng)市的各個(gè)縣,不同區(qū)縣用電量對(duì)氣溫的敏感度不同,表4為不同區(qū)縣對(duì)溫度敏感度的描述(加入閾值)。
用電量受到多種因素的影響,為了重點(diǎn)強(qiáng)調(diào)現(xiàn)溫度對(duì)用電量的影響,選擇相關(guān)性系數(shù)絕對(duì)值大于0.8,即對(duì)溫度敏感度非常高的時(shí)間段,分析溫度對(duì)用電量的具體影響;結(jié)果如表5、表6所示。
表4 不同區(qū)縣對(duì)溫度敏感度的描述Tab.4 Description of temperature sensitivity of different curves
對(duì)春夏、秋季2個(gè)時(shí)段,其變化趨勢(shì)單一,具體趨勢(shì)如下:
對(duì)冬末、初冬2個(gè)時(shí)段,其用電量波動(dòng)性大,同時(shí)擁有溫度上升時(shí),用電量下降;溫度下降時(shí),用電量上升的趨勢(shì)。
風(fēng)力敏感度與相對(duì)濕度分析
風(fēng)力敏感度與相對(duì)濕度分析,結(jié)果如圖3所示。
圖3 風(fēng)力敏感度與相對(duì)濕度分析結(jié)果Fig. 3 Results of wind sensitivity and relative humidity analysis
表5 用電量隨溫度變化的趨勢(shì)(春夏、秋季)Tab.5 Trends of electricity consumption with temperature change (spring & summer, autumn)
表6 用電量隨溫度變化的趨勢(shì)(冬末,初冬)Tab.6 Trends in electricity consumption with temperature change (late winter, early winter)
由圖3可知,左邊散點(diǎn)圖根據(jù)某一天與前一天的風(fēng)力等級(jí)、用電量的變化差值構(gòu)成的;右圖根據(jù)某一天與前一天的相對(duì)濕度、用電量的變化差值構(gòu)成的。當(dāng)風(fēng)力或相對(duì)濕度等級(jí)增加1級(jí)時(shí),用電量既可能增加也可能減少,不存在一定的規(guī)律。同樣的方法應(yīng)用到降水量與極端天氣變量,可以得到相同的結(jié)果。
基于時(shí)間序列的居民用電量預(yù)測(cè)研究,一方面試點(diǎn)單位的相關(guān)管理人員可根據(jù)預(yù)測(cè)結(jié)果制定負(fù)荷調(diào)整計(jì)劃,最大程度上降低企業(yè)運(yùn)行成本;另一方面電力公司根據(jù)溫度與用電量大致上呈現(xiàn)負(fù)相關(guān)的基礎(chǔ)上,在溫度急劇上升或急劇下降的事件發(fā)生時(shí),可以輔助制定應(yīng)急策略,讓氣象敏感單位做好提前預(yù)防工作,盡可能降低極端事件帶來(lái)的人力物力損失。同時(shí)在應(yīng)用過(guò)程中,可將新的數(shù)據(jù)作為驗(yàn)證集代入模型,進(jìn)一步調(diào)整模型參數(shù),使模型達(dá)到最優(yōu)。
本研究在傳統(tǒng)居民用電量短期預(yù)測(cè)的研究基礎(chǔ)上,進(jìn)一步研究了居民用電氣象敏感度分析,將人為不可控因素作為輔助因素(溫度,風(fēng)力,相對(duì)濕度,降雨量與極端天氣)加入到居民用電量的研究之中,這種不可控因素?zé)o法阻止其發(fā)生,但我們可以在不可控情況發(fā)生時(shí),及時(shí)提出相應(yīng)的策略,達(dá)到預(yù)警的作用,這樣既能完善電力系統(tǒng)功能,又能提升居民客戶對(duì)電力公司的信任。
目前對(duì)居民用電客戶的用電量預(yù)測(cè)工作尚處于探索階段,較主網(wǎng)及大工業(yè)用電客戶的電量預(yù)測(cè)還有很大的差距。本研究基于指數(shù)平滑算法中的累加形式的三次指數(shù)平滑算法實(shí)現(xiàn)了慶陽(yáng)市居民用電量的短期(3 d)預(yù)測(cè),其平均預(yù)測(cè)誤差控制在4%以內(nèi),預(yù)測(cè)效果良好,為了進(jìn)一步研究居民用電量,本研究在此基礎(chǔ)上進(jìn)行了居民用電氣象敏感度分析,從而制定相應(yīng)的策略,提前防范極端事件發(fā)生時(shí)對(duì)電力公司與居民客戶帶來(lái)的損失,但是本文提出的不可控因素之間存在多重共線性,可能在一定程度上會(huì)影響對(duì)居民用電量的判斷,可以用,ridge,lasso等方法進(jìn)行變量稀疏化,再進(jìn)一步進(jìn)行研究。