魏鶴嬋
摘 要: 海量用電數(shù)據(jù)中隱含著客戶的用電規(guī)律特征,對這些數(shù)據(jù)進(jìn)行分析能夠了解客戶的差異化、個(gè)性化服務(wù)需求?;趪鴥?nèi)外研究現(xiàn)象,對客戶用電規(guī)律關(guān)鍵技術(shù)進(jìn)行了系統(tǒng)研究,研究方法包括聚類算法、日期匹配算法、曲線相似性度量算法等。提出詳細(xì)的電能計(jì)量系統(tǒng)構(gòu)建方案,分析主網(wǎng)的用電規(guī)律和用電特征。結(jié)合用電模式分析了海量客戶的用電規(guī)律,建立歷史日削峰填谷匹配關(guān)系,并以某電力公司2017-2018年的客戶用電數(shù)據(jù)為例,驗(yàn)證了用電分析模型的有效性,能夠?yàn)槲磥淼碾娏π枨髠?cè)響應(yīng)政策的制定提供數(shù)據(jù)支撐。
關(guān)鍵詞: 用電特征; 聚類算法; 用電規(guī)律; 電能計(jì)量系統(tǒng)
中圖分類號(hào): TP311; TM933 ? ? ?文獻(xiàn)標(biāo)志碼: A
Abstract: Massive electricity consumption data imply the characteristics of customers electricity consumption law. The analysis of these data can understand differentiated and personalized needs of customers. The key technologies of customers electricity consumption law are systematically studied, including clustering algorithm, date matching algorithm, curve similarity measurement algorithm, etc. A detailed construction scheme of energy measurement system is proposed, and the main network is studied. Based on the electricity consumption law and characteristics, combined with the electricity consumption pattern, the electricity consumption law of mass customers is analyzed, and the matching relationship between peak-shaving and valley-filling is established. The validity of the electricity consumption analysis model is validated by taking the massive electricity consumption data of a power company from 2017 to 2018 as an example, which can provide data support for the formulation of future power demand-side response policy.
Key words: power consumption feature; clustering algorithm; electricity usage law; energy metering system
0 引言
近年來,客戶用電規(guī)律及用電量呈現(xiàn)出多元化的特征,未來電網(wǎng)必須能夠提供更加優(yōu)質(zhì)、清潔、可靠、安全的電力供應(yīng)[1]。同時(shí),隨著營配一體化協(xié)同工作機(jī)制的建立,用電客戶的用電數(shù)據(jù)能夠與客戶繳費(fèi)、客戶檔案等關(guān)聯(lián)起來,對這些用電數(shù)據(jù)進(jìn)行深度挖掘能夠幫助電網(wǎng)了解客戶的個(gè)性化、差異化服務(wù)需求。如何通過提取天氣參數(shù)、客戶信息、用電負(fù)荷等相關(guān)數(shù)據(jù),建立電力主網(wǎng)的負(fù)荷特征與客戶群體的負(fù)荷特征的模式匹配關(guān)系,對提高整個(gè)配電系統(tǒng)的工作效率和管理水平有著重要的意義[2-4]。國內(nèi)外學(xué)者對客戶用電規(guī)律進(jìn)行了深入研究,林承就等[5]對居民智能用電情況進(jìn)行了數(shù)據(jù)統(tǒng)計(jì),通過模糊綜合評價(jià)法對居民智能用電的態(tài)度進(jìn)行量化評分,分析了居民用電情況和影響因素;劉利成等[6]探討了典型用電客戶的用電規(guī)律,結(jié)合大量的行業(yè)經(jīng)驗(yàn),構(gòu)建了月度用電量計(jì)算公式,驗(yàn)證了該電量計(jì)算方法的有效性,但系統(tǒng)運(yùn)行的時(shí)間耗費(fèi)長不能滿足快速的用電需求響應(yīng)。Ibrahim D等[7]基于并行K-MEANS聚類算法,建立了谷電系數(shù)、負(fù)荷率、峰時(shí)耗電率等時(shí)間序列特征,將居民客戶被分成商業(yè)客戶、老人家庭、上班族+老人、上班族、空置房等5類客戶,但聚類方法的計(jì)算復(fù)雜度較高。本文對客戶用電規(guī)律關(guān)鍵技術(shù)進(jìn)行了系統(tǒng)研究,包括聚類算法、日期匹配算法、曲線相似性度量算法等,并對提出了詳細(xì)的電能計(jì)量系統(tǒng)構(gòu)建方案,研究了主網(wǎng)的用電規(guī)律和用電特征,結(jié)合用電模式分析了海量客戶的用電規(guī)律,建立歷史日削峰填谷匹配關(guān)系,并以某電力公司2017-2018年的海量客戶用電數(shù)據(jù)為例,驗(yàn)證了用電分析模型的有效性,對提高電網(wǎng)需求側(cè)能效管理水平具有建設(shè)性意義。
1 用電規(guī)律模型的構(gòu)建
1.1 用電規(guī)律分類
客戶用電規(guī)律分析是對歷史數(shù)據(jù)的處理過程,本文對海量數(shù)據(jù)進(jìn)行聚類分析,用電規(guī)律分析需要對以下算法進(jìn)行研究,聚類算法、最優(yōu)聚類評價(jià)算法、日期匹配算法、曲線相似性度量算法。其中,聚類分析是將海量數(shù)據(jù)集劃分為若干個(gè)子集,并使集合內(nèi)的數(shù)據(jù)具有較高的相似度。EM聚類算法作為一種迭代算法,用于含有隱變量的概率參數(shù)模型的極大后驗(yàn)概率估計(jì),EM算法主要分為E步驟和M步驟,通過兩步驟逐步改進(jìn)模型的參數(shù),最后終止于一個(gè)極大點(diǎn)。K-MEANS算法是將數(shù)據(jù)對象劃分為k個(gè)聚類,具體過程為:從數(shù)據(jù)對象中任意選取k個(gè)對象作為初始的聚類中心;分別計(jì)算每個(gè)對象到聚類中心的距離,并將其分配到最近距離的聚類;分配完成后,重新計(jì)算k個(gè)聚類的中心點(diǎn),對兩次聚類中心進(jìn)行比較,輸出聚類結(jié)果。
1.2 用電規(guī)律診斷
2 電能計(jì)量系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
電能計(jì)量系統(tǒng)分為用電規(guī)律分析模型、主網(wǎng)負(fù)荷聚類分析、主網(wǎng)負(fù)荷數(shù)據(jù)管理、用電客戶負(fù)荷查詢、客戶群用電規(guī)律分析等模塊,功能模塊[12]如圖1所示。
其中,用電規(guī)律分析引擎通過用電規(guī)律分析模型的算法實(shí)現(xiàn)[13]。
2.1 用電規(guī)律分析引擎
用電行為分析引擎是以算法包的形式實(shí)現(xiàn),對用戶規(guī)律分析之前,需要對數(shù)據(jù)進(jìn)行預(yù)處理,包括新舊測量點(diǎn)處理、負(fù)值處理、缺失值處理、“0”值處理、異常值檢測處理等[14]。使用EM聚類對主網(wǎng)負(fù)荷數(shù)據(jù)進(jìn)行聚類,將歷史負(fù)荷曲線分成多個(gè)群體,從而獲得在不同時(shí)期主網(wǎng)負(fù)荷的不同特征,主網(wǎng)聚類分析算法流程,如圖2所示。
基于主網(wǎng)聚類的聚類結(jié)果,使用Map-Reduce環(huán)境下的K-Means聚類算法,對不同主網(wǎng)下的客戶群進(jìn)行聚類分析,得到負(fù)荷聚類結(jié)果和負(fù)荷聚類特征[15]??蛻羧壕垲惙治隽鞒蹋鐖D3所示。
基于客戶群聚類分析,對主網(wǎng)特征及客戶群聚類特征進(jìn)行削峰填谷模式匹配,通過匹配結(jié)果將客戶群與主網(wǎng)之間關(guān)系分類,如圖4所示。
將歷史數(shù)據(jù)劃分為3個(gè)日期數(shù)據(jù)集合,分別為:工作日、周末以及節(jié)假日。待測日為工作日或周末時(shí),分別在工作日和歷史周末集合中尋找歷史相似日。待測日為節(jié)假日時(shí),直接用歷史同一節(jié)假日群體進(jìn)行用電規(guī)律的分析。日期匹配分析算法流程,如圖5所示。
2.2 主網(wǎng)負(fù)荷的聚類分析
主網(wǎng)負(fù)荷的聚類分析對聚類結(jié)果、聚類分布、聚類結(jié)果特征,能夠直觀的展示負(fù)荷分類以及日期構(gòu)成等,流程圖如圖6所示。
2.3 客戶群用電規(guī)律分析
客戶群用電規(guī)律分析實(shí)現(xiàn)了用戶用電規(guī)律分析和用電規(guī)律預(yù)測。結(jié)合主網(wǎng)負(fù)荷聚類、客戶負(fù)荷聚類、削峰填谷模式匹配執(zhí)行結(jié)果,直觀的展示對比情況;用戶用電規(guī)律預(yù)判支撐查詢匹配結(jié)果,功能流程圖,如圖7所示。
2.4 主網(wǎng)負(fù)荷數(shù)據(jù)管理
主網(wǎng)負(fù)荷數(shù)據(jù)管理和用電客戶負(fù)荷查詢以表格和圖形形式展示日主網(wǎng)負(fù)荷情況,以及主網(wǎng)、客戶群、用電客戶三者之間的對比關(guān)系,用于查詢主網(wǎng)負(fù)荷數(shù)據(jù)和用電客戶負(fù)荷數(shù)據(jù),頁面流程圖[16],如圖8所示。
3 仿真實(shí)驗(yàn)分析
為驗(yàn)證系統(tǒng)的設(shè)計(jì)思路、操作流程及模塊功及是否滿足各單位功能需求,以某電力公司2017-2018年的海量客戶典型月用電數(shù)據(jù)為例,對電能計(jì)量系統(tǒng)客戶用電規(guī)律進(jìn)行驗(yàn)證。
3.1 主網(wǎng)聚類結(jié)果
利用EM聚類算法對2017年某電力公司典型月主網(wǎng)負(fù)荷曲線進(jìn)行聚類分析,網(wǎng)負(fù)荷聚類特征曲線,如圖9所示。
可以看出,每一類的負(fù)荷特征曲線形態(tài)較為相似,低谷型負(fù)荷主要出現(xiàn)在節(jié)假日和春季,高峰型負(fù)荷主要出現(xiàn)在冬季和夏季。第一類主網(wǎng)負(fù)荷曲線夜間負(fù)荷較低,晝夜差距明顯,白天從6:00負(fù)荷不斷增大,并在11:00達(dá)到峰值,19:00后負(fù)荷開始下降,分布主要集中在夏冬季節(jié)。其中,節(jié)假日和春季在第一類中無分布;夏季、秋季、冬季中第一類分布分別占比58.11%、51.70%、6.52%,第二類主網(wǎng)負(fù)荷曲線為普通型,整體趨勢與第一類類似,晝夜差距也較為明顯,但白天基本平穩(wěn),四季分布均勻,分別占比15.07%,39.82%,41.34%,33.18%;第三類主網(wǎng)負(fù)荷曲線為低谷型,在中午有明顯谷值,春秋季和節(jié)假日分布較多,夏冬季也有少許分布。其中,節(jié)假日占比82.16%,夏季、秋季、冬季中第一類分布分別占比83.93%,1.08%、51.13%、14.31%。綜上,第一類主網(wǎng)負(fù)荷曲線主要為夏、冬季節(jié);第二類主網(wǎng)負(fù)荷曲線四季分布較為均勻;第三類主網(wǎng)負(fù)荷曲線主要為春秋季節(jié);節(jié)假日主要集中在第三類。
3.2 客戶群體分析結(jié)果
通過對用戶用電曲線數(shù)據(jù)的聚類分析,可得到電力客戶負(fù)荷特征。利用客戶負(fù)荷曲線作為并行K-MEANS聚類算法的輸入,得到第一類主網(wǎng)負(fù)荷下的客戶負(fù)荷曲線,如圖10所示。
通過模式匹配建立第一類主網(wǎng)負(fù)荷特征曲線和電力客戶負(fù)荷曲線的對應(yīng)關(guān)系,求取皮爾森相關(guān)系數(shù)及負(fù)荷曲線的最大負(fù)荷值,結(jié)合電力客戶負(fù)荷曲線最大負(fù)荷值確定削峰填谷對象??蛻糌?fù)荷特征曲線,可以看出,第一類主網(wǎng)負(fù)荷特征曲線與四類電力客戶負(fù)荷曲線的皮爾森相關(guān)系數(shù)分別為0.989 7,0.993 3,0.999 7,0.630 3,最大負(fù)荷分別為7.022 0 kW、1.216 9 kW、0.433 7 kW和0.095 1 kW。第一類的最大負(fù)荷值最大,因此確定第一類主網(wǎng)日負(fù)荷特征曲線下的削峰填谷對象為第一類用戶。
針對第二類主網(wǎng)日負(fù)荷特征曲線,利用測量點(diǎn)負(fù)荷曲線進(jìn)行自動(dòng)化聚類,可以得到第二類日負(fù)荷下客戶負(fù)荷曲線,如圖11所示。
通過模式匹配等技術(shù)建立第二類主網(wǎng)負(fù)荷特征曲線與電力客戶負(fù)荷曲線的對應(yīng)關(guān)系,第二類主網(wǎng)負(fù)荷特征曲線與三類電力客戶負(fù)荷曲線的皮爾森相關(guān)系數(shù)分別為0.996 2,0.995 3,0.858 8,電力客戶的最大負(fù)荷為分別為2.371 2 kW,0.412 4 kW,0.056 6 kW。由于第一類和第二類客戶負(fù)荷曲線皮爾森相關(guān)系數(shù)差距較小,且第一類的最大負(fù)荷值較大,因此,確定第二類主網(wǎng)電力客戶削峰填谷對象為第一類用戶。
針對第三類主網(wǎng)日負(fù)荷特征曲線,利用測量點(diǎn)負(fù)荷曲線進(jìn)行自動(dòng)化聚類,可以得到第三類日負(fù)荷下客戶負(fù)荷曲線,如圖12所示。
通過模式匹配等技術(shù)建立第三類主網(wǎng)負(fù)荷特征曲線與電力客戶負(fù)荷曲線的對應(yīng)關(guān)系,可以看出,第三類主網(wǎng)負(fù)荷特征曲線與五類電力客戶負(fù)荷曲線的皮爾森相關(guān)系數(shù)分別為0.986 2,0.745 4,0.995 6,-0.605 8,0.991 4電力客戶的最大負(fù)荷為分別為5.294 6 kW,4.637 0 kW,0.799 5 kW,0.321 4 kW,0.095 8 kW。由于第四類客戶負(fù)荷曲線與第三類主網(wǎng)負(fù)荷曲線的相關(guān)系數(shù)為負(fù)值,因此該類客戶優(yōu)先作為鼓勵(lì)用電的客戶類型。而為第一類、第三類和第五類客戶負(fù)荷曲線的相關(guān)系數(shù)差距較小,且均接近1,但第一類的最大負(fù)荷值較大,確定第三類主網(wǎng)電力客戶削峰填谷對象為第一類用戶。