張世元,王治國,董昊男,傅冠凱
(國網(wǎng)甘肅省電力公司,甘肅蘭州 730030)
電力數(shù)據(jù)隱藏著用戶用電的行為和習(xí)慣,利用電力數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘和用戶類型研究,可以更好地理解用戶對個(gè)性化和差異化服務(wù)的需求。由此,服務(wù)的深度和廣度進(jìn)一步擴(kuò)大,為制定支持未來需求方響應(yīng)的政策提供數(shù)據(jù)支持[1]。在傳統(tǒng)行業(yè)分類的基礎(chǔ)上,提出了基于聚類的用戶分類研究方法。雖然使用該方法能夠快速分析用電行為,但并未考慮用戶使用電力的不同,特別是3 種類型用戶的當(dāng)前市場價(jià)值、潛在市場價(jià)值和區(qū)域貢獻(xiàn)價(jià)值,這種分類很大程度上是宏觀的,并不符合電力負(fù)荷精細(xì)化管理的能源戰(zhàn)略,因此,對不同類型的用戶采取不同營銷策略是具有必要性的[2]。因此,提出了一種基于數(shù)據(jù)驅(qū)動(dòng)的用電行為分析模型。在此基礎(chǔ)上,建立了數(shù)據(jù)驅(qū)動(dòng)的用電行為分析模型,提取了有價(jià)值的信息。
該方法結(jié)合K-means 算法和數(shù)據(jù)驅(qū)動(dòng)技術(shù),實(shí)現(xiàn)了電力消耗分類的并行處理。這種算法因其計(jì)算速度快而經(jīng)常用于大規(guī)模數(shù)據(jù)聚類[3]。圖1 是用電分析結(jié)構(gòu)框圖。
圖1 用電分析結(jié)構(gòu)框圖
如圖1 所示,用電量信息采集主要完成對家庭用戶用電量數(shù)據(jù)的采集[4-6]。將采集到的數(shù)據(jù)輸入不同設(shè)備驅(qū)動(dòng)模塊之中,通過執(zhí)行多變量、存儲(chǔ)多維數(shù)據(jù),其并行存儲(chǔ)、轉(zhuǎn)換功能可為用戶用電行為分析奠定基礎(chǔ)[7-8]。
基于數(shù)據(jù)驅(qū)動(dòng)聚類算法步驟如下所示:
Step2:對上述數(shù)據(jù)集中的第i個(gè)樣本點(diǎn)ai,確定其與聚類中心βj的距離,并獲取樣本點(diǎn)ai所屬類別簇,計(jì)算公式如下所示:
式(1)中,i=1,…,n;j=1,…,m;
Step3:依據(jù)式(2)更新m個(gè)聚類中心,計(jì)算公式如下:
式(2)中,nj表示簇βj對象數(shù)量。
Step4:重復(fù)Step2 和Step3,直到函數(shù)收斂為止;
Step5:收斂評價(jià)依據(jù)如圖2 所示。
圖2 收斂評價(jià)依據(jù)
如圖2 所示,數(shù)據(jù)驅(qū)動(dòng)收斂評估的基礎(chǔ)有3 個(gè)階段,即初始類別、層次合并和重新標(biāo)記[9-10]。每一階段以
初始類別階段:Map/Reduce 模型將輸入數(shù)據(jù)集分成幾個(gè)數(shù)據(jù)子集,并為每個(gè)Map 函數(shù)賦值[11-13]。key 是相對于輸入數(shù)據(jù)文件開始點(diǎn)的當(dāng)前示例的偏移。利用歐氏距離公式,分析當(dāng)前樣本各維度的坐標(biāo)值,對中心點(diǎn)進(jìn)行距離計(jì)算,得到最接近樣本的聚類指數(shù),并生成中間的設(shè)置{k1,v1},k1 是最接近集群指數(shù),v1 是每個(gè)維坐標(biāo)的當(dāng)前采樣值[14]。此值對的數(shù)據(jù)類型與原始鍵-值對不同,需要將操作結(jié)果存儲(chǔ)在中間庫中。
層級合并階段迭代期間,為了降低通信開銷,Map 階段結(jié)束后,需要對已處理數(shù)據(jù)進(jìn)行部分合并[15]。這一階段,Map/Reduce 模型重新排列中間鍵值集,從而生成新的二元組。在新集合中,所有相應(yīng)鍵的值都相同,并且二元組的集合也會(huì)按照Reduce任務(wù)的相同數(shù)目分成片段。對每個(gè)Reduce 任務(wù),輸入是二元組集合的片段[16]。利用層次分析法將處理樣本的數(shù)據(jù)合并為相應(yīng)節(jié)點(diǎn)的坐標(biāo)值和累積坐標(biāo)值,將相應(yīng)的值相加,除以樣本總數(shù),獲得新的中心點(diǎn)坐標(biāo),輸出鍵-值對
選取合理的電力行為特征評價(jià)指標(biāo)作為分類依據(jù),考慮電力用戶負(fù)荷特征和長、短期時(shí)間序列特征,建立了電力用戶用電行為特征多維評價(jià)指標(biāo)體系,包括:1)由年度最大負(fù)荷利用小時(shí)數(shù)和典型日平均負(fù)荷率所構(gòu)成的負(fù)荷特征指數(shù)可用于衡量負(fù)荷密度和強(qiáng)度;2)以年為單位的月平均負(fù)荷構(gòu)成的月用電量時(shí)間序列能夠反映出年時(shí)間尺度上負(fù)荷的用電行為特征,如季節(jié)不平衡特征;3)以典型日小時(shí)為單位的日用電量時(shí)間序列能夠反映負(fù)荷在日時(shí)間尺度上的行為特征,如峰谷效應(yīng)等。基于此,所建立的模型如式(3)所示:
式(3)中,Vα表示月用電量時(shí)序向量,Vβ表示日內(nèi)用電量時(shí)序向量,Vγ表示負(fù)荷特性向量。
基于滑動(dòng)窗口的思想,根據(jù)電力消耗情況下總功率信號的變化,設(shè)計(jì)了一種基于滑動(dòng)窗口的電力消耗檢測算法,包括兩個(gè)檢測過程。在此基礎(chǔ)上,通過連續(xù)地獲取輸入總電信號的滑動(dòng)窗,計(jì)算滑動(dòng)窗口及切換前后穩(wěn)態(tài)功率差的變化情況,檢測其用電特性。
電流行為檢測算法包括兩類:第一類是判斷總功率信號是否突然改變,以及開關(guān)過程中起始點(diǎn)、結(jié)束點(diǎn)的位置;針對總功率變化信號,需先選擇一個(gè)滑動(dòng)窗口作為標(biāo)記功率點(diǎn)Pj功率序列S=[Pj-N…Pj…Pj+N],其中N表示功率點(diǎn)窗口側(cè)向長度。當(dāng)滑動(dòng)窗中含有負(fù)荷開關(guān)位置時(shí),由于用電行為常常伴隨著功率突發(fā)變化的現(xiàn)象發(fā)生,所以窗口功率序列值的波動(dòng)幅度較大,且不具有規(guī)律性。因此,計(jì)算功率序列方差Svar作為功率突發(fā)變化的幅度變化量。
非電器投切在正常使用情況下,其功率變化幅度與當(dāng)前功率點(diǎn)有關(guān),可將αSmean作為功率點(diǎn)突變閾值,將該閾值作為限值,以此避免誤檢現(xiàn)象發(fā)生。
設(shè)Smean為滑動(dòng)窗口功率序列平均功率,依據(jù)用戶使用情況調(diào)整電器種類,保證分析結(jié)果更加精準(zhǔn)。當(dāng)窗口功率突變時(shí),有Svar≥αSmean,用電行為檢測過程示意圖如圖3 所示。
圖3 用電行為檢測過程示意圖
使用滑動(dòng)窗的冪次方差和均值,能夠判斷窗口是否發(fā)生了改變。利用連續(xù)滑動(dòng)窗口求出冪次變異性的近似起點(diǎn)pstart和終點(diǎn)pend,如圖4 所示。
圖4 用電行為探測
同時(shí)考慮兩側(cè)窗口長度N,可得到較準(zhǔn)確的始點(diǎn)=Pstart+N和終點(diǎn)=Pend+N。通過對開關(guān)過程中瞬態(tài)和穩(wěn)態(tài)部分的定位,確定了用電行為起始點(diǎn)和終點(diǎn)的位置,為后續(xù)負(fù)荷特性的提取提供了依據(jù)。在檢測到功率突變時(shí),可利用突變前后穩(wěn)態(tài)功率的變化來判斷突變是開關(guān)動(dòng)作還是穩(wěn)態(tài)工作。在為負(fù)荷切換閾值留出一定余量的情況下,考慮功率變化對居民負(fù)荷正常運(yùn)行的干擾,可規(guī)劃用電行為檢測過程,如圖5 所示。
圖5 用電行為檢測流程
由圖5 可實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)下用電行為的檢測。
原始資料可能存在某些缺失或偏離的異常值,需進(jìn)行修正。如果數(shù)據(jù)量不超過20%的空值和一個(gè)“NAN”異常值,則使用相鄰負(fù)載數(shù)據(jù)的平均值填充。若存在連續(xù)的異常數(shù)據(jù),則繼續(xù)搜索兩端,直到值不為空。由于不同的特征具有不同的維度,在用戶分類中直接使用原始數(shù)據(jù)會(huì)導(dǎo)致聚類效果差、收斂速度慢等問題,從而使原始特征數(shù)據(jù)標(biāo)準(zhǔn)化。標(biāo)準(zhǔn)化負(fù)載數(shù)據(jù),避免對數(shù)據(jù)產(chǎn)生偏差,即:
式(4)中,s2(i) 表示原始數(shù)據(jù)標(biāo)準(zhǔn)化后的數(shù)據(jù)值,α表示均值,β表示標(biāo)準(zhǔn)差。
使用標(biāo)準(zhǔn)化負(fù)荷數(shù)據(jù)統(tǒng)計(jì)負(fù)荷特性參數(shù),保證其在[0,1]范圍內(nèi),計(jì)算公式為:
預(yù)測負(fù)荷時(shí),對溫度因素進(jìn)行處理,提升分析結(jié)果的精準(zhǔn)度和收斂速度。
分析早晚高峰型、日高峰型、多峰型下的用電量,結(jié)果如圖6 所示。
由圖6 可知,在早晚高峰型下,用電量在8~30 kW·h 范圍內(nèi)波動(dòng);在日高峰型下用電量在2~25 kW·h 范圍內(nèi)波動(dòng);在多峰型下用電量在3~28 kW·h 范圍內(nèi)波動(dòng)。
圖6 早晚高峰型、日高峰型、多峰型下用電量
以上述內(nèi)容為基礎(chǔ),分別采用基于聚類的用戶分類研究方法W1、數(shù)據(jù)驅(qū)動(dòng)的用電行為分析模型W2 對3 種情況下用電量情況展開分析,結(jié)果如表1~表3 所示。
表1 早晚高峰情況下用電量分析
表2 日高峰情況下用電量分析
表3 多峰型情況下用電量分析
由表1 可知,使用基于聚類的用戶分類研究方法在3 種情況下,用電量均與實(shí)際用電量不符,尤其在日高峰型下,與實(shí)際情況相差最大,最大誤差為10 kW·h;使用數(shù)據(jù)驅(qū)動(dòng)的用電行為分析模型在3 種情況下,用電量均與實(shí)際用電量一致。
針對傳統(tǒng)用戶問題分類方法主觀性強(qiáng)、結(jié)果混亂、準(zhǔn)確性不足等缺點(diǎn),建立了數(shù)據(jù)驅(qū)動(dòng)的用戶消費(fèi)行為分析模型,實(shí)現(xiàn)了對電力用戶問題分類分析的細(xì)化,并為識(shí)別電力相關(guān)因素和差異預(yù)測奠定了基礎(chǔ)。結(jié)合數(shù)據(jù)驅(qū)動(dòng)和K-means 算法,提出了一種基于功率特征的電力消耗分類方法。實(shí)驗(yàn)證明,該模型分析結(jié)果準(zhǔn)確。
雖然使用該方法分析結(jié)果精準(zhǔn),但缺少用電環(huán)境參數(shù)分析,無法保證該方法在復(fù)雜環(huán)境下也具有良好分析效果。