吳麗珍, 張永年, 陳 偉, 郝曉弘
(1. 蘭州理工大學 電氣工程與信息工程學院, 甘肅 蘭州 730050; 2. 蘭州理工大學 甘肅省工業(yè)過程先進控制重點實驗室, 甘肅 蘭州 730050; 3. 蘭州理工大學 國家級電氣與控制工程實驗教學中心, 甘肅 蘭州 730050)
隨著我國能源互聯(lián)網(wǎng)戰(zhàn)略的不斷推進,電網(wǎng)建設(shè)也趨向于智能化,用戶用電量和用電行為方式也呈現(xiàn)出多元化的特征[1].在我國電力體制改革的背景下,電力行業(yè)逐步進入以市場為導向的新層面,同時因為體驗型經(jīng)濟逐漸興起,傳統(tǒng)的對電力用戶無差化服務(wù)已無法滿足用戶多樣化需求,因此,準確地對電力用戶用電行為分析,實現(xiàn)對電力用戶用電的精準分類并提供差異性服務(wù)成為了供配電領(lǐng)域的發(fā)展關(guān)鍵[2-3].研究電力用戶的基本信息數(shù)據(jù)對用戶用電行為的影響對于用戶用電策略的制定有著重要意義.
近年來,國內(nèi)外學者通過用電大數(shù)據(jù)挖掘,在用戶用電行為分析方面做了相關(guān)研究.張斌等[4]針對單一聚類方法的不足,通過對不同聚類方法優(yōu)缺點的分析,提出一種層次聚類與劃分聚類相結(jié)合的聚類方法用于負荷聚類.朱文俊等[5]在利用自適應(yīng)K-means算法對電力用戶進行局部聚類分析基礎(chǔ)上,提取局部負荷曲線并構(gòu)建局部模型,并利用傳統(tǒng)聚類算法對局部模型進行分析,獲取全局負荷曲線模型,進行用戶用電態(tài)勢感知.但是,上述方法由于算法需要處理的數(shù)據(jù)類型較多,且存在大量的無用數(shù)據(jù),因此數(shù)據(jù)處理所需時間較長.陸俊等[6]提出一種基于用電特征優(yōu)選策略的自適應(yīng)用戶用電行為分析方法,以減少計算復雜度和提高聚類準確率,但其僅對用戶用電特征數(shù)據(jù)進行處理分析,而對于用戶基本信息數(shù)據(jù)并未加以利用,降低了電力用戶分類的準確性.目前大多數(shù)研究是利用用戶數(shù)據(jù)對用戶進行分類,對于在利用有限的數(shù)據(jù)信息情況下,分析電力用戶的基本信息數(shù)據(jù)與用戶用電行為之間的關(guān)聯(lián)性方面的研究較少,而該方面研究對于電力公司用電策略的制定有著重要意義.隨機矩陣理論(random matrix theory,RMT)作為一種統(tǒng)計學工具,在分析數(shù)據(jù)之間關(guān)聯(lián)性方面有著較為突出的效果.
因此,本文提出一種基于K-means聚類和隨機矩陣理論的電力用戶用電行為刻畫方法.首先,通過熵權(quán)法構(gòu)建用電特征評價體系,選取用戶優(yōu)選用電特征數(shù)據(jù),利用K-means聚類算法對電力用戶進行分類.然后,利用隨機矩陣理論對各用電群體構(gòu)建用電行為分析模型,分析基本信息數(shù)據(jù)對各類用戶用電行為的影響程度,刻畫不同用電模式用戶的用電行為,為供電公司制定營銷策略提供理論支撐.
對于一個電力用戶個體,所采集的數(shù)據(jù)主要包括兩類,一類是電力用戶的基本屬性數(shù)據(jù),包括經(jīng)濟情況、氣候數(shù)據(jù)、用戶理想電價、節(jié)假日等數(shù)據(jù),通過對該屬性分析可以預估電力用戶對于電力的消費能力[7].第二類是電力用戶的用電特征數(shù)據(jù),主要包括歷史電價、歷史負荷曲線、日負荷率、峰時耗電量等,從其中可以了解用戶的用電模式及用電習慣[8].由于供電結(jié)構(gòu)的改革,如何給用戶提供精準化用電服務(wù)成為了很重要的一個研究部分.但是在實際情況中,供電公司為每一個用戶提供一個用電策略顯然是不可能的,因此,需要對具有同種用電行為模式的用戶進行群體劃分,利用群體策略來替代個體策略,可以提高供電公司的服務(wù)效率.
由于用戶對不同用電特征的行為響應(yīng)不同,通過選取對該類用戶最有效的用電特征評價體系來刻畫用戶用電行為,能夠去除多余信息,減少數(shù)據(jù)量,提高分析速度.此外,用電特征與用戶用電行為之間關(guān)系緊密,各用電特征間存在較大的關(guān)聯(lián)性,分析中存在信息冗余以及重疊現(xiàn)象,會使得分析效果變差.因此,可以考慮利用熵權(quán)法求取權(quán)重值有效評價用戶用電特征.
設(shè)有m個用戶群體,n個用電特征,得到評價體系的初始數(shù)據(jù)矩陣:X={xij}m×n.其中,xij表示在第j個用電特征在第i個用戶下的特征數(shù)值.由于不同用電特征的量綱不同,為了使得不同量綱之間具有可比性,需要對原始數(shù)據(jù)標準化,其變換公式如下式所示[9]:
(1)
特征信息比重pij和信息熵值hj計算公式[10]為
利用信息熵值hj求解權(quán)重值wj,計算公式為
(4)
式中:0 根據(jù)評價方法對該類用戶的各用電特征進行評價,選取最優(yōu)用電特征,并建立優(yōu)選特征集.從每次搜索中選取權(quán)重值最大的用電特征放入已選特征集中,并利用已選特征集進行特征分析,直到其性能達到目標值為止.優(yōu)選特征集評價值與目標值為 式中:Y(j)為已選特征優(yōu)選集評價值;wj為第j個用電特征的權(quán)重值;C為目標閾值,一般取值為0.1~0.5;E為目標值.當E值小于C時,優(yōu)選特征集選擇結(jié)束. 用電行為特征優(yōu)選方法流程圖如圖1所示. 圖1 用電行為特征優(yōu)選方法流程Fig.1 Flow chart of user behavior feature optimization 聚類分析是在不了解一批樣本中其類別或者其他特征歸屬的情況下,利用某種相似性度量方法,將特征極為相似的樣品歸為一類的方法.目前常用的聚類方法有K-means算法、K-medoi算法、Clarans算法、Pam算法等.由于K-means算法簡單,易于實現(xiàn),算法放入可伸縮性較好,且適用各種數(shù)據(jù)類型,已經(jīng)在數(shù)理統(tǒng)計、模式識別和數(shù)據(jù)挖掘等領(lǐng)域適用[11-12].由于是利用優(yōu)選用電特征數(shù)據(jù)對電力用戶用電行為進行刻畫,很大程度上減少了數(shù)據(jù)量.算法進行聚類分析時,每次的迭代過程所用時間更少,在總體時間復雜度上面會遠小于傳統(tǒng)聚類算法.因此選用K-means算法進行聚類分析.算法步驟為: 步驟1:根據(jù)優(yōu)選特征集,提取樣本用戶群體優(yōu)選用電特征數(shù)據(jù)集X={x11,…,x1i;x21,…,x2i;xn1,…,xni},其中n為用戶個數(shù),i為優(yōu)選特征個數(shù),xni表示第n個用戶的第i個用電特征值. 步驟2:數(shù)據(jù)處理.由于數(shù)據(jù)中存在不同特征量,因此數(shù)據(jù)具有不同的性質(zhì)屬性和度量單位,為使得數(shù)據(jù)具有同樣的標準,需要對數(shù)據(jù)進行中心化變換,如下式所示: (7) 式中:xmi是第m個數(shù)據(jù)所包含的第i個特征;m=1,2,…,n. 步驟3:令迭代次數(shù)I=1,選擇初始聚集點為C1,C2,…,Ck,記為Cj(I),j=1,2,…,k. 步驟4:計算每一個數(shù)據(jù)點與所選k個聚集點之間的歐式距離d(x′mi,Cj(I)),m=1,2,…,n;j=1,2,…,k.如果滿足下式,則x′mi∈Cj: (8) 步驟5:計算k個新的聚類中心: (9) 式中:N為Cj中聚類點個數(shù). 步驟6:判斷若Cj(I+1)≠Cj(I),j=1,2,…,k,則I=I+1,返回步驟3;否則算法結(jié)束. 步驟7:輸出聚類結(jié)果,算法結(jié)束. 聚類的效果用目標函數(shù)U來表示: (10) U值越小,聚類效果越好.因此,算法通過對U值的不斷優(yōu)化來得到更好的聚類結(jié)果,當U值為極小值時,聚類結(jié)果最優(yōu). 利用K-means聚類法對電力用戶群體劃分后,為了對用戶用電行為進行刻畫,需要分析用戶基本信息數(shù)據(jù)和用戶用電行為之間的關(guān)聯(lián)性.RMT能夠?qū)Π嗑S數(shù)據(jù)信息的矩陣進行隨機性分析,挖掘數(shù)據(jù)間的信息與關(guān)聯(lián)性,得到用戶用電行為與基本用戶信息之間的相關(guān)性和聯(lián)系,從而實現(xiàn)對用戶用電行為的刻畫[13]. 協(xié)方差矩陣是數(shù)理統(tǒng)計以及其他領(lǐng)域分析系統(tǒng)狀態(tài)較為常用的一個統(tǒng)計量.M-P律是隨機矩陣理論中可用于描述大維協(xié)方差矩陣的特征值分布情況,并通過其平均譜分布情況來反映數(shù)據(jù)間的相關(guān)性,且具有較強的實用性. (11) 平均譜半徑(mean spectral radius,MSR)是隨機矩陣理論中常用的一種線性特征值統(tǒng)計量,利用特征值在復平面上與原點的距離來反映隨機矩陣特征值的分布情況,其定義如下式所示[16]: (12) 式中:LMSR為隨機矩陣的平均譜半徑;λi(i=1,2,…,p)為矩陣的第i個特征根. 為分析用戶基本信息對電力用戶用電模式的影響,將用戶基本信息數(shù)據(jù)和用戶用電特征數(shù)據(jù)建立增廣矩陣,利用增廣部分對于原用電特征數(shù)據(jù)的影響程度來表征兩者之間的相關(guān)性. (13) (14) (15) (16) 將所得特征數(shù)據(jù)進行標準化處理后,按如下步驟建立增廣矩陣模型.假定所得到的用戶數(shù)據(jù)中,存在m個用戶,每個節(jié)點選取用電特征mc個,用戶基本信息類型有mf個.用戶用電特征數(shù)據(jù)構(gòu)成基本狀態(tài)矩陣為Bc∈C(m×mc),用戶基本信息數(shù)據(jù)構(gòu)成影響因素矩陣為Bf∈C(m×mf).將基本狀態(tài)數(shù)據(jù)矩陣與影響因素矩陣構(gòu)建為狀態(tài)增廣矩陣A: (17) (18) 采用隨機矩陣理論中的平均譜半徑作為矩陣數(shù)據(jù)間相關(guān)性分析的指標.為排除狀態(tài)數(shù)據(jù)與影響因素數(shù)據(jù)中重復數(shù)據(jù)所帶來的干擾,定義增廣矩陣譜半徑之差作為指標,其公式[18]為 (19) 利用隨機矩陣理論通過數(shù)據(jù)間的相關(guān)性來刻畫用戶用電行為,為電力公司對用戶用電相關(guān)服務(wù)工作提供理論支持.用戶用電行為刻畫方法流程圖如圖2所示. 圖2 用戶用電行為刻畫方法流程Fig.2 Flow chart of user behavior description method 本文用于算例分析的數(shù)據(jù)為甘肅省武威市電網(wǎng)某區(qū)域的實際量測數(shù)據(jù).使用MATLAB軟件搭建仿真平臺,分析所有用戶數(shù)據(jù),對用戶用電行為刻畫方法進行驗證. 利用用電行為特征優(yōu)選方法,計算各用電特征的評價值,求取最優(yōu)特征集.令目標閾值C=0.2,仿真計算結(jié)果見表1. 表1 用電特征評價Tab.1 Evaluation of power consumption feature 利用表1中用電特征評價值求取目標值E,所得結(jié)果為E=[1, 0.498 6, 0.332 2, 0.247 8,0.196 9,0.163 2,0.139 8],當E≤C時,共迭代了4次,此時最優(yōu)特征集中包含有評價值較高的5個優(yōu)選特征,即為峰谷差率、峰谷差量、日平均負荷、峰時耗電比以及日最大負荷.因此,選取這5個用電特征作為L1的優(yōu)選特征,并將對應(yīng)的用電特征數(shù)據(jù)作為對群體L1進行聚類分析所需的數(shù)據(jù). 采用K-means聚類算法,分別對使用優(yōu)選特征集和未使用優(yōu)選特征集兩種情況進行聚類分析.計算結(jié)果為:當使用優(yōu)選特征集時,聚類迭代次數(shù)為9次,準確率為95.6%,聚類所需時間為0.309 s.未使用優(yōu)選特征集時,聚類迭代次數(shù)為26次,準確率為97.2%,聚類所需時間為0.605 s.結(jié)果表明,選擇優(yōu)選特征集進行聚類分析相比于未選用優(yōu)選特征集聚類分析的準確率略微下降,但具有更少的迭代次數(shù)和更短的仿真時間. 各類用戶的典型用電行為規(guī)律曲線與用戶負荷曲線如圖3所示,圖中各類用戶的典型用電負荷規(guī)律曲線用黑色表示. 圖3 聚類結(jié)果及各類用戶用電負荷曲線Fig.3 Clustering results and load curves of various users 從圖3可以看出,第一類用戶整體負荷水平較高,在早晨及夜晚用電量較高,凌晨用電量較少,應(yīng)為一些小型原料指向性工業(yè),由于原料不能久貯,因此一天內(nèi)大多數(shù)時間處于生產(chǎn)時間,比如小型水果加工廠.第二類用戶整體負荷水平較低,用電主要集中在白天,午時以及夜晚用電相對較少,在6點左右有一次負荷峰值,可能為設(shè)備啟動造成,而且負荷變化較快,應(yīng)該存在一些非線性設(shè)備,如一些熔焊、烘焙商鋪.第三類用戶白天用電量較低,下午18點至凌晨1點用電量較高,由于該類負荷高峰期主要集中在夜間,負荷水平比較低,應(yīng)為一些餐飲、娛樂類用戶,如夜市、KTV.分析結(jié)果與甘肅武威地區(qū)實際調(diào)查結(jié)果相符合.由此可見,基于優(yōu)選特征集的K-means聚類方法具有較高的準確性,可用于刻畫電力用戶的用電行為. 選取各群體用戶的峰谷差率、峰谷差量、日平均負荷、峰時耗電比和日最大負荷數(shù)據(jù)作為基本狀態(tài)數(shù)據(jù),取各群體用戶的經(jīng)濟情況、溫度數(shù)據(jù)、用戶理想電價和節(jié)假日數(shù)據(jù)作為影響因素數(shù)據(jù),建立狀態(tài)增廣矩陣,利用隨機矩陣理論進行分析,其分析結(jié)果如圖4所示. 由圖4可以看出,不同的用戶對于不同的影響因素都具有不同的反映特征.第一類用戶主要受經(jīng)濟情況影響比較多,理想電價和節(jié)假日等方面影響較小,可以看出該類用戶主要受限于生產(chǎn)規(guī)模的大小.對于第二類用戶,溫度和經(jīng)濟情況的影響要遠遠高于其他幾個影響因素.第三類用戶對于節(jié)假日的敏感程度要高于其他兩類用戶,因此該類用戶在節(jié)假日期間會有更多的用戶.總體來說,經(jīng)濟情況和溫度對三類用戶的影響程度都較高,而理想電價相對影響程度比較低. 圖4 用戶行為刻畫分析結(jié)果Fig.4 Analysis results of user behavior description 綜上所述,電力公司在針對第一類電力用戶時,要根據(jù)其經(jīng)濟情況來制定相應(yīng)的售電方案,其挖掘潛力受限于電力用戶的經(jīng)濟情況限制.對于第二類用戶,電力公司應(yīng)主要以經(jīng)濟情況和溫度作為主要方面制定售電方案,可以為電力用戶在不同季節(jié)提供不一樣的用電策略.針對第三類用戶,由于節(jié)假日對該用戶用電行為的影響程度較高,說明該類用戶用電量的大小與人流量大小有很大相關(guān)性,電力公司可以根據(jù)這方面對該類用戶不同節(jié)假日、日夜峰谷期間制定相應(yīng)的用電策略. 本文針對電力行業(yè)市場化改革背景下用戶用電行為刻畫的必要性,提出一種基于用戶基本信息數(shù)據(jù)和用電特征數(shù)據(jù)相結(jié)合的用電行為刻畫方法.所提方法利用隨機矩陣理論在大維數(shù)據(jù)分析和數(shù)據(jù)關(guān)聯(lián)性分析方面的優(yōu)勢,無需將原始數(shù)據(jù)矩陣分解為多個向量進行重復計算,具有較高的分析效率,分析效果較為直觀.最后,通過實際應(yīng)用數(shù)據(jù)算例驗證結(jié)果表明,該方法能夠較好地分析用戶基本信息數(shù)據(jù)和用戶用電行為之間的關(guān)聯(lián)性,有助于售電公司對不同電力用戶采取不同的售電方案和電力需求側(cè)響應(yīng)策略,提升對電力用戶的服務(wù)質(zhì)量,促進電力系統(tǒng)的高效運行.1.2 K-means聚類法
2 用戶用電行為刻畫方法
2.1 隨機矩陣理論
2.2 構(gòu)建用戶用電行為刻畫模型
3 算例驗證及分析
3.1 特征優(yōu)選集的選取
3.2 用電行為聚類方法驗證
3.3 用戶行為刻畫方法
4 結(jié)論