趙國生,牛貞貞,劉永光,孫超亮
(1.鄭州大學(xué) 電氣工程學(xué)院,河南 鄭州450001;2.河南許繼儀表有限公司,河南 許昌461000)
基于電力用戶的實(shí)際負(fù)荷曲線分類對電力需求側(cè)管理[1]有著重要意義.合理的電力負(fù)荷分類有助于供電部門有效地掌握用戶的負(fù)荷特性并制定合理的電價(jià)政策[2];有助于通過削峰填谷手段實(shí)現(xiàn)負(fù)荷曲線的整形[3];有助于激勵用戶積極參與到需求側(cè)管理項(xiàng)目中去.同時(shí),精細(xì)化的負(fù)荷分類對指導(dǎo)電網(wǎng)滾動規(guī)劃、實(shí)時(shí)調(diào)度及運(yùn)行規(guī)劃的可靠性評估等方面也具有重要意義.根據(jù)用電行業(yè)、電力負(fù)荷用電可靠性等級以及電價(jià)等進(jìn)行分類的傳統(tǒng)負(fù)荷分類方法已不能滿足需求側(cè)管理的需要,基于電力用戶的實(shí)際負(fù)荷曲線分類的電力負(fù)荷特性分類方法受到越來越多的關(guān)注,成為當(dāng)前負(fù)荷分類的主要方法.
目前,基于實(shí)際負(fù)荷曲線對負(fù)荷進(jìn)行分類的方法有很多,常用的有K-means 算法[4]、層次聚類算法[5]、模糊C 均值聚類算法(FCM)[6]、高斯混合模型(GMM)算法[7]、自組織特征映射神經(jīng)網(wǎng)絡(luò)(SOM)算法[8]、支持向量機(jī)(SVM)算法[9]和極限學(xué)習(xí)機(jī)(ELM)算法[10]等. 這些方法中,F(xiàn)CM 算法在運(yùn)行時(shí)間、準(zhǔn)確度、穩(wěn)定性及聚類效果等方面均表現(xiàn)較好,是目前應(yīng)用最廣泛的電力負(fù)荷特性分類算法之一. 但是,F(xiàn)CM 算法也存在著需要人為確定聚類數(shù)目c 以及模糊加權(quán)指數(shù)m 取值需要憑經(jīng)驗(yàn)給定等問題. 針對FCM 算法存在的缺點(diǎn),筆者以聚類有效性判別指標(biāo)[11]MIA 和MDC 為基礎(chǔ)來自動確定FCM 算法的聚類數(shù)目,并通過模糊決策的方法來確定最優(yōu)的m 取值,以達(dá)到最優(yōu)的聚類結(jié)果.
FCM 算法是一種以隸屬度來確定每個(gè)數(shù)據(jù)點(diǎn)屬于某個(gè)聚類程度的算法,該算法是傳統(tǒng)硬聚類(HCM)算法的一種改進(jìn).FCM 把數(shù)據(jù)集X =[x1,x2,…,xn]分為c 個(gè)模糊組,并求每組的聚類中心,它的模糊劃分可用矩陣U = [uij]表示,其中矩陣U 的元素uij表示第j(j = 1,2,…,n)個(gè)數(shù)據(jù)點(diǎn)屬于第i(i = 1,2,…,c)類的隸屬度.uij滿足以下條件:
FCM 的目標(biāo)函數(shù)是各點(diǎn)的隸屬度和該點(diǎn)與聚類中心的歐氏距離的乘積之和,F(xiàn)CM 算法就是求使聚類目標(biāo)函數(shù)最小化的劃分矩陣U 和聚類中心矩陣C.即
式中:n 是樣本數(shù)據(jù)集的個(gè)數(shù);c 是聚類中心數(shù);m為模糊加權(quán)指數(shù);dij表示樣本點(diǎn)和聚類中心之間的歐氏距離.
使得公式(2)達(dá)到最小值的兩個(gè)必要條件為
FCM 算法就是反復(fù)更新聚類中心矩陣C 和隸屬矩陣U 進(jìn)行迭代的過程,具體步驟如下.
step1:給定聚類數(shù)目c、模糊加權(quán)指數(shù)m 和迭代停止閾值ε 的值,令k = 0,初始化隸屬度矩陣U(0)和聚類中心矩陣C(0).
step2:根據(jù)公式(6)計(jì)算更新U(k).
step3:根據(jù)公式(7)計(jì)算更新C(k+1).
step4:根據(jù)公式(2)計(jì)算目標(biāo)函數(shù),如果
FCM 聚類算法的聚類數(shù)目不能自動確定,需要人為輸入.為了克服這一缺點(diǎn),筆者以類內(nèi)距離MIA 和類間距離MDC 兩個(gè)聚類效果評價(jià)指標(biāo)為基礎(chǔ),引入聚類數(shù)目c 的自適應(yīng)函數(shù)I(c)來確定FCM 算法的聚類數(shù)目.理想的負(fù)荷分類結(jié)果應(yīng)該是同類負(fù)荷曲線間距離最小,不同類負(fù)荷曲線間距離最大.類內(nèi)距離MIA 和類間距離MDC 的定義如下:
假設(shè)聚類結(jié)果得到c 個(gè)負(fù)荷分類,Ck表示第k類負(fù)荷曲線中所包含的負(fù)荷曲線集合;ntk表示該集合中的所有負(fù)荷曲線;nk表示第k 類負(fù)荷曲線中包含的單位數(shù)目;CTk表示第k 類負(fù)荷曲線的聚類中心,其中k = 1,2,…,c.
類內(nèi)距離MIA 表示各聚類中心和其對應(yīng)聚類中所有負(fù)荷曲線數(shù)據(jù)的距離平均值,定義如下:
類間距離MDC 表示不同類的聚類中心負(fù)荷曲線間距離的平均值,定義如下:
MDC(c)= mean(d(CTk,CTk)). (10)
式中:mean 為求平均值的函數(shù).
定義類間距離MDC 與類間距離MIA 的比值I為
I(c)= MDC(c)/MIA(c). (11)
由于MIA(c)表示類內(nèi)距離;MDC(c)表示類間距離;類間距離與類內(nèi)距離的比值I(c)越大表明聚類效果越好,即I(c)取得最大值時(shí)對應(yīng)的c為最佳聚類數(shù)目.
FCM 聚類算法與傳統(tǒng)的硬聚類算法的區(qū)別就在于引入了模糊加權(quán)指數(shù)m,而參數(shù)m 取值的大小是根據(jù)經(jīng)驗(yàn)確定的.不同的m 值對FCM 算法的分類結(jié)果有著很大的影響.m 的值越大,聚類結(jié)果越模糊,所得到的FCM 分類結(jié)果中每類之間的區(qū)別越不明顯. 也就是說,m 的取值影響著FCM算法的聚類效果.m 的取值區(qū)間為[1,+ ∞],在不做特殊要求的時(shí)候,m 的值取2.Pal 等人從聚類有效性方面入手,通過實(shí)驗(yàn)得出m 的最優(yōu)選擇區(qū)間為[1.5,2.5].
選取m 的最優(yōu)取值是為了FCM 聚類算法能夠得出合理有效的聚類結(jié)果,所以,筆者以FCM算法的目標(biāo)函數(shù)為基礎(chǔ),引入m 的自適應(yīng)函數(shù).根據(jù)文獻(xiàn)[12]中的劃分熵Hm(U,C)和FCM 算法的目標(biāo)函數(shù)Jm(U,C)共同約束來求得最優(yōu)的m.其中Hm(U,C)定義如下:
其中,當(dāng)uij= 0 時(shí),uij·ln uij= 0;Hm(U,C)越大,聚類越模糊.模糊加權(quán)指數(shù)m 的最佳值為m*,表示如下:
將m*確定轉(zhuǎn)化為一個(gè)帶約束的非線性規(guī)劃問題,用模糊決策的方法來確定m*的值,則Jm(U,C)和Hm(U,C)分別定義成如下形式:
其中:參數(shù)α >1,一般α = 1.5;β 為較大的正常數(shù),一般β = 10. 根據(jù)式(14)、(15),利用模糊決策的方法可以得到m*.
即以較大的隸屬度來通過同時(shí)極小化Jm(U,C)和Hm(U,C),由此得到的聚類結(jié)果不但分類清晰,而且類內(nèi)的元素相似性也比較大.
筆者所提出的自適應(yīng)FCM 算法是通過模糊決策的方法自動確定模糊加權(quán)指數(shù)m 的值,并通過類間距離與類內(nèi)距離的比值形成的自適應(yīng)函數(shù)I(c)來自動確定聚類數(shù)目.自適應(yīng)FCM 算法流程圖如圖1 所示.自適應(yīng)FCM 聚類算法的具體實(shí)現(xiàn)步驟如下.
step1:輸入初始聚類數(shù)目c = 2,I(0)= 0.
step2:給定m = 1.1.
step3:由1.2 中的FCM(m,c)進(jìn)行聚類,求出目標(biāo)函數(shù)Jm(U*,C*)和劃分熵Hm(U*,C*).
step4:判斷模糊加權(quán)指數(shù)m 的大小,如果m <2.5,則m = m +0.1 返回step3.
step5:根據(jù)公式(12),利用模糊決策的方法得到最優(yōu)的模糊加權(quán)指數(shù)的m*
c .
step6:由1.2 中的FCM(m*c ,c)進(jìn)行聚類,求出I(c).
step7:當(dāng)2 <c <n 時(shí),如果I(c-1)>I(c-2)且I(c-1)>I(c),則聚類過程結(jié)束;否則c = c+1,返回step2.
圖1 自適應(yīng)FCM 算法流程圖Fig.1 The flow chart of adaptive FCM algorithm
算例所采用的數(shù)據(jù)為北方某省電力公司的用電信息采集系統(tǒng)所采集到的包括商業(yè)樓宇、公共機(jī)構(gòu)、高耗電行業(yè)等不同行業(yè)的98 個(gè)電力用戶的96點(diǎn)典型日負(fù)荷曲線.為了降低其他因素的影響,筆者采用連續(xù)多個(gè)工作日的96 點(diǎn)日負(fù)荷曲線數(shù)據(jù)取平均值的方法來獲取典型的日負(fù)荷曲線數(shù)據(jù).
現(xiàn)取連續(xù)一個(gè)月的96 點(diǎn)日負(fù)荷曲線數(shù)據(jù)來獲取該類負(fù)荷的典型日負(fù)荷曲線,則該負(fù)荷的典型日負(fù)荷曲線為一個(gè)月日負(fù)荷曲線數(shù)據(jù)的平均值.第i 條負(fù)荷曲線的典型負(fù)荷曲線表示為xi=[xi1,xi2,…,xi96],由于不同類型的負(fù)荷數(shù)據(jù)變化很大,不便于進(jìn)行數(shù)據(jù)比較,為去除負(fù)荷數(shù)量級對聚類分析的影響,在進(jìn)行聚類分析之前已經(jīng)對電力用戶的典型日負(fù)荷曲線數(shù)據(jù)進(jìn)行歸一化處理,這里采用極值序列歸一化,即
歸一化之后所有的數(shù)值都在[0,1],式中max[xi1,xi2,…,xi96]為第i 條典型日負(fù)荷曲線數(shù)據(jù)xi中數(shù)據(jù)點(diǎn)的最大值.
根據(jù)算例所使用的典型日負(fù)荷曲線數(shù)據(jù),對其進(jìn)行極值序列歸一化處理后,得到歸一化的98條典型日負(fù)荷曲線數(shù)據(jù). 按照第2 節(jié)中的自適應(yīng)FCM 聚類算法對98 條負(fù)荷曲線進(jìn)行分類. 當(dāng)聚類數(shù)目c=8 且最優(yōu)模糊加權(quán)指數(shù)m*c =1.9 時(shí)算法停止,最終的聚類結(jié)果如圖2 所示.
圖2 自適應(yīng)FCM 算法分類結(jié)果Fig.2 The classification result of adaptive FCM algorithm
由圖2 的最終分類結(jié)果可以看出,該分類結(jié)果中每個(gè)分類能明顯地代表一類典型負(fù)荷的負(fù)荷特征,分類結(jié)果比較理想. 與傳統(tǒng)的FCM 算法相比,筆者所用自適應(yīng)FCM 算法的聚類數(shù)目c 的確定,是根據(jù)聚類有效性指標(biāo)的類間距離與類內(nèi)聚類的比值來確定的;而模糊加權(quán)指數(shù)m 值是以FCM 算法的目標(biāo)函數(shù)為基礎(chǔ),利用模糊決策的方法確定的.該算法克服了傳統(tǒng)FCM 算法的不足,并且優(yōu)于那些單純確定聚類數(shù)目c 的自適應(yīng)FCM算法.
文獻(xiàn)[8]是將SOM 算法與FCM 算法相結(jié)合,利用SOM 算法得到聚類數(shù)目和初始聚類中心,并作為FCM 算法的初始輸入,以克服FCM 算法存在的缺點(diǎn),即相當(dāng)于進(jìn)行了兩次聚類,實(shí)現(xiàn)起來比較復(fù)雜,且聚類結(jié)果的優(yōu)劣仍需要進(jìn)行衡量.與文獻(xiàn)[8]相比,筆者所采用的自適應(yīng)FCM 算法,是基于聚類結(jié)果的評價(jià)指標(biāo)確定自適應(yīng)函數(shù)以確定聚類數(shù)目c,且以FCM 算法的目標(biāo)函數(shù)為基礎(chǔ)來確定模糊加權(quán)指數(shù)m,均是以聚類結(jié)果最優(yōu)為基礎(chǔ)對FCM 算法本身進(jìn)行的改進(jìn),此方法不僅克服了FCM 算法存在的缺點(diǎn),且得到的聚類結(jié)果是最優(yōu)的,實(shí)現(xiàn)起來也比較簡單.
針對FCM 聚類算法存在需要人為確定聚類數(shù)目的缺點(diǎn),筆者通過計(jì)算聚類算法中的有效性判別指標(biāo)MDC(c)和MIA(c)的比值I(c),選取I(c)取得最大值時(shí)所對應(yīng)的聚類數(shù)目c 為最優(yōu)的聚類數(shù)目,并且通過模糊決策的方法來優(yōu)選模糊加權(quán)指數(shù)m,以FCM 算法的目標(biāo)函數(shù)Jm(U*,C*)為模糊決策方法的目標(biāo)函數(shù)和劃分熵Hm(U*,C*)為模糊決策方法的約束條件,以較大的隸屬度來通過同時(shí)極小化Jm(U,C)和Hm(U,C)以求得最優(yōu)的m. 通過算例分析可知,該算法不僅克服了FCM 算法存在的缺點(diǎn),而且所得到的聚類結(jié)果能夠分別代表一類典型負(fù)荷的負(fù)荷特性.
[1] 王冬利.電力需求側(cè)管理實(shí)用技術(shù)[M].北京:中國電力出版社,2005:7 -14.
[2] 黃永皓,康重慶,夏清,等.用戶分類電價(jià)決策方法的研究[J].中國電力,2004,37(1):24 -28.
[3] 徐明.基于負(fù)荷特性分析的錯峰方案研究[D]. 廣州:華南理工大學(xué)電力學(xué)院,2012:17 -19.
[4] 樓佳,王小華. 一種分列式的k - means 聚類算法[J].杭州電子科技大學(xué)學(xué)報(bào),2009,29(4):54 -57.
[5] 郭曉娟,劉曉霞,李曉玲.層次聚類算法的改進(jìn)及分析[J].計(jì)算機(jī)應(yīng)用與軟件,2008,25(6):243 -246.
[6] 周開樂,楊善林.基于改進(jìn)模糊C 均值算法的電力負(fù)荷特性分類[J]. 電力系統(tǒng)保護(hù)與控制,2012,40(22):58 -62.
[7] 岳佳,王士同. 高斯混合模型聚類中EM 算法及初始化的研究[J]. 微計(jì)算機(jī)信息,2006,11(22):244-247.
[8] 王文生,王進(jìn),王科文.SOM 神經(jīng)網(wǎng)絡(luò)和C -均值法在負(fù)荷分類中的應(yīng)用[J]. 電力系統(tǒng)及其自動化學(xué)報(bào),2011,23(4):36 -39.
[9] 馮曉蒲.基于實(shí)際負(fù)荷曲線的電力用戶分類技術(shù)研究[D].保定:華北電力大學(xué)電氣與電子工程學(xué)院,2011:22 -27.
[10]NAGI J,YAP K S,TIONG S K,et al.Nontechnical loss detection for metered customers in power utility using support vector machines[J]. IEEE Transactions on Power Delivery,2010,25(2):1162 -1171.
[11]CHICCO G,NAPOLI R,PETAL P.Customer characterization options for improving the tariff offer[J].IEEE Trans on Power Systems,2003,18(1):381 -387.
[12]BEZDEK J C. Pattern recognition with fuzzy objective function algorithms[M]. NewYork:Plenum Press,1981:100 -136.