徐衍會(huì),張藍(lán)宇,宋歌
(華北電力大學(xué)電氣與電子工程學(xué)院,北京市 102206)
?
基于核的模糊C均值逐層聚類算法在負(fù)荷分類中的應(yīng)用
徐衍會(huì),張藍(lán)宇,宋歌
(華北電力大學(xué)電氣與電子工程學(xué)院,北京市 102206)
針對(duì)傳統(tǒng)的模糊C均值聚類方法不適于非正態(tài)分布數(shù)據(jù)集的聚類、處理高維數(shù)據(jù)集收斂速度緩慢以及噪聲點(diǎn)敏感的問題,提出了一種基于核的模糊C均值逐層聚類方法,應(yīng)用于電力負(fù)荷特性分類。該方法的核心是2個(gè)模塊和1個(gè)算法:改進(jìn)快速排序法模塊、核函數(shù)模塊與模糊C均值算法。改進(jìn)快速排序法模塊將大數(shù)據(jù)集劃分為若干特征突出的子空間,進(jìn)而結(jié)合核函數(shù)模塊與模糊C均值算法對(duì)各子空間進(jìn)一步精確分類。以廣東省的負(fù)荷調(diào)研數(shù)據(jù)為基礎(chǔ),在Matlab平臺(tái)上對(duì)基于核的模糊C均值逐層聚類方法與模糊C均值算法的分類結(jié)果進(jìn)行對(duì)比分析,結(jié)果表明:前者在提高分類效率與分類精確度的同時(shí),具備較理想的收斂速度;另外,前者分類結(jié)果精細(xì)程度的可控性有利于電網(wǎng)工程實(shí)用規(guī)劃。
負(fù)荷分類;改進(jìn)快速排序法;核函數(shù);模糊C均值
隨著電網(wǎng)規(guī)模的逐漸擴(kuò)大,國(guó)內(nèi)一些大型省網(wǎng)作為典型的受端電網(wǎng),多直流落點(diǎn)安全穩(wěn)定性與受端地區(qū)電壓穩(wěn)定性成為影響電網(wǎng)安全穩(wěn)定的重大課題。為了準(zhǔn)確把握電網(wǎng)的運(yùn)行特性,確保電網(wǎng)可靠地持續(xù)供電,電力系統(tǒng)數(shù)字仿真精確性的提高具有重要的現(xiàn)實(shí)價(jià)值。毋庸置疑,負(fù)荷模型的精確性直接影響仿真結(jié)果的準(zhǔn)確性,而制約負(fù)荷模型建立的主要因素是由于負(fù)荷自身的隨機(jī)時(shí)變性、地域分散性、成分多樣性、非連續(xù)性等特點(diǎn)導(dǎo)致的綜合負(fù)荷特性差異[1-3],造成綜合負(fù)荷特性差異的根本原因則是負(fù)荷構(gòu)成成分的不同[4]。因此,按照負(fù)荷構(gòu)成不同對(duì)其進(jìn)行分類對(duì)建立結(jié)構(gòu)合理、參數(shù)準(zhǔn)確的綜合負(fù)荷模型,以服務(wù)于電力系統(tǒng)仿真計(jì)算具有十分重要的意義。
我國(guó)各區(qū)域電網(wǎng)的變電站數(shù)目龐大且負(fù)荷組成多樣化,負(fù)荷分類就是將同一電網(wǎng)負(fù)荷特征接近或相似的負(fù)荷點(diǎn)歸并分類,按類分組進(jìn)行建模。近年來,將模式識(shí)別領(lǐng)域的聚類分析應(yīng)用于電網(wǎng)負(fù)荷分類大大推動(dòng)了電力負(fù)荷分類精確化的發(fā)展。目前已應(yīng)用于負(fù)荷分類的聚類方法有層次聚類算法和基于準(zhǔn)則函數(shù)最優(yōu)的聚類算法[5],尤其以隸屬于后者的模糊聚類算法得到了廣泛關(guān)注。模糊聚類算法主要包含二大分支,基于模糊等價(jià)關(guān)系的傳遞閉包法(傳遞閉包法)和模糊C均值聚類算法(fuzzy c-means algorithm,F(xiàn)CM)。傳遞閉包法以模糊相似度為基礎(chǔ),得到模糊等價(jià)矩陣后設(shè)置閥值決定分類數(shù)目[6-7],分類結(jié)果粗糙但計(jì)算速度明顯優(yōu)于FCM。FCM的聚類能力優(yōu)于傳遞閉包法,目前針對(duì)FCM的改進(jìn)優(yōu)化研究主要集中在參數(shù)優(yōu)化[8-9]與初始聚類中心選擇[10-11]這2個(gè)方面。
雖然FCM更具備推廣價(jià)值,但由于FCM受樣本分布與初始參數(shù)的制約,在迭代過程中對(duì)噪聲點(diǎn)敏感且易陷入局部最小[12-13];另外,由FCM的迭代過程推出,算法對(duì)于球狀分布的數(shù)據(jù)聚類效果較好[14],而實(shí)際樣本空間并非球狀分布,嚴(yán)重制約了FCM的推廣應(yīng)用能力。
因此,本文提出基于核的模糊C均值逐層聚類(quick sort-kernel fuzzy c means, QS-KFCM)算法,引入逐層分類思想,在處理呈現(xiàn)不規(guī)則分布的大規(guī)模樣本集時(shí),首先將大樣本集進(jìn)行壓縮,快速搜索歸并突出特征相似的樣本,劃分為若干子空間,然后對(duì)各子空間進(jìn)一步精確聚類,最終得到滿足要求的分類結(jié)果。
1.1 改進(jìn)快速排序法模塊
利用改進(jìn)快速排序法模塊完成大樣本集到子空間的劃分是一次全局搜索的過程,將樣本空間中的每個(gè)樣本作為1條數(shù)據(jù)進(jìn)行管理,提取每個(gè)樣本的最大特征值,以最小的計(jì)算代價(jià)將具有相同突出特征的樣本歸入同一子空間,為子空間的精確分類做好基礎(chǔ)分類工作。
快速排序法采用分治策略,平均時(shí)間復(fù)雜度為O(nlogn)[15],考慮到本文只需提取數(shù)組最大元素,因此,對(duì)快速排序法進(jìn)行改進(jìn),查找到最大元素后即可結(jié)束遞歸調(diào)用,時(shí)間復(fù)雜度小于O(nlgn)。
假設(shè)待排序的n個(gè)元素存儲(chǔ)在數(shù)組A[0,n-1]中,選擇A[0]作為基準(zhǔn)元素,以此基準(zhǔn)元素為中心,將當(dāng)前無序區(qū)域劃分為左右2個(gè)較小的子區(qū)間A[0,pt-1]和A[pt+1,n-1],使得A[0,pt-1]中元素均小于A[0],A[pt+1,n-1]中元素均大于A[0],調(diào)整后A[0]所在位置設(shè)為pt。根據(jù)pt查找最大元素位置,判定是否輸出:
(1)若pt=n-1,則終止遞歸調(diào)用,A[pt]=maxA[0,n-1],輸出最大值A(chǔ)[pt];若pt=n-2,則終止遞歸調(diào)用,A[pt+1]=maxA[0,n-1],輸出最大值A(chǔ)[pt+1]。
(2)否則,循環(huán)調(diào)用快速排序算法對(duì)左、右子區(qū)間A[0,pt-1]和A[pt+1,n-1]排序搜索,至A[n-1]=maxA[0,n-1],輸出A[n-1]。
1.2 核方法模塊
核方法模塊將低維空間的樣本通過非線性映射到高維空間,改善了數(shù)據(jù)的空間分布使其易于線性劃分,使得聚類準(zhǔn)確度和精確度大大提高,實(shí)現(xiàn)了對(duì)FCM的二次優(yōu)化。
樣本xi={xi1,xi2,…,xiq},從原q維空間映射到Q維特征空間的非線性映射形式為
(1)
式中Φ(x)=[Φ(x1),Φ(x2),…,Φ(xQ)]。
核函數(shù)定義為從原q維空間映射到高維Q維特征空間的非線性映射Φ的點(diǎn)積形式,表示為
對(duì)于所有的x,z∈X?Rq,
(2)
常用的基本核中,高斯核作為能夠更加準(zhǔn)確地還原原有數(shù)據(jù)分布狀況的核函數(shù),受到了最為廣泛的應(yīng)用。
高斯核定義為
(3)
式中σ為高斯核函數(shù)的寬度,控制核的靈活性。
1.3 基于核的FCM算法
基于核的FCM算法是在高維特征空間中,通過構(gòu)造拉格朗日函數(shù),迭代尋找1組聚類中心矢量,使各樣本到聚類中心的加權(quán)距離平方和達(dá)到最小。
假設(shè)X={x1,x2,…,xn}?Rq是給定的數(shù)據(jù)集合,聚類中心vj(j=1,2,…,c),c表示待分類數(shù)目,基于核的FCM聚類模型描述如下:
最小化
(4)
使得U∈M
運(yùn)用拉格朗日乘數(shù)法,建立無約束準(zhǔn)則函數(shù)
(5)
進(jìn)而根據(jù)式(3)確定過渡矩陣K
(7)
注意,矩陣中的元素k(xi,vj)<10-15時(shí),使k(xi,vj)≈0,優(yōu)化矩陣。
為使目標(biāo)函數(shù)值達(dá)到最小,不斷更新各類中心及隸屬度矩陣各元素的值,隸屬度uij與聚類中心vj的更新公式
(8)
(9)
取變電站論域Xi={x1,x2,…,xn},xi表示各變電站負(fù)荷構(gòu)成特征向量;xi由xi1,xi2,…, xi5表征,分別為各變電站的工業(yè)負(fù)荷、農(nóng)業(yè)負(fù)荷、商業(yè)負(fù)荷、居民負(fù)荷、其他負(fù)荷的組成百分比。具體步驟如下:
(1)利用改進(jìn)快速排序法遍歷Xi中的xi,查找xi的最大特征值xim(xim=max(xi1,xi2,…,xi5)),進(jìn)而將所有樣本分置于5個(gè)子空間中,第j(j=1,2,…,5)個(gè)子空間的樣本共同特征為xim=max(xi1,…,xij,…,xi5)。設(shè)置進(jìn)行下一層分類的子空間容量閥值θ,大于該值時(shí)方可進(jìn)行子空間分類,避免樣本容量過小而進(jìn)行不必要分類。
(2)子空間分類。假設(shè)第y個(gè)子空間由N個(gè)樣本組成,初始化樣本構(gòu)成矩陣:
1)設(shè)定算法所需各類控制參數(shù),m=2,σ=0.1,設(shè)置迭代次數(shù)為T,迭代由k=0開始。
2)降噪處理。實(shí)際電網(wǎng)中存在大工業(yè)用戶或者其他用戶,在聚類計(jì)算中不可避免的成為噪聲點(diǎn),影響算法準(zhǔn)確性,因此,在對(duì)變電站論域X進(jìn)行分類計(jì)算前,首先進(jìn)行降噪處理,將噪聲點(diǎn)單獨(dú)劃為一區(qū)后再對(duì)其余部分進(jìn)行分類。本文規(guī)定變電站向量的某個(gè)特征值大于90%時(shí),該站劃入噪聲區(qū)。
4)按式(7)計(jì)算過渡矩陣K,如果?l、j,使K中的k(xi,vj)=1,則令ulj,且對(duì)i≠l,uij=0。
5)按式(8)與(9)更新隸屬度矩陣與聚類中心,若k=T,輸出模糊分類矩陣U=(μij)N×C和C個(gè)聚類中心向量V={v1,v2,…,vc}。
6)按照最大隸屬度原則,確定子空間分類結(jié)果。另外,在實(shí)際負(fù)荷分類中,不同區(qū)域電網(wǎng)負(fù)荷組成狀況有所差別,應(yīng)根據(jù)具體區(qū)域具體省份對(duì)精細(xì)分類后的結(jié)果進(jìn)行微調(diào)整,合并一些相近類別。
3.1 基于核的模糊C均值逐層聚類算法分類結(jié)果分析
本文中的實(shí)驗(yàn)數(shù)據(jù)取自廣東電網(wǎng)6個(gè)供電局的負(fù)荷特性調(diào)查統(tǒng)計(jì)結(jié)果。按照基于核的逐層聚類算法,得到的分類結(jié)果為:
(1)以工業(yè)為主的變電站區(qū)域,工業(yè)比重在41%~86%,共50個(gè)變電站T1={B5,…,B16,B18,…,B39,B41,…,B47,B50,…,B57,B59,B60};以商業(yè)為主的變電站區(qū)域,商業(yè)比重為38%,共1個(gè)變電站T2={B7};以居民為主的變電站區(qū)域,居民比重在31%~57%,共5個(gè)變電站T3={B17,B40,B48,B49,B58};大工業(yè)用戶變電站與其他用戶變電站區(qū)域,即工業(yè)比重與其他比重在90%以上的變電站TZ1={B1,B2,B3,B4}, TZ2={B61,B62}。
(2)T1進(jìn)一步分為T1={T11,T12,…,T16},共6類,得到聚類中心矩陣
(3)T2中僅包含1個(gè)變電站,其居民用電與工業(yè)用電比重相當(dāng),各占30%,與T3中的多數(shù)變電站性質(zhì)相似,因此將T2與T3合并為T23。
綜上,將62個(gè)變電站分為9類:T11,T12,T13,T14T15,T16,TZ1,TZ2,T23。
3.2 QS-KFCM與FCM方法分類性能對(duì)比分析
4.統(tǒng)計(jì)學(xué)處理:采用SPSS17.0統(tǒng)計(jì)軟件進(jìn)行數(shù)據(jù)分析。計(jì)量數(shù)據(jù)先行正態(tài)性檢驗(yàn),符合正態(tài)分布數(shù)據(jù)以表示,組間比較采用獨(dú)立樣本t檢驗(yàn);不符合正態(tài)分布數(shù)據(jù)以M(P25,P75)表示,組間比較采用秩和檢驗(yàn)。計(jì)數(shù)數(shù)據(jù)以例數(shù)表示,組間比較采用χ2檢驗(yàn)。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
3.2.1 分類結(jié)果對(duì)比分析
采用相同聚類數(shù)目c=9,利用FCM算法進(jìn)行計(jì)算,得到聚類中心矩陣
比較VQS-KFCM與VFCM,可得:
(1)工業(yè)比重較高區(qū)域,這2種算法得出的分類基本相同,這部分負(fù)荷特征突出,較易區(qū)分,工業(yè)比重在70%左右。
(2)VFCM中的V4與V7對(duì)應(yīng)QS-KFCM算法分類結(jié)果中的T23類,代表了以居民為主或以商業(yè)為主的變電站區(qū)。
(3)工業(yè)比重在55%左右的區(qū)域,農(nóng)業(yè)、商業(yè)占比差異較大,變電站特征分散,采用FCM算法只形成了V5這個(gè)中心點(diǎn),農(nóng)業(yè)比重為8%,商業(yè)比重為10%,但歸入該類的變電站農(nóng)業(yè)比重為0%~29%,商業(yè)比重為7%~20%,類內(nèi)特征模糊;采用QS-KFCM算法形成了VT14與VT15這2個(gè)類中心點(diǎn),分別歸納了工業(yè)比重為主、居民為輔的相同條件下,商業(yè)比重18%、農(nóng)業(yè)比重2%與農(nóng)業(yè)比重10%、商業(yè)比重10%的這2種情況,類內(nèi)特征較為一致,類間特征差異較大。
(4)比較分類結(jié)果,存在較多差異,F(xiàn)CM算法的分類合理性較差,以B14與B57為例:FCM算法將B14([48,28,1.7,21,1.3])歸入V3類,B58( [30,3,7,31,29])歸入V6類,變電站特征顯然與中心點(diǎn)不一致;QS-KFCM算法將B14歸入T15類,體現(xiàn)出了該站各特征的比重關(guān)系,B58歸入T23類,突出了該站以居民為主的特點(diǎn),分類更加合理。
以上分析說明QS-KFCM算法可以實(shí)現(xiàn)變電站負(fù)荷分類工作;對(duì)于數(shù)量較少的以居民或商業(yè)為主變電站群,利用逐層分類的手段大大降低了計(jì)算復(fù)雜度和計(jì)算時(shí)間而不影響聚類精度;QS-KFCM提取變電站共同特征的能力優(yōu)于FCM且能夠全面概括不同類型的變電站組成特征,這與該算法不是隨機(jī)選取中心點(diǎn)而是按照樣本分布情況引導(dǎo)選擇中心點(diǎn),并且在迭代技術(shù)上采用基于核技術(shù)的FCM優(yōu)化算法息息相關(guān)。QS-KFCM按照樣本分布情況選擇中心點(diǎn)并采用基于核技術(shù)的FCM進(jìn)行迭代優(yōu)化,從而其提取變電站共同特征的能力明顯優(yōu)于FCM,且能夠全面概括不同類型的變電站組成特征。
本文采用Davies-Bouldin(DB)指標(biāo)進(jìn)行聚類有效性評(píng)價(jià),同時(shí)計(jì)算出各類的類內(nèi)致密度與類間離散度,比較兩種算法的聚類精確度。
采用區(qū)的分類結(jié)果做對(duì)比實(shí)驗(yàn),結(jié)果如表1~3所示。
表1 類內(nèi)致密度對(duì)比
Table 1 Comparision of clustering density degree
較好的聚類應(yīng)使得類內(nèi)分散度小而類間離散度高,表1、2表明,QS-KFCM算法的類內(nèi)致密度比FCM算法高出近2倍,類間離散度也明顯高于FCM算法。另外,DB值作為綜合評(píng)價(jià)聚類有效性的指標(biāo),該值越小,表示聚類之間的相似性較小,類內(nèi)相似性較高,聚類效果越好,由表3可以看出來QS-KFCM算法所得聚類結(jié)果精確度較FCM算法有很大的提升。
表2 類間離散度對(duì)比
Table 2 Comparision of clustering dispersion degree
表3 DB值對(duì)比
3.2.3 對(duì)噪聲點(diǎn)的抑制能力分析
考慮實(shí)際電網(wǎng)的變電站負(fù)荷特征各異,無法避免噪聲點(diǎn)的存在,良好的聚類算法應(yīng)具有較強(qiáng)的抗干擾能力。以工業(yè)為主的T1區(qū)變電站作為實(shí)驗(yàn)對(duì)象,分類數(shù)目為6,測(cè)試QS-KFCM算法與FCM算法對(duì)噪聲點(diǎn)的魯棒性,加入的噪聲點(diǎn)分別取B1[100,0,0,0,0]與B55[31,1,38,30,0](B55以商業(yè)為主,與T1區(qū)變電站負(fù)荷特征差異較大),分別作聚類分析。
首先加入B1,采用QS-KFCM算法該點(diǎn)不會(huì)影響T1區(qū)分類,由于該點(diǎn)達(dá)到降噪處理閥值,可通過降噪處理剔除,減少了不必要的計(jì)算時(shí)間。
其次,加入無法進(jìn)行降噪處理的噪聲點(diǎn)B55,進(jìn)行聚類計(jì)算。表4為2種算法的中心點(diǎn)改變值,從加入噪聲點(diǎn)的聚類中心與未加之前聚類中心的變化情況來看,F(xiàn)CM算法中心點(diǎn)偏離程度遠(yuǎn)大于QS-KFCM算法。觀察2種算法對(duì)B55的隸屬度分配情況(表5),F(xiàn)CM算法將其硬性歸入第6類,而QS-KFCM算法將B55的隸屬度值平均分配給每一類,說明該點(diǎn)到各類距離接近,但不屬于各類,借此隸屬度分配特征可以檢測(cè)出噪聲點(diǎn),另外,也使得該點(diǎn)對(duì)目標(biāo)函數(shù)的影響得到了更好的抑制。
表4 噪聲點(diǎn)對(duì)FCM、QS-KFCM中心點(diǎn)的影響
Table 4 Influence of noise on centroid of FCM, QS-KFCM
表5 噪聲點(diǎn)在FCM、QS-KFCM算法中的隸屬度分配值
該測(cè)試說明,具有降噪處理與核技術(shù)雙重保障的QS-KFCM算法有很強(qiáng)的抵御噪聲能力,使得該算法在處理不同類型數(shù)據(jù)結(jié)構(gòu)時(shí)表現(xiàn)穩(wěn)定。
3.2.4 收斂速度對(duì)比分析
目標(biāo)函數(shù)值的變化直接反映聚類結(jié)果的收斂與否,精度越高的聚類結(jié)果應(yīng)使得目標(biāo)函數(shù)值越小,因此,采用FCM、QS-KFCM算法分別迭代計(jì)算52次,觀察目標(biāo)函數(shù)值變化。結(jié)果如圖1所示。
圖1 QS-KFCM算法與FCM算法目標(biāo)函數(shù)值
由圖1可得:(1)QS-KFCM算法所得目標(biāo)函數(shù)值收斂曲線一直處于FCM下方,目標(biāo)函數(shù)值始終較小,這表明QS-KFCM算法選取的初始中心點(diǎn)比較符合實(shí)際分類狀況,加快了收斂進(jìn)程。(2)QS-KFCM的目標(biāo)函數(shù)曲線在迭代10次后基本趨于穩(wěn)定,說明目標(biāo)函數(shù)值已收斂到最?。?FCM的目標(biāo)函數(shù)曲線在迭代15次開始平緩,到30次后才趨于穩(wěn)定。意味著QS-KFCM算法的收斂速度相對(duì)較快,因此,可將前后2次的目標(biāo)函數(shù)值之差的絕對(duì)值作為迭代終止條件,進(jìn)一步優(yōu)化QS-KFCM算法的計(jì)算速度。
本文主要針對(duì)模糊C均值算法處理大數(shù)據(jù)集收斂速度慢、聚類效果差以及噪聲點(diǎn)敏感問題展開改進(jìn)研究,提出了基于核的模糊C均值逐層聚類算法,并對(duì)廣東省的負(fù)荷組成進(jìn)行聚類分析。結(jié)果表明,該算法不僅增強(qiáng)了算法抵御噪聲的能力和聚類準(zhǔn)確度,而且有利于簡(jiǎn)化或降低負(fù)荷管理的難度和復(fù)雜性,實(shí)用性較強(qiáng)。但是,中心點(diǎn)的選擇仍是下一步研究的重點(diǎn),本方法采用的是均等劃分的方法,具有一定的引導(dǎo)性質(zhì),而沒有做到完全無監(jiān)督分配,阻礙了分類結(jié)果的準(zhǔn)確程度,尚需完善。
[1]賀仁睦, 魏孝銘, 韓民曉. 電力負(fù)荷動(dòng)特性實(shí)測(cè)建模的外插和內(nèi)推[J]. 中國(guó)電機(jī)工程學(xué)報(bào), 1996,16(3): 151-154. He Renmu,Wei Xiaoming, Han Mingxiao. Power system dynamic load modeling based on the measurements in the field[J]. Proceedings of the CSEE, 1996,16(3): 151-154.
[2]賀仁睦, 韓冬,楊琳. 負(fù)荷模型對(duì)電網(wǎng)安全性的影響研究 [J]. 電網(wǎng)技術(shù), 2007, 31(5): 1-5. He Renmu, Han Dong, Yang Lin. Study on effect of load models on power system security[J].Power System Technology,2007,31(5):1-5.
[3]鄭曉雨.大電網(wǎng)實(shí)測(cè)負(fù)荷模型的實(shí)用化研究[D].北京:華北電力大學(xué),2011. Zheng Xiaoyu. Research on the praeticality of the measurement based load model in large grid[D]. Beijing: North China Electric Power University, 2011.
[4]李培強(qiáng), 李欣然, 陳耀華, 等.基于模糊聚類的電力負(fù)荷特性的分類與研究 [J]. 中國(guó)電機(jī)工程學(xué)報(bào), 2005, 25(24): 73-78. Li Peiqiang, Li Xinran, Chen Yaohua,et al. The characteristics classification and synthesis of power load based on fuzzy clustering[J].Proceedings of the CSEE,2005,25(24):73-78.[5]范九倫,趙鳳, 雷博, 等. 模式識(shí)別導(dǎo)論[M]. 西安:西安電子科技大學(xué)出版社, 2012:79-91.
[6]黃梅,楊少兵. 負(fù)荷建模中的負(fù)荷調(diào)查統(tǒng)計(jì)分類[J]. 電網(wǎng)技術(shù), 2007, 31(4): 65-68. Huang Mei, Yang Shaobing. Application study on load investigation and clustering for load modeling[J].Power System Technology,2007,31(4):65-68.
[7]黃梅, 賀仁睦, 楊少兵. 模糊聚類在負(fù)荷實(shí)測(cè)建模中的應(yīng)用[J]. 電網(wǎng)技術(shù), 2006, 30(14): 49-52. Huang Mei, He Renmu, Yang Shaobing. Application of fuzzy clustering in measurement-based load modeling[J].Power System Technology,2006,30(14):49-52.
[8]Maji P, Pal S K. Rough set based generalized fuzzy C-Means algorithm and quantitative indices[J].IEEE Transactions on Systems, 2007,37(6): 1529-1540.
[9]楊浩, 張磊,何潛,等. 基于自適應(yīng)模糊C均值算法的電力負(fù)荷分類研究[J]. 電力系統(tǒng)保護(hù)與控制, 2010, 38(16): 111-115. Yang Hao, Zhang Lei, He Qian, et al. Study of power load classification based on adaptive fuzzy C means[J].Power System Protection and Control,2010,38(16):111-115.
[10]曾博, 張建華,丁藍(lán),等. 改進(jìn)自適應(yīng)模糊C均值算法在負(fù)荷特性分類的應(yīng)用[J]. 電力系統(tǒng)自動(dòng)化, 2011, 35(12): 42-46. Zeng Bo, Zhang Jianhu, Ding Lan, et al. An improved adaptive fuzzy c-means algorithm for load characteristics classification[J].Automation of Electric Power Systems,2011,35(12):42-46.
[11]周開樂, 楊善林. 基于改進(jìn)模糊C均值算法的電力負(fù)荷特性分類 [J]. 電力系統(tǒng)保護(hù)與控制, 2012, 40(22): 58-63. Zhou Kaile, Yang Shanlin. An improved fuzzy C-means algorithm for power load characteristics classification[J]. Power System Protection and Control, 2012, 40(22): 58-63.
[12]Liu J W, Xu M Z .Kernelized fuzzy attribute C-means clustering algorithm[J].Fuzzy Sets and Systems,2008,159:2428-2445.
[13]朱曉清.電力負(fù)荷的分類方法及其應(yīng)用[D].廣州:華南理工大學(xué),2012. Zhu xiaoqing. Load classification method and its application[D]. Guangzhou: South China University of Iechnology, 2012.
[14]李晶皎,趙麗紅,王愛俠. 模式識(shí)別[M]. 北京:電子工業(yè)出版社.,2010:87-95.
[15]黃江寧, 郭瑞鵬, 趙舫, 等. 基于故障集分類的電力系統(tǒng)可靠性評(píng)估方法[J]. 中國(guó)電機(jī)工程學(xué)報(bào), 2013, 33(16): 112-121. Huang Jiangning, Guo Ruipeng, Zhao Fang, et al. Fault set classification method for power system reliability evaluation[J]. Proceeding of the CSEE, 2013, 33(16): 112-121.
徐衍會(huì) (1978),男,博士,副教授,主要研究方向?yàn)閯?dòng)態(tài)電力系統(tǒng)分析與負(fù)荷建模;
張藍(lán)宇(1990),女,碩士研究生,主要研究方向?yàn)樨?fù)荷建模與負(fù)荷特性綜合分析;
宋歌(1989),女,碩士研究生,主要研究方向?yàn)樨?fù)荷建模。
(編輯:蔣毅恒)
Application of Clustering Hierarchy Algorithm Based on Kernel Fuzzy C-Means in Power Load Classification
XU Yanhui, ZHANG Lanyu, SONG Ge
(College of Electrical & Electronic Engineering, North China Electric Power University, Beijing 102206, China)
To solve the problems that traditional Fuzzy C-means algorithm (FCM) was unsuitable for the clustering of non-normal distribution data set and sensitive to the noise, and its convergence speed for high dimensional dataset treatment was slow, a clustering hierarchy process based on kernel Fuzzy C-means algorithm was proposed for power load classification, which was composed of two modules and a algorithm: improved quick sort module, kernel function module and FCM. Firstly, an improved quick sort module was used to divide the large dataset into several subspaces with significant characteristics, then it could complete the clustering of subspaces combined with kernel function module and FCM algorithm. Based on the investigation data of load in Guangdong, the classification result of clustering hierarchy algorithm based on kernel Fuzzy C-means was compared with that of FCM on MATLAB platform. The results show that: the proposed method can improve the efficiency and accuracy of classification, and has higher convergence rate; moreover, the accuracy controllability of its classification results is benefited to grid engineering planning.
load classification; improved quick sort; kernel function; Fuzzy C-means
Φ:x∈X?Rq→Φ(x)?RQ
K(x,z)=<Φ(x),Φ(z)>
教育部中央高?;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)資金資助項(xiàng)目(2014MS05)。
TM 714
A
1000-7229(2015)04-0046-06
10.3969/j.issn.1000-7229.2015.04.008
2014-09-01
2014-10-30
Project Supported by the Fundamental Research Funds for the Central Universities (2014MS05).