常鮮戎,孫景文
(華北電力大學(xué) 電氣與電子工程學(xué)院,河北 保定071003)
在電力系統(tǒng)負(fù)荷預(yù)測(cè)實(shí)際工作中,由于SCADA 系統(tǒng)中的量測(cè)、記錄、轉(zhuǎn)換、傳輸?shù)热我猸h(huán)節(jié)故障都有可能導(dǎo)致觀測(cè)數(shù)據(jù)出現(xiàn)反常態(tài)勢(shì),以致與大多數(shù)觀測(cè)值不一致;另一方面,由于突發(fā)事件或者某些原因(線路檢修停電,切負(fù)荷停電,大事件沖擊等)而引起負(fù)荷的異常變化,雖然數(shù)據(jù)是真實(shí)的,但是從預(yù)測(cè)意義上看還是壞數(shù)據(jù)。壞數(shù)據(jù)的存在會(huì)對(duì)負(fù)荷特性分析及負(fù)荷預(yù)報(bào)產(chǎn)生不良影響,使得預(yù)測(cè)結(jié)果的準(zhǔn)確度無法保證。因此,在進(jìn)行負(fù)荷預(yù)測(cè)之前,很有必要對(duì)原始負(fù)荷數(shù)據(jù)進(jìn)行預(yù)處理[1]。
有關(guān)壞數(shù)據(jù)的處理問題,常用的是橫向縱向比較法,即利用同類型、相鄰日等各種曲線的相似性,對(duì)某些表現(xiàn)出特殊異常的點(diǎn)進(jìn)行修正。但是這種方法主觀性很強(qiáng),并且對(duì)于連續(xù)出現(xiàn)壞數(shù)據(jù)的情況無能為力。文獻(xiàn)[2]中分別計(jì)算歷史數(shù)據(jù)中各日同時(shí)刻的負(fù)荷變化率,確定一個(gè)范圍,再以此對(duì)比檢測(cè)日的同時(shí)刻的負(fù)荷變化率,以此確定該點(diǎn)是否異常。該方法已經(jīng)有了較大的改進(jìn),但是仍存在不足,即該方法對(duì)于單點(diǎn)數(shù)據(jù)是壞數(shù)據(jù)很有效,但是仍然無法處理壞數(shù)據(jù)連續(xù)出現(xiàn)的情況;用于計(jì)算負(fù)荷變化率的歷史數(shù)據(jù)必須保證是正常數(shù)據(jù),但是實(shí)際中并不能實(shí)現(xiàn)。文獻(xiàn)[3]中在灰色估計(jì)中引入了參數(shù)估計(jì)法,以此為模型對(duì)壞數(shù)據(jù)進(jìn)行處理,但是參數(shù)估計(jì)是非線性優(yōu)化問題,由于其所具有的復(fù)雜性,導(dǎo)致該算法計(jì)算很緩慢,且很容易陷入局部極值。文獻(xiàn)[4]中提出了基于人工神經(jīng)網(wǎng)絡(luò)的壞數(shù)據(jù)處理方法,方法新穎,并且能處理成片出現(xiàn)的壞數(shù)據(jù),實(shí)現(xiàn)壞數(shù)據(jù)的有效定位。但是該方法仍然存在一定的缺陷:一是該方法采用Kohonen 神經(jīng)網(wǎng)絡(luò)進(jìn)行聚類,因此只能實(shí)現(xiàn)球形數(shù)據(jù)的硬聚類,聚類結(jié)果勢(shì)必比較差[5];二是該方法采用BP 神經(jīng)網(wǎng)絡(luò)進(jìn)行壞數(shù)據(jù)的辨識(shí),由于BP 網(wǎng)絡(luò)固有的特性,無法避免陷入局部極值,且設(shè)計(jì)會(huì)很復(fù)雜[6];三是該方法對(duì)壞數(shù)據(jù)進(jìn)行調(diào)整時(shí),直接使用特征曲線相應(yīng)時(shí)刻數(shù)值來代替,這也不甚合理。文獻(xiàn)[7,8]盡管采用模糊聚類的思想對(duì)文獻(xiàn)[4]硬聚類方法進(jìn)行改進(jìn),但是它們都沒有解決最佳聚類數(shù)和初始聚類中心的選擇問題,而是采用普遍的處理方法,即對(duì)于聚類數(shù)采用試湊法,對(duì)于初始聚類中心采用隨機(jī)初始化的方法。
本文根據(jù)數(shù)據(jù)挖掘理論提出了一種新的方法:首先利用改進(jìn)的模糊C 均值方法對(duì)原始負(fù)荷進(jìn)行聚類,得到特征曲線;其次計(jì)算每類中每日各時(shí)刻的方差,根據(jù)3σ 法則尋找壞數(shù)據(jù)位置,得到壞數(shù)據(jù)辨識(shí)模型;最后利用隸屬度最大和次大的兩條特征曲線對(duì)壞數(shù)據(jù)進(jìn)行合理精細(xì)的修正。通過對(duì)四川某電網(wǎng)的實(shí)際負(fù)荷進(jìn)行分析,可以發(fā)現(xiàn),本文所提出的方法有很高的實(shí)用性和精確性。
電力負(fù)荷曲線具有兩個(gè)重要特征:相似性和平滑性。相似性是指不同日曲線的幾個(gè)峰谷時(shí)刻基本相同,大致形狀也是極為相似的。平滑性是指一條曲線的相鄰點(diǎn)一般不會(huì)有大的變化(極特殊情況除外),壞數(shù)據(jù)的存在將明顯破壞曲線的平滑性。這樣,可以用數(shù)據(jù)挖掘理論中的聚類算法從大量可能含有壞數(shù)據(jù)的負(fù)荷曲線中提取出特征曲線,利用分類算法將含有壞數(shù)據(jù)的曲線模式同特征曲線模式分開,實(shí)現(xiàn)壞數(shù)據(jù)的識(shí)別。
模型結(jié)構(gòu)如圖1 所示。第1 層為改進(jìn)后的模糊C 均值聚類模型(Improved Fuzzy C-Means,IFCM),將待處理的歷史日負(fù)荷曲線輸入,則與該曲線相似度最大的特征曲線被選出,激活相應(yīng)的第2層的壞數(shù)據(jù)辨識(shí)模型。第2 層為與各特征曲線對(duì)應(yīng)的壞數(shù)據(jù)辨識(shí)模型,實(shí)現(xiàn)精確定位。如果辨識(shí)出壞數(shù)據(jù),則標(biāo)記1,否則標(biāo)記0。第3 層實(shí)現(xiàn)對(duì)壞數(shù)據(jù)的修正。
圖1 壞數(shù)據(jù)處理模型Fig.1 Model of bad data processing
負(fù)荷曲線的聚類是為了提取出負(fù)荷的特征曲線。聚類一般分為硬聚類和模糊聚類兩種。傳統(tǒng)的硬聚類是把每個(gè)數(shù)據(jù)對(duì)象嚴(yán)格地劃分到某個(gè)類中,算法中的隸屬度不是1 就是0,如傳統(tǒng)的Kmeans 算法和K-medoids 算法。現(xiàn)實(shí)中大多數(shù)的對(duì)象并沒有嚴(yán)格的類別屬性,因此提出了模糊聚類的思想。模糊聚類的樣本對(duì)某個(gè)類別的隸屬度在區(qū)間[0,1]內(nèi)取值,樣本對(duì)所有類別的隸屬度之和為1。模糊聚類算法與硬聚類算法相比更符合客觀實(shí)際,提高了算法的精度,但是模糊聚類的速度要緩慢一些。
1.1.1 模糊C 均值聚類( FCM)
FCM(Fuzzy C-Means,F(xiàn)CM)是第一層聚類算法的基礎(chǔ)。FCM 算法是對(duì)目標(biāo)函數(shù)進(jìn)行優(yōu)化的一種逐步迭代的數(shù)據(jù)聚類方法,每次迭代都沿著目標(biāo)函數(shù)減小的方向進(jìn)行。FCM 聚類算法是一種能自動(dòng)對(duì)樣本點(diǎn)進(jìn)行分類的方法,通過優(yōu)化準(zhǔn)則函數(shù)來確定每個(gè)樣本點(diǎn)對(duì)類中心的隸屬度,從而決定樣本所屬的類[9,10]。FCM 算法實(shí)現(xiàn)原理如下:
設(shè)樣本集合X ={x1,x2,… ,xi,… ,xn}中元素xi有s 個(gè)特征,即xi={xi1,xi2,… ,xis},要把X分為c 類(2≤c≤n)。
設(shè)有c 個(gè)聚類中心V ={v1,v2,… ,vc},取dik為樣本xk與聚類中心vi的歐氏距離,記作:
聚類準(zhǔn)則是使得下列目標(biāo)函數(shù)達(dá)到最小值:
式(2)中:uik表示第k 個(gè)樣本在第i 類中的隸屬度,且滿足:
m 是模糊因子,用來決定聚類結(jié)果模糊度的權(quán)重指數(shù),m∈[1,∞),取其經(jīng)驗(yàn)值范圍為1.5≤m≤2.5。結(jié)合應(yīng)用Lagrange 乘數(shù)法,結(jié)合式(3)的約束條件對(duì)式(2)進(jìn)行求解,可以得到模糊劃分矩陣U 和聚類原型V 更新公式如式(4)和(5):
模糊聚類算法中,F(xiàn)CM 算法理論最為完善,其不僅有深厚的數(shù)學(xué)基礎(chǔ),而且在眾多領(lǐng)域獲得了成功的應(yīng)用,是目前最實(shí)用也最受歡迎的算法之一。但是,它仍然存在著一些問題:(1)模糊加權(quán)指數(shù)m 的確定問題,尚缺乏理論指導(dǎo);(2)模糊聚類目標(biāo)函數(shù)是非凸的,而FCM 類型算法又是通過迭代爬山法實(shí)現(xiàn)的,因此對(duì)于初始化特別敏感,很容易陷入局部極小值,而得不到全局最優(yōu)解;(3)盡管模糊聚類是一種無監(jiān)督的分類,但目前的FCM 算法都要求事先給定聚類類別數(shù),否則算法會(huì)產(chǎn)生誤導(dǎo),破壞算法的無監(jiān)督性和自適應(yīng)性。
1.1.2 FCM 的改進(jìn)算法IFCM
(1)加權(quán)指數(shù)m 選擇問題
加權(quán)指數(shù)m 是FCM 聚類算法中的一個(gè)重要參數(shù)[11]。本文從FCM 算法出發(fā)研究m 與聚類分析效果的關(guān)系。利用基于目標(biāo)函數(shù)拐點(diǎn)的方法來確定最優(yōu)的m,原理如下:
研究發(fā)現(xiàn)模糊聚類的目標(biāo)函數(shù)Jm(U,V)存在拐點(diǎn),也就是說目標(biāo)函數(shù)對(duì)m 的偏導(dǎo)數(shù)存在一個(gè)極小點(diǎn)。而且,該拐點(diǎn)恰好位于Bezdek 的經(jīng)驗(yàn)范圍[1,1.5]之內(nèi),并隨樣本集的可分性變化做相應(yīng)的移動(dòng)。盡管目前還沒有確切的物理意義,但是從實(shí)驗(yàn)的角度可以驗(yàn)證拐點(diǎn)所對(duì)應(yīng)的m 值可以作為合適的加權(quán)指數(shù),從而可以得到一種最優(yōu)加權(quán)指數(shù)m*的快速求取方法:
由于對(duì)于模糊聚類而言,目標(biāo)函數(shù)的拐點(diǎn)恰好是其導(dǎo)數(shù)的極小值,為了快速實(shí)現(xiàn),最優(yōu)加權(quán)指數(shù)m*又可按式(7)選取:
(2)聚類數(shù)和初始聚類中心選擇問題
針對(duì)聚類數(shù)和初始聚類中心無法確定問題,本文將粒度思想引入FCM 聚類算法中,從信息粒度的角度進(jìn)行聚類分析,通過計(jì)算信息粒耦合度和分離度,從不同的粒度空間對(duì)聚類結(jié)果進(jìn)行有效性評(píng)價(jià),最終得出較優(yōu)的聚類結(jié)果,同時(shí)也得到最佳的聚類數(shù)。另外采用基于改進(jìn)的K 均值算法的聚類結(jié)果來作為初始化聚類中心,即基于改進(jìn)的K 均值算法,得到相對(duì)合理的全局聚類中心,再將此聚類中心作為FCM 算法的初始聚類點(diǎn),用以提高算法的收斂速度和分類準(zhǔn)確性。同時(shí),在求解最優(yōu)解的時(shí)候,針對(duì)每一個(gè)聚類數(shù)c 進(jìn)行FCM聚類時(shí),都要重新初始化聚類中心,從而導(dǎo)致確定的最佳聚類數(shù)不穩(wěn)定的情況,提出了合并聚類中心的思想。
K 均值算法屬于聚類技術(shù)中一種基本的劃分方法,具有簡(jiǎn)單快速的特點(diǎn)。其基本思想是選取k個(gè)數(shù)據(jù)對(duì)象作為初始聚類中心,通過迭代把數(shù)據(jù)對(duì)象劃分到不同的簇中,使簇內(nèi)部對(duì)象之間相似度很大,而簇之間相似度很小。由于K 均值算法是隨機(jī)選取k 個(gè)對(duì)象作為初始聚類中心,無法體現(xiàn)數(shù)據(jù)對(duì)象的分布,因此提出改進(jìn)算法,即計(jì)算數(shù)據(jù)對(duì)象兩兩之間距離,找出距離最近的對(duì)象進(jìn)行合并,刪除合并的數(shù)據(jù)對(duì)象,再次計(jì)算兩兩之間距離,一直循環(huán)進(jìn)行,直至滿足設(shè)定的閾值。由于改進(jìn)后的K 均值算法首先根據(jù)啟發(fā)式算法來尋找數(shù)據(jù),因而產(chǎn)生的初始聚類中心比較符合數(shù)據(jù)的實(shí)際分布,也就更適用于對(duì)實(shí)際數(shù)據(jù)的聚類,將此聚類結(jié)果應(yīng)用于FCM 算法的初始聚類中心,具有合理性。
粒度是指“信息粗細(xì)的平均度量”。不同粒度下聚類對(duì)應(yīng)著樣本點(diǎn)集的不同劃分結(jié)果,本文通過信息粒耦合度和分離度來衡量劃分結(jié)果的好壞,耦合度度量類內(nèi)的緊致性,該項(xiàng)越小緊致性越好;分離度代表類間的分離性,該項(xiàng)越大分離性越好。
式(8 ~10)中:Cd(c)表示信息粒耦合度,Sd(c)表示信息粒分離度,GD(c)表示聚類結(jié)果有效性函數(shù),較小的GD(c)代表較好的聚類結(jié)果。
(3)IFCM 算法的原理
根據(jù)算法的基本思想,可得算法的基本步驟如下:
Step1:設(shè)定最大初始聚類個(gè)數(shù)cmax,模糊系數(shù)m,迭代停止閾值ε,權(quán)重因子α,最大迭代次數(shù)lmax,令迭代計(jì)數(shù)器l=0;
Step2:根據(jù)初始聚類個(gè)數(shù)cmax,運(yùn)用改進(jìn)K 均值算法,得到聚類結(jié)果;
Step3:用式(4)更新模糊分類矩陣U,用式(5)更新聚類中心V;
Step4:達(dá)到迭代停止閾值,則輸出U 和V,若未達(dá)到,則令l=l+1,轉(zhuǎn)Step3;
Step5:計(jì)算有效性函數(shù)GD(c),保存;
Step6:計(jì)算類兩兩之間距離,將距離最小的兩類合并為一類,得到c-1 個(gè)聚類中心;
Step7:令c=c-1,若c >1,則重設(shè)l =0,轉(zhuǎn)向Step3,否則,轉(zhuǎn)向Step8;
Step8:選擇最小的GD(c)對(duì)應(yīng)的聚類結(jié)果,即為最佳聚類結(jié)果,至此,算法結(jié)束。
模型第2 層使用概率統(tǒng)計(jì)中的3σ 法則來設(shè)計(jì)負(fù)荷壞數(shù)據(jù)的辨識(shí)模型。第1 層中基于聚類產(chǎn)生k 個(gè)聚類中心,每一個(gè)聚類中心對(duì)應(yīng)于一個(gè)3σ辨識(shí)模型。當(dāng)待檢曲線輸入之后,首先找到其所屬的特征曲線,然后根據(jù)3σ 法則進(jìn)行判斷,辨識(shí)出壞數(shù)據(jù)的準(zhǔn)確位置,為修正做好基礎(chǔ)工作。
模型的第3 層實(shí)現(xiàn)對(duì)壞數(shù)據(jù)的修正,方法是將第2 層檢測(cè)到的壞數(shù)據(jù)點(diǎn)位置的數(shù)據(jù)用隸屬度最大和次大的2 條特征曲線相應(yīng)點(diǎn)位置的數(shù)值加權(quán)和來代替(如果次最大隸屬度值太小,就只用最大隸屬度對(duì)應(yīng)的特征曲線值)。設(shè)檢測(cè)出某曲線xj的t1點(diǎn)至t2點(diǎn)為壞數(shù)據(jù),其隸屬度最大和次大的兩個(gè)類中心為vi1、vi2,壞數(shù)據(jù)的修正公式為
本模型主要考慮的是負(fù)荷曲線的相似性和平滑性,為消除負(fù)荷增長(zhǎng)后幅值變化的影響,對(duì)負(fù)荷進(jìn)行歸一化,即用每點(diǎn)負(fù)荷值除以當(dāng)日負(fù)荷總量。歸一化之后,消除負(fù)荷增長(zhǎng)對(duì)聚類的影響。
根據(jù)上述改進(jìn)方法,各參數(shù)取值如下:加權(quán)指數(shù)m=2;初始聚類數(shù)cmax=14;最優(yōu)聚類數(shù)c*=5;權(quán)重因子α=0.6;迭代停止閾值ε=0.000 001。
設(shè)聚類算法將負(fù)荷曲線分為k 類,同時(shí)產(chǎn)生k條特征曲線,則有k 個(gè)辨識(shí)模型與之對(duì)應(yīng),詳述如下:
(1)將聚類得到的聚類中心記作{x1(i),x2(i),… ,xk(i)},每個(gè)類別中包括的曲線條數(shù)記作M={m1,m2,… ,mk};
(2)令迭代系數(shù)t=1,計(jì)算第t 類對(duì)應(yīng)于每個(gè)時(shí)刻負(fù)荷的方差,如式(12),E(i)是第t 類所有曲線每個(gè)時(shí)刻的平均值;
(3)判斷第t 類的包含曲線中的壞數(shù)據(jù),若滿足式(13),則該點(diǎn)為壞數(shù)據(jù)。
模型訓(xùn)練完畢之后,含有壞數(shù)據(jù)的分量對(duì)應(yīng)的輸出分量標(biāo)記為1,其余正常點(diǎn)對(duì)應(yīng)的輸出分量則標(biāo)記為0。壞數(shù)據(jù)不論是單點(diǎn)出現(xiàn)或是連續(xù)成片,模型均能較準(zhǔn)確地辨識(shí)和定位。
以四川省某電網(wǎng)的一年的實(shí)際負(fù)荷為例,用上述所提出模型進(jìn)行實(shí)際驗(yàn)證。
首先按照2.1 所述方法進(jìn)行負(fù)荷樣本的歸一化處理。該電網(wǎng)的負(fù)荷采樣數(shù)據(jù)間隔為5 min,即日負(fù)荷數(shù)據(jù)為288 點(diǎn)。(1)由于采樣點(diǎn)數(shù)較多,會(huì)造成聚類特征曲線求取之后與實(shí)際負(fù)荷曲線整體特征差異較大,并且輸入輸出太多,神經(jīng)網(wǎng)絡(luò)訓(xùn)練速度也慢。因此,本文將288 點(diǎn)分為3 部分,即96點(diǎn)作為一部分,分別進(jìn)行同樣的處理過程。這樣既可以改善收斂性、減少時(shí)間,并且還能使得每一段聚類特征曲線更能反映日負(fù)荷曲線,有利于壞數(shù)據(jù)辨識(shí)。(2)由于數(shù)據(jù)跨度為1年,若直接對(duì)其進(jìn)行聚類,勢(shì)必造成聚類數(shù)目很大,并且不能很好地反映季節(jié)特征。因此,本文將歷史數(shù)據(jù)分為4部分,分別代表4 個(gè)季節(jié),對(duì)每個(gè)季節(jié)的數(shù)據(jù)分別進(jìn)行數(shù)據(jù)聚類,這樣聚類數(shù)目較小,并且聚類特征曲線與日負(fù)荷曲線差異也會(huì)很小,更利于壞數(shù)據(jù)辨識(shí)。
由3.1 可知,本文將樣本分為12 部分,重復(fù)利用提出方法進(jìn)行12 次聚類?,F(xiàn)僅以其中一部分為例,其余類似。
圖2 是2011年12月1日至2012年2月29日共計(jì)91 天的負(fù)荷,取97 至192 采樣點(diǎn)共計(jì)96個(gè)采樣點(diǎn)得到的負(fù)荷,經(jīng)歸一化之后的結(jié)果。由圖2 可以看出,很明顯有幾處存在壞數(shù)據(jù)。
圖2 2011年12月1日至2012年2月29日歸一化負(fù)荷曲線Fig.2 Normalized load curves from December 1,2011 to February 29,2012
本文按照上述第2 節(jié)介紹的方法進(jìn)行聚類數(shù)目的選擇,得到最佳聚類數(shù)目為7,并采用改進(jìn)模糊C 均值方法進(jìn)行聚類,確定最終聚類中心(特征曲線)。為了更好地說明問題,取出其中隸屬于某一條聚類特征曲線的負(fù)荷曲線,見圖3。由圖3 可以看出,毛刺數(shù)據(jù)明顯偏離整體趨勢(shì),對(duì)含有壞數(shù)據(jù)的負(fù)荷曲線檢測(cè)效果見圖4。
圖3 隸屬于某一條特征曲線的歸一化負(fù)荷曲線Fig.3 Normalized load curves belonging to one of the characteristic curves
圖4 對(duì)含有壞數(shù)據(jù)的負(fù)荷曲線檢測(cè)效果Fig.4 Detection effect of the load curve containing bad data
最后,本文列出一年內(nèi)4 個(gè)季節(jié)段每段的壞數(shù)據(jù)檢測(cè)正確率,如表1。
表1 壞數(shù)據(jù)檢測(cè)正確率Tab.1 Accuracy percentage of bad data detection
(1)負(fù)荷曲線聚類
四川省某電網(wǎng)地處山區(qū),水資源極其豐富,小水電裝機(jī)容量比較大;另外其整體負(fù)荷基準(zhǔn)值較低,居民用商業(yè)用電占主要成分,規(guī)律比較難尋。因此,該電網(wǎng)的負(fù)荷波動(dòng)比較大,壞數(shù)據(jù)較多,負(fù)荷曲線規(guī)律性小。針對(duì)以上特性,采取將樣本分為12 部分的思想,對(duì)每一部分分別聚類,結(jié)果證明效果還是不錯(cuò)的。
(2)負(fù)荷曲線辨識(shí)
本文采用了概率統(tǒng)計(jì)中的3σ 法則來進(jìn)行壞數(shù)據(jù)的辨識(shí)。針對(duì)實(shí)際負(fù)荷數(shù)據(jù),通過觀察方差的大小來確定3σ 區(qū)間的大小,而不是取為1,本文經(jīng)過試驗(yàn)確定為1.05,表1 的檢測(cè)準(zhǔn)確率表明效果很好。
(3)模型的應(yīng)用
該模型是對(duì)已有歷史數(shù)據(jù)進(jìn)行的離線建模分析。而考慮到一個(gè)地區(qū)的復(fù)合模式在較長(zhǎng)一段時(shí)間內(nèi)相對(duì)穩(wěn)定,因此可以針對(duì)不屬于樣本集中的負(fù)荷曲線進(jìn)行處理。方法如下:首先將新的負(fù)荷數(shù)據(jù)找到對(duì)應(yīng)的季節(jié)段,即屬于4 個(gè)季節(jié)段的哪一段;然后將新的負(fù)荷數(shù)據(jù)分為3 部分,每一部分分別求其對(duì)相應(yīng)季節(jié)段相應(yīng)部分的隸屬度;最后,根據(jù)隸屬度最大原則,進(jìn)行辨識(shí)和修正。
進(jìn)行壞數(shù)據(jù)的辨識(shí)一直以來未受到很大的重視。人工判斷的方法主觀性太強(qiáng),規(guī)律性難以找到,導(dǎo)致處理效果較差。電力日負(fù)荷曲線具有相似性和平滑性。模糊聚類思想作為一種數(shù)據(jù)方法,有其獨(dú)特的優(yōu)勢(shì),能夠自動(dòng)將類似的歸為一類,而僅僅需要給定其聚類數(shù)目即可。本文在引入模糊聚類方法進(jìn)行聚類的同時(shí),針對(duì)其不足做出改進(jìn),提出聚類數(shù)目,初始聚類中心自行確定的方法,力圖使聚類效果達(dá)到最好,然后利用3σ法則進(jìn)行壞數(shù)據(jù)辨識(shí),最后進(jìn)行壞數(shù)據(jù)的修正。實(shí)例分析可以看出,本文提出方法具有準(zhǔn)確性和實(shí)用性。
[1]康重慶,夏清,劉梅.電力系統(tǒng)負(fù)荷預(yù)測(cè)[M].北京:中國電力出版社,2007.
[2]莫維仁,張伯明,孫宏斌,等.擴(kuò)展短期負(fù)荷預(yù)測(cè)方法的應(yīng)用[J].電網(wǎng)技術(shù),2003,27 (5):6 -9.
[3]康重慶,夏清,相年德.灰色系統(tǒng)參數(shù)估計(jì)與不良數(shù)據(jù)辨識(shí)[J].清華大學(xué)學(xué)報(bào) (自然科學(xué)版),1997,37 (4):72 -75.
[4]張國江,邱家駒,李繼紅.基于人工神經(jīng)網(wǎng)絡(luò)的電力負(fù)荷壞數(shù)據(jù)辨識(shí)與調(diào)整[J].中國電機(jī)工程學(xué)報(bào),2001,21 (8):104 -107.
[5]朱明.數(shù)據(jù)挖掘[M].合肥:中國科技大學(xué)出版社,2002.
[6]袁曾任.人工神經(jīng)元網(wǎng)絡(luò)及其應(yīng)用[M].北京:清華大學(xué)出版社,1999.
[7]張曉星,程其云,周湶,等.基于數(shù)據(jù)挖掘的電力負(fù)荷壞數(shù)據(jù)動(dòng)態(tài)智能清洗[J].電力系統(tǒng)自動(dòng)化,2005,29 (8):60 -64.
[8]張昀,周湶,任海軍,等.數(shù)據(jù)挖掘在電力負(fù)荷壞數(shù)據(jù)智能辨識(shí)與修正中的應(yīng)用[J].重慶大學(xué)學(xué)報(bào),2013,36 (2):69 -74.
[9]陳東輝.基于目標(biāo)函數(shù)的模糊聚類算法關(guān)鍵技術(shù)研究[D].西安:西安電子科技大學(xué),2012.
[10]范九倫.模糊聚類新算法與聚類有效性問題研究[D].西安:西安電子科技大學(xué),1998.
[11]高新波,裴繼紅,謝維信.模糊C-均值聚類算法中加權(quán)指數(shù)m 的研究[J].電子學(xué)報(bào),2000,4 (4):80 -83.
[12]范九倫,吳成茂.FCM 算法中隸屬度的新解釋及其應(yīng)用[J].電子學(xué)報(bào),2004,2 (2):350 -352.
[13]卜東波,白碩,李國杰.聚類/分類中的粒度原理[J].計(jì)算機(jī)學(xué)報(bào),2002,25 (8):810 -816.
[14]童述林,文福拴,陳亮.電力負(fù)荷數(shù)據(jù)預(yù)處理的二維小波閾值去噪方法[J].電力系統(tǒng)自動(dòng)化,2012,36 (2):101 -104.
[15]李光珍,劉文穎,云會(huì)周,等.母線負(fù)荷預(yù)測(cè)中樣本數(shù)據(jù)預(yù)處理的新方法[J].電網(wǎng)技術(shù),2010,34(2):149 -154.