唐偉寧 李 欣
1(國網(wǎng)吉林省電力有限公司電力科學(xué)研究院 吉林 長春 130000) 2(國網(wǎng)吉林省電力有限公司吉林供電公司 吉林 吉林 132001)
需求響應(yīng)(DR)是智能電網(wǎng)的關(guān)鍵技術(shù)之一,有利于降低峰值負(fù)荷,重塑負(fù)荷曲線,從而節(jié)省對昂貴備用發(fā)電機(jī)組的額外投資?,F(xiàn)有文獻(xiàn)已經(jīng)對參與需求響應(yīng)的住宅和商業(yè)負(fù)荷進(jìn)行了很多研究[1-3],典型的負(fù)荷曲線對于評估可調(diào)度的負(fù)荷容量、開發(fā)基于價格或基于激勵的DR程序、確定調(diào)度方案具有重要意義。負(fù)荷聚類即是將眾多的負(fù)荷曲線分成幾個典型的類別,近年來,有研究人員提出了多種聚類方法。
常用的聚類方法有基于劃分的聚類算法(包括模糊C-均值和K-均值)、基于層次的聚類算法、基于自組織映射的網(wǎng)絡(luò)聚類算法、基于密度的聚類算法和基于模型的聚類算法[4]等。隨著數(shù)據(jù)挖掘技術(shù)的發(fā)展,一些新的聚類方法應(yīng)運(yùn)而生。為了獲得最優(yōu)的聚類數(shù),文獻(xiàn)[5]將聚類算法與優(yōu)化理論相結(jié)合,提出了一種基于蟻群優(yōu)化的聚類方法;文獻(xiàn)[6]提出了支持向量聚類在電力負(fù)荷曲線聚類分析研究中的有效應(yīng)用;分層聚類具有較高的準(zhǔn)確率和較低的效率,分區(qū)聚類具有較高的效率和較低的準(zhǔn)確率,文獻(xiàn)[7]將分層聚類與分區(qū)聚類相結(jié)合,提出了一種集成聚類算法。然而,負(fù)荷形狀變異性在負(fù)荷曲線分析中是必不可少的,其反映了用戶的不同行為和特點(diǎn)。傳統(tǒng)的基于歐氏距離測度的聚類方法存在以下缺點(diǎn):(1) 只考慮點(diǎn)到點(diǎn)之間的距離,缺乏分段趨勢信息,不具備形狀模式識別的能力。換句話說,假設(shè)數(shù)據(jù)點(diǎn)的順序并不重要,當(dāng)排列時間點(diǎn)時,提供的是同樣的結(jié)果,這可能會丟失一些有關(guān)剖面形狀圖案的重要信息。(2) 負(fù)荷曲線的聚類需要考慮數(shù)據(jù)集中關(guān)注全局屬性的所有維度,隨著數(shù)據(jù)集維數(shù)的增加,距離相似性度量的意義越來越小[8]。
聚類的結(jié)果取決于算法和數(shù)據(jù)的分辨率,然而,很少有聚類方法考慮數(shù)據(jù)粒度對電力需求曲線分析性能的影響。直接處理原始數(shù)據(jù)不是一種有效的方法,因?yàn)閿?shù)據(jù)可能非常大并且包含許多冗余的細(xì)節(jié)。傳統(tǒng)上,根據(jù)聚類實(shí)驗(yàn),時間序列負(fù)荷曲線數(shù)據(jù)的近似具有固定的時間分辨率,通常為15、30或60分鐘。因此必須確定一種解決方案,在表示負(fù)荷曲線特征的詳細(xì)程度和處理數(shù)據(jù)的必要性之間進(jìn)行權(quán)衡。現(xiàn)有文獻(xiàn)提出了幾種處理時間分辨問題的方法,包括主成分分析法、Sammon映射法、自組織映射法、分段聚合近似法和符號聚合近似法[9]等。這些方法根據(jù)數(shù)據(jù)集的特點(diǎn)采用固定的一致或非一致的時間分辨率,由于基于均值的近似等歸約技術(shù)的性質(zhì),在某些類型的負(fù)荷數(shù)據(jù)中很可能會丟失一些重要的模式。
本文提出一種新的聚類方法來對負(fù)荷曲線進(jìn)行分組,以實(shí)現(xiàn)負(fù)荷分組控制或異構(gòu)聚合負(fù)荷建模,主要貢獻(xiàn)有:(1) 提出一種時間分辨率可變的分段聚合近似方法,用于權(quán)衡數(shù)據(jù)細(xì)節(jié)和數(shù)據(jù)維數(shù);(2) 將多維度相似的譜聚類算法應(yīng)用于負(fù)荷曲線聚類分析,提高負(fù)荷曲線間相似性度量的準(zhǔn)確性,保證較高的聚類質(zhì)量。
隨著需求側(cè)響應(yīng)程序的發(fā)展和先進(jìn)計量基礎(chǔ)設(shè)施(Advanced Metering Infrastructure,AMI)系統(tǒng)帶來的海量數(shù)據(jù),需要應(yīng)用負(fù)荷曲線聚類技術(shù)對用戶按用電模式進(jìn)行分類,并對其整體能耗趨勢進(jìn)行清晰的評價。本文負(fù)荷曲線的聚類主要分為三個階段:負(fù)荷數(shù)據(jù)準(zhǔn)備、負(fù)荷曲線聚類和將結(jié)果應(yīng)用到DR程序,如圖1所示。
具體包括以下步驟:
(1) 求均值。單個負(fù)荷的典型日曲線通常用特定工作日內(nèi)負(fù)荷數(shù)據(jù)的平均值表示,通過減少異常負(fù)荷數(shù)據(jù)的影響,可以得到典型的用電模式。
(2) 規(guī)范化。負(fù)荷曲線聚類通常是根據(jù)用戶的曲線形狀和歐幾里得距離度量將“相似”的用戶分組在一起。通常在聚類之前對負(fù)荷數(shù)據(jù)進(jìn)行規(guī)范化,以確保距離度量對每個變量的權(quán)重相等。
當(dāng)前兩種常用的規(guī)范化方法是:統(tǒng)計規(guī)范化和維度規(guī)范化。前一種方法,如Z-score方法,根據(jù)原始數(shù)據(jù)的均值和標(biāo)準(zhǔn)差進(jìn)行規(guī)范化,并將數(shù)據(jù)轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布;縮放規(guī)格化(如Min-Max方法)是對0到1之間的線性壓縮數(shù)據(jù)的振幅數(shù)據(jù)進(jìn)行規(guī)范化。由于歐幾里得距離對負(fù)荷數(shù)據(jù)振幅的差異敏感,因此本文采用Min-Max法,對于由n個記錄組成的數(shù)據(jù)X,定義為:
(1)
(3) 基于信息熵的分段聚合近似。基于信息熵的分段聚合近似(Information Entropy Based Piecewise Aggregate Approximation,IEPAA)算法[8]是用一種新的可變時間分辨率的低維數(shù)據(jù)來近似高維數(shù)據(jù),是對單個用戶典型日負(fù)荷曲線基本特征的近似,采用信息熵來度量日負(fù)荷曲線的波動程度。
(4) 譜聚類。通過使用譜聚類方法,考慮距離、形狀波動和形狀趨勢,將“相似”的用戶組合在一起。為了驗(yàn)證本文算法,以商業(yè)建筑100臺暖通空調(diào)機(jī)組的用電數(shù)據(jù)[9]為例進(jìn)行分析,圖2為100臺暖通空調(diào)機(jī)組的典型日負(fù)荷曲線。
采樣間隔為5 min,數(shù)據(jù)四舍五入到最接近的十分之一。對100臺暖通空調(diào)機(jī)組的典型日負(fù)荷曲線進(jìn)行取平均算法,可以得到一個名為DS的數(shù)據(jù)集,每個典型的日負(fù)荷曲線由288個數(shù)據(jù)點(diǎn)組成,數(shù)據(jù)集DS的維數(shù)為100×288。
采用信息熵度量負(fù)荷曲線的波動程度,假設(shè)一個數(shù)據(jù)X包含n個可能的記錄,表示為x1,x2,…,xn,每個記錄的概率分別為p1,p2,…,pn。數(shù)據(jù)X的信息熵Hn可以定義為:
(2)
信息熵Hn可以反映負(fù)荷曲線的波動程度,Hn越大,負(fù)荷曲線的波動越大,反之亦然。當(dāng)p1=p2=p3=…=pn時,熵Hn的最大值Hmax為ln(n)。
平均信息熵可以表示為:
(3)
定義τj為一定時間內(nèi)第j個負(fù)荷曲線的波動程度,則τj可近似為下列方程:
(4)
式中:j=1,2,…,N,N是負(fù)荷曲線的數(shù)量;ω是比例系數(shù),本文中ω=1;nj是第j個負(fù)荷曲線的可能記錄。
定義系數(shù)ρ為一定時間內(nèi)波動度τj=1時的負(fù)荷曲線數(shù)與負(fù)荷曲線總數(shù)的比值,ρ可以表示為:
(5)
在下面的IEPAA算法中,將系數(shù)ρ與預(yù)設(shè)閾值σ進(jìn)行比較,如果ρ大于σ,則認(rèn)為相應(yīng)的數(shù)據(jù)波動較大,應(yīng)進(jìn)一步劃分為兩個數(shù)據(jù)段。
PAA通過低維數(shù)據(jù)獲得高維數(shù)據(jù)的近似值,假設(shè)一個數(shù)據(jù)由n個元素組成,表示為X={x1,x2,…,xn}。X可以用m個元素組成的數(shù)據(jù)來近似,表示為Y={y1,y2,…,yn}。Y的第i個元素由以下公式計算:
(6)
式中:m (1) 參數(shù)選擇:根據(jù)數(shù)據(jù)值的概率分布計算信息熵,負(fù)荷曲線數(shù)據(jù)四舍五入到最接近的十分之一。負(fù)荷曲線分類的最大時間分辨率(Maximum Temporal Resolution,MTR)主要取決于DR程序中的負(fù)荷控制持續(xù)時間和類型,因此,根據(jù)實(shí)際情況確定數(shù)據(jù)的時間分辨率。 (2) 負(fù)荷切換事件檢測:在時間窗T內(nèi),如果負(fù)荷的最大和最小功率之差大于某一閾值,則發(fā)生負(fù)荷切換事件。將變量S定義為時間窗T內(nèi)N個負(fù)荷曲線的切換事件總數(shù): (7) 若第i個負(fù)荷切換事件發(fā)生,則si=1,否則si=0。 (3) IEPAA的主要步驟:圖3是IEPAA算法的流程,其中:K1和K2分別是數(shù)據(jù)段的數(shù)量;σ和Γ是預(yù)設(shè)閾值;i和j是整數(shù)變量。閾值σ和Γ可調(diào),閾值越大,表示其從數(shù)據(jù)集中刪除的負(fù)荷曲線越多,本文將σ和Γ分別設(shè)為0.06和4。 采用數(shù)據(jù)集DS說明所提IEPAA算法的主要過程,包括以下步驟: 1) 初始化DSD=0.1,MTR=5 min,T=30 min,K1=48,i=0。每日負(fù)荷曲線的數(shù)據(jù)長度為288。時間窗T為30 min意味著數(shù)據(jù)集DS被劃分為48個段,每段維度為100×6。K1為段數(shù),i是一個臨時整數(shù)變量。 2) 篩選出適合參與DR響應(yīng)的負(fù)荷曲線。對于每個段,計算總負(fù)荷切換事件S,若0 3) 在步驟2)之后,將獲得新的數(shù)據(jù)集數(shù)據(jù),維度為(100-R)×288,臨時變量i重置為0。 4) 將時間窗設(shè)置為60 min,這意味著數(shù)據(jù)集數(shù)據(jù)被分成24個段。該段被命名為SegA,每段SegA的維度為(100-R)×12。 5) 選擇表示為SegAi的第i段數(shù)據(jù)。 6) 根據(jù)式(5)和式(7)計算SegAi的系數(shù)ρ和S,若ρ<σ或S<Γ,則轉(zhuǎn)到步驟7),否則轉(zhuǎn)到步驟8)。 7) 使用12個數(shù)據(jù)點(diǎn)的平均值近似模擬各曲線的第i個數(shù)據(jù)段。使用1個數(shù)據(jù)點(diǎn)代替12個數(shù)據(jù)點(diǎn)來實(shí)現(xiàn)了數(shù)據(jù)降維。 8) 將SegAi等分為兩段(稱為SegB)。SegB各段的數(shù)據(jù)量為(100-R)×6。臨時整數(shù)變量j設(shè)置為0。 9) 選擇表示為SegBj的第j段數(shù)據(jù)。 10) 根據(jù)式(5)和式(7)計算數(shù)據(jù)段SegBj的系數(shù)ρ和S,若ρ<σ或S<Γ,則轉(zhuǎn)到步驟11),否則轉(zhuǎn)到步驟12)。 11) 使用相應(yīng)的6個數(shù)據(jù)點(diǎn)的平均值來近似擬合曲線的第j段,通過使用1個數(shù)據(jù)點(diǎn)替換6個數(shù)據(jù)點(diǎn)來實(shí)現(xiàn)數(shù)據(jù)降維。 12) 將SegBj分為兩段(命名為SegC)。SegC各段的數(shù)據(jù)量為(100-R)×3。臨時整數(shù)變量k設(shè)置為0。 13) 選擇表示為SegCk的第k段數(shù)據(jù)。 14) 使用3個數(shù)據(jù)點(diǎn)的平均值近似模擬各曲線的第k段,使用1個數(shù)據(jù)點(diǎn)代替3個數(shù)據(jù)點(diǎn)來實(shí)現(xiàn)數(shù)據(jù)降維。 15) 獲取典型數(shù)據(jù)。 結(jié)果表明,該算法采用變差分時間來近似不同波動水平的數(shù)據(jù)段。 對給定的數(shù)據(jù)集DS使用本文所提出的IEPAA算法,并獲得一個表征數(shù)據(jù)集DS1。傳統(tǒng)PAA算法分別以10分鐘和15分鐘的固定時間分辨率在數(shù)據(jù)集DS上進(jìn)行計算,以獲得相應(yīng)的數(shù)據(jù)集DS2和DS3。 時間序列數(shù)據(jù)的有效表示不僅要減少數(shù)據(jù)維數(shù),而且要保持原始數(shù)據(jù)的顯著特征。引入平均可分辨信息指數(shù)(Average Distinguished Information,ADI)來評價IEPAA算法的表示效果。ADI的數(shù)據(jù)越大,表示算法在保持特征方面的性能越好。 假設(shè)Yi,j是二維表示數(shù)據(jù)集Y的一個元素,其中:i=1,2,…,M;j=1,2,…,L;M表示負(fù)荷曲線的總數(shù);L表示負(fù)荷數(shù)據(jù)的長度。數(shù)據(jù)集Y的ADI定義為: (8) DS1、DS2和DS3的ADI分別用式(8)計算,計算結(jié)果如表1所示,可見DS1的數(shù)據(jù)長度小于DS2和DS3的數(shù)據(jù)長度,這意味著本文所提出的IEPAA算法比傳統(tǒng)的PAA算法具有更好的數(shù)據(jù)降維效果。DS1的ADI明顯大于DS2和DS3的ADI,證明IEPAA算法在保持?jǐn)?shù)據(jù)特征方面比傳統(tǒng)PAA算法有更好的性能。此外,DS1的近似誤差也分別小于DS2和DS3。簡而言之,本文提出的IEPAA算法在負(fù)荷曲線數(shù)據(jù)的表示方面具有明顯的優(yōu)勢。 表1 IEPAA與傳統(tǒng)PAA的比較 相似性指標(biāo)對于聚類分析至關(guān)重要,這里以第2節(jié)定義的數(shù)據(jù)集DS1為例說明相似性指標(biāo)。在計算相似性指標(biāo)之前,對數(shù)據(jù)集DS1的數(shù)據(jù)采用中值的方式進(jìn)行處理使數(shù)據(jù)平滑。 1) 距離指標(biāo):歐幾里得距離通常用于距離指標(biāo),兩組負(fù)荷數(shù)據(jù)Yi和Yk之間的歐氏距離de(i,k)表示為: (9) 式中:i=1,2,…,M;j=1,2,…,L。 2) 形狀波動指標(biāo):本文采用相關(guān)距離作為形狀波動指標(biāo),兩組負(fù)荷曲線數(shù)據(jù)Yi和Yk之間的協(xié)方差可以表示為: (10) 相關(guān)距離dc(i,k)定義為: dc(i,k)=1-cov(i,k) (11) 3) 形狀趨勢指標(biāo):采用最大距離描述形狀趨勢指標(biāo),兩組負(fù)荷的曲線數(shù)據(jù)Yi和Yk之間的最大距離表示為: dm(j)=|yi,j-yk,j| (12) 式中:s=η×L,η是可根據(jù)DR程序調(diào)整的系數(shù)。 4) 多維度相似性指標(biāo):基于距離度量和兩種形狀指標(biāo),本文引入了多維度相似性指標(biāo)。從歐幾里得距離矩陣de的數(shù)據(jù)集Y中可以分別獲得形狀波動度量矩陣dc和形狀趨勢度量矩陣dm。多維度相似性度量矩陣D定義為: D=α×de+β×dc+χ×dt α+β+χ=1 (13) 式中:α、β和χ是可以根據(jù)不同的DR程序進(jìn)行調(diào)整的加權(quán)系數(shù);矩陣D的維數(shù)為M×M。 近年來,譜聚類已經(jīng)成為目前流行的聚類算法之一[10],本文采用常用的Ng-Jordan-Weiss(NJW)算法進(jìn)行譜聚類分析。 (1) 鄰接矩陣構(gòu)造:采用高斯核函數(shù)構(gòu)造鄰接矩陣W為: (14) 式中:γ是對聚類至關(guān)重要的維度參數(shù)。接下來說明如何確定比例參數(shù)γ。 步驟1將矩陣D的每一行按降序排序以獲得矩陣D′。 步驟2得到(M-1)×M維矩陣E,其中E(i,k)=D′(i+1,j)-D′(i,j)。 步驟3從矩陣E的每一列中求出最大元素E(im,jm)。 步驟4找到對應(yīng)的元素D′(im,jm),其中E(im,jm)=D′(im+1,jm)-D′(im,jm)。 步驟6參數(shù)γ可由以下方程式計算: (15) 式中:ε是相似度量的最大隸屬度。 (2) 最佳聚類數(shù):根據(jù)文獻(xiàn)[11]中引入的矩陣攝動理論,用一種新的方法確定最佳聚類數(shù)k。主要步驟如下: 步驟1計算鄰接矩陣W的特征值。 步驟2將計算出的特征值按降序排序,得到一個數(shù)組λ。 步驟3k=max{i|λ(i)>0.01,i=1,2,…,M}。 (3) 提出譜聚類的步驟。所提譜聚類算法包括以下步驟: 步驟1構(gòu)造多維度相似度量矩陣D。 步驟2確定高斯核函數(shù)的維度參數(shù)γ,計算得到M×M維的鄰接矩陣W。 步驟3計算鄰接矩陣W的規(guī)范化拉普拉斯矩陣L。 步驟4確定最優(yōu)聚類數(shù)k。 步驟5計算L的第一個k階特征向量u1,u2,…,uk。 步驟6構(gòu)造一個M×k維的矩陣T,使得u1,u2,…,uk為T中的列向量。 步驟7設(shè)si為與L的第i行相對應(yīng)的向量。 步驟8用K-均值法對點(diǎn)si(i=1,2,…,M)進(jìn)行聚類。 步驟9得到聚類結(jié)果。 以數(shù)據(jù)集DS1為例,對本文算法進(jìn)行分析。 (1) K-means聚類:K-means算法[12]是負(fù)荷曲線問題中最常用的算法,具有簡單和高效的特點(diǎn)。K-均值聚類的目的是將觀測數(shù)據(jù)劃分成若干個聚類,以最小化聚類內(nèi)的平方和。在數(shù)據(jù)集DS1上執(zhí)行K-均值算法,Davies-Bouldin指數(shù)(DBI)[13]下的最優(yōu)聚類數(shù)為6,如圖4所示。 (2) 譜聚類的應(yīng)用:多維度相似度量矩陣由歐氏距離、形狀起伏和形狀趨勢組成,加權(quán)系數(shù)可以根據(jù)DR程序進(jìn)行調(diào)整。負(fù)荷曲線的形態(tài)特征和振幅對DR程序都很重要,然而,負(fù)荷預(yù)測和負(fù)荷建模更多的是關(guān)注曲線的振幅而不是形態(tài)特征。因此,如果將所提聚類應(yīng)用于DR程序,建議設(shè)置更小的α和更大的β和χ。此外,若將所提聚類方法應(yīng)用于負(fù)荷預(yù)測或負(fù)荷建模中,則需設(shè)置較大的α和較小的β和χ。 算例1:選擇較小的歐氏距離加權(quán)系數(shù)和較大的形狀波動和形狀趨勢加權(quán)系數(shù)。多維度相似度量矩陣的加權(quán)系數(shù)分別設(shè)為α=0.2、β=0.4、χ=0.4,最大隸屬度ε=0.01,相應(yīng)的參數(shù)γ=0.160 9。 所提譜聚類算法是在DS1數(shù)據(jù)集上實(shí)現(xiàn)的。最佳聚類數(shù)為7,聚類結(jié)果如圖5所示。每個聚類C1、C2、C3、C4、C5、C6和C7的曲線號分別為21、8、7、13、11、13和16。 比較圖4和圖5可以發(fā)現(xiàn): 1) 2) 算例2:選擇較大的歐氏距離加權(quán)系數(shù)和較小的形狀波動和形狀趨勢加權(quán)系數(shù)。多維度相似度量矩陣的加權(quán)系數(shù)分別設(shè)為α=0.4、β=0.2、χ=0.2。最大隸屬度ε=0.01,相應(yīng)參數(shù)γ=0.15。 仿真結(jié)果如圖6和圖7所示,本文算法在數(shù)據(jù)集DS1上執(zhí)行,最佳聚類數(shù)為8。聚類C1、C2、C3、C4、C5、C6、C7和C8的曲線數(shù)分別為11、13、13、16、15、7、8和6。 對比圖6和圖4,可以觀察到圖6中C5和C8聚類中的曲線對應(yīng)于圖4中的C6聚類中的曲線。此外,圖4中C5聚類中的曲線對應(yīng)于圖6中的C1、C4和C6聚類中的曲線。結(jié)果表明,通過設(shè)置多維度加權(quán)系數(shù),本文方法可以較好地對負(fù)荷曲線進(jìn)行分類。 當(dāng)前兩個主要的DR類別是:基于價格的需求響應(yīng)和基于激勵的需求響應(yīng)。對于第一個類別,用戶面臨的是基于市場價格的時變價格;另一方面,根據(jù)第二個方案,向用戶提供付款,以激勵其減少用電量。正確有效的負(fù)荷曲線聚類對DR非常重要,聚類結(jié)果有助于設(shè)計合理的DR方案和負(fù)荷控制方案。以圖6中的聚類結(jié)果為例,通過計算每個聚類中對應(yīng)曲線的平均值,可以得到8個典型曲線,如圖7所示,其中:C2、C5、C8聚類為平頂曲線;C3聚類為多模峰曲線;C1、C4、C6聚類為短時峰曲線;C7聚類為雙峰曲線。電力公司或負(fù)荷集成商可以根據(jù)典型曲線圖信息和每種聚類的負(fù)荷數(shù)量,設(shè)計合理的DR方案,并評估參與不同DR的負(fù)荷潛力。 傳統(tǒng)的基于單維度距離相似性度量的聚類方法沒有同時考慮距離度量和形狀度量。本文提出的基于多維度相似性度量的譜聚類方法充分考慮了距離和形狀度量,比傳統(tǒng)聚類方法具有更好的聚類效果。 本節(jié)將譜聚類算法的性能與原始K-均值聚類算法和改進(jìn)蟻群聚類算法進(jìn)行了比較,包括計算時間、聚類穩(wěn)定性和聚類有效性等。蟻群算法是由Dorigo定義的,其動機(jī)是螞蟻系統(tǒng)的智能行為,已被應(yīng)用于解決很多實(shí)際問題。 (1) 計算時間:首先,已知K-均值聚類的輸入是N維歐氏空間中的向量,而譜聚類的輸入是數(shù)據(jù)之間的相似矩陣。譜聚類的計算復(fù)雜度小于K-均值聚類。為了比較計算時間,在DS1數(shù)據(jù)集上分別進(jìn)行了30次循環(huán)運(yùn)行的K-均值算法、蟻群算法和譜聚類算法。K-均值聚類、蟻群算法和譜聚類算法的計算時間分別為13.21 s、7.56 s和1.10 s,隨著負(fù)荷曲線數(shù)目的增加,傳統(tǒng)聚類算法與譜聚類算法的計算時間差異將越來越大。而當(dāng)住宅和商業(yè)負(fù)荷參與動態(tài)頻率調(diào)節(jié)等輔助DR過程時,縮短計算時間是至關(guān)重要的。 (2) 聚類穩(wěn)定性:聚類算法的穩(wěn)定性是指多次運(yùn)行結(jié)果的一致性,而多數(shù)聚類算法的多次運(yùn)行結(jié)果通常是不同的。本文討論并比較了K-均值聚類算法、蟻群聚類算法和譜聚類算法的穩(wěn)定性,圖8給出了DS1的K-均值、蟻群和本文算法的10次運(yùn)行結(jié)果??梢园l(fā)現(xiàn),譜聚類算法10次運(yùn)行結(jié)果的一致性要優(yōu)于K-均值聚類算法。 利用文獻(xiàn)[14]中定義的用于評價聚類算法穩(wěn)定性的穩(wěn)定性指數(shù)(The Stability Index,TSI)對三種聚類算法進(jìn)行定量比較。TSI定義為: (16) TSI越小,聚類算法的穩(wěn)定性越好。基于式(16),在DS1數(shù)據(jù)集上10次運(yùn)行的K-均值、蟻群和譜聚類的TSI分別為1.70、1.83和1.00,本文算法的TSI小于K-均值和蟻群聚類算法的TSI。 (3) 聚類有效性:聚類算法的一個目的通常是為了盡快提高同一個聚類中對象之間的相似度,本文采用文獻(xiàn)[15]中定義的聚類算法的有效性指標(biāo)(The Validity Index,TVI)對目標(biāo)之間的相似性進(jìn)行定量評估,TVI越小,聚類有效性越好。加權(quán)因子μ=0.5的K-均值聚類、蟻群聚類和譜聚類在DS1上運(yùn)行時的TVI分別為0.38、0.26和0.15,可以發(fā)現(xiàn),與K-均值和蟻群聚類算法相比,本文算法具有更好的聚類效果。 本文將信息熵、分段近似和譜聚類的概念相結(jié)合,提出一種適用于制定需求響應(yīng)策略的負(fù)荷數(shù)據(jù)聚類算法,并在100個商用暖通空調(diào)系統(tǒng)中進(jìn)行驗(yàn)證。本文得出以下結(jié)論: (1) 基于IE算法的PAA在負(fù)荷急劇增加或在短時間內(nèi)切大量負(fù)荷的情況下,可以有效地選擇出適合DR程序的負(fù)荷。 (2) 傳統(tǒng)的維度技術(shù)往往會丟失大量顯著的特征信息,而基于IE的PAA不僅降低了維數(shù),而且保持了原始負(fù)荷數(shù)據(jù)的基本特性,具有較高的精度。 (3) 改進(jìn)的譜聚類算法從距離、形態(tài)波動特征和形態(tài)趨勢特征等方面計算負(fù)荷曲線之間的相似性,并采用基于矩陣攝動理論的方法得到聚類數(shù),大大減少了計算量,該方法的綜合聚類質(zhì)量優(yōu)于K-均值聚類和蟻群算法聚類。 除需求響應(yīng)外,聚類結(jié)果對電力公司或負(fù)荷集成商進(jìn)行負(fù)荷預(yù)測、負(fù)荷建模和電價設(shè)計也具有潛在的實(shí)用價值。下一步將研究本文方法在特定DR程序中的實(shí)現(xiàn),如動態(tài)頻率調(diào)節(jié)。2.3 IEPAA算法的細(xì)節(jié)
2.4 IEPAA算法的應(yīng)用
3 譜聚類
3.1 相似性指標(biāo)
3.2 譜聚類算法
3.3 算例分析
圖4中的聚類C1和C6中的曲線在持續(xù)時間和形狀方面具有良好的相似性,而不考慮振幅情況。在圖4中,基于唯一歐氏距離度量的K-均值聚類將這些曲線分類為兩個不同的聚類C1和C6,若暖通空調(diào)機(jī)組參與了一些基于價格DR程序,則圖4中C1和C6聚類中的曲線可以更好地分類為一個聚類。圖5中,基于多維度度量的譜聚類算法能夠?qū)⑦@些曲線分類一個C1聚類中。
圖4中C5聚類中的曲線對應(yīng)于圖5中的C3、C5和C7聚類中的曲線??梢园l(fā)現(xiàn),圖5中的C3、C5和C7聚類中的曲線具有相似的振幅,但出現(xiàn)時間截然不同,其中的相應(yīng)負(fù)荷具有參與短期DR程序的高可行性。這些曲線因其出現(xiàn)時間不同,應(yīng)采用不同的負(fù)荷控制方案。然而,K-均值算法不能將它們區(qū)分開來而是將它們分為了一個聚類。3.4 在DR中的應(yīng)用
3.5 性能比較
4 結(jié) 語