姚黃金,雷 霞,付鑫權(quán),胡 益
基于改進(jìn)自適應(yīng)密度峰值算法的日負(fù)荷曲線聚類分析
姚黃金,雷 霞,付鑫權(quán),胡 益
(西華大學(xué)電氣與電子信息學(xué)院,四川 成都 610039)
電力市場的逐步開放以及大量可再生能源的接入使用戶具有更多的用電自由,導(dǎo)致電力用戶類型多樣化、用戶間負(fù)荷特性差異逐漸增大、負(fù)荷數(shù)據(jù)的類簇分布情況復(fù)雜化。為解決傳統(tǒng)聚類算法面對(duì)不均衡負(fù)荷數(shù)據(jù)集時(shí)聚類效果不佳以及缺乏自適應(yīng)能力等問題,提出一種改進(jìn)自適應(yīng)密度峰值聚類(Improved self-adaptive Density Peak Clustering, ISDPC)算法。首先,基于K-最近鄰(K-Nearest Neighbor, KNN)和相對(duì)密度的思想定義了一種新的密度度量方式。然后在決策圖中擬合分段函數(shù)得到最優(yōu)類簇?cái)?shù)目。最后,通過構(gòu)造加權(quán)KNN圖改進(jìn)樣本分配策略。試驗(yàn)結(jié)果表明,與傳統(tǒng)聚類算法相比,所提方法聚類結(jié)果更加精確、具備自適應(yīng)能力、魯棒性更強(qiáng)。
負(fù)荷曲線聚類;密度峰值聚類;自適應(yīng);KNN;魯棒性
隨著電力體制改革朝著市場化的方向不斷邁進(jìn),售電公司越來越重視用戶的用電體驗(yàn)。面對(duì)競爭愈加激烈的市場環(huán)境,為提升客戶服務(wù)水平、爭奪市場份額,售電公司需要從海量、多樣的用電數(shù)據(jù)中挖掘用戶的用電特征,充分掌握用戶的用電偏好,從而輔助售電公司進(jìn)行負(fù)荷預(yù)測[1-3]、參與需求側(cè)響應(yīng)[4-5]、制定電價(jià)等營銷策略[6-7]。對(duì)用戶日負(fù)荷曲線進(jìn)行聚類分析,科學(xué)合理地劃分用戶群體是售電公司分析用戶用電特性的重要手段[8-11]。
目前針對(duì)負(fù)荷曲線聚類研究大多集中在3個(gè)方面:對(duì)傳統(tǒng)聚類算法的性能優(yōu)化、數(shù)據(jù)降維以及樣本相似性度量的改進(jìn)。針對(duì)基于劃分的k-means和模糊C均值(fuzzy C-mean, FCM)算法需要人為設(shè)置類簇?cái)?shù)目、對(duì)初始類簇中心敏感等缺陷,文獻(xiàn)[12]通過引入分位數(shù)半徑令k-means算法能夠識(shí)別類簇?cái)?shù)目、產(chǎn)生較為理想的類簇中心。文獻(xiàn)[13]提出一種基于灰狼優(yōu)化的FCM聚類算法,能夠快速搜索出最優(yōu)初始類簇中心,提高FCM算法的全局尋優(yōu)能力。文獻(xiàn)[14]將半監(jiān)督學(xué)習(xí)與改進(jìn)AP聚類算法相結(jié)合,完成了對(duì)居民用戶的負(fù)荷分解。為解決高維數(shù)據(jù)給聚類分析帶來的困擾,文獻(xiàn)[15-22]分別通過奇異值分解(SVD)、主成分分析法(PCA)、離散小波變換(DWT)、提取負(fù)荷特征指標(biāo)、自動(dòng)編碼器(CAE)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)、分段聚合近似等方法降低負(fù)荷數(shù)據(jù)維度。在對(duì)樣本相似性度量改進(jìn)的研究中,文獻(xiàn)[23]綜合考慮了負(fù)荷曲線的分布特性和動(dòng)態(tài)特性,將歐氏距離與動(dòng)態(tài)時(shí)間彎曲距離相結(jié)合,文獻(xiàn)[24]基于推土機(jī)距離(EMD)衡量了負(fù)荷曲線的縱向隨機(jī)性。然而,隨著電力市場的逐步開放以及大量可再生能源的接入,令用戶擁有了更大的用電自由,增大了負(fù)荷的隨機(jī)性、波動(dòng)性以及用戶間負(fù)荷特性的差異,導(dǎo)致所采集負(fù)荷數(shù)據(jù)的樣本分布情況愈加復(fù)雜,產(chǎn)生了類簇形狀差異大、分布不均衡的負(fù)荷數(shù)據(jù)集,而傳統(tǒng)聚類算法在這種數(shù)據(jù)集上的聚類效果不佳。此外,面對(duì)不同的負(fù)荷數(shù)據(jù)集,若每一次聚類分析都需要人為調(diào)整某些參數(shù),顯然是不利于實(shí)際應(yīng)用的。針對(duì)上述問題,為得到準(zhǔn)確的聚類結(jié)果,聚類算法需同時(shí)滿足以下兩點(diǎn)要求:1) 能夠適用于任意類簇分布情況;2) 具備自適應(yīng)能力。
文獻(xiàn)[25]提出快速搜索和尋找密度峰值的聚類(Clustering by fast search and find of density peaks, DPC),簡稱密度峰值聚類。由于該算法聚類速度快、能夠快速發(fā)現(xiàn)任意形狀的類簇、魯棒性強(qiáng),已廣泛用于圖像識(shí)別、社區(qū)發(fā)現(xiàn)等領(lǐng)域[26]。目前,已有文獻(xiàn)通過kd樹算法[27]、類間類內(nèi)優(yōu)化[28]、變分模態(tài)分解[29-30]等方法對(duì)DPC算法在負(fù)荷聚類時(shí)運(yùn)算速度慢、不適用于多種用戶類型、聚類精度不佳等缺陷進(jìn)行了改進(jìn),但這些方法均不能同時(shí)滿足上述兩點(diǎn)要求。
鑒于此,本文提出一種ISDPC算法。首先,基于KNN相對(duì)密度的思想提出了一種新的密度度量方式;然后通過在決策圖中擬合分段函數(shù)確定最優(yōu)類簇?cái)?shù)目;最后構(gòu)造出加權(quán)KNN圖,兼顧樣本間的屬性相似性和結(jié)構(gòu)相似性,并基于圖的距離衡量樣本與類簇中心的相似度,改進(jìn)樣本分配策略。算例分析結(jié)果表明,與傳統(tǒng)聚類算法相比,本文所提方法聚類結(jié)果更加精確,適用于不同分布情況的負(fù)荷數(shù)據(jù)集,魯棒性更強(qiáng),且具備自適應(yīng)能力。
DPC算法有兩點(diǎn)基本假設(shè):(1) 每個(gè)類簇中心的局部密度高于周圍相鄰點(diǎn)的密度;(2) 類簇中心之間的距離較遠(yuǎn)。
1) 局部密度
截?cái)嗪擞?jì)算方式為
高斯核計(jì)算方式為
2) 最小距離
3) 決策圖
4) 樣本分配策略
選出類簇中心后再對(duì)剩余樣本點(diǎn)進(jìn)行分配,DPC算法的分配策略為:按局部密度下降的順序,將剩余樣本點(diǎn)依次分配到比其局部密度更高且距離最近的樣本點(diǎn)所屬類簇之中。
傳統(tǒng)的DPC算法應(yīng)用于類簇分布情況復(fù)雜的日負(fù)荷曲線聚類存在以下缺陷:
1) DPC算法定義的局部密度并未考慮數(shù)據(jù)內(nèi)部的結(jié)構(gòu)差異,當(dāng)類簇之間的密度差異過大時(shí),通過固定的截?cái)嗑嚯x所計(jì)算出的局部密度不能真實(shí)地反映樣本點(diǎn)的疏密情況。如圖1所示,無論截?cái)嗑嚯x如何取值,所有綠色樣本點(diǎn)的局部密度均全大于藍(lán)色樣本點(diǎn)。由于決策值由局部密度和最小距離的乘積決定,當(dāng)樣本間的局部密度差異過大時(shí),會(huì)對(duì)類簇中心的確定造成影響。
2) 類簇中心需要通過決策圖人為確定。
3) 若因數(shù)據(jù)樣本分布不均勻或存在流型結(jié)構(gòu),導(dǎo)致某些類簇邊緣點(diǎn)相距其他類簇較近時(shí),DPC算法的分配策略會(huì)造成樣本的錯(cuò)誤分配,并且一旦某個(gè)樣本點(diǎn)分配錯(cuò)誤,后續(xù)分配還會(huì)進(jìn)一步放大這一錯(cuò)誤。如圖1所示,點(diǎn)與點(diǎn)的距離最為接近且局部密度小于點(diǎn),根據(jù)樣本分配策略則點(diǎn)與點(diǎn)屬于同一類簇。
圖1 樣本分布圖
針對(duì)DPC算法在日負(fù)荷曲線聚類時(shí)的缺陷,本文提出一種改進(jìn)自適應(yīng)密度峰值聚類(ISDPC)算法。
為使DPC算法不再需要人為設(shè)置截?cái)嗑嚯x,且適用于類簇密度差距較大的數(shù)據(jù)樣本,基于KNN和相對(duì)密度的思想重新定義了局部密度的計(jì)算方法。
定義2(自然穩(wěn)定狀態(tài)):在自然鄰居搜索過程中,若每個(gè)數(shù)據(jù)點(diǎn)都有逆近鄰或者當(dāng)所有逆近鄰個(gè)數(shù)為0的數(shù)據(jù)不變時(shí),自然鄰居搜索達(dá)到自然穩(wěn)定狀態(tài)。
自然最近鄰算法步驟如下:
圖2 決策值擬合
類簇中心自動(dòng)選擇方法步驟如下:
基于KNN圖的分配策略主要分為3步:構(gòu)建加權(quán)KNN圖、計(jì)算最短路徑以及樣本分配。
然后,通過Dijkstra算法計(jì)算在加權(quán)KNN圖中各類簇中心到其余節(jié)點(diǎn)的最短路徑,得到最短路徑矩陣,如式(9)所示。路徑越短,節(jié)點(diǎn)就與類簇中心越相似。
最后,按照式(10)將非類簇中心點(diǎn)分配到所屬類簇。
本文所提出的ISDPC聚類算法整體流程如圖3所示。
圖3 ISDPC算法流程圖
具體步驟如下。
1) 數(shù)據(jù)預(yù)處理:電力系統(tǒng)在實(shí)際運(yùn)行中,由于測量和信道的誤差及系統(tǒng)各種故障及沖擊負(fù)荷的影響,導(dǎo)致負(fù)荷數(shù)據(jù)中會(huì)存在缺失、噪聲等問題[31]。因此,有必要對(duì)負(fù)荷數(shù)據(jù)進(jìn)行預(yù)處理,包括缺失值填補(bǔ)、曲線平滑濾波、數(shù)據(jù)歸一化處理。
4) 通過類簇中心自動(dòng)選擇方法,選出類簇中心。
5) 根據(jù)基于加權(quán)KNN圖的樣本分配策略對(duì)剩余樣本點(diǎn)進(jìn)行分配。
聚類評(píng)價(jià)指標(biāo)分為外部和內(nèi)部評(píng)價(jià)指標(biāo)[32-33],二者的主要區(qū)別在于外部評(píng)價(jià)指標(biāo)需要與依靠聚類結(jié)果相關(guān)的外部信息來評(píng)價(jià)聚類的準(zhǔn)確性,而內(nèi)部評(píng)價(jià)指標(biāo)通過計(jì)算所劃分類簇的類內(nèi)緊湊度和類間分離度來衡量聚類效果的優(yōu)劣。由于實(shí)際日負(fù)荷曲線的聚類分析往往是缺少外部結(jié)果信息的,故本文以輪廓系數(shù)(Silhouette Coefficient, SC)和戴維森指數(shù)(Davies-Bouldin index, DBI) 2個(gè)內(nèi)部評(píng)價(jià)指標(biāo)評(píng)價(jià)各類聚類算法的聚類效果。
定義為
為驗(yàn)證本文所提出的方法在用戶負(fù)荷曲線聚類中的有效性,本節(jié)基于真實(shí)負(fù)荷數(shù)據(jù)和模擬負(fù)荷數(shù)據(jù)兩個(gè)數(shù)據(jù)集,采用本文方法和傳統(tǒng)聚類方法進(jìn)行聚類分析并比較聚類結(jié)果。
實(shí)驗(yàn)環(huán)境:Intel(R) Core(TM) i5-4460 CPU@ 3.20 GHz,8.00 GB RAM,編程語言為Python 3.6。
4.1.1真實(shí)負(fù)荷數(shù)據(jù)聚類效果
真實(shí)負(fù)荷數(shù)據(jù)集來自美國能源部OpenEI公布的工商業(yè)用戶負(fù)荷數(shù)據(jù),共2 260條工作日負(fù)荷曲線,每小時(shí)采集一次,每日共計(jì)24個(gè)采樣點(diǎn)。
為直觀地呈現(xiàn)數(shù)據(jù)樣本的分布情況,通過多維尺度變換(Multiple Dimensional Scalling, MDS)將數(shù)據(jù)樣本從高維映射到二維平面。真實(shí)負(fù)荷數(shù)據(jù)集的二維分布如圖4所示,該數(shù)據(jù)集中的類簇形狀多為球形,類簇形狀差異不大。
ISDPC算法聚類結(jié)果如圖5所示,將用戶負(fù)荷曲線劃分為7類,可歸為單峰、雙峰、三峰、避峰4型。類別3、4為單峰型負(fù)荷,主要包含學(xué)校、零售業(yè)、醫(yī)院等行業(yè)用戶,用電集中在白天。類別3的用戶呈現(xiàn)日間長時(shí)段高峰用電特性,用電時(shí)間為06:00左右到20:00;類別4的用戶在白天用電時(shí)長略短于類別3,且午間休息時(shí)段的用電量略有下降。類別1、2、5為雙峰型負(fù)荷,主要包含居民、酒店住宿等行業(yè)用戶,具有早高峰和晚高峰用電特性。類別5用戶早高峰時(shí)段用電量高于晚高峰用電量;類別1、2用戶早晚高峰時(shí)段用電量接近,但是類別2用戶午間用電量極低,具有明顯的午休現(xiàn)象。類別6屬于三峰型負(fù)荷,可能是餐飲行業(yè)用戶,在早中晚時(shí)段均存在高峰用電現(xiàn)象,在上午工作時(shí)段和午間休息時(shí)段用電有所下降,凌晨時(shí)段用電量大幅下降。類別7為避峰型負(fù)荷,可能是高能耗企業(yè)用戶,為了降低用電成本,選擇在夜間進(jìn)行生產(chǎn)任務(wù),呈現(xiàn)夜間用電特性。
圖4 真實(shí)負(fù)荷數(shù)據(jù)集的二維映射
圖5 ISDPC算法對(duì)真實(shí)負(fù)荷數(shù)據(jù)集的聚類結(jié)果
表1 不同截?cái)嗑嚯x下DPC算法聚類效果
圖6 DPC算法決策圖
圖7 DPC算法在真實(shí)負(fù)荷數(shù)據(jù)集中的聚類結(jié)果
表2為四種算法的聚類效果對(duì)比,對(duì)于分布均勻、類簇形狀相差不大的負(fù)荷數(shù)據(jù)集而言,四種算法均有較好的聚類效果,且ISDPC和k-means算法的聚類效果略優(yōu)于另外兩種算法。
4.1.2 模擬負(fù)荷數(shù)據(jù)聚類效果
模擬負(fù)荷數(shù)據(jù)集是以7類典型日負(fù)荷曲線為基礎(chǔ),通過添加的噪聲所形成的負(fù)荷數(shù)據(jù)集。對(duì)每個(gè)類簇設(shè)置不同比例的擾動(dòng)和樣本數(shù)量得到類簇分布不均衡的模擬負(fù)荷數(shù)據(jù)集,其二維分布如圖8所示。
表2 不同算法在真實(shí)負(fù)荷數(shù)據(jù)集下的聚類效果對(duì)比
圖8 模擬負(fù)荷數(shù)據(jù)集的二維映射
四種算法的聚類效果如表3所示,對(duì)于不均衡負(fù)荷樣本的聚類分析,DPC、k-means、FCM算法的效果均不理想,只有ISDPC算法能夠準(zhǔn)確劃分各個(gè)類簇,圖9為在模擬負(fù)荷數(shù)據(jù)集中ISDPC算法所得決策圖和結(jié)果分布圖。DPC算法在不斷調(diào)整截?cái)嗑嚯x參數(shù)的過程中始終無法得到較好的聚類結(jié)果,出現(xiàn)了以下兩種情形:當(dāng)截?cái)嗑嚯x較小時(shí),發(fā)現(xiàn)的密度峰值點(diǎn)(類簇中心)遠(yuǎn)超過真實(shí)數(shù)量,如圖10(a);當(dāng)截?cái)嗑嚯x較大時(shí),僅有2個(gè)密度峰值點(diǎn),如圖10(b)。由此可見,當(dāng)負(fù)荷數(shù)據(jù)集的類簇分布不均衡時(shí),通過固定的截?cái)嗑嚯x無法準(zhǔn)確識(shí)別類簇中心;而本文通過改進(jìn)DPC算法的局部密度計(jì)算方式,在不設(shè)置任何參數(shù)的情況下仍然能夠準(zhǔn)確識(shí)別類簇中心。
表3 不同算法在模擬負(fù)荷數(shù)據(jù)集下的聚類效果對(duì)比
4.2.1算法魯棒性檢驗(yàn)
表4 算法魯棒性對(duì)比
4.2.2算法速度比較
在不同規(guī)模的模擬負(fù)荷數(shù)據(jù)集下分別執(zhí)行本文方法、DPC算法、k-means算法和FCM算法,比較各自的運(yùn)行時(shí)間。如圖11所示,由于引入了KNN和圖計(jì)算,故本文方法的速度慢于DPC算法;其次,本文方法在樣本數(shù)量小于40 000時(shí)運(yùn)行速度略快于k-means算法,之后比k-means算法慢,但始終遠(yuǎn)勝于FCM算法。
圖11 算法效率比較
針對(duì)當(dāng)前的負(fù)荷數(shù)據(jù)集存在類簇形狀多樣、分布不均衡等問題,本文提出一種改進(jìn)自適應(yīng)密度峰值聚類算法。算例結(jié)果表明:1) 在不同分布情況的數(shù)據(jù)集中,本文方法均能夠準(zhǔn)確劃分出各個(gè)類簇,且具備自適應(yīng)能力。2) 相較于傳統(tǒng)聚類算法,本文方法在聚類效果、魯棒性、運(yùn)算速度等方面均表現(xiàn)出顯著的優(yōu)越性。綜上所述,本文方法能夠較好地輔助售電公司分析電力用戶的用電特性,不需要人為更改任何參數(shù)就能夠應(yīng)用于不同的負(fù)荷數(shù)據(jù)樣本。
但是本文方法的運(yùn)算時(shí)間隨著樣本數(shù)量的增加呈現(xiàn)指數(shù)增長趨勢。因此,如何在保證聚類效果不改變的情況下提高算法速度,使其適用于大數(shù)據(jù),是接下來的研究內(nèi)容。
[1] DINESH C, MAKONIN S, BAJI? I V. Residential power forecasting using load identification and graph spectral clustering[J]. IEEE Transactions on Circuits and Systems II: Express Briefs, 2019, 66(11): 1900-1904.
[2] SHANG C, GAO J, LIU H, et al. Short-term load forecasting based on PSO-KFCM daily load curve clustering and CNN-LSTM model[J]. IEEE Access, 2021, 9: 50344-50357.
[3] 劉達(dá), 雷自強(qiáng), 孫堃. 基于小波包分解和長短期記憶網(wǎng)絡(luò)的短期電價(jià)預(yù)測[J]. 智慧電力, 2020, 48(4): 77-83.
LIU Da, LEI Ziqiang, SUN Kun. Short-term electricity price forecasting based on wavelet packet decomposition & long-term and short-term memory networks[J]. Smart Power, 2020, 48(4): 77-83.
[4] LIN S, LI F, TIAN E, et al. Clustering load profiles for demand response applications[J]. IEEE Transactions on Smart Grid, 2019, 10(2): 1599-1607.
[5] 劉鑫, 吳紅斌, 王鯨杰, 等. 市場環(huán)境下考慮需求響應(yīng)的虛擬電廠經(jīng)濟(jì)調(diào)度[J]. 中國電力, 2020, 53(9): 172-180.
LIU Xin, WU Hongbin, WANG Jingjie, et al. Economic dispatch of a virtual power plant considering demand response in electricity market environment[J]. Electric Power, 2020, 53(9): 172-180.
[6] JIA M, WANG Y, SHEN C, et al. Privacy-preserving distributed clustering for electrical load profiling[J]. IEEE Transactions on Smart Grid, 2021, 12(2): 1429-1444.
[7] 賈雪楓, 李存斌. 考慮短期負(fù)荷影響的DeepESN電力市場實(shí)時(shí)電價(jià)預(yù)測研究[J]. 智慧電力, 2021, 49(1): 64-70.
JIA Xuefeng, LI Cunbin. Real-time electricity price forecasting of electricity market using deepesn considering short-term load impact[J]. Smart Power, 2021, 49(1): 64-70.
[8] 王繼業(yè), 季知祥, 史夢潔, 等. 智能配用電大數(shù)據(jù)需求分析與應(yīng)用研究[J]. 中國電機(jī)工程學(xué)報(bào), 2015, 35(8): 1829-1836.
WANG Jiye, JI Zhixiang, SHI Mengjie, et al. Scenario analysis and application research on big data in smart power distribution and consumption systems[J]. Proceedings of the CSEE, 2015, 35(8): 1829-1836.
[9] 夏成文, 許凱帥, 鮑玉昆, 等. 基于單值聚類分析的區(qū)域居民概率負(fù)荷預(yù)測研究[J]. 電力信息與通信技術(shù), 2021, 19(1): 1-10.
XIA Chengwen, XU Kaishuai, BAO Yukun, et al. Research on probabilistic load forecasting for regional residential users based on single value cluster analysis[J]. Electric Power Information and Communication Technology, 2021, 19(1): 1-10.
[10]張鐵峰, 顧明迪. 電力用戶負(fù)荷模式提取技術(shù)及應(yīng)用綜述[J]. 電網(wǎng)技術(shù), 2016, 40(3): 804-811.
ZHANG Tiefeng, GU Mingdi. Overview of electricity customer load pattern extraction technology and its application[J]. Power System Technology, 2016, 40(3): 804-811.
[11] 靳冰潔, 林勇, 羅澍忻, 等. 基于負(fù)荷特性聚類及Elastic Net分析的短期負(fù)荷預(yù)測方法[J]. 中國電力, 2020, 53(9): 221-228.
JIN Bingjie, LIN Yong, LUO Shuxin, et al. A short-term load forecasting method based on load curve clustering and elastic net analysis[J]. Electric Power, 2020, 53(9): 221-228.
[12]劉季昂, 劉友波, 程明暢, 等. 基于分位數(shù)半徑動(dòng)態(tài)K-means的分布式負(fù)荷聚類算法[J]. 電力系統(tǒng)保護(hù)與控制, 2019, 47(24): 15-22.
LIU Ji’ang, LIU Youbo, CHENG Mingchang, et al. Distributed load clustering algorithm based on dynamic K-means of quantile radius[J]. Power System Protection and Control, 2019, 47(24): 15-22.
[13]吳亞雄, 高崇, 曹華珍, 等. 基于灰狼優(yōu)化聚類算法的日負(fù)荷曲線聚類分析[J]. 電力系統(tǒng)保護(hù)與控制, 2020, 48(6): 68-76.
WU Yaxiong, GAO Chong, CAO Huazhen, et al. Clustering analysis of daily load curves based on GWO algorithm[J]. Power System Protection and Control, 2020, 48(6): 68-76.
[14] 汪繁榮, 向堃, 劉輝. 基于改進(jìn)AP聚類與優(yōu)化GRNN的非侵入式負(fù)荷分解研究[J]. 工程科學(xué)與技術(shù), 2020, 52(4): 56-65.
WANG Fanrong, XIANG Kun, LIU Hui. Research on non-intrusive load decomposition based on improved AP clustering and optimized GRNN[J]. Advanced Engineering Sciences, 2020, 52(4): 56-65.
[15] 陳燁, 吳浩, 史俊祎, 等. 奇異值分解方法在日負(fù)荷曲線降維聚類分析中的應(yīng)用[J]. 電力系統(tǒng)自動(dòng)化, 2018, 42(3): 105-111.
CHEN Ye, WU Hao, SHI Junyi, et al. Application of singular value decomposition algorithm to dimension reduced clustering analysis of daily load profiles[J]. Automation of Electric Power Systems, 2018, 42(3): 105-111.
[16] 梁京章, 黃星舒, 吳麗娟, 等. 基于KPCA和改進(jìn)K-means的電力負(fù)荷曲線聚類方法[J]. 華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版), 2020, 48(6): 143-150.
LIANG Jingzhang, HUANG Xingshu, WU Lijuan, et al. Clustering method of power load profiles based on KPCA and improved K-means[J]. Journal of South China University of Technology (Natural Science Edition), 2020, 48(6): 143-150.
[17] 黃景林, 彭顯剛, 簡勝超, 等. 基于深度學(xué)習(xí)與不平衡樣本集的輸電線路故障分類[J]. 智慧電力, 2021, 49(2): 114-119.
HUANG Jinglin, PENG Xiangang, JIAN Shengchao, et al. Transmission line fault classification based on deep learning and imbalanced sample set[J]. Smart Power, 2021, 49(2): 114-119.
[18] JIANG Z, LIN R, YANG F, et al. A fused load curve clustering algorithm based on wavelet transform[J]. IEEE Transactions on Industrial Informatics, 2018, 14(5): 1856-1865.
[19] 曹華珍, 吳亞雄, 李浩, 等. 基于海量數(shù)據(jù)的多維度負(fù)荷特性分析系統(tǒng)開發(fā)[J]. 電力系統(tǒng)保護(hù)與控制, 2021, 49(6): 155-166.
CAO Huazhen, WU Yaxiong, LI Hao, et al. Development of a multi-dimensional load characteristic analysis system based on massive data[J]. Power System Protection and Control, 2021, 49(6): 155-166.
[20] WANG Y, CHEN Q, KANG C, et al. Sparse and redundant representations-based smart meter data compression and pattern extraction[J]. IEEE Transactions on Power Systems, 2016, 32(3): 2142-2151.
[21] RYU S, CHOI H, LEE H, et al. Convolutional autoencoder based feature extraction and clustering for customer load analysis[J]. IEEE Transactions on Power Systems, 2019, 35(2): 1048-1060.
[22] 唐俊熙, 曹華珍, 高崇, 等. 一種基于時(shí)間序列數(shù)據(jù)挖掘的用戶負(fù)荷曲線分析方法[J]. 電力系統(tǒng)保護(hù)與控制, 2021, 49(5): 140-148.
TANG Junxi, CAO Huazhen, GAO Chong, et al. A new user load curve analysis method based on time series data mining[J]. Power System Protection and Control, 2021, 49(5): 140-148.
[23] 宋軍英, 崔益?zhèn)? 李欣然, 等. 基于歐氏動(dòng)態(tài)時(shí)間彎曲距離與熵權(quán)法的負(fù)荷曲線聚類方法[J]. 電力系統(tǒng)自動(dòng)化, 2020, 44(15): 87-94.
SONG Junying, CUI Yiwei, LI Xinran, et al. Load curve clustering method based on Euclidean-dynamic time warping distance and entropy weight method[J]. Automation of Electric Power Systems, 2020, 44(15): 87-94.
[24] 馮志穎, 唐文虎, 吳青華, 等. 考慮負(fù)荷縱向隨機(jī)性的用戶用電行為聚類方法[J]. 電力自動(dòng)化設(shè)備, 2018, 38(9): 39-44, 53.
FENG Zhiying, TANG Wenhu, WU Qinghua, et al. Clustering method of user electricity behavior considering load longitudinal randomness[J]. Electric Power Automation Equipment, 2018, 38(9): 39-44, 53.
[25] RODRIGUEZ A, LAIO A. Clustering by fast search and find of density peaks[J]. Science, 2014, 344(6191): 1492.
[26] 陳葉旺, 申蓮蓮, 鐘才明, 等. 密度峰值聚類算法綜述[J]. 計(jì)算機(jī)研究與發(fā)展, 2020, 57(2): 378-394.
CHEN Yewang, SHEN Lianlian, ZHONG Caiming, et al. Survey on density peak clustering algorithm[J]. Journal of Computer Research and Development, 2020, 57(2): 378-394.
[27] 陳俊藝, 丁堅(jiān)勇, 田世明, 等. 基于改進(jìn)快速密度峰值算法的電力負(fù)荷曲線聚類分析[J]. 電力系統(tǒng)保護(hù)與控制, 2018, 46(20): 85-93.
CHEN Junyi, DING Jianyong, TIAN Shiming, et al. An improved density peaks clustering algorithm for power load profiles clustering analysis[J]. Power System Protection and Control, 2018, 46(20): 85-93.
[28] 王帥, 杜欣慧, 姚宏民, 等. 面向含多種用戶類型的負(fù)荷曲線聚類研究[J]. 電網(wǎng)技術(shù), 2018, 42(10): 3401-3412.
WANG Shuai, DU Xinhui, YAO Hongmin, et al. Research on load curve clustering with multiple user types[J]. Power System Technology, 2018, 42(10): 3401-3412.
[29] 谷紫文, 李鵬, 郎恂, 等. 基于變分模態(tài)分解和密度峰值快速搜索的電力負(fù)荷曲線可控聚類模型[J]. 電力系統(tǒng)保護(hù)與控制, 2021, 49(8): 118-127.
GU Ziwen, LI Peng, LANG Xun, et al. A controllable clustering model of the electrical load curve based on variational mode decomposition and fast search of the density peak[J]. Power System Protection and Control, 2021, 49(8): 118-127.
[30] 劉君, 余思伍, 陳沛龍, 等. 基于聚類分析的變壓器有載分接開關(guān)儲(chǔ)能彈簧故障識(shí)別[J]. 高壓電器, 2020, 56(7): 159-165, 172.
LIU Jun, YU Siwu, CHEN Peilong, et al. Fault recognition for on-load tap changer storage spring of power transformer by clustering analysis algorithm[J]. High Voltage Apparatus, 2020, 56(7): 159-165, 172.
[31] HUANG L, YANG Y, ZHAO H, et al. Time series modeling and filtering method of electric power load stochastic noise[J]. Protection and Control of Modern Power Systems, 2017, 2(3): 269-275.
[32] GUO G, CHEN L, YE Y, et al. Cluster validation method for determining the number of clusters in categorical sequences[J]. IEEE Transactions on Neural Networks and Learning Systems, 2017, 28(12): 2936-2948.
[33]徐杰彥, 許雯旸, 褚淵, 等. 區(qū)域尺度住宅建筑日用電負(fù)荷模型構(gòu)建方法研究[J]. 中國電力, 2020, 53(8): 29-39.
XU Jieyan, XU Wenyang, CHU Yuan, et al. Residential electricity load model construction in district scale[J]. Electric Power, 2020, 53(8): 29-39.
Cluster analysis of daily load curves based on an improved self-adaptive density peak clustering algorithm
YAO Huangjin, LEI Xia, FU Xinquan, HU Yi
(College of Electrical and Electronic Information, Xihua University, Chengdu 610039, China)
The opening electricity market and the incremental penetration of renewable energy provide more consumption choices for users. This results in diversification of power user patterns, increasing differences of load characteristics and giving a complex distribution of load clusters. An improved self-adaptive density peak clustering (ISDPC) algorithm is proposed to ameliorate the clustering results and adaptive abilities of traditional clustering methods for unbalanced load data. First, a new density metric is defined based on the K-nearest neighbor (KNN) and relative density. Secondly, the optimal number of clusters is obtained by a fitting partition function obtained from the decision graph. Finally, the allocation of strategy is improved by a weighted KNN graph. The experimental results show that clustering results obtained from the proposed method perform better in accuracy, robustness, and adaptability.
load profiles clustering; density peak clustering; self-adaptation; KNN; robustnes
10.19783/j.cnki.pspc.210364
This work is supported by the National Natural Science Foundation of China (No. 51877181).
國家自然科學(xué)基金項(xiàng)目資助(51877181)
2021-04-06;
2021-07-01
姚黃金(1996—),男,碩士研究生,研究方向?yàn)樨?fù)荷畫像;E-mail: yaohuangjin@qq.com
雷 霞(1973—),女,通信作者,博士,教授,研究方向?yàn)殡娏κ袌?、電網(wǎng)規(guī)劃和調(diào)度、電網(wǎng)彈性;E-mail: Snow_lei@mail.xhu.edu.cn
付鑫權(quán)(1997—),男,碩士研究生,研究方向?yàn)樨?fù)荷預(yù)測。E-mail: 745034344@qq.com
(編輯 周金梅)