趙岳恒,劉民偉,王文飛,支剛,萬(wàn)航羽,陳宇,趙爽,胡凱,劉娟
采用有效地手段從大量的風(fēng)電出力場(chǎng)景中挑選出典型的風(fēng)電出力場(chǎng)景,可以減少原始場(chǎng)景數(shù)量,以較小的工作量和較高的精度表征風(fēng)電出力的全時(shí)空特性[1-3]??v觀現(xiàn)有的相關(guān)研究,主要包含2 種思路,一是通過(guò)對(duì)歷史的實(shí)際風(fēng)電出力數(shù)據(jù)進(jìn)行概率統(tǒng)計(jì)分析,得到風(fēng)電未來(lái)的出力場(chǎng)景;另一種是將風(fēng)電典型出力場(chǎng)景選取轉(zhuǎn)化為一個(gè)聚類的問(wèn)題,結(jié)合歷史的風(fēng)電出力數(shù)據(jù)和無(wú)監(jiān)督分類模型選取出最具有代表性的出力場(chǎng)景。
聚類分析是一種非常重要的數(shù)據(jù)挖掘工具,廣泛應(yīng)用于圖像處理、入侵檢測(cè)和電力系統(tǒng)負(fù)荷預(yù)測(cè)等諸多領(lǐng)域[4-9],取得了較好的分析效果。如文獻(xiàn)[7] 提出了一種基于K 均值聚類的風(fēng)電樣本場(chǎng)景生成方法,并將其應(yīng)用到無(wú)功優(yōu)化當(dāng)中。文獻(xiàn)[8]利用類內(nèi)、類間距離提出一種改進(jìn)的聚類算法,并應(yīng)用到圖像處理當(dāng)中,效果較好。文獻(xiàn)[9]將分層聚類算法應(yīng)用到風(fēng)電場(chǎng)景選取應(yīng)用當(dāng)中,相關(guān)實(shí)驗(yàn)證明了方法是有效的。譜聚類(SC)[10]是一種廣泛使用的聚類算法,相比于K 均值和分層聚類算法,SC 算法對(duì)數(shù)據(jù)分布具有更強(qiáng)的適應(yīng)性,效果往往也更加出色,同時(shí)算法的計(jì)算復(fù)雜度也要低很多,本文嘗試采用SC 算法對(duì)云南某地區(qū)大規(guī)模的風(fēng)電進(jìn)行分析,選取出最能代表該地區(qū)風(fēng)電出力特性的典型出力場(chǎng)景。
SC 算法是一種基于圖論的方法,將一個(gè)聚類的問(wèn)題轉(zhuǎn)化成圖像分割的問(wèn)題,由相似度把這些頂點(diǎn)連接在一起,然后進(jìn)行分割,把分割后依然連接在一起的頂點(diǎn)判定為同一個(gè)類別,此即SC 算法的核心思路。SC 聚類示意見(jiàn)圖1。
圖1 SC算法聚類示意圖
基于SC 算法的風(fēng)電日出力場(chǎng)景聚類算法的具體步驟如下:
1)假設(shè)第i(i=1,2,...,N) 天的風(fēng)電出力樣本表示為Xi=[xi1,xi2,...xin],進(jìn)一步可得到整個(gè)N 天的風(fēng)電處理樣本集為:
根據(jù)以上樣本矩陣即可構(gòu)建鄰接矩陣W,其矩陣元素為:
式中參數(shù)σ為高斯距離里面的方差,本文算法中取值為0.9。
2)計(jì)算拉普拉斯矩陣L=D-1/2WD,其中D表示對(duì)角陣,元素取值為:
然后計(jì)算Laplacian 矩陣L的前k個(gè)最大特征值和特征向量Vi,由特征向量構(gòu)造子空間矩陣U,即
3)將矩陣U的每一行進(jìn)行歸一化后即可得到矩陣Y,其元素為:
4)最后對(duì)矩陣Y中的每一行表示的數(shù)據(jù)樣本點(diǎn)采用K均值算法進(jìn)行聚類分析,若Y中的第i行被分類到第k類,那么相應(yīng)的原始數(shù)據(jù)樣本集X中的元素xi也就可以劃分到第k簇。
為驗(yàn)證前述所提的風(fēng)電日出力場(chǎng)景聚類方法的正確性及有效性,本文以云南某地區(qū)2017年風(fēng)電場(chǎng)實(shí)際出力數(shù)據(jù)為案例進(jìn)行分析。截至2017 年底,此地區(qū)風(fēng)電場(chǎng)共計(jì)19 個(gè),裝機(jī)總?cè)萘?089 MW。該地區(qū)風(fēng)電場(chǎng)運(yùn)行數(shù)據(jù)檢測(cè)設(shè)備所能采集的數(shù)據(jù)為每15 分鐘一個(gè)有功出力數(shù)據(jù),全年有4×24×365=35 040 個(gè)采樣數(shù)據(jù)點(diǎn)。
參照現(xiàn)有的風(fēng)電出力特性研究方法,本文采用月平均和月最大出力曲線定量地評(píng)估該地區(qū)風(fēng)電的特性,分別如圖2、3 所示。
圖2 地區(qū)風(fēng)電場(chǎng)月平均出力曲線
圖3 地區(qū)風(fēng)電場(chǎng)月最大出力曲線
從上圖可以看出,地區(qū)風(fēng)電場(chǎng)枯期最大出力基本能夠達(dá)到裝機(jī)的75%以上,豐期出力較小。地區(qū)風(fēng)電場(chǎng)出力整體呈現(xiàn)枯期大、豐期小的特點(diǎn)。
從地區(qū)風(fēng)電出力特性的分析可知,該地區(qū)風(fēng)電場(chǎng)月平均出力特性呈現(xiàn)枯期出力大,豐期出力小的特點(diǎn)??紤]到篇幅限制,本文算例只選取了該地區(qū)冬季3 個(gè)月的實(shí)際風(fēng)電出力數(shù)據(jù)進(jìn)行場(chǎng)景聚類分析。
根據(jù)所提的場(chǎng)景聚類方法和實(shí)際出力數(shù)據(jù),本文采用M atlab 軟件編程實(shí)現(xiàn)樣本數(shù)據(jù)的歸一化處理,并對(duì)該地區(qū)冬季風(fēng)電出力場(chǎng)景進(jìn)行聚類分析。為直觀的表示風(fēng)電出力原始數(shù)據(jù)樣本集X90×96中樣本的分布情況,本文提出采用PCA降維算法將高維空間中的X90×96樣本矩陣映射到2 維空間進(jìn)行可視化展示,如圖4 所示,圖上每個(gè)“*”點(diǎn)代表一個(gè)實(shí)際風(fēng)電出力樣本。
圖4 風(fēng)電出力樣本集2維可視化結(jié)果
為了確定算法最優(yōu)聚類數(shù)k的取值,采用類內(nèi)平均距離與類間平均距離的比值J來(lái)描述類間樣本的差異性[8],以此作為聚類數(shù)的判定依據(jù)。其中:
圖5 為J值隨聚類數(shù)k的變化關(guān)系。J越小,說(shuō)明類內(nèi)平均距離越小,類簇聚集程度更加緊密,類間平均距離越大,說(shuō)明類簇間的差異程度更大,聚類效果越好。
從圖5 可知,當(dāng)k增加到7 時(shí),樣本集被緊湊的劃分到各自的聚類簇當(dāng)中,聚類效果較好;當(dāng)聚類數(shù)k大于7 時(shí),聚類數(shù)的增加對(duì)J 值的影響逐漸減小,表明當(dāng)k等于7 時(shí),聚類數(shù)已經(jīng)能夠有效地區(qū)分樣本間的差異性,而過(guò)多的聚類數(shù)會(huì)造成不同類間樣本差異性較小,使選取的典型場(chǎng)景不具有強(qiáng)代表性,同時(shí)也會(huì)增加實(shí)際工程計(jì)算量。
圖5 聚類數(shù)k與J的關(guān)系
因此,地區(qū)風(fēng)電出力場(chǎng)景聚類中最優(yōu)聚類數(shù)取7,聚類結(jié)果如圖6 所示。其中圖6 中(a)~(f)分別表示k-means 算法聚類結(jié)果、鄰接矩陣W、拉普拉斯矩陣L、子空間矩陣U、標(biāo)準(zhǔn)化后的子空間矩陣U 和譜聚類后的結(jié)果。
圖6 風(fēng)電出力場(chǎng)景聚類結(jié)果
另外,根據(jù)以上風(fēng)電出力場(chǎng)景聚類結(jié)果,圖7 給出了樣本集劃分到各簇的概率。
圖7 風(fēng)電出力場(chǎng)景聚類概率分布
從上圖可看出,算例樣本集最大概率被劃分到Cluster 1 當(dāng)中,說(shuō)明該簇樣本具有很大地特性相關(guān)性,在場(chǎng)景選取的時(shí)候?qū)⒅攸c(diǎn)考慮從簇1 中挑選出典型場(chǎng)景。
根據(jù)風(fēng)電原始場(chǎng)景聚類結(jié)果,通過(guò)有效地方法確定該地區(qū)典型的風(fēng)電日出力場(chǎng)景具有重要的意義。首先,風(fēng)電的反調(diào)峰特性會(huì)加劇電網(wǎng)調(diào)峰的壓力,風(fēng)電典型出力曲線應(yīng)能很好地反映風(fēng)電的調(diào)峰效益。其次,為保證各類場(chǎng)景典型風(fēng)電出力曲線在系統(tǒng)電量平衡分析中的準(zhǔn)確性,其必須能夠正確反映原發(fā)電曲線的電量特性,即與原發(fā)電曲線的期望發(fā)電量保持一致。
由上述風(fēng)電出力場(chǎng)景聚類的結(jié)果可知,簇1聚類了樣本總數(shù)的大多數(shù),比例最高,故可以在簇1 的風(fēng)電日出力樣本中選取出地區(qū)風(fēng)電出力典型場(chǎng)景。簇1 中的樣本出力特性曲線如圖8所示。
圖8 簇1中風(fēng)電日出力典型場(chǎng)景
當(dāng)風(fēng)電出力峰谷差最大時(shí),將會(huì)加大電網(wǎng)的調(diào)峰壓力,基于此本文選取簇1 中風(fēng)電日出力峰谷差最大的樣本(深紅色曲線)作為調(diào)峰計(jì)算時(shí)采用的典型風(fēng)電日出力場(chǎng)景。
綜上所述,提出了一種基于譜聚類算法的風(fēng)電日出力典型場(chǎng)景生成方法,并以云南某地區(qū)冬季三個(gè)月的實(shí)際風(fēng)電出力數(shù)據(jù)為算例進(jìn)行出力場(chǎng)景聚類分析,實(shí)驗(yàn)結(jié)果驗(yàn)證了所提方法的有效性,總結(jié)本文得到如下結(jié)論:
1)算法主要研究了如何將大量的風(fēng)電日出力場(chǎng)景行之有效地劃分到不同的類,有利于減少原始風(fēng)電日出力場(chǎng)景數(shù)量,以較小的工作量和較高的精度表征風(fēng)電出力的全時(shí)空特性。
2)實(shí)驗(yàn)驗(yàn)證了SC 算法對(duì)于風(fēng)電出力的樣本聚類是有效且適用的,聚類效果較好。
3)采取何種評(píng)估方法定量地從聚類場(chǎng)景中挑選出最有效的典型出力場(chǎng)景是下一步可以開展的研究。