, , ,
(上海師范大學 信息與機電工程學院,上海 200234)
基于優(yōu)化模糊C均值聚類選取相似日的燃氣負荷預測
邱 靜,徐曉鐘*,鄧松,王婷
(上海師范大學 信息與機電工程學院,上海200234)
針對短期負荷預測方法中傳統(tǒng)的模糊C均值(FCM)聚類容易陷入局部最優(yōu)和對初始聚類中心敏感的問題,提出利用粒子群優(yōu)化(PSO)算法的全局搜索特性來優(yōu)化此缺點.通過優(yōu)化的FCM聚類來選取與預測日相似的日期作為支持向量機的訓練樣本,既強化了訓練樣本的數(shù)據(jù)規(guī)律,又保證數(shù)據(jù)特征的一致性.實驗結(jié)果表明,優(yōu)化預測模型的預測精度優(yōu)于BP神經(jīng)網(wǎng)絡(luò)和支持向量機算法.
短期負荷預測; 相似日; 相似性; 模糊C均值(FCM)聚類; 粒子群優(yōu)化(PSO)算法; 支持向量機(SVM)
提高燃氣負荷的預測精度,既是為了工業(yè)用氣和居民生活用氣得到合理分配和調(diào)度,也是燃氣工業(yè)自身健康發(fā)展的需要.燃氣負荷預測對燃氣工業(yè)乃至整個國民經(jīng)濟的發(fā)展都有著十分重要的意義[1].
目前負荷預測大致可以分為傳統(tǒng)方法和智能方法.用傳統(tǒng)方法所建的模型由于難以表達負荷與其影響因素的非線性關(guān)系,其預測精度難以進一步提高,限制了它在短期負荷預測中的應(yīng)用[2-3].作為智能方法主要代表的人工神經(jīng)網(wǎng)絡(luò),以其強大的自主學習能力、非線性處理能力等特性,較好地克服了傳統(tǒng)方法的缺點[4-5],但在實際運用中還存在著網(wǎng)絡(luò)結(jié)構(gòu)選擇困難,泛化能力較差,易陷入局部極小,收斂慢等缺陷[6-7].支持向量機作為數(shù)據(jù)挖掘的一項新技術(shù),在模式識別、處理回歸問題等方面已得到了成功應(yīng)用,被認為是神經(jīng)網(wǎng)絡(luò)的替代方法[8-9],文獻[10-11]將支持向量機和聚類算法相結(jié)合,以改善支持向量機在短期負荷預測中的應(yīng)用效果.
模糊C均值聚類存在兩個嚴重的缺陷[12]:1) 算法的性能依賴于初始聚類中心的選取,同時聚類的效果受初始值的影響較大;2) 模糊C均值(FCM)聚類算法在迭代尋找最優(yōu)解的過程中使用的是梯度下降的方法,會不可避免地導致陷于局部最優(yōu)值.針對這些問題,本文作者結(jié)合粒子群算法的全局搜索特性優(yōu)化FCM聚類.通過優(yōu)化后的FCM聚類,獲取歷史負荷樣本的最優(yōu)模式分類,再通過模式識別抽取出與預測樣本相似的樣本,作為最優(yōu)訓練樣本集,強化了參與支持向量機(SVM)訓練建模的樣本數(shù)據(jù)規(guī)律性,使訓練樣本都具有相同或相近的輸入、輸出數(shù)學關(guān)系,實現(xiàn)了FCM聚類分析和SVM的有效結(jié)合,同時也改善了SVM算法的預測效果.
設(shè)樣本空間X={x1,x2,…,xn},聚類數(shù)為c,且2≤c (1) FCM算法是通過梯度下降方法尋找最優(yōu)解,即使其目標函數(shù)達到極小值.算法的目標函數(shù)為: ‖xk-zi‖, (2) 式中dik為第k個樣本到第i類的中心距離,zi為第i類的中心.目標函數(shù)具有極小值的必要條件為: (3) 式中l(wèi)是迭代次數(shù),m是加權(quán)指數(shù). FCM聚類算法的迭代步驟如下: 1) 確定聚類數(shù)目c,加權(quán)指數(shù)m,一般m=2;隨機生成聚類中心矩陣Z(0),并令迭代次數(shù)l=0. 2) 利用式(3)分別計算隸屬度矩陣U(l),并修改聚類中心Z(l+1). 由于FCM聚類算法是基于目標函數(shù)的聚類過程,其本質(zhì)上是一種局部尋優(yōu)的求解過程,如果初始化不當,就會導致算法陷入局部收斂達不到全局最優(yōu)解.為此,可以采用粒子群的全局搜索特性優(yōu)化. 2.1粒子群優(yōu)化(PSO)算法 PSO算法是一種基于群體智能的隨機全局優(yōu)化技術(shù),粒子群由許多粒子組成,每個粒子的位置代表優(yōu)化問題在搜索空間中的候選解,粒子的速度決定它們飛行的方向和距離,并且有一個適應(yīng)度函數(shù)來決定每一個粒子在群體中的適應(yīng)度.群體中每一個粒子在迭代過程中,通過跟蹤兩個“最好的位置”來不斷更新自己,一個是粒子本身目前所找到的最好位置pi_best,另一個是目前整個群體中所有粒子發(fā)現(xiàn)的最好位置gbest,更新公式如下: (4) (5) 每個粒子本身最佳位置更新公式為: (6) 所有粒子的全局最佳位置更新公式為: n. (7) 2.2粒子群優(yōu)化FCM聚類算法 由于FCM聚類算法使用梯度下降方法尋找最優(yōu)解,存在對初始值敏感和容易陷入局部最優(yōu)解的缺陷.利用PSO算法的優(yōu)化搜索能力對FCM聚類算法改進,能保證得到問題的全局最優(yōu)解. 2.2.1 粒子編碼 FCM聚類算法的核心就是聚類中心的確定,因此可以選取聚類中心作為種群的個體,一個粒子表示待求解的聚類中心的集合.則每個粒子xi編碼為 xi=(s11,s12,…,s1d,…si1,si2,…,sid,…,sc1,sc2,…,scd), (8) 式中(si1,si2,…,sid)表示第i類的聚類中心,d為樣本的維數(shù). 2.2.2 適應(yīng)度函數(shù) 對FCM聚類,最優(yōu)聚類結(jié)果即是其目標函數(shù)取得最小值對應(yīng)的結(jié)果.由于每一個粒子代表的是一種聚類中心的選取,所以每個粒子適應(yīng)度的大小表明了在這種聚類中心的選取下其聚類效果的好壞.可以把FCM聚類目標函數(shù)的倒數(shù)作為對每個粒子適應(yīng)度的評價: (9) 從式(9)可以知,如果目標函數(shù)Jm越小,則個體適應(yīng)度f(xi)就越大,聚類效果就越好. 2.3基于粒子群優(yōu)化的FCM聚類算法的步驟 步驟1:確定聚類數(shù)目c,群體規(guī)模N,學習因子c1,c2,慣性權(quán)重w范圍,最大迭代次數(shù)itermax. 步驟2:從n個樣本中隨機的選取c個不同的樣本向量作為染色體的初始聚類中心,每個粒子代表各類的聚類中心. 步驟3:根據(jù)式(9)計算初始種群中個體的適應(yīng)度值. 步驟4:根據(jù)式(6)計算粒子當前的位置,并根據(jù)式(5)更新粒子的位置,產(chǎn)生下一代種群. 步驟5:計算種群中個體的適應(yīng)度值,若滿足終止條件,算法結(jié)束,輸出整個搜索空間找到的最小適應(yīng)度值所對應(yīng)的類的聚類中心,并通過FCM算法得到最終劃分結(jié)果;否則返回到步驟4. 圖1 FCM聚類優(yōu)化前后的目標函數(shù)值圖 FCM聚類優(yōu)化前后目標函數(shù)值與迭代次數(shù)的關(guān)系如圖1所示.可以看出粒子群優(yōu)化后的FCM聚類具有更強的全局搜索能力. 3.1相似日 人們在進行短期負荷預測時,發(fā)現(xiàn)如果預測日在氣象狀況、日類型等影響因素上與某歷史日比較相似,則預測日的負荷與該歷史日的負荷也比較接近,通常把該歷史日稱為相似日.在實際運行中,很多負荷預測工作人員就是通過尋找相似日來進行負荷預測的.但該方法過度依賴于工作人員的經(jīng)驗,合理選擇相似日對于提高短期負荷預測的精度非常重要,沒有太多工作經(jīng)驗的預測人員往往無法找到與預測日相似的歷史日,降低預測效果. 3.2特征向量的選取 利用優(yōu)化的FCM聚類算法選取相似日時,首先需確定顯著影響燃氣負荷變化的特征因素:溫度(日平均溫度,日最高溫度,日最低溫度)、星期類型(周一到周日)、天氣類型等. 3.3映射數(shù)據(jù)庫的設(shè)計 由于各個特征因素的量綱各不相同,因此需要把各個物理量作適當?shù)挠成?把不同的量綱映射到特定的區(qū)間,使得各個量之間具有數(shù)值上的可比性.根據(jù)文獻[13]的思想建立符合上海市的映射數(shù)據(jù)庫,如表1所示. 表1 各特征量的映射數(shù)據(jù)表 4.1最小二乘支持向量機算法 對于訓練樣本集T={(xi,yi)|i=1,2,…,l},其中xi∈Rn為輸入向量,yi∈R為相應(yīng)的輸出目標值,l為訓練樣本的個數(shù).SVM先采用非線性映射φ(x):Rm→RM將低維輸入空間映射到高維特征空間,再在高維特征空間進行線性回歸,達到原線性空間非線性回歸的效果.決策線性回歸函數(shù)為: f(x)=wφ(x)+b, (10) 式中w是特征空間中的權(quán)系數(shù)向量,b∈R是常數(shù).SVM采用結(jié)構(gòu)化風險最小化準則來確定參數(shù)w和b,即 (11) 式中Rstr是結(jié)構(gòu)風險,Remp是損失函數(shù), (12) (13) (14) 式中K(xi,xj)=[φ(xi),φ(xj)]為核函數(shù),其作用是不必知道從低維輸入空間到高維特征空間非線性映射φ(x)的具體形式,通過引入核函數(shù)就可得到?jīng)Q策回歸方程. 求解上述問題,可得到支持向量機回歸函數(shù): (15) 4.2樣本輸入量的選擇 本文作者把影響燃氣負荷的特征因子作為輸入向量包括:1) 預測日前K日預測日的負荷數(shù)據(jù)A=[a1,a2,…,ak];2) 預測日的氣象數(shù)據(jù)B=[b1,b2,…,bi],包括最高溫度、最低溫度、平均溫度和天氣類型等;3) 預測日的日屬性D=[d1,d2,…,d7],代表周一至周日. 4.3燃氣負荷預測流程 用基于PSO算法的FCM聚類與SVM算法進行燃氣負荷預測時,先將用于確定預測因子與預測負荷之間非線性關(guān)系的歷史數(shù)據(jù)用基于粒子群算法優(yōu)化的FCM算法聚類,得到最佳聚類中心.通過計算待預測樣本到各個聚類中心的距離,選擇最小距離對應(yīng)的類包含的數(shù)據(jù)找到與待預測樣本的相似日,并將這些相似日作為SVM算法的訓練樣本,從而進行燃氣負荷預測,如圖2所示. 4.4實驗結(jié)果分析 圖3為上海市2011~2014年的燃氣負荷聚類結(jié)果,每一種顏色代表一種類別,共6個類.由圖3可知,不同年中相同的燃氣負荷值都在一個類中,即每一類都代表了相似的燃氣負荷值. 圖2 燃氣負荷預測流程 圖3 上海市2011~2014年的燃氣負荷分類結(jié)果 根據(jù)圖3,分別采用BP神經(jīng)網(wǎng)絡(luò)、傳統(tǒng)的SVM及提出的基于優(yōu)化的FCM聚類及SVM結(jié)合的算法對2014年8月1到9月30日的燃氣負荷進行仿真預測,結(jié)果對比如圖4所示. 圖4 三種預測算法仿真值與實際值對比圖 平均相對誤差 (16) 利用PSO算法的全局搜索能力優(yōu)化FCM聚類算法.并將改進后的FCM聚類與SVM結(jié)合建立新型的燃氣負荷預測模型,對燃氣負荷數(shù)據(jù)分類,依據(jù)分類結(jié)果選取訓練樣本,選用同類特征的數(shù)據(jù)作為預測輸入,保證了數(shù)據(jù)特征的一致性,強化了歷史數(shù)據(jù)的規(guī)律.而且充分發(fā)揮了SVM算法結(jié)構(gòu)風險最小化及小樣本、高泛化能力的優(yōu)勢.實驗結(jié)果證明了該方法的有效性,該方法比傳統(tǒng)的SVM算法和BP神經(jīng)網(wǎng)絡(luò)都具有更高的預測精度. [1] Apergis N,Payne J E.Natural gas consumption and economic growth:A panel investigation of 67 countries [J].Appl Energy,2010,87:2759-2763. [2] 張昀,周湶,任海軍,等.改進人工免疫網(wǎng)絡(luò)算法在電力短期負荷預測中的應(yīng)用 [J].重慶大學學報,2013,36 (4):33-39. Wang J,Zhou Q,Reng H J,et al.Application and research of improved artificial immune network to power short-term load forecasting [J].Journal of Chongqing University,2013,36 (4):33-39. [3] 虞尚智.機器學習算法在短期負荷預測中的應(yīng)用 [J].科學技術(shù)與工程,2013,13 (18):2231-2236. Yu S Z.Application and research of improve artificial immune network to power short-term load forecasting [J].Science Technology and Engineering,2013,13 (18):2231-2236. [4] Ding N,Benoit C,Foggia G,et al.Neuralnetwork-based model design for short-term load forecast in distribution systems [J].IEEE Transactions on Power Systems,2016,31 (1):72-81. [5] Szoplik J.Forecasting of natural gas consumption with artificial neural networks [J].Energy,2015,85 (1):208-220. [6] Grant J,Eltoukhy M,Asfour S.Short-term electric peak demand forecasting in a large government building using artificial neural networks [J].Energies,2014,7 (4):1935-1953. [7] Cecati C,Kolbusz J,Rozycki P,et al.A novel RBF training algorithm for short-term electric load forecasting and comparative studies [J].IEEE Transactions on Industrial Electronics,2015,62 (10):6519-6529. [8] Ren F,Hu C,Tang F Z,et al.Load forecasting based on self-organizing map and support vector machines [C].Proceeding of the 11th World Congress on Intelligent Control and Automation,2015:3148-3150. [9] Kavousi-Fard A,Samet H,Marzbani F.A new hybrid modified firefly algorithm and support vector regression model for accurate short term load forecasting [J].Expert Systems with Applications,2014,41 (13):6047-6056. [10] 劉永光,孫超亮,牛貞貞,等.改進型模糊C均值聚類算法的電力負荷特性分類技術(shù)研究 [J].電測與儀表,2014,18:5-9. Liu Y G,Sun C L,Niu Z Z,et al.Research on the improve fuzzy c-means clustering algorithm based power load characteristic classification technology [J].Electrical Measurement & Instrumentation,2014,18:5-9. [11] Duan P,Xie K,Guo T T,et al.Short-term load forecasting for electric power systems using the PSO-SVR and FCM clustering techniques [J].Energies,2011,4:173-184. [12] Khalialia M A,Bezdek J,Popescu M,et al.Improvements to the relational fuzzy c-means clustering algorithm [J].Pattern Recognition,2014,47 (12):3920-3930. [13] 廖宗明.基于K均值聚類與支持向量機的電力系統(tǒng)短期負荷預測 [D].廣州:華南理工大學,2012. Liao Z M.The research of short term load forecasting of power system based on fuzzy-means clustering and SVM [D].Guangzhou:South China University of Technology,2012. (責任編輯:包震宇) Gasloadforecastingbasedonoptimizedfuzzyc-meanclusteringanalysisofselectingsimilardays Qiu Jing,XuXiaozhong*,DengSong,WangTing (The College of Information,Mechanical and Electrical Engineering,Shanghai Normal University,Shanghai200234,China) Traditional fuzzy c-means (FCM) clustering in short term load forecasting method is easy to fall into local optimum and is sensitive to the initial cluster center.In this paper,we propose to use global search feature of particle swarm optimization (PSO) algorithm to avoid these shortcomings,and to use FCM optimization to select similar date of forecast as training sample of support vector machines.This will not only strengthen the data rule of training samples,but also ensure the consistency of data characteristics.Experimental results show that the prediction accuracy of this prediction model is better than that of BP neural network and support vector machine (SVM) algorithms. short term load forecasting; similar days;similarity; fuzzy c-means (FCM) clustering; particle swarm optimization (PSO) algorithm;support vector machine (SVM) 2016-05-04 邱 靜(1990-),女,碩士研究生,主要從事人工智能數(shù)據(jù)挖掘方面的研究.E-mail:572148690@qq.com 導師簡介: 徐曉鐘(1964-),男,高級工程師,主要從事人工智能數(shù)據(jù)挖掘及計算機軟件架構(gòu)設(shè)計方面的研究.E-mail:xxz_edu@shnu.edu.cn TP315.69 :A :1000-5137(2017)04-0560-07 *2 基于粒子群優(yōu)化FCM聚類算法
3 基于優(yōu)化的FCM聚類選取相似日
4 基于優(yōu)化FCM聚類選取相似日的燃氣負荷預測
5 結(jié) 論