• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于聚類分析的短期負(fù)荷智能預(yù)測方法研究

      2014-08-08 14:14:16陳宏義李存斌施立剛
      關(guān)鍵詞:負(fù)荷預(yù)測支持向量機數(shù)據(jù)挖掘

      陳宏義+李存斌+施立剛

      文章編號:16742974(2014)05009405

      收稿日期:20131222

      基金項目:國家自然科學(xué)基金資助項目(71271084);國家電網(wǎng)公司2014年總部科技項目65

      作者簡介:陳宏義(1966-),男,湖南漢壽人,中國能源建設(shè)集團有限公司高級政工師,華北電力大學(xué)博士研究生

      通訊聯(lián)系人,Email:shlg87@163.com

      (1.華北電力大學(xué) 經(jīng)濟與管理學(xué)院,北京 102206;2.中國能源建設(shè)集團有限公司,北京 100029)

      摘 要:短期電力負(fù)荷預(yù)測作為電網(wǎng)企業(yè)的基本工作,其精度的提高對于電網(wǎng)企業(yè)運營管理和調(diào)度管理具有較大的意義,然而由于電力負(fù)荷受到諸多非線性因素的影響,因此得到高精度的電力負(fù)荷預(yù)測結(jié)果是比較困難的.本文首先利用數(shù)據(jù)挖掘中的kmeans聚類技術(shù)對訓(xùn)練集的氣象數(shù)據(jù)進(jìn)行聚類分析,分析提取相似日,在提取相似日的相關(guān)歷史數(shù)據(jù)后,建立支持向量機模型進(jìn)行短期電力負(fù)荷預(yù)測.經(jīng)算例結(jié)果證明,由該方法得出的預(yù)測結(jié)果平均相對誤差為0.88%,和同結(jié)構(gòu)支持向量機預(yù)測的平均相對誤差(1.66%)以及ARMA預(yù)測的平均相對誤差(3.81%)相比,預(yù)測精度得到明顯的提高,證明了該方法的有效性.

      關(guān)鍵詞:數(shù)據(jù)挖掘;負(fù)荷預(yù)測;聚類;支持向量機;kmeans

      中圖分類號:TM715 文獻(xiàn)標(biāo)識碼:A

      A New Forecasting Approach for Shortterm Load 

      Intelligence Based on Cluster Method

      

      CHEN Hongyi1,2, LI Cunbin1, SHI Ligang1

      (1.School of Economics and Management, North China Electric Power Univ, Beijing 102206, China;

      2.China Energy Engineering Group Co Ltd, Beijing 100029,China)

      Abstract:Load forecasting is one of the basic issues of the electric power industry. However, because load has a certain social attributes, the improvement of the accuracy of load forecasting result is a difficult issue. This paper first used kmeans cluster method to find similar data from historical date and weather data, and then used support vector machine (SVM) for forecasting. Seen from the result, the proposed method's MAPE is 0.88%, but BPANN and ARMA are 1.66% and 3.81% respectively. It is proved that this method has a high accuracy.

      Key words: data mining; load forecasting; clustering; support vector machine(SVM);kmeans

      

      隨著電力工業(yè)市場化的進(jìn)展,短期電力負(fù)荷預(yù)測精度的提高對電網(wǎng)企業(yè)的電力調(diào)度安排,電網(wǎng)調(diào)度自動控制,電網(wǎng)企業(yè)的營銷行為具有十分重要的意義[1].20世紀(jì)80年代,國外學(xué)者Bunn和Farmer在研究負(fù)荷預(yù)測精度對電網(wǎng)企業(yè)的經(jīng)濟效益影響時就已經(jīng)指出,負(fù)荷誤差每增加1%將會增加10 000 000英鎊的電力經(jīng)營成本[2],因此,負(fù)荷預(yù)測精度的提高對電網(wǎng)企業(yè)而言將會產(chǎn)生較大的社會經(jīng)濟效益.

      很多研究負(fù)荷預(yù)測的學(xué)者已經(jīng)對電力負(fù)荷預(yù)測的建模問題開展深入研究,其方法包括回歸擬合預(yù)測模型、灰色預(yù)測方法、時間序列分析以及幾種方法組合在一起的組合預(yù)測方法等.近二十年來,隨著人工智能領(lǐng)域的發(fā)展,越來越多的研究人員將神經(jīng)網(wǎng)絡(luò)為代表的人工智能預(yù)測方法應(yīng)用到負(fù)荷預(yù)測中,取得了一定的成果.其中人工神經(jīng)網(wǎng)絡(luò)由于具有無需先驗經(jīng)驗便可以按照任意精度進(jìn)行非線性擬合的優(yōu)點,受到了眾多學(xué)者的青睞,成為近些年來主要的研究方法之一.國內(nèi)外學(xué)者對應(yīng)用神經(jīng)網(wǎng)絡(luò)進(jìn)行電力負(fù)荷預(yù)測的文獻(xiàn)進(jìn)行了綜述,并指出,和非智能的預(yù)測方法相比,神經(jīng)網(wǎng)絡(luò)得到的負(fù)荷預(yù)測結(jié)果精度更高[3-6].但是也有學(xué)者指出利用神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測的缺點是可能收斂于局部最優(yōu)解,并且在訓(xùn)練時需要大量的樣本[7].

      支持向量機預(yù)測方法的出現(xiàn)極大地改善了神經(jīng)網(wǎng)絡(luò)的上述缺陷,具有要求確定的參數(shù)少、在理論上有全局最優(yōu)唯一解的特點,在小樣本的條件下被認(rèn)為是可以替代神經(jīng)網(wǎng)絡(luò)的智能預(yù)測方法[8].很多學(xué)者針對支持向量機在不同領(lǐng)域內(nèi)的運用展開研究,均取得了不俗的效果,證明了支持向量機的實用性[9-11].但是由于短期的負(fù)荷預(yù)測受到大量復(fù)雜影響因素的多重非線性干擾,如氣象、電力的實時需求、經(jīng)濟影響、電力系統(tǒng)的影響、電力市場各參與方、政治活動等.因此,無論模型如何先進(jìn),如果不盡可能地考慮這些因素的影響,很難進(jìn)一步提高負(fù)荷預(yù)測的精度.

      近幾年,很多學(xué)者意識到利用數(shù)據(jù)挖掘技術(shù)首先對數(shù)據(jù)進(jìn)行處理,再利用模式識別技術(shù)提取出相應(yīng)的負(fù)荷預(yù)測影響相關(guān)的知識,能夠進(jìn)一步提高預(yù)測的精度.在提取出的相關(guān)知識里,尤其是氣象相關(guān)的知識,如分類[12]、尋找相似日特征[13]等對提高負(fù)荷預(yù)測的精度作用最大.這表明將數(shù)據(jù)挖掘技術(shù)引入到電力負(fù)荷預(yù)測中不但是可行的,而且可以提高預(yù)測的精度.受此思路啟發(fā),本文首先利用待預(yù)測日的氣象因素,采用數(shù)據(jù)挖掘中的kmeans聚類算法進(jìn)行聚類,得到相似日的結(jié)果,然后提取相似日的相關(guān)歷史負(fù)荷數(shù)據(jù),并利用支持向量機模型對負(fù)荷進(jìn)行預(yù)測.由于該預(yù)測方法在建模前,首先通過聚類方法找出和待預(yù)測日相似的負(fù)荷數(shù)據(jù)樣本進(jìn)行短期負(fù)荷預(yù)測,因此和傳統(tǒng)預(yù)測方法利用近期樣本進(jìn)行預(yù)測相比,能夠有效地進(jìn)一步提高負(fù)荷預(yù)測的精度.

      1 利用kmeans聚類方法選取相似日數(shù)據(jù)

      聚類分析是對樣本或指標(biāo)按照各自的特性進(jìn)行分類的一種多元統(tǒng)計分析方法,一般基于距離的標(biāo)準(zhǔn)對樣本數(shù)據(jù)分成不同的類或者簇.和分類相比,聚類不需要先驗知識,即,可以在無監(jiān)督、無指導(dǎo)的條件下進(jìn)行機器學(xué)習(xí).聚類目前應(yīng)用于很多領(lǐng)域中,包括數(shù)學(xué)、計算機科學(xué)、統(tǒng)計學(xué)、生物學(xué)和經(jīng)濟學(xué)等.聚類算法主要以統(tǒng)計方法、機器學(xué)習(xí)、智能計算等方法為基礎(chǔ),其中較著名的聚類方法是kmeans劃分算法,也是最具有代表性的聚類方法之一.該算法只需要一個參數(shù),即聚類個數(shù)k,然后將樣本n分為k個簇,分類原則是具有較高相似度的盡量劃分為一個簇,而不同簇之間的相似度則盡可能的小.kmeans 算法過程如下[14]:

      1)從n個樣本中任選k個對象作為簇中心;

      2)計算中心外樣本和中心之間的相似度(一般采用距離函數(shù));

      3)按照相似度進(jìn)行分配,具有較高相似度的樣本聚類為一簇;

      4)計算聚類后所得簇的新的簇中心,并不斷重復(fù),直到標(biāo)準(zhǔn)測度函數(shù)開始收斂為止.

      kmeans聚類的標(biāo)準(zhǔn)測度函數(shù)一般采用如式(1)所示的均方差予以計算:

      E=∑ki=1∑p∈Cip-mi2(1)

      其中E是所有樣本的平方誤差的總和;p是聚類空間中的樣本點;mi是簇Ci的平均值.

      由于短期電力負(fù)荷預(yù)測受到較多因素的影響,因此能否針對待預(yù)測日,利用和待預(yù)測日相近日的數(shù)據(jù)進(jìn)行預(yù)測是進(jìn)一步提高短期電力負(fù)荷預(yù)測精度的一個關(guān)鍵步驟.這是因為利用數(shù)據(jù)挖掘在預(yù)測前先選取相似日可以將具有高度相似特征的類似負(fù)荷點尋找出來,尤其在利用智能算法對負(fù)荷進(jìn)行預(yù)測時,可以避免由于具有不同特征的預(yù)測點對智能預(yù)測方法訓(xùn)練時產(chǎn)生的收斂慢的問題.利用kmeans聚類方法提取相似日電力負(fù)荷數(shù)據(jù),結(jié)合智能預(yù)測模型進(jìn)行預(yù)測的流程如下:

      1)針對待預(yù)測日/時點,收集相關(guān)預(yù)測影響因素的數(shù)據(jù),如天氣,日期類型等,組成一條數(shù)據(jù)記錄;

      2)對上述數(shù)據(jù)記錄,針對歷史負(fù)荷數(shù)據(jù)中的數(shù)據(jù),設(shè)定聚類個數(shù)k,利用kmeans算法進(jìn)行聚類尋找;

      3)根據(jù)聚類結(jié)果,記錄日期標(biāo)識,按照預(yù)測的“近大遠(yuǎn)小”原則,選擇距離待預(yù)測日最近日期的相關(guān)歷史負(fù)荷數(shù)據(jù),確定出待預(yù)測日的輸入因素,建立智能預(yù)測模型進(jìn)行預(yù)測.

      2 支持向量機預(yù)測模型

      本文的智能預(yù)測模型選取的是支持向量機 (support vector machine,SVM),該模型是Vapnik于20世紀(jì)90年代中期提出的一種新的智能學(xué)習(xí)方法,起先用于非線性的模式識別問題,隨著應(yīng)用領(lǐng)域的不斷擴展和對支持向量機研究的深入,支持向量機逐漸應(yīng)用于非線性的擬合中,表現(xiàn)出了良好的性能,并且由于支持向量機利用結(jié)構(gòu)風(fēng)險最小化代替了神經(jīng)網(wǎng)絡(luò)的經(jīng)驗風(fēng)險最小化對網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行訓(xùn)練,因此具有較好的泛化能力,在理論上能夠搜索到全局最優(yōu)解,能夠克服神經(jīng)網(wǎng)絡(luò)易陷入局部最小值的缺點.由于支持向量機在小樣本的條件下學(xué)習(xí)速度快,因此可以認(rèn)為支持向量機方法是可以在小樣本條件下取代神經(jīng)網(wǎng)絡(luò)方法的較好的選擇.

      支持向量機進(jìn)行非線性擬合預(yù)測方法的原理如下[1].

      假設(shè)有訓(xùn)練樣本集G={(xi,di)},i=1,…,N,xi∈Rn,di∈R1.支持向量機回歸的基本原理是通過映射將數(shù)據(jù)映射到一個高維特征空間中,并在該空間中尋找一個輸入空間到輸出空間的非線性映射

      Symbol`@@

      ψ(x),其回歸函數(shù)如下:

      y = f(x)=wψ(x)+b (2)

      其函數(shù)逼近問題等價于如下函數(shù)最?。邯?/p>

      R(C)=(C/N)∑Ni=1Lε(di,yi)+‖w‖2/2 (3)

      Lε(d,y)=0 d-y≤εd-y-εotherwise (4)

      其中‖w‖2/2表示平滑程度,Lε(d,y)為ε敏感損失函數(shù).

      通過引入兩個松弛變量ζ,ζ*,上述函數(shù)可以變成如下形式:

      R(w,ζ,ζ*)=‖w‖2/2+C∑Ni=1(ζi+ζ*i)s.t.wψ(xi)+bi-di≤ε+ζ*i,i=1,2,…,Ndi-wψ(xi)-bi≤ε+ζi,i=1,2,…,Nζi,ζ*i≥0,i=1,2,…,N (5)

      利用拉格朗日型和KarushKuhnTucker條

      件,解其對偶問題,可以得到支持向量機回歸函數(shù):

      f(x,β,β*)=∑Ni=1(βi-β*i)K(x,xi)+b (6)

      式中K(x,xi)稱為核函數(shù),需要滿足Mercer條件,一般選取最常用的高斯核函數(shù)K(x,

      Symbol`@@

      xi)

      Symbol`@@

      Symbol}@@

      exp(

      Symbolm@@

      ‖

      Symbol`@@

      x

      Symbol`@@

      Symbolm@@

      Symbol`@@

      xi

      Symbol`@@

      ‖2/2

      SymbolsA@

      

      Symbol`@@

      2).

      3 實證分析

      本文以我國南方電網(wǎng)某地市級電力局的日整點負(fù)荷數(shù)據(jù)為例進(jìn)行實證分析.利用聚類分析的因素數(shù)據(jù)有日期類型數(shù)據(jù)、氣象數(shù)據(jù)(包括氣壓相關(guān)數(shù)據(jù)、氣溫相關(guān)數(shù)據(jù)、濕度相關(guān)數(shù)據(jù)、降水量、人體舒適程度等)共12項屬性相關(guān)數(shù)據(jù),共組織形成54條記錄形式,將最后1條數(shù)據(jù)作為測試記錄使用.其具體數(shù)值如表1所示.

      接下來對這些記錄進(jìn)行預(yù)處理,對于標(biāo)識型的數(shù)據(jù),利用數(shù)值予以替代.以星期為例,分別用0,1,…,6代替星期日,星期一,…,星期六,對于原本是數(shù)據(jù)類型的屬性值,利用等距離方法將其離散化,從而得到初始分析記錄集.

      對于支持向量機模型的訓(xùn)練,按照相關(guān)文獻(xiàn),將輸入層節(jié)點選取L(t-24i),L(t-j),其中i=1,2,3;j=1,2,即,使用待預(yù)測時點的前三個時點和同一聚類中的日期待預(yù)測時間最近兩天的同一時點的數(shù)據(jù)作為輸入變量.此外,為方便對比分析,選取同結(jié)構(gòu)的支持向量機,即,使用待預(yù)測時點的前三個時點和前兩天的同一時點數(shù)據(jù)作為輸入變量,同時,利用自回歸滑動平均模型ARMA(1,1)對上述數(shù)據(jù)分別進(jìn)行預(yù)測.實驗計算環(huán)境選擇matlab2011a,libsvm2.8.8軟件包,誤差對比分析采用平均相對誤差eMAPE,計算結(jié)果如表2所示.

      eMAPE=1n∑ni=1A(i)-F(i)A(i)×100% (7)

      從圖1和表2中可以明顯發(fā)現(xiàn),本文提出的方法具有較高的精度值,并且在大多數(shù)預(yù)測點上均表現(xiàn)良好,平均誤差值達(dá)到了0.88%,而同結(jié)構(gòu)未進(jìn)行聚類尋找相似數(shù)據(jù)的支持向量機預(yù)測的平均誤差為1.66%,根據(jù)ARMA(1,1)得到的預(yù)測平均誤差為3.81%.從誤差對比中可以直觀地看出,本文的方法具有更高的擬合精度.

      表1 處理后的待聚類數(shù)據(jù)集

      Tab.1 Clusters data set to be processed

      最低

      溫度

      /℃

      最高

      溫度

      /℃

      7:00

      溫度

      /℃

      16:00

      溫度

      /℃

      最大

      濕度

      /(%rh)

      最小

      濕度

      /(%rh)

      人體舒

      適程度

      5

      8

      1

      26

      33

      26.5

      32.6

      0.85

      0.5

      8

      5

      9

      2

      26

      34

      26.3

      32.4

      0.85

      0.5

      9

      5

      10

      3

      27

      34

      28.2

      32.2

      0.85

      0.5

      9

      5

      11

      4

      25

      34

      25.6

      33.1

      0.85

      猜你喜歡
      負(fù)荷預(yù)測支持向量機數(shù)據(jù)挖掘
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      電力系統(tǒng)短期負(fù)荷研究綜述
      動態(tài)場景中的視覺目標(biāo)識別方法分析
      論提高裝備故障預(yù)測準(zhǔn)確度的方法途徑
      價值工程(2016年32期)2016-12-20 20:36:43
      電力系統(tǒng)負(fù)荷的一元線性模型預(yù)測方法
      價值工程(2016年32期)2016-12-20 20:19:59
      面向云計算的智能電網(wǎng)負(fù)荷預(yù)測平臺模型研究
      基于電力系統(tǒng)負(fù)荷預(yù)測方法的配電網(wǎng)規(guī)劃中的實踐研究
      青年時代(2016年29期)2016-12-09 20:31:03
      基于熵技術(shù)的公共事業(yè)費最優(yōu)組合預(yù)測
      價值工程(2016年29期)2016-11-14 00:13:35
      基于支持向量機的金融數(shù)據(jù)分析研究
      沛县| 滦南县| 双峰县| 新田县| 江都市| 通化市| 囊谦县| 湄潭县| 通渭县| 阿合奇县| 恩平市| 海盐县| 板桥市| 凤翔县| 石棉县| 辉县市| 宝应县| 钟山县| 长沙市| 福州市| 辽阳市| 河源市| 弥渡县| 栾川县| 大渡口区| 定日县| 永丰县| 霍城县| 徐州市| 襄樊市| 石柱| 广元市| 贡觉县| 广饶县| 贵德县| 临安市| 清新县| 北票市| 调兵山市| 沛县| 城市|