• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于SARIMA-GS-SVR組合模型的短期電力需求預測

      2022-07-17 06:04:34王萬雄
      電子科技 2022年8期
      關鍵詞:殘差預測函數

      劉 晗,王萬雄

      (甘肅農業(yè)大學 理學院,甘肅 蘭州 730070)

      目前,工廠、企業(yè)規(guī)模的逐步擴大和生活水平的提高使得電力消費直線增長。電力生產的控制和最佳規(guī)劃需要精確的電力需求預測。電力預測時期包括短期、中期和長期,其中短期預測顯示了天、周和季節(jié)的系統(tǒng)變化,是該領域的研究熱點[1-3]。此外,組合模型利用了單一模型的優(yōu)勢,提供了比單一模型更穩(wěn)定、可靠的預測結果,具有更重要的研究價值[4],已在經濟、工業(yè)等領域有了廣泛的應用[5-8]。文獻[9]應用混合深度神經網絡(Convolutional Long Short-Term Memory,CLSTM)模型預測短期電力需求。文獻[10]將小波變換(Wavelet Transform,WT)和人工神經網絡(Artificial Neural Network,ANN)混合使用,提高了預測精度。文獻[11]利用前饋(Back Propagation,BP)神經網絡和模糊系統(tǒng)的方法進行了電力負荷預測。相比其它算法,神經網絡算法在大樣本條件下性能優(yōu)良,隨著數據量的增多,其計算能力也更強。但是,神經網絡算法可解釋性低,計算成本昂貴,易陷入局部最優(yōu),因此有學者提出了支持向量機(Support Vector Machine,SVM)預測模型。

      與神經網絡算法相比,SVM算法的泛化能力強,更容易收斂到全局最優(yōu)[12]。本文應用傳統(tǒng)算法與機器學習算法相結合的方法來預測短期電力需求時間序列。由于受溫度、工作日等因素影響,短期電力需求時間序列呈現明顯的周期性特點,而季節(jié)差分自回歸移動平均(Seasonal Auto Regressive Integrated Moving Average,SARIMA)模型在處理周期性數據上表現良好[13]。用電量與人口、電價等諸多因素有關,這些都會導致電力需求時間序列呈現高度的非線性特征,而支持向量回歸(Support Vector Regression,SVR)模型則在處理非線性數據上有較大的優(yōu)勢[12]。綜上所述,本文充分考慮了這兩個模型的優(yōu)點。此外,鑒于SVR模型參數的選擇將直接影響其預測精度,為解決傳統(tǒng)SVR因人工經驗設置參數產生的局部最優(yōu)問題,本文選用網格搜索(Grid Search,GS)算法對SVR的懲罰因子C和核函數參數γ進行全局尋優(yōu)。綜合考慮以上因素,本文最終建立了GS算法優(yōu)化的SARIMA-SVR模型,即SARIMA-GS-SVR組合模型,并建立了SARIMA、SVR、GS-SVR與指數平滑模型共同預測短期電力需求時間序列。

      1 基本理論

      1.1 SARIMA的基本理論

      自回歸移動平均模型ARMA(p,q)描述平穩(wěn)的時間序列為

      xt=θ1xt-1+θ2xt-2+…+θpxt-p+εt+

      ω1εt-1+ω2εt-2+…+ωqεt-q

      (1)

      式中,θ1,θ2,…,θp和ω1,ω2,…,ωq為模型參數;εt為誤差項。式(1)由兩部分組成

      xt1=θ1xt1-1+θ2xt1-2+…+θpxt1-p+εt1

      (2)

      xt2=εt2+ω1εt2-1+ω2εt2-2+…+ωqεt2-q

      (3)

      式(2)為p階自回歸模型AR(p),θ1,θ2,…,θp為自回歸系數,簡記為

      (4)

      式中,B為時間后移算子。

      式(3)為q階移動平均模型MA(q),ω1,ω2,…,ωq為移動平均系數,簡記為式(5)。

      xt2=Wq(B)εt2,

      (5)

      不平穩(wěn)的序列需要通過差分處理,平穩(wěn)后使用ARMA模型建模。令φ(B)=Bp(B)(1-B)d,得到

      Wq(B)εt2=θp(B)?dxt1

      (6)

      式中,d為差分次數,且?d=(1-B)d。此時模型為積累式自回歸移動平均模型,記為ARIMA (p,d,q)。

      具有周期性的時間序列需要先處理其周期性,之后用ARIMA模型建模,模型簡寫為

      θp(B)ψp(Bs)?d(1-Bs)Dxt1=Wq(B)φQ(Bs)εt2

      (7)

      其中

      ψp(Bs)=1-ψ1Bs-ψ2B2s-…-ψpBps

      (8)

      φQ(Bs)=1-φ1Bs-φ2B2s-…-φQBqs

      (9)

      式中,s為周期長度;D為季節(jié)差分的次數,模型記為ARIMA (p,d,q)(P,D,Q)s。

      1.2 SVR的基本理論

      SVM是以統(tǒng)計理論為基礎的機器學習算法,包括支持向量分類和SVR[14],是一種基于結構風險最小化的算法。SVM有良好的泛化能力[15],在解決非線性問題上效果良好,因此在分類和回歸問題中得到了廣泛的運用[16]。SVR是基于SVM的回歸算法,它的基本理論是通過核函數把數據從樣本空間映射到高維特征空間,然后在特征空間中進行線性回歸,尋找最優(yōu)的回歸超平面,進而實現數據預測的目的。

      假設訓練樣本集S={(si,yi)},i=1,2,…,n,xi∈Rd(R為實數域,d為維數),xi為輸入,yi為對應輸出。SVR的目標為搜尋回歸函數f(x),使f(xi)與yi的偏差盡可能小,回歸函數為

      f(x)=ωTφ(x)+b

      (10)

      式中,ω為權值系數;φ(x)為非線性變換函數;b為偏執(zhí)項?;貧w預測的偏差不可避免,因此需要引入不敏感損失函數

      L[y,f(x)]=max{0,|y-f(x)|-ε}

      (11)

      式中,L[y,f(x)]為ε損失函數,若預測偏差小于ε,則損失為0,否則將偏差減去ε。

      (12)

      (13)

      (14)

      1.3 指數平滑法的基本理論

      Holt-Winters模型是一種三參數指數平滑法,用來預測有水平項、趨勢項和季節(jié)性波動的時間序列[18]。該方法提供了λ、β和γ3個參數,分別對應當前點的水平、趨勢和季節(jié)部分。平滑參數λ控制水平的指數型下降,β控制斜率的指數型下降,γ控制季節(jié)指數下降。參數的取值范圍均為[0~1],取值越大說明越近的觀測值占有的權重越大。t+1時刻的預測值可表示為

      (15)

      式中,a為t+1時刻序列的水平項系數;b為斜率;xt為當前時刻值;st+1為t+1時刻序列的季節(jié)效應。

      2 數據采集及分析

      本文實驗使用的數據來自美國國家航空和宇宙航空局(NASA,http://www.eia.doe.gov/)發(fā)布的加利福尼亞州(加州)電力需求歷史數據,樣本數據時間范圍為2020年2月16日~2020年2月26日,共計264組,監(jiān)測間隔為1小時。圖 1為該時間段內加州小時電力需求數據圖。由圖1可知,加州電力需求序列呈現周期性特征,在每天約7時和約19時達到峰值,在約13時達到谷值。原始序列分解為趨勢項、周期項和殘差項,具體如圖2所示。圖2表明序列有很強的周期性特征和一定的趨勢特征。2020年2月22日與23日是周末,趨勢圖和殘差圖在這兩天出現下跌情況,原因可能為周末休息等因素。

      圖1 加州實際電力需求時序圖Figure 1. Sequence diagram of California actual electricity demand

      圖2 電力需求因素分解綜合圖Figure 2. Comprehensive decomposition diagram of power demand factors

      3 SARIMA-GS-SVR組合預測模型

      3.1 GS算法

      GS算法是通過遍歷給定的參數組合來優(yōu)化模型表現的方法[19]。本文設定懲罰因子C的變化區(qū)間為C∈[C1,C2],核函數參數γ的變化區(qū)間為γ∈[γ1,γ2]。實驗使用GS算法對區(qū)間里的每對參數(C′,γ′)進行模型訓練,并計算均方誤差(Mean Square Error,MSE),最后采用MSE最小的參數作為最佳模型參數。算法步驟如下:

      步驟1初始化SVR參數C和γ,令C=C0,γ=γ0;

      步驟2設定C的步長為Cs,更新式為C=C+Cs。γ的步長為γs,更新式為γ=γ+γs;

      步驟3將參數(C,γ)帶入SVR構建SVR模型,采用5折交叉驗證法計算訓練樣本5次交叉驗證MSE的均值;

      圖3 GS算法流程圖Figure 3. Flow chart of GS algorithm

      步驟4將得到的MSE與上一步進行對比,若MSE減小,則(C,γ)替換上一步的(C,γ),反之不操作;

      步驟5判斷C是否達到最大值C2,若是,進行步驟6;反之,返回步驟2;

      步驟6判斷γ是否達到最大值γ2,若是,進行步驟7;反之,返回步驟2;

      步驟7當前SVR的參數(C,γ)達到最優(yōu),輸出結果。

      3.2 模型原理

      由前面數據分析可知原始序列包括線性時間序列分量、周期性時間序列分量和非線性時間序列分量,因此單一模型對電力需求預測有較大的局限。鑒于SARIMA模型對線性數據的擬合優(yōu)勢和SVR模型對非線性數據的擬合優(yōu)勢,可利用GS算法對SVR模型的C和γ參數進行尋優(yōu)。本文使用SARIMA-GS-SVR模型來預測短期電力需求。

      假設電力需求序列Yt由線性部分Lc和非線性部分Nt組成,即

      Yt=Lt+Nt

      (16)

      SARIMA-GS-SVR組合模型預測步驟如下:

      步驟1將原始序列因素分解,觀測序列周期項、趨勢項和殘差項特征;

      步驟2序列分為訓練子集和測試子集,對前者差分,觀測序列平穩(wěn)性;

      步驟3查看序列自相關圖和偏自相關圖,根據特征擬合SARIMA模型;

      步驟5將SARIMA模型預測的殘差,以3個歷史殘差作為輸入,下一個殘差作為輸出,轉化為有監(jiān)督學習數據集;

      步驟6歸一化數據集并將其劃分為訓練集和測試集;

      步驟7利用GS算法尋優(yōu)到最佳SVR參數組合(C,γ);

      步驟8將訓練集數據帶入SVR模型,利用最優(yōu)參數進行模型訓練;

      (17)

      3.3 模型設置

      3.3.1 核函數的選取

      構建SVR模型包括參數確定和核函數選取。需要確定的參數有正則化參數C、核函數參數γ,這兩個非負參數對于模型準確預測具有重要作用[20]。RBF核函數可直觀反映兩個數據的距離,比其它核函數效果更好,應用更廣泛[21],因此本文選用如下RBF核函數

      (18)

      式中,γ為控制半徑,且γ=1/2σ2;σ2為核函數的方差。

      3.3.2 數據預處理

      為了使數據具有相同尺度的量綱以減少誤差,在進行SVR預測之前,對數據進行歸一化處理

      (19)

      式中,xstd為歸一化后的值;xmin和xmax分別為數據的最小值和最大值。

      3.4 模型預測流程

      將SARIMA模型預測的殘差基于GS算法尋優(yōu)到的最佳參數(C,γ)輸入到SVR中,建立SARIMA-GS-SVR組合模型進行電力需求預測。具體流程如圖4所示。

      圖4 SARIMA-GS-SVR模型流程圖Figure 4. Flow chart of SARIMA-GS-SVR model

      4 實驗設置及結果分析

      4.1 實驗參數設置

      基于Python 3仿真環(huán)境,以加州電力需求數據為例,建立SARIMA、SVR、GS-SVR、SARIMA-GS-SVR和指數平滑5種預測模型。設置GS算法參數:模型為SVR,交叉驗證折數CV=5,訓練核數n_jobs=4,評分目標函數為訓練樣本5折交叉驗證的均方誤差MSE,設置核函數參數γ和懲罰因子C的搜索上限均為28,下限為2-8,搜索步長s=2.5,不敏感損失因子ε在尋優(yōu)過程中保持0.1不變。設置SVR模型參數:選擇RBF徑向基核函數,核函數參數γ和懲罰因子C的取值為GS算法尋優(yōu)到的最佳參數組合。設置指數平滑模型參數:λ=0.951 2,β=0.935 0,γ=1,a=26 482.129 4,b=-712.614 9。

      4.2 實驗結果及分析

      選取2020年2月16日~2020年2月25日范圍內的240組數據作為預測模型的訓練子集,并選取2020年2月26日內的24組數據作為測試子集,進行模型預測。由數據分析圖2看出,原始序列存在多種復雜特征,序列以天為周期,對訓練子集進行一階24步差分后所得序列如圖5所示。由圖5可知,去除個別極值點影響之外,序列均值和標準差在0值附近小范圍波動。自相關圖與偏自相關圖如圖6所示,兩圖在一階延遲后都基本落在兩倍標準差范圍之內。根據圖6,擬合模型SARIMA(1,1,1) (0,1, 0)24。該模型對測試子集的預測結果如圖8所示。

      圖5 電力需求差分序列時序圖Figure 5. Sequence diagram of power demand differential sequence

      圖6 訓練樣本自相關與偏自相關圖Figure 6. Autocorrelation and partial autocorrelation graph of training sample

      表1列出了GS-SVR與SARIMA-GS-SVR模型利用GS算法尋優(yōu)到的最優(yōu)參數以及對應的最小目標函數MSE。將SARIMA模型預測的殘差利用GS算法尋優(yōu)到最佳參數(C=10.045 1,γ=3.590 8),帶入SVR模型得到2020年2月26日殘差預測結果,如圖7所示。

      表1 GS算法尋優(yōu)的最佳參數Table 1. Optimal parameters searched by GS algorithm

      由圖7可以看出,GS-SVR模型預測的殘差與實際殘差走勢一致,表明該模型具有良好的預測效果。SARIMA、SVR、GS-SVR、SARIMA-GS-SVR和指數平滑5種預測模型對測試子集的預測結果如圖8所示。從圖8 可以看出,相比其它4種模型的預測值,SARIMA-GS-SVR的預測值更接近實際值。SVR單一模型的預測效果差于GS-SVR組合模型,說明了利用GS算法進行SVR模型參數尋優(yōu)的必要性。將5種模型的預測值與實際值作比較,結果如表2所示。

      圖7 實際殘差值與GS-SVR預測殘差值對比Figure 7. Comparison of actual residual and GS-SVR forecasting residual

      圖8 電力需求實際值與5種模型預測值對比Figure 8. Comparison of actual power demand values and predicted values of five models

      表2 模型預測結果Table 2. Prediction results of models

      續(xù)表

      4.3 實驗誤差對比

      本文應用平均絕對誤差(Mean Absolute Error,MAE)、平均絕對百分比誤差(Mean Absolute Percent Error,MAPE)、均方根誤差(Root Mean Square Error,RMSE)和組合預測相對單一預測模型提高的預測精度(Accuracy Improvement,AI)來評價模型效果。各指標如式(20)~式(23)所示,其中N為樣本個數,xt為真實值,t為預測值,s為單一預測模型絕對誤差之和,sc為組合預測模型絕對誤差之和。當AI>0時,組合模型的預測效果優(yōu)于單一模型;反之,組合模型的預測效果較差。

      (20)

      (21)

      (22)

      (23)

      表3列出了5種模型的預測誤差。相比SVR,GS-SVR的預測精度提高了35.622 7%。相比SARIMA,SARIMA-GS-SVR的預測精度提高了29.181 2%。SARIMA-GS-SVR的MAE、MAPE和RMSE的誤差指標評價值均小于其他4種模型。誤差評價結果表明,組合模型SARIMA-GS-SVR模型的預測效果最好。

      表3 模型預測誤差Table 3. Forecasting error of models

      5 結束語

      本文基于SARIMA模型預測的殘差,提出用GS算法對SVR的參數進行優(yōu)化,并建立了SARIMA-GS-SVR組合預測模型,以美國加利福尼亞州2020年2月26日實際歷史數據做預測分析。 結果表明,SARIMA-GS-SVR組合預測模型預測效果優(yōu)于GS-SVR、SARIMA、SVR和指數平滑4種模型。本文提出的SARIMA-GS-SVR組合預測模型在一定程度上提高了短期電力需求的預測精度,但在SVR參數優(yōu)化算法的選擇上仍有一定的提升空間。在未來的研究中,計劃選擇其他算法來優(yōu)化SVR參數,并進行組合預測模型分析來繼續(xù)優(yōu)化預測精度。

      猜你喜歡
      殘差預測函數
      無可預測
      黃河之聲(2022年10期)2022-09-27 13:59:46
      選修2-2期中考試預測卷(A卷)
      選修2-2期中考試預測卷(B卷)
      基于雙向GRU與殘差擬合的車輛跟馳建模
      二次函數
      第3講 “函數”復習精講
      二次函數
      基于殘差學習的自適應無人機目標跟蹤算法
      函數備考精講
      基于遞歸殘差網絡的圖像超分辨率重建
      自動化學報(2019年6期)2019-07-23 01:18:32
      河南省| 乌拉特后旗| 天水市| 多伦县| 呼玛县| 汾阳市| 麻城市| 达州市| 绵竹市| 吴旗县| 娄烦县| 阿鲁科尔沁旗| 丹阳市| 平阳县| 阜宁县| 清苑县| 吴忠市| 陕西省| 平湖市| 水城县| 五指山市| 明水县| 米泉市| 仁布县| 从化市| 铜鼓县| 松江区| 海兴县| 达孜县| 黄梅县| 龙陵县| 邹城市| 塘沽区| 新安县| 若羌县| 舞钢市| 松潘县| 柘荣县| 长武县| 阿巴嘎旗| 剑阁县|