賈茹賓, 高金峰
(鄭州大學(xué) 電氣工程學(xué)院,河南 鄭州 450001)
變壓器是電力系統(tǒng)的關(guān)鍵設(shè)備,運行使用過程中,由于老化、電、熱故障等原因會產(chǎn)生少量氣體溶解于絕緣油中,各種氣體成分含量及不同組分間的比例關(guān)系與變壓器的健康狀況密切相關(guān)[1-2],因此預(yù)測變壓器油中溶解氣體含量是診斷故障的前提條件。
目前常用的變壓器油中氣體含量預(yù)測方法主要有灰色理論、網(wǎng)絡(luò)分析法、極端學(xué)習(xí)機(jī)、支持向量機(jī)與組合預(yù)測方法等。有許多學(xué)者對預(yù)測方法給予研究,在預(yù)測變壓器油中氣體含量方向均取得較好的效果。劉航等[3]采用考慮多因素的灰色關(guān)聯(lián)分析法;代杰杰等[4]運用深度信念網(wǎng)絡(luò)模型;劉亞南等[5]在短期負(fù)荷預(yù)測領(lǐng)域使用極端學(xué)習(xí)機(jī)的方法,預(yù)測效果良好,但其容易產(chǎn)生過擬合現(xiàn)象,并且極端學(xué)習(xí)的權(quán)值是隨機(jī)給定的,使得該算法的穩(wěn)定性不能得到保證;司馬莉萍等[6]對支持向量機(jī)算法進(jìn)行優(yōu)化并取得較好的預(yù)測效果;肖燕彩等[7]采用灰色模型預(yù)測油中氣體的未來趨勢,灰色預(yù)測模型適用于隨時間按指數(shù)規(guī)律單調(diào)增長趨勢的預(yù)測,如果預(yù)測量是按指數(shù)規(guī)律變化,則預(yù)測精度較高,但變壓器油中溶解氣體含量并不一定按指數(shù)規(guī)律增長變化,因此預(yù)測結(jié)果存在偏差。
ARIMA模型已在氣象、醫(yī)學(xué)、交通、農(nóng)林等研究領(lǐng)域得到廣泛應(yīng)用,并取得很好的效果,將該模型應(yīng)用到變壓器油中溶解氣體含量預(yù)測中,并對此模型進(jìn)行以下兩點優(yōu)化:
(1)結(jié)合自相關(guān)函數(shù)(ACF)和偏自相關(guān)函數(shù)(PACF)參數(shù)選擇原則得到若干組模型,然后利用3種準(zhǔn)則對模型進(jìn)行優(yōu)選;
(2)利用相關(guān)的殘差檢驗方法對優(yōu)選模型進(jìn)行殘差檢驗并對殘差檢驗結(jié)果分析。
ARIMA模型可以根據(jù)系統(tǒng)輸出的有限長度數(shù)據(jù)建立比較精確的、反應(yīng)系統(tǒng)動態(tài)依存關(guān)系的數(shù)學(xué)模型,考慮了序列的依存性和隨機(jī)波動的干擾性。優(yōu)化后的ARIMA模型克服了已有預(yù)測方法的過擬合現(xiàn)象以及對預(yù)測輸入量類型有限制等問題,并且使原有預(yù)測模型的精準(zhǔn)度更高。
ARIMA(p,d,q)模型實則為AR(p)模型和MA(q)模型的組合。ARIMA中的“I”意味著對不平穩(wěn)時間序列進(jìn)行差分處理,通過差分法可確定ARIMA(p,d,q)模型中的參數(shù)d。
AR(p)是自回歸模型,該模型是變量在時刻t的響應(yīng)xt與時刻t-1,t-2,…的響應(yīng)xt-1,xt-2,…及t時刻進(jìn)入系統(tǒng)的擾動的關(guān)系,而與前期的擾動無直接關(guān)系。
自回歸模型必須滿足平穩(wěn)性要求。p階自回歸過程的公式如式(1)所示:
(1)
式中:xt是當(dāng)前值;μ是常數(shù)項;p是階數(shù);γi是自相關(guān)系數(shù);ξt是誤差。
MA(q)模型是移動平均模型,該模型是指變量在時刻t的響應(yīng)xt與時刻t-1,t-2…的響應(yīng)xt-1,xt-2,…無直接關(guān)系,而與時刻t-1,t-2,…進(jìn)入系統(tǒng)的擾動存在一定的關(guān)系,移動平均法能有效地消除預(yù)測中的隨機(jī)波動,是自回歸模型中誤差項的累加。q階自回歸過程的公式如式(2)所示:
(2)
式中:q是階數(shù);ξt是誤差;θi是消除隨機(jī)波動的參數(shù)。
ARMA(p,q)是自回歸移動平均模型,該模型為自回歸與移動平均的結(jié)合[8-9],是指變量在時刻t的響應(yīng)xt不僅與時刻t-1,t-2,t-3,…的響應(yīng)xt-1,xt-2,…存在直接關(guān)系,而且與時刻t-1,t-2…進(jìn)入系統(tǒng)的擾動存在一定的相關(guān)關(guān)系。公式如式(3)所示:
(3)
綜上所述,建立ARIMA模型的條件:序列的取值依賴時間的變化但不一定是時間的嚴(yán)格函數(shù);每時刻的取值具有一定的隨機(jī)性;序列應(yīng)滿足平穩(wěn)性或差分處理后滿足平穩(wěn)性的要求。
變壓器油中氣體含量值會根據(jù)變壓器運行狀況的變化發(fā)生變化,通過時間的變化體現(xiàn),因此滿足建立模型的條件。
對一個不滿足平穩(wěn)性條件的序列,通過若干次差分確定差分階數(shù)d值,將非平穩(wěn)時間序列轉(zhuǎn)化為平穩(wěn)時間序列,此時ARIMA模型轉(zhuǎn)換為ARMA模型,再對平穩(wěn)時間序列通過自相關(guān)函數(shù)(ACF)和偏自相關(guān)函數(shù)(PACF)定階,得到若干組p和q值。因此對應(yīng)若干組模型,通過赤池信息準(zhǔn)則(AIC)、貝葉斯信息準(zhǔn)則(BIC)、漢南-奎因準(zhǔn)則(HQC)對多組模型進(jìn)行優(yōu)選,利用4種殘差圖呈現(xiàn)殘差檢驗結(jié)果,對優(yōu)選模型的殘差檢驗結(jié)果分析,殘差滿足要求后,利用最佳模型對時間序列預(yù)測。
實驗數(shù)據(jù)來自2013年6月至8月某500 KV變壓器A相DGA監(jiān)測數(shù)據(jù),共采集86例數(shù)據(jù),其中61例用于訓(xùn)練,25例用于測試。
樣本數(shù)據(jù)反映氣體含量值隨時間變化的過程。以變壓器過熱故障為例,變壓器在運行中由于過載、開關(guān)接觸不良、引線夾件螺絲松動或接頭焊接不良、渦流引起銅過熱、鐵芯漏磁、局部短路等原因?qū)е伦儔浩鬟^熱,而此類原因會使油中溶解氣體含量值發(fā)生變化。ARIMA模型將氣體含量值的累積性以及外界干擾的變化過程記錄到訓(xùn)練過程中,在短時間內(nèi)的變化均可預(yù)測到,由于篇幅原因,以H2含量的預(yù)測為例。
2.2.1 ADF單位根檢驗平穩(wěn)性
樣本序列經(jīng)ADF檢驗顯示不滿足平穩(wěn)性的要求,對樣本數(shù)據(jù)差分處理,每進(jìn)行一次差分處理后都要經(jīng)ADF檢驗,直到滿足平穩(wěn)性為止。針對樣本數(shù)據(jù),一次差分處理就滿足了平穩(wěn)性的要求,因此ARIMA(p,d,q)模型中參數(shù)d為1。H2含量隨時間變化曲線如圖1所示。
圖1 H2含量隨時間波動趨勢圖Figure 1 The trend chart of H2 content fluctuation with time
ADF單位根檢驗過程:首先假設(shè)需要進(jìn)行ADF檢驗的序列存在單位根,為非平穩(wěn)序列,如果待檢驗的序列經(jīng)程序計算得到的統(tǒng)計量Augmented Dickey-Fuller Test Statistic的值顯著小于3個置信度Critical Value(1%,5%,10%)的臨界值時;同時p-value接近于0,說明原假設(shè)不成立,判定正在接受檢驗的序列為平穩(wěn)時間序列,否則繼續(xù)進(jìn)行差分運算[10-11]。
一階差分圖如圖2所示,差分檢驗結(jié)果如表1所示,可判定經(jīng)過差分處理的數(shù)據(jù)序列為平穩(wěn)序列,滿足定階要求。
圖2 H2一階差分圖Figure 2 H2 first-order difference diagram
指標(biāo)結(jié)果Augmented Dickey-Fuller Test Statis-tic-8.378 296 e+00p-value2.550 610 e-13#Lags Used1.000 000 e+00Number of Observations Used8.200 000 e+01Critical Value (10%)-2.897 490 e+00Critical Value (5%)-2.585 949 e+00Critical Value (1%)-3.512 738 e+00
2.2.2 ACF和PACF定階
自相關(guān)函數(shù)ACF的k階相關(guān)系數(shù)為
(4)
其中,ρk的取值范圍為[-1,1]。
對平穩(wěn)AR(p)模型,求滯后k階自相關(guān)系數(shù)ρk時,ACF得到的不僅僅是xt與xt-k之間的相關(guān)關(guān)系,同時還受到中間k-1個變量xt-1、xt-2、…、xt-k+1的影響,且k-1個變量又都與xt-k具有相關(guān)關(guān)系,因此自相關(guān)系數(shù)ρk也受到k-1個變量的影響。偏自相關(guān)函數(shù)PACF有效刪除了中間k-1個變量xt-1、xt-2、…、xt-k+1的影響,僅是xt-k對xt的相關(guān)關(guān)系。
AR(p)模型的參數(shù)值p,可由偏自相關(guān)函數(shù)的相關(guān)系數(shù)PACF(ρk)得到,同理MA(q)模型的參數(shù)q,可由自相關(guān)函數(shù)的相關(guān)系數(shù)ACF(ρk)確定,因此ARMA(p,q)模型的參數(shù)p和q要根據(jù)自相關(guān)函數(shù)ACF和偏自相關(guān)函數(shù)PACF[12]確定。圖3和圖4為樣本數(shù)據(jù)經(jīng)差分處理后的自相關(guān)函數(shù)圖和偏自相關(guān)函數(shù)圖。在對模型的階數(shù)選擇時依據(jù)原則如表2所示。
圖3 自相關(guān)函數(shù)圖Figure 3 Autocorrelation function diagram
圖4 偏自相關(guān)函數(shù)圖Figure 4 Partial autocorrelation function diagram
模型ACFPACFAR(p)衰減趨于零p階后截尾MA(q)q階后截尾衰減趨于零ARMA(p,q)p階后衰減趨于零p階后衰減趨于零
2.2.3 模型優(yōu)選
通過以上步驟得到9組ARMA(p,q)模型,為選出最優(yōu)模型,利用AIC、BIC、HQC 3種準(zhǔn)則判斷[13],依據(jù)準(zhǔn)則計算的結(jié)果如表3所示,用Y表示結(jié)果,則
YAIC=2m-ln(L);
(5)
YBIC=mln(n)-2ln(L);
(6)
YHQC=mln(ln(n))-2ln(L),
(7)
式中:m是模型參數(shù)的數(shù)量;n是樣本數(shù)量;L是似然函數(shù)。
AIC、BIC、HQC準(zhǔn)則對應(yīng)的計算結(jié)果越小,則分別對應(yīng)數(shù)據(jù)擬合的優(yōu)良程度越高、模型的復(fù)雜度越低、模型的預(yù)測精度越高。
通過比較發(fā)現(xiàn),3個準(zhǔn)則中AIC和HQC的結(jié)果最小值對應(yīng)的模型均為ARMA(2,2),而BIC準(zhǔn)則對應(yīng)的結(jié)果最小值為ARMA(0,0),由于ARIMA模型復(fù)雜程度本身不高,結(jié)合參數(shù)d為1,可確定ARMA(2,1,2)為最優(yōu)模型。
表3 模型對應(yīng)的3種準(zhǔn)則計算結(jié)果Table 3 Calculation results of three criteria corresponding to the model
2.2.4 殘差檢驗
為確保模型的預(yù)測效果,對優(yōu)選模型進(jìn)行殘差檢驗,殘差是實際值與估計值的差,預(yù)測效果較好的模型的殘差要體現(xiàn)出隨機(jī)性和不可預(yù)測性。殘差是正態(tài)分布說明殘差是隨機(jī)的,對隨機(jī)誤差有比較好的擬合[14]。
圖5中大約有95%的標(biāo)準(zhǔn)化殘差值在(-2,2)之間,服從正態(tài)分布;圖6更直觀地反映出殘差服從正態(tài)分布;圖7中大多數(shù)的點都落在符合規(guī)定的區(qū)間內(nèi),滿足正態(tài)分布,殘差滿足要求;圖8是一種散點圖,圖上的點近似地在一條直線附近,說明是正態(tài)分布,殘差滿足要求。
圖5 標(biāo)準(zhǔn)化殘差圖Figure 5 Standardized residual diagram
各圖的橫縱坐標(biāo)沒有量綱,因此以上針對各圖的實際意義進(jìn)行解釋說明。
使用優(yōu)選模型對測試數(shù)據(jù)進(jìn)行預(yù)測,并與真實數(shù)據(jù)對比,結(jié)果如圖9所示。從圖9可以看出,預(yù)測數(shù)據(jù)與實際數(shù)據(jù)高度接近,能夠反映變壓器油中氣體含量的變化趨勢和數(shù)量關(guān)系。
圖6 殘差的直方加密度估計圖Figure 6 Histogram density estimation of residuals
圖7 殘差的相關(guān)圖Figure 7 Correlation diagram of residuals
圖8 殘差的QQ圖Figure 8 QQ diagram of residuals
圖9 預(yù)測趨勢Figure 9 Forecasting trends
為驗證預(yù)測方法ARIMA模型的有效性,對同一組樣本數(shù)據(jù)分別使用灰色預(yù)測模型GM、支持向量機(jī)預(yù)測模型SVM進(jìn)行預(yù)測,預(yù)測結(jié)果如圖10所示。
圖10 模型預(yù)測值比較Figure 10 Model prediction comparison
表4從3個維度討論:①使用同一種長度的樣本訓(xùn)練,預(yù)測相同的長度進(jìn)行性能比較;②以預(yù)測結(jié)果的誤差范圍小于5%和10%的個數(shù)進(jìn)行縱、橫向比較;③使用3種長度的樣本訓(xùn)練,預(yù)測不同的長度,對其性能優(yōu)劣性比較。
表4 預(yù)測精度對比Table 4 Prediction accuracy comparison
從維度1來看,3種方法預(yù)測的準(zhǔn)確度均以ARIMA模型的預(yù)測效果最好;從維度2來看,無論是誤差小于5%還是小于10%的個數(shù)均以ARIMA模型最多;從維度3來看,當(dāng)使用的訓(xùn)練樣本數(shù)增加,預(yù)測長度也增加時,GM和SVM預(yù)測的準(zhǔn)確度增加不夠明顯,例如當(dāng)訓(xùn)練樣本從61個增加到100個,預(yù)測長度從25個增加到35個時,預(yù)測準(zhǔn)確度增加,但當(dāng)訓(xùn)練樣本增加到160個,預(yù)測長度增加到60個時,GM和SVM預(yù)測準(zhǔn)確度幾乎不變,ARIMA模型預(yù)測準(zhǔn)確度會增加。
預(yù)測結(jié)果表明,ARIMA模型具有較好的性能,可用于變壓器油中氣體含量的預(yù)測。若每24 h采集一次數(shù)據(jù),對表4中第一行數(shù)據(jù)而言,可以使用61 d的歷史數(shù)據(jù),預(yù)測未來25 d氣體含量的變化趨勢和數(shù)量關(guān)系,而第3行數(shù)據(jù)則顯示,利用此前160 d的數(shù)據(jù),可以預(yù)測此后60 d可能的結(jié)果。
以變壓器油中溶解的氣體H2含量為對象建立模型,由于預(yù)測精度較高,其余氣體含量均能較好地預(yù)測,總結(jié)ARIMA模型預(yù)測方法得到如下結(jié)論:
(1)用于對呈現(xiàn)對數(shù)、線性或隨機(jī)性較強但趨勢性較弱特性的數(shù)據(jù)序列預(yù)測,克服其他預(yù)測方法易存在的過擬合現(xiàn)象,預(yù)測誤差較小,準(zhǔn)確度高。
(2)具有訓(xùn)練樣本長度越長、預(yù)測準(zhǔn)確度越高的特性。
(3)只需導(dǎo)入數(shù)據(jù),即可自動完成變壓器油中溶解氣體含量的預(yù)測,在此過程中不需要人為判斷。