付卿卿
(貴州電網(wǎng)有限責任公司, 貴州,貴陽 550002)
隨著我國經(jīng)濟的發(fā)展和社會的進步,我國終端數(shù)據(jù)的接入量和采集量逐漸地上升,尤其是電力計量數(shù)據(jù)的積累呈現(xiàn)高儲備的趨勢。每天僅電力計量數(shù)據(jù)的積累就高達上億,故障問題也隨之頻繁發(fā)生,因此需要有效的電力故障診斷模型從儲備的電力計量數(shù)據(jù)中挖掘潛在的規(guī)律,科學準確地預測電力故障問題。電力故障的有效預測也可以幫助企業(yè)提高電網(wǎng)的運行效率,節(jié)約維護過程中所需的成本。針對該領域的研究正處于發(fā)展的階段,部分專家學者[1-2]利用回歸分析法建立預測模型,從多因素預測角度出發(fā),分析因素變量間的相關性,判定不同因素對電力故障的影響。也有部分專家[3-4]學者從電力計量數(shù)據(jù)的角度出發(fā),利用電力計量數(shù)據(jù)得到計量系統(tǒng)網(wǎng)絡阻抗與電流互感器一次、二次側(cè)短路故障之間的關系,將得到的規(guī)律應用在故障檢測中,但是并沒有真正地實現(xiàn)預測智能化,更好的還是將規(guī)律和主觀經(jīng)驗判斷相結(jié)合,再將判斷后的經(jīng)驗用于預測。還有部分專家學者[5-6]利用人工智能技術(shù)建立診斷模型,旨在從海量的電力計量數(shù)據(jù)中挖掘潛在的規(guī)律,但是模型更多是在理論上構(gòu)建,并未真正地實現(xiàn)故障的診斷,也未真正地將模型搭建起來。
綜上可知,目前利用電力計量數(shù)據(jù)實現(xiàn)電力故障的預測是一種大的趨勢,主要集中在知識經(jīng)驗判斷、數(shù)據(jù)理論模型分析等方面。這些診斷方法十分依賴人工操作和專家的經(jīng)驗,而采集海量的數(shù)據(jù)時,電力計量終端極容易出現(xiàn)問題,故障情況經(jīng)常發(fā)生。因此,本研究利用優(yōu)化的Tradaboost回歸算法建立電力故障預測模型,從大量的電力計量數(shù)據(jù)中挖掘潛在的規(guī)律,實現(xiàn)電力計量數(shù)據(jù)驅(qū)動。
電力計量數(shù)據(jù)的獲取主要通過電度表、電壓互感器、電流互感器,并獲取二次側(cè)電流。對于高壓電力計量系統(tǒng)故障性質(zhì)深入分析可知,將故障分為直接可診斷的故障和間接可診斷的故障。直接可診斷的故障即直接通過電力儀表的測量結(jié)果,判斷是否可以直接發(fā)生,并不需要深入的研究潛在的故障特性。間接診斷的故障指電力計量數(shù)據(jù)長期儲存后,通過相應的模型算法可以實現(xiàn)對故障的提前預測,因為電力計量數(shù)據(jù)是多維度數(shù)據(jù)的綜合,因此可以在主觀觀測不到的情況下實現(xiàn)提前預測的功能。根據(jù)高壓電力計量系統(tǒng)的結(jié)構(gòu),對計量回路的多個參數(shù)進行檢測和電力實時監(jiān)測樣本的采集。將歷史數(shù)據(jù)和實時監(jiān)測的數(shù)據(jù)輸入神經(jīng)網(wǎng)絡預測模型中,實現(xiàn)對監(jiān)測情況的提前預測,對故障問題進行處理和分析。
在積累了大量的電力計量數(shù)據(jù)的基礎上,為解決Tradaboost算法權(quán)重初始化策略,利用LR()算法進行優(yōu)化,為得到源域中與目標域數(shù)據(jù)分布類似的數(shù)據(jù)集,以類似度為標準對數(shù)據(jù)進行權(quán)重初始化,本文引入LR算法來優(yōu)化Tradaboost源樣本權(quán)重初始化步驟,將數(shù)據(jù)先通過LR算法進行篩選。LR算法的本質(zhì)是二分類概率輸出器,通過LR算法分類后,可以認為更加靠近決策邊界的源域數(shù)據(jù)與目標域數(shù)據(jù)類似程度更高。假設源域數(shù)據(jù)分布為a,標記為0,目標域數(shù)據(jù)分布為b,標記為1。訓練LR模型,將得到分類概率,這個概率即可作為源域數(shù)據(jù)與目標域數(shù)據(jù)特征分布的類似程度。因此,LR被分類器判定為b的源域數(shù)據(jù)的初始權(quán)重更大。
原始Tradaboost算法是分類模型,子學習器為弱分類器,本文涉及的電力故障預測是回歸問題,因此需要子學習器換成SVR回歸器代替弱分類器。定義訓練集為(xi,yi),i=1,…,l,是xi∈Rn,l為數(shù)據(jù)總量,n為影響因素維數(shù),xi∈Rn為輸入值,yi=R為輸出期望值。其目標回歸函數(shù)為
f(x)=ωφ(x)+b
(1)
式中,φ(x)為輸入空間到特征空間的非線性映射,ω為權(quán)重向量,b為優(yōu)化參數(shù)。再添加回歸損失函數(shù)ε,如式(2),SVR即可進行回歸預測。
(2)
如式(2)損失函數(shù)所示,若預測值與期望值的絕對差小于ε,即視預測值為正確,反之則認為預測錯誤。SVR算法引入了松弛變量ξi和懲罰系數(shù)C,優(yōu)化目標函數(shù)如式(3):
(3)
引入拉格朗日乘子法可得式(3)最優(yōu)解:
(4)
算法的步驟如下。
輸入:SVR回歸器,Ds,Dt,Test,μ,ρ,H。
輸出:預測故障發(fā)生的程度,基于目標域的強回歸器f(x)。
Step 1 源域樣本權(quán)重初始化。合并源域和目標域訓練集Ds和Dt,對訓練集數(shù)據(jù)進行歸一化。調(diào)用LR算法進行Tradaboost源樣本權(quán)重初始化,為源域中同目標域數(shù)據(jù)分布類似的數(shù)據(jù)賦予更大的初始權(quán)重。
Step 2 初始化源域樣本更新方式?(s),ns為源域樣本總量。
(6)
Step 3 設置迭代次數(shù)H。Forth=1,2,3,4,…,H。
Step 6 計算暫定強學習器f(x)在目標域訓練集Dt上的誤差εi。
Step 7 重置Dt樣本權(quán)重更新方式。
(7)
Step 8 計算暫定強學習器f(x)在源域訓練集Dt上的誤差εi,更新合并訓練集樣本權(quán)重ωi+1。
(8)
ωi+1=ωi+1?(t+1)
(9)
Step 9 得到的源域樣本權(quán)重如小于樣本排除參數(shù)值μ,則排除該樣本,不參與下一次迭代。
Step 10 迭代次數(shù)m>M,結(jié)束循環(huán),輸出最終強學習器。
將電力計量數(shù)據(jù)輸入到LR-Tradaboost算法中,再將目標域前20組數(shù)據(jù)和源域全部數(shù)據(jù)合并成訓練集對模型進行訓練,將目標域后7組數(shù)據(jù)作為測試集驗證模型預測性能。為驗證傳統(tǒng)機器學習模型在電力故障預測問題上的適用性,將不同方法下的訓練結(jié)果進行對比。SVR算法訓練集為目標域前20組數(shù)據(jù),測試集為目標域后7組數(shù)據(jù)。同時,為驗證LR-Tradaboost算法在預測性能方面的作用,利用針對回歸問題的Tradaboost-R2算法同LR-Tradaboost算法的訓練結(jié)果作以比較,Tradaboost-R2算法的訓練集和測試集與LR-Tradaboost算法相同。選用回歸算法評價指標均方根誤差RMSE以及R2作為算法訓練結(jié)果的評價指標,對比不同算法測試集預測結(jié)果的均方根誤差以及R2來對模型進行對比和評價,實現(xiàn)算法預測性能的驗證。見表1。
表1 電力計量數(shù)據(jù)發(fā)生異常的真實值與預測值對比表
為了對比LR-Tradaboost算法和Tradaboost-R2算法的學習效率,在2種算法的訓練過程中,每隔10次迭代過程,分別計算2種算法得到的暫定強學習器的R2,得到算法的收斂程度。圖1為LR-Tradaboost算法和Tradaboost-R2算法的回歸收斂速度的對比圖。由圖1得到,LR-Tradaboost算法在迭代次數(shù)為50時已經(jīng)收斂,模型分數(shù)R2達到了0.81,之后的迭代過程中R2不再增加?;诘玫矫黠@的收斂程度變化趨勢和減少計算工作量的考慮,本研究采用每10次迭代計算一次算法R2,實際上LR-Tradaboost算法的收斂發(fā)生在迭代次數(shù)40到50的閉區(qū)間內(nèi),并非在第50次迭代后達到收斂。由圖2可得,Tradaboost-R2算法在進行50次迭代后,模型分數(shù)僅為0.21,且仍處于上升趨勢,事實上Trada-boost-R2算法在100到110次迭代之間才完成收斂。對比2種算法的收斂速度,發(fā)現(xiàn)LR-Tradaboost算法的收斂速度幾乎是Tradaboost-R2算法的2倍,證明了LR-Tradaboost算法在利用電力計量數(shù)據(jù)預測電力故障上效果更好,基于LR的優(yōu)化權(quán)重初始化策略有效提高了算法性能及效率。
圖1 算法回歸收斂對比圖
本研究主要利用電力計量數(shù)據(jù)結(jié)合優(yōu)化Tradaboost回歸算法實現(xiàn)電力故障的預測,提出了LR算法優(yōu)化權(quán)重初始化策略的LR-Tradaboost算法,同Tradaboost-R2算法預測結(jié)果和收斂速度作對比,LR-Tradaboost預測誤差比Tradaboost-R2少,而收斂速度LR-Tradaboost幾乎是Tradaboost-R2的2倍,故LR-Tradaboost算法在電力故障預測中效果較好。