吳 丹,王 俊,許 燕
(1.國網上海市電力公司,上海 200122;2.上海電力實業(yè)有限公司,上海 200025)
現階段充電樁的功能逐漸完善,其設計結構也越來越復雜,受多種因素的影響后,難免發(fā)生各種故障,降低了自身功能。如果運維部門沒有及時發(fā)現和檢修就可能導致嚴重的事故發(fā)生,造成經濟損失,甚至危及到人身安全。因此,應確保充電樁的有效運行,消除潛在故障,公共充電樁故障預測則成為電動汽車行業(yè)在發(fā)展過程中極為重要的技術之一。
近幾年,對充電樁故障的分析研究較多,林越等人[1]進行了一種基于隱生滅過程模型的充電樁故障診斷研究。對狀態(tài)轉移只在相鄰狀態(tài)間發(fā)生的情況進行分析,完成在特定規(guī)則下隱生滅過程模型的構建,通過生滅過程的局部平衡方程組給出了充電樁在發(fā)生故障時的穩(wěn)態(tài)分布,并且對穩(wěn)態(tài)分布物理意義一一解釋。金勇等人[2]提出一種基于故障字典法的交流充電樁故障檢測方法。該方法結合充電樁中電器元件的主要特征,對交流充電樁發(fā)生故障的主要模型進行分析,提取出充電樁內的主回路相關電量特征,采用故障字典法完成故障的監(jiān)測全過程。
但是上述方法只能對現有故障進行及時診斷,無法對未發(fā)生的故障進行預測,不能做到防患于未然,因此,文中構建一種基于深度學習的公共充電樁故障預測模型。
深度學習作為機器學習的一個分支,其實質為多層人工神經網絡,主要通過模擬人腦建立用于分析學習的神經網絡以實現對數據的解釋。深度學習網絡的構架較多,例如卷積神經網絡[3]、循環(huán)神經網絡[4]等,而文中以更適用于充電樁故障預測的深度受限玻爾茲曼機為構建模型的基礎深度學習網絡,實現對充電樁故障預測模型的建立。
受限玻爾茲曼機(Restricted Boltzmann Machine,RBM)為一種無向圖網絡模型,包含卷積層、隱層和可視層3 層網絡。其基本模型如圖1 所示。
圖1 受限玻爾茲曼機模型
RBM 網絡輸入是Nm×Nm二值單元,隱層中含括K個子隱層,各個子隱層大小為Nh×Nh。引入權值共享思想,即在每個相同的子隱層中的單元共享同一個卷積核,每個卷積核即為一個濾波器。若濾波器的大小為Nw×Nw,則各個子隱層共享一個偏置b。對于所有可視層,若共享偏置為c,則RBM 的能量函數可以表示為:
式(1)中,v為可視層,vij為連接i可視層單元與j隱層單元的值;為第i個可視層單元與第k個子隱層內的j單元的值,bk表示k子隱層的偏置。
可視層的輸入值為0-1 二值矩陣,隱層單元也為二值單元,因此為求得隱層單元的具體數值,可采用Gibbs 采樣法[5]。采樣的實現具體過程如下,首先固定可視層v的數值,計算出隱層h的后驗概率,固定隱層的值后,計算可視層v的后驗概率。反復進行以上操作,直至收斂。采樣的數學表達式可以表示為:
式(2)中,σ()· 為sigmiod 函數。在可視層v確定的條件下,進行隱層的采樣操作,同理,在隱層固定后,完成可視層的采樣。獲得各個單元后驗概率后,將后驗概率和均勻分布抽樣后獲得的概率進行比較以激活各層單元。
為便于概率處理,將每個輸入變量歸一化至[0,1]間,對RBM進行進一步優(yōu)化,其能量函數可以表示為:
則可視層神經元的條件概率可以表示為:
式(4)中,N()· 是均值為μ、標準差為σ的正態(tài)分布概率密度,隱藏神經元的條件概率為:
在Gibbs 采樣法的基礎上,加入逐層預訓練過程[6-8]。該過程是從下至上對每一層的RBM 進行學習,使用訓練后的權重θ={ω1,ω2,…,ωl} 構造DBM。
預訓練算法如下:
1)首先使用CD 算法對第一層的RBM 進行訓練,并且在訓練過程中要保持從下自上的權重2ω1為從上到下權重ω1的兩倍。
2)固定2ω1值不變,通過采樣獲得h1,隨后以h1為輸入數據對第二層RBM 進行訓練。
3)固定2ω2值不變,通過采樣獲得h2,并以其為輸入數據對下一層進行訓練。
4)重復以上操作,直至訓練到l-1 層。
5)采用CD 算法對最上層的RBM 進行訓練,在此過程中始終保持由下自上的權重ω1。
6)最后使用權重{ω1,ω2,…,ωl} 構造DBM。
在深度受限玻爾茲曼機的深度學習網絡基礎上,使用極限梯度提升決策樹法構建預測模型。主要思想是將多棵決策樹的模型進行組合,從多維度分析信息,提高模型的準確率[9]。給定含有n個樣本、m個特征的樣本集,表示為D={xi,yi},其中x、y表示特征向量與因變量。訓練時,給定一個目標函數:
式(6)中,w表示模型內待估計函數,l(w)表示損失函數,Ω(w)表示正則化項,該操作的主要作用為控制模型復雜程度。
損失函數的數學表達式為:
式(7)中,表示第t輪模型預測值,=0,fk(xi)表示回歸決策樹。
因此,目標函數的形式可以重新表示為:
采用泰勒二次展開[10-12],形式如下:
定義:
獲得近似目標函數,為了減少計算量,去除常數項,目標函數的形式可以表示為:
隨后將決策樹分為樹結構部分q與葉節(jié)點分數部分ω,則每一個決策樹可以表示為:
對決策樹的復雜程度進行重新定義,如下:
在新定義條件下,新形式的目標函數可以表示為:
此目標中包含了T個獨立單變量的二次函數。將其進行變量求導即可獲得最優(yōu)值如下:
此時即可獲得最佳決策樹:
式(16)中,γ為新子節(jié)點加入后增加的復雜度。當Gain<0 時,XGBoost 停止分裂,此時參數γ正在此處處理復雜性。分裂點為Gain最大值時被認定為最優(yōu)分裂。
充電樁發(fā)生故障可能由多種因素導致而成,其中最為常見的是外部環(huán)境和運維頻率。因此文中從以上兩個方面結合深度學習給出故障預測模型,發(fā)生故障和運維頻率之間的預測模型如下:
式(17)中,Yi,j,j=1,2,…,k為影響第i個樁的j個運維因素,其中包括運維部門處理的及時率Dit、充電樁的硬件質量CZit、維修及時率CWit、充電區(qū)停電時長WCit,定義以上模型的前半部分為運維頻率對故障發(fā)生的影響指數[13-15],則可得:
外部環(huán)境的影響主要反映在天氣對充電樁發(fā)生故障的影響,其模型如下:
式(19)中,Ti,j(j=1,2,…,p)為影響i樁的j種環(huán)境因素,其中包括風向風力、雨雪、溫度等,在多種環(huán)境條件下進行充電樁故障預測[16]。
最后將環(huán)境影響指數與運維影響指數融合給出綜合預測模型,以反映環(huán)境與運維頻率對充電樁發(fā)生故障的總效應,可以表示為:
通過綜合影響模型即可實現充電樁故障預測。
以某一地區(qū)的充電樁作為實驗樣本,采集共一個月時間的樣本數據。在此期間存在充電樁出現故障情況,為驗證文中預測模型的有效性,實驗提供了數據,刪除無效數據后,選擇采集所得數據中的100個樣本數據,將其分為訓練集和測試集,其中80 個為訓練集、20 個為測試集。與文獻[1]、文獻[2]方法進行對比分析,3 種模型所得的ROC 曲線(Receiver Operating Characteristic curve,受試者工作特征曲線)如圖2 所示。
圖2 不同方法的測試集ROC曲線
從圖2 中可以看出,文中方法曲線更靠近左上方,表明文中模型的預測能力更強,從定量數值角度分析,文獻[1]、文獻[2]和文中方法的測試結果如表1所示。從表1 中可以看出,3 種方法的AUC(Area Under Curve,ROC 曲線下方的面積大小)數值分別為0.887、0.872、0.864,測 試集的準 確率為89.21%、93.46%、97.78%,進一步證明了文中方法的準確率更高,實際應用價值更高。
表1 不同方法測試結果
故障預測能夠為充電樁的日常運維提供數據基礎[17],因此文中以公共充電樁較為常見的故障原因為理論基礎,結合深度學習法提出了一種基于深度學習的公共充電樁故障預測模型,并且通過實驗證明了所提方法具有較高的預測準確性,獲得了階段性研究進展,但是還存在一些問題需要進一步探索。