方衛(wèi)東,陳漢林,陳子標
(福建工程學院 信息科學與工程學院,福建 福州 350118)
SOC(state of charge,荷電狀態(tài),用來反映電池的剩余容量)是電池管理系統(tǒng)的重要參數(shù)之一,SOC低故障是剩余容量占電池容量過低,在國標《電車汽車遠程服務(wù)與管理系統(tǒng)技術(shù)規(guī)范》[1]中標注為重點故障。國內(nèi)純電動客車的SOC低故障常常發(fā)生在每日行車的最后時段,與充電后的SOC值、行駛里程、路況、載客量、天氣等因素相關(guān)[2]。
在純電動客車頻繁發(fā)生的20項故障統(tǒng)計中,SOC低報警故障占總故障的4.63%[3]。SOC越低意味著放電深度越深,會導致電池壽命縮短及電壓和電流輸出不穩(wěn)定,嚴重影響交通及行車安全[4]。純電動客車SOC低故障預(yù)測主要是車輛能耗預(yù)測。當前國內(nèi)對車輛能耗預(yù)測模型一般以續(xù)航里程作為指標,且著重分析車輛電池參數(shù)對里程的影響[5],或者是通過歷史的平均能耗和電池剩余能量預(yù)測未來的行駛能量損耗[6-7]或者通過GPS軌跡信息預(yù)測未來一段時間的能耗[8]。這些方法需要建立復雜的路況模型、電池模型、車輛運行模型,計算量和估計難度較大。針對上述問題,本研究以隨機選取某車企50輛純電動公交車,近8 400萬條運行樣本數(shù)據(jù)為研究對象,提出基于ARIMA方法的SOC低故障預(yù)測模型,并采用混淆矩陣的真陽率與誤診率為評估指標,驗證方法的有效性。
ARIMA模型為差分自回歸移動平均模型,是時間序列分析中最常見的一種模型,實際是差分運算與自回歸移動平均模型(ARMA)的結(jié)合[9]。
設(shè)xt為時間序列,B為后移算子,即Bxt=xt-1,記為差分算子,則:
(1)
一般有:
(2)
式中Cid=d!/i!(d-i)!,表明差分后序列等于原序列的若干序列值的加權(quán)和。若xt在d階差分后平穩(wěn),則滿足式(3)的可稱為差分自回歸移動平均模型,記為ARMA(p,d,q)模型。
(3)
式中Φ(B)=1-?1B-…-?pBp,為ARMA(p,q)模型的自回歸系數(shù)多項式;Φ(B)=1-θ1B-…-θqBq,為ARMA(p,q)模型的移動平滑系數(shù)多項式。{εt},{εs}為零均值白噪聲序列。
研究數(shù)據(jù)符合《電車汽車遠程服務(wù)與管理系統(tǒng)技術(shù)規(guī)范》,具有驅(qū)動電機數(shù)據(jù)、車輛位置數(shù)據(jù)、發(fā)動機數(shù)據(jù)、整車數(shù)據(jù)、報警數(shù)據(jù)等[9]。其中,與SOC低故障相關(guān)的字段具有4項:充電開始時間、充電開始SOC、截止下次充電前消耗SOC、截止下次充電前運行里程。
純電動客車每輪充放電的SOC變化有:
(4)
SOCt為純電動客車t輪開始充電的SOC值,SOCt-1是純電動客車t-1輪開始充電的SOC值,SOCChargingt-1是t-1輪充電時刻的總充電SOC,SOCConsumedt為t-1輪充電后車輛運行消耗的SOC。
由于純電動客車在營運結(jié)束后會充電較長的時間,在結(jié)束充電的時候SOC一般為100%,并且由于路線較為固定的原因,每日的運行里程也較為固定。如圖1部分展示某輛車截止下次開始充電前消耗的SOC與截止下次開始充電前運行里程之間的關(guān)系,實線為消耗的SOC,虛線為運行里程,星形標志為該過程發(fā)生SOC低故障。從圖可以看出,即使在里程變化較小的情況下,不同運行周期SOC的消耗依舊不一致,這主要是由載客量、天氣、路況、駕駛習慣等因素導致。如果需要定性的分析這些因素就需要建立復雜的路況模型、電池模型、車輛運行模型,而采用時間序列的分析方法可以更為簡單直接地預(yù)測結(jié)果。
圖1 消耗SOC與運行里程關(guān)系
將50輛純電動客車從2019年11月到2019年12月的報SOC低故障時的SOC值拼接如圖2顯示,共計27 218次故障,有效故障56次,橫坐標為充電次數(shù),縱坐標為開始充電SOC值。從圖2中明顯可以發(fā)現(xiàn)故障時刻的SOC值均小于20%,因此可以確定SOC低故障的閾值為20%。
圖2 SOC低故障情況
利用VIN(vehicle identification number,車輛識別號)為L*76407的純電動客車2018年6月1日~2020年4月1日共計346次充電過程的起始充電SOC數(shù)據(jù)標定模型和訓練樣本,然后對50輛純電動客車2020年4月1日~2020年5月1日的開始充電SOC進行故障預(yù)測。
出于數(shù)據(jù)的安全性考慮,車輛L*76407的VIN只顯示第一位和最后五位作為標識,該車積累數(shù)據(jù)近2年,總數(shù)據(jù)量為3.9 GB,有效SOC低故障數(shù)量為25次,總行駛里程為7.5萬km,數(shù)據(jù)的時間跨度為2018年6月1日至2020年4月1日,每日運行里程維持在140 ~175 km,單趟行程為34 km,固定行駛在湖南省永州市東安縣。將車輛數(shù)據(jù)根據(jù)比例0.66分割為訓練集和測試集如圖3,訓練集為實線,測試集為虛線,星形標志為該過程發(fā)生SOC低故障。
圖3 開始充電SOC序列的訓練集和測試集
一個時間序列是幾種變化形式的疊加或耦合:趨勢序列Tt、季節(jié)序列St、循環(huán)序列Ct、殘差序列It。趨勢序列是原始序列在較長時期內(nèi)持續(xù)發(fā)展變化的一種趨向或狀態(tài),循環(huán)序列是不具嚴格規(guī)則的周期性連續(xù)變動,殘差序列是由于眾多偶然因素對時間序列造成的影響。時間序列Y可以表示為以上四個因素的函數(shù),即:Yt=F(Tt,St,Ct,It)。其中F()常用的模型分為加法模型和乘法模型,從圖3發(fā)現(xiàn)開始充電SOC序列的季節(jié)性并不明顯,故而采用加法模型:
(5)
對開始充電SOC序列的訓練集分解如圖4所示。其中,季節(jié)序列具備明顯的規(guī)律,趨勢序列較為平滑,有利于后續(xù)的預(yù)測分析。殘差序列圍繞著橫坐標軸不斷上下波動,可以判斷為白噪聲序列,對其從小到大排序并取5%(-5.540)為預(yù)測值疊加量。
圖4 季節(jié)性分解
3.2.1 平穩(wěn)性檢測
對給定的時間序列進行ARIMA模型的分析與預(yù)測需要序列符合平穩(wěn)性,否則會出現(xiàn)偽回歸問題。ADF檢測序列是否存在單位根可判斷平穩(wěn)性,存在單位根則是非平穩(wěn)序列。對季節(jié)性分解后的趨勢序列進行分析,檢測結(jié)果表明:ADF值-1.529 404,大于1%、5%、10%的3個顯著性水平下的臨界值,統(tǒng)計量P值為0.518 919,大于臨界值0.05,接受原假設(shè),所以該序列為非平穩(wěn)序列,需要進行差分處理。
3.2.2 參數(shù)標定
對趨勢序列進行一階差分處理如圖5,結(jié)果基本對稱且在0值附近波動,初步判斷屬于平穩(wěn)狀態(tài)。通過ADF平穩(wěn)性檢測結(jié)果表明:ADF值-3.045 144大于10%的顯著性水平下的臨界值,統(tǒng)計量P值為0.038 881,小于0.05,不滿足存在單位根的原假設(shè),故而一階差分后的序列穩(wěn)定,可對其進行ARIMA建模分析。
圖5 趨勢序列一階差分
由于一階差分后,序列已經(jīng)維持穩(wěn)定,差分階數(shù)d=1,進而對趨勢序列建立ARIMA(p,1,q)模型。根據(jù)一階差分的ACF圖(autocorrelation function,自相關(guān)函數(shù)),PACF圖(partial autocorrelation function,偏自相關(guān)函數(shù))的拖尾及截尾狀況,可以得到相關(guān)的p,q參數(shù)。
對差分序列做ACF和PACF如圖6所示,自相關(guān)5階拖尾,偏相關(guān)6階拖尾,即p=5,q=6。此時模型ARIMA(5,1,6),表達式為:
圖6 差分序列定階
(6)
則
(7)
最后計算出:
(8)
將上述獲取得到的模型用于測試集中進行擬合數(shù)據(jù),結(jié)果如圖7(a),均方誤差為0.129。預(yù)測結(jié)果疊加季節(jié)性序列和殘差疊加量-5.540,顯示結(jié)果如圖7(b),實線為測試集,虛線為預(yù)測結(jié)果,可以發(fā)現(xiàn)測試集中屬于閾值線以下的故障點基本和預(yù)測結(jié)果符合。
圖7 SOC低故障預(yù)測結(jié)果
以50輛純電動客車2020年4月1日~2020年5月1日的數(shù)據(jù)的SOC建立ARIMA(5,1,6)模型,從而驗證模型的有效性與可行性。數(shù)據(jù)共948次充電過程,其中發(fā)生SOC低故障數(shù)為56次,由于故障樣本占總數(shù)的十分之一以下,屬于分類不均衡問題,故而采用混淆矩陣的準確率(ACC)、真陽率(TPR)、誤診率(FNR)作為評估指標。準確率提供了實驗結(jié)果的全局信息,真陽率是正確預(yù)測為正的樣本占全部正樣本的比例,誤診率是實際為反例的樣本中,預(yù)測為正例的占比,預(yù)測結(jié)果的二元分類混淆矩陣如表1。
表1 基于ARIMA的SOC低預(yù)測結(jié)果混淆矩陣
從表1可以觀察到,TP(本身為故障,預(yù)測結(jié)果也為故障)是54個,TN(本身為正常,預(yù)測結(jié)果也為正常)是800個,F(xiàn)N(本身是故障,預(yù)測結(jié)果為正常)是2個,F(xiàn)P(本身是正常,預(yù)測結(jié)果為故障)是92個。
準確率:
真陽率:
誤診率:
從結(jié)果可知,2020年4月1日~2020年5月1日故障預(yù)測的準確率為90.1%,真陽率為96.4%,誤診率為10.3%,表明ARIMA模型具有良好的預(yù)測效果與實用性。
針對于純電動客車SOC低故障預(yù)測問題,首先分析了車輛運行周期的能耗特征,然后結(jié)合充電開始SOC特性,通過差分獲得平穩(wěn)序列,構(gòu)建差分自回歸滑動平均模型以擬合數(shù)據(jù)的趨勢性和周期性,最后以湖南某運營公司的純電動客車開始充電SOC數(shù)據(jù)進行模型參數(shù)標定,利用構(gòu)建的模型預(yù)測與診斷故障,將結(jié)果與實際故障比較進行驗證。結(jié)果顯示,針對于不同的純電動客車,真陽率在96.4%,誤診率在10.3%,驗證了模型的故障預(yù)測有效性。
基于ARIMA的SOC低故障預(yù)測結(jié)果為公交運營公司的車輛排班與出行計劃提供重要參考依據(jù),對提高運營管理具有顯現(xiàn)實意義,但是故障預(yù)測結(jié)果有10.3%的故障誤診率,如何提高真陽率的同時減低誤診率將作為未來的研究方向。