劉偉霞,田 勛,肖家勇,常 偉,李 源,毛 樑
(1北京新能源汽車股份有限公司,北京100176;2上海覺云科技有限公司,上海200030)
隨著電動汽車在中國的推廣和車聯(lián)網(wǎng)技術(shù)的應(yīng)用,其保有量持續(xù)增加,電動汽車的行車數(shù)據(jù)根據(jù)國家標(biāo)準(zhǔn)(GB/T 32960)[1]進(jìn)行實時采集。電池作為電動汽車的動力來源,隨著充放電次數(shù)和行駛里程的增加,容量不斷衰減。電池作為典型的動態(tài)非線性電化學(xué)系統(tǒng),其退化狀態(tài)識別和狀態(tài)估計仍存在巨大挑戰(zhàn)。因此亟需能夠動態(tài)、自學(xué)習(xí)和優(yōu)化的算法進(jìn)行電池健康度(SOH,state of health)的精確估算。
SOH 估算是用來判斷電池健康狀況的一種方法,采用電池所能充入或放出電量與電池標(biāo)稱容量的百分比表示。對于新電池,其值一般大于100%,隨著電池的使用以及老化,其值逐漸降低,依據(jù)IEEE 標(biāo)準(zhǔn)1188—1996[2]規(guī)定,當(dāng)動力電池的容量能力下降到80%時,應(yīng)更換電池。
獲得SOH的傳統(tǒng)方法大致包括:
(1)開路電壓的IC 曲線:鋰離子電池容量增量法即ICA(incremental capacity analysis)是研究鋰離子電池衰減機(jī)理分析常用的方法,該方法可將平緩的電壓平臺轉(zhuǎn)化為容量增量曲線中的峰值,使用Lorentz 函數(shù)擬合IC 峰以獲得IC 峰的特征參數(shù)。如式(1)所示,其中Ai是第i個IC峰下方的面積,Wi是第i個IC峰的半峰寬,V0i是第i個IC峰的對稱中心,V為動力電池的外部電壓。通過轉(zhuǎn)換為整數(shù)形式來簡化,可得到式(2)中所示的電池充電模型,其中C為常數(shù)。
(2)安時積分法:通過每個充電段中的SOC(充電狀態(tài))變化計算每次充電中的充電容量,使用SOC 更改來標(biāo)準(zhǔn)化容量,以獲得與SOH 每百分之一相對應(yīng)的容量,乘以100即可得出當(dāng)前時間計算出的總可用容量。
(3)卡爾曼濾波方法[3]:需先前樣本的系統(tǒng)變量,以及當(dāng)前樣本的強(qiáng)制術(shù)語和觀察值。
(4)大數(shù)據(jù)方法[4]:利用電池歷史數(shù)據(jù)和實測數(shù)據(jù),依靠大數(shù)據(jù)平臺提供的海量分布式存儲和并行計算功能,提取相關(guān)特征以實現(xiàn)SOH 在線估算并通過單體之間的差異進(jìn)行校正。
上述方法僅能計算歷史SOH 數(shù)據(jù),而無法知悉當(dāng)前狀態(tài)。因此,文章實現(xiàn)了利用機(jī)器學(xué)習(xí)技術(shù)預(yù)測電池SOH 的方法。通過長期的數(shù)據(jù)收集,使用電池額定值信息和狀態(tài)監(jiān)視數(shù)據(jù)來挖掘隱藏的電池健康狀態(tài)信息及其演變規(guī)則。文章建立了機(jī)器學(xué)習(xí)模型以實現(xiàn)實時預(yù)測,并在此基礎(chǔ)上開發(fā)了應(yīng)用LSTM網(wǎng)絡(luò)的電池未來趨勢預(yù)測模型。
文章的研究基于大量實車數(shù)據(jù),采集跨度從2018年中至2020年初,持續(xù)收集數(shù)據(jù)時間跨度達(dá)500 天。該批數(shù)據(jù)直接來自兩種車型共計600 輛,數(shù)據(jù)采集規(guī)則為每隔10 s 記錄一次,共計收集約4.2億個數(shù)據(jù)樣本。
上述電動汽車電池的數(shù)據(jù)為電動汽車監(jiān)控數(shù)據(jù),監(jiān)控數(shù)據(jù)包括正常使用狀況下與電池相關(guān)的電池自身數(shù)據(jù)以及汽車狀態(tài)數(shù)據(jù),內(nèi)含超過200個數(shù)據(jù)變量。數(shù)據(jù)形式均為基于時間序列的流式數(shù)據(jù),包括與機(jī)器學(xué)習(xí)算法訓(xùn)練相關(guān)的電流、電壓、溫度、剩余電量(SOC)等,由以上實測數(shù)據(jù)獲得SOH的處理步驟為:①根據(jù)總電壓劃分提取充電片段區(qū)間(劃分穩(wěn)定的電壓、電流區(qū)間);②在區(qū)間內(nèi)用電流和時間的積分獲得區(qū)間內(nèi)充入的容量(A·h);③對每輛車的每次充電片段重復(fù)①②步驟;④對每輛車的所有容量數(shù)據(jù)進(jìn)行篩選(去除異常值);⑤采用滑動平均進(jìn)行容量平滑;⑥定義初始容量為100%容量,后續(xù)容量除以初始容量得到SOH數(shù)值。
文章主要基于處理后的數(shù)據(jù)為研究對象,為確保高質(zhì)量的數(shù)據(jù)、提高結(jié)果的準(zhǔn)確性,因此需對收集的數(shù)據(jù)進(jìn)行整理。數(shù)據(jù)排序必須首先清理數(shù)據(jù),并制定相應(yīng)的清理規(guī)則,以將低質(zhì)量的數(shù)據(jù)轉(zhuǎn)換為符合數(shù)據(jù)質(zhì)量要求的數(shù)據(jù),清理規(guī)則包括空余賦值、錯值去除、交叉檢驗等。
由于在后續(xù)的處理步驟中需對數(shù)據(jù)進(jìn)行處理和計算,為便于計算和識別數(shù)據(jù)的特征,首先需要對整理后的數(shù)據(jù)進(jìn)行特征化以便于展現(xiàn),從而便于計算和識別。由圖1可知:重要性相對較高的兩個特征為mile 和day,重要性相對較低的特征為over_in_charge。
圖1 特征重要性對比Fig.1 Comparison of feature importance
容量轉(zhuǎn)換如圖2所示,對容量數(shù)據(jù)進(jìn)行異常值剔除,整體過程如下:①獲得原始數(shù)據(jù)點;②采用箱線圖的方法展示整體數(shù)據(jù)結(jié)果,刪除大于98%和小于2%分位數(shù)的數(shù)據(jù)點;③針對每20個連續(xù)的數(shù)據(jù)點,刪除最高的值(若最高值為第一個,則不刪除)和最低的值(若最低值為最后一個,則不刪除);④對數(shù)據(jù)進(jìn)行滑動平均,滑動窗口大小取數(shù)據(jù)長度的1/3。
構(gòu)造預(yù)測模型包含兩階段:
(1)當(dāng)前實時電池運行狀況預(yù)測模型:該模型將實時輸入當(dāng)前的一組特征值,并返回模型預(yù)測的當(dāng)前電池運行狀況。
(2)未來電池健康狀態(tài)預(yù)測模型:從原始數(shù)據(jù)中提取充電段特征后,需按天補(bǔ)充缺失的數(shù)據(jù),刪除重復(fù)數(shù)據(jù),以相等間隔提取數(shù)據(jù),區(qū)分SOH 序列,將數(shù)據(jù)標(biāo)準(zhǔn)化并應(yīng)用滑動窗口將非監(jiān)督數(shù)據(jù)轉(zhuǎn)換為監(jiān)督數(shù)據(jù)的方法,區(qū)分訓(xùn)練集和測試集,最后建立LSTM模型以預(yù)測未來3個月的電池SOH走向。
圖2 容量轉(zhuǎn)換Fig.2 Conversion of capacity
針對此問題,本文對6個機(jī)器學(xué)習(xí)模型進(jìn)行了訓(xùn)練,模型包括:L1、L2正則化的線性回歸模型;Ridge 和Lasso 回 歸; XGBoost; LightGBM;CatBoost 以及LSTM 模型。鑒于實時預(yù)測SOH 屬于回歸問題,因此文章選擇平均絕對誤差(MAE)進(jìn)行模型性能的衡量。
3.2.1 特征工程
為得到相關(guān)性最高的特征輸入模型,文章依據(jù)安時積分法計算出相應(yīng)SOH 具有明顯正相關(guān)和負(fù)相關(guān)的特征。
3.2.2 模型選擇
(1)線性回歸模型(Ridge和Lasso)
線性回歸模型的問題在于參數(shù)和變量之間的線性關(guān)系。由于準(zhǔn)確率很大程度上取決于數(shù)據(jù)集本身,因此當(dāng)數(shù)據(jù)不在規(guī)則范圍內(nèi)時,導(dǎo)致模型性能不穩(wěn)定,且模型和參數(shù)適用范圍窄。為解決此問題,文章選取基于梯度增強(qiáng)決策樹的模型。
(2)基于梯度提升決策樹的模型
梯度提升決策樹通過使用強(qiáng)大的損失函數(shù),可以更好地處理離群值。XGBoost、LightGBM 和CatBoost 模型優(yōu)化了分布式梯度提升庫。XGBoost 提供了并行計算[5],LightGBM 支持并行和GPU計算[6],而CatBoost支持分類變量指標(biāo)[7]。
(3)深度神經(jīng)網(wǎng)絡(luò)
文章設(shè)計了常規(guī)的三層神經(jīng)網(wǎng)絡(luò),其中第1層包含256 個神經(jīng)元,第2 層包含128 個神經(jīng)元,第3 層包含64 個神經(jīng)元,應(yīng)用ReLu 作為激活函數(shù),批處理大小為128,迭代次數(shù)設(shè)置為3000。
應(yīng)用學(xué)習(xí)率衰減技術(shù)進(jìn)行動態(tài)調(diào)整,當(dāng)優(yōu)化達(dá)到瓶頸時,當(dāng)前學(xué)習(xí)率可能不再適合優(yōu)化。相對而言,當(dāng)模型學(xué)習(xí)率較大時,步長變大或?qū)е聯(lián)p失函數(shù)收斂結(jié)果而無法達(dá)到最低要求。因此起始訓(xùn)練時將學(xué)習(xí)率設(shè)置為0.1,若經(jīng)過100 次迭代后損失函數(shù)未減小,則學(xué)習(xí)率減半。
實驗得到模型平均絕對誤差為0.034,其實驗表現(xiàn)與CatBoost 和LightGBM 相比并無顯著優(yōu)勢。各模型的預(yù)測結(jié)果見表1 及圖3 所示預(yù)測效果圖,其中綠點表示該時刻真實值,紅點表示預(yù)測值。可直觀得出LightGBM和CatBoost的效果最優(yōu)。
表1 各模型的平均絕對誤差比較Table 1 Comparison of average absolute error of each model
3.2.3 混合模型
通過在兩輛實車測試CatBoost和LightGBM的混合模型,對比模型預(yù)測值與實際觀測數(shù)值,得到如表1所示的實驗結(jié)果,同時如圖4所示對兩個模型的預(yù)測結(jié)果詳細(xì)解釋了如何對兩個模型進(jìn)行均值融合。
圖3 模型測試結(jié)果Fig.3 Test results of models
3.2.4 模型選擇小結(jié)
由表1可知,CatBoost模型性能最佳,其次為LightGBM 模型,兩者性能差異較小,與其他模型之間性能差距較大,因此文章取輸出平均值對兩種模型進(jìn)行混合,以獲得更好實驗結(jié)果。
圖4 LightGBM與CatBoost混合模型Fig.4 Combined model of LightGBM and CatBoost
對于未來健康狀況預(yù)測,研究目標(biāo)為獲得SOH 的衰減曲線。根據(jù)事物發(fā)展的連續(xù)性,該問題屬于對于未來健康狀況預(yù)測,研究目標(biāo)為獲得SOH 的衰減曲線。根據(jù)事物發(fā)展的連續(xù)性,該問題屬于時間序列預(yù)測問題[8],因此文章選取長短期記憶模型(LSTM)進(jìn)行未來電池健康狀態(tài)趨勢的分析。
由于采集的總數(shù)據(jù)量大,訓(xùn)練全部數(shù)據(jù)周期過長,因此文章從總體數(shù)據(jù)中抽取4000 萬條數(shù)據(jù)作為樣本數(shù)據(jù)集。為保證數(shù)據(jù)分布的平衡性,樣本數(shù)據(jù)集的選取綜合考慮季節(jié)、時段等因素。最后將樣本數(shù)據(jù)集以0.7、0.2以及0.1的比例劃分為訓(xùn)練集、驗證集與測試集。由于模型的唯一特征為SOH 數(shù)值本身,但文章未直接使用電池的SOH 數(shù)據(jù),而是在每個時間間隔計算其差值。此處理,將保證無論某個電池的SOH 在何種范圍內(nèi)進(jìn)行波動,其差值變動小,因此分布不會受到影響,訓(xùn)練集,驗證集和測試集將共享相似的分布范圍。為確保模型參數(shù)不超過樣本大小,文章針對小樣本集設(shè)計小模型。LSTM 模型損失函數(shù)收斂情況如圖5 所示,測試效果如圖6所示,圖中綠點表示真實值,紅點表示預(yù)測值,同時圖7詳細(xì)描述了模型對13個周的數(shù)據(jù)進(jìn)行預(yù)測,得出對應(yīng)預(yù)測值。
圖5 LSTM與損失函數(shù)收斂示意圖Fig.5 Convergence diagram of LSTM loss function
圖6 LSTM模型測試效果Fig.6 Diagram of LSTM’s results
圖7 LSTM數(shù)據(jù)流Fig.7 Data flow of LSTM
研究了估計實時SOH 并預(yù)測未來衰減趨勢的方法,實驗結(jié)果表明兩個模型在處理此類數(shù)據(jù)集方面表現(xiàn)良好。CatBoost和LightGBM的混合模型在預(yù)測實時SOH 方面具有較低的平均絕對誤差,彌補(bǔ)了安時積分法的缺陷,該混合模型易于調(diào)參,且適用于廣泛的數(shù)據(jù)集。LSTM網(wǎng)絡(luò)對于預(yù)測未來的趨勢具有出色的性能,文章驗證了其預(yù)測SOH 衰減趨勢的良好效果。通過構(gòu)建以上模型,電池使用相關(guān)方可更好地掌控新能源汽車鋰電池的狀態(tài),從而實現(xiàn)相關(guān)的調(diào)度管理。