趙 珍, 龐曉瓊, 董淵昌
(中北大學 計算機科學與技術學院, 山西 太原 030051)
近年來, 隨著儲能技術的發(fā)展, 鋰離子電池(Lithium-Ion Batteries, LIBs)已經(jīng)成為可再生能源存儲的主流方案之一。從便攜式設備到電動汽車再到航空航天系統(tǒng), 設備的正常運行都離不開LIBs穩(wěn)定的能源供應[1-3]。然而, 隨著使用周期的增加, LIBs性能會逐漸下降, 直到達到失效閾值。在此之后, 電池的性能將會大幅下降, 進而可能威脅到電力系統(tǒng)能源供應的穩(wěn)定性, 甚至導致災難性的后果[4-7]。近年來, 由LIBs性能故障引起的電動汽車駕駛事故案例日趨增加, 這雖然和電動汽車普及率的提高有關, 但同時也說明, LIBs的性能安全問題仍然是一個亟需關注的問題。因此, 構建鋰離子電池退化狀態(tài)監(jiān)測系統(tǒng)具有重要的現(xiàn)實意義[8-10]。
到目前為止, 已有不少文獻從不同角度提出了各種策略來實現(xiàn)LIBs健康狀態(tài)和剩余使用壽命(Remaining Useful Life, RUL)的預測。這些策略根據(jù)研究側重點的不同可以分為兩大類: 基于模型的方法和數(shù)據(jù)驅動的方法[11-14]。基于模型的方法從電池內部的電化學反應入手來研究LIBs的退化特性, 然而由于LIBs的內部機理比較復雜, 很難用物理模型定量描述其結構。因此, 基于模型的方法很難直接準確地進行鋰離子電池RUL的預測。基于觀測數(shù)據(jù)的數(shù)據(jù)驅動方法直接從電池狀態(tài)監(jiān)測數(shù)據(jù)中挖掘電池退化信息, 避開了對鋰離子電池復雜內部機理和電化學反應過程的研究, 成為了當前電池壽命研究的熱點方向。
然而, 在目前關于LIBs的RUL預測研究工作中, 更多的是從數(shù)值水平上取得更高精度的預測結果, 即獲得一個精確的預測數(shù)值。但是, 由于實際使用情況的不確定性, 一個精確的數(shù)值結果可能無法直接應用于實際工況[15-16]。在一些實際應用中, 為LIBs的RUL提供一個可供選擇的預測區(qū)間比提供一個精確的預測結果更有意義。在這種情況下, 根據(jù)使用對象的安全性要求和使用場景緊迫程度的不同, 用戶可以在潛在故障出現(xiàn)前得到充分的預警, 并做出合理的決策。在安全性或緊迫程度較高的情況下, 可以在達到失效閾值處的預測區(qū)間下限附近盡早終止對電池的使用, 以避免由于能量供應不足而發(fā)生事故; 否則, 可以適當增加LIBs的工作周期, 以減少頻繁更換電池所帶來的不必要的開銷。因此, 一個令人滿意的鋰離子電池RUL預測模型, 不僅應該提供準確的LIBs未來性能退化趨勢, 還應該給出可信的RUL預測區(qū)間。
目前, 鋰離子電池RUL區(qū)間預測的研究工作還較少。Pang等[17]利用模糊信息粒化方法直接對電池容量退化數(shù)據(jù)進行處理, 并與數(shù)據(jù)驅動方法結合來實現(xiàn)電池RUL區(qū)間的預測。在使用過程中, 還引入了語言描述來解決模糊信息粒化在處理容量退化序列過程中對波動數(shù)據(jù)平滑的問題, 盡可能地保留了原始容量退化數(shù)據(jù)的形態(tài), 從而較好地實現(xiàn)了鋰離子電池RUL區(qū)間預測。然而, 在鋰離子電池RUL預測中, 用容量作為健康指標并不是最好的選擇。一是由于容量的測量常常需要精密且昂貴的儀器, 但是, 在大多數(shù)使用環(huán)境下, 容量并非直接測得, 而是由電流、電壓、放電時間等特征間接計算得來[18-19]。二是由于容量直接表征了電池的性能, 直接對其進行處理, 很容易損失關于電池性能退化情況的信息, 進而影響后續(xù)的預測效果。從特征選擇的角度看, 模型預測結果的準確性往往受模型訓練準確性的影響, 而模型訓練的準確性在一定程度上依賴于訓練輸入的特征數(shù)據(jù)與輸出數(shù)據(jù)之間的相關性。也就是說, 模型特征數(shù)據(jù)與輸出目標數(shù)據(jù)之間的相關性越大, 模型的穩(wěn)定性和預測結果的準確性就越高。因此, 選擇更易測量的且與容量相關度較高的健康指標對鋰離子電池RUL區(qū)間預測更有效。
基于上述分析, 本文將實際應用中更容易獲取的表征電池健康狀態(tài)的特征量作為實現(xiàn)鋰離子電池RUL區(qū)間預測的健康指標, 提出了一種新的區(qū)間預測方案。首先, 從電池退化數(shù)據(jù)集中提取多種表征電池退化狀態(tài)的健康指標; 其次, 將容量作為參照對象, 進行灰色關聯(lián)分析, 選擇相關性最高的兩組健康指標作為模糊信息?;妮斎胄蛄? 然后, 對兩組特征序列分別進行模糊信息粒化, 生成模糊顆粒, 進而獲得各自特征序列的上下限, 并以此作為區(qū)間預測的基礎; 最后, 將所選兩組健康指標?;蟮纳舷孪拮鳛檩斎? 容量作為輸出, 利用最小二乘支持向量機(Least Squares Support Vector Machine, LSSVM)進行訓練并預測最后的RUL區(qū)間。
信息粒化是指一個完整的對象被處理(分割和?;?為若干連續(xù)的部分, 每個部分生成一個顆粒的過程。在信息?;母拍钕? 進一步利用模糊理論來生成模糊信息顆粒, 稱為模糊信息?;痆20]。
模糊信息?;奶幚碇饕〞r間序列的分割和時間窗口的模糊化兩個步驟。
在時間序列分割部分, 將原始時間序列劃分為若干個同質且不重疊的子序列, 這些子序列被定義為時間窗。合理的時間窗口分割策略是更好地理解和分析原始時間序列的關鍵前提。一般來說, 常用的分割方法是定寬分割, 即選擇一個固定的寬度來生成所有的時間窗。
設X={x1,x2,…,xn}為時間序列, 窗口尺度為w, 且1≤w≤n。時間窗的大小與其保留原始時間序列本質信息的能力有關。如果w=n, 說明一個時間窗口等于整個時間序列, 這樣生成的顆粒尺度過大, 失去了?;谋疽狻H绻鹷=1, 說明每個xi都是一個顆粒, 這樣的?;菬o效的。因此, 選擇合適的時間窗口至關重要。
分割后, 利用模糊粒化對生成的時間窗口進行處理, 產(chǎn)生模糊顆粒, 每個時間窗口對應一個顆粒。模糊顆粒由一組參數(shù)組成, 這組參數(shù)可以在一定程度上表征對應時間窗口的信息。令U作為一個論域, 模糊信息?;亩x為
g(xisG)isλ,x∈X,
(1)
式中:x為變量;G為U的凸模糊子集。模糊信息粒化的一個重要核心是確定G的隸屬度函數(shù)。本文選取三角隸屬度函數(shù)A(x), 表示為
(2)
式中:m為時間窗口中子集的中位數(shù);a和b分別為生成模糊顆粒的支持度的下界和上界。構造三角隸屬度函數(shù)的顆粒表達式, 即確定上述參數(shù)[21]。模糊顆粒的構建需要滿足兩個條件: 1)模糊顆粒能夠完整表達原始信息, 2)模糊顆粒應具有一定的特異性。為滿足上述條件, 構造函數(shù)QA, 表示為
(3)
(4)
確定m的值后, 原始子序列X′可以被劃分為兩個子序列, 然后分別計算A(x)的左邊(小于m部分)和右邊(大于m部分)。根據(jù)A(x)和式(3), 可以得出關于a和b的函數(shù), 即
(5)
(6)
分別計算式(5)和式(6)的導數(shù), 可得
(7)
(8)
當Q(a)和Q(b)達到最大值時, 分別得到a和b的值, 即
(9)
(10)
支持向量機(Support Vector Machine, SVM)是一種解決分類和回歸問題的強大工具[22]。SVM建立在統(tǒng)計學基礎上, 屬于機器學習范疇, 其基本思想是將低維線性不可分問題映射到高維線性可分超平面。SVM基于結構風險最小化原則, 而非經(jīng)驗風險最小化原則, 這一特點也使得支持向量機具有比神經(jīng)網(wǎng)絡更好的泛化性能。SVM通過在模型復雜度和學習能力之間找到合適的平衡點來抑制過擬合和欠擬合。當處理有限的訓練樣本時, 支持向量機表現(xiàn)出良好的性能。然而, 當訓練數(shù)據(jù)量增大時, 優(yōu)化的復雜度會隨著訓練樣本的增加而成比例增加, 大大增加了優(yōu)化需要的時間。此外, SVM的性能很大程度上依賴于參數(shù)的優(yōu)化結果。為了克服傳統(tǒng)支持向量機的不足, Suykens等[23]提出了LSSVM, 將支持向量機的優(yōu)化問題轉化為求解線性方程組, 在保留SVM特點的基礎上, 降低了計算的復雜度, 提高了計算效率[24-25]。
令{(x1,y1),(x2,y2),…,(xl,yl)},yi∈R為一個訓練集, 其中,xi是第i個樣本的輸入向量,yi是輸出。構建的模型為
f(x)=ωTφ(x)+b,
(11)
式中:ω是權值向量;b是偏差;φ(x)是將x映射到更高維特征空間的非線性映射函數(shù)。LSSVM的最小目標函數(shù)可以表示為
s.t.yi=ωTφ(xi)+b+ei,i=1~l,
(12)
式中:λ為關于誤差懲罰的正則化參數(shù);ei為誤差變量, 且e=[e1,e2,…,el]T。采用拉格朗日乘子法解決上述優(yōu)化問題, 即
(13)
式中:LLSSVM有參數(shù)ω,b,e和α;αi是拉格朗日乘子, 且α=[α1,α2,…,αl]T。令式(13)中ω,b,e和α的偏導數(shù)為0, 即
(14)
消去式(14)中的ω和e, 則式(13)僅與b和α有關, 可得
(15)
式中:E=[1,1,…,1]T;Ω是l×l的方陣, 且Ωij=φ(xi)Tφ(xj)。令K(xi,xj)=φ(xi)T·φ(xj),K(xi,xj)是LSSVM的核函數(shù)??紤]到LIBs退化數(shù)據(jù)具有嚴重的非線性特征, 本文選擇徑向基函數(shù)作為核函數(shù), 表達式為
(16)
式中:σ是核寬度。通過求解式(15), 可以得到α和b, 最終建立的回歸模型為
(17)
實驗中使用的鋰離子電池退化數(shù)據(jù)集來自NASA Prognostics Center of Excellence(PCoE)中心的公開數(shù)據(jù)集, 該數(shù)據(jù)集是由4組同類型電池(cell 5, cell 6, cell 7和cell 18)在相同的實驗環(huán)境下測得的[26]。4個電池組的容量退化數(shù)據(jù)如圖1 所示, 其退化循環(huán)都在168個周期以內。當電池容量達到額定容量的70%時, 則認為該電池已達到失效閾值。
圖1 4組電池容量的退化曲線(cell 5, cell 6, cell 7和cell 18)
健康指標的提取對于表征鋰電池退化狀態(tài)非常重要。常見的健康指標主要從電池的充放電電壓變化率、充放電時間變化長度以及溫度變化等方面進行描述。本文實驗從充放電電壓、時間以及溫度3個方面提取了6種健康指標, 包括電池平臺期放電時長、平臺期電壓變化率、等時間間隔放電電壓差、等壓升充電時間間隔、平均電壓衰減以及放電期平均溫度。以cell 5為例, 具體介紹如下:
1)電池平臺期放電時長。
電池在不同循環(huán)周期下的放電電壓曲線如圖2 所示。由圖2 可以看出, 放電初始階段的瞬時壓降值隨著放電循環(huán)周期的增加而逐漸增大, 然后電壓進入一個平穩(wěn)變化期, 稱為平臺期。隨著電池放電循環(huán)的增加, 平臺期的持續(xù)時間縮短, 電壓下降速度變快, 因此, 電池平臺期放電時長和平臺期電壓變化率都與電池的性能有關。
圖2 不同放電循環(huán)周期的電壓曲線
電壓下降結束后, 電池電壓進入緩慢變化的放電平臺期。這一平臺期通常出現(xiàn)在鋰離子電池的標稱電壓附近。由于本文所用電池的標稱電壓為3.6 V~3.7 V, 因此, 選擇電壓達到3.5 V所作為最終的平臺期結束電壓, 也就是說, 電壓達到3.5 V所對應的時刻為平臺期結束時刻。
第i個放電循環(huán)的平臺期放電時長的計算公式為
td_plat(i)=tend(i)-tstart(i),
(18)
式中:td_plat(i)為第i個放電循環(huán)的平臺期放電時長;tend(i)為該放電循環(huán)的平臺期結束時刻;tstart(i)為起始時刻, 也就是電壓驟降結束點。
2)平臺期電壓變化率。
第i個放電循環(huán)的平臺期電壓變化率的計算公式為
Rv=Vd(i)/td_plat(i),
(19)
式中:Rv為第i個放電循環(huán)的平臺期電壓變化率;Vd(i)為該放電循環(huán)下的平臺期電壓降量。
3)等時間間隔放電電壓差。
在持續(xù)使用過程中, 電池電量放空所用的時間會隨著放電循環(huán)次數(shù)的增加而逐漸減小, 相同時間間隔下的電壓差也可以作為一組健康指標。
4)放電期平均溫度。
電池放電過程中的溫度平均值會隨著電池內阻的增大而升高。
5)等壓升充電時間間隔。
充電過程中電池達到相同電壓間隔所需要的時間即為等壓升充電時間間隔。
6)平均電壓衰減。
在一個放電循環(huán)中, 將500 s~1 500 s的時間間隔作為研究范圍, 在該范圍內平均取100個電壓點, 每個取樣時間定義為j=1,2,…,100。第i個放電循環(huán)的平均電壓衰減的計算公式為
(20)
式中:FMV(i)為平均電壓衰減值;Vj為放電循環(huán)第j個電壓點;Vn為標稱電壓。
模型預測結果的準確性往往受模型訓練準確性的影響, 而模型訓練的準確性在一定程度上依賴于訓練輸入的特征數(shù)據(jù)與輸出的標簽數(shù)據(jù)之間的相關性。也就是說, 模型特征數(shù)據(jù)與輸出目標數(shù)據(jù)之間的相關性越大, 模型的穩(wěn)定性和預測結果的準確性就越高。
灰色關聯(lián)分析(Grey Relation Analysis, GRA)是一種定量描述和比較系統(tǒng)發(fā)展變化情況的方法, 其基本思想是通過比較數(shù)據(jù)中幾何形狀的相似度來判斷其聯(lián)系是否緊密。GRA的結果越高, 兩個數(shù)據(jù)之間的相關性越高。
(|y(k)-xi(k)|+
(21)
(22)
式中:ξi(k)為第k個指標的灰色關聯(lián)系數(shù);y(k)為參考序列, 在這里是原始容量序列;xi(k)為對比序列, 即健康指標序列;ρ為分辨系數(shù), 取值為0.5;γi為最終計算所得的灰色關聯(lián)度。
圖3 給出了對cell 5的6組健康指標的提取結果, 從整體趨勢上可以看出, 除去放電期平均溫度外, 其他5組序列的變化趨勢與圖1中對應電池的容量退化趨勢呈明顯的正相關或負相關。將其容量序列進行灰色關聯(lián)分析, 結果如圖4 所示。由圖4 可知, 與電池容量相關度最高的是電池平臺期放電時長和等壓升充電時間間隔, 相關度均達到了0.9以上, 與容量具有較好的相關性。在后續(xù)的實驗中將上述兩種指標作為輸入, 容量作為輸出進行建模。
圖3 cell 5的6組健康指標提取結果
圖4 灰度關聯(lián)分析結果
在獲得健康指標之后, 需要對其進行模糊信息?;? 得到模糊信息顆粒。在模糊信息?;? 第一步是生成時間窗口, 而生成時間窗口最重要的是確定分割窗口的尺度??紤]到實驗所選用的退化數(shù)據(jù)集規(guī)模不大, 為使達到要求的訓練數(shù)據(jù)規(guī)模不過分小, 同時為了盡可能利用?;膬?yōu)勢, 分割尺度設置為3。
以cell 5為例, 圖5 給出了所選健康指標電池平臺期放電時長和等壓升充電時間間隔經(jīng)過模糊信息粒化的結果, 其中Low和Up分別表示顆粒的下界和上界, R表示顆粒的平均水平。為了便于預測, 在建模前對Low和Up進行歸一化處理。將兩組健康指標的前23個顆粒的上下限作為LSSVM模型的輸入, 容量作為輸出, 對模型進行訓練。
(a)電壓平臺期放電時長
4組電池的RUL區(qū)間預測結果如圖6 所示, 將結果從顆粒擴展到循環(huán)周期, 預測起始點設置為70。位于真實值右側的曲線表示預測上限, 左側曲線表示預測下限。從圖6 中可以看出, 4組電池的預測區(qū)間, 即上下限范圍差, 在大部分情況下覆蓋了真實值, 這說明本文所提模型可以實現(xiàn)對鋰離子電池RUL的區(qū)間預測。
圖6 4組電池的區(qū)間預測結果(cell 5, cell 6, cell 7和cell 18)
由圖6 可知, cell 7在測量周期內沒有達到失效閾值, 因此, 在表1 中給出了cell 5, cell 6和cell 18的RUL區(qū)間預測結果。由表1 可知, 3組電池的RUL區(qū)間預測結果均包含了真實RUL值, 且預測區(qū)間寬度在30個循環(huán)內, 說明預測效果良好。
表1 3組電池的RUL區(qū)間預測結果(cell 5, cell 6和cell 18)
綜上所述, 利用電池平臺期放電時長和等壓升充電時間間隔作為表征電池退化狀態(tài)的指標來建??梢詫崿F(xiàn)效果良好的鋰離子電池RUL區(qū)間預測。
為進一步評價本文所提區(qū)間預測模型的性能, 引入一類可評價區(qū)間預測模型的指標, 一個是特異性準則(記為V), 用來計算預測區(qū)間的寬度, 另一個是覆蓋準則(記為Q), 用來衡量預測區(qū)間的數(shù)量。討論第i個時間窗的數(shù)據(jù), 令其為Xi={x1,x2,…,xw};[ai,bi]為預測區(qū)間。兩組指標定義為
Vi=bi-ai,
(23)
(24)
(25)
式中:w表示窗寬。當Qi值相等時,Vi值越小, 表示模型預測結果的精確度越好。同樣, 當Vi值相等時,Qi值越大, 說明預測結果越準確。另外, 令p為時間窗的個數(shù), 可以得到源于Vi和Qi的綜合指標P。
(26)
4組電池的區(qū)間預測評價結果如表2 所示。
表2 4組電池的區(qū)間預測評價結果(cell 5, cell 6, cell 7和cell 18)
本文提出了一種新的區(qū)間預測策略, 實現(xiàn)了對離子電池RUL的區(qū)間預測。用更易于測量的健康指標而不是容量來表征電池退化狀態(tài), 更適用于實際情況。在利用數(shù)據(jù)驅動方法訓練模型時, 模型效果受輸入特征與輸出數(shù)據(jù)之間相關性的影響較大, 因此, 本文利用灰色關聯(lián)分析計算與容量(輸出)相關度最高的指標可以最大程度地保證訓練效果。本文利用了區(qū)間預測中常用的數(shù)據(jù)處理方法模糊信息粒化, 將特征序列處理為帶有上下限的顆粒, 方便了后續(xù)處理。另外, 建模選擇了泛化性能強且小樣本友好的LSSVM。實驗結果表明, 4組電池都實現(xiàn)了RUL區(qū)間預測, 且預測區(qū)間在30個循環(huán)周期內, 說明所提模型的區(qū)間預測效果較好。在4組電池的區(qū)間預測過程中, 區(qū)間預測覆蓋率均在90%以上, 預測寬度在0.056內, 說明所提模型區(qū)間預測的準確度和精確度良好。下一步的研究工作可利用實際工況下的數(shù)據(jù)集而非實驗室數(shù)據(jù)對所提模型性能進行測試和優(yōu)化, 使其更適用于實況環(huán)境。