張之琦,郁亞娟,李 茜,胡宇辰,黃 凱
(1.北京理工大學(xué)材料學(xué)院,北京100081;2.北京林業(yè)大學(xué)環(huán)境科學(xué)與工程學(xué)院,北京100083)
通常當(dāng)鋰離子電池的容量下降至其標(biāo)稱容量的某個特定閾值之后就很可能會出現(xiàn)電池故障,對鋰離子電池剩余有效壽命進行預(yù)測有著重要意義。在電池剩余壽命的預(yù)測中,健康狀態(tài)(state of health,SOH)和剩余有效壽命(remaining useful life,RUL)是兩個重要的研究指標(biāo)[1]。RUL 指的是在器件的生命周期中無法實現(xiàn)其基本功能的時間,通常定義為從當(dāng)前時間到系統(tǒng)或者組件出現(xiàn)故障的時間。SOH 描述的是老化電池與新電池相比的物理健康狀況[2-6]。
目前針對鋰電池容量的研究方法主要分為兩種,一種是基于模型預(yù)測電池容量,一種是通過數(shù)據(jù)驅(qū)動實現(xiàn)預(yù)測[7],如圖1 所示。但是基于模型進行預(yù)測的問題在于這類模型對電池的老化過程很難建立復(fù)雜的數(shù)學(xué)模型來進行準(zhǔn)確的模擬,所以在數(shù)據(jù)量充足的時候常常使用數(shù)據(jù)驅(qū)動的方法來進行電池容量的預(yù)測,這一類方法忽略了一定的電化學(xué)特性,僅基于電化學(xué)數(shù)據(jù)中提取出的特征來預(yù)測電池容量[8]。
近年來智能技術(shù)的發(fā)展,特別是機器學(xué)習(xí)研究的熱潮極大地推動了數(shù)據(jù)驅(qū)動的RUL 預(yù)測技術(shù)的發(fā)展,例如各種神經(jīng)網(wǎng) 絡(luò)[9]、隨 機 森 林[10]、支 持 向 量 機(support vector machine,SVM)[11]和用于電池RUL 預(yù)測的相關(guān)向量機(relevance vector machine,RVM)[12]。然而很多機器學(xué)習(xí)算法在應(yīng)用中都有著局限性:決策樹得到的最終結(jié)果很可能收斂于局部最優(yōu)解;隨機森林改善了決策樹的一些不足,有著優(yōu)于SVM 的訓(xùn)練速度,但是偏倚增大,在解決回歸問題時表現(xiàn)欠佳;多層感知機的神經(jīng)網(wǎng)絡(luò)消耗很多計算資源,同時在對參數(shù)進行優(yōu)化后很容易導(dǎo)致過擬合;隱式馬爾科夫模型需要大量的數(shù)據(jù)訓(xùn)練才能得到精確的模型;深度學(xué)習(xí)模型雖然有著更高的精度和魯棒性,但是模型復(fù)雜度更高,訓(xùn)練時間更長,面對小樣本場景時表現(xiàn)不佳,在很多情況下并不適用;SVM 模型有著不錯的精確度以及抵抗噪聲的能力,在大規(guī)模的數(shù)據(jù)中也有著不錯的表現(xiàn),但是SVM 模型中的參數(shù)需要經(jīng)過交叉驗證,SVM 的核函數(shù)需要滿足Mercer 定理并且結(jié)果無法以概率的形式輸出[13]。研究者們一直致力于開發(fā)新的思路,SVM 是剩余壽命預(yù)測中研究最為廣泛的機器學(xué)習(xí)算法之一,與其有著相同廣義數(shù)學(xué)模型的RVM 因此受到了研究者的關(guān)注。
圖1 基于模型和基于數(shù)據(jù)的算法對比[8]
RVM 作為一種機器學(xué)習(xí)技術(shù)主要用來解決回歸和分類問題。RVM 雖然是一種和SVM 具有相同廣義數(shù)學(xué)模型的算法,但是它避開了SVM 算法的很多不足,解決問題的思路也和SVM 算法截然不同。RVM 是一種基于貝葉斯的稀疏核算法,與SVM 法最大的區(qū)別是提供了對輸出數(shù)據(jù)的概率解釋[14]。除此之外,RVM 避開了SVM 的很多先天缺陷,例如SVM 算法中所使用的核函數(shù)對應(yīng)的核矩陣需要滿足Mercer條件,這使核函數(shù)的選擇變得苛刻,同時SVM 對于算法中的超參數(shù)需要進行交叉驗證,而這個過程非常消耗計算資源,嚴(yán)重影響模型的效率[15]。RVM 在回歸問題上還有著優(yōu)良的控制“欠擬合”和“過度擬合”的能力[16]。這些優(yōu)勢使得RVM在預(yù)測剩余有效壽命研究中受到關(guān)注,并且在理論和實驗上都證明了RVM 在訓(xùn)練回歸模型的時候有著不錯的泛化性能[17]。
但是RVM 算法同樣存在一些先天缺陷,例如在訓(xùn)練RVM 模型時使用的一些核函數(shù)有可能會使最終的輸出結(jié)果收斂于一個局部最優(yōu)解而不是全局最優(yōu)解,同時RVM 算法訓(xùn)練的過程中需要進行矩陣之間的相乘和矩陣求逆的操作,這使得一些RVM 算法的時間復(fù)雜度達到了O(M3),空間復(fù)雜度來到了O(M2),其中M 表示首次需要進行訓(xùn)練的樣本數(shù)量,這意味著RVM 模型在面對大樣本對象的時候表現(xiàn)不佳[18]。已有很多研究表明RVM 算法在長期預(yù)測應(yīng)用中表現(xiàn)不理想,導(dǎo)致模型對于鋰離子電池RUL 的長期預(yù)測結(jié)果和實際偏差較大?;趩我籖VM 算法的預(yù)測模型在在線實時預(yù)測系統(tǒng)中對鋰離子電池的RUL 判斷同樣表現(xiàn)堪憂。為了解決這些問題,近年來很多研究針對RVM 算法提出了解決方案,希望優(yōu)化RVM 模型在RUL 預(yù)測中的表現(xiàn)[19]。
本文對近5 年來關(guān)于RVM 的出版材料進行了系統(tǒng)研究,以期提供RVM 算法在電池剩余壽命預(yù)測中的主要發(fā)展趨勢和潛在應(yīng)用。
RVM 和SVM 有著相同的廣義數(shù)學(xué)模型:
式中:y(xi;ω)為一個未知的非線性數(shù)學(xué)模型;ε 為RVM 模型中常用的一個滿足高斯分布的噪聲,其均值為0 且方差為σ2。
模型中的非線性數(shù)學(xué)公式y(tǒng)(xi;ω)表示為:
式中:φ(xi)=[1, k(xi, x1),(xi, x2),…,k(xi, xN)]T;φ(xi)為每個訓(xùn)練樣本經(jīng)過核函數(shù)擴展之后的基函數(shù);ωn為每個樣本所帶有的權(quán)重;ω={ω1,ω2,…,ωN}為一個包含權(quán)值的向量。
式(2)可以簡寫為:
式中:Φ 為一個N×N+1 的設(shè)計矩陣。
整合式(3)得到:
假設(shè)模型的殘差符合高斯分布,同時為了書寫簡便令β-1=σ2,之后得到:
通過最大化式(5),求偏導(dǎo)即可求得ω 和β-1,但是如此求得的模型很容易出現(xiàn)過擬合的缺陷,所以需要先給ω 定義一個先驗分布來解決過擬合的問題[20]。 ω 先驗分布可以表達為:
參數(shù)ω 的后驗分布可以表示為:
結(jié)合貝葉斯統(tǒng)計學(xué)中的邊緣似然函數(shù)(marginal likelihood function)就能寫出目標(biāo)的概率分布:
式(12)中mTΦ(x)表示高斯分布的均值,σ2(x)表示高斯分布的均方差,之后求得N[t|mTΦ(x),σ2(x)]的極大值就能得到其中的超參數(shù)α*和用來表示噪聲方差的β*。如此就能得到概率分布模型的表達式。目前RVM 的最大期望(expectation maximization,EM)迭代方法也得到了廣泛的應(yīng)用,其原理如圖2 所示[18]。
圖2 RVM的EM迭代流程
本文中將RVM 預(yù)測的優(yōu)化分為以下四個部分。
為了提升RVM 在RUL 預(yù)測中的表現(xiàn),很多研究嘗試在RVM 模型中使用多個核函數(shù)優(yōu)化模型,但引入多個核函數(shù)必然導(dǎo)致需要擬合的參數(shù)增加,無疑會增大訓(xùn)練的時間和復(fù)雜程度。針對RVM 核函數(shù)的研究重心是希望解決單核RVM 算法中存在的缺陷,利用優(yōu)化方法尋求最佳核函數(shù)的組成以獲得更為準(zhǔn)確的預(yù)測結(jié)果。優(yōu)化核函數(shù)的簡化方案如圖3 所示。
王春雷等[21]將核函數(shù)進行組合來優(yōu)化模型,使用高斯核函數(shù)和多項式核函數(shù)構(gòu)成的組合核函數(shù)代替原有的單一核函數(shù)來提高模型的泛化性能。研究結(jié)果表明,使用組合核函數(shù)的RVM 模型和使用單一核函數(shù)的方法相比,雖然效率略有降低但是準(zhǔn)確性得到了提高。通過人工試值來調(diào)整核函數(shù)的關(guān)系仍舊具有很大的主觀性而且不全面,Yang 等[22]使用離散粒子群優(yōu)化(discrete particle swarm optimization,DPSO)的策略來計算RVM 核函數(shù)最優(yōu)組合,結(jié)果表明自選擇核函數(shù)的RVM 模型的訓(xùn)練結(jié)果優(yōu)于之前的RVM 模型。
圖3 使用RVM 進行預(yù)測的簡化流程
類似的,在Zhang 等[23]的研究中使用粒子群優(yōu)化(particle swarm optimization, PSO)法實現(xiàn)了對核函數(shù)的組合優(yōu)化。Chen 等[24]通過杜鵑算法智能地實現(xiàn)對RVM 中每個核函數(shù)的參數(shù)確定以得到對RUL 問題求解的最佳組合。與RVM 核杜鵑算法相結(jié)合的CS-HKRVM 算法使用混合核的策略,由于泛化能力和學(xué)習(xí)能力的提升,在數(shù)據(jù)測試中已經(jīng)被證明優(yōu)于單核RVM 模型。在劉月峰等[25]的研究中,果蠅優(yōu)化算法(fruit fly optimization algorithm,F(xiàn)OA)被用來尋找組合核函數(shù)之間的組合方程系數(shù)。值得注意的是該研究為了減少模型中需要同時擬合的參數(shù)數(shù)量,首先訓(xùn)練單核RVM 來確定較好的超參數(shù),在保持超參數(shù)不變的基礎(chǔ)上組合多個核函數(shù)。結(jié)果表明基于FOA 群智能優(yōu)化的RVM 有著比單核RVM 模型更好的預(yù)測精度。
數(shù)據(jù)模型混合方法不僅可以反映電池的退化機理,而且可以從數(shù)據(jù)集中獲得電池健康狀態(tài)的信息和演化規(guī)律,一定程度上解決了數(shù)據(jù)模型忽略物理特征和物理模型過于復(fù)雜的缺點[26]。
Wang 等[6]設(shè)計了基于RVM 和三參數(shù)容量退化模型相結(jié)合的預(yù)測方法,來進行對鋰離子電池剩余壽命的預(yù)測,實驗結(jié)果很好地表征了周期和容量之間的下降趨勢。
卡爾曼濾波器(Kalman filter,KF)是一種數(shù)據(jù)融合的算法,該算法中只需獲得上一刻的系統(tǒng)的估計值和現(xiàn)在的觀測值就能得到現(xiàn)在系統(tǒng)狀態(tài)的估計值,所以不需要記錄觀測或者估計的歷史信息。在很多研究中卡爾曼濾波器用來實現(xiàn)物理模型與RVM 方法的結(jié)合,其中RVM 的預(yù)測分布作為卡爾曼濾波器中的觀測值,與模型的預(yù)測分布進行結(jié)合,實現(xiàn)數(shù)據(jù)驅(qū)動方法和物理模型方法的融合。其基本流程如圖4 所示,雖然已經(jīng)得到應(yīng)用的卡爾曼濾波器種類很多,但基本原理類似。
圖4 RVM結(jié)合卡爾曼濾波器建立融合模型的簡化流程
Yuchen 等[19]結(jié)合了RVM 算法和卡爾曼濾波器算法,實現(xiàn)了將鋰離子電池RUL 的長期預(yù)測變成一些較為精確的短期預(yù)測。利用RVM 算法進行精確的短期預(yù)測后,利用卡爾曼濾波器將每一次的RVM 短期預(yù)測結(jié)果優(yōu)化后用于更新數(shù)據(jù)集,進行重新訓(xùn)練得到新的相關(guān)向量和系數(shù)矩陣,更新后能夠得到較為穩(wěn)定的對下一個周期的容量的預(yù)測結(jié)果。在Zheng等[27]的研究中提出了一個類似的結(jié)合算法,不同的是該研究針對RVM 迭代計算中的累積誤差,采用加權(quán)函數(shù)來調(diào)整誤差對于預(yù)測結(jié)果的干擾,并根據(jù)預(yù)測過程的變化,開發(fā)了一種自適應(yīng)協(xié)方差更新方案。
劉貴行等[28]利用差分進化算法和粒子群優(yōu)化算法來優(yōu)化RVM 中的參數(shù),最后利用KF 結(jié)合物理模型對RVM 模型的預(yù)測結(jié)果進行降噪以此來削弱噪聲的影響,同時將優(yōu)化后的預(yù)測結(jié)果作為在線樣本添加到訓(xùn)練集中,對提出的模型重新訓(xùn)練,以此來動態(tài)調(diào)整系數(shù)矩陣和相關(guān)向量以執(zhí)行下一次迭代預(yù)測。
除了經(jīng)典的KF 模型以外,一種用于非線性系統(tǒng)的無跡卡爾曼濾波器(unscented Kalman filter,UKF)也被用來和RVM 模型進行結(jié)合。其中的RVR 模型為UKF 提供殘差的未來演變,利用UKF 來實現(xiàn)預(yù)測過程中對電池模型參數(shù)的連續(xù)更新。經(jīng)過實驗驗證,得到了優(yōu)于單一RVR 和UKF 模型的結(jié)果[8]。
除卡爾曼濾波器之外,粒子濾波器(Particle filter,PF)也被用來建立融合模型。粒子濾波器是一種使用重采樣算法和一組加權(quán)粒子來近似概率密度函數(shù)(probability density function,PDF)的計算模型[29]。在這類模型中RVM 常被用來從先前的電池退化數(shù)據(jù),查找代表性的訓(xùn)練向量,然后通過擬合提取的訓(xùn)練向量來識別開發(fā)的容量損失模型。圖5 是這類預(yù)測模型的基本流程圖,雖然各項研究之間有所差異,但基本思路一致。
圖5 結(jié)合RVM進行預(yù)測的簡化流程
2007 年RVM 首次被用來預(yù)測電池壽命所采用的方法就是與PF 模型進行結(jié)合,在之后的一年Saha 等人的研究中再次提出了將RVM 和PF 結(jié)合的模型。研究中使用了Rao-Blackwellized PF(RBPF)框架來減少預(yù)測結(jié)果的不確定性。簡單的將PF 和RVM 模型結(jié)合會因為RVM 模型使用EIS 數(shù)據(jù)的離線性,導(dǎo)致模型不能通過在線數(shù)據(jù)更新模型參數(shù)[30]。
使用RVM 和PF 模型并且同時利用Monte Carlo(MC)模擬和Kullback - Leibler(KL) 發(fā)散的verification and validation(V&V)方法來校準(zhǔn)PF 的粒子數(shù)和模型噪聲,來提高模型預(yù)測的準(zhǔn)確性,并實現(xiàn)通過在線數(shù)據(jù)更新模型的參數(shù),得到了不錯的模擬結(jié)果[31]。
利用RVM 實現(xiàn)對電池剩余有效壽命的預(yù)測,這種基于數(shù)據(jù)的預(yù)測方法與監(jiān)測的數(shù)據(jù)有很大的關(guān)系,模型要求有大量的實驗數(shù)據(jù)才能實現(xiàn)穩(wěn)定的建模,選擇合適的健康指標(biāo)能夠提高模型的精確度以及減少訓(xùn)練的消耗。
Zhou 等[7]從鋰離子電池的工作參數(shù)中提取了一種新的健康指標(biāo)(HI)。研究中使用的HI 由電池的放電電壓形成,這些電壓的數(shù)據(jù)易于通過在線方式獲取,解決了之前訓(xùn)練數(shù)據(jù)離線性的問題。經(jīng)過處理的HI 數(shù)據(jù)利用RVM 模型實現(xiàn)對電池RUL 的預(yù)測。得到的結(jié)果表明優(yōu)化的RVM 在RUL 預(yù)測中會得到更為準(zhǔn)確的結(jié)果。
為了減少初始訓(xùn)練數(shù)據(jù)中的噪音造成的影響,Zhang 等[23]使用經(jīng)驗?zāi)B(tài)分解方法(empirical mode decomposition, EMD)和多核相關(guān)向量機(multi-kernel RVM,MKRVM)結(jié)合的電池容量預(yù)測方法。EMD 去噪方法用于處理測得的容量數(shù)據(jù),以產(chǎn)生無噪聲的容量數(shù)據(jù)?;谌ピ牒蟮娜萘繑?shù)據(jù),構(gòu)建了使用MKRVM 的電池容量預(yù)測模型。
Zhang 等[32]從電池充電和放電過程的充電電壓、電流和溫度曲線中提取特征來表征電池的老化過程,通過這些健康特征(health feature,HF)建立的模型取得了不錯的結(jié)果。于是有研究通過灰色有理分析從充電電壓、電流和溫度曲線中的14 個HF 中提取出和電池老化相關(guān)的5 個高相關(guān)性的HF。將這些經(jīng)過處理的HF 數(shù)據(jù)作為RVM 模型的輸入,驗證了經(jīng)過HF 萃取的特征作為健康指標(biāo)有不錯的預(yù)測結(jié)果[33]。
Widodo 等[17]使用樣本熵處理放電電壓的信息并將得到的數(shù)據(jù)作為建立模型的參數(shù),利用樣本熵功能和估算的SOH來評估電池的退化率,較為準(zhǔn)確地實現(xiàn)了對于電池退化狀態(tài)的描述,同時反映電池的健康狀態(tài)。
傳統(tǒng)的檢測方法都是基于一些集總的性能指標(biāo),類似于容量、電阻和電壓等,而這些指標(biāo)都是很多物理參數(shù)的復(fù)雜函數(shù)。雖然基于這些集總參數(shù)的方法很容易實現(xiàn),但是精確度有限。所以開發(fā)基于物理化學(xué)參數(shù)的診斷方法在一些情況下變得很有意義,Zhou 等[34]通過將EIS 與機器學(xué)習(xí)方法相結(jié)合,實現(xiàn)了RVM 無模型物理級電池診斷方法,向物理級電池診斷邁進了一步。為了解決傳統(tǒng)性能指標(biāo)預(yù)測不準(zhǔn)確的問題,Zhang 等[35]選擇了5 個間接指標(biāo)作為訓(xùn)練模型的健康指標(biāo),使用歸一化的方法解決多參數(shù)的維度問題,同時在模型中使用動態(tài)參數(shù),結(jié)合粒子群優(yōu)化得到最終的模型,經(jīng)過驗證得到了令人滿意的結(jié)果。
Zhao 等[36]使用了RVM 和灰色預(yù)測模型(gray forecast model,GM)來預(yù)測電池的健康狀態(tài),根據(jù)預(yù)測結(jié)果更新訓(xùn)練數(shù)據(jù)集,然后更新RVM 和GM。RVM 和GM 不斷地相互校正彼此的預(yù)測結(jié)果,結(jié)果表明這個過程減少了預(yù)測的累積誤差并提高了電池SOH 的預(yù)測精度。Liu 等[18]在RVM 模型上應(yīng)用增量學(xué)習(xí)的策略,提出了增量優(yōu)化相關(guān)向量機(incremental optimized RVM,IP-RVM)算法。該方法相比于離線的RVM,提高了預(yù)測的準(zhǔn)確性,與再訓(xùn)練RVM 預(yù)測的精度接近但是時間消耗明顯減少。在此之后,范興明等[37]利用增量學(xué)習(xí)的策略建立了實時處理數(shù)據(jù)的RVM 模型。
RVM 算法作為機器學(xué)習(xí)中一個用于分類和回歸問題的算法,在電池壽命的預(yù)測中受到了越來越多的關(guān)注,但是RVM 模型在應(yīng)用的時候仍然面臨著很多有待解決的問題。建議RVM 在未來電池壽命預(yù)測中的重點研究方向為:
(1)重點關(guān)注RVM 算法和其他算法的結(jié)合,特別是與基于模型預(yù)測電池壽命的方法相結(jié)合,充分利用RVM 在壽命預(yù)測中泛化性能好以及模型稀疏的優(yōu)點,并通過結(jié)合其他算法解決RVM 在長期預(yù)測中的問題。
(2)追蹤RUL 預(yù)測中對于新健康指標(biāo)的研究,并將這些指標(biāo)應(yīng)用于RVM 模型,解決目前常用指標(biāo)離線性的缺陷。
(3)注重實際使用中不確定性問題的處理,改進RVM 算法提高預(yù)測的精度。