屈克慶, 董 浩, 毛 玲, 趙晉斌, 楊建林, 李 芬
(1. 上海電力大學(xué) 電氣工程學(xué)院,上海 200090; 2. 國家電投風(fēng)電產(chǎn)業(yè)創(chuàng)新中心,上海 200233)
鋰離子電池因高能量密度、低自放電率和循環(huán)壽命長的優(yōu)點,被廣泛應(yīng)用在電動汽車和分布式儲能系統(tǒng)等多個領(lǐng)域中.然而,這些優(yōu)勢會隨著電池壽命的衰減而降低,電池的過度老化可能導(dǎo)致電池系統(tǒng)故障,甚至引發(fā)安全事故[1-3].因此,為了避免事故發(fā)生和提高電池系統(tǒng)運行的穩(wěn)定性,對鋰離子電池進(jìn)行實時的健康狀態(tài)(State of Health,SOH)監(jiān)測尤為重要[4].
鋰離子電池的老化過程十分復(fù)雜,是外部和內(nèi)部因素相互作用的結(jié)果.其外部因素包括環(huán)境溫度、充放電速率、放電深度等;內(nèi)部因素可以概括為固體電解質(zhì)界面的分解、鋰離子沉淀和鍍層等[5].目前,關(guān)于鋰離子電池SOH的估計方法主要分為直接測量法、基于模型的方法和基于數(shù)據(jù)驅(qū)動的方法[6].直接測量法通過直接計算電池容量和內(nèi)阻來反映電池的健康狀態(tài),包括庫倫計數(shù)法、開路電壓法和阻抗頻譜法等[7-9];其計算復(fù)雜度較低,但在線運行時需要額外的硬件支持且抗噪能力較差[10].基于模型的方法通過電化學(xué)機(jī)理或等效電路模擬電池老化現(xiàn)象.一些遞歸觀測器,如卡爾曼濾波[11]、滑模觀測器[12]和粒子濾波器[13]等,被用于從充放電過程獲得電流、電壓數(shù)據(jù)來更新模型的內(nèi)阻和容量參數(shù),以此進(jìn)行SOH在線估計.其中電化學(xué)模型的準(zhǔn)確性較高,但模型過于復(fù)雜,不適合應(yīng)用到電池管理系統(tǒng)中;等效電路模型的觀測器方法簡單且適用于在線系統(tǒng),但是估計精度不高,無法準(zhǔn)確跟蹤電池的老化狀態(tài).
如今,大數(shù)據(jù)技術(shù)快速發(fā)展,大量多維、實用的電池數(shù)據(jù)被收集,為基于數(shù)據(jù)驅(qū)動的方法提供了巨大潛力.數(shù)據(jù)驅(qū)動方法的基本思想是通過建立電池外部特性與SOH的非線性映射關(guān)系,避免考慮電池內(nèi)部復(fù)雜的電化學(xué)反應(yīng).常用的模型[14-17]包括極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)、支持向量機(jī)(Support Vector Machine,SVM)、高斯過程回歸(Gaussian Process Regression,GPR)和人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network, ANN)等.除選擇適合的模型外,健康因子(Health Factor, HF)提取也是實現(xiàn)SOH準(zhǔn)確估計的關(guān)鍵.實際上,由于電池的電壓、電流和溫度等數(shù)據(jù)可直接從電池管理系統(tǒng)(Battery Management System, BMS)中輕易獲得,所以BMS已被廣泛用于特征提取.文獻(xiàn)[18]中從電池完整的充電電壓、電流和溫度曲線中提取了4個HF,經(jīng)過主成分分析(Principal Component Analysis,PCA)處理后作為GPR的輸入來估計電池的SOH和剩余壽命(Remaining Useful Life,RUL),不僅精度較高且能給出估計值的不確定性表達(dá),然而HF提取需要完整的充電數(shù)據(jù),實際中難以獲得.文獻(xiàn)[19]中提出一種基于最小二乘SVM誤差補(bǔ)償模型,以等壓升時間為模型的輸入來動態(tài)補(bǔ)償經(jīng)驗?zāi)P偷念A(yù)測結(jié)果.文獻(xiàn)[20]中通過分析容量增量(Incremental Capacity,IC)曲線來確定與容量高相關(guān)性的電壓片段進(jìn)行HF提取,并使用計算量較小的核嶺回歸實現(xiàn)SOH在線估計.然而,在處理大量、多維的電池運行數(shù)據(jù)時,通過對數(shù)據(jù)進(jìn)行二次特征分析來篩選出高質(zhì)量數(shù)據(jù)片段更加重要.文獻(xiàn)[21]中通過提取不同電壓區(qū)間下的IC曲線峰值作為HF來估計SOH.文獻(xiàn)[22]中從差分熱伏安(Differential Thermal Voltammetry, DTV)曲線中提取峰值、峰位和谷值作為HF,使用改進(jìn)的高斯回歸建立起電池的老化模型.但是,這類方法直接從IC曲線或DTV曲線中進(jìn)行HF提取,在微分計算誤差和噪聲干擾的影響時,會嚴(yán)重降低SOH估計的效率和準(zhǔn)確率.綜上可知,上述文獻(xiàn)所用的神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)模型,其超參數(shù)一般需要人為調(diào)試或者利用智能算法尋優(yōu),導(dǎo)致計算成本較高且模型的泛用性能較差,而且在特征提取方面未綜合考慮電壓、電流和溫度的共同影響.
針對以上問題,選擇一種訓(xùn)練時間短、泛化能力強(qiáng)和計算效率高的ELM作為集成學(xué)習(xí)的子模型,提出一種基于融合HF和集成學(xué)習(xí)的鋰離子電池SOH估計方法.首先,離線階段收集電池的老化數(shù)據(jù),通過定性分析電池的dQ/dV和dT/dV(Q、V和T分別為電池的充電容量、充電電壓和充電溫度)曲線從片段電壓、電流和溫度中提取與SOH相關(guān)度最高的數(shù)據(jù)區(qū)間作為HF.然后,進(jìn)行主成分分析降維處理后輸入到集成ELM(Integrated ELM,IELM)模型中得到N個SOH的估計值,經(jīng)過可信度決策剔除其中不可信的輸出,將剩余估計結(jié)果的均值作為最終SOH預(yù)測值.最后,使用NASA和牛津大學(xué)電池老化數(shù)據(jù)集中的多塊電池進(jìn)行實驗驗證,表明方法的準(zhǔn)確性和可靠性.
數(shù)據(jù)來自NASA鋰離子電池老化數(shù)據(jù)集[23]中編號B0005、B0006、B0007和B0018號電池數(shù)據(jù)和牛津大學(xué)電池老化數(shù)據(jù)集[24]中的8個電池(Cell 1~Cell 8)數(shù)據(jù).NASA數(shù)據(jù)集中使用的LG Chem 18650圓柱形電池陰極為LiNiCo0.15Al0.05O2,陽極為石墨,額定容量為2 A·h.老化實驗中對鋰離子電池使用1.5 A的恒定電流充電至截止電壓4.2 V,恒壓階段電流逐漸減少至截止電流20 mA,然后施加2 A的恒定電流放電至截止電壓,在該模式下進(jìn)行重復(fù)充放電.牛津大學(xué)鋰離子電池老化數(shù)據(jù)集包含8塊Kokam的鈷酸鋰離子軟包電池,型號為SLPB533459H4,陰極為鋰鈷氧化物和鋰鎳鈷氧化物,陽極為石墨,額定容量為740 mA·h.老化試驗中反復(fù)對鋰電池進(jìn)行1.48 A恒流充電,其放電過程模擬Artemis市區(qū)行駛工況,每隔100次循環(huán)測量一次容量.本文SOH定義為當(dāng)前最大可用容量與額定容量的比值,兩個數(shù)據(jù)集的SOH變化曲線如圖1所示,其中M為循環(huán)次數(shù).
圖1 NASA 數(shù)據(jù)集和牛津大學(xué)數(shù)據(jù)集鋰離子電池的SOH曲線Fig.1 SOH curves of lithium-ion batteries from NASA datasets and Oxford University datasets
實際上,電池的放電曲線隨著工況的變化而變化,難以獲取穩(wěn)定的數(shù)據(jù),而充電工況往往是固定的,可直接利用BMS監(jiān)測并獲取穩(wěn)定的電壓、電流和溫度數(shù)據(jù).圖2(a)和2(b)顯示出電池的充電電壓和溫度曲線由紅到黑變化,代表電池的老化狀態(tài)逐漸加重,其中t為時間.可以看出,隨著電池老化加重,充電電壓到達(dá)截止電壓的時間越短,且充電時的溫度逐漸升高,表明電壓、溫度與電池的SOH之間存在一定關(guān)聯(lián)性.
因此,可以從電池充電電壓和溫度曲線中提取健康因子來表征電池的不同老化狀態(tài).考慮到大量輸入數(shù)據(jù)會增加計算復(fù)雜度,且在電池的實際使用過程中采集的數(shù)據(jù)往往是片段的,為了降低估計模型對數(shù)據(jù)量的依賴性,通過離線分析dQ/dV和dT/dV曲線確定電壓、溫度與容量相關(guān)度都較高的數(shù)據(jù)區(qū)間,獲取高質(zhì)量的健康因子.此外,為了盡可能使原有電池老化信息顯現(xiàn)出來,使用SG (Savitzky-Golay) 濾波法對dQ/dV和dT/dV曲線進(jìn)行濾波處理,如圖2(c)和2(d)所示.dQ/dV和dT/dV曲線通過B個采樣點的有限差分獲得,具體計算公式如下:
(1)
(2)
式中:Q(k)、V(k)和T(k)為第k次采樣電池的充電容量、充電電壓和充電溫度.B值越大,越能降低噪聲對曲線的影響,但過大可能會淹沒曲線原有的峰值特性,因此經(jīng)權(quán)衡將B值設(shè)定為10.
從圖2(c)中的dQ/dV曲線可以看出,曲線的峰值位于3.95~4.05 V,代表該段電壓區(qū)間與電池的容量之間存在高度關(guān)聯(lián)性.溫度與容量之間的潛在聯(lián)系可以通過dQ/dT分析,表達(dá)式如下:
(3)
由式(3)可知,溫度對容量關(guān)聯(lián)程度與dQ/dV成正比,與dT/dV成反比.因此,由圖2(c)和圖2(d)可以發(fā)現(xiàn),當(dāng)電壓在3.95~4.0 V時,dQ/dV恰好為峰值且dT/dV也處于0附近,使得dQ/dT最大.因此,可以針對該電壓區(qū)間[V1,V2]內(nèi)的充電數(shù)據(jù)提取特征,對此數(shù)據(jù)區(qū)間內(nèi)電壓對時間的積分作為HF1,溫度對時間的積分作為HF2,電流對時間的積分作為HF3,具體計算公式如下:
(4)
(5)
(6)
式中:Vcc為恒流充電電壓;t1到t2為Vcc從V1至V2所需時間;Tcc為電池恒流充電時的溫度;I為恒流充電的電流;i為電池第i次循環(huán).
通過前文對片段數(shù)據(jù)的定性分析,初步確定了與容量相關(guān)度較高的電壓、電流和溫度區(qū)間,為了定量找出具體的數(shù)據(jù)區(qū)間,采取Pearson和Spearman系數(shù)進(jìn)行衡量,具體計算如下:
(7)
(8)
式中:X和Y為樣本總體;xi和yi為樣本個體.相關(guān)系數(shù)的值介于-1到+1之間,其絕對值越接近1,表示二者相關(guān)程度越高,當(dāng)?shù)扔?時表示兩者之間沒有線性關(guān)系.
提取的3個健康因子與SOH變化曲線如圖3所示,可知健康因子相互之間存在趨勢和波動重疊的部分,為了降低計算復(fù)雜度,利用主成分分析法將重疊信息與多余信息分離,在保留原有信息的同時,將原來的3個健康因子重組為一個新的向量記作間接健康因子(Indirect HF,IHF),具體步驟如下.
首先設(shè)X=[HF1HF2HF3],為n×m階的矩陣,n為樣本數(shù),m為向量數(shù),計算協(xié)方差矩陣:
(9)
式中:X*為標(biāo)準(zhǔn)化后的X.X*的特征向量ui和特征值λi(i=1, 2, …,k)由下式計算可得:
Sui=λiui
(10)
令U=[u1u2…uk],降維后的矩陣Z可由下式所得:
Z=X*×U
(11)
各主成分的貢獻(xiàn)率可通過下式獲得:
(12)
選擇貢獻(xiàn)度最大的主成分作為IHF進(jìn)行SOH估計,使模型的輸入矩陣階數(shù)由n×m變?yōu)閚×1,大大降低了模型的計算復(fù)雜度.
圖3 B0005不同的HF與SOH的變化曲線Fig.3 Variation of different health factors with SOH of B0005
ELM是Huang等[25]提出的一種單隱藏層前饋神經(jīng)網(wǎng)絡(luò),其主要思想是隨機(jī)分配輸入層與隱藏層的連接權(quán)重wi和偏置bi,從而提高計算的延展性.與傳統(tǒng)的機(jī)器學(xué)習(xí),如SVM、相關(guān)向量機(jī)和GPR等相比,ELM的計算速度更快,泛化性能更好,實現(xiàn)更簡單.
ELM的結(jié)構(gòu)由輸入層、隱藏層和輸出層組成,如圖4所示.假定給定的數(shù)據(jù)集{xi,yi|xi∈Rn,yj∈Rm,i=1, 2, …,L},yj代表輸出,xi代表輸入,L為隱藏節(jié)點數(shù).對于單個ELM,其隱藏層輸出的數(shù)學(xué)表達(dá)式如下:
圖4 單個ELM的網(wǎng)絡(luò)結(jié)構(gòu)Fig.4 Structure of an ELM network
hi(x)=g(wix+bi),wi∈Rn,bi∈R
(13)
式中:hi(x)為第i個節(jié)點隱藏層的輸出;g(·)為激活函數(shù).由此可得單個ELM的輸出為
(14)
式中:βi為第i個節(jié)點隱藏層到輸出層之間的連接權(quán)重;H=[h1(x)h2(x) …h(huán)L(x)];β=[β1β2…βL]T.ELM學(xué)習(xí)過程的目標(biāo)是通過矩陣求解的方法找到使誤差最小的最優(yōu)β.最優(yōu)β的計算方法為
β*=H+Y
(15)
式中:H+為H的Moore-Penrose廣義逆矩陣.如上所述,ELM的學(xué)習(xí)過程不同于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)訓(xùn)練算法需要對神經(jīng)網(wǎng)絡(luò)權(quán)重進(jìn)行迭代調(diào)整.因此,其學(xué)習(xí)速度比傳統(tǒng)機(jī)器模型快數(shù)倍,僅需要設(shè)置激活函數(shù)和隱藏層數(shù)目就能實現(xiàn)SOH估計,不需要過多人為干涉,并且所需的計算內(nèi)存也很小.
ELM因其本身學(xué)習(xí)速度快的特點,適合大規(guī)模的數(shù)據(jù)處理,然而ELM隨機(jī)給定網(wǎng)絡(luò)權(quán)重來進(jìn)行學(xué)習(xí)的特點,使得單個ELM的輸出結(jié)果并不穩(wěn)定.為了提高準(zhǔn)確性和可靠性,通過重復(fù)實驗來減小誤差,因此選擇具有隨機(jī)學(xué)習(xí)特性的ELM作為集成學(xué)習(xí)的子模型.
集成學(xué)習(xí)的基本框架如圖5所示,將提取的IHF分別輸入到N個ELM模型中,每個ELM單元的網(wǎng)絡(luò)參數(shù)和隱藏層數(shù)均隨機(jī)給定,由此可以得到N個SOH估計值.圖6顯示了B0005號電池經(jīng)過200個ELM模型輸出的SOH估計誤差和分布,可以看出誤差大致呈正態(tài)分布,其中MAE為平均絕對誤差(Mean Absolute Error, MAE).雖然大多誤差分布在 -0.5%~0.5%內(nèi),但尚有部分ELM輸出誤差較大.
圖5 IELM的框架圖Fig.5 Frame diagram of IELM
圖6 B0005號電池的估計結(jié)果誤差分析Fig.6 Error analysis of estimated results of B0005 battery
因此,根據(jù)拉依達(dá)準(zhǔn)則設(shè)計一個可信度決策的策略來剔除“不可信”的ELM輸出,僅使用“可信”的輸出計算最終的SOH估計值.為減小異常值影響,使用樣本中位數(shù)和標(biāo)準(zhǔn)差代替拉依達(dá)準(zhǔn)則中的真實均值和方差:
(16)
(17)
(18)
采取MAE、平均絕對百分比誤差(Mean Absolute Percentage Error, MAPE)、均方根誤差(Root Mean Square Error, RMSE)評價模型性能,定義如下:
(19)
(20)
(21)
采取遍歷法對前文確定的數(shù)據(jù)區(qū)間進(jìn)行鄰域搜索,在權(quán)衡數(shù)據(jù)量長度和相關(guān)性強(qiáng)度后,得到NASA數(shù)據(jù)集B0005、B0006、B0007和B0018電池特征提取所需數(shù)據(jù)區(qū)間為3.98~4.0 V電壓變化內(nèi)的數(shù)據(jù),牛津大學(xué)數(shù)據(jù)集中Cell 1~Cell 8號電池特征提取所需數(shù)據(jù)區(qū)間為3.8~3.85 V電壓變化內(nèi)的數(shù)據(jù).
對此區(qū)間內(nèi)電壓、電流和溫度進(jìn)行特征提取得到3個HF值,然后使用PCA進(jìn)行降維處理得到IHF.為定量衡量本文所構(gòu)建的IHF與電池SOH之間的相關(guān)性強(qiáng)弱,選擇Pearson系數(shù)和Spearman系數(shù)進(jìn)行評價,計算結(jié)果如表1所示.結(jié)果可知,本文所構(gòu)建的HF在兩個數(shù)據(jù)集中均大于0.9,且提取特征所需要的數(shù)據(jù)長度僅為20、50 mV,在實際應(yīng)用中可較易獲得.
表1 IHF與各電池SOH相關(guān)性分析
實驗在CPU型號為i5-7300HQ、RAM內(nèi)存為16 GB、顯卡為GTX1050Ti的計算機(jī)設(shè)備上進(jìn)行.為驗證方法的準(zhǔn)確性,每次選擇NASA或牛津大學(xué)電池老化數(shù)據(jù)集中的一塊電池作為測試集,剩余電池數(shù)據(jù)則作為訓(xùn)練集.以NASA數(shù)據(jù)集為例,當(dāng)B0005作為驗證集時,B0006、B0007和B0018則作為訓(xùn)練集;當(dāng)B0006作為驗證集時,B0005、B0007和B0018則作為訓(xùn)練集,以此類推.同時考慮實際的計算成本和模型預(yù)測精度要求,當(dāng)集成模型ELM為200個時,就可達(dá)到穩(wěn)定的估計輸出.各電池的SOH預(yù)測結(jié)果和誤差如圖7和8所示,圖中紅色曲線代表預(yù)測值,藍(lán)色曲線代表SOH真實值;誤差指標(biāo)計算結(jié)果如表2所示.
圖7 牛津數(shù)據(jù)集SOH估計結(jié)果Fig.7 SOH estimation results from Oxford dataset
從預(yù)測曲線中可以看出,本文方法不僅能夠準(zhǔn)確估計電池的線性老化趨勢,而且對局部的波動部分也能準(zhǔn)確跟蹤.從誤差結(jié)果可知,NASA數(shù)據(jù)集中的預(yù)測誤差除了個別點在4%左右,大部分誤差均在2%以內(nèi);牛津大學(xué)數(shù)據(jù)集中僅有少數(shù)點誤差在3%左右,絕大部分位于1%以內(nèi).
圖8 NASA數(shù)據(jù)集SOH估計結(jié)果Fig.8 SOH estimation results from NASA dataset
實際上,當(dāng)電池的SOH低于70%時,健康特征與SOH之間的關(guān)系非線性程度加劇會引起誤差增大.因此,當(dāng)電池容量衰減為額定容量的70%~80%時,電池的性能將呈指數(shù)級下降,應(yīng)及時更換電池,一般將該閾值稱為壽命終止閾值.實際運行中很少會獲得低于該閾值的數(shù)據(jù),故可以接受較大的估計誤差.由表2可知,NASA數(shù)據(jù)集的SOH估計誤差指標(biāo)均處于2%以內(nèi),牛津大學(xué)數(shù)據(jù)集的SOH估計誤差指標(biāo)均處于1%以內(nèi),盡管每塊電池的老化條件各不相同,但本文所構(gòu)建的健康特征和模型對每塊電池都能達(dá)到較好的預(yù)測結(jié)果,表明方法有較強(qiáng)的可靠性和準(zhǔn)確性.
表2 各電池SOH估計結(jié)果的誤差指標(biāo)Tab.2 Error index of SOH estimation results of each battery
為驗證本文特征選取方法(M1)對電池SOH估計的準(zhǔn)確性,基于不同情況設(shè)計以下特征選取方案:M2為從電壓提取的健康特征;M3為從電壓和電流中提取的健康特征;M4為從電壓和溫度中提取的健康特征.從表3可以看出,由于同時考慮了電池電壓、電流和溫度因素,M1方法能更好地追蹤電池老化狀態(tài),所以模型的估計誤差最低.在實際情況中,若因某一傳感器故障不能使用M1進(jìn)行特征提取,而使用其余特征提取的方法,其估計誤差可維持在2%以內(nèi),也能實現(xiàn)較好的SOH預(yù)測,對實際工況有指導(dǎo)意義.
表3 不同健康因子下的SOH估計誤差Tab.3 SOH estimation error at different health factors
此外,為了驗證模型的性能,選擇與當(dāng)下主流的SOH估計模型進(jìn)行比較,如ELM、長短期記憶(Long Short-Term Memory, LSTM)神經(jīng)網(wǎng)絡(luò)和GPR模型,所有算法使用相同的訓(xùn)練集和測試集,且測試平臺相同,估計結(jié)果和模型運行時間如表4所示.可知,IELM模型在兩個數(shù)據(jù)集上的平均RMSE最低,且計算速度比LSTM快,與GPR相當(dāng).然而,LSTM和GPR需要提前設(shè)定好模型的超參數(shù),其參數(shù)的尋優(yōu)過程往往比較繁瑣,相比之下ELM和IELM模型因其本身特性無需進(jìn)行參數(shù)設(shè)置,能夠節(jié)省大量的額外時間.但單一的ELM存在輸出不穩(wěn)定的情況,IELM模型則通過集成學(xué)習(xí)和可信度原則對原本單一模型進(jìn)行了改進(jìn),使得模型在兩個數(shù)據(jù)集上的平均RMSE分別降低了0.78%和0.3%.實驗結(jié)果表明,本文方法與其他主流模型相比有較高的精度和可靠性.
表4 不同模型的估計誤差和計算速度
提出一種基于融合HF和IELM模型的鋰離子電池SOH在線估計方法.通過分析dQ/dV和dT/dV曲線,選擇電壓、溫度和容量三者相關(guān)性較高的數(shù)據(jù)區(qū)間進(jìn)行特征提取,然后進(jìn)行PCA處理后作為集成模型的輸入.選擇具有隨機(jī)學(xué)習(xí)特點的ELM作為集成學(xué)習(xí)的子模型,并通過一個可靠的可信度決策規(guī)則剔除偏差較大的估計結(jié)果.最后,使用NASA和牛津大學(xué)電池老化數(shù)據(jù)集共12塊電池對所提方法進(jìn)行多電池實驗驗證,結(jié)果顯示本文方法能夠在較短時間內(nèi)從20、50 mV電壓片段所包含充電數(shù)據(jù)區(qū)間內(nèi)提取健康特征并準(zhǔn)確估計出電池的SOH,結(jié)果表明該方法具有較高的準(zhǔn)確性和可靠性.