李放,張營,閔永軍
(210037 江蘇省 南京市 南京林業(yè)大學 汽車與交通工程學院)
電動汽車產(chǎn)業(yè)是我國重點發(fā)展的戰(zhàn)略性新興產(chǎn)業(yè)之一,因其噪音污染小、綠色環(huán)保等優(yōu)點備受消費者青睞[1]。近年來,電池系統(tǒng)在極端工況和惡劣環(huán)境下故障引發(fā)的火災事故不斷發(fā)生,其安全性備受關注。隨著電動汽車使用時間的增加,電池狀態(tài)估計不準確、續(xù)駛里程預測失準同樣讓人擔憂。建立高性能、安全可靠的電池管理系統(tǒng)是推動電動汽車發(fā)展的重要舉措。本文簡介電動汽車大數(shù)據(jù)基礎,綜述大數(shù)據(jù)背景下國內(nèi)外優(yōu)化電池管理系統(tǒng)的研究并展開分析。
大數(shù)據(jù)是2008 年Google 成立10 周年,在《Nature》特刊中第一次提出的[2],至今學術界對大數(shù)據(jù)無統(tǒng)一定義。2015 年8 月國務院《促進大數(shù)據(jù)發(fā)展行動綱要》指出:大數(shù)據(jù)是以容量大、類型多、存取數(shù)據(jù)快、應用價值高為主要特征的數(shù)據(jù)集合,正快速發(fā)展為對數(shù)量巨大、來源分散、格式多樣的數(shù)據(jù)進行采集、存儲和分析,從中發(fā)現(xiàn)新知識,創(chuàng)造新價值,提升新能力的新一代信息技術和服務業(yè)態(tài)。
無論對大數(shù)據(jù)有何種定義,相比其他小數(shù)據(jù),大數(shù)據(jù)有“5V”的特點[3]:體量大(Volume):“大”是其主要特征,數(shù)據(jù)量以TB、PB 甚至EB 為單位計量;種類多(Variety):同傳統(tǒng)數(shù)據(jù)比,維度多、類型雜、來源廣且不僅限于數(shù)字符號,包括音頻、圖片、日志等類型;數(shù)據(jù)處理快(Velocity):要求數(shù)據(jù)響應快,處理及時;準確性(Veracity):數(shù)據(jù)收集準確可靠;價值(Value):數(shù)據(jù)具有進行挖掘分析的深度價值。
Mapreduce 模式為大數(shù)據(jù)提供了并行運算,可在數(shù)千臺機器上處理數(shù)萬億字節(jié)的數(shù)據(jù)[4]。Hadoop作為開源項目,在其框架上可以采取Mapreduce 的模式處理海量數(shù)據(jù)。Hadoop 和Mapreduce 成為了目前主流的大數(shù)據(jù)處理技術,普遍應用于醫(yī)療、交通等領域[5-7]。Alteryx 可將Hadoop 或其他異類數(shù)據(jù)結(jié)合在一起處理,Pentaho 允許Hadoop 在內(nèi)的多個數(shù)據(jù)庫導入,具有強大算法和優(yōu)秀的內(nèi)置工具[8]。Flink 將MapReduce 的可擴展性與并行數(shù)據(jù)庫中的查詢優(yōu)化等能力相結(jié)合,支持多種編程語言接口[9]。Spark 為大數(shù)據(jù)應用引入了統(tǒng)一的編程模式和引擎,合并處理任務且效率更高,Spark 已經(jīng)發(fā)展成為最活躍的開源項目之一[10]。
為了更好地對電動汽車數(shù)據(jù)實時監(jiān)控和管理,各國都建立了新能源汽車大數(shù)據(jù)管控平臺,由車載終端將運行的各種數(shù)據(jù)上傳至平臺,伴隨出現(xiàn)的云儲存降低了數(shù)據(jù)儲存和管理成本。我國2016 年建立了新能源汽車國家監(jiān)測與管理平臺,2020 年接入量已突破300 萬輛,國家平臺架構主要基于Linux 系統(tǒng)和Java 編程語言,采用Hadoop 框架,地方或企業(yè)也有數(shù)據(jù)監(jiān)管平臺或云平臺,我國以企業(yè)為第一責任主體的思路,形成了新能源汽車大數(shù)據(jù)三級架構,如圖1 所示[11]。GB/T 32960-《電動汽車遠程服務與管理系統(tǒng)技術規(guī)范》對數(shù)據(jù)平臺間通訊連接方式、采集內(nèi)容、采集時間間隔、故障上報時間等提出明確要求,實現(xiàn)了對電動汽車的實時監(jiān)控、數(shù)據(jù)采集和分析。但平臺收集的數(shù)據(jù)只有進一步挖掘,才能開發(fā)其最大價值以改進電動汽車的性能。
電池管理系統(tǒng)是電動汽車動力系統(tǒng)中的核心部分,以電池組中的單節(jié)電池作為最小管理單元,通過對電池組內(nèi)電流、終端電壓、溫度、單體電壓等物理量的測量,實現(xiàn)對電池狀態(tài)的實時評估、管理,并保障電池的安全,又被形象地稱為 “電池管家”[12]。作為銜接電池組、整車系統(tǒng)和電機的紐帶,完善高效的BMS 對電動汽車的性能至關重要。其基本結(jié)構如圖2 所示,主要功能包括溫度管理、充放電控制、電池狀態(tài)估計、電池平衡監(jiān)控、故障診斷與報警等。
由于電池的SOC、SOH 等狀態(tài)參數(shù)無法通過BMS 中的傳感器直接測量,因此基于BMS 可測量的數(shù)據(jù)如電壓、電流、溫度等信息建立準確高效的電池模型,對電池狀態(tài)估計、故障診斷、續(xù)行駛里程預測具有重大意義。目前的電池模型分為電化學模型、等效電路模型以及數(shù)據(jù)驅(qū)動模型[13]。
基于物理的電化學模型對于描述電池內(nèi)部的化學反應機理準確度高,適用于觀察電池內(nèi)部微觀反應,但許多參數(shù)難以獲取,如導電率或某些化學材料的性質(zhì),并且需要使用一系列的偏微分方程來進行表述,造成求解難度大,難以應用于BMS 中。
等效電路模型由于直觀性強,能與控制算法結(jié)合,也是當前研究的熱點之一,可分為整數(shù)階模型和分數(shù)階模型,優(yōu)缺點如表1 所示。分數(shù)階等效電路模型近年被大量改進研究,但精度的提高不可避免的帶來模型結(jié)構復雜和計算量增大,仿真速度較慢[13]。文獻[14]認為等效電路模型作為簡化的電池模型,不能全面反映電池的動態(tài)特性。
表1 2 種等效電路模型比較Tab.1 Comparison of two equivalent circuit models
由于不同類型的電池內(nèi)電化學反應不同,全面了解電池內(nèi)部反應機理難度較大。而數(shù)據(jù)驅(qū)動模型不依賴先驗知識,僅用大量數(shù)據(jù)建立良好精度和具備泛化能力的模型,且具備一定的動態(tài)仿真性能。大數(shù)據(jù)平臺的發(fā)展為建立數(shù)據(jù)驅(qū)動模型提供了基礎,使其極具研究潛力,文獻[13]指出基于大數(shù)據(jù)和云平臺建立的數(shù)據(jù)驅(qū)動BMS有望成為未來趨勢。
電池荷電狀態(tài)(SOC)是電池的基本參數(shù),是指電池中剩余電荷的可用狀態(tài)。SOC 的準確估算對控制過度充放電,緩解里程焦慮,提高電池整體性能等有重要意義。相關研究中,Li[15]等提出了一種能夠在多變量環(huán)境和動態(tài)條件下穩(wěn)定工作的大數(shù)據(jù)驅(qū)動鋰電池模型,首次使用堆疊式降噪自動編碼器-極限學習機(Stacked Denoising Autoencoders-Extreme Learning Machine,SDAE-ELM)建立電池模型,由SDAE 提取特征后輸入ELM,對終端電壓和SOC 估算的誤差分別在2%和3%以內(nèi);胡杰[16]等分析并篩選電池能耗影響因素,使用CAN 總線采集電動出租車運行數(shù)據(jù),利用GPS 獲取車輛位置數(shù)據(jù),通過爬蟲技術考慮了溫度這一影響因素,使用機器學習實現(xiàn)SOC預測并提出溫度能耗模型,實現(xiàn)了能耗與汽車實際工況以及交通路網(wǎng)參數(shù)的結(jié)合;Li[17]等基于電池大數(shù)據(jù)平臺和網(wǎng)絡物理系統(tǒng)(Cyber-Physical System,CPS)技術的電池管理方法,通過廣義回歸神經(jīng)網(wǎng)絡(General Regression Neural Network,GRNN)算法和交叉驗證技術驅(qū)動的數(shù)據(jù)清洗,使用基于特征的電池建模方法,SOC 估算誤差控制在2.47%以內(nèi);Cui[18]等提出了一種結(jié)合離散小波變換和自適應小波神經(jīng)網(wǎng)絡的混合小波神經(jīng)網(wǎng)絡模型用于鋰離子電池SOC 估算;鮑偉[19]等以某電動公交車云平臺獲取的30 000 條樣本數(shù)據(jù),采用支持向量機的方法,用貝葉斯優(yōu)化算法優(yōu)化超參數(shù)最終實現(xiàn)SOC 自主預測。有學者將數(shù)據(jù)驅(qū)動模型與其他模型結(jié)合使用提高估計的準確性和魯棒性,如Xu[20]等提出了一種減少電池測試信息的在線SOC 估算方法,通過組合1 階RC 模型并運用遺傳算法進行在線辨識,可被應用于不同的工況。也有學者使用模糊推理系統(tǒng)或粒子群算法與神經(jīng)網(wǎng)絡組合模型預測SOC[21-22]。
在SOC 估計領域,基于大數(shù)據(jù)建立模型的方法已經(jīng)做了大量研究,但在沒有完全了解電池系統(tǒng)全部工作原理時,建立數(shù)據(jù)驅(qū)動模型是更好的選擇。目前來看,將數(shù)據(jù)驅(qū)動模型與其他模型結(jié)合使用會有更好的精度和穩(wěn)定性,但也增加了計算復雜度和應用實際的難度。
電池健康狀態(tài)(SOH)直接反應了電動汽車的動力性能和壽命狀態(tài),SOH 的準確評估有助于確定電池老化狀態(tài)和量化電池的健康水平。相關研究中,Xiao[23]等基于某公司電動汽車一年的運營數(shù)據(jù),提取增量容量分析(Incremental Capacity Analysis,ICA)的特征,使用粒子群算法優(yōu)化超參數(shù),實現(xiàn)了基于高斯過程回歸的SOH 評估;賈俊[24]等提出一種鋰離子電池健康狀態(tài)綜合評分及異常電池篩選的模型,無需進行模型訓練和復雜的超參數(shù)調(diào)整,達到92%以上的準確率。對于數(shù)據(jù)驅(qū)動模型不能建立概率模型的問題,王萍[25]等使用如高斯回歸給出其置信區(qū)間來彌補;Frisk[26]等利用來自5 個歐洲市場的33 603 輛車的291 個變量,使用隨機森林算法實現(xiàn)了SOH 評估并研究了不同變量對電池退化的影響;Wang[27]等采用ICA 方法提取恒流充電過程的特征參數(shù)作為健康因子(Health Factors,HFs),利用高斯過程回歸處理SOH 和HFs 的關系并建立模型,采用多島遺傳算法和共軛梯度法對超參數(shù)優(yōu)化,通過加速電池壽命試驗驗證了所提出的SOH 評估方案的有效性。但Cai[28]等認為,過多的特征提取可能會降低估計精度,也會增加建模難度,通過提出一種非支配排序遺傳算法,利用支持向量機和由脈沖測試得到的特征建立了SOH 評估方法。Song[29]等為了擺脫實驗室實驗充放電循環(huán),考慮不同的駕駛環(huán)境和駕駛員行為,基于上海市電動汽車公共數(shù)據(jù)收集監(jiān)測研究中心采集的電動汽車真實數(shù)據(jù),提出了模糊神經(jīng)網(wǎng)絡算法實現(xiàn)SOH 評估,通過對一年700 輛電動汽車的監(jiān)測數(shù)據(jù)驗證其有效性,最大相對誤差為4.5%,并能描述電池組老化趨勢。
由于電池老化受到多種因素影響,未來的研究可以進一步考慮多因素對SOH 的影響,采用溫度、放電深度、充電速率等其他影響因素作為參數(shù)建立電池SOH 評估模型,并測試所提出的模型在不同環(huán)境下的SOH 評估是否準確。此外,可以發(fā)展在線學習或參數(shù)自動優(yōu)化等方法,使在有新數(shù)據(jù)時能夠自適應地在線學習。
電池故障診斷系統(tǒng)通過監(jiān)測電池電壓、充放電電流、溫度等數(shù)據(jù)判斷電池系統(tǒng)可能存在的故障,保證電動汽車安全性和穩(wěn)定性。對于數(shù)據(jù)驅(qū)動的故障診斷模型,若樣本容量較小則無法全面、準確地反映某些故障深層特征和類型,因此可通過大數(shù)據(jù)檢測比對數(shù)據(jù)異常,建立全面、高性能的在線診斷模型。相關研究中,Liu[30]等借助云端存儲的大數(shù)據(jù),使用基于密度的噪聲應用空間聚類(Density-based spatial clustering of applications with noise,DBSCAN)和角方差聯(lián)合檢測異常電池單體;Schmid[31]等提出了一種基于單電池電壓比較的數(shù)據(jù)驅(qū)動故障診斷模型,使用主成分分析法統(tǒng)計評估數(shù)據(jù),通過分析每個單元對故障信號的貢獻度來檢測和定位故障,在BMS 中有較大的應用前景;Zhao[32]等基于北京電動汽車監(jiān)控服務中心的大數(shù)據(jù),使用機器學習算法和3σ多級篩選策略,以概率形式檢測端電壓的異常變化,定義了異常電壓的兩種故障類型,準確確定其位置?;趪译妱悠嚪蘸凸芾碇行奶峁┑拇罅繉崟r數(shù)據(jù),Hong[33]等實現(xiàn)對溫度故障引起的熱失控的診斷和預測,提出了一種基于Z 評分(Z-score)的熱失控熱安全管理策略,應用香農(nóng)熵對監(jiān)測數(shù)據(jù)進行分析,引入溫度異常系數(shù),實現(xiàn)溫度異常的實時診斷預警;彭運賽[34]等提出了一種改進CNN 和信息融合的電池組故障診斷方法,基于美國城市循環(huán)工況(Urban Dynamometer Driving Schedule,UDDS)下采集電池組數(shù)據(jù),實現(xiàn)對SOC 偏低、容量偏小、內(nèi)阻偏大3 種故障的識別;Li[35]等基于國家新能源汽車監(jiān)測管理中心的實際運行數(shù)據(jù),將長短期記憶神經(jīng)網(wǎng)絡和等效電路模型相結(jié)合建立一種新的電池故障診斷模型,實現(xiàn)潛在故障的準確診斷和單體電池熱失控的精確定位。
由于電池故障診斷的復雜性,不同故障之間的耦合關系尚不明確,大多數(shù)故障診斷模型定位和檢測的故障類型相當有限,建立全面的故障診斷仍具有挑戰(zhàn)性。也應該考慮模型的可靠性和實時性問題,進一步提高模型的診斷能力和實際應用能力是下一步研究的重點。
里程焦慮是阻礙電動汽車發(fā)展的主要問題之一,司機需關注可行駛距離,并確保汽車在斷電前能到達充電站,最直接的解決辦法是增加充電站點數(shù)量和提高電池容量,但成本較高且難度較大。由于電動汽車的大量運行數(shù)據(jù)上傳至數(shù)據(jù)平臺,一些研究根據(jù)車輛出行和地圖信息大數(shù)據(jù)建立模型,實現(xiàn)續(xù)行駛里程準確預測以消除里程焦慮。相關研究中,Lee[36]等人提出了一種估計電動汽車行駛里程的大數(shù)據(jù)分析方法,考慮了電池的內(nèi)阻變化和健康狀態(tài),利用一種無監(jiān)督聚類增長的分層自組織映 射(Growing Hierarchical Self-organizing Maps,GHSOM)對云平臺收集的駕駛模式進行聚類,分析車輛的駕駛行為。每一次駕駛員出行時,云計算系統(tǒng)都可以結(jié)合駕駛員的駕駛模式和已建立的SOH 老化模型來估算行駛里程;胡杰[37]等提出融合片段回歸與單點分類的機器學習方法對行駛里程進行預測,采集了5 輛同型號純電動汽車在行駛過程中產(chǎn)生的數(shù)據(jù),將154 萬個樣本組成數(shù)據(jù)集,通過提取最優(yōu)特征集合和多模型融合的方式實現(xiàn)行駛里程預測,經(jīng)測試集驗證,平均相對誤差為1.71%;Zhong[38]等基于電動汽車的真實數(shù)據(jù),利用BP 神經(jīng)網(wǎng)絡建立了剩余行駛里程的估計模型,考慮能量回收率、SOC 等9 個因素,最終模型精度良好,但沒有將溫度這一因素考慮在內(nèi);Fetene[39]等2 年間從741名司機收集大量車輛出行次數(shù)(超過23萬次)和行駛里程(約230 萬km),以及有關車輛、道路、天氣和季節(jié)的信息,計算了雪鐵龍某款車型的能源消耗率(Energy Consumption Rate,ECR),得出了最優(yōu)ECR 對應的溫度和車速,對行駛里程預測有一定參考意義;田慧欣[40]等提出了一種基于地圖信息和循環(huán)支持向量回歸模型的方法,并借助地圖信息提高了純電動汽車續(xù)駛里程的預測精度。
空間大數(shù)據(jù)和駕駛員特征提取,為里程估算帶來了不同的研究視角,但一些模型將環(huán)境等其他因素進行了理想化,距離實際應用還需繼續(xù)進行更多測試,如國慶節(jié)、春節(jié)時的汽車大規(guī)模高密度的出行數(shù)據(jù)會對數(shù)據(jù)驅(qū)動模型預測精度造成影響,增強模型的實用性和魯棒性還需要進一步測試改進。
大數(shù)據(jù)和機器學習的發(fā)展為完善電池管理系統(tǒng)提供了全新的思路。本文總結(jié)了基于大數(shù)據(jù)對電池管理系統(tǒng)SOC 估計、SOH 評估、故障診斷、續(xù)行駛里程預測4 方面的研究方法,從研究成果看,數(shù)據(jù)驅(qū)動模型具有巨大的應用潛力和研究價值,未來的工作可從以下幾方面進行:
(1)SOC估計方面,對比各種方法與研究結(jié)果,數(shù)據(jù)驅(qū)動模型同其他模型結(jié)合后性能最好,但計算量偏大,需要在復雜性和預測精度之間權衡,因此高效、精確的SOC 估計方法亟待深入研究;
(2)SOH 評估方面,進一步考慮多因素對SOH 的影響,并在不同環(huán)境下測試評估效果,從而建立實用性更強的模型。由于SOH 評估具有長期性,開發(fā)在線學習和參數(shù)自動優(yōu)化是下一步模型改進的重點;
(3)故障診斷方面,通過尋找故障早期的異常規(guī)律和參數(shù),提高第一時間發(fā)現(xiàn)故障的能力,以避免安全事故,同時建立在線識別多種故障且能準確定位的故障診斷模型極具研究價值;
(4)續(xù)行駛里程預測方面,基于駕駛員出行信息和地圖信息建立的里程預測模型需要增加其魯棒性,可應用數(shù)據(jù)清洗、聚類分析或更大規(guī)模的數(shù)據(jù)集來改進模型。
上述研究中對獲取的大數(shù)據(jù)無一例外都進行了數(shù)據(jù)清洗,未來需提高大數(shù)據(jù)平臺的數(shù)據(jù)質(zhì)量并選擇更合理的數(shù)據(jù)清洗方法,也需提高電池內(nèi)傳感器精度以確保測量參數(shù)的準確性,高質(zhì)量的數(shù)據(jù)是精確估計參數(shù)和提高模型精度的關鍵。