謝燕芳,黎 飛,程 登,王興月,馮鈺杰
(上汽通用五菱汽車股份有限公司廣西汽車新四化重點實驗室,廣西 柳州 545007)
隨著全球氣溫逐年上升和化石能源日益緊缺,各國對新能源汽車的關(guān)注和需求日漸增長。截至2021年6月,全國汽車保有量達2.92億輛,其中新能源汽車603萬輛,占汽車總量的2.06%。2021年上半年全國新注冊登記機動車1 871萬輛、新能源汽車110.3萬輛,均創(chuàng)同期歷史新高。
電池續(xù)航和電池充電是用戶非常關(guān)注的兩個信息,電池續(xù)航能量讓用戶可以了解到車輛可以跑多遠,電池充電時間可以讓用戶了解多長時間充滿,以更好地安排出行計劃。充電時間預(yù)測是根據(jù)用戶的車輛的充電大數(shù)據(jù),預(yù)測出車輛從充電時刻到充滿時刻的時長,并通過手機APP端實時告知用戶,讓用戶實時了解到車輛充滿的時長,以便于更好規(guī)劃出行,極大地提高了用戶用車的便利性。
在現(xiàn)有技術(shù)中,一般通過專家經(jīng)驗預(yù)測電池的充電時間或者根據(jù)物理公式預(yù)測電池的充電時間[1]。根據(jù)經(jīng)驗預(yù)測電池的充電時間即依據(jù)近3個月的充電情況去預(yù)測充電時間,先計算每次充電SOC平均充電時間,然后根據(jù)需要充滿的SOC乘以充電時間,公式如下:
根據(jù)物理公式預(yù)測電池的充電時間即依據(jù)充電過程的物理特征預(yù)測充電時間,即使用額定能量、充電電流、充電電壓和充電SOC值計算充電時間,公式如下:
但充電環(huán)境溫度、充電電網(wǎng)穩(wěn)定性、電池充電策略等因素會導(dǎo)致經(jīng)驗預(yù)測和物理公式預(yù)測會有較大偏差。我們使用平均誤差和方差對專家經(jīng)驗預(yù)測和物理公式預(yù)測效果進行評估,其中:
專家經(jīng)驗預(yù)測平均誤差值11.2 min,方差為4.9 min;公式預(yù)測平均誤差值13.6 min,方差為5.9 min??傮w預(yù)測效果并不理想,因此我們引入了機器學(xué)習的方法進行電池充電預(yù)測。
本文抽取了100臺新能源汽車使用機器學(xué)習方法預(yù)測充電時長,為了評估模型的可行性,我們首先需要對樣本數(shù)據(jù)進行數(shù)據(jù)探索;其次對數(shù)據(jù)進行異常數(shù)據(jù)的預(yù)處理以利于提高機器學(xué)習結(jié)果的準確率;第三,我們使用對清洗完成的數(shù)據(jù)進行一次特征工程加工,產(chǎn)生模型需要輸出的特征參數(shù);最后將樣本分為訓(xùn)練集和測試集,訓(xùn)練集用于模型訓(xùn)練,測試集用于預(yù)測結(jié)果測試,結(jié)果評估仍按照平均誤差值和方差進行評估。
車輛數(shù)為100臺;數(shù)據(jù)時間為2020-07-01至2020-08-30、2020-12-01至2021-01-31;車輛位置:廣西、海南、山東、黑龍江、四川;研究目的為通過電池充電時間相關(guān)影響因素預(yù)測新能源汽車電池充電時間。
1)數(shù)據(jù)字段:容量提取和建模需要的特征字段在原始數(shù)據(jù)中都存在。
2)數(shù)據(jù)精度:除了SOC和充電電壓的精度偏低,其他的數(shù)據(jù)字段的精度都符合要求,如表1所示。
表1 數(shù)據(jù)字段精度說明
3)數(shù)據(jù)質(zhì)量:時間數(shù)據(jù)質(zhì)量良好,重復(fù)時間數(shù)據(jù)很少,10 s間隔基本穩(wěn)定,如表2所示。充電數(shù)據(jù)質(zhì)量較好,充電次數(shù)較多,充電SOC跨度較大,利于模型訓(xùn)練;跳變數(shù)據(jù)少。
表2 數(shù)據(jù)字段質(zhì)量表
為了預(yù)測結(jié)果更精確,需要控制數(shù)據(jù)質(zhì)量,因而本文對收集的數(shù)據(jù)進行了預(yù)處理。主要是對原始數(shù)據(jù)字段中的一些異常值、空值和跳變數(shù)據(jù)進行處理,具體如下:
1)對數(shù)據(jù)進行去重,對每個充電過程中的完全重復(fù)的數(shù)據(jù),都只會保留其中一條,其余數(shù)據(jù)刪除。
2)時間戳異常值處理,主要針對年、月、日、時、分、秒設(shè)定各自的取值范圍,比如月的取值范圍是1~12,日的取值范圍是1~31等,超出范圍的數(shù)據(jù)會整條被刪除。
3)按照時間順序?qū)?shù)據(jù)值進行排序。
4)去除“臟”數(shù)據(jù),剔除超出數(shù)據(jù)范圍的數(shù)據(jù),并對其余的數(shù)據(jù)按照給定的范圍進行數(shù)據(jù)篩選。
5)對缺失值(NAN)進行處理,當字段的缺失比例非常低時(如5%以內(nèi))利用線性插值法填補存在缺失的觀測數(shù)據(jù),當某些變量的缺失比例非常高時(超過85%),直接刪除這些缺失變量。
6)對在時間上有跳變的數(shù)據(jù)進行拼接。
3.4.1 充電時間預(yù)測流程圖(見圖1)
1)輸入原始數(shù)據(jù):輸入每臺車的原始數(shù)據(jù),車聯(lián)網(wǎng)顆粒度最小的數(shù)據(jù);
2)提取充電片段信息:以車號為索引篩選各車輛數(shù)據(jù),按照整車模式判斷條件提取充電片段的充電片段;
3)異常數(shù)據(jù)清洗:按照數(shù)據(jù)預(yù)處理的方法處理異常數(shù)據(jù);
4)充電數(shù)據(jù)特征計算:計算充電時間的特征值和電流平滑值;
5)訓(xùn)練集和測試切分:按照80%訓(xùn)練集和20%測試集計行切分數(shù)據(jù);
6)充電時間預(yù)測模型建:使用隨機森林方法對測試集進行訓(xùn)練,然后使用模型進行測試;
7)結(jié)束:輸出結(jié)果。
3.4.2 充電時間預(yù)測說明
對比了公式預(yù)測和隨機森林的方法,我們可以看到隨機森林準確性和收斂性均有較好的表現(xiàn)。從圖2、圖3數(shù)據(jù)來看,粗線為對角線,細線為上下波動15 min的線,使用公式計算會發(fā)現(xiàn)時間預(yù)測會總體偏小,且散點較多,離散度非常高。從隨機森林來看,波動性相對較為穩(wěn)定,也較為收斂。
3.4.3 隨機森林結(jié)果指標對比
從擬合優(yōu)度、|預(yù)測-實際|平均值、|預(yù)測-實際|標準差、|預(yù)測-實際|最大值各項指標來看,隨機森林模型預(yù)測效果各項指標表現(xiàn)良好,對充電時間預(yù)測準確率提升較大,如下頁表3所示。
表3 隨機森林結(jié)果指標對比表
從預(yù)測結(jié)果來看,引入了機器學(xué)習算法后充電時間預(yù)測準確率可以滿足用戶對滿充時長的了解,汽車廠家可以實時給用戶提供滿充時長的查詢,讓用戶清晰明了地知道滿充需要花費的時長,合理規(guī)劃充電和出行,提高用戶的滿意度。
但是隨機森林結(jié)果隨SOC增加偏差越大,特別是SOC接近100%的時間,因為電池充電策略的不同會造成偏差越來越大。其次充電過程會有各類異常出行,會導(dǎo)致充電預(yù)測時間的波動,需要考慮更多的異常值處理,使用低通濾波處理掉一部分數(shù)據(jù)后再進行改進。另外,因為電池的差異性,模型的調(diào)整需要不斷改進,需要加入更多的電池特性數(shù)字。因此,我們應(yīng)該在大量車輛驗證后,對模型進行不斷地優(yōu)化,在使用過程中不斷地調(diào)整模型,提高預(yù)測模型的準確度,給用戶提供更為準確的充電預(yù)測時間。