李廣瑋 吳 鳴 王昕揚 徐 毅
1(上海電力大學(xué) 上海 200082) 2(中國電力科學(xué)研究院 北京 100192)
隨著我國經(jīng)濟(jì)的快速發(fā)展,城市汽車數(shù)量逐漸增加[1-2],在面臨能源緊張和環(huán)境污染問題的前提下,新能源汽車的發(fā)展成為了未來交通出行的趨勢。針對電動汽車的實際行駛工況進(jìn)行研究,對確定電動汽車負(fù)荷的耗電量、新能源汽車技術(shù)開發(fā)[3]、充電站規(guī)劃配置[4]、電動汽車充電導(dǎo)航具有重要意義。目前我國汽車行駛工況參照的是歐洲ECE城市工況,與實際行駛狀態(tài)差距較大[5],已不能滿足我國車輛開發(fā)測試的需求。針對這一問題,我國學(xué)者已經(jīng)先后建立了區(qū)域性汽車工況,但主要是針傳統(tǒng)汽車工況,所使用的方法是K-均值聚類(K-Means Cluster)分析法[6-8]。由于電動汽車與傳統(tǒng)汽車的驅(qū)動方式不同,二者在速度響應(yīng)、加速度和扭矩響應(yīng)等各方面有較大的差異[9],采用傳統(tǒng)汽車工況評價電動汽車?yán)m(xù)航、能耗等特性缺乏一定的合理性。除此之外,K-Means方法聚類需要人為選定類的數(shù)量,人為判斷聚類結(jié)果是否合理,會對聚類效果合理性產(chǎn)生影響。
因此,本文選用迭代自組織數(shù)據(jù)分析算法(Iterative Self Organizing Data Analysis Techniques Algorithm,ISODATA)[10]構(gòu)建電動汽車代表性工況,因為ISODATA具有歸并和分裂等機(jī)制,是一種非監(jiān)督的算法,有效避免人為判斷聚類效果的不合理性。本文使用ISODATA、PCA[11]和運動學(xué)片段分析法[12]等方法,對電動汽車行駛數(shù)據(jù)進(jìn)行分析和聚類,利用Silhouette函數(shù)對ISODATA聚類結(jié)果的合理性進(jìn)行評估。根據(jù)聚類結(jié)果篩選運動學(xué)片段,構(gòu)建電動汽車的代表性工況,通過測試數(shù)據(jù)集,計算了代表性工況與測試數(shù)據(jù)的差異率,并對合理性進(jìn)行驗證。在代表性工況的基礎(chǔ)上,分析了電動汽車的耗電特性與剩余電量的實時評估方法。
本文對電動汽車代表工況與耗電估算的研究基于電動汽車的實時采集數(shù)據(jù)。由于采集設(shè)備、外界因素和人為駕駛等原因,原始數(shù)據(jù)存在不良數(shù)據(jù)或缺失信息,因此首先需要進(jìn)行數(shù)據(jù)預(yù)處理。在對數(shù)據(jù)進(jìn)行預(yù)處理后,采用PCA進(jìn)行特征降維以便達(dá)到更好的聚類效果。ISODATA能夠自主的調(diào)節(jié)聚類的類別個數(shù),屬于無監(jiān)督算法,能夠減少人為判斷分類個數(shù)的誤差。根據(jù)ISODATA得到分類結(jié)果,構(gòu)建電動汽車的道路行駛工況曲線,并實現(xiàn)電動汽車耗電的實時估算。
由于建筑物覆蓋、隧道遮掩等,采集信號丟失,造成數(shù)據(jù)時間不連續(xù),需要采用牛頓插值法補全數(shù)據(jù)[13]。首先對日期數(shù)據(jù)進(jìn)行轉(zhuǎn)換,轉(zhuǎn)換成時間序列,檢測時間序列異常的點,對于采集信號問題產(chǎn)生的短間隔時間不連續(xù)數(shù)據(jù)區(qū)間,插值節(jié)點為等距節(jié)點,使用牛頓等距插值法進(jìn)行數(shù)據(jù)填充,插值節(jié)點為:
xk=x0+tht=0,1,…,n
(1)
式中:h代表步長,本文步長為1。在x處的牛頓等距插入值f(x)表達(dá)式為:
f(x)=P(x0+th)+Rn(s)
(2)
式中:Rn(s)是函數(shù)f(x)在x0+th處的插值余項,代表插值誤差。
(3)
(4)
式中:ΔnF0代表f(x)在tk-m+j處的m階前向差分,j=0,1,…,m。
(5)
由于采集設(shè)備和駕駛?cè)藛T的原因,常會產(chǎn)生一些不良數(shù)據(jù)。因此需要對原始數(shù)據(jù)進(jìn)行甄別,不良數(shù)據(jù)類型包括:
(1) 加減速異常數(shù)據(jù)(電動汽車0~100 km/h加速時間大于7 s,剎車最大減速度不超過8 m·s-2)[14]。
(2) 長期停車異常數(shù)據(jù)(停車不熄火、汽車熄火采集設(shè)備仍運行)。
(3) 堵車、斷斷續(xù)續(xù)低速狀態(tài),視為怠速狀態(tài)。
(4) 怠速超過180 s,視為異常狀態(tài)。
不良記錄數(shù)據(jù)處理步驟:
步驟一由時間序列和GPS速度已知,可得到汽車加速度的數(shù)據(jù),剔除超出閾值的數(shù)據(jù)。
步驟二斷斷續(xù)續(xù)低速行駛情況,重新賦值GPS速度為0。
步驟三將補充完整的數(shù)據(jù)進(jìn)行異常怠速和長期停車檢測,檢測GPS速度連續(xù)為0或者怠速時間大于180 s,剔除以上異常數(shù)據(jù)。具體流程如圖1所示。
圖1 預(yù)處理流程
經(jīng)過數(shù)據(jù)預(yù)處理后的數(shù)據(jù)速度-時間關(guān)系和加速度-時間關(guān)系如圖2和圖3所示。
圖2 部分速度-時間關(guān)系
圖3 部分加速度-時間關(guān)系
運動學(xué)片段指的是汽車行駛過程中,兩次怠速狀態(tài)之間的時間速度分布片段[15]。本文采集數(shù)據(jù)所提取的部分?jǐn)?shù)據(jù)運動學(xué)片段如圖4所示。
圖4 部分運動學(xué)片段
在汽車行駛過程中,需要選用一些基本的特征參數(shù)反映每個運動學(xué)片段的行駛特征。將采集數(shù)據(jù)源分割成297個運動學(xué)片段并計算各運動學(xué)片段的15個參數(shù)。原始數(shù)據(jù)轉(zhuǎn)換后,通過15個參數(shù)計算得到用于描述運動學(xué)片段的7個特征參數(shù),如表1所示。
表1 用于描述運動學(xué)片段的7個特征參數(shù)
主成分分析是一種特征降維方法[16-17]。將原有的X1,X2,…,XP(比如P個指標(biāo))的特征轉(zhuǎn)換為新的特征組Fm來表征[18]。相比之下,F(xiàn)m維數(shù)低且不關(guān)聯(lián)。
F1表示原特征參數(shù)進(jìn)行線性組合得到的第一個主成分,F(xiàn)1=?11X1+?21X2+…+?p1Xp。方差越大,F(xiàn)1能夠表征的信息越多[19]。
如果F1無法表征原來P個指標(biāo)的信息,考慮選取第二個主成分指標(biāo)F2。F2與F1要保持獨立、不相關(guān),協(xié)方差Cov(F1,F2)=0,F(xiàn)1,F(xiàn)2,…,F(xiàn)m為原變量指標(biāo)X1,X2,…,XP第1、第2、…、第m個主成分。
F1=a11X+a12X2+…+a1pXp
F2=a21X+a22X2+…+a2pXp
?
Fm=am1X+am2X2+…+ampXp
(6)
通過對297個運動學(xué)片段的特征參數(shù)進(jìn)行主成分分析,得到如表2所列的主成分貢獻(xiàn)率及累積貢獻(xiàn)率。
表2 主成分貢獻(xiàn)率
由表2可知,前4個主成分的累積貢獻(xiàn)率97.24%,其中前3個主成分的累積貢獻(xiàn)率已經(jīng)達(dá)到91.229 3%,且特征值都大于1。因此,選取前3個主成分足以反映出7個特征參數(shù)的大部分信息[2]。
ISODATA是一種改進(jìn)型的非監(jiān)督聚類算法。通過設(shè)置初始參數(shù)K0和每類最小樣本數(shù)Nmin,引入合并和分裂機(jī)制。該算法具備自動判別類別個數(shù)是否合理并合并或分裂族群的功能。
當(dāng)兩類的中心過小,可以合并為一類。當(dāng)樣本數(shù)目過多或距離某類標(biāo)準(zhǔn)差過大,就會將該類分裂。
根據(jù)初始類簇中心和類的初始參數(shù)K0迭代計算,最終確定分類結(jié)果和最終結(jié)果的類別數(shù)K[20]。
通過ISODATA將數(shù)據(jù)分類到不同的類,同一類中的對象有很大的相似性,而不同的類之間的對象有很大的相異性。對于樣本數(shù)據(jù)集S={S1,S2,…,Sn}。ISODATA最終將其劃分成K類,表達(dá)式為P={P1,P2,…,PK},1≤K≤n。
ISODATA的基本步驟描述如下:
步驟1隨機(jī)選取K0個樣本,作為初始中心。
步驟2針對每個數(shù)據(jù),計算它到中心的距離,將其分到距離最小的類中。此時類的數(shù)量為K1。
步驟3判斷上述每個類中的元素數(shù)目是否小于Nmin,如果小于Nmin則丟棄該類。令K1=K1-1,該類中的樣本按照距離最小原則,重新分配到剩下的類中[21]。
步驟4按照每一類的數(shù)據(jù),重新計算該類的聚類中心。
步驟5如果K1 步驟6如果K1>2K0,說明當(dāng)前類太多,前往合并操作。 步驟7達(dá)到最大迭代次數(shù)則終止,K=K1,否則返回步驟2。 ISODATA通過計算數(shù)據(jù)和類中心的歐氏距離進(jìn)行分類。數(shù)值越小,相似度越大。計算公式為[22]: (7) 式中:Si為樣本數(shù)據(jù)集中的第i個數(shù)據(jù)對象;uj則為第j個聚類中[14]。 運用PCA分析法和ISODATA分析方法對所有的運動學(xué)片段進(jìn)行分析,得到聚類分析結(jié)果。運用Silhouette函數(shù)繪制輪廓圖,判斷每個運動學(xué)片段的分類是否合理。Silhouette函數(shù)表達(dá)式為: (8) 式中:a(i)表示樣本i與同類樣本的差異度,用該樣本與當(dāng)前類別內(nèi)各點的平均歐氏距離表示;b(i)表示樣本i與其他類別樣本的差異度,用該樣本與其余類別內(nèi)各點的平均歐氏距離表示。 Silhouette函數(shù)的函數(shù)值s(i)的取值范圍為[-1,1]。s(i)越接近于1,表示樣本i更傾向于屬于當(dāng)前樣本。s(i)越接近于-1,表示樣本i更傾向于屬于其他樣本?;贗SODATA自動得到的類別個數(shù)為2,采用人為定義類別個數(shù)為3和4,繪制對應(yīng)的Silhouette函數(shù)如圖5所示。 (a) 分2類 (b) 分3類 (c) 分4類圖5 不同分類Silhouette函數(shù)值的輪廓 由圖5(a)可看出,分2類時,Silhouette函數(shù)值均大于0,類與類之間區(qū)別明顯。由圖5(b)和5(c)看出,出現(xiàn)少量負(fù)值,說明分為3類和4類時,存在未被很好區(qū)分的片段。根據(jù)分析,ISODATA能夠作為聚類分析的依據(jù),且具有理想的聚類效果。 對分為2類時,各類型行駛狀態(tài)和時間比例進(jìn)行統(tǒng)計,結(jié)果如圖6所示。由圖6可看出,加速度時間比所占比例較高;類型1和類型2的平均速度和平均行駛速度較均勻。與類型2相比,類型1的加速時間短,平均加速度、平均速度與平均行駛速度較大,可見,類型1的行駛狀態(tài)和駕駛操作較為順暢。而類型2加速時間比例大,平均加速度、平均速度和平均行駛速度卻較小,因此可能處于較為擁堵或跟車的行駛狀態(tài)。 圖6 各類型行駛狀態(tài) 電動汽車實行工況的構(gòu)建步驟: 步驟一根據(jù)聚類中心的大小,按照從小到大的順序分別篩選20個候選運動學(xué)片段。 步驟二篩選備用運動學(xué)片段,如果某個類型中所包含的運動學(xué)片段不足20個。 步驟三以篩選的20個運動片段為基礎(chǔ)集合,從中隨機(jī)篩選并組合成大于等于1 200 s的代表工況。 具體流程如圖7所示。 圖7 工況構(gòu)建流程 根據(jù)前述的聚類分析法的工況構(gòu)建過程,按照分類結(jié)果的時間比例,合成如圖8所示的1 200 s的汽車代表行駛工況。 圖8 電動汽車代表工況 對比代表工況和測試數(shù)據(jù)的特征參數(shù),結(jié)果如表3所示。可以看出,構(gòu)建的代表工況可以反映試驗電動汽車汽車的整體行駛特征。 表3 代表行駛工況和實際采集數(shù)據(jù)源特征參數(shù) 基于前述電動汽車行駛工況,首先按照最小距離原則確定電動汽車運行狀態(tài)的類別: (9) 確定電動汽車在某一路段行駛時的類別為1,2,…,n后,計算電動汽車在該類別工況下的行駛距離dn。則該路段消耗電量E為: E=Eq1×d1+Eq2×d2+…+Eqn×dn (10) 式中:Eqn代表第n類工況每公里消耗的電量。通過該路段后,剩余電量Es為: Es=E0Ssoc-E (11) 式中:E0、Ssoc代表了初始電量與荷電狀態(tài)。 在每個類別中隨機(jī)抽取了部分運動學(xué)片段,并合成了模擬的行駛情況。繪制出本段模擬行駛片段的實際耗電量與采用耗電評估方法計算所得的耗電量曲線對比圖,如圖9所示,虛線為所記錄的實際耗電曲線??梢钥闯龌诒疚奶岢龅幕诘缆沸旭偣r的研究,可以實現(xiàn)對電動汽車耗電量和道路行駛耗電特性的有效追蹤。 圖9 耗電量曲線 目前,國內(nèi)外針對汽車工況的研究主要以傳統(tǒng)汽車為主,對電動汽車工況研究較少。工況提取和聚類結(jié)果的判斷方法也存在一定不足,在電動汽車能耗特性分析方面也沒有與實際工況緊密結(jié)合。本文采用無監(jiān)督式聚類算法ISODATA進(jìn)行電動汽車的工況合成與構(gòu)建,并對合成的代表性工況進(jìn)行了合理性驗證,誤差均在±5.2%的范圍內(nèi)。在運動片段聚類和代表性工況的基礎(chǔ)上,進(jìn)行了電動汽車道路耗電特性分析和電量實時估算分析,驗證了所構(gòu)建的行駛工況模型與耗電量估算方法具有合理性。本文對電動汽車的能耗分析、基礎(chǔ)充電站設(shè)施配置、充電策略等方向的研究具有一定的參考價值。3.4 Silhouette函數(shù)輪廓圖篩選聚類結(jié)果
4 構(gòu)建行駛工況和耗電實時估算方法
4.1 合成方法
4.2 電動汽車工況合成結(jié)果
4.3 電動汽車工況合理性驗證
4.4 實際道路耗電估算
5 結(jié) 語