楊 金,陳 林,周 強(qiáng),陳建勛
(1.重慶交通大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,重慶 400074)(2.重慶南開中學(xué),重慶 400074)
本世紀(jì)初,我國(guó)直接采用歐洲的NEDC(新標(biāo)歐洲循環(huán)測(cè)試)行駛工況對(duì)汽車產(chǎn)品能耗/排放的認(rèn)證,有效促進(jìn)了汽車節(jié)能減排和技術(shù)的發(fā)展[1]. 但隨著我國(guó)汽車保有量的迅速增長(zhǎng),交通狀況的逐漸變化,繼續(xù)以NEDC工況為基準(zhǔn)所優(yōu)化標(biāo)定的汽車,其法規(guī)認(rèn)證結(jié)果與使用過程中的實(shí)際油耗量相比較,差距越來越大[2]. 因而,制定能反映我國(guó)實(shí)際道路行駛狀況的行駛工況迫在眉睫. 本文主要采集了某城市同一輛輕型汽車在不同時(shí)間段共21 d所獲得的數(shù)據(jù),針對(duì)人工篩選的不足,首先對(duì)數(shù)據(jù)時(shí)間不連續(xù)、加、減速度異常、長(zhǎng)期停車、長(zhǎng)時(shí)間堵車、怠速4種情況的異常數(shù)據(jù)進(jìn)行處理,然后對(duì)運(yùn)動(dòng)學(xué)片段進(jìn)行劃分,再通過主成分分析方法對(duì)車輛行駛工況的特征參數(shù)進(jìn)行處理,根據(jù)選出的特征參數(shù)利用K-均值聚類分析方法將所有代表性運(yùn)動(dòng)學(xué)片段按低速、中速和高速進(jìn)行聚類,最終擬合成汽車行駛工況的全過程,由此建立了某市同一輛輕型汽車合理的行駛工況,其設(shè)計(jì)方案簡(jiǎn)單合理,具有很好的實(shí)用價(jià)值.
由于GPS信號(hào)不良、數(shù)據(jù)采集設(shè)備故障、堵車等狀況造成部分無效和異常數(shù)據(jù),必須對(duì)無效和異常數(shù)據(jù)進(jìn)行數(shù)據(jù)處理. 本文主要考慮數(shù)據(jù)時(shí)間不連續(xù)、加、減速度異常、長(zhǎng)期停車、長(zhǎng)時(shí)間堵車、怠速4種情況的異常數(shù)據(jù),接下來我們給出上述4種情況的定義及其處理方式.
為使采集的數(shù)據(jù)更加全面,本文利用可插入GPRS手機(jī)卡和SD儲(chǔ)存卡的記錄儀采集某城市同一輕型車不同時(shí)間段在實(shí)際道路行駛的數(shù)據(jù). 采樣頻率為1 Hz,將采集到的GPS車速、X軸加速度、Y軸加速度、Z軸加速度、發(fā)動(dòng)機(jī)轉(zhuǎn)速、扭矩百分比、瞬時(shí)油耗、油門踏板開度、空燃比、發(fā)動(dòng)機(jī)負(fù)荷百分比、進(jìn)氣流量等數(shù)據(jù)從SD卡中導(dǎo)出.
數(shù)據(jù)時(shí)間不連續(xù):往往是由汽車行駛過程中GPS信號(hào)丟失導(dǎo)致的. 由于數(shù)據(jù)以秒為單位,且數(shù)據(jù)量往往是幾十萬甚至上百萬,人工篩選工作量過于巨大,因此選擇編寫計(jì)算機(jī)程序篩選出非連續(xù)數(shù)據(jù). 此時(shí)需要對(duì)非連續(xù)數(shù)據(jù)進(jìn)行定義及處理,具體定義及處理方式如下:
令ti、ti+1為相鄰兩時(shí)間點(diǎn)且ti
若vi=vi+1=0,根據(jù)運(yùn)動(dòng)學(xué)片段的定義,認(rèn)為[t′,ti]、[ti+1,t″]時(shí)間段車輛行駛數(shù)據(jù)可以構(gòu)成一個(gè)完整的運(yùn)動(dòng)學(xué)片段,保留[t′,ti]與[ti+1,t″]時(shí)間段的車輛行駛數(shù)據(jù);
若vi=0且vi+1≠0,則[t′,ti]時(shí)間段車輛行駛數(shù)據(jù)可以構(gòu)成一個(gè)完整的運(yùn)動(dòng)學(xué)片段,保留[t′,ti]時(shí)間段的車輛行駛數(shù)據(jù),而[ti+1,t″]時(shí)間段車輛行駛數(shù)據(jù)無法構(gòu)成一個(gè)完整的運(yùn)動(dòng)學(xué)片段,刪除[ti+1,t″]時(shí)間段的車輛行駛數(shù)據(jù);
若vi≠0且vi+1=0,則[t′,ti]時(shí)間段車輛行駛數(shù)據(jù)無法構(gòu)成一個(gè)完整的運(yùn)動(dòng)學(xué)片段,刪除[t′,ti]時(shí)間段的車輛行駛數(shù)據(jù),而[ti+1,t″]時(shí)間段車輛行駛數(shù)據(jù)可以構(gòu)成一個(gè)完整的運(yùn)動(dòng)學(xué)片段,保留[ti+1,t″]時(shí)間段的車輛行駛數(shù)據(jù);
若vi≠0且vi+1≠0,則[t′,ti]與[ti+1,t″]時(shí)間段車輛行駛數(shù)據(jù)無法構(gòu)成一個(gè)完整的運(yùn)動(dòng)學(xué)片段,刪除[t′,t″]時(shí)間段的車輛行駛數(shù)據(jù),刪除[t′,t″]所有數(shù)據(jù)后,包含t′時(shí)刻的連續(xù)行駛片段與包含t″時(shí)刻的連續(xù)行駛片段雖然時(shí)間上不連續(xù),但是保證了每部分片段之間時(shí)間的連續(xù)性,每部分片段可以認(rèn)為是一個(gè)運(yùn)動(dòng)學(xué)片段.
加、減速度異常:汽車行駛過程中,對(duì)于一輛普通轎車,一般情況下:0~100 km/h的加速時(shí)間大于7 s,緊急剎車最大減速度在7.5 m/s2~8.0 m/s2.由于采集的數(shù)據(jù)中并不能直接得到加速度,因此首先測(cè)算每個(gè)時(shí)刻的加速度.
加速度的定義為:單位時(shí)間內(nèi)速度改變程度的矢量.若動(dòng)點(diǎn)的速度vi經(jīng)(ti+1-ti)s后變成vi+1,加速度計(jì)算公式如下:
(1)
考慮到已知數(shù)據(jù)是以秒為單位測(cè)算車輛的速度,本文加速度測(cè)算公式如下:
(2)
將測(cè)算的加速度與普通轎車一般情況下加、減速度做比較,根據(jù)公式(1),最大加速度為4 m/s2,最大減速度為7.5 m/s2,超過則為加、減速度異常情況.
按照公式(2)測(cè)算所有時(shí)刻的加速度,將各個(gè)時(shí)刻的加或減速度與最大加速度為4 m/s2和最大減速度比較,判斷該時(shí)刻的加或減速度是否存在問題,具體定義及處理方式如下:
令ti時(shí)刻的加速度為ai,vi代表ti時(shí)刻的速度,若ai>4 m/s2、ai<-7.5 m/s2,則定義ti時(shí)刻為加或減速度異常的數(shù)據(jù)時(shí)刻,如果刪除ti時(shí)刻的數(shù)據(jù),必然會(huì)導(dǎo)致原本包含ti時(shí)刻的車輛連續(xù)行駛片段不連續(xù),因此需要對(duì)這部分?jǐn)?shù)據(jù)進(jìn)行處理.
若vi≠0,找到距離ti時(shí)間最近且GPS車速為0的時(shí)間點(diǎn)t′、t″,且t′ 若vi=0,找到距離ti時(shí)間最近且GPS車速為0的時(shí)間點(diǎn)t′,且t′>ti,刪除[ti,t′]時(shí)間段的車輛行駛數(shù)據(jù),即完成了汽車突然加、減速度產(chǎn)生的異常數(shù)據(jù)的處理,刪除[ti,t′]的所有數(shù)據(jù)后,包含ti時(shí)刻的車輛連續(xù)行駛片段與包含t′時(shí)刻的車輛連續(xù)行駛片段雖然時(shí)間上不連續(xù),但是保證每部分片段之間時(shí)間的連續(xù)性,每部分片段可以被認(rèn)為是一個(gè)運(yùn)動(dòng)學(xué)片段. 長(zhǎng)期停車:定義vi=0的連續(xù)時(shí)刻的累計(jì)時(shí)間超過180 s為長(zhǎng)期停車狀態(tài),將所有vi=0的連續(xù)時(shí)間區(qū)間通過計(jì)算機(jī)語言篩選出來,并判斷累計(jì)時(shí)間是否超過180 s,若[t′,t″]為連續(xù)時(shí)間vi=0區(qū)間,則累計(jì)時(shí)間計(jì)算方式如下: cumulativetime=(t″-t′)+1. (3) 長(zhǎng)期停車產(chǎn)生的異常數(shù)據(jù)具體定義及處理方式如下:令通過MATLAB編程語言篩選出vi=0的連續(xù)時(shí)間區(qū)間為[t′,t″],根據(jù)公式(3)計(jì)算vi=0的連續(xù)時(shí)刻的累計(jì)時(shí)間,若cumulativetime>180 s,刪除[t′,t″]時(shí)間段的車輛行駛數(shù)據(jù),即完成了長(zhǎng)期停車產(chǎn)生的異常數(shù)據(jù)處理. 堵車、怠速:由于長(zhǎng)時(shí)間堵車、斷斷續(xù)續(xù)低速行駛通常按怠速情況處理,即vi=0的情況,因此長(zhǎng)時(shí)間堵車、斷斷續(xù)續(xù)低速行駛時(shí)間超過180 s,可理解為長(zhǎng)期停車狀態(tài),長(zhǎng)期停車為異常情況,需要對(duì)這部分?jǐn)?shù)據(jù)進(jìn)行處理. 具體定義及處理方式:通過MATLAB編程語言篩選出vi≠0的連續(xù)時(shí)間范圍:{ti,ti+1,ti+2,…,t′},其速度范:{vi,vi+1,vi+2,…,v′},若max{vi,vi+1,vi+2,…,v′}<10 km/h,則定義[ti,t′]這段時(shí)間為長(zhǎng)時(shí)間堵車、斷斷續(xù)續(xù)低速行駛時(shí)間,根據(jù)公式(3)計(jì)算,若cumulativetime>180 s,刪除[ti,t′]時(shí)間段的車輛行駛數(shù)據(jù),即完成了長(zhǎng)期停車產(chǎn)生的異常數(shù)據(jù)處理. 運(yùn)動(dòng)學(xué)片段是指汽車從怠速狀態(tài)開始至下一個(gè)怠速狀態(tài)開始之間的車速區(qū)間[3].本文劃分運(yùn)動(dòng)學(xué)片段的標(biāo)準(zhǔn)是: 1.從汽車速度為零的狀態(tài)開始,到下個(gè)時(shí)間為零的狀態(tài)結(jié)束; 2.全過程持續(xù)時(shí)間必須是連續(xù)的,且超過50 s; 3. 過程中的最大速度大于10 km/h. 將上述3個(gè)條件用MATLAB軟件對(duì)篩除異常后的數(shù)據(jù)進(jìn)行運(yùn)動(dòng)學(xué)片段的劃分,我們共得到了1 648個(gè)運(yùn)動(dòng)學(xué)片段. 從這1 648個(gè)運(yùn)動(dòng)學(xué)片段中隨機(jī)選出4段數(shù)據(jù)繪制其速度-時(shí)間圖,如圖1所示,并將第一節(jié)運(yùn)動(dòng)學(xué)片段的速度-時(shí)間圖提取出來. 如圖2所示. 圖1 4節(jié)運(yùn)動(dòng)學(xué)片段的速度-時(shí)間圖Fig.1 Velocity-time diagram of four segments of kinematics 圖2 運(yùn)動(dòng)學(xué)片段的速度-時(shí)間圖Fig.2 Velocity-time diagram of kinematic segments 從圖1可以看出,這4節(jié)運(yùn)動(dòng)學(xué)片段的開頭和結(jié)尾處的速度為0,無間斷區(qū)間,最大速度均大于 10 km/h,因此,這4節(jié)運(yùn)動(dòng)學(xué)片段均滿足上述劃分運(yùn)動(dòng)學(xué)片段的3個(gè)標(biāo)準(zhǔn),由此可以驗(yàn)證編寫的MATLAB代碼的有效性.由圖2,速度為0的運(yùn)行狀態(tài)即怠速狀態(tài),速度隨著時(shí)間的增加而增加的運(yùn)行狀態(tài)為加速狀態(tài),速度隨著時(shí)間的增加而減少的運(yùn)行狀態(tài)為減速狀態(tài),速度隨著時(shí)間的增加不產(chǎn)生較大變化的狀態(tài)為勻速狀態(tài). 前面已經(jīng)介紹了數(shù)據(jù)處理方法和運(yùn)動(dòng)學(xué)片段的劃分,下面我們將引入本文要用到的主成分分析方法和K-均值聚類方法的算法原理. 汽車行駛工況是描述汽車行駛速度與時(shí)間的曲線[4].初步選擇以下11個(gè)與速度相關(guān)的參數(shù)作為汽車運(yùn)行特征參數(shù):最高速度vmax;平均速度vm;平均行駛速度(不含怠速)vmr;平均加速度aa;平均減速度ac;速度標(biāo)準(zhǔn)差vsd;加速度標(biāo)準(zhǔn)差asd;加速時(shí)間比例Pa;等速時(shí)間比例Pb;減速時(shí)間比例Pc;怠速時(shí)間比例Pd.針對(duì)選定的11個(gè)特征參數(shù),我們選用主成分分析法得到對(duì)行駛工況影響最大的幾個(gè)因素[5-6],主要步驟如下: 第一步,對(duì)11個(gè)特征參數(shù)進(jìn)行主成分分析[7-8],得到較大影響的特征參數(shù). 上述11個(gè)特征參數(shù)和所有區(qū)間片段的參數(shù)矩陣如下: (4) 式中,xii(i=1,2,…,r,j=1,2,…,s)是第i個(gè)區(qū)間片段的第j個(gè)參數(shù);r是所有區(qū)間片段數(shù);s是所有特征參數(shù)個(gè)數(shù). 對(duì)參數(shù)矩陣X進(jìn)行標(biāo)準(zhǔn)化,得到矩陣Y如下: (5) 式中, (6) (7) (8) 由矩陣Y計(jì)算協(xié)方差矩陣Z,其定義如下: (9) 式中, (10) (11) 由矩陣X得到相關(guān)矩陣G,定義如下: (12) 式中, (13) 用λi表示矩陣G的特征值,λ1≥λ2≥…≥λn≥0, 相應(yīng)正交化特征向量如下: (14) 用Ri表示第i個(gè)主成分的貢獻(xiàn)率,定義如下: (15) 式中,貢獻(xiàn)率Ri越大,表示該主成分i所表達(dá)的信息越多. 用LRθ表示前θ個(gè)特征值的貢獻(xiàn)率之和,定義如下: (16) 式中,如果LRi≥80%,前θ個(gè)特征值就能滿足應(yīng)用需要,即每個(gè)區(qū)間片段有θ個(gè)主成分.由此可以得到θ個(gè)對(duì)車輛行駛工況有較大影響的特征參數(shù). 第二步,將主成分分析確定的θ個(gè)特征參數(shù)用于聚類分析中,用于評(píng)價(jià)片段之間的相關(guān)程度[9-10]. 相關(guān)程度通過相關(guān)系數(shù)衡量,相關(guān)系數(shù)的定義如下: (17) (18) 通過公式(17)-(18)可對(duì)所有代表性運(yùn)動(dòng)學(xué)片段進(jìn)行聚類[11-12],按照低速、中速、高速3類運(yùn)行狀態(tài)將所有代表性運(yùn)動(dòng)學(xué)片段歸為3類. 第三步,對(duì)于3類運(yùn)行狀態(tài)提取的不同數(shù)量運(yùn)動(dòng)學(xué)片段條數(shù)進(jìn)行數(shù)據(jù)擬合. 本文構(gòu)建的車輛行駛工況時(shí)長(zhǎng)在1 200 s~1 300 s之間,可通過各類總運(yùn)行時(shí)間在總體數(shù)據(jù)時(shí)間中所占的時(shí)間比確定各類最終擬合工況所占的時(shí)間,定義如下: (19) 式中,Tk為第k類在最終擬合的車輛行駛工況圖所占時(shí)間;Tall為所有帶變形運(yùn)動(dòng)學(xué)片段的持續(xù)時(shí)間;Tduringtime為要構(gòu)建的車輛行駛工況的持續(xù)時(shí)間;Nk為第k類運(yùn)動(dòng)學(xué)片段的總條數(shù);Tki為第k類中第i條運(yùn)動(dòng)學(xué)片段的運(yùn)行時(shí)間.由公式(19)可分別從3類運(yùn)行狀態(tài)下提取不同數(shù)量的運(yùn)動(dòng)學(xué)片段條數(shù),最后擬合成車輛行駛工況圖. 從預(yù)處理后的數(shù)據(jù)中,按時(shí)間長(zhǎng)度在1 100 s~1 400 s之間的連續(xù)行駛區(qū)間將所有連續(xù)行駛區(qū)間提取出來,一共提取了11個(gè)區(qū)間,并對(duì)這11個(gè)區(qū)間按照運(yùn)動(dòng)學(xué)片段的定義劃出了97個(gè)代表性運(yùn)動(dòng)學(xué)片段. 根據(jù)選出的11個(gè)特征參數(shù)計(jì)算97個(gè)運(yùn)動(dòng)學(xué)片段的部分特征參數(shù)值(表1). 表1 97個(gè)運(yùn)動(dòng)學(xué)片段的特征參數(shù)Table 1 Characteristic parameters of 97 kinematic segments 根據(jù)表1的數(shù)據(jù)進(jìn)行主成分分析,得到11個(gè)特征參數(shù)即11個(gè)主成分的特征值、貢獻(xiàn)率及累計(jì)貢獻(xiàn)率數(shù)據(jù)表,以及主成分載荷矩陣表,如表2、3所示. 表2 各個(gè)主成分的特征值、貢獻(xiàn)率及累計(jì)貢獻(xiàn)率Table 2 Eigenvalues,contribution rate and cumulative contribution rate of each principal component 從表2看出,前3個(gè)主成分累計(jì)貢獻(xiàn)率超過80%,因此選取前3個(gè)主成分進(jìn)行分析,通過SPSS軟件分析,可得到前3個(gè)主成分的載荷矩陣. 從表3可以看出: 表3 主成分載荷矩陣表Table 3 Principal component load matrix (1)第一類主成分主要反映平均速度、最高速度、平均行駛速度; (2)第二類主要反映加速度標(biāo)準(zhǔn)差; (3)第三類主要反映速度標(biāo)準(zhǔn)差. 因此根據(jù)主成分分析選出的特征參數(shù):平均速度、最高速度、平均行駛速度、加速度標(biāo)準(zhǔn)差、平均加速這5個(gè)特征參數(shù)進(jìn)行聚類分析,將所有代表性運(yùn)動(dòng)學(xué)片段按照低速、中速、高速進(jìn)行聚類,最終聚類中心對(duì)比如圖3所示. 圖3 聚類中心對(duì)比圖Fig 3 Comparison of cluster centers 從圖3中可以看出,第Ⅰ類片段的加速比例較高,反映了車輛在暢通無阻的道路上的行駛情況,可以定為高速片段;第Ⅱ類片段的怠速比例較大,反映了車輛在擁擠的道路上行駛,可以定為低速片段;第Ⅲ類片段的勻速比例較大,反映了車輛穩(wěn)定形式的狀態(tài),可以定為中速片段. 通過SPSS軟件分析,可得到K均值聚類分析的聚類成員列表,如表4所示. 表4 K均值聚類分析的聚類成員列表Table 4 List of cluster members of K-means cluster analysis 從表4可以看出,97個(gè)運(yùn)動(dòng)學(xué)片段被分成3類,第Ⅰ類包括了16個(gè)運(yùn)動(dòng)學(xué)片段,第Ⅱ類包括了32個(gè)運(yùn)動(dòng)學(xué)片段,第Ⅲ類包含了49個(gè)運(yùn)動(dòng)學(xué)片段. 公式(19)計(jì)算取整后,可獲得2條第Ⅰ類高速片段,4條第Ⅱ類低速片段,5條第Ⅲ類中速片段,最后擬合成持續(xù)時(shí)間為1 207 s的車輛行駛工況圖,如圖4所示. 在0~272 s之間為車輛低速行駛狀態(tài),且低速狀態(tài)的車速低于24.6 km/h;在272 s~930 s之間為車輛中速行駛狀態(tài),且中速行駛狀態(tài)的車速普遍處于24 km/h~43.7 km/h;在930 s~1 207 s之間為車輛高速行駛狀態(tài),且高速行駛狀態(tài)車速最高達(dá)到了64.4 km/h. 圖4 構(gòu)建的汽車工況速度-時(shí)間圖Fig.4 Constructed speed-time diagram of vehicle working condition 本文通過采集某城市同一輛輕型汽車在不同時(shí)間段共21 s所獲得的數(shù)據(jù),主要介紹了如何通過處理大量的汽車行駛數(shù)據(jù)來得到汽車運(yùn)動(dòng)學(xué)原理. 首先對(duì)數(shù)據(jù)時(shí)間不連續(xù)、加減速度異常、長(zhǎng)期停車、長(zhǎng)時(shí)間堵車和怠速4種情況的異常數(shù)據(jù)進(jìn)行處理,然后運(yùn)用MATLAB軟件對(duì)篩除異常后的數(shù)據(jù)進(jìn)行運(yùn)動(dòng)學(xué)片段的劃分,并從中取出具有代表性的運(yùn)動(dòng)學(xué)片段,再利用主成分分析方法求出對(duì)車輛行駛工況有較大影響的特征參數(shù),用得到的特征參數(shù)求出用于評(píng)價(jià)片段之間的相關(guān)程度的片段間的相關(guān)系數(shù)和片段之間的距離,再使用K-均值聚類方法對(duì)所有代表性運(yùn)動(dòng)片段進(jìn)行聚類分析,將所有運(yùn)動(dòng)學(xué)片段按照低速、中速、高速的運(yùn)動(dòng)狀態(tài)分為3類,并得到了聚類中心對(duì)比圖. 最后根據(jù)K-均值聚類分析的聚類成員對(duì)3類運(yùn)行狀態(tài)提取的不同數(shù)量運(yùn)動(dòng)學(xué)片段條數(shù)進(jìn)行數(shù)據(jù)擬合,最終擬合成包含低速、中速和高速3種運(yùn)動(dòng)狀態(tài)的汽車行駛速度與時(shí)間的曲線,即持續(xù)時(shí)間為1 207 s的汽車行駛工況圖,由此得到汽車運(yùn)動(dòng)學(xué)的數(shù)學(xué)原理. 本文通過對(duì)汽車運(yùn)動(dòng)學(xué)數(shù)學(xué)原理的探索,為相關(guān)部門制定出反應(yīng)我國(guó)實(shí)際情況的汽車行駛工況提供理論依據(jù),為車輛設(shè)計(jì)的動(dòng)力匹配、提高發(fā)動(dòng)機(jī)的燃油消耗率、有效降低尾氣排放提供參考,對(duì)我國(guó)汽車工業(yè)的發(fā)展具有重要意義.1.2 運(yùn)動(dòng)學(xué)片段劃分
2 算法原理及應(yīng)用
2.1 算法原理
2.2 算法案例
3 結(jié)論