李瀟 汪濤 張毅 李朝陽
(上海交通大學(xué) 船舶海洋與建筑工程學(xué)院,上海 200240)
智能網(wǎng)聯(lián)汽車可以通過專用短程通信(Dedicated Short Range Communication,DSRC)[1]、第五代移動通信技術(shù)(簡稱5G)等通信技術(shù)實時與道路上的其他車輛和智能路側(cè)設(shè)備進(jìn)行通信,通過將交通數(shù)據(jù)上傳至云端數(shù)據(jù)中心以進(jìn)一步實現(xiàn)對交通狀態(tài)的精確掌握;但是,即使網(wǎng)聯(lián)車在道路上實現(xiàn)完全普及,采集到的交通數(shù)據(jù)也需要其他檢測手段加以修正,傳統(tǒng)交通數(shù)據(jù)檢測仍是保證道路交通數(shù)據(jù)準(zhǔn)確性的重要方式。現(xiàn)有研究表明,至2050年,道路上智能網(wǎng)聯(lián)車所占比例僅為75%左右[2],因此在智能網(wǎng)聯(lián)車與人工駕駛車輛長期混行的條件下,如何利用有效的方法對由網(wǎng)聯(lián)車實時回傳的數(shù)據(jù)和其他利用傳統(tǒng)交通信息檢測方式獲取的數(shù)據(jù)所組成的多源交通數(shù)據(jù)進(jìn)行融合,對實時掌握交通運行狀況具有重要意義。
關(guān)于智能網(wǎng)聯(lián)車與多源交通數(shù)據(jù)的融合,國內(nèi)外學(xué)者已做了大量研究。在網(wǎng)聯(lián)車數(shù)據(jù)采集與應(yīng)用方面,Du等[3]為了獲取網(wǎng)聯(lián)車和周圍車輛換道行為的相關(guān)數(shù)據(jù),基于V2X技術(shù)設(shè)計了一套高精度的車輛位置信息收集系統(tǒng),實驗表明該系統(tǒng)能準(zhǔn)確描述車輛換道軌跡;Sahin等[4]針對網(wǎng)聯(lián)車集群中的數(shù)據(jù)自主收集問題構(gòu)建了一個測試反饋式數(shù)據(jù)動態(tài)收集方法的框架,并建立了一個可以模擬數(shù)據(jù)動態(tài)收集過程和對這一過程中的決策進(jìn)行評估的仿真平臺;Hu等[5]將網(wǎng)聯(lián)車在行駛過程中所提供的豐富信息結(jié)合深度學(xué)習(xí)對密歇根州某地的公路交叉口進(jìn)行了事故風(fēng)險水平預(yù)測。在徑向基神經(jīng)網(wǎng)絡(luò)(Radial Basis Function Neural Network,RBFNN)的應(yīng)用方面,Ullah等[6]為降低因無線傳感器網(wǎng)絡(luò)傳輸無效數(shù)據(jù)而產(chǎn)生的額外功耗,提出了一種基于改進(jìn)RBF神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)聚合方法,該方法能夠?qū)鞲衅鞑杉降臄?shù)據(jù)進(jìn)行分類并有效減少冗余數(shù)據(jù)和異常值;Hou等[7]提出了一種結(jié)合堆棧自動編碼器(Stacked Autoencoder,SAE)和RNF神經(jīng)網(wǎng)絡(luò)的短時交通流預(yù)測模型,該模型能夠有效地擬合交通流的周期性變化,同時降低天氣等因素對預(yù)測結(jié)果的干擾;羅玉濤等[8]提出了一種降低車輪控制系統(tǒng)干擾的自適應(yīng)神經(jīng)網(wǎng)絡(luò)滑膜控制方法,該方法采用RBF神經(jīng)網(wǎng)絡(luò)對系統(tǒng)的不確定性和電機(jī)力矩的擾動進(jìn)行實時估計,以此作為車輪轉(zhuǎn)角控制器設(shè)計的基礎(chǔ),有效提高了車輪轉(zhuǎn)角控制的自適應(yīng)性和穩(wěn)定性。由上述相關(guān)研究可以看出,RBF神經(jīng)網(wǎng)絡(luò)已得到了廣泛應(yīng)用。
道路交通流量是表征交通運行狀態(tài)的重要參數(shù),數(shù)據(jù)的非線性程度較高。RBF神經(jīng)網(wǎng)絡(luò)可以逼近任意精度的非線性函數(shù),具有收斂速度快的特點,用于多源交通流量融合具有明顯的優(yōu)勢[9];而利用粒子群算法(Particle Swarm Optimization,PSO)的尋優(yōu)能力確定RBF神經(jīng)網(wǎng)絡(luò)中神經(jīng)元核函數(shù)的中心坐標(biāo)、寬度與權(quán)重,可以使其發(fā)揮更出色的函數(shù)逼近能力。因此,本研究提出使用粒子群算法結(jié)合RBF神經(jīng)網(wǎng)絡(luò)對多源交通流量進(jìn)行融合。
智能網(wǎng)聯(lián)車在行駛的過程中通過DSRC或者5G通信技術(shù)與其他網(wǎng)聯(lián)車和智能路側(cè)設(shè)施進(jìn)行信息實時交互。以此為基礎(chǔ),交通主管部門可以實現(xiàn)對車輛信息的全方位采集,主要體現(xiàn)在對車輛速度、車輛位置、路段車輛密度、車輛OD點對、延誤等數(shù)據(jù)的獲取上。以交通流量為例,通過道路上網(wǎng)聯(lián)車來推算交通流量,在線圈檢測、微波檢測等傳統(tǒng)交通流量檢測方式以外,為道路交通流量的準(zhǔn)確判斷提供了一個新的途徑;與此類似,眾多研究表明,多源交通大數(shù)據(jù)從不同維度對城市交通信息進(jìn)行描繪[10]?;煨袟l件下多源交通數(shù)據(jù)具有規(guī)模性、多樣性、實效性、價值性4個基本特點。
交通信息采集與存儲一般存在多個數(shù)據(jù)源系統(tǒng),導(dǎo)致交通數(shù)據(jù)本身具有豐富的多樣性。各種交通調(diào)度平臺、交通監(jiān)測系統(tǒng)中的各種數(shù)據(jù)相互獨立、結(jié)構(gòu)各異、數(shù)據(jù)量大且分散,使得交通信息不能充分利用。因此在進(jìn)行多源交通數(shù)據(jù)融合的同時,還需要對交通大數(shù)據(jù)進(jìn)行充分分析、挖掘與提取,從不同數(shù)據(jù)層面對交通數(shù)據(jù)進(jìn)行高效處理,降低數(shù)據(jù)噪音和冗余度并提高數(shù)據(jù)的準(zhǔn)確性。如圖1所示,以網(wǎng)聯(lián)汽車、路側(cè)交通設(shè)施、交通監(jiān)測系統(tǒng)等數(shù)據(jù)源提供的數(shù)據(jù)作為交通數(shù)據(jù)融合的原始數(shù)據(jù),提取數(shù)據(jù)特征后形成具有指向性的特征數(shù)據(jù)輸入到特征層,特征數(shù)據(jù)經(jīng)過特征層的深度融合后經(jīng)過處理輸入到?jīng)Q策層,最終得到交通運行決策數(shù)據(jù),以達(dá)到利用少量的數(shù)據(jù)獲得盡可能多的交通特征的目的。
圖1 網(wǎng)聯(lián)環(huán)境下交通大數(shù)據(jù)融合框架
2.1.1 傳統(tǒng)交通數(shù)據(jù)采集方法
在傳統(tǒng)交通數(shù)據(jù)采集領(lǐng)域,針對道路交通量、平均車速等交通參數(shù)的獲取主要有人工計數(shù)法、浮動車法、機(jī)械計數(shù)法與錄像法等方式。但受限于人力成本與檢測器的精度,傳統(tǒng)交通數(shù)據(jù)的調(diào)查方法難以做到面面俱到。
2.1.2 網(wǎng)聯(lián)環(huán)境下交通數(shù)據(jù)獲取
若道路中車輛全部為網(wǎng)聯(lián)車,可以把道路中的全部車輛視為“特殊傳感器”。而在網(wǎng)聯(lián)車與非網(wǎng)聯(lián)車混行的條件下,在對道路交通流量進(jìn)行估計時,可以把混行車流中的網(wǎng)聯(lián)車看作浮動車,利用車載激光雷達(dá)或攝像頭,結(jié)合目標(biāo)檢測技術(shù)識別單位時間內(nèi)超越網(wǎng)聯(lián)車或被網(wǎng)聯(lián)車超越的車輛數(shù),采用“浮動車法”進(jìn)行交通流量檢測,將車輛在行駛過程中采集到的數(shù)據(jù)計算生成交通流量并回傳至數(shù)據(jù)中心,檢測計算方法如式(1)所示:
(1)
其中,qc為目標(biāo)路段選定方向(如某路段下行方向)上的交通量,Xa為網(wǎng)聯(lián)車逆選定方向(上行方向)行駛時迎面駛來的車數(shù),Yc為網(wǎng)聯(lián)車順選定方向(下行方向)行駛時超越網(wǎng)聯(lián)車的車數(shù)減去被網(wǎng)聯(lián)車超越的車數(shù),ta為網(wǎng)聯(lián)車逆選定方向(上行方向)的行駛時間,tc為網(wǎng)聯(lián)車順選定方向(下行方向)的行駛時間。
針對道路上同一時刻有多輛網(wǎng)聯(lián)車行駛的情況,測量交通量取多輛網(wǎng)聯(lián)車返回數(shù)據(jù)的算術(shù)平均值。
2.2.1 徑向基神經(jīng)網(wǎng)絡(luò)
RBFNN于1988年由耶魯大學(xué)的Moody等[11]提出,該神經(jīng)網(wǎng)絡(luò)只有一個中間層,神經(jīng)元以徑向基函數(shù)作為核函數(shù),徑向基函數(shù)圖像如圖2所示。中間層每個神經(jīng)元只對特定范圍的輸入做出響應(yīng),對這些響應(yīng)賦予權(quán)重W得到輸出值。由于中間層數(shù)量少,所以RBFNN的學(xué)習(xí)速度極快,同時由于每個神經(jīng)元與輸出值的關(guān)系相對獨立,神經(jīng)元之間的相互干擾小,適合進(jìn)行大范圍的數(shù)據(jù)融合以及高速數(shù)據(jù)處理。
圖2 徑向基函數(shù)圖像
2.2.2 粒子群算法
雖然RBFNN結(jié)構(gòu)簡單,但是中間層神經(jīng)元核函數(shù)y(x,w,b)=e-(b(x-w))中w和b的確定對減小輸出誤差和降低隱藏層的維度非常重要[12],實際應(yīng)用中大多采用窮舉、試湊和經(jīng)驗的方法來確定,具有盲目性且效率較低。PSO算法計算過程簡單且需要調(diào)整的參數(shù)少,適用于復(fù)雜問題求最優(yōu)解,算法由Kennedy等[13]于1995年提出,每個粒子在時刻t具有位置xi(t)和速度vi(t)兩個參數(shù),首先需要確定整個系統(tǒng)的目標(biāo)函數(shù)以判斷粒子優(yōu)劣,再根據(jù)每一輪粒子返回的目標(biāo)函數(shù)值尋找粒子個體最優(yōu)位置pi和全局最優(yōu)位置pg,最終得到全局最優(yōu)位置pg即為系統(tǒng)最優(yōu)解。
vi(t+1)=k·vi(t)+c1·rand()·(pb,i(t)-xi(t))+
c2·rand()·(gb(t)-xi(t))
(2)
xi(t+1)=xi(t)+vi(t+1)
(3)
其中:vi表示某一個時刻粒子i的速度;k為慣性權(quán)重;c1、c2為自身學(xué)習(xí)因子和社會學(xué)習(xí)因子;rand()表示0到1之間的隨機(jī)數(shù)。
2.2.3 算法設(shè)計
RBFNN在訓(xùn)練過程中需要確定4個關(guān)鍵性參數(shù):中間層神經(jīng)元個數(shù)、每個核函數(shù)中心坐標(biāo)w和寬度b、各神經(jīng)元的輸出權(quán)重W。不同類型的數(shù)據(jù)樣本,中間層神經(jīng)元的個數(shù)不同,因此首先選定輸入數(shù)據(jù)組成數(shù)據(jù)集,后續(xù)神經(jīng)網(wǎng)絡(luò)中間層核函數(shù)維度需與輸入數(shù)據(jù)集維度一致;利用Elbow Method方法和K均值聚類算法對訓(xùn)練集中的數(shù)據(jù)進(jìn)行聚類,取聚類中心個數(shù)作為神經(jīng)元的個數(shù),同時聚類中心的坐標(biāo)還可以作為粒子運動時的范圍參考;然后設(shè)計對應(yīng)數(shù)量級的神經(jīng)網(wǎng)絡(luò),在求神經(jīng)網(wǎng)絡(luò)中的關(guān)鍵參數(shù)w、b、W的過程中,引入具有優(yōu)良尋優(yōu)性能的粒子群算法對神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,以融合數(shù)據(jù)與對照數(shù)據(jù)的差值作為優(yōu)化的目標(biāo)函數(shù)進(jìn)行迭代;最后通過粒子迭代以及運算過程中RBFNN自身參數(shù)的更新共同得到幾個關(guān)鍵參數(shù),計算過程如圖3。
在多源傳感器數(shù)據(jù)融合方面,卡爾曼濾波(Kalman Filter,KF)是一種最優(yōu)的系統(tǒng)參數(shù)估計方法[14]。傳統(tǒng)卡爾曼濾波算法的核心是預(yù)先將非線性系統(tǒng)中的非線性函數(shù)變換為線性函數(shù),使用反饋控制來不斷迭代估計整個系統(tǒng)的狀態(tài),在數(shù)學(xué)上是一種線性最小方差統(tǒng)計估算方法[15]。車輛的到達(dá)在某種程度上具有隨機(jī)性,這種隨機(jī)性反映在空間和時間兩個維度上呈現(xiàn)線性或非線性分布,因此本研究使用PSO-RBFNN和KF兩種方法對多源交通流量進(jìn)行融合,并對這兩種方法的融合效果進(jìn)行了對比。
對來源于不同交通檢測設(shè)備的數(shù)據(jù)進(jìn)行融合,在某市實驗路網(wǎng)中選取一段東西雙向六車道路段,在目標(biāo)路段距離交叉口停車線25 m處安裝微波與視頻檢測裝置,在距離交叉口停車線5 m處安裝線圈檢測器,浮動車數(shù)據(jù)由測試網(wǎng)聯(lián)車回傳。選擇其中3種檢測方式測得的道路交通流量:線圈檢測獲取的交通流量qc,“浮動車法”獲取的交通流量qf,微波檢測設(shè)備獲取的交通流量qm,由于網(wǎng)聯(lián)車混行條件下可以將網(wǎng)聯(lián)車視為浮動車,將qf作為混行條件下網(wǎng)聯(lián)車計算的交通流量,剔除明顯錯誤數(shù)據(jù)后整理得到3組Excel數(shù)據(jù),交通流量取每天07:00-09:00以及17:00-20:00的高峰流量,以15 min為時間間隔進(jìn)行劃分。設(shè)計的神經(jīng)網(wǎng)絡(luò)中以qc和qf兩種數(shù)據(jù)作為輸入進(jìn)行融合,并以微波檢測設(shè)備獲取的交通流量qm表征實際道路交通流量,作為對照組對融合后的數(shù)據(jù)進(jìn)行對比。為訓(xùn)練本段道路交通流量對應(yīng)的神經(jīng)網(wǎng)絡(luò),將上文采集到的交通流量數(shù)據(jù)劃分為訓(xùn)練集和測試集兩部分,同時取前70%的數(shù)據(jù)作為訓(xùn)練集、后30%的數(shù)據(jù)作為測試集。
圖3 粒子群優(yōu)化的徑向基神經(jīng)網(wǎng)絡(luò)示意圖
3.2.1 神經(jīng)網(wǎng)絡(luò)訓(xùn)練
使用Matlab編寫算法程序,首先利用“Elbow Method”對訓(xùn)練集中的數(shù)據(jù)進(jìn)行聚類中心分析[16],以確定中間層神經(jīng)元的個數(shù)進(jìn)行判斷,將線圈檢測裝置和“浮動車法”獲取的交通流量進(jìn)行組合,形成二維數(shù)據(jù)點對,形式為“(線圈檢測數(shù)據(jù),浮動車獲取的數(shù)據(jù))”,將數(shù)據(jù)對看作二維平面上的點,利用K-Means算法將數(shù)據(jù)分為3類(基于K聚類的交通流量分類結(jié)果如圖4所示),中心點分別為(217.344 6,210.588 1)、(214.678 2,238.514 9)、(240.261 2,226.765 6),并以聚類中心為參考設(shè)置本輪RBF神經(jīng)網(wǎng)絡(luò)中間層神經(jīng)元中心位置的移動范圍。
圖4 基于K均值聚類的交通流量分類
然后用PSO算法生成20個粒子,結(jié)合3個聚類中心坐標(biāo)對粒子初始坐標(biāo)范圍和運動范圍進(jìn)行框定。由于RBFNN共有3個神經(jīng)元,每個神經(jīng)元有2個中心點參數(shù):1個寬度參數(shù)和1個權(quán)重參數(shù),因此粒子的維度設(shè)12。
最后建立PSO-RBFNN目標(biāo)函數(shù),將3種方式獲取的交通流量輸入神經(jīng)網(wǎng)絡(luò),利用qc和qf進(jìn)行融合,將融合結(jié)果與qm的差值作為PSO算法中粒子優(yōu)劣的目標(biāo)函數(shù),通過迭代最終得到最優(yōu)粒子,PSO-RBFNN迭代曲線如圖5所示。
從圖5可以看出,將融合的交通流量與微波檢測的交通流量進(jìn)行比較,隨著訓(xùn)練次數(shù)的增加,差值逐漸縮小。經(jīng)過1 400輪迭代,最終輸出粒子的12個維度坐標(biāo)即為RBFNN中的參數(shù),其中,第1、2;5、6;9、10個參數(shù)為神經(jīng)網(wǎng)絡(luò)神經(jīng)元中心坐標(biāo),分別為(227.988 3,223.000 0)、(229.332 0,230.785 9)、(207.000 0,220.000 0),第3、7、11個參數(shù)為神經(jīng)元核函數(shù)的寬度;第4、8、12個參數(shù)為神經(jīng)元權(quán)重。這一RBF神經(jīng)網(wǎng)絡(luò)可作為本次實驗路段最終交通流量融合的神經(jīng)網(wǎng)絡(luò)。
圖5 PSO-RBFNN迭代曲線
3.2.2 交通流量融合
選取路段交通流量中的測試集,利用3.2.1節(jié)中訓(xùn)練得到的RBF神經(jīng)網(wǎng)絡(luò),將線圈獲取的交通流量qc與浮動車獲取的交通流量qf作為輸入進(jìn)行融合,再將融合后的結(jié)果與微波檢測器獲取的交通流量進(jìn)行對比,結(jié)果如圖6、圖7所示。
從圖6中可以看出,經(jīng)過PSO-RBFNN融合得到的數(shù)據(jù)圍繞兩組參與融合的基礎(chǔ)數(shù)據(jù)qc和qf波動,但在圖7中,將表征實際情況的數(shù)據(jù)qm添加到圖中后,可以明顯地看出融合后得到的數(shù)據(jù)曲線與qm的曲線更加貼合,即PSO-RNFNN融合結(jié)果與實際情況更相近。這是因為在神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中,目標(biāo)函數(shù)值的確定依賴于qm。
圖6 PSO-RBFNN交通流量融合結(jié)果
圖7 PSO-RBFNN交通流量融合結(jié)果與對照組對比
同樣,將3.1節(jié)中測試集數(shù)據(jù)中線圈檢測獲取的交通流量qc與浮動車檢測獲取的交通流量qf輸入到KF中,得到兩者融合的數(shù)據(jù),再將經(jīng)過融合的數(shù)據(jù)與微波檢測器獲取的交通流量進(jìn)行對比,結(jié)果如圖8、圖9所示。
圖8 KF交通流量融合結(jié)果
圖9 KF交通流量融合結(jié)果與對照組對比
從圖8中可以看出,經(jīng)過KF融合后得到的數(shù)據(jù)始終處于兩組參與融合的基礎(chǔ)數(shù)據(jù)qc和qf之間,在圖9中加入表征實際情況的數(shù)據(jù)qm后,融合后的數(shù)據(jù)曲線與真實數(shù)據(jù)曲線關(guān)聯(lián)性不明顯,因為經(jīng)過KF融合后獲得的數(shù)據(jù)僅與qc和qf有關(guān)。
不同分布特征的數(shù)據(jù)可以采用不同的融合方式,數(shù)據(jù)融合方式?jīng)]有優(yōu)劣之分,只有適用情況不同。本節(jié)采用PSO-RBFNN神經(jīng)網(wǎng)絡(luò)和KF兩種方法分別對不同檢測方式獲取的交通流量進(jìn)行融合。對兩種方式的融合結(jié)果分別采用平均絕對誤差(MAE)、平均絕對百分誤差(MAPE)和均方根誤差(RMSE)3個指標(biāo)評價兩種方式的數(shù)據(jù)融合效果,結(jié)果如圖10、表1所示。
圖10 KF與PSO-RBFNN融合效果曲線
表1 PSO-RBFNN與KF融合效果對比
通過圖10和表1可以看出,PSO-RBFNN的融合結(jié)果曲線與對照數(shù)據(jù)曲線更加貼合,各項誤差值也顯著降低。因此,利用PSO-RBFNN融合兩種來源的交通流量更加貼近對照組的結(jié)果,這是由于PSO-RBFNN融合的數(shù)據(jù)在訓(xùn)練過程中以對照組數(shù)據(jù)為參考,融合效果更好,即:PSO-RBFNN能憑借粒子不斷迭代更好地提取所擬合目標(biāo)的現(xiàn)實特性,在數(shù)據(jù)融合與預(yù)測中具有更高的精度。
網(wǎng)聯(lián)車與非網(wǎng)聯(lián)車混行產(chǎn)生的交通大數(shù)據(jù)具有規(guī)模性、多樣性、實效性、價值性等特點,通過粒子群算法尋優(yōu)和利用不同來源的道路交通流量對徑向基神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,可以看出,利用K均值聚類法對初始多源交通數(shù)據(jù)進(jìn)行分類可以有效確定神經(jīng)網(wǎng)絡(luò)中間層個數(shù),減少徑向基神經(jīng)網(wǎng)絡(luò)的空間復(fù)雜度;在多輪粒子迭代過程中隨著神經(jīng)網(wǎng)絡(luò)中參數(shù)的不斷調(diào)整,融合交通流量與實際交通流量的差值逐漸縮小并趨于穩(wěn)定,神經(jīng)網(wǎng)絡(luò)逐漸擬合該段道路交通流量的分布特征;同時此方法融合后的數(shù)據(jù)與卡爾曼濾波算法融合后的數(shù)據(jù)相比誤差相對更小,對非線性數(shù)據(jù)的融合過程更具有針對性,明顯提高了交通狀態(tài)的擬合度。