王暢 蔣思琦 韓依洋
摘 要:針對第七屆“泰迪杯”數(shù)據(jù)分析職業(yè)技能大賽C題——運輸車輛安全駕駛行為分析,以歐氏距離和物理方法為基礎(chǔ),建立基于軌跡與速度特征異常檢測模型,基于差分與最小二乘法軌跡擬合模型,綜合運用MATLAB軟件編程求解,得到良好的數(shù)據(jù)擬合路線圖等結(jié)論。
關(guān)鍵詞:歐氏距離;差分;最小二乘法;MATLAB
0 引言
隨著信息技術(shù)的發(fā)展,以及車載運行監(jiān)控系統(tǒng)的不斷改進,為了充分利用交通運輸企業(yè)的車聯(lián)網(wǎng)數(shù)據(jù),挖掘車輛駕駛行為的潛在特征,對監(jiān)控系統(tǒng)所統(tǒng)計的數(shù)據(jù)進行合理的整理,可以為數(shù)據(jù)的進一步挖掘提供良好的保障。
1 模型假設(shè)
(1)假設(shè)車輛行駛是在二維的平面上,即不考慮地球的形狀及地面的高度差。
(2)假設(shè)每輛車僅有一名駕駛?cè)藛T。
2 基于軌跡和速度特征異常檢測模型
2.1 模型建立思想
由于原有數(shù)據(jù)的數(shù)據(jù)量大且存在異常軌跡的情況,即需要通過有效的方法解決異常軌跡并且得到擬合數(shù)據(jù)。針對異常軌跡的檢測,R-Tree異常軌跡檢測算法是目前常用的異常軌跡檢測方法。R-Tree異常軌跡檢測算法是通過找出每個軌跡點的w-鄰域點集,與該軌跡點構(gòu)成點對集合,每個軌跡點僅和其w-鄰域點集中的點進行比較,然后通過指定的鄰域閾值w找出異常軌跡,但是此方法對于長且復(fù)雜的軌跡,表現(xiàn)出異常軌跡分段平均化的現(xiàn)象。即在此基礎(chǔ)上我們提出了根據(jù)相鄰兩點數(shù)字特征綜合考慮數(shù)據(jù)的異常情況。
2.2 模型建立
對于軌跡特征,通過歐幾里的距離進行兩點之間的距離計算,設(shè)定兩個坐標(biāo)點在二維空間上的距離則兩點之間的軌跡彎曲程度本文使用兩點之間的移動距離與兩點之間的形成的直線距離的比值衡量。
對于速度特征,數(shù)據(jù)的位置變化代表著車輛運動時位置隨時間的變化情況。對于等時變化的數(shù)據(jù),可以得到速度vi與位移li的關(guān)系:則相應(yīng)的加速度:
綜合考慮軌跡特征和速度特征,設(shè)定相應(yīng)的閾值,對數(shù)據(jù)進行異常點的處理。
2.3 基于差分與最小二乘法軌跡擬合模型
由于車輛的行駛軌跡沒有規(guī)律性,即在不同區(qū)域內(nèi),形成的軌跡可以完全不同,所以不能通過高次擬合的方法來完整的擬合車輛的行駛軌跡;離散的數(shù)據(jù)對應(yīng)不同的坐標(biāo)和不同的方位角,因此擬合過程中的擬合曲線是否連續(xù)或者擬合結(jié)果是否能夠組成一條連續(xù)的軌跡并不是必需的。故根據(jù)差分和最小二乘法的思想來分段的擬和軌跡,并且獲取合適的方位角。
2.4 結(jié)果分析
通過MATLAB軟件編程可以得到,以其中兩條路線為例(如圖 1、圖 2所示)。
根據(jù)數(shù)據(jù)處理和軌跡擬合結(jié)果顯示,綜合考慮軌跡彎曲程度和速度對于去除異常軌跡點有明顯的效果,但不能完整的處理異常數(shù)據(jù)點;通過設(shè)置權(quán)函數(shù),運用差分和最小二乘法的思想,提高了軌跡擬合的準(zhǔn)確性,但是設(shè)置權(quán)函數(shù)的作用比較局限。
參考文獻
[1]孫川,吳超仲,褚端峰,等.基于車聯(lián)網(wǎng)數(shù)據(jù)挖掘的營運車輛駕駛速度行為聚類研究[J].交通運輸系統(tǒng)工程與信息,2015,15(06):82-87.
[2]陳錦陽,劉良旭,宋加濤,等.基于R-tree的高效異常軌跡檢測算法[J].計算機應(yīng)用與軟件,2011,28(10):34-37.
[3]李紅巖.車輛軌跡異常檢測應(yīng)用研究[D].長春:長春工業(yè)大學(xué),2019.
[4]姚連璧,錢瑾斐.基于移動最小二乘法的軌跡擬合切線方位角計算[J].同濟大學(xué)學(xué)報(自然科學(xué)版),2018,46(11):1589-1593.