王新勝,卞震
?
基于貝葉斯模型的駕駛行為識(shí)別與預(yù)測(cè)
王新勝,卞震
(江蘇大學(xué)計(jì)算機(jī)科學(xué)與通信工程學(xué)院,江蘇 鎮(zhèn)江 212013)
針對(duì)智能駕駛系統(tǒng)處理大量駕駛數(shù)據(jù)時(shí)出現(xiàn)的效率和精度不足的問題,提出一種基于貝葉斯模型來處理駕駛數(shù)據(jù),識(shí)別和預(yù)測(cè)人類駕駛行為的方法。該方法可以無監(jiān)管地通過駕駛數(shù)據(jù)對(duì)應(yīng)地推斷出具體駕駛行為,共分為2步:第一步,通過貝葉斯模型分割算法將慣性傳感器收集到駕駛數(shù)據(jù)分割為近線性分段;第二步,通過LDA拓展模型將線性分段聚集為具體的駕駛行為(如制動(dòng)、轉(zhuǎn)彎、加速和慣性滑行)。離線實(shí)驗(yàn)和在線實(shí)驗(yàn)結(jié)果表明,在處理大量駕駛數(shù)據(jù)的情況下,該方法效率和識(shí)別精度更高。
駕駛數(shù)據(jù);貝葉斯模型;慣性傳感器;線性分段
隨著科技的快速發(fā)展,車載傳感器的數(shù)量與日俱增,帶來了汽車駕駛數(shù)據(jù)量的快速增長(zhǎng)[1]。從低層次的機(jī)械診斷信息如發(fā)動(dòng)機(jī)的狀態(tài)到更加高層次的防抱死制動(dòng)系統(tǒng)和電子穩(wěn)壓數(shù)據(jù),基于不同傳感器技術(shù)的駕駛員輔助系統(tǒng)(ADAS)在不斷快速發(fā)展[2]。先進(jìn)的ADAS可以提供車道偏離警告、交通信號(hào)識(shí)別、自適應(yīng)巡航控制、自動(dòng)停車和碰撞規(guī)避等功能[3]。雖然這些數(shù)據(jù)是分析駕駛員行為、交通狀況和開發(fā)未來安全系統(tǒng)的重要來源,但其生成速度快且數(shù)據(jù)量過大,專家們無法在有效時(shí)間或成本效益內(nèi)對(duì)這些數(shù)據(jù)進(jìn)行分析[4,5]。在大規(guī)模的車輛駕駛行為研究的情況下,這種問題更加突出[6,7]。
同樣,智能車輛面臨的問題是必須能夠及時(shí)地將大量駕駛數(shù)據(jù)處理成簡(jiǎn)明而有意義的結(jié)果。而目前的ADAS無法形成對(duì)環(huán)境的高度了解。相反,它們僅限于車輛及其周圍環(huán)境數(shù)據(jù)的處理和反饋。單靠這種做法,對(duì)于長(zhǎng)期、預(yù)期的駕駛來說是不夠的。為了使車輛對(duì)潛在風(fēng)險(xiǎn)做出全面的反饋,并避免與駕駛員的直覺相沖突,ADAS未來的發(fā)展必須全面考慮駕駛員的行為、意圖以及道路交通環(huán)境信息[8]。本文的目的就是通過分析低層次的自然數(shù)據(jù)形成對(duì)世界的高層次了解。因此,無論是處理大量歷史數(shù)據(jù)還是分析實(shí)時(shí)數(shù)據(jù),都需要一個(gè)無需人為監(jiān)管就能夠處理大量復(fù)雜數(shù)據(jù)的方法。目前,該方法面臨著許多需要解決的問題,主要包括處理數(shù)據(jù)所需的準(zhǔn)確性、車輛速度帶來的時(shí)間限制和數(shù)據(jù)處理過程帶來的時(shí)延以及道路環(huán)境等問題。其中,道路環(huán)境是必須要重點(diǎn)解決的問題,因?yàn)楫?dāng)環(huán)境與獲取的實(shí)驗(yàn)數(shù)據(jù)的測(cè)試環(huán)境不相同時(shí),往往容易得出錯(cuò)誤的結(jié)果。此外,該方法必須能夠適應(yīng)各種少見的道路狀況,滿足長(zhǎng)期使用的需求[9]。
通過研究發(fā)現(xiàn),使用貝葉斯模型[10]來進(jìn)行駕駛行為的識(shí)別和預(yù)測(cè)可以很好地解決上述問題。貝葉斯模型具有以下優(yōu)點(diǎn):1) 使用貝葉斯模型能對(duì)信息的價(jià)值或是否需要采集新的信息做出科學(xué)的判斷,能對(duì)實(shí)驗(yàn)結(jié)果的可能性加以數(shù)量化的評(píng)價(jià),而不是像一般的決策方法那樣,對(duì)結(jié)果完全肯定或完全否定,提高了結(jié)果的準(zhǔn)確性[11];2) 貝葉斯模型將先驗(yàn)概率或主觀概率這2種信息巧妙地結(jié)合起來;3) 便于對(duì)3層貝葉斯概率模型(也稱為L(zhǎng)DA, latent Dirichlet allocation)進(jìn)行拓展[12];4) 貝葉斯模型可以在處理數(shù)據(jù)的過程中根據(jù)具體情況做出相應(yīng)的變化,逐步完善數(shù)據(jù)模型,使得出的結(jié)果更加科學(xué),能夠滿足長(zhǎng)期使用的需求[13];5) 使用貝葉斯模型無需人為監(jiān)管且只需要少量的數(shù)據(jù)預(yù)處理,計(jì)算效率高,能滿足駕駛信息處理問題中實(shí)時(shí)性的需要。
為此,本文提出一個(gè)基于貝葉斯模型的方法來解決智能駕駛系統(tǒng)處理大量駕駛數(shù)據(jù)時(shí)出現(xiàn)的效率和精度不足的問題。
表1 駕駛行為識(shí)別與預(yù)測(cè)方法比較
研究表明,人類在駕駛時(shí),傾向于使用多個(gè)簡(jiǎn)單的操作而不是執(zhí)行單一復(fù)雜的操作[14]?;谶@一原則發(fā)現(xiàn),當(dāng)駕駛員在駕駛車輛的過程中,對(duì)應(yīng)車輛在短時(shí)間內(nèi)是線性或近線性狀態(tài)運(yùn)動(dòng)的。根據(jù)這一發(fā)現(xiàn),大量研究工作得以展開并且構(gòu)建了相應(yīng)的數(shù)學(xué)模型,已達(dá)到將自然駕駛數(shù)據(jù)序列同時(shí)劃分為多個(gè)非重疊的線性分段,并將這些分段聚集成對(duì)應(yīng)的高級(jí)駕駛行為的目的。
文獻(xiàn)[15,16]中都提出了基于分段自回歸模型分析駕駛數(shù)據(jù)以推斷駕駛行為的方法。但是這2個(gè)文獻(xiàn)都只是使用模擬數(shù)據(jù)對(duì)它們的模型進(jìn)行相應(yīng)的測(cè)試,無法保證在線實(shí)驗(yàn)環(huán)境中對(duì)應(yīng)算法的實(shí)時(shí)性。文獻(xiàn)[17]使用貝葉斯非參數(shù)模型來分析駕駛數(shù)據(jù)。在文獻(xiàn)[18]中,也使用了文獻(xiàn)[17]中提出的模型,并且將該模型與LDA模型相結(jié)合,以此來將抽象的線性分段與具體的駕駛行為相聯(lián)系。盡管得出的結(jié)果比較理想,但是該模型在計(jì)算上有著相當(dāng)大的固有復(fù)雜性。此外,測(cè)試的結(jié)果還受到測(cè)試環(huán)境的影響,不同的測(cè)試環(huán)境導(dǎo)致其測(cè)試的結(jié)果也不相同。
文獻(xiàn)[19]提出了使用慣性測(cè)量單元(IMU)來收集數(shù)據(jù),結(jié)合照相機(jī)的圖像來推斷駕駛行為的方法。該方法由2個(gè)部分組成:首先,使用了文獻(xiàn)[20]中提出的變點(diǎn)檢測(cè)方法,將IMU收集的數(shù)據(jù)分割成不重疊的線性分段;然后,將線性分段和相機(jī)圖像片段相關(guān)聯(lián),以此得出具體的駕駛行為。而文獻(xiàn)[21]提出了一種通過區(qū)分不同的駕駛風(fēng)格,以識(shí)別對(duì)應(yīng)駕駛?cè)藛T信息的方法。同樣,該方法還是需要分割慣性數(shù)據(jù)。但與文獻(xiàn)[19]中提出的方法不同的是,分割過程是通過使用閾值和車輛信號(hào),如剎車燈來完成的。類似地,文獻(xiàn)[22]中也是使用閾值和移動(dòng)的平均值來分割車載傳感器收集的慣性數(shù)據(jù)。表1給出了上述方法的比較結(jié)果。
針對(duì)上述方法中存在的問題,本文在文獻(xiàn)[17]和文獻(xiàn)[18]的基礎(chǔ)上,提出一種不需要監(jiān)管的、高效的方法來識(shí)別與預(yù)測(cè)駕駛行為,即基于貝葉斯模型的方法。與文獻(xiàn)[21,22]提出的方法不同的是,本文所提方法不依賴于閾值或外部信號(hào);與文獻(xiàn)[19]中提出方法相比較,本文所提方法有著完全貝葉斯、不需要監(jiān)管的優(yōu)點(diǎn);與文獻(xiàn)[15,16]中提出的方法不同的是,本文所提方法不受測(cè)試數(shù)據(jù)的影響,并且可以推廣到新的環(huán)境中。此外,本文方法考慮了坡度對(duì)駕駛數(shù)據(jù)的影響,對(duì)駕駛員行為的識(shí)別更加準(zhǔn)確。
在統(tǒng)計(jì)學(xué)領(lǐng)域,有許多關(guān)于變點(diǎn)檢測(cè)與序列分割模型的研究[23]。本文所提基于貝葉斯模型的駕駛行為識(shí)別與預(yù)測(cè)方法,其基本思想是引入統(tǒng)計(jì)學(xué)中的變點(diǎn)檢測(cè)方法并結(jié)合貝葉斯多元線性回歸模型來實(shí)現(xiàn)車輛運(yùn)動(dòng)數(shù)據(jù)序列的分割,進(jìn)而使用LDA拓展模型,對(duì)分割序列與具體的駕駛行為之間進(jìn)行映射。
首先,通過樣本數(shù)據(jù)得到似然函數(shù),給出先驗(yàn)分布;然后,結(jié)合先驗(yàn)分布得到數(shù)據(jù)模型的后驗(yàn)分布并且計(jì)算出數(shù)據(jù)的邊緣似然估計(jì);最后,對(duì)于給定的新測(cè)試數(shù)據(jù),利用之前得到的后驗(yàn)分布作為權(quán)重,在整個(gè)參數(shù)空間里計(jì)算加權(quán)積分,得到預(yù)測(cè)分布,實(shí)現(xiàn)貝葉斯多元線性回歸模型的構(gòu)建。
3.1.1 似然函數(shù)
3.1.2 參數(shù)的共軛先驗(yàn)分布
在給定條件下,關(guān)于和的共軛先驗(yàn)分布服從矩陣正態(tài)—逆分布,其密度函數(shù)描述如式(3)所示。
3.1.3 參數(shù)的后驗(yàn)分布
根據(jù)貝葉斯定理,共軛先驗(yàn)分布密度正比于似然函數(shù),即
由于共軛,所以參數(shù)和的后驗(yàn)分布具有對(duì)應(yīng)的先驗(yàn)分布(3)相同的數(shù)學(xué)形式。所以后驗(yàn)分布為
3.1.4 數(shù)據(jù)的邊緣似然估計(jì)
通過對(duì)似然函數(shù)中模型參數(shù)邊緣化,得出數(shù)據(jù)的邊緣似然估計(jì),其密度函數(shù)為
上述的積分可以計(jì)算求值,其結(jié)果可以用2個(gè)常數(shù)的比值來表示,其中,分子和分母分別與超參數(shù)先驗(yàn)和后驗(yàn)分布相關(guān)聯(lián),數(shù)學(xué)計(jì)算式為
3.1.5 預(yù)測(cè)分布
本節(jié)將應(yīng)用多元線性模型的理論來解決數(shù)據(jù)序列分割的問題。
為此進(jìn)行以下假設(shè):1) 在每個(gè)分段內(nèi),模型系數(shù)和噪聲均遵循高斯分布;2) 在每個(gè)分布中,條件均值都為線性函數(shù),并且協(xié)方差恒定。通過以上假設(shè),數(shù)據(jù)序列的分割問題容易處理且易于擴(kuò)展。
序列分割問題具體的方法過程如下。首先,使用構(gòu)建的多元線性模型并結(jié)合所給出的變點(diǎn)檢測(cè)算法計(jì)算出變點(diǎn)參數(shù)的先驗(yàn)分布以及風(fēng)險(xiǎn)函數(shù);然后,定義出在線分割算法的邊界條件;最后,根據(jù)初始數(shù)據(jù)、風(fēng)險(xiǎn)函數(shù)和邊界條件,推算出分段長(zhǎng)度的概率密度函數(shù)。3.2.5節(jié)將給出具體的分割算法。
3.2.1 變點(diǎn)檢測(cè)
其中,后驗(yàn)分布為
其聯(lián)合分布就可以遞歸地表示為
2) 在給定了前一個(gè)變點(diǎn)的基礎(chǔ)上,可以得出最新數(shù)據(jù)的預(yù)測(cè)分布。
3.2.2 風(fēng)險(xiǎn)函數(shù)
圖1展示的是消息傳遞算法的過程。其中,圓圈代表運(yùn)行過程中所有可能的狀態(tài);圓圈之間的連線顯示的是時(shí)間步長(zhǎng)之間的遞歸傳遞質(zhì)量;實(shí)線表示概率數(shù)值正在上升,運(yùn)行長(zhǎng)度在下一個(gè)時(shí)間段增長(zhǎng);虛線表示當(dāng)前的運(yùn)行狀態(tài)被停止并且數(shù)值下降到0的可能性。
圖1 消息傳遞算法的過程
3.2.3 邊界條件
通過運(yùn)行長(zhǎng)度的分布函數(shù)和觀測(cè)的數(shù)據(jù)遞歸地寫出聯(lián)合分布。遞歸算法不僅要定義遞歸關(guān)系,還要定義初始化條件,包含以下2種情況。
1) 在第一個(gè)基準(zhǔn)之前發(fā)生變化,例如,在觀察數(shù)據(jù)時(shí),可將初始運(yùn)行長(zhǎng)度的所有概率密度函數(shù)重置為0。
2) 更新測(cè)試數(shù)據(jù)發(fā)生變化,如在運(yùn)行長(zhǎng)度上升時(shí),根據(jù)歸一化常數(shù)將運(yùn)行長(zhǎng)度重置為0,其數(shù)學(xué)計(jì)算式為
3.2.4 多元線性模型序列分割
根據(jù)式(7)和式(9)可知
3.2.5 貝葉斯模型分割算法
算法1給出了用于分割數(shù)據(jù)序列的算法。在該算法中,首先,初始化數(shù)據(jù);然后,根據(jù)3.2.2節(jié)求出的風(fēng)險(xiǎn)函數(shù)計(jì)算線性分段運(yùn)行長(zhǎng)度的分布函數(shù);接下來更新充分統(tǒng)計(jì)量,計(jì)算出運(yùn)行長(zhǎng)度邊緣預(yù)測(cè)分布;重復(fù)上述過程實(shí)現(xiàn)序列分割。
算法1 貝葉斯模型分割算法
1) 初始化
3) 根據(jù)式(7)推演后驗(yàn)預(yù)測(cè)密度函數(shù)
4) 根據(jù)式(9)計(jì)算增長(zhǎng)概率密度函數(shù)
5) 計(jì)算變點(diǎn)密度函數(shù)
6) 確定運(yùn)行長(zhǎng)度分布
7) 更新充分統(tǒng)計(jì)量
8) 進(jìn)行預(yù)測(cè)
9) 重復(fù)步驟2)
3.2.6 線性分段粒度分析
LDA模型也被稱為3層貝葉斯概率模型,可以提供方法聚集數(shù)據(jù)。這些模型常用于文檔內(nèi)容的信息檢索,例如,根據(jù)每個(gè)文檔的詞匯為該文檔指定對(duì)應(yīng)的主題。在本文情況下,文檔就是線性分段,而主題是具體的駕駛行為。
與文檔中的單詞不同的是本文的數(shù)據(jù)是連續(xù)的。為了解決這個(gè)問題,本文對(duì)傳統(tǒng)LDA模型進(jìn)行了拓展。LDA拓展模型確定主題的過程也是一個(gè)分類的過程,具體過程如下,給定駕駛數(shù)據(jù)序列,使用算法1對(duì)數(shù)據(jù)序列變點(diǎn)進(jìn)行檢測(cè),分割駕駛序列;然后將每個(gè)分段當(dāng)作文檔,對(duì)其使用LDA拓展模型;根據(jù)那些經(jīng)常出現(xiàn)的詞匯歸納出主題,然后可以與語義標(biāo)簽相互關(guān)聯(lián)。
和LDA模型類似,本文給出的LDA拓展模型同樣根據(jù)線性分段的比例對(duì)具體駕駛行為進(jìn)行預(yù)測(cè),同時(shí)使用Matlab對(duì)該模型進(jìn)行了驗(yàn)證,結(jié)果表明該方法準(zhǔn)確性高。
本節(jié)將分別討論離線實(shí)驗(yàn)和在線實(shí)驗(yàn)這2種情況下分割和聚集駕駛數(shù)據(jù)序列的實(shí)驗(yàn)結(jié)果。首先,收集駕駛數(shù)據(jù),利用第3節(jié)介紹的方法將實(shí)驗(yàn)數(shù)據(jù)分成近似線性的分段;然后,利用LDA拓展模型聚集線性分段,將其與具體的駕駛行為相映射。
4.1.1 數(shù)據(jù)的預(yù)處理
本文使用慣性傳感器來收集駕駛數(shù)據(jù)。在汽車上利用3軸陀螺儀和線性加速度傳感器來測(cè)量汽車的慣性數(shù)據(jù)。傳感器被水平地放置在車輛中間位置,軸朝上,軸面向前進(jìn)方向。在10 min的車程內(nèi),平均每秒鐘收集5次數(shù)據(jù),共收集了超過3 000個(gè)數(shù)據(jù),如表2所示。
表2 駕駛數(shù)據(jù)參數(shù)
其中,數(shù)據(jù)預(yù)處理涉及提取傳感器軸的分割問題。關(guān)于軸的旋轉(zhuǎn)被用來作為衡量車輛偏航度,軸的旋轉(zhuǎn)被用來作為衡量測(cè)量車輛行駛的坡度,軸的線性加速度被選擇為車輛的行駛方向。除了這些針對(duì)車輛框架的預(yù)處理,該方法唯一的預(yù)處理就是消除部分由于傳感器不靈敏而收集到的錯(cuò)誤的駕駛數(shù)據(jù)信息。式(21)和式(22)為傳感器收集到的數(shù)據(jù)。
4.1.2 離線駕駛數(shù)據(jù)分割
整個(gè)離線行為分析通過使用算法1中提出的貝葉斯模型分割算法進(jìn)行序列分割,使用3.3節(jié)中提出的LDA拓展模型對(duì)線性分段進(jìn)行聚集。
1) 分段結(jié)果
分割算法一共花費(fèi)11.8 s的時(shí)間處理13 m的駕駛數(shù)據(jù),平均每個(gè)數(shù)據(jù)花費(fèi)的時(shí)間為86.1 μs,實(shí)時(shí)性好。共生成170個(gè)線性分段,平均每個(gè)線性分段持續(xù)時(shí)間為3.4 s,該數(shù)值在3 ~7 s之間變化。
圖2所示為120 s內(nèi)駕駛數(shù)據(jù)的貝葉斯模型分割算法實(shí)驗(yàn)結(jié)果,按順序分別為加速度、軸偏轉(zhuǎn)度、軸偏轉(zhuǎn)度以及線性分段長(zhǎng)度隨時(shí)間的變化。通過變點(diǎn)檢測(cè)算法,計(jì)算出加速度,軸和軸的偏轉(zhuǎn)度數(shù)據(jù)中的變點(diǎn),圖2(d)中的粗線表示線性分段持續(xù)的時(shí)間長(zhǎng)度,其線性遞增,遇到變點(diǎn)歸零。通過該實(shí)驗(yàn),成功地檢測(cè)出駕駛序列中的變點(diǎn),將駕駛數(shù)據(jù)序列分割成近線性的分段。
圖3(a)為3值航位推測(cè)算法的軌跡。該圖通過加速度和軸與軸偏轉(zhuǎn)度進(jìn)行航位推測(cè)計(jì)算,可以描述車輛的運(yùn)行軌跡以及道路地形,其中,軌跡上標(biāo)注的圓圈表示算法計(jì)算出的分段邊界??梢园l(fā)現(xiàn),分段的邊界主要集中在拐角和上坡下坡處,直觀地說明轉(zhuǎn)彎和爬坡的操作比直線操作更加復(fù)雜。
圖3(b)為2值平面軌跡,與本文的圖3(a)方法相比,缺少軸偏轉(zhuǎn)度(坡度)的數(shù)據(jù)。在駕駛過程中,地形對(duì)駕駛行為的影響是顯著的。例如,下坡過程中,就算駕駛員執(zhí)行滑行的操作,車輛在數(shù)據(jù)上仍然呈現(xiàn)加速的狀態(tài)。所以只有消除地形的影響,才能提高聚集數(shù)據(jù)的精確度。
圖2 120 s內(nèi)駕駛數(shù)據(jù)的貝葉斯模型分割算法實(shí)驗(yàn)結(jié)果
圖3 利用加速度和陀螺儀測(cè)量的數(shù)據(jù)進(jìn)行的航位推測(cè)的軌跡
2) 聚集結(jié)果
在完成駕駛序列的線性分割后,使用3.3節(jié)提出的LDA拓展模型進(jìn)行數(shù)據(jù)聚集。
分段通常由一些不同的主題組成,就像文檔通常包含幾個(gè)不同的主題。本文提出的LDA拓展模型得到分段數(shù)據(jù)后返回的是每個(gè)分段的主題比例,因此可以得出每個(gè)文檔中有多少主題。其中,5個(gè)主題模型的比例如圖4所示。
圖4 按主題繪線的航位軌跡推算
圖4為按主題繪線的航位推測(cè)軌跡。每一條線對(duì)應(yīng)著一個(gè)分段,其線段圖形是5個(gè)基本圖形的凸組合,每個(gè)主題對(duì)應(yīng)一種圖形。凸組合中的系數(shù)就是主題的比例,而主題是由擴(kuò)展LDA模型進(jìn)行選擇和分配的。然后可以以直觀駕駛行為(如滑行、制動(dòng)和轉(zhuǎn)向的方式)來標(biāo)注分段。
圖5是對(duì)LDA模型聚集法與簡(jiǎn)單的閾值方法所得出結(jié)果進(jìn)行比較。用于表示閾值數(shù)據(jù)的規(guī)則如下
為了降低閾值輸出中的噪聲,慣性數(shù)據(jù)使用的是20個(gè)樣本數(shù)據(jù)的平均值。
圖5展示的是由測(cè)試車輛經(jīng)過2個(gè)十字路口執(zhí)行轉(zhuǎn)彎操作時(shí)收集到的慣性數(shù)據(jù)。車輛以穩(wěn)定的速度朝向路口行駛,制動(dòng)減速完成右轉(zhuǎn)彎,然后回到正常速度。再次執(zhí)行同樣的操作,完成左轉(zhuǎn)彎。其中閾值法很容易受到噪聲數(shù)據(jù)的影響。只有對(duì)數(shù)據(jù)進(jìn)行除噪和調(diào)整閾值的級(jí)別才能獲得理想的結(jié)果。但即使有微調(diào),結(jié)果仍然容易受到閾值附近的噪聲影響。這將導(dǎo)致駕駛數(shù)據(jù)出現(xiàn)從一個(gè)駕駛狀態(tài)到另一個(gè)駕駛狀態(tài)不正常的快速波動(dòng)。由圖5(b)可以發(fā)現(xiàn),當(dāng)= 283 s和= 405 s左右時(shí)駕駛行為出現(xiàn)快速變動(dòng)。
圖5 LDA模型聚集法與簡(jiǎn)單的閾值方法結(jié)果比較
由于閾值法嚴(yán)格的規(guī)范,導(dǎo)致其提供的簡(jiǎn)單規(guī)則無法正確地模擬局部數(shù)據(jù)變化對(duì)應(yīng)的主題,例如,在= 283 s到轉(zhuǎn)向加速的過程中,可以發(fā)現(xiàn)使用閾值法處理確定駕駛數(shù)據(jù)分段更加單一。而在這個(gè)過程中,本文提供的方法對(duì)局部數(shù)據(jù)處理時(shí)生成了更加詳細(xì)的分段。即使數(shù)據(jù)的復(fù)雜性增加,添加新的規(guī)則變得越加困難,該方法還可以進(jìn)行擴(kuò)展。只需要添加新數(shù)據(jù)或增加檢測(cè)行為的數(shù)量,不需要對(duì)該模型本身進(jìn)行其他的修改。
圖6和圖7分別為在線實(shí)驗(yàn)軌跡與校園實(shí)驗(yàn)軌跡。本文的在線實(shí)驗(yàn)是通過慣性傳感器進(jìn)行駕駛數(shù)據(jù)的收集,然后利用手機(jī)4G網(wǎng)絡(luò)即時(shí)傳輸?shù)皆破脚_(tái)進(jìn)行計(jì)算。云平臺(tái)通過運(yùn)行算法1提出的分割算法和3.3節(jié)提出的分類方法,將其軌跡圖分段以路徑的形式顯示出來。圖6顯示的4個(gè)圖分別對(duì)應(yīng)4個(gè)時(shí)間段內(nèi)通過分割和聚集算法推算出的軌跡,圖中圖形與駕駛行為主題相對(duì)應(yīng),圖中的條形圖表示的是在當(dāng)前駕駛數(shù)據(jù)情況下的所有主題的后驗(yàn)概率,根據(jù)后驗(yàn)概率確定當(dāng)前主題。圖7顯示的是根據(jù)不同的主題對(duì)車輛軌跡進(jìn)行圖形編碼的軌跡??梢园l(fā)現(xiàn),圖6與圖7的部分軌跡一致。實(shí)驗(yàn)表明,在對(duì)應(yīng)時(shí)間內(nèi),后驗(yàn)概率最高的駕駛行為主題與觀察到的駕駛員正在執(zhí)行的駕駛行為一致。
圖6 在線實(shí)驗(yàn)軌跡
圖7 校園實(shí)驗(yàn)軌跡
此外,根據(jù)在線實(shí)驗(yàn)的結(jié)果,可以預(yù)測(cè)三角形線段區(qū)域多的路口交通狀況不好,因?yàn)槿切尉€段區(qū)域多表明車輛多次減速,可見其路況不是很好。下一步的工作是進(jìn)一步分析圖形背后包含的現(xiàn)實(shí)含義。
本文提出了識(shí)別和預(yù)測(cè)駕駛行為的方法,實(shí)現(xiàn)了如何將分段聚集到與具體駕駛行為相對(duì)應(yīng)的主題中,從而獲得有意義的數(shù)據(jù)。同時(shí),還展示了在線進(jìn)行分段和聚集。該方法是完全無監(jiān)管的,而且只需很少的預(yù)處理。本文貢獻(xiàn)主要有以下3點(diǎn)。
1) 對(duì)貝葉斯先驗(yàn)參數(shù)進(jìn)行改進(jìn),考慮參數(shù)為非零和非對(duì)角矩陣的情況,與傳統(tǒng)的假設(shè)參數(shù)為0和對(duì)角矩陣相比,算法適用性更高、更可靠。
2) 對(duì)LDA模型進(jìn)行拓展,使用該模型對(duì)數(shù)據(jù)進(jìn)行聚集,擺脫了傳統(tǒng)的閾值帶來的決定是肯定或否定,結(jié)果以概率的形式顯示。同時(shí)考慮了道路坡度對(duì)駕駛數(shù)據(jù)的影響,避免因?yàn)槁窙r而影響結(jié)果的準(zhǔn)確性。準(zhǔn)確性和適用性較一般算法更好。
3) 通過大量仿真實(shí)驗(yàn)驗(yàn)證了所提出的基于貝葉斯模型的算法優(yōu)于傳統(tǒng)算法,從實(shí)驗(yàn)結(jié)果上可以看出,本文方法結(jié)果準(zhǔn)確性更高,特別是在道路狀況復(fù)雜的區(qū)域。
未來的研究將進(jìn)一步考慮道路環(huán)境等問題,由于實(shí)驗(yàn)條件和算法只允許考慮慣性傳感器收集到的數(shù)據(jù),在道路環(huán)境部分只考慮坡度這一因素,未來將在模型中加入其他道路環(huán)境因素,進(jìn)一步提升算法的適用范圍。此外,本文只是識(shí)別和預(yù)測(cè)出駕駛員具體的駕駛行為,但是這些行為背后包含的規(guī)律還有待進(jìn)一步的研究。
[1] FRANKE U, PFEIFFER D, RABE C, et al. Making bertha see[C]// IEEE International Conference on Computer Vision Workshops. 2014: 214-221.
[2] WINNER H, HAKULI S, LOTZ F, et al. Handbook of driver assistance systems: basic information, components and systems for active safety and comfort[M]. Springer Publishing Company, Incorporated, 2015.
[3] CHEN Y, JIANG X H, LIAO L C, et al. Driving behavior motivation model research based on vehicle trajectory data[C]//International Conference on Smart Vehicular Technology, Transportation, Communication and Applications. 2017: 36-44.
[4] DOSHI A, MORRIS B, TRIVEDI M. On-road prediction of driver’s intent with multimodal sensory cues[J]. IEEE Pervasive Computing, 2011, 10(3):22-34.
[5] SATZODA R K, MARTIN S, LY M V, et al. Towards automated drive analysis: a multimodal synergistic approach[C]//International IEEE Conference on Intelligent Transportation Systems. 2013: 1912-1916.
[6] STUBING H, BECHLER M, HEUSSNER D, et al. SIM TD : a car-to-X system architecture for field operational tests[J]. IEEE Communications Magazine, 2010, 48(5):148-154.
[7] ALEXANDER P, HALEY D, GRANT A. Cooperative intelligent transport systems: 5.9-GHz field trials[J]. Proceedings of the IEEE, 2011, 99(7):1213-1235.
[8] LI Z, BAO S, KOLMANOVSKY I V, et al. Visual-manual distraction detection using driving performance indicators with naturalistic driving data[J]. IEEE Transactions on Intelligent Transportation Systems, 2017, PP(99):1-8.
[9] MAYE J, TRIEBEL R, SPINELLO L, et al. Bayesian on-line learning of driving behaviors[C]//IEEE International Conference on Robotics and Automation. 2011:4341-4346.
[10] YAN X, SU X G. Bayesian linear regression[J]. Security Ticket Control, 2009, 15(1):1052-1056.
[11] KIRCHNER M R, RYAN K, WRIGHT N. Maneuvering vehicle tracking with Bayesian changepoint detection[C]// IEEE Aerospace Conference. 2017:1-9.
[12] KRESTEL R, FANKHAUSER P, NEJDL W. Latent dirichlet allocation for tag recommendation[C]//ACM Conference on Recommender Systems. 2009: 61-68.
[13] HARLé F, CHATELAIN F, GOUY-PAILLER C, et al. Bayesian model for multiple change-points detection in multivariate time series[J]. IEEE Transactions on Signal Processing, 2016, 64(16):4351-4362.
[14] KIM J H, HAYAKAWA S, SUZUKI T, et al. Modeling of driver's collision avoidance maneuver based on controller switching model[J]. IEEE Transactions on Systems Man & Cybernetics Part B Cybernetics, 2005, 35(6):1131-1143.
[15] SEKIZAWA S, INAGAKI S, SUZUKI T, et al. Modeling and recognition of driving behavior based on stochastic switched ARX model[C]//IEEE Conference on Decision and Control, 2005 and 2005 European Control Conference. 2006: 5095-5100.
[16] TERADA R, OKUDA H, SUZUKI T, et al. Multi-scale driving behavior modeling using hierarchical PWARX model[C]//International IEEE Conference on Intelligent Transportation Systems. 2010: 1638-1644.
[17] TANIGUCHI T, NAGASAKA S, HITOMI K, et al. Semiotic prediction of driving behavior using unsupervised double articulation analyzer[C]//Intelligent Vehicles Symposium. 1931:849-854.
[18] BANDO T, TAKENAKA K, NAGASAKA S, et al. Unsupervised drive topic finding from driving behavioral data[C]//Intelligent Vehicles Symposium. 2013:177-182.
[19] JOHNSON D A, TRIVEDI M M. Driving style recognition using a smartphone as a sensor platform[C]//International IEEE Conference on Intelligent Transportation Systems. 2011:1609-1615.
[20] PAUL F, ZHEN L. On-line inference for multiple changepoint problems[J]. Journal of the Royal Statistical Society, 2007, 69(4):589-605.
[21] LY M V, MARTIN S, TRIVEDI M M. Driver classification and driving style recognition using inertial sensors[C]//Intelligent Vehicles Symposium. 2013:1040-1045.
[22] MAYE J, TRIEBEL R, SPINELLO L, et al. Bayesian on-line learning of driving behaviors[C]//IEEE International Conference on Robotics and Automation. 2011:4341-4346.
[23] STEPHENS D A. Bayesian retrospective multiple-changepoint identification[J]. Journal of the Royal Statistical Society, 1994, 43(1): 159-178.
Driving behavior recognition and predictionbased on Bayesian model
WANG Xinsheng, BIAN Zhen
School of Computer Science and Communication Engineering, Jiangsu University, Zhenjiang 212013, China
Since the existing intelligent driving systems are lack of efficiency and accuracy when processing huge number of driving data, a brand new approach of processing driving data was developed to identify and predicate human driving behavior based on Bayesian model. The approach was proposed to take two steps to deduce the specific driving behavior from driving data correspondingly without any supervision, the first step being using Bayesian model segmentation algorithm to divide driving data that inertial sensor collected into near-linear segments with the help of Bayesian model segmentation algorithm, and the second step being using extended LDA model to aggregate those linear segments into specific driving behavior (such as braking, turning, acceleration and coasting). Both offline and online experiments are conducted to verify this approach and it turns out that approach has higher efficiency and recognition accuracy when dealing with numerous driving data.
driving data, Bayesian model, inertial sensor, linear segmentation
TP393
A
10.11959/j.issn.1000-436x.2018043
2017-10-25;
2018-02-10
國家自然科學(xué)基金資助項(xiàng)目(No.U1764263)
The National Natural Science Foundation of China (No.U1764263)
王新勝(1972-),男,江蘇宿遷人,博士,江蘇大學(xué)副教授,主要研究方向?yàn)闊o線傳感器網(wǎng)絡(luò)等。
卞震(1992-),男,江蘇淮安人,江蘇大學(xué)碩士生,主要研究方向?yàn)檐嚶?lián)網(wǎng)安全結(jié)構(gòu)。