李博 張洪剛
(北京郵電大學(xué) 信息與通信工程學(xué)院,北京 100876)
近年來我國公路運(yùn)輸行業(yè)發(fā)展迅速,巨大的交通流量使得對(duì)路面狀況的要求不斷提高,方便快速地進(jìn)行路面異常檢測受到越來越多的關(guān)注。及時(shí)發(fā)現(xiàn)路面異常有助于保證路面質(zhì)量、降低交通事故的發(fā)生率、避免或緩解交通擁堵、節(jié)約油耗、降低污染、提高輔助駕駛和自動(dòng)駕駛體驗(yàn),對(duì)保障生命安全、提高出行效率、節(jié)能減排有著深遠(yuǎn)意義[1- 2]。
通過攝像頭采集路況數(shù)據(jù),模型易受攝像頭參數(shù)、拍攝角度、光照、實(shí)際路況等影響[3- 5];相比之下,通過控制器局域網(wǎng)絡(luò)(CAN,Controller Area Network)/ 車載診斷系統(tǒng)(OBD,On-Board Diagnostic)[6- 8]、手機(jī)傳感器等設(shè)備采集數(shù)據(jù)更加方便[9],并且基于傳感信號(hào)數(shù)據(jù)構(gòu)建的模型更穩(wěn)定,利于普及和推廣。通過對(duì)傳感數(shù)據(jù)的處理和分析實(shí)現(xiàn)異常檢測有兩種常見方案。一種方案是基于原始信號(hào)計(jì)算的統(tǒng)計(jì)度量來進(jìn)行異常檢測,文獻(xiàn)[10]通過對(duì)加速傳感器信號(hào)統(tǒng)計(jì)度量的計(jì)算和適當(dāng)閾值的選取,實(shí)現(xiàn)異常路面的檢測;Oneyama等[11]通過傳感信號(hào)的FFT(Fast Fourier Transform)特征,對(duì)路面狀況實(shí)現(xiàn)了分級(jí);文獻(xiàn)[12]認(rèn)為路面的顛簸程度與加速傳感數(shù)據(jù)和速度傳感數(shù)據(jù)存在一定的線性關(guān)系;文獻(xiàn)[13]提出一種基于多傳感器信號(hào)進(jìn)行路面不平程度測量的方法。另一種方案是將異常檢測問題轉(zhuǎn)化為分類問題,在近幾年取得了更好的效果,Chen等[14]利用正常路面和異常路面?zhèn)鞲行盘?hào)分布上的差異,構(gòu)建GMM(Gaussian Mixture Model)模型實(shí)現(xiàn)路面異常檢測;文獻(xiàn)[15-16]利用手機(jī)中的GPS和加速傳感器等傳感設(shè)備定頻收集信號(hào)數(shù)據(jù),作為SVM等分類器的特征輸入,實(shí)現(xiàn)了正常路面和異常路面的區(qū)分;Silva等[17]對(duì)比了Gradient Boosting、MLP Classifier、Gaussian NB、Linear SVC等方法的檢測效果;Carlos等[18]對(duì)比了SVM與幾種經(jīng)典統(tǒng)計(jì)度量方法的檢測效果。上述研究中,對(duì)模型的時(shí)序性和不同傳感器信號(hào)之間的時(shí)序相關(guān)性討論較少。另外,異常路面對(duì)傳感信號(hào)產(chǎn)生的影響,呈現(xiàn)在不同的尺度,也加大了傳感信號(hào)分析的難度。
本研究給出了一種針對(duì)傳感器信號(hào)時(shí)間序列數(shù)據(jù)進(jìn)行路面異常檢測的算法,通過相關(guān)性分析和Granger因果檢驗(yàn)構(gòu)建初始的動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)[19];然后利用小波分解將時(shí)序數(shù)據(jù)在不同位置和尺度展開,解決傳感器信號(hào)的尺度分析問題,通過卷積神經(jīng)網(wǎng)絡(luò)(CNN,Convolution Neural Network)對(duì)高階網(wǎng)絡(luò)節(jié)點(diǎn)進(jìn)行網(wǎng)絡(luò)嵌入(NE,Network Embedding)學(xué)習(xí)[20- 23];基于網(wǎng)絡(luò)嵌入進(jìn)行鏈路預(yù)測,結(jié)合代價(jià)敏感的MDL(Minimal Description Length,最小描述長度),解決高階時(shí)序相關(guān)性的分析問題,修正了網(wǎng)絡(luò)結(jié)構(gòu),完成分類器構(gòu)建;最后通過實(shí)驗(yàn)對(duì)檢測效果進(jìn)行了驗(yàn)證。
通過對(duì)網(wǎng)絡(luò)結(jié)構(gòu)和網(wǎng)絡(luò)概率參數(shù)的學(xué)習(xí)構(gòu)建動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)分類器,然后用分類器來對(duì)路面情況進(jìn)行分類。
貝葉斯網(wǎng)絡(luò)可以較好地描述信號(hào)間的依賴關(guān)系,動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)在傳統(tǒng)貝葉斯網(wǎng)絡(luò)的基礎(chǔ)上引入隨時(shí)間變化的馬爾科夫模型的思想,解決了時(shí)序信號(hào)間相關(guān)性的描述問題。文中,以獲取的速度傳感器值(Speed)、加速度傳感器值(Acc)、陀螺儀傳感器值(Gyro)等傳感器信號(hào)數(shù)據(jù)構(gòu)建的網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行示意說明,如圖1所示。圖1(a)是初始時(shí)刻網(wǎng)絡(luò),圖1(b)是轉(zhuǎn)移網(wǎng)絡(luò),通過圖1(a)與1(b)的結(jié)合,可以得到如圖1(c)所示的動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)。設(shè)ci為待預(yù)測類別變量,xt,n代表第t個(gè)時(shí)刻第n個(gè)傳感器采集到的傳感信號(hào)數(shù)據(jù),則有:
p(ct|xt,1,…,xt,n,xt-1,1,…,xt-1,n,ct-1)=
(1)
其中,p(xt,1,…,xt,n,ct,xt-1,1,…,xt-1,n,ct-1)可以通過類ct-1的先驗(yàn)概率p(ct-1)、t-1時(shí)刻的條件概率p(xt-1,1,…,xt-1,n|ct-1)以及不同時(shí)刻轉(zhuǎn)移概率p(ct|ct-1)p(xt,1,…,xt,n|ct,xt-1,1,…,xt-1,n,ct-1)計(jì)算得出。
按式(1)計(jì)算各路面狀況分類的概率,選取最大概率對(duì)應(yīng)的路面類別為預(yù)測類別,并可以將一階動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)推廣至高階[19],進(jìn)而在多個(gè)時(shí)間點(diǎn)上進(jìn)行時(shí)序分析。貝葉斯網(wǎng)絡(luò)可以描述節(jié)點(diǎn)間的相互關(guān)系,具有較強(qiáng)解釋性。動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)可以通過轉(zhuǎn)移網(wǎng)絡(luò)描述多個(gè)時(shí)刻節(jié)點(diǎn)間的關(guān)系,從而挖掘傳感信號(hào)在多個(gè)時(shí)刻間的關(guān)聯(lián)關(guān)系。
(a)初始時(shí)刻網(wǎng)絡(luò)
(b)轉(zhuǎn)移網(wǎng)絡(luò)
(c)動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)
從傳感器數(shù)據(jù)中直接學(xué)習(xí)到一個(gè)精準(zhǔn)的路面異常檢測模型具有較大難度,首先要計(jì)算出一個(gè)初始網(wǎng)絡(luò)模型,然后通過對(duì)網(wǎng)絡(luò)迭代修正,生成較為精準(zhǔn)的路面異常檢測模型。本研究提出的路面異常檢測模型的學(xué)習(xí)框架如圖2所示,學(xué)習(xí)過程被劃分為動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)初始化和網(wǎng)絡(luò)修正兩部分。模型的整體學(xué)習(xí)過程為:以多變量時(shí)序傳感器數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)輸入,進(jìn)行網(wǎng)絡(luò)初始化,然后迭代進(jìn)行網(wǎng)絡(luò)修正,直至最大迭代次數(shù)或收斂條件后輸出模型。
網(wǎng)絡(luò)初始化部分又分為結(jié)構(gòu)初始化和參數(shù)學(xué)習(xí),其中結(jié)構(gòu)初始化包括初始時(shí)刻網(wǎng)絡(luò)初始化和轉(zhuǎn)移網(wǎng)絡(luò)初始化。文中提出使用相關(guān)性分析和Gran-ger因果檢驗(yàn)方法,分別分析初始時(shí)刻和一階時(shí)序線性相關(guān)傳感信號(hào)的依賴關(guān)系,依據(jù)依賴關(guān)系構(gòu)建初始化結(jié)構(gòu),然后根據(jù)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行參數(shù)學(xué)習(xí)生成初始化網(wǎng)絡(luò)。
網(wǎng)絡(luò)修正部分包括網(wǎng)絡(luò)嵌入學(xué)習(xí)、結(jié)構(gòu)修正和參數(shù)學(xué)習(xí)。文中提出使用網(wǎng)絡(luò)嵌入學(xué)習(xí)來分析傳感信號(hào)間復(fù)雜的高階時(shí)序相關(guān)性,在初始化網(wǎng)絡(luò)的基礎(chǔ)上生成網(wǎng)絡(luò)嵌入。獲取網(wǎng)絡(luò)嵌入后,基于網(wǎng)絡(luò)嵌入進(jìn)行鏈路預(yù)測(Link Predication),結(jié)合MDL實(shí)現(xiàn)網(wǎng)絡(luò)結(jié)構(gòu)修正。對(duì)修正后的結(jié)構(gòu)重新進(jìn)行參數(shù)學(xué)習(xí),如果未達(dá)到迭代次數(shù)或收斂條件,則進(jìn)行下一輪網(wǎng)絡(luò)修正。
圖2 路面異常檢測模型訓(xùn)練過程
初始時(shí)刻網(wǎng)絡(luò)結(jié)構(gòu)的學(xué)習(xí),目的是發(fā)現(xiàn)各傳感器信號(hào)與預(yù)測類別之間在同一時(shí)刻的相關(guān)性,為后續(xù)優(yōu)化提供結(jié)構(gòu)基礎(chǔ)。首先計(jì)算各傳感器信號(hào)與類別變量的Pearson相關(guān)系數(shù),以得到較為明顯的關(guān)聯(lián)關(guān)系。
(2)
式(2)為傳感器信號(hào)時(shí)間序列X與類別標(biāo)注Y的相關(guān)性系數(shù)。假設(shè)X={x1,x2,…,xm},Y={y1,y2,…,ym},m為傳感器信號(hào)樣本數(shù)量,可得式(3):
(3)
式(3)的絕對(duì)值在一定程度上反映了兩個(gè)序列的相關(guān)性。實(shí)踐中認(rèn)為,當(dāng)該值在[0.6,0.8]范圍內(nèi)時(shí)兩序列強(qiáng)相關(guān),當(dāng)該值在[0.8,1.0]范圍內(nèi)時(shí)兩序列極強(qiáng)相關(guān)。這里以0.6為閾值,生成傳感器信號(hào)X節(jié)點(diǎn)到類別Y節(jié)點(diǎn)的邊界。確定貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)后,使用極大似然估計(jì)法(Maximum Likelihood Estimation,MLE)求解概率參數(shù)。該方法簡便有效,但只能判別傳感器信號(hào)與類別節(jié)點(diǎn)間所具有的線性關(guān)系,因此需要在網(wǎng)絡(luò)修正階段進(jìn)一步優(yōu)化網(wǎng)絡(luò)。
轉(zhuǎn)移網(wǎng)絡(luò)的學(xué)習(xí),目的是發(fā)現(xiàn)各傳感器信號(hào)間在相鄰時(shí)刻的相關(guān)性。Granger因果檢驗(yàn)是一種可以在時(shí)序上計(jì)算變量相關(guān)性的技術(shù)[24]。車傳感信號(hào)是多變量的時(shí)序信號(hào),且在時(shí)序上有相關(guān)性(比如速度和加速度信號(hào)),因此符合Granger因果檢驗(yàn)的適用范圍。這里通過Granger因果檢驗(yàn)實(shí)現(xiàn)轉(zhuǎn)移網(wǎng)絡(luò)結(jié)構(gòu)的初始化,用以分析兩個(gè)臨階網(wǎng)絡(luò)之間在時(shí)序上的轉(zhuǎn)移關(guān)系。如果由傳感器信號(hào)值yk和傳感器信號(hào)值xk滯后值所決定的yk的條件分布,與僅由yk滯后值所決定的條件分布相同,即
f(yk|yk-1,yk-2,…,xk-1,xk-2,…)=
f(yk|yk-1,yk-2,…)
(4)
則認(rèn)為傳感器信號(hào)X對(duì)傳感器信號(hào)Y不存在Granger因果性關(guān)系。實(shí)際計(jì)算中,將其等價(jià)于其它條件不變時(shí),若加上傳感信號(hào)X的滯后變量后對(duì)Y的預(yù)測精度不存在顯著性改變,則認(rèn)為X對(duì)Y不存在Granger因果性關(guān)系。該問題可以轉(zhuǎn)化為兩個(gè)線性回歸的檢驗(yàn)問題。
(5)
(6)
其中,αi和βj是式(5)和式(6)兩個(gè)線性回歸模型的回歸系數(shù)。通過F統(tǒng)計(jì)完成其檢驗(yàn)。構(gòu)建傳感信號(hào)X對(duì)Y不存在Granger因果性關(guān)系的假設(shè):
H0:β1=β2=…=βk=0
(7)
如果X的滯后變量回歸參數(shù)估計(jì)值全部不存在顯著性,則上述假設(shè)不能被拒絕。該檢驗(yàn)計(jì)算出前后兩個(gè)時(shí)刻的傳感信號(hào)關(guān)系,再結(jié)合相關(guān)系數(shù)計(jì)算出的相同時(shí)刻傳感信號(hào)和類別間的關(guān)系,得出轉(zhuǎn)移網(wǎng)絡(luò)結(jié)構(gòu),然后使用MLE對(duì)網(wǎng)絡(luò)參數(shù)初始化。時(shí)序信號(hào)間的高階非線性關(guān)系需要在網(wǎng)絡(luò)修正過程中分析。
傳感器信號(hào)由于復(fù)雜的路面作用,常呈現(xiàn)非線性相關(guān)和高階時(shí)序相關(guān),這種復(fù)雜的相關(guān)性不容易在網(wǎng)絡(luò)初始化過程中獲取。網(wǎng)絡(luò)修正學(xué)習(xí),目的是基于初始網(wǎng)絡(luò),對(duì)這種高階非線性關(guān)系進(jìn)行學(xué)習(xí),對(duì)網(wǎng)絡(luò)進(jìn)行優(yōu)化。文中提出使用網(wǎng)絡(luò)嵌入進(jìn)行高階貝葉斯網(wǎng)絡(luò)修正。網(wǎng)絡(luò)嵌入可以在初始網(wǎng)絡(luò)中學(xué)習(xí)到更為深層次的節(jié)點(diǎn)之間的關(guān)聯(lián)關(guān)系,并且可以通過不斷迭代學(xué)習(xí)達(dá)到較優(yōu)的修正結(jié)果。
對(duì)高階貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行優(yōu)化,將H階貝葉斯網(wǎng)絡(luò)作為待更新網(wǎng)絡(luò),使用上下文敏感的網(wǎng)絡(luò)嵌入學(xué)習(xí)方法[23]。假設(shè)G=(V,E,S)是待更新網(wǎng)絡(luò),其中V是信號(hào)節(jié)點(diǎn)集合,E?V×V代表節(jié)點(diǎn)之間的邊集合,S代表傳感器信號(hào)節(jié)點(diǎn)的時(shí)間序列。其中,ωu,v是eu,v∈E的權(quán)重。將節(jié)點(diǎn)v∈V對(duì)應(yīng)的傳感器信號(hào)時(shí)間序列表示為sv,nv=|sv|為傳感器信號(hào)數(shù)量。根據(jù)網(wǎng)絡(luò)結(jié)構(gòu)和節(jié)點(diǎn)對(duì)應(yīng)的傳感器信號(hào)時(shí)間序列對(duì)每個(gè)節(jié)點(diǎn)計(jì)算上下文敏感的向量,即對(duì)于一條邊eu,v生成兩個(gè)向量v(u)∈Rd和u(v)∈Rd(R是實(shí)數(shù)集)。
針對(duì)網(wǎng)絡(luò)結(jié)構(gòu)和傳感器信號(hào)時(shí)間序列數(shù)據(jù),構(gòu)建兩種向量:對(duì)于節(jié)點(diǎn)v,分別構(gòu)建基于結(jié)構(gòu)的向量vs和基于傳感信號(hào)時(shí)序數(shù)據(jù)的向量vt。其中,vs用于捕捉待修正網(wǎng)絡(luò)的結(jié)構(gòu)信息,vt用于結(jié)合對(duì)應(yīng)傳感器信號(hào)的時(shí)間序列優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)。該向量是上下文敏感的,即參與計(jì)算的邊所對(duì)應(yīng)的兩個(gè)節(jié)點(diǎn)不同,則計(jì)算的向量結(jié)果也不同。設(shè)v=vs⊕vt,其中⊕表示將兩個(gè)向量進(jìn)行拼接。最大化各邊的總目標(biāo)函數(shù):
(8)
其中,L(e)是每條邊的目標(biāo)函數(shù),可以表示為
L(e)=Ls(e)+Lt(e)
(9)
這里,Ls(e)表示基于待修正網(wǎng)絡(luò)結(jié)構(gòu)的目標(biāo)函數(shù),Lt(e)表示基于傳感器信號(hào)時(shí)間序列的目標(biāo)函數(shù)。
貝葉斯網(wǎng)絡(luò)中的邊是有向的,以有向邊的對(duì)數(shù)似然來定義Ls(e):
Ls(e)=ωu,vlgp(vs|us)
(10)
將式(10)的條件概率定義為
(11)
通過定義Lt(e)來進(jìn)一步分析高階時(shí)序傳感信號(hào)間的非線性關(guān)系。
Lt(e)=α×Ltt(e)+β×Lts(e)+γ×Lst(e)
(12)
其中:α、β和γ為權(quán)重,
Ltt(e)=ωu,vlgp(vt|ut)
(13)
Lts(e)=ωu,vlgp(vt|us)
(14)
Lst(e)=ωu,vlgp(vs|ut)
(15)
式(13)-(15)中的條件概率形式上與基于結(jié)構(gòu)的條件概率定義相似,將兩種節(jié)點(diǎn)向量映射到同一表達(dá)空間。式(13)-(15)可通過式(11)計(jì)算得出。
緩速帶、坑洼和顛簸等路面對(duì)陀螺儀等傳感器信號(hào)產(chǎn)生了不同尺度的頻域影響,單純從時(shí)頻分析信號(hào),不易發(fā)掘頻域中蘊(yùn)含的特征,這里引入小波技術(shù)對(duì)傳感器信號(hào)進(jìn)行分析。小波變換可以同時(shí)分析傳感器信號(hào)時(shí)域和頻域的不同尺度特征[25]。首先對(duì)傳感器信號(hào)作小波變換,給定尺度函數(shù)φ(x)和小波函數(shù)ψ(x),信號(hào)時(shí)間序列函數(shù)f(x)可以展開為不同尺度不同位置的尺度函數(shù)和小波函數(shù)的線性組合:
(16)
其中:
(17)
(18)
稱c0(k)為近似系數(shù),dj(k)為細(xì)節(jié)系數(shù)。
φj,k(x)=2j/2φ(2jx-k)
(19)
ψj,k(x)=2j/2ψ(2jx-k)
(20)
其中,k為位置系數(shù),j為尺度階數(shù),j越大,尺度越小。對(duì)原信號(hào)函數(shù)進(jìn)行高階分解:
(21)
對(duì)于給定eu,v,兩個(gè)傳感器信號(hào)節(jié)點(diǎn)所對(duì)應(yīng)的時(shí)間序列為su和sv,通過小波分解將時(shí)序序列劃分為矩陣p∈Rd×m和Q∈Rd×m(R是實(shí)數(shù)集)作為CNN的輸入,其中m取值為小波分解級(jí)數(shù)加2,矩陣由小波分解的0階近似和0至m-2階細(xì)節(jié)參數(shù)構(gòu)成。通過CNN來實(shí)現(xiàn)上下文敏感的時(shí)間序列嵌入向量計(jì)算。
路面異常造成的傳感信號(hào)變化具有局部連續(xù)性和多信號(hào)變量間的關(guān)聯(lián)性,CNN可以通過局部連接和權(quán)值共享來描述這些特點(diǎn),這里通過CNN來實(shí)現(xiàn)傳感信號(hào)上下文敏感的網(wǎng)絡(luò)嵌入學(xué)習(xí)[23]。上下文敏感的網(wǎng)絡(luò)嵌入學(xué)習(xí)過程如圖3所示。令A(yù)∈Rd×d(R是實(shí)數(shù)集)為兩個(gè)時(shí)間序列小波變換后的卷積矩陣,則相關(guān)性矩陣F∈Rm×n可以表示為:
F=tanh(PTAQ)
(22)
其中,F(xiàn)中的每一個(gè)元素Fi,j代表兩個(gè)隱向量Pi和Qj的相關(guān)性得分?;谏鲜鲇?jì)算,對(duì)F的行和列分別構(gòu)建池化層,將其定義為
(23)
(24)
通過Softmax函數(shù)將向量gp和gq轉(zhuǎn)化為上下文相關(guān)度向量ap和aq。ap中的第i個(gè)元素定義如下:
(25)
上下文嵌入向量定義為
(26)
(27)
圖3 小波上下文敏感網(wǎng)絡(luò)嵌入
為了對(duì)比評(píng)價(jià)修正前后的網(wǎng)絡(luò)結(jié)構(gòu),需要確定結(jié)構(gòu)評(píng)分標(biāo)準(zhǔn),這里提出在傳統(tǒng)評(píng)分標(biāo)準(zhǔn)MDL[19,26]中加入代價(jià)敏感系數(shù),以解決數(shù)據(jù)集中異常類別道路占比較小的問題。假設(shè)使用某模型對(duì)信號(hào)數(shù)據(jù)集合Z進(jìn)行壓縮存儲(chǔ),設(shè)隨機(jī)變量U={x1,x2,…,xn}的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)為Bs=(U,E),其中U為貝葉斯網(wǎng)絡(luò)的節(jié)點(diǎn)集合,E是有向邊的集合。Bp={p(xi|parent(xi)):xi∈U}為條件概率表(Conditional Probability Tables,CPTs)的集合,parent(xi)是網(wǎng)絡(luò)結(jié)構(gòu)中xi的父節(jié)點(diǎn)集合,則p(xi|parent(xi))為傳感器信號(hào)節(jié)點(diǎn)xi在其父節(jié)點(diǎn)某一取值組合狀態(tài)下的條件概率分布。網(wǎng)絡(luò)結(jié)構(gòu)Bs的DL測度為
DL(Bs:Z)=DLBN(Bs∶Z)+DLdata(Z|Bs)=
DLstru(Bs)+DLtab(Bs)+DLdata(Z|Bs)
(28)
其中,DLBN(Bs:Z)=DLstru(Bs)+DLtab(Bs)為壓縮模型的編碼長度。對(duì)式(23)加入分類代價(jià)敏感系數(shù)C,對(duì)正類和負(fù)類錯(cuò)分樣本進(jìn)行加權(quán)懲罰。
(29)
H(x|parent(xi))=
-∑p(x,parent(xi))lgp(x,parent(xi))
(30)
式(30)為條件熵,可通過對(duì)Z中實(shí)例個(gè)數(shù)統(tǒng)計(jì)求出。
(31)
式(31)為壓縮模型中網(wǎng)絡(luò)結(jié)構(gòu)的編碼長度,|pai|表示|parent(xi)|中節(jié)點(diǎn)取值的組合數(shù)目, 即節(jié)點(diǎn)xi的父節(jié)點(diǎn)取值的組合數(shù)目。
(32)
式(32)為壓縮模型中條件概率表的編碼長度,|xi|表示節(jié)點(diǎn)xi的取值數(shù)。
算法1:動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化算法
Input:待優(yōu)化貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)Bs
計(jì)算Bs的代價(jià)敏感MDL得分Score
Fori=1to MaxTurn do
網(wǎng)絡(luò)嵌入學(xué)習(xí)計(jì)算邊的l集合
從集合中選取l最大值對(duì)應(yīng)的邊
Ifev,u在網(wǎng)絡(luò)Bs中不存在 then
添加從v到u的邊,生成新B′s;
放棄修改
Else
計(jì)算
If Scorenew≤Score,then
放棄修改
Else
Score=ScorenewEndif
Endif
Endif
從集合中選取l最小值對(duì)應(yīng)的邊ev′,u′
Ifev′,u′已經(jīng)在網(wǎng)絡(luò)存在 then
If Scorenew≤Score,then
放棄修改
Endif
Endif
Endfor
網(wǎng)絡(luò)結(jié)構(gòu)評(píng)估算法結(jié)合網(wǎng)絡(luò)嵌入鏈接預(yù)測和MDL構(gòu)建了搜索算法。以代價(jià)敏感的MDL準(zhǔn)則評(píng)估模型結(jié)構(gòu),DL測度越小,代表貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)越可能合理。
基于算法1,完成一次對(duì)待優(yōu)化貝葉斯網(wǎng)絡(luò)的修正,算法輸入是H階貝葉斯網(wǎng)絡(luò)。優(yōu)化初始時(shí)刻的網(wǎng)絡(luò)結(jié)構(gòu):將初始時(shí)刻的網(wǎng)絡(luò)結(jié)構(gòu)與當(dāng)前轉(zhuǎn)移網(wǎng)絡(luò)組成H階貝葉斯網(wǎng)絡(luò),僅優(yōu)化初始時(shí)刻網(wǎng)絡(luò)部分的邊,然后從優(yōu)化后的網(wǎng)絡(luò)中拆分初始時(shí)刻貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)。優(yōu)化轉(zhuǎn)移網(wǎng)絡(luò):直接以H階貝葉斯網(wǎng)絡(luò)轉(zhuǎn)移網(wǎng)絡(luò)作為輸入進(jìn)行優(yōu)化。對(duì)優(yōu)化后的網(wǎng)絡(luò)結(jié)構(gòu),重新使用MLE學(xué)習(xí)網(wǎng)絡(luò)概率參數(shù)。
使用MMSys2017中提出的Multimedia Sensor Dataset作為實(shí)驗(yàn)數(shù)據(jù)集。該數(shù)據(jù)集通過手機(jī)傳感器收集了多種信號(hào)數(shù)據(jù),包括GPS、加速度、方向、磁場和陀螺儀等傳感器信號(hào)數(shù)據(jù),以及用于輔助標(biāo)注的視頻數(shù)據(jù),并在數(shù)據(jù)對(duì)齊、速度數(shù)據(jù)生成、數(shù)據(jù)準(zhǔn)確度校正方面進(jìn)一步處理。
該數(shù)據(jù)集提供了3種異常路面數(shù)據(jù):Pothole Passing、Speed Bump Passing、Uneven Road Passing。通過視頻輔助,對(duì)行駛過程中的異常路面時(shí)間進(jìn)行標(biāo)注,將數(shù)據(jù)集分為3種異常路面采集的信號(hào)數(shù)據(jù)和正常路面采集的信號(hào)數(shù)據(jù),作為監(jiān)督學(xué)習(xí)的訓(xùn)練數(shù)據(jù)和評(píng)估過程的測試數(shù)據(jù)。實(shí)驗(yàn)中將數(shù)據(jù)以10s為時(shí)間窗口切分成樣本。針對(duì)不同路面數(shù)據(jù)集進(jìn)行多組實(shí)驗(yàn),結(jié)果如表1所示。這里使用幾種不同的評(píng)估指標(biāo)[15- 18],正確率是指正確分類的樣本占總樣本的比例,除正確率外,其它各項(xiàng)評(píng)估參數(shù)定義如下:
(33)
(34)
(35)
(36)
(37)
誤檢率高,會(huì)使正常路面更容易被誤判為異常路面。漏檢率高,會(huì)使異常路面更容易被誤判為正常路面。F1是綜合評(píng)定指標(biāo),代表該方法性能的綜合表現(xiàn),F(xiàn)1值高,表示異常道路檢測結(jié)果較為準(zhǔn)確,并且對(duì)異常道路的召回也比較理想。
實(shí)驗(yàn)對(duì)比中,選取了一些有代表性的利用傳感信號(hào)進(jìn)行路面異常檢測的方法:基于統(tǒng)計(jì)度量的方法Z-DIFF[10,18]和STDEV[18],基于傳統(tǒng)機(jī)器學(xué)習(xí)的方法SVM[15- 16]和GBDT[17]。另外,還選取了一些時(shí)序分類方向的前沿模型(如:基于1-NN的1-NN(ED)和1-NN(DTW)方法[27],基于神經(jīng)元網(wǎng)絡(luò)的MLP[28]和MC-DCNN方法[27],基于信號(hào)形狀的Shapelets-DT方法[29]以及分析信號(hào)間時(shí)序關(guān)系的貝葉斯網(wǎng)絡(luò)方法BN[26]和DBN[19]),用于對(duì)比文中方法。
從不同數(shù)據(jù)集角度來觀察實(shí)驗(yàn)結(jié)果,整體上看各種方法對(duì)Uneven Road Passing的檢測效果差于Pothole Passing和Speed Bump Passing,Uneven Road路段標(biāo)注難度較大,異常路段與正常路段頻繁交錯(cuò)出現(xiàn),難以精準(zhǔn)區(qū)分。各種方法對(duì)Speed Bump的檢測效果相對(duì)較好,一般車輛經(jīng)過該路面時(shí)會(huì)提前準(zhǔn)備,例如適當(dāng)減速,并且經(jīng)過過程中車輛震動(dòng)相對(duì)劇烈,多項(xiàng)傳感器信號(hào)變化較為明顯。
對(duì)各體系內(nèi)方法進(jìn)行內(nèi)部對(duì)比,基于統(tǒng)計(jì)度量的方法,Z-DIFF較STDEV有更高的正確率和更低的誤檢率,但漏檢率并不穩(wěn)定;基于傳統(tǒng)機(jī)器學(xué)習(xí)的方法,GBDT與SVM相比在正確率、漏檢率、誤檢率和F1值幾項(xiàng)指標(biāo)方面,在不同數(shù)據(jù)集中結(jié)果較為接近,不存在明顯優(yōu)勢;基于1-NN的方法,1-NN(DTW)較1-NN(ED)具有更低的漏檢率和誤檢率;基于神經(jīng)元網(wǎng)絡(luò)的方法,MC-DCNN較之MLP,各項(xiàng)評(píng)估指標(biāo)表現(xiàn)更好;基于貝葉斯網(wǎng)絡(luò)的方法中,文中方法較傳統(tǒng)的BN和DBN在各項(xiàng)評(píng)估指標(biāo)方面表現(xiàn)更好。
對(duì)不同方法體系進(jìn)行對(duì)比,基于統(tǒng)計(jì)度量的方法和傳統(tǒng)機(jī)器學(xué)習(xí)方法表現(xiàn)較差,尤其體現(xiàn)在F1值方面,較其它方法體系有明顯差距。而時(shí)序分類方法整體效果上表現(xiàn)更優(yōu),證明文中考慮利用信號(hào)時(shí)序特點(diǎn)構(gòu)建分類模型的可行性,以及較傳統(tǒng)方法的優(yōu)越性。在時(shí)序分類方法中,基于信號(hào)形狀的方法表現(xiàn)較差,基于1-NN的方法和基于神經(jīng)網(wǎng)絡(luò)的不同方法表現(xiàn)有所差異,基于貝葉斯網(wǎng)絡(luò)方法表現(xiàn)偏好,信號(hào)間時(shí)序相關(guān)性可以被貝葉斯方法更好地學(xué)習(xí)和表現(xiàn)。
表1 不同數(shù)據(jù)集識(shí)別結(jié)果
對(duì)各方法在各數(shù)據(jù)集上進(jìn)行對(duì)比,在Pothole的檢測上,文中方法對(duì)比其它方法,在正確率上至少提高2個(gè)百分點(diǎn),最多可以提高17個(gè)百分點(diǎn);在漏檢率上至少降低近1個(gè)百分點(diǎn),最多可以降低24個(gè)百分點(diǎn);在誤檢率上至少降低1.6個(gè)百分點(diǎn),最多可以降低20個(gè)百分點(diǎn)。在Speed Bump的檢測上,文中方法對(duì)比其它方法在正確率上最少可以提高1.5個(gè)百分點(diǎn),最多可以提高14個(gè)百分點(diǎn);在漏檢率上至少降低2個(gè)百分點(diǎn),最多可以降低近20個(gè)百分點(diǎn);在誤檢率上至少降低1.5個(gè)百分點(diǎn),最多可以降低11個(gè)百分點(diǎn)。在Uneven Road的檢測上,文中方法對(duì)比其它方法在正確率上最少可以提高1.5個(gè)百分點(diǎn),最多可以提高13個(gè)百分點(diǎn);在漏檢率上至少降低1.6個(gè)百分點(diǎn),最多可以降低15個(gè)百分點(diǎn);在誤檢率上至少降低1.4個(gè)百分點(diǎn),最多可以降低14個(gè)百分點(diǎn)。在F1值上,文中方法在3種數(shù)據(jù)集上可以達(dá)到80%以上,其中對(duì)Speed Bump的識(shí)別達(dá)到90%以上。同時(shí),文中方法在不同的數(shù)據(jù)集實(shí)驗(yàn)中,各項(xiàng)評(píng)估指標(biāo)能穩(wěn)定在一個(gè)較好的狀態(tài),在實(shí)際應(yīng)用環(huán)境中具有更好的魯棒性。
路面檢測在更好地輔助駕駛、提高駕駛員和行人安全等方面有重要意義。本研究提出一種基于高階動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)嵌入的路面異常檢測算法,該算法將路面檢測問題轉(zhuǎn)化為時(shí)序信號(hào)數(shù)據(jù)分類問題,通過構(gòu)建動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)分類器解決檢測問題。首先,提出利用相關(guān)性分析和Granger因果檢測分別分析同一時(shí)刻和不同時(shí)刻的傳感器信號(hào)與道路類型間的相關(guān)性,以構(gòu)建初始網(wǎng)絡(luò)結(jié)構(gòu);然后,提出將信號(hào)數(shù)據(jù)進(jìn)行小波變換以分析不同尺度下的路面信號(hào)特征,并通過CNN對(duì)多尺度的傳感信號(hào)數(shù)據(jù)的局部連續(xù)性進(jìn)行分析,進(jìn)而實(shí)現(xiàn)嵌入學(xué)習(xí)以分析高階時(shí)序信號(hào)之間的相關(guān)性;最后,結(jié)合網(wǎng)絡(luò)嵌入和代價(jià)敏感的MDL完成網(wǎng)絡(luò)修正,提出一種高階網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化算法。組建不同路面狀況的數(shù)據(jù)集,對(duì)基于統(tǒng)計(jì)度量的方法、基于傳統(tǒng)機(jī)器學(xué)習(xí)分類模型的方法、基于1-NN、基于形狀、基于神經(jīng)元網(wǎng)絡(luò)和貝葉斯網(wǎng)絡(luò)的時(shí)序數(shù)據(jù)分類方法進(jìn)行對(duì)比,結(jié)果表明文中方法具有更低的誤檢率和漏檢率、更高的正確率和F1值,并且在不同數(shù)據(jù)集上的表現(xiàn)效果更加魯棒。