孟玉
上海第二工業(yè)大學(xué) 上海 201209
中國改革開放后,社會經(jīng)濟得到了快速發(fā)展,很多地區(qū)朝著城市化與汽車化的方向發(fā)展,城市的交通資源越來越緊張。路上車輛越來越多,導(dǎo)致越來越多的城市發(fā)生擁堵事件,交警對車輛的指揮越來越困難,尤其是對一些特殊車輛不能做到及時有效的調(diào)度。關(guān)于救護車被堵在車流中無法動彈。導(dǎo)致人員得不到及時治療的新聞報道屢見不鮮。由于道路交通的復(fù)雜,以及交通信號燈的影響,交警部門也很難做出準確的處理。基于此,本文通過研究對比當(dāng)下適合救護車輛識別方法的優(yōu)缺點,找出救護車輛識別的最優(yōu)解。
車輛識別的任務(wù)是確定該車輛屬于哪一種類別。根據(jù)提取特征的不同。我們把它分為顏色、車型、車牌、車標的識別等等。本文將救護車輛識別發(fā)展分為三個階段:物理識別階段、淺層學(xué)習(xí)階段、深度學(xué)習(xí)階段[1]。
基于物理參數(shù)的車輛識別技術(shù)是最早的識別車輛的技術(shù),一般都需要硬件的支持。它主要是識別出車輛的車型,救護車的車型與一般汽車和卡車不同。根據(jù)車型判斷識別出車輛是否為救護車。目前主要有基于地感線圈檢測方法,基于紅外激光技術(shù)檢測方法,基于聲表面波的車輛檢測技術(shù)。地感線圈的檢測方法,需要提前在地下填埋線圈,當(dāng)車輛從線圈上通過時,因為各種車型的材質(zhì)分布的不同,從線圈上得到的反饋信息也不同,從而可以判斷出該車輛是否為救護車輛。不過他的缺點很明顯,首先必須準備好線圈,其次,線圈埋在路下很容易受到一些重型車輛的碾壓導(dǎo)致?lián)p壞?;诩t外激光技術(shù)的檢測方法,我們再道路兩邊安裝紅外脈沖發(fā)射器,車輛通過該路段時會反射回來紅外脈沖,車型的不同導(dǎo)致脈沖信息的不同,這樣我們就能區(qū)分該車輛的型號?;诼暠砻娌ǖ能囕v檢測技術(shù),通過發(fā)射聲波,由反射回來的空氣震動的大小來判定車型。這些物理方法都很成熟,但是缺點都很明顯,而且價格較貴,損耗較大,目前并沒有大范圍的使用[2]。
隨著車輛識別技術(shù)的發(fā)展,我們通過淺層學(xué)習(xí)的方法來實現(xiàn)救護車輛識別。淺層學(xué)習(xí)的方法是通過提取車輛的紋理特征來識別的。那么我們就得考慮提取什么樣的特征,以及采用什么樣的淺層識別模型來作為分類器。根據(jù)特征表達的方式不同,我們把淺層學(xué)習(xí)分為三類,分別為基于全局特征的車輛識別技術(shù),基于局部特征的車輛識別技術(shù),基于三維特征的識別方法[3]。
我們提取車輛特征對車輛的整體進行描述,得到車輛的特征的表示向量。在與淺層學(xué)習(xí)結(jié)合,得到車輛的類別。目前,主要是根據(jù)車輛的顏色、形狀、紋理等全局特征。我們需要在不同車輛的識別中找到最適合的全局特征來表示。救護車的顏色是最常用到的特征之一,我們使用救護車顏色直方圖作為特征,然后和已有的特征庫進行匹配,從而判斷出該車輛是否為救護車。缺點就是沒有考慮到光照不同對顏色有影響,導(dǎo)致結(jié)果不準確。采用Gabor 濾波器來提取車輛圖像特征,與模式匹配方法結(jié)合進而實現(xiàn)車輛識別。全局特征反映的是車輛的整體信息,一般差異較大識別準確率比較高,反之識別率較差。
全局特征滿足不了精細化的車輛識別,我們需要更細致的局部特征。我們引入了詞袋(Bag-of-words)模型概念,把圖形分為一個個圖像塊,每個圖形塊定義成詞袋模型中的單詞,這樣圖像就由一個個單詞構(gòu)成,圖像的特征向量表示就是所有單詞構(gòu)成的直方圖。
目前監(jiān)控識別的車輛圖形一般為二維圖像,我們通過對圖像上的救護車進行三維建模,獲得救護車的三維信息,然后訓(xùn)練固定的三維模型進行識別。
總之,淺層學(xué)習(xí)只能根據(jù)一些理想化的特征來識別車輛,不能精細化的識別車輛不同之處,且容易受到外界的干擾[4]。
深度學(xué)習(xí)的定義最早是由多倫多大學(xué)的Hinton教授提出的,他于2006年在頂級期刊《science》上的論文開啟了深度學(xué)習(xí)研究和發(fā)展的熱潮。深度學(xué)習(xí)是機器學(xué)習(xí)領(lǐng)域的一個全新的研究方向,它能通過自主地學(xué)習(xí)特征來提高識別的精度,從而被引入到車輛識別當(dāng)中。在深度學(xué)習(xí)中,常見的深度學(xué)習(xí)模型包括卷積神經(jīng)網(wǎng)絡(luò)、深度置信網(wǎng)絡(luò)、受限玻爾茲曼機和自編碼器等等。下面主要介紹基于卷積神經(jīng)網(wǎng)絡(luò)的救護車輛識別技術(shù)。
基于卷積神經(jīng)網(wǎng)絡(luò)的救護車輛識別技術(shù)。卷積神經(jīng)網(wǎng)絡(luò)一種深度學(xué)習(xí)模型,CNN能夠自適應(yīng)的提取目標特征,并且通過增加數(shù)量擬合更高的模型,實現(xiàn)提高識別的準確率。CNN可以直接將圖片輸入網(wǎng)絡(luò),不需要人工提取特征信息,相比于傳統(tǒng)的圖像處理技術(shù)有著巨大的優(yōu)勢。目前比較經(jīng)典的CNN模型結(jié)構(gòu)有AlexNet網(wǎng)絡(luò)模型、VGGNet網(wǎng)絡(luò)模型、Inception網(wǎng)絡(luò)模型、ResNet網(wǎng)絡(luò)模型等等[5]。
綜上所述,隨著科技的進步,救護車輛特征提取的方法也越來越多,深度學(xué)習(xí)的方法將越來越領(lǐng)先于物理參數(shù)與淺層學(xué)習(xí)的方法。結(jié)合不同的深度網(wǎng)絡(luò)的特點解決救護車輛識別問題在不久的將來會取得突破性進展。分秒必爭,救護車車輛識別技術(shù)的研究能在一定程度上更好地幫助警察叔叔們調(diào)度車輛,為擁堵的救護車規(guī)劃一條最合理的路線,挽救病人的生命,具有很強的現(xiàn)實意義。