• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    YOLOv5定位多特征融合的車標(biāo)識(shí)別

    2023-03-13 10:04:52董光輝陳星宇
    關(guān)鍵詞:車標(biāo)高斯正確率

    董光輝,陳星宇

    東北林業(yè)大學(xué) 信息與計(jì)算機(jī)工程學(xué)院,哈爾濱 150040

    在當(dāng)今交通領(lǐng)域高速發(fā)展的時(shí)代,對(duì)道路交通的實(shí)時(shí)性、安全性以及智能性等不斷提出更高的要求。智能交通系統(tǒng)的出現(xiàn)受到了社會(huì)各界越來越多的關(guān)注,作為人工智能中具有蓬勃發(fā)展與廣泛應(yīng)用前景的產(chǎn)業(yè)領(lǐng)域,智能交通在帶來更多具有創(chuàng)新性的解決方案的同時(shí),也對(duì)道路監(jiān)察管理、道路基礎(chǔ)設(shè)施建設(shè)等部門與行業(yè)提出了更高的標(biāo)準(zhǔn)。智能交通系統(tǒng)需要對(duì)道路及車輛的各種相關(guān)信息進(jìn)行檢測(cè)、記錄與分析,道路信息包括交通標(biāo)志、交通信號(hào)燈、人行橫道與停止線等,車輛信息包括車牌、車型、車標(biāo)等。其中,車標(biāo)是車輛類別的重要標(biāo)識(shí)符,其特征鮮明且不易修改,目前車標(biāo)圖像識(shí)別是智能交通系統(tǒng)設(shè)計(jì)的重要分支和熱門研究課題,車標(biāo)識(shí)別對(duì)于交管部門監(jiān)控行車信息、公安部門追蹤車輛犯罪等實(shí)際場(chǎng)景具有重要意義。

    車標(biāo)識(shí)別主要包含車標(biāo)定位與車標(biāo)識(shí)別兩部分。對(duì)于完整的車標(biāo)定位與識(shí)別系統(tǒng)而言,車標(biāo)定位與識(shí)別整體正確率是由定位正確率與識(shí)別正確率共同決定的,若由于定位失敗或發(fā)生偏差而導(dǎo)致被定位到的車標(biāo)圖片錯(cuò)誤或不完整,將會(huì)直接影響車標(biāo)圖像識(shí)別階段的分類判別,因此快速并準(zhǔn)確地完成車標(biāo)定位是首要任務(wù)。

    在車標(biāo)定位方面,Liu等人[1]提出了一種車輛標(biāo)志定位的方法。該方法首先通過車牌的位置獲得車輛標(biāo)志的近似區(qū)域,然后使用邊緣檢測(cè)與投影的方法判斷車輛徽標(biāo)背景的水平或垂直紋理,最后使用已知的紋理再通過形態(tài)濾波與投影信息正確定位車輛徽標(biāo)的位置。Sun等人[2]首先使用Adaboost和局部二值模式(local binary pattern,LBP)特征檢測(cè)車牌的位置,以便通過先驗(yàn)知識(shí)減少車標(biāo)的搜索區(qū)域,然后使用改進(jìn)的基于梯度的位置算法進(jìn)一步定位車標(biāo)。劉玉松等人[3]提出了一種基于邊緣投影(projection of edge)的快速車標(biāo)定位方法。張棟冰[4]結(jié)合視覺注意機(jī)制(visual attention theory,VAT)與支持向量機(jī)(support vector machine,SVM)提出了復(fù)雜環(huán)境下的車標(biāo)區(qū)域定位算法。焦志全[5]針對(duì)復(fù)雜應(yīng)用場(chǎng)景下的車標(biāo)定位問題提出了基于非限制場(chǎng)景ALPR系統(tǒng)與遷移學(xué)習(xí)(transfer learning)的解決方案。上述方法在實(shí)現(xiàn)上需依賴于車牌定位,過程繁瑣且定位速度較慢。

    對(duì)于識(shí)別階段而言,車標(biāo)特征的選擇和提取尤為重要。王枚等人[6]提出了基于主成分分析(principal components analysis,PCA)與邊緣不變矩進(jìn)行車標(biāo)識(shí)別的新方法。為了解決識(shí)別精度問題,Dai等人[7]采用Tchebichef矩不變量與SVM來識(shí)別車輛標(biāo)志,實(shí)驗(yàn)結(jié)果表明該系統(tǒng)在無噪聲和有噪聲環(huán)境中均可以達(dá)到較滿意的車標(biāo)識(shí)別正確率。Soon等人[8]采用矩不變量和最小平均距離(minimum mean distance,MMD)分類器識(shí)別六種不同類型的車標(biāo),利用Tchebichef和Legendre矩不變量識(shí)別從粗分割與細(xì)分割中獲得的車標(biāo)。Gu等人[9]提出了基于密集SIFT匹配能量和SIFT流一致性的車輛標(biāo)志識(shí)別算法,驗(yàn)證了車標(biāo)識(shí)別的準(zhǔn)確性和多尺度車標(biāo)圖像在各種真實(shí)數(shù)據(jù)上的魯棒性。李熙瑩等人[10]基于Edge Boxes算法提出了大型車輛的車標(biāo)檢測(cè)與識(shí)別方案。李哲等人[11]提出了基于多種LBP集成學(xué)習(xí)的車標(biāo)識(shí)別方案。曲愛妍等人[12]基于方向梯度直方圖(histogram of oriented gradient,HOG)特征與LBP,結(jié)合SVM對(duì)車標(biāo)圖像進(jìn)行識(shí)別。

    在提取車標(biāo)圖片的特征之前,對(duì)車標(biāo)進(jìn)行邊緣檢測(cè)將有助于突出車標(biāo)主體圖像,但不同邊緣檢測(cè)算法的效果差異對(duì)最終提取出的車標(biāo)特征存在不同的影響。目前對(duì)圖像邊緣檢測(cè)與特征提取的研究廣泛且應(yīng)用領(lǐng)域眾多。

    在圖像邊緣檢測(cè)方面,Punarselvam等人[13]提出了基于幅度與邊緣長(zhǎng)度的Canny邊緣檢測(cè)算法,用于CT掃描脊柱盤圖像的邊界檢測(cè)的預(yù)處理。Roe等人[14]提出了一種基于顏色恒定性的局部圖像均衡與擴(kuò)展高斯差分邊緣檢測(cè)算子XDoG的二值化方法,用于退化歷史文獻(xiàn)的彩色圖像。所提出的方法被證明取得了更令人滿意的結(jié)果。劉麗霞等人[15]提出了基于改進(jìn)Canny邊緣檢測(cè)的遙感影像分割算法。Du等人[16]為了提高軸端面的圓度檢測(cè)效率和精度,提出了一種基于改進(jìn)的Canny-Zernike亞像素圖像邊緣檢測(cè)與改進(jìn)的Hough變換的檢測(cè)方法,克服了單Hough變換檢測(cè)精度低的缺點(diǎn)。齊小祥等人[17]基于邊緣檢測(cè)提出了一種逆合成孔徑雷達(dá)圖像自適應(yīng)區(qū)域分割方法。

    在圖像特征提取方面,Lv等人[18]提出了一種基于灰度共生矩陣(gray level co-occurrence matrix,GLCM)特征結(jié)合SVM在逆合成孔徑雷達(dá)圖像中提取水區(qū)的新方法。Mihreteab等人[19]通過結(jié)合HOG與中心對(duì)稱局部二值模式作為特征集提出了一種鳥類檢測(cè)器,該方法可以在各種光照條件下檢測(cè)烏鴉。Feng等人[20]基于HOG特征能夠保持良好的幾何與光學(xué)不變性的特點(diǎn),提出了提取手勢(shì)的HOG特征,然后用SVM對(duì)特征向量進(jìn)行訓(xùn)練的手勢(shì)識(shí)別方案。Mirzapour等人[21]使用GLCM與Gabor濾波器提取紋理特征,以便對(duì)像素聚合網(wǎng)絡(luò)PAN圖像進(jìn)行分類。實(shí)驗(yàn)結(jié)果表明所提出的快速GLCM與特征融合方法具有良好的性能。Verma等人[22]提出了結(jié)合Gabor濾波器與人工神經(jīng)網(wǎng)絡(luò)破譯面部表情識(shí)別的方法。該方法使用Gabor濾波器提取面部表情,然后使用多層人工神經(jīng)網(wǎng)絡(luò)對(duì)面部表情進(jìn)行分類。劉文培等人[23]提出了面向人臉識(shí)別的小波包分解-方向梯度直方圖(wavelet packet decomposition-histograms of oriented gradients,WPD-HOG)金字塔特征提取方法。Chang等人[24]提出了一種基于Gabor特征與雙參數(shù)恒定誤報(bào)率檢測(cè)技術(shù)對(duì)逆合成孔徑雷達(dá)影像內(nèi)船舶進(jìn)行檢測(cè)的方法。該方法能夠達(dá)到較高的船舶識(shí)別精度。

    針對(duì)上述車標(biāo)定位中存在的問題,以及識(shí)別階段選擇車標(biāo)邊緣檢測(cè)算法與車標(biāo)特征提取手段的復(fù)雜情況,本文提出了一種YOLOv5網(wǎng)絡(luò)車標(biāo)定位多特征融合的車標(biāo)圖像識(shí)別方案。車標(biāo)定位階段選擇YOLOv5s網(wǎng)絡(luò),車標(biāo)識(shí)別階段首先通過調(diào)整擴(kuò)展高斯差分中的參數(shù)來得到具有不同圖像細(xì)節(jié)、邊緣粗細(xì)、明暗程度的車標(biāo)邊緣,然后設(shè)計(jì)一組二維Gabor濾波器對(duì)車標(biāo)圖像進(jìn)行濾波處理,從各個(gè)濾波器的輸出結(jié)果中提取出對(duì)應(yīng)的車標(biāo)圖像特征向量,最后通過計(jì)算待測(cè)車標(biāo)圖像特征與自制車標(biāo)特征向量標(biāo)準(zhǔn)比對(duì)庫(kù)中特征向量的歐幾里德距離,取距離最小者對(duì)應(yīng)的標(biāo)簽索引作為分類識(shí)別結(jié)果。技術(shù)路線圖如圖1所示。為了提高車標(biāo)圖像特征向量的分類預(yù)測(cè)正確率,本文在從Gabor濾波器組中提取出車標(biāo)圖像特征向量的基礎(chǔ)上,將歐氏距離判別替換成隨機(jī)森林算法再次對(duì)車標(biāo)特征向量分類預(yù)測(cè)進(jìn)行實(shí)驗(yàn)并統(tǒng)計(jì)整體識(shí)別正確率。

    圖1 技術(shù)路線圖Fig.1 Technology roadmap

    本文的主要貢獻(xiàn)包括如下四個(gè)方面:

    (1)引入了YOLOv5s網(wǎng)絡(luò)進(jìn)行車標(biāo)的一步定位,提高了定位速度與精度。

    (2)采用參數(shù)可控的擴(kuò)展高斯差分XDoG進(jìn)行車標(biāo)邊緣檢測(cè),通過調(diào)參可生成具有不同圖像細(xì)節(jié)、邊緣粗細(xì)、明暗程度的邊緣檢測(cè)效果,可根據(jù)不同情況下所拍攝的車標(biāo)圖片質(zhì)量進(jìn)行調(diào)整以達(dá)到不同的要求。

    (3)采用二維Gabor濾波器組提取圖像特征,通過調(diào)整參數(shù)(尺度、方向)可以生成不同數(shù)量的濾波器組,滿足不同情況下對(duì)圖像特征的各種要求。

    (4)本方案可對(duì)45類車標(biāo)進(jìn)行識(shí)別,采用隨機(jī)森林算法替代歐氏距離判別,提高了識(shí)別分類的正確率。

    1 基于YOLOv5s網(wǎng)絡(luò)的車標(biāo)定位

    2020年,Jocher推出了基于YOLOv4版本進(jìn)行改進(jìn)的YOLOv5算法。該算法進(jìn)行目標(biāo)檢測(cè)可分為三步[25]:首先統(tǒng)一對(duì)圖像進(jìn)行規(guī)格大小的改變并對(duì)其分割,然后通過卷積神經(jīng)網(wǎng)絡(luò)提取圖像中目標(biāo)的特征,最后通過非極大值抑制(non-maximum suppression,NMS)剔除冗余的候選框,輸出高質(zhì)量的檢測(cè)結(jié)果。根據(jù)網(wǎng)絡(luò)結(jié)構(gòu)的深度與寬度將YOLOv5分為由小到大的四個(gè)不同版本[26]:YOLOv5s、YOLOv5m、YOLOv5l、YOLOv5x。由于本文要求的車標(biāo)定位算法需要具有較高的定位檢測(cè)速度與精度,并且有部署到嵌入式端或者移動(dòng)端的需求,通過比較發(fā)現(xiàn),在YOLOv5四個(gè)版本中最小的s版本的模型大小僅十幾兆,并且還能保持目標(biāo)檢測(cè)的速度與精度,YOLOv5s網(wǎng)絡(luò)定位車標(biāo)比傳統(tǒng)車標(biāo)定位算法(例如基于車牌位置定位車標(biāo))的實(shí)現(xiàn)更加簡(jiǎn)單,故選用YOLOv5s模型進(jìn)行車標(biāo)定位。YOLOv5s網(wǎng)絡(luò)主要包括Input、Backbone、Neck、Prediction等模塊,而每個(gè)模塊又是由CBL、CSP、Focus、SPP等小模塊組成[27]。YOLOv5s網(wǎng)絡(luò)模型結(jié)構(gòu)如圖2所示。

    圖2 YOLOv5s網(wǎng)絡(luò)模型結(jié)構(gòu)Fig.2 YOLOv5s network model structure

    本文基于YOLOv5s建立的車標(biāo)定位網(wǎng)絡(luò)相比于傳統(tǒng)的車標(biāo)定位方案(例如基于車牌位置定位車標(biāo)的方案)正確率更高。車標(biāo)識(shí)別是在車標(biāo)定位的基礎(chǔ)上完成的,定位的正確率是車標(biāo)定位階段工作的首要指標(biāo),因?yàn)槠鋾?huì)直接影響后續(xù)車標(biāo)識(shí)別的過程,由此在車標(biāo)定位階段需選擇檢測(cè)定位精度高的算法。

    基于YOLOv5s網(wǎng)絡(luò)定位車標(biāo)的步驟是:首先將車標(biāo)數(shù)據(jù)集按適當(dāng)比例劃分為訓(xùn)練集(train set)、驗(yàn)證集(validation set)與測(cè)試集(test set),然后將訓(xùn)練集與驗(yàn)證集輸入到Y(jié)OLOv5s網(wǎng)絡(luò)中進(jìn)行訓(xùn)練,通過多輪訓(xùn)練即可得到訓(xùn)練完成的YOLOv5s車標(biāo)定位網(wǎng)絡(luò);接著將測(cè)試集輸入到已訓(xùn)練完成的YOLOv5s車標(biāo)定位網(wǎng)絡(luò)中,輸出測(cè)試結(jié)果并統(tǒng)計(jì)車標(biāo)定位的正確率;最后將輸出測(cè)試結(jié)果中已定位到的、僅含有車標(biāo)的區(qū)域提取出來,為后續(xù)的車標(biāo)識(shí)別階段做準(zhǔn)備。結(jié)果如圖3(a)所示。

    為了更好地對(duì)比與證明本文所提出的智能交通系統(tǒng)車標(biāo)圖像識(shí)別方案的效果,增加了利用YOLOv5s網(wǎng)絡(luò)一步到位直接完成車標(biāo)識(shí)別的實(shí)驗(yàn),以此分析兩種方案各自識(shí)別車標(biāo)的優(yōu)劣,為后續(xù)進(jìn)一步改進(jìn)優(yōu)化車標(biāo)識(shí)別方案做準(zhǔn)備?;赮OLOv5s網(wǎng)絡(luò)一步到位識(shí)別車標(biāo)的步驟是:仍然利用基于YOLOv5s網(wǎng)絡(luò)定位車標(biāo)的已劃分好的數(shù)據(jù)集,然后將訓(xùn)練集與驗(yàn)證集輸入到Y(jié)OLOv5s網(wǎng)絡(luò)中進(jìn)行訓(xùn)練,通過多輪訓(xùn)練即可得到訓(xùn)練完成的YOLOv5s一步到位識(shí)別車標(biāo)的網(wǎng)絡(luò);最后將測(cè)試集輸入到已訓(xùn)練完成的YOLOv5s一步到位識(shí)別車標(biāo)的網(wǎng)絡(luò)中,輸出測(cè)試結(jié)果并統(tǒng)計(jì)一步到位識(shí)別車標(biāo)的正確率。結(jié)果如圖3(b)所示。

    圖3 車標(biāo)定位與一步識(shí)別的結(jié)果Fig.3 Results of vehicle logo positioning and one-step recognition

    實(shí)驗(yàn)過程中利用同一訓(xùn)練與驗(yàn)證數(shù)據(jù)集(4 500張?jiān)计噲D片,共45類車標(biāo),每類100張,訓(xùn)練集與驗(yàn)證集的比例為7∶3)在YOLOv5s網(wǎng)絡(luò)中訓(xùn)練,然后對(duì)同一測(cè)試數(shù)據(jù)集(900張?jiān)计噲D片,共45類車標(biāo),每類20張)進(jìn)行測(cè)試,其中訓(xùn)練集與測(cè)試集的圖片不存在交疊重合的部分,以此避免了同一張圖片既用于訓(xùn)練也用于測(cè)試的情況,使最終的車標(biāo)識(shí)別正確率更科學(xué)、精準(zhǔn)。通過實(shí)驗(yàn)發(fā)現(xiàn),僅利用YOLOv5s網(wǎng)絡(luò)完成車標(biāo)定位的正確率為99.33%,利用YOLOv5s網(wǎng)絡(luò)直接一步到位識(shí)別車標(biāo)的正確率為97.11%。導(dǎo)致利用同一個(gè)YOLOv5s網(wǎng)絡(luò)進(jìn)行一步到位識(shí)別車標(biāo)的正確率比僅完成車標(biāo)定位的正確率低的原因是:車標(biāo)定位階段的標(biāo)簽只有一種“Vehicle-logo”,而直接一步到位識(shí)別車標(biāo)時(shí)標(biāo)簽則細(xì)化到了每種車標(biāo)的名字,不再是單一的“Vehicle-logo”標(biāo)簽,45類車標(biāo)的標(biāo)簽類別數(shù)明顯遠(yuǎn)多于“Vehicle-logo”這一種,故對(duì)同一車標(biāo)圖片主體而言,在需要進(jìn)行更具體的標(biāo)簽分類識(shí)別任務(wù)時(shí),網(wǎng)絡(luò)對(duì)目標(biāo)的細(xì)節(jié)特征要求也更高,在數(shù)據(jù)集不發(fā)生改變的情況下,目標(biāo)檢測(cè)與識(shí)別的工作任務(wù)量加大且正確率也會(huì)降低。

    2 基于多特征融合的車標(biāo)識(shí)別

    本章包含三個(gè)部分,首先采用擴(kuò)展高斯差分XDoG對(duì)YOLOv5s網(wǎng)絡(luò)定位的車標(biāo)圖像進(jìn)行邊緣檢測(cè);然后采用二維Gabor濾波器組提取車標(biāo)特征并通過歐幾里德距離進(jìn)行分類判別;最后將歐氏距離判別替換為隨機(jī)森林算法對(duì)車標(biāo)特征進(jìn)行分類。

    2.1 基于擴(kuò)展高斯差分的車標(biāo)邊緣檢測(cè)

    拉普拉斯算子(Laplacian)是通過檢測(cè)二階導(dǎo)數(shù)的零交叉點(diǎn)(zero-crossings)來對(duì)圖像進(jìn)行邊緣檢測(cè)的,其表達(dá)式為:

    由于拉普拉斯算子對(duì)噪聲高度敏感,故在對(duì)圖像作拉普拉斯卷積之前需要對(duì)圖像的噪點(diǎn)進(jìn)行低通濾波處理。常用的低通濾波器為高斯低通濾波器,其表達(dá)式[28]為:

    其中,Gσ(x,y)被稱為高斯核,(x,y)表示圖像中的二維坐標(biāo),σ表示空間域中高斯分布的標(biāo)準(zhǔn)差(與頻域中低通濾波器的截止頻率成反比)。

    在高斯低通濾波去除圖像噪聲之后再作拉普拉斯卷積,該過程寫成數(shù)學(xué)表達(dá)式為:

    其中,LoG[?]表示進(jìn)行高斯拉普拉斯操作,I(x,y)表示圖像,“?”表示一個(gè)卷積操作。

    式(3)中的第二個(gè)等號(hào)表示高斯拉普拉斯操作可以等效為先求高斯核的拉普拉斯變換,然后再與圖像作卷積運(yùn)算。這樣的好處是圖像只在最后一步參與一次卷積運(yùn)算,相比于先高斯濾波再拉普拉斯變換導(dǎo)致圖像數(shù)據(jù)參與兩次運(yùn)算而言,降低了計(jì)算量,提高了效率。由此,得出高斯拉普拉斯LoG的表達(dá)式為:

    由于高斯拉普拉斯LoG在計(jì)算時(shí)缺乏可分性而導(dǎo)致計(jì)算效率較低,故在LoG的基礎(chǔ)上提出了高斯差分(difference of Gaussians,DoG)。對(duì)圖像I(x,y)進(jìn)行高斯差分操作的表達(dá)式為:

    其中,DoG[?]表示進(jìn)行高斯差分操作,k為一個(gè)大于零的常數(shù),通常設(shè)為1.6。

    對(duì)式(5)中兩個(gè)高斯核的差分用極限表達(dá)式:

    進(jìn)行近似替換可得:

    將式(7)帶入式(5)中可得高斯差分的二階微分表達(dá)形式為:

    由此,得出高斯差分DoG的表達(dá)式:

    對(duì)圖像I(x,y)進(jìn)行高斯差分操作后,再乘以閾值函數(shù)即可得到最終輸出的高斯差分之后的圖像,該過程可用數(shù)學(xué)表達(dá)式寫為:

    其中,Tε(?)表示閾值函數(shù),作用是對(duì)高斯差分操作之后的圖像DoG[I(x,y)]進(jìn)行閾值化處理,使得輸出的圖像強(qiáng)度差異更明顯。閾值函數(shù)的表達(dá)式為:

    其中,u是在高斯差分圖像DoG[I(x,y)]中對(duì)應(yīng)二維坐標(biāo)下的值,ε是設(shè)置的閾值。

    Winnem?ller等人[29]于2012年提出了擴(kuò)展高斯差分(extended difference of Gaussians,XDoG)。因其具有多個(gè)參數(shù),可以通過調(diào)整參數(shù)的方式滿足對(duì)圖像細(xì)節(jié)、灰暗程度、邊緣粗細(xì)的不同要求,故其在圖像邊緣檢測(cè)方面有很好的效果。

    擴(kuò)展高斯差分XDoG首先是在高斯差分DoG的基礎(chǔ)上引入?yún)⒘喀?,目的是調(diào)整擴(kuò)展高斯差分濾波的截止效果的強(qiáng)度。引入?yún)⒘喀煤蟮谋磉_(dá)式為:

    其中,當(dāng)γ=1時(shí)退化為普通的高斯差分。

    其次,擴(kuò)展高斯差分XDoG將高斯差分圖像閾值化時(shí)所使用的簡(jiǎn)單二分閾值函數(shù)替換成了一個(gè)連續(xù)的斜坡函數(shù),即:

    最后,對(duì)圖像I(x,y)進(jìn)行擴(kuò)展高斯差分XDoG操作的過程用數(shù)學(xué)表達(dá)式可寫為:

    擴(kuò)展高斯差分XDoG可以通過調(diào)節(jié)如表1所示的參數(shù)來獲得不同車標(biāo)圖片的圖像細(xì)節(jié)、灰暗程度、邊緣粗細(xì)。以?shī)W迪車標(biāo)為例,其車標(biāo)圖像隨各參數(shù)變化的邊緣檢測(cè)效果如圖4所示。

    圖4 奧迪車標(biāo)圖像隨各參數(shù)變化的邊緣檢測(cè)效果Fig.4 Edge detection effect of Audi logo image varying with various parameters

    表1 XDoG的參數(shù)解釋Table 1 Parameter interpretation of XDoG

    2.2 基于二維Gabor濾波的車標(biāo)特征提取

    在信號(hào)時(shí)頻分析理論中,測(cè)不準(zhǔn)原理指出無法在時(shí)域與頻域上均獲得任意的測(cè)量精度,時(shí)域與頻域二者的精度互相制約,頻率域分辨率的提高必然要以犧牲時(shí)域的分辨率為代價(jià)。

    對(duì)于單位能量信號(hào)g(t)而言,其傅里葉變換記為g(ω)。設(shè)g(t)在時(shí)域與頻域的中心分別為μt與μω,用數(shù)學(xué)表達(dá)式寫為:

    單位能量信號(hào)g(t)的主要能量集中范圍可以用時(shí)域與頻域的等效寬度進(jìn)行定義,其數(shù)學(xué)表達(dá)式為:

    則有:

    1985年,Daugman[30]首次提出了二維Gabor濾波器(2D-GaborFilter)。2D-Gabor函數(shù)是唯一能夠達(dá)到測(cè)不準(zhǔn)原理下界的高性能函數(shù)[31],即其可以同時(shí)在時(shí)域與頻域獲得較高的分辨率。二維Gabor濾波器在提取圖像目標(biāo)的局部空間域與頻率域信息方面具有優(yōu)良的特性,能夠很好地近似哺乳類動(dòng)物的視覺皮層簡(jiǎn)單細(xì)胞(visual cortex simple cell)二維感受野剖面。

    二維Gabor函數(shù)是一個(gè)由高斯函數(shù)調(diào)制的復(fù)正弦函數(shù),其數(shù)學(xué)表達(dá)式[32]為:

    其中,f0是正弦平面波的中心頻率值,即所生成的每個(gè)二維Gabor濾波器所對(duì)應(yīng)的頻率,θ是高斯波與正弦平面波沿逆時(shí)針方向旋轉(zhuǎn)的角度值,α與β是橢圓高斯曲線長(zhǎng)軸與短軸的銳度值。

    歸一化的二維Gabor濾波器響應(yīng)的表達(dá)式為:

    其中,I(x,y)表示圖像,“?”表示一個(gè)卷積操作。

    將式(20)代入式(23)中可以得到:

    定義沿長(zhǎng)軸與短軸的高斯分布寬度分別為γ與η,這兩個(gè)參數(shù)與正弦平面波的中心頻率f0之間存在如下關(guān)系:

    將式(25)與式(26)代入式(24)可得:

    由于不同車標(biāo)圖像的紋理具有不同的中心頻率值與頻帶寬度,以此可以設(shè)計(jì)一組二維Gabor濾波器對(duì)車標(biāo)圖像進(jìn)行濾波處理,每個(gè)二維Gabor濾波器僅允許與其頻率相對(duì)應(yīng)的車標(biāo)圖像紋理通過,同時(shí)抑制其他車標(biāo)圖像紋理的能量,從各個(gè)濾波器的輸出結(jié)果中所提取出來的車標(biāo)圖像紋理特征可以用于后續(xù)的車標(biāo)分類識(shí)別。

    第一步需要設(shè)計(jì)二維Gabor濾波器,確定二維Gabor濾波器的方向(orientation)、尺度(scale)、間隔(separation)。建立車標(biāo)特征提取的二維Gabor濾波器時(shí)選擇5個(gè)尺度與8個(gè)方向,這樣就構(gòu)成了由40個(gè)Gabor濾波器組成的Gabor濾波器組,如圖5所示。二維Gabor濾波器在每個(gè)尺度處的頻率不同,定義尺度維的最大頻率為,尺度維頻率間隔為2,則每個(gè)尺度處的頻率值可以表示為:

    圖5 二維Gabor濾波器組Fig.5 Two dimensional Gabor filter bank

    用式(28)中的fu替換式(27)中的f0,用式(29)中的θv替換式(21)與式(22)中的θ,可得到40個(gè)歸一化的二維Gabor濾波器響應(yīng)的函數(shù)表達(dá)式:

    第二步是從二維Gabor濾波器的輸出結(jié)果中提取車標(biāo)特征。二維Gabor濾波器組與每張車標(biāo)圖像在空間域進(jìn)行卷積,則對(duì)應(yīng)到頻率域變?yōu)?0個(gè)Gabor濾波器的頻率響應(yīng)與每張車標(biāo)圖像的乘積。具體做法為:先將車標(biāo)圖像通過快速傅里葉變換得到圖像的頻率域處理結(jié)果,然后再將其與40個(gè)Gabor濾波器的頻率響應(yīng)相乘,最終每張車標(biāo)圖像可以得到對(duì)應(yīng)的40個(gè)濾波器的頻率域乘積輸出結(jié)果。對(duì)該輸出結(jié)果取絕對(duì)值可得到幅度值并將其歸一化為標(biāo)準(zhǔn)正態(tài)分布,最終的結(jié)果是一個(gè)1×1 440維的行向量,以此作為車標(biāo)圖像的特征行向量。將每類車標(biāo)中所有圖片通過上述兩個(gè)步驟所提取出來的特征行向量求均值,即可得到該類車標(biāo)的特征行向量標(biāo)準(zhǔn)比對(duì)模板,所有45類車標(biāo)的特征行向量標(biāo)準(zhǔn)比對(duì)模板組合起來形成一個(gè)45×1 440維的矩陣,該矩陣即為“45類車標(biāo)特征行向量標(biāo)準(zhǔn)比對(duì)庫(kù)”。通過計(jì)算待測(cè)車標(biāo)圖像通過二維Gabor濾波提取出來的特征與“45類車標(biāo)特征行向量標(biāo)準(zhǔn)比對(duì)庫(kù)”中特征的歐幾里德距離,取距離最小者所對(duì)應(yīng)的種類標(biāo)簽索引,即可判別出待測(cè)車標(biāo)圖像的所屬類別。

    2.3 基于隨機(jī)森林的車標(biāo)特征分類

    對(duì)于已經(jīng)提取到的二維Gabor特征而言,其維度為1 440維,通過計(jì)算特征之間的歐幾里德距離并且取距離最小者所對(duì)應(yīng)的種類標(biāo)簽索引作為最終特征分類結(jié)果可以達(dá)到較好的效果,但對(duì)于高維特征的輸入樣本而言,隨機(jī)森林(random forest,RF)在當(dāng)前所有算法中,其能夠處理具有高維特征的輸入樣本且無需降維處理,準(zhǔn)確率高且能夠有效地運(yùn)行在大數(shù)據(jù)集上。隨機(jī)森林是通過集成學(xué)習(xí)(ensemble learning)的思想將多棵隨機(jī)決策樹(decision tree)集成的一種算法,即由多個(gè)弱分類器組合成一個(gè)強(qiáng)分類器。每棵決策樹都是一個(gè)分類器,對(duì)于一個(gè)輸入樣本而言,N棵樹會(huì)產(chǎn)生N個(gè)分類結(jié)果。而隨機(jī)森林集成了所有的分類投票結(jié)果,將投票次數(shù)最多的類別指定為最終的輸出結(jié)果。

    3 實(shí)驗(yàn)結(jié)果與分析

    3.1 車標(biāo)數(shù)據(jù)集

    本文選用的數(shù)據(jù)集是來自楊朔等人[33]于2021年發(fā)布的VLD-45車標(biāo)數(shù)據(jù)集,其中包含45類車標(biāo),共計(jì)45 000張?jiān)计噲D片(包含環(huán)境背景與汽車整體)以及與之對(duì)應(yīng)的xml標(biāo)簽文件,車標(biāo)數(shù)據(jù)集圖片節(jié)選如圖6所示。

    圖6 VLD-45車標(biāo)數(shù)據(jù)集圖片節(jié)選Fig.6 VLD-45 vehicle logo data set image excerpts

    用于“基于YOLOv5s網(wǎng)絡(luò)的車標(biāo)定位”的數(shù)據(jù)集包含4 500張圖片,總共45類車標(biāo),每類車標(biāo)中含有100張圖片,其中訓(xùn)練集與驗(yàn)證集的比例為7∶3。

    用于“基于擴(kuò)展高斯差分XDoG邊緣檢測(cè)與二維Gabor濾波提取特征的車標(biāo)識(shí)別”的數(shù)據(jù)集包含5 400張圖片,總共45類車標(biāo),每類車標(biāo)中含有120張圖片。對(duì)每類車標(biāo)的120張圖片而言,其中100張用于訓(xùn)練生成該類車標(biāo)特征行向量標(biāo)準(zhǔn)比對(duì)模板,剩余20張圖片作為待測(cè)車標(biāo)圖片用于檢測(cè)車標(biāo)識(shí)別正確率。

    通過上述對(duì)VLD-45車標(biāo)數(shù)據(jù)集的劃分,保證了車標(biāo)定位與車標(biāo)識(shí)別階段的圖片不存在交疊重合的部分,以此避免了同一張圖片既用于訓(xùn)練也用于測(cè)試的情況,使最終的車標(biāo)識(shí)別正確率更科學(xué)、精準(zhǔn)。

    3.2 車標(biāo)定位網(wǎng)絡(luò)訓(xùn)練與車標(biāo)區(qū)域提取

    3.2.1 YOLOv5s車標(biāo)定位網(wǎng)絡(luò)訓(xùn)練

    如圖7(a)、(b)所示,分別為車標(biāo)定位訓(xùn)練過程中預(yù)測(cè)框回歸損失函數(shù)與目標(biāo)檢測(cè)損失函數(shù)隨訓(xùn)練迭代次數(shù)的變化曲線,兩種損失函數(shù)均隨訓(xùn)練迭代次數(shù)的增加而快速下降,最后趨于收斂。如圖8(a)、(b)所示為車標(biāo)定位訓(xùn)練過程中精確率、召回率隨訓(xùn)練迭代次數(shù)的變化曲線,二者隨著迭代次數(shù)增加而快速上升然后趨于平穩(wěn)。如圖8(c)、(d)所示為交并比的閾值分別為0.5與0.5∶0.95(步長(zhǎng)為0.05)時(shí)的平均精度均值(mean average precision,mAP)變化情況,二者的變化趨勢(shì)均為逐漸提升后趨于平穩(wěn)。如圖9所示為車標(biāo)定位類別混淆矩陣圖,如圖10(a)、(b)、(c)、(d)所示,分別為F1分?jǐn)?shù)與置信度曲線圖、精確度與置信度曲線圖、召回率與置信度曲線圖、交并比(IoU)為0.5時(shí)的精確度-召回率曲線圖。F1分?jǐn)?shù)(F1-Score)是綜合考量精確度與召回率的調(diào)和值,其表達(dá)式為:

    圖7 兩種損失函數(shù)隨訓(xùn)練迭代次數(shù)的變化曲線Fig.7 Variation curves of two loss functions with number of training iterations

    圖8 精確率、召回率、mAP隨訓(xùn)練迭代次數(shù)的變化曲線Fig.8 Variation curves of accuracy rate,recall rate and mAP with number of training iterations

    圖9 車標(biāo)定位類別混淆矩陣圖Fig.9 Confusion matrix of vehicle logo positioning category

    圖10 各指標(biāo)間曲線圖Fig.10 Curves between indicators

    其中,Precision表示精確度,Recall表示召回率。

    如圖11所示為車標(biāo)定位的實(shí)驗(yàn)結(jié)果,其展示了不同品牌的汽車基于YOLOv5s網(wǎng)絡(luò)的車標(biāo)定位結(jié)果,其中車標(biāo)的標(biāo)簽為“Vehicle-logo”。

    圖11 不同品牌汽車的車標(biāo)定位結(jié)果Fig.11 Vehicle logo positioning results of different brand cars

    3.2.2 YOLOv5s車標(biāo)定位結(jié)果分析

    基于YOLOv5s網(wǎng)絡(luò)定位車標(biāo)的實(shí)驗(yàn)結(jié)果表明,900張測(cè)試圖片中有6張?jiān)计噲D片的車標(biāo)未被檢測(cè)定位出來,故基于YOLOv5s網(wǎng)絡(luò)定位車標(biāo)的正確率為99.33%,并在圖12中展示了發(fā)生漏檢情況的6張車標(biāo)圖片。圖12中的子圖(a)、(b)、(d)、(e)、(g)、(h)為漏檢車標(biāo)的原始圖片,子圖(c)、(f)、(i)為筆者人為框選出車標(biāo)所在區(qū)域后再利用YOLOv5s網(wǎng)絡(luò)檢測(cè)定位車標(biāo)的結(jié)果,目的是進(jìn)一步分析漏檢的可能原因。經(jīng)過實(shí)驗(yàn)與分析,可以將漏檢的6張圖片分成3類,對(duì)應(yīng)3種原因。

    圖12 車標(biāo)定位漏檢示例Fig.12 Vehicle logo positioning missed detection examples

    子圖(a)、(b)的漏檢原因是相對(duì)于整張?jiān)计噲D片而言,車標(biāo)位置不突出或者車標(biāo)相對(duì)于整張圖片的大小比例過小。當(dāng)人為框選出如子圖(c)所示的車標(biāo)區(qū)域后再利用YOLOv5s網(wǎng)絡(luò)檢測(cè)定位車標(biāo)發(fā)現(xiàn),吉普車標(biāo)被成功檢測(cè)定位,但吉姆西的車標(biāo)仍為漏檢的狀態(tài)。

    子圖(d)、(e)的漏檢原因是車標(biāo)與其周圍環(huán)境背景難以區(qū)分。子圖(d)中本田車標(biāo)剛好出現(xiàn)在道路旁的白色車道柵欄縫隙處,本田車標(biāo)與汽車車身的顏色也均為白色,這就導(dǎo)致車標(biāo)與其所處的環(huán)境難以區(qū)分。子圖(e)中的沃爾沃車標(biāo)位于輪胎裝飾罩的中心,其與汽車輪胎螺栓的顏色及形狀大小相似。此外,車輪輪輻的顏色也與車標(biāo)顏色相近。當(dāng)人為框選出如子圖(f)所示的車標(biāo)區(qū)域后再利用YOLOv5s網(wǎng)絡(luò)檢測(cè)定位車標(biāo)發(fā)現(xiàn),本田車標(biāo)被成功檢測(cè)定位,但沃爾沃車標(biāo)圖片中的汽車輪胎螺栓被誤識(shí)別為車標(biāo),而本應(yīng)被檢測(cè)識(shí)別的沃爾沃車標(biāo)仍被漏檢。通過對(duì)比圖像細(xì)節(jié)發(fā)現(xiàn),汽車輪胎螺栓在陽光的照射下可于車胎螺栓表面映射出路面上的道路交線,通過金屬反光曲面成像,筆直的道路交線在車胎螺栓表面形成長(zhǎng)條帶狀的物影,這恰好與圖中將“VOLVO”字樣刻于金屬橫條之上的沃爾沃圓形車標(biāo)主體高度相似,從而導(dǎo)致汽車輪胎螺栓的誤識(shí)別與沃爾沃車標(biāo)的漏檢。

    子圖(g)、(h)的漏檢原因是車標(biāo)與車輛的前格柵融合在一起而難以區(qū)分車標(biāo)與格柵背景。子圖(g)中的吉利車標(biāo)被安裝在車輛的前格柵上,在定位識(shí)別時(shí)難以將其與格柵背景區(qū)分開。子圖(h)的林肯車標(biāo)直接與車輛的前格柵融為一體,其形狀、邊框粗細(xì)、顏色與格柵金屬條框高度相似,極大地增加了識(shí)別難度。當(dāng)人為框選出如子圖(i)所示的車標(biāo)區(qū)域后再利用YOLOv5s網(wǎng)絡(luò)檢測(cè)定位車標(biāo)發(fā)現(xiàn),吉利與林肯車標(biāo)均未被正確識(shí)別,仍為漏檢的狀態(tài)。

    3.2.3 車標(biāo)區(qū)域提取

    在利用YOLOv5s網(wǎng)絡(luò)完成車標(biāo)定位之后,將定位出的車標(biāo)區(qū)域提取出來。圖13(a)、(b)展示了在車標(biāo)定位完成之后,將僅含有車標(biāo)區(qū)域提取出來的結(jié)果。

    圖13 車標(biāo)定位實(shí)驗(yàn)結(jié)果Fig.13 Experimental results of vehicle logo positioning

    3.3 傳統(tǒng)邊緣檢測(cè)算子處理車標(biāo)實(shí)驗(yàn)結(jié)果

    3.3.1 邊緣檢測(cè)算子的種類選取實(shí)驗(yàn)

    以大眾車標(biāo)為例,觀察Sobel算子、Roberts算子、Prewitt算子、LoG算子、Canny算子的邊緣檢測(cè)效果,結(jié)果如圖14所示。每種邊緣檢測(cè)算子的檢測(cè)閾值都設(shè)置為0.1,設(shè)置低閾值的目的是盡量將車標(biāo)的更多特征提取出來,在邊緣檢測(cè)算子選擇的初始階段能更直觀地反映邊緣檢測(cè)與提取效果。實(shí)驗(yàn)結(jié)果為Canny算子不容易受噪聲干擾,能夠檢測(cè)到真正的車標(biāo)圖像弱邊緣,其邊緣檢測(cè)效果明顯優(yōu)于其他四種算子。

    圖14 不同算子邊緣檢測(cè)結(jié)果Fig.14 Edge detection results of different operators

    3.3.2 Canny算子檢測(cè)閾值選取必要性證明實(shí)驗(yàn)

    (1)不同Canny算子的檢測(cè)閾值選取對(duì)同一車標(biāo)邊緣檢測(cè)效果的影響對(duì)比實(shí)驗(yàn)

    以大眾車標(biāo)為例,通過對(duì)比實(shí)驗(yàn)發(fā)現(xiàn),Canny算子進(jìn)行車標(biāo)邊緣檢測(cè)的效果取決于Canny算子的檢測(cè)閾值選擇,如圖15所示。若檢測(cè)閾值設(shè)置過小,任何特征信息(包括無用的干擾與紋理)都被檢測(cè)出來,容易造成誤判,如圖15(a)所示。若檢測(cè)閾值設(shè)置過大,容易漏掉重要邊緣信息而造成誤判,如圖15(c)所示。只有在選擇合適的檢測(cè)閾值時(shí)才能既保留重要的邊緣信息,又能有效濾除干擾紋理,如圖15(b)所示,這樣才能有助于后續(xù)的提取特征識(shí)別車標(biāo),這也是本對(duì)比實(shí)驗(yàn)的目的所在。

    圖15 設(shè)置不同的檢測(cè)閾值時(shí)邊緣檢測(cè)的效果差異Fig.15 Differences of edge detection effect when setting different detection thresholds

    (2)不同Canny算子的檢測(cè)閾值選取對(duì)多種車標(biāo)邊緣檢測(cè)效果的影響對(duì)比實(shí)驗(yàn)

    ①Canny算子的檢測(cè)閾值為0.3時(shí),經(jīng)過車標(biāo)邊緣檢測(cè)后,利用HOG提取車標(biāo)特征再進(jìn)行歐幾里德距離判別后,華晨汽車被誤判為寶馬,實(shí)驗(yàn)結(jié)果如圖16所示。

    圖16 華晨汽車被誤判為寶馬的結(jié)果圖Fig.16 Figure of result that BrillianceAuto was mistaken for BMW

    ②Canny算子的檢測(cè)閾值為0.15時(shí),經(jīng)過車標(biāo)邊緣檢測(cè)后,利用HOG提取車標(biāo)特征再進(jìn)行歐幾里德距離判別后,華晨汽車被正確識(shí)別,實(shí)驗(yàn)結(jié)果如圖17所示。

    圖17 華晨汽車正確識(shí)別的結(jié)果圖Fig.17 Result chart of correct recognition for BrillianceAuto

    ③華晨汽車被誤判為寶馬的原因分析

    之所以會(huì)出現(xiàn)誤判的情況,通過對(duì)比寶馬與華晨汽車兩種車標(biāo)經(jīng)過Canny算子進(jìn)行邊緣檢測(cè)后的結(jié)果可以發(fā)現(xiàn),二者的邊緣特征都是一個(gè)近似圓形的主要輪廓,且這個(gè)圓形輪廓均被近似均分為四個(gè)扇形,二者的邊緣特征非常相近,只有降低檢測(cè)閾值而保留更多的邊緣信息之后才能更好地區(qū)分二者,如圖18(b)、18(c)、19(b)、19(c)所示。但檢測(cè)閾值不能無下限地降低,因?yàn)閷?duì)邊緣細(xì)節(jié)的過分追求反而會(huì)導(dǎo)致無用的干擾與紋理特征被保留,這又會(huì)增加其他車標(biāo)的誤判率。

    圖18 華晨車標(biāo)邊緣檢測(cè)效果圖Fig.18 Edge detection effect diagram of BrillianceAuto

    圖19 寶馬車標(biāo)邊緣檢測(cè)效果圖Fig.19 Edge detection effect diagram of BMW

    3.4 車標(biāo)識(shí)別的實(shí)驗(yàn)結(jié)果

    本節(jié)的車標(biāo)識(shí)別實(shí)驗(yàn)分成兩個(gè)部分。第一個(gè)實(shí)驗(yàn)是為了探究傳統(tǒng)圖像處理中典型的特征提取方法和邊緣檢測(cè)算法相結(jié)合與僅利用本文所重點(diǎn)研究的二維Gabor濾波進(jìn)行特征提取識(shí)別車標(biāo)在正確率指標(biāo)上的優(yōu)劣。第二個(gè)實(shí)驗(yàn)是在第一個(gè)實(shí)驗(yàn)的基礎(chǔ)上,選擇已經(jīng)測(cè)試過的傳統(tǒng)實(shí)驗(yàn)方案中的最優(yōu)組合,與本文重點(diǎn)研究的基于擴(kuò)展高斯差分XDoG邊緣檢測(cè)與二維Gabor濾波提取特征結(jié)合的車標(biāo)識(shí)別方案進(jìn)行對(duì)比,以證明本文提出的車標(biāo)識(shí)別方案相較于傳統(tǒng)的圖像處理有更優(yōu)的識(shí)別效果,其甚至可以與利用智能化算法YOLOv5s網(wǎng)絡(luò)一步到位識(shí)別車標(biāo)的正確率幾乎接近。

    3.4.1 基于傳統(tǒng)圖像處理的車標(biāo)識(shí)別

    本小節(jié)的實(shí)驗(yàn)是為了探究傳統(tǒng)圖像處理中典型的特征提取方法(例如方向梯度直方圖HOG、灰度特征Gray、灰度共生矩陣GLCM等)與當(dāng)前邊緣檢測(cè)標(biāo)準(zhǔn)算法Canny算子相結(jié)合時(shí)的車標(biāo)識(shí)別效果。由于本小節(jié)的實(shí)驗(yàn)?zāi)康膬H是為了預(yù)先性地探究不同傳統(tǒng)方法結(jié)合時(shí)對(duì)車標(biāo)識(shí)別正確率的影響,然后基于此預(yù)實(shí)驗(yàn)的結(jié)果選擇傳統(tǒng)實(shí)驗(yàn)方案中的最優(yōu)組合作為傳統(tǒng)算法的代表,進(jìn)而與本文所提出的YOLOv5網(wǎng)絡(luò)車標(biāo)定位多特征融合方案的車標(biāo)識(shí)別效果進(jìn)行對(duì)比,故為了快速地找出傳統(tǒng)的基本圖像處理方法的最優(yōu)組合,此時(shí)測(cè)試的數(shù)據(jù)集由900張(45類車標(biāo),每類20張)減少為315張(45類車標(biāo),每類7張),以便快速得到最優(yōu)組合的參數(shù)。傳統(tǒng)圖像處理識(shí)別車標(biāo)正確率如表2所示。

    表2 基于傳統(tǒng)圖像處理的車標(biāo)識(shí)別正確率統(tǒng)計(jì)表Table 2 Statistical table of vehicle logo recognition accuracy based on traditional image processing

    基于傳統(tǒng)圖像處理的車標(biāo)識(shí)別實(shí)驗(yàn)結(jié)果分析如下所示:

    (1)單獨(dú)利用HOG提取特征與采用“HOG+Gray+GLCM”三種特征融合的兩種方法進(jìn)行車標(biāo)識(shí)別的正確率一致,均為93.65%。雖然特征種類由原來的一種增加到了三種,但是識(shí)別正確率并沒有任何變化,導(dǎo)致這種情況的原因是HOG特征是1×108 900的行向量,Gray特征和GLCM特征加起來為1×85的行向量,在求解L2范數(shù)用以度量歐幾里德距離時(shí),Gray特征和GLCM特征起到的作用相比于HOG特征而言極小,作出的貢獻(xiàn)可以忽略不計(jì)。

    (2)利用Canny算子進(jìn)行車標(biāo)圖像邊緣檢測(cè)后,識(shí)別正確率最高可達(dá)96.19%,相比于僅利用HOG提取特征而無邊緣檢測(cè)的效果有明顯提升。說明經(jīng)過Canny算子進(jìn)行車標(biāo)圖像邊緣檢測(cè)后,再利用HOG提取特征可以提高車標(biāo)識(shí)別正確率。

    (3)通過“HOG+Canny”這一組對(duì)比實(shí)驗(yàn)可以看出,若Canny算子的檢測(cè)閾值過小,則包含無用的干擾紋理在內(nèi)的特征均被保留下來容易造成誤判。若檢測(cè)閾值過大,容易漏掉重要邊緣特征而造成誤判。只有在選擇合適的檢測(cè)閾值時(shí)才能既保留重要的邊緣信息,又能有效濾除干擾紋理,實(shí)現(xiàn)對(duì)傳統(tǒng)HOG方法識(shí)別車標(biāo)正確率的提升。

    (4)以檢測(cè)GMC-吉姆西車標(biāo)為例,雖然Canny算子結(jié)合傳統(tǒng)HOG特征進(jìn)行車標(biāo)識(shí)別可以提高識(shí)別正確率,但通過待測(cè)車標(biāo)與標(biāo)準(zhǔn)車標(biāo)模板的歐幾里德距離對(duì)比柱狀圖發(fā)現(xiàn),目標(biāo)車標(biāo)與其他剩余44類車標(biāo)的歐幾里德距離差別不如二維Gabor濾波顯著,如圖20(a)、(b)所示,仍然存在誤判的風(fēng)險(xiǎn),為了穩(wěn)定起見,實(shí)驗(yàn)結(jié)果建議使用二維Gabor濾波作為車標(biāo)特征提取方法。

    圖20 歐幾里德距離對(duì)比柱狀圖Fig.20 Comparison histogram of Euclidean distance

    3.4.2 基于XDoG與二維Gabor濾波的車標(biāo)識(shí)別

    如表3所示為基于擴(kuò)展高斯差分邊緣檢測(cè)與二維Gabor濾波提取特征的車標(biāo)識(shí)別正確率統(tǒng)計(jì)表。通過分析表中的各行數(shù)據(jù),可以得出如下結(jié)果:

    表3 本文識(shí)別方案的車標(biāo)識(shí)別正確率統(tǒng)計(jì)表Table 3 Statistical table of vehicle logo recognition accuracy based on recognition scheme of this paper

    (1)對(duì)比統(tǒng)計(jì)表的第1、2、3行可知,未使用任何邊緣檢測(cè)手段的二維Gabor濾波提取特征的識(shí)別正確率,優(yōu)于使用Canny算子、XDoG分別進(jìn)行邊緣檢測(cè)后利用HOG提取特征的識(shí)別正確率。由此證明了二維Gabor濾波具有很好的特征提取效果。

    (2)由統(tǒng)計(jì)表的第1行與第2行、第3行與第4行分別做對(duì)比,由這兩組對(duì)比可知,與不進(jìn)行車標(biāo)圖像邊緣檢測(cè)相比,通過邊緣檢測(cè)后再提取特征的車標(biāo)識(shí)別正確率更高。由此證明了邊緣檢測(cè)的必要性。

    (3)對(duì)比統(tǒng)計(jì)表的第2、4兩行,可證明擴(kuò)展高斯差分XDoG比Canny算子進(jìn)行車標(biāo)圖像邊緣檢測(cè)的效果更好。

    (4)對(duì)比統(tǒng)計(jì)表的第3行至第7行可知,使用擴(kuò)展高斯差分XDoG且合理調(diào)整參數(shù)后得到的最佳識(shí)別正確率,相較于未使用XDoG進(jìn)行車標(biāo)圖像邊緣檢測(cè)而言,車標(biāo)錯(cuò)誤識(shí)別張數(shù)減少為原來的一半,調(diào)參之后的最佳識(shí)別正確率可達(dá)97.56%。由此證明擴(kuò)展高斯差分XDoG與二維Gabor濾波的結(jié)合提升了車標(biāo)識(shí)別正確率。

    3.5 車標(biāo)定位與識(shí)別整體實(shí)驗(yàn)結(jié)果與分析

    3.5.1 基于傳統(tǒng)圖像處理的車標(biāo)識(shí)別

    由于車標(biāo)圖像識(shí)別是建立在車標(biāo)定位的基礎(chǔ)之上進(jìn)行的,所以車標(biāo)識(shí)別全過程的整體正確率應(yīng)該為基于YOLOv5s網(wǎng)絡(luò)進(jìn)行車標(biāo)定位的正確率與基于擴(kuò)展高斯差分XDoG檢測(cè)邊緣與二維Gabor濾波提取特征進(jìn)行車標(biāo)識(shí)別的正確率的乘積,整體實(shí)驗(yàn)正確率如表4所示。為了更好地證明所提出的“YOLOv5s網(wǎng)絡(luò)定位車標(biāo)+擴(kuò)展高斯差分XDoG檢測(cè)邊緣+二維Gabor濾波提取特征”的YOLOv5網(wǎng)絡(luò)車標(biāo)定位多特征融合識(shí)別方案的性能,本文還利用YOLOv5s網(wǎng)絡(luò)一步到位直接完成車標(biāo)定位與識(shí)別與之對(duì)比。為了保證實(shí)驗(yàn)數(shù)據(jù)的有效性和可對(duì)比性,在利用YOLOv5s網(wǎng)絡(luò)一步到位識(shí)別車標(biāo)時(shí),仍然采用在擴(kuò)展高斯差分XDoG檢測(cè)邊緣與二維Gabor濾波提取特征識(shí)別車標(biāo)實(shí)驗(yàn)中的900張測(cè)試圖片集。但與XDoG邊緣檢測(cè)、二維Gabor濾波實(shí)驗(yàn)中的900張測(cè)試數(shù)據(jù)集不同的是,用于YOLOv5s網(wǎng)絡(luò)一步到位識(shí)別車標(biāo)的數(shù)據(jù)集是前者在單獨(dú)提取車標(biāo)區(qū)域前的原始汽車圖片。

    表4 本文定位與識(shí)別方案的整體正確率統(tǒng)計(jì)表Table 4 Overall accuracy statistical table of positioning and recognition scheme of this paper

    實(shí)驗(yàn)結(jié)果表明,本文所提出的車標(biāo)圖像識(shí)別方案在調(diào)參之后能達(dá)到的最佳車標(biāo)定位與識(shí)別整體正確率為96.91%,與利用YOLOv5s網(wǎng)絡(luò)直接一步到位完成車標(biāo)定位與識(shí)別的整體正確率97.11%非常接近,且相較于傳統(tǒng)圖像處理識(shí)別車標(biāo)的正確率有明顯提升。

    3.5.2 YOLOv5s一步識(shí)別與本文方案的結(jié)果對(duì)比

    與利用YOLOv5s網(wǎng)絡(luò)直接一步到位完成車標(biāo)定位與識(shí)別的方案(記為方案I)相比,本文所提出的車標(biāo)圖像識(shí)別方案(記為方案II)在整體識(shí)別正確率上與之非常接近,為了更全面精準(zhǔn)地分析兩種方案的效果差異,本小節(jié)專門對(duì)兩種方案中未被正確識(shí)別的車標(biāo)單獨(dú)進(jìn)行了對(duì)比研究。圖21至圖23展示了兩種方案各自存在的錯(cuò)誤發(fā)生情況。通過對(duì)比實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),在方案II車標(biāo)定位階段均成功的情況下,同一車標(biāo)圖片用兩種方案進(jìn)行識(shí)別的結(jié)果不同:有的車標(biāo)圖片通過方案I可以正確識(shí)別但是在方案II中識(shí)別錯(cuò)誤(圖21),有的車標(biāo)圖片通過方案II可以正確識(shí)別但是在方案I中識(shí)別錯(cuò)誤(圖22),還有一種情況是兩種方案在識(shí)別同一車標(biāo)圖片時(shí)均產(chǎn)生錯(cuò)誤(圖23)。兩種方案在車標(biāo)整體識(shí)別正確率上相差不大,但二者發(fā)生錯(cuò)誤的原因卻不完全相同且值得深入分析。通過本小節(jié)對(duì)兩種方案的錯(cuò)誤對(duì)比,可以發(fā)現(xiàn)兩種方案各有所長(zhǎng)。在后續(xù)的相關(guān)研究中可以融合兩種方案的優(yōu)點(diǎn),利用本文提出方案的技術(shù)要點(diǎn)改進(jìn)YOLOv5s網(wǎng)絡(luò)以提升車標(biāo)識(shí)別正確率,或者利用YOLOv5s網(wǎng)絡(luò)的構(gòu)建思想對(duì)傳統(tǒng)圖像處理以及本文提出的方案進(jìn)行優(yōu)化,同時(shí)分析兩種方案各自的缺點(diǎn)來規(guī)避技術(shù)缺陷,以便在兩種方案的基礎(chǔ)上提出更優(yōu)的車標(biāo)圖像識(shí)別方案。

    圖21 車標(biāo)定位成功(方案Ⅰ識(shí)別正確,方案Ⅱ識(shí)別錯(cuò)誤)Fig.21 Vehicle logo located correctly(scheme I recognition is correct,and scheme II recognition is wrong)

    圖22 車標(biāo)定位成功(方案Ⅰ識(shí)別錯(cuò)誤,方案Ⅱ識(shí)別成功)Fig.22 Vehicle logo located correctly(scheme I recognition is wrong,and scheme II recognition is correct)

    圖23 車標(biāo)定位成功(方案Ⅰ與方案Ⅱ均識(shí)別錯(cuò)誤)Fig.23 Vehicle logo located correctly(scheme I and scheme II recognition are both wrong)

    3.6 基于隨機(jī)森林的車標(biāo)特征分類結(jié)果

    將通過二維Gabor濾波得到的車標(biāo)特征通過隨機(jī)森林算法進(jìn)行分類預(yù)測(cè),2D-Gabor特征數(shù)據(jù)集來源于“基于擴(kuò)展高斯差分XDoG邊緣檢測(cè)與二維Gabor濾波提取特征的車標(biāo)識(shí)別”的數(shù)據(jù)集(包含5 400張車標(biāo)圖片,45類車標(biāo),每類車標(biāo)120張)經(jīng)過二維Gabor濾波處理之后形成的5 400個(gè)1×1 440維的行向量。

    如圖24所示為車標(biāo)數(shù)據(jù)集-訓(xùn)練集的預(yù)測(cè)結(jié)果,即包含45類車標(biāo),每類車標(biāo)100張圖片,經(jīng)過二維Gabor濾波處理后得到4 500個(gè)1×1 440維的行向量。訓(xùn)練集的車標(biāo)特征分類正確率為100%。為了更加清晰地展示實(shí)際車標(biāo)訓(xùn)練集分類與預(yù)測(cè)車標(biāo)訓(xùn)練集分類的結(jié)果,圖25將訓(xùn)練及預(yù)測(cè)結(jié)果進(jìn)行了局部放大以展示圖像細(xì)節(jié)。結(jié)果圖表明,預(yù)測(cè)車標(biāo)訓(xùn)練集分類與實(shí)際車標(biāo)訓(xùn)練集分類數(shù)據(jù)點(diǎn)重合,結(jié)果完全一致。如圖26所示為訓(xùn)練集混淆矩陣,展示了隨機(jī)森林模型在45類車標(biāo)上的預(yù)測(cè)分類的準(zhǔn)確性。

    圖24 訓(xùn)練集預(yù)測(cè)結(jié)果Fig.24 Training set prediction results

    圖25 訓(xùn)練集預(yù)測(cè)結(jié)果(放大圖)Fig.25 Training set prediction results(enlarged)

    圖26 訓(xùn)練集混淆矩陣Fig.26 Training set confusion matrix

    如圖27所示為車標(biāo)數(shù)據(jù)集-測(cè)試集的預(yù)測(cè)結(jié)果,即包含45類車標(biāo),每類車標(biāo)20張圖片,經(jīng)過二維Gabor濾波處理后得到900個(gè)1×1 440維的行向量。圖28將測(cè)試及預(yù)測(cè)結(jié)果進(jìn)行了局部放大以展示圖像細(xì)節(jié)。結(jié)果圖表明,預(yù)測(cè)車標(biāo)測(cè)試集分類與實(shí)際車標(biāo)測(cè)試集分類數(shù)據(jù)點(diǎn)重合,結(jié)果完全一致。如圖29所示為測(cè)試集混淆矩陣,展示了隨機(jī)森林模型在45類車標(biāo)上的預(yù)測(cè)分類的準(zhǔn)確性。測(cè)試集的車標(biāo)特征分類正確率為100%,即車標(biāo)識(shí)別階段的最終正確率為100%,由于利用YOLOv5s網(wǎng)絡(luò)進(jìn)行車標(biāo)定位的正確率為99.33%,最終通過計(jì)算可得車標(biāo)定位與識(shí)別整體正確率為99.33%,相較于進(jìn)行歐氏距離判別并取其最小者所對(duì)應(yīng)的種類標(biāo)簽索引的方法正確率更高,以此體現(xiàn)了隨機(jī)森林算法對(duì)于高維特征的輸入樣本在無需降維處理的情況下可達(dá)到高準(zhǔn)確率的優(yōu)勢(shì)。車標(biāo)識(shí)別正確率如表5所示。

    圖27 測(cè)試集預(yù)測(cè)結(jié)果Fig.27 Testing set prediction results

    圖28 測(cè)試集預(yù)測(cè)結(jié)果(放大圖)Fig.28 Testing set prediction results(enlarged)

    圖29 測(cè)試集混淆矩陣Fig.29 Testing set confusion matrix

    表5 識(shí)別正確率對(duì)比統(tǒng)計(jì)表Table 5 Comparison statistics of recognition accuracy單位:%

    4 結(jié)束語

    本文針對(duì)智能交通系統(tǒng)中車標(biāo)圖像識(shí)別的重要研究課題,建立了YOLOv5s車標(biāo)定位網(wǎng)絡(luò),分析了圖像邊緣檢測(cè)標(biāo)準(zhǔn)算法Canny與擴(kuò)展高斯差分XDoG進(jìn)行車標(biāo)圖像邊緣檢測(cè)的差異,設(shè)計(jì)了用于提取車標(biāo)圖像特征的二維Gabor濾波器,提出了一種YOLOv5網(wǎng)絡(luò)車標(biāo)定位多特征融合的車標(biāo)圖像識(shí)別方案,實(shí)現(xiàn)了對(duì)45類常見車標(biāo)圖像的準(zhǔn)確識(shí)別,最佳識(shí)別正確率可達(dá)99.33%。本文所提出的車標(biāo)圖像識(shí)別方案,在合理調(diào)整實(shí)驗(yàn)參數(shù)之后能達(dá)到的最佳車標(biāo)定位與識(shí)別整體正確率超過了利用YOLOv5s網(wǎng)絡(luò)直接一步到位完成車標(biāo)定位與識(shí)別的方案,且相較于傳統(tǒng)圖像處理識(shí)別車標(biāo)的正確率有明顯提升。本文仍有許多問題需要進(jìn)一步研究與完善:

    (1)需要進(jìn)一步通過更多的圖像處理手段與計(jì)算機(jī)視覺技術(shù)對(duì)車標(biāo)誤識(shí)別情況進(jìn)行更加全面的分析。本文僅對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行了對(duì)比展示與分析,后續(xù)需增加進(jìn)一步的實(shí)驗(yàn)深入探究導(dǎo)致車標(biāo)誤識(shí)別的具體原因,以此來反饋調(diào)整已有設(shè)計(jì)方案中的實(shí)驗(yàn)方案、實(shí)驗(yàn)步驟及相關(guān)參數(shù)設(shè)置等。

    (2)需要在后續(xù)的相關(guān)研究中融合“YOLOv5s網(wǎng)絡(luò)直接一步到位完成車標(biāo)定位與識(shí)別”與本文方案二者之所長(zhǎng),可以利用本文所提出方案的技術(shù)要點(diǎn)改進(jìn)YOLOv5s網(wǎng)絡(luò)以提升車標(biāo)識(shí)別正確率,或者利用YOLOv5s網(wǎng)絡(luò)的構(gòu)建思想對(duì)傳統(tǒng)圖像處理以及本文提出的方案進(jìn)行優(yōu)化,同時(shí)分析兩種方案各自的缺點(diǎn)來規(guī)避技術(shù)缺陷,以便在兩種方案的基礎(chǔ)上綜合性地提出更優(yōu)的智能交通系統(tǒng)車標(biāo)圖像識(shí)別方案。

    猜你喜歡
    車標(biāo)高斯正確率
    小高斯的大發(fā)現(xiàn)
    勞斯萊斯“歡慶女神”車標(biāo)換代升級(jí)
    世界汽車(2022年3期)2022-05-23 13:42:30
    門診分診服務(wù)態(tài)度與正確率對(duì)護(hù)患關(guān)系的影響
    天才數(shù)學(xué)家——高斯
    基于Edge Boxes的大型車輛車標(biāo)檢測(cè)與識(shí)別
    瘋狂的車標(biāo)
    家庭百事通(2017年8期)2017-08-12 00:17:32
    生意
    品管圈活動(dòng)在提高介入手術(shù)安全核查正確率中的應(yīng)用
    生意
    有限域上高斯正規(guī)基的一個(gè)注記
    漯河市| 平凉市| 台江县| 拉孜县| 乐平市| 高淳县| 元阳县| 吴堡县| 桓台县| 吴旗县| 长宁区| 金昌市| 高清| 涟源市| 称多县| 响水县| 宜都市| 江孜县| 山东省| 遂溪县| 永平县| 乌兰察布市| 怀集县| 米易县| 隆子县| 肥西县| 常德市| 会同县| 新丰县| 宜宾县| 云浮市| 绥德县| 库伦旗| 肥乡县| 会宁县| 潼南县| 深圳市| 通山县| 金山区| 麦盖提县| 商南县|