韓 璇,顧寄南,黎良臣
(江蘇大學(xué)機(jī)械工程學(xué)院,江蘇 鎮(zhèn)江 212013)
在現(xiàn)代自動(dòng)化生產(chǎn)過(guò)程中,機(jī)器視覺(jué)系統(tǒng)廣泛地用于各種工況監(jiān)視、成品檢驗(yàn)和質(zhì)量控制等領(lǐng)域[1]。在汽車(chē)制造行業(yè),輪轂的視覺(jué)定位、識(shí)別與測(cè)量技術(shù)也應(yīng)用廣泛[2]。目前,人工識(shí)別的效率已經(jīng)無(wú)法滿(mǎn)足快速的自動(dòng)化生產(chǎn)需求,需要采用基于機(jī)器視覺(jué)的方法實(shí)現(xiàn)對(duì)輪轂的分類(lèi)。
基于機(jī)器視覺(jué)的輪轂分類(lèi)方法的研究國(guó)內(nèi)也進(jìn)行了很多,文獻(xiàn)[3]提取出輪轂的形狀特征并采用模板匹配的方法對(duì)輪轂進(jìn)行分類(lèi);文獻(xiàn)[4]研究了輪轂基于灰度信息的模板匹配分類(lèi)方法;文獻(xiàn)[5]對(duì)輪轂圖像進(jìn)行旋轉(zhuǎn)模板匹配,完成對(duì)輪轂的識(shí)別。但是,模板匹配方法受光照的穩(wěn)定性,均勻性以及圖像上輪轂與背景對(duì)比度的影響較大,不穩(wěn)定的光照條件會(huì)降低輪轂識(shí)別分類(lèi)的精度。此外,模板匹配法過(guò)度地依賴(lài)模板圖像的質(zhì)量。
為了降低上述因素對(duì)輪轂圖像識(shí)別分類(lèi)精度的影響,采用一種基于梯度方向直方圖特征(HOG)和支持向量機(jī)(SVM)的輪轂圖像分類(lèi)方法。首先對(duì)采集的樣本輪轂圖像進(jìn)行預(yù)處理,接著提取出正負(fù)樣本的HOG 特征,利用SVM 對(duì)樣本數(shù)據(jù)進(jìn)行訓(xùn)練得到相應(yīng)的分類(lèi)模型并輸入測(cè)試數(shù)據(jù)完成輪轂的識(shí)別實(shí)驗(yàn)。其算法大致流程圖,如圖1 所示。
圖1 算法流程圖Fig.1 Algorithm Flowchart
樣本圖片的來(lái)源是成型輪轂分揀系統(tǒng)中的原始圖像,輪轂的圖片由歐姆龍CCD 工業(yè)相機(jī)拍攝所得,光源為L(zhǎng)ED 環(huán)形光源,照明方式為前向照明,為了驗(yàn)證提出的方法是否可行,調(diào)節(jié)光源控制器使光源呈現(xiàn)弱光、正常光和強(qiáng)光三種狀態(tài),大量地拍攝不同光源狀態(tài)下的輪轂圖片,并將其轉(zhuǎn)化為灰度圖像,從中選擇合適的圖片用于正負(fù)樣本的制作。
HOG 特征采集的一個(gè)“細(xì)胞”的像素大小為16×16 的矩形區(qū)域,將像素的梯度方向?qū)?60°均勻劃分成9 個(gè)直方圖通道,“細(xì)胞”內(nèi)的每個(gè)像素對(duì)其梯度方向所在的直方圖通道進(jìn)行加權(quán)投票[6],權(quán)值采用梯度幅值的高斯加權(quán)計(jì)算方法得來(lái)。
對(duì)梯度強(qiáng)度進(jìn)行歸一化能夠進(jìn)一步對(duì)光照和邊緣進(jìn)行壓縮,歸一化處理能夠有效地克服圖像局部光照變化與背景對(duì)比度變化的影響[6]。歸一化塊由四個(gè)“細(xì)胞”組成,塊與塊之間互相重疊。采用歸一化的方法可以有效減弱圖像局部變化的影響。采用的歸一化函數(shù)為L(zhǎng)2-norm,其計(jì)算式為:
訓(xùn)練樣本的像素為64×64,歸一化塊的個(gè)數(shù)為9,每個(gè)“細(xì)胞”代表著維數(shù)為9 的特征向量,則一個(gè)樣本提取到的HOG 特征向量維數(shù)為9×4×9=324 個(gè),該向量描述了整張圖片的信息,提取出所有正負(fù)樣本的HOG 特征后,將它們制作成數(shù)據(jù)文件,放入支持向量機(jī)中訓(xùn)練,如圖2 所示。
圖2 塊與細(xì)胞結(jié)構(gòu)圖解Fig.2 Structure Diagram of Block and Cell
利用MATLAB R2016a 和Libsvm-3.23 工具箱對(duì)不同光照條件下的輪轂進(jìn)行識(shí)別實(shí)驗(yàn),計(jì)算機(jī)為Win7 系統(tǒng),配置i5 處理器,主頻2.60GHz,內(nèi)存為4G。
實(shí)驗(yàn)選取了兩種不同型號(hào)的輪轂A 和輪轂B 在三種不同光照條件下(弱光、正常光和強(qiáng)光)拍攝得到的圖片作為樣本。將圖片中的輪轂A 提取出來(lái)作為實(shí)驗(yàn)的正樣本,將剩余輪轂B 的圖片作為負(fù)樣本。根據(jù)正負(fù)樣本HOG 特征提取的計(jì)算方法,將預(yù)處理后的樣本圖片輸入用MATLAB 編好用于提取HOG 特征的程序中,完成正負(fù)樣本HOG 特征的提取,最后將所有樣本的HOG特征值制作成用于訓(xùn)練的數(shù)據(jù)格式?,F(xiàn)將部分正負(fù)樣本以及提取出其中一對(duì)正負(fù)樣本的HOG 特征給出,如圖3~圖5 所示。
圖3 部分正負(fù)樣本Fig.3 Positive and Negative Samples
圖4 正樣本的HOG特征值Fig.4 HOG Eigenvalue of Positive Sample
圖5 負(fù)樣本的HOG 特征值Fig.5 HOG Eigenvalue of Negative Sample
在識(shí)別工具的選用上,采用的是支持向量機(jī)(Support Vector Machine,SVM)。其主要思想是將樣本從原特征空間通過(guò)變換轉(zhuǎn)換到高維特征空間,在高維特征空間中選取最優(yōu)超平面進(jìn)行分類(lèi)。本實(shí)驗(yàn)的樣本數(shù)據(jù)非線性可分,需要引入核函數(shù)K(x,xj)和ξi將輸入空間的非線性可分樣本數(shù)據(jù)通過(guò)函數(shù)映射到高維特征空間中,然后在高維特征空間中構(gòu)造線性判別函數(shù)來(lái)代替原空間的非線性判別函數(shù)[6],最優(yōu)分類(lèi)函數(shù)為:
本實(shí)驗(yàn)的支持向量機(jī)有兩個(gè)參數(shù)需要選擇:懲罰參數(shù)C 和徑向基函數(shù)的參數(shù)σ。
實(shí)驗(yàn)主要使用交叉驗(yàn)證和網(wǎng)格搜索法對(duì)兩個(gè)參數(shù)進(jìn)行優(yōu)選,使用的支持向量機(jī)庫(kù)為L(zhǎng)ibsvm-3.23 工具箱,得到的參數(shù),如圖6 所示。可知最優(yōu)參數(shù)C=32,σ=1,交叉驗(yàn)證精度為88.89%。
圖6 交叉驗(yàn)證結(jié)果圖Fig.6 Result Chart of Cross-Validation
訓(xùn)練好的分類(lèi)模型參數(shù),如表1 所示。
表1 訓(xùn)練模型的參數(shù)Tab.1 Parameters of Training Model
為了驗(yàn)證所提方法的有效性,將這里的方法與基于灰度信息的模板匹配方法進(jìn)行對(duì)比試驗(yàn)。分別選取弱光、正常光、強(qiáng)光和三種光照條件下混合的輪轂圖片各150 張作為待識(shí)別樣本。實(shí)驗(yàn)分為兩個(gè)步驟:第一步,分別選取正常光照下的兩類(lèi)輪轂圖片各一張作為模板,將待識(shí)別的輪轂圖片與模板圖片進(jìn)行匹配識(shí)別;第二步,用支持向量機(jī)訓(xùn)練得出的模型對(duì)待識(shí)別的輪轂圖像進(jìn)行識(shí)別。兩種方法的識(shí)別準(zhǔn)確率,如表2 所示。由表中數(shù)據(jù)可知,基于灰度信息的模板匹配方法識(shí)別正常光照下的輪轂的準(zhǔn)確率最高,非正常光照下的輪轂識(shí)別率較低;基于HOG 特征的輪轂識(shí)別方法在不同的光照條件下都有著較高的識(shí)別準(zhǔn)確率。
表2 識(shí)別準(zhǔn)確率Tab.2 The Accuracy of Recognition
由上述可知,采用一種基于梯度方向直方圖特征和支持向量機(jī)的輪轂圖像分類(lèi)方法,其結(jié)論如下:(1)與傳統(tǒng)的基于灰度特征的模板匹配方法相比,HOG 特征對(duì)于光照的影響有很強(qiáng)的適應(yīng)能力。(2)正常光照下的輪轂識(shí)別準(zhǔn)確率與非正常光照下的識(shí)別準(zhǔn)確率基本一致,光照對(duì)總體的識(shí)別效果并無(wú)較大的影響。