徐毓凱 楊國平
(上海工程技術(shù)大學(xué)機械與汽車工程學(xué)院 上海 201620)
字符是人們進行信息記錄或標(biāo)記的主要方法之一,在汽車零件的生產(chǎn)過程中,為了對生產(chǎn)的零件進行分類或者信息記錄,字符在汽車工業(yè)產(chǎn)品中獲得了廣泛的應(yīng)用。為提升汽車工業(yè)產(chǎn)品生產(chǎn)制造或檢驗檢測過程中字符識別的效率及準(zhǔn)確率,有必要對實現(xiàn)字符的視覺識別進行研究。
雖然目前字符識別技術(shù)已有較為成熟的發(fā)展和應(yīng)用,如文本識別[1~3]、車牌識別等[4~5]。但工業(yè)零件字符識別有所不同,其字符顏色一般與背景色相近,兩者對比度非常低;而且字符有的存在于金屬產(chǎn)品上,因金屬表面氧化造成的銹蝕可能進一步降低字符與背景的對比度[6]。因此大部分的汽車零件在工業(yè)流水線進行分類或者篩選時還不能運用現(xiàn)有字符識別技術(shù)實現(xiàn)對其進行直接識別,這大大降低了工作效率,降低了企業(yè)的工業(yè)自動化水平。因此本文針對這一問題提出了基于光度立體法的汽車零件字符識別預(yù)處理方法。從四個不同方向?qū)ξ矬w進行照明并收集圖片,利用四張采集的圖片計算物體三維表面的局部梯度[7],然后對圖片進行形態(tài)學(xué)處理[8],最終得到對比度高的灰度圖片,為后面的字符識別過程提供高質(zhì)量的待檢測圖片。本方法可以對汽車零件字符工業(yè)自動化識別提供參考。
光度立體法是計算機視覺中的一種技術(shù),用于通過在不同光照條件下觀察物體來估計物體的表面法線。這是基于這樣一個事實,即表面反射的光量取決于表面相對于光源和觀察者的方向。給定來自不同角度的足夠光源,測量反射到相機中的光量,表面取向可以被約束到單個取向或甚至過度約束。
該技術(shù)最初由 Woodham 于 1980 年引入[9]。并于1989 年由B. K. P. Horn 分析單個圖像的陰影形狀的特殊情況[10]。從那以后,光度立體法已被廣泛應(yīng)用于許多其他情況,包括擴展光源和非朗伯表面處理[11]。目前的研究旨在使該方法在投影陰影,高光和非均勻照明的情況下工作。
光度立體法分析在不同光照條件下的物體的多個圖像以估計每個像素處的法線方向,如圖1。
圖1 光度立體法示例
根據(jù)Woodham 的朗伯反射率,已知點狀遠(yuǎn)距離光源和均勻反照率,可得到反射線性方程(1):
式中:I為圖像光強度;k為待測對象的表面反射率;L為光源的單位方向向量;N為待測對象的表面某點的單位法向量。
由L和N為單位向量,可得:
然后得到待測對象的表面梯度,即在x、y 方向的高度梯度p 和q。
光度立體法需要至少三個具有不同照明方向的圖像。然而,物體的三維幾何形狀通常導(dǎo)致陰影投射。在陰影區(qū)域中,有效可用的照明方向的數(shù)量減少,會導(dǎo)致模糊。然而,為了獲得更精確的結(jié)果,需要更多照明方向。因此,通常應(yīng)使用三個以上具有不同方向的光源。但是越多的照明方向也導(dǎo)致要處理的圖像數(shù)量越多,因此處理時間越長。在大多數(shù)應(yīng)用中,四到六個光源是合理的。根據(jù)經(jīng)驗,傾斜角度應(yīng)選擇在30°和60°之間,均勻地分布在待測物體周圍。本文針對工業(yè)流水線的特點,采用四光源光度立體法[12~13],四個光源下圖像某像素點的光亮度如下:
將式(5)轉(zhuǎn)化為矩陣形式:
式(6)為超定線性方程組,可由最小二乘法求解得到表面某點的單位法向量N和表面反射率K:
將圖像中的每個像素點進行式(5~8)的計算可得到待測物體圖像的表面梯度圖和反射率圖。
通過前面的光度立體算法可以得到表面梯度圖和反射率圖,但圖像的對比度不夠高,并且具有很多噪聲干擾,因此本文進一步對表面梯度進行處理,對每一個像素點計算,得到表面旋度、散度、平均曲率和高斯曲率[14~16]。
待測物體表面的表面梯度f(r,c)可由下式求得:
式中:r 為圖像中的行坐標(biāo);c 為圖像中的列坐標(biāo);u(r,c)為圖像點 (r,c)處的行梯度分量;ν(r,c)為圖像點(r,c)處的列梯度分量。
本次實驗選取了海康MV-CE013-50GM/C 型號相機,選用130萬像素,靶面面積為1/1.4,分辨率為1280*960。光源選取了發(fā)光面為100mm 紅色四面可調(diào)條形光。光源控制器選取了四通道數(shù)字控制器。
本次實驗分別對汽車變速器外殼和汽車輪胎上的字符進行了基于光度立體法的字符識別預(yù)處理。實驗前先標(biāo)定光源的位置,即獲得光源與相機光軸的夾角slant 見圖2(a)、投影到待測對象平面的光線與水平軸的夾角Tilt見圖2(b)。
圖2 系統(tǒng)示意圖
光源的位置分別放置于圖2(b)的 0°、90°、180°、270°處。確定光源位置后,將四面可調(diào)光源任意一個光源打開(其他三個光源為關(guān)閉狀態(tài)),以字符被拍攝地方為中心圓點,記錄下如圖2(b)從光源位置點到最右側(cè)0°的角度,然后如圖2(a)所示記錄下光源照射到被測物體的表面反射到相機之間的角度,兩個角度作為一組。同理,按照此方法分別打開四個不同的方位光源依次進行拍照記錄角度,拍完四張圖后,再進行統(tǒng)一處理。
圖3 四個光照方向下變速器外殼成像圖
對四個光照方向下變速器外殼成像圖的像素點依次用式(5)~(8)計算得到圖4(a)的表面梯度圖和圖4(b)的反射率圖。
圖4 變速器外殼圖像處理圖
由圖4 可以明顯看出表面梯度圖和反射率圖已經(jīng)比原圖的對比度有了很大的提升,但是在工業(yè)流水線上識別零件字符不僅要求精度高,而且時間也應(yīng)該越短越好。因此本文根據(jù)式(9)~(13)對圖4計算得到圖5經(jīng)形態(tài)學(xué)處理后的旋度、散度、曲率圖像。
圖5 變速器外殼處理后的表面圖
由圖5 可以看出處理后的表面旋度圖字符與背景對比度明顯提升了很多,為后面的字符識別提供了高質(zhì)量的待檢測圖。
汽車零件的種類很多,表面材質(zhì)也有所不同,因此本文又對和變速器外殼材質(zhì)不同的輪胎進行實驗。實驗步驟和變速器外殼一樣,只需要調(diào)整相機鏡頭和待檢測字符的距離,重新聚焦即可。首先分別對圖2(b)的 0°、90°、180°、270°四個照明方向拍攝圖片見圖(6)。
圖6 四個光照方向下輪胎成像圖
對每張圖片的相同位置像素點依次用式(5~8)計算得到圖7的表面梯度圖。
由圖7 可以看出輪胎表面梯度圖并不能直接凸顯出輪胎上的字符部分,因此繼續(xù)對圖7 的像素點進行式(9~13)的計算,分別得到圖像表面旋度、表面散度、表面均值曲率和表面高斯曲率(見圖8)。
圖7 輪胎表面梯度圖
圖8 輪胎表面梯度處理后的圖
由圖8 可以看出,處理后的表面散度圖和表面均值曲率大幅提高了輪胎表面字符與背景的對比度,為后面的輪胎字符識別提供了高質(zhì)量的待檢測圖。
由于汽車零件上的字符顏色一般與背景色相近,兩者對比度非常低的特點,使得工業(yè)自動化流水線自動識別字符具有一定難度,本文針對這一情況提出了基于光度立體法的汽車零件字符識別方法,該方法的實驗器材結(jié)構(gòu)簡單,適用于流水線自動識別。實驗結(jié)果表明利用光度立體法對圖像進行處理可以有效降低噪聲,大幅提高待檢測字符與背景的對比度。但該方法依然具有一定缺陷與不足,光度立體法基于Woodham 的算法,它假設(shè)每個光源提供平行且均勻的光束。實驗必須使用具有均勻強度的遠(yuǎn)心照明光源,或者作為替代方案,使用遠(yuǎn)光點光源。另外,物體必須具有朗伯反射特性,即它必須以漫射方式反射入射光。具有鏡面反射特性的物體(即,鏡面或光澤表面)或區(qū)域不能被正確處理,因此導(dǎo)致錯誤的結(jié)果。本文方法雖然具有一些不足,但對于流水線檢測汽車零件字符具有一定的理論意義和實用價值。