歐陽世波 王磊 張清友
摘 要:隨著技術(shù)的進步,特別是機器視覺技術(shù)的迅猛發(fā)展,條碼的讀取與識別已經(jīng)不再依賴于傳統(tǒng)的條碼掃描器。機器視覺為條碼的快速、準(zhǔn)確和自動化讀取提供了新的技術(shù)路徑。然而,復(fù)雜的物流環(huán)境、不同的包裝材料以及各種環(huán)境因素(如光線、遮擋)會影響機器視覺系統(tǒng)的性能。文章對基于機器視覺的物流包裝條碼特征快速提取與識別方法展開深入研究,以期為實際物流場景中的條碼識別提供一種更為高效和準(zhǔn)確的技術(shù)手段。
關(guān)鍵詞:機器視覺;物流包裝條碼;條碼特征快速提取
中圖分類號:F259.27文獻標(biāo)志碼:ADOI:10.13714/j.cnki.1002-3100.2024.08.012
Abstract: With the advancement of technology, especially the rapid development of machine vision technology, the reading and recognition of barcodes no longer rely on traditional barcode scanners. Machine vision provides a new technological path for the fast, accurate, and automated reading of barcodes. However, complex logistics environments, different packaging materials, and various environmental factors (such as light and occlusion) can affect the performance of machine vision systems. This paper conducts in-depth research on the fast extraction and recognition methods of logistics packaging barcode features based on machine vision, hoping to provide a more efficient and accurate technical means for barcode recognition in practical logistics application scenarios.
Key words: machine vision; logistics packaging barcode; fast extraction of barcode features
0 ? ?引 ? ?言
條碼作為一種數(shù)字或代表特定信息的視覺形式,可通過一系列線條和空隙或其他圖形符號表示。這些代表信息的符號可以被專門的讀取設(shè)備掃描并解碼,從而實現(xiàn)自動數(shù)據(jù)捕獲,大大提高了數(shù)據(jù)錄入的速度和準(zhǔn)確性。隨著計算機技術(shù)和圖像處理技術(shù)的飛速發(fā)展,機器視覺逐漸在條碼識別領(lǐng)域嶄露頭角。不同于傳統(tǒng)的激光掃描技術(shù),機器視覺依賴攝像頭或其他圖像傳感器來捕獲物體的數(shù)字圖像,并使用軟件算法進行圖像分析和處理。利用機器視覺進行條碼識別在處理損壞、模糊或部分被遮擋的條碼時具有明顯優(yōu)勢。
從傳統(tǒng)的激光掃描到基于機器視覺的智能識別,條碼技術(shù)的演變反映了科技進步給現(xiàn)代社會帶來的巨大變革。然而,也出現(xiàn)了新的挑戰(zhàn)和問題,如何更好地利用機器視覺技術(shù)進行條碼識別、實現(xiàn)更高的識別速度和準(zhǔn)確性,將是該領(lǐng)域持續(xù)探索的方向。楊文科(2023)對條碼技術(shù)與RFID技術(shù)的特點及應(yīng)用方式展開闡述,并對物流行業(yè)中存在的問題進行闡述[1]。王永桐(2023)以自動識別技術(shù)作為研究對象,分析技術(shù)的分類及應(yīng)用特點,探究自動識別技術(shù)在物流管理中的應(yīng)用策略[2]。曾王平(2023)對物流倉儲管理系統(tǒng)與RF系統(tǒng)的數(shù)據(jù)交互、倉儲策略進行研究,探索了優(yōu)化業(yè)務(wù)流程、優(yōu)化揀選路徑、保障倉儲作業(yè)準(zhǔn)確高效的方法[3]。孫東 (2022) 指出:引入4尺度檢測、多尺度特征融合結(jié)構(gòu)、GIOU損失數(shù)的新的深度學(xué)習(xí)算法與傳統(tǒng)算法相比具有較大優(yōu)勢,同時在檢測速率上滿足實時性要求,有一定的實用性及有效性。[4]林雯(2014)針對物流過程中對物品包裝嚴(yán)密程度檢測的問題,提出使用計算機視覺檢測的方法,以求突破傳統(tǒng)檢測方法的限制,提高物品包裝檢測的精度和速度[5]。本文對基于機器視覺的物流包裝條碼特征快速提取與識別方法展開研究,期望為相關(guān)工作人員提供一定的理論支持和實踐指導(dǎo)。
1 ? ?機器視覺技術(shù)概述
1.1 ? ?機器視覺的基本原理
機器視覺技術(shù)正日益成為現(xiàn)代自動化系統(tǒng)中的核心組成部分,它的基本原理包括如何賦予機器“看”和“理解”環(huán)境的能力。機器視覺結(jié)合光學(xué)、電子、計算機科學(xué)、數(shù)學(xué)和生物學(xué)等多個領(lǐng)域的知識,意在將捕獲到的圖像數(shù)據(jù)轉(zhuǎn)化為有意義的描述或決策。在這個過程中,會涉及圖像捕捉設(shè)備的使用,如數(shù)字相機或其他傳感器,以獲得環(huán)境或目標(biāo)物體的二維圖像。這種圖像其實是由大量的像素組成的,其中每個像素都記錄了一個特定位置的亮度或顏色信息。為了從這些原始圖像中提取有用的信息,通常需要進行圖像預(yù)處理,如濾波、去噪和增強,以改進圖像的質(zhì)量。當(dāng)圖像預(yù)處理完成后,需要進行圖像分析,識別圖像中的關(guān)鍵特征。這些特征可以是明顯的邊緣、角點、紋理或其他明顯的圖像屬性。隨著特征的提取,圖像的進一步識別和解釋將成為可能。
1.2 ? ?機器視覺系統(tǒng)的主要組成部分
機器視覺系統(tǒng)作為一個綜合性的技術(shù)體系,在實現(xiàn)圖像數(shù)據(jù)的獲取和解析中需涵蓋多個核心組件。圖像捕獲設(shè)備,如數(shù)字相機、CCD(電荷耦合器件)或CMOS(互補金屬氧化物半導(dǎo)體)傳感器,為系統(tǒng)提供了視覺信息來源。它們能夠高效地捕捉到環(huán)境或目標(biāo)物體的二維圖像數(shù)據(jù)。照明系統(tǒng)同樣是關(guān)鍵組成部分之一。這是因為適當(dāng)?shù)墓饩€條件是獲取清晰、高質(zhì)量圖像的先決條件。通過調(diào)控光源的類型、位置和強度,照明系統(tǒng)能夠確保傳感器可以在最佳條件下工作。
圖像處理和分析軟件能夠?qū)⒃紙D像數(shù)據(jù)轉(zhuǎn)換為有用的信息。這涉及使用各種算法和技術(shù),如圖像增強、特征提取和模式匹配,識別圖像中的關(guān)鍵信息。為了進行準(zhǔn)確的圖像分析,通常需要使用高性能的計算平臺和存儲系統(tǒng)。這些硬件能夠支持機器視覺算法的實時運行,確保系統(tǒng)在各種應(yīng)用環(huán)境中都能進行快速、準(zhǔn)確的響應(yīng)。系統(tǒng)通常還包括一個接口或控制單元,以實現(xiàn)與其他設(shè)備或系統(tǒng)的通信。這使機器視覺系統(tǒng)能夠與自動化設(shè)備、機器人或其他信息系統(tǒng)協(xié)同工作,實現(xiàn)高度的自動化操作。主要組成部分如圖1所示。
2 ? ?基于機器視覺的條碼特征提取
2.1 ? ?圖像預(yù)處理技術(shù)
2.1.1 ? ?去噪與增強
去噪與增強是圖像預(yù)處理過程中的關(guān)鍵步驟,在物流包裝條碼特征提取環(huán)境下其作用尤為重要。機器視覺中處理的圖像常常受到多種噪聲源的影響,如傳感器噪聲、環(huán)境噪聲或傳輸過程中的干擾。這些噪聲不僅會降低圖像的質(zhì)量,更會導(dǎo)致后續(xù)的條碼識別過程出現(xiàn)誤差。
去噪的主要目的是減少或消除圖像中的這些噪聲。常用的去噪方法包括中值濾波、高斯濾波、雙邊濾波等。中值濾波通過將每個像素的值替換為其鄰域內(nèi)的中值來消除噪聲,尤其適用于處理椒鹽噪聲。高斯濾波則使用高斯函數(shù)對圖像進行平滑處理,主要用于消除高斯噪聲。雙邊濾波則結(jié)合空間濾波與灰度值相似性的考慮,能夠在去噪的同時保留圖像邊緣信息。
圖像增強旨在提高圖像的可視性和可分辨性,通過調(diào)整圖像的對比度、亮度或銳化來實現(xiàn)。直方圖均衡化是一種常用的增強方法,它能夠提高圖像的對比度,使圖像中的條碼更突出。銳化處理通過加強圖像中的邊緣信息進一步提高條碼的可識別性。
2.1.2 ? ?二值化與分割
二值化是將圖像轉(zhuǎn)化為僅包含兩種像素值(通常是0和1或黑與白)的過程。在條碼圖像處理中,由于條碼通常是由黑白條紋構(gòu)成的,所以二值化能夠明確地分離條碼與背景,使后續(xù)處理變得簡單而高效。常見的二值化方法有全局閾值法、局部閾值法和自適應(yīng)閾值法。全局閾值法是為整個圖像選擇一個統(tǒng)一的閾值。局部閾值法則是為圖像的不同區(qū)域選擇不同的閾值,更加靈活。自適應(yīng)閾值法則是根據(jù)圖像的內(nèi)容自動調(diào)整閾值,適用于光照不均勻的情況。
分割是在二值化后,將圖像中的目標(biāo)區(qū)域(如條碼)從背景中分離出來的過程。這一步驟確保了僅條碼部分被進一步分析,排除了其他可能的干擾元素。常用的圖像分割方法包括基于閾值的分割、基于邊緣的分割和基于區(qū)域的分割。在條碼處理中,由于條碼具有固定的幾何形狀和結(jié)構(gòu)特點,基于閾值和邊緣的分割方法往往更為有效。
2.2 ? ?特征提取方法
2.2.1 ? ?邊緣檢測
邊緣檢測在機器視覺中是一個關(guān)鍵步驟,特別是在物流條碼的特征提取中,它為正確識別條碼中的信息提供了基礎(chǔ)。邊緣檢測旨在識別圖像中亮度快速的變化區(qū)域,這些區(qū)域通常代表物體的邊界或其他重要的信息特征。條碼通常由一系列的黑白條紋組成,這些條紋在亮度上有明顯的變化。因此,邊緣檢測算法可以有效地揭示這些條紋的位置和結(jié)構(gòu),從而為后續(xù)的解碼工作提供重要的信息。常用的邊緣檢測方法包括Sobel算子、Canny邊緣檢測器和Prewitt算子。其中,Canny邊緣檢測器是一種多階段算法,它使用高斯濾波來平滑圖像,然后計算圖像的梯度強度和方向。接下來,使用非最大值抑制來消除梯度值上的假響應(yīng),最后通過雙閾值處理來確定真正的邊緣。Canny算法具有高度的準(zhǔn)確性和魯棒性,常被用于條碼邊緣檢測。
2.2.2 ? ?輪廓分析
輪廓可以被視為圖像中對象的外部形狀或邊界,它能為對象的識別、分類和后續(xù)的特征提取提供有價值的信息。對于條碼,輪廓分析的重要性在于,條碼本身是由一系列精確的線條或塊構(gòu)成的,這些線條或塊代表特定的信息編碼。輪廓分析能夠準(zhǔn)確地檢測、跟蹤和測量這些線條或塊的形狀、位置和大小,從而為解碼條碼提供必要的數(shù)據(jù)。輪廓分析的流程如圖2所示。
2.2.3 ? ?信息編碼提取
信息編碼提取在條碼識別中起到關(guān)鍵作用,它將條碼的視覺形式轉(zhuǎn)化為可以被機器解讀的數(shù)據(jù)。條碼的設(shè)計原理是利用不同的線條寬度、間隔和排列來存儲信息,準(zhǔn)確地從條碼圖像中提取這些特征成為關(guān)鍵。首先,系統(tǒng)需要確保已經(jīng)準(zhǔn)確定位到條碼的主體部分,這通常依賴前期的輪廓分析和邊緣檢測兩個步驟。其次,針對條碼中的每個線條(無論是黑色還是白色),系統(tǒng)會測量其像素寬度,這是因為不同的寬度往往代表不同的信息編碼。最后,結(jié)合標(biāo)準(zhǔn)的條碼解碼規(guī)則,系統(tǒng)可以解析出代表的數(shù)字或字符,從而完成信息的解讀。這一過程需要高度的準(zhǔn)確性和速度,因為條碼在很多實時應(yīng)用中,如超市結(jié)賬和物流追蹤,都需要被快速地識別和解析。
3 ? ?條碼識別方法與技術(shù)
3.1 ? ?模板匹配技術(shù)
模板匹配技術(shù)的核心思想是使用預(yù)定義的模板在一個大圖像中搜索和定位特定的特征或?qū)ο?。在條碼識別的過程中,模板匹配可以定位條碼的位置,特別是當(dāng)條碼與周圍環(huán)境存在顯著差異時。進行模板匹配首先需要一個參考模板,這通常是條碼的一個特定部分或整體。通過在目標(biāo)圖像上滑動這個模板,模板與圖像局部區(qū)域之間的相似度就能被計算出來,從而確定最佳的匹配位置。相似度的計算可以采用多種方法,如相關(guān)系數(shù)、均方誤差或其他統(tǒng)計方法。對模板和圖像進行預(yù)處理,如去噪、增強和標(biāo)準(zhǔn)化,可以提高模板匹配的魯棒性和準(zhǔn)確性。多尺度和多方向的模板匹配技術(shù)也得到了廣泛的研究。
盡管模板匹配技術(shù)在很多應(yīng)用中都表現(xiàn)良好,但它對圖像中的噪聲和畸變較為敏感。當(dāng)目標(biāo)對象的外觀因光線、角度或遮擋發(fā)生變化時,匹配效果就會受到影響。因此,在復(fù)雜場景或高度變化的環(huán)境中,更先進的方法,如基于深度學(xué)習(xí)的技術(shù),更適合用于條碼識別。
3.2 ? ?深度學(xué)習(xí)方法
3.2.1 ? ?卷積神經(jīng)網(wǎng)絡(luò) (CNN)
卷積神經(jīng)網(wǎng)絡(luò)(CNN)是深度學(xué)習(xí)領(lǐng)域中的一種強大的模型,特別適用于進行圖像分析和識別。其具有獨特的結(jié)構(gòu)和運算方式,因此CNN能從圖像中自動提取出重要的特征,這在傳統(tǒng)圖像處理技術(shù)中通常需要進行手動設(shè)計。CNN的基礎(chǔ)是卷積操作,該操作通過滑動窗口(或稱為卷積核)在輸入圖像上執(zhí)行,以檢測特定的特征。這些窗口負(fù)責(zé)從圖像中提取局部信息,并保留空間關(guān)系。隨著網(wǎng)絡(luò)深度的增加,卷積層能捕獲從簡單的邊緣和紋理到更復(fù)雜的結(jié)構(gòu)和模式的各種特征。
池化層常在連續(xù)的卷積層之間插入,用于減少數(shù)據(jù)的維度并提高網(wǎng)絡(luò)的計算效率。此外,它還提供了某種程度的位置不變性,這對圖像識別任務(wù)非常有利。全連接層位于網(wǎng)絡(luò)的末端,將高級特征進行組合,并輸出最終的分類結(jié)果或回歸預(yù)測。
在條碼識別的上下文中,CNN可以被訓(xùn)練用來識別各種類型的條碼,無論是一維還是二維。通過學(xué)習(xí)大量的樣本,網(wǎng)絡(luò)能區(qū)分不同的條碼編碼,并準(zhǔn)確地讀取信息。與傳統(tǒng)的特征工程方法相比,CNN的自動特征提取能力使其在面對各種扭曲、噪聲或低分辨率的條碼圖像時仍具有出色的魯棒性。
3.2.2 ? ?循環(huán)神經(jīng)網(wǎng)絡(luò) (RNN)
循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)是一種為處理序列數(shù)據(jù)而特別設(shè)計的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)不同,RNN具有處理時間序列或連續(xù)數(shù)據(jù)的能力,這歸因于其內(nèi)部的循環(huán)結(jié)構(gòu),使網(wǎng)絡(luò)可以保存前一時刻的信息,并將其用于當(dāng)前的計算中。這種特性使RNN特別適合被用于處理如文本、語音、時間序列數(shù)據(jù)等具有順序性的任務(wù)。
RNN的基本單元接受當(dāng)前時間步的輸入和前一時間步的隱藏狀態(tài),并輸出一個新的隱藏狀態(tài)。這使RNN可以捕獲序列中的時間依賴性和長期依賴關(guān)系。然而,傳統(tǒng)的RNN在處理長序列時會遇到梯度消失和爆炸的問題,這限制了它們捕獲長期依賴關(guān)系的能力。因此,RNN變體被研究人員提出,如長短時記憶網(wǎng)絡(luò)(LSTM)和門控循環(huán)單元(GRU)。這些變體設(shè)計有特定的門控機制,可以更有效地學(xué)習(xí)和記住長序列中的依賴關(guān)系。
在條碼識別的場景中,考慮到條碼本質(zhì)上是一串有序的編碼,RNN及其變體可以在識別過程中考慮編碼之間的順序關(guān)系。例如,當(dāng)處理橫跨多個圖像區(qū)域的長條碼或連續(xù)讀取流式視頻中的條碼時,RNN能夠有效地捕獲和利用這些連續(xù)性信息,從而提高識別的準(zhǔn)確性和魯棒性。
4 ? ?性能評估與對比
4.1 ? ?實驗設(shè)計
實驗首先需要定義一個明確的目標(biāo),即驗證所提出的條碼特征提取與識別方法的有效性和準(zhǔn)確性。為此,實驗設(shè)計包括以下幾個核心環(huán)節(jié)。
數(shù)據(jù)集選擇:選擇一個包含多種物流包裝條碼的數(shù)據(jù)集,確保數(shù)據(jù)集包含各種形態(tài)、大小、分辨率、清晰度、光照條件下的條碼圖像,以驗證所提方法的魯棒性。
預(yù)處理:對數(shù)據(jù)集中的圖像進行必要的預(yù)處理,如去噪、大小調(diào)整、色彩平衡等,以準(zhǔn)備進行特征提取和識別。
實驗分組:將數(shù)據(jù)集隨機分為訓(xùn)練集和測試集,確保二者分布均勻,通??梢圆扇?0%的數(shù)據(jù)作為訓(xùn)練集,20%的數(shù)據(jù)作為測試集。
模型訓(xùn)練:使用訓(xùn)練集對提出的特征提取與識別方法進行訓(xùn)練,調(diào)整模型的參數(shù)直至達到最佳性能。
模型驗證:使用獨立的測試集對訓(xùn)練好的模型進行驗證,記錄其在各種條件下的識別準(zhǔn)確率、速度、魯棒性等關(guān)鍵指標(biāo)。
對比實驗:為了證明所提方法的優(yōu)越性,可以選擇一些現(xiàn)有的條碼特征提取與識別算法作為基線,進行同樣的實驗流程,并與所提方法的實驗結(jié)果進行對比。
4.2 ? ?實驗數(shù)據(jù)集
本研究選擇綜合性的條碼數(shù)據(jù)集進行測試。該數(shù)據(jù)集的具體描述如表1所示。
該數(shù)據(jù)集覆蓋大部分實際應(yīng)用中會遇到的各種場景和條件,從低分辨率到高分辨率,從不同的光照條件到多種條碼類型,這樣就可以在一個真實且具有代表性的環(huán)境中測試和驗證所提出的條碼特征提取與識別方法的效果。
4.3 ? ?評估指標(biāo)
本研究選擇以下主要指標(biāo)(見表2)全面評價提出的條碼特征提取與識別方法的性能。
其中,TP:True Positives,真正例;TN:True Negatives,真負(fù)例;FP: False Positives,假正例;FN:False Negatives,假負(fù)例。
4.4 ? ?結(jié)果與討論
在實驗過程中,本研究針對各種條碼類型和不同圖像質(zhì)量進行了測試,實驗結(jié)果如表3所示。
從表3可以看出,無論是對于一維條碼、二維條碼還是其他特定類型的條碼,基于機器視覺的識別方法都達到了較高的準(zhǔn)確性。其中,一維條碼在所有評估指標(biāo)上均達到了最優(yōu)表現(xiàn),這是由于其結(jié)構(gòu)簡單,信息量相對較少的特點。與此相比,二維條碼和其他特定類型的條碼的識別精度稍低,但仍在可接受范圍內(nèi)。
識別速度在各類條碼中略有差異。一維條碼的識別速度最快,這再次證明其具有結(jié)構(gòu)簡單、處理速度快的特點。二維條碼和其他特定類型的條碼的識別時間略長,這與它們復(fù)雜的結(jié)構(gòu)和更大的信息量有關(guān)。
總的來說,本研究方法在多種條碼類型的識別上均展現(xiàn)出了較好的穩(wěn)定性和效率。可以考慮進一步優(yōu)化算法,以提高其對更復(fù)雜條碼的識別精度。同時針對具體的應(yīng)用場景還可以對算法進行微調(diào),以適應(yīng)不同的環(huán)境和需求。
5 ? ?結(jié) ? ?論
隨著現(xiàn)代物流、零售和其他行業(yè)的迅猛發(fā)展,條碼技術(shù)在商品管理、資產(chǎn)跟蹤以及各種自動化操作中扮演著越來越重要的角色。本文深入探討了機器視覺在條碼特征提取與識別中的應(yīng)用。從機器視覺的基本原理到其在條碼識別中的實際應(yīng)用,涵蓋圖像預(yù)處理、特征提取和深度學(xué)習(xí)等多個關(guān)鍵技術(shù)領(lǐng)域。實驗部分對比了不同的識別方法,并在多種數(shù)據(jù)集上驗證了其效果。經(jīng)過深入研究,本文為如何利用機器視覺技術(shù)提高條碼識別的準(zhǔn)確性和速度提供了有益見解,期望這些研究成果能夠為相關(guān)領(lǐng)域的實踐者提供指導(dǎo),并進一步推動條碼技術(shù)與機器視覺的整合與創(chuàng)新。
參考文獻:
[1] 楊文科.條碼技術(shù)與RFID技術(shù)在物流中的應(yīng)用前景分析[J].科技資訊,2023,21(13):27-30.
[2] 王永桐.自動識別技術(shù)在物流管理中的應(yīng)用[J].產(chǎn)業(yè)創(chuàng)新研究,2023(10):101-103.
[3] 曾王平.基于企業(yè)的物流倉儲信息化建設(shè)內(nèi)容及思路研究[J].現(xiàn)代信息科技,2023,7(8):168-170,174.
[4] 孫東.快遞包裹信息碼視覺定位與識別技術(shù)研究[D].哈爾濱:哈爾濱商業(yè)大學(xué),2022.
[5] 林雯.基于計算機視覺的物流包裝嚴(yán)密程度檢測系統(tǒng)[J].物流技術(shù),2014,33(1):332-335.