摘要:本文對機器視覺技術(shù)基礎(chǔ)理論及基于深度學習的AI 機器視覺技術(shù)做介紹,通過對電池殼制造行業(yè)中電池殼品質(zhì)AI 機器視覺檢測的典型案例,表明在該檢測領(lǐng)域的技術(shù)優(yōu)越性,并對AI+ 機器視覺技術(shù)在汽車行業(yè)中的應用前景進行了展望。
關(guān)鍵詞:機器視覺;深度學習;卷積神經(jīng)網(wǎng)絡;電池殼制造
一、基于深度學習的AI 機器視覺技術(shù)概述
(一)機器視覺技術(shù)概念
機器視覺(Machine Vision)的研究是從20 世紀60 年代中期美國學者L.R. 羅伯茲關(guān)于理解多面體組成的積木世界研究開始的[1]。根據(jù)美國自動成像協(xié)會(AIA)的定義,機器視覺是一種應用于工業(yè)和非工業(yè)領(lǐng)域的硬件和軟件組合,它基于捕獲并處理的圖像為設(shè)備執(zhí)行其功能提供操作指導。它被稱為智能制造的“慧眼”[2],為智能制造打開新“視”界,是實現(xiàn)工業(yè)自動化和智能化的必要手段。
從狹義上,機器視覺系統(tǒng)包括圖像采集部分(相機、鏡頭、光源、光源控制器),圖像傳輸部分(圖像采集卡、線纜、數(shù)據(jù)接口)以及圖像處理解析部分(預處理器、主處理器、應用軟件)。其中圖像采集部分負責成像,圖像處理解析部分負責對成像結(jié)果進行處理分析和輸出。從廣義角度,還包括后端相關(guān)的信息通訊及運動控制系統(tǒng)。
傳統(tǒng)機器視覺主要用于對檢測物品進行識別、測量、定位及檢測,通過機器代替人工進行測量與判斷,識別場景及效率相對標準化。識別是基于對目標物的形狀、顏色等特征進行甄別;測量是將獲取的圖像像素信息標定成常用度量衡單位,再在圖像中精確計算目標物的幾何尺寸;定位則是獲得目標物關(guān)于二維或三維的位置信息;檢測主要指外觀檢測,對產(chǎn)品裝配后的完整性檢測及外觀缺陷檢測等,其難度最高,因此迫切需要尋找一種有效的技術(shù)方式,提高檢測可靠性。
(二)基于深度學習的AI 機器視覺技術(shù)概念
人工智能(Artificial Intelligence, 縮寫為AI) 指由人制造出來的可以表現(xiàn)出智能的機器,通常是指通過普通計算機程序來呈現(xiàn)人類智能的技術(shù)。深度學習(deep learning)是人工智能的一個子領(lǐng)域,通過處理數(shù)據(jù)和創(chuàng)建用于決策制定的模式,來模仿人類大腦的工作方式,可通過人工神經(jīng)網(wǎng)絡等架構(gòu)完成[3]。卷積神經(jīng)網(wǎng)絡(Convolutional NeuralNetworks, CNN)是人工神經(jīng)網(wǎng)絡中的一種,是深度學習中頗受歡迎的代表算法之一。
機器視覺經(jīng)常使用CNN 算法, 它的基本結(jié)構(gòu)由輸入層、卷積層(convolutional layer)、池化層(poolinglayer,也成為取樣層)、全連接層及輸出層構(gòu)成。圖像中不同數(shù)據(jù)窗口的數(shù)據(jù)和卷積核(一個濾波矩陣)作內(nèi)積的操作就叫做卷積,它的本質(zhì)是將小區(qū)域內(nèi)的信息統(tǒng)計抽象出來,即提取圖像不同頻段的特征。CNN 的卷積層和池化層一般會取若干個,采用卷積層和池化層交替設(shè)置,即一個卷積層連接一個池化層池化層后再連接一個卷積層,依此類推[4]。卷積層的第一層通常用于捕捉邊緣、顏色、梯度方向和基本幾何形狀等基本特征。添加層后,此模型會填充高級特征。池化層會逐漸縮小表示空間的大小,可提高計算效率,并會單獨對每個特征圖進行運算,其常用的方法是最大池化,即捕捉數(shù)組的最大值,從而減少計算所需值的數(shù)量。標準化層會對數(shù)據(jù)進行正則化處理,以改善神經(jīng)網(wǎng)絡的性能和穩(wěn)定性。其通過將所有輸入都轉(zhuǎn)換為均值為 0 且方差為1,從而使每個層的輸入更便于管理。
(三)人工智能帶動機器視覺技術(shù)發(fā)展
在AI 的加持下,機器視覺行業(yè)將迎來空前發(fā)展機會。從算法、技術(shù)到應用,AI 技術(shù)極大程度賦能機器視覺在圖像模型上的智能化應用,優(yōu)化了圖像識別的復雜度及精度,實現(xiàn)萬物識別。深度學習算法的加持為機器視覺應用場景的拓寬提供了技術(shù)支持,同時可以進一步提升機器視覺的效率及準確性。
二、電池殼制造行業(yè)中AI 機器視覺技術(shù)的典型應用
在我國新能源汽車快速發(fā)展的引領(lǐng)下,電動化已成為全球汽車發(fā)展的主要趨勢。新能源動力汽車由電池包提供電源,是電動汽車產(chǎn)業(yè)鏈的核心。其中汽車電池殼制造行業(yè)的自動化程度較高,機器視覺作為先進技術(shù)的典型已成功運用到該行業(yè)中,基于深度學習的AI 機器視覺技術(shù)在此過程中發(fā)揮了巨大的作用。
汽車電池殼生產(chǎn)線上,殼體需經(jīng)過焊接、機加工、壓鉚、拉鉚等工藝加工,生產(chǎn)過程中可能存在螺母、螺栓、螺柱、蓋板、線束、鋼絲牙套等的安裝錯漏,以及工件孔位、套筒、閥門、封堵片等零件的缺失。任何一個零件的安裝異常都會導致電池包存在安全隱患。因此,在電池殼生產(chǎn)過程中,增加AI機器視覺檢測品質(zhì)缺陷十分必要。且由于很多電池殼為鋁合金材質(zhì),存在一定程度的反光且結(jié)構(gòu)復雜,因此,使用傳統(tǒng)機器視覺技術(shù)很多時候無法滿足客戶的高檢測標準。由于基于深度學習的AI 機器視覺檢測算法可規(guī)避傳統(tǒng)算法對圖像中目標特征的高成像要求,因此該技術(shù)在識別電池殼的上述缺陷是非常行之有效的檢測手段。
電池殼體在生產(chǎn)后,通常會預留一個全面質(zhì)檢工位,采用機器人帶視覺的方式進行全面檢測。電池殼品質(zhì)視覺檢測工作站主要由機器人系統(tǒng)、視覺系統(tǒng)、變位機夾具系統(tǒng)、電控系統(tǒng)四大部分組成。待檢電池殼由上工序放入變位機夾具內(nèi)夾緊,機器人負責在末端安裝視覺設(shè)備采集電池殼各待檢部位圖像。變位機在機器人視覺檢測的過程中配合機器人動作進行翻轉(zhuǎn),確保所有待檢部位能夠清晰拍攝。電控系統(tǒng)作為設(shè)備總控,負責協(xié)調(diào)機器人、視覺系統(tǒng)及變位機夾具系統(tǒng)協(xié)同工作,設(shè)備如圖1 所示。
具體識別步驟如下:
步驟1 :采集大量螺母、螺栓、螺柱等目標物的圖片,使用深度學習算法構(gòu)建并訓練深度神經(jīng)網(wǎng)絡模型;
步驟2 :對所構(gòu)建的深度神經(jīng)網(wǎng)絡模型進行打包,生成可執(zhí)行文件;
步驟3 :構(gòu)建傳統(tǒng)機器視覺框架作為主軟件運行,并單獨建立新線程調(diào)用可執(zhí)行文件啟動運行;
步驟4 :在可執(zhí)行文件啟動時創(chuàng)建服務端,將主軟件作為客戶端與服務端進行連接,以實現(xiàn)傳統(tǒng)機器視覺框架與服務端可執(zhí)行文件間的數(shù)據(jù)通信;
步驟5 :在進行電池盒外觀檢測時,作為主軟件的傳統(tǒng)機器視覺框架采集并獲取電池盒外觀的圖像將其發(fā)送至服務端,于服務端執(zhí)行可執(zhí)行文件獲得識別結(jié)果,將識別結(jié)果返回至傳統(tǒng)機器視覺框架予以輸出。
應用結(jié)果表明,與傳統(tǒng)的機器視覺算法相比,AI+ 機器視覺技術(shù)對于有反光、結(jié)構(gòu)復雜的零件檢測更具有優(yōu)勢,可克服反光等不良檢測因素,具有檢出率高、計算速度快、檢測節(jié)拍高等特點。
三、結(jié)語
基于深度學習的機器視覺技術(shù)在現(xiàn)代先進汽車制造產(chǎn)業(yè)的各個環(huán)節(jié)中都起到了至關(guān)重要的作用。在工業(yè)4.0 時代背景下,隨著人工智能技術(shù)的進步,以及相關(guān)軟硬件技術(shù)及云技術(shù)的發(fā)展,AI+ 機器視覺的技術(shù)在未來將會有更加廣闊的應用空間,能促使汽車制造行業(yè)向模塊化、數(shù)字化、自動化、智能化方向發(fā)展。
參考文獻:
[1] 朱陽芬,銀冬平,鄒舜章等. 機器視覺在汽車行業(yè)中的發(fā)展與應用[J]. 汽車實用技術(shù),2017,22 :8-11.
[2] 尹仕斌,任永杰,劉濤等. 機器視覺技術(shù)在現(xiàn)代汽車制造中的應用綜述[J]. 光學學報,2017,38(8):1-12.
[3] 黃樺,騰海渤,劉義法等. 機器視覺技術(shù)在汽車制造行業(yè)中的應用研究[J]. 汽車工藝與材料,2022(6):8-15.
[4] 周飛燕,金林鵬,董軍. 卷積神經(jīng)網(wǎng)絡研究綜述[J]. 計算機學報,2017,40(6):1229-1251.