華迦睿
(江蘇省南通市第二中學(xué) 江蘇南通 226000)
近年來(lái),隨著人工智能的發(fā)展,機(jī)器視覺(jué)技術(shù)逐漸滲透到生活的各個(gè)方面。機(jī)器視覺(jué)是一種利用光電成像系統(tǒng)采集圖像信息,然后在計(jì)算機(jī)或?qū)S脠D像處理器上運(yùn)行軟件對(duì)圖像信息進(jìn)行處理的技術(shù),最后通過(guò)識(shí)別和分析來(lái)判斷目標(biāo)物體的形狀和大小。機(jī)器視覺(jué)也可以稱(chēng)為計(jì)算機(jī)視覺(jué),它借助計(jì)算機(jī)實(shí)現(xiàn)人體的視覺(jué)功能,即用機(jī)器代替人眼進(jìn)行判斷。機(jī)器視覺(jué)是一種利用光電成像系統(tǒng)采集圖像信息,然后在計(jì)算機(jī)或?qū)S脠D像處理器上運(yùn)行軟件對(duì)圖像信息進(jìn)行處理的技術(shù),最后對(duì)目標(biāo)對(duì)象的形狀和大小進(jìn)行識(shí)別和分析[1]。
而對(duì)于外形相似的書(shū)籍識(shí)別與分類(lèi)的領(lǐng)域,機(jī)器視覺(jué)卻應(yīng)用較少[2]。隨著人們對(duì)知識(shí)的渴求越來(lái)越強(qiáng)烈,各種各樣的教輔書(shū)、材料書(shū)、休閑書(shū)層出不窮[3-5]。許多人也因?yàn)闀?shū)籍太多而很難去將它們分類(lèi)整理,日后需要時(shí)卻又很難找到[6-7]。對(duì)于傳統(tǒng)的書(shū)籍分類(lèi),都是需要人類(lèi)的眼睛大腦進(jìn)行判斷區(qū)分,然后再用雙手將它們分類(lèi)[8-9]。這樣非常耗費(fèi)時(shí)間與精力,并且也可能會(huì)因身體疲勞或大腦錯(cuò)辨等因素而出錯(cuò)。
基于這種常見(jiàn)問(wèn)題,筆者提出了一種機(jī)器視覺(jué)的書(shū)籍分類(lèi)整理智能識(shí)別系統(tǒng)。其原理是通過(guò)VS與OpenCv開(kāi)發(fā)的智能書(shū)籍分類(lèi)識(shí)別算法,對(duì)獲取到的書(shū)籍圖像進(jìn)行一系列的預(yù)處理,得到書(shū)籍特的二值化圖像。筆者提出了一種基于形態(tài)學(xué)邊緣檢測(cè)提取書(shū)籍特征信息和分類(lèi)的算法[10],從而實(shí)現(xiàn)對(duì)不同學(xué)科不同專(zhuān)業(yè)的書(shū)籍特征信息的檢測(cè)和識(shí)別。筆者所設(shè)計(jì)的書(shū)籍分類(lèi)系統(tǒng)很好地完成了對(duì)書(shū)籍的識(shí)別實(shí)驗(yàn),達(dá)到了書(shū)籍分類(lèi)整理自動(dòng)化的要求。其在快速識(shí)別與自動(dòng)分類(lèi)的基礎(chǔ)上,大大減少了人們?yōu)榇怂ㄙM(fèi)的時(shí)間精力,促使人們有序整理,高效學(xué)習(xí),有較大實(shí)用價(jià)值。
從下面的圖中可以看得出,書(shū)籍分類(lèi)系統(tǒng)包含了硬件和軟件和PC端,一共3個(gè)部分。具體各個(gè)部分的處理流程和功能如下圖。
圖1 系統(tǒng)拓?fù)鋱D
根據(jù)書(shū)籍封面是平面,并且不是動(dòng)態(tài)物體的特點(diǎn),獲取書(shū)籍圖像的硬件的型號(hào),筆者選取的是MER-531-20GM/C-P的530的攝像頭,次攝像頭獲取書(shū)籍圖像的速度大小是20fps,具體結(jié)構(gòu)圖如下圖。
圖2 MER-531-20GM/C-P
下面的圖顯示的是該系統(tǒng)所選取的攝像頭對(duì)不同顏色的光的敏感程度曲線。
圖3 MER-531-20GM/C-P的敏感程度曲線
同樣在獲取書(shū)籍圖像的過(guò)程中,配合攝像頭使用的鏡頭也是非常重要的。筆者根據(jù)實(shí)際需求選取鏡頭為OPI-C0420-2M,其獲取圖像的理論大小可表示為200萬(wàn)像素。
圖4 200像素定焦鏡頭
實(shí)際上,書(shū)籍的顏色有多種多樣,筆者選用型號(hào)為OPTLI10810的條形白光光源來(lái)配合圖像采集。其消耗功率小,燈帶角度90°,避免了單色光對(duì)拍攝書(shū)籍封面時(shí)產(chǎn)生錯(cuò)誤的色光。
圖5 條形光源
在系統(tǒng)中個(gè)傳感硬件都是非常重要的,筆者將個(gè)傳感硬件的具體參數(shù)進(jìn)行了列表分析。
表1 硬件型號(hào)與參數(shù)
由環(huán)形光源照射書(shū)籍的封面。采集到的圖像通過(guò)預(yù)處理部分進(jìn)行形態(tài)學(xué)處理、圖像去噪、轉(zhuǎn)化為二值化圖像和邊緣檢測(cè)一系列處理。最后,由軟件的識(shí)別檢測(cè)部分對(duì)書(shū)籍封面信息進(jìn)行識(shí)別檢測(cè),得出并顯示結(jié)果。
圖6 系統(tǒng)軟件交互圖
筆者所提出的機(jī)器視覺(jué)的書(shū)籍分類(lèi)整理智能識(shí)別系統(tǒng),包含硬件部分和軟件部分。根據(jù)系統(tǒng)的設(shè)計(jì)要求,筆者利用軟件開(kāi)發(fā)平臺(tái)VS2010軟件開(kāi)發(fā)平臺(tái)設(shè)計(jì)開(kāi)發(fā)了軟件系統(tǒng)的界面。如下圖所示為系統(tǒng)的主功能界面,主要分為圖像顯示窗口、識(shí)別結(jié)果顯示窗口,系統(tǒng)開(kāi)始功能按鈕,系統(tǒng)停止按鈕功能鍵。
圖7 系統(tǒng)功能界面圖
考慮到書(shū)籍封面是膠裝封面或銅板紙且表面光滑會(huì)反光,并且不同學(xué)科、不同專(zhuān)業(yè)的學(xué)籍的書(shū)名不一樣,中文與英文書(shū)籍的書(shū)名也不一樣。因此,為了驗(yàn)證系統(tǒng)的可靠性,筆者進(jìn)行了相關(guān)實(shí)驗(yàn)。采用系統(tǒng)分別識(shí)別2批數(shù)量相同的書(shū)籍圖像,記錄系統(tǒng)識(shí)別2組所用的時(shí)間,識(shí)別正確率。實(shí)驗(yàn)結(jié)果如下表。
表2 試驗(yàn)結(jié)果
從表格中可以看出,系統(tǒng)識(shí)別檢測(cè)2組書(shū)籍所用的時(shí)間在230s以內(nèi),識(shí)別速度快,誤檢率在8%以內(nèi),識(shí)別準(zhǔn)確率較高。
從上面的測(cè)試結(jié)果中可以看得出,筆者設(shè)計(jì)的識(shí)別系統(tǒng)所用的時(shí)間基本上都在230s以內(nèi),識(shí)別速度快,誤檢率在8%以內(nèi),識(shí)別準(zhǔn)確率較高。因此,其基本上實(shí)現(xiàn)了獨(dú)立對(duì)不同學(xué)科、不同類(lèi)型的數(shù)據(jù)的識(shí)別和檢測(cè),有較大的圖書(shū)識(shí)別推薦價(jià)值。