商 睿
圖像識(shí)別技術(shù)是將所需物體進(jìn)行有效信息采集,并依據(jù)所采集信息,在數(shù)據(jù)庫(kù)里進(jìn)行關(guān)鍵信息檢索,從而將所需物體歸類(lèi)到不同種類(lèi)的圖像處理信息技術(shù)。其本質(zhì)是將物體這一個(gè)體范圍投影到類(lèi)別范圍。這種技術(shù)主要是對(duì)圖像所體現(xiàn)的信息進(jìn)行識(shí)別。圖像識(shí)別技術(shù)的發(fā)展主要經(jīng)歷了文本信息提取識(shí)別,分割圖像信息識(shí)別,三維物體信息識(shí)別3個(gè)階段。圖像識(shí)別系統(tǒng)主要由劃分圖像,提取圖像有效信息,檢索關(guān)鍵信息并以此分類(lèi)將個(gè)體投影到類(lèi)別這三大部分組成,是目前世界上較為先進(jìn)的識(shí)別技術(shù)[1]。
圖像識(shí)別技術(shù)的原理是基于人們對(duì)事物的認(rèn)知過(guò)程。當(dāng)人們看到一個(gè)陌生的事物時(shí),會(huì)在潛意識(shí)里在自己的大腦存儲(chǔ)庫(kù)里搜尋這種事物的關(guān)鍵詞。圖像識(shí)別技術(shù)亦是如此,它是先掃描面前的物體,通過(guò)圖像分割等步驟及方法,提取出有效信息并根據(jù)有效信息進(jìn)行檢索得出物體種類(lèi)后歸類(lèi)。只不過(guò)圖像處理技術(shù)搜尋的關(guān)鍵是在于事物的特征是否明顯,若特征明顯,那么搜尋的效率就高,反之特征不明顯或者模糊不清,那么搜尋的效率就低。
圖像識(shí)別技術(shù)的發(fā)展主要經(jīng)歷了文本信息提取識(shí)別,分割圖像信息識(shí)別,三維物體信息識(shí)別三個(gè)階段。文字識(shí)別興起于1950 年,主要是識(shí)別字母數(shù)字符號(hào)為基礎(chǔ)的印刷文明。隨著時(shí)代的發(fā)展,圖像識(shí)別技術(shù)開(kāi)始識(shí)別手寫(xiě)文字,且應(yīng)用廣泛在許多專(zhuān)業(yè)設(shè)備中都有其身影。數(shù)字圖像識(shí)別技術(shù)于19世紀(jì)60 年代中期興起,其具體出現(xiàn)的時(shí)間有待考證。這種識(shí)別技術(shù)主要是對(duì)二維世界的信息提取與檢索分類(lèi),是在圖像識(shí)別技術(shù)發(fā)展中,應(yīng)用較為廣泛的識(shí)別技術(shù)。在人類(lèi)社會(huì)發(fā)展中起了非常重要的作用。這種技術(shù)除了感知與認(rèn)識(shí)的作用外,還有著易于儲(chǔ)存運(yùn)輸處理方便等巨大優(yōu)勢(shì),極大滿足了人們對(duì)于圖像信息提取處理的認(rèn)識(shí)傳播的需求。以上兩種均是針對(duì)于二維世界,而近代興起的物體識(shí)別則是針對(duì)于三維世界,但物體識(shí)別也是在數(shù)字圖像識(shí)別的基礎(chǔ)上興起的,它通過(guò)對(duì)物體本身及環(huán)境的感知達(dá)到識(shí)別的目的。物體識(shí)別屬于高級(jí)計(jì)算機(jī)視覺(jué)領(lǐng)域,對(duì)我們生活產(chǎn)生著不可替代的意義。
圖像識(shí)別分兩大步,第一步是對(duì)圖像進(jìn)行分割。對(duì)于圖像的分割,就目前來(lái)看有著3 種基本方法。第一種是依據(jù)圖像的閾值不同進(jìn)行分割。這是較為常用的一種方法。這種方法本質(zhì)上是基于不同目標(biāo)的灰度值來(lái)選取信息,具有用時(shí)短效率高的巨大優(yōu)勢(shì)。但是這種分割的局限性也很大,如不易區(qū)分閾值從而造成提取出大量無(wú)效或具有干擾性信息。第二種方法是依據(jù)區(qū)域不同來(lái)進(jìn)行圖像分割。分割有兩種基本形式,一種是區(qū)域生長(zhǎng),一種是分裂合并。與其他方法不同的是,這種方法可以有效避免因無(wú)法區(qū)分閾值而提取出大量無(wú)效信息的問(wèn)題,并且這種方法注意到了維護(hù)空間的連接性。因此,具有很強(qiáng)的魯棒性。第三種方法是通過(guò)檢測(cè)圖像像素的灰度值,并識(shí)別這些像素灰度值的差異,從而探測(cè)到圖像的邊緣地區(qū)來(lái)進(jìn)行分割的方法。這種方法的科學(xué)技術(shù)含量較高,且需要按一定策略,將檢測(cè)所得邊緣點(diǎn)鏈接形成輪廓,構(gòu)成所需圖像分割領(lǐng)域。第二步是進(jìn)行圖像的匹配。在圖像匹配這一步中,現(xiàn)在最為常用的方法是細(xì)節(jié)匹配。這一步相較于上一步更為復(fù)雜,需要將一定信息數(shù)據(jù)帶入公式,再依據(jù)公式檢測(cè)出細(xì)節(jié)是否匹配[2]。
航空與衛(wèi)星遙感技術(shù)是當(dāng)今圖像識(shí)別技術(shù)應(yīng)用較多的領(lǐng)域。其主要分為兩個(gè)方面,一是攝影,二是圖像識(shí)別,其中圖像識(shí)別又分為光學(xué)機(jī)器掃描(紅外探測(cè)系統(tǒng))和多光譜遙感技術(shù)。紅外探測(cè)系統(tǒng)是依據(jù)地物發(fā)射的熱輻射溫度的差異,將紅外輻射能量以亮度表示的一種圖像化系統(tǒng)。多光譜遙感技術(shù)則是一種特殊的技術(shù)。在地物的輻射中,一般來(lái)說(shuō)產(chǎn)生的是較寬的、連續(xù)的電磁波,在這樣的電磁波里難以直接獲取信息。而如果把這種電磁波分割成許多個(gè)比較瞎站的光譜段,就可以獲得一些有效信息。這種以攝影或掃描的方式,在同一時(shí)間獲得同一目標(biāo)的、來(lái)自不同光短信息的技術(shù)就是多光譜遙感技術(shù)。這種技術(shù)在當(dāng)下研究航空衛(wèi)星圖像時(shí)是一種非常重要的內(nèi)容,也是圖像識(shí)別技術(shù)的重大應(yīng)用[2]。
人臉識(shí)別技術(shù)是圖像識(shí)別技術(shù)在生物信息提取識(shí)別方面的一種最為廣泛、最為主要的應(yīng)用。人臉識(shí)別是近年來(lái)各領(lǐng)域研究的熱點(diǎn)問(wèn)題。這是一種依據(jù)捕捉人眼鼻嘴的參數(shù)比例,在數(shù)據(jù)庫(kù)進(jìn)行搜索識(shí)別技術(shù)[3]。但是這種技術(shù)也存在著一種缺陷,當(dāng)外部環(huán)境或者人表情姿態(tài)發(fā)生變化是人臉識(shí)別的性能就會(huì)將下降,因此在人臉識(shí)別技術(shù)上,很多研究者對(duì)光照及姿態(tài)變化進(jìn)行了專(zhuān)門(mén)的研究,找到了多種解決的方法,如針對(duì)于光照變化的構(gòu)建圖像模型,針對(duì)于姿態(tài)變化的線形對(duì)象類(lèi)思想,當(dāng)然也有同時(shí)針對(duì)光照和姿態(tài)變化的三維建模思想,這些方法思想在近幾年均有了較大的進(jìn)展[4],但在實(shí)際應(yīng)用方面還存在著較大的挑戰(zhàn)。
在農(nóng)業(yè)生產(chǎn)方面,圖像識(shí)別技術(shù)主要應(yīng)用于識(shí)別不同的植物,如花伴侶App[5]?;ò閭HApp 是一種面向大眾新型知識(shí)服務(wù)App,它是基于中國(guó)植物圖像庫(kù),將里面的植物按照所屬群科分類(lèi)。人們只需要拍張照,就能知道這個(gè)植物是什么種類(lèi),是什么科的。方便了人們的生活,對(duì)于擴(kuò)大人們對(duì)植物的認(rèn)識(shí)有著非常重要的意義。
圖像識(shí)別技術(shù)在交通方面應(yīng)用較為寬泛,如汽車(chē)標(biāo)志定位技術(shù),用于定位車(chē)標(biāo),在現(xiàn)實(shí)生活中具有重要意義。車(chē)標(biāo)識(shí)別技術(shù)的原理并不復(fù)雜,利用攝像頭等攝影工具,把車(chē)標(biāo)拍照后上傳到數(shù)據(jù)庫(kù),再通過(guò)數(shù)據(jù)庫(kù)進(jìn)行關(guān)鍵信息的檢索,即可得到我們所需要的信息。但是由于車(chē)標(biāo)識(shí)別技術(shù)中的定位并不準(zhǔn)確,因此帶來(lái)識(shí)別中車(chē)標(biāo)大小尺寸的差異,所以如何減小這種差異也成為研究智能圖像識(shí)別技術(shù)的熱點(diǎn)。除此之外,圖像識(shí)別技術(shù)在維護(hù)交通安全方面有著重要的作用,交警可以將監(jiān)控信息上傳,通過(guò)人臉識(shí)別,在信息庫(kù)中搜索相近的信息得出相似度最高的人員,從而協(xié)助交警抓住肇事逃逸人。因此圖像識(shí)別技術(shù)對(duì)交通安全的維護(hù)有著一定促進(jìn)作用。
圖像識(shí)別技術(shù)在軍事上有著重要的應(yīng)用,對(duì)軍事化的發(fā)展起到一定的促進(jìn)作用。如在軍事演習(xí)中所使用的遙感技術(shù),對(duì)地面物體的信息提取分析將所得主要信息呈現(xiàn)在所需人的屏幕上。除此之外,圖像識(shí)別技術(shù)還有利于軍事勘察,并且對(duì)于軍事勘察有著不可替代的作用。
機(jī)器視覺(jué)也可運(yùn)用于對(duì)貨架中的商品進(jìn)行識(shí)別。這一工作的原理是:先讓機(jī)器分析與識(shí)別大量的圖片,同時(shí)糾正機(jī)器判斷出錯(cuò)的數(shù)據(jù),同時(shí)使用神經(jīng)網(wǎng)絡(luò)的算法反復(fù)學(xué)習(xí)。在這樣過(guò)程之后,計(jì)算機(jī)就獲得了具有簡(jiǎn)單的識(shí)物功能。在此基礎(chǔ)上,繼續(xù)對(duì)機(jī)器進(jìn)行訓(xùn)練,使其可以認(rèn)識(shí)貨架上商品的包裝,是瓶裝還是袋裝亦或其他類(lèi)型,甚至是什么品牌、口味與規(guī)格。這樣的機(jī)器可以準(zhǔn)確識(shí)別成千上萬(wàn)種商品,大大提高無(wú)人超市的管理等工作的效率。
圖像識(shí)別技術(shù)在當(dāng)今世界中起著不可替代的作用,它的應(yīng)用范圍大到軍事航空,小到日常生活,在現(xiàn)實(shí)產(chǎn)生著重要意義,極大的方便了人們的生活,并且協(xié)助人們維護(hù)社會(huì)日常準(zhǔn)則。但是圖像識(shí)別技術(shù)在當(dāng)下并不完善,它還存在著許多未知領(lǐng)域和技術(shù)難題等待著我們的探索和完善,除此之外,圖像識(shí)別技術(shù)也并不是人們所想象中的那樣,它對(duì)人類(lèi)同樣存在著一些威脅,只不過(guò)尚未表現(xiàn)出來(lái)。因此,針對(duì)圖像識(shí)別技術(shù),我們?cè)诜e極開(kāi)發(fā)它的同時(shí),也要注意合理運(yùn)用。