吳英男
(廣東省外語藝術(shù)職業(yè)學(xué)院 信息學(xué)院,廣東 廣州 510240)
隨著人們生活質(zhì)量的提高,對物質(zhì)有了更高的追求,由于圖像主要用于評價某一事物,并且圖像中所能夠呈現(xiàn)出的信息要遠(yuǎn)遠(yuǎn)超過其他方面所能呈現(xiàn)出的內(nèi)容。在我國多媒體以及互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展下,有關(guān)圖像技術(shù)方面的應(yīng)用也越來越廣,并且數(shù)據(jù)承載量也在逐漸增加,從存儲到運輸,從處理到查詢均是圖像檢索技術(shù)應(yīng)具備的功能。操作人員可以從數(shù)據(jù)庫中尋找信息,并且還應(yīng)保證檢索技術(shù)的準(zhǔn)確性,多媒體技術(shù)的不斷發(fā)展對圖像檢索技術(shù)有很大的幫助,能夠有效解決用戶在使用過程中存在的問題。
早在1970年便有了圖像檢索技術(shù)的出臺,并且其更多的是應(yīng)用文本索引技術(shù),各項工作的開展需要有文本數(shù)據(jù)的支撐,并且在進(jìn)行查詢方面的內(nèi)容時也需要將圖像文本作為數(shù)據(jù)支撐,該方法在應(yīng)用過程中會涉及到關(guān)鍵詞、標(biāo)題等方面的內(nèi)容,在完成初步操作后便會將相關(guān)數(shù)據(jù)進(jìn)行儲存后再建立聯(lián)系,這樣便完成了文本檢索工作,隨著社會的發(fā)展進(jìn)步,此方法已不能滿足工作需求,其存在的不足主要有以下幾個方面:第一,在標(biāo)注圖像時需要由人工操作完成,雖然能將各種小圖像匯總在一起,但卻無法精準(zhǔn)的統(tǒng)計數(shù)量,使用此方法存在很大的弊端;第二,各圖像之間所呈現(xiàn)出的信息種類很多,并且存在很大的不同,導(dǎo)致各圖像在分類上沒有統(tǒng)一標(biāo)準(zhǔn)。在1990年之后,便出現(xiàn)能夠?qū)D像內(nèi)容以及語義進(jìn)行檢索的技術(shù),其主要依據(jù)圖像檢索技術(shù)進(jìn)行擴(kuò)張,提前抽取數(shù)據(jù)庫中的相關(guān)信息,將某一圖像作為目標(biāo)圖像,隨后系統(tǒng)便會讀取其中的特點,并自主與其他圖形數(shù)據(jù)進(jìn)行對比,最后將所收集到的相同的圖像展現(xiàn)給用戶,通過對比新舊兩種檢索技術(shù)可以發(fā)現(xiàn),兩者在速度以及效率方面的內(nèi)容均有很大的改進(jìn)空間[1]。
通過調(diào)查可以發(fā)現(xiàn),當(dāng)前我國常用以下三種技術(shù)對圖像進(jìn)行檢索:第一,根據(jù)顏色之間的不同進(jìn)行檢索,檢索顏色是最常見的一種技術(shù),其能夠?qū)⑾嚓P(guān)數(shù)據(jù)更加直觀的展示出來,以直方圖的形式呈現(xiàn)出來,此項檢索技術(shù)雖然在提取以及計算方面占據(jù)優(yōu)勢,但卻無法將更加直觀的內(nèi)容展現(xiàn)給用戶;第二,根據(jù)紋理之間的不同進(jìn)行檢索,檢索人員可以通過記錄紋理的粗糙程度、方向等性能來進(jìn)行展示;第三,根據(jù)形狀之間的不同進(jìn)行檢索,此項技術(shù)主要是通過分析圖像整體的形狀以及輪廓展開研究,將數(shù)據(jù)庫中形狀相同的圖像進(jìn)行分類匯總。
與其他內(nèi)容相比,顏色所能到來的感受是最為明顯的,其能夠全面的將信息展現(xiàn)出來,不需要通過額外分割或者加工處理,并且經(jīng)過旋轉(zhuǎn)或移動是不會發(fā)生改變的。在根據(jù)顏色對圖像進(jìn)行檢索時主要會涉及到三方面內(nèi)容,即選擇適當(dāng)?shù)念伾臻g、選擇適當(dāng)?shù)奶崛》椒ㄒ约斑x擇準(zhǔn)確的匹配技術(shù),并且不同顏色空間對應(yīng)著不同的顏色模型,檢索人員可以結(jié)合實際情況來選取,確保檢索技術(shù)的作用能夠發(fā)揮出來。
例如,有某一項案件中用到了圖形顏色進(jìn)行檢索的方式,并且選用了RGB顏色空間,這主要是由于申請人考慮了顏色所轉(zhuǎn)換的空間是不同的;此外,還有一項案件使用了紋理以及圖像混合的圖像檢索方式,其所選用的是HSV的顏色空間,在檢索過程中需要從H通道中的色調(diào)入手來獲取整體的色調(diào)數(shù)組,在設(shè)置亮度時會通過調(diào)整S和V通道中的數(shù)據(jù)進(jìn)行,最后還會通過分析整體的色調(diào)數(shù)組以及亮度獲取對應(yīng)特征,且所呈現(xiàn)出的模型是多種多樣的。當(dāng)在對顏色模型進(jìn)行檢索時,在選用顏色空間時Lab、HSV是最為常見的兩種類型,并且操作方式與替換方式均十分簡便[2]。
對圖像而言,紋理能夠展現(xiàn)出一種獨特的視覺沖擊,并且也是整個檢索環(huán)節(jié)最為關(guān)鍵且無法準(zhǔn)確描述的內(nèi)容。一般而言,會通過分析紋理的構(gòu)成元素以及排列布局展開研究,重點在形態(tài)、圖論以及拓?fù)浞ǖ热N形式。而頻譜法則是將多角度分析和時頻分析進(jìn)行結(jié)合,隨后根據(jù)主要的紋理形式來分析定位,有關(guān)小波變換以及分形方面的內(nèi)容均是在此基礎(chǔ)上完成的。通過調(diào)查分析可以發(fā)現(xiàn),專家們更多的是關(guān)注紋理特征的主要提取技術(shù),目前灰度共生矩陣法、隨機(jī)場模型法是最常見的兩種,具有操作簡便、準(zhǔn)確性高的特點,值得推廣。
由于提取紋理特征的方式并不僅僅有上述幾種類型,然而整體的統(tǒng)計技巧均與統(tǒng)計法、結(jié)構(gòu)法以及頻譜法有很大的聯(lián)系。在對案件進(jìn)行分析時有一項提到了有關(guān)紋理特征所需要用到的檢索技術(shù),其主要應(yīng)用到特定的空間分析技術(shù),并應(yīng)用Variogram函數(shù)進(jìn)行統(tǒng)計,以區(qū)域化展現(xiàn)的形式對相關(guān)數(shù)據(jù)進(jìn)行統(tǒng)計,將統(tǒng)計結(jié)果以函數(shù)值的形式呈現(xiàn)出來,將整個圖形的結(jié)構(gòu)性以及統(tǒng)計性方面的內(nèi)容展現(xiàn)出來。盡管此申請是在統(tǒng)計紋理特征的基礎(chǔ)上完成,然而并沒有用到幾種常見的數(shù)據(jù)模型,此種方式能夠幫助申請人判斷圖像紋理的主要特點,同時還能有效提高準(zhǔn)確性,實現(xiàn)了對原有技術(shù)以及特征的創(chuàng)新,取得了十分顯著的效果。除此之外,還有某一案例在對紋理特征進(jìn)行檢索時主要用到了機(jī)器人進(jìn)行檢索,同時還需要用到灰度共生矩完成紋理特征檢索,使用特定模型對整個系統(tǒng)進(jìn)行數(shù)據(jù)分析,整個過程是客觀與準(zhǔn)確的[3]。
在對形狀特征進(jìn)行檢索時需要事先對檢索目標(biāo)進(jìn)行分割,在確保各項數(shù)據(jù)準(zhǔn)確的前提下開始檢索。當(dāng)前我國已有多種檢索技術(shù)用于形狀的圖像檢索,其中最常見的技術(shù)主要有以下幾種:全局特征直接匹配、基于局部不變量、基于變形模板匹配、利用變換域和形態(tài)學(xué)等物種方法。倘若按照形狀表達(dá)的形式進(jìn)行分類,則會涉及到區(qū)域的形狀描述符與基于邊緣的形狀描述符兩種,這兩種形式在應(yīng)用過程中存在不同,首先,前者主要將整個目標(biāo)區(qū)域的形狀元素進(jìn)行匯總,技術(shù)人員在選用描述方式時有面積、中心、矩、骨架等形式可供選擇;其次,后者主要將整個目標(biāo)區(qū)域的邊界元素進(jìn)行匯總,技術(shù)人員在選用檢測算子時有5種形式,即Canny、Gaussian、Sobel、Roberts和Prewitt等等[4]。
通過考察可以發(fā)現(xiàn),形狀提取無論是在圖像,還是文字檢索方面均取得了十分顯著的成就,并且還有專利在對區(qū)域形狀進(jìn)行檢索時所用到的技術(shù),其在檢索過程中使用了選中分層劃分技術(shù)對目標(biāo)區(qū)域內(nèi)容進(jìn)行檢索,并遵循旋轉(zhuǎn)分層的原理對原有技術(shù)進(jìn)行創(chuàng)新,使得當(dāng)前所選用的技術(shù)標(biāo)準(zhǔn)能夠滿足社會發(fā)展需求,技術(shù)人員可以通過研究圖像的主要特征來分析所能對圖像檢索技術(shù)帶來的便利,并且還可以借助組合描述算法來對目標(biāo)區(qū)域內(nèi)容進(jìn)行分解,此中檢索技術(shù)能夠減少儲存空間,并且利于編程環(huán)節(jié)工作的開展。曾有一案例中講到了有關(guān)形狀匹配的圖像檢索技術(shù),其在實際應(yīng)用過程中需要借助上下文算法的作用,對原有形狀以及特征進(jìn)行描述,隨后在對漢字進(jìn)行檢索時加入不變矩算法,此形式不僅能夠獲取準(zhǔn)確的函數(shù)值,還能夠獲得更多人的認(rèn)可,當(dāng)在對古書法方面的內(nèi)容進(jìn)行檢索時可以通過數(shù)字化的方式來完成,確保所呈現(xiàn)出的數(shù)據(jù)結(jié)果能夠?qū)⒆髡叻绞降乃枷胍约帮L(fēng)格展現(xiàn)出來,使用針對碑文中提取能夠在一定程度上提高形狀檢索的準(zhǔn)確性,并且檢索效率相對較高,有良好的魯棒性,值得大范圍應(yīng)用。
由于每一圖形之間都有多種空間分布形態(tài),每種空間形式又根據(jù)其特有的空間關(guān)系進(jìn)行了模型劃分,其中最常見的便是方向以及空間結(jié)構(gòu)的劃分。除此之外,要想能夠獲取根據(jù)圖像的空間關(guān)系,還應(yīng)當(dāng)對局部特征之間的內(nèi)容進(jìn)行研究、分析,目前我國常用的方式主要有三種,即SIFT、SURF和BRIEF,三種方式均有各自的特點,需要檢索人員根據(jù)實際狀況的不同展開分析,確保所選用的提取方法能夠滿足需求。
有關(guān)內(nèi)容圖像檢索方面的內(nèi)容是具有很強綜合性的,是一項全面的集成技術(shù),在對此方面內(nèi)容進(jìn)行研究時會涉及到模式識別、圖像分析以及信息檢索方面的內(nèi)容,當(dāng)前我國在各個領(lǐng)域均有了十分顯著的成就,然而在發(fā)展過程中也存在相應(yīng)的問題需要改進(jìn),希望有關(guān)部門能夠加大對改進(jìn)工作的重視,盡早解決存在的問題,推動我國內(nèi)容圖像檢索技術(shù)的發(fā)展。
在對圖像色彩特征進(jìn)行分析時主要存在的問題時有相似度定義以及視覺感兩方面的問題,這主要是因為不同個體對色彩的感知以及判斷是存在差異的,要想能夠從根本上提高檢索質(zhì)量,則必須要加大對色彩物理以及個體心理方面的研究力度,確保各項工作能夠順利開展[5]。
能夠?qū)崿F(xiàn)與數(shù)據(jù)庫技術(shù)的結(jié)合,在對大批量圖像數(shù)據(jù)進(jìn)行處理時,數(shù)據(jù)庫則會演變?yōu)闄z索系統(tǒng)的最終段部分,此種形式會對圖像特征以及計算速度造成一定的影響。
能夠?qū)崿F(xiàn)與多媒體或者互聯(lián)網(wǎng)技術(shù)的錢融合,在我國互聯(lián)網(wǎng)技術(shù)不斷發(fā)展的背景下,圖像檢索技術(shù)也應(yīng)緊跟時代發(fā)展的潮流,使圖像檢索技術(shù)能夠得到迅速發(fā)展。
通過上文的論述可以發(fā)現(xiàn),有關(guān)內(nèi)容圖像檢索中所設(shè)計到的內(nèi)容是多種多樣的,并且該技術(shù)在應(yīng)用過程中需要借助圖像檢索系統(tǒng)來完成,其不僅能夠準(zhǔn)確地對數(shù)據(jù)庫內(nèi)的圖像進(jìn)行檢索,還能夠應(yīng)用在互聯(lián)網(wǎng)、電子圖書館、商標(biāo)以及醫(yī)療行業(yè),有著良好的發(fā)展空間。目前,圖像檢索技術(shù)有著十分廣泛的應(yīng)用范圍,并且技術(shù)發(fā)展逐漸完善,成為一些大型企業(yè)的關(guān)鍵技術(shù),由文本檢索轉(zhuǎn)變?yōu)閳D像檢索,由人工檢索轉(zhuǎn)變?yōu)橹悄軝z索,由感知文字轉(zhuǎn)變?yōu)橐曈X體驗,這表明我國科學(xué)技術(shù)在不斷發(fā)展,并且是居民日益增長的物質(zhì)需求所帶來的文化產(chǎn)物,因此,有關(guān)部門在發(fā)展此項技術(shù)時要做到嚴(yán)謹(jǐn),大力推廣此項技術(shù)的發(fā)展。