【摘 要】 基于內(nèi)容的圖像檢索是圖像檢索研究領(lǐng)域的核心內(nèi)容。與傳統(tǒng)的依賴(lài)文字檢索圖像的方式不同,基于內(nèi)容的圖像檢索是通過(guò)提取圖像的特征信息并利用各種分析算法,學(xué)習(xí)算法將這些特征映射成反映圖像本質(zhì)的語(yǔ)義特征。本課題首先介紹了傳統(tǒng)的圖像處理技術(shù)和一些底層特征的提取方法,然后依據(jù)近似匹配的相關(guān)算法對(duì)底層特征進(jìn)行分類(lèi),提出了根據(jù)用戶(hù)選擇滿(mǎn)意樣本來(lái)優(yōu)化分類(lèi)結(jié)果的思路。
【關(guān)鍵詞】 圖像檢索 底層特征提取 近似匹配
一、需求分析
本文是通過(guò)提取圖像底層特征,利用近似匹配算法建立分類(lèi)模型,并由用戶(hù)反饋優(yōu)化分類(lèi)樣本已達(dá)到基于內(nèi)容的圖像檢索。本系統(tǒng)要滿(mǎn)足以下功能:加載目標(biāo)圖像,并可提取其基本特征信息;建立被用于檢索的圖像庫(kù)和其對(duì)應(yīng)的底層特征庫(kù);反饋給用戶(hù)近似的檢索結(jié)果及優(yōu)化選項(xiàng);能夠?qū)z索結(jié)果作出數(shù)字化評(píng)估。該系統(tǒng)在建立特征庫(kù)后,通過(guò)算法的計(jì)算和用戶(hù)的優(yōu)化,找到語(yǔ)義程度上最滿(mǎn)意的結(jié)果,以達(dá)到滿(mǎn)足本課題的要求。
二、詳細(xì)設(shè)計(jì)
本文在規(guī)劃圖像檢索的過(guò)程中時(shí),不僅需要提取出圖像底層的多方面重要特征,還需要將這些特征轉(zhuǎn)化成向量或數(shù)值,一方面方便記錄特征信息以對(duì)其建立索引,使之便于處理和存儲(chǔ),另一方面使其適應(yīng)近似匹配算法.以便利用這些特征為圖像分類(lèi)。在檢索算法的設(shè)計(jì)中,如何利用用戶(hù)的反饋,動(dòng)態(tài)地優(yōu)化特征的選擇和分類(lèi)的方法是本課題設(shè)計(jì)的核心。本部分分三個(gè)部分,分別介紹了底層特征的具體提取算法,近似匹配算法和反饋優(yōu)化檢索的設(shè)計(jì)過(guò)程。
2.1 圖像顏色特征
顏色空間對(duì)于相關(guān)顏色以數(shù)字形式表示是一個(gè)很重要的成分,是數(shù)字化顏色理論的重要組成部分。RGB顏色空間是圖像處理中最常用的顏色空間,它通過(guò)互相垂直的坐標(biāo)軸表示一幅圖像在紅、綠、藍(lán)三個(gè)色度上的分布情況。
2.2 圖像紋理特征
方塊編碼(Block Truncation Coding),是一種快速有損圖像壓縮技術(shù)。其原理是將圖像劃分成若干子圖像塊,然后統(tǒng)計(jì)子圖像塊的平均值,將塊中低于平均值的像素點(diǎn)置為0,高于平均值的點(diǎn)置為1,這樣就將圖像二值化,可以作為二電平輸出,不但傳輸速度快,且重建時(shí)可保持均值。
2.3 近似匹配算法
在將圖像的顏色、形狀、紋理等底層特征提取出來(lái)并記錄后,這些特征就變成向量的形式供近似匹配算法使用以達(dá)到比較圖像間相似度的目的。不同的近似匹配算法計(jì)算出的相似結(jié)果也不同,對(duì)于不同的特征和相似性需求,需要采用多種近似匹配算法,再對(duì)結(jié)果評(píng)估后確定合適的一種。
三、系統(tǒng)測(cè)試
對(duì)于本軟件的檢索方式,分為綜合檢索和基于單一特征檢索兩種。其中單一特征檢索是根據(jù)目標(biāo)圖像所提取出的一種特征向量(如灰度顏色直方圖)與特征庫(kù)中其他圖像的同一特征向量做比較,找尋最近的圖片,以此來(lái)反映該特征的檢索能力;而綜合檢索則是將所有7個(gè)主要的底層特征按流程逐一檢索,每一步采納用戶(hù)反饋的信息,最后綜合所有特征向量,在反饋信息修正下進(jìn)行檢索,以此來(lái)融入用戶(hù)反饋的內(nèi)容達(dá)到精確檢索的目的。對(duì)于檢索的結(jié)果,本軟件也提供了數(shù)值化的評(píng)估方式,通過(guò)多種數(shù)據(jù)具體地反映檢索效果。
在CBIR的測(cè)試中,查全率(recall)和查準(zhǔn)率(precision)是評(píng)價(jià)檢索效果的主流方法。其中查全率表示檢索到有效的圖像占圖像庫(kù)中所有有效圖像的比例,而查準(zhǔn)率表示有效圖像占所有返回結(jié)果的比例。定義如下
S檢索到的有效圖數(shù)目,u為檢索結(jié)果中無(wú)效圖的數(shù)目,v為在圖像庫(kù)中有效但未被檢索到的圖像數(shù)目。
四、結(jié)論
本課題設(shè)計(jì)并實(shí)現(xiàn)了基于用戶(hù)反饋優(yōu)化算法的圖像檢索系統(tǒng),該系統(tǒng)能夠?qū)⒂脩?hù)對(duì)檢索結(jié)果的評(píng)價(jià)轉(zhuǎn)化為檢索方法的改進(jìn)參數(shù),使系統(tǒng)在交互過(guò)程中動(dòng)態(tài)地達(dá)到圖像精準(zhǔn)檢索的目的。在設(shè)計(jì)過(guò)程中,圖像底層特征信息的提取和檢索優(yōu)化的算法是主要解決的問(wèn)題。在實(shí)現(xiàn)的過(guò)程中既遇到了棘手的問(wèn)題和難點(diǎn),也學(xué)到了圖像處理和分類(lèi)的許多方法技巧。
【參考文獻(xiàn)】
[1] 孫君頂.圖像特征提取與檢索技術(shù)[M].北京:電子工業(yè)出版社,2015.
[2] 王永明,王貴錦.圖像局部不變性特征與描述[M].北京:國(guó)防工業(yè)出版社,2010.
作者簡(jiǎn)介:張宇(1993—),女,漢族,山東青島人,管理學(xué)學(xué)士,單位:天津師范大學(xué)管理學(xué)院企業(yè)管理系,研究方向:企業(yè)管理。