劉晶 尹長(zhǎng)青
摘要:提出一種新的圖像檢索方法,用離散余弦變換(DCT)和灰度共生矩陣(GLCM)提取圖像的視覺(jué)內(nèi)容。由于基于DC系數(shù)的特征向量保留了圖像最重要的視覺(jué)分量,所以計(jì)算基于均勻量化直方圖的DC系數(shù),并且從該直方圖導(dǎo)出了用于形成DC特征向量的一些統(tǒng)計(jì)參數(shù)。然后根據(jù)剩余圖像通過(guò)取原始圖像平面和基于DC系數(shù)的重構(gòu)圖像平面之間的差異來(lái)獲得其他重要視覺(jué)特征。最后從殘差圖像的GLCM中的一些統(tǒng)計(jì)參數(shù)用來(lái)構(gòu)建基于GLCM的特征向量,并且該特征向量可以更有效的識(shí)別殘差圖像的紋理特征。公共數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果表明圖像的組合特征提取提高了圖像檢索的速度和準(zhǔn)確性。
關(guān)鍵詞:CBIR 離散余弦變換 灰度共生矩陣 特征提取 統(tǒng)計(jì)參數(shù) 殘差圖像
一、概述
本文分別考慮了用于提取變換域和空間域圖像特征的DCT和GLCM描述符。利用塊級(jí)DCT提取圖像特征與GLCM相結(jié)合的方法構(gòu)造單一特征向量,提高了圖像檢索系統(tǒng)的準(zhǔn)確性。所提出的CBIR方案的性能在兩個(gè)著名的Corel-SK和Corel-10K圖像數(shù)據(jù)庫(kù)上得到驗(yàn)證。
二、背景知識(shí)
(一)塊級(jí)離散余弦變換
塊級(jí)DCT工具主要用于數(shù)據(jù)壓縮、特征提取、水印等。DCT直接應(yīng)用于原始圖像,并將其分解成重要部分進(jìn)行特征提取和圖像分析的重要部分在各個(gè)領(lǐng)域。DCT被定義為信號(hào)的一維形式,并被擴(kuò)展到矩陣,圖像的二維變換中。這種變換具有可分離,正交,去相關(guān),能量壓縮和對(duì)稱(chēng)性質(zhì)。令f(x,y)表示通過(guò)使用DCT變換將被變換到頻域的給定圖像的圖像值。一個(gè)大小為N×N的塊的二維DCT變換可以被定義為:
大部分能量在DC系數(shù)中是簡(jiǎn)潔的,甚至DC系數(shù)和AC系數(shù)之間的特性也是非常不相似的。表1顯示了原始圖像和殘差圖像與不同的選定DCT系數(shù)之間的關(guān)系,發(fā)現(xiàn)原始圖像和殘差圖像之間的PSNR值對(duì)于選定的不同數(shù)量的DCT系數(shù)而言不會(huì)發(fā)生顯著變化。
三、塊級(jí)DCT信息和GLCM參數(shù)的CBIR
(一)DC特征向量構(gòu)造
通過(guò)計(jì)算每個(gè)DCT塊的DC系數(shù)的量化直方圖的統(tǒng)計(jì)參數(shù)來(lái)構(gòu)造DC特征向量。DC直方圖被定義為所有DCT塊的DC系數(shù)的出現(xiàn)或頻率,然后將DC直方圖量化為L(zhǎng)L個(gè)bin/interval(本例中L L=8),并從每個(gè)修改的bin/interval或group中,計(jì)算出一些統(tǒng)計(jì)值,如平均值和標(biāo)準(zhǔn)偏差以形成DC特征向量。令H(b)為DC直方圖的DC系數(shù)的頻率,則概率P(b)直方圖可以定義為:
五、結(jié)束語(yǔ)
本文提出了本文提出了一種基于塊級(jí)DCT信息和殘差圖像的GLCM參數(shù)的CBIR檢索方法。通過(guò)基于DC特征的分量和GLCM參數(shù)串聯(lián)起來(lái),以有效地形成低維特征向量,其中基于DC和GLCM的特征向量被單獨(dú)歸一化。