彭偉勇,王小華,姚金良
(杭州電子科技大學(xué)計(jì)算機(jī)應(yīng)用技術(shù)研究所,浙江杭州310018)
基于內(nèi)容的圖像拷貝檢測(cè)通過(guò)從檢測(cè)圖像中提取唯一的魯棒的特征信息,以判斷圖像之間是否存在拷貝現(xiàn)象[1]。現(xiàn)有方法可以分為基于全局特征和基于局部特征兩種。文獻(xiàn)2利用圖像高斯過(guò)濾后低頻部分中的統(tǒng)計(jì)特征(直方圖形狀和均值)進(jìn)行拷貝檢測(cè)。文獻(xiàn)3將圖像的Y平面進(jìn)行分割,以每一塊與其8鄰域塊之間的相關(guān)系數(shù)作為特征簽名。這些全局特征算法主要獲取圖像整體結(jié)構(gòu)信息,具有速度快,對(duì)整體圖像攻擊魯棒,但他們對(duì)幾何旋轉(zhuǎn)和局部攻擊檢測(cè)效果差。相反,基于局部特征算法對(duì)局部攻擊檢測(cè)效果好,但計(jì)算復(fù)雜度較高和整體辨識(shí)性較低,例如文獻(xiàn)4對(duì)圖像分塊,提取圖像邊緣特征進(jìn)行檢測(cè)。隨著圖像多種復(fù)雜拷貝攻擊的出現(xiàn),圖像拷貝檢測(cè)算法迎來(lái)了新的挑戰(zhàn)。
基于多特征集成的魯棒圖像拷貝檢測(cè)算法流程圖如圖1所示。
圖1 基于多特征集成的魯棒圖像拷貝檢測(cè)算法流程圖
本文首先將預(yù)處理后的圖像進(jìn)行整體DCT變換,并對(duì)變換后的AC系數(shù)進(jìn)行zigzag掃描,提取AC系數(shù)中的中低頻系數(shù),計(jì)算其順序測(cè)度作為拷貝檢測(cè)第一級(jí)的圖像特征;為能應(yīng)對(duì)圖像局部變化,利用Harris檢測(cè)器提取圖像的局部特征點(diǎn),在以Harris點(diǎn)所在鄰域內(nèi)采樣,提取該點(diǎn)的主方向,進(jìn)而生成128維Harris特征向量,并利用K-D樹(shù)建立特征索引,便于圖像之間的Harris點(diǎn)匹配,利用RANSAC算法,剔除錯(cuò)誤的匹配對(duì)。最后采用級(jí)聯(lián)式的過(guò)濾框架融合兩種特征的檢測(cè)結(jié)果。
DCT是一種正交變換方法,其數(shù)學(xué)公式表示為:
式中,u=0,1,…,M-1;v=0,1,…,N -1;a(t)=,y為空間域的采樣值,u,v為頻率域的采樣值,f(x,y)分別表示圖像空間域中坐標(biāo)為x和y象素點(diǎn)的灰度值。
DCT的中、低頻系數(shù)能很好的反映圖像的概貌,并隨著圖像的縮放、拉伸呈現(xiàn)出相應(yīng)的比例關(guān)系,能很好的抵抗圖像的加噪、濾波、縮放等攻擊,也巧妙地彌補(bǔ)了下一級(jí)特征對(duì)縮放攻擊不魯棒的缺陷。若圖像橫坐標(biāo)的縮放比例為λ1,縱坐標(biāo)的縮放比例為λ2,則DCT中低頻AC系數(shù)對(duì)應(yīng)的縮放比例為
Harris算子是一種角點(diǎn)提取算子,其數(shù)學(xué)表達(dá)式為:
式中,矩陣M為:
式中,Ix,Iy分別為圖像x,y方向的梯度值;w(x,y)為高斯濾波器;設(shè)矩陣M的兩個(gè)特征值為λ1和λ2,M具有旋轉(zhuǎn)不變性,定義特征點(diǎn)的響應(yīng)函數(shù)為:
式中,k一般取值為0.04-0.06。當(dāng)R大于給定的閾值,且在局部范圍內(nèi)是極大值時(shí),對(duì)應(yīng)的象素點(diǎn)即Harris興趣點(diǎn)。提取特征點(diǎn)之后,在其所在鄰域內(nèi)采樣,確定出具有旋轉(zhuǎn)不變性的特征點(diǎn)主方向。圖像點(diǎn)L(x,y)處的梯度值與方向計(jì)算公式如:
梯度直方圖范圍是0-360°,每10°為一個(gè)柱,當(dāng)存在另一個(gè)峰值的能量大于或等于主峰值80%時(shí),將其作為該特征點(diǎn)另一個(gè)主方向,大約僅有15%點(diǎn)被賦予多個(gè)主方向。最后用拋物線(xiàn)擬合與每個(gè)峰頂最近的3個(gè)峰值,進(jìn)而準(zhǔn)確獲取峰頂位置,作為特征點(diǎn)準(zhǔn)確的主方向。
將坐標(biāo)軸旋轉(zhuǎn)到特征點(diǎn)主方向,以特征點(diǎn)為中心取16×16窗口,如圖2(a)所示,為了簡(jiǎn)化,圖2(a)中只給出了8×8窗口,中央點(diǎn)為當(dāng)前特征點(diǎn)坐標(biāo),每個(gè)小格代表特征點(diǎn)鄰域一個(gè)象素,箭頭指向該象素點(diǎn)的梯度方向,長(zhǎng)度表示該點(diǎn)的梯度模值,圈內(nèi)代表高斯加權(quán)范圍,然后在每個(gè)4×4圖像塊上計(jì)算8個(gè)方向的梯度方向直方圖,如圖2(b)所示,每個(gè)4×4圖像塊形成一個(gè)種子點(diǎn),圖2(b)中給出的是4個(gè)種子點(diǎn),實(shí)際上算法共16個(gè)種子點(diǎn),每個(gè)種子點(diǎn)有8個(gè)方向向量信息,形成128維的Harris特征向量,將特征向量進(jìn)行歸一化,去除光照變化影響。
當(dāng)特征向量生成后,采用K-D樹(shù)建立索引,搜索每個(gè)特征點(diǎn)的兩個(gè)最近鄰特征點(diǎn)。在這兩個(gè)特征點(diǎn)中,如果最近的歐式距離除以次近距離小于某個(gè)比例閾值,則接受這一匹配對(duì);再利用RANSAC隨機(jī)抽樣一致性算法,剔除錯(cuò)誤的匹配對(duì)。
圖2 圖像梯度與特征點(diǎn)特征描述
級(jí)聯(lián)式過(guò)濾框架如圖3所示。采用全局特征不僅可以處理大部分常見(jiàn)的圖像攻擊,而且節(jié)省了檢測(cè)時(shí)間,更能彌補(bǔ)下一級(jí)Harris角點(diǎn)對(duì)圖像縮放的不魯棒缺點(diǎn);然后采用相對(duì)精細(xì)的Harris角點(diǎn)特征進(jìn)一步檢測(cè),解決上一級(jí)檢測(cè)級(jí)中對(duì)旋轉(zhuǎn)、裁剪等局部圖像攻擊不魯棒問(wèn)題。兩級(jí)過(guò)濾框架不僅發(fā)揮了各自?xún)?yōu)勢(shì),還彌補(bǔ)了對(duì)方的不足,實(shí)驗(yàn)結(jié)果表明級(jí)聯(lián)式過(guò)濾框架在保證檢測(cè)精度最大化同時(shí),節(jié)省了時(shí)間。
圖3 級(jí)聯(lián)式過(guò)濾框架
從網(wǎng)絡(luò)圖像數(shù)據(jù)庫(kù)[6]中收集10 000張任意大小圖像作為測(cè)試數(shù)據(jù)庫(kù)TD。在TD中隨機(jī)選取30張作為查詢(xún)圖像,采用Photoshop軟件與stirmark軟件對(duì)查詢(xún)圖像進(jìn)行11種混合攻擊與40種單一攻擊。
第一級(jí)檢測(cè)系統(tǒng)在不同相似度閾值下對(duì)單一攻擊的查全率和查準(zhǔn)率比較如表1所示。從表1可以看出隨著相似度閾值sim的降低,查準(zhǔn)率相應(yīng)降低,查全率反而增長(zhǎng)。經(jīng)實(shí)驗(yàn),將最佳閾值設(shè)置為0.75。
本文與Kim提出的算法[7]進(jìn)行對(duì)比性實(shí)驗(yàn),圖像部分攻擊實(shí)驗(yàn)結(jié)果如表2所示。實(shí)驗(yàn)顯示Kim算法對(duì)于旋轉(zhuǎn)、裁剪、拉伸、平移等攻擊敏感。
表1 不同閾值下的檢測(cè)結(jié)果比較
本文算法融合了圖像局部與全局特征信息,綜合時(shí)域與頻域的信號(hào)處理,巧妙利用兩級(jí)檢測(cè)系統(tǒng)特征之間的互補(bǔ)作用,與已有算法相比,本文算法在查詢(xún)圖像經(jīng)過(guò)各種幾何攻擊和常規(guī)信號(hào)處理之后,具有較高查準(zhǔn)率和查全率的同時(shí),提高了系統(tǒng)的檢測(cè)效率。
表2 Kim方法與本文方法比較(%)
[1] Hampapur Arun,Bolle Rudolf M.Comparison of distance measures for video copy-detection[C].Los Alamitos:IEEE Computer Society,2001:737 -740.
[2] 馬曉普,劉妍.基于統(tǒng)計(jì)特征的魯棒圖像拷貝檢測(cè)技術(shù)[J].計(jì)算機(jī)應(yīng)用,2009,29(8):2 233-2 235.
[3] Wu Ming-Ni,Lin Chia-Chen,Chang Chin-Chen.A robust content-based copy detection scheme[J].Fundamenta Informaticae,2006,71(2/3):351 -366.
[4] Lin Chia-Chen,Wang Shing-Shoung.An edge-based image copy detection scheme[J].Fundamenta Informaticae,2008,83(3):299-318.
[5] Davis B J,Nawab SH.The relationship of transform coefficients for differing transforms and/or differing subblock sizes[J].IEEE Transactions on Signal Processing,2004,52(2):1 458 -1 461.
[6] Wang JZ,Li Jia.Automatic linguistic indexing of pictures by a statistical modeling approach[EB/OL].http://wang.ist.psu.edudocsrelated/,2003 -11 -12.
[7] Kim C.Content-based image copy detection[J].Signal Processing:Image Communication,2003,18(3):169 -184.