白杰,趙琰
(上海電力大學電子與信息工程學院,上海 200090)
隨著網(wǎng)絡(luò)媒體的日益發(fā)展,用戶可以將更多的視頻等包含大量圖像的信息傳入互聯(lián)網(wǎng)。這些圖像通過photoshop等圖像處理軟件進行一定操作就可以產(chǎn)生諸如改變亮度、添加水印、馬賽克等拷貝版本。若有人惡意篡改圖像則可能帶來嚴重后果,因而正確區(qū)分這些圖像至關(guān)重要。圖像哈希技術(shù)的出現(xiàn)為這類問題帶來了解決方法。圖像哈希是指將一副圖像定向映射為一串字符或數(shù)字序列。哈希算法需要具備具有魯棒性、區(qū)別性、安全性、緊湊性等基本特性,在圖像分類、檢索等領(lǐng)域中被廣泛應用。
1)基于變換的圖像哈希。早期哈希主要通過圖像變換來提取特征,如離散傅里葉變換(DFT)、離散余弦變換(DCT)、小波變換、對數(shù)極坐標變換等。文獻[1]結(jié)合對數(shù)極坐標變換和離散傅里葉變換對圖像提取旋轉(zhuǎn)不變特征矩陣來構(gòu)建哈希序列。文獻[2]將DFT變換和Radon變換結(jié)合構(gòu)建哈希,通過量化DFT變換系數(shù)和提取變換后的特征得到哈希。以上兩種算法在對抗攻擊的魯棒性方面效果有限,且適用攻擊操作種類較少。文獻[3]考慮到對數(shù)極坐標變換具有良好的旋轉(zhuǎn)不變性,結(jié)合LT變換和四元數(shù)傅里葉變換,將經(jīng)過LT變換的次級圖像提取QDFT幅度矩陣完成哈希算法,該算法魯棒性較強但可對抗操作不多。文獻[4]將圖像進行非重疊分割,提取每個圖像塊的DCT系數(shù)并量化得到魯棒的哈希序列。基于同樣的非重疊分割思想,文獻[5]使用canny算子計算圖像塊的特征點,選取代表性強的特征塊和位置信息與DCT系數(shù)連接,經(jīng)過主成分分析(PCA)得到哈希序列,這兩種算法可對抗的攻擊操作種類有所增加,但旋轉(zhuǎn)攻擊抗性都較弱。文獻[6]使用Radon變換提取圖像系數(shù)并進行一維DCT,通過低頻系數(shù)統(tǒng)計特征得到哈希序列,該算法的旋轉(zhuǎn)抗性較優(yōu)。文獻[7]利用多級離散小波變換(DWT)提取特征構(gòu)造哈希序列。文獻[8]在小波變換基礎(chǔ)上結(jié)合圖像的特征點構(gòu)造哈希序列,增強了算法的區(qū)別性。文獻[9]提出將對數(shù)極坐標變換和Gabor變換相結(jié)合提取圖像特征,該算法在區(qū)分性良好的基礎(chǔ)上還具有較強的緊湊性。早期的圖像哈希算法結(jié)構(gòu)較為簡單,主要聚焦于提高算法的魯棒性和區(qū)別性,但對計算效率、攻擊容量有所欠缺。因此,在保證算法魯棒性的前提下,為了提高算法的處理效率,序列緊湊性也成為優(yōu)化的目標。
2)基于數(shù)據(jù)降維的圖像哈希。文獻[10]將局部線性嵌入用于哈希序列的壓縮,降低了算法的計算代價。隨后文獻[11]提出使用圖像的最大內(nèi)接圓進行等面積環(huán)形分割將圖像重組為列,再進行非負矩陣分解提取特征,該算法對旋轉(zhuǎn)攻擊的魯棒性良好,但由于使用環(huán)分割導致圖像邊緣處的敏感性不足。文獻[12]提取圖像塊紋理特征并壓縮。文獻[13]將小波分解和CS-LBP相結(jié)合,該算法性能良好,且具備了一定的拷貝檢測能力。文獻[14]提出利用WeberLBP提取圖像的紋理特征,并與圖像的顏色特征相結(jié)合構(gòu)建哈希算法,使用PCA壓縮數(shù)據(jù)使得算法具有不錯的緊湊性。文獻[15]在Lab顏色空間中結(jié)合環(huán)形分區(qū)和向量不變矩,提出了具備區(qū)別性和強魯棒性的算法。
3)基于顏色特征和圖像矩的圖像哈希。隨著研究的深入,簡單的變換方式和單一的特征構(gòu)成已經(jīng)不能滿足對算法性能的要求。文獻[16]將RGB彩色圖像轉(zhuǎn)換到HSI和YCbCr顏色空間,計算各分量均值和方差,提取局部顏色特征。文獻[17]以圖像顏色特征作為出發(fā)點,提取彩色圖像的對立色并分塊提取顏色特征,再對亮度圖像進行四叉樹分解得到結(jié)構(gòu)特征,聯(lián)合兩種特征組成哈希序列。該算法具有強魯棒性并且可以進行篡改定位。文獻[18]使用圖像的Zernike矩構(gòu)成哈希序列,結(jié)合保角變換,提取圖像的角信息,提高算法魯棒性且可以進行篡改定位。
此外,文獻[19]利用四元數(shù)奇異值分解計算出拼接圖像的噪聲信息,增強了圖像的特征表達。文獻[20]使用空洞卷積提取不同尺度的圖像特征,將多尺度特征融合后作為網(wǎng)絡(luò)的輸入,有效增強了算法的檢測性能。這些針對圖像特征的提取和表達方面的改進值得學習借鑒。
目前的哈希算法在保證魯棒性的前提下各具優(yōu)勢,但仍存在一些短板,如針對灰度圖像的方案整體魯棒性較強但不適用于彩色圖像,可對抗的攻擊種類較少。本文提出一種可以直接處理彩色圖像并且在魯棒性、區(qū)別性和序列緊湊性上具備一定優(yōu)勢的算法。由于拉蓋爾矩對多數(shù)篡改操作具有魯棒性,將其與四元數(shù)理論相結(jié)合拓展到圖像哈希中,直接提取RGB圖像的特征,得到的全局特征具有較好的魯棒性。對預處理后的圖像提取能量,在三維空間視角下提取能量的結(jié)構(gòu)特征,在保證算法魯棒性的同時提高區(qū)別性,增強對旋轉(zhuǎn)攻擊的魯棒性。
圖1是結(jié)合四元數(shù)拉蓋爾矩和三維結(jié)構(gòu)特征的哈希算法流程,主要由預處理、特征提取、哈希生成組成(彩色效果見《計算機工程》官網(wǎng)HTML版,下同)。圖像預處理是指對圖像進行雙線性插值得到二次圖像,再對二次圖像進行多尺度融合分別得到高斯融合圖像和拉普拉斯融合圖像。特征提取包括全局特征和三維能量結(jié)構(gòu)特征,全局特征是指提取圖像的四元數(shù)拉蓋爾矩系數(shù),三維能量結(jié)構(gòu)特征是指利用亮度圖像的能量和非重疊分割后各子塊的能量,在三維空間下提取結(jié)構(gòu)特征。哈希生成將所得各部分特征量化組合得到中間哈希,經(jīng)過密鑰加密生成哈希序列。
圖1 哈希算法流程Fig.1 Procedure of Hash algorithm
用雙線性插值統(tǒng)一輸入圖像尺寸為N×N,以處理不同大小的輸入圖像。該操作可以略微提升縮放攻擊抗性,對統(tǒng)一尺寸圖像I0進行下采樣。下采樣的模糊圖像記為I1、I2、I3、I4。再用圓盤均值濾波器進行多級濾波。拉普拉斯金字塔表達式如式(1)所示:
(1)
圖像金字塔包含不同尺度下圖像的信息。I0、I1、I2、I3為四級高斯金字塔,L1、L2、L3、L4為四級拉普拉斯金字塔,將圖像金字塔進行融合可以發(fā)揮增強圖像的作用。通過多尺度融合得到二次圖像的高斯融合圖像IM和拉普拉斯融合圖像LM,如式(2)所示:
(2)
文獻[21]提出在笛卡兒坐標系中灰度圖像的廣義拉蓋爾矩,廣義拉蓋爾多項式可以由式(3)定義:
(3)
由式(3)可得,廣義拉蓋爾矩的定義如式(4)所示:
(4)
其中:fgray(i,j)表示一幅N×N的灰度圖像。
(5)
表1 Ln,m系數(shù)Table 1 Ln,mcoefficients
由于兩種融合圖像求得的四元數(shù)拉蓋爾矩系數(shù)是復數(shù)形式,因此對其求模并排列為行向量,則IM的四元數(shù)拉蓋爾矩系數(shù)為G= [g1,g2,…,gn(n+1)/2],LM的四元數(shù)拉蓋爾矩系數(shù)為J= [j1,j2,…,jn(n+1)/2]。按式(6)分別對融合圖像的矩系數(shù)進行二值化,GM和JM為G和J的均值,G1和J1為二值化向量,i= 1,2,…,n(n+1)/2。
(6)
連接融合圖像的矩系數(shù)得到全局特征HQ=[G1,J1],長度為L1=n(n+1)。
文獻[22]提出圖像在經(jīng)過常見的攻擊操作前后,其能量并不會發(fā)生大的波動,所以可以認為圖像能量對于常見攻擊操作有較好的魯棒性。算法在YCbCr顏色空間下提取高斯融合圖像的亮度圖像Y,對于尺寸為N×N的亮度圖像,它的能量E可以表示為:
(7)
其中:trace(·)表示矩陣的跡;yi,j表示亮度圖像Y的像素值。本文選擇在三維空間內(nèi)進行特征提取,圖像的三維能量結(jié)構(gòu)特征由兩部分組成。第一部分先計算亮度圖像Y的能量矩陣NE,以NE的行位置為x軸、列位置為y軸、能量值為z軸構(gòu)建三維模型,在xOz和yOz兩個投影面上畫出峰頂曲線和峰谷曲線,求取峰值點與谷值點連線的夾角余弦值。第二部分以b×b的子塊大小非重疊分割亮度圖像,計算各子塊能量值得到亮度圖像的分塊能量矩陣NY,以NY的行位置為x軸、列位置為y軸、能量值為z軸構(gòu)建三維模型并畫出等高線,求出特定點到等高線上最近點和最遠點連線的余弦值,從而充分提取三維結(jié)構(gòu)特征。
本文算法三維特征在構(gòu)造時主要考慮:1)使用圖像能量構(gòu)造三維模型;2)通過提取峰谷值點和分重疊分割使哈希序列更緊湊;3)加入等高線特征增強抵抗旋轉(zhuǎn)攻擊的能力。
三維能量圖像和相應投影面的峰谷值曲線如圖2所示。
圖2 三維能量模型和峰谷值曲線Fig.2 Three-dimensional energy model and peak and valley value curves
按照式(8)獲得NE在xOz投影面下的峰頂曲線M1和峰谷曲線M2,同理可以得到NE在yOz投影面下的峰頂曲線M3和峰谷曲線M4。
M1=max(NE,1),M2=min(NE,1)
(8)
其中:min(·,1)和max(·,1)表示按行取NE最小值和最大值。在不同投影面的峰谷值曲線上等間距取出16對峰谷值點,記xOz投影面取出的峰值點集為M1P,谷值點集為M2V,yOz投影面取出的峰值點集為M3P,谷值點集為M4V。提取xOz投影面峰值點集M1P在xOy平面上的位置信息矩陣P=[P1,P2,…,P16]與yOz投影面峰值點集M3P在xOy平面上的位置信息矩陣U=[U1,U2,…,U16]。同理,xOz投影面谷值點集M2V在xOy平面上的位置信息矩陣Q=[Q1,Q2,…,Q16],yOz投影面谷值點集M4V在xOy平面上的位置信息矩陣V=[V1,V2,…,V16]。將xOz投影面上的峰值點集按照序數(shù)從大到小依次與谷值點集序數(shù)從小到大的順序相連,形成線段集S=[P1Q16,P2Q15,…,P16Q1],共計16條線段。同理,取得yOz投影面上的峰值點與谷值點的線段集K=[U1V16,U2V15,…,U16V1]。記xOy平面為F,求出這些線段與xOy平面夾角的余弦值,將一系列余弦值排列成行向量并按式(9)進行二值化。
(9)
其中:SM表示xOz平面線段集與水平面F夾角余弦值的平均值;KM表示yOz平面線段集與水平面F夾角余弦值的平均值,i=1,2,…,16;H1、H2長度都為16。以上是通過圖像在三維能量模型上不同投影面的特征點得到局部結(jié)構(gòu)特征。
為了進一步提高算法對于旋轉(zhuǎn)攻擊的魯棒性,接下來對圖像進行抗旋轉(zhuǎn)特征提取。使用圖像子塊能量值作為等高線特征的z軸主要原因如下:1)圖像子塊的能量值對常見的攻擊操作同樣具有良好的魯棒性;2)分塊處理可以在不影響算法魯棒性的前提下有效降低數(shù)據(jù)維度,提高計算效率;3)為了提高對于旋轉(zhuǎn)攻擊的魯棒性,選擇在三維結(jié)構(gòu)上尋找等高線提取抗旋轉(zhuǎn)的結(jié)構(gòu)特征,圖像分塊處理可以使算法以微弱降低ROC曲線表現(xiàn)力為代價,明顯提升對旋轉(zhuǎn)攻擊的魯棒性。具體步驟如下:算法利用亮度圖像的分塊能量矩陣NY的信息,以行位置信息為x軸、列位置信息為y軸、子塊能量值為z軸構(gòu)造三維模型。在三維結(jié)構(gòu)上畫出一系列等高線,選定xOy平面的中心點O作為原點,找到原點在每一條等高線上距離最近和最遠的兩點。這樣做的優(yōu)點是當圖像受到任意角度的旋轉(zhuǎn)攻擊,分塊能量矩陣的三維模型會隨之發(fā)生旋轉(zhuǎn),但等高線只會發(fā)生水平旋轉(zhuǎn),所選取的原點到等高線上任意一點的連線與水平面的夾角在旋轉(zhuǎn)前后不會發(fā)生改變。所以選取這樣一組在任意角度旋轉(zhuǎn)攻擊下保持不變的特征有助于提高算法的魯棒性。分塊能量矩陣NY的三維模型等高線和等高線在xOy平面的投影示意圖如圖3所示。
圖3 等高線模型示意圖Fig.3 Schematic diagram of the contour model
為便于觀察,圖3顯示了取4條等高線的三維結(jié)構(gòu)示意圖,且標注出了中心點O所在位置。求解原點到等高線近點遠點連線與水平面F的余弦值,記為近點余弦值集Dmin=[D1,D2,…,Dn],遠點余弦值集Dmax=[d1,d2,…,dn],將其按式(10)進行二值化:
(10)
其中:DM為所有連線與水平面夾角余弦值的平均值;i=1,2,…,n;H3、H4長度都為n。通過聯(lián)合投影面峰谷值點的局部結(jié)構(gòu)特征和分塊能量矩陣的等高線特征,得到圖像的三維能量結(jié)構(gòu)特征HE=[H1,H2,H3,H4],L2=2n+32表示HE的長度。
連接HQ和HE得到中間哈希Hmid=[HQ,HE],本文算法得到的哈希序列長度為L=L1+L2=n(n+1)+2n+32。出于安全性考慮,用隨機生成的1 000個偽隨機數(shù)列w重排中間哈希Hmid得到最終哈希序列h,如式(11)所示:
h(i)=Hmid(w[i])
(11)
其中:w(i)表示偽隨機數(shù)序列w的第i個數(shù)。本文算法得到二進制哈希序列,選擇漢明距離作為圖像相似度判斷依據(jù),當兩幅圖像的漢明距離小于閾值T時判斷為相似圖像,反之為不同圖像。漢明距離D的計算公式如式(12)所示:
(12)
其中:h1(i)和h2(i)是h中的第i個元素;?為異或運算;h1、h2表示進行判斷的兩幅圖像。
本節(jié)主要進行包括魯棒性實驗、區(qū)別性實驗、參數(shù)分析、不同算法對比。實驗中使用的參數(shù)如下:圖像歸一化尺寸N=256,圖像子塊大小b=16,階數(shù)n=8,故算法的哈希序列長度為L=120 bit。所有的實驗均通過MATLABR2019a平臺進行仿真。
魯棒性實驗中測試樣本由圖4所示的20幅彩色圖像組成。
圖4 魯棒性實驗圖像Fig.4 Images of robustness experiments
按照如表2所示的操作攻擊每幅測試圖像,單個測試圖有66個相似版本,將測試圖像與相似圖像配對,計算相似圖像對的哈希距離。
表2 魯棒性實驗攻擊參數(shù)Table 2 Attack parameters for robustness experiments
表3是20幅測試圖像經(jīng)過以上12類攻擊操作得到的相似圖像與原圖像的哈希距離統(tǒng)計。由表3可以看出,相似圖像與原圖像的哈希距離都落在0~18區(qū)間內(nèi),哈希距離均值都不超過12。說明本文算法對常見的攻擊操作具有良好的魯棒性,并且當閾值設(shè)置到18以上時,理論上可以將全部的相似圖像識別出來。
表3 哈希距離表Table 3 Hash distance table
圖5展示了圖4中前5個測試樣本在不同篡改攻擊下的哈希距離分布,可得算法對多種常見攻擊的魯棒性都較好。
圖5 魯棒性實驗結(jié)果Fig.5 Results of robustness experiments
表4 區(qū)別性實驗攻擊參數(shù)Table 4 Attack parameters of the differentiation experiment
圖6展示了不同圖像對和相似圖像對的哈希距離分布。其中,橫坐標表示漢明距離,縱坐標表示該距離下相似或不同圖像對數(shù)目。由圖6可以看出,相似圖像對漢明距離區(qū)間為0~45,不同圖像對漢明距離區(qū)間為22~118,即在漢明距離為22~45時,相似圖像對和不同圖像對發(fā)生了重疊。算法選取碰撞率(PC)和檢錯率(PE)指標衡量區(qū)別性,根據(jù)式(13)計算確定合適的閾值區(qū)分相似和不同圖像對。
圖6 漢明距離分布Fig.6 Hamming distance distribution
PC=NC/ND
PE=NE/NS
(13)
其中:NC表示不同圖像誤判相似圖像數(shù);ND為不同圖像數(shù);NE表示相似圖像誤判不同圖像數(shù);NS為相似圖像數(shù)。計算結(jié)果如表5所示,由圖6和表5可知,當閾值T=34時,碰撞率為7.80×10-5,檢錯率為2.42×10-5,綜合考慮碰撞率和檢錯率,選擇T=34為閾值。
表5 各閾值檢錯率和碰撞率Table 5 Error detection rate and collision rate for each thresholds
2.3.1 階數(shù)n和分塊大小b對算法的影響
實驗在除階數(shù)和分塊大小以外的條件固定情況下,取n=[6,7,8,9],b=[8,16],兩兩組合分別進行實驗。通過ROC[25]曲線衡量選取階數(shù)和分塊大小的不同取值時算法的綜合性能如圖7所示。參數(shù)分析實驗的數(shù)據(jù)集與前文區(qū)別性實驗相同。通過錯誤接受率(PFPR)和正確接受率(PTPR)指標衡量區(qū)別性,計算公式如式(14)所示:
圖7 各分塊大小和階數(shù)下的ROC曲線Fig.7 ROC curves for each block size and order
PFPR=n1/N1
PTPR=n2/N2
(14)
其中:n1指錯判相似圖像對數(shù);n2為正確判定相似圖像對數(shù);N1和N2分別為不同圖像對和相似圖像對的總數(shù)。
圖7顯示,當n=8、b=16時,算法的ROC曲線表現(xiàn)力最佳,且當b的取值固定為8或16時,曲線表現(xiàn)力都隨著n由6增加到8持續(xù)提高,但n=9時哈希序列長度達到140,等高線特征長度達到18,一定程度上影響了算法的綜合表現(xiàn)力,故綜合考慮當n=8、b=16時為最佳選擇。
2.3.2 多尺度融合處理的效果
由于所提算法在預處理的過程中為了強化對圖像信息的表達,對插值以后的二次圖像進行了多尺度融合的處理,因此在所有參數(shù)都相同的情況下,將經(jīng)過多尺度融合的算法和直接使用二次圖像進行特征提取并計算哈希的算法進行比較。ROC曲線對比如圖8所示,說明算法經(jīng)過多尺度融合后,區(qū)別性有所提高。
圖8 多尺度融合前后的ROC曲線Fig.8 ROC curves before and after multi-scale fusion
2.3.3 等高線特征對旋轉(zhuǎn)抗性的影響
為了驗證等高線特征對算法在旋轉(zhuǎn)攻擊魯棒性方面的影響,在其他參數(shù)相同的情況下,不添加等高線特征的算法對旋轉(zhuǎn)攻擊的魯棒性和加入等高線特征的旋轉(zhuǎn)攻擊魯棒性如圖9所示。
圖9 加入等高線特征前后的魯棒性對比Fig.9 Robustness comparison before and after adding contour features
圖9(a)是無等高線特征的旋轉(zhuǎn)攻擊魯棒性圖,哈希序列長度為104,可以看出,在0.2°~1.0°的旋轉(zhuǎn)攻擊下,哈希距離最高為22,且上升趨勢明顯。圖9(b)為加入等高線特征的旋轉(zhuǎn)攻擊魯棒性,哈希序列長度為120,由圖9(b)顯示在0.2°~1.0°的旋轉(zhuǎn)攻擊下,哈希距離最大為14,圖9(c)顯示在1.0°~5.0°旋轉(zhuǎn)攻擊下,哈希距離最大為26。可以看出,在哈希序列長度增加的同時,原始圖像與經(jīng)過旋轉(zhuǎn)攻擊的圖像之間的哈希距離反而有所降低,證明等高線特征的加入有效提高了算法對于旋轉(zhuǎn)攻擊的魯棒性和綜合表現(xiàn)力。
為考量本文算法的圖像分類性能,將本文算法與文獻[12,26-28]算法的ROC曲線性能進行對比。為保證公平性,本節(jié)參與對比的各個算法使用同樣的數(shù)據(jù)集并且在相同平臺運行。圖10展示了不同算法之間ROC曲線對比。
圖10 不同算法的ROC曲線對比Fig.10 ROC curve comparison of different algorithms
當PFPR=0時,本文算法的PTPR為0.999 2。參與對比的算法[12, 26-28]PTPR分別為0.998 5、0.999 1、0.924 5和0.996 4。當PTPR接近于1時,本文算法的PFPR為0.000 6,文獻[12, 26-28]算法的PFPR分別為0.112 1、0.002 0、0.761 1和0.060 4??梢钥闯?當PFPR=0、PTPR=1時,本文算法的表現(xiàn)都優(yōu)于對比算法。在算法的哈希生成效率和儲存代價方面,計算了同樣外部參數(shù)情況下本文算法與各對比算法的總運行時間和哈希長度。將1 000張輸入圖像產(chǎn)生哈希序列的總時間記錄下來并除以1 000得到各個算法的平均哈希生成時間。表6綜合記錄了本文算法與對比算法的性能對比。通過表6可以看出,本文算法的哈希序列長度為120 bit,在所有對比算法中緊湊性最好,運算速度快。圖10展示出本文算法的ROC曲線最接近圖像的左上角,說明本文算法的綜合性能較好。
表6 不同算法的性能對比Table 6 Performance comparison of different algorithms
由于等高線特征通過分塊能量矩陣得到,若圖像歸一化尺寸N發(fā)生變化,等高線特征就會隨之變化而改變算法性能。為了展現(xiàn)本文算法在不同N值下的性能,選擇N=256和N=512,通過ROC曲線來衡量算法性能,如圖11所示??梢钥闯?本算法在N=512時性能發(fā)生了輕微下滑,這是由于雖然N取值的變化會使圖像的分塊能量矩陣發(fā)生變化,但等高線特征的長度并不會受到影響,從而將歸一化尺寸波動帶來的影響控制在可接受的范圍內(nèi)。文獻[12]算法性能下滑非常明顯,這是由于N取值提高導致哈希序列過長,在區(qū)別性上的表現(xiàn)下降明顯,從而影響了ROC曲線。文獻[26]算法也有一定程度的削弱。由圖易得,在N=256時本算法具有ROC曲線表現(xiàn)上的優(yōu)勢。
圖11 各算法在不同N值下ROC曲線對比Fig.11 Comparison of ROC curve of each algorithms under different N values
圖像檢索在實際應用中面對的目標應該是互聯(lián)網(wǎng)媒體中的各種圖像,但在實驗研究中通常使用已有的數(shù)據(jù)庫,并對這些數(shù)據(jù)庫中的圖像進行攻擊處理來驗證算法的圖像分類性能??截悪z測實驗則是在網(wǎng)絡(luò)上隨機下載圖像,并對圖像進行攻擊處理。原始圖像的來源不同可能導致分辨率、尺寸、顏色空間上的差異。這些差異在實驗中會體現(xiàn)為算法可能在對某些數(shù)據(jù)庫上能表現(xiàn)出較好的圖像分類性能,但在拷貝檢測實驗中表現(xiàn)會有所降低。引入文獻[29]提出的查全率(P)和查準率(R)作為衡量算法在拷貝檢測方面性能的指標。隨機下載1 000幅網(wǎng)絡(luò)圖像為拷貝檢測原始圖像庫,其中抽取100幅作為查詢圖像庫。對查詢圖像庫的圖片進行28種攻擊操作,如表7所示。將得到的拷貝圖像和原始圖像庫共計3 800幅作為實驗圖像庫,對查詢圖像庫進行實驗。P和R的計算公式如式(15)所示:
表7 拷貝檢測攻擊參數(shù)Table 7 Attack parameters for copy detection
P=N3/N4
R=N3/N5
(15)
其中:N3是結(jié)果中正確查詢拷貝圖像數(shù);N4是結(jié)果中拷貝圖像數(shù);N5是測試圖像庫中拷貝圖像數(shù)。
表8是進行5次隨機抽取后,拷貝圖像與查詢圖像之間漢明距離在選擇不同的閾值下算法的平均查全率和查準率。當?shù)玫降臐h明距離小于所選閾值時,認為該圖像為拷貝圖像,反之則認為圖像是實驗數(shù)據(jù)庫中除拷貝圖像之外的其他圖像。由表8可以看出,當閾值為30時,算法能以94.92%的準確率將所有拷貝圖像識別出來;當閾值取38時,查全率為97.58%,查準率為96.77%。
表8 平均查全率和查準率Table 8 Average completion rate and accuracy rate
同時為了增強查全率與查準率指標的穩(wěn)定性,選取1 000幅圖像中的400幅進行多次隨機抽取實驗得到的平均查全率與查準率如表9所示。
表9 增加查詢圖像后的平均查全率和查準率Table 9 Increase the average search completion rate and accuracy rate after querying images
通過拷貝檢測實驗與文獻[12,22,26-27]算法進行比較,畫出查全率和查準率曲線,結(jié)果如圖12所示??梢钥闯?本文算法P-R曲線最靠近右上角,優(yōu)于其他算法。結(jié)果表明,本文算法在拷貝檢測應用方面具有較好的表現(xiàn)。
圖12 不同算法的P-R曲線對比Fig.12 Comparison of P-R curve of different algorithms
本文提出一種結(jié)合四元數(shù)拉蓋爾矩和三維能量結(jié)構(gòu)的哈希算法。用四元數(shù)拉蓋爾矩提取融合彩色圖像的全局特征,對三維空間下高斯融和圖像的能量信息建立模型并提取結(jié)構(gòu)特征,同時對非重疊分割后的能量信息構(gòu)建三維模型,提取其中抗旋轉(zhuǎn)的等高線特征,提高魯棒性。實驗結(jié)果表明,該算法的哈希長度緊湊,運算速度快,魯棒性與區(qū)別性之間取得了較好的平衡。下一步將嘗試對等高線特征進行拓展,使算法在保證性能的前提下增強對更大角度旋轉(zhuǎn)攻擊的魯棒性。