摘 要:針對JPEG圖像重壓縮篡改操作(偽作)檢測及篡改定位問題,探討一種利用DCT系數(shù)首位數(shù)字特征的改進(jìn)方法。首先,將待測JPEG圖像分成大小為64×64的重疊圖像塊,對于每一圖像塊,取每8×8小塊中前9個(gè)位置的交流DCT(AC-DCT)系數(shù)的首位數(shù)字(1~9)特征;然后,對提取的首位數(shù)字特征進(jìn)行PCA降維壓縮以抽取緊湊特征,再利用SVM分類器判斷相應(yīng)圖像塊是否經(jīng)過重壓縮操作;最后,利用重壓縮檢測結(jié)果來定位JPEG圖像篡改區(qū)域。實(shí)驗(yàn)結(jié)果表明,與代表性文獻(xiàn)算法相比,改進(jìn)算法在視覺效果上取得了更好的篡改定位結(jié)果,且對旋轉(zhuǎn)、縮放、羽化等操作具有魯棒性。
關(guān)鍵詞: 雙重JPEG壓縮;偽作檢測;篡改定位;DCT系數(shù)首位數(shù)字;PCA降維
中圖分類號:TP391.41
文獻(xiàn)標(biāo)識碼: A
隨著科技的進(jìn)步和發(fā)展,數(shù)碼相機(jī)和圖像編輯軟件日益普及,致使數(shù)字圖像的惡意篡改越來越多。偽造圖像大量地充斥互聯(lián)網(wǎng)和各類媒體,嚴(yán)重地影響了人們的日常生活。而且,偽造圖像如果被大量地用于正式媒體、科學(xué)發(fā)現(xiàn)、法庭證物等,無疑將會對政治和社會穩(wěn)定產(chǎn)生嚴(yán)重的影響。而JPEG是現(xiàn)階段應(yīng)用最為廣泛的一種圖像格式,無論是數(shù)碼相機(jī)、手機(jī)及其它成像設(shè)備拍攝的數(shù)碼圖像,還是互聯(lián)網(wǎng)上傳輸?shù)膱D像,大都壓縮為JPEG格式。因此,研究JPEG圖像固有特性并用于篡改檢測有著非常重要的學(xué)術(shù)意義和實(shí)用價(jià)值。
圖像篡改者在對一幅JPEG圖像進(jìn)行篡改偽造操作之前,往往需要先將其轉(zhuǎn)換為非壓縮的BMP格式,對其進(jìn)行一系列的圖像篡改操作后再壓縮成JPEG圖像進(jìn)行保存或傳輸,因此存在雙重JPEG壓縮。所以檢測待檢圖像中是否存在雙重JPEG壓縮,可作為確定圖像是否存在篡改操作(偽作)的線索。因此,JPEG圖像重壓縮檢測成為圖像偽作檢測研究和應(yīng)用中的一個(gè)重要課題。
對于該問題,國內(nèi)外許多學(xué)者已開展了相關(guān)的工作。其中,F(xiàn)AN等[1]提出利用塊效應(yīng)來檢測BMP圖像的壓縮歷史;POPESCU等[2]利用JPEG圖像經(jīng)過壓縮后其DCT系數(shù)直方圖在頻域的周期效應(yīng)來檢測圖像是否經(jīng)過了重壓縮操作;MAHDIAN等[3]則在文獻(xiàn)[2]的基礎(chǔ)上,針對其誤判率較大的問題加以改進(jìn),在計(jì)算DCT系數(shù)直方圖的頻譜之前,首先去掉了直方圖中的邊緣信息,并且在計(jì)算過程中只考慮DCT系數(shù)的大小,提高了檢測的準(zhǔn)確率;LUK等[4]提出一種利用JPEG重壓縮圖像估計(jì)原始JPEG量化表的方法,并利用神經(jīng)網(wǎng)絡(luò)對JPEG重壓縮操作進(jìn)行檢測;而FU等[5]建立了一個(gè)基于Benford法則的統(tǒng)計(jì)模型,通過分析JPEG圖像塊DCT系數(shù)及JPEG量化系數(shù)首位數(shù)字的分布特征來檢測重壓縮操作;LI等[6]分析了文獻(xiàn)[5]中所提方法性能局限的根本原因,僅采用前20個(gè)交流模式的量化DCT系數(shù)的首位數(shù)字分布特征來進(jìn)行JPEG重壓縮檢測;AMERINI等[7] 則利用前9個(gè)位置的DCT系數(shù)的首位數(shù)字為2、5、7的分布,運(yùn)用SVM分類器對特征進(jìn)行處理,以實(shí)現(xiàn)圖像中有無JPEG重壓縮的二元分類進(jìn)而實(shí)現(xiàn)拼接篡改定位。MIRE等[8]同樣利用了首位數(shù)字特征來進(jìn)行JPEG圖像篡改檢測。
利用DCT系數(shù)首位數(shù)字特征來進(jìn)行JPEG圖像重壓縮檢測成為近些年研究的熱點(diǎn)方法之一,其具有簡單有效的特點(diǎn)。
本文在文獻(xiàn)[7]的基礎(chǔ)上,針對其篡改定位結(jié)果不太理想等問題加以改進(jìn),提出一種用PCA降維壓縮抽取的前9個(gè)位置的DCT系數(shù)首位數(shù)字(1~9)特征來檢測JPEG重壓縮及篡改定位的方法,并以對比實(shí)驗(yàn)驗(yàn)證其有效性。
1 圖像偽作方式和篡改定位模型
1.1 圖像偽作的一般方式
圖1為圖像偽作的一般方式[9],其步驟通常如下:
(1)選用未經(jīng)壓縮的原始圖像A作為背景區(qū)域,從JPEG格式(設(shè)壓縮質(zhì)量因子為Q1)的原始圖像B中裁剪感興趣區(qū)域,并將其復(fù)制粘貼放置在背景合適的位置上;
(2)在得到拼接圖像C后,為使篡改區(qū)域與背景區(qū)域更好地融合,通常會對篡改區(qū)域進(jìn)行某些潤飾操作,如模糊、銳化、旋轉(zhuǎn)、縮放、羽化等;
(3)對合成圖像進(jìn)行重新保存,保存為JPEG格式(設(shè)其壓縮質(zhì)量因子為Q2),得到最后的篡改圖像D。
1.2 圖像篡改定位模型
重壓縮操作通常會改變JPEG圖像的一些統(tǒng)計(jì)特性,通過分析某些統(tǒng)計(jì)特性的變化,可以作為輔助手段來判斷圖像是否經(jīng)過了篡改操作。更進(jìn)一步,可以通過判斷圖像的部分區(qū)域是否經(jīng)過了重壓縮操作,以此定位篡改區(qū)域[10],如圖2。
對于一幅給定的待測JPEG圖像,本文首先將其分塊(設(shè)分塊大小為N×N),然后對于每一圖像塊里的每8×8小塊取前9個(gè)位置的AC-DCT系數(shù)(去除第一個(gè)位置的DC-DCT系數(shù))的首位數(shù)字(1~9)特征;然后,對提取的首位數(shù)字特征進(jìn)行PCA降維處理,并將所提降維特征送入SVM分類器以判斷相應(yīng)圖像塊是否經(jīng)過了重壓縮操作。如果判斷一圖像塊經(jīng)過了重壓縮操作,則認(rèn)為該圖像塊為篡改區(qū)域;否則,若判斷圖像塊未經(jīng)過重壓縮操作,則認(rèn)為該圖像塊為原始的背景區(qū)域。
需要注意的是,分塊大小N會影響最后的判斷精度。N取值過大過小都會出現(xiàn)較多的誤判,另外,由于JPEG壓縮中的DCT變化是基于8×8圖像塊的,為更好地保留圖像的重壓縮特性,N的取值還應(yīng)保證為8的倍數(shù),本文實(shí)驗(yàn)中N=64。另外,在圖像分塊過程中,為保證更精確地定位,本文還采取了重疊分塊,每次移動(dòng)步長S=8。
2 DCT系數(shù)首位數(shù)字特征抽取
2.1 首位數(shù)字特征
Benford法則由美國天文學(xué)家Simon Newcomb和物理學(xué)家Frank Benford于1881年和1938年先后發(fā)現(xiàn),并通過收集大量數(shù)據(jù)進(jìn)行了分析驗(yàn)證。該法則指出,對于許多統(tǒng)計(jì)數(shù)據(jù),其首位有效數(shù)字出現(xiàn)的概率滿足如下表達(dá)式:
ACEBO等[11]發(fā)現(xiàn),在某種限制下,自然圖像也接近這個(gè)法則;其后,F(xiàn)U等[5]指出,圖像DCT系數(shù)的首位有效數(shù)字分布在量化前遵循Benford法則。
對于重壓縮圖像,由于前后兩次壓縮時(shí)量化因子的差異,會使DCT系數(shù)的分布重新分配從而導(dǎo)致重壓縮圖像的DCT系數(shù)的首位數(shù)字不再呈對數(shù)分布的趨勢,即破壞了單次壓縮具有的Benford分布特性[6],如圖3所示,它是隨機(jī)選擇的500幅單次壓縮圖像與500幅重壓縮圖像的DCT系數(shù)首位有效數(shù)字統(tǒng)計(jì)分布規(guī)律??梢钥闯觯瑢τ趩未螇嚎s圖像,其首位有效數(shù)字確實(shí)遵循了Benford法則,而對于重壓縮圖像,這種對數(shù)分布規(guī)律則完全被打破。
2.2 首位數(shù)字特征的PCA降維及應(yīng)用
在文獻(xiàn)[12]中,通過實(shí)驗(yàn)發(fā)現(xiàn)DCT系數(shù)的首位數(shù)字為2、5、7的分類特征比較明顯,因此文獻(xiàn)[12]與文獻(xiàn)[7]都特征選擇首位數(shù)字為2、5、7的分布。雖然這可以減少特征維度,但是首位數(shù)字為其他的分布特征沒有考慮在內(nèi),這導(dǎo)致最后的篡改定位結(jié)果誤差較大。因此,本文綜合考慮后,選擇DCT系數(shù)首位數(shù)字為1~9的分布,最后利用PCA(Principal Component Analysis)降維壓縮以抽取緊湊特征,去除首位數(shù)字之間的相關(guān)性。
PCA是一種常用的基于變量協(xié)方差矩陣對信息進(jìn)行處理、壓縮和提取的有效方法。其思想核心是將高維數(shù)據(jù)用貢獻(xiàn)率較大的低維數(shù)據(jù)來表示,以此來去除冗余數(shù)據(jù)并且降低計(jì)算復(fù)雜度。
本文利用PCA降維處理DCT系數(shù)的首位數(shù)字特征以實(shí)現(xiàn)特征抽取,用以檢測JPEG重壓縮,進(jìn)而定位篡改區(qū)域。具體步驟如下:
(1)對于一幅待測JPEG圖像,首先估計(jì)出其壓縮質(zhì)量因子[13],選擇相應(yīng)的SVM模型,不同的壓縮質(zhì)量因子對應(yīng)不同的SVM模型,訓(xùn)練有[50∶5∶95]共10個(gè)SVM模型;
(2)對待測圖像進(jìn)行分塊處理,分塊大小為64×64,且采取重疊分塊,移動(dòng)步長為8,由左至右,由上到下的順序移動(dòng);
(3)特征提取 對于每個(gè)64×64的圖像塊里,有64個(gè)8×8塊,對每個(gè)8×8小塊,不考慮DC-DCT系數(shù),取前9個(gè)位置的AC-DCT系數(shù)的首位有效數(shù)字,把64個(gè)8×8塊中相同位置的首位有效數(shù)字取出來,形成自然數(shù)字1~9的分布,就得到了第2個(gè)位置到第10個(gè)位置的DCT系數(shù)的首位數(shù)字1~9的分布,此時(shí)特征向量為81維,最后再進(jìn)行PCA特征降維;
(4)將降維后的特征送入SVM分類器中進(jìn)行二分類,經(jīng)過重壓縮操作的為正類,判斷為篡改區(qū)域,單次壓縮的為負(fù)類,判斷為背景區(qū)域;
(5)篡改定位 步驟(4)中保存了整幅待測圖像所有64×64圖像塊與分類超平面的距離,根據(jù)此距離矩陣顯示出篡改定位結(jié)果。
3 實(shí)驗(yàn)結(jié)果與分析
3.1 篡改圖像檢測對比實(shí)驗(yàn)
為驗(yàn)證本文算法對不同篡改手段的魯棒性,對經(jīng)過不同篡改方式的圖像進(jìn)行了檢測實(shí)驗(yàn)。實(shí)驗(yàn)中選取多幅篡改后的JPEG圖像來驗(yàn)證本文改進(jìn)算法的有效性,并與文獻(xiàn)[7]算法進(jìn)行對比。圖4、5、6是三組對比實(shí)驗(yàn)結(jié)果。
圖4中,圖(a)為未經(jīng)壓縮的分辨率為255×255的原始圖像A;圖(b)為Q1=60的原始圖像B;圖(c)為利用Photoshop軟件復(fù)制粘貼原始圖像B中紅圈內(nèi)的花瓣到原始圖像A中,并經(jīng)過了旋轉(zhuǎn)、縮小等潤飾操作的篡改圖像,保存為Q2=90的JPEG格式;圖(d)為文獻(xiàn)[7]算法(只選擇首位數(shù)字為2、5、7的分布)的篡改定位結(jié)果;圖(e)為文獻(xiàn)[7]算法加PCA降維處理的篡改定位結(jié)果;圖(f)為本文改進(jìn)算法的篡改定位結(jié)果。從圖6可看出,本文改進(jìn)算法篡改定位效果更好,誤差更小,同時(shí)對旋轉(zhuǎn)、縮放、羽化等操作也具有魯棒性。
圖5(a)為圖4(a)中局部復(fù)制粘貼后的篡改圖像。從實(shí)驗(yàn)結(jié)果可看出,本文改進(jìn)算法對于復(fù)制-粘貼篡改方式也適用,且篡改定位效果更好。圖4、5的實(shí)驗(yàn)結(jié)果驗(yàn)證了本文算法對不同篡改方式的魯棒性。
為了更好地驗(yàn)證本文算法的有效性,對圖6(a)所示分辨率為768×576的篡改圖像進(jìn)行篡改檢測。從圖6可看出,藍(lán)色天空中的老鷹為篡改部分,本文改進(jìn)算法篡改定位效果更好。
3.2 DCT系數(shù)位置數(shù)與F1值
文獻(xiàn)[7]和文獻(xiàn)[12]選擇了前9個(gè)位置的DCT系數(shù)的首位數(shù)字特征,取得了較好的實(shí)驗(yàn)結(jié)果,但都沒有具體給出為何這樣選擇的依據(jù),本文同樣選擇前9個(gè)位置的DCT系數(shù)的首位數(shù)字特征并通過實(shí)驗(yàn)驗(yàn)證了此選擇。
圖7給出了在UCID數(shù)據(jù)庫[14]中測試圖像的DCT系數(shù)位置數(shù)與相應(yīng)的F1值曲線圖,考慮了2~10、20、30、40、50、63(因圖像的主要信息集中在低頻部分,高頻部分只包含了細(xì)微的細(xì)節(jié)變化信息,且如果考慮過多DCT系數(shù)位置數(shù),會引入過多的噪音,F(xiàn)1值必會逐漸減小,所以本實(shí)驗(yàn)后面只考慮了整十的情況)個(gè)位置數(shù)時(shí)相應(yīng)的F1值,從圖中可以看出,對特征進(jìn)行PCA降維比無PCA降維處理F1值明顯更大,SVM分類效果更好,且考慮9個(gè)位置數(shù)時(shí)F1值最大,可達(dá)0.7955,此時(shí)分類效果最好。
4 結(jié)語
為檢測JPEG圖像是否經(jīng)過重壓縮操作并定位篡改區(qū)域,本文探討了一種基于DCT系數(shù)首位數(shù)字特征抽取的改進(jìn)方法,該方法利用PCA降維壓縮以提取DCT系數(shù)首位數(shù)字特征的緊湊特征,再利用SVM分類器檢測JPEG重壓縮操作并定位篡改區(qū)域。實(shí)驗(yàn)結(jié)果表明本文的改進(jìn)方法是更為有效的,且對不同篡改操作具有魯棒性。但當(dāng)Q1>Q2時(shí),篡改定位結(jié)果誤差較大。這將是下一步需要完善的工作。
參考文獻(xiàn):
[1]FAN Z, QUEIROZ R L.Identification of bitmap compression history: JPEG detection and quantizer estimation[J]. IEEE Trans. Image Processing, 2003, 12(2): 230-235.
[2]POPESCU A C, FARID H. Statistical tools for digital forensics[M]// Information Hiding. Berlin Heidelberg: Springer, 2004: 128-147.
[3]MAHDIAN B, SAIC S. Detecting double compressed JPEG images[C]// Proc. 2009 IET Int’l Conf. Crime Detection and Prevention. London, UK: IET, 2009: 1-6.
[4]LUK J, FRIDRICH J.Estimation of primary quantization matrix in double compressed JPEG images[C]// DFRWS 2003: Proc. 2003 Digital Forensic Research Workshop. Cleveland, OH: DFRWS, 2003: 5-8.
[5]FU D, SHI Y Q, SU W. A generalized Benford’s law for JPEG coefficients and its applications in image forensics[J]. Proc. SPIE, 2007: 65051L.1-65051L.11.
[6]LI B, SHI Y Q, HUANG J.Detecting doubly compressed JPEG images by using Mode Based First Digit Features[C]// MMSP 2008: Proc. 2008 IEEE 10th Int’l Workshop on Multimedia Signal Processing. Piscataway, NJ: IEEE, 2008: 730-735.
[7]AMERINI I, BECARELLI R, CALDELLI R, et al.Splicing forgeries localization through the use of first digit features[C]// WIFS 2014: Proc. 2014 IEEE Int’l Workshop on Information Forensics and Security. Piscataway, NJ: IEEE, 2014: 143-148.
[8]MIRE A V, DHOK S B, MISTRY N J, et al.Tampering localization in digital image using first two digit probability features[M]// Information Systems Design and Intelligent Applications. New Delhi: Springer, 2016: 133-141.
[9]左菊仙, 劉本永. 偽造圖像典型篡改操作的檢測[J]. 中國圖象圖形學(xué)報(bào), 2012, 17(11): 1367-1375.
[10]DONG L, KONG X, WANG B, et al. Double compression detection based on Markov model of the first digits of DCT coefficients[C]// ICIG 2011: Proc. 2011 IEEE 6th Int’l Conf. Image and Graphics. Piscataway, NJ: IEEE, 2011: 234-237.
[11]ACEBO E, SBERT M.Benford’s law for natural and synthetic images[C]// Proc. 2005 Eurographics Workshop on Computational Aesthetics in Graphics, Visualization and Imaging. Girona, Spain: DBLP, 2005: 169-176.
[12]MILANI S, TAGLIASACCHI M, TUBARO S.Discriminating multiple JPEG compression using first digit features[C]// ICASSP 2012: Proc. 2012 IEEE Int’l Conf. Acoustics, Speech and Signal Processing. Piscataway, NJ: IEEE, 2012: 2253-2256.
[13]PENG Y Y, LIU B Y. Accurate estimation of primary quantization table with applications to tampering detection[J]. Electronics Letters, 2013, 49(23): 1452-1454.
[14]SCHAEFER G, STICH M.UCID: an uncompressed color image database[J]. Proc. SPIE, 2004, 5307: 472-480.
(責(zé)任編輯:周曉南)