羅鴻斌
摘 要:數(shù)字圖像盲取證作為一種不依賴任何預(yù)簽名提取或預(yù)嵌入信息來鑒別圖像真?zhèn)魏蛠碓吹男抡n題,正逐步成為多媒體安全領(lǐng)域新的研究熱點(diǎn),本文首先介紹了這一領(lǐng)域當(dāng)前的研究現(xiàn)狀和進(jìn)展,接著從圖像篡改遺留痕跡特征、圖像內(nèi)在統(tǒng)計(jì)特性、成像設(shè)備一致性三個(gè)方面闡述了當(dāng)前圖像盲取證技術(shù)的主要方法,并分析了不足之處。
關(guān)鍵詞:數(shù)字圖像取證;篡改檢測
隨著計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)、多媒體技術(shù)的迅速發(fā)展,數(shù)字圖像已在我們工作生活中發(fā)揮著越來越重要的作用,與此同時(shí),高質(zhì)量數(shù)碼相機(jī)的普及和功能日益強(qiáng)大的圖像處理軟件的廣泛應(yīng)用,使得人們不需要特殊的專業(yè)技術(shù)即可對數(shù)字圖像進(jìn)行非常逼真的修改,處理效果很難通過人眼分辨。大多數(shù)人對數(shù)字圖像的修改只是為了增強(qiáng)表現(xiàn)效果或?yàn)榱撕猛?,但也不乏有人出于各種目的故意篡改,甚至惡意地利用、傳播經(jīng)過精心偽造的數(shù)字圖像,這嚴(yán)重的影響了科學(xué)發(fā)現(xiàn)、保險(xiǎn)和法庭證物等,無疑會(huì)對政治、軍事和社會(huì)的各方面會(huì)產(chǎn)生惡劣的影響。因此,面向真實(shí)性檢測的數(shù)字圖像盲取證技術(shù)是迫切需要的一種技術(shù),潛在的應(yīng)用領(lǐng)域廣泛,涉及新聞媒體、電子票據(jù)、文檔簽名、法庭犯罪取證、保險(xiǎn)事故調(diào)查、軍事情報(bào)分析等領(lǐng)域,有著廣泛的應(yīng)用前景,正逐步成為多媒體數(shù)據(jù)安全領(lǐng)域新的研究熱點(diǎn)。
1 數(shù)字圖像取證
數(shù)字圖像取證技術(shù)是一個(gè)多學(xué)科綜合的研究問題,它涉及計(jì)算機(jī)視覺、信號(hào)處理、計(jì)算機(jī)圖形學(xué)、機(jī)器學(xué)習(xí)、成像傳感器、模式識(shí)別等領(lǐng)域的知識(shí)。數(shù)字圖像取證技術(shù)要解決的問題主要包括以下幾個(gè)方面:能否確認(rèn)一幅圖像是真實(shí)(原始)圖像,還是經(jīng)過篡改操作處理后的偽造圖像;能否確認(rèn)偽造圖像的篡改區(qū)域和篡改程度;能否確認(rèn)圖片是由成像設(shè)備拍攝的照片,還是由計(jì)算機(jī)生成的圖片;能否確認(rèn)拍攝照片的成像設(shè)備的類型或品牌。
目前,通常有兩種取證技術(shù)一是數(shù)字圖像主動(dòng)取證技術(shù)(數(shù)字簽名、數(shù)字水?。?,另一種是數(shù)字圖像被動(dòng)取證技術(shù),也通常稱為數(shù)字圖像盲取證技術(shù)。
數(shù)字簽名技術(shù),它提取原始圖像的內(nèi)容摘要作為簽名,在圖像使用端通過比對接收圖像的內(nèi)容摘要和簽名文件,從而驗(yàn)證圖像的真實(shí)性。數(shù)字水印技術(shù)它利用數(shù)字作品中普遍存在的冗余數(shù)據(jù)與隨機(jī)性把版權(quán)信息或內(nèi)容信息嵌入到數(shù)字作品本身,從而起到保護(hù)數(shù)字產(chǎn)品版權(quán)或真實(shí)性的目的,用于數(shù)字圖像檢測的數(shù)字水印一般可以分為兩類:脆弱水印和半脆弱水印。脆弱水印是一種在圖像發(fā)生任何形式的改變時(shí)都會(huì)被損壞掉的水印;半脆弱水印是指能夠容忍圖像進(jìn)行諸如JPEG壓縮、加少量噪聲的偶然修改,但會(huì)被圖像內(nèi)容的惡意篡改損壞的水印。在圖像使用端通過檢測水印信號(hào)的修改情況,判斷出圖像被篡改的位置以及被篡改的嚴(yán)重程度。數(shù)字簽名和數(shù)字水印檢測技術(shù)的一個(gè)共同特點(diǎn)是內(nèi)容提供方必須對圖像進(jìn)行預(yù)處理,提取簽名或嵌入水印。換句話說,只有所有的數(shù)字圖像在發(fā)布之前都實(shí)現(xiàn)了簽名提取或水印嵌入,相應(yīng)的鑒別技術(shù)才能真正有效,而在實(shí)際應(yīng)用中,絕大多數(shù)數(shù)字圖像事先并沒有預(yù)處理,這就大大限制了這兩種數(shù)字圖像檢測技術(shù)的使用范圍。
數(shù)字圖像盲取證技術(shù)是指在不依賴任何預(yù)簽名提取或預(yù)嵌入信息的前提下,根據(jù)待取證數(shù)字圖像自身的一些特征判斷其是否經(jīng)過篡改、合成和潤飾等偽造處理,判斷識(shí)別及其可能的來源。
2 國內(nèi)外的研究現(xiàn)狀
基于數(shù)字圖像盲取證技術(shù)是近幾年發(fā)展起來的,其研究還處于初級(jí)階段,挑戰(zhàn)性高,創(chuàng)新空間大,因此許多高校和科研機(jī)構(gòu)都投入到該領(lǐng)域的研究中來。如美國著名的Dartmouth學(xué)院、Binghamton大學(xué)、Columbia大學(xué)和Polytechnic大學(xué)等分別成立了專門的數(shù)字媒體檢測技術(shù)研究小組。相比國外,國內(nèi)在該領(lǐng)域的研究起步較晚,但由于該項(xiàng)研究在法律、公安實(shí)務(wù)中有重要的應(yīng)用性,所有國內(nèi)許多大學(xué),尤其是公安類院校也開展了大量的研究工作,主要有中山大學(xué)、國防科技大學(xué)、同濟(jì)大學(xué)和北京郵電大學(xué)等。吳啟[1]詳細(xì)闡述了各種利用Photoshop軟件對數(shù)字圖像進(jìn)行篡改的技術(shù),然后分析了各種偽造方法的缺陷,以及從細(xì)節(jié)上識(shí)別這些篡改圖像的方法。王渝霞[2]從圖像光照一致性、各種物體的比例關(guān)系、色彩反差一致性、局部分辨率、邊緣特征等方面闡述了靜態(tài)圖像原始性檢驗(yàn)技術(shù)。吳瓊[3]提出了一個(gè)數(shù)字圖像盲取證技術(shù)的基本框架,它包括圖像建模、特征提取與特征分析、算法設(shè)計(jì)、測試與驗(yàn)證、圖像盲取證技術(shù)定位與圖像分類、相關(guān)的圖像源特性以及圖像數(shù)據(jù)庫等主要組成部分。這些研究從各個(gè)方面闡述數(shù)字圖像盲取證技術(shù)的一般方法,但是這些方法大都是經(jīng)驗(yàn)性的,檢測結(jié)果與檢驗(yàn)操作者的熟練程度和經(jīng)驗(yàn)。對于這一研究領(lǐng)域,國際上近幾年研究有較大的進(jìn)展,發(fā)展了一系列檢測圖像篡改的技術(shù)。主要有利用圖像塊之間的相關(guān)性可以檢測克隆性圖像篡改、拼接性圖像篡改;利用圖像放大、縮小重采樣時(shí)像素之間的相關(guān)性可以檢測替換性圖像篡改;利用圖像中數(shù)碼相機(jī)的色彩濾鏡矩陣的不一致性可以用來檢測拼接性、替換性圖像篡改;利用圖像中數(shù)碼相機(jī)的傳感器噪聲模式的不一致性,也可以檢測拼接性、替換性圖像篡改;利用圖像中色彩的偏差可以用來檢測拼接性、替換性圖像篡改;利用透視幾何技術(shù)可以用來檢測篡改圖像中不符合透視幾何原理的現(xiàn)象;圖像拼接時(shí)光照條件是最難處理的環(huán)節(jié),利用光照的不一致性或不均勻性可以檢測篡改圖像[4-11]。
3 數(shù)字圖像篡改的主要方法
目前數(shù)字圖像篡改主要有以下幾種篡改方法:一是圖像區(qū)域替換,篡改者通常將圖像中的某一部分用另外一副圖像的相應(yīng)部分替換,替換后圖像邊緣部分經(jīng)過拼合模糊,使得看起來比較完整。二是圖像拼接,通常是將兩副照片按照一定規(guī)律連接成一副完整的圖像,并經(jīng)過色階調(diào)整、色彩平衡、色相以及飽和度調(diào)整,使兩張圖像看起來比較協(xié)調(diào)。三是圖像克隆,將數(shù)字圖像中的某些部分進(jìn)行復(fù)制,并粘貼到同一張圖像中的另一個(gè)位置,以加強(qiáng)圖像中的某些效果。四是圖像刪減,就是將圖像上的某一區(qū)域剪切掉或刪除掉某些內(nèi)容。五是圖像修復(fù),對圖像上信息缺損區(qū)域、移走目標(biāo)物體留下的信息空白區(qū)域進(jìn)行信息填充,并且使觀察者無法覺察到圖像曾經(jīng)缺損或已被修復(fù)。其典型方法是基于樣本紋理合成的修復(fù)技術(shù),該技術(shù)可以用來去除圖像中的大目標(biāo)。六是圖像增強(qiáng),包括改變圖像特定區(qū)域的顏色和對比度等,這種操作明顯地改變圖像內(nèi)容,但可以模糊或突出某些細(xì)節(jié),或者改變照片的明暗程度等。任何形式的篡改操作都會(huì)不可避免地引起數(shù)字圖像數(shù)據(jù)內(nèi)部特征的變化。
4 數(shù)字圖像盲取證技術(shù)
根據(jù)數(shù)字圖像取證中所使用的檢測特征依據(jù)不同,可將數(shù)字圖像盲取證技術(shù)分為三類:基于圖像篡改過程遺留痕跡特征的取證技術(shù);基于圖像內(nèi)在統(tǒng)計(jì)特性的取證技術(shù);基于成像設(shè)備一致性的來源取證技術(shù),下面分別介紹。
4.1 基于圖像篡改過程遺留痕跡特征的取證技術(shù)
該類技術(shù)通過尋找并利用圖像篡改操作在偽造圖像中的遺留痕跡對圖像進(jìn)行原始性檢測,這種遺留痕跡單憑人眼通常很難發(fā)現(xiàn)。不同的篡改手段會(huì)產(chǎn)生不同的偽造遺留痕跡,如JPEG雙重壓縮操作會(huì)導(dǎo)致圖像DCT變換系數(shù)的直方圖產(chǎn)生周期性模式,重采樣操作會(huì)導(dǎo)致圖像像素之間的相關(guān)性發(fā)生變化,復(fù)制-粘貼操作會(huì)導(dǎo)致圖像不同區(qū)域之間產(chǎn)生異常的相似性等。目前研究的方法主要包括JPEG雙重壓縮檢測、重采樣檢測、復(fù)制-粘貼檢測、照明條件不一致性檢測和模糊檢測等。
4.2 基于圖像內(nèi)在統(tǒng)計(jì)特性的真實(shí)性檢測
篡改圖像的手段多種多樣,大多數(shù)情況下從視覺上難以察覺圖像是否被偽造過。但是,篡改和偽造必然在一定程度上影響和破壞圖像的內(nèi)在統(tǒng)計(jì)特性,基于這一觀點(diǎn),基于圖像內(nèi)在統(tǒng)計(jì)特性的盲取證方法首先提取對圖像篡改敏感的統(tǒng)計(jì)特性,以形成區(qū)分性的特征向量,然后構(gòu)建分類器對待檢測圖像進(jìn)行分類。該類技術(shù)的核心是提取作為區(qū)分性特征向量的圖像統(tǒng)計(jì)特性,然后依靠分類器來做出決策。目前研究的方法中提取的特征包括雙相干特征、邊緣百分比特征、圖像質(zhì)量度量特征和二元相似性度量特征等。
4.3 基于成像設(shè)備一致性的真實(shí)性檢測
自然圖像通常是由數(shù)字采集設(shè)備獲取的,不同的采集設(shè)備具有不同的特性,如鏡頭的光學(xué)畸變不同、相機(jī)使用的顏色濾波陣列CFA(Color Filter Array)和相應(yīng)的插值算法不同等。而由同一設(shè)備采集的圖像通常具有特殊的一致性規(guī)律以反映該設(shè)備的特性,這些一致性的規(guī)律可用來確定圖像的來源和檢測圖像是否被篡改。
5 數(shù)字圖像盲取證方面存在的問題
近幾年,數(shù)字圖像盲取證研究已經(jīng)成為一個(gè)熱點(diǎn)問題,但隨著各種各樣的數(shù)字圖像處理軟件的不斷進(jìn)步和發(fā)展,數(shù)字圖像篡改技術(shù)也越來越成熟,被動(dòng)式的數(shù)字圖像取證也越來越難,從總體上來說,數(shù)字圖像盲取證技術(shù)的發(fā)展還處于初級(jí)階段,需要進(jìn)一步深入研究。具體體現(xiàn)在以下兩個(gè)方面。
5.1 現(xiàn)有的檢測方法適用性差,檢測結(jié)果認(rèn)可度不高
數(shù)字圖像盲取證技術(shù)取得了一些研究成果和檢測方法,但目前大多數(shù)字圖像盲取證檢測方法是在很多約束條件下成立的,其應(yīng)用對象還存在一定的局限性,算法依賴性高,通用性差,適用性低,檢測結(jié)果不夠理想,不能像指紋一樣,定性的檢測數(shù)字圖片是否被篡改,很多方法只能作為篡改偽造的輔助證明手段,還沒有成為一個(gè)具有公信力的技術(shù)手段。
5.2 數(shù)字圖像盲取證技術(shù)的體系不完善、缺乏對檢測標(biāo)準(zhǔn)的研究
現(xiàn)有的數(shù)字圖像檢測方法大多數(shù)還是強(qiáng)調(diào)人的主觀作用,不論是那類檢測方法,都沒有統(tǒng)一的檢測標(biāo)準(zhǔn),強(qiáng)調(diào)人在檢測中的主觀判斷作用,而忽略了對這些檢測手段的量化,沒有建立標(biāo)準(zhǔn)圖像數(shù)據(jù)庫和相關(guān)檢測評價(jià)指標(biāo)。
由于數(shù)字圖像本身的復(fù)雜性和多樣性,數(shù)字圖像的盲取證技術(shù)是一項(xiàng)難度很大的創(chuàng)新工作,雖然已經(jīng)成為當(dāng)前多媒體信息安全領(lǐng)域研究的一個(gè)熱點(diǎn)問題,但取證檢測畢竟是隨著數(shù)字圖像發(fā)展而帶來的一項(xiàng)新課題,取證檢測中的許多問題還需要我們進(jìn)一步深入研究和探索。
[參考文獻(xiàn)]
[1]吳啟.淺談?dòng)?jì)算機(jī)偽造照片的檢驗(yàn)[J].中國人民公安大學(xué)學(xué)報(bào):自然科學(xué)版,2005,(4):73-75.
[2]王渝霞,論靜態(tài)圖像的原始性檢驗(yàn)[J].刑事偵查,2006,18(1):68-67.
[3]Wang J,Bhat P,Colburn R A,et al.Interactive video cutout.ACM Transactions on Graphics(SIGGRAPH'05),2005,24(3):585~594.
[4]http://www.cs.dartmouth.edu/farid/research/digitaltampering/.
[5]Zhu B B,Swanson M D,Tewfik A H.When seeing isn't believing.IEEE Signal Processing Magazine,2004,21(2):40~49.
[6]Lin C Y,Chang S F.Semi-fragile watermarking for authentication JPEG visual content.Proceedings of SPIE,San Jose, CA,USA,2000,3971:140-151.
[7]Ng T T,Chang S F,Sun Q B.Blind detection of photomontage using higher order statistics.Proceedings of IEEE International Symposium on Circuits and ystems(ISCAS04),Vancouver,Canada,2004,5:688~691.
[8]Menezes A J,Oorchot P V,Vanstone S.Handbook of applied cryptography.BocaRaton,F(xiàn)L:CRC Press,1997.
[9]吳金海,林福宗.基于數(shù)字水印的圖像認(rèn)證技術(shù).計(jì)算機(jī)學(xué)報(bào),2004,27(9):1153-1161.
[10]Lin C Y.Watermarking and digital signature techniques for multimedia authentication and copyright protection.Doctor Thesis,Columbia University,2000.
[11]Lin C Y,Chang S F.A robust image authentication method distinguishing JPEG compression from malicious manipulation.IEEE Transactions on Circuits and Systems for Video Technology,2001,11(2):153~168.