柴功昊 秦東愉
摘要:隨著科技水平的不斷進(jìn)步與發(fā)展,我們的信息技術(shù)也獲得了長遠(yuǎn)的發(fā)展,為我們的生活提供了很多的便利。我們的信息傳輸媒介也隨著科技的進(jìn)步由傳統(tǒng)的紙質(zhì)媒介變?yōu)閿?shù)字圖像,但是技術(shù)的進(jìn)步也會(huì)帶來一些不好的影響,比如如何鑒別數(shù)字圖像的真?zhèn)涡?,因此本文就面向?jì)算機(jī)生成圖像的智能取證技術(shù)進(jìn)行研究。
關(guān)鍵詞:計(jì)算機(jī)生成圖像;智能取證;技術(shù)研究
中圖分類號(hào):TP18 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2017)02-0172-03
1 前言
當(dāng)今時(shí)代的各行各業(yè)都離不開信息的傳遞,信息已經(jīng)成為了一種重要的資源,因此加強(qiáng)對(duì)信息資源的合理利用,不僅能夠促進(jìn)企業(yè)的發(fā)展,更能夠不斷推動(dòng)我國的經(jīng)濟(jì)建設(shè)。數(shù)字圖像也是一種重要的信息資源,人們通過數(shù)字圖像可以傳遞和存儲(chǔ)非常多的信息,因此數(shù)字圖像的真實(shí)性就成為了人們需要研究的一個(gè)重要課題。數(shù)字圖像的數(shù)量非常龐大,因此就需要通過計(jì)算機(jī)來進(jìn)行數(shù)字圖像的真?zhèn)伪鎰e,這樣才能從根本上保障圖像信息的安全性和可靠性。
2 研究背景
隨著信息技術(shù)的不斷發(fā)展,傳統(tǒng)的紙質(zhì)媒介已經(jīng)逐漸被淘汰,取而代之的是數(shù)字信息技術(shù),這種技術(shù)具有諸多的優(yōu)點(diǎn),例如存儲(chǔ)信息量大、存儲(chǔ)方便以及容易保存等。尤其是其中的數(shù)字圖像,已經(jīng)在各個(gè)領(lǐng)域都展開了使用,為人們的生產(chǎn)生活提供了很多的便利。雖然技術(shù)的發(fā)展給我們的生活帶來了便利,但是也給我們的生活帶來了一定的影響,通過各種軟件的處理,就能夠?qū)?shù)字圖像中的信息進(jìn)行處理,從而導(dǎo)致虛假信息的傳播,這同樣給社會(huì)帶來了很多危害。
數(shù)字圖像能夠存儲(chǔ)和傳遞非常多的信息,但是數(shù)字圖像具備可編輯性,而且隨著各種軟件技術(shù)的不斷完善與發(fā)展,人們很難通過肉眼來感覺到數(shù)字圖像是否被再次編輯過,這樣人們就無法準(zhǔn)確的辨別數(shù)字圖像的真?zhèn)危瑥亩o不法分子帶來了可乘之機(jī)。在這種背景下,加強(qiáng)對(duì)計(jì)算機(jī)生成圖像的鑒別工作就顯得意義重大,因此智能取證技術(shù)就應(yīng)運(yùn)而生了,這種技術(shù)能夠?qū)?shù)字圖像的真?zhèn)芜M(jìn)行鑒定,利用一些先進(jìn)的技術(shù),來對(duì)數(shù)字圖像進(jìn)行分析。通過掃描數(shù)字圖像的完整性,可以尋找出數(shù)字圖像被修改的痕跡,進(jìn)而通過一些數(shù)據(jù)模型的對(duì)比,就能夠?qū)?shù)字圖像的真?zhèn)芜M(jìn)行鑒別。這樣數(shù)字圖像才能夠更加可信,從而有效解決很多的實(shí)際問題,更好的發(fā)揮數(shù)字圖像作為證據(jù)信息的作用。
3 數(shù)字圖像智能取證技術(shù)的發(fā)展現(xiàn)狀
隨著科技水平的不斷進(jìn)步,人們在數(shù)字圖像防偽取證技術(shù)上的研究也獲得了很大的成果,發(fā)明出了很多的鑒別數(shù)字圖像真?zhèn)蔚姆椒?。就技術(shù)層面來說,主要分為主動(dòng)式取證和被動(dòng)式取證兩種方法。主動(dòng)式取證是通過在數(shù)字圖像中添加水印、數(shù)字標(biāo)簽等內(nèi)容來達(dá)到主動(dòng)防偽的目的。這種技術(shù)的主要方法就是在數(shù)字圖像中添加一些特殊的信息,這樣在取證的過程中,通過對(duì)特殊信息的檢測就能夠鑒別數(shù)字圖像的真?zhèn)巍_@種技術(shù)最早出現(xiàn)在1996年,在技術(shù)層面已經(jīng)非常成熟,但是隨著各種信息技術(shù)的發(fā)展,人們還是可以通過一些方法來對(duì)這些信息進(jìn)行修改,因此我們還要不斷完善主動(dòng)式取證技術(shù)。
而被動(dòng)式取證技術(shù)則是通過對(duì)數(shù)字圖像進(jìn)行掃描,然后與一些原始的數(shù)據(jù)模型進(jìn)行對(duì)比,尋找出異常的地方來進(jìn)行取證。這種技術(shù)存在很多的技術(shù)難點(diǎn),在鑒別數(shù)字圖像的過程中也存在著很大的局限性。但是在一些特殊場合也能起到一定的作用,相信隨著技術(shù)的不斷完善,這種方法更容易提高辨別程度的準(zhǔn)確性,因此我們也應(yīng)該加強(qiáng)對(duì)這種技術(shù)的研究。
4 兩種取證技術(shù)的具體分析
4.1主動(dòng)式取證技術(shù)
在主動(dòng)式取證技術(shù)中,我們主要對(duì)其中的兩個(gè)方面來進(jìn)行研究,首先是數(shù)字圖像完整性的取證。因?yàn)閿?shù)字圖像轉(zhuǎn)換為計(jì)算機(jī)語言就是一個(gè)個(gè)的數(shù)字,這些數(shù)字具有一定的排列順序,在這種情況下,對(duì)數(shù)字圖像加入水印,就可以給數(shù)字圖像貼上一個(gè)標(biāo)簽。而這種水印對(duì)于數(shù)據(jù)的改變具有非常高的敏感性,只要有比特級(jí)數(shù)據(jù)的變動(dòng),那么這種水印就會(huì)消失,從而在日后的取證過程中無法找到水印的痕跡,這樣就能夠達(dá)到取證的目的。
其次,就是對(duì)數(shù)字圖像的篡改取證,這種技術(shù)可以檢測出數(shù)字圖像被篡改的部分。因?yàn)榧夹g(shù)的限制,數(shù)字圖像存在著一定的失真,在數(shù)字圖像信息中加入半脆弱水印,就能夠?qū)D像失真帶來的影響降到最低。這主要是基于在取證過程中,對(duì)于正常情況下的失真,水印表現(xiàn)出魯棒性,而對(duì)于非正常情況下的失真,水印表現(xiàn)為敏感性,這樣在感受到來自外界惡意的篡改時(shí),半脆弱水印就會(huì)起作用,表現(xiàn)出對(duì)篡改信息的敏感性,從而導(dǎo)致水印消失,來達(dá)到取證的作用。
4.2被動(dòng)式取證技術(shù)
在被動(dòng)式取證技術(shù)的研究方面,我們主要討論對(duì)自然數(shù)字圖像的篡改,基于計(jì)算機(jī)生成圖像的取證我們之前的研究還不是很深入。在自然數(shù)字圖像取證面,我們主要是通過以下幾種方法來進(jìn)行圖像的取證。首先,就是基于對(duì)物理特性進(jìn)行分析來進(jìn)行取證。這種篡改方法的原理是通過對(duì)同一自然景象進(jìn)行反復(fù)拍攝,然后將兩幅區(qū)別不大的圖像通過軟件的方法來進(jìn)行合成,這樣就會(huì)形成一副全新的數(shù)字圖像。但是每一副數(shù)字圖像都具有各自的物理特征,因此必然會(huì)存在著一定的區(qū)別,產(chǎn)生這種區(qū)別的地方主要在于相機(jī)的硬件特征,每個(gè)相機(jī)都有不同的噪聲,而且采用的濾鏡方式也都不同,并且都具有各自的圖像算法。這樣在取證的過程中對(duì)這些物理特性進(jìn)行分析,就能夠?qū)ふ业奖淮鄹牡牟糠?,從而達(dá)到鑒別真?zhèn)蔚哪康摹?/p>
另外,每一副數(shù)字圖像的外部自然環(huán)境都存在著或多或少的差異,因此根據(jù)數(shù)字圖像的外界環(huán)境來進(jìn)行圖像檢測也屬于運(yùn)用物理特性來進(jìn)行圖像取證。在拍攝同一景物的過程中,必然會(huì)出現(xiàn)各種細(xì)微的差別,例如光照方向和光的一些特性,基于這樣一個(gè)原理,我們就可以通過對(duì)圖像的外界光環(huán)境來進(jìn)行分析,從而尋找出其中被篡改的痕跡。
其次,就是基于物體幾何特性的分析,這種方法主要是通過對(duì)目標(biāo)物體進(jìn)行掃描,來對(duì)其幾何特性進(jìn)行分析。通過對(duì)目標(biāo)物體進(jìn)行抓取,然后跟實(shí)際模型的比例進(jìn)行對(duì)照,然后通過移動(dòng)、旋轉(zhuǎn)和縮放等手段來進(jìn)行處理,通過這樣一個(gè)過程,我們就可以尋找出像素之間的變動(dòng),從而發(fā)現(xiàn)篡改的痕跡。
最后,就是基于圖像的統(tǒng)計(jì)特征來進(jìn)行取證。通過建立一套模型數(shù)據(jù)庫,將圖片的一些通用特征進(jìn)行建模,然后將數(shù)字圖像內(nèi)容與數(shù)據(jù)庫進(jìn)行比對(duì),這樣就可以在圖像的關(guān)聯(lián)性及相關(guān)性層次來對(duì)圖像進(jìn)行處理,在這樣的一個(gè)對(duì)比過程中,我們就能夠發(fā)現(xiàn)因?yàn)榇鄹亩鴰淼膱D像關(guān)聯(lián)性不一致的問題,從而實(shí)現(xiàn)智能識(shí)別圖像中的異常情況。
另外一種取證技術(shù)就是基于計(jì)算機(jī)生成圖像的取證,這種取證技術(shù)主要是對(duì)數(shù)字圖像的整數(shù)維空間和分?jǐn)?shù)維空間進(jìn)行數(shù)據(jù)分析。在整數(shù)維空間研究中,我們主要是對(duì)其空間值域的一些特性進(jìn)行分析,包括方差、平均值、偏態(tài)以及峰態(tài)等內(nèi)容,將這些數(shù)據(jù)進(jìn)行統(tǒng)計(jì),然后在小波值域內(nèi)進(jìn)行對(duì)比,進(jìn)而達(dá)到數(shù)字圖像取證的目的。在分?jǐn)?shù)維空間研究中,我們研究的依據(jù)就是自然圖片和計(jì)算機(jī)生成圖片存在著一定的特性差異,在分?jǐn)?shù)維的領(lǐng)域中對(duì)這些差異特征進(jìn)行提取分析,從而達(dá)到取證的目的。
5 計(jì)算機(jī)生成圖像取證關(guān)鍵技術(shù)的研究
5.1以高階統(tǒng)計(jì)量為依據(jù)的圖像取證技術(shù)
在對(duì)計(jì)算機(jī)生成圖像進(jìn)行取證時(shí),通過對(duì)其高階統(tǒng)計(jì)量進(jìn)行分析就是一種比較有效的取證方法。這種方法的原理是通過對(duì)特征量數(shù)據(jù)進(jìn)行區(qū)分,進(jìn)而判斷出哪些數(shù)據(jù)是屬于自然圖像,哪些數(shù)據(jù)是屬于計(jì)算機(jī)生成圖像。而進(jìn)行取證的具體方法如下,首先,需要對(duì)數(shù)字圖像中的特征量進(jìn)行提取,然后對(duì)這些特征量進(jìn)行分析,最后在將這些分析過的特征量輸入到一個(gè)特定的分類器中,然后將這些分類數(shù)據(jù)與自然生成圖像的數(shù)據(jù)進(jìn)行對(duì)比,這樣就能夠區(qū)別出自然圖像和計(jì)算機(jī)圖像。但是僅僅通過數(shù)據(jù)的對(duì)比來進(jìn)行圖像的取證還是存在一定的局限性,而影響圖像取證準(zhǔn)確性的因素主要跟圖像的算法有關(guān)系,而想要提升圖像算法的準(zhǔn)確性,就需要我們利用高階統(tǒng)計(jì)量有關(guān)的內(nèi)容。
首先需要我們明白計(jì)算機(jī)生成圖片的原理,計(jì)算機(jī)生成圖像就是對(duì)真實(shí)場景進(jìn)行再現(xiàn),利用計(jì)算機(jī)技術(shù)對(duì)真實(shí)物體進(jìn)行模擬,從而獲得一種真實(shí)感較強(qiáng)的圖像,但是計(jì)算機(jī)生成的圖像與自然圖像在原理上存在著本質(zhì)區(qū)別,因此我們可以利用這一區(qū)別來進(jìn)行圖像的取證。自然圖像具有很強(qiáng)的內(nèi)在聯(lián)系性和相關(guān)性,但是計(jì)算機(jī)生成的圖像則不具備這樣的特征,因此我們可以基于高階統(tǒng)計(jì)量的數(shù)據(jù)來進(jìn)行計(jì)算機(jī)生成圖像的鑒別。小波變換具有多制度和高分辨率的特點(diǎn),因此我們可以從獲得的高階統(tǒng)計(jì)量數(shù)據(jù)中來對(duì)比這些數(shù)據(jù),從而起到鑒別計(jì)算機(jī)生成圖片的目的。
Farid就是一種非常常用的高階統(tǒng)計(jì)量算法,通過特征值的算法進(jìn)行統(tǒng)計(jì),然后將數(shù)據(jù)與原始數(shù)據(jù)模型進(jìn)行對(duì)比,最后通過計(jì)算來獲取最后的特征數(shù)值。之后就是對(duì)分類器進(jìn)行設(shè)計(jì),通過使用這些獲取的最終特征數(shù)值來對(duì)分類器進(jìn)行訓(xùn)練,這樣分類器就能夠?qū)Ω鞣N數(shù)值進(jìn)行區(qū)分,最終達(dá)到圖像數(shù)值分類的效果。Farid通過濾波器來分離這些特征值,然后將獲得的特征值進(jìn)行小波轉(zhuǎn)換,然后再次進(jìn)行濾波操作,就能夠獲得四個(gè)不同的子帶,然后找出其中的低通自帶,進(jìn)行重復(fù)小波變換和濾波操作,最后四條不同的子帶可以計(jì)算出不同的特征值頻譜,進(jìn)而獲得具體的特征值。之后的操作要借助最優(yōu)線性預(yù)測器,尋找到另外一組的特征值,進(jìn)行數(shù)據(jù)求解,這樣就能夠?qū)⒄`差減小,進(jìn)而獲得準(zhǔn)確的數(shù)值。
5.2基于多維提取的計(jì)算機(jī)生成圖像取證技術(shù)
多維提取計(jì)算法也是一種常用的計(jì)算機(jī)生成圖像取證技術(shù),人們通過計(jì)算機(jī)尋找圖像在空間域和變換域中的一些特征來進(jìn)行檢測,這種檢測方法能夠快速準(zhǔn)確地對(duì)3D生成圖像進(jìn)行識(shí)別,但是這種方法存在著一定的局限性,因?yàn)檫@種方法需要很多復(fù)雜的數(shù)學(xué)模型,但是我們在數(shù)學(xué)模型的建立上還面臨著模型嚴(yán)重不足的情況,因此這種方法的應(yīng)用性欠佳。
相比于Farid技術(shù),多提取計(jì)算法充分考慮了圖像的時(shí)域特性,進(jìn)而在檢測精度上有所提高。多維提取計(jì)算法可以將圖片中的空間域和變換域中的值進(jìn)行提取,這樣的算法可以更好地對(duì)圖片的顏色特征以及邊緣特征進(jìn)行取證,大大提高圖像檢測中顏色和邊緣的精準(zhǔn)度。顏色是一個(gè)圖像的重要特征,通過對(duì)顏色數(shù)據(jù)的分析,我們可以獲得很多的信息,但是計(jì)算機(jī)生成的圖像在顏色的表現(xiàn)方面跟自然圖片相比還存在一定的差距,通過細(xì)致的數(shù)據(jù)對(duì)比,我們可以發(fā)現(xiàn)在顏色細(xì)節(jié)方面的呈現(xiàn)時(shí),計(jì)算機(jī)生成圖像存在著明顯的過渡不自然的情況。
這種多維提取計(jì)算法的重點(diǎn)在于對(duì)特征值得提取,然后通過分類器來進(jìn)行數(shù)據(jù)的處理,之后再將數(shù)據(jù)與數(shù)據(jù)模型進(jìn)行對(duì)比,從而對(duì)圖片進(jìn)行區(qū)分,為了提高圖像的識(shí)別精度,需要我們在空間域和變換域?qū)μ卣髦颠M(jìn)行采集,從而提高基礎(chǔ)數(shù)據(jù)的準(zhǔn)確性,進(jìn)而通過計(jì)算來提高計(jì)算結(jié)果的準(zhǔn)確性。
6 兩種處理技術(shù)仿真實(shí)驗(yàn)結(jié)果對(duì)比
6.1基于高階統(tǒng)計(jì)量為依據(jù)的圖像取證技術(shù)仿真實(shí)驗(yàn)結(jié)果
基于這種算法,我們進(jìn)行仿真實(shí)驗(yàn)。首先我們選取一些圖片來作為原始圖片,其中一半是計(jì)算機(jī)生成圖片,而生成的圖片主要通過3Ds MAX和Maya等軟件來進(jìn)行制作。這些圖片包含了室內(nèi)室外以及白天黑夜等各種場景。另外的一半圖片主要是用數(shù)碼相機(jī)進(jìn)行拍攝。然后分別拿出計(jì)算機(jī)生成圖片和自然圖片的一半來組成原始的數(shù)據(jù)庫。
然后將剩下的圖片按照基于高階統(tǒng)計(jì)量為依據(jù)的圖像取證技術(shù)進(jìn)行處理,我們可以發(fā)現(xiàn)在訓(xùn)練集中,計(jì)算機(jī)生成圖像的識(shí)別率為百分之七十,而自然圖像的識(shí)別率高達(dá)百分之九十八。而在測試集中,我們可以發(fā)現(xiàn)計(jì)算機(jī)生成圖像的識(shí)別率為百分之五十,而自然圖像的識(shí)別率為百分之八十。這樣的實(shí)驗(yàn)結(jié)果說明,這種算法在準(zhǔn)確性上還需要進(jìn)行提高,在實(shí)際的測試結(jié)果中,基于這種原理來測得的數(shù)據(jù)還是無法取得令人滿意的效果,因此我們還需要對(duì)這種算法的原理進(jìn)行優(yōu)化。
6.2基于多維提取的計(jì)算機(jī)生成圖像取證技術(shù)仿真實(shí)驗(yàn)結(jié)果
基于此種算法來進(jìn)行計(jì)算機(jī)生成圖片的識(shí)別我們發(fā)現(xiàn),在面對(duì)同樣的測試數(shù)據(jù)時(shí),我們在訓(xùn)練集中的測試成績是,計(jì)算機(jī)生成圖像識(shí)別率為百分之七十五,而自然圖像的識(shí)別率沒有什么變化,在百分之九十七左右,而在測試集中,計(jì)算機(jī)生成圖像的識(shí)別率則稍有提升,達(dá)到了百分之六十五,而對(duì)自然圖像的識(shí)別依然在百分之八十左右,由此可見基于多維提取的計(jì)算機(jī)生成圖像取證技術(shù)相比于基于高階統(tǒng)計(jì)量為依據(jù)的圖像取證技術(shù)在計(jì)算機(jī)生成圖像上有一定的優(yōu)勢,但是這種優(yōu)勢也并不明顯。
通過這兩種算法仿真結(jié)果的對(duì)比,我們發(fā)現(xiàn)多維提取法在識(shí)別計(jì)算機(jī)生成圖片上存在著一定的優(yōu)勢,而產(chǎn)生這些優(yōu)勢的來源應(yīng)該在于,對(duì)影響圖片區(qū)別的各種因素進(jìn)行綜合的對(duì)比,這樣通過多維度數(shù)據(jù)的對(duì)比,可以更好地對(duì)圖片進(jìn)行取證,因此在未來的發(fā)展中,我們應(yīng)該將更多影響圖片區(qū)別的因素考慮進(jìn)來,從而進(jìn)一步提高對(duì)計(jì)算機(jī)生成圖片的識(shí)別率。
7 未來發(fā)展趨勢
對(duì)于數(shù)字圖像的鑒別我們還有很長的路要走,尤其是在鑒別計(jì)算機(jī)生成圖像方面,就目前的技術(shù)水平而言,我們還無法準(zhǔn)確快速地識(shí)別出這些計(jì)算機(jī)生成圖像,因此在未來的發(fā)展道路上,需要我們在提高檢測精度和優(yōu)化分類器上做出進(jìn)一步的努力。
首先,需要我們重新對(duì)特征值的數(shù)據(jù)模型進(jìn)行優(yōu)化,在多維提取計(jì)算法中,需要我們充分考慮影響圖片信息的各個(gè)因素,通過更多方面的異同來進(jìn)行數(shù)字圖像的對(duì)比,另外還需要我們充分考慮這些影響因素之間的關(guān)聯(lián),確認(rèn)這些影響因素是否相關(guān)聯(lián)。如果存在關(guān)聯(lián),還需要我們運(yùn)用一些特殊的算法來進(jìn)行優(yōu)化,將這些因素之間的關(guān)聯(lián)降到最低,這樣才能夠更好的實(shí)現(xiàn)影響因子的獨(dú)立性,從而提高圖像鑒別技術(shù)的準(zhǔn)確性。
其次,需要我們對(duì)分類器的原理進(jìn)行優(yōu)化,分類器是處理數(shù)據(jù)的一個(gè)重要組成部分,因此加強(qiáng)分類器的分類作用,可以明顯提高數(shù)據(jù)分類的準(zhǔn)確性,想要優(yōu)化分類器,就需要我們對(duì)分類器的算法進(jìn)行研究,提高算法的準(zhǔn)確程度,進(jìn)而提高圖像的檢測精度。
8 小結(jié)
總而言之,在面向計(jì)算機(jī)生成圖像的智能取證技術(shù)的研究過程中,我們發(fā)現(xiàn)現(xiàn)有的技術(shù)水平還不能夠有效的區(qū)別自然圖片和計(jì)算機(jī)生成圖片。就基于高階統(tǒng)計(jì)量為依據(jù)的圖像取證技術(shù)和多維提取計(jì)算技術(shù)而言,這兩種方法都存在著一定的局限性,在算法與數(shù)據(jù)采集的環(huán)節(jié)都存在著很大的提升空間,因此我們要不斷加強(qiáng)對(duì)這些技術(shù)的攻關(guān),從而更好地推動(dòng)計(jì)算機(jī)生成圖像智能取證技術(shù)的發(fā)展,從而保障信息傳遞的安全。
參考文獻(xiàn):
[1] 李慶華.面向計(jì)算機(jī)生成圖像的智能取證技術(shù)研究[J].信息技術(shù)與信息化,2016(1):100-102.
[2] 王玉平.面向計(jì)算機(jī)生成圖像的智能取證技術(shù)研究[D].上海交通大學(xué),2007.
[3] 喬通,錢振興,張新鵬,等.基于局部能量方差特性的數(shù)字圖像取證[J].模式識(shí)別與人工智能,2012,25(2):280-284.