山東煙臺生產(chǎn)力促進(jìn)中心 王勇亮 鄭學(xué)通 戚 鵬 郭 艷
圖像取證技術(shù)及其相關(guān)問題的研究
山東煙臺生產(chǎn)力促進(jìn)中心 王勇亮 鄭學(xué)通 戚 鵬 郭 艷
由于數(shù)碼圖像的普及,以及圖像處理和信息提取等技術(shù)的快速發(fā)展,使人們對圖像本身有了更高的要求,并且圖像在越來越多的司法或其它鑒定場合成為關(guān)鍵證物,如何在紛亂復(fù)雜的圖像中去偽存真,提取更完備更正確信息成為了當(dāng)前數(shù)字圖像研究中的一個(gè)熱點(diǎn)。圖像取證正是在這個(gè)背景下應(yīng)運(yùn)而生。
自進(jìn)入二十一世紀(jì)以來,隨著個(gè)人電腦和其他數(shù)碼設(shè)備的大規(guī)模普及,圖像幾乎成了人們每天都能接觸到的東西,成為了人們生活中有意或無意都會留下的一個(gè)參照物,所以其中包含的巨量的信息是我們?nèi)≈槐M用之不竭的資源。在司法或其它鑒定領(lǐng)域,只要我們能合理的利用圖像直接或間接包含的信息,我們就能獲取我們能夠想了解的任何一個(gè)方面,所以,對圖像取證技術(shù)的研究具有重大現(xiàn)實(shí)意義。只要擁有優(yōu)越的圖像取證方法,我們就能夠從圖像中看出端倪,進(jìn)而獲取方方面面我們可能用到的信息,為進(jìn)一步的司法舉證或者其他鑒定工作打下良好基礎(chǔ),同時(shí)在這個(gè)信息時(shí)代中借助高科技提供充足的線索,使鑒定人員能夠事半功倍的還原現(xiàn)場,大幅度的提升判斷速度和工作效率。
人們應(yīng)用圖像取證技術(shù)去解決問題的追求主要有以下五個(gè)方面:
一是原始證據(jù)圖像品質(zhì)達(dá)不到需求,需要對圖像進(jìn)行各種優(yōu)化處理來對圖像中的細(xì)節(jié)信息進(jìn)行分辨,以便更加細(xì)致的對照。在現(xiàn)實(shí)生活中,我們經(jīng)常會遇到數(shù)碼設(shè)備由于光線、環(huán)境以及設(shè)備自身性能的問題而得到的不清晰的圖像,導(dǎo)致圖像中的關(guān)鍵目標(biāo)無法進(jìn)行分辨,這類圖像亟需一種有效的優(yōu)化方法來區(qū)分其中的關(guān)鍵目標(biāo),以便為司法或者其他鑒定工作服務(wù);
二是圖像資料數(shù)量巨大,人們需要更加智能的技術(shù)來對圖像中感興趣的信息進(jìn)行快速檢索。當(dāng)前的軟硬件條件下各式各樣的圖像信息數(shù)量龐大,尤其是各種監(jiān)控設(shè)備的廣泛應(yīng)用使得圖像數(shù)量規(guī)模變得更加令人嘆為觀止,有統(tǒng)計(jì)顯示,對于一段時(shí)長6小時(shí)的監(jiān)控錄像,有時(shí)甚至需要使用其時(shí)長60%以上的工作時(shí)間才能完成取證工作,所以人們在這些紛繁復(fù)雜的圖像信息中尋覓自己關(guān)注的特定信息步履維艱,非常需要一種有效的針對圖像內(nèi)容的檢索方法來快速的識別自己感興趣的圖像;
三是隨著各種圖像處理技術(shù)的發(fā)展和圖像處理工具大規(guī)模應(yīng)用,圖像變得越來越容易被篡改和偽造,網(wǎng)絡(luò)上的PS風(fēng)氣日益流行,并且這種修改是肉眼無法覺察的,使得我們在這些真假難辨的圖像面前如墜云霧,更有甚者,一些圖片偽造者別有用心,希望借其“作品”擾亂視聽,歪曲事實(shí),如大名鼎鼎的“華南虎”事件,這類問題造成諸多方面的負(fù)面影響,導(dǎo)致政府公信力或者公眾判斷力下降,破壞社會的安定團(tuán)結(jié),造成許多惡劣后果。另外許多擁有嚴(yán)格版權(quán)的圖像也有被侵權(quán)之憂,人們需要一種有效的區(qū)分圖片真?zhèn)魏蛠碓吹姆椒ǎ?/p>
四是圖像資料中隱含的間接信息的提取,比如圖像中物體的速度或者景深等三維信息,這些都是圖像所能提供的間接信息,我們可以根據(jù)圖像的成像原理,來對其間接信息進(jìn)行分析和提取,檢測圖像中目標(biāo)的位置或速度,來實(shí)現(xiàn)一些極具現(xiàn)實(shí)意義的應(yīng)用,比如汽車超速檢測等;
五是在有足夠的線索時(shí)將其他信息轉(zhuǎn)換為圖像信息,比如模擬畫像和合成照片等參考物證,這些應(yīng)用是另一個(gè)意義上的圖像取證。
以上五個(gè)方面的應(yīng)用是建立在當(dāng)前的硬件應(yīng)用環(huán)境之上的,可概括為增強(qiáng)取證、圖像篡改檢測、圖像間接信息提取、圖像內(nèi)容智能檢索、基于信息的圖像構(gòu)建五個(gè)方面,對圖像取證技術(shù)的研究能夠在目前這個(gè)環(huán)境下為人們提供充足的證據(jù),以便對某一事物進(jìn)行全方位的考察。
本文論述的圖像取證問題范圍涵蓋圖像,下面對這圖像取證五個(gè)方面問題的研究方法與現(xiàn)狀分別進(jìn)行介紹。
從信號圖像出現(xiàn)開始,人們便致力于改善圖像顯示效果,最早的圖像增強(qiáng)可追溯到1921年美國和歐洲進(jìn)行海底電纜通信時(shí),為了改善模擬信號圖像的還原效果,研究人員將圖像的灰度等級從5個(gè)增加到了15個(gè),大大改善了圖像復(fù)原的效果。到了20世紀(jì)60年代,第一臺可以進(jìn)行數(shù)字圖像處理的計(jì)算機(jī)研制成功,人們開始用幾何校正和灰度變換等方法進(jìn)行圖像增強(qiáng),到了70年代初,研究者已經(jīng)將圖像增強(qiáng)技術(shù)應(yīng)用到醫(yī)學(xué)圖像、地球遙感監(jiān)測和天文學(xué)圖像等領(lǐng)域,80年代之后,硬件的快速發(fā)展讓人們有更充足的圖像增強(qiáng)算法來進(jìn)行選擇,進(jìn)入90年代之后,圖像增強(qiáng)技術(shù)更廣泛的應(yīng)用到人們的生活和生產(chǎn)等領(lǐng)域,研究者們開始嘗試將這些算法嵌入到數(shù)碼設(shè)備中。
目前國內(nèi)外關(guān)于圖像增強(qiáng)方法主要有基于空域的方法、基于變換域的方法和基于機(jī)器學(xué)習(xí)或貝葉斯統(tǒng)計(jì)的方法等。其中基于空域的方法主要是從子圖像乃至像素級別對圖像進(jìn)行直方圖均衡[1-2]、線性對比度調(diào)整、反銳化掩膜、自適應(yīng)優(yōu)化[3]等處理,前兩者主要對圖像亮度對比度進(jìn)行優(yōu)化,后兩者主要針對圖像邊緣細(xì)節(jié)進(jìn)行優(yōu)化?;谧儞Q域的方法包括傅里葉(Fourier)變換、小波(Wavelet)變換、曲波(Curvelet)、脊波(Redgelet)和輪廓波(Contourlet)變換、離散余弦(Discrete Cosine Transform)變換等,其原理是將圖像變換到其他空間,然后利用此空間對信號處理的優(yōu)勢進(jìn)行處理,然后再將此空間里的信號重構(gòu)為空域圖像的形式,以實(shí)現(xiàn)優(yōu)化處理。
較之空域圖像增強(qiáng)方法不同,變換域增強(qiáng)方法有其獨(dú)到的優(yōu)勢?;诳沼虻膱D像增強(qiáng)方法往往針對性較強(qiáng),如直方圖均衡方法主要針對圖像的對比度進(jìn)行優(yōu)化增強(qiáng),自適應(yīng)優(yōu)化和反銳化掩膜主要將圖像的邊緣細(xì)節(jié)進(jìn)行效果提升,而變換域方法有時(shí)候能夠取得一舉多得的效果。
隨著數(shù)學(xué)理論的發(fā)展,又出現(xiàn)了許多新的圖像增強(qiáng)方法,其中最具代表性的有基于數(shù)學(xué)形態(tài)學(xué)的方法、基于模糊數(shù)學(xué)的方法、基于人工智能的方法和基于偏微分方程的方法等。
自1814年第一張照片問世之后不久,便出現(xiàn)了對照片的修改和加工,1865年著名攝影家Mathew Brady拍攝的一張照片在后期人為的增加了一個(gè)人物,從此之后,各種出于政治或者其他目的的圖像篡改便流行開來,大部分都是通過拼接手段對照片中的人物或者物品進(jìn)行增加或者移除,進(jìn)入數(shù)碼時(shí)代之后,圖像篡改變的更加簡單易行,隨著數(shù)碼技術(shù)和工具的普及,對圖像是否為篡改和偽造的甄別成為了計(jì)算機(jī)領(lǐng)域又一個(gè)前沿課題,由于圖像篡改檢測涉及到司法、輿論、政府公信力和傳媒等多方面的利害關(guān)系,當(dāng)前學(xué)術(shù)界開始對圖像篡改檢測投入更多的精力進(jìn)行研究。
Shih-fu chang等人通過研究CCD失真校正、非線性伽馬校正、色彩插值、白平衡和傳感器噪聲等對圖像生成的影響,并對這些影響形成的特征進(jìn)行檢測,從而對圖像的來源和圖像是否拼接進(jìn)行鑒定。Hany Farid等人利用小波分解和高階統(tǒng)計(jì)建模等方法來對圖像素材(包括數(shù)碼照片、掃描圖像和計(jì)算機(jī)生成圖像)進(jìn)行盲檢測,根據(jù)來源不同的圖像具有各異的高階統(tǒng)計(jì)的特性,結(jié)合機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘技術(shù),來進(jìn)行來源檢測。Hany Farid和A.Popescu還根據(jù)DCT系數(shù)直方圖中的類采樣效應(yīng)來進(jìn)行二次壓縮檢測,并且通過EM算法(Expectation/Maximization)進(jìn)行數(shù)字圖像重采樣檢測。J.Fridrich等人利用數(shù)碼相機(jī)的模式噪聲來作為檢測標(biāo)準(zhǔn)來判斷相機(jī),進(jìn)行相機(jī)識別。馬里蘭大學(xué)的吳旻利用對圖像不同塊之間DCT系數(shù)的相關(guān)性、信噪比進(jìn)行統(tǒng)計(jì)和雙譜分析的方法,對圖像的空域?yàn)V波、壓縮、重采樣、亮度調(diào)整等篡改操作進(jìn)行檢測。
在圖像防偽方面,數(shù)字水印技術(shù)是當(dāng)前研究的熱點(diǎn),并且在國內(nèi)外的研究中取得了初步的進(jìn)展。數(shù)字圖像篡改取證的研究近年來受到了世界上各國研究機(jī)構(gòu)和研究者的重視,在許多國際重要期刊與國際會議上,圖像盲取證越來越多的成為一個(gè)重要專題,IEEE、Springer都為圖像盲取證設(shè)置了獨(dú)立的期刊,數(shù)字圖像取證科學(xué)的前沿性和重要性由此凸顯出來,一些圖像相關(guān)廠商也在其產(chǎn)品中增加關(guān)于圖像篡改取證的模塊,圖像處理工具大亨Adobe正準(zhǔn)備在其招牌產(chǎn)品Photoshop中增加圖像防偽外掛程序,來進(jìn)行圖像真?zhèn)魏痛鄹牡淖R別。
數(shù)字圖像真?zhèn)握鐒e涉及到圖像處理分析技術(shù)、數(shù)理統(tǒng)計(jì)、模式識別、數(shù)據(jù)挖掘、成像原理、計(jì)算機(jī)視覺等方面的知識,是一項(xiàng)比較復(fù)雜的系統(tǒng)工程。
成像的過程是將三維景物通過光學(xué)系統(tǒng)變換到二維平面上的過程,按照感光媒介不同可分為傳統(tǒng)成像系統(tǒng)和現(xiàn)代成像系統(tǒng),其代表分別為化學(xué)膠片和CCD(或CMOS)。在成像的過程中,拍攝目標(biāo)所包含的各種相關(guān)信息也被悉數(shù)記錄,在計(jì)算技術(shù)發(fā)達(dá)的今天,國內(nèi)外研究者寄希望于將包含在圖像中的這些蛛絲馬跡加以綜合運(yùn)用,以便獲取許多我們以前只有通過物理測量或人工識別才可以獲取的信息,這些應(yīng)用在現(xiàn)代被歸類為機(jī)器視覺。
機(jī)器視覺主要通過將觀察對象進(jìn)行數(shù)字化,根據(jù)人類的判別規(guī)則來對觀察目標(biāo)進(jìn)行判別,或者逆用成像原理來獲取觀察目標(biāo)的物理數(shù)據(jù),從而實(shí)現(xiàn)對數(shù)字化圖像信息進(jìn)行自動(dòng)化的識別,這些需要識別的信息主要包括被拍攝目標(biāo)與相機(jī)之間的距離、目標(biāo)運(yùn)動(dòng)速度、圖像中包含的文字乃至人物等等,對圖像中的這些信息進(jìn)行精確識別一直都是機(jī)器視覺領(lǐng)域的研究重點(diǎn)和難點(diǎn)。在現(xiàn)代的生產(chǎn)生活中,機(jī)器視覺已經(jīng)越來越多的被應(yīng)用到實(shí)際,完成一些重復(fù)性和機(jī)械性的識別工作,以彌補(bǔ)人眼長時(shí)間連續(xù)進(jìn)行機(jī)械性識別易產(chǎn)生疲勞和不穩(wěn)定的不足,減輕人類的勞動(dòng)強(qiáng)度,在一些智能機(jī)器人中,也置入了機(jī)器視覺模塊,以便判斷周圍環(huán)境,為高級人工智能程序提供輸入信息。
1987年,Pentland首先提出了圖像模糊程度與物體距離之間的關(guān)系,并將離焦圖像的點(diǎn)擴(kuò)散函數(shù)近似為類高斯函數(shù)來進(jìn)行計(jì)算。1988年,Subbarao和Gurumoorthy等人取消了對點(diǎn)擴(kuò)散函數(shù)的限制,利用線擴(kuò)散函數(shù)的擴(kuò)散參數(shù)來代表物體與鏡頭之間的距離,只需點(diǎn)擴(kuò)散函數(shù)具有圓對稱性就可以。1999年,Schechner和Kiryati采用靈敏分析的方法來使用圓柱形點(diǎn)擴(kuò)散函數(shù)估計(jì)測距誤差和不同頻率成分的關(guān)系,使離焦測距算法在精度上有了更高的提升。
國內(nèi)外也有許多學(xué)者根據(jù)圖像中運(yùn)動(dòng)模糊位移來測算物體的相對運(yùn)動(dòng)速度,Cannon等利用頻域中的零值條紋在理論上證明從勻速直線運(yùn)動(dòng)模糊圖像中估計(jì)運(yùn)動(dòng)方向和相對運(yùn)動(dòng)尺度的可行性,但并沒有給出自動(dòng)鑒別的方法。
在三維重建方面,目前的主要做法是找到圖像的被動(dòng)線索和主動(dòng)線索,然后根據(jù)同一場景的多個(gè)角度的圖像來進(jìn)行參數(shù)化建模。
基于圖像內(nèi)容的檢索是計(jì)算機(jī)領(lǐng)域擁有戰(zhàn)略意義的新課題,由于其潛在應(yīng)用價(jià)值極大,所以國內(nèi)外對于這方面的研究都比較重視,從九十年代至今,已經(jīng)有許多趨近成熟的系統(tǒng)問世。
國際商用公司(IBM)率先研發(fā)出第一個(gè)圖像內(nèi)容檢索系統(tǒng)QBIC,其后麻省理工學(xué)院(MIT)也憑借其人才優(yōu)勢研發(fā)出了PhotoBook圖像檢索系統(tǒng)。美國哥倫比亞大學(xué)也開發(fā)出了VisualSeek,這類系統(tǒng)主要針對如何選擇合適的全局特征來描述圖像中的內(nèi)容。為了解決圖像內(nèi)容檢索算法實(shí)用性比較差的問題,后來的研究者提出了Image Retrieval算法,各國科學(xué)家沿著這一方向又研發(fā)出了Netra、BlobWorld、SLMPLIcity等系統(tǒng)。
華裔科學(xué)家黃煦濤首先將相關(guān)反饋技術(shù)應(yīng)用于圖像檢索,以減少機(jī)器低層特征與人類高層語義之間的差異,提高檢索結(jié)果的針對性。
在計(jì)算機(jī)模擬畫像方面,早期公安部組織研發(fā)了PZY-110型人像組合儀,不過未能在全國推廣普及。九十年代由公安部和清華大學(xué)開發(fā)的自動(dòng)模擬畫像系統(tǒng)通過了專家鑒定。2001年中國刑警學(xué)院的趙成文教授的“警星CCK-Ⅲ人像模擬組合系統(tǒng)”開發(fā)成功,并達(dá)到了國際先進(jìn)水平。
在顱骨面貌復(fù)原方面,我國的吉林大學(xué)和意大利都靈大學(xué)都采用了首先人工堆顱骨外觀修正,再對顱骨各個(gè)面的二維圖像進(jìn)行采樣并建模。
加拿大哥倫比亞大學(xué)的Imager Lab采用參數(shù)化人臉模型的辦法來進(jìn)行建模,Giuseppe等人采用CT切片的疊加來進(jìn)行三維網(wǎng)格建模,取得了較好的復(fù)原效果。
數(shù)字圖像取證技術(shù)由于起步較晚,尚未形成系統(tǒng)的理論體系和研究模型。本文對圖像取證技術(shù)及其研究內(nèi)容做了綜述,并總結(jié)了圖像取證技術(shù)五個(gè)方面當(dāng)前的國內(nèi)外研究方法與現(xiàn)狀。圖像取證技術(shù)是在當(dāng)前硬件環(huán)境下發(fā)展起來的一個(gè)新興領(lǐng)域,它包括到圖像質(zhì)量優(yōu)化、圖像真?zhèn)舞b別、圖像間接信息提取、圖像內(nèi)容智能檢索、基于信息構(gòu)建圖像等方面,涉及到信號與信號處理、成像原理、計(jì)算機(jī)視覺、數(shù)學(xué)形態(tài)學(xué)、統(tǒng)計(jì)學(xué)乃至密碼學(xué)等領(lǐng)域,是人們從繁雜的圖像信息中搜索有價(jià)值線索的利器,是與現(xiàn)實(shí)生活息息相關(guān)的一個(gè)研究方向,對于司法取證、圖像信息智能過濾和提取、敏感圖像真?zhèn)舞b別等有很大應(yīng)用價(jià)值,極具現(xiàn)實(shí)意義。
[1]劉國軍,唐降龍,黃劍華等.基于模糊小波的圖像對比度增強(qiáng)算法[J].電子學(xué)報(bào),2005,33(4):643-646.
[2]A.C.Popescu and H.Farid.Exposing Digital Forgeries by Detecting Duplicated Image Regions[M].Technical Report,TR2004-515,Dartmouth College,Computer Science,2004.
[3]郭維新.由最佳散焦圖像序列測距[D].廣州:暨南大學(xué),1990.
王勇亮(1987—),男,山東梁山人,碩士研究生,現(xiàn)供職于山東煙臺生產(chǎn)力促進(jìn)中心,主要從事虛擬現(xiàn)實(shí)系統(tǒng)應(yīng)用與研究。