王波,殷建峰,李亞賓
(大連理工大學信息與通信工程學院,遼寧 大連 116024)
JPEG壓縮對相機型號來源取證的影響分析
王波,殷建峰,李亞賓
(大連理工大學信息與通信工程學院,遼寧 大連 116024)
針對實際取證場景中經(jīng)網(wǎng)絡傳輸?shù)腏PEG壓縮圖像,分析了基于彩色濾波陣列(CFA)插值系數(shù)特征、局部二進制模式(LBP)以及圖像質量(IQM)和高階小波統(tǒng)計特征這3種典型的相機型號來源取證方法的性能,評估了社交平臺和網(wǎng)絡媒體情況下已有來源取證算法的性能。實驗結果表明,隨著圖像壓縮質量的下降,相機型號來源鑒別準確率迅速下降,已有方法在實際應用中的性能仍然有待提高。
相機型號來源取證;JPEG壓縮;彩色濾波陣列;局部二進制模式;圖像質量測量;小波變換
在現(xiàn)實生活中,隨著社交平臺不斷發(fā)展,微信、QQ、微博幾乎成為多數(shù)人日常生活的重要組成部分。與此同時,網(wǎng)絡數(shù)字媒體蓬勃壯大,無論是使用范圍、生成數(shù)量還是影響力,都大大超越了傳統(tǒng)媒體,甚至有將傳統(tǒng)紙媒取而代之的趨勢,人們所獲得的信息大多來自于網(wǎng)絡,真相和流言也往往始于網(wǎng)絡。數(shù)字圖像在網(wǎng)絡中傳播的過程中,出于傳輸速率、網(wǎng)絡存儲能力以及數(shù)據(jù)流量限制等方面的考慮,可能經(jīng)歷了尺寸變換、壓縮、潤色等圖像處理過程,JPEG便是常用的一種壓縮標準。但由于用戶終端屏幕分辨率等因素的限制,這些經(jīng)過壓縮的圖像并不會產(chǎn)生明顯的視覺差異,依然保持了良好的顯示效果。鑒于實際需要進行相機來源鑒別的數(shù)字圖像往往是這些從網(wǎng)絡獲得的經(jīng)過壓縮的數(shù)字圖像,它們的數(shù)據(jù)特性和統(tǒng)計分布與原始圖像存在一定差異,因此目前性能優(yōu)秀的各種實現(xiàn)相機來源鑒別方法的有效性和可靠性有必要進行重新評估,增強相關算法對于JPEG壓縮圖像的頑健性,真正地實現(xiàn)對普遍的JPEG壓縮圖像也能獲得良好的性能才更具有實用價值。
為了測試JPEG壓縮圖像對相機型號來源鑒別的影響,本文使用典型的3種方法:基于彩色濾波陣列插值系數(shù)特征、基于局部二進制模式特征、基于圖像質量測量(IQM)結合高階小波統(tǒng)計特征,利用SVM分類器進行訓練和測試,評估3種方法對于壓縮圖像的頑健性。下面對這3種方法的核心特征進行介紹。
2.1 彩色濾波陣列插值
目前,市場上的數(shù)碼相機往往在感光器件前端放置一個彩色濾波陣列,以便在一個像素點獲得RGB中的某一個顏色分量,隨后通過CFA插值算法估計出該像素點另外2個顏色分量。CFA的排列、對應的濾波模式及插值算法決定了獲取圖像數(shù)據(jù)的統(tǒng)計特征。王波等[8]在2009年針對CFA插值系數(shù)的估計和插值算法的盲檢測問題,提出了一種基于協(xié)方差矩陣的CFA插值盲檢測方法,其核心思想是將協(xié)方差矩陣引入插值系數(shù)方程的建立和求解當中。對于不含噪聲、未壓縮的CFA插值圖像,該算法的檢測準確率高達99%。
利用文獻[8]中的思路,采用線性插值模型對插值系數(shù)進行估計。以G通道為例,設選擇鄰域為(2k+1)(2k+1)大小,待插值點為(m,n)點,則CFA插值的一般模型如下。其中,ag、ar、ab分別表示插值的權值系數(shù),
i,j i,j i,j r、g、b分別代表紅色、綠色、藍色通道像素值。對于給定的數(shù)字圖像,利用文獻[4]給出的方法,將240維CFA插值系數(shù)的均值和240維插值系數(shù)的方差構成480維特征向量,從而鑒別相機來源。
2.2 局部二進制模式
文獻[5]中提出了一種基于LBP的相機來源鑒別算法。該算法考慮每個點與8個鄰域數(shù)據(jù)點之間關系,構成包含相機成像過程中遺留痕跡的模型,該模型可以被定義為
其中,R代表鄰域半徑,P代表圓上的樣本點數(shù),設置P=8,R=1。gc和gp分別代表中心像素點的灰度階和鄰域像素點的灰度階,LBP特征的星座圖分布如圖1(a)所示。
圖1 LBP特征星座圖
定義函數(shù)S為
計算中心像素點與周圍點的差值,并根據(jù)函數(shù)S進行二值量化和編碼,就可以獲得如圖1(b)所示的LBP模型。理論上共可獲得256(256=28)種可能的LBP分布模型,將其中出現(xiàn)頻率較高的部分記為“uniform”的LBP,其余為“non-uniform”的LBP。對其中出現(xiàn)頻率較高的59個模型進行統(tǒng)計,構成59維的特征。在紅色和綠色2個顏色通道,分別從空域圖像、經(jīng)過預測誤差處理的圖像、經(jīng)過一階小波變換的圖像中提取該特征獲得354(354=59×3×2)維特征[9]。
2.3 圖像質量特征與高階小波特征
孫雪輝[10]指出,數(shù)碼相機幾乎全部采用了12位模數(shù)轉換器(ADC, analog to digital converter),會引入顏色丟失和噪聲增強,因此圖像質量評價也可作為相機來源鑒別的特征。圖像質量特征是評價圖像質量客觀性的方法和手段,通過量化描述這些不可察覺的差異,不僅可以對圖像的感知變化進行評價,還可以分析不可感知的變化。本)文也采用文獻[11,12]中13維的圖像質量特征,如表1所示。
表1 13維圖像質量特征的構成
Lyu等[13]認為不同的圖像采集設備成像過程中會引入不同的設備特征,并可以在頻域的不同方向和尺度得到反映,基于此,他們使用多尺度小波變換提取了高維統(tǒng)計特征來描述設備差異。Wang等[14]認為數(shù)碼相機成像過程的內(nèi)在缺陷和圖像處理可以用于實現(xiàn)相機來源鑒別,于是提取了高階小波特征和小波系數(shù)特征作為特征向量。本文對圖像進行4階小波變換,選擇RGB三色通道的第4層低頻系數(shù)、水平高頻系數(shù)、垂直高頻系數(shù)、對角高頻系數(shù)的均值、標準差、斜度、峰度作為特征,共形成48(48=3×4×4)維高階小波統(tǒng)計特征。均值、標準差、斜度、峰度的計算方法如下式(4)~式(7)中,Hk(i, j)表示水平分量,c和r分別表示其行數(shù)和列數(shù)。
本文實驗結合以上2種特征,共獲得61(61=13+48)維圖像特征。
3.1 實驗設置與參數(shù)
本文采用來自“Dresden Image Dataset”[15]圖像庫的5個相機型號的圖像,每個型號選取350幅JPEG圖像構成實驗數(shù)據(jù)庫,如表2所示。
表2 實驗數(shù)據(jù)庫
實驗中采用的SVM分類器為LIBSVM-3.21。在實驗中,隨機選取每種相機的250幅JPEG圖像作為分類器的訓練樣本,剩余100幅圖像作為原始測試樣本。
在仿真實驗中,以待測試原圖相機來源鑒別準確率為基礎,設置8個對照組。每個實驗組共500(500=100×5)幅測試圖像,共進行27組實驗。表3為仿真實驗測試圖像的相關信息。
表3 仿真實驗測試圖像
在實際社交平臺的圖像實驗中,每類相機隨機選擇20幅圖像,選擇最常用的社交媒體微信、QQ和微博,在Wi-Fi環(huán)境下對測試圖像進行上傳/下載或傳送,獲得經(jīng)過社交平臺處理的JPEG圖像。每個測試組為100(100=20×5)幅圖像,共進行9組實驗,與待測試原圖相機來源鑒別準確率做對照。其中,微信平臺為安卓客戶端,QQ平臺為電腦客戶端,微博平臺為電腦瀏覽器網(wǎng)頁端。同時,為了避免社交媒體傳送時圖像分辨率的變化對實驗結果的影響,測試圖像統(tǒng)一從原始圖像左上區(qū)域選取1 024×1 024像素大小的子圖像,然后進行社交媒體的傳送壓縮。表4為經(jīng)過社交媒體壓縮后的實驗測試圖像的相關信息。
表4 實際實驗測試數(shù)據(jù)
3.2 實驗結果與分析
如上所述,為了完成基于CFA插值特征、LBP特征、IQM結合高階小波特征的相機來源鑒別方法在面對JPEG壓縮圖像時的性能比較和評估,本文按照第2節(jié)給出的實驗設置,分別基于3類特征完成了36組測試實驗。實驗結果如表5、圖2和圖3所示。
表5 各測試組平均相機來源鑒別準確率
仿真實驗結果表明,對于原始圖像測試,3類算法均可達到比較好的性能:基于CFA插值特征鑒別準確率達到99.4%;基于LBP特征鑒別準確率達98.0%;基于IQM結合高階小波特征略遜一籌,也達到了84.8%。
圖2 相機型號來源取證準確率隨JPEG圖像壓縮質量變化的關系
整體來看,隨著JPEG圖像質量因子的下降,3類算法的鑒別準確率也迅速下降,尤其在圖像質量因子由95下降至90時,3類算法的鑒別準確率從80%左右快速降至50%左右,圖像質量因子下降至65時,3類算法的鑒別準確率基本已經(jīng)穩(wěn)定在20%左右,幾乎相當于對測試樣本隨機分類。
相對而言,基于IQM結合高階小波特征的鑒別準確率隨JPEG圖像質量因子的下降變化更為緩和,但也明顯不能滿足現(xiàn)實需要。基于CFA特征的鑒別盡管在原始圖像測試條件下獲得了最高的準確率,但當JEPG圖像質量因子下降時,其準確率下降也最為劇烈,難以在現(xiàn)實中實現(xiàn)應用。這表明單純依賴相機參數(shù)的特征在面對JPEG壓縮圖像時的頑健性更差。
3類算法的相機來源鑒別準確率隨JPEG圖像質量因子的變化趨勢和3類算法性能的橫向比較如圖2所示。
實際實驗結果顯示,對于從普通社交平臺微信、QQ、微博獲取的圖像,相機來源鑒別結果的準確率與其壓縮算法有很大關系,不同社交媒體下的實驗結果差異很大。對于通過微博壓縮的圖像進行相機來源鑒別,基于CFA特征的鑒別準確率較高,為95.0%。此時基于IQM結合高階小波特征的準確率明顯下降,僅有58.0%,基于LBP特征的鑒別準確率為84.3%,與質量因子為95的標準JPEG壓縮試驗結果相近。讀取壓縮圖像的量化表并與標準量化表對比,發(fā)現(xiàn)微博對原圖進行了質量因子為95的壓縮,此時的鑒別準確率也與測試實驗相符。同樣地微信對話對圖像進行壓縮的質量因子為90,此時3類特征的鑒別準確率都略高于50%,但并不具有實際應用的意義。而經(jīng)過QQ對話壓縮的圖像,鑒別準確率已降至25.0%左右,接近于統(tǒng)計學上隨機分類的概率。現(xiàn)有算法對社交媒體壓縮圖像的來源鑒別準確率仍有待提高。
從社交平臺獲取的圖像與原始圖像相機來源鑒別準確率對比如圖3所示。
圖3 社交平臺壓縮圖像與原始圖像相機型號來源取證準確率對比
圖4~圖6的混淆矩陣清晰地展現(xiàn)了每一類圖像的相機來源鑒別的結果。其中,對角線代表測試圖像被正確分類的百分比,其他則代表錯誤分類的百分比。
圖4 CFA特征檢測混淆矩陣
圖5 LBP特征檢測混淆矩陣
圖6 IQM+高階小波特征檢測混淆矩陣
本文針對JPEG圖像壓縮質量對相機來源鑒別的影響,對基于CFA插值系數(shù)特征、基于LBP特征、基于IQM結合高階小波特征在不同JPEG圖像壓縮質量下進行相機來源鑒別3種算法的性能進行了比較和評估。隨著JPEG圖像壓縮質量的下降,3種算法性能迅速下降,在質量因子約為85時性能已經(jīng)非常不理想,而在面對實際網(wǎng)絡社交平臺的測試圖像時,算法性能與社交媒體壓縮算法有很大關系,但基本與實驗中相同質量因子的準確率相符,當社交媒體對圖像的壓縮因子小于90后,已難以在現(xiàn)實情境中滿足相機來源鑒別的需求。因此,目前使用的相機來源鑒別的相關算法亟待改進。
[1] PIVA A. An overview on image forensics[J]. ISRN Signal Processing, 2013, (1): 1-22.
[2] 王波. 利用成像引入特征的數(shù)字圖像被動盲取證研究[D]. 大連:大連理工大學, 2010. WANG B. Study on passive and blind digital image forensics using characteristics introduced by image formation[D]. Dalian: Dalian University of Technology, 2010.
[3] KOT A C, CAO H. Image and video source class identification[M]// Digital Image Forensics. New York:Springer Press, 2013: 157-178.
[4] SWAMINATHAN A, WU M, LIU K J R. Nonintrusive component forensics of visual sensors using output images[J]. IEEE Transac-tions on Information Forensics and Security, 2007, 2(1): 91-105.
[5] XU G, SHI Y Q. Camera model identification using local binary patterns[C]//IEEE International Conference on Multimedia and Expo(ICME). 2012: 392-397.
[6] KHARRAZI M, SENCAR H T, MEMON N. Blind source camera identification[C]//IEEE International Conference on Image Processing (ICIP). 2004: 709-712.
[7] SAN C K, LAM E Y, WONG K K Y. Automatic source cameraidentification using the intrinsic lens radial distortion[J]. Optics Express, 2006, 14(24): 11551-11565.
[8] 王波, 孔祥維, 尤新鋼, 等. 基于協(xié)方差矩陣的CFA插值盲檢測方法[J]. 電子與信息學報,2009,31(5):1175-1179. WANG B, KONG X W, YOU X G, et al. Blind CFA interpolation detection based on covariance matrix[J]. Journal of Electronics and Information Technology, 2009, 31(5):1175-1179
[9] TAN Y, WANG B, LI M, et al. Camera source identification with limited labeled training set[C]//The 14th International Workshop on Digital-forensics and Watermarking, Tokyo. 2015.
[10] 孫雪輝. 利用多特征和軟件成像的手機圖像盲取證技術[D]. 大連: 大連理工大學,2010. SUN X H. Blind cell-phone image forensics based on multi- features and soft-imaging[D]. Dalian: Dalian University of Technology,2010.
[11] ISMAIL A. Steganalysis using image quality metrics[J]. IEEE Transactions on Image Processing, 2003, 12(2):221-229.
[12] ESKICOIGLU AM, FISHER P S. Image quality measures and their performance[J]. IEEE Transactions on Communication, 1995,43(12): 2959-2965.
[13] LYU S, FARID H. How realistic is photorealistic[J]. IEEE Transactions on Signal Processing, 2005, 53(2): 845-850.
[14] WANG B, GUO Y Q, KONG X W, et al. Source camera identification forensics based on wavelet features[C]//International Conference on Intelligent Information Hiding and Multimedia Signal Processing, Kyoto. 2009:702-705.
[15] GLOE T, BOHME R. The dresden image database' for benchmarking digital image forensics[J]. Journal of Digital Forensic Practice,2010, 3(2-4):150-159.
王波(1981-),男,四川自貢人,大連理工大學副教授,主要研究方向為數(shù)字圖像取證、信息隱藏與信息隱藏分析。
殷建峰(1994-),女,山西太原人,大連理工大學本科生,主要研究方向為數(shù)字圖像取證。
李亞賓(1994-),男,河南漯河人,大連理工大學碩士生,主要研究方向為數(shù)字圖像取證。
Performance evaluation for JPEG compression on model-based source camera identification
WANG Bo, YIN Jian-feng, LI Ya-bin
(School of Information and Communication Engineering, Dalian University of Technology, Dalian 116024, China)
Focusing on JPEG images transferred by social platform and network media from actual forensic cases,quantities of simulation experiments were carried out to evaluate the performance of three typical methods of model-based source camera identification. The methods are based on the feature of interpolation coefficients of color filter array (CFA), local binary pattern (LBP), and image quality measurement (IQM) with high-order wavelet statistic features. The experiments demonstrate that the accuracy decreases rapidly with the compression quality of images decreasing. As a result, methods of model-based source camera identification currently used are demanded better performance in practical scenes.
model-based source camera identification, JPEG compression, color filter array, local binary pattern,image quality measures, wavelet transform
網(wǎng)絡信息時代給人們的生活帶來了極大的便利,數(shù)字圖像已經(jīng)成為了信息的重要載體。同時,各種圖像處理編輯軟件和應用迅速普及,圖像的篡改和偽造變得非常容易和便捷。近年來,在新聞、政治、司法以及科學等領域層出不窮的篡改偽造數(shù)字媒體所引發(fā)的各類事件,沖擊著人們對新聞、司法乃至社會誠信體系的信心。也正因為數(shù)字媒體完整性和真實性分析的急切需求,催生了數(shù)字內(nèi)容取證技術的迅速發(fā)展[1]。相機型號來源鑒別是其中一個重要方面,并且應運而生了各種實現(xiàn)相機來源鑒別的方法?,F(xiàn)有的相機來源鑒別主要劃分為[2]:設備類型鑒別、設備型號鑒別、設備個體鑒別。本文僅討論設備型號的鑒別。相機來源鑒別通常被建模為機器學習中的分類問題[3]。Swaminathan等[4]通過建立線性模型來對彩色濾波陣列(CFA,color filter array)插值系數(shù)進行準確估計,獲得了在19個相機型號下90%的平均鑒別準確率。Xu等[5]提出利用局部二進制模式(LBP,local binary pattern)作為來源鑒別的統(tǒng)計特征,在18個相機型號樣本的情況下,獲得了高達98%的平均鑒別準確率。Kharrazi等[6]提取了數(shù)字圖像中的顏色特征、圖像質量特征以及高階小波特征共34維,獲得了88.0%的平均鑒別準確率。Choi等[7]將不同型號數(shù)碼相機的鏡頭失真作為來源鑒別的核心特征,提取數(shù)字圖像中直線信息的失真來量化描述鏡頭的失真,進而區(qū)分和鑒別不同型號數(shù)碼相機拍攝的圖像,測試結果準確率達到96%。盡管這些方法在十幾個相機類別的情況下,都取得了較優(yōu)的性能,但這樣的結果大多都是基于實驗樣本來自拍攝設備的原始圖像。
s: The National Natural Science Foundation of China (No.61502076), Scientific Research Foundation of the Education Department of Liaoning Province (No.L2015114)
TN911.73
A
10.11959/j.issn.2096-109x.2016.00100
2016-07-12;
2016-08-19。通信作者:王波,bowang@dlut.edu.cn
國家自然科學基金資助項目(No.61502076);遼寧省教育廳科學研究基金資助項目(No.L2015114)