胡 達, 胡永健, 劉琲貝
(華南理工大學(xué) 電子與信息學(xué)院,廣東 廣州 510640)
數(shù)碼相機的普及使得數(shù)字圖像大大地豐富了人們的日常生活和學(xué)習(xí)。然而,人們可以通過功能強大的數(shù)字圖像處理軟件很容易地修改圖像內(nèi)容而不留下任何視覺上的痕跡,使得數(shù)字圖像內(nèi)容不再是眼見為實。在法律訴訟、新聞媒體及科學(xué)發(fā)現(xiàn)等一些領(lǐng)域,需要確定數(shù)字圖像內(nèi)容的可信度,因此數(shù)字圖像取證研究隨之興起[1-3]。
數(shù)字圖像源辨識是數(shù)字圖像取證的重要分支之一,其目的是對數(shù)字圖像來源進行認(rèn)證。由于數(shù)碼相機傳感器各像素點將光信號轉(zhuǎn)換為電子信號的能力各有不同,使得相機成像過程中不可避免地引入了光響應(yīng)非均勻模式噪聲(Photo-response Nonuniformity Noise,簡稱PRNU),統(tǒng)稱為模式噪聲。模式噪聲相對穩(wěn)定、不易消失,而且每種相機拍攝的圖片都含有該相機特有的模式噪聲,因此,模式噪聲可以作為相機指紋實現(xiàn)數(shù)字圖像源辨識[4]。文獻[4]最早提出使用模式噪聲實現(xiàn)數(shù)字圖像源辨識;文獻[5]使用一種基于小波的濾波器對數(shù)字圖像進行去噪,得到其噪聲殘余,通過平均某相機拍攝的多幅圖像的噪聲殘余來提取該相機的模式噪聲,最后使用相關(guān)性檢測器檢測測試圖像中是否含有該模式噪聲來確定測試圖像是否由該相機所拍攝。由于模式噪聲容易被圖像紋理細(xì)節(jié)污染,多位學(xué)者對文獻[4]中所提算法模式噪聲的提取方法和利用進行改進。文獻[6]認(rèn)為相機模式噪聲中的較大分量更值得信賴,因此使用模式噪聲中較大的分量進行相關(guān)性檢測。文獻[7]認(rèn)為只使用一個顏色通道獲得的相機模式噪聲不能完全反映相機傳感器特征,因此把文獻[6]中大分量的思想用在彩色圖像的3個顏色通道上。具體做法是,分別提取R、G、B 3個通道的模式噪聲的大分量。對于某一像素位置,取3個分量中較大值作為該位置的模式噪聲。文獻[8]提出了6種數(shù)學(xué)模型對模式噪聲進行改善,一方面增強模式噪聲,另一方面也抑制圖像內(nèi)容對模式噪聲的影響。文獻[9]從頻域改善模式噪聲,并認(rèn)為圖像紋理細(xì)節(jié)和插值會在某些頻率范圍內(nèi)產(chǎn)生較大的傅里葉幅值,因此只利用模式噪聲中的相位信息實現(xiàn)圖像源辨識。文獻[10]認(rèn)為圖像邊緣信息對模式噪聲的污染比較嚴(yán)重,因此剔除了邊緣處的噪聲殘余作為待檢測信號。實驗證明,上述改進算法均能在一定程度上改善檢測效果。
本文通過分析圖像內(nèi)容對模式噪聲的影響,利用一個評估函數(shù)對測試圖像內(nèi)容進行評估,選取其中亮度高紋理簡單的區(qū)域,從所選擇區(qū)域中提取模式噪聲進行圖像源辨識。
目前,在基于模式噪聲的數(shù)字圖像源辨識方法中,均采用對圖像進行濾波后得到噪聲殘余作為其含有的模式噪聲。文獻[5]提出的基于小波分析的去噪算法是目前使用較廣泛的模式噪聲提取工具,然而該去噪算法對圖像內(nèi)容有較大的依賴性。由Canon IXUS 500相機拍攝的圖片如圖1a所示,對圖1a的綠色通道進行濾波得到的噪聲殘余如圖1b所示。在檢測過程中,該噪聲殘余作為模式噪聲使用,從圖1b看出,原圖中天空區(qū)域紋理平滑,其噪聲殘余也比較光滑,而原圖中草地和樹木區(qū)域的細(xì)節(jié)紋理比較多,其噪聲殘余中也含有很多細(xì)節(jié)紋理印跡。因此,不同區(qū)域的模式噪聲被圖像內(nèi)容污染的情況會不同,其反映源相機固有特性的能力也不同。在檢測測試圖像是否含有某相機模式噪聲時,如果只使用測試圖像中被污染較輕的模式噪聲,則更利于對測試圖像的檢測。
圖1 圖像內(nèi)容對噪聲殘余的影響
文獻[11]研究了圖像內(nèi)容對模式噪聲的影響。首先對噪聲殘余進行建模,即
其中,W為噪聲殘余;I為圖像;K為模式噪聲因子;I·K為模式噪聲分量;ε為圖像隨機噪聲和濾波算法引入的噪聲。
利用多個噪聲殘余,使用最大似然法估計參考相機模式噪聲因子為:
其中,Ik為第k幅圖像;Wk為其噪聲殘余。K的Cramer-Rao下界為:
其中,σ2為ε的方差。
(3)式說明了何種類型的圖像適合提取模式噪聲。當(dāng)圖像數(shù)量一定時,亮度值Ik應(yīng)盡可能的高,但不能飽和,因為飽和區(qū)域的模式噪聲很弱甚至沒有。同時Var(K)與σ2成正比,因此平滑的區(qū)域模式噪聲更好。綜上所述,亮度高紋理簡單區(qū)域的模式噪聲質(zhì)量更高。
文獻[12]根據(jù)紋理和亮度將圖像分為以下4類:低亮度復(fù)雜紋理、中等亮度復(fù)雜紋理、高亮度簡單紋理和飽和亮度中等紋理。理論分析證明第3類模式噪聲的質(zhì)量更好,因此只利用這類區(qū)域的模式噪聲。
文獻[12]算法的關(guān)鍵是從一幅圖像中篩選出第3類圖像區(qū)域,具體做法是:首先定義了2個分別反映圖像紋理和亮度的特征。使用大約20000個32×32的圖像塊,計算每塊的特征值,得到20000個二維特征向量。然后使用模糊聚類算法將這些特征向量聚為4類,分別代表上述4類圖像,得到每類圖像塊的中心點。當(dāng)需要從某圖像中選取亮度高紋理簡單的區(qū)域時,將該圖像進行分塊,計算每個塊的特征向量到第3類圖像中心點的距離。選取距離較小的那些圖像塊作為選擇出的亮度高紋理簡單的區(qū)域。
為驗證文獻[12]將圖像分為4類的假設(shè)的合理性,選取大約25000個大小為32×32且內(nèi)容豐富的圖像塊。采用文獻[12]的方法,計算每個圖片塊的特征向量,這些特征向量的分布如圖2所示,其橫坐標(biāo)和縱坐標(biāo)分別代表2個特征。從圖2中可見,這些特征向量并沒有很明顯地聚成4類,說明將這些圖像塊分成4類的假設(shè)并不合理。
圖2 文獻[12]算法中的特征分布
文獻[12]在實施上存在一定的缺陷。首先需要大量的訓(xùn)練圖片塊獲取每類圖像的中心向量,這一方面增加了訓(xùn)練樣本個數(shù),另一方面增加了算法時間復(fù)雜度。同時,使用不同的圖片塊求得的每類圖像的中心向量可能不同,導(dǎo)致最后選擇的區(qū)域也不同。因此對所使用的訓(xùn)練圖片塊有一定的依賴性。
針對以上分析,本文提出了一種選擇圖像中亮度高紋理簡單區(qū)域的方法。對圖像的亮度和紋理進行綜合評估,其公式為:
其中,I(i,j)為圖像(i,j)處像素值;Icrit為提取模式噪聲的最佳像素值,對于像素值大于或小于Icrit的像素點的模式噪聲質(zhì)量逐漸衰減[11];m和n分別為圖像的高和寬;V(i,j)為以(i,j)處像素為中心的周圍5×5鄰域的方差,其公式為:
其中,μ為鄰域均值。
F1為圖像中所有像素點周圍鄰域的方差的平均值,可以用來評估圖像紋理。紋理越簡單,F(xiàn)1值越?。患y理越復(fù)雜,F(xiàn)1值越大。F2用于評估圖像的亮度,當(dāng)圖像像素值越接近Icrit,則F2越大;反之F2越小。(4)式中F值與F1成正比,與F2成反比,故F可以對圖像的紋理和亮度進行綜合評估。當(dāng)圖像的紋理越簡單,亮度值越接近于最佳像素值時,F(xiàn)值將越小。而對于紋理復(fù)雜亮度低的圖像,其F值就越大。
選擇亮度高紋理簡單的區(qū)域時,將測試圖像分成32×32的不重疊塊。由于模式噪聲是乘性的,太暗區(qū)域的模式噪聲很弱,同時由于像素值范圍有限,亮度飽和區(qū)域的模式噪聲也很弱甚至沒有,因此首先計算每個塊的均值,將均值大于253或小于30的塊剔除,設(shè)置這些塊的F值為無窮大。然后利用(4)式對剩下的每個塊進行評估。根據(jù)文獻[11],設(shè)置Icrit=250、τ=6,計算出每個塊的F值。最后將所有塊的F值進行升序排列,則F值較小的若干個塊對應(yīng)區(qū)域即相對的亮度高紋理簡單的圖像區(qū)域。
本文方法使用評估函數(shù)直接對測試圖像進行預(yù)處理來選取亮度高紋理簡單的區(qū)域,而文獻[12]需要使用額外的訓(xùn)練圖片來節(jié)約訓(xùn)練樣本個數(shù)。
文獻[4]提供了一種常用的參考相機模式噪聲提取方法。首先使用濾波器[5]對某相機拍攝的N幅圖像進行濾波,獲得其噪聲殘余,然后對這些噪聲殘余進行平均,即得到相機的模式噪聲為:
其中,W為模式噪聲;Wk為第k幅圖像噪聲殘余。
通過對多幅圖像的噪聲殘余進行平均,不僅可以抑制圖像內(nèi)容對模式噪聲的影響,而且可以增強模式噪聲。
在提取測試圖像模式噪聲時,首先對測試圖像I進行相同的濾波,得到整幅圖像的模式噪聲Wt。然后利用3.1的方法選擇出測試圖像中亮度高紋理簡單的區(qū)域,并記錄其位置。選取Wt對應(yīng)位置的模式噪聲組成序列ˉWt,即作為測試圖像的模式噪聲。
本文通過檢測測試圖像是否含有某相機的模式噪聲來判斷測試圖像是否由參考相機拍攝。相關(guān)性檢測器為:
由于只使用測試圖像部分區(qū)域模式噪聲,因此在進行相關(guān)性檢測時,參考相機的模式噪聲也應(yīng)該選取相對應(yīng)區(qū)域的部分,而不應(yīng)該使用全部的模式噪聲。綜上所述,本文算法實現(xiàn)流程如圖3所示。
圖3 算法流程圖
為了驗證本文選擇亮度高紋理簡單區(qū)域方法的有效性,本文從原始圖像的左上角剪切出尺寸為1024×1024的區(qū)域作為實驗圖像,且只選擇圖像的綠色分量。FujiFilm Finepix S602相機拍攝的圖像如圖4a所示。將該圖像分成大小為32×32的塊,則一共1024個塊。采用本文算法選擇300個F值較小的塊,選擇的區(qū)域如圖4b所示。
由圖4可以看出,亮度較高且紋理平滑的地面被保留,而紋理復(fù)雜的建筑卻被排除掉,同時像素值趨于飽和的天空也被排除在外。這說明本文算法確實可以選擇出亮度高紋理簡單的區(qū)域。
圖4 選取亮度高紋理簡單區(qū)域方法測試
在利用相機模式噪聲實現(xiàn)圖像源辨識過程中,為了確定圖像是否為某參考相機所拍攝,首先提取參考相機模式噪聲和測試圖像的測試模式噪聲,然后對它們求相關(guān)性值。當(dāng)測試圖像是由參考相機所拍攝時,稱該相關(guān)性值為同類相關(guān)性值,否則稱為異類相關(guān)性值。當(dāng)相關(guān)性值大于某一閾值時,則接受測試圖像是由參考相機所拍攝的假設(shè),否則拒絕。因此,該檢測過程是一個二值檢測,而且2類相關(guān)性值之間距離越大,越有利于檢測。
為驗證只使用測試圖像中亮度高紋理簡單區(qū)域的模式噪聲作為檢測信號的優(yōu)越性,首先分別使用FujiFilm Finepix S602和Canon IXUS 500拍攝50幅天空圖像,提取其相機模式噪聲[4]。然后利用本文方法,選取圖4a中100~1024個F值較小的塊,依次提取這些塊對應(yīng)的測試模式噪聲,并與上述2種相機的相應(yīng)區(qū)域的模式噪聲進行相關(guān)性計算,得到若干個2類相關(guān)性值,觀察相關(guān)性值與所選塊數(shù)量的關(guān)系。
本文之所以選擇塊的數(shù)量大于100個,是由于選取模式噪聲序列太短可能會使得相關(guān)性值沒有意義。而當(dāng)選取的塊數(shù)是1024個時,則選取的是整幅圖像。使用本文和文獻[4]算法時,2類相關(guān)性值與所選取塊的數(shù)量的關(guān)系如圖5所示。盡管文獻[4]計算的相關(guān)性值并不是塊的數(shù)量的函數(shù),但為了便于比較,依然用直線表示,表明相關(guān)性值是一個常量。
從圖5可看出,當(dāng)選擇的塊數(shù)量為300~500時,本文算法的同類相關(guān)性值大大高于文獻[4]的算法。而此時,2種算法的異類相關(guān)性值卻基本接近,這說明本文算法相比于文獻[4]算法可以大大拉開2類相關(guān)性值的距離,更有利于檢測。實驗結(jié)果表明,選取測試圖像中亮度高紋理簡單的區(qū)域的模式噪聲更有利于檢測。
這是由于小波去噪算法[5]得到的噪聲殘余容易被圖像中的紋理細(xì)節(jié)部分所影響。而亮度高紋理簡單的區(qū)域的邊緣細(xì)節(jié)部分較少,從這些區(qū)域提取的模式噪聲被圖像內(nèi)容污染的并不嚴(yán)重,其用來實現(xiàn)源辨識的能力更強。
圖5 2類相關(guān)性值與圖像塊數(shù)量的關(guān)系
為了驗證本文算法的有效性,將本文算法與文獻[4]和文獻[12]算法的實驗結(jié)果進行比較,結(jié)果表明,文獻[12]和本文算法均選擇40%的亮度高紋理簡單的區(qū)域的模式噪聲。
實驗使用了多種參考相機,本文僅列出以FujiFilm Finepix S602和Nikon COOLPIX L3為參考相機時的實驗結(jié)果。利用參考相機拍攝的50幅天空圖片,使用本文提取參考相機模式噪聲。對參考相機和Canon IXUS 70分別拍攝的150幅包含各種紋理的圖片進行測試,得到150個同類相關(guān)性值和150個異類相關(guān)性值。以FujiFilm Finepix S602和Nikon COOLPIX L3為參考相機時的2類相關(guān)性值的散點圖分布如圖6和圖7所示。
圖6 以FujiFilm Finepix S602為參考相機下不同算法的相關(guān)性值散點圖
圖7 以Nikon COOLPIX L3為參考相機時不同算法的相關(guān)性值散點圖
使用不同算法時,2種參考相機下的2類相關(guān)性值的統(tǒng)計量見表1和表2所列。其中,M11和S11分別為同類相關(guān)性值的均值和標(biāo)準(zhǔn)差;M12和S12分別是異類相關(guān)性值的均值和標(biāo)準(zhǔn)差;D為2類相關(guān)性值的均值間的距離。
由圖6和圖7可看出,3種算法均能將參考相機與測試相機分開。從表1和表2可以看出,與文獻[4]相比較,文獻[12]和本文算法大大增加了同類相關(guān)性值,盡管也稍微增加了異類相關(guān)性值,但依然較大地拉開了2類相關(guān)性值距離,說明利用測試圖像中亮度高紋理簡單區(qū)域的模式噪聲更有利于實現(xiàn)圖像源辨識。
當(dāng)以Nikon COOLPIX L3為參考相機時,本文算法的2類相關(guān)性值的距離大于文獻[12]。當(dāng)以FujiFilm Finepix S602為參考相機時,本文算法與文獻[12]結(jié)果相近。值得注意的是,在從測試圖像中選取亮度高紋理簡單的區(qū)域時,文獻[12]需要使用額外的訓(xùn)練圖片獲取每類圖像的中心點。而本文直接使用評估函數(shù)對測試圖像直接進行預(yù)處理,因此本文算法節(jié)約了訓(xùn)練樣本數(shù),且克服了文獻[12]算法對用于獲取每類圖像中心點的圖像的依賴。
表1 FujiFilm Finepix S602為參考相機的統(tǒng)計量
表2 Nikon COOLPIX L3為參考相機的統(tǒng)計量
本文使用圖像中亮度高紋理簡單的區(qū)域的模式噪聲實現(xiàn)數(shù)字圖像源辨識,提出利用評估函數(shù)直接對圖像進行預(yù)處理的方法選擇亮度高紋理簡單的區(qū)域,克服了同類算法中需要額外訓(xùn)練樣本且依賴所選額外樣本的缺陷。實驗結(jié)果證明了本文算法比同類算法的優(yōu)越性。
[1]Hu Y J,Li C T,Zhou C H.Selecting forensic features for robust camera identification[C]//ISC 2010:The 2010International Computer Symposium,2010:506-511.
[2]Fridrich J,Soukal D,Lukas J.Detection of copy-move for-gery in digital images[C]//Proceedings of the Digital Forensic Research Workshop,Cleveland,OH:USA,2003:272-276.
[3]谷宗運,呂皖麗,羅 斌.基于Tchebichef不變矩的數(shù)字圖像被動認(rèn)證算法[J].合肥工業(yè)大學(xué):自然科學(xué)版,2011,34(6):848-852.
[4]Lukas J,F(xiàn)ridrich J,Goljan M.Digital camera identification from sensor pattern noise[J].IEEE Transactions on Information Forensics and Security,2006,1(2):205-214.
[5]Mihcak M K,Kozintsev I,Ramchandran K.Spatially adaptive statistical modeling of wavelet image coefficients and its application to denoising[C]//Acoustics,Speech and Signal Processing,2009:3253-3256.
[6]Hu Y J,Yu B H,Jian C.Source camera identification using large components of sensor pattern noise[C]//International Conference on Computer Science and Its Applications 2009,Jeju,South Korea,2009:1-5.
[7]Hu Y J,Jian C,Li C T.Using improved imaging sensor pattern noise for source camera identification[C]//IEEE International Conference on Multimedia and Expo,Singapore,2010:1481-1486.
[8]Li C T.Source camera identification using enhanced sensor pattern noise[J].IEEE Transactions on Information Forensics and Security,2010,5(2):280-287.
[9]Kang Xiangui,Li Yinxiang,Qu Zhenhua,et al.Enhancing source camera identification performance with a camera reference phase sensor pattern noise[J].IEEE Transactions on Information Forensics and Security,2012,7(2):393-402.
[10]Matsushita K,Kitazawa H.An improved camera identification method based on the texture complexity and the image restoration[C]//International Journal of Hybrid Information Technology,2010:17-28.
[11]Chen M,F(xiàn)ridrich J,Goljan M,et al.Determining image origin and integrity using sensor noise [J].IEEE Transactions on Information Forensics and Security,2008,3(1):74-90.
[12]Gharib F,Akhlaghian F,Ravanjamjah J,et al.Using the local information of image to identify the source camera[C]//The IEEE Symposium on Signal Processing and Information Technology,Luxor Egypt,2010:515-519.