劉進(jìn)林,李欣竹,蔣晨琛
(中國人民公安大學(xué) 警務(wù)信息工程與網(wǎng)絡(luò)安全學(xué)院,北京 100038)
隨著信息技術(shù)的發(fā)展,圖像偽造成本變得越來越低,帶有惡意目的的圖像篡改給人類社會(huì)帶來許多不利的影響。圖像拼接是圖像偽造中最常見的手段,圖像拼接檢測(cè)領(lǐng)域的研究日益增多,提出了各種檢測(cè)圖像拼接的方法。
前些年,檢測(cè)圖像拼接的方法主要集中在拼接圖像造成的不連續(xù)性引起的全局統(tǒng)計(jì)性質(zhì)的變化上。文獻(xiàn)[1]提出了結(jié)合小波域的函數(shù)矩特征與Hilbert-Huang變換(HHT)進(jìn)行拼接檢測(cè)。文獻(xiàn)[2]提出了結(jié)合函數(shù)矩特征與二維相位一致性的方法。利用全局統(tǒng)計(jì)性質(zhì)變化進(jìn)行檢測(cè)的方法不足之處是特征維數(shù)高而且準(zhǔn)確率不高。
近幾年,已經(jīng)提出了提取圖像拼接區(qū)域局部變化進(jìn)行圖像拼接檢測(cè)的方法。文獻(xiàn)[3]提出基于可操縱金字塔變換(SPT)和局部二值模式(LBP)的圖像拼接檢測(cè)方法,用支持向量機(jī)(SVM)進(jìn)行分類。文獻(xiàn)[4]提出基于局部三值模式(LTP)描述圖像統(tǒng)計(jì)特征的方法。文獻(xiàn)[5]提出了基于多尺度局部Gabor相位量化的方法。這些方法的準(zhǔn)確率較高但是特征維數(shù)高,算法時(shí)間復(fù)雜度高。
基于馬爾科夫特征的方法[6-14]是利用圖像拼接區(qū)域局部變化進(jìn)行檢測(cè)的,是檢測(cè)性能最好的方法之一。馬爾科夫特征從多年前就已經(jīng)應(yīng)用于圖像拼接檢測(cè)領(lǐng)域,近兩年馬爾科夫特征的不斷優(yōu)化成為發(fā)展趨勢(shì)。馬爾科夫特征主要在空域[10]、DCT域[6-10,13-14]、DWT域[8-9,12]、QDCT域[11]進(jìn)行提取應(yīng)用于拼接檢測(cè)。文獻(xiàn)[6]提出將矩特征與馬爾科夫特征相結(jié)合的方法。文獻(xiàn)[7]融合了馬爾科夫和DCT特征。文獻(xiàn)[8]提取DCT域與DWT域的馬爾科夫特征。文獻(xiàn)[9]提出了基于二維非因果馬爾科夫模型的方法。文獻(xiàn)[10]提出了基于空域和DCT域的馬爾科夫特征的方法。文獻(xiàn)[11]提出了基于四元數(shù)離散余弦變換(QDCT)域的馬爾科夫特征的算法。文獻(xiàn)[12]提出了基于分塊DWT的方法。以上方法普遍存在特征維數(shù)高時(shí)間復(fù)雜度高、需要額外的降維算法對(duì)特征進(jìn)行降維的問題。文獻(xiàn)[13]提出了基于改進(jìn)的馬爾科夫特征,所提出的算法在離散余弦變換(DCT)域中提取系數(shù)馬爾科夫特征和分塊馬爾科夫特征。文獻(xiàn)[14]提出基于量化馬爾科夫特征的拼接檢測(cè)方法。上述方法都有較高的準(zhǔn)確率,這可以說明馬爾科夫特征的性能十分良好,同時(shí)還存在一些待研究的問題,仍有很大的發(fā)展空間。在空域、DWT域、QDCT域提取的馬爾科夫特征維數(shù)都很高,DCT域的特征維數(shù)相對(duì)較低。提出維數(shù)低、性能更加良好、有更好的適用性和實(shí)用性的方法是十分必要的。
馬爾科夫特征是經(jīng)典的概率特征,同時(shí)也是當(dāng)前用于拼接檢測(cè)中性能最好的特征之一。根據(jù)隨機(jī)過程理論,馬爾科夫隨機(jī)過程是提取像素相關(guān)性的一種工具,而圖像/系數(shù)二維矩陣中,像素/系數(shù)之間存在相關(guān)性,拼接操作改變了圖像像素之間的相關(guān)性。轉(zhuǎn)移概率矩陣可以用來表示馬爾科夫過程。
在圖像拼接檢測(cè)中,首先將數(shù)據(jù)集分為訓(xùn)練集和測(cè)試集,再提取特征,然后訓(xùn)練分類器,最后進(jìn)行分類測(cè)試。
在DCT域提取馬爾科夫特征傳統(tǒng)方法的基本步驟如下,對(duì)于一張大小為M×N的圖像:
(1)變換領(lǐng)域:用B(x,y)表示一個(gè)8×8的圖像塊中的一個(gè)空域位置的值(1≤x,y≤8),將B(x,y)從空間域轉(zhuǎn)換到DCT域:
D(u,v)=DCT(B(x,y))
(1)
其中D(u,v)是與B(x,y)對(duì)應(yīng)的DCT塊內(nèi)的值,(u,v)(1≤u,v≤8)是DCT域的頻域位置。
(2)計(jì)算差分矩陣:傳統(tǒng)的馬爾科夫特征計(jì)算塊內(nèi)的水平、垂直、主對(duì)角線、副對(duì)角線四個(gè)方向的差分矩陣。水平計(jì)算公式如公式(2)所示:
C→(u,v)=D(u,v)-D(u+1,v)
(2)
(3)取閾值T(T為整數(shù)),對(duì)上述差分矩陣的值進(jìn)行截值操作,對(duì)于大于T的值取為T,小于-T的值取為-T,在-T與T之間的值取其整數(shù)部分。
(4)計(jì)算轉(zhuǎn)移概率矩陣:
P(s,t)=Pr(F(u,v)=s|F(u′,v′)=t)
(3)
其中P(s,t)表示不同方向的馬爾科夫特征,(s,t)∈{(n1,n2)|n1,n2=-T,…,-1,0,1,…,T},每一個(gè)方向的特征維數(shù)為(2T+1)×(2T+1)。
提取完特征后,將訓(xùn)練集特征輸入到支持向量機(jī)(SVM)中進(jìn)行訓(xùn)練,將測(cè)試集特征輸入到訓(xùn)練好的分類器中進(jìn)行分類測(cè)試。
改進(jìn)馬爾科夫特征提取過程:
(1)分通道:分別提取彩色圖像的R、G、B三通道圖像。彩色圖像大小為M×N×3,得到三個(gè)大小為M×N的二維矩陣,分別對(duì)每一個(gè)通道作如下操作。
(2)變換域:對(duì)矩陣進(jìn)行8×8分塊的離散余弦變換,將圖像從空域轉(zhuǎn)換到頻域,得到DCT系數(shù)矩陣,取絕對(duì)值后再取整,如公式(1)所示。
(3)計(jì)算差分矩陣:對(duì)DCT系數(shù)矩陣分別計(jì)算兩種(塊內(nèi)、塊間)、兩個(gè)方向(水平、垂直)的差分矩陣,得到四個(gè)差分矩陣。
(4)
(5)
(6)
(7)
其中,1≤u≤N,1≤v≤M上標(biāo)表示差分矩陣的方向,下標(biāo)intra表示塊內(nèi)運(yùn)算,inter表示塊間運(yùn)算。
(4)取閾值T:對(duì)四個(gè)差分矩陣的所有元素值的范圍約束在[-T,T]之間。
(5)計(jì)算馬爾科夫特征:對(duì)塊內(nèi)、塊間的水平、垂直差分矩陣分別計(jì)算對(duì)應(yīng)的水平、垂直轉(zhuǎn)移概率矩陣,得到四個(gè)塊內(nèi)的轉(zhuǎn)移概率矩陣和四個(gè)塊間的轉(zhuǎn)移概率矩陣。
(8)
(9)
(10)
(11)
(6)求和:對(duì)塊內(nèi)、塊間轉(zhuǎn)移概率矩陣分別求和,即求每個(gè)通道塊內(nèi)、塊間四個(gè)轉(zhuǎn)移概率矩陣的和,得到兩個(gè)轉(zhuǎn)移概率矩陣,作為最終特征。當(dāng)T=3時(shí),(2T+1)×(2T+1)=49,每個(gè)顏色通道的特征維數(shù)為98。
(12)
(13)
得到馬爾科夫特征,用于下一步分類。
(14)
圖1表示改進(jìn)馬爾科夫特征提取的流程。在圖中,方框中的箭頭表示差分矩陣與轉(zhuǎn)移概率矩陣的方向。實(shí)線表示塊內(nèi)運(yùn)算,虛線表示塊間運(yùn)算。
圖1 改進(jìn)馬爾科夫特征提取方法
本文提出的特征具有以下特點(diǎn):(1)彩色圖像提取顏色通道圖像,而不是直接轉(zhuǎn)為灰度圖。將彩色圖像轉(zhuǎn)換成灰度圖像后進(jìn)行檢測(cè),在一定程度上改變了原始圖像的統(tǒng)計(jì)特征,掩蓋了拼接的痕跡,降低檢測(cè)效果。(2)不是直接在空域上求馬爾科夫特征,而是在變換域上提取特征。與空域相比,在變換域上使用馬爾科夫特征具有更好的檢測(cè)性能。(3)將轉(zhuǎn)移概率矩陣作用于差分矩陣而不直接作用于原圖像矩陣。差分矩陣中的元素分布以某種方式圍繞著零,分布集中在零上的程度反映了像素/系數(shù)之間相關(guān)性的強(qiáng)弱。將轉(zhuǎn)移概率矩陣應(yīng)用在差分矩陣上,不僅可以降低馬爾科夫轉(zhuǎn)移概率矩陣的維數(shù)而且可以更好地獲取像素相關(guān)性,提取出更明顯的痕跡,減少圖像內(nèi)容帶來的影響。(4)計(jì)算塊間的差分矩陣。不只計(jì)算塊內(nèi)的差分矩陣,計(jì)算塊與塊之間的差距,獲取更全面有效的信息。(5)取閾值T。由于變換域內(nèi)的差值矩陣具有較大的動(dòng)態(tài)范圍,特征的數(shù)量會(huì)非常大,需要取閾值控制得到特征的維數(shù)。(6)求和操作。當(dāng)T=3時(shí),不求和的特征維數(shù)為392,求和后特征維數(shù)為98。不需要額外的降維算法,用求和操作不僅可以得到更好的圖像拼接特征而且可以達(dá)到降維的目的。
對(duì)實(shí)驗(yàn)所用到的數(shù)據(jù)集、分類方法和評(píng)價(jià)指標(biāo)進(jìn)行說明。在三個(gè)公開數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),并與其他方法進(jìn)行對(duì)比。
選用三個(gè)公開的數(shù)據(jù)集:哥倫比亞彩色拼接檢測(cè)圖庫[15]、CASIA V1.0[16]與CASIA V2.0。哥倫比亞彩色數(shù)據(jù)集包括183張?jiān)紙D像和180張篡改圖像,圖像大小從757×568到1 152×768,圖像格式為TIFF格式,全部為簡(jiǎn)單的拼接圖像。CASIA V1.0數(shù)據(jù)集包括800張?jiān)紙D像和921張篡改圖像,圖像大小為374×256,圖像格式為JPEG格式,均為有前處理的拼接圖。CASIA V2.0數(shù)據(jù)集包括7 200張?jiān)紙D像和5 123張篡改圖像,圖像大小從320×240到800×600,原始圖像有JPEG和BMP格式,篡改圖像有JPEG和TIFF格式,拼接圖有前處理和后處理操作。
使用支持向量機(jī)(SVM)分類器[17],使用網(wǎng)格算法尋找最優(yōu)參數(shù),用六倍交叉驗(yàn)證來評(píng)估SVM模型參數(shù),即隨機(jī)選擇整個(gè)數(shù)據(jù)集5/6的圖像作為訓(xùn)練集,剩余1/6作為測(cè)試集,共進(jìn)行30次獨(dú)立的隨機(jī)實(shí)驗(yàn),并取平均結(jié)果作為實(shí)驗(yàn)結(jié)果,以減少隨機(jī)帶來的影響。用三個(gè)評(píng)價(jià)指標(biāo)來衡量算法的性能:查全率(Recall),查準(zhǔn)率(Precision),準(zhǔn)確率(Accuracy,ACC)。Recall=TP/(TP+FN),表示檢測(cè)正確的拼接圖像數(shù)占數(shù)據(jù)集中所有拼接圖像數(shù)的比例;Precision=TP/(TP+FP),表示檢測(cè)正確的拼接圖像占所有檢測(cè)為拼接圖像的比例;ACC=(TP+TN)/(TP+FN+FP+TN),代表數(shù)據(jù)集所有圖像分類正確的圖像所占比例。其中,TP表示在所有拼接圖像中預(yù)測(cè)正確的拼接圖像數(shù),F(xiàn)N表示在所有拼接圖像中錯(cuò)誤預(yù)測(cè)成原始圖像的圖像數(shù),TN表示在所有原始圖像中預(yù)測(cè)正確的原始圖像數(shù),F(xiàn)P表示在所有原始圖像中錯(cuò)誤預(yù)測(cè)成拼接圖像的圖像數(shù)。
本文有一個(gè)變化參數(shù)閾值T,閾值T是在求轉(zhuǎn)移概率矩陣之前對(duì)差分矩陣進(jìn)行值的限制,T決定著特征的維數(shù)大小。如果T太大會(huì)產(chǎn)生冗余信息進(jìn)而增加計(jì)算的時(shí)間復(fù)雜度;如果T太小,就會(huì)帶來過多的信息損失,不能很好地捕獲差分矩陣中系數(shù)的關(guān)聯(lián)性,無法區(qū)分真實(shí)圖像與拼接圖像。本文分別采用T=2、3、4進(jìn)行實(shí)驗(yàn)。
在拼接檢測(cè)時(shí),每一張圖提取三個(gè)顏色通道的特征,如圖1所示。每個(gè)特征單獨(dú)訓(xùn)練一個(gè)SVM分類器,共三個(gè)SVM分類器。測(cè)試時(shí),用訓(xùn)練好的SVM分類器對(duì)圖像進(jìn)行分類。在決策時(shí),采用三選二的方式進(jìn)行綜合決策,即R、G、B三個(gè)通道,如果兩個(gè)通道及以上判斷為拼接圖則認(rèn)為是拼接圖。
在哥倫比亞彩色數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果如表1所示。隨著T值的增大,查全率基本沒有變化,而查準(zhǔn)率在逐步上升,當(dāng)T=3時(shí)準(zhǔn)確率達(dá)到了94.38%,每個(gè)通道的正確率都在90.69%以上。
表1 在哥倫比亞彩色數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果(%)
在CASIA1數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果如表2所示。查全率并沒有隨著T值的增大而有多大變化,保持在98%左右,而查準(zhǔn)率提升了3%,當(dāng)T=4時(shí)達(dá)到了最高的準(zhǔn)確率99.19%,每個(gè)通道的正確率也都在97.75%以上。
在CASIA2數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果如表3所示。查全率也沒有隨著T值的增大有多大變化,保持在95%左右,而查準(zhǔn)率提升了4%,當(dāng)T=4時(shí)達(dá)到了最高的準(zhǔn)確率96.02%,每個(gè)通道的正確率也都超過了94.25%。
表2 在CASIA1數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果 (%)
表3 在CASIA2數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果 (%)
與其他方法檢測(cè)結(jié)果的對(duì)比如表4所示。本文的方法與文獻(xiàn)[2]、[8]、[15]、[16]的方法進(jìn)行對(duì)比,均高于其他方法。本文方法在三個(gè)公開數(shù)據(jù)集上都取得了較好的結(jié)果。
表4 與其他方法檢測(cè)結(jié)果的對(duì)比 (%)
為了評(píng)估算法的有效性,在IEEE IFS-TC第一階段圖像取證競(jìng)賽數(shù)據(jù)集(IFS-TC)上進(jìn)行測(cè)試。數(shù)據(jù)集包括1 050張?jiān)紙D像和1 150張篡改圖像,圖像大小都大于1 024×786。閾值T取值同上文。用同上文一樣的分類方法,用SVM分類器進(jìn)行六倍交叉驗(yàn)證,共進(jìn)行30次獨(dú)立的隨機(jī)實(shí)驗(yàn),取平均結(jié)果作為實(shí)驗(yàn)結(jié)果。評(píng)價(jià)指標(biāo)也同上文一致。實(shí)驗(yàn)結(jié)果如表5所示。當(dāng)T=3時(shí)可以達(dá)到92.23%的準(zhǔn)確率,單獨(dú)一個(gè)通道的正確率也達(dá)到90.91%。從實(shí)驗(yàn)結(jié)果可以看出,本算法具有良好的性能。
表5 在IFS-TC數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果 (%)
本文提出了一種適用廣泛的用于拼接檢測(cè)的馬爾科夫特征。在提取特征過程中,只提取了更能反映出拼接痕跡的水平、垂直兩個(gè)方向的差分矩陣與轉(zhuǎn)移概率矩陣。簡(jiǎn)單的求和操作不僅使特征維度降低同時(shí)更有利于正確分類。提取的改進(jìn)特征在三個(gè)公開數(shù)據(jù)集哥倫比亞彩色圖庫、CASIA1和CASIA2上的準(zhǔn)確率分別達(dá)到了94.38%、99.19%、96.02%。此外,在IFS-TC數(shù)據(jù)集上也取得了不錯(cuò)的結(jié)果,準(zhǔn)確率也達(dá)到了92.23%??梢钥闯?,不同的數(shù)據(jù)集的最優(yōu)參數(shù)是不同的,綜合來看T=3時(shí)在多個(gè)數(shù)據(jù)集達(dá)到了最好的效果,特征維度僅為98維,準(zhǔn)確率也很高。