楊林聰,夏志華
(1.南京信息工程大學(xué) 語(yǔ)言文化學(xué)院,江蘇 南京,210044;2.南京信息工程大學(xué) 計(jì)算機(jī)與軟件學(xué)院,江蘇 南京,210044)
數(shù)字隱寫術(shù)利用人類的視覺、 聽覺等感知冗余以及多媒體的數(shù)據(jù)冗余,將秘密信息嵌入到公開的數(shù)字媒體中[1-2]。 隱寫分析以檢測(cè)和提取秘密信息為目的,判斷隱藏信息是否存在,估計(jì)密鑰并提取秘密信息。目前,隱寫分析的研究主要集中于秘密信息存在性的檢測(cè),為此,本文作者對(duì)灰度圖像中空域 LSB(least significant bit)匹配隱寫的檢測(cè)進(jìn)行研究?,F(xiàn)有的LSB匹配的隱寫分析方法主要分為兩大類∶ 針對(duì)型和通用型檢測(cè)方法。其中,針對(duì)型方法設(shè)計(jì)1個(gè)統(tǒng)計(jì)特征,并對(duì)此特征設(shè)定1個(gè)閾值以判斷待檢測(cè)圖像是否隱藏信息。通用型方法通常提取對(duì)信息嵌入敏感的多維特征向量,然后,用基于學(xué)習(xí)的方法從大量樣本中學(xué)習(xí)載體與載密圖像之間的差別,以訓(xùn)練出1個(gè)分類器來對(duì)秘密信息進(jìn)行檢測(cè)。在針對(duì)型方法中,Harmsen等[3]將信息嵌入看成獨(dú)立加性噪聲,提取直方圖特征函數(shù)質(zhì)心檢測(cè)隱藏信息。Ker[4]對(duì)Harmsen的方法進(jìn)行了以下改進(jìn):(1) 用二維直方圖代替了一維直方圖;(2)用下采樣圖像作為載體圖像的校準(zhǔn)版本對(duì)特征進(jìn)行校準(zhǔn)。Fridrich等[5]提出了基于最大似然估計(jì)的檢測(cè)方法,能估計(jì)嵌入的信息長(zhǎng)度。然而,此算法在檢測(cè)未壓縮圖像時(shí)效果較差。為解決高噪聲圖像的檢測(cè)問題,Zhang[6]利用信息隱藏對(duì)圖像直方圖局部極值的影響提取特征,然而,此算法在檢測(cè)用 JPEG(joint photographic experts group)壓縮過的圖像時(shí)效果不佳。在通用型檢測(cè)算法中,Goljan等[7-8]從小波域提取特征來訓(xùn)練分類器。Pevny[9]根據(jù)相鄰像素之間的依賴關(guān)系會(huì)受到信息隱藏的擾亂,利用馬爾可夫模型提取相應(yīng)的特征,并用支持向量機(jī)對(duì)特征進(jìn)行訓(xùn)練和測(cè)試。Liu等[10]利用圖像最低和次低位平面內(nèi)部的相關(guān)性提取特征,并指出隨著圖像復(fù)雜度的提高,其算法的檢測(cè)性能降低。許漫刊等[11-12]利用LSB匹配嵌入對(duì)直方圖的影響提取多維特征來訓(xùn)練分類器。對(duì)于針對(duì)型和通用型檢測(cè)方法,其關(guān)鍵在于設(shè)計(jì)具有的區(qū)分圖像是否含有隱藏信息的特征。盡管LSB匹配嵌入的信息不會(huì)對(duì)人類視覺產(chǎn)生影響,但其無可避免地改變了圖像的某些特性,如空域LSB匹配嵌入可被模擬成在圖像中加入獨(dú)立噪聲,這會(huì)使圖像直方圖變平滑,并擾亂圖像相鄰像素之間的相關(guān)性。為此,本文作者針對(duì)性地提出基于圖像直方圖與圖像相鄰像素相關(guān)性特征的檢測(cè)方法。
將隱寫分析看成二類模式分類問題,特征提取是此問題的關(guān)鍵。 自然圖像的某些基本屬性會(huì)受到信息隱藏的影響如圖像直方圖以及圖像相鄰像素之間的相關(guān)性而發(fā)生改變。下面提取基于這些圖像屬性的特征。
1.1.1 LSB匹配嵌入策略
將灰度圖像用I表示,則圖像像素點(diǎn)可表示為0≤I(i,j)<2L,0≤i<M,0≤j<N。 其中:L為像素灰度值階數(shù);M和N分別為圖像的高度和寬度。設(shè)(i,j)處的載體圖像的灰度為Ic(i,j),嵌入信息后的灰度為Is(i,j),秘密信息比特為b,則LSB匹配嵌入的基本策略如下:
1.1.2 LSB匹配對(duì)圖像直方圖的影響
定義圖像的像素直方圖h(n)=|{(i,j)|I(i,j)=n}|。將LSB匹配嵌入模擬成在圖像中加獨(dú)立加性噪聲,設(shè)嵌入率為p,則LSB匹配嵌入對(duì)圖像直方圖的影響可以表示如下:
若忽略直方圖邊界,則LSB匹配可看成用濾波器[p/4,1-p/2,p/4]對(duì)圖像直方圖進(jìn)行低通濾波,這會(huì)使得圖像直方圖變平滑。
1.1.3 圖像直方圖特征提取
定義圖像直方圖相鄰元素的絕對(duì)差數(shù)組如下:
在Dh(i)的元素中,值較大的元素受到 LSB匹配嵌入的影響較大。對(duì)圖像Dh(i)中的元素進(jìn)行排序,取T個(gè)最大的Dh(i)的元素作為特征。定義圖像直方圖梯度能量為:
由于LSB匹配會(huì)使得圖像直方圖變平滑,LSB匹配嵌入后,載密圖像的Ehg應(yīng)該比載體圖像的小,因此,Ehg也可作為特征來檢測(cè)隱秘信息[11]。
在圖像獲取過程中,相機(jī)的顏色插值與校正、降噪及濾波等過程會(huì)使相鄰像素有很強(qiáng)的相關(guān)性。 由于秘密信息與圖像是相互獨(dú)立的,圖像相鄰像素之間的相關(guān)性會(huì)被秘密信息所擾亂[9]。
圖像相鄰像素之間的相關(guān)性可由圖像相鄰像素之間的差來表示。假定存在相鄰像素對(duì)(a,b),經(jīng)過LSB匹配嵌入后,a與b以相等的概率加減1或者保持不變,那么,像素對(duì)的差值d=a-b也以一定概率p加減1、加減2或者保持不變,見表1。注意:表1沒有考慮像素為0和255的像素。
圖1 3 162幅圖像水平相鄰像素差的平均分布Fig.1 Average distribution of horizontal difference calculated from 3 162 images
表1 LSB匹配嵌入對(duì)相鄰像素差的影響Table 1 Change of difference between adjacent pixels after LSB matching
表2 LSB匹配嵌入對(duì)相鄰像素差的各種改變概率Table 2 Change of difference probability caused by LSBmatching
當(dāng)嵌入率為1 byte/像素時(shí),LSB匹配嵌入會(huì)對(duì)相鄰像素差按照一定的概率發(fā)生改變,如表2所示。由表2可知:不管相鄰像素差是多少,LSB都會(huì)按一定比率加減1、加減2或者保持不變。而在自然圖像中,相鄰像素之間的差服從以0為中心的高斯分布,如圖1所示。
經(jīng)過嵌入后,相鄰像素之間差為0的數(shù)量減少,如圖2所示。本文運(yùn)用共生矩陣模型對(duì)圖像相鄰像素之間的差進(jìn)行建模,以提取圖像相鄰像素相關(guān)性特征。首先,沿水平(h)、垂直(v)、斜線(d)及反斜線(m) 4個(gè)方向計(jì)算相鄰像素差,得到4個(gè)差分圖像:
圖2 信息嵌入前后水平相鄰像素差的概率Fig.2 Probability of difference before and after LSB embedding
然后,從上述4個(gè)差分圖像分別統(tǒng)計(jì)出4個(gè)共生參數(shù)Ch,Cv,Cd和Cm:
其中:若x=y,則否則,?(x,y) = 0 。
最后,對(duì)4個(gè)共生矩陣相對(duì)應(yīng)的元素取平均值,構(gòu)成最終的特征矩陣,此矩陣中的元素可用于檢測(cè)秘密信息的特征。
由于自然圖像的多樣性,從自然圖中提取的特征也具有不平穩(wěn)性,故由信息嵌入造成的圖像特征的變化很可能被圖像特征本身的多樣性所掩蓋。一般地,在原始圖像中嵌入信息對(duì)原始圖像的影響較大,而對(duì)載密圖像進(jìn)行信息再嵌入對(duì)載密圖像的影響較小,因此,對(duì)待檢測(cè)圖像進(jìn)行信息嵌入,構(gòu)造1幅對(duì)應(yīng)的校準(zhǔn)圖像,分別從待檢測(cè)圖像和校準(zhǔn)圖像提取特征,將對(duì)應(yīng)特征的比值作為最終特征。綜上所述,檢測(cè)算法歸納如下:
(1) 對(duì)檢測(cè)圖像用LSB匹配進(jìn)行嵌入,嵌入率為100%,得到對(duì)應(yīng)的校準(zhǔn)圖像。
(2) 分別從待檢測(cè)圖像和校準(zhǔn)圖像提取直方圖特征和相關(guān)性特征,并用待檢測(cè)圖像的特征與校準(zhǔn)圖像的特征的比值作為最終特征,組成特征向量。
(3) 在圖像庫(kù)中,用支持向量機(jī)對(duì)特征向量進(jìn)行訓(xùn)練和檢測(cè)。
在2個(gè)圖像庫(kù)上對(duì)提出的算法進(jìn)行性能驗(yàn)證,并與Ker[4]和Liu等[10]的算法進(jìn)行比較。
NRCS為3 162幅未壓縮的圖像;FREEFOTO為10 408幅JPEG壓縮過的圖像,量化因子為75。 將所有圖像轉(zhuǎn)變成灰度BMP圖像,作為載體圖像用LSB匹配方法進(jìn)行嵌入,嵌入比率包括100%,75%,50%和25%。 對(duì)于NRCS庫(kù),本文用2 000幅載體圖像和2 000幅相應(yīng)的載密圖像來訓(xùn)練分類器。在2 000幅載密圖像中,4種嵌入比率的載密圖像各含500幅;測(cè)試圖像庫(kù)由1 162幅載體圖像和1 162×4=4 648幅載密圖像組成。對(duì)于FREEFOTO庫(kù),用6 000幅載體圖像和6 000幅載密圖像來訓(xùn)練分類器;測(cè)試圖像庫(kù)由4 408幅載體圖像和4 408×4=17 632幅載密圖像組成。
在實(shí)驗(yàn)中,本文取T=20個(gè)圖像直方圖相鄰元素的絕對(duì)差作為圖像直方圖特征。另外,在提取相關(guān)性特征時(shí),設(shè)定式(7)中的參數(shù)s和t,s和t∈{-3,-2,…,2,3}來限定特征維數(shù),提取 7×7=49個(gè)圖像相關(guān)性特征。聯(lián)合直方圖梯度能量Ehg,共提取20+49+1=70個(gè)特征,參數(shù)通過實(shí)驗(yàn)的方法設(shè)定用LIBSVM來訓(xùn)練和測(cè)試分類器。選用RBF核函數(shù),并用Grid搜索來確定核函數(shù)參數(shù)γ和錯(cuò)分懲罰因子C。各檢測(cè)算法的支持向量機(jī)的參數(shù)見表3。
表3 支持向量機(jī)參數(shù)對(duì)(lg C,lg γ)Table 3 Parameters of SVM (lg C,lg γ)
采用檢測(cè)可靠性ρ來評(píng)價(jià)檢測(cè)方法的性能,其定義如下:
式中:A為ROC曲線下面的面積。 各檢測(cè)算法的性能ROC曲線見圖3和圖4,各算法的檢測(cè)可靠性ρ見表4。
同一個(gè)隱藏算法在不同圖像中隱藏的信息,其隱蔽性是有差異的,而且基于不同特征提取模型設(shè)計(jì)的隱藏信息檢測(cè)算法對(duì)不同圖像庫(kù)的檢測(cè)效果也不盡相同。
圖3 不同嵌入率下3種方法對(duì)圖像庫(kù)NRCS的檢測(cè)性能Fig.3 Performance comparison of methods on the detection of NRCS
圖4 不同嵌入率下3種方法對(duì)圖像庫(kù)FREEFOTO的檢測(cè)性能Fig.4 Performance comparison of methods on detection of FREEFOTO
表4 各檢測(cè)算法的可靠性Table 4 Detection reliability of methods
實(shí)驗(yàn)中用了2個(gè)圖像庫(kù)NRCS和FREEFOTO對(duì)本文算法進(jìn)行測(cè)試,其中NRCS包含的是從未經(jīng)過壓縮的圖像,其圖像紋理豐富,噪聲成分較多;FREEFOTO包含了用JPEG壓縮過得圖像,其圖像所含噪聲成分相對(duì)較低。 從整體上來講,含噪聲成分較多的NRCS圖像中隱藏的信息與FREEFOTO圖像相比更難檢測(cè)。 這是因?yàn)長(zhǎng)SB匹配嵌入的信息通常可以看出強(qiáng)度很弱的加性噪聲,此類噪聲很容易被圖像中原有的噪聲淹沒,因此,載體圖像中本來的噪聲能對(duì)隱藏信息起到很好的掩護(hù)作用。
基于不同特征提取模型設(shè)計(jì)的隱藏信息檢測(cè)算法對(duì)不同圖像庫(kù)的檢測(cè)效果也不盡相同。從表4可知:與比FREEFOTO相比,Ker[4]的特征在檢測(cè)NRCS圖像時(shí)更具優(yōu)勢(shì)。Ker[4]利用信息嵌入對(duì)圖像直方圖的影響檢測(cè)隱藏信息。從本文理論推導(dǎo)可知,任何圖像在嵌入信息之后直方圖都會(huì)變平滑,因此,Ker[4]的算法在檢測(cè)2個(gè)圖像庫(kù)時(shí)都應(yīng)該有較好的檢測(cè)性能。然而,從實(shí)驗(yàn)結(jié)果可以看出,Ker[4]檢測(cè)圖像庫(kù)NRCS時(shí)的精度要比檢測(cè) FREEFOTO時(shí)精度要高。其原因是圖像經(jīng)過JPEG壓縮后,其直方圖變平滑,見圖5。因此,LSB匹配嵌入對(duì)經(jīng)過JPEG壓縮過的圖像的直方圖平滑效果,要比未經(jīng)過壓縮的圖像的平滑效果影響弱。
Liu的檢測(cè)方法是基本信息嵌入對(duì)圖像相關(guān)性的干擾提取特征,而 FREEFOTO中圖像相鄰像素之間的相關(guān)性較高,更易受到LSB匹配嵌入的干擾,因此,其算法在檢測(cè)JPEG壓縮過的圖像時(shí)更有優(yōu)勢(shì)。本文算法全面考慮了 LSB匹配對(duì)圖像直方圖和圖像相關(guān)性的影響,并用校準(zhǔn)圖像對(duì)特征進(jìn)行校準(zhǔn),因而,獲得的檢測(cè)效果更好。
圖5 壓縮因子為75時(shí)未壓縮過的和JPEG壓縮過的圖像EghFig.5 Egh of Uncompressed and JPEG-compressed when quantization quality is 75
(1) 將LSB匹配嵌入模擬成像圖像中添加獨(dú)立加性噪聲,分析了LSB匹配對(duì)圖像直方圖和圖像相關(guān)性的影響。在檢測(cè)LSB匹配算法時(shí),應(yīng)全面考慮信息嵌入對(duì)這2類圖像屬性的影響。
(2) 根據(jù)LSB匹配對(duì)圖像造成的影響,利用差分模型和共生矩陣,提取了21個(gè)直方圖特征和49個(gè)相關(guān)性特征。運(yùn)用嵌入信息的方法為待檢測(cè)圖像構(gòu)造校準(zhǔn)圖像,減小了圖像內(nèi)容對(duì)隱藏信息檢測(cè)算法的負(fù)面影響。
(3) 基于圖像直方圖的特征在檢測(cè)未壓縮過的圖像時(shí)更具優(yōu)勢(shì),而基于圖像相關(guān)性的特征則更擅長(zhǎng)檢測(cè)含噪聲較少的圖像中的隱藏信息。本文算法全面考慮了LSB匹配對(duì)圖像直方圖和圖像相關(guān)性的影響,并用校準(zhǔn)圖像對(duì)特征進(jìn)行校準(zhǔn),因而獲得了最佳的檢測(cè)效果。
[1]Lou D C, Hu C H.LSB steganographic method based on reversible histogram transformation function for resisting statistical steganalysis[J].Information Sciences, 2012, 188(4)∶346-358.
[2]Saha B, Sharma S.Steganographic techniques of data hiding using digital images[J].Defence Science Journal, 2012, 62(1)∶11-18.
[3]Harmsen J J, Pearlman W A.Steganalysis of additive noise modelable information hiding[C]//5th Conference on Security and Watermarking of Multimedia Contents.Santa Clara, Canada,2003∶ 131-142.
[4]Ker A D.Steganalysis of LSB matching in grayscale images[J].IEEE Signal Processing Letters, 2005, 12(6)∶ 441-444.
[5]Fridrich J, Soukal D, Goljan X.Maximum likelihood estimation of length of secret message embedded using +/- K steganography in spatial domain[C]//Security, Steganography and Watermarking of Multimedia Contents VII.Bellingham, 2005∶ 595-606.
[6]Zhang J, Cox I J, Doerr G, Ieee.Steganalysis for LSB matching in images with high-frequency noise[C]//9th IEEE Workshop on Multimedia Signal Processing.New York, 2007∶ 385-388.
[7]Goljan M, Fridrich J, Holotyak T.New blind steganalysis and its implications[C]//Security, Steganography and Watermarking of Multimedia Contents VIII.Bellingham, 2006∶ 7201-7213.
[8]Holotyak T, Fridrich J, Voloshynovskiy S.Blind statistical steganalysis of additive steganography using wavelet higher order statistics[C]//9th International Conference on Communications and Multimedia Security.Salzburg, Austria,2005∶ 273-274.
[9]Pevny T, Bas P, Fridrich J.Steganalysis by subtractive pixel adjacency matrix[C]//11th ACM Workshop on Multimedia Security Princeton, NJ, USA, 2009∶ 75-83.
[10]Liu Q Z, Sung A H, Ribeiro B, et al.Image complexity and feature mining for steganalysis of least significant bit matching steganography[J].Information Sciences, 2008, 178(1)∶ 21-36.
[11]許漫坤, 李天昀, 平西建.基于小波估計(jì)和直方圖特征的LSB匹配分析[J].計(jì)算機(jī)工程, 2009, 35(19)∶ 4-6.XU Mankun, LI Tianyun, PING Xijian.Steganalysis of LSB matching based on wavelet estimation and histogram features[J].Computer Engineering, 2009, 35(19)∶ 4-6.
[12]Cancelli G, Doerr G, Cox I J, et al.Detection of ± LSB steganography based on the amplitude of histogram local extrema[C]//15th IEEE International Conference on Image Processing.San Diego,USA, 2008∶ 1288-1291.