肖瑞雪,馮英偉,屈建萍
1.河北建筑工程學(xué)院 信息工程學(xué)院,河北 張家口075000
2.河北建筑工程學(xué)院 電氣工程學(xué)院,河北 張家口075000
3.河北建筑工程學(xué)院 教務(wù)處,河北 張家口075000
隱寫(xiě)術(shù)和隱寫(xiě)分析在相互制約中不斷發(fā)展。當(dāng)前主流的隱寫(xiě)術(shù)是WOW、S-UNIWARD等自適應(yīng)隱寫(xiě)術(shù)[1],它們僅在圖像的紋理區(qū)域嵌入微弱的隱寫(xiě)信號(hào),這使得隱寫(xiě)分析工作面臨更大的挑戰(zhàn)。
典型的傳統(tǒng)隱寫(xiě)分析模型是空域富模型(Spatial Rich Model,SRM)[2],它分為特征設(shè)計(jì)和分類(lèi)兩個(gè)階段。在特征設(shè)計(jì)階段,首先依賴專(zhuān)家手工設(shè)計(jì)的多個(gè)高通濾波器(High Pass Filters,HPFs)獲得富含隱寫(xiě)信號(hào)的子特征向量,并通過(guò)組合等方式獲得約三萬(wàn)多維的子特征;在分類(lèi)階段,采用基于機(jī)器學(xué)習(xí)的集成分類(lèi)器接收高維子特征,完成隱寫(xiě)判別任務(wù)。但大量的子特征使得傳統(tǒng)隱寫(xiě)分析模型的分類(lèi)器需要較長(zhǎng)的訓(xùn)練優(yōu)化時(shí)間,這極大地影響了隱寫(xiě)檢測(cè)的效率;SRM的HPFs不能被訓(xùn)練優(yōu)化,難以應(yīng)對(duì)飛速發(fā)展的隱寫(xiě)術(shù)帶來(lái)的挑戰(zhàn)。
深度學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)可組合淺層次特征信息為高維語(yǔ)義特征,且將特征提取和分類(lèi)階段融為一體加入到模型學(xué)習(xí)過(guò)程中,獲得較高的訓(xùn)練優(yōu)化效率和識(shí)別、分類(lèi)準(zhǔn)確率[3-5]。將深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于隱寫(xiě)分析領(lǐng)域,既有效提高了隱寫(xiě)檢測(cè)效率[6-8],又獲得較好的隱寫(xiě)分析性能。2015年,Qian等人[9]提出基于卷積神經(jīng)網(wǎng)絡(luò)的隱寫(xiě)分析模型,采用KV核進(jìn)行預(yù)處理獲得殘差特征圖,隨后采用五個(gè)卷積層和高斯激活函數(shù)捕獲隱寫(xiě)特征,模型的檢測(cè)準(zhǔn)確率超過(guò)SRM。隨后,Xu等人[10]提出深層次隱寫(xiě)分析模型,采用絕對(duì)值層、TanH激活函數(shù)加強(qiáng)統(tǒng)計(jì)建模。Ye等人[11]提出一個(gè)由八個(gè)卷積層組成的隱寫(xiě)分析模型,在預(yù)處理層加入截?cái)嗑€性單元(Truncated Linear Unit,TLU)和經(jīng)HPFs初始化的卷積核,并首次將其加入網(wǎng)絡(luò)學(xué)習(xí)中;經(jīng)仿真得知,在0.2嵌入率、WOW隱寫(xiě)術(shù)、增強(qiáng)型數(shù)據(jù)集上,采用隨機(jī)初始化卷積核方式的模型的隱寫(xiě)檢測(cè)錯(cuò)誤率為0.5,僅采用SRM的HPFs初始化卷積核方式的模型的隱寫(xiě)檢測(cè)錯(cuò)誤率為0.226 1,將經(jīng)SRM的HPFs初始化的卷積核加入網(wǎng)絡(luò)學(xué)習(xí)過(guò)程的模型的隱寫(xiě)檢測(cè)錯(cuò)誤率為0.198 2,說(shuō)明將經(jīng)SRM的HPFs初始化的卷積核加入網(wǎng)絡(luò)學(xué)習(xí)過(guò)程中可實(shí)現(xiàn)隱寫(xiě)特征的自動(dòng)化學(xué)習(xí),有利于提升模型的特征表達(dá)能力,這一結(jié)論在S-UNIWARD、HILL隱寫(xiě)術(shù)下得到同樣的論證。Yedroudj等人[12]提出一個(gè)由五個(gè)卷積層組成的隱寫(xiě)分析模型,稱為YedroudjNet,在WOW、S-UNIWARD隱寫(xiě)算法上的檢測(cè)準(zhǔn)確率遠(yuǎn)高于傳統(tǒng)的SRM。深度殘差網(wǎng)絡(luò)可有效解決模型網(wǎng)絡(luò)的退化問(wèn)題,也逐漸被應(yīng)用于隱寫(xiě)分析研究工作中[13-16]。
本文設(shè)計(jì)一個(gè)基于高效特征融合的多尺寸圖像隱寫(xiě)分析模型。將經(jīng)HPFs初始化的卷積核加入網(wǎng)絡(luò)學(xué)習(xí)中,便于提升隱寫(xiě)信號(hào)的提取效率;提出特征融合的思想,在特征提取層中融合子網(wǎng)絡(luò)輸出的抽象、非線性的高維隱寫(xiě)特征,獲得特征間依賴性信息,增強(qiáng)隱寫(xiě)特征識(shí)別能力;提出改良版SPP,以自適應(yīng)多尺寸圖像,并有效增強(qiáng)隱寫(xiě)特征的多樣性。
基于高效特征融合的可變尺寸圖像隱寫(xiě)分析模型如圖1所示。
圖1 隱寫(xiě)分析模型簡(jiǎn)圖Fig.1 Steganalysis model diagram
隱寫(xiě)分析模型網(wǎng)絡(luò)由預(yù)處理層、特征提取層和分類(lèi)層組成。在預(yù)處理層中,將經(jīng)多個(gè)HPFs初始化的卷積核加入到網(wǎng)絡(luò)學(xué)習(xí)中,并從輸入圖像中獲得富含多階隱寫(xiě)信號(hào)的殘差特征圖;在特征提取層中,采用子網(wǎng)絡(luò)1提取抽象的隱寫(xiě)語(yǔ)義特征,采用子網(wǎng)絡(luò)2提取非線性、高維的隱寫(xiě)特征,隨后采用改良版空間金字塔池化(Spatial Pyramid Pooling,SPP)[17]獲得多樣化隱寫(xiě)特征和自適應(yīng)多尺寸隱寫(xiě)特征圖,最終采用拼接方法融合兩個(gè)子網(wǎng)絡(luò)特征得隱寫(xiě)特征間的依賴信息;在分類(lèi)層中,采用一個(gè)全連接層與Softmax函數(shù)統(tǒng)計(jì)得圖像樣本的判別概率值,據(jù)此判別圖像為載體圖像或載密圖像。
傳統(tǒng)SRM采用多階HPFs可充分捕獲圖像中水平、垂直、對(duì)角線、副對(duì)角線鄰域像素的相關(guān)信息,輸出經(jīng)抑制圖像內(nèi)容和放大隱寫(xiě)痕跡后的殘差特征圖,因此,在預(yù)處理層中引入SRM的HPFs,有效捕獲隱寫(xiě)信號(hào)。根據(jù)Ye等人[11]的研究結(jié)果可知,將經(jīng)HPFs初始化的卷積核加入到網(wǎng)絡(luò)學(xué)習(xí)中可取得較好的隱寫(xiě)檢測(cè)準(zhǔn)確率,因此,在深度學(xué)習(xí)基礎(chǔ)上,采用36個(gè)HPFs初始化36個(gè)卷積核,并將其加入到網(wǎng)絡(luò)學(xué)習(xí)過(guò)程中,從而彌補(bǔ)手工設(shè)計(jì)的不足,實(shí)現(xiàn)隱寫(xiě)特征的自動(dòng)化學(xué)習(xí),加快收斂速率。在3.1節(jié)開(kāi)展了預(yù)處理層的HPFs和自動(dòng)化學(xué)習(xí)的仿真分析。
在預(yù)處理層中,采用一階、二階、三階、四階、五階、六階HPFs初始化卷積核,它們?cè)谒椒较虻臍埐钪涤?jì)算方法如表1所示。
表1 殘差值計(jì)算方法Table 1 Residual value calculation method
圖2 二階HPFFig.2 Second order HPF
豎直、對(duì)角線、副對(duì)角線方向的HPFs可由水平方向HPF旋轉(zhuǎn)不同的角度所得。殘差特征圖計(jì)算過(guò)程可被變換為卷積運(yùn)算,如公式(1)所示:
R表示殘差特征圖,*表示卷積運(yùn)算,X表示輸入圖像,K表示經(jīng)HPFs初始化的卷積核(寬為W′、高為H′);r(i,j)表示像素(i,j)的殘差值;(r,c)表示第r行、第c列,0≤r≤H′,0≤c≤W′;x(r,c)(i,j)表示中心像素位置為(i,j)的局部圖像(寬為W′、高為H′)的第r行、第c列的像素值,k(r,c)表示K的第r行、第c列的值。采用水平方向的二階HPF初始化后的K如圖3所示。
圖3 卷積核Fig.3 Convolution kernel
經(jīng)一階至六階HPFs初始化的卷積核尺寸分別為3×3、3×3、5×5、5×5、7×7、7×7;根據(jù)對(duì)稱性可得一階至六階HPFs的數(shù)量分別為8、4、8、4、8、4,則經(jīng)HPFs初始化后的卷積核數(shù)量為36。最終輸出一個(gè)包含多階隱寫(xiě)特征的殘差特征圖。
為充分捕獲抽象的隱寫(xiě)語(yǔ)義特征,設(shè)計(jì)由Ghost瓶頸層和殘差模塊組成的子網(wǎng)絡(luò)1。Ghost瓶頸層[18]通過(guò)卷積操作和線性變換可提取豐富的關(guān)鍵隱寫(xiě)特征,其中Ghost瓶頸層1可從殘差特征圖中提取冗余的隱寫(xiě)特征,Ghost瓶頸層2通過(guò)降采樣方法增強(qiáng)對(duì)隱寫(xiě)特征幾何變化的容忍性,且降低參數(shù)規(guī)模,因此借鑒Ghost作者的Ghost瓶頸層1和Ghost瓶頸層2堆疊使用的設(shè)計(jì)模式,依次采用Ghost瓶頸層1、Ghost瓶頸層2提取冗余的隱寫(xiě)特征;對(duì)于豐富、冗余的隱寫(xiě)特征,殘差模塊可通過(guò)多個(gè)網(wǎng)絡(luò)分支提取深層次、抽象的語(yǔ)義特征,有效增強(qiáng)模型的泛化能力,因此采用由兩個(gè)不同深度的網(wǎng)絡(luò)分支組成的殘差模塊從冗余特征中提取抽象的隱寫(xiě)語(yǔ)義特征。子網(wǎng)絡(luò)1的結(jié)構(gòu)簡(jiǎn)圖如圖4所示。
圖4 子網(wǎng)絡(luò)1 Fig.4 Subnet 1
Ghost瓶頸層由Ghost單元模塊組合而成。Ghost單元模塊包括卷積運(yùn)算和線性變換,其計(jì)算方法[18]分別如公式(2)、公式(3)所示:
f表示卷積核;Y=[y1,y2,…,yi,…,ym]表示經(jīng)卷積運(yùn)算的m通道特征圖,1≤i≤m;φ(i,j)(yi)表示對(duì)第i個(gè)特征圖作第j次線性變換;表示經(jīng)線性變換的m×s通道的特征圖,1≤j≤s;φ(i,s)(yi)為Y特征圖的第i個(gè)通道yi。在本文中,設(shè)置s=3。
Ghost單元模塊可靈活自定義卷積核數(shù)量,在卷積運(yùn)算的基礎(chǔ)上添加了線性變換,將m通道的特征圖放大s倍,輸出m×s通道的多樣化、冗余特征圖。對(duì)于隱寫(xiě)分析任務(wù),Ghost單元模塊通過(guò)線性變換提取包含輸入信息的冗余特征,從而增強(qiáng)特征的多樣性,便于提取較微弱的隱寫(xiě)信號(hào)。
Ghost作者設(shè)計(jì)的Ghost瓶頸層1如圖5所示,Ghost瓶頸層2如圖6所示。
圖5 Ghost瓶頸層1Fig.5 Ghost bottleneck layer 1
圖6 Ghost瓶頸層2Fig.6 Ghost bottleneck layer 2
Ghost瓶頸層組合了多個(gè)Ghost單元模塊,期望捕獲充足的隱寫(xiě)特征信息。根據(jù)Ghost[18]領(lǐng)域知識(shí)可知,Ghost瓶頸層中首個(gè)Ghost單元模塊的功能是擴(kuò)展通道數(shù)量;設(shè)置Ghost單元模塊的卷積操作是卷積核尺寸為1×1的點(diǎn)卷積運(yùn)算,從而在保存全面特征信息的同時(shí)減少計(jì)算量。Ghost瓶頸層1可從殘差特征圖中提取冗余的隱寫(xiě)特征;與Ghost瓶頸層1相比,Ghost瓶頸層2插入步長(zhǎng)為2的深度可分離卷積層,可有效增強(qiáng)對(duì)特征幾何變化的容忍性,降低參數(shù)規(guī)模。
為從冗余特征中提取抽象的隱寫(xiě)語(yǔ)義特征,在子網(wǎng)絡(luò)1的尾部添加由兩個(gè)網(wǎng)絡(luò)分支組成的殘差模塊。在殘差模塊中,第一個(gè)網(wǎng)絡(luò)分支由兩個(gè)堆疊的卷積、批次標(biāo)準(zhǔn)化(Batch Normalization,BN)、整流線性單元(Rectifie Linear Units,ReLU)操作組成,其中卷積核數(shù)量分別為144和288,第二個(gè)網(wǎng)絡(luò)分支由一個(gè)卷積、BN、ReLU操作組成,卷積核數(shù)量為288,將它們的輸出特征圖相加得抽象的隱寫(xiě)語(yǔ)義特征圖。
為適應(yīng)隱寫(xiě)信號(hào)的非線性分布,且捕獲高維度的隱寫(xiě)特征,設(shè)計(jì)由Ghost瓶頸層和密集連接模塊組成的子網(wǎng)絡(luò)2。在子網(wǎng)絡(luò)2中,首先采用Ghost瓶頸層2的降采樣方法降低參數(shù)規(guī)模,增強(qiáng)對(duì)隱寫(xiě)特征幾何變化的容忍性;Ghost瓶頸層3采用Ghost瓶頸層1提取豐富的特征信息,再通過(guò)降采樣和非線性變換方法摒棄冗余的特征,并提取非線性特征,因此采用Ghost瓶頸層3提取非線性、低冗余的隱寫(xiě)特征;密集連接模塊通過(guò)大量短路連接匯聚多層特征得高維組合特征,增強(qiáng)特征表達(dá)能力,因此采用密集連接模塊從非線性、低冗余的特征中提取得高維、非線性的隱寫(xiě)特征。子網(wǎng)絡(luò)2的結(jié)構(gòu)簡(jiǎn)圖如圖7所示。
圖7 子網(wǎng)絡(luò)2 Fig.7 Subnet 2
為較好地適應(yīng)隱寫(xiě)信號(hào)的非線性分布狀態(tài),且提取低冗余的隱寫(xiě)特征,設(shè)計(jì)了Ghost瓶頸層3,如圖8所示。
圖8 Ghost瓶頸層3Fig.8 Ghost bottleneck layer 3
Ghost瓶頸層3主要由Ghost瓶頸層1、步長(zhǎng)為3的深度可分離卷積、Ghost單元模塊堆疊而成。其中,Ghost瓶頸層1發(fā)揮增加特征通道數(shù)的功能,所有Ghost模塊的卷積操作是卷積核為1×1的點(diǎn)卷積運(yùn)算。與Ghost瓶頸層1和Ghost瓶頸層2相比,Ghost瓶頸層3采用較大步長(zhǎng)的降采樣方式壓縮獲得低冗余的隱寫(xiě)特征,且采用大量的ReLU非線性變換方法增強(qiáng)隱寫(xiě)特征的非線性表達(dá)能力,以適應(yīng)隱寫(xiě)信號(hào)的非線性分布狀態(tài)。
為提取高維組合特征,增強(qiáng)特征表達(dá)能力,在子網(wǎng)絡(luò)2的尾部添加由3個(gè)卷積層組成的密集連接模塊,其中,每個(gè)卷積層的卷積核數(shù)量均為72。為保證最大程度的信息傳輸,密集連接模塊的每一個(gè)卷積層將其前面所有輸入特征圖進(jìn)行拼接,隨后將輸出的特征圖傳遞給之后的所有卷積層。因此,密集連接模塊通過(guò)特征圖的拼接操作組合多維特征信息,從而能增強(qiáng)模型的特征表達(dá)能力,最終輸出非線性的高維隱寫(xiě)特征。
為應(yīng)對(duì)子網(wǎng)絡(luò)1和子網(wǎng)絡(luò)2的可變尺寸特征圖,增強(qiáng)模型的魯棒性,且提取更多樣化的隱寫(xiě)特征,設(shè)計(jì)了改良版SPP,如圖9所示,其中H表示特征圖的高度,W表示寬度,C表示通道數(shù)。
圖9 改良版SPP Fig.9 Improved SPP
SPP[17]可自適應(yīng)多尺寸的輸入圖像,輸出相同維度的特征向量,改良版SPP也具備這些優(yōu)勢(shì)。此外,改良版SPP將最大池化方法替換為平均池化,以適應(yīng)微弱的隱寫(xiě)信號(hào);且在不過(guò)分增大計(jì)算量的前提下,添加窗口和步長(zhǎng)為(H/3)×(W/3)的平均池化操作,便于捕獲多樣化的隱寫(xiě)特征。相關(guān)的仿真分析結(jié)果見(jiàn)3.6節(jié)。
模型的重要參數(shù)信息如表2所示。擴(kuò)展通道數(shù)表示Ghost瓶頸層中首個(gè)單元模塊或瓶頸層的輸出特征圖通道數(shù)。
表2 模型參數(shù)信息Table 2 Parameter information of model
除特別說(shuō)明,模型網(wǎng)絡(luò)的卷積核尺寸均為3×3,步長(zhǎng)為1,填充模式為“SAME”;采用Xavier初始化所有卷積核權(quán)重,設(shè)置偏置值為0.02。
在BOSSBase v1.01和LIRMMBase圖像數(shù)據(jù)集上進(jìn)行評(píng)估。BOSSBase v1.01數(shù)據(jù)集是從7個(gè)數(shù)字照相機(jī)中獲取的10 000張512×512的PGM格式灰度圖像,圖像與照相機(jī)的詳細(xì)信息如表3所示。
表3 圖像與所屬照相機(jī)信息Table 3 Image and camera information
LIRMMBase數(shù)據(jù)集是10 000張512×512的PPM格式彩色圖像,將其變換為PGM格式灰度圖像,便于開(kāi)展研究。
考慮到當(dāng)前GPU的算力限制,采用MATLAB的imresize()函數(shù)縮放圖像尺寸為256×256;采用WOW、S-UNIWARD自適應(yīng)隱寫(xiě)術(shù)作為隱寫(xiě)檢測(cè)對(duì)象;將隱寫(xiě)分析任務(wù)看作二分類(lèi)問(wèn)題,即標(biāo)記載體圖像為0,載密圖像為1;依據(jù)比例8∶1∶1隨機(jī)劃分載體、載密圖像集至訓(xùn)練集、驗(yàn)證集和測(cè)試集中,則訓(xùn)練集中包含16 000對(duì)載體、載密圖像,驗(yàn)證集中包含2 000對(duì)載體、載密圖像,測(cè)試集中包含2 000對(duì)載體、載密圖像。
實(shí)驗(yàn)的硬件環(huán)境是基于12 GB顯存的TITAN X型號(hào)GPU,軟件環(huán)境是基于Ubuntu16.04系統(tǒng)的Tensorflow深度學(xué)習(xí)框架,編程語(yǔ)言是Python3.7。
初始的學(xué)習(xí)率為0.03,隨后學(xué)習(xí)率依據(jù)指數(shù)衰減法不斷減小。指數(shù)衰減計(jì)算方法如公式(4)所示:
r′表示初始的學(xué)習(xí)率;r表示每輪的已優(yōu)化學(xué)習(xí)率;dr表示衰減系數(shù),為0.95;gs表示全局步數(shù),初始值為0,在訓(xùn)練優(yōu)化階段中,每輸入一次數(shù)據(jù)樣本,全局步數(shù)加1;ds表示衰減速度,為2 000。
根據(jù)圖像樣本的標(biāo)簽和模型的預(yù)測(cè)值,采用準(zhǔn)確率表征模型的預(yù)測(cè)性能,計(jì)算方法如公式(5)所示:
TP表示標(biāo)簽值是正例、預(yù)測(cè)值也是正例的圖像樣本量;TN表示標(biāo)簽值是負(fù)例、預(yù)測(cè)值也是負(fù)例的圖像樣本量;FP表示標(biāo)簽值是負(fù)例、預(yù)測(cè)值是正例的圖像樣本量;FN表示標(biāo)簽值是正例、預(yù)測(cè)值是負(fù)例的圖像樣本量。
采用熱力圖表征模型隱寫(xiě)檢測(cè)功能的正確性。模型可能學(xué)習(xí)到固定數(shù)據(jù)集中與隱寫(xiě)無(wú)關(guān)的某個(gè)共性特征完成隱寫(xiě)分析任務(wù),這使得模型不具備泛化性能,違背了隱寫(xiě)檢測(cè)的初衷。熱力圖以高亮的形式標(biāo)注模型的關(guān)注區(qū)域,幫助學(xué)者分析模型的特征捕獲細(xì)節(jié),確保隱寫(xiě)檢測(cè)功能的正確性。
采用損失值表征模型的判定輸出與期望輸出的差異。本文采用的交叉熵?fù)p失函數(shù)如式(6)所示:
其中,yLoss表示模型的判定輸出結(jié)果表示模型的期望輸出結(jié)果。
研究HPFs和自動(dòng)化學(xué)習(xí)對(duì)隱寫(xiě)分析的影響。HPF可有效抑制圖像內(nèi)容,放大隱寫(xiě)信號(hào),輸出具備較高隱寫(xiě)信息含量的殘差特征圖,從而降低模型的隱寫(xiě)特征捕獲壓力,提高收斂效率;將經(jīng)HPF初始化的卷積核加入網(wǎng)絡(luò)訓(xùn)練過(guò)程,可實(shí)現(xiàn)預(yù)處理層的自動(dòng)化學(xué)習(xí),促使模型所有參數(shù)隨著隱寫(xiě)檢測(cè)損失值的減小而不斷被優(yōu)化。在0.4嵌入率的WOW隱寫(xiě)術(shù)下統(tǒng)計(jì)模型在不同HPFs和自動(dòng)化學(xué)習(xí)的損失值和隱寫(xiě)檢測(cè)準(zhǔn)確率,結(jié)果如表4、表5所示。
表4 非自動(dòng)化學(xué)習(xí)下HPFs對(duì)模型的影響Table 4 Influence of HPFs on model under non automatic learning
表5 自動(dòng)化學(xué)習(xí)下HPFs對(duì)模型的影響Table 5 Influence of HPFs on model under automatic learning
根據(jù)表4和表5結(jié)果可知,當(dāng)實(shí)現(xiàn)預(yù)處理層的自動(dòng)化學(xué)習(xí)后,無(wú)論是否采用HPFs,模型的損失值減小,隱寫(xiě)檢測(cè)性能得到一定的改善,說(shuō)明自動(dòng)化學(xué)習(xí)可使模型參數(shù)得到充分的優(yōu)化,提升隱寫(xiě)檢測(cè)能力。在自動(dòng)化學(xué)習(xí)的前提下,當(dāng)未采用HPFs時(shí),模型的損失值較大,隱寫(xiě)檢測(cè)準(zhǔn)確率為57.79%,說(shuō)明模型沒(méi)有收斂;采用HPFs時(shí),模型的損失值明顯減小,隱寫(xiě)檢測(cè)準(zhǔn)確率有較大提升,說(shuō)明HPFs可提升模型的收斂效率;單獨(dú)采用三階HPFs時(shí),模型具備較低的損失值和較高的隱寫(xiě)檢測(cè)準(zhǔn)確率,說(shuō)明經(jīng)三階HPFs初始化的卷積核可從圖像中捕獲高含量隱寫(xiě)信號(hào);采用一至六階HPFs時(shí),模型的損失值為0.035 1,隱寫(xiě)檢測(cè)準(zhǔn)確率為96.46%,具備最佳的隱寫(xiě)檢測(cè)性能,說(shuō)明經(jīng)多階HPFs初始化的卷積核可從圖像中捕獲高含量的多階隱寫(xiě)信號(hào),有效促進(jìn)模型的特征表達(dá)。
研究池化操作對(duì)隱寫(xiě)分析的影響。隱寫(xiě)操作可被看作在圖像樣本中嵌入+1、0、-1的微弱隱寫(xiě)信號(hào)。池化通過(guò)降采樣操作可有效縮小特征圖,避免過(guò)擬合現(xiàn)象的出現(xiàn),但過(guò)多的池化操作會(huì)抑制隱寫(xiě)信號(hào)。在當(dāng)前隱寫(xiě)分析模型的所有一般卷積層后加入窗口尺寸為3×3、步長(zhǎng)為2的平均池化層,相關(guān)卷積運(yùn)算步長(zhǎng)參數(shù)也作一定的調(diào)整,統(tǒng)計(jì)在0.4嵌入率的WOW隱寫(xiě)術(shù)下模型的損失值和檢測(cè)準(zhǔn)確率,如表6所示。
表6 池化對(duì)模型的影響Table 6 Influence of pooling on model
添加平均池化層后,當(dāng)隱寫(xiě)分析模型達(dá)到收斂狀態(tài)時(shí),檢測(cè)準(zhǔn)確率是93.13%,低于原模型的檢測(cè)準(zhǔn)確率約3個(gè)百分點(diǎn);說(shuō)明過(guò)多的平均池化層會(huì)抑制隱寫(xiě)信號(hào),不利于隱藏分析工作的開(kāi)展。
研究Ghost單元模塊對(duì)隱寫(xiě)分析的影響。與一般卷積操作相比,Ghost單元模塊依靠線性變換輸出富含多樣化隱寫(xiě)特征的多通道特征圖。在0.4嵌入率的WOW隱寫(xiě)術(shù)下,刪除Ghost單元模塊的線性變換部分,僅保留常規(guī)卷積操作,統(tǒng)計(jì)模型的損失值和隱寫(xiě)檢測(cè)準(zhǔn)確率,結(jié)果如表7所示。
表7 Ghost對(duì)模型的影響Table 7 Influence of Ghost on model
當(dāng)摒棄Ghost單元模塊的線性變換部分時(shí),模型的損失值略高,隱寫(xiě)檢測(cè)準(zhǔn)確率降低約3個(gè)百分點(diǎn);說(shuō)明Ghost單元模塊通過(guò)線性變換可輸出多樣化的冗余隱寫(xiě)特征信息,有利于增強(qiáng)模型的特征表達(dá)能力。
研究殘差模塊對(duì)隱寫(xiě)分析的影響。子網(wǎng)絡(luò)1的殘差模塊通過(guò)兩個(gè)網(wǎng)絡(luò)分支在加深網(wǎng)絡(luò)層數(shù)的同時(shí),有效解決梯度消失的問(wèn)題。僅保留殘差模塊的主網(wǎng)絡(luò)分支,在0.4嵌入率的WOW隱寫(xiě)術(shù)下統(tǒng)計(jì)模型的損失值和隱寫(xiě)檢測(cè)準(zhǔn)確率,如表8所示。
表8 殘差模塊對(duì)模型的影響Table 8 Influence of residual module on model
當(dāng)模型無(wú)殘差模塊時(shí),隱寫(xiě)檢測(cè)準(zhǔn)確率降低約4個(gè)百分點(diǎn);說(shuō)明對(duì)于同等深度的網(wǎng)絡(luò),殘差模塊可保留較多的輸入信息,避免梯度消失現(xiàn)象的出現(xiàn),有利于學(xué)習(xí)抽象的語(yǔ)義特征,增強(qiáng)模型的隱寫(xiě)語(yǔ)義特征理解能力。
研究密集連接模塊對(duì)隱寫(xiě)分析的影響。在密集連接模塊中,每一個(gè)網(wǎng)絡(luò)層的輸入信息為前面所有網(wǎng)絡(luò)層的輸出特征圖,這加強(qiáng)了特征在網(wǎng)絡(luò)中的傳遞。取消密集連接模塊的短路連接,保證每個(gè)網(wǎng)絡(luò)層的輸入信息僅為上一個(gè)網(wǎng)絡(luò)層的輸出特征圖,在0.4嵌入率的WOW隱寫(xiě)術(shù)下統(tǒng)計(jì)模型的損失值和隱寫(xiě)檢測(cè)準(zhǔn)確率,如表9所示。
表9 密集連接模塊對(duì)模型的影響Table 9 Influence of dense connection module on model
當(dāng)模型無(wú)密集連接模塊時(shí),隱寫(xiě)檢測(cè)準(zhǔn)確率降低約6個(gè)百分點(diǎn);說(shuō)明密集連接模塊可獲得高維組合隱寫(xiě)特征,提升模型的隱寫(xiě)檢測(cè)性能。
研究改良版SPP對(duì)隱寫(xiě)分析的影響。設(shè)計(jì)兩個(gè)改良版SPP方案,稱為改良版SPP1和改良版SPP2。與傳統(tǒng)SPP相比,改良版SPP1將傳統(tǒng)SPP的最大池化操作替換為平均池化操作,以適應(yīng)微弱的隱寫(xiě)信號(hào);改良版SPP2在改良版SPP1基礎(chǔ)上,添加窗口和步長(zhǎng)為(H/3)×(W/3)的平均池化操作,期望提取較豐富、多樣的隱寫(xiě)特征。在0.4嵌入率的WOW隱寫(xiě)術(shù)下統(tǒng)計(jì)模型的損失值和隱寫(xiě)檢測(cè)準(zhǔn)確率,結(jié)果如表10所示。
表10 改良版SPP對(duì)模型的影響Table 10 Influence of modified SPP on model
改良版SPP1模型的隱寫(xiě)檢測(cè)準(zhǔn)確率高于傳統(tǒng)SPP約1個(gè)百分點(diǎn),說(shuō)明平均池化操作更有利于保留微弱的隱寫(xiě)信號(hào);改良版SPP2模型的隱寫(xiě)檢測(cè)準(zhǔn)確率高于傳統(tǒng)SPP約2個(gè)百分點(diǎn),說(shuō)明增加池化操作可提取多樣化的隱寫(xiě)特征,促進(jìn)模型的特征表達(dá)能力。
研究子網(wǎng)絡(luò)組合對(duì)隱寫(xiě)分析的影響。模型的兩個(gè)子網(wǎng)絡(luò)捕獲了抽象、非線性、高維的隱寫(xiě)語(yǔ)義特征,將其組合后,融合的特征中還包含兩子網(wǎng)絡(luò)特征的依賴性信息。分別設(shè)置模型僅包含子網(wǎng)絡(luò)1、子網(wǎng)絡(luò)2,在0.4嵌入率的WOW隱寫(xiě)術(shù)下統(tǒng)計(jì)模型的損失值和隱寫(xiě)檢測(cè)準(zhǔn)確率,如表11所示。
表11 子網(wǎng)絡(luò)對(duì)模型的影響Table 11 Influence of subnetwork on model
當(dāng)模型僅包含子網(wǎng)絡(luò)1和僅包含子網(wǎng)絡(luò)2時(shí),隱寫(xiě)檢測(cè)準(zhǔn)確率較低,分別為83.31%和86.23%,說(shuō)明模型的子網(wǎng)絡(luò)1和子網(wǎng)絡(luò)2可從殘差特征圖中捕獲較豐富的隱寫(xiě)特征;原模型的損失值明顯較低,準(zhǔn)確率為96.46%,說(shuō)明融合子網(wǎng)絡(luò)1和子網(wǎng)絡(luò)2的隱寫(xiě)特征后可得抽象、非線性、高維的隱寫(xiě)語(yǔ)義特征,同時(shí)獲得隱寫(xiě)特征間的依賴信息,這有效促進(jìn)模型的特征表達(dá)能力。
采用熱力圖可視化模型,便于分析模型關(guān)注的區(qū)域。在0.4嵌入率的WOW隱寫(xiě)術(shù)下,模型的熱力圖如圖10所示。
圖10 20000.pgm的熱力圖Fig.10 Thermal diagram of 20000.pgm
亮色區(qū)域?yàn)槟P椭攸c(diǎn)關(guān)注的區(qū)域,暗色區(qū)域?yàn)槟P团卸ǖ膶?duì)隱寫(xiě)分析無(wú)貢獻(xiàn)的區(qū)域。分析可知,模型重點(diǎn)關(guān)注建筑物的棱角和臺(tái)階區(qū)域,期望從中捕獲隱寫(xiě)信號(hào)。WOW等自適應(yīng)隱寫(xiě)術(shù)優(yōu)先將信息隱藏至紋理豐富的圖像區(qū)域,例如此圖中建筑物的棱角和臺(tái)階,因此可確定本隱寫(xiě)分析模型根據(jù)從圖像紋理區(qū)域中捕獲的特征信息完成隱寫(xiě)分析任務(wù),具備正確的隱寫(xiě)分析功能。隱寫(xiě)術(shù)在圖像中嵌入的隱寫(xiě)信號(hào)分布狀態(tài)如圖11所示,白色像素值即為嵌入的隱寫(xiě)信號(hào)。
圖11 20000.pgm的隱寫(xiě)信號(hào)分布圖Fig.11 Steganography of 20000.pgm
將本模型與其他隱寫(xiě)分析模型作比較,結(jié)果如表12所示。
表12 與其他隱寫(xiě)分析方法的比較結(jié)果Table 12 Comparison with other steganalysis methods
與SRM隱寫(xiě)分析模型相比,本模型將手工特征提取方式優(yōu)化為自動(dòng)化特征提取方式,有效提升隱寫(xiě)檢測(cè)效率和隱寫(xiě)檢測(cè)性能;與YedroudjNet相比,本模型通過(guò)并行子網(wǎng)絡(luò)融合抽象、非線性的高維隱寫(xiě)語(yǔ)義特征,且獲得特征間的依賴性信息,提升模型的隱寫(xiě)特征表達(dá)能力;本模型在0.2、0.4嵌入率的WOW隱寫(xiě)術(shù)下的檢測(cè)準(zhǔn)確率分別為82.6%和96.5%,在0.2、0.4嵌入率的S-UNIWARD隱寫(xiě)術(shù)下的檢測(cè)準(zhǔn)確率分別為81.4%和95.2%。
本文針對(duì)隱寫(xiě)檢測(cè)任務(wù)提出一個(gè)基于高效特征融合的可變尺寸圖像隱寫(xiě)分析模型。采用經(jīng)多階HPFs初始化卷積核的網(wǎng)絡(luò)層仿真手工特征提取方法,并將其加入網(wǎng)絡(luò)自動(dòng)化學(xué)習(xí)中,提高了隱寫(xiě)信號(hào)的捕獲效率;融合兩個(gè)子網(wǎng)絡(luò)的抽象、非線性的高維隱寫(xiě)語(yǔ)義特征,并捕獲特征間的依賴信息,增強(qiáng)模型的隱寫(xiě)特征識(shí)別能力;采用改良版SPP增加隱寫(xiě)特征的多樣性,自適應(yīng)可變尺寸圖像。實(shí)驗(yàn)結(jié)果表明,仿真多階手工特征提取方法,并將其加入自動(dòng)化學(xué)習(xí)中,有助于捕獲隱寫(xiě)信號(hào),顯著提升模型網(wǎng)絡(luò)的收斂效率;融合兩個(gè)子網(wǎng)絡(luò)的隱寫(xiě)特征可獲得特征間依賴信息,有效提升模型的隱寫(xiě)檢測(cè)準(zhǔn)確率;改良版SPP既可自適應(yīng)可變尺寸圖像,又能提升隱寫(xiě)檢測(cè)性能;采用熱力圖可視化模型的關(guān)注區(qū)域,可知模型通過(guò)正確提取隱寫(xiě)特征完成檢測(cè)任務(wù);模型對(duì)嵌入率為0.2、0.4的WOW隱寫(xiě)術(shù)的檢測(cè)準(zhǔn)確率為82.6%、96.5%,對(duì)嵌入率為0.2、0.4的S-UNIWARD隱寫(xiě)術(shù)的隱寫(xiě)檢測(cè)準(zhǔn)確率為81.4%、95.2%,優(yōu)于SRM、YedroudjNet隱寫(xiě)分析模型。未來(lái)研究工作是采用融合特征的思想融合彩色圖像顏色通道間和通道內(nèi)的隱寫(xiě)特征信息,提升彩圖隱寫(xiě)分析性能。