王麗娜 王凱歌 徐一波 唐奔宵 譚選擇
(空天信息安全與可信計(jì)算教育部重點(diǎn)實(shí)驗(yàn)室(武漢大學(xué)) 武漢 430072) (武漢大學(xué)國(guó)家網(wǎng)絡(luò)安全學(xué)院 武漢 430072)
隱寫是通過輕微地修改文本、圖像等數(shù)字載體中的值來嵌入秘密信息的一門技術(shù)[1],其目的在于隱藏通信雙方的實(shí)際通信內(nèi)容.與隱寫技術(shù)相對(duì)應(yīng)的隱寫分析技術(shù),充分利用信號(hào)處理、數(shù)理統(tǒng)計(jì)、機(jī)器學(xué)習(xí)等理論,通過分析秘密信息嵌入前后載體的統(tǒng)計(jì)差異,進(jìn)而發(fā)現(xiàn)并挖掘潛藏在載體中的秘密信息[2].對(duì)隱寫算法的研究主要圍繞在如何嵌入盡可能多秘密信息的同時(shí),盡量少地引入修改痕跡.目前,隨著隱寫分析技術(shù)逐漸完成從簡(jiǎn)單統(tǒng)計(jì)方法向機(jī)器學(xué)習(xí)技術(shù)的轉(zhuǎn)變,針對(duì)隱寫算法安全性的定量或定性演繹主要集中在構(gòu)建更好的失真度量[3],設(shè)計(jì)高效的隱寫編碼以及安全隱藏容量邊界[4-5],從而使攜密載體在視覺質(zhì)量和統(tǒng)計(jì)特性上盡量逼近原始載體,以提高被嵌入載體的抗檢測(cè)能力.
在隱寫安全性研究方面,文獻(xiàn)[1]提出將最大均值差異(maximum mean discrepency, MMD)作為信息隱藏算法的安全性指標(biāo),該指標(biāo)比KL散度(Kullback-Leibler divergence)[6]的計(jì)算復(fù)雜度更低,且在高維度空間更加穩(wěn)定;文獻(xiàn)[7]利用Fisher信息量對(duì)給出了安全嵌入容量并對(duì)安全嵌入量進(jìn)行優(yōu)化;文獻(xiàn)[8]對(duì)平方根法則進(jìn)行改進(jìn),進(jìn)而提高了信息隱藏中平方根法則的實(shí)際應(yīng)用能力;文獻(xiàn)[9]中,研究人員將圖像的像素建模為n階Markov,以此衡量圖像信息隱藏算法安全性.除此之外,文獻(xiàn)[10]基于博弈論提出了一種衡量信息隱藏算法安全性的方法.隱寫算法安全性的提高主要依賴于2個(gè)方面:1)自適應(yīng)的隱寫方法,其可以選擇圖像中更加安全的位置進(jìn)行隱寫[11];2)盡可能降低隱寫嵌入帶來的修改量[12].隨著雙層校驗(yàn)格碼(syndrome tellis codes, STC)[13]在信息隱藏中的應(yīng)用,這2個(gè)方面都得到了很好的滿足,隱寫算法的安全性得到了一次飛躍性的提升,導(dǎo)致目前信息隱藏研究發(fā)展速度有所放緩.信息隱藏技術(shù)研究難以突破STC框架,只是在失真函數(shù)方面做部分修改[14-16],這些改進(jìn)一般針對(duì)某些不足做修修補(bǔ)補(bǔ),很難給隱藏性能帶來較大提高.
以往關(guān)于隱寫算法安全性的研究與驗(yàn)證,基本是在固定的測(cè)試集上對(duì)比隱寫分析檢測(cè)率,以此反映隱寫算法的反檢測(cè)能力.但是,隱寫算法在嵌入實(shí)際樣本時(shí),其安全性并不能完全得到隱寫算法安全性的保證.實(shí)驗(yàn)過程中發(fā)現(xiàn),樣本載體會(huì)對(duì)實(shí)際隱寫過程的安全性產(chǎn)生較大影響:當(dāng)隱寫算法應(yīng)用在不同的樣本載體時(shí),算法抗檢測(cè)能力會(huì)出現(xiàn)較大偏差.經(jīng)過深入分析后我們發(fā)現(xiàn),產(chǎn)生這一現(xiàn)象的原因在于:圖像載體自身所具備的噪聲特性對(duì)于隱寫算法的適配性存在差異.本文認(rèn)為:可以通過對(duì)隱寫載體進(jìn)行系統(tǒng)的安全性評(píng)價(jià),以提升隱寫算法安全性.
本文在實(shí)驗(yàn)發(fā)現(xiàn)的基礎(chǔ)上,從嵌入載體自身特性和規(guī)律的角度出發(fā),通過提取不同嵌入效果的樣本載體噪聲分布特征,設(shè)計(jì)并實(shí)現(xiàn)了一種樣本載體安全性的評(píng)價(jià)方法,并將該方法運(yùn)用于樣本載體預(yù)篩選上.實(shí)驗(yàn)結(jié)果表明:與隨機(jī)選取樣本圖像載體相比,通過本文方法進(jìn)行預(yù)篩選后的載體圖像,在多種隱寫算法、隱寫分析與嵌入率下的檢測(cè)錯(cuò)誤率平均提高了3.8~11.8個(gè)百分點(diǎn),有效地提高了實(shí)際應(yīng)用中信息隱寫的安全性.
本文的貢獻(xiàn)主要體現(xiàn)在3個(gè)方面:
1) 針對(duì)隱寫載體進(jìn)行信息嵌入時(shí)產(chǎn)生的安全性差異問題,對(duì)隱寫樣本載體進(jìn)行了全面詳細(xì)的理論分析與實(shí)際驗(yàn)證,通過聚類的方法探索并驗(yàn)證了載體安全性問題的存在;
2) 在隱寫載體安全性差異分析結(jié)果的基礎(chǔ)上,提出高通濾波殘差共生概率矩陣描述載體噪聲,并通過特征概率分布設(shè)計(jì)了載體安全性評(píng)價(jià)方法,該方法可以顯著提升載體安全性;
3) 通過大量、完善的實(shí)驗(yàn)分析,驗(yàn)證了本文安全性評(píng)價(jià)方法的有效性,該方法應(yīng)用于圖像載體預(yù)篩選后,可以明顯降低隱蔽信息被檢測(cè)的概率,極大提高隱寫的安全性.
本文方法對(duì)圖像載體安全性進(jìn)行驗(yàn)證和研究,提出一種實(shí)際效果更加有效的隱寫方案,相比于隱寫算法安全性提升,本文方法對(duì)于安全性的貢獻(xiàn)更高,兼具學(xué)術(shù)與應(yīng)用價(jià)值.
圖像卷積是圖像處理的最基本方法之一,其本質(zhì)是對(duì)圖像進(jìn)行線性濾波的過程[17].圖像卷積在圖像處理中有著廣泛的應(yīng)用,通過卷積操作,可以快捷地完成圖像銳化、邊緣檢測(cè)、均值模糊等處理.
圖像卷積過程中,輸出像素是輸入像素鄰域的加權(quán)和,即計(jì)算2維圖像中每一個(gè)像素點(diǎn)與卷積核對(duì)應(yīng)元素的乘積之和,然后以其結(jié)果作為該像素位置的值.卷積相當(dāng)于將一個(gè)2維函數(shù)移動(dòng)到另一個(gè)2維函數(shù)的所有位置,其中,卷積核為一個(gè)2維的濾波器矩陣.對(duì)于一個(gè)卷積核而言,周圍的鄰域的值代表中心的被卷積的像素點(diǎn)周圍像素點(diǎn)對(duì)其影響力的權(quán)重.通過設(shè)計(jì)不同形式的卷積核,以實(shí)現(xiàn)對(duì)圖像不同的濾波效果.
在卷積核的設(shè)計(jì)上,存在一定的規(guī)則要求:首先,卷積核的大小為奇數(shù),以保證卷積核存在中心.假設(shè)卷積核的大小為n,則該卷積核的半徑為(n+1)/2;其次,如果需要保證卷積前后圖像的亮度保持一致,卷積核中所有元素之和應(yīng)為1.如果卷積核元素之和大于1,則卷積后的圖像會(huì)比原圖像亮,反之則卷積后的圖像變暗.本文中卷積用于計(jì)算樣本圖像的殘差矩陣,該矩陣反映圖像中像素與其鄰域像素之間的差異程度.
灰度共生矩陣是一種通過研究灰度的空間相關(guān)特性來描述紋理的常用方法,Haralick等人[18]在1973年最先提出用灰度共生關(guān)系來描述圖像紋理特征.由于紋理是由灰度分布在空間位置上反復(fù)出現(xiàn)而形成的,因而在圖像空間中相隔某距離的2像素之間會(huì)存在一定的灰度關(guān)系,即圖像中灰度的空間相關(guān)特性.
灰度空間相關(guān)特性通過統(tǒng)計(jì)指定方向上的灰度關(guān)系表示,對(duì)于一張擁有p種不同像素值的灰度圖像,會(huì)在特定方向上產(chǎn)生p×p大小的共生矩陣,矩陣中(i,j)th處的值表示原圖像中指定方向上ith和jth像素關(guān)聯(lián)出現(xiàn)的次數(shù),如圖1所示:
Fig. 1 Example of calculating co-occurrence matrix圖1 計(jì)算灰度共生矩陣
為了使得對(duì)紋理的描述信息不受旋轉(zhuǎn)的影響,通常在多個(gè)方向上進(jìn)行計(jì)算與統(tǒng)計(jì).無論是否考慮圖像的灰度值或者顏色的各種維度,共生矩陣都能很好地描述圖像的紋理.
隱寫檢測(cè)是對(duì)極低信噪比的隱寫信息進(jìn)行識(shí)別的過程.若將載體的復(fù)雜紋理看作噪聲,則在隱寫強(qiáng)度一定的情況下,噪聲強(qiáng)度越大,越有利于隱寫.
通過卷積操作對(duì)樣本圖像的灰度圖Ig進(jìn)行濾波,提取圖像中的噪聲殘差,該過程可以表示為Ig*K,其中K為高通卷積核,*為卷積操作:
(1)
得到原圖像的殘差矩陣D=I*K=(di j),其中i,j=1,2,…,N.
在殘差矩陣中,對(duì)應(yīng)于原圖像位置的數(shù)值的絕對(duì)值越大,則代表該像素點(diǎn)處噪聲越大;反之,若殘差矩陣中的數(shù)值絕對(duì)值越接近0,則表示原圖像該點(diǎn)處越平滑,噪聲越小.對(duì)殘差矩陣進(jìn)行截?cái)嘁越档途仃嚨臓顟B(tài):將殘差矩陣中小于-T和大于T的值,分別直接截?cái)嗟?T和T,本文中T=3,將圖像殘差分為了7個(gè)等級(jí):
(2)
通過統(tǒng)計(jì)殘差矩陣相鄰像素對(duì)在4個(gè)方向上的出現(xiàn)頻率,計(jì)算殘差矩陣的共生概率矩陣Ch(),Cv(),Cd(),Cm(),用于描述圖像中的噪聲分布情況.本文使用的4種共生關(guān)系如圖2所示:
Fig. 2 Symbiotic relationship of residual matrix圖2 殘差矩陣共生關(guān)系
因?yàn)闅埐罹仃嚱財(cái)嗪蟾鼽c(diǎn)的取值范圍為[-3,3],所以殘差矩陣的每一種共生關(guān)系包含49維元素.4種共生關(guān)系對(duì)應(yīng)的共生概率矩陣可以描述為
(3)
(4)
(5)
(6)
其中,M,N表示載體圖像的尺寸,u,v∈[-T,T],δ(·)描述為
(7)
4個(gè)共生關(guān)系共得到4(2T+1)2=196維的噪聲特征F=(Fh,Fv,Fd,Fm).
若載體圖像安全性可以由圖像本身的噪聲分布決定,那么F接近的載體應(yīng)具有相似的隱寫安全性.為驗(yàn)證該猜想,本節(jié)中對(duì)2.1節(jié)得到的圖像噪聲特征進(jìn)行聚類.假設(shè)驗(yàn)證階段的聚類算法描述如算法1所示:
算法1. 噪聲分布特征聚類算法.
輸入:載體噪聲分布特征集合fs={f1,f2,…,fn}、聚類簇?cái)?shù)k=3;
輸出:簇類劃分c={c1,c2,c3}.
① iffs≠? then
② foreachfiinfs
④ end for
⑤ 選擇k個(gè)相距最遠(yuǎn)的特征作為初始中心{Centroid1,Centroid2,Centroid3};
⑥ while任意初始中心Centroid發(fā)生變化,或者聚類中特征平方和最小do
⑦ foreachfiinfs
⑧ 計(jì)算特征向量fi與各中心Centroidj(1≤j≤3)之間的距離di j;
⑨ 將fi劃入具有最短中心距離
⑩ end for
通過迭代聚類中心的方式進(jìn)行聚類分析.首先計(jì)算所有噪聲分布特征fi之間的相似程度,以歐氏距離di j表示.而后,根據(jù)噪聲分布情況,使用貪心算法從特征集中選取k=3個(gè)間距最大的特征作為初始聚類中心,k=3表示希望將載體集根據(jù)安全性排序依次分為安全性高、安全性一般以及安全性差的3類c1,c2,c3.迭代更新聚類中心,每一輪迭代中計(jì)算除當(dāng)前中心外的所有噪聲分布特征fi與當(dāng)前各個(gè)聚類中心Cenrtoidj之間的距離,并將該特征分配到與其距離最近的類別中,設(shè)噪聲集合中包含m條特征fi=(x1,x2,…,xn),n=196,1≤i≤m,對(duì)于每一個(gè)特征fi,計(jì)算其應(yīng)該屬于的類別:
(8)
其中,j表示聚類類別;ci表示樣本特征fi與k個(gè)類中距離最近的類,其取值為[1,k].每輪結(jié)束后重新計(jì)算各個(gè)聚類的中心Centroidj:
(9)
迭代的結(jié)束條件為當(dāng)前聚類中對(duì)象的方差Var最小,或中心不發(fā)生改變:
(10)
本文通過如下實(shí)驗(yàn)步驟,對(duì)不同噪聲分布的載體的隱寫安全差異性進(jìn)行分析與驗(yàn)證:
1) 在BOSS[19]庫(kù)中通過上述方法對(duì)原始樣本進(jìn)行聚類,并分別從聚類得到的3個(gè)類別中各隨機(jī)選取10 000張圖像作為實(shí)驗(yàn)樣本,以HUGO[20]算法進(jìn)行隱寫,嵌入率為0.4.2)在同一樣本庫(kù)內(nèi)隨機(jī)選取額外10 000張圖像作為測(cè)試樣本,隱寫檢測(cè)方法選用SPAM[21],分類器采用隨機(jī)森林.3)考慮到實(shí)際隱寫與隱寫分析過程中可能出現(xiàn)跨樣本庫(kù)的情況,從BOWS[22]庫(kù)中額外選取3 000張圖像作為測(cè)試樣本進(jìn)行相同的隱寫分析,檢測(cè)結(jié)果如表1所示:
Table 1 Steganalysis Results of the 3 Categories ofCarrier Sets
Note:The detection accuracy of category 1 is the lowest.
從表1可以看出,基于BOSS圖像庫(kù)的3類樣本載體的檢測(cè)率存在明顯差異,其中第1類樣本載體的cover檢測(cè)率僅為0.38,平均檢測(cè)率為0.537,遠(yuǎn)低于第2類樣本載體的平均檢測(cè)率0.581 5與第3類樣本載體的平均檢測(cè)率0.886 5.上述結(jié)果表明,樣本庫(kù)相同時(shí),使用第1類中的圖像作為載體進(jìn)行隱寫可以有效降低被SPAM算法檢測(cè)到的概率,提高隱寫的安全性,而使用第3類圖像樣本作為載體時(shí)被檢測(cè)的成功率高,不適合作為隱寫載體.
改變測(cè)試樣本來源為BOWS圖像庫(kù)后,由于跨圖像庫(kù)導(dǎo)致3類檢測(cè)率相較于BOSS庫(kù)都有一定幅度的降低,但整體檢測(cè)率分布趨勢(shì)基本與BOSS庫(kù)中實(shí)驗(yàn)結(jié)果類似:以第1類載體進(jìn)行隱寫嵌入的圖像平均檢測(cè)率最低,為0.517 5,明顯低于第2類樣本載體的0.567 5,第3類樣本載體的檢測(cè)準(zhǔn)確率最高,達(dá)到0.775,載體進(jìn)行HUGO隱寫時(shí)安全性最低.以上實(shí)驗(yàn)結(jié)果與本文猜想一致,即圖像載體安全性可以由載體本身的噪聲分布情況描述.
我們將最終3個(gè)聚類的中心映射到[0,255]區(qū)間上,并進(jìn)行降維,得到3個(gè)不同安全性聚類的標(biāo)準(zhǔn)特征Fs,k:
(11)
其中,k表示載體類別,定義進(jìn)行隱寫嵌入后具有安全性最高的類別為第1類載體集,其標(biāo)準(zhǔn)特征(上述實(shí)驗(yàn)中第1類聚類的最終質(zhì)心)為Fs,1,根據(jù)載體隱寫安全性遞減,依次是第2類載體集Fs,2、第3類載體集Fs,3,3類載體對(duì)應(yīng)的標(biāo)準(zhǔn)特征分布矩陣如圖3所示:
Fig. 3 Standard feature distributions of three categories of secure carrier圖3 3類安全性載體標(biāo)準(zhǔn)特征分布
從圖3可以看出,載體噪聲分布矩陣由第1類載體特征到第3類載體特征依次逐漸地向中心聚攏,第1類載體中噪聲分布比較平均,與其他2類載體相比,分布更加分散.隨著安全性降低,第2類、第3類載體噪聲分布向中心聚攏的程度更大,分布更加集中.由特征提取的方法可知,噪聲矩陣中分布越靠近中心代表載體圖像的噪聲越平滑,分布越分散,表示該載體圖像存在更多的復(fù)雜噪聲,這也符合直觀上載體噪聲越大、圖像內(nèi)容越復(fù)雜,則其安全性越高的感受.
基于第2節(jié)中載體噪聲分布對(duì)隱寫安全性的研究結(jié)果,設(shè)計(jì)了一種評(píng)價(jià)載體安全性的衡量指標(biāo),并運(yùn)用于隱寫載體的預(yù)篩選過程.隱寫載體安全性評(píng)價(jià)體系與樣本載體預(yù)篩選流程如圖4所示:
Fig. 4 Procedure of the security assessment method and pre-selection for image carriers圖4 圖像載體安全性評(píng)價(jià)與樣本預(yù)篩選流程
載體安全性評(píng)價(jià)與篩選過程中,首先對(duì)待篩選圖像提取噪聲分布特征,特征的提取方法與2.1節(jié)中基本一致:1)對(duì)樣本圖像進(jìn)行卷積操作,計(jì)算圖像殘差矩陣;2)計(jì)算殘差矩陣對(duì)應(yīng)的4種共生概率矩陣,對(duì)其進(jìn)行映射和降維操作后,作為該圖像的噪聲分布特征.
第2節(jié)中驗(yàn)證了具有相似噪聲分布的載體圖像之間的隱寫安全性相近,因此,相比于其他2類標(biāo)準(zhǔn)特征,同一個(gè)樣本庫(kù)中載體的噪聲分布越接近第1類標(biāo)準(zhǔn)特征Fs,1,則它們的安全性越高,這種相似性可以用載體圖像噪聲分布特征與標(biāo)準(zhǔn)特征之間的相關(guān)性來描述:
(12)
其中,S表示對(duì)于待評(píng)價(jià)樣本圖像的安全性評(píng)價(jià),通過計(jì)算噪聲分布特征Fn與第1類標(biāo)準(zhǔn)特征之間的相關(guān)性的絕對(duì)值得到,F(xiàn)s,1為第1類載體噪聲分布特征如圖5所示:
Fig. 5 Feature of noise distribution of Fs,1圖5 第1類安全載體噪聲分布特征
式(12)中,N=7×7為噪聲特征長(zhǎng)度,S的取值范圍為[0,1],S值越大表示待評(píng)價(jià)載體的安全性越高,實(shí)際隱寫過程前,通過設(shè)定合適的閾值對(duì)備選樣本進(jìn)行預(yù)篩選.S所表示的載體安全性的閾值選擇將在實(shí)驗(yàn)部分討論.
本節(jié)中將對(duì)圖像載體安全性評(píng)價(jià)方法進(jìn)行全面的實(shí)驗(yàn)評(píng)估,實(shí)驗(yàn)部分的圖像樣本全部來自于BOSS標(biāo)準(zhǔn)圖像庫(kù)與BOWS標(biāo)準(zhǔn)圖像庫(kù),實(shí)驗(yàn)過程中所選取的圖像均為隨機(jī)抽取.本節(jié)中,首先對(duì)載體安全性評(píng)價(jià)方法中閾值S進(jìn)行討論,然后針對(duì)載體安全性評(píng)價(jià)方法的實(shí)際應(yīng)用效果進(jìn)行驗(yàn)證分析:分別采用S-UNIWARD[23],WOW[24],HUGO[20]算法對(duì)樣本載體以不同嵌入率進(jìn)行信息嵌入,而后通過SPAM[21]與SRM[25]隱寫分析方法依次對(duì)3種隱寫算法嵌入的圖像進(jìn)行交叉檢測(cè).
安全載體的篩選取決于安全性評(píng)價(jià)方法中閾值S的選擇.理論上,S越大則被篩選出的載體圖像的安全性越高.但是,篩選過程中隨著S值增高,可用載體數(shù)量也會(huì)隨之減少,而載體數(shù)量如果太少則不利于隱寫的實(shí)際應(yīng)用.
為了分析閾值S對(duì)隱寫安全性以及樣本篩選數(shù)量的影響,本文通過HUGO算法對(duì)隨機(jī)抽取的10 000張圖像進(jìn)行信息嵌入,嵌入率分別為0.1,0.2,0.3,0.4,在閾值S取值0.4,0.5與0.6下利用SPAM方法分別進(jìn)行隱寫檢測(cè),并統(tǒng)計(jì)檢測(cè)錯(cuò)誤率作為安全性的衡量指標(biāo),實(shí)驗(yàn)結(jié)果如圖6所示:
Fig. 6 The experimental results of selecting thresholds圖6 載體篩選閾值實(shí)驗(yàn)結(jié)果
圖6(a)中方形代表載體預(yù)篩選過程中閾值S=0.4時(shí)進(jìn)行樣本篩選后的檢測(cè)錯(cuò)誤率,圓點(diǎn)表示閾值S=0.5時(shí)檢測(cè)錯(cuò)誤率,正三角表示以閾值S=0.6時(shí)進(jìn)行樣本篩選后的檢測(cè)錯(cuò)誤率,倒三角對(duì)應(yīng)虛線表示隨機(jī)抽取5 000張圖像作為載體時(shí)的檢測(cè)錯(cuò)誤率.實(shí)驗(yàn)結(jié)果中,檢測(cè)錯(cuò)誤率越高表示載體集的安全性越強(qiáng),檢測(cè)錯(cuò)誤率隨著嵌入率的增加而降低的速率越小代表載體集安全性越穩(wěn)定.從圖6(a)中可以看出,當(dāng)閾值S=0.4時(shí),載體集在4種嵌入率下的檢測(cè)錯(cuò)誤率均為最低,甚至略低于隨機(jī)抽取的載體集的安全性,且隨著嵌入率的增加,檢測(cè)錯(cuò)誤率有較大幅度的下降.當(dāng)嵌入率為0.1時(shí),檢測(cè)錯(cuò)誤率為0.484 5,與另外3個(gè)實(shí)驗(yàn)載體集所對(duì)應(yīng)的檢測(cè)錯(cuò)誤率差距較小,但當(dāng)嵌入率增加到0.4時(shí),檢測(cè)錯(cuò)誤率僅為0.333 9,遠(yuǎn)低于閾值為0.5與0.6時(shí)的錯(cuò)誤率,并且低于隨機(jī)抽取情況下的37.32%.上述結(jié)果說明以S=0.4篩選出的載體集與隨機(jī)抽取的載體集中的載體分布相似,均包含了許多安全性較低的載體,導(dǎo)致樣本集整體的安全性低.
當(dāng)閾值S取值增加到0.5后,安全載體集檢測(cè)錯(cuò)誤率出現(xiàn)明顯提高,4種嵌入率下的檢測(cè)錯(cuò)誤率分別為0.492 8,0.482 4,0.462 0,0.442 3,遠(yuǎn)高于閾值0.4對(duì)應(yīng)載體集與隨機(jī)載體集的檢測(cè)結(jié)果.此外,隨著嵌入率從0.1增加到0.4,安全載體集的檢測(cè)錯(cuò)誤率只降低了5.1個(gè)百分點(diǎn),降低的幅度較小,經(jīng)篩選后的載體集具有更高的安全性與穩(wěn)定性.
閾值取值增加到0.6后,篩選出的載體集在低嵌入率下安全性提高不明顯,嵌入率為0.1,0.2,0.3時(shí),檢測(cè)錯(cuò)誤率分別為0.490 2,0.482 6,0.466 7,與閾值S=0.5對(duì)應(yīng)結(jié)果差異較小.當(dāng)嵌入率達(dá)到0.4時(shí),檢測(cè)錯(cuò)誤率有明顯提升,錯(cuò)誤率穩(wěn)在0.466左右,整體載體集的安全性受到嵌入率的影響小,僅下降了2.4個(gè)百分點(diǎn).上述結(jié)果表明,在本節(jié)實(shí)驗(yàn)環(huán)境下,被篩選的載體集安全性與閾值S取值同步上升直到閾值達(dá)到0.5后趨近穩(wěn)定.
實(shí)際隱寫過程中閾值S確定還需要考慮被篩選出的樣本數(shù)量,符合要求的載體樣本數(shù)量越少則載體集內(nèi)圖像的綜合安全性越高,但樣本數(shù)量太少不利于隱寫的實(shí)施.圖6(b)表示進(jìn)行篩選后符合要求的載體數(shù)量與閾值之間的關(guān)系,基礎(chǔ)的圖像載體數(shù)量為10 000.當(dāng)閾值S=0.4時(shí),符合要求的載體數(shù)量為8 204,約為整體樣本集的4/5,但由前面實(shí)驗(yàn)結(jié)果可知,該閾值下的載體安全性與隨機(jī)選取的載體集安全性接近,并沒有達(dá)到提高隱寫安全性的效果.
當(dāng)閾值S=0.5時(shí),篩選出的樣本數(shù)量為4 313,樣本數(shù)量充裕,同時(shí)篩選出的載體集已經(jīng)具有較高的抗檢測(cè)能力,但依然存在上升空間.當(dāng)閾值S提高到0.6時(shí),載體集的安全性提升空間接近上限,而符合要求的載體數(shù)量下降到1 322.綜合考慮篩選載體數(shù)量以及載體集綜合安全穩(wěn)定性,建議閾值范圍為0.5~0.6,本節(jié)后續(xù)實(shí)驗(yàn)中采用S=0.6作為安全載體預(yù)篩選閾值.
4.2.1 基于SPAM的安全性驗(yàn)證
本節(jié)將對(duì)載體安全性評(píng)價(jià)方法的實(shí)際效果進(jìn)行分析與評(píng)價(jià).首先,利用載體安全性評(píng)價(jià)方法對(duì)樣本載體進(jìn)行預(yù)篩選,從樣本庫(kù)中選取1 000張圖像作為安全載體集.接著,從相同圖像庫(kù)中隨機(jī)選取等同數(shù)量的圖像作為對(duì)比載體集.為檢驗(yàn)安全性評(píng)價(jià)方法對(duì)不同隱寫算法的敏感程度,分別使用S-UNIWARD,WOW,HUGO算法對(duì)2個(gè)載體集進(jìn)行同樣的信息嵌入,嵌入率為0.1,0.2,0.3,0.4.采用SPAM隱寫分析方法對(duì)上述載體集進(jìn)行隱寫檢測(cè),實(shí)驗(yàn)結(jié)果如圖7所示:
Fig. 7 Steganalysis results based on SPAM圖7 基于SPAM隱寫分析結(jié)果
通過SPAM方法進(jìn)行隱寫分析的實(shí)驗(yàn)結(jié)果中,正三角表示安全載體集下的檢測(cè)錯(cuò)誤率,圓點(diǎn)表示基于隨機(jī)載體集的檢測(cè)錯(cuò)誤率,3個(gè)子圖分別代表3種嵌入算法.3種嵌入算法下,與隨機(jī)選擇載體相比,通過安全性評(píng)價(jià)進(jìn)行預(yù)篩選后的安全載體集在抗檢測(cè)能力上都有明顯的提升.其中,以S -UNIWARD進(jìn)行信息嵌入時(shí)安全性提升最為明顯,在4種嵌入率下的檢測(cè)錯(cuò)誤率為0.497,0.470 5,0.463 7,0.447 8,檢測(cè)錯(cuò)誤率均保持在44%以上,載體集安全性受到嵌入率的影響較小,4種嵌入率下的檢測(cè)錯(cuò)誤率與隨機(jī)載體集相比分別提高了4.1,4.46,9.15,10.59個(gè)百分點(diǎn).利用WOW進(jìn)行信息嵌入的實(shí)驗(yàn)結(jié)果與S-UNIWARD相似,經(jīng)過預(yù)篩選的安全載體集的檢測(cè)錯(cuò)誤率在各個(gè)嵌入率下均明顯高于隨機(jī)載體集,在嵌入率為0.1時(shí)最高,為0.498 5,當(dāng)嵌入率增加到0.4時(shí)檢測(cè)錯(cuò)誤率有所降低,但仍然保持在0.45以上,隨機(jī)載體集中的檢測(cè)錯(cuò)誤率在嵌入率為0.1時(shí)只比篩選后的安全載體集對(duì)應(yīng)檢測(cè)錯(cuò)誤率低2.04個(gè)百分點(diǎn).但是,隨著嵌入率上升到0.4,檢測(cè)錯(cuò)誤率快速下降低,相比于安全載體集低了約6個(gè)百分點(diǎn).通過HUGO進(jìn)行信息嵌入的實(shí)驗(yàn)結(jié)果中,當(dāng)嵌入率為10%時(shí),安全載體集與隨機(jī)載體集上的檢測(cè)錯(cuò)誤率均接近0.49,隨著嵌入率的增加,2個(gè)載體集的抗檢測(cè)能力差距逐漸拉大,在嵌入率為0.2,0.3,0.4時(shí),安全載體集的檢測(cè)錯(cuò)誤率分別提高了3.18,5.82,6.06個(gè)百分點(diǎn).
上述結(jié)果表明,通過本文方法預(yù)篩選的安全載體集能夠在對(duì)抗SPAM隱寫分析方法時(shí)極大地提高隱寫安全性,被篩選出的載體安全性能穩(wěn)定,對(duì)于嵌入率、嵌入算法等外在因素不敏感.
4.2.2 基于SRM的安全性驗(yàn)證
為了研究本文所提出的載體安全性評(píng)價(jià)方法對(duì)于隱寫分析方法的敏感程度,我們對(duì)相同的2個(gè)樣本集增加SRM隱寫分析實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如圖8所示.
Fig. 8 Steganalysis results based on SRM圖8 基于SRM隱寫分析結(jié)果
與SPAM隱寫分析的檢測(cè)結(jié)果相似,安全載體集在對(duì)抗SRM檢測(cè)上同樣擁有很好的效果.其中,通過S-UNIWARD算法進(jìn)行信息嵌入時(shí),在嵌入率為0.1,0.2,0.3,0.4的情況下,安全載體集的檢測(cè)錯(cuò)誤率最高達(dá)到0.484 9,最低保持在0.34左右,檢測(cè)錯(cuò)誤率與隨機(jī)載體集相比分別提高了6.36,10.59,12.93,8.47個(gè)百分點(diǎn).在以WOW算法進(jìn)行嵌入的實(shí)驗(yàn)中,安全載體集的抗檢測(cè)能力在多種嵌入率下同樣明顯強(qiáng)于隨機(jī)載體集,其檢測(cè)錯(cuò)誤率分布在0.484 1~0.348 7之間,平均錯(cuò)誤率為0.420 9,遠(yuǎn)遠(yuǎn)高于隨機(jī)載體集的平均檢測(cè)錯(cuò)誤率0.337 4.圖8(c)中,以HUGO算法進(jìn)行信息嵌入的隨機(jī)載體集與安全載體集在對(duì)抗SRM隱寫分析時(shí)整體效果均有所下降.然而通過預(yù)篩選的安全載體集,在各個(gè)嵌入率下仍然具有較高的安全性,檢測(cè)錯(cuò)誤率平均提高了6.05~ 10.67個(gè)百分點(diǎn).
上述實(shí)驗(yàn)證明,本文提出的評(píng)價(jià)方法能夠有效反映載體圖像的安全性,經(jīng)過該方法篩選后的載體集對(duì)抗多種隱寫分析方法的檢測(cè)時(shí),在多種嵌入率、隱寫方法的情況下,均能有效且穩(wěn)定地提高隱寫安全性.
本文將隱寫安全性分為算法安全和載體安全2個(gè)方面,從載體自身屬性的角度出發(fā),計(jì)算載體圖像的殘差矩陣與共生矩陣,提取載體圖像中的噪聲分布特征,并對(duì)載體噪聲特征進(jìn)行聚類分析,驗(yàn)證了不同噪聲分布的載體對(duì)隱寫安全性存在顯著影響.基于分析驗(yàn)證結(jié)論,提出了一種圖像載體安全性評(píng)價(jià)方法,該方法以樣本載體噪聲分布特征之間的相關(guān)性為基礎(chǔ),計(jì)算待嵌入圖像載體與已驗(yàn)證安全載體之間的相似度,對(duì)待嵌入樣本進(jìn)行安全性評(píng)估.實(shí)驗(yàn)證明:本文提出的載體安全性評(píng)價(jià)方法可以有效評(píng)價(jià)載體的安全性,將該方法應(yīng)用于隱寫載體預(yù)篩選后,在各種嵌入率下,都可以極大地降低主流隱寫分析的檢測(cè)率,且受隱寫算法、載體來源等因素影響較小.