魏程程 西安工業(yè)大學(xué)
隱寫術(shù)作為信息隱藏的一個重要分支,現(xiàn)已成為信息安全領(lǐng)域的重要研究內(nèi)容之一,與密碼學(xué)的不同之處在于,隱寫術(shù)是把特定的秘密信息隱藏在某個公開的信息(載體信號)里,其中嵌入的秘密信息既不會改變載體信號的視聽覺效果,同時也不會改變載體文件的格式和大小,外觀的表現(xiàn)仍舊是載體信號(公開信息)的內(nèi)容和特征,有公開的信息作掩護(hù),因此第三方不會覺察出秘密信息的存在,從而實現(xiàn)了隱蔽通信?,F(xiàn)實生活中有很多不同的數(shù)字載體(圖像,視頻,音頻等)供隱寫術(shù)使用,其中最廣泛使用的是數(shù)字圖像。隱寫術(shù)既可以滿足合法的利益也可能被人們?yōu)E用,例如,公眾可以利用其來保護(hù)隱私,也可以保障政治、軍事、經(jīng)濟(jì)等重要信息在公共傳輸過程中的安全性和可靠性,而恐怖分子可能用它來在互聯(lián)網(wǎng)上傳播恐怖主義的信息,從而隱寫術(shù)也成為了犯罪分子進(jìn)行非法活動的工具和手段。
隨著互聯(lián)網(wǎng)的廣泛使用以及日漸發(fā)展成熟的信息隱藏技術(shù),大量的隱寫方法如雨后春筍般冒出,用戶通過互聯(lián)網(wǎng)可以輕松便捷地獲取多種隱寫工具,其操作簡單,容易上手。如果對這些工具加以濫用,便會對網(wǎng)絡(luò)信息安全產(chǎn)生嚴(yán)重的威脅 ,因此我們對反隱寫技術(shù)的需求在不斷增加。隱寫分析是一項反隱寫術(shù)的技術(shù),它具有重要的現(xiàn)實意義, 近年來,正成為信息安全領(lǐng)域一個新的研究熱點(diǎn)。
現(xiàn)有的隱寫分析方法,根據(jù)基本原理的不同可以分為三類:感官分析法、基于標(biāo)識特征分析法和基于統(tǒng)計特征分析法。其中統(tǒng)計特征分析法是隱寫分析領(lǐng)域中大多采用的方法,它是將載體圖像的某一個或多個統(tǒng)計量的理論期望頻率分布和待檢測的隱密圖像分布進(jìn)行比較,找出兩者的差異,從而設(shè)計算法實現(xiàn)兩者的分類。
統(tǒng)計特征分析法根據(jù)檢測目標(biāo)的不同可以分為兩類:特定隱寫分析法和通用盲檢測法。
一般來說,針對性的隱寫分析方法試圖在已知隱寫算法的前提下,判斷待檢測對象是否含有隱秘信息,其檢測性能和可靠性較高,但是靈活性和可擴(kuò)展性較差。空域的隱寫分析中,針對LSB替換隱寫方法,早期典型的方法是由Westfeld等人提出的基于卡方統(tǒng)計的方法;Fridrich在文獻(xiàn)中提出了基于RS的檢測方法;Dumitrescus等人提出的SPA(Sample Pair Analysis)方法;張濤提出的基于DIH(Differential Image Histogram)的算法。變換域的隱寫分析主要是檢測針對DCT域的信息隱藏,張濤等人提出的快速卡方檢驗法,能夠有效地估計順序JSteg隱寫和隨機(jī)JSteg隱寫的信息嵌入比率。
通用的隱寫分析方法也稱為盲檢測方法,就是在隱寫方法未知而只有檢測對象的情況下,對其中是否隱藏秘密信息進(jìn)行檢測判斷。盡管通用的隱寫分析方法的檢測率并不十分令人滿意,但由于它不需要嵌入操作的先驗知識,因此具有更好的實用價值。典型的通用盲隱寫分析方法有,Avcibas提出的基于圖像質(zhì)量度量(Image Quality Metrics, IQM)法。Shi YunQ提出了針對擴(kuò)展頻域隱寫和LSB隱寫的盲檢測方法。
通過對現(xiàn)存的大量隱寫分析算法的研究,發(fā)現(xiàn)很多現(xiàn)有算法存在一些負(fù)面的問題,例如較低的檢測精度,盡管一些新興的算法具有令人滿意的檢測精度,但是由于高維數(shù)的特征向量導(dǎo)致其檢測效率并不令人滿意。因此,本文的工作重點(diǎn)集中在以下兩個方面:一方面致力于提高算法的檢測精度,另一方面試圖減少特征向量的維數(shù)以避免“維數(shù)災(zāi)難”,提高算法的效率。
由于共生矩陣能夠有效地描述特定像素對之間聯(lián)合概率發(fā)生的相關(guān)度量,因此可以被用來描述圖像隱寫前后所引起的統(tǒng)計特征的變化。根據(jù)這種思想,Abolghasemi等人提出一個基于共生矩陣的LSB隱寫分析方法,在他們的方法中,作者認(rèn)為自然圖像的相鄰像素之間通常具有很高的相關(guān)性,圖像的共生矩陣是趨于對角分布的,然而,在數(shù)據(jù)嵌入后,由于相鄰像素間的高相關(guān)性減弱,導(dǎo)致沿著共生矩陣主對角線方向的高密集分布模式擴(kuò)散開來?;谶@一原理,作者選擇了共生矩陣主對角線上的元素,以及部分次對角線的元素作為特征,使用支持向量機(jī)作為分類器進(jìn)行分類。
文章提出了另外一個基于共生矩陣的LSB隱寫分析算法,在文中,作者計算了水平和垂直差分圖像的共生矩陣,然后提取共生矩陣上三角的180維特征向量,用支持向量機(jī)作為分類器進(jìn)行分類。
在本文中,我們針對“維數(shù)災(zāi)難”以及檢測精度低等問題,利用共生矩陣的性質(zhì),提出了一種針對LSB替換攻擊的隱寫分析方法。在我們的方法中,利用了圖像的位平面之間的相關(guān)性,在秘密信息嵌入后,這種相關(guān)性遭到破壞。據(jù)此,我們將灰度圖像分解成8個位平面,分別計算最低位平面與其余七個位平面間的差分矩陣,然后計算差分矩陣的和矩陣,生成和矩陣的共生矩陣,通過研究分析共生矩陣的特性,從中提取統(tǒng)計顯著性特征,使用支持向量機(jī)作為分類器來區(qū)分載體圖像和隱密圖像。
我們的方法可以分成三個階段:圖像預(yù)處理,特征提取和分類。其框架如圖1所示。
圖1 提出算法的框架圖
在我們的方法中,從圖像的位平面間的相關(guān)性入手,將灰度圖像分解成8個位平面,然后我們計算位平面的差分矩陣,最后將差分矩陣求和得到一個和矩陣,利用和矩陣的共生矩陣來描述位平面間的相關(guān)性,然后利用這種相關(guān)性來建立統(tǒng)計顯著性特征。方法的具體步驟描述如下:
對于灰度圖像I,位平面分解可以被公式化如下:
考慮到圖像的位平面間必然存在一定的相關(guān)性,我們分別計算了最低位平面與其余七個位平面的差分矩陣,然后我們定義了差分矩陣的和矩陣。由于每個位平面矩陣中的元素值只有0或1兩種,所以差分矩陣中的元素值為-1,0,1。為了更好地描述位平面間的相關(guān)性,在差分矩陣加和時,避免-1和1正負(fù)抵消的情況是十分必要的。因此,先對每個差分矩陣中的元素進(jìn)行絕對值操作后再加和,生成和矩陣。方法的具體步驟描述如下:
差分矩陣的和矩陣:
計算共生矩陣:
這里, 當(dāng)且僅當(dāng)其后面括號的式子成立。
在我們的方案中,共生矩陣的參數(shù)選擇如下,共生矩陣的偏移參數(shù)Δx設(shè)置為1,Δy設(shè)置為0,也就是說,在計算共生矩陣時只考慮水平方向相鄰的元素。我們生成的共生矩陣是非對稱矩陣。
圖2為按照我們的方案中設(shè)置偏移量以及矩陣是否對稱,計算一個矩陣的共生矩陣的示例圖:
圖2 矩陣I及其共生矩陣
下面計算MD的共生矩陣G,得到一個8×8的矩陣:
特征提?。?/p>
根據(jù)圖像相鄰像素間的相關(guān)性以及和矩陣的分布特性,G中元素的分布模式是趨于集中分布的,也就是說,中間區(qū)域的值比邊緣區(qū)域的值大,可以將中間區(qū)域的值看作是圖像的主要信息,在隱寫前后圖像本質(zhì)發(fā)生微小變化,圖像的主要信息也隨之會發(fā)生變化,進(jìn)而可以作為統(tǒng)計顯著性特征。也就是說,在秘密信息嵌入到最低位平面后,最低位平面和其余七個位平面之間的相關(guān)性發(fā)生改變,這種變化可以通過G的中間區(qū)域的值來描述。因此,在我們的工作中,我們選擇G的中間區(qū)域的16個元素作為特征向量,
如圖3所示:
圖3 特征選擇示意圖
為了說明特征向量f對數(shù)據(jù)嵌入是敏感的,我們分別測試了1600張載體圖像和1600張隱密圖像,圖4顯示了用上述方法生成其共生矩陣G的統(tǒng)計平均值的分布模式。
圖4 共生矩陣G的統(tǒng)計平均值的分布模式
圖4左圖表示1600張載體圖像分別用上述方法生成共生矩陣G的統(tǒng)計平均值的分布模式,右圖表示1600張隱密圖像分別用上述方法生成共生矩陣G的統(tǒng)計平均值的分布模式。從圖中可以看出,載體圖像和隱密圖像對應(yīng)的共生矩陣G中間區(qū)域的元素是顯著的,并且在數(shù)據(jù)嵌入前后,中間區(qū)域元素的值發(fā)生改變。
如果秘密信息嵌入到圖像的最低位平面,位平面之間的相關(guān)性將發(fā)生改變,這種改變將表現(xiàn)在共生矩陣G上,同時可以作為證據(jù)來證明圖像中是否隱藏秘密信息。
我們定義了特征向量f作為分類特征,使用LS-SVM作為分類器來區(qū)分載體圖像和隱密圖像,這里選擇徑向基函數(shù)(RBF)作為核函數(shù)。
實驗中使用的圖像來自http: //www.freefoto.com,哥倫比亞圖像庫和UCID圖像庫。這些測試的圖像包含了不同的明暗度,紋理和細(xì)節(jié),如圖5所示:
圖5 測試圖像示例
我們利用它們生成不同嵌入率的隱密圖像以評估提出的方法,樣本集的建立如下:
首先,1600張測試圖像(大小為256×256)被轉(zhuǎn)化成位圖格式的灰度圖像,生成載體圖像樣本集,定義為IC。
其次,我們在載體圖像的最低位平面嵌入秘密信息生成隱密圖像,嵌入率的大小分別是12%,25%和50%,然后我們得到三個隱密圖像樣本集,定義為IS-1,IS-2和IS-3。
為了定量地分析提出方法的檢測精度,我們公式化定義了假陽性率和假陰性率,內(nèi)容如下:
為了驗證提出的方法同現(xiàn)有的基于共生矩陣的方法相比,在檢測精度上的優(yōu)越性,我們設(shè)計了比較實驗,實驗在不同嵌入率12%,25%,50%的情況下統(tǒng)計了真陰性率PTN=1-PFP和真陽性率PTP=1-PFN,結(jié)果在表1中列出。表1中,PT= (PTN+PTP)/2。
我們從IC中隨機(jī)選取400張載體圖像,從IS-1中隨機(jī)選取400張隱密圖像作為訓(xùn)練樣本,然后從IC-{已選取過的400張載體圖像}中隨機(jī)選取200張載體圖像作為測試樣本,使用LS-SVM進(jìn)行分類,得到假陽性率PFP。我們重復(fù)這個過程10次,統(tǒng)計實驗結(jié)果的平均值作為最終的PFP,表1中顯示的是其對應(yīng)的真陰性率PTN=1-PFP。對于嵌入率為25%和50%的隱秘圖像,測試過程和上述提到的相同,所有的測試結(jié)果都被顯示在表1中。
我們從IC中隨機(jī)選取400張載體圖像,從IS-1中隨機(jī)選取400張隱密圖像作為訓(xùn)練樣本,然后從IS-1-{已選取過的400張隱密圖像}中隨機(jī)選取200張隱密圖像作為測試樣本,使用同測試PFP一樣的方法得到假陰性率PFN,在表3-1中顯示其對應(yīng)的真陽性率PTP=1-PFN。
表1 檢測率的比較結(jié)果
從表1中可以看出,與方法【3】和【4】相比,我們的方法的真陰性率和真陽性率是令人滿意的。
本文提出了一種新的基于共生矩陣的LSB替換隱寫分析方法,提出的方法利用了圖像位平面間相關(guān)性的知識,通過從共生矩陣中提取特征,減少了特征向量的維數(shù),進(jìn)而有效地避免了“維數(shù)災(zāi)難”,并達(dá)到了預(yù)期的效果,該算法具有令人滿意的檢測率。