趙永寬,蔡曉霞,陳 紅
(解放軍電子工程學(xué)院,合肥 230037)
隨著近年來掩密技術(shù)的不斷發(fā)展,隱寫分析技術(shù)也得到了很好的應(yīng)用與發(fā)展。隨著隱寫分析算法及其指標(biāo)的豐富,隱寫分析的評(píng)估開始受到重視。針對(duì)不同的實(shí)際應(yīng)用需求,可以根據(jù)相應(yīng)的評(píng)估算法從多個(gè)指標(biāo)評(píng)估典型隱寫分析算法性能[1,2]。文獻(xiàn)[3]從可靠性和檢測速率兩個(gè)方面,采用模糊綜合評(píng)估理論與層次分析法構(gòu)建評(píng)估系統(tǒng);文獻(xiàn)[4]采用多元線性回歸分析模型以檢出率等5個(gè)評(píng)估指標(biāo)評(píng)估隱寫分析算法性能。然而,現(xiàn)有的幾種評(píng)估方案都沒有考慮到評(píng)估指標(biāo)之間存在的知識(shí)冗余,而將其中包含較少或幾乎不包含什么信息的指標(biāo)帶入到之后的評(píng)估算法當(dāng)中,造成評(píng)估結(jié)果可靠性不高。因此,找出并刪除這些冗余指標(biāo),簡化評(píng)估指標(biāo)系統(tǒng)的復(fù)雜度,不僅不會(huì)對(duì)系統(tǒng)產(chǎn)生任何負(fù)面影響,還可以除去那些影響作出正確決策的干擾和噪聲,節(jié)約存儲(chǔ)資源,進(jìn)而提高評(píng)估結(jié)果的可靠性,使之更好地為評(píng)估算法的策略選擇服務(wù)。
現(xiàn)已被提出的評(píng)估指標(biāo)主要有檢出率、漏檢率、虛警率、否定率、全局檢測率、檢測頑健性、特征復(fù)雜度和檢測復(fù)雜度等,分別定義為:
(1)檢出率:隱藏圖像中檢測出含有秘密信息的圖像數(shù)與隱藏圖像數(shù)的比率;
(2)漏檢率:隱藏圖像中檢測出不含秘密信息的圖像數(shù)與隱藏圖像數(shù)的比率;
(3)虛警率:非隱藏圖像中檢測出含有秘密信息的圖像數(shù)與非隱藏圖像數(shù)的比率;
(4)否定率:非隱藏圖像中檢測出不含秘密信息的圖像數(shù)與非隱藏圖像數(shù)的比率;
(5)全局檢測率P:計(jì)算公式為
其中 p(w0)、p(w1)、p(e w0)、p(e w1)分別表示否定率、檢出率、虛警率和漏檢率;
(6)檢測頑健性:定義檢測算法對(duì)經(jīng)過一定干擾后載密圖像的全局檢測率為檢測頑健性,這里的干擾方式可以是濾波、加噪、剪貼、復(fù)制、旋轉(zhuǎn)、尺寸縮放等攻擊方法;
(7)特征復(fù)雜度:算法在提取待測圖像特征過程中所需要的時(shí)間;
(8)檢測復(fù)雜度:算法在檢測載密圖像過程中所需要的時(shí)間,可通過分析算法的實(shí)現(xiàn)步驟從而計(jì)算得到。
這些指標(biāo)構(gòu)成如表1所示的評(píng)估指標(biāo)體系[5]。
表1 評(píng)估指標(biāo)體系Table 1 Evaluation index system
從二級(jí)指標(biāo)定義可知,檢出率與漏檢率之和為1,虛警率和否定率之和也為1,即:
又因?yàn)槿謾z測率 P=1-{p(e w0)p(w0)+p(e w1)p(w1)},因此檢出率、漏檢率、虛警率 、否定率以及全局檢測率之間存在顯著的知識(shí)冗余。
區(qū)分矩陣是通過將論域中的每個(gè)對(duì)象進(jìn)行兩兩比較來獲得系統(tǒng)中每兩個(gè)表示系統(tǒng)中的所有不可區(qū)分關(guān)系。
定義1[6]:設(shè)知識(shí)表達(dá)系統(tǒng)S=,R=A是屬性集合,A={a1,a2,…,am}為條件屬性集合,其區(qū)分矩陣是一個(gè)n×n的矩陣,其任一元素為
若知識(shí)系統(tǒng)S中有m個(gè)連續(xù)值屬性,ai表示第i個(gè)連續(xù)值屬性,ai∈A,{}表示系統(tǒng)中屬性ai的值的集合。屬性ai的初始區(qū)間為
在計(jì)算屬性ai的初始區(qū)間pij的頻率值時(shí),每計(jì)算到一個(gè)新的矩陣項(xiàng)c時(shí),該頻率就更新為
設(shè)Redu和Core′分別是初始區(qū)間的約簡和候選核 。令 Redu= ,Core′= ,f()=0,計(jì)算初始區(qū)間的區(qū)分矩陣 ψ,并計(jì)算各個(gè)初始區(qū)間的頻率函數(shù)f()。對(duì)初始區(qū)間的區(qū)分矩陣 ψ進(jìn)行合并并排序,生成候選核 Core′。
BCC算法求解初始區(qū)間約簡的流程如圖1所示。
最后得到的Redu就是所求的初始區(qū)間的約簡,用它將連續(xù)屬性離散化。
設(shè)A={a1,a2,…,am}為條件屬性集合。對(duì)于任意的a∈R,有信息映射f:U×a※Va,Va是屬性a上的值域,且假設(shè) Va=[la,ra]R,此處R為實(shí)數(shù)集。屬性a的值域Va上的一個(gè)斷點(diǎn)可記為(a,c),定義Va上的一個(gè)分類:
因此,定義了一個(gè)新的決策表:
圖1 初始區(qū)間約簡流程圖Fig.1 Flow chart of initial interzone reduction
算法的基本思想如下:首先將區(qū)分矩陣中的各項(xiàng)排序,長度短的排前面,若長度相同則以出現(xiàn)頻率為排序標(biāo)準(zhǔn),出現(xiàn)頻率高的排前面。再將每個(gè)屬性在矩陣中出現(xiàn)的頻率以及各項(xiàng)的長度所提供的反映屬性分辨能力的信息分配到各項(xiàng)中的每個(gè)屬性上,就得到各屬性的加權(quán)頻率值。在計(jì)算屬性 a的加權(quán)頻率值時(shí),每計(jì)算到一個(gè)新的區(qū)分矩陣項(xiàng)c時(shí),該頻率就更新為
HORAFA算法的基本過程是
計(jì)算S的區(qū)分矩陣M,并計(jì)算f(ai);將矩陣中的各項(xiàng)排序,記為 M′;
選擇 c中f(ai)最大的 ai加入Red,Red=Red∪{ai};}
最后得到的Red就是最終要求的屬性的約簡。
利用Matlab7.1,對(duì)文獻(xiàn)[7-10]提出的4種圖像隱寫分析算法進(jìn)行實(shí)驗(yàn)仿真。圖2給出了算法在不同干擾攻擊前后的全局檢測率(圖中算法[1—4]分別對(duì)應(yīng)文獻(xiàn)[7-10]的隱寫分析算法)。
圖2 干擾攻擊前/后各算法的全局檢測率Fig.2 Overall detection rate before/after attack of steganalysis algorithms
表2給出了各隱寫分析算法特征和檢測的復(fù)雜度,從中可以看出,3種檢測算法的檢測復(fù)雜度都較低;相比之下,特征復(fù)雜度將是決定算法復(fù)雜度優(yōu)劣的決定因素。
表2 算法的復(fù)雜度Table 2 Complexity of algorithms
首先對(duì)4種隱寫分析算法的8個(gè)評(píng)估指標(biāo)仿真實(shí)驗(yàn)數(shù)據(jù)進(jìn)行初始區(qū)間構(gòu)造,并用BCC算法將仿真數(shù)據(jù)離散化。表3給出了離散化結(jié)果。
表3 仿真實(shí)驗(yàn)數(shù)據(jù)離散化結(jié)果Table 3 Discrete data of experiment result
將離散化矩陣作為HORAFA算法的輸入,分別求出各指標(biāo)的出現(xiàn)頻率和區(qū)分矩陣,最終計(jì)算出指標(biāo)的約簡如下:
即僅用檢出率、虛警率和檢測頑健性3個(gè)指標(biāo)就可以表示原來8個(gè)指標(biāo)組成的指標(biāo)體系。
某個(gè)評(píng)價(jià)方法的兼容度,是指該評(píng)價(jià)方法下方案排序與每一個(gè)方法下方案排序的等級(jí)相關(guān)系數(shù)的算術(shù)平均值。
第i個(gè)方法的兼容度計(jì)算公式如下:
式中,ri,j為等級(jí)相關(guān)系數(shù),n表示評(píng)估方法的數(shù)量。
若某個(gè)評(píng)價(jià)方法的兼容度較大,則該方法的代表性較強(qiáng),可靠性就高。表4給出了屬性約簡前、后文獻(xiàn)[5]的評(píng)估算法下各隱寫分析算法的排序。
表4 屬性約簡前后各隱寫分析算法的排序Table 4 Steganalysis orders before and after attribute reduction
其中參考排序是僅特征復(fù)雜度單一指標(biāo)要求下算法的排序結(jié)果。對(duì)兼容度分析得知評(píng)估算法在屬性約簡前rb=0.733,約簡后ra=0.867,即屬性約簡后使評(píng)估結(jié)果的可靠性顯著提高。
本文在分析隱寫分析評(píng)估指標(biāo)體系存在知識(shí)冗余的基礎(chǔ)上,提出并實(shí)現(xiàn)了一種針對(duì)隱寫分析冗余評(píng)估指標(biāo)的屬性約簡算法,不僅避免了相應(yīng)指標(biāo)重復(fù)參與運(yùn)算,節(jié)約了存儲(chǔ)資源,而且對(duì)提高評(píng)估結(jié)果的可靠性有積極的影響,進(jìn)而完善已有的評(píng)估算法,在實(shí)際中具有重要的工程應(yīng)用價(jià)值。然而,隨著隱寫分析評(píng)估指標(biāo)的不斷豐富,指標(biāo)之間的冗余將不再明顯,如何確定多個(gè)評(píng)估指標(biāo)之間存在冗余有待進(jìn)一步研究。
[1]湯光明,汪濱,王亞弟.基于多目標(biāo)決策的隱寫檢測評(píng)估[J].計(jì)算機(jī)工程,2009,35(5):133-135.TANG Guang-ming,WANG Bin,WANG Ya-di.Information Hiding Detection Evaluation Based on Multi-objection Strategy[J].Computer Engineering,2009,35(5):133-135.(in Chinese)
[2]龔劬,郭吉強(qiáng).基于FCM算法的隱寫分析算法綜合評(píng)估[J].計(jì)算機(jī)工程,2009,35(4):175-176.GONG Qu,GUO Ji-qiang.Seganalysis Comprehensive Evluation Based on FCM[J].Computer Engineering,2009,35(4):175-176.(in Chinese)
[3]張偉.隱寫分析算法的模糊綜合評(píng)估[D].上海:上海交通大學(xué),2007.ZHANG Wei.Fuzzy Comprehensive Evaluation of Steganalysis Algorithms[D].Shanghai:Shanghai Jiaotong University,2007.(in Chinese)
[4]康輝.圖像隱寫分析算法性能評(píng)估研究[D].無錫:江南大學(xué),2007.KANG Hui.The Performance Evaluation Study of Image Steganalysis Algorithms[D].Wuxi:Jiangnan University,2007.(in Chinese)
[5]趙永寬,蔡曉霞,陳紅.針對(duì)圖像盲檢測算法的模糊綜合評(píng)估[J].通信學(xué)報(bào),2010,31(9A):259-263.ZHAO Yong-kuan,CAI Xiao-xia,CHEN Hong.Fuzzy comprehensive evaluation for image blind steganalysis algorithms[J].Journal on Communications,2010,31(9A):259-263.(in Chinese)
[6]張杰,唐宏,蘇凱,等.效能評(píng)估方法研究[M].北京:國防工業(yè)出版社,2009.ZHANG Jie,TANG Hong,SU Kai,et al.Efficiency Evaluation Methods[M].Beijing:National Defense Industry Press,2009.(in Chinese)
[7]潘曉聲,黃繼風(fēng).JPEG文件隱形信息檢測算法[J].上海師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2005,34(3):26-32.PAN Xiao-sheng,HUANG Ji-feng.A JPEG steganalysis algorithm[J].Journal of Shanghai Normal University(Natural Sciences Edition),2005,34(3):26-32.(in Chinese)
[8]黃聰,宣國榮,高建炯,等.基于DCT域共生矩陣的JPEG圖像隱寫分析[J].計(jì)算機(jī)應(yīng)用,2006,26(12):2863-2865.HUANG Cong,XUAN Guo-rong,GAO Jian-jiong,et al.Steganalysis based on co-ocurrence matrix in DCT domain for JPEG images[J].Computer Applications,2006,26(12):2863-2865.(in Chinese)
[9]宋華,尤新剛,戴一奇.基于SVM的JPEG圖像隱密分析研究[J].計(jì)算機(jī)工程,2006,32(10):6-8.SONG Hua,YOU Xin-gang,DAI Yi-qi.SVM-based Blind Steganalysis for JPEG Image[J].Computer Engineering,2006,32(10):6-8.(in Chinese)
[10]伊兵哲,平西建.基于LSSVM的JPEG圖像隱寫分析算法[C]//第七屆全國信息隱藏暨多媒體信息安全學(xué)術(shù)大會(huì)論文集.南京:中國電子學(xué)會(huì),2007:254-259.YI Bing-zhe,PING Xi-jian.LSSVM-based Blind Steganalysis forJPEG Images[C]//Proceedings of CIHW2007.Nanjing:Chinese Institute of Electronics,2007:254-259.(in Chinese)