劉正輝, 孫 芳, 祁傳達(dá)(信陽(yáng)師范學(xué)院 計(jì)算機(jī)與信息技術(shù)學(xué)院, 河南 信陽(yáng) 464000)
關(guān)于數(shù)字多媒體安全方面的研究,已有相當(dāng)豐碩的研究成果[1-4]。如在數(shù)字音頻取證方面,文獻(xiàn)[5]分析了AMR編碼量化對(duì)錄音的影響,得出AMR壓縮波形中存在顯著的樣本重復(fù)情況。然而該情況在其他壓縮格式(如MP3、WMA等)中并不存在?;诖宋墨I(xiàn)[5]給出了樣本重復(fù)率的計(jì)算方法,并以此為特征提出了一種AMR壓縮錄音的檢測(cè)方法。為解決基于公開特征的水印取證算存在的安全隱患,文獻(xiàn)[6]選擇保密的特征來(lái)嵌入用于取證的水印信息,提出一種抗特征分析替換攻擊的數(shù)字語(yǔ)音取證算法。該方案從一定程度上提高了取證水印的安全性。
在一些應(yīng)用場(chǎng)合,人們不僅需要驗(yàn)證語(yǔ)音內(nèi)容的真實(shí)性,還渴望獲得被攻擊部分要表達(dá)的含義,即對(duì)被攻擊內(nèi)容的篡改恢復(fù)。對(duì)圖像可恢復(fù)技術(shù)的研究已較為成熟[7-11],而關(guān)于可恢復(fù)的數(shù)字語(yǔ)音取證技術(shù)則鮮有報(bào)道[12]??苫謴?fù)的數(shù)字語(yǔ)音取證技術(shù),能夠恢復(fù)被攻擊的內(nèi)容,挖掘攻擊者有意掩蓋的事實(shí),為推斷攻擊者的意圖提供有益的參考。考慮到可恢復(fù)數(shù)字語(yǔ)音取證技術(shù)的實(shí)際需求,本文提出一種基于離散小波變換DWT(Discrete Wavelet Transform)的可恢復(fù)數(shù)字語(yǔ)音取證算法。首先給出了基于DWT的語(yǔ)音壓縮和重構(gòu)方法?;谠摲椒ǎ疚膶⒃夹盘?hào)壓縮為少量的DWT近似分量,驗(yàn)證了由DWT近似分量在保持語(yǔ)義前提下,對(duì)原始信號(hào)的重構(gòu)能力。將幀號(hào)和壓縮信號(hào)作為水印,采用基于分塊的方法嵌入語(yǔ)音信號(hào)中。幀號(hào)用于定位被攻擊的內(nèi)容,壓縮信號(hào)用于重構(gòu)被攻擊的信號(hào),并進(jìn)行篡改恢復(fù)。
對(duì)于長(zhǎng)為N的語(yǔ)音信號(hào)A,q階DWT的結(jié)構(gòu)見圖1。其中,ACq和DCq分別表示q階的近似分量(低頻)和細(xì)節(jié)分量(高頻),|ACq|和|DCq|表示ACq和DCq的長(zhǎng)度。從某種程度上語(yǔ)音信號(hào)的低頻包含了該信號(hào)的主要部分,而高頻部分起到的是修飾作用。從獲取語(yǔ)音信號(hào)要表達(dá)含義的角度講,僅保留低頻部分即可,基于此本文給出了基于DWT的語(yǔ)音壓縮和重構(gòu)方法。
記原始語(yǔ)音信號(hào)為A={al|1≤l≤L},其中L表示語(yǔ)音信號(hào)的長(zhǎng)度,al表示第l個(gè)樣本點(diǎn),壓縮步驟為:
Step1將A分為P幀,第i幀記為Ai。
Step3對(duì)Ai進(jìn)行D階DWT(本文取3階DWT),將最高階DWT的近似分量作為壓縮信號(hào)的一部分,記為C1i。
Step4將1到D階細(xì)節(jié)分量置零,對(duì)C1i和置零的細(xì)節(jié)分量進(jìn)行逆DWT,得到的信號(hào)記為R1i,將Ai和R1i做差,得到第i幀的殘差信號(hào)Ei。
Step5對(duì)Ei進(jìn)行2階DWT,并將2階DWT的近似分量記為C2i。C1i和C2i一起作為壓縮信號(hào),記Ci=C1i‖C2i,Ci即為第i幀的壓縮信號(hào)。
(1) 本文壓縮方法重構(gòu)信號(hào)測(cè)試
隨機(jī)選取一段長(zhǎng)度為4 096,采樣頻率為44.1 kHz的語(yǔ)音信號(hào),測(cè)試上述壓縮方法的重構(gòu)效果,步驟為:
Step1采用11.025 kHz的采樣頻率對(duì)語(yǔ)音信號(hào)進(jìn)行重采樣,采樣后信號(hào)長(zhǎng)度為1 024,見圖2。
Step2對(duì)圖2所示信號(hào)進(jìn)行3階DWT,然后對(duì)細(xì)節(jié)分量置零,逆DWT后得到的信號(hào)見圖3。
Step3由圖2、圖3可得殘差信號(hào)。對(duì)殘差信號(hào)進(jìn)行2階DWT后,將細(xì)節(jié)分量置零,逆DWT得到的信號(hào)作為重構(gòu)的殘差信號(hào),見圖4。
Step4圖3、圖4合成的信號(hào)即為對(duì)1 024個(gè)樣本點(diǎn)重構(gòu)的信號(hào),見圖5。
(2) 不同壓縮方法重構(gòu)信號(hào)質(zhì)量對(duì)比
文獻(xiàn)[12]給出了基于離散余弦變換DCT的語(yǔ)音信號(hào)壓縮和重構(gòu)方法。將語(yǔ)音信號(hào)DCT低頻系數(shù)作為壓縮信號(hào),高頻系數(shù)置零,并通過(guò)逆DCT來(lái)重構(gòu)信號(hào)。圖6、圖7分別給出由文獻(xiàn)[12]和本文方法重構(gòu)圖2信號(hào)和原始信號(hào)的殘差(壓縮信號(hào)樣本點(diǎn)個(gè)數(shù)相等),并且圖6信號(hào)能量大于圖7信號(hào)。說(shuō)明和文獻(xiàn)[12]相比,本文所提方法重構(gòu)信號(hào)的能量損失較小,更接近原始信號(hào)。
將語(yǔ)音信號(hào)A分幀、分段,方法見圖8,具體步驟為:
Step1將信號(hào)A分幀,Ai表示第i幀,1≤i≤P。
Step2采用文獻(xiàn)[6]中的方法,置亂Ai中的樣本,并記生成的信號(hào)為Si。
Step3將Si分成3部分,用S1i,S2i和S3i來(lái)表示。將S1i和S2i等分成M個(gè)(3個(gè)樣本為一組)子段,M表示用于篡改定位的整數(shù)序列的長(zhǎng)度。第j段記為S1i,j和S2i,j,1≤j≤M。
(1) 幀號(hào)嵌入
Step1由式( 1 )將幀號(hào)i變換成M長(zhǎng)的整數(shù)序列Yi={y1,y2,…yM}。yi作為第i幀的水印分別嵌入到S1i和S2i中。
i=y110M-1+y210M-2+…+yM
( 1 )
Step2將y1嵌入到S1i的第1個(gè)子段S1i,1中,并記S1i,1中的3個(gè)樣本為s11,s12和s13。
Step3取s11,s12和s13小數(shù)點(diǎn)后第4位的值,記為v1,v2和v3。
Step4由式( 2 )令V=f(v1,v2,v3)。
f(v1,v2,v3)=mod(v1+v2×2+v3×3, 10)
( 2 )
Step5對(duì)比y1和V,量化v1、v2或v3。量化方法為v1±1、v2±1或v3±1,如文獻(xiàn)[6]。以此完成y1的嵌入。
重復(fù)以上步驟,將Yi分別嵌入在S1i和S2i中。
(2) 壓縮信號(hào)嵌入
根據(jù)本文篡改恢復(fù)的思路,如果第i幀的壓縮信號(hào)嵌入到自身當(dāng)中,在第i幀的內(nèi)容被攻擊后,嵌入其中的壓縮信號(hào)也將受到攻擊。這樣就不能通過(guò)壓縮信號(hào)來(lái)恢復(fù)該幀的內(nèi)容。為解決該問(wèn)題,首先將各幀生成的壓縮信號(hào)置亂,使第i幀的壓縮信號(hào)嵌入到其他幀中。如果第i幀的內(nèi)容被攻擊,可以從其他幀中提取壓縮信號(hào),來(lái)恢復(fù)被攻擊的內(nèi)容。
Step1將S3i,1的6個(gè)樣本點(diǎn)分為6塊,并記為B1,B2,…,B6,其中
Br=mod(?|10t·s31|,10)
3≤t≤5 1≤r≤6
Step3計(jì)算B1中3個(gè)樣本之和,記為sum(B1)。
如果BC1=-1(即Ci,1<0),且mod(sum(B1),2)=1,量化B1中最后一個(gè)樣本加1或減1,使mod(sum(B1),2)=0。
Step4采用和幀號(hào)嵌入相同的方法,將BCt嵌入到Bt對(duì)應(yīng)的樣本中,2≤t≤6。
采用上述步驟,完成其他壓縮信號(hào)的嵌入,并重復(fù)上述方法,將各幀幀號(hào)和壓縮信號(hào)嵌入到對(duì)應(yīng)幀中。并反置亂,來(lái)生成含水印的信號(hào)。幀號(hào)和壓縮信號(hào)嵌入過(guò)程見圖9。
記A′為含水印信號(hào),內(nèi)容取證和篡改恢復(fù)過(guò)程分別見圖10、圖11,過(guò)程為:
(4) 篡改定位和篡改恢復(fù)。假設(shè)含水印信號(hào)第1幀到第i幀的內(nèi)容能通過(guò)驗(yàn)證,而緊接著的連續(xù)樣本不能。對(duì)該部分的定位和篡改恢復(fù)過(guò)程,見圖11,步驟為:
( 3 )
Step3第i幀和第i′幀之間的內(nèi)容,即被定位到的被攻擊內(nèi)容。
Step4根據(jù)本文的置亂方法,找到被攻擊內(nèi)容對(duì)應(yīng)的壓縮信號(hào)嵌入位置,然后提取壓縮信號(hào),并重構(gòu)被攻擊的內(nèi)容。
考慮到實(shí)際情況,本文采用由錄音筆在不同場(chǎng)景下錄制的100個(gè)語(yǔ)音段作為測(cè)試信號(hào)。錄制環(huán)境為寂靜的會(huì)議室、討論會(huì)現(xiàn)場(chǎng)、火車站和郊外,對(duì)應(yīng)的樣本類型分別標(biāo)記為T1、T2、T3和T4。錄制語(yǔ)音為單聲道、采樣頻率為44.1 kHz的信號(hào)。其他用到的實(shí)驗(yàn)參數(shù)取值為L(zhǎng)=245 760,P=20,f′=11 025 Hz,M=4;置亂系統(tǒng)中Logistic混沌映射的初值k=0.589 4,μ=3.934 2。
本文采用主觀區(qū)分度SDG(Subjective Difference Grades)和信噪比SNR(Signal to Noise Ratio)測(cè)試水印的不可感知性。SDG評(píng)分標(biāo)準(zhǔn)見表1,信噪比的計(jì)算方法為
( 4 )
式中:a(l)、a′(l)分別為原始語(yǔ)音信號(hào)和含水印語(yǔ)音的第l個(gè)樣本點(diǎn);L為信號(hào)長(zhǎng)度。
表2給出了對(duì)100段信號(hào)測(cè)得的SDG值和SNR值,SDG值由15位聽眾打分得到。由測(cè)試結(jié)果可得,本文算法中水印是不可聽的。
表1 SDG值的評(píng)分標(biāo)準(zhǔn)
表2 不同類型語(yǔ)音信號(hào)的SDG值和SNR值
本文所提算法將水印嵌入在置亂后的樣本中,通過(guò)反置亂來(lái)獲取含水印的信號(hào)。本文中水印嵌入位置對(duì)合法用戶(擁有系統(tǒng)密鑰)才能獲得。
如果在沒有系統(tǒng)密鑰的情況下,對(duì)含水印系統(tǒng)進(jìn)行攻擊,攻擊內(nèi)容能通過(guò)認(rèn)證的概率為
( 5 )
式中:M越大(幀號(hào)映射整數(shù)序列越長(zhǎng)),被成功攻擊的可能性越小。
文獻(xiàn)[13-14]指出,基于公開特征的水印算法存在安全隱患。式( 5 )給出了攻擊者攻擊本文算法的成功率Pv,Pv較小,說(shuō)明攻擊成功的概率較低。從而,和基于公開特征的水印算法[13]相比,本文在一定程度上提高了算法的安全性。
隨機(jī)選取圖12中一段含水印信號(hào),然后對(duì)其進(jìn)行刪除攻擊、插入攻擊和替換攻擊,并給出篡改定位和篡改恢復(fù)結(jié)果,其中Ti=1對(duì)應(yīng)的幀是真實(shí)的。
(1) 刪除攻擊
這里僅給出對(duì)刪除攻擊篡改定位和篡改恢復(fù)的詳細(xì)步驟。由于篇幅原因,對(duì)于其他類型的攻擊,僅給出相關(guān)的實(shí)驗(yàn)結(jié)果。
Step1刪除含水印信號(hào)第45 601到第53 600個(gè)樣本,攻擊后的信號(hào),見圖13。
Step2根據(jù)本文的取證方法,逐幀驗(yàn)證其真實(shí)性,并提取能夠通過(guò)驗(yàn)證幀的幀號(hào),幀號(hào)提取結(jié)果,見圖14。對(duì)于被攻擊的幀,由于幀號(hào)不能被提取和重構(gòu),故圖14中沒有被顯示的幀號(hào)對(duì)應(yīng)的內(nèi)容就是被攻擊的部分。可知第4和第5幀被攻擊。
Step3依據(jù)本文置亂方法,易得第4幀和第5幀的內(nèi)容嵌入在第9幀和第18幀當(dāng)中。從其中提取壓縮信號(hào),并重構(gòu)被攻擊的內(nèi)容,重構(gòu)結(jié)果見圖15。
(2) 插入攻擊
插入10 000個(gè)樣本到含水印信號(hào)中,攻擊的信號(hào)見圖16。易得第11幀是被攻擊的部分。從第13幀提取壓縮信號(hào),并恢復(fù)被攻擊內(nèi)容,篡改恢復(fù)結(jié)果見圖17。
(3) 替換攻擊
替換含水印信號(hào)第210 001到220 000個(gè)樣本,見圖18(第18幀是被攻擊的部分)。從第6幀中提取對(duì)應(yīng)的壓縮信號(hào),并進(jìn)行篡改恢復(fù),結(jié)果見圖19。
表3給出了以上3類篡改恢復(fù)信號(hào)的SDG值,并和文獻(xiàn)[12]所給算法進(jìn)行了對(duì)比,從對(duì)比結(jié)果可見,基于本文算法篡改恢復(fù)的信號(hào)有更好的不可聽性,從某種程度上而言,本算法篡改恢復(fù)信號(hào)的聽覺質(zhì)量高于文獻(xiàn)[12]所給算法。
表3 不同類型攻擊篡改恢復(fù)信號(hào)的SDG值
綜合以上分析,本文所提算法嵌入水印具有較好的不可聽性,提高了水印嵌入安全性,同時(shí)也提高了篡改恢復(fù)信號(hào)的聽覺質(zhì)量。
提出一種基于DWT的語(yǔ)音內(nèi)容篡改恢復(fù)算法。給出了基于DWT的語(yǔ)音壓縮和重構(gòu)方法,并分析了重構(gòu)信號(hào)的性能。將幀號(hào)作為各幀的標(biāo)識(shí)和壓縮信號(hào)一起進(jìn)行嵌入。對(duì)被攻擊信號(hào),首先用幀號(hào)來(lái)定位被攻擊的語(yǔ)音幀;然后,提取被攻擊內(nèi)容對(duì)應(yīng)的壓縮信號(hào)進(jìn)行篡改恢復(fù)。本文算法提高了水印的安全性和篡改恢復(fù)信號(hào)的聽覺質(zhì)量。
參考文獻(xiàn):
[1] MARCO F,TIZIANO B,ALESSIA D R,et al.A Framework for Decision Fusion in Image Forensics Based on Dempster-shafer Theory of Evidence[J].IEEE Transactions on Information Forensics and Security,2013,8(4):593-607.
[2] CHEN S D,TAN S Q,LI B,et al.Automatic Detection of Object-based Forgery in Advanced Video[J].IEEE Transactions on Circuits and Systems for Video Technology,2015,26(11):2138-2151.
[3] SOODEH A,SHAHROKH G,WANG Z J.A Sparse Representation-based Wavelet Domain Speech Steganography Method[J].IEEE Transactions on Audio,Speech,and Language Processing,2015,23(1): 80-91.
[4] LIU Q,SUNG A H,QIAO M.Derivative-based Audio Steganalysis[J].ACM Transactions on Multimedia Computing Communications & Applications,2011,7(3):726-742.
[5] LUO D,YANG R,HUANG J W.Identification of AMR Decompressed Audio[J].Digital Signal Processing,2015,37(2):85-91.
[6] 王靜,劉正輝,祁傳達(dá),等.一種抗特征分析替換攻擊的數(shù)字語(yǔ)音取證算法[J].鐵道學(xué)報(bào),2016,38(6):73-78.
WANG Jing,LIU Zhenghui,QI Chuanda,et al.A Content Authentication Algorithm for Digital Speech Signal Robust Against Feature-analyzed Substitution Attack[J].Journal of the China Railway Society,2016,38(6):73-78.
[7] SINGH D,SINGH S K.Effective Self-embedding Watermarking Scheme for Image Tampered Detection and Localization with Recovery Capability[J].Journal of Visual Communication and Image Representation,2016,38(5):775-789.
[8] HONG C Q,CHEN X H,WANG X D,et al.Hypergraph Regularized Autoencoder for Image-based 3D Human Pose Recovery[J].Signal Processing,2016,124(7):775-789.
[9] ROLDAN L R,HERNANDEZ M C,MIYATAKE M N,et al.Watermarking-based Image Authentication with Recovery Capability Using Halftoning Technique[J].Signal Processing:Image Communication,2013,28(1):69-83.
[10] DONG W S,SHI G M,WU X L, et al.A Learning-based Method for Compressive Image Recovery[J].Journal of Visual Communication and Image Representation,2013,24(7):1055-1063.
[11] QIN C,CHANG C C,CHEN K N.Adaptive Self-recovery for Tampered Images Based on VQ Indexing and Inpainting[J].Signal Processing,2013,93(4):933-946.
[12] LIU Z H,ZHANG F. Authentication and Recovery Algorithm for Speech Signal Based on Digital Watermarking[J].Signal Processing,2013,123(3):157-166.
[13] LEI B Y,SOON I Y,LI Z.Blind and Robust Audio Watermarking Scheme Based on SVD-DCT[J].Signal Processing,2011,91(8):1973-1984.
[14] LIU Zhenghui,WANG Hongxia. A Novel Speech Content Authentication Algorithm Based on Bessel-fourier Moments[J]. Digital Signal Processing,2014,24(1):197-208.