蔡詠梅,郭文強(qiáng)
(新疆財(cái)經(jīng)大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院,新疆 烏魯木齊830012)
音頻數(shù)字水印是數(shù)字水印的一個(gè)重要分支,是音頻數(shù)字媒體實(shí)現(xiàn)版權(quán)保護(hù)和認(rèn)證的有效手段。傳統(tǒng)的數(shù)字水印方案是通過(guò)對(duì)原始音頻媒體數(shù)據(jù)進(jìn)行時(shí)域[1]或頻域[2]變換來(lái)實(shí)現(xiàn)數(shù)字水印的嵌入和提取,而這些信息的嵌入不可避免的會(huì)導(dǎo)致原始音頻的失真。近年來(lái)零水印的研究備受關(guān)注。但目前圖像零水印研究的較多。
零水印[3-7]方法的基本思想是通過(guò)數(shù)字音頻自身特征,構(gòu)造出一個(gè)水印密鑰,再與實(shí)際數(shù)字水印結(jié)合生成相應(yīng)水印信息后到第三方安全機(jī)構(gòu)進(jìn)行注冊(cè);或直接構(gòu)造出一個(gè)水印信息,進(jìn)行注冊(cè)。該方法打破了只有向音頻中嵌入水印才能實(shí)現(xiàn)版權(quán)保護(hù)功能的傳統(tǒng)思想。零水印方案中的數(shù)字水印是注冊(cè)到知識(shí)產(chǎn)權(quán)水印數(shù)據(jù)信息庫(kù)中,而不是嵌入到音頻文件中,所以不存在音頻質(zhì)量下降或水印容量受限等問題。零水印的研究很好地解決了數(shù)字水印的透明性和魯棒性之間的矛盾。因此,如何提取數(shù)字音頻媒體自身的特征信息,構(gòu)造出一個(gè)魯棒的零數(shù)字水印成為零水印研究的關(guān)鍵。
本文結(jié)合離散小波變換[8,9](DWT)奇異值分解[10,11](SVD)和音頻信號(hào)自身特征,提出了一種新的音頻零水印方案,并對(duì)該算法進(jìn)行了仿真實(shí)驗(yàn),實(shí)驗(yàn)表明該算法對(duì)于下采樣、低通濾波、去噪、重量化、MP3壓縮、回聲和翻轉(zhuǎn)等流行音頻信號(hào)攻擊具有很強(qiáng)的魯棒性。
小波變換是一種窗口大小固定,形狀可變的時(shí)頻局部分析方法,其定義可參見文獻(xiàn)[12]。小波變換后,低頻部分頻率分辨率較高,時(shí)間分辨率較低;高頻部分頻率分辨率較低,時(shí)間分辨率較高。小波變換與傅立葉變換相比,在時(shí)域和頻域同時(shí)具有良好的局部化性質(zhì),能有效的從信號(hào)中提取信息,通過(guò)伸縮和平移等運(yùn)算功能對(duì)信號(hào)進(jìn)行多尺度細(xì)化分析。離散小波變化的主要特征:
(1)能量集中不變特性。離散小波變換前后音頻信號(hào)總能量保持不變,音頻信號(hào)變換后分解成低頻分量和高頻兩個(gè)分量,低頻分量集中了音頻信號(hào)絕大部分能量是原始音頻信號(hào)的主體部分;高頻分量能量較少是原始音頻信號(hào)的細(xì)節(jié)部分。
(2)具有多分辨率分析特性。離散小波變換時(shí)可根據(jù)具體算法特點(diǎn)選擇小波基和小波變換級(jí)數(shù),所以在水印設(shè)計(jì)時(shí)具有很大的靈活性。
奇異值分解是一種正交變換,它可以將矩陣對(duì)角化。奇異值分解是一種數(shù)值算法,是線性代數(shù)中非常有效的工具之一。基于奇異值分解的數(shù)值水印算法對(duì)一般的轉(zhuǎn)置、旋轉(zhuǎn)、縮放等幾何失真等是魯棒的。奇異值分解主要特性:
(1)任何一個(gè)實(shí)矩陣都可以進(jìn)行奇異值分解,分解成兩個(gè)正交矩陣和一個(gè)對(duì)角矩陣的乘積。
(2)矩陣的奇異值發(fā)生較小調(diào)整時(shí),逆變換后原矩陣不會(huì)發(fā)生較大改變。
(3)魯棒性好,當(dāng)矩陣發(fā)生較小變化時(shí),經(jīng)奇異值分解后的奇異值不會(huì)發(fā)生太大變化,對(duì)常規(guī)音頻信號(hào)的攻擊,對(duì)角矩陣具有較好的穩(wěn)定性。
本文基于DWT-SVD音頻零水印算法思路是:對(duì)載體音頻進(jìn)行分段,對(duì)每一段音頻進(jìn)行二級(jí)DWT變換,將DWT變換后的近似分量轉(zhuǎn)化為方陣,進(jìn)行SVD變換,得對(duì)角矩陣,通過(guò)對(duì)角矩陣構(gòu)造零水印信息。
設(shè)原始音頻為A={A1,A2,...,At},水印圖像大小為N1×N2。基于DWT-SVD的水印構(gòu)造方法如下:
(1)水印圖像預(yù)處理:水印圖像可以表示為:W=Wi,j,0≤i<N1,0≤j<N2,其中Wi,j∈{0,1}??梢酝ㄟ^(guò)以下公式完成降維操作:W={W(i)=W(n1,n2),1≤n1≤N1,0≤n2≤N2,i=n1×N1+n2}。
(2)原始音頻分段:將分成N1×N2個(gè)幀,第i幀記作Bi,每幀的長(zhǎng)度為1024樣點(diǎn),這里要保證選取的音頻長(zhǎng)度大于1024N1×N2。
(3)DWT、SVD變換構(gòu)造密鑰:
令i=1
1)將幀Bi轉(zhuǎn)化為32×32的矩陣,并對(duì)該矩陣進(jìn)行2級(jí)小波變換,可得一個(gè)近似分量和兩個(gè)細(xì)節(jié)變量。
2)將1)中得到的近似分量做SVD變換,可得到4×4的對(duì)角矩陣S。
3)利用對(duì)角矩陣S的第一個(gè)元素S(1,1)計(jì)算x(i),計(jì)算方法如下
4)利用x(i)構(gòu)造二值水印密鑰,構(gòu)造方法如下
5)令i=i+1。
6)若i≤N1×N2,則重復(fù)1)-5),此時(shí)可得到二值水印密鑰k={k1,k2,...,kN1×N2}。
(4)生成注冊(cè)機(jī)構(gòu)的偽水印:W′=xor(W,k)。
將實(shí)際水印信息W與水印密鑰k進(jìn)行異或運(yùn)算,可得到偽水印W′,將其保存在第三方注冊(cè)機(jī)構(gòu)的水印數(shù)據(jù)庫(kù)中。
基于DWT-SVD的水印檢測(cè)方法如下:
(1)水印音頻分段:將水印音頻Aw分成N1×N2個(gè)幀Bwi,每幀的長(zhǎng)度為1024樣點(diǎn)。
(2)DWT、SVD變換構(gòu)造二值密鑰:
令i=1
1)將幀Bwi轉(zhuǎn)化為32×32的矩陣,并對(duì)該矩陣進(jìn)行2級(jí)小波變換,
2)將1)中得到的近似分量做SVD變換,得到對(duì)角矩陣Sw。
3)利用對(duì)角矩陣的第一個(gè)值Sw(1,1)計(jì)算x′(i),計(jì)算方法如下
4)利用x′(i)構(gòu)造二值密鑰,構(gòu)造方法如下
5)令i=i+1。
6)若i≤N1×N2,則重復(fù)1)-5),此時(shí)可得到二值密鑰序列k′={k′1,k′2,...,k′N1×N2}。
(4)獲取水印信息:
W=xor(W′,k′)將W′與水印密鑰k′進(jìn)行異或運(yùn)算得到水印信息W。
(5)計(jì)算相關(guān)系數(shù)NC和誤碼率BER。
本實(shí)驗(yàn)采用兩類的二值圖像作為水印圖像。一類是字符圖像 “山”,大小為32×32(如圖1所示);一類是logo圖像 (如圖2所示)。音頻信號(hào)均選用wav格式,單聲道,采樣率為44100kHz,16bit編碼的音頻信號(hào)。為了有效驗(yàn)證本算法的透明性和魯棒性,實(shí)驗(yàn)選取了三類音頻文件人物對(duì)話、流行音樂和古典樂曲音頻。
對(duì)三類水印音頻文件分別實(shí)施常見攻擊,計(jì)算相似系數(shù)NC和誤碼率BER。相似系數(shù)NC和誤碼率BER是衡量水印魯棒性的兩個(gè)重要指標(biāo),計(jì)算公式分別如下所示
式中:W——原始水印,W′——偽水印,它們的大小為N1×N2。由公式知當(dāng)W=W′,NC=1,即NC的值越接近1,BER的參數(shù)值越接近0,表明算法的抵抗攻擊的能力越強(qiáng),魯棒性越好。
實(shí)驗(yàn) 所 用 常見攻擊:下 采 樣 (44100Hz-22100Hz-44100Hz);高斯噪聲,加載20dB的白噪聲;低通濾波,截至頻率為11025Hz;重量化,將16位音頻變?yōu)?位音頻,在重新量化為16位音頻;對(duì)音頻信號(hào)進(jìn)行比特率為32kbpsMP3壓縮;對(duì)音頻信號(hào)進(jìn)行比特率為64kbpsMP3壓縮;對(duì)音頻信號(hào)進(jìn)行比特率為128kbpsMP3壓縮;回聲,延遲50ms,音量:10%處理;翻轉(zhuǎn),音頻樣本振幅逆轉(zhuǎn)。
表1記錄了流行音樂攻擊檢測(cè)后的NC和BER參數(shù),其中NC和BER的平均值分別為0.9801和0.0232;表2記錄了古典樂曲攻擊檢測(cè)后的NC和BER參數(shù),其中NC和BER的平均值分別為0.9905和0.0113;表3記錄了人物對(duì)話攻擊檢測(cè)后的NC和BER參數(shù),其中NC和BER的平均值分別為0.9965和0.0032。對(duì)三類音頻進(jìn)行攻擊后相似系數(shù)的平均值大于0.98和誤碼率的平均值小于0.02。
圖3記錄了水印采用logo二值圖像,音頻采用如上人物對(duì)話攻擊檢測(cè)結(jié)果。檢測(cè)結(jié)果中f子圖和i子圖誤碼率相對(duì)較高,f子圖NC和BER分別為0.9964和0.0028;i子圖NC和BER分別為0.9925和0.0056;但比字符水印表1、表2、表3的實(shí)驗(yàn)結(jié)果優(yōu),表1低通濾波NC和BER分別為0.9 5 2 1和0.0 5 6 6?;芈暀z測(cè)NC和BER分別為0.8844和0.1338;表2低通濾波NC和BER分別為0.9728和0.0322?;芈暀z測(cè)NC和BER分別為0.9475和0.0628;表3低通濾波NC和BER分別為0.9869和0.0156。回聲檢測(cè)NC和BER分別為0.9821和0.0125。
?
?
對(duì)兩類二值水印進(jìn)行仿真檢測(cè),實(shí)驗(yàn)結(jié)果表明本算法具有較好的魯棒性。
表4記錄了本文算法和現(xiàn)有算法在加載常見水印音頻攻擊后的相似系數(shù)和誤碼率值。表中攻擊類型序列與常見攻擊說(shuō)明序列一致。
表4 不同算法魯棒性比較攻擊類型1 2 3 4 5本文 NC 1 0.999 0.987 1 1 BER 0 0.001 0.016 0 0[6] NC 0.981 0.999 0.824 0.998 0.999 BER 0.001 0.001 0.5 0.002 0.001[9] NC 1 1 1 0.97 0.99 BER— —[7] NC 0.981 0.975 0.925 0.996 0.922 BER 0.019 0.025 0.075 0.004 0.078
本文提出了一種新的基于音頻的零水印算法,該算法將離散小波變換和奇異值分解相結(jié)合,依據(jù)音頻自身特性構(gòu)造檢測(cè)密鑰,與二值數(shù)字水印結(jié)合生成相應(yīng)水印信息,打破了只有向音頻中嵌入水印才能實(shí)現(xiàn)版權(quán)保護(hù)功能的思想。仿真實(shí)驗(yàn)中對(duì)音頻實(shí)施了常規(guī)音頻處理攻擊,與現(xiàn)有零水印算法進(jìn)行比較發(fā)現(xiàn)本算法在音頻質(zhì)量不失真的前提下,具有比較理想的魯棒性,很好的緩解了數(shù)字水印透明性和魯棒性的矛盾,實(shí)現(xiàn)了音頻數(shù)字媒體的產(chǎn)權(quán)保護(hù)和認(rèn)證。
[1]Harumi Murata,Akio Ogihara,Motoi Iwata,et al.Multiple embedding for time-domain audio watermarking based on lowfrequency amplitude modification[C]//The 23rd International Technical Conference on Circuits/Systems,Computers and Communications,20081461-1464.
[2]Pranab Kumar Dhar,Mohammad Ibrahim Khan,Kim Jong-Myon.A new audio watermarking system using discrete Fourier transform for copyright protection[J].International Journal of Computer Science and Network Security,2010,6 (10):35-40.
[3]Yang Yu,Lei Min,Liu Huaqun,et al.A novel robust zerowatermarking scheme based on discrete wavelet transform[J].Journal of Multimedia,2012,7 (4):303-308.
[4]SONG W,HOU J J,LI Z H,et al.A novel zero-bit watermarking algorithm based on logistic chaotic system and singular value decomposition[J].Acta Physica Sinica,2009,58 (7):4449-4456.
[5]YE Tianyu,MA Zhaofeng,NIU Xinxin,et al.A zero-watermark technology with strong robustness[J].Journal of Beijing University of Posts and Telecommunications,2010,33 (3):126-129(in Chinese).[葉天語(yǔ),馬兆豐,鈕心忻,等.強(qiáng)魯棒零水印技術(shù)[J].北京郵電大學(xué)學(xué)報(bào),2010,33 (3):126-129.]
[6]Chen Ning,Zhu Jie.A robust zero-watermarking algorithm for audio[J].EURASIP Journal on Advances in Signal Processing,2008 (2008):103-110
[7]ZHONG Xi,TANG Xianghong.A dwt domain zero-watermark algorithm based on audio’s character[J].Journal of Hangzhou Dianzi University.2007,29 (2):33-36 (in Chinese).[鐘西,唐向宏.基于音頻特征的小波域零水印算法[J].杭州電子科技大學(xué)學(xué)報(bào),2007,29 (2):33-36.]
[8]AlI A H.Digital audio watermarking based on the discrete wavelets transform and singular value decomposition[J].European Journal of Scientific Research,2010,39 (1):6-21.
[9]TAN L,WU B,LIU Z,et al.An audio information on hiding algorithm with high capacity which based on chaotic and wavelet transform[J].Acta Electronic Sinica,2010,38 (8):1812-1818.
[10]Bhat K,Vivekananda,Indranil Sengupta,et al.An adaptive audio watermarking based on the singular value decomposition in the wavelet domain[J].Digital Signal Processing,2010,20 (6):1547-1558.
[11]CHEN Yinqiu,WU Xiangsheng.A blind watermarking based on SVD-DWT[J].Journal of Natural Science of Hunan Normal Uniersity,2009,32 (1):47-55 (in Chinese).[陳寅秋,伍祥生.基于SVD-DWT的音頻盲水印.湖南師范大學(xué)自然科學(xué)學(xué)報(bào),2009,32 (1):47-55.]
[12]NIU Xinxin.Information hiding and digital watermarking[M].Beijing:Beijing University of Posts and Telecommunications Press,2004:64 (in Chinese).[鈕心忻.信息隱藏與數(shù)字水印[M].北京:北京郵電大學(xué)出版社,2004:64.]