蔡詠梅
(新疆財經(jīng)大學 計算機科學與工程學院,新疆 烏魯木齊830012)
數(shù)字水印技術(shù)可以實現(xiàn)數(shù)字媒體的版權(quán)保護問題,然而大多都進行的是圖像數(shù)字水印研究,且算法成熟。胡青等[1]提出了一種基于小波變換和奇異值分解的水印算法,算法將水印信息量化后嵌入原始圖像小波低頻子帶分塊奇異值分解后的奇異向量中,水印提取無需原始圖像,可在密鑰和量化閾值控制下實現(xiàn)水印的盲提取。該算法含水印圖像透明性和魯棒性強,尤其對JPEG 壓縮具有優(yōu)異的魯棒性。葉天語[2]提出了DWT-SVD 域全盲自嵌入魯棒量化水印算法。該算法先對原始圖像進行DWT 變換,將變換后低頻子帶分成互不重疊的子塊,對每個子塊進行SVD,判斷相鄰子塊最大奇異值的大小關(guān)系產(chǎn)生自嵌入特征水印序列,然后將自嵌入特征水印序列奇偶量化嵌入原始圖像小波低頻子帶每個子塊的最大奇異值,最后進行SVD 合成和DWT 逆變換產(chǎn)生含水印圖像。
與靜止圖像水印技術(shù)相比,數(shù)字音頻水印具有更大的挑戰(zhàn)性。目前,數(shù)字音頻水印技術(shù)的研究也進一步推進。音頻數(shù)字水印算法 一 般 分 時 域[3,4]和 頻 域[5,6]兩 種,因 在 時域中嵌入水印,魯棒性較差,所以對音頻水印的研究大都集中在變換域,尤其以離散小波變換 (DWT)居多[7]。陳寅秋等[7]提出了一種基于SVD 和DWT 的音頻盲水印算法,將原始音頻數(shù)據(jù)進行小波變換,提取低頻分量進行奇異值分解,將置亂加密處理的水印圖像,嵌入到奇異值中,實現(xiàn)水印的嵌入過程。利用圖像置亂和奇異值分解方法,提高了水印的不可感知性,另外在水印的檢測與提取過程中不再需要原始載體數(shù)據(jù),是音頻盲水印,實驗中未提及MP3壓縮,回聲攻擊。雷敏等[8]提出了基于DWT-DCTSVD 的音頻盲水印算法,該算法也首先對原始音頻分段,對每一段音頻進行二級小波變換,將近似分量進行余弦變換后進行奇異值分解,將二值水印圖像降維嵌入奇異值矩陣中,算法的魯棒性和透明性較好,實驗中未提及回聲攻擊。
冗余小波變換[9,10]較離散小波變換嵌入容量更大,魯棒性更強,但目前國內(nèi)外對RDWT 在音頻水印中的研究較少。
本文將冗余小波變換引進音頻水印處理,結(jié)合離散余弦變換和奇異值分解特性提出了基于RDWT-DCT-SVD 的音頻盲水印算法,并對該算法進行了仿真實驗,實驗結(jié)果表明,該算法的透明性較好,對于重采樣、低通濾波、MP3壓縮、重量化、回聲、替換攻擊具有很強的魯棒性。
RDWT 冗余離散小波變換可以看作是連續(xù)小波變換的一種近似,是一種非正交的小波變換主要特性:
(1)冗余性,信號經(jīng)冗余離散小波變換時信號本身不進行下抽樣處理,而是在每兩個濾波器系數(shù)間插入零值來實現(xiàn)濾波器的延展,因此,信號變換后的逼近信號和細節(jié)信號長度都與原信號長度相同,所以增加水印嵌入容量。
圖1 2級RDWT 和DWT 分解比較
(2)平移不變性,冗余離散小波變換各級分解中保持固定的采樣率,因此具有空間平移不變特性,魯棒性更強。
DCT 作為一種實數(shù)域變換,其變換核為實數(shù)的余弦函數(shù),主要特性:
(1)DCT 是一種正交變換,相對FFT 變換而言DCT變換后不產(chǎn)生虛部,便于水印的嵌入和強度控制。
(2)對音頻信號進行小的干擾,DCT 的變換系數(shù)將不會發(fā)生大的變化,抗攻擊能力增強。
(3)能量保持與集中,DCT 變換前后音頻信號總能量保持不變。DCT 變換對能量重新分配,信號的大部分能量集中在少量低頻系數(shù)中。
SVD 是線性代數(shù)中非常有用的工具,能將矩陣對角化。它具有如下特性:
(1)任何一個實矩陣都可以進行奇異值分解,分解成兩個正交矩陣和一個對角矩陣的乘積。
(2)矩陣的奇異值發(fā)生較小調(diào)整時,逆變換后原矩陣不會發(fā)生較大改變。
(3)魯棒性好,當矩陣發(fā)生較小變化時,經(jīng)奇異值分解后的奇異值不會發(fā)生太大變化,對常規(guī)音頻信號的攻擊處理S矩陣具有較好的穩(wěn)定性。
RDWT-DCT-SVD音頻盲水印算法的思路是:首先對載體音頻進行分段,對每一段音頻進行二級RDWT 變換,將RDWT 變換后的逼近分量進行一維DCT 變換,再將DCT 變換后的系數(shù)轉(zhuǎn)化為方陣,同時對此方陣進行SVD 變換,得對角矩陣,水印圖像降維后嵌入相應(yīng)對角矩陣。
本算法選用二值水印圖像,載體音頻文件是一維的,為了將水印圖像成功嵌入音頻載體中,需要先對水印圖像進行降維處理。水印圖像大小為N1×N2,水印圖像可以表示為W =Wi,j,0i<N,0j<N2,其中Wi,j∈ {0,1}??梢酝ㄟ^式 (1)完成降維操作
設(shè)原始音頻為A= {A1,A2,…,An},音頻水印嵌入方法如下:
(1)原始音頻分段:將分成N1×N2個幀,每幀的長度為1024樣點,保證選取的音頻長度大于1024 N1×N2。
(2)RDWT 變換:matlab函數(shù)庫中沒有直接可調(diào)用的RDWT函數(shù),需要編寫。調(diào)用編譯成功的mrdwt函數(shù):[Al,Ah,L]=mrdwt(Ai,h,L)對每一段音頻信號進行二級RDWT變換,得到低頻逼近分量Al和高頻分量Ah。
(3)DCT 和SVD 變換:對RDWT 變換后的Al分量進行DCT 變換,利用vector2Matrix函數(shù)將變換后的前四分之一系數(shù)轉(zhuǎn)換成方陣,進行奇異值分解,得到對角矩陣S。
(4)嵌入水印圖像:取出每一個對角矩陣的第一個值進行判斷嵌入水印。
(5)SVD 逆變換,DCT 逆變換:將Sw逆變換后得到的Sw′轉(zhuǎn)換成一維向量,將一維向量進行DCT 逆變換,得A1w。
(6)RDWT 逆變換,matlab函數(shù)庫中沒有直接可調(diào)用的IRDWT 函數(shù),需要編寫。調(diào)用編譯成功的mirdwt函數(shù)[Aiw,L]=mirdwt(Alw,Ah,h,L)進行2級逆變換,得嵌入水印后的音頻分段。
(7)整合各音頻分段,得到嵌入水印的音頻文件Aw,輸出。
提取算法是嵌入算法的逆過程,提取步驟如下:
(1)嵌入水印音頻Aw 分段:將水印音頻分成N1×N2個幀,每幀的長度為1024樣點。
(2)RDWT 變換:調(diào)用mrdwt函數(shù)對每一段音頻信號進行二級RDWT 變換,得到低頻逼近分量和高頻分量。
(3)DCT和SVD變換:對RDWT變換后的低頻逼近分量進行DCT變換,利用vector2Matrix函數(shù)將變換后的前四分之一系數(shù)轉(zhuǎn)換成方陣,進行奇異值分解,得到對角矩陣。
(4)提取水印圖像:取出每一個對角矩陣的第一個值進行判斷提 取水印。接近偶數(shù)提取水印0信息,接近奇數(shù)提取水印1信息。對所有音頻分段進行水印信息提取,得到水印信息。
(5)計算相關(guān)系數(shù)NC 和誤碼率BER:將提取出來的水印信息進行vector2Matrix轉(zhuǎn)換,完成相關(guān)系數(shù)和誤碼率的計算。
本文采用大小為32×32的二值圖像作為水印圖像 (如圖2所示),音頻均選用常用wav格式,單聲道,采樣率為44100kHz,16bit編碼。為了有效驗證本算法的透明性和魯棒性,實驗選取了3類音頻文件人物對話、流行音樂和古典樂曲。
圖2 二值水印圖像
隱藏容量是評價水印性能的指標,即單位時間傳輸過程中所嵌入水印信息的比特數(shù)。本文音頻文件的采樣頻率是44100Hz,音頻分段后,每幀1024個采樣點,所以隱藏容量為44100/1024=43.07bps
為了檢測含水印音頻的透明性,可以將原始音頻和含水印音頻信號的波形圖進行比較。圖3-圖5分別為人物對話、古典樂曲、流行音樂原始音頻和嵌入水印后的音頻文件波形圖。單從人眼觀察3類原始音頻和水印音頻波形圖,沒有區(qū)別,這部分透明性的檢測我們通過MOS值和信噪比SNR 進行衡量,SNR 通過式 (2)計算可得。參數(shù)見表1
表1 模板圖像的性質(zhì)示例
主觀分析,MOS平均意見分大于4.5,客觀定量分析SNR 信噪比都大于20db。從實驗數(shù)據(jù)分析可知透明較好。
本文采用常見的歸一化相關(guān)系數(shù)NC 和誤碼率BER 對水印的魯棒性進行評價。NC 的計算式見式 (3),BER 的計算式見式 (4)
在魯棒性檢測實驗中,對加載水印的音頻進行如下攻擊,NC系數(shù)和BER 值見表2-表4。
(1)下采樣,44100Hz-22050Hz-44100Hz;
(2)高斯白噪聲,加載20dB的白噪聲;
(3)低通濾波,截至頻率為11025Hz;
(4)重量化,將16位音頻變?yōu)?位音頻,再重新量化為16位音頻;
(5)MP3 壓縮,分別對音頻信號進行比特率為32kbps、64kbps、128kbps MP3壓縮處理;
(6)回聲處理,分別對音頻信號進行延遲:延遲:0.05s,音量:10%處理;
(7)替換:隨機選取5段含水印的音頻,用添加高斯噪聲的相應(yīng)位音頻替換含水印音頻。
表2-表4給出了3種類型音頻信號加載水印攻擊后檢測出的相關(guān)系數(shù)和誤碼率。本文還進行了音頻樣點值20%Aw 的攻擊,3種類型音頻文件攻擊后的相關(guān)系數(shù)均為1,誤碼率為0。表2中對嵌入水印人物音頻對話進行攻擊平均誤碼率為0.0126,平均相似系數(shù)NC 為0.9882;表3中對嵌入水印古典樂曲進行攻擊平均誤碼率為0.0160,平均相似系數(shù)NC為0.9864;表4中對嵌入水印流行音樂進行攻擊平均誤碼率為0.0125,平均相似系數(shù)NC為0.9895;
表5列出了本文算法和現(xiàn)有算法在加載常見水印音頻攻擊后的誤碼率對照表。表中數(shù)據(jù)顯示該算法具有強魯棒性。
表5 不同算法攻擊后的魯棒性比較BER (%)
音頻數(shù)字水印研究中小波變換多用離散小波變換,本文嘗試將冗余離散小波變換引進音頻數(shù)字水印研究中,冗余離散小波變換可以看作是連續(xù)小波變換的近似,是非正交的小波變換。相對離散小波變換它嵌入水印信息的容量更大,魯棒性更強。本文提出的基于RDWT 變換與DCT變換、SVD 變換相結(jié)合的音頻盲水印算法透明性和魯棒性好,較好的解決了透明性和魯棒性統(tǒng)一的問題。仿真實驗結(jié)果表明,該算法對常規(guī)音頻攻擊具有較強的魯棒性,尤其是MP3壓縮、回聲和替換攻擊效果更佳。
[1]HU Qing,LONG Dongyang.Singular vector quantization watermarking scheme based on DWT-SVD [J].Computer Science,2011,38 (11):30-33 (in Chinese).[胡青,龍冬陽.基于DWT-SVD的奇異向量量化水印算法 [J].計算機科學,2011,38 (11):30-33.]
[2]YE Tianyu.Perfectly blind self-embedding robust quantizationbased watermarking scheme in DWT-SVD domain [J].Journal of Image and Graphics,2012,17 (6):644-650 (in Chinese).[葉天語.DWT-SVD 域全盲自嵌入魯棒量化水印算法 [J].中國圖象圖形學報,2012,17 (6):644-650.]
[3]Wen Nung Lie,Li Chun Chang.Robust and high-quality timedomain audio watermarking based on low-frequency amplitude modification [J].IEEE transactions on multimedia,2006,8(1):46-59.
[4]Harumi Murata,Akio Ogihara,Motoi Iwata,et al.Multiple embedding for time-domain audio watermarking based on lowfrequency amplitude modification [C]//The 23rd International Technical Conference on Circuits/Systems,Computers and Communications,2008:1461-1464.
[5]Pranab Kumar Dhar,Mohammad Ibrahim Khan,Jong-Myon Kim.A new audio watermarking system using discrete fourier transform for copyright protection [J].International Journal of Computer Science and Network Security,2010,10 (6):35-40.
[6]Kamalika Datta,Indranil Sengupta.A redundant audio watermarking technique using discrete wavelet transformation[C]//The Second International Conference on Communication Software and Networks,2010:27-31.
[7]CHEN Yinqiu,WU Xiangsheng.A blind watermarking based on SVD-DWT [J].Journal of Natural Science of Hunan Normal Uniersity,2009,32 (1):47-55 (in Chinese).[陳寅秋,伍祥生.基于SVD-DWT的音頻盲水印 [J].湖南師范大學自然科學學報,2009,32 (1):47-55.]
[8]LEI Min,YANG Yu.An audio blind watermarking schenm based on DWT-DCT-SVD [J].Journal of Beijing University of Posts and Telecommunication,2011,34 (S1):51-54 (in Chinese). [雷敏,楊榆.基于DWT-DCT-SVD 的音頻盲水印算法 [J].北京郵電大學學報,2011,34 (S1):51-54.]
[9]Nasrin M,Makbol Bee,Ee Khoo.Robust blind image watermarking scheme based on redundant discrete wavelet transform and singular value decomposition [J].International Journal of Electronics and Communications,2013,67 (2):102-112.
[10]Vatsa M,Singh R,Noore A.Feature based RDWT watermarking for multimodal biometric system [J].Image and Vision Computing,2009,27 (3):293-304.
[11]Xing s,kim hj,huang j,Audio watermarking robust against time-scale modification and mp3 compression [J].Signal Process,2008,88 (10):2372-2387.
[12]Zezula R,Misurec J.Audio digital watermarking algorithm based on SVD in MCLT domain [C]//Third International Conference on Systems,2008:140-143.
[13]Vivekananda B K,Indranil S,Abhijit D.An audio watermarking scheme using singular value decomposition and dithermodulation quantization [J].Multimedia Tools and Applications,2010,52 (2-3):369-383.