馬曉紅, 趙琳琳
(大連理工大學信息與通信工程學院,遼寧大連 116024)
隨著網(wǎng)絡規(guī)模的不斷擴大和數(shù)字化技術(shù)的不斷成熟,數(shù)字多媒體產(chǎn)品得到了廣泛應用.以MP3為代表的音樂制品變得更易傳播,從而促進了信息的共享,并進一步推動了數(shù)字音樂作品的發(fā)展.與此同時,對版權(quán)保護也提出了新的挑戰(zhàn).由于數(shù)字音頻信息極易被無限制地任意編輯、復制與散布,如何有效地保護版權(quán)及發(fā)行公司的合法權(quán)益成為人們?nèi)找骊P(guān)注的問題.傳統(tǒng)加密技術(shù)只能提供小范圍的保護,且具有安全性不足和流通性較差等弱點.數(shù)字音頻水印技術(shù)通過將代表作者信息的圖像、簽名或者是作品的序列號等信息嵌入到音樂制品中,實現(xiàn)了版權(quán)保護的目的[1 、2].
現(xiàn)有的數(shù)字音頻水印方法大致可以分為時域方法和變換域方法兩大類.前者通過修改宿主音頻信號的時域采樣值而嵌入水印,典型的有最低有效位(LSB)法[3]和回聲掩蔽法[4]等.該類方法一般具有可嵌入水印容量較小、抗攻擊能力較差等弱點.變換域方法通過修改宿主音頻信號的變換域系數(shù)進行水印嵌入,常用的變換有離散傅里葉變換(DFT)[5]、離散余弦變換(DCT)和離散小波變換(DW T)等[6].該類方法具有水印能量可以分布至所有音頻樣本,能夠充分利用人類聽覺特性,且與數(shù)據(jù)壓縮標準兼容等優(yōu)點,因而具有良好的魯棒性,已經(jīng)成為研究與應用的熱點.小波提升法[7、8]由Sweldens等提出,該方法不依賴于傅里葉變換,可以直接在時空域中完成小波變換,具有算法簡單、計算速度快等優(yōu)良特性,在數(shù)字水印領域得到了廣泛應用[9].
本文給出一種基于QR分解和提升小波變換的魯棒音頻水印方法.該方法將原始宿主音頻信號升維后進行QR分解,對其R分量第一行進行提升小波變換,得到待嵌入的小波系數(shù),利用線性瞬時混合模型將其與待嵌入的水印信號進行混合,得到隱秘音頻信號.水印提取時,利用獨立分量分析算法提取嵌入水印信號,獲得嵌入水印信號的估計,經(jīng)過后處理即可獲得水印圖像.
QR分解[10]是一種線性代數(shù)工具.任意一個矩陣A∈Rm×n(m≥n)的QR分解可以表示為
其中R1為對角元大于零的上三角矩陣,Q為正交矩陣.由于cond2(A)=cond2(R),即矩陣A和矩陣R的2-條件數(shù)相等,QR分解具有數(shù)值穩(wěn)定性.
提升小波變換[11]的基本思想是基于歐幾里德算法,將小波變換分解成提升的形式,并通過對每一步提升所產(chǎn)生的浮點數(shù)取整,實現(xiàn)整型變換.小波提升過程如圖1所示,它包括分裂(split)、預測(p redict)和更新(update)3個步驟.圖1中S表示分裂,P表示預測,U表示更新.
圖1 小波提升過程Fig.1 The w avelet lifting procedure
盲源分離用于解決在源向量和混合矩陣均為未知的情況下,從觀測向量中恢復出每個相互獨立的源向量的問題.假設有N個獨立的源信號s1,s2,…,sN和M個由這些源信號混合而成的觀測信號x1,x2,…,xM(M≥N),盲源分離線性瞬時混合模型可以由下式表示:
式中:s=(s1s2 …sN)T,為源信號向量;x=(x1x2 …xM)T,為觀測信號向量;A為混合矩陣.
信號經(jīng)過變換后,使不同信號分量之間的相依性最小化,這種方法稱為獨立分量分析[12]算法,它是解決盲源分離問題的一種比較成熟的方法.
基于QR分解和提升小波變換的魯棒音頻水印方法嵌入原理框圖如圖2所示.它由嵌入水印信號生成、小波系數(shù)選取和水印信號的嵌入3個模塊組成.
圖2 水印嵌入原理框圖Fig.2 The block diagram of w atermark embedding
為了保護原始二值水印圖像的安全,本文采用混沌序列[13]對其進行擴頻處理.
混沌現(xiàn)象是在非線性動力系統(tǒng)中出現(xiàn)的確定性的和類似隨機的過程,這種過程既非周期又不收斂.一類非常簡單卻被廣泛研究的動力系統(tǒng)是Logistic映射,其定義如下:
式中:μ為控制參數(shù);c0為初值.當混沌映射參數(shù)滿足3.5699456<μ≤4時,該映射工作于混沌狀態(tài).混沌序列具有對參數(shù)c0和μ敏感的特點.
設原始二值水印圖像為W′={w′(m,n),0≤m≤M-1,0≤n≤N-1},其中w′(m,n)表示圖像中第m行、第n列像素的灰度值,M和N分別為水印圖像的行數(shù)和列數(shù).嵌入水印信號的生成過程如下:首先,將原始水印圖像降維成一維序列,并將其元素的值映射為{1,-1}序列;然后,利用式(3)生成一個與該序列等長的混沌序列,以0.5為閾值將其映射為一個{1,-1}序列;對降維后的圖像序列利用擴頻技術(shù)進行加密處理,即可生成待嵌入的水印信號W={w(k),0≤k≤M×N-1}.生成混沌序列的初值作為秘鑰K1保留.
考慮到QR分解具有良好的穩(wěn)定性,本文將原始宿主音頻信號升維后進行QR分解,根據(jù)R分量是上三角矩陣且第一行為非零元素的特點,選定R分量的第一行,對其進行提升小波變換,得到了待嵌入的小波系數(shù),利用線性瞬時混合模型進行水印嵌入.具體過程如下:
首先,將一維原始宿主音頻信號X′={x′(n),0≤n≤L-1}升維為二維信號X,即.其次,對X進行QR分解,即X=QR,其中Q是正交矩陣,R是上三角矩陣,選擇R的第一行元素作為s,即s={R(1,j),0≤j≤M×N-1}.最后,對s進行提升小波變換,得到待嵌入水印的小波系數(shù).
將選定的小波系數(shù)s和待嵌入的水印信號W利用線性瞬時混合方法進行水印嵌入,嵌入過程如下式所示:
其中A為滿秩的混合矩陣,為了保證隱秘音頻信號的透明性,其元素應滿足條件a11a12,a21
a22.將第一路信號S1進行提升小波重構(gòu)和QR重構(gòu),并進行降維操作,獲得最終的隱秘音頻信號.另一路信號S2作為秘鑰K2保留,以便進行水印信號提取.
這里之所以選擇線性瞬時混合方法進行水印的嵌入,主要原因在于:不借助于秘鑰K2的幫助,由隱秘音頻信號是無法獲得水印信號的,因為這屬于盲源分離問題中的欠定分離情況,因此本文的水印方案具有很強的安全性.但是,該種嵌印方法也存在一個問題,即需要保留的密鑰數(shù)據(jù)量較大,不利于密鑰的管理.可以將密鑰升維成二維矩陣,通過對其進行奇異值分解,達到減少密鑰數(shù)據(jù)量的目的.
水印提取過程是水印嵌入的逆過程,其原理框圖如圖3所示.
圖3 水印提取原理框圖Fig.3 The b lock diagram of w atermark ex tracting
對待檢測的隱秘音頻信號升維后進行QR分解,對R矩陣的第一行元素進行提升小波變換,將獲得的小波系數(shù)和密鑰K2作為兩路源信號,利用FastICA算法[14]對其進行分離,獲得兩路信號S′1和S′2,分別計算它們的四階統(tǒng)計量值,值較小的一路信號即為分離出的水印信號w′.將w′中的每一個元素以零為閾值進行二值化處理,獲得由-1和1構(gòu)成的序列,利用密鑰K1對其進行混沌逆映射,進而轉(zhuǎn)換為由0和255構(gòu)成的二值序列,升維后即可得到提取出的水印圖像W={w(m,n),0≤m≤M-1,0≤n≤N-1}.
為了驗證本文方法的有效性,分別選取語音信號、流行音樂、經(jīng)典音樂和爵士樂等作為宿主信號.下面以語音信號作為宿主信號為例,給出相應的實驗結(jié)果.
宿主信號為一段采樣率為8 kHz,長度為65536點的語音信號,實驗中使用的各個參數(shù)值設置如下:M=N=32,a11=0.97,a12=0.03,a21=0.92,a22=0.08.
宿主語音信號和隱秘語音信號的時域波形圖分別如圖4(a)和(b)所示.由圖4可以看出,二者在波形上幾乎沒有任何差別;聽音測試也表明,二者在聽覺質(zhì)量上幾乎沒有任何差別,表現(xiàn)出了良好的透明性.
圖4 語音信號時域波形圖Fig.4 The time domain w aveform of speech signal
圖5(a)為原始二值水印圖像,圖5(b)和(c)分別表示在密鑰正確和錯誤(誤差為1%)情況下提取出的水印圖像.
由圖5(c)可以看出,即使密鑰發(fā)生微小變化,也不能正確提取出水印圖像,因此水印圖像的安全性可以由密鑰信息來保證.
圖5 安全性測試Fig.5 The security testing
圖6給出了隱秘語音信號在經(jīng)過諸如MP3、剪切、上采樣、下采樣、添加高斯白噪聲、低通濾波、高通濾波等各種信號處理操作后提取出的水印圖像.
由圖6(a)和(b)可以看出,本文方法可以有效地抵抗MP3攻擊,并具有較好的抗剪切攻擊能力;對比圖6(c)和(d)可知,下采樣攻擊比上采樣攻擊對魯棒水印的影響大;由圖6(f)和(g)可知,高通濾波比低通濾波對魯棒水印造成的影響大;由圖6(e)可知,添加20 dB的高斯白噪聲,會引起魯棒水印輕微的降質(zhì).
圖6 隱秘信號經(jīng)過常規(guī)信號處理攻擊后提取出的水印圖像Fig.6 Extracted watermark images from w atermarked signa l under common signal p rocessing attacks
本文給出了一種基于QR分解和提升小波變換的魯棒數(shù)字音頻水印方法.該方法充分利用了QR分解的穩(wěn)定性,以及提升小波變換的快速性等良好特性.采用線性瞬時混合方法實現(xiàn)了水印的嵌入,利用FastICA算法實現(xiàn)了水印的盲提取.實驗結(jié)果表明,該方法具有良好的安全性、透明性和魯棒性.
[1]全笑梅,張鴻賓.基于小波包域聽覺感知分析的統(tǒng)計音頻水印算法[J].電子學報,2007,35(4):673-678
[2]LIE W N,CHANG L C.Robust and high-quality time-domain audio w atermarking based on low-frequency amplitude modification [J].IEEE Transactions on Mu ltimedia,2006,8(1):46-59
[3]CERZON M A,GRAVEN PG.A high rate buried data channel for audio CD[J].Journal of Audio Engineering Society,1995,43(1-2):3-22
[4]K IM H J,CHOI Y H.A novel echo-hiding scheme w ith backw ard and forward kernels[J].IEEE Transactions on Circuits and Systems for Video Technology,2003,13(8):885-889
[5]LU C S,LIAO H Y M,CHEN L H.Mu ltipurpose audio watermarking [C] // IEEE International Con ference on Pattern Recognition.W ashington D C:IEEE Computer Society,2000:282-285
[6]WANG X Y,ZHAO H.A nove l synch ronization invariant audio watermarking scheme based on DW T and DCT [J].IEEE Transactions on Signal Processing,2006,54(12):4835-4840
[7]CLAYPOOLE R L,DAV ISG M,SWELDENSW,etal.Nonlinear wavelet transforms for image coding via lifting [J].IEEE Transactions on Image Processing,2003,12(12):1449-1459
[8]CALDERBANK A R, DAUBECH IES I,SWELDENSW,etal.Lossless image compression using integer to integer wavelet transform s[C]//International Conference on Image Processing.W ashington D C:IEEE Signal Processing Society,1997:596-599
[9]王讓定,徐達文.基于提升小波的多重數(shù)字音頻水印[J].電子與信息學報,2006,28(10):1820-1826
[10]施吉林,張宏偉,金光日.計算機科學計算[M].北京:高等教育出版社,2005:33-36
[11]SALOMON D.數(shù)據(jù)壓縮原理與應用[M].吳樂南,等譯.北京:電子工業(yè)出版社,2003:393-395
[12]COMON P.Independent component analysis:a new concept[J].Signa l Processing,1994,36(3):287-314
[13]張志明,王 磊.基于混沌加密的DCT域圖像水印算法[J].計算機工程,2003,29(17):9-10
[14]HYVARINEN A.Fast and robust fixed-point algorithm s for independent component analysis[J].IEEE Transactions on Neural Networks, 1999,10(3):626-634