柏玉保,柏 森,暴晉飛,尤春艷
(重慶通信學(xué)院,重慶 400035)
隨著計算機(jī)網(wǎng)絡(luò)通信技術(shù)的發(fā)展,人們借助計算機(jī)、數(shù)字掃描儀等電子設(shè)備可以方便、迅速地將數(shù)字信息傳輸?shù)剿谕哪康牡?。然而,?dāng)人們享受網(wǎng)絡(luò)技術(shù)帶來的便利的同時,不得不面對隨之而來的負(fù)面影響。例如,盜版者通過簡單的操作就可以獲得與正版一樣的復(fù)制品,并以此獲取暴利。近年來,音頻水印發(fā)展非常迅速,音頻數(shù)據(jù)的版權(quán)保護(hù)也顯得越來越重要。通過在音頻載體中嵌入水印,可以實現(xiàn)盜版確認(rèn)、使用跟蹤等功能。以音頻為載體的經(jīng)典的信息隱藏算法基本可以分為兩類:時域算法和變換域算法。時域算法的主要代表有LSB算法[1]、相位編碼[2]和回聲隱藏[3],這些算法比較簡單,但是魯棒性差,但也有一些算法具有很好的魯棒性(如時域能量算法[4]等).目前研究的方向主要集中在DFT變換域[5]、離散余弦變換 DCT[6-7]、離散小波變換 DWT[8]及其他正交域。DWT是信號處理中一種非常有力的工具,它是一種信號的時間-頻率分析方法,在時域、頻域內(nèi)都具有表征信號局部特性的能力,具有良好的魯棒特性等。參考文獻(xiàn)[8]提出了一種基于小波變換的語音信息隱藏算法,算法是對語音分段,在各段小波變換的高頻系數(shù)中嵌入密文信息,獲得了很好的隱藏效果。DCT域信息隱藏算法計算量比較小,現(xiàn)在研究得比較多。參考文獻(xiàn)[7]就是利用人耳聽覺的頻率掩蔽效應(yīng)分析了DCT系數(shù)的聽覺容差,發(fā)現(xiàn)直流系數(shù)具有最大的聽覺容差。通過改變DCT直流系數(shù)來嵌入水印,魯棒性和不可感知性都達(dá)到很好的平衡。而參考文獻(xiàn)[9]提出了一種基于DCT和DWT域的音頻信息隱藏算法。該算法充分利用了離散小波變換的多分辨率特性和離散余弦變換的能量壓縮能力,具有很好的魯棒性。參考文獻(xiàn)[10]充分利用了DCT和DWT的優(yōu)點(diǎn),提出1種混合域盲水印算法,具有很好的魯棒性。參考文獻(xiàn)[11]則根據(jù)人耳聽覺的頻率掩蔽效應(yīng),選擇對人耳聽覺不敏感的頻帶所對應(yīng)的小波系數(shù),將小波系數(shù)分段進(jìn)行離散余弦變換,將水印嵌入到DCT直流系數(shù)上,都具有非常好的不可感知性和強(qiáng)魯棒性。
本研究結(jié)合了DCT和DWT域的算法,將數(shù)字水印隱藏到另一個載體音頻中。在實現(xiàn)時,首先對載體音頻進(jìn)行小波變換,獲取低頻小波系數(shù),然后適當(dāng)分段并進(jìn)行離散余弦變換得到直流系數(shù),將得到的直流系數(shù)按順序組合成一組向量,對其選取適當(dāng)?shù)拈L度進(jìn)行分段,最后根據(jù)其統(tǒng)計特征嵌入水印[12]。實驗結(jié)果表明,該算法不可感知性良好,與參考文獻(xiàn)[9-11]的混合域算法相比,本文算法魯棒性有了較大提高。
假設(shè)載體語音為 X=(x1,x2,…,xL)。其中 L為載體音頻信號的采樣點(diǎn)數(shù),xi為第i個采樣點(diǎn)的幅度值。
(1)離散小波變換
用 “db2”小波對載體語音X進(jìn)行離散小波變換(DWT):[S,H]=DWT(X),其中 S 為低頻分量,記為 S=(s1,s2,…,sk),k 為低頻分量長度(低頻系數(shù)的個數(shù))。 對低頻分量 S進(jìn)行分段,每段長度為 N,得到 S1,S2,…,SM,如下:
其中,M為分段數(shù)且M≤?k/N」,Si為第i段低頻系數(shù)。
(2)離散余弦變換
對 S1,S2,… ,SM分別進(jìn)行DCT變換 :Di=DCT(Si)為第 i段低頻系數(shù) DCT變換后的系數(shù),且 Di=(di(1),di(2),…,di(N))。提取每段的直流系數(shù)組成向量 C,記為C=(d1(1),d2(1),…,dM(1))。 將 C 進(jìn)行分段,每段長度取 T(不足的用零補(bǔ)齊),記為
其中,n=「M/T ?,「·?表示向上取整。在本文中,T 的取值范圍對算法的魯棒性很重要,實驗表明“T=10”時效果比較好。
(3)采用統(tǒng)計特征的方法嵌入水印
用種子“seed”產(chǎn)生一段二進(jìn)制偽隨機(jī)序列作為水印信息 , 記為 W={m(i)|i=1,2, … , 「M/T?}, 其中 m(i)∈{0,1},表示序列的第 i個值。
在本文中,根據(jù)參考文獻(xiàn)[12],找到一種對攻擊不敏感的統(tǒng)計特征,該特征值就是通過計算上述每段直流系數(shù)向量Ri求得的平均值。實驗表明,該統(tǒng)計特征值對一般的信號處理(如低通濾波、加噪聲、重量化、重采樣等)具有穩(wěn)健性。
根據(jù)如下步驟修改每段直流系數(shù)向量Ri進(jìn)行水印信息的嵌入。
②如果 W(i)=1,則
如果 W(i)=0,則
其中,Δ表示嵌入強(qiáng)度系數(shù),該值越大,提取水印魯棒性越強(qiáng),但衡量不可感知性的信噪比越弱,反之則相反。
(4)反離散余弦變換
將嵌入水印后的DCT直流系數(shù)段逐個和未改變的其他DCT系數(shù)按照原始順序合并,進(jìn)行反離散余弦變換,得到新的DCT系數(shù)。
(5)反離散小波變換
利用新得到的DCT系數(shù)進(jìn)行反離散小波變換,對信號進(jìn)行重構(gòu),得到含有水印的音頻信號。
由于水印嵌入過程中使用了統(tǒng)計特征的方法,所以在信息提取時不需要原始載體語音信號,屬于盲提取算法。提取過程如下:
(1)離散小波變換。使用“db2”小波基對待檢測語音信號序列整體進(jìn)行小波變換,并提取低頻小波系數(shù),對其按嵌入時的長度值進(jìn)行分段。
(2)離散余弦變換。對每段低頻小波系數(shù)進(jìn)行DCT變換,提取其各段的直流系數(shù),并按順序組合成向量,同樣對其按嵌入時的適當(dāng)長度值進(jìn)行分段。
(3)水印提取。計算各段直流系數(shù)的均值。如果該段的均值大于“0”,則提取出 bit為“1”;而該段的均值小于“0”,則提取出 bit為“0”。
(4)將從各個分段中提取的水印信息按順序進(jìn)行合并,得到完整的水印信息。
為了消除主觀因素的影響,采用歸一化相關(guān)系數(shù)對提取的水印和原始水印進(jìn)行客觀評價,歸一化相關(guān)系數(shù)定義為:
在實驗中,以一段長度為 16 s,抽樣速率為 8 kHz,位速為128 Kb/s,16位量化的語音信號為公開信息,在該段語音中嵌入水印,采用種子“seed”產(chǎn)生一段二進(jìn)制偽隨機(jī)序列作為水印信息,根據(jù)上述算法,在低頻小波系數(shù)分段階段,取N=64,小波基為“db2”;對直流系數(shù)組成的向量,取T=10,嵌入強(qiáng)度系數(shù)Δ=3.5。
圖1是原始文件和嵌入水印的音頻文件時域波形圖,從波形圖上可以看到,兩者相似性很高。利用主觀評價方法測試算法的隱蔽性,事先不告知參與測試人哪個是原始音頻哪個是水印音頻,將水印音頻和原始音頻播放給5個人聽,一致辨別不出兩者有何區(qū)別;用歸一化相關(guān)系數(shù)和信噪比對音頻文件進(jìn)行客觀評價,歸一化相關(guān)系數(shù)如公式(4)所示。
圖1 原始音頻與含有水印音頻時域圖形
信噪比公式為:
其中 ,x(n)為原始音頻 ,x′(n)為嵌入水印后的音頻。通過計算,嵌入水印信息前后音頻文件的整體信噪比為21.779 8 dB,相關(guān)系數(shù)為0.996 7。這說明該算法無論在主觀和客觀上都具有很好的不可感知性。
為了檢驗水印的魯棒性,對音頻水印文件做以下信號處理。
(1)低通濾波。低通濾波器為長度為9階、截止頻率為1.5 kHz的巴特沃思低通濾波器。
(2)加高斯白噪聲。均值 u=0,均方差σ=0.01。
(3)回響。將原始信號的延時拷貝疊加到原始信號之上,延時時間為400 ms,延時信號幅度為原始信號10%。
(4)重采樣。將音頻文件用6 kHz重采樣,再重新用8 kHz重新采樣恢復(fù)成原始音頻。
(5)MP3壓縮。將含水印音頻壓縮為MP3文件,然后恢復(fù)成與原始音頻格式相同的音頻。
(6)重量化。將含水印音頻從16 bit量化為 8 bit,再重新量化為16 bit。
(7)同步攻擊:在含有水印音頻中隨機(jī)選取若干個采樣點(diǎn),然后進(jìn)行裁剪。裁剪的樣點(diǎn)個數(shù)分別是100、300、500個;在原始音頻中每 0.05 s分別連續(xù)刪除 1、2、3個點(diǎn),共分別刪除 100、300、498個采樣點(diǎn)。
(8)時域線性壓縮。用Cool Edit Pro 2.0軟件將含密音頻壓縮1%,即從16 s線性縮短到15.98 s。
(9)時域線性延伸。用Cool Edit Pro 2.0軟件將含密音頻延伸1%,即從16 s線性延伸到16.02 s。
(10)音調(diào)改變。不改變信號速度而改變音調(diào)頻率。用Cool Edit Pro 2.0軟件將含密音頻進(jìn)行音調(diào)的改變,分別將音調(diào)增加為原始音調(diào)頻率的102%(Ritio=102%)和減少為原始音頻頻率的98%(Ritio=98%)。
(11)DA/AD轉(zhuǎn)換。利用Winamp音樂播放器播放原始音頻,利用Windows自帶的錄音機(jī)通過線路輸出方式進(jìn)行錄音。
根據(jù)歸一化相關(guān)系數(shù)定義分別計算各種攻擊下提取水印的相關(guān)系數(shù),結(jié)果如表1所示。
表1 魯棒性攻擊檢測結(jié)果及算法比較
本文提出的基于離散小波變換(DWT)和離散余弦變換(DCT)的混合域音頻信息隱藏算法,首先使用小波將音頻文件整體進(jìn)行分解,選擇對聽覺不敏感和抗噪抗低通的低頻小波系數(shù)部分作為嵌入頻帶;然后適當(dāng)分段并進(jìn)行離散余弦變換得到直流系數(shù),將得到的直流系數(shù)組合成一組向量,對其選取適當(dāng)?shù)拈L度進(jìn)行分段,最后根據(jù)其統(tǒng)計特征來嵌入水印,充分利用了整個音頻文件的冗余空間,使魯棒性和不可感知性達(dá)到了比較好的平衡。能抵抗噪聲、低通濾波、重采樣、重量化、回聲、MP3壓縮、樣點(diǎn)裁剪、時間伸長和壓縮等的攻擊,特別是在抗樣點(diǎn)裁剪、時域線性伸長與壓縮、音調(diào)改變攻擊方面,相似度都達(dá)到0.9以上,幾乎能完全正確提取水印,表現(xiàn)出了非常強(qiáng)的魯棒性。從實驗結(jié)果來看,本文所提算法與參考文獻(xiàn)[10,11]提出的混合域水印算法相比,魯棒性有了比較明顯的提高。另外水印文件的不可感知性也比較好,這樣就使魯棒性和不可感知性達(dá)到了比較好的平衡。
然而這種信息隱藏算法的缺點(diǎn)在于:一是不能抵抗同步攻擊以及D/A、A/D轉(zhuǎn)換操作方面比較弱;二是算法的信息容量小。這是下一步算法研究改進(jìn)的重點(diǎn)。
[1]COOPERMAN M,MOSKOWITZ S.Steganographic method and device[M].USA: Patent, 1997.
[2]BENDER W,GRUHL D,MORIMOTO N,et al.Techniques for data hiding[J].IBM System Journal, 1996, 35: 313-336.
[3]GRUHL D,BENDER W,LU A.Echo hiding[C].Proceedings of the 1 st International Workshop on Information Hiding.[S.1.]: Springer, 1996: 295-315.
[4]WEN Nung Lie,LI Chun Chang.Robust and high-quality time-domain audio watermarking based on low-frequency amplitude modification[J].IEEE Transactions on Multimedia,2006, 8(1): 46-59.
[5]SEOK Jong Won,HONG Jin Woo,KIM Jin Woong.A novel audio watermarking algorithm for copyright protection of digital audio[J].ETRI Journal, 2002, 24(3): 181-189.
[6]馬翼平,韓紀(jì)慶.DCT域音頻水印:嵌入對策和算法[J].電子學(xué)報,2006,34(7):1260-1264.
[7]由守杰,柏森,曹巍巍.魯棒的DCT域音頻盲水印算法[J].重慶郵電大學(xué)學(xué)報(自然科學(xué)版),2008,20(2):206-211.
[8]何琴,鄒華興,白劍.基于小波變換的語音信息隱藏算法[J].計算機(jī)應(yīng)用研究,2005,22(12):118-119.
[9]王先春,郭杰榮,胡惟文,等.基于 DCT和 DWT域的音頻信息隱藏算法[J].計算機(jī)工程與設(shè)計,2008,29(16):4389-4391.
[10]王向紅,趙紅,崔永瑞.一種新的混合域自適應(yīng)數(shù)字音頻水印算法[J].小型微型計算機(jī)系統(tǒng),2006,27(2):316-319.
[11]由守杰,柏森,曾輝.魯棒的混合域音頻信息隱藏算法[J].計算機(jī)技術(shù)與發(fā)展,2008,18(3):169-172.
[12]LI Wei, XUE Xiang Yang, LI Xiao Qiang, et al.A novel feature-based robust audio watermarking for copyright protection[C].Proceedings of the International Conference on Information Technology: Computers and Communications(ITCC’03)2003 IEEE, 2003.