曹軍梅
(延安大學(xué) 計(jì)算中心,陜西 延安716000)
對(duì)數(shù)字作品進(jìn)行保護(hù)的傳統(tǒng)方法是密碼術(shù),但密碼術(shù)只能保護(hù)傳輸中的內(nèi)容或訪問控制,一旦被解密或被用戶訪問,被破解的音頻副本就可以被任意盜版和傳播,因而不能有效地判定用戶的合法性,必須結(jié)合新的技術(shù)對(duì)即使解密后的音頻產(chǎn)品進(jìn)行全程跟蹤。在這種背景下,能夠有效地實(shí)行版權(quán)保護(hù)的數(shù)字音頻水印技術(shù)應(yīng)運(yùn)而生。廣播數(shù)字化和網(wǎng)絡(luò)化的快速發(fā)展,特別是移動(dòng)流媒體業(yè)務(wù)和數(shù)字多媒體業(yè)務(wù)的應(yīng)用,推動(dòng)了數(shù)字音頻水印技術(shù)的快速發(fā)展,并得到初步應(yīng)用。
數(shù)字音頻水印就是在不影響原始音頻質(zhì)量的前提下向其中嵌入和提取數(shù)字水印的過程。水印與原始音頻數(shù)據(jù)緊密結(jié)合并隱藏在其中,通常是不可聽到的,而且能夠抵抗一般音頻信號(hào)處理和盜版者的某些惡意攻擊。
數(shù)字音頻水印系統(tǒng)主要由3部分組成:水印的生成、嵌入和提取或檢測(cè)。其中水印的嵌入是最重要的部分。
1)水印W的生成 典型的水印信號(hào)依賴于密鑰k、水印信息 Iw和原始數(shù)字音頻 V,即 W=fw(Iw,k,V),式中 fw是不可逆的[1],k常常起到對(duì)水印信息Iw進(jìn)行編碼和指定嵌入位置的作用。水印信號(hào)可以是二值序列、高斯噪聲序列、混沌序列或其它有意義的形式。
2)水印嵌入算法Ew的設(shè)計(jì) 嵌入過程的通式Vw=Ew(V,Iw,k),其中,Vw表示嵌入水印后的數(shù)字音頻,Ew為數(shù)字水印嵌入算法。Cox提出了3種水印嵌入公式:①v'i=vi+αwi;②v'i=vi(1+αwi);③v'i=vieαwi);其中:vi為原始音頻數(shù)據(jù),wi為水印數(shù)據(jù),a為嵌入強(qiáng)度因子,為數(shù)字或矩陣。①為線性嵌入,②③為非線性嵌入。水印信號(hào)通常嵌入在空域、變換域中。
3)水印檢測(cè)或提取算法Dw檢測(cè)水印的通式為:①有原始數(shù)字音頻 V時(shí):=Dw(Vw,V,k);②有原始數(shù)字水印 W 時(shí):=Dw(Vw,W,k);③沒有原始信息時(shí):=Dw(Vw,k);其中,表示提取的水印,Dw為數(shù)字水印提取算法,Vw表示含水印的數(shù)字音頻。
檢測(cè)水印的方法通常有兩種:一是有原水印,作嵌入信號(hào)的提取或相關(guān)性驗(yàn)證;二是盲檢測(cè),必須對(duì)嵌入信息作全搜索或分布假設(shè)檢驗(yàn)等。如果水印信號(hào)是隨機(jī)信號(hào)(偽隨機(jī)信號(hào)或二值圖像),證明檢測(cè)信號(hào)是水印信號(hào)一般采用歸一化相關(guān)系數(shù)NC作為評(píng)價(jià)標(biāo)準(zhǔn),通式為:
數(shù)字音頻水印技術(shù)包含的主要性能指標(biāo)[2]為:
1)可證明性 水印應(yīng)能為受保護(hù)的數(shù)字音頻作品的歸屬提供完全可靠的證據(jù)。
2)透明性 在音頻水印中,最重要的一點(diǎn)是數(shù)字水印的感知透明性,就是嵌入的水印不能明顯地改變聽覺效果,不被覺察。對(duì)于音頻信號(hào)而言,數(shù)字音頻水印就是一種額外的噪聲。往往以信噪比或峰值信噪比為指標(biāo)。設(shè)信噪比為RS,N,N為音頻數(shù)據(jù)段長度,vi為原始音頻采樣數(shù)據(jù),為嵌入水印后音頻采樣數(shù)據(jù),則:
3)魯棒性 在實(shí)際應(yīng)用中,數(shù)字音頻水印的魯棒性非常重要。這里所說的魯棒性是指水印不受包括疊加噪聲、有損壓縮、低通濾波、重新采樣、重新量化、比例縮放、數(shù)模和模數(shù)轉(zhuǎn)換等常用信號(hào)處理及幾何攻擊、解釋性攻擊、共謀攻擊的影響。同時(shí),音頻水印算法必須具備某種同步機(jī)制,以對(duì)抗時(shí)間域上的同步攻擊。
4)水印的數(shù)據(jù)率 水印引起的相對(duì)額外比特開銷必須足夠小。
5)低復(fù)雜性 水印算法應(yīng)該容易實(shí)現(xiàn),以方便其集成到一般電子產(chǎn)品中。
6)公開性 水印算法應(yīng)該公開,安全性最好依賴于密鑰而不是算法的秘密性。
數(shù)字水印技術(shù)涉及密碼學(xué)、通信、編碼理論、擴(kuò)頻、信號(hào)處理、數(shù)據(jù)壓縮、噪聲理論、視聽覺感知等理論,因此,水印算法也利用了這些學(xué)科的知識(shí)。常用的音頻水印算法有以下幾種。
時(shí)間域水印算法通過直接修改媒體的內(nèi)容以嵌入水印信息,它簡(jiǎn)單、易實(shí)現(xiàn),但魯棒性較差。時(shí)間域算法可通過LSB[3]、偽隨機(jī)置換、量化和抖動(dòng)、回聲數(shù)據(jù)隱藏等技術(shù)實(shí)現(xiàn)。
變換域水印算法魯棒性較高,具有較好的不可感知性,隱藏信息量也大,也能與壓縮標(biāo)準(zhǔn)有機(jī)結(jié)合。目前主要集中在DCT域、DWT域及其他正交域?;臼峭ㄟ^對(duì)原數(shù)據(jù)進(jìn)行變換,根據(jù)所嵌入的水印調(diào)整變換系數(shù),再用反變換映像到空域,接收方通過相應(yīng)的變換來恢復(fù)或檢測(cè)水印。王向陽等人提出了基于DCT與DWT域的自適應(yīng)水印算法[4],Solana公司則把數(shù)據(jù)植入到音頻信號(hào)的子帶,并開發(fā)了一個(gè)叫作EDNA的數(shù)字音頻標(biāo)記產(chǎn)品。
擴(kuò)頻域水印算法將擴(kuò)頻技術(shù)引入水印中,使得水印技術(shù)可以有著與密碼學(xué)類似的安全性。方法為將水印用偽隨機(jī)信號(hào)調(diào)制,加入到音頻信號(hào)或其變換域中。由于高頻區(qū)嵌入水印對(duì)透明性非常有利,但對(duì)魯棒性效果差;而低頻區(qū)嵌入水印對(duì)魯棒性有利,但感知效果卻無法接受。擴(kuò)頻技術(shù)可通過將一個(gè)能量信號(hào)嵌入到音頻每個(gè)頻帶[5]來緩解這些矛盾。
混沌序列易于產(chǎn)生、數(shù)量大、保密性好且自相關(guān)性強(qiáng)而互相關(guān)性弱,因此易于從其他信號(hào)或者干擾中分離出來,用作水印時(shí)具有較大的優(yōu)勢(shì)。其算法是:一維離散映射F:U~U,為一實(shí)值序列軌跡。 方程可表示為 Z(n+1)=F(Z(n),λ),Z(n)∈U,λ∈IR,n表示迭代次數(shù);λ為控制參數(shù)。混沌序列難以破譯,但在特定條件下混沌實(shí)值序列可由窮舉法逆推出來。實(shí)值序列二值化后丟失了部分信息,具有符合水印要求的不可逆性,幾乎不可破譯。
發(fā)送端可通過調(diào)整網(wǎng)絡(luò)的權(quán)重使水印逼近原始音頻信號(hào)的感知特性,在接收端也可用訓(xùn)練好的網(wǎng)絡(luò)提取水印[6]。利用三層前饋神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)非線性逼近能力的特點(diǎn),通過權(quán)重的調(diào)節(jié)就可以建立原始音頻采樣點(diǎn)與嵌入水印后音頻采樣點(diǎn)之間的對(duì)應(yīng)關(guān)系,該關(guān)系反映了數(shù)字水印的特征,因而可實(shí)現(xiàn)盲檢測(cè)。另外,還可以用遺傳算法對(duì)網(wǎng)絡(luò)的運(yùn)算速度、提取質(zhì)量進(jìn)行優(yōu)化。
根據(jù)上述對(duì)數(shù)字音頻水印技術(shù)的分析和目前廣播系統(tǒng)安全措施的不足,提出將音頻水印用于廣播系統(tǒng)安全管理,并通過仿真實(shí)驗(yàn)證明是可行的。
1)廣播信號(hào)源文件傳輸中的安全檢測(cè) 電臺(tái)文件傳輸系統(tǒng)的安全性主要包括:①音頻文件回傳系統(tǒng)的安全性,記者外出采訪的音頻文件,經(jīng)過回傳系統(tǒng)傳回電臺(tái),如果系統(tǒng)中管理信息或用戶登錄信息泄露,電臺(tái)就無法分清所傳的音頻文件本身是否由真正合法用戶提供,所以必須對(duì)音頻文件本身的合法性進(jìn)行驗(yàn)證。②電臺(tái)之間的音頻文件交換系統(tǒng)的安全性,全國電臺(tái)基本已實(shí)現(xiàn)前端數(shù)字化,各電臺(tái)之間音頻文件的直接交換越來越頻繁,如何保證電臺(tái)音頻文件交換系統(tǒng)數(shù)據(jù)本身的安全和版權(quán)問題,也是當(dāng)前關(guān)心的重要問題。數(shù)字音頻水印技術(shù)能夠很好地滿足上述要求,可以在傳送之前利用水印處理技術(shù)將所需要傳送的音頻文件嵌入水印,即添加用戶和節(jié)目標(biāo)識(shí)等,同時(shí)用私有密鑰加密水印。在接收方,對(duì)所收到的音頻文件首先利用公有密鑰進(jìn)行解密處理,驗(yàn)證用戶的合法性。由于在水印的添加過程中,已經(jīng)包含了節(jié)目標(biāo)識(shí),所以增加了版權(quán)的驗(yàn)證性。對(duì)于無法識(shí)別或提取不到水印的音頻文件,可以認(rèn)為是不合法文件,或者是文件受到了惡意破壞。由于LSB算法比較簡(jiǎn)單,對(duì)音頻的保真性也較好,同時(shí)其傳輸通道的性能較好,對(duì)水印的魯棒性要求很低,因此很適合用于文件傳輸系統(tǒng)。通過仿真實(shí)驗(yàn)證明,利用LSB的算法可實(shí)現(xiàn)音頻文件傳輸中的安全性。
2)廣播節(jié)目的版權(quán)認(rèn)證 廣播節(jié)目的監(jiān)測(cè)除了質(zhì)量監(jiān)測(cè)之外,還應(yīng)包含節(jié)目合法性監(jiān)測(cè)。合法監(jiān)測(cè)主要分為兩種,一種是異地代為發(fā)射的節(jié)目監(jiān)測(cè),這種監(jiān)測(cè)主要是防止異地插播自己本地的節(jié)目和廣告。另外一種是防止非法攻擊的監(jiān)測(cè),這種監(jiān)測(cè)主要是為了安全播出。不管是什么樣的監(jiān)測(cè),都是對(duì)節(jié)目進(jìn)行身份驗(yàn)證,確信接收到的信號(hào)是本臺(tái)實(shí)際傳送的信號(hào),而水印技術(shù)的最大特點(diǎn)就是進(jìn)行版權(quán)認(rèn)證,可以對(duì)音頻信號(hào)最前端——數(shù)字音頻文件添加魯棒性數(shù)字水印。在發(fā)射地或可接收地安裝數(shù)字水印接收檢測(cè)設(shè)備,可以很方便地檢測(cè)出這些水信息,以此來驗(yàn)證節(jié)目的合法性。由于在水印的嵌入和提取過程中均需要密鑰處理,對(duì)其他人而言,密鑰本身是保密的,所以即使知道水印的嵌入算法,對(duì)音頻水印而言也是絕對(duì)安全的。由于DCT域算法可有效地與HAS結(jié)合,也兼容國際數(shù)據(jù)壓縮標(biāo)準(zhǔn),還能夠保證水印的魯棒性和透明性,同時(shí)計(jì)算復(fù)雜性也較低。通過仿真實(shí)驗(yàn)證明,利用基于HAS的DCT水印算法可實(shí)現(xiàn)音頻文件的版權(quán)認(rèn)證。
3)節(jié)目播出的監(jiān)視 在廣播電臺(tái)做廣告的廠商,想監(jiān)視某個(gè)廣播頻道是否按時(shí)播出了他們的廣告,廣播節(jié)目等內(nèi)容,生產(chǎn)商想知道廣播電臺(tái)播出自己作品的時(shí)間和次數(shù)是否超過了允許的次數(shù)限制,在每條廣告或每個(gè)廣播節(jié)目的音頻中嵌入數(shù)字音頻水印,即將每條廣告或每個(gè)廣播節(jié)目音頻文件在制作完成后嵌入包含用戶、廣告廠商識(shí)別號(hào)或廣播節(jié)目生產(chǎn)商標(biāo)識(shí)的數(shù)字水印,這些水印隨著廣告或廣播節(jié)目一起播出和發(fā)射,廠商或生產(chǎn)商利用水印監(jiān)視功能系統(tǒng)(軟件或硬件)就可以準(zhǔn)確監(jiān)視自己作品播出的次數(shù)、時(shí)間等。這種方法還可以用于電臺(tái)內(nèi)部廣告部門的監(jiān)測(cè)和統(tǒng)計(jì),同時(shí)也是對(duì)播出部門的有效監(jiān)督。由于,擴(kuò)頻水印具有非常好的魯棒性,能夠抵抗傳輸過程中的信道噪音、濾波、重取樣、有損壓縮編碼、D/A或A/D轉(zhuǎn)換等多種信號(hào)處理。通過仿真實(shí)驗(yàn)證明,利用擴(kuò)頻水印算法可以監(jiān)視廣播節(jié)目播出的時(shí)間及次數(shù)。
在分析和探討了數(shù)字音頻水印技術(shù)的基礎(chǔ)上,提出將數(shù)字音頻水印技術(shù)應(yīng)用于廣播系統(tǒng)安全管理,并通過仿真實(shí)驗(yàn)證明了該思路的可行性。就目前來說,音頻數(shù)字水印在廣播電視領(lǐng)域的應(yīng)用還不多見。但隨著廣播系統(tǒng)數(shù)字化的進(jìn)一步深入,這一新技術(shù)的應(yīng)用前景將是十分樂觀的。
[1]Craver S,Memon N,Yeo B L,et al.Resolving rightful ownerships with invisible watermarking techniques:limitations,attacks and implications[J].IEEE Journal on Selected Areas in Communications,1998 (4):573-586.
[2]ARNOLD M.Audio watermarking;features,applications and algorithms[C]//IEEE International Conference on Multimedia and Expo(ICME),2000:1013-1016.
[3]Bassia P,Pitas I,Nikolaidis N,et al.Robust audio watermarking in the time domain.[J]IEEE Transactions on Multimedia,2001,3(2):232-241.
[4]王向陽,楊紅穎,趙紅.一種新的自適應(yīng)數(shù)字音頻水印算法[J].計(jì)算機(jī)工程,2005,31(7):133-135.
WANG Xiang-yang,YANG Hong-ying,ZHAO-Hong.A new adaptive digital audio watermarking algorithm[J]Computer Engineering,2005,31(7):133-135.
[5]Kirovski D,Malvar H.Robust spread-spectrum audio watermarking[C]//Salt Lake City:IEEE International Conference on Acoustics,Speech,and Signal Processing,2001 (3):1345-1348.
[6]曹軍梅.數(shù)字水印技術(shù)分析及其在電視領(lǐng)域的應(yīng)用[J].電子設(shè)計(jì)工程,2009,17(6):78-80。
CAO Jun-mei.Analysis of digital watermarking technology and its application in television field[J].Electronic Design Engineering,2009,17(6):78-80.