滕曉宇,桂小林,戴慧珺,李宗育,王志通,李發(fā)兵
(1.西安交通大學(xué)電子與信息工程學(xué)院,710049,西安;2.西安交通大學(xué)陜西省計算機網(wǎng)絡(luò)重點實驗室,710049,西安;3.本鋼集團有限公司,117000,遼寧本溪)
信號處理技術(shù)的普及使得多媒體作品的復(fù)制、篡改操作變得極為容易和隱蔽[1],此類問題在音頻信號中尤為嚴(yán)重。數(shù)字水印技術(shù)作為多媒體安全研究的一個分支[2],以其隱蔽性高、安全性好等優(yōu)點,已經(jīng)成為解決此類問題較為簡單和通用的方法之一。
音頻數(shù)字水印按照嵌入方式分為嵌入式水印與零水印。嵌入式水印以犧牲水印信息嵌入量與音頻質(zhì)量為代價,通過更改原始音頻的時域或頻域信息來嵌入水印[3-4]。零水印算法根據(jù)音頻信號的特征向量構(gòu)造水印,并不向原始音頻信號中添加任何信息,即對音頻信號零更改,因而能夠較好地處理數(shù)字水印的透明性與魯棒性之間的關(guān)系[5-7]。
目前,針對音頻的零水印算法已有不少研究成果,大致可以分為以下3類:①單純型,該類方法根據(jù)單一的音頻信號特征如倒譜系數(shù)、小波域特征、短時能量、過零率等直接構(gòu)造水印[8-9],具有良好的時間特性,但構(gòu)造算法易被破解;②多特征混合型,該類方法結(jié)合信號特征與信號處理方法構(gòu)造音頻水印[10-13],提高了水印的魯棒性但增加了構(gòu)造算法的復(fù)雜度,而且并未考慮到水印信息的安全性;③雙水印算法,該類方法將以上2種零水印構(gòu)造結(jié)果相融合,得到最終的水印信息[14-15],在一定程度上降低了暴力破解水印信息的概率,但不能確保一定會增強水印信息的魯棒性,而且同時增大了算法復(fù)雜度。
綜上所述,現(xiàn)有的音頻零水印算法雖然能滿足一般情況下對音頻零水印的需求,但仍舊存在以下不足:①高性能的數(shù)字音頻水印算法總是以犧牲算法復(fù)雜度為代價的;②由于未考慮音頻信號中每幀信息含量的差異性,導(dǎo)致算法運行過程中存在大量冗余工作;③不能保證水印信息的唯一性;④忽略了水印信息的安全性,即可通過構(gòu)造出的水印信息破解水印構(gòu)造算法。
為此,本文在分析總結(jié)現(xiàn)有的音頻零水印的基礎(chǔ)上,從安全性的角度提出了一種針對水印信息的攻擊模型,并以此為基準(zhǔn)設(shè)計了一種基于亂序局部感知哈希的音頻零水印方案。
分析重構(gòu)攻擊模型定義在音頻零水印領(lǐng)域,是以水印信息安全性為出發(fā)點的一種特殊的攻擊,具體表現(xiàn)為當(dāng)發(fā)生水印信息泄漏時,只需通過分析泄漏的水印信息,即可得知構(gòu)造水印的元素及方法,從而重構(gòu)水印算法。分析重構(gòu)攻擊模型實質(zhì)上是水印構(gòu)造的逆推導(dǎo)過程。
該種攻擊的危害主要表現(xiàn)為以下2點:①在微觀上,分析重構(gòu)出水印信息的過程中同時破解了水印的構(gòu)造算法,攻擊者可以根據(jù)水印構(gòu)造算法在不更改版權(quán)信息的情況下篡改、復(fù)制原始音頻;②在宏觀上,版權(quán)判定中將無法判定版權(quán)信息,致使通過水印判定版權(quán)的算法失效,甚至導(dǎo)致整個版權(quán)保護系統(tǒng)癱瘓。
分析重構(gòu)攻擊的特點可分為以下4類:①水印信息與原始音頻信號的基本特征相似度極高,該種情況大多出現(xiàn)在單純型水印構(gòu)造算法中,例如水印信息與在某閾值下的短時平均能量一致;②水印信息與經(jīng)過多種信號處理的原始音頻特征相似,例如水印信息與經(jīng)過小波分解的短時能量相似;③水印信息與音頻信號的組合特征比較相似,該種方式常見于多特征混合型零水印構(gòu)造算法;④結(jié)合多種處理方式,處理通過多種音頻信號特征生成的特征向量,該種情況較前3種具有較好的抗分析重構(gòu)性。
設(shè)ω={ω1,ω2,…,ωn}表示音頻信號的n類處理方式,v={v1,v2,…,vm}表示音頻信號的m類特征,則上述4種分析重構(gòu)類型中的最小時間復(fù)雜度為O(1),最大時間復(fù)雜度為O(m!n!)。由于常見的信號處理方式與數(shù)字音頻特征是可窮舉的,也就是說可以暴力破解水印構(gòu)造方法。
本文涉及的不同符號及其含義如表1所示。
表1 符號對照表
音頻零水印方案分成零水印構(gòu)造與零水印檢測2個部分:零水印構(gòu)造是根據(jù)音頻信號的特征向量構(gòu)造水印;零水印檢測是當(dāng)發(fā)生版權(quán)糾紛時,對待檢測的音頻進行水印的二次構(gòu)造,將構(gòu)造的結(jié)果與原始音頻的水印通過相似度檢測等手段,判斷并確定版權(quán)的歸屬。
由于離散小波變換具有多尺度與多分辨率的特性[5],能由粗及細(xì)地逐步分析信號特征,將其應(yīng)用到音頻零水印中,能保證水印具有良好的魯棒性。局部敏感哈希[16-18]的原理是原始相似度較高的兩個向量,經(jīng)過哈希轉(zhuǎn)換之后仍舊具有很高的相似度,而本身不相似的兩個向量,經(jīng)過哈希轉(zhuǎn)換之后同樣不相似。將其應(yīng)用到音頻零水印中,能在保證水印結(jié)果的準(zhǔn)確性的同時增強水印信息的安全性。鏈表在數(shù)據(jù)置換過程中可以起到記錄置換順序,即保序的作用,應(yīng)用到音頻零水印構(gòu)造過程中可以使水印信息達(dá)到更好的抗分析重構(gòu)性以及唯一性。因此,本文結(jié)合音頻信號的小波特征與局部敏感哈希以及鏈表,設(shè)計并實現(xiàn)了一種亂序局部敏感哈希的音頻零水印方案。
本文提出的零水印方案分為零水印構(gòu)造模型與零水印檢測模型。零水印構(gòu)造模型主要分為3個部分:第1部分為音頻信號預(yù)處理過程,通過對音頻信號進行預(yù)加重、補幀以及去靜音幀等操作,完成音頻幀的篩選,從根源上降低音頻幀的處理數(shù)量,從而達(dá)到降低水印構(gòu)造算法復(fù)雜度的目的;第2部分為水印的構(gòu)造過程,通過音頻信號的小波分解得到特征向量V,根據(jù)局部感知哈希族函數(shù)H將向量進行映射,最后借助鏈表將哈希變換所得的值進行置亂,從而得到構(gòu)造的水印信息Z,在該部分中,為保證水印信息的唯一性,本文利用鏈表將哈希映射結(jié)果進行置亂,以達(dá)到降低水印碰撞性的目的;第3部分為水印圖像構(gòu)造,引入水印圖像的目的是使得后續(xù)水印檢測結(jié)果更加清晰,該部分借助圖像置亂算法將原始圖像進行置亂,并與第2部分所構(gòu)造的水印信息相結(jié)合,得到水印圖像T。本文提出的音頻零水印構(gòu)造模型如圖1所示。
圖1 零水印構(gòu)造模型
預(yù)處理部分在改進現(xiàn)有的通用分幀模型的基礎(chǔ)上提出了去靜音幀模型,其目的為根據(jù)音頻信號基本特征去掉信號中靜音幀及信息含量較低的部分。令max為取數(shù)值集合的最大值操作,min為取數(shù)值集合的最小值操作,mean為取數(shù)值集合的平均值,S為振幅F的方差,E為音頻信號短時平均能量,SF為歸一化方差,En為歸一化短時能量,Zn為SF與En之比,則篩選過程中涉及到的計算式有
(1)
(2)
(3)
由以上分析以及式(1)~(3),可得去靜音幀模型如圖2所示。
圖2 去靜音幀模型
水印圖像構(gòu)造階段主要分為圖像二值化、Arnold圖像置亂[19]以及水印圖像與水印信息結(jié)合共3個部分,其模型如圖3所示。
圖3 水印圖像構(gòu)造模型
與零水印構(gòu)造模型相對應(yīng)的是零水印檢測模型,檢測模型同樣主要分為3個部分:第1部分為水印的二次構(gòu)造,該部分是對待檢測的音頻片段W1進行水印構(gòu)造,構(gòu)造過程中應(yīng)用到的構(gòu)造算法與水印構(gòu)造過程中設(shè)計的算法相同(構(gòu)造過程如圖1所示),因此該過程為水印二次構(gòu)造;第2部分為相似度計算與相似度比對,前者是針對水印信息Z與Z1,后者是針對水印圖像T與T1;第3部分是版權(quán)判定,根據(jù)第2部分的結(jié)果判定版權(quán)的最終歸屬。音頻零水印的檢測模型如圖4所示。
圖4 音頻零水印檢測模型
在零水印檢測過程中,需要對水印圖像進行相似度比對,主體為原始圖像、存檔的水印圖像T以及經(jīng)過水印二次構(gòu)造所得到的待檢測音頻特征向量V1,主要理論依據(jù)為兩次異或等于原始數(shù)值這一邏輯關(guān)系,具體處理過程如圖5所示。
圖5 水印圖像比對
由圖1與圖5可以看出,實現(xiàn)音頻零水印方案的關(guān)鍵模塊主要由分幀、去靜音幀、特征向量生成、亂序局部敏感哈希水印生成、水印圖像構(gòu)造等組成。
預(yù)處理部分主要完成音頻信號濾波、預(yù)加重、分幀、去靜音幀等操作,其中濾波與預(yù)加重等前期處理技術(shù)的研究已較為成熟,此處不再贅述。
對于分幀算法,文獻(xiàn)[20]給出了一種0填補分幀方法,該方法提取特征向量時不會影響端點幀的判斷。但是,本文設(shè)計的零水印構(gòu)造算法是基于能量值相關(guān)的基礎(chǔ)運算,現(xiàn)有的分幀方法需改進后方可適用,改進后的音頻分幀算法如下:先計算音頻段總長度L對于幀長I的余數(shù)K,判斷K與0的關(guān)系;然后統(tǒng)計第1幀與最后1幀中0的數(shù)目,分別用N1與N2表示;再根據(jù)N1與N2的大小關(guān)系進行0填充,最終得到分幀后的語音幀集合NW。本文設(shè)計的分幀算法pro-enframe的偽代碼如下,文獻(xiàn)[20]的原始分幀算法在本文設(shè)計的算法中以“分幀操作”字樣體現(xiàn)。
PROC pro-enframe(L,I,N1,N2,NW)
INPUT:音頻段長度L,分幀長度I
OUTPUT:分幀后音頻集合NW
BEGIN
K←L%I;/*取余運算*/
IF (K=0) THEN 分幀操作,得NW;
/*統(tǒng)計采樣點數(shù)目*/
Fori←0 ToI-1 DO
【IFN[i]=0 THENN1=N1+1;】
Fori←L-I-1 ToL-1 DO
【IFN[i]=0 THENN2=N2+1;】
IF(N1≥N2) THEN
音頻最前補幀并分幀操作;
ELSE音頻最后補幀并分幀操作;
END
該模塊主要完成零水印構(gòu)造中特征向量的生成,簡化了文獻(xiàn)[21]關(guān)于小波能量的算法,過程為:首先對音頻進行小波變換得數(shù)組D1[1,…,n]、D2[1,…,n]、D3[1,…,n];然后取3個數(shù)組中的最大元素作為特征值寫入數(shù)組V[1,…,n]中。本文設(shè)計的特征向量生成算法get-vec的偽代碼如下。
PROC get-vec (NW,D1,D2,D3,V)
INPUT:音頻信號幀集合NW
OUTPUT:特征向量V
BEGIN
D1,D2,D3←NW/*小波變換*/
Fori←0 ToI-1 DO
【V[i]←MAX(D1[i],D2[i],D3[i])】
END
該模塊主要由4部分組成。第1部分為哈希映射選擇哈希函數(shù)族H,此處每一個哈希函數(shù)就是一個簡單的閾值函數(shù),在對原有特征向量進行降維的同時對數(shù)據(jù)進行二值化,閾值函數(shù)采用動態(tài)選取方式,根據(jù)數(shù)據(jù)的平均值并結(jié)合隨機數(shù)函數(shù)進行構(gòu)造。第2部分為局部敏感哈希映射,將每一個特征向量經(jīng)過哈希映射后的結(jié)果組成數(shù)組A。由于每一個感知哈希函數(shù)hn都對應(yīng)著一個桶Tn,每個桶都可以用一個一維數(shù)組表示,為方便后續(xù)水印圖像處理,數(shù)組長度應(yīng)與圖像數(shù)組行(或列)相等。第3部分為提高水印信息的抗分析重構(gòu)性,對映射數(shù)組A進行縱向置亂,并由鏈表list1記錄數(shù)組A中每個向量的首元素在A1中位置。第4部分為置亂映射數(shù)組,根據(jù)第3部分的方法,將數(shù)組A1橫向置亂,并由鏈表list2記錄每維元素的位置。本文設(shè)計的亂序局部敏感哈希水印生成算法ZL-W的偽代碼如下。
PROC ZL-W (V,H,A,A1,list1 list2)
INPUT:音頻特征向量V
OUTPUT:水印信息Z
BEGIN
Step1:選擇哈希函數(shù)族H;
/*進行局部感知哈希函數(shù)映射,得數(shù)組A*/
/*縱向置亂數(shù)組A得A1,鏈表list1記錄*/
/*橫向置亂數(shù)組A1得A2,鏈表list2記錄*/
Step5:輸出水印信息Z
END
哈希函數(shù)族H生成時,閾值函數(shù)是依據(jù)待處理數(shù)據(jù)的平均值來進行選取的。文獻(xiàn)[22]表明,閾值選取過程中均值居多,但均值不能較好地滿足多峰值信號要求,因此需要引入縮放因子?;谝陨戏治?本文選取的閾值函數(shù)的變化范圍為
(4)
鏈表list1與list2的作用是輔助置亂與記錄原始順序。借鑒文獻(xiàn)[23]中的方法,用Di表示第i維特征向量。圖6是零水印構(gòu)造中的縱向置亂示意圖。
圖6 零水印構(gòu)造中的縱向置亂示意圖
從圖6可以看出:根據(jù)鏈表結(jié)構(gòu)可以將特征向量置亂,原始水印特征向量的順序應(yīng)為D1、D2、D3,經(jīng)過置亂之后變成D3、D1、D2,而且置亂為無規(guī)律置亂,因此在一定程度上增強了水印信息的抗分析重構(gòu)性。
設(shè)數(shù)組A1[]、B[1,…,m][1,…,n]、C[1,…,m][1,…,n]、鏈表list1分別存儲首元素所在位置、置亂前特征向量、置亂后特征向量、縱向置亂順序。本文設(shè)計的縱向置亂算法Ra_Z的偽碼如下。
PROC Ra_Z(A1,B,C,list1)
INPUT:置亂前的數(shù)據(jù)B
OUTPUT:置亂后的數(shù)據(jù)C,鏈表list1,首元素存儲數(shù)組A1
BEGIN
h←d-1;
/*生成d個不同的隨機數(shù)*/
Fori←oTod-1 Do 【NL[i]←i;】
While (h!=0)
【V3←Random(0,h);
/*在0~h之間隨機生成1個整數(shù)*/
g←NL[h];NL[h]←V;NL[V3]←g;
/*交換數(shù)據(jù)*/h←h-1;】
/*根據(jù)隨機數(shù)置亂特征值,并由list1記錄*/
p←0;/*用于指示數(shù)組值*/
A1←NL[1];
Fori←0 Ton-1 Do
【W(wǎng)L←NL[i];/*取出隨機數(shù)值*/
C[][i]←B[][p];
list1.data←p;
list1.link←N[i+1];p←p+1;】
END
該模塊主要完成零水印構(gòu)造過程中水印圖像的構(gòu)造,由圖3水印圖像構(gòu)造模型以及文獻(xiàn)[17]圖像置亂算法組成,水印信息構(gòu)造以幀為單位,水印圖像的選取是與幀數(shù)相對應(yīng),以便構(gòu)造水印圖像。設(shè)Y為原始圖像,r為圖像置亂的階數(shù),Z為水印信息,t為置亂后的圖像,T為最終得到的水印圖像,本文設(shè)計的水印圖像構(gòu)造算法Water-P的偽代碼如下。
PROC Water-P (Y,r,Z,t,T)
INPUT:原始圖像Y,置亂階數(shù)r,水印信息Z
OUTPUT:水印圖像T
BEGIN
/*對原始圖像二值化處理,得到圖像Y2*/
T←tXORZ;
/*將水印信Z與圖像t進行按位異或操作*/
輸出水印圖像T;
END
由于本文提出的音頻零水印方案是針對抗分析重構(gòu)攻擊的,因此方案的分析驗證應(yīng)分為自身可行性驗證分析以及與其他方案對比分析共2個部分,前者側(cè)重于驗證,后者側(cè)重于對比分析。
本文的實驗數(shù)據(jù)主要分為音頻數(shù)據(jù)和水印圖像數(shù)據(jù)2個部分。音頻數(shù)據(jù)分為語音數(shù)據(jù)與音樂數(shù)據(jù),語音數(shù)據(jù)部分采用的是麻省理工大學(xué)的公開數(shù)據(jù)庫TIMIT、以漢語普通話形式錄制的男女聲發(fā)音“0~9”、連續(xù)語音“西安交通大學(xué)電子與信息工程學(xué)院”,而音樂數(shù)據(jù)主要選用中國古典民族器樂片段。
為增強版權(quán)判定結(jié)果的可閱讀性與直觀性,本文引入水印圖像,由于單純的黑體字樣圖像不能很好地體現(xiàn)細(xì)微的圖像變化,因此本文在水印圖像的選取階段同時采用印有西安交通大學(xué)?;盏膱D像和印有“西安交大”黑體字樣的圖像作為原始水印圖像,二值化后的水印圖像以及3階置亂后的效果圖如圖7所示。
(a)?;斩祱D像 (b)校徽圖置亂效果圖 (c)黑體字的二值圖像 (d)黑體字圖置亂效果圖圖7 二值水印圖像及置亂效果圖
篩選方案的分析和驗證從不可感知性、可行性、有效性等方面展開。
3.2.1 水印的不可感知性 水印是否被感知是指嵌入水印信息前后的音頻段是否發(fā)生改變,以及這種改變能否被人耳感知。本文采用零水印方式,從音頻信號中提取特征用以構(gòu)造水印,并未向原始音頻信號中添加任何信息,即對原始音頻信號零改變。圖8為采用本文提出的音頻水印方案嵌入水印前后的時域波形對比,從圖中可以看出,嵌入水印前后信號的差值恒為0,即嵌入水印前后信號完全相同,因此本文方案具有良好的不可感知性。
3.2.2 去靜音幀算法有效性驗證 為了驗證去靜音幀算法的有效性,本文選取連續(xù)語音“西安交通大學(xué)電子與信息工程學(xué)院”作為驗證對象,此處音頻幀的幀長q=256,篩選閾值為-0.35,篩選效果如圖9所示。
(a)原始音頻信號的時域波形
(b)嵌入水印后信號的時域波形
(c)嵌入水印前后信號的差值圖8 嵌入水印前后的音頻時域波形對比
(a)原始音頻時域波形
(b)去靜音幀算法執(zhí)行后的音頻能量圖9 去靜音幀算法的效果驗證
由于圖9a時域波形較為密集,因此僅選出2個具有代表性的區(qū)域,對去靜音幀效果進行說明。圖9b中①②區(qū)域?qū)?yīng)圖9a中靜音或者帶有部分噪聲的區(qū)域①②,可以看出,在圖9a中區(qū)域①②所對應(yīng)的時域波形幾乎聚集在0附近,即所對應(yīng)的數(shù)據(jù)幀為靜音幀或者信息含量低,所以對應(yīng)在圖9b①②中為0。因此,本文的去靜音幀算法是有效的并且合理的。
3.2.3 零水印構(gòu)造方案驗證 以連續(xù)女聲發(fā)音“西安交通大學(xué)電子與信息工程學(xué)院”為驗證用例來驗證零水印構(gòu)造方案是否可以有效執(zhí)行,水印構(gòu)造前后效果具體如圖10所示。
(d)水印圖像2 (e)存檔圖像2 (f)二次構(gòu)造的水印圖像2圖10 水印構(gòu)造前后效果圖
(a)水印圖像1 (b)水印圖像2圖11 加入強背景音樂后二次構(gòu)造的水印圖像
根據(jù)本文提出的零水印構(gòu)造方案可知,在待檢測語音的特征向量與原始語音的特征向量相似度較高的情況下,可以完全恢復(fù)無噪聲水印圖像。從圖10b、10c與圖10e、10f可以看出,從待檢測音頻可還原清晰可見的原始水印圖像。當(dāng)加入強背景音樂后,二次構(gòu)造的水印圖像如圖11所示,可以看出,2幅水印圖像幾乎已經(jīng)無法辨別?;张c黑體漢字。因此,本文所提出的音頻水印方案是可行的。
為了進一步驗證本文提出的音頻零水印方案的有效性,從可行性、魯棒性與抗分析重構(gòu)性這幾個方面與相關(guān)研究進行對比分析。
3.3.1 抗分析重構(gòu)性 文獻(xiàn)[1]是基于特征的雙水印,采用混沌方式將水印圖像進行置亂,使得水印信息無法從圖像中讀出,但未對水印特征向量采取保護措施,一旦秘鑰泄漏,水印圖像以及水印信息將被成功解密。本文與其設(shè)計思路不同,通過置亂水印特征信息來增強抗分析重構(gòu)性。
設(shè)m為音頻信號特征的種類數(shù)量,n表示處理方式種類數(shù),R表示需要構(gòu)造特征矩陣的行數(shù)與列數(shù),并且n 從表2可以看出,本文提出的亂序局部敏感哈希零水印方案的抗分析重構(gòu)性明顯高于文獻(xiàn)[5,8-9]的算法,具有良好的抗分析重構(gòu)性。 3.3.2 魯棒性 為方便對比分析,采用歸一化相關(guān)系數(shù)CN作為算法魯棒性的評價指標(biāo),計算公式為 (5) 式中:L1表示水印每維向量的大小;L2表示水印向量的維數(shù)。L1×L2即為水印信息的大小。CN越大表示魯棒性越好。 本文從抗噪聲攻擊、抗MP3壓縮攻擊、抗多種比例裁剪攻擊這3方面進行方案魯棒性的分析比對。 (1)抗高斯噪聲攻擊。對原始音頻信號分別添加均值為、標(biāo)準(zhǔn)方差為0.000 3與均值為、標(biāo)準(zhǔn)方差為0.000 5的高斯白噪聲,并分別與文獻(xiàn)[1](嵌入水印)、文獻(xiàn)[5]、文獻(xiàn)[24]進行比對分析,結(jié)果如表3所示。 表3 不同方案在不同攻擊強度下的魯棒性評價 由表3可知:本文提出的音頻零水印方案在2種攻擊強度下的CN明顯大于文獻(xiàn)[24]的結(jié)果,略大于文獻(xiàn)[1]的結(jié)果,由于本文與文獻(xiàn)[5]都采用了小波變換,因此在抗噪性方面與文獻(xiàn)[5]處于幾乎持平狀態(tài)。綜上可知,本文提出的零水印構(gòu)造方案有較好的抗噪聲攻擊性。 (2)抗MP3壓縮攻擊。MP3壓縮是指通過一定的速率將原始文件壓縮成較小的文件,在這個過程中,器樂相對于語音較為敏感。對原始器樂《鳳凰于飛》片段分別進行速率為96、128、160 kb/s的壓縮攻擊,并與文獻(xiàn)[5]和文獻(xiàn)[24]進行對比分析,結(jié)果如下:由于本文與文獻(xiàn)[5]、文獻(xiàn)[24]都涉及離散小波變化,所以在抗MP3壓縮攻擊上性能差異不大,CN幾乎持平;3種方案在不同的壓縮速率下,CN都能保持在0.9以上,都在壓縮速率為128 kb/s時達(dá)到最大值,此時CN≥0.98;由于壓縮速率為96 kb/s時采用的是低頻壓縮,原始器樂的高頻段的一部分丟失,水印構(gòu)造產(chǎn)生會受到影響,3種方案的抗MP3壓縮攻擊性都不太好。因此,本文所提出的音頻零水印構(gòu)造方案具有一定的抗MP3壓縮攻擊能力。 (3)抗剪裁攻擊??辜舨霉羰侵笇⒃家纛l的部分信息裁剪掉后,仍可以進行版權(quán)判定,是水印信息魯棒性的一個重要體現(xiàn)。選取漢語連續(xù)語音“西安交通大學(xué)電子與信息工程學(xué)院”以及單音男女發(fā)音“0~9”進行剪裁攻擊實驗,并與文獻(xiàn)[1]、文獻(xiàn)[5]、文獻(xiàn)[24]進行對比。 剪裁攻擊選取的幀數(shù)為 (6) 攻擊中需要剪裁的幀序號為 AN=rand(C,Lnum) (7) 式中:AN為需要剪裁的幀序號;rand為隨機數(shù)生成函數(shù)。 在式(7)生成隨機數(shù)的過程中,如果隨機生成所得的靜音幀比例高于一定閾值,則需要重新進行生成。由于語音段中靜音幀的比例較高,閾值通常先選為50%,再根據(jù)具體語音進行調(diào)整。器樂段中靜音幀比例較低,通常選為67%(2/3)。 在實驗對比之前首先對本文提出的零水印方案進行剪裁攻擊,效果如圖12所示。 (a)原始水印圖像 (b)1%剪裁 (c)1%剪裁單音 (d)3%剪裁 (e)5%剪裁 (f)10%剪裁圖12 本文方案剪裁攻擊后二次構(gòu)造的水印圖像 圖12a為原始水印圖像;圖12b為連續(xù)語音(女)在攻擊強度為1%時二次構(gòu)造的水印圖像;圖12c為單語音在攻擊強度為1%時二次構(gòu)造的水印圖像;圖12d為英語語音在攻擊強度為3%時二次構(gòu)造的水印圖像,英語語音為TIMIT數(shù)據(jù)庫中任取的1條語音;圖12e為中國古典民族器樂《鳳凰于飛》片段在攻擊5%時二次構(gòu)造的水印圖像;圖12f為連續(xù)語音(男)在攻擊強度為10%時二次構(gòu)造的水印圖像。從圖中可以看出:本文提出的方案在攻擊強度為5%時才出現(xiàn)明顯的噪聲,如圖12e所示;在強度為10%時,雖然噪聲已經(jīng)很明顯,但是水印圖像信息仍舊清晰,如圖12f所示。 選取漢語男女發(fā)音語音為用例進行剪裁攻擊實驗,并與文獻(xiàn)[1]、文獻(xiàn)[5]以及文獻(xiàn)[24]進行比對分析,由于本文采用一定比例的隨機剪裁,相同比例下對應(yīng)的剪裁的位置是不一樣的,所以每種剪裁比例分別對應(yīng)5組實驗,其平均CN如圖13所示。 圖13 不同方案在不同攻擊強度下的CN 由圖13可知:當(dāng)攻擊強度小于3%時,4種方案相差不大;隨著攻擊強度的增大,4種方案都存在下降趨勢,文獻(xiàn)[1]為嵌入水印,因此下降最快,而本文方案下降較慢,略好于其他方案。因此,本文方案具有較好的抗剪裁攻擊性。 本文通過對音頻零水印技術(shù)的現(xiàn)狀進行分析,從安全角度入手,提出了一種分析重構(gòu)水印攻擊模型,并依據(jù)此攻擊模型提出了一種基于亂序局部敏感哈希音頻零水印方案。該方案主要分為兩大模塊:零水印構(gòu)造和零水印檢測。零水印構(gòu)造過程中主要借助局部敏感哈希以及鏈表增強水印信息的抗分析重構(gòu)性。在零水印構(gòu)造模塊中:在預(yù)處理階段根據(jù)音頻信號的特點設(shè)計了去靜音幀模型,從源頭降低了水印構(gòu)造算法的時間復(fù)雜度;在水印構(gòu)造過程中,結(jié)合鏈表、局部敏感哈希以及小波變換共同設(shè)計構(gòu)造模型,并將水印信息與水印圖像相結(jié)合。在零水印檢測模塊中,對待檢測音頻依據(jù)本文提出的水印構(gòu)造算法進行水印的二次構(gòu)造,之后經(jīng)過相似度計算和與水印圖像的相似度比對判定版權(quán)的歸屬。理論分析與對比實驗表明,本文提出的零水印方案能在保持較低計算復(fù)雜度的情況下仍具有良好的抗分析重構(gòu)性與魯棒性。但是,本文的特征提取僅從小波分析入手,特征單一,在一定程度上會造成版權(quán)判定過程中準(zhǔn)確度下降、抗噪性差。與此同時,局敏感哈希與鏈表結(jié)合會造成復(fù)雜度高、可讀性差。這都是下一步需要改進的地方。4 結(jié) 論