謝 玲,范明泉
(1.中國(guó)西南電子技術(shù)研究所,成都610036;2.西南交通大學(xué)信息科學(xué)與技術(shù)學(xué)院,成都610031)
基于時(shí)域統(tǒng)計(jì)特征的音頻內(nèi)容取證新算法*
謝 玲1,**,范明泉2
(1.中國(guó)西南電子技術(shù)研究所,成都610036;2.西南交通大學(xué)信息科學(xué)與技術(shù)學(xué)院,成都610031)
針對(duì)現(xiàn)有音頻內(nèi)容取證算法采用二值圖像作為辨識(shí)水印所帶來(lái)的安全隱患,以及基于音頻內(nèi)容或特征生成的辨識(shí)水印穩(wěn)定性不高,易被常規(guī)信號(hào)處理操作淹沒的問題,提出了一種新的基于時(shí)域統(tǒng)計(jì)特征的音頻內(nèi)容取證算法。通過對(duì)音頻信號(hào)時(shí)域統(tǒng)計(jì)平均值進(jìn)行非均勻量化生成辨識(shí)水印。理論和實(shí)驗(yàn)結(jié)果表明通過該方法生成的辨識(shí)水印能夠抵抗常規(guī)信號(hào)處理操作,穩(wěn)定性高。生成的辨識(shí)水印存儲(chǔ)于認(rèn)證中心,組建辨識(shí)水印庫(kù)。對(duì)音頻內(nèi)容進(jìn)行取證時(shí),將由該音頻生成的辨識(shí)水印與從水印庫(kù)中提取的對(duì)應(yīng)辨識(shí)水印進(jìn)行比對(duì),即可對(duì)待取證音頻的真實(shí)性、完整性進(jìn)行鑒定。該取證方法操作簡(jiǎn)便,對(duì)不同類型音頻均能實(shí)現(xiàn)篡改定位,對(duì)常規(guī)音頻信號(hào)處理操作的魯棒性高,有效擴(kuò)大了基于內(nèi)容音頻取證算法的應(yīng)用范圍。
音頻內(nèi)容取證;辨識(shí)水印;篡改定位;非均勻量化;時(shí)域統(tǒng)計(jì)特征;混沌系統(tǒng)
近年來(lái),伴隨著互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展以及音頻壓縮技術(shù)的日益成熟,以MP3為代表的音樂在互聯(lián)網(wǎng)上廣泛傳播,極大地便利和豐富了人們的生活。然而,由于網(wǎng)絡(luò)信息的全透明性和易操作性,以及各種音頻信號(hào)處理工具的涌現(xiàn),使得惡意攻擊者可以從感知上不留痕跡地對(duì)音頻數(shù)據(jù)進(jìn)行篡改、偽造。在一些重要的實(shí)際應(yīng)用(如新聞媒體、法律證據(jù)、電子商務(wù))中,人們需要確切地知道所接收或要使用的音頻數(shù)據(jù)是否真實(shí)、是否完整、是否還具有使用價(jià)值。因此,如何有效地對(duì)音頻數(shù)據(jù)進(jìn)行真實(shí)性、完整性鑒別取證,已成為學(xué)術(shù)界當(dāng)前迫切需要解決的難題之一[1-3]。
根據(jù)容忍音頻數(shù)據(jù)被篡改的程度來(lái)劃分,數(shù)字音頻信號(hào)主動(dòng)性取證技術(shù)主要可以分為兩類。第一類不允許有任何修改,被稱為精確取證,這類取證可用脆弱水印來(lái)實(shí)現(xiàn)。文獻(xiàn)[4]通過修改音頻信號(hào)混合變換域低、中頻系數(shù)嵌入二值圖像辨識(shí)水印實(shí)現(xiàn)對(duì)音頻內(nèi)容的取證;文獻(xiàn)[5]通過修改音頻信號(hào)小波變換域細(xì)節(jié)分量嵌入二值圖像辨識(shí)水印,而在基于音頻特征生成的秘密密鑰上嵌入二值圖像標(biāo)識(shí)水印,實(shí)現(xiàn)對(duì)音頻內(nèi)容取證和版權(quán)保護(hù)的雙重功能。這類方案大多采用二值圖像作為辨識(shí)水印,其劣勢(shì)在于[6]:一是二值圖像的使用,增加了信息的傳輸量,浪費(fèi)了網(wǎng)絡(luò)傳輸帶寬;二是若二值圖像在傳輸過程中被篡改,將會(huì)增加取證的虛警概率;三是若二值圖像在傳輸過程中被替換,同時(shí)對(duì)傳輸?shù)囊纛l處理后嵌入了用來(lái)替換的二值圖像,則取證時(shí)即使音頻內(nèi)容發(fā)生了篡改,取證方也覺察不到。第二類允許不改變音頻內(nèi)容的修改,如音頻轉(zhuǎn)碼、重采樣、D/AA/D轉(zhuǎn)換、有損壓縮、音量調(diào)節(jié)、去除噪聲等,被稱為模糊取證,這類取證可利用半脆弱水印、音頻感知哈希(Perceptual Hashing)來(lái)實(shí)現(xiàn)。這類方法大多基于音頻內(nèi)容或特征點(diǎn)生成辨識(shí)水印,然而大部分算法生成的辨識(shí)水印穩(wěn)定性較差,容易被常規(guī)的音頻信號(hào)處理操作所淹沒。文獻(xiàn)[7]將各音頻段的重要比特位的能量和作為特征,對(duì)該特征進(jìn)行二值編碼生成辨識(shí)水印;文獻(xiàn)[8]基于語(yǔ)音信號(hào)的重要頻率帶上的能量變化來(lái)編碼,生成基于內(nèi)容的特征矢量,用作取證的辨識(shí)水印。它們共同面臨的問題是音頻特征點(diǎn)不穩(wěn)定,部分特征點(diǎn)易被常規(guī)信號(hào)處理操作淹沒,影響取證準(zhǔn)確率[9]。
鑒于此,本文利用音頻信號(hào)連續(xù)采樣時(shí)域統(tǒng)計(jì)平均值這一特征,通過基于混沌系統(tǒng)的非均勻量化手段生成安全的二值辨識(shí)水印,解決了傳統(tǒng)使用二值圖像作為辨識(shí)水印帶來(lái)的安全隱患問題。理論分析和實(shí)驗(yàn)結(jié)果表明,通過本文方法生成的辨識(shí)水印不僅能有效地抵抗常規(guī)音頻信號(hào)處理操作,而且能準(zhǔn)確地鎖定音頻內(nèi)容被篡改的區(qū)域,適合于音頻信號(hào)的實(shí)際取證應(yīng)用。
假設(shè)原始音頻信號(hào)表示為A={a(i)|i=0,…,L -1},辨識(shí)水印的生成過程框圖如圖1所示。
圖1 辨識(shí)水印生成過程框圖Fig.1 Diagram of identifying watermark generation
下面介紹具體步驟。
步驟1:劃分音頻幀
將原始音頻信號(hào)A均勻地劃分成M個(gè)互不重疊的音頻幀,記為A1(p),p=1,2,…M,音頻幀的長(zhǎng)度記為N,N=L/M。
步驟2:劃分音頻子帶
將每個(gè)音頻幀均勻地劃分成M1個(gè)互不重疊的音頻子帶,記為A2(p,q),q=1,2,…M1,音頻子帶的長(zhǎng)度為N/M1。
步驟3:計(jì)算時(shí)域統(tǒng)計(jì)平均值
計(jì)算每個(gè)音頻子帶的時(shí)域統(tǒng)計(jì)平均值,記為D(p,q),如公式(1)所示:
步驟4:非均勻量化
首先,將歸一化的音頻幅值區(qū)間[-1,1]均勻地劃分為子區(qū)間的組合,記為
這里S是均勻量化的間隔,并且h(i)=-1+i×S,i= 1,…,2/S-1。
其次,基于密鑰K1和K2,通過混沌系統(tǒng)生成偽隨機(jī)序列Q={Q(i)|i=1,2,…,2/S -1},這里密鑰K1是混沌系統(tǒng)的初值,密鑰K2是混沌系統(tǒng)的參數(shù)。
接著,通過偽隨機(jī)序列Q來(lái)擾亂均勻的子區(qū)間[-1,h(1)),[h(1),h(2)),…,[h(i),h(i+1)),…,[h(2/S-1),1],記擾亂后的子區(qū)間為
[h′(i),h′(i+1)),…,[h′(2/S-1),1]
其中,h′(i)=-1+i×S+Δ×Q(i),Δ是調(diào)制參數(shù),Δ<S, i=1,…,2/S-1。
最后,根據(jù)每個(gè)音頻子帶的時(shí)域統(tǒng)計(jì)均值,生成對(duì)應(yīng)的二值比特。若統(tǒng)計(jì)均值D(p,q)屬于第j個(gè)子間隔,j=1,2,…,2/S,那么對(duì)應(yīng)的二值比特W(p,q)為
由此,可得最終整個(gè)音頻信號(hào)對(duì)應(yīng)的二值比特序列W1={W1(k)|k=1,2,…,M×M1}。
步驟5:地址序列的生成
基于密鑰K3和K4,通過混沌系統(tǒng)生成偽隨機(jī)序列
這里密鑰K3是混沌系統(tǒng)的初值,密鑰K4是混沌系統(tǒng)的參數(shù)。將偽隨機(jī)序列Q1按降序排序,如公式(3)所示:
其中,a(i)是混沌序列排序后的地址索引序列。
步驟6:二值混沌序列的生成
將每個(gè)十進(jìn)制數(shù)地址索引a(i)轉(zhuǎn)化為長(zhǎng)度為m的二值序列,記為(a1a2…ad…am)2,其中,ad∈{0,1},m=n×M1,n是整數(shù)。接著,將長(zhǎng)度為m的二值序列均勻地分為n組,各組比特相互異或,如公式(4)所示:
這樣,連接所有的異或值可得到流密碼序列Qc={Qc(i)|i=1,2,…,M×M1}。
步驟7:加密
通過公式(5)獲得該音頻信號(hào)的二值辨識(shí)水印Wc:
最后,將密鑰(K1,K2,K3,K4)及二值辨識(shí)水印Wc存儲(chǔ)于可信認(rèn)證中心(Authentication Center, CA),組建辨識(shí)水印庫(kù);當(dāng)需要對(duì)某音頻進(jìn)行取證時(shí),從認(rèn)證中心CA提取對(duì)應(yīng)的密鑰及辨識(shí)水印用于音頻內(nèi)容的取證。
辨識(shí)水印的提取及音頻內(nèi)容取證過程框圖如圖2所示。
圖2 辨識(shí)水印的提取及音頻內(nèi)容取證框圖Fig.2 Diagram of identifying watermark extraction and audio content forensics
下面介紹具體步驟。
步驟1:類似于辨識(shí)水印的生成過程步驟1~4,獲得待取證音頻信號(hào)A*對(duì)應(yīng)的二值比特序列W′1。
步驟2:類似于辨識(shí)水印的生成過程步驟5~6,獲得流密碼序列Qc,用流密碼序列Qc對(duì)二值辨識(shí)水印Wc進(jìn)行解密,得二值比特序列W1*。
步驟3:音頻內(nèi)容取證。定義取證序列T= {T(i)∈{0,1}},i=1,2,…,M×M1,T由公式(6)計(jì)算獲得:
將長(zhǎng)度為M×M1的取證序列T依次等分成M組,每組的M1個(gè)比特對(duì)應(yīng)相應(yīng)的一個(gè)音頻幀的內(nèi)容取證,計(jì)算每組元素之和得
定義
當(dāng)TA(p)=0時(shí),表示對(duì)應(yīng)音頻幀的內(nèi)容沒有發(fā)生變化;當(dāng)TA(p)=1時(shí),表示對(duì)應(yīng)音頻幀的內(nèi)容被篡改。
4.1 辨識(shí)水印規(guī)模分析
假設(shè)原始音頻信號(hào)的采樣率為fs(Hz),則通過本文算法生成的辨識(shí)水印Wc的規(guī)模CW(b/s)為
其中,N是音頻幀的長(zhǎng)度,M1是每個(gè)音頻幀中的音頻子帶數(shù)。
4.2 辨識(shí)水印穩(wěn)定性分析
本文算法基于音頻子帶時(shí)域統(tǒng)計(jì)均值生成辨識(shí)水印,辨識(shí)水印的穩(wěn)定性主要取決于音頻子帶時(shí)域統(tǒng)計(jì)均值的穩(wěn)定性。文獻(xiàn)[10-11]給出了音頻子帶時(shí)域統(tǒng)計(jì)均值對(duì)時(shí)間尺度修改(Time-Scale Modifi-cation,TSM)的近似不變性。實(shí)際上音頻子帶時(shí)域統(tǒng)計(jì)均值對(duì)常規(guī)音頻信號(hào)處理操作也具有較強(qiáng)的魯棒性。
設(shè)A(t)|t∈T0是音頻子帶的模擬表示, n(t)|t∈T0是音頻信號(hào)遭受常規(guī)信號(hào)處理操作后的變化量,這樣受污染的音頻信號(hào)可表示為A′(t)|t∈T0,A′(t)=A(t)+n(t),那么有
一般地,n(t)|t∈T0服從均勻分布N(0,σ2),這樣公式(10)可演化為
由公式(11)可以看出,音頻子帶的時(shí)域統(tǒng)計(jì)均值在常規(guī)信號(hào)處理操作前后是不變的。進(jìn)而可知,音頻信號(hào)在遭受常規(guī)信號(hào)處理操作前后,由本文算法生成的辨識(shí)水印也是近似不變的。
4.3 辨識(shí)水印篡改檢測(cè)性能分析
由辨識(shí)水印的生成及音頻內(nèi)容取證過程可以看出,如果第p個(gè)音頻幀被惡意篡改,那么對(duì)應(yīng)音頻幀的二值比特序列將會(huì)發(fā)生變化,從而TA(p)=1。
取證序列T(i)的元素可以假設(shè)為獨(dú)立隨機(jī)變量,那么T(i)元素全為0的概率為1/(C12)M1。顯然在這樣的情況下,即使對(duì)應(yīng)的音頻幀內(nèi)容發(fā)生變化,也無(wú)法取證得到,即漏警概率為1/2M1。因此,當(dāng)惡意篡改發(fā)生時(shí),篡改檢測(cè)的理論概率Pr為
由公式(12)可以看出,當(dāng)音頻幀劃分的音頻子帶數(shù)越多時(shí),篡改檢測(cè)的理論概率越高。
為了驗(yàn)證本文算法的檢測(cè)可靠性、對(duì)惡意篡改的脆弱性及對(duì)常規(guī)音頻信號(hào)處理操作的魯棒性,選取了幾類音頻信號(hào)進(jìn)行實(shí)驗(yàn),它們均為WAVE格式、采樣率為44.1 kHz、16比特量化的音頻信號(hào)。限于篇幅這里只選取其中具有代表性的音頻信號(hào)來(lái)報(bào)道結(jié)果,如圖3所示。算法重要的參數(shù)設(shè)置如下:測(cè)試音頻信號(hào)樣本數(shù)L=409 600,劃分的音頻幀數(shù)M=1 024,劃分的音頻子帶數(shù)M1=4,M1越大,篡改檢測(cè)的概率越高,均勻量化步長(zhǎng)S=0.02,調(diào)制系數(shù)Δ=0.001,十進(jìn)制數(shù)地址索引轉(zhuǎn)化為二進(jìn)制比特位數(shù)m=12,所采用的混沌系統(tǒng)為L(zhǎng)ogistic混沌映射。
圖3 測(cè)試音頻信號(hào)Fig.3 The original audio signal
5.1 檢測(cè)可靠性
檢測(cè)可靠性是本取證算法最重要的性能指標(biāo)。為了證明由測(cè)試音頻信號(hào)生成的辨識(shí)水印是唯一的,選取了57個(gè)音頻(包括圖3所示的測(cè)試音頻信號(hào))進(jìn)行測(cè)試,檢測(cè)結(jié)果如圖4和圖5所示。由圖4及圖5的實(shí)驗(yàn)結(jié)果可以看出,通過本文算法生成的辨識(shí)水印與原始測(cè)試音頻信號(hào)是一一對(duì)應(yīng)的。
圖4 歸一化相關(guān)系數(shù)結(jié)果Fig.4 Results of normalized correlation
圖5 誤比特率結(jié)果Fig.5 Results of bit error rate
5.2 篡改定位測(cè)試
為了評(píng)價(jià)算法的篡改定位能力,對(duì)測(cè)試音頻信號(hào)進(jìn)行了3類攻擊。篡改類型1是隨機(jī)地刪除部分音頻信號(hào),篡改類型2是用其他音頻信號(hào)的內(nèi)容來(lái)替換測(cè)試音頻信號(hào)的部分內(nèi)容,篡改類型3是用測(cè)試音頻信號(hào)的一部分內(nèi)容替換另一部分內(nèi)容。圖6 (a)所示是刪除測(cè)試音頻信號(hào)的前40 000個(gè)抽樣,圖6(b)所示是測(cè)試音頻信號(hào)第40 001個(gè)抽樣到第80 000個(gè)抽樣、第160 001個(gè)抽樣到第200 000個(gè)抽樣被其他音頻信號(hào)替換,圖6(c)所示是測(cè)試音頻信號(hào)第80 001個(gè)抽樣到第120 000個(gè)抽樣、第200 001個(gè)抽樣到第240 000個(gè)抽樣被測(cè)試音頻信號(hào)的第120 001個(gè)抽樣到第160 000個(gè)抽樣、第300 001個(gè)抽樣到第340 000個(gè)抽樣替換。圖7給出了篡改定位結(jié)果,其中,TA(p)=1表示對(duì)應(yīng)的音頻幀內(nèi)容被篡改, TA(p)=0表示對(duì)應(yīng)的音頻幀內(nèi)容未變。由圖7可以看出本文算法具有很好的篡改定位能力。
圖6 篡改攻擊后的音頻信號(hào)Fig.6 The attacked audio signals
圖7 篡改定位結(jié)果Fig.7 The tamper location results
5.3 對(duì)常規(guī)信號(hào)處理操作的魯棒性測(cè)試
為了進(jìn)一步說(shuō)明本文算法生成辨識(shí)水印抵抗常規(guī)信號(hào)處理操作的能力,進(jìn)行了一系列典型的信號(hào)處理實(shí)驗(yàn)。測(cè)試音頻信號(hào)遭受了添加噪聲、低通濾波、重采樣、重量化、降低噪聲、添加回聲、MP3壓縮等常規(guī)信號(hào)處理操作,用誤比特率(Bit Error Rate, BER)衡量抵抗常規(guī)信號(hào)處理操作的魯棒性,其定義如下:
其中,E表示檢測(cè)的錯(cuò)誤比特?cái)?shù)。BER值越小,說(shuō)明抵抗常規(guī)信號(hào)處理操作的能力越強(qiáng)。表1給出了實(shí)驗(yàn)的結(jié)果,并與文獻(xiàn)[10-11]進(jìn)行了比較。由表1可以看出,本文算法生成的辨識(shí)水印對(duì)常規(guī)音頻信號(hào)處理操作的魯棒性較強(qiáng)。
表1 抗常規(guī)信號(hào)處理操作的實(shí)驗(yàn)結(jié)果Table 1 Experimental results of robustness against common signal processing operations
基于當(dāng)前多媒體領(lǐng)域?qū)σ纛l數(shù)據(jù)真實(shí)性、完整性的取證需求,本文通過對(duì)音頻信號(hào)時(shí)域統(tǒng)計(jì)平均值進(jìn)行非均勻量化生成辨識(shí)水印,提出了一種基于時(shí)域統(tǒng)計(jì)特征的音頻內(nèi)容取證算法。該方案相比現(xiàn)有算法而言,具有如下優(yōu)點(diǎn):
(1)辨識(shí)水印存儲(chǔ)于認(rèn)證中心,無(wú)需嵌入到原始音頻信號(hào)中,確保了音頻信號(hào)的保真度,特別適用于對(duì)音頻信號(hào)保真度要求很高的場(chǎng)合;
(2)生成的辨識(shí)水印具有很好的檢測(cè)可靠性和篡改定位能力;
(3)生成的辨識(shí)水印對(duì)常規(guī)音頻信號(hào)處理操作的魯棒性強(qiáng)。
此外,混沌系統(tǒng)的應(yīng)用增強(qiáng)了本文算法的安全性。該取證方法計(jì)算簡(jiǎn)單,容易實(shí)現(xiàn),對(duì)不同類型的音頻均適用和有效。下一步的研究重點(diǎn)是如何實(shí)現(xiàn)對(duì)低碼率下音頻壓縮數(shù)據(jù)流的內(nèi)容認(rèn)證。
[1] Nishimura R.Audio Watermarking Using Spatial Masking and Ambisonics[J].IEEE Transactions on Audio,Speech, and Language Processing,2012,20(9):2461-2469.
[2] Xiang Yong,Natgunanathan I,Peng Dezhong,et al.A Dual-channel Time-spread Echo Method for Audio Watermarking[J].IEEE Transactions on Information Forensics and Security,2012,7(2):383-392.
[3] Khan M K,Xie Ling,Zhang Jiashu.Chaos and NDFT-based Spread Spectrum Concealing of Fingerprint-biometric Data into Audio Signals[J].Digital Signal Processing,2010,20(1):179-190.
[4] 王向陽(yáng),祁薇.用于版權(quán)保護(hù)與內(nèi)容認(rèn)證的半脆弱音頻水印算法[J].自動(dòng)化學(xué)報(bào),2007,33(9):936-940. WANG Xiang-yang,QI Wei.A Semi-fragile Audio Watermarking for Copyright Protection and Content Authentication[J].Acta Automatica Sinica,2007,33(9):936-940.(in Chinese)
[5] Chen Ning,Zhu Jie.A Multipurpose Audio Watermarking Scheme for Copyright Protection and Content Authentication[C]//Proceedings of 2008 IEEE International Conference on Multimedia and Expo.Hannover:IEEE, 2008:221-224.
[6] 范明泉,王宏霞.基于音頻內(nèi)容的混合域脆弱水印算法[J].鐵道學(xué)報(bào),2010,32(1):118-122.FAN Ming-quan,WANG Hong-xia.Content-based Fragile Audio Watermarking in Hybrid Domain[J].Journal of the China Railway Society,2010,32(1):118-122.(in Chinese)
[7] Chen Fan,He Hongjie,Wang Hongxia.A Fragile Watermarking Scheme for Audio Detection and Recovery[C]// Proceedings of 2008 IEEE International Conference on Image and Signal Processing.Sanya:IEEE,2008:135-138.
[8] Gulbis M,Muller E,Steinebach M.Content-based Authentication Watermarking with Improved Audio Content Feature Extraction[C]//Proceedings of 2008 IEEE International Conference on Intelligent Information Hiding and Multimedia Signal Processing.Harbin:IEEE,2008:620-623.
[9] 王宏霞,范明泉.基于質(zhì)心的混合域半脆弱音頻水印算法[J].中國(guó)科學(xué):信息科學(xué),2010,40(2):313-326. WANG Hong-xia,FAN Ming-quan.Centroid-based Semi-fragile Audio Watermarking in Hybrid Domain[J]. Science in China:Information Science,2010,40(2): 313-326.(in Chinese)
[10] Xiang Shijun,Huang Jiwu.Time-scale Invariant Audio Watermarking Based on the Statistical Features in Time Domain[C]//Proceedings of 2006 International Conference on Information Hiding.Virginia:Springer,2006:1-16. [11] Xiang Shijun,Huang Jiwu.Histogram-based Audio Watermarking Against Time-scale Modifications and CroppingAttacks[J].IEEETransactionson Multimedia,2007,9(7):1357-1372.
XIE Ling was born in Kunming,Yunnan Province,in 1981.She received the B.S.degree and the M.S.degree from Southwest Jiaotong University in 2004 and 2007,respectively.She is now an engineer.Her research interests include radar signal processing and multimedia signal processing.
Email:wangyangxie@126.com
范明泉(1982—),男,江蘇南通人,分別于2004年和2010年獲西南交通大學(xué)學(xué)士學(xué)位和博士學(xué)位,現(xiàn)為助理研究員,主要研究方向?yàn)樾畔踩?/p>
FAN Ming-quan was born in Nantong,Jiangsu Province, in 1982.He received the B.S.degree and the Ph.D.degree from Southwest Jiaotong University in 2004 and 2010,respectively.He is now an assistant researcher.His research direction is information security.
Email:mqfan_sc@163.com
A Novel Audio Content Forensics Scheme Based on Time Domain Statistical Characteristic
XIE Ling1,FAN Ming-quan2
(1.Southwest China Institute of Electronic Technology,Chengdu 610036,China; 2.School of Information Science&Technology,Southwest Jiaotong University,Chengdu 610031,China)
Many previous audio content forensics schemes adopt binary image as identifying watermark, which introduces security holes to forensics systems.On the other hand,partial content-based or featurebased identifying watermarks have feeblish stability and may be damaged under various signal processing operations.To overcome these problems,a novel audio content forensics scheme based on time domain statistical characteristic is proposed in this paper.The statistical average value of continuous audio samples is used to generate identifying watermark by non-uniform quantization.Theoretical analysis and experimental results show that the generated identifying watermark is robust against various signal processing operations. Various identifying watermarks generated from different audio signals are stored at CA(Center of Authentication).When authenticating the veracity and integrity of audio content,firstly identifying watermark is generated from the to be detected audio,then corresponding identifying watermark is extracted from database of CA,finally the two identifying watermarks for audio content forensics are compared.The proposed forensics scheme has lower computation complexity,and the ability of tamper localization and tolerance against common signal processing operations are excellent.It greatly expands the applicability of contentbased audio forensics scheme.
audio content forensics;identifying watermark;tamper localization;non-uniform quantization;time domain statistical characteristic;chaotic system
date:2013-10-18;Revised date:2013-11-04
**通訊作者:wangyangxie@126.com Corresponding author:wangyangxie@126.com
TN912.3;TN919
A
1001-893X(2013)11-1476-06
謝 玲(1981—),女,云南昆明人,分別于2004年和2007年獲西南交通大學(xué)學(xué)士學(xué)位和碩士學(xué)位,現(xiàn)為工程師,主要研究方向?yàn)槔走_(dá)信號(hào)處理、多媒體信號(hào)處理;
10.3969/j.issn.1001-893x.2013.11.014
2013-10-18;
2013-11-04