梁長垠 ,李 昂,牛夏牧
(1. 深圳職業(yè)技術學院 電子與信息工程學院,廣東 深圳 518055;2. 哈爾濱工業(yè)大學 深圳研究生院,廣東 深圳518055)
隨著近年來網絡多媒體技術的飛速發(fā)展,數字視頻在網絡中傳播的越來越廣泛,相應地,視頻數據遭受惡意篡改所造成的社會危害也越來越大?;诖耍鳛楸WC視頻內容完整性和真實性的視頻內容認證技術成為近來研究和應用的熱點。而半脆弱性數字水印技術因其具有隱蔽性好、對失真具有一定容忍度、不需要額外保存認證信息、具有篡改定位能力等優(yōu)良特性,在多媒體信息的內容認證方面具有很好的應用前景。
目前,文獻[1]結合LSB脆弱水印算法和基于擴頻的視頻魯棒水印算法,設計了針對MPEG視頻認證的半脆弱水印系統,該水印系統能夠抵抗碼率轉換等內容保持類操作,但水印生成時計算復雜,實時性差。文獻[2]提出了一種自恢復認證的視頻水印算法,該算法利用修改VLC(Variable length coding)參數在壓縮視頻碼流中嵌入水印,將后一個圖像組(GOPi+1)的主要特征值壓縮后嵌入當前圖像組(GOPi)中。這雖然能夠對圖像的一般修改進行認證與恢復,但不能抵制轉碼、加噪等內容保持類的操作。文獻[3]提出了一種基于內容特征的可配置視頻認證方案,該方案雖然可以通過參數調節(jié)的方式實現系統魯棒性與安全性之間的較好平衡,但同樣對改變視頻結構的內容保持類操作敏感。本文將結合視頻內容的特點,應用鏡頭分割技術對視頻進行不變特征提取,提出一種基于云水印的視頻水印認證方案[4-5]。
為了區(qū)別惡意篡改與正常的視頻處理過程,本文設計了一種基于云水印的視頻認證技術。該技術基本思想是:壓縮的視頻碼流首先通過部分解碼以得到DCT系數,嵌入水印后再重新編碼。然后通過對接收視頻中提取的水印信息與重構的特征信息進行比較,以實現對時域及空域惡意篡改的檢測。
在圖像認證方面,已經有各種各樣從圖像中提取不變特征量的魯棒哈希算法被提出[6-7]。而將這些算法擴展到視頻認證中時卻存在著一些問題。由于視頻通常是由大量的圖像幀構成,復雜的圖像特征提取算法會導致水印嵌入耗時過長,不能滿足視頻認證的實時性要求。并且這些視頻幀的特征量之間也缺乏聯系,對時域上的篡改檢測無能為力。考慮到在絕大多數的視頻序列中,一個鏡頭內連續(xù)的圖像幀在視覺上都是十分相似的特點,本文將待認證的視頻進行鏡頭分割[8-9],以鏡頭為單位提取不變特征量。鏡頭分割方法的主要差別在于幀與幀之間的比較方法不同。首先,從視頻幀中提取某種特征來衡量幀間內容的變化,例如顏色、形狀、紋理等特征都可以用來作為對視頻幀的描述;然后,根據某種標準來度量幀間內容的差別,這種差別就是計算出來的幀間不連續(xù)值Z(k,k+1),其中k≧1,最后經過閾值判決,不連續(xù)值大于某一預先設定的閾值,則認為幀k與k+1形成了邊界,否則兩幀在同一鏡頭內。
對MPEG-2壓縮的視頻來說,一方面由于中、低頻DCT系數集中了圖像幀的絕大部分能量,較好地反映了視頻的內容變化;另一方面,中、低頻系數在重壓縮等合法操作的過程中相對穩(wěn)定,而對視頻幀內容上的篡改敏感[10]。因此利用視頻幀亮度塊內中、低頻DCT系數的能量分布作為鏡頭分割的依據及內容特征,是一個便捷且恰當的選擇。
設一個視頻幀中有m個宏塊,每個宏塊包含4個亮度塊,每個亮度塊都由64個DCT系數組成。基于DCT系數能量的鏡頭分割方法可分為以下三個步驟:
(3)將距離d(k,k+1)與一個閾值Ts進行比較,如果d(k,k+1)>Ts,則第k幀為一個鏡頭的邊界,閾值Ts的選取可參考文獻[11]。
將這個能量序列歸一化為一個二值形式,得到鏡頭S的特征向量F:
特征量F很好地反映了鏡頭S內所有I幀圖像的能量分布情況。這里也可以引入其它一些復雜的圖像特征提取技術,以期進一步地提高認證水印的篡改檢測能力。
為增加安全性,可用密鑰K將特征量F置亂并進一步做適當的調制,產生m位的水印信息W{w1,w2, …wn},其中wi是特征位F(i)經擴頻后得到的m/n位偽隨機序列。根據云模型及視頻序列的特性,通過擴展云發(fā)生器[4-5]生成嵌入到鏡頭S中的云水印信息。
以水印信息集合W{w1,w2, …wn}為期望值,選擇適當的En和He,可以產生一系列相似但不同的水印云滴的集合{D1,D2,…,Dt},其中Di=W’,t為鏡頭S包含的視頻幀總數。具體的實現過程如下:
(1)以En為期望,He2為方差,生成一個隨機熵En’;
(2)以集合W中的元素wi為期望,En’2為方差,生成一個隨機量wi’;
(3)遍歷W中的所有元素,產生一個水印云滴Di=W’{w1’,w2’…wn’};
(4)重復步驟(1)~(3)直至產生t個云滴。
鏡頭S對應的t個水印云滴將被逐一嵌回到該鏡頭所有幀內,每幀圖像將嵌入一個云滴。水印的嵌入方法則是通過調整宏塊內的能量分布,將水印嵌入在DCT系數的亮度塊中,每個宏塊嵌入一個水印信息bit位。其中設定的能量閾值TE可用來提高水印的魯棒性,實際應用中可以根據具體需要調整TE的大小,TE大,則魯棒性好,圖像視覺效果會相對降低一些;TE小,則魯棒性就差一些。具體嵌入方案如下:
(2)當嵌入的水印信息為0時,將塊B1、B2的DCT高頻系數清零并與塊B0、B3交換部分中頻系數,直至(EB0+EB3)-(EB1+EB2)≧TE;
(3)當嵌入的水印信息為1時,將塊B0、B3的DCT高頻系數清零并與塊B1、B2交換部分中頻系數,直至(EB1+EB2)-(EB0+EB3) ≧TE;
通過這個閾值的設定,可以保證宏塊內兩部分的能量差值始終不小于TE,確保了水印對于常規(guī)視頻處理的魯棒性。
水印的提取是嵌入的逆過程,分別計算接收視頻每個宏塊內四個亮度塊的能量。若EB0+EB3≧EB1+EB2,則提取水印位“0”,若EB0+EB3﹤EB1+EB2,則提取水印位“1”。
通過重構視頻的內容特征并與從視頻中提取出的水印信息進行比較,可以實現對接收視頻的空域及時域惡意篡改進行認證和檢測定位。
首先將接收視頻以同樣方法重新分割為一系列的鏡頭,從鏡頭S’內提取出t’個水印云滴,利用逆向云發(fā)生器得到水印信息W’{w’1,w’2, …w’n}[4-5]。對鏡頭S’的內容特征進行重構得到向量F’,以相同的密鑰K及偽隨機序列置亂和調制后生成m位重構特征信息Z{z1,z2, …zn}。分別計算偽隨機序列w’i與zi之間的相關性,可實現定位精度為m/n個宏塊的空域篡改檢測。
時域上的篡改包括幀的剪切、插入及位置互換等,這些攻擊都會導致鏡頭內有效水印云滴樣本的減少,使恢復的水印信息W’與原始水印信息W之間存在的誤差增大。以重構特征信息Z{z1,z2, …zn}代替W,并忽略已檢測到空域篡改的圖像區(qū)域,對W’ {w’1,w’2, …w’n}及Z{z1,z2, …zn}的其余n’部分計算其平均距離:
∑|w'i-z'i|
若d>T,則可判斷鏡頭S內遭到了時域上的篡改。
在鏡頭層次上的時域篡改檢測是通過對不同的鏡頭改變置亂密鑰來實現的,所有的密鑰均由一個狀態(tài)機密鑰發(fā)生器產生[12]。在不知道密鑰K的情況下進行水印的嵌入是幾乎不可能的,而即使知道了當前鏡頭所用的密鑰,也不能為其它鏡頭的密鑰破解提供任何信息,因此這種密鑰轉換的機制也進一步確保了認證水印方案的安全性。
為驗證上一節(jié)中算法的可行性和有效性,下面采用MPEG-2標準視頻測試序列Table-Tennis進行實驗,并從對常規(guī)處理的魯棒性、篡改檢測能力等方面進行測試及討論,測試視頻的主要參數,視頻大小為704×480;GOP幀數為12;I/P幀間距為3;色差格式為4∶2∶0;幀率為25 fps;幀數為679。
視頻文件由于其數據量極大,并且與圖像相比有較大的冗余,因此在存儲和傳輸的過程中通常要對其進行一些例如壓縮碼率轉換、比例縮放、圖像濾波等。其中,尤以不同碼率的轉換最為常見,包括適當去除視頻序列的B幀或P幀、丟棄高頻DCT系數、 重新量化、將壓縮視頻轉化為非壓縮比特流后重編碼。因此,視頻認證水印對于常規(guī)處理,必須具有一定的魯棒性。本文對算法在視頻壓縮重編碼、碼率轉換、幀率轉換后的魯棒性進行了測試,如表1所示為25幀/s與20幀/s時的誤碼率。從中可以看出,平均每幀的誤碼率一般不超過0.7 bit。當對視頻進行篡改時,某幀或某些幀的誤碼率會很大。所以很小的誤碼率不影響對視頻認證的效果。
表1 誤碼率
為了評價認證方案對時域篡改檢測能力,本文共設計了如表2所示的3組實驗。從其中時域認證結果可以看出,視頻圖像空域的內容篡改對時域的檢測影響很大,原因在于對圖像內容的篡改會使可用于時域檢測的水印信息部分減少,計算誤差增大。這會降低檢測的正確率,同時會產生虛警,虛警率隨著單幀篡改程度的加深和篡改幀數量的提高而變大??傮w來說,本文提出的視頻認證方案對時域上的篡改均有較好的檢測效果。
本文算法是對視頻內容進行保護,實驗結果如圖1所示。從實驗中可以看出,本文的認證水印方案可以檢測出對視頻圖像的篡改,包括替換視頻中的某個對象和在視頻中刪除或添加某個對象。通過本文提出的算法進行檢測,可以比較精確地定位篡改位置(如圖1(c)中認證圖像的黑塊部分所示)。
表2 時域認證結果
圖1 Table-Tennis視頻序列攻擊后的檢測結果
本文在視頻鏡頭分割技術的基礎上,提出了一種基于鏡頭的特征提取和云水印的視頻內容認證方案,該方案可實現針對MPEG壓縮視頻進行內容篡改的檢測及定位。通過對視頻鏡頭進行特征提取,大大縮短了水印的嵌入時間,提高了認證算法的實時性。利用有效水印云滴樣本數量與還原誤差之間的關系,檢測視頻內容在時域上遭受篡改的程度?;谀芰糠植嫉闹貥嬏卣髁颗c還原水印信息的相關性檢測,能夠對空域的篡改進行有效的定位。
參考文獻:
[1] PENG Yinyu, HEATHER Hong. A semi-fragile watermarking system for MPEG video authentication[J]. ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing, 2002,4(5):3461-3464.
[2] CROSS Daniel, MOBASSERI Bijan. Watermarking for self-authentication of compressed video[C]. IEEE International Conference on Image Processing Rochester, New York, 2002,3(9):913-916.
[3] SUN Q, HE D, TIAN Q A. Secure and robust authentication scheme for video transcoding[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2006,16(10):1232-1244.
[4] 李德毅, 劉常昱, 杜鹢, 等. 不確定性人工智能[J]. 軟件學報, 2004,15(11):1583-1594.
LI Deyi, LIU Changyu, DU Yi, et al. Artifical intelligence with uncertainty[J]. Journal of Software, 2004,15(11):1583-1594.
[5] 李德毅, 杜鹢. 不確定性人工智能[M]. 北京: 國防工業(yè)出版社, 2005.
[6] YANG B, GU F, NIU X. Block mean value based image perceptual hashing[C]. International Conference on Intelligent Information Hiding and Multimedia Signal Processing, 2006:167-172.
[7] SWAMINATHAN A, MAO Y, WU M. Robust and secure image hashing[J]. IEEE Transactions on Information Forensics and Security, 2006,1(2):215-230.
[8] 章毓晉. 基于內容的視覺信息檢索[M].北京: 科學出版社, 2003:13-17.
[9] 李國輝. 基于內容的多媒體信息檢索模型和方法研究[D]. 長沙: 國防科學技術大學, 2001:10-30.
[10] MOBASSERI B G, EVANS A T. Content-dependent video authentication by self-watermarking in color space[C]. SPIE Security and Watermarking of Multimedia Contents III, San Jose, 2001,4314(1):21-26.
[11] ROOVER C D, VLEESCHOUWER C D, LEFEBVRE F, et al. Robust video hashing based on radial projections of key frames[J]. IEEE Transactions on Signal Processing, 2005,53(10):4020-4037.
[12] LIN E T, DELP E J. Temporal synchronization in video watermarking[J]. IEEE Transactions on Signal Processing, 2004,52(10):3007-3022.