劉琚,孫建德
(山東大學信息科學與工程學院,山東濟南 250100)
獨立分量分析的圖像/視頻分析與應用
劉琚,孫建德
(山東大學信息科學與工程學院,山東濟南 250100)
隨著通信和計算機技術的發(fā)展,圖像和視頻信息的應用越來越多.圖像和視頻信息分析中的一個重要方法是獲得合適的特征來逼近人類視覺特性.獨立分量分析是一種新的無監(jiān)督訓練方法,它可以在圖像和視頻的理解方面很好地與人類視覺相匹配.給出了不同的ICA圖像/視頻分析模型和基于這些模型的獨立特征,對多媒體ICA分析和數字小波分析方法進行了對比,對于不同分析方法的計算機仿真給出了不同模型的獨立特征,并且給出了基于這些特征在圖像和視頻水印方案中的應用.應用實驗的仿真結果表明,獨立特征對于圖像和視頻水印性能具有較好的改善作用.
獨立分量分析;特征提取;視頻分析;數字水印
隨著計算機和網絡技術的發(fā)展,多媒體技術得到了廣泛的應用,近年來又出現了新媒體的概念.多媒體通常是指語音、圖像和視頻信息,新媒體則擴展到圖形、文字、動畫和虛擬場景等.然而,人們獲取信息的最主要來源仍然是圖像和視頻.人們從圖像/視頻可以得到直觀信息,但是只有對圖像/視頻進行分析、變換后才可以獲得圖像/視頻中隱含的特征并進行識別、分類、檢索和理解等應用.
目前常用的圖像特征分析方法大多分為時/空域和變換域方法.時/空域中處理技術通常有時延、尺度變換、插值、采樣、旋轉、濾波等,而變換域方法最主要的就是傅里葉變換和小波變換等.變換域處理方法的中心思想是將信號分解成基信號的疊加,這些基信號可以表現出原始信號的特性,如頻率特性、時頻特性等.
傅里葉變換是將一個信號的時域表示形式映射到一個頻域表示形式,對一個信號做傅里葉變換,可以得到其頻域特性,包括幅度和相位2個方面.離散余弦變換(discrete cosine transform,DCT)是一種與傅里葉變換緊密相關的數學運算.
信號通過傅里葉變換表現的是頻率特性,但是不同頻率的基信號出現的時間無法確定,因此出現了信號時頻分析工具——小波變換.對于數字信號的時頻特性分析主要采用的是離散小波變換(discrete wavelet transform,DWT).
離散小波變換是以相互正交的母小波為基函數,是時間和頻率局域化的變換,因而能有效地從信號中提取時頻分布參數.通過伸縮和平移等運算可對信號進行多尺度的細化分析,解決了傅里葉變換不能解決的許多問題,被認為是時間-尺度分析和多分辨率分析的一種新技術[1].它在信號分析、語音合成、圖像識別、計算機視覺、數據壓縮、地震勘探、大氣與海洋波分析等方面都取得了具有科學意義和應用價值的成果.
獨立分量分析(independent component analysis,ICA)是近年來在信號分析與處理中發(fā)展起來的一種新方法,它作為一種盲源分離技術(blind source separation,BSS),是信號處理領域的研究熱點.ICA的實質就是尋求一種線性變換,將一組隨機變量表示成一組統(tǒng)計意義上相互獨立的變量的線性組合[2],因此通過ICA提取的信號特征是相互獨立的.目前ICA已經廣泛地應用于特征提取、生理學數據分析、語音信號處理、圖像處理、人臉識別和數字水印等方面.
ICA作為一種信號處理技術,其目的就是以統(tǒng)計獨立的變量的線性組合來表示一組隨機變量[2].ICA最有意義的2個應用就是盲源分離和特征提取,而這2個方面和數字水印研究有著相通性和密切的聯(lián)系.
盲源分離是在源信號和傳輸通道參數未知的情況下,根據輸入源信號的統(tǒng)計特性,僅通過觀測信號就可以實時地恢復或提取源信號.
ICA信號模型如式(1):
式中:x=[x1x2…xm]T是m維觀察信號矢量,s=[s1s2…sn]T是n維未知源信號矢量,A是未知的混疊矩陣,W是未知的分離矩陣.
ICA就是僅根據觀察信號x來估計源信號s,求解分離矩陣W,通過^s=Wx,得到s的估計.已經有許多成熟的ICA算法、如FastICA算法[3]由于其算法簡單和良好性能而被廣泛應用.
FastICA是一種快速的定點獨立分量分析算法.它首先對觀察信號利用主分量分析(principle component analysis,PCA)進行預白化,將觀察信號x變換成z=Ux,使得z的分量具有單位方差且互不相關,其中z的自相關矩陣是單位陣,U為白化陣.
FastICA利用峭度目標函數作為分離準則,分離矩陣的訓練公式為
式中:k是迭代次數,最終分離矩陣為W=VTU.
文獻[4]中,A.Hyvarinen將ICA用于圖像特征提取.
假設一個信號在某個采樣點x的信號值表示為I(x).信號處理中的許多基本模型將該信號I(x)表示為一系列的特征或基函數ai(x)的線性疊加的結果:
式中:si為隨機系數,每一個信號I(x)對應的Si是不相同的.由此簡化為對于信號向量 x=[x1x2…xm]T,信號的表示為x=As.這種簡潔的表示與基本的ICA模型完全相同.
圖1給出由特征基向量合成圖像的模型[4].
圖1 圖像合成模型Fig.1 Image mixture model
在ICA模型中,至少存在2個觀測信號,而實際中需要處理的往往只有一幅圖像,因而,許多基于ICA的水印方案采用對原始圖像分塊的方式得到多個觀測信號,把每個塊看作一個觀測信號來建立ICA模型.
對于圖像,通常是將圖像分成8×8或是16×16的像素塊,如圖2,并把這些塊作為ICA模型中的觀測信號,再通過ICA得到源信號.這樣得到的所謂源信號是相互獨立的,可以視為圖像的特征,因此這一過程稱作特征提取.
圖3是自然圖像采用基于分塊ICA提取出來的基向量[4].為了更好地表現特征,人們往往采用一些標準化手段.具體做法為:首先,將圖像進行線性標準化,使得像素具有零均值、單位方差;然后.將圖像分成塊,再利用FastICA方法進行處理;最后,得到ICA的向量基.A.Hyvarinen指出[4],這些基向量顯然在空間、頻率、方向這3個方面都具有局部性,而且這些特征與Gabor函數十分相似,同時也指出這些基向量與小波也有相似性.
圖2 分塊法Fig.2 Method of image blocking
圖3 利用分塊ICA提取出來的自然圖像基向量Fig.3 Basis vectors of natural images extracted by the method of blocking ICA
這些特征能被證明含有原始圖像的一些方向邊緣,因此被用作圖像重構的基[5].此外,Hateren證明了這些特征與人類視覺獲得的特征是相似的,并且在視頻中的相應實驗中也得到了相似的結論[6].
基于分塊的ICA模型,在圖像分塊之后,各個塊和原圖像都失去了相似性,提取出來的特征并不能很好地反映圖像的整體特性.
采樣法是一種十分常用的信號處理方法,可以根據不同的采樣因子或者采樣間隔將信號分解成相似的信號.用采樣法抽取則可以使得到的圖像與原始圖像相似.當采樣因子為2時,原圖像可以被分解為4個相似的子圖.
假設原始圖像大小為n×m,通過采樣因子為2的下采樣(如圖4)后,得到4個子圖,如式(2)表示為:
式中:I為原始圖像,i=1,2,…,n/2,j=1,2,…m/2.
圖4中由A組成的子圖為原始圖像通過抽取奇行、奇列得到;由B組成的子圖是由原始圖像通過抽取奇行、偶列得到;由C組成的子圖為原始圖像通過抽取偶行、奇列得到;由D組成的子圖是由原始圖像通過抽取偶行、偶列得到.圖5是將原始標準peppers圖像經過上述采樣方法得到的分解結果.
圖4 原始圖像以及經下采樣得到的4個子圖Fig.4 Original image and the four sub-images obtained by downsampling
圖5 原始peppers圖像以及經下采樣得到4個子圖Fig.5 Original standard image“peppers”and the four sub-images obtained by downsampling
將上述采樣方法分解得到的4個子圖作為觀測信號進行ICA處理,就可以得到相應的特征.
為了后面便于跟小波變換對比,把下采樣與ICA相結合處理信號的整個過程稱為ICA變換(ICA transform,ICAT)[7].通過 ICAT 得到的4 個特征圖像(feature image,FI),可以用子帶的方式表示,如圖6.
圖6 ICAT提取的4個特征分量Fig.6 Four feature images obtained by ICAT
圖6 中,FI1,FI2,FI3,FI4就是原始圖像經 ICAT獲得的特征.根據ICA理論,這4個特征不但不相關,而且相互獨立.不難發(fā)現,這個分析結果與圖像經小波理論多尺度分析得到的結果(即圖8(b))很相似.因此,將FI4稱為原始圖像的概貌分量,FI1,FI2,FI3被稱為細節(jié)分量.
在小波分析理論中,信號二層、三層乃至高層的分析方法,在實際應用中被廣泛地應用.因此,研究二層、高層的ICAT分解方法具有一定意義.
基于采樣和ICA的特征分析方法二層分解模型有2種.第1種是與小波分析方法類似,將一層ICAT分解得到的各個分量繼續(xù)進行一次ICAT處理.另一種方法是將圖像經過采樣因子為4的采樣提取出16個子圖,然后對這16個圖像進行ICA處理,這個過程被稱為基于采樣因子為4的ICAT.在這里只以第1種方法為例進行說明,分解原理圖如圖7所示.
圖7 第1種2層ICAT分解原理Fig.7 The framework of the first type of 2-order ICAT
第1種方法與常用的小波多尺度分析方法相類似,將它與離散小波變換進行分析結果對比.標準圖像peppers通過第1種二層ICAT方法處理的結果如圖8(a),其中16個分量中存在著概貌分量(最后一個分量)及細節(jié)分量(其余15個分量).圖8(b)是peppers圖像通過二層2D-DWT處理得到的結果,其中母小波采用的是 Daubechies-4 小波[8-9].
圖8 ICAT與DWT的分析結果對比Fig.8 Comparison between ICAT and DWT
小波多尺度分析中,圖像分解得到概貌分量表示的是原始圖像的低頻子帶,是原始圖像能量最集中的部分,體現了原始圖像中的主要信息.因此,本文把概貌部分的能量統(tǒng)計特性作為概貌分量的一個準則來衡量相應的變換方法的優(yōu)劣.
本文將概貌分量進行二維離散余弦變換(2DDCT),對得到的離散余弦系數進行zigzag掃描,得到的DCT系數按從低頻到高頻依次排列.除第1個DCT系數(直流系數)外,再按照從低頻到高頻的順序統(tǒng)計交流系數能量分別占整個交流系數總能量95%、90%的個數.如果這個數目在總的交流系統(tǒng)中所占的比例越小,則表明對應變換的能量集中特性更好.
實驗中采用標準peppers圖像,圖像大小為512×512,離散小波變換采用的母小波為Daubechies-4小波.分別對一層、二層小波分析和ICAT分解得到的概貌分量進行上述的DCT系數統(tǒng)計分析.
1)一層分解結果.在DWT得到的概貌分量(由于采用 Daubechies-4小波,概貌分量像素大小為259×259)的交流(AC)系數當中,按從低頻到高頻的順序,前5 627個低頻交流系數的能量占據了整個交流系數總能量的95%,這些系數占據整個交流系數的8.39%;而ICAT概貌分量(像素大小為256×256)的統(tǒng)計數量為3 451個,占據整個交流系數的5.27%,僅僅是DWT結果的61%.這說明,按從低頻到高頻順序統(tǒng)計,ICAT概貌分量中的前3 451個交流系數恢復的圖像可以得到用小波概貌分量前5 627個交流系數恢復圖像的質量.這意味著一層ICAT分解提取的概貌分量能量較DWT更加集中.
2)二層分解統(tǒng)計結果.二層DWT得到的概貌分量,其像素大小為69×69,它的交流(AC)系數當中,按從低頻到高頻的順序,前1 673個交流系數的能量占據了整個交流系數總能量的95%,這些系數占據整個交流系數的35.14%.另外,前962個交流系數的能量占據了整個交流系數總能量的90%,這些系數占據整個交流系數的19.61%.采樣因子為2的二重ICA方法得到的概貌分量,其像素大小為64×64,它的交流(AC)系數當中,按從低頻到高頻的順序,前1 296個低頻交流系數的能量占據了整個交流系數總能量的95%,這些系數占據整個交流系數的31.64%;前650個低頻交流系數的能量占據了整個交流系數總能量的90%,這些系數占據整個交流系數的15.87%.這意味著基于下采樣的二層ICAT分解方法提取的概貌分量與二階離散小波變換提取的概貌分量相比,能量更加集中.
ICAT和DWT概貌分量能量統(tǒng)計的結果說明ICAT提取的概貌分量能量與DWT提取的概貌分量相比,能量更加集中.也就是說,可以用相對較少的DCT系數恢復出同樣質量的圖像.這說明,ICAT方法的稀疏性要強于DWT,即可以用較少的數據恢復相同質量的圖像.眾所周知,DWT能去除數據的相關性以達到減少數據的冗余的目的[10]而被應用于數據壓縮,并已經作為JPEG2000壓縮標準的理論基礎.ICA獲得的分量不僅不相關而且是統(tǒng)計獨立的,這能在更大程度上減少數據冗余.上述實驗也都證明了這一點.因此利用ICAT壓縮圖像時,壓縮性能可能會優(yōu)于DWT.
類似于圖像的ICA分析,視頻的ICA分析也有不同的模型,因此,基于ICA的視頻分析可以產生不同的獨立視頻特征.
將1.3節(jié)中基于圖像分塊的ICA特征表示[11]向視頻擴展,首先將視頻進行時間上的分段,然后將分段視頻在空間上分塊,把視頻分為三維塊,以這些三維塊作為ICA模型中的觀測分量進行ICA分解,所得到的獨立塊特征就是基于ICA的視頻獨立塊特征的表示.文獻[10]通過實驗證明這些獨立塊特征與人類感知視覺中大腦皮層細胞所呈現的濾波器非常類似.圖9是視頻獨立塊特征的提取框架.
在進行三維塊特征提取時,首先要將視頻進行時間上的分段,即要確定視頻塊在時間上的跨度,然后才在空間上分塊.視頻在進行MPEG壓縮時,通常按照GOP(group of picture,GOP)結構來對視頻幀分類進行不同的壓縮處理,一般GOP中包括3類幀[12]:I幀、P幀和B幀.視頻壓縮中最常用的一種GOP結構如圖10所示.
圖9 視頻獨立塊特征的提取框架Fig.9 Framework of the independent block-based video feature extraction
圖10 視頻GOP中幀的典型結構Fig.10 The structure of GOP
按照視頻中這種GOP的結構來對視頻在時間上進行分段.分段后,再按照圖9中描述的過程進行視頻特征的提取,這樣獲得的特征被稱為視頻獨立塊特征(video independent block feature,VIBF).這個過程中的視頻塊特征本身也是視頻的形式,稱其中的視頻幀為切片,以便和原視頻中的幀進行區(qū)別.
基于獨立塊特征的表示方法能夠很好地表示一段視頻,然而這種獨立塊特征的含義并不非常明確.視頻是時間軸上有序排列的連續(xù)圖像序列,這些連續(xù)圖像之間存在大量相似的背景信息,幀與幀之間的區(qū)別主要是通過相對運動信息來表征的.這些背景信息和相對運動信息在統(tǒng)計上是相互獨立的,可以通過ICA技術從相鄰的幀圖像中分別提取出來.由此就產生了基于連續(xù)幀動態(tài)分量的第2種視頻的表示方法.
假設視頻中某連續(xù)的2幀圖像分別為xF(i)和xF(i-1),它們的背景信息 sF(i-1)稱為靜態(tài)分量,它們之間的相對運動信息sMF(i)稱為運動分量.xF(i)和xF(i-1)可以看做是 sF(i-1)和 sF(i)線性疊加的結果:
式 中:xF(i)、xF(i-1)、sF(i-1)、分 別 是 xF(i)、xF(i-1)、sF(i-1)、的行向量形式.因此,ICA 可以用來分離視頻中相鄰2幀之間的靜態(tài)分量信息和運動分量信息.圖11是利用FastICA對一段視頻中相鄰2幀進行分解的結果.
圖11 ICA分解兩相鄰視頻幀得到的結果Fig.11 ICA analysis on two consecutive frames
文獻[13]證明邊緣是圖像的獨立成分,而由動態(tài)分量圖可以看出,視頻幀中物體的運動軌跡就是通過邊緣體現出來的.邊緣突出的地方表明發(fā)生了劇烈的運動,邊緣模糊的地方只發(fā)生輕微的運動,沒有邊緣的地方即沒有相對運動,這一結果反映了視頻幀的相對運動分量,有效地描述了視頻的運動過程,而提取過程避免了傳統(tǒng)運動估計方法中重復性的塊操作,減少了計算量.
同時,利用幀差法得到的幀間相對運動信息與其使用的參考幀有關,即幀間相對運動信息與靜止的背景信息之間存在相關性.因此,雖然幀差法算法簡單,可以較快地提取視頻幀間相對運動信息,但提取的運動信息并不是真正意義上的幀間相對運動信息,在應用中魯棒性較弱.而使用ICA提取的幀間相對運動信息是惟一的,與靜止的背景信息是相互獨立的,可以很好地表示視頻相鄰2幀之間發(fā)生的運動情況,并且在應用中具有較強的魯棒性.
連續(xù)幀動態(tài)分量的表示方法能夠很好地體現出視頻中的運動成分,但是這種成分是由視頻的連續(xù)幀獲得的,表示的只是特定時間點上的運動信息,無法反映視頻的整體信息.與此同時,人們發(fā)現視頻中同一個視頻場景中運動的對象、時序等不發(fā)生變化,由此提出基于獨立內容特征的視頻表示方法.
基于獨立內容特征的視頻表示方法首先要將視頻進行鏡頭分割,即根據場景將視頻按內容在時間上劃分成段,在每段中利用主獨立分量分析(principal independent component analysis,PICA)提取出基于這段視頻的內容特征——視頻獨立內容特征(video independent content feature,VICF).
2.3.1 鏡頭分割
視頻鏡頭分割,又稱為視頻時間上的分割,是視頻處理中一個重要的研究方向.視頻分割就是按照場景內容的變化將視頻在時間上分成不同的段.鏡頭分割的方法主要有:基于像素的、基于塊的、基于直方圖的方法等[14].
2.3.2 視頻獨立內容特征(VICF)
1)主獨立分量分析.
一般地,在進行ICA分解前,先將觀察信號利用主分量分析(PCA)進行預白化.若在白化過程中,只選擇觀察信號的協(xié)方差矩陣中主要特征值所對應的特征向量來構造白化陣,就可以實現降維,并在后面的ICA中達到對主要獨立分量的優(yōu)化估計,這個過程被稱為主獨立分量分析.主獨立分量分析和一般獨立分量分析的不同就在于白化時是否進行降維.鏡頭中的VICF就是通過主獨立分量分析提取的.
2)視頻獨立內容特征(VICF).
將同一個鏡頭內視頻幀作為ICA模型中的觀察信號進行PICA分解,就可以得到基于視頻內容的獨立特征VICF.
圖12 手彈鋼琴視頻中的幀Fig.12 Frames in the video of fingers playing piano
圖13是用FastICA對這段視頻進行主獨立分量分析的結果,在進行PCA預白化時,維數降至6,b1-b6是得到的 6 個 VICF;p1-p6為 PCA 白化后得到的6個主特征分量的幀形式.圖13(a)~(f)是PI-CA提取出來的VICF.其中(a)~(e)中灰度顯著的地方顯示了彈下的鋼琴鍵,b1~b5分量分別對應第4鍵、第2鍵、第1鍵、第3鍵和第5鍵.VICF是從同一內容的視頻幀中提取出來的特征幀,是視頻內容的本質特征,對視頻中的各種處理有很強的魯棒性.
圖13 PICA分解得到的獨立分量幀Fig.13 Principal independent content feature frames obtained by PICA
數字水印技術是一種將特制的、不可見的標記隱藏在數字圖像、聲音、視頻等數字內容中,由此可以確定版權擁有者,認證數字內容來源的真實性等.數字水印系統(tǒng)通常包含2個部分:水印信息的嵌入和水印信息的提取或檢測,一般要求水印具有不可見性、魯棒性和較大的信息容量[17-21].水印嵌入和檢測模型如圖14所示.
圖14 水印嵌入和檢測模型Fig.14 Models of watermark embedding and detection
可以看出,ICA的混疊/分離模型與水印的嵌入/提取在某種程度上是相通的.因此,將ICA與水印技術結合,就可以得到基于ICA的圖像/視頻水印方案.下面分別給出基于混疊圖像盲分離的圖像水印檢測方案.
方案利用ICA的混疊/分離模型,在時空域中將水印圖像直接疊加到載體圖像上.在水印嵌入時,將水印圖像作為一個弱信號嵌入到載體圖像中,得到的嵌入水印的圖像就是載體圖像和水印圖像的混疊;在水印檢測時,從待檢測的載體圖像中提取出水印圖像,通過與原始水印圖像的比較來判斷待檢測的載體圖像中是否嵌入水印.水印嵌入及提取的方案框圖如圖15所示[17].
圖15 空域中嵌入及提取水印的方案Fig.15 Framework of watermarking embedding and extraction in spatial domain
1)水印的嵌入和提取.
選擇2幅尺寸相同的圖像分別作為載體圖像I和水印圖像w,將其看作ICA模型的2個源信號.水印的嵌入過程用公式表示如下:
為了滿足水印不可見性的要求,Am中|a11|?|a12|,并且可以通過調節(jié)它們2個的比例關系來調節(jié)水印的不可見程度,其中a21、a22均不為零.
檢測水印時,可以將混疊矩陣和密鑰矩陣聯(lián)合起來通過水印嵌入過程的逆過程分離出水印信息;然而這種檢測方法對于混疊矩陣的保密性不好,并且由于水印檢測的病態(tài)性,這樣的檢測方法會使水印的魯棒性變差.因此,這里采用ICA算法進行水印的分離,獲得到分離矩陣Wm后,利用式(1)進行分離和提取水印.如果待檢測的水印圖像為I'w,則提取過程的公式表示如下:
式中:x'Iw為待測水印圖像I'w的行向量形式,s'w為提取出來的水印圖像w'的行向量形式,行向量s'I為一個與原始載體圖像類似的圖像I'的向量形式.Wm為提取水印時的分離矩陣.
2)仿真實驗
圖16 混疊后得到的圖像Fig.16 Two mixture images
對加水印的圖像進行不同的攻擊處理,然后對加水印的圖像進行攻擊,并從攻擊后的圖像中提取水印.圖17(a)、(b)是經過JPEG壓縮后的圖像以及從中提取出來的水印.圖18(a)、(b)是中值濾波處理后的圖像以及從中提取出來的水印.
圖17 JPEG壓縮后的圖像及提取出的水印Fig.17 Watermarked image with JPEG compression and the watermark extracted from it
從仿真結果可以看出,空域中基于ICA疊加/提取的數字水印方案,其優(yōu)點是嵌入水印信息的量比較大,且對于一些比較猛烈的攻擊,在密鑰圖像的輔助下,具有良好的魯棒性.
其他文獻中將這種思想在不同變換域或者不同分量上進行了應用.文獻[28]中將原始圖像和數字水印進行相同的ICA分解后,在原始圖像分解后的系數上疊加水印分解后的系數,從而完成水印的嵌入;文獻[29-30]中將圖像先進行小波變換或者Ridgelet變換,在變換的系數上通過水印的混疊來完成嵌入,提取時,在變換域上通過ICA分解來提取出混疊的水印;文獻[31]將圖像的RGB 3個分量作為3個混疊圖像進行ICA分解,在得到的特征上進行水印的嵌入和提取.這些方法在一定場合下都得到了很好的結果.
圖18 中值濾波后的圖像及提取出的水印Fig.18 Watermarked image with median filtering and the watermark extracted from it
“拷貝攻擊”是水印攻擊中容易引起版權混淆和糾紛的一種攻擊.為了對抗“拷貝攻擊”,往往需要在嵌入水印的同時,嵌入表征圖像的簽名信息.針對于這種嵌入水印時有原始圖像、水印圖像和簽名圖像3個圖像信息,而提取時則只有待檢測圖像和密鑰圖像2個信息的情況,文獻[19]介紹了一種解決方法.這種方法將原始圖像的簽名連同水印信息一同嵌入到原始圖像中;在接收端,將待檢測圖像和密鑰圖像作為2個觀測信號,通過在提取/檢測過程中多次采用ICA分解,并結合源信號的一定先驗知識,實現從2個觀測信號中分離出原始圖像、原始圖像的簽名以及水印信息.
1)水印的嵌入和提取.
嵌入水印時,首先將原始圖像進行多層小波分解,并將其逼近子圖作為源信號s1,水印和原始圖像的IS分別作為源信號s2和s3.然后將s1、s2和s3表示成行向量形式,利用ICA混疊模型x=As進行混疊實現水印的嵌入.在這里,為了降低密鑰管理的復雜度,簡化水印應用過程,隨機產生一個2×3維的矩陣A=(aij)2×3作為混疊矩陣,即有如下嵌入模型:
最后選取x1作為嵌入水印和IS的小波逼近子圖,x2為私鑰陣.對x1進行小波反變換,就完成了整個嵌入過程.為了滿足水印的不可見性要求,混疊矩陣 A 中應滿足a12,a13?a11(a12+a13≈0.1a11).如果密鑰陣x2中含有水印信息,則在提取/檢測階段,對于不含水印的圖像,仍然能夠將水印提取出來,這是由于不管源信號如何混疊,ICA方法都可以僅通過觀測信號來恢復或提取源信號,因此為了降低虛警率,a22取值應為零.a22=0使得密鑰陣中含有IS信息而不含水印信息,這使得在提取/檢測時,s3將獲得比s2更高的魯棒性,因此使a12>a13從而進一步提高水印的魯棒性.
提取/檢測水印時,首先將嵌入水印的圖像的小波逼近子圖和私鑰矩陣用行向量表示,并分別看作是2個觀測信號x1和x2,利用ICA分離訓練公式得到分離矩陣w1∈R2×2,對x1和x2進行ICA運算,得到分離信號y1和y2,即
從式(3)可以看出,本質上y1和y2也是源信號s1、s2和s3的線性組合.其次,將y2作為一個觀測信號x3,將^s3作為另一個觀測信號x4,對x3和x4進行ICA運算,用矩陣W2∈R2×2進行分離,得到水印s2和簽名s3:
2)仿真實驗及結論.
表1給出了在幾種常規(guī)攻擊下提取的水印與原水印之間的NC值,各類攻擊分別為:1)均值為0.1,方差為0.001 5的高斯噪聲攻擊;2)3×3中值濾波;3)剪切掉“Lena”圖像的眼睛部分;4)JEPG壓縮,其中壓縮比率為16.624;5)尺度變換,即采用“Bilinear”方法先將圖像擴大為原圖像的2倍,再縮為原圖像大小.從表1中可以看出,此水印算法具有較好的魯棒性,所測NC值均高于給定的閾值0.85.
表1 常規(guī)攻擊下提取的水印與原水印NC值比較Table 1 NC comparison between the original and extracted watermarks under usual attacks
圖19 水印嵌入前后圖像及水印Fig.19 Images with and without watermark and watermark
視頻水印技術利用視頻數據中存在的時間冗余和空間冗余,把表征版權的水印信息嵌入到數字視頻內容中,在不影響視頻質量的前提下,達到版權保護和內容完整性檢驗的目的.
與圖像水印技術相比,視頻水印具有自身固有的一些特征,視頻水印算法還有一些特殊的要求,如視頻具有更大的信號空間,因而具有更大的隱藏信息容量;但易受剪切、幀頻改變、幀重組、掉幀等一些特有的攻擊的影響.
不管視頻經過什么樣的處理,惟一保持不變的是視頻內容,因而視頻內容對各種處理魯棒性最強.
利用2.3節(jié)中描述的視頻獨立內容特征分析,提出一種基于ICA和獨立視頻內容特征的視頻水印方案[22].先將視頻通過鏡頭分割在時間上分段,再對每個段進行ICA分解,將得到的獨立分量幀看作圖像,采用現有的圖像水印方法,在每個段分解得到的主獨立分量幀上嵌入水印.由于視頻中的主獨立分量幀對于各種視頻處理有很好的魯棒性,因此在嵌入水印時只要采用盲圖像水印方案就可以達到視頻水印的盲檢測.這里采用了基于量化思想的SWE(single watermark embedding)方案[23].
在水印提取時,先提取待檢測視頻的主獨立分量幀,再從每個主獨立分量幀中檢測水印.
仿真實驗中選用一段73幀的廣告作為實驗視頻,視頻中有3個鏡頭,幀率為25幀/s,幀大小為272×352.水印是有山東大學字樣的二值圖像,大小為32×32.
在每個提取出來的VICF上都嵌入相同的水印,并且進行下面的10個攻擊實驗,基于幀的攻擊:1)3×3中值濾波,2)幀尺寸縮小2倍,3)幀旋轉0.5°,4)密度為0.02 的椒鹽噪聲,5)均值為0,方差為0.001的高斯噪聲;基于視頻的攻擊:6)各視頻段內部的幀交換,每5幀中任選2相鄰幀進行交換,7)幀丟失,每6幀中任意丟失一幀,8)幀率從25~30幀/s,持續(xù)時間不變,幀數從73增為85,9)幀率從25~24幀/s,持續(xù)時間不變,幀數從73減為69,10)各視頻段內部的共謀攻擊.這些實驗都是在視頻經過了MPEG2壓縮后進行的.這里沒有選用幀數不變而持續(xù)時間變化的幀率變化,是因為這種幀率變化對于視頻幀沒有任何的影響,和沒有幀率變化的情況下進行提取是相同的.圖20(a)~(j)分別對應(a)~(j)攻擊后提取出來的水印.1)~10)每個子圖中的3個水印,從左向右分別對應每種攻擊后從第1、2、3段中提取出來的水印.圖20(k)是原始水印.
圖20 各種攻擊下視頻各鏡頭中提取的水印Fig.20 Watermarks extracted from different video shots under various attacks
實驗結果表明,這種方案對于常見的基于幀的攻擊,如中值濾波、尺度伸縮、椒鹽噪聲、高斯噪聲等有很好的魯棒性;對于常見的基于視頻的攻擊,如MPEG2壓縮、幀交換、幀丟失、幀率變化、共謀攻擊等也有很好的魯棒性.對于空間上不同步的攻擊(如旋轉),有一定的魯棒性;而對于時間不同步的攻擊(如幀交換、幀丟失、幀率變化),有很好的魯棒性.
2.2節(jié)介紹了利用ICA從視頻相鄰2幀中提取包含相對運動信息的運動分量幀,考慮人眼對運動區(qū)域及其鄰近區(qū)域的變化敏感性相對較低的視覺特性,通過運動區(qū)域的定位,將水印嵌入原始視頻幀的運動區(qū)域內[24],且采用基于視覺模型的QIM算法,在保證水印不可見的前提下,使水印對高斯白噪聲、MPEG-2壓縮、幀刪除和幀剪裁等攻擊具有較高的魯棒性.
由于人眼對紋理細節(jié)和邊緣分布豐富的運動區(qū)域及其鄰近區(qū)域的變化敏感性相對較低,利用ICA提取運動分量信息,并根據此定位視頻幀中運動最為劇烈的部分作為水印嵌入的區(qū)域.首先,通過ICA分析得到2幀共有的靜態(tài)分量和相對運動分量.通過定位運動分量幀中紋理顯著的區(qū)域,可以實現對原始視頻幀中運動區(qū)域的定位.
圖21描述了運動區(qū)域定位過程.首先,用16×16的宏塊對運動信息幀進行初步的運動區(qū)域定位.文獻[24]中用宏塊中各互不重疊的8×8小塊的方差和作為衡量運動劇烈程度的標準,即認為方差和大的宏塊運動更劇烈.其次,以方差和最大的宏塊為中心確定一個方形區(qū)域(8n×8n,相應地嵌入水印的信息量為n×n),此區(qū)域對應至原視頻幀中,即為定位得到的運動區(qū)域.
圖21 運動區(qū)域定位Fig.21 Motion region locating
采用基于Watson’s視覺模型[25]的量化索引調制算法[26]嵌入水印.檢測水印時,仍然用ICA提取相對運動分量,對接收到的視頻幀進行運動區(qū)域定位,利用與嵌入相反的過程提取水印.
仿真試驗截取了一段北極熊視頻作為載體視頻,共包含50幀圖像,每幀圖像大小為272×352,幀率為25幀/s.使用的水印為由0、1組成的二進制偽隨機序列,長度為100(相應地,確定的運動區(qū)域的大小為80×80).嵌入水印時,嵌入水印的強度beta設為18,使視頻在保持良好的視覺質量的前提下仍然具有較好的魯棒性.
為證明算法的魯棒性,實驗采用一些常見的信息處理方式對水印視頻進行處理,包括各種均值為0.方差不同的高斯白噪聲攻擊,在保持視頻時長或幀數不變的前提下采用不同幀率的MPEG-2壓縮,以及幀刪除和幀剪裁攻擊.其中,幀刪除中隨機刪掉視頻中約10%的幀,即視頻丟失5幀圖像.對于實際視頻應用中經常遭受的幀剪裁攻擊,又進行了各幀統(tǒng)一順序剪裁和隨機剪裁,以及各幀隨機剪裁不同的行列等3種實驗方式.圖22給出了視頻遭受攻擊后的水印檢測結果.在試驗中,采取用與剪裁處相隔5行/列的行列填充于剪裁處.
圖22 視頻水印檢測結果Fig.22 Watermark extraction results
仿真結果證明了本方案對高斯白噪聲、MPEG-2壓縮、幀刪除及幀剪裁攻擊有較高的魯棒性.
本文總結了近年來基于ICA的圖像/視頻分析的方法研究及其在多媒體水印中的應用.盲信號分離方法近年來不斷出現新的成果,欠定盲分離、非線性盲分離分析、張量分析和潛變量分析等,其在圖像和視頻分析領域的應用也在不斷拓展.本文只是總結了自己基于ICA的圖像和視頻特征提取的研究及其在數字水印領域的應用成果,實際上還更多其他人的類似研究及成果需要在以后的工作中有加以總結.
[1]MALLAT S A.Theory for multiresolution signal decomposition:the wavelet representation[J].IEEE Trans Pattern A-nal Mach Intel,1989,11(7):674-693.
[2]COMON P.Independent component analysis,a new concept[J].Signal Processing,1994,36:287-314.
[3]HYVRINEN A,OJA E.A fast fixed-point algorithm for independent component analysis[J].Neural Computation,1997,9(7):1483-1492.
[4]HYVARINEN A,KARHUNEN J,OJA E.Independent component analysis[M].New York:John Wiley,2001:21-35.
[5]HURRI J,HYVARINEN A,KARHUNEN J,et al.Image feature extraction using independent component analysis[C]//Proc IEEE Nordic Signal Processing Symposium.Espoo,Finland,1996:475-478.
[6]Van HATEREN J H,Van DER SCHAAF A.Independent component filters of natural images compared with simple cells in primary visual cortex[J]//Proceedings Royal Society of London:Biological Sciences,1998,265(1394):359-366.
[7]ZHANG Qiang,SUN Jiande,LIU Ju,et al.A novel ICA-based image video processing method[C]//ICA 2007,LNCS 4666,[S.l.],2007:836-842.
[8]MALLAT S.Wavelets for a vision[J].Proceedings of the IEEE,1996,84(4):604-614.
[9]ANTONINI M,BARLAUD M,MATHIEU P.Daubechies:image coding using wavelet transform[J].IEEE Transactions on Image Processing,1992,1(2):205-220.
[10]SWANSON M D,ZHU B,TEWFIK A H.Multiresolution scene-based video watermarking using perceptual models[J].IEEE Journal on Selected Areas in Communications,1998,16(4):540-550.
[11]Van HATEREN J H,RUDERMAN D L.Independent component snalysis of natural image sequences yields spatio-temporal filters similar to simple cells in primary visual cortex[J]//Proceedings of the Royal Society.London B,1998,265(1412):2315-2320.
[12]TEKALP A M.Digital video processing[M].北京:清華大學出版社,1998:15-30.
[13]BELL A J,SEJNOWSKI T J.Edges are the independent components of natural scenes[M]//Advances in Neural Information Processing Systems 9.Cambrige:The MIT Press,1996:831-837.
[14]HOYER P O,HYVARINEN A.Independent component analysis applied to feature extraction from color and stereo images[J].Network:Computation in Neural Systems,2000,11(3):191-210.
[15]SMARAGDIS P,CASEY M.Audio/visual independent components[C]//4th International Symposium on Independent Component Analysis and Blind Signal Separation.Nara,Japan,2003:709-714.
[16]孫建德,劉琚.基于獨立分量分析的盲視頻水印方案[J]. 電子學報,2004,32(9):1507-1510.
SUN Jiande,LIU Ju.A blind video watermarking scheme based on independent component analysis[J].Acta Electronica Sinica,2004,32(9):1507-1510.
[17]劉琚,孫建德,基于ICA的數字水印的方法[J].電子學報,2004,32(4):657-660.
LIU Ju,SUN Jiande.A new scheme of digital watermarking based on independent component analysis[J].Acta Electronic Sinica,2004,32(4):657-660.
[18]KUTTER M,VOLOSHYNOVSKIY S,HERRIGEL A.The watermark copy attack[C]//Proc of SPIE:Security and Watermarking of Multimedia ContentsⅡ.San Jose,USA:SPIE,2000,3971:371-380.
[19]胡慧博,劉琚,孫建德.基于 ICA的抗拷貝攻擊的數字水印方案[J].電子與信息學報,2005,27(7):1035-1038
HU Huibo,LIU Ju,SUN Jiande.An ICA-based watermarking scheme resistant to copy attack[J].Journal of E-lectronics& Information Technology,2005,27(7):1035-1038.
[20]LIU Ju,ZHANG Xingang,SUN Jiande.A digital watermarking scheme based on ICA detection[C]//4th International Symposium on Independent Component Analysis and Blind Signal Separation.Nara,Japan,2003:215-220.
[21]凌潔,劉琚,孫建德,等.基于視覺模型的迭代AQIM水印算法[J]. 電子學報,2010,38(1):151-155.
LING Jie,LIU Ju,SUN Jiande,et al.Visual model based iterative AQIM watermark algorithm[J].Acta Electronica Sinica,2010,38(1):151-155.
[22]SUN Jiande,LIU Ju.A novel blind video watermarking scheme based on independent dynamic component[J].Multidimensional Systems and Signal Processing,2006,17(1):59-74.
[23]YU D,SATTER F,MA K K.Watermark detection and extraction using ICA method[J].EURASIP Journal on Applied Signal Processing,2002,1:92-104.
[24]SUN Zhaowan,LIU Ju,SUN Jiande,et al.A motion location based video watermarking scheme using ICA to extract dynamic frames[J].Neural Computing & Applications,2009,18(5):507-514.
[25]WATSON A B.DCT quantization matrices visually optimized for individual images[C]//Proc SPIE on Human Vision,Visual Processing,and Digital Display Ⅳ.San Jose,USA,1993:202-216.
[26]CHEN B,WORNELL G W.Quantization index modulation:a class of provably good methods for digital watermarking and information embedding[J].IEEE Transactions on Information Theory,2001,47(4):1423-1443.
[27]SUN Jiande,LIU Ju.A blind video watermarking scheme based on ICA and shot segmentation[J].Science in China Series F,2006,49(3):302-312.
[28]GONZáLEZ-SERRANO F J,MURILLO-FUENTES J J.Independent component analysis applied to image watermarking[C]//Proc IEEE ICASSP.Lake City,USA,2001:1997-2000.
[29]MANGAIYARKARASI P,ARULSELVI S.A new digital image watermarking based on finite ridgelet transform and extraction using ICA[C]//Proceedings of ICETECT.Tamil Nadu,India,2011:837-841.
[30]JADHAV S,BHALCHANDRA A.Robust digital image-adaptive watermarking using BSS based extraction technique[J].//International Journal of Image Processing,2010,4(1):77-88.
[31]CHAUDHARI B P,GULVE A K.Approaches of digital image watermarking using IC[C]//Proceedings of ISCET.Punjab,India,2010:32-46.
劉琚,男,1965年生,工學博士,教授、博士生導師.現為山東大學信息科學與工程學院學術委員會副主任,通信工程系主任;中國電子學會高級會員、IEEE高級會員(Senior Member);國內外期刊International Journal of Swarm Intelligence Research(IJSIR)、《通信學報》和《數據采集與處理》等編委.主要研究方為多媒體信息處理、無線通信中空時信號處理,盲信號處理理論與應用等.參加了國家重點基礎研究發(fā)展規(guī)劃(973)項目和歐盟項目等.主持承擔了國家自然科學基金、高等學??萍紕?chuàng)新工程重大項目培育資金項目等課題10余項.曾獲江蘇省科技進步一等獎和中國高校自然科學二等獎等,授權發(fā)明專利8項,在國內外核心期刊或重要學術會議上發(fā)表學術論文200余篇.
孫建德,男,1978年生.工學博士,副教授.主要研究方向為基于內容的多媒體分析、基于視覺關注模型的圖像/視頻分析、圖像/視頻復制檢測、多媒體信息隱藏和數字水印、2D-3D視頻轉換等.主持并參與了國家自然科學基金等課題10余項.在國內外期刊和重要國際學術會議上發(fā)表論文30余篇.
Independent component analysis-based image/video analysis and applications
LIU Ju,SUN Jiande
(School of Information Science and Engineering,Shandong University,Ji’nan 250100,China)
The application of image and video is becoming increasingly popular with the development of computer and communication techniques.One of the important methods applied in image and video information analysis is to obtain suitable features which approach the visual characteristics of humans.Independent component analysis(ICA)is an unsupervised training method which effectively matches human vision with image and video understanding.In this paper,different image/video analysis models of ICA were presented and the independent image/video features based on these models were analyzed.A comparison between multimedia ICA and digital wavelet transform(DWT)was performed.Finally,computer simulation results on various analysis methods were given to show the independent features of different models and their applications in image and video watermarking.The results of the application simulations show that the independent features may make improvements for image and video watermarking.
independent component analysis;feature extraction;video analysis;digital watermarking
TP18;TN911.7
A
1673-4785(2011)06-0495-12
10.3969/j.issn.1673-4785.2011.06.004
2011-01-03.
國家自然科學基金資助項目(60872024,61001180,60970048);高等學??萍紕?chuàng)新工程重大項目培育資金資助項目 (708059);山東大學資助創(chuàng)新基金資助項目(2010JC007);教育部博士點專項基金資助項目(新教師項目,200804221023).
劉琚.E-mail:juliu@sdu.edu.cn.