于 靜,高 飛,王沙沙,溫英新
(北京理工大學(xué) 信息與電子學(xué)院,北京100081)
電視臺標(biāo)是區(qū)分電視臺的重要標(biāo)識,臺標(biāo)有效識別將為視頻收視行為統(tǒng)計提供有力支持,同時,也是對各個電視臺進(jìn)行自動視頻分析、節(jié)目導(dǎo)向及內(nèi)容檢索的重要手段。目前,對臺標(biāo)識別已開展了廣泛的研究,從各種不同側(cè)面提出了一些臺標(biāo)識別的方法,在一定的條件下,這些方法可以較好地解決臺標(biāo)的正確識別[1-2]。
由于臺標(biāo)的透明度不同,臺標(biāo)可分為半透明臺標(biāo)和不透明臺標(biāo)兩類。半透明臺標(biāo)的像素點會隨著復(fù)雜背景變化,如中央電視臺和北京電視臺的臺標(biāo)。而不透明臺標(biāo)的像素點不會隨著背景改變,如湖南衛(wèi)視、東方衛(wèi)視等電視臺的臺標(biāo)[2]。若對上述兩種不同類型的臺標(biāo)采用同一種方法進(jìn)行識別,很難獲得令人滿意的效果。
本文通過對各種電視臺標(biāo)數(shù)據(jù)的分析,提出了一種基于統(tǒng)計分類的自動臺標(biāo)識別方法。該方法首先采用統(tǒng)計識別方法將不透明臺標(biāo)和半透明臺標(biāo)進(jìn)行有效分類。在此基礎(chǔ)上,針對兩種類型臺標(biāo)的各自特點,采用不同的臺標(biāo)分割方法將臺標(biāo)進(jìn)行正確分割。然后對分割的臺標(biāo)采用基于小波變換、奇異值分解的方法進(jìn)行特征提取和識別。經(jīng)大量實驗數(shù)據(jù)驗證,該方法識別精度高,具有較強的適應(yīng)性。
為了實現(xiàn)臺標(biāo)的正確識別,首要任務(wù)是將上述兩類臺標(biāo)進(jìn)行有效分類。
由于臺標(biāo)位置的時空不變性[3],而臺標(biāo)區(qū)域的背景變化相對較大,因此,可以采用基于多幀疊加及統(tǒng)計平均的方法使臺標(biāo)本身的信息獲得增強,同時弱化背景信息。但是,由于兩類臺標(biāo)的透明度不同,半透明臺標(biāo)的像素點會隨背景變化而改變,不透明臺標(biāo)的像素點不會隨著背景變化。因此,這種基于多幀疊加及統(tǒng)計平均的方法對于兩類臺標(biāo)的增強程度是不同的。
通過分析,構(gòu)成半透明臺標(biāo)有效部分的像素點都是偏向于白色的,偏白色像素點的R、G、B 3個分量的值都是偏大的。而不透明臺標(biāo)主要由彩色像素點構(gòu)成,基本不含有偏白色像素點或只含有一部分偏白色像素點,彩色像素點的R、G、B 3個分量不會同時取得較大值。因此,兩類臺標(biāo)所含偏白色像素點的數(shù)量相差較大,半透明臺標(biāo)含有更多的偏白色像素點。這是兩類臺標(biāo)的關(guān)鍵特性差異,基于這種差異可以對兩類臺標(biāo)進(jìn)行有效分類。
本文對視頻圖像數(shù)據(jù)的處理是針對每一幀數(shù)據(jù)左上角包含所有電視臺標(biāo)的盡量小的公共區(qū)域。
(1)對視頻圖像序列,連續(xù)采集 200幀數(shù)據(jù),將 200幀視頻圖像數(shù)據(jù)分為10組,依序每隔10幀抽取1幀數(shù)據(jù),組成1組,每一組中均含有在時間軸上不連續(xù)的20幀視頻圖像數(shù)據(jù)。
(2)對于每一組視頻數(shù)據(jù),將 20幀圖像的 R、G、B 3個分量分別相加再取統(tǒng)計平均,所得均值分別記為SRi、SGi、SBi,i=1,2,…,10。
對于每一組在時間軸上不連續(xù)的20幀視頻圖像,臺標(biāo)本身不會隨背景改變(不透明臺標(biāo))或僅有較小變化(半透明臺標(biāo)),而背景部分有較大改變,因此,通過多幀疊加再取平均的方法可以加強臺標(biāo)本身,同時弱化背景。
(3)經(jīng)過上述處理,獲得10組視頻圖像的 R、G、B分量的均值 SRi、SGi、SBi,i=1,2,…,10。 設(shè)定經(jīng)驗閾值,用該閾值分別對所得的均值 SRi、SGi、SBi進(jìn)行判別,將小于閾值的像素點置為0,而大于等于閾值的像素點保持不變。
(4)再將10組視頻圖像數(shù)據(jù)經(jīng)過上述處理的 SRi、SGi、SBi分別相加再取平均,得到均值 SR、SG、SB,采用(3)中的經(jīng)驗閾值分別對其進(jìn)行判別,將小于閾值的像素點置為0,而大于等于閾值的像素點保持不變。
(5)這時SR、SG、SB中保留的非零像素點分別為視頻圖像R、G、B分量取值較大的像素點,綜合利用經(jīng)過處理的均值SR、SG、SB將這三者相加再取平均,所得均值記為M,設(shè)定門限T。M中大于門限T的像素點即認(rèn)定為偏白的像素點,統(tǒng)計M中偏白像素點的數(shù)量,若大于某個閾值 (通過反復(fù)試驗求得最佳閾值),則認(rèn)定這200幀視頻圖像的臺標(biāo)屬于半透明臺標(biāo),否則認(rèn)為是不透明臺標(biāo)。臺標(biāo)統(tǒng)計分類方法的效果如圖1所示。
圖1 臺標(biāo)統(tǒng)計分類實驗結(jié)果
由此,通過統(tǒng)計分類的方法實現(xiàn)了半透明和不透明兩類臺標(biāo)的有效分類。
上述預(yù)處理主要用于將半透明臺標(biāo)和不透明臺標(biāo)的有效分類。在分類的基礎(chǔ)上,對每類臺標(biāo)分別采用針對該類臺標(biāo)自身特點的方法實現(xiàn)臺標(biāo)的正確分割,然后采用基于小波變換和奇異值分解相結(jié)合的方法實現(xiàn)臺標(biāo)的有效表示和正確識別。
在臺標(biāo)特征識別中,僅對視頻臺標(biāo)區(qū)域的灰度圖像進(jìn)行處理。
2.1.1 不透明臺標(biāo)分割
不透明臺標(biāo)各像素點與背景無關(guān),僅受隨機噪聲干擾,取值基本不變,而背景部分變化較大。據(jù)此,采用迭代相減的方法去掉背景,將不透明臺標(biāo)的有效部分提取出來,實現(xiàn)臺標(biāo)的正確分割。具體做法是:
(1)在臺標(biāo)統(tǒng)計分類中,對于已經(jīng)判定歸為不透明臺標(biāo)一類的200幀視頻圖像序列進(jìn)行分組,將這200幀視頻的灰度圖像分為20組,每相鄰10幀視頻圖像數(shù)據(jù)組成1組。
(2)將每一組視頻中的10幀灰度圖像數(shù)據(jù)相加再取統(tǒng)計平均,所得均值分別記為 SNi,i=1,2,…,20。 經(jīng)統(tǒng)計平均后,可以加強不會隨背景改變的臺標(biāo)本身。各組的SNi在臺標(biāo)區(qū)域的像素點取值相近,而在背景區(qū)域的像素點取值相差較大。據(jù)此,可以實現(xiàn)不透明臺標(biāo)的分割。
(3)采用迭代相減的方法去除背景。首先,用SN2減去SN1,所得差值大于經(jīng)驗閾值D1的區(qū)域就判定為背景,將SN2中相應(yīng)的區(qū)域置為0。這樣,可以去掉一部分的背景。然后用SN3減去已去掉部分背景的SN2,并執(zhí)行與SN2減去SN1后相同的操作,這樣可以進(jìn)一步地去掉背景。以此類推,直至完成。此時,已將判定為背景的區(qū)域全部置為0。最后,認(rèn)定SN20保留的非零像素點構(gòu)成的區(qū)域即為有效臺標(biāo)部分,至此,實現(xiàn)了不透明臺標(biāo)的有效分割。不透明臺標(biāo)分割方法的效果如圖2所示。
圖2 東方衛(wèi)視臺標(biāo)分割實驗結(jié)果
2.1.2 半透明臺標(biāo)分割
半透明臺標(biāo)各像素點的取值會隨背景的變化而改變,針對這個特點,在分割半透明臺標(biāo)時,需要使用迭代相減和小波重構(gòu)兩種方法共同完成。具體做法是:
(1)在臺標(biāo)統(tǒng)計分類中,對于已經(jīng)判定歸為半透明臺標(biāo)一類的200幀視頻圖像序列進(jìn)行分組,將這200幀視頻的灰度圖像分為20組,每相鄰10幀視頻圖像數(shù)據(jù)組成1組。
(2)將每一組視頻中的10幀灰度圖像數(shù)據(jù)相加再取統(tǒng)計平均,所得均值分別記為STi,i=1,2,…,20。 經(jīng)統(tǒng)計平均后,可以加強會隨背景變化有較小改變的臺標(biāo)本身。
但是,由于半透明臺標(biāo)本身會隨背景改變,這種基于多幀疊加和統(tǒng)計平均的方法對半透明臺標(biāo)的加強沒有對不透明臺標(biāo)的效果好。因此,還需要對得到的STi進(jìn)行小波重構(gòu),進(jìn)一步加強半透明臺標(biāo)[4]。
具體做法是:對STi進(jìn)行小波變換,并對得到的低頻小波系數(shù)進(jìn)行倍乘操作,再用倍乘后的低頻小波系數(shù)進(jìn)行小波逆變換,實現(xiàn)小波重構(gòu)。這樣可以使半透明臺標(biāo)的有效部分得到進(jìn)一步加強。經(jīng)小波重構(gòu)后的各組STi在臺標(biāo)區(qū)域的像素點取值相近,而在背景區(qū)域的像素點取值相差較大。據(jù)此,可以實現(xiàn)半透明臺標(biāo)的正確分割。
(3)對于小波重構(gòu)后的各組 STi,采用迭代相減的方法去除背景。首先,用ST2減去ST1,所得差值大于經(jīng)驗閾值D2的區(qū)域就判定為背景,將ST2中相應(yīng)的區(qū)域置為0。這樣,可以去掉一部分的背景。然后用ST3減去已去掉部分背景的ST2,并執(zhí)行與 ST2減去 ST1后相同的操作,這樣可以進(jìn)一步去掉背景。以此類推,直至完成。此時,已將判定為背景的區(qū)域全部置為0。最后,認(rèn)定ST20保留的非零像素點構(gòu)成的區(qū)域即為有效臺標(biāo)部分,至此,實現(xiàn)了半透明臺標(biāo)的正確分割。半透明臺標(biāo)分割方法的效果如圖3所示。
圖3 中央新聞臺標(biāo)分割實驗結(jié)果
以上已經(jīng)分別完成兩類臺標(biāo)的分割,接下來就要提取臺標(biāo)的有效特征并進(jìn)行識別。在此,以不透明臺標(biāo)為例,半透明臺標(biāo)的特征提取和識別采用相同的方法。
首先對分割出的臺標(biāo)進(jìn)行小波變換,得到小波系數(shù)的低頻分量。該分量集中反映了臺標(biāo)的主要特征,同時又可以起到去除噪聲和減少后續(xù)處理數(shù)據(jù)量的作用。
小波系數(shù)的低頻部分可以從多種層面反映臺標(biāo)的特征,如通常采用的方差、中心矩等。本文采用了一種新的方法,即對小波低頻系數(shù)矩陣進(jìn)行奇異值分解(SVD)[5]。
在奇異值分解理論中,任何m×n階矩陣M(假定m>n),秩為 r(r≤n),則存在 m×m 正交陣 U 和 n×n 正交陣 V,使得:
其中,Σ=diag(λ1,λ2,…,λr)是對角矩陣,其對角元素為矩陣M的奇異值。
對小波低頻系數(shù)矩陣進(jìn)行奇異值分解,得到的奇異值作為臺標(biāo)的特征參數(shù)向量,如式(2)。
不同臺標(biāo)的小波低頻系數(shù)矩陣的特征值存有較大差異,因此,可將由式(2)得到的特征參數(shù)向量用于區(qū)分臺標(biāo)。
為了完成臺標(biāo)的識別,本研究中預(yù)先建有不透明類臺標(biāo)的知識庫S1(半透明類臺標(biāo)預(yù)先建有知識庫S2,S1與S2獨立),臺標(biāo)知識庫中存有臺標(biāo)特征參數(shù)向量、電視臺名稱等相關(guān)知識。計算待識別臺標(biāo)與臺標(biāo)庫S1中各臺標(biāo)模板之間差值的2-范數(shù),最小者即為候選臺標(biāo)。
在此,待識別臺標(biāo)只與本類臺標(biāo)知識庫中的各臺標(biāo)模板相比較,而不需與所有臺標(biāo)模板進(jìn)行比較,這樣可以減少臺標(biāo)識別的計算量。
本文共采集中央新聞、北京衛(wèi)視、東方衛(wèi)視、天津衛(wèi)視和湖南衛(wèi)視等5個頻道,每個頻道30個樣本,共計150個樣本,每個樣本時長為8 s(視頻的幀速率為25幀/s),樣本視頻圖像大小為640×480。統(tǒng)一提取視頻幀圖像左上角包含臺標(biāo)、大小為50×120的子圖作為分析對象。其中,中央新聞、北京衛(wèi)視兩個頻道的臺標(biāo)屬于半透明臺標(biāo),東方衛(wèi)視、天津衛(wèi)視、湖南衛(wèi)視三個頻道的臺標(biāo)屬于不透明臺標(biāo)。臺標(biāo)識別算法實驗結(jié)果如表1所示。
表1 臺標(biāo)識別算法實驗結(jié)果
從表1中可以看出,本文算法對臺標(biāo)的正確識別率較高,特別是對半透明臺標(biāo)的識別精度可以達(dá)到100%。實驗中,影響不透明臺標(biāo)識別精度的原因是:每個待識別視頻樣本時長僅為8 s,當(dāng)視頻樣本臺標(biāo)區(qū)域的背景幾乎不變時,本文算法不能將不透明臺標(biāo)的有效部分從背景中提取出來,也就不能正確識別臺標(biāo)。
電視臺標(biāo)是區(qū)分電視臺的重要標(biāo)識,自動臺標(biāo)識別技術(shù)是對各個電視臺進(jìn)行自動視頻分析、節(jié)目導(dǎo)向及內(nèi)容檢索的重要手段。本文通過研究分析半透明和不透明兩類臺標(biāo)的共性和兩者的差異性,首先通過統(tǒng)計分類的方法將兩類臺標(biāo)分開,再針對兩類臺標(biāo)各自的特點,分別采用不同的方法實現(xiàn)每類臺標(biāo)的分割,最后對分割得到的臺標(biāo)用基于小波變換和奇異值分解的方法完成臺標(biāo)識別。實驗表明,該算法識別精度較高、適應(yīng)性較強,具有工程應(yīng)用價值,但對不透明臺標(biāo)的識別精度有待進(jìn)一步提高。在今后的研究中,將進(jìn)一步改進(jìn)不透明臺標(biāo)的分割方法,提高識別精度。
[1]周獻(xiàn)中,史迎春,王韜.基于HSV顏色空間加權(quán) Hu不變矩的臺標(biāo)識別[J].南京理工大學(xué)學(xué)報,2005,29(3):363-367.
[2]張博洋,曾向榮,劉振中.基于神經(jīng)網(wǎng)絡(luò)的靜態(tài)臺標(biāo)識別系統(tǒng)設(shè)計與實現(xiàn)[J].計算機仿真,2009,26(1):212-215.
[3]TEKALP A M.數(shù)字視頻處理[M].崔之祐,江春,陳麗鑫,譯.北京:電子工業(yè)出版社,1998.
[4]CASTLEMAN K R.數(shù)字圖像處理[M].朱志剛,林學(xué)訚,石定機,等譯.北京:電子工業(yè)出版社,1998.
[5]張顯全,李國祥,秦芳遠(yuǎn).基于小波變換和奇異值分解的剪紙紋樣識別[J].計算機工程與設(shè)計,2010,31(10):2280-2282,2286.