王鳳領(lǐng)
摘要: 基于壓縮域視頻片段檢測(cè)可以省略解壓步驟,直接從原始視頻數(shù)據(jù)流提取特征,可以加快檢測(cè)率。本文首先分析了視頻數(shù)據(jù)的特性,視頻的分割和關(guān)鍵幀的選取,闡述現(xiàn)有的典型方法,通過分析視頻檢索技術(shù)的關(guān)鍵技術(shù),采用基于視頻分割和關(guān)鍵幀的壓縮視頻流提取方法,提出了一種基于DC系數(shù)和運(yùn)動(dòng)矢量從MPEG壓縮視頻中提取關(guān)鍵幀的方法。實(shí)驗(yàn)表明,所提出的方法可以減少計(jì)算負(fù)擔(dān),并可以更好地表示視頻內(nèi)容。
關(guān)鍵詞:壓縮視頻流; DC系數(shù); 運(yùn)動(dòng)矢量; 關(guān)鍵幀提取
中圖分類號(hào):TP391
文獻(xiàn)標(biāo)志碼: A
文章編號(hào): 2095-2163(2017)05-0079-04
0引言
視頻數(shù)據(jù)是一種非結(jié)構(gòu)化數(shù)據(jù)。數(shù)據(jù)的復(fù)雜性和數(shù)量巨大以及表達(dá)方法的匱乏均使得視頻存儲(chǔ)和檢索成為研究難題。為了便捷管理并充分利用視頻信息,視頻分析則尤顯必要。同時(shí)還需發(fā)掘科學(xué)合理的視頻組織結(jié)構(gòu)以提取視頻的特征并將其合成,以便有效地存儲(chǔ)和檢索視頻數(shù)據(jù)。
1視頻數(shù)據(jù)特征
不同于傳統(tǒng)的字符數(shù)字?jǐn)?shù)據(jù),視頻數(shù)據(jù)作為一種多媒體信息,實(shí)質(zhì)上則屬于非字符數(shù)字?jǐn)?shù)據(jù)。與傳統(tǒng)的字符數(shù)值數(shù)據(jù)相比,視頻數(shù)據(jù)具有更加豐富的內(nèi)容。對(duì)其可做如下解析:
1)視頻數(shù)據(jù)具有較高的信息分辨率。信息分辨率是指媒體提供細(xì)節(jié)的數(shù)目。視頻數(shù)據(jù)若輔以深入的觀察,可以逐漸得到一些新的細(xì)節(jié)。
2)視頻數(shù)據(jù)內(nèi)容的多樣性。視頻數(shù)據(jù)作為表示信息的媒介,整體上可以分為2種類型的內(nèi)容:稱為信息內(nèi)容的一類視頻內(nèi)容,具體指代了視頻包含語(yǔ)義內(nèi)容;另一種類型的視頻內(nèi)容,稱為音頻和視頻內(nèi)容,其中攜帶了包含在外部視覺表示中的視頻和音頻。
3)視頻數(shù)據(jù)解釋的多樣性和模糊性。視頻數(shù)據(jù)是連續(xù)重放的圖像信息,并且包含在圖像幀中的信息非常豐富。因而對(duì)圖片或視頻就可能生成不同的解釋,如此即與字符數(shù)值數(shù)據(jù)對(duì)視頻數(shù)據(jù)有完全準(zhǔn)確和客觀的解釋而有所不同的是,其中往往夾雜有個(gè)人主觀因素。在視頻數(shù)據(jù)庫(kù)中,經(jīng)常只是立足于查詢的相似性,即只是近似匹配的視頻數(shù)據(jù)查詢[1]。
[BT4]2視頻分段
視頻分割標(biāo)準(zhǔn)具有多樣性和復(fù)雜性的特點(diǎn)。對(duì)于不同的視頻對(duì)象及其應(yīng)用,視頻分段也是不同的。這就使得視頻數(shù)據(jù)在組織上將建立為多級(jí)樹結(jié)構(gòu)。例如,對(duì)于故事片的組織,從低到高級(jí)可以是鏡頭、場(chǎng)景和情節(jié)。一般來說,樹結(jié)構(gòu)的底部是透鏡。任何視頻流由許多場(chǎng)景組成。因此,視頻數(shù)據(jù)庫(kù),新的視頻數(shù)據(jù)流進(jìn)入數(shù)據(jù)庫(kù),數(shù)據(jù)模型應(yīng)該基于多級(jí)數(shù)據(jù)流分割,底層一般是透鏡分割。研究可知,在視頻分割結(jié)構(gòu)中,鏡頭是視頻剪輯的最重要形式,鏡頭技術(shù)的檢測(cè)相對(duì)來說已較為成熟[2]。
5.1MPEG視頻壓縮技術(shù)
對(duì)于MPEG壓縮標(biāo)準(zhǔn),當(dāng)視頻流被壓縮時(shí),幀被組壓縮(GOP-圖片組)。如圖1所示,I和P幀稱為參考幀。在每組圖像中,第1幀總是B幀,并且?guī)瑑?nèi)編碼用于基于塊(8×8)的離散余弦變換(DCT)來量化圖像。I幀中主要可用信息是DCT的DC系數(shù)。P幀使用前向預(yù)測(cè)幀間編碼,并且在前I幀或P幀中可定義參考幀和宏塊作為單位執(zhí)行運(yùn)動(dòng)預(yù)測(cè)和運(yùn)動(dòng)補(bǔ)償。主要可用信息是用于運(yùn)動(dòng)預(yù)測(cè)的前向運(yùn)動(dòng)矢量和用于運(yùn)動(dòng)補(bǔ)償?shù)念A(yù)測(cè)殘差的DCT系數(shù)。在B幀中則呈現(xiàn)了被雙向預(yù)測(cè)的3種類型的運(yùn)動(dòng)矢量,分別是:前向運(yùn)動(dòng)矢量、后向運(yùn)動(dòng)矢量和雙向運(yùn)動(dòng)矢量[11]。
[6結(jié)束語(yǔ)
根據(jù)視頻數(shù)據(jù)及其信息的特點(diǎn),探討研究了視頻的分割和關(guān)鍵幀的選取,綜述了現(xiàn)有的典型方法,通過分析視頻檢索技術(shù)的關(guān)鍵技術(shù),采用基于視頻分割和關(guān)鍵幀的壓縮視頻流提取方法,設(shè)計(jì)提出了一種基于DC系數(shù)和運(yùn)動(dòng)矢量從MPEG壓縮視頻中提取關(guān)鍵幀的方法。實(shí)驗(yàn)表明,本次研發(fā)提出的方法可以減少計(jì)算負(fù)擔(dān),并可以更好地表示視頻內(nèi)容。
參考文獻(xiàn):
胡圣武, 李鯤鵬. 三維GIS 關(guān)鍵技術(shù)的研究[J]. 地理空間信息,2008,6(3):9-12.
[2] 朱映映, 周洞汝. 一種從壓縮視頻流中提取關(guān)鍵幀的方法[J]. 計(jì)算機(jī)工程與應(yīng)用,2003(18):13-14,48.
[3] 王娣, 黃春毅. 基于內(nèi)容的視頻檢索[J]. 現(xiàn)代圖書情報(bào)技術(shù),2000(86):71-72,78.
[4] 陸燕, 陳福生. 基于內(nèi)容的視頻檢索技術(shù)[J]. 計(jì)算機(jī)應(yīng)用研究,2003(11):1-4.
[5] 張若英, 申銥京. 基于內(nèi)容的視頻檢索方法的研究[J]. 計(jì)算機(jī)工程與應(yīng)用,2004(6):196-199.
[6] 朱愛紅, 李連. 基于內(nèi)容的視頻檢索關(guān)鍵技術(shù)研究[J]. 情報(bào)檢索,2004(1):45-47.
[7] 彭宇新, CHONG_WAH N, 郭宗明,等. 基于內(nèi)容的視頻檢索關(guān)鍵技術(shù)[J]. 計(jì)算機(jī)工程,2004,30(1):14-16.
[8] 孟倩. 基于內(nèi)容檢索的視頻數(shù)據(jù)庫(kù)數(shù)據(jù)模型的研究[J]. 徐州師范大學(xué)學(xué)報(bào)(自然科學(xué)版), 2003,21(4):59-62. [ZK)]
[9] NAKAJIMA Y. A video browsing using fast scene cut detection for an efficient networked video database access[J]. IE ICE Transactions on Information & System, 1994, E77-D (12): 1335-1364.
[10]YEO B L, LIU B. A unified approach to temporal segmentation of motion JPEG and MPEG compressed video[C]//Proc IEEE Intconf on multimedia computing and systems. Washington,DC:IEEE, 1995: 81-89.
[11]KOPRINSKA I,CARRATO S. Temporal video segmentation:A survey[J]. Signal Processing Image Communication, 2001,16(5): 477-500.endprint