龐 博 成東坡
(1.商丘職業(yè)技術(shù)學(xué)院 河南 商丘:476100;2.濟(jì)源高級(jí)中學(xué) 河南 濟(jì)源:459000)
對(duì)比賽及訓(xùn)練錄像的重復(fù)觀察,進(jìn)行視頻點(diǎn)評(píng)和視頻分析,是教練和研究人員在訓(xùn)練和科學(xué)研究中使用的一種重要方法。從視頻圖像數(shù)據(jù)中提取關(guān)鍵信息能夠幫助運(yùn)動(dòng)員提升運(yùn)動(dòng)成績,提供技術(shù)支持,幫助其進(jìn)行運(yùn)動(dòng)恢復(fù)。然而,如何對(duì)海量的視頻進(jìn)行分類是一個(gè)關(guān)鍵問題。近年來,已經(jīng)有大量的研究人員,針對(duì)這一問題進(jìn)行了探索。其中,文獻(xiàn)[1]針對(duì)視頻的分類問題,提出一種基于隱馬爾可夫(Hidden Markov Model,HMM)模型的分類方法。該方法在各類運(yùn)動(dòng)訓(xùn)練視頻片段的連續(xù)幀中提取4維運(yùn)動(dòng)特征向量。文獻(xiàn)[2]提出一種基于類型標(biāo)志鏡頭與視覺詞袋模型相結(jié)合的視頻分類方法,并分別提出了單一視頻及混合視頻2種分類算法。文獻(xiàn)[3]提出一種多特征和神經(jīng)網(wǎng)絡(luò)相融合的視頻識(shí)別模型(MF-RBFNN),提取反映視頻的靜態(tài)和動(dòng)態(tài)特征進(jìn)行分類。
樸素貝葉斯分類器是機(jī)器學(xué)習(xí)一個(gè)常用的分類模型。本文提出了一種基于樸素貝葉斯分類器的視頻分類方法,該方法對(duì)視頻進(jìn)行特征提取,提取紋理、顏色以及亮度三種反映其運(yùn)動(dòng)類別的特征。然后,進(jìn)一步進(jìn)行基于樸素貝葉斯分類器的視頻分類。對(duì)于輸入的幾種特征,采用極大似然估計(jì),直至完成最終的分類。實(shí)驗(yàn)結(jié)果表明,提出的視頻分類方法取得了令人滿意的分類結(jié)果。
設(shè)視頻f有L個(gè)灰度級(jí),G表示灰度共生矩陣,其元素nij表示灰度分別為i和j的像素對(duì)的次數(shù)。其中:
nij=N{(x,y)|f(x,y)=i,
f(x+Δx,y+Δy)=j}
(1)
其中,f(x,y)表示像素點(diǎn)(x,y)處的灰度級(jí),Δx,Δy表示兩點(diǎn)間的方向θ和距離d。采用4種常用的紋理特征作為分類特征。
(2)
(3)
(4)
(5)
假定幀大小為M×N,并轉(zhuǎn)換為HSV模型,并劃分大小為h×v的k×k塊。其中h=M/K,v=N/K,以xi,m,n表示視頻中第n塊內(nèi)第i個(gè)像素點(diǎn)m分量的像素值。則視頻顏色特征為:
(6)
(7)
(8)
其中,ξm,n,xi,m,n,Sm,n分別表示第塊內(nèi)分量的均值、方差、三階矩。n∈[1,k×k],i∈[1,h×v],m∈[H,S,V]。
(9)
以y表示塊亮度比較編碼值,其中l(wèi)≤m≤k×k,2≤n≤k×k-1。
(10)
通過式(10)可對(duì)幀按塊亮度均值比較并進(jìn)行編碼。
貝葉斯分類器是已知的第一種概率分類器,它由所依據(jù)的方程式而得名[4-6]。樸素貝葉斯分類器是機(jī)器學(xué)習(xí)一個(gè)特別質(zhì)樸而深刻的模型[7-8]:當(dāng)你要根據(jù)多個(gè)特征而非一個(gè)特征對(duì)數(shù)據(jù)進(jìn)行分類的時(shí)候,可以假設(shè)這些特征相互獨(dú)立(或者你先假設(shè)相互獨(dú)立),然后利用條件概率乘法法則得到每一個(gè)分類的概率,然后選擇概率最大的那個(gè)作為機(jī)器的判定[9-10]。
給定一組訓(xùn)練數(shù)據(jù)集{(x1,y1),(x2,y2),…,(xm,ym)},其中,m是樣本的個(gè)數(shù),每個(gè)數(shù)據(jù)集包含n個(gè)特征,即Xi=(xi1,xi2,…,xin)。類標(biāo)記集合為{y1,y2,…,yk}。設(shè)p(y=yi|X=x)表示輸入的X樣本為x時(shí),輸出的y為yk的概率。假設(shè)現(xiàn)在給定一個(gè)新的樣本x,要判斷其屬于哪一類,可分別求解p(y=y1|x),p(y=y2|x),…,p(y=yk|x)的值。哪一個(gè)值最大就屬于哪一類,即求解最大的后驗(yàn)概率arg maxp(y|x)。具體求解方式,根據(jù)貝葉斯理論有:
(11)
一般的,樸素貝葉斯理論假設(shè)各個(gè)特征之間是相互獨(dú)立的,則上式可以寫成:
(12)
由于式(12)的分母,對(duì)于每一個(gè)p(y=yi|x)求解都是一樣的,所以實(shí)際操作中可以省略。最終,判別公式變?yōu)椋?/p>
(13)
在提取到視頻的顏色、亮度以及紋理特征之后,然后進(jìn)行基于樸素貝葉斯分類器的視頻分類。對(duì)于輸入的幾種特征,采用極大似然估計(jì)。在樸素貝葉斯法中,學(xué)習(xí)就是意味著估計(jì)先驗(yàn)概率p(y)和條件概率p(x|y),然后根據(jù)先驗(yàn)概率和條件概率,去計(jì)算新的樣本的后驗(yàn)概率p(y|x)。
其中,在先驗(yàn)概率p(y)的極大似然估計(jì)如下:
(14)
假設(shè)輸入樣本的第個(gè)特征的可能的取值集合為{αj1,αj2,…,αjsj},則條件概率p(x(j)|y=yi)的極大似然估計(jì)如下:
p(x(j)=αjl|y=yi)=
(15)
提出的視頻分類方法的實(shí)驗(yàn)流程如圖1所示。具體的實(shí)驗(yàn)步驟為:
圖1 提出的視頻分類方法的實(shí)驗(yàn)流程
(1)通過網(wǎng)絡(luò)搜集5種體育項(xiàng)目的運(yùn)動(dòng)視頻,分別為籃球、足球、斯諾克、蹦床、網(wǎng)球,圖2所示為5種項(xiàng)目的視頻幀圖像示例;
(2)使用MATLAB 2017將所有視頻幀的分辨率統(tǒng)一調(diào)整為400×370;
(3)在Windows XP下,利用VC++6.0進(jìn)行編程,對(duì)視頻圖像進(jìn)行特征提取,提取紋理、顏色以及亮度三種特征;
(4)將3種不同的特征進(jìn)行融合,采用極大似然估計(jì),直至完成最終的分類過程;
(5)輸出分類結(jié)果。
5種不同運(yùn)動(dòng)項(xiàng)目的訓(xùn)練集和測試集的視頻幀數(shù)、來自比賽場次情況如表1所示。
表1 幾種運(yùn)動(dòng)項(xiàng)目的視頻數(shù)據(jù)集情況
如圖3所示為足球運(yùn)動(dòng)視頻中的目標(biāo)提取結(jié)果示例,從圖3中可以看出,運(yùn)動(dòng)目標(biāo)較少和較多時(shí),提出的方法均可有效提取出運(yùn)動(dòng)目標(biāo)。
圖3 足球運(yùn)動(dòng)視頻中的目標(biāo)提取結(jié)果示例
最終的分類準(zhǔn)確率如表2 所示,其中對(duì)籃球、足球、斯諾克等5個(gè)運(yùn)動(dòng)項(xiàng)目均取得了90%以上的分類準(zhǔn)確性,由此驗(yàn)證了提出的分類方法的可靠性。
表2 不同項(xiàng)目視頻的分類準(zhǔn)確率
樸素貝葉斯分類器是分類算法集合中基于貝葉斯理論的一種算法,本文提出了一種基于樸素貝葉斯分類器的視頻分類方法。對(duì)視頻進(jìn)行特征提取,提取紋理、顏色以及亮度三種反映其類別的特征。在提取到視頻的顏色、亮度以及紋理特征之后,然后進(jìn)行基于樸素貝葉斯分類器的視頻分類。對(duì)于輸入的幾種特征,采用極大似然估計(jì),直至完成最終的分類。實(shí)驗(yàn)結(jié)果表明,對(duì)籃球、足球、斯諾克等5個(gè)運(yùn)動(dòng)項(xiàng)目均取得了90%以上的分類準(zhǔn)確性,提出的視頻分類方法取得了較為準(zhǔn)確的分類結(jié)果,證明了提出的方法的有效性。