陳雙全
(武漢船舶職業(yè)技術(shù)學(xué)院電氣學(xué)院,湖北 武漢 430050)
面對海量視頻上傳請求,有限的審核員配備條件,不可能讓審核員將視頻認(rèn)真從頭看到尾,這就為不良人員提供了在正規(guī)視頻中插播非正規(guī)內(nèi)容的機會。而機械識別效率和準(zhǔn)確率仍然不能滿足工程應(yīng)用的要求。因此本系統(tǒng)提出了針對視頻興趣度排列組合的K-MEANS改進(jìn)聚類算法識別違規(guī)視頻,保證互聯(lián)網(wǎng)視頻內(nèi)容的健康性。
從視頻數(shù)據(jù)形成的角度來看,按照形成過程首先視頻內(nèi)容包含了多個視頻的圖像幀,由一連串圖像幀構(gòu)成了一個鏡頭,再由多組鏡頭構(gòu)成了一個場景,最后由多個場景片段組成視頻。在進(jìn)行視頻結(jié)構(gòu)化處理時,視頻流、場景分割、關(guān)鍵幀提取等都可以作為視頻內(nèi)容數(shù)據(jù)分析的組成部分。由此可見,視頻內(nèi)容識別有別于一般數(shù)據(jù)結(jié)構(gòu)性的關(guān)聯(lián)關(guān)系,視頻內(nèi)容非結(jié)構(gòu)化特征更為明顯。
對于一段視頻的內(nèi)容識別要首先對其按照視頻拍攝時的鏡頭進(jìn)行分割,無論是影片還是短視頻,都是由多個鏡頭組合而成,即使采用長鏡頭進(jìn)行拍攝通常也不會大于10分鐘。所以,在對鏡頭進(jìn)行分割時要從鏡頭切換點進(jìn)行分割,將視頻劃分出若干個鏡頭的組成。鏡頭與鏡頭之間存在濾鏡的過渡,在分割時要準(zhǔn)確把握濾鏡的切入點與切出點,由此進(jìn)行平均分割以達(dá)到鏡頭分割的準(zhǔn)確性。
鏡頭分割完成后,每一個鏡頭都包含一連串的圖像幀,圖像幀以圖像片段的形式存在,通過幀的滾動實現(xiàn)圖像的連貫性播放。圖像幀作為視頻內(nèi)容的基本組成單元,進(jìn)行鏡頭圖像內(nèi)容的聚類可采用有幀平均法和直方圖平均法進(jìn)行關(guān)鍵幀的提取。有幀平均法是對一組連貫的圖像幀以圖像內(nèi)容相似度聚類的平均值所屬關(guān)鍵幀圖像作為圖像內(nèi)容進(jìn)行識別,直方圖平均法是對鏡頭中圖像坐標(biāo)像素數(shù)的平均值作為圖像內(nèi)容進(jìn)行識別進(jìn)而得到關(guān)鍵幀的圖像。
對提取出來的關(guān)鍵幀圖像按照圖像特征數(shù)據(jù)庫進(jìn)行比對分析和聚類計算,圖像特征數(shù)據(jù)庫作為圖像內(nèi)容識別的基礎(chǔ),其包含了大量的非結(jié)構(gòu)化圖像特征,可通過對圖像特征的累計不斷豐富圖像特征數(shù)據(jù)庫的內(nèi)容,由此提高視頻內(nèi)容識別的準(zhǔn)確度。
現(xiàn)有視頻內(nèi)容識別算法主要包括:K均值模糊聚類算法和C均值模糊聚類算法?;贙均值聚類的視頻內(nèi)容識別均值算法模型如下:(1)選取K個聚類中心作為視頻內(nèi)容樣本的K均值聚類
(3)計算視頻內(nèi)容樣本各聚類中心的新向量值:
式中nj為Sj所包含的樣本數(shù)。
K均值偽代碼如下:
設(shè)定聚類數(shù)目K,最大執(zhí)行步驟tmax,一個很小的容忍誤差ε>0決定聚類中心起始位置Cj(0),0 實現(xiàn)原理是:設(shè)有視頻內(nèi)容像素點X={x1,x2,…,xn} ,將它分為c類,uik為xk對第i類的隸屬度,用一個模糊隸屬度矩陣U={uik}∈Rcn表示分類結(jié)果,必須滿足: 通過最小化關(guān)于隸屬度矩陣U和聚類中心V的目函數(shù)Jm(U,V)來實現(xiàn): 其中,U={uik}為滿足條件(1)的隸屬度矩陣,為c個聚類中心點集,m∈(1,+∞)為加權(quán)指數(shù),當(dāng)m=1時,模糊聚類就退化為硬C均值聚類。 第k個樣本到第i類中心的距離定義為: (1)初始化視頻內(nèi)容樣本的聚類中心V={v1,v2,…,vc} ; (2)用隨機數(shù)的方式初始化視頻內(nèi)容樣本的屬性度量矩陣; (3)計算C均值聚類算法的視頻內(nèi)容樣本的隸屬度矩陣: 其中,A為p×p的正定矩陣,當(dāng)A=I時,即為歐氏距離。 C均值聚類算法的聚類模型描述如下: (5)重復(fù)步驟三和四直至公式6的結(jié)果處于收斂狀態(tài)。 C均值聚類偽代碼如下: 輸入:總數(shù)K,尺度tmax,誤差ε>0,起始位置Cj(0),0 針對現(xiàn)有的K-MEANS算法在流媒體視頻中的聚類結(jié)果往往趨于孤立點的問題以及時間復(fù)雜度為O(n2)不利于對流媒體系統(tǒng)中大數(shù)據(jù)量的挖掘的問題,本文采用的是基于排列組合思想的K-MEANS聚類改進(jìn)算法。 K-MEANS聚類改進(jìn)算法的設(shè)計流程:For i=0;i if(e∈E){//如果待測元素e屬于極大聚類集合 本文對現(xiàn)有視頻內(nèi)容識別算法進(jìn)行分析,包括:K均值模糊聚類算法和C均值模糊聚類算法,提出了基于改進(jìn)的K-均值聚類算法的視頻內(nèi)容識別設(shè)計思想,并通過算法的設(shè)計流程完成對K-MEANS聚類改進(jìn)解決流媒體視頻中的聚類結(jié)果趨于孤立點的問題以及時間復(fù)雜度為O(n2)不利于對流媒體系統(tǒng)中大數(shù)據(jù)量的挖掘的問題,該方法基于排列組合的K-MEANS聚類算法深層次挖掘策略的內(nèi)在規(guī)則,對于更好地識別視頻內(nèi)容有著較好的實現(xiàn)效果。 [1]徐勇.基于聚類算法的內(nèi)容識別研究[J].電腦與電信,2016(11):39-41. [2]孟彩霞.大數(shù)據(jù)環(huán)境下不良網(wǎng)絡(luò)內(nèi)容識別技術(shù)研究[J].軟件導(dǎo)刊,2015,14(11):19-21. [3]岳曉峰,龔青池.視頻流圖像字符識別算法的研究和實現(xiàn)[J].機械工程與自動化,2015(4):73-75.4.2 K-MEANS聚類改進(jìn)算法設(shè)計
5 結(jié)語