薛 峰,廖小兵
(上海理工大學(xué),上海200093)
計算機已成為日常生活和工作中必不可少的一部分。其中,由文本、聲音以及圖像等多種形式綜合而成的多媒體便成為信息時代的代表產(chǎn)物,因其將傳輸、儲存等媒體功能科學(xué)化整合,為使用者提供多種形式的信息展現(xiàn),使得獲取到的信息更加生動[1]。與此同時,被動信息傳播的出現(xiàn)令人們對冗雜信息產(chǎn)生反感,因此,根據(jù)信息內(nèi)容及性質(zhì),對不同種類信息進行有效劃分,成為當(dāng)下數(shù)據(jù)分析的主要研究對象。
文獻[2]為了提高分類精度,提出了基于數(shù)據(jù)點本身及其位置關(guān)系輔助信息挖掘分類方法。首先,根據(jù)網(wǎng)絡(luò)節(jié)點連接特征確定節(jié)點以及子網(wǎng)絡(luò)頻率,定義節(jié)點濃度,使用迭代計算方式計算節(jié)點實際影響力;其次,充分挖掘并處理蘊含在數(shù)據(jù)點關(guān)聯(lián)作用中的信息,將得到的挖掘結(jié)果作為數(shù)據(jù)點物理特征之外的輔助信息,在保證分類精度的前提下,構(gòu)建基于數(shù)據(jù)點本身及其位置關(guān)系的信息挖掘分類函數(shù);最后,通過人造數(shù)據(jù)集合真實數(shù)據(jù)集的仿真驗證了所提方法的有效性。文獻[3]在海量圖像信息中獲得想要的有效信息,提出了一種圖像場景的獨立子空間ISA分類方法。首先,基于ISA網(wǎng)絡(luò)模型特征,結(jié)合空間金字塔匹配模型和支持向量機分類器完成圖像場景分類,獲取到信息特征變化基元;其次,利用獲取到的特征基元獲取信息塊描述子,使用空間金字塔匹配模型對信息特征進行描述;最后,在場景數(shù)據(jù)集上與其它方法對比進行仿真,結(jié)果表明所提方法具有一定的準(zhǔn)確性。
由于上述所提方法存在耗時長、分類計算過程復(fù)雜,無法應(yīng)用于大量多媒體信息中。因此,本文通過邊緣模糊方式確定多媒體信息特征,結(jié)合邊緣點導(dǎo)數(shù)變化確定同類信息交叉位置,建立高斯函數(shù)邊緣模糊算子歸納同類信息得到最優(yōu)解,仿真結(jié)果表明所提方法具有更高的可行性。
多媒體信息分類中需選取常見特征,主要方法有:選取信息頻率、增益信息提取、X2統(tǒng)計、信息互換、信息交叉熵以及文本證據(jù)權(quán)等方法[4]。針對信息分類中的邊緣模糊確定問題,利用增益信息與X2統(tǒng)計兩種方法對信息特征進行提取。
增益信息是建立在熵的評估方法之上,在對多媒體信息進行特征選擇時,需判定某個關(guān)鍵詞的出現(xiàn)頻率,以及文本中是否包含其它類型的信息,通常將該種特征提取定義為某一特征函數(shù)在文本中出現(xiàn)頻率的差值,計算方法如式(1)所示
(1)
增益信息特征計算是一種可有效確定信息類型的選擇算法,體現(xiàn)在多媒體信息分類中被大面積推廣應(yīng)用,與此同時還可獲取到最佳分類結(jié)果,并為后續(xù)邊緣模糊確定奠下良好基礎(chǔ)。
通過獲取到的增益信息特征從而確定歸屬于邊緣的信息節(jié)點,邊緣模糊計算需借助一階和二階導(dǎo)數(shù)極值、過零進行判定[5]。邊緣點模糊確定導(dǎo)數(shù)曲線如圖1所示。
圖1 邊緣點模糊確定導(dǎo)數(shù)曲線
在圖1中,實線表示點V周圍的灰度變化,點劃線則代表點H周圍的一階導(dǎo)數(shù)曲線改變情況,曲線則表示對應(yīng)點的二階導(dǎo)數(shù)情況,點A為一階導(dǎo)數(shù)曲線的局部極值,點C為二階導(dǎo)數(shù)曲線的零交叉位置,與y軸相對應(yīng)的平行線AC代表點A、V、C三點位于同一條直線。
若要判斷一個文本信息是否屬于邊緣點時,可沿一類像素點的梯度方向進行二階導(dǎo)數(shù)零交叉方式,如圖2所示。
圖2 邊緣梯度插值圖
為了清楚描述點V是否為邊緣點,需將點V區(qū)域的像素點描繪成一個網(wǎng)格圖,此時點B的梯度方向線r與網(wǎng)格相交點H是B在梯度方向中的最近點[7]。但點H或許不是B的最近像素之一,因此,結(jié)合線性插值方式將H的一階和二階導(dǎo)數(shù)進行如下定義
rH1=(1-α)r1(xV,yV+1)+αr1(xV+1,yV+1)
(2)
rH2=(1-α)r2(xV,yV+1)+αr2(xV+1,yV+1)
(3)
式(2)和式(3)中,r1和r2分別表示坐標(biāo)(xV,yV+1)和(xV+1,yV+1)相對應(yīng)的導(dǎo)數(shù)值。假設(shè)點V和點H的二階導(dǎo)數(shù)出現(xiàn)由正至負(fù)的變化,則可確定兩點間存在零交叉點[8]。
基于由上述邊緣點函數(shù),結(jié)合高階函數(shù)的一階導(dǎo)數(shù),可建立出邊緣模糊確定算子[9]。
將設(shè)θ(x,y)的平均值設(shè)為0,高斯函數(shù)方差為σ2,則可得到θ(x,y)的尺度轉(zhuǎn)變方程
θ(x,y)=(1/s2)θ(x/s,y/s)
(4)
其中,s為信息伸縮變量,則
(5)
以及
(6)
通過式(5)和式(6)可看出在信息伸縮變量s上,可將信息函數(shù)f(x,y)的小波分類變化定義為
(7)
為了確定多媒體中的邊緣候選位置,選取n個鄰近的整數(shù)范圍,將s=m,m+1,…,m+m-1,m∈Z*視作模糊尺度,經(jīng)計算得到各邊緣模糊算子。需分類信息與模糊算子進行卷積[11],局部范圍內(nèi)最大數(shù)值點即為確定分類的候選邊緣。將邊緣幅度閾值用Ts表示,幅度數(shù)值大于Ts的候選點作為邊緣確定點。對閾值小于ls的邊緣范圍進行刪除,令確定出的信息類型有更高的可信度,一般情況下,ls的數(shù)值設(shè)為20。結(jié)合實際情況選取m和m+1數(shù)值,同時要滿足最小尺度下分類信息最為準(zhǔn)確,其它外在因素對邊緣確定影響最小、尺度最大時信息邊緣失真最小[12]。
圖3 鄰近信息空間模糊確定邊緣點
如圖3所示,信息伸縮變量s的集合為M,s+1區(qū)域內(nèi)的邊緣點為(i,j),表示為Fs,s+1(i,j)。使用Cs,s+1(i,j)表示變量s空間位置(i,j)與s+1區(qū)域內(nèi)的關(guān)聯(lián)性,可描述為
Cs,s+1(i,j)
(8)
式(8)中,As(i,j)表示s邊緣點(i,j)的梯度關(guān)系,α為邊緣點閾值差,設(shè)為30°。若Cs(i,j)=1,則表示在信息伸縮量s中邊緣點(i,j)與s+1邊緣點為同一類型,反之則不屬于一類。
3.3.1 邊緣模糊確定分類最優(yōu)解
假設(shè)多媒體信息集合X={x1,x2,…,xn}中每類信息有m個特征,即xi={xi1,xi2,…,xim},再將X按照邊緣點閾差分成N類,此時得到N的分類中心為V={v1,v2,…,vn},其中
(9)
即
(10)
據(jù)式(10)可得到最佳信息劃分矩陣表示為B,其中
(11)
多媒體信息特征在模糊空間中使用μAn(Fi)表示,稱其為Fi類型對信息集合的隸屬度,也被稱為隸屬函數(shù),如圖4所示,為隸屬函數(shù)和模糊空間關(guān)系圖。
圖4 隸屬函數(shù)和模糊空間
隸屬度表達了一種信息類型屬于某一個模糊概念程度。若隸屬度越大,說明該信息屬于該種類的相似程度越高。以多媒體信息中心的文本內(nèi)容為例,描述為{青年,中年,老年},以年齡21歲的人為例,可使用μ青年(x,20)=1表示此人為青年類型。
綜上所述,可將邊緣模糊確定描述為
(12)
式(12),m(i)表示第i個信息用邊緣模糊集合時的語義關(guān)系數(shù)量。例如,m(i)=3體現(xiàn)邊緣模糊點至信息類型的映射。
3.3.2 信息分類中的邊緣模糊評價
當(dāng)單因素邊緣模糊確定結(jié)果僅代表一種因素對分類對象產(chǎn)生的影響,為了得到更精準(zhǔn)的分類結(jié)果,將所有影響因素綜合,即
=(b1,b2,…,bt)
(13)
上式(13)中,L為邊緣綜合模糊分類集合,bt表示綜合考慮所有影響因素后,分類對象對文本集合中第t類對象的影響程度。由此可見,集合L也可被稱為分類集合的模糊子集。
通過得到的邊緣模糊確定導(dǎo)數(shù),可解決分類方法計算復(fù)雜的問題,并提高分類結(jié)果的準(zhǔn)確率。邊緣模糊確定方法在計算流程方面從定性角度進行簡化推理及分析,得到簡潔、可靠和快捷的分類方法,令算法更實用。
假設(shè)一個多媒體信息庫,將分類條件設(shè)為“年齡25歲左右,身高在175cm上下”的人,使用本文所提邊緣模糊確定分類方法計算步驟如下:
1)將年齡為25,身高為175設(shè)為分類中心條件,對信息進行邊緣模糊化導(dǎo)數(shù)處理,因身高的確定程度高于年齡,確定分類條件設(shè)為Q={0.74,0.24,0,0.7,0.1},將該類特征確定為ω1=1/3、ω2=2/3。
2)確定多媒體信息中的各種幾率,計算出邊緣模糊距離以及相似程度。
通過仿真條件,使用文獻[2]和文獻[3]提出的方法對多媒體信息進行分類檢索,在相同實驗背景下,使用本文所提邊緣模糊確定方法的準(zhǔn)確率與以上兩種方法進行對比,分類結(jié)果如圖5所示。
圖5 本文方法與文獻方法對比
分析圖5中的實驗結(jié)果可看出:在參與分類的15個信息特征中,本文提出的邊緣模糊確定方法要明顯優(yōu)于文獻兩種方法,使用所提方法,分類性能更優(yōu)。
表1 與{25,175}的最佳分類結(jié)果
采用邊緣模糊確定方式對多媒體信息進行劃分,得到如表1所示的各類型信息的模糊距離及相似度,分析計算結(jié)果可知:{24,173}、{26,177}都是與{25,175}最為相似的,而{21,168}就沒有{25,175}的相似度高。
表2 分類過程中不同方法寬帶利用率/%
根據(jù)實際經(jīng)驗可知,網(wǎng)絡(luò)寬帶的利用率越低說明網(wǎng)絡(luò)運行速度越快,當(dāng)網(wǎng)絡(luò)寬帶的利用率低于35%時,信息分類計算方式對網(wǎng)絡(luò)運行速度的影響程度可忽略,從表2中可看出:邊緣模糊確定方法在多媒體信息分類中的寬帶利用率在29.2%~30.9%之間,相比其它兩種方法對網(wǎng)絡(luò)運行的影響程度較小,確保了多媒體信息分類的效率。
針對多媒體信息內(nèi)容復(fù)雜、發(fā)展迅速的特點,為了提高信息分類效率,本文提出多媒體信息分類中的邊緣模糊確定方法仿真。經(jīng)與文獻[2]和文獻[3]方法的仿真結(jié)果對比表明:采用邊緣模糊確定方法進行多媒體信息分類效果更好。因為其考慮了不同信息存在的特征差異,并在分級計算過程中為不同類型特征信息提供不同的閾值,使得分類結(jié)果更為準(zhǔn)確,可被應(yīng)用于其它分類模式中,有廣泛應(yīng)用推廣價值。
目前存在著多種多樣的信息分類方法,如何高效識別出信息特征,便于更有效地達到多媒體信息分類的目的,成為當(dāng)下分類研究中的重要問題。多媒體信息是有一定粒度的,結(jié)合多媒體中圖像或文本含義的力度將信息由上而下確定出邊緣模糊特征,通過某種映射關(guān)系按特征進行歸類。隨著各行各業(yè)更加垂直細(xì)分的應(yīng)用出現(xiàn),“大雜燴”式的信息分類也會逐漸被淘汰,只有進行掠奪式的信息變現(xiàn),才能在下一個轉(zhuǎn)型中放手一搏。因此,只有進一步提高信息分類效率、提高信息分類的準(zhǔn)確程度,才能在信息龐雜中取得一定成績。