李凱敏 齊赫 苗莉 ??诮?jīng)濟(jì)學(xué)院
在整個(gè)多媒體數(shù)據(jù)的研究中,多媒體數(shù)據(jù)得到了大量的涌現(xiàn),因此也產(chǎn)生了各種各樣的多媒體數(shù)據(jù)庫,這些數(shù)據(jù)庫的容量十分之大,內(nèi)容也越來越豐富多彩,和過去的一些多媒體的數(shù)據(jù)研究相比較起來,過去的多媒體研究的側(cè)重點(diǎn)在于對基本內(nèi)容的一些檢索和探索,這雖然在一定程度上,可以解決信息搜索和信息資源發(fā)現(xiàn)的問題,但是另外一方面,人們對于信息的需求程度越來越高,對于信息的處理應(yīng)用方面也越來越廣泛,因此這種以前的多媒體數(shù)據(jù)研究不能夠很好地滿足這些問題。
在多媒體數(shù)據(jù)挖掘研究的過程中,將其與傳統(tǒng)的數(shù)據(jù)挖掘進(jìn)行比較的話,我們會發(fā)現(xiàn)其中有幾個(gè)需要我們?nèi)ソ鉀Q的問題,比如多媒體數(shù)據(jù)地非結(jié)構(gòu)化的問題,我們應(yīng)當(dāng)在這些數(shù)據(jù)上進(jìn)行一定的挖掘,從而獲取相關(guān)的一些知識,除此以外,在多媒體數(shù)據(jù)中,其特征向量往往是數(shù)十維,有時(shí)候甚至是數(shù)百維的,那么我們對于如何對于高維矢量進(jìn)行數(shù)據(jù)的挖掘,也是一項(xiàng)重要的問題。
在多媒體的數(shù)據(jù)挖掘中,有很多種的系統(tǒng)結(jié)構(gòu),需要我們對其進(jìn)行一一分析,首先就是多媒體的數(shù)據(jù)收集。一般來說,對于一些大型的多媒體的數(shù)據(jù)集,其可能會包含幾十萬幅的照片以及上千個(gè)小時(shí)的音視頻文件等等,而對于這些文件,其媒體的結(jié)構(gòu)和元數(shù)據(jù)庫中的描述是相關(guān)聯(lián)的,這樣便可以用于可視化的表現(xiàn)和存取了。
在這種模塊中,其主要是針對多媒體中的一些原始數(shù)據(jù)進(jìn)行相關(guān)的預(yù)處理,并且從中提取出數(shù)據(jù)的有效特征,進(jìn)而可以將特征矢量,通過元數(shù)據(jù)的這種形式記錄在整個(gè)元數(shù)據(jù)庫之中。而關(guān)于元數(shù)據(jù)庫的話,這是一種按照挖掘的一些相關(guān)要求,進(jìn)行組織起來的,一種多維的、多層次的、多媒體屬性的數(shù)據(jù)庫,其可以起到支持高效率多媒體挖掘的作用。
在多媒體的數(shù)據(jù)挖掘中,往往要涉及到關(guān)于挖掘引擎的相關(guān)內(nèi)容,關(guān)于挖掘引擎,其包含著一組快速的挖掘算法,這其中比如分類、聚類、關(guān)聯(lián)等等,在這種挖掘引擎種,系統(tǒng)是可以根據(jù)一些具體的應(yīng)用,來對于一些挖掘算法進(jìn)行選擇,其可以選擇一個(gè)算法,同時(shí)也可以選擇多種相對應(yīng)的算法,同時(shí)對于元數(shù)據(jù)庫進(jìn)行一定的挖掘。在元數(shù)據(jù)庫中,這里面的特征矢量一般情況下來講,其都是高維的,然而對于一些傳統(tǒng)的數(shù)據(jù)挖掘方法來說,其一般情況下來將,都是只適用于一些比較低緯的數(shù)據(jù),那么在這個(gè)時(shí)候,如果我們?nèi)匀皇褂眠@些方法來對于這些高緯矢量進(jìn)行處理,那么將會起到一些非常不理想的效果,那么這也就是我們經(jīng)常性講到的維度災(zāi)難。那么我們?yōu)榱吮苊膺@種唯獨(dú)災(zāi)難,或者是克服這種維度災(zāi)難的影響,便有很多的針對高維數(shù)據(jù)引結(jié)構(gòu)的一些經(jīng)典的算法被提了出來。
最后涉及到的系統(tǒng)就是用戶接口系統(tǒng)了,在這種用戶接口系統(tǒng)中,我們一般可以實(shí)現(xiàn)挖掘結(jié)果的可視化以及界面的解釋,同時(shí)也可以實(shí)現(xiàn)為用戶提供的相關(guān)便捷措施和系統(tǒng)。由于多媒體具有試聽的特性以及時(shí)空的特性這兩種特點(diǎn),因此挖掘出來的一些模式應(yīng)當(dāng)用一種新的表現(xiàn)方式加以呈現(xiàn),比如導(dǎo)航式的知識開展以及交互式的問題求解等等,除此以外,還有提供挖掘結(jié)果的可視化的接口。
在多媒體數(shù)據(jù)挖掘中,比較廣泛應(yīng)用的就是圖像挖掘的技術(shù)了,然而原始的圖像是不能夠被直接挖掘的,因此我們便需要對于這些原始圖像進(jìn)行一定的處理,在對這些圖像進(jìn)行預(yù)處理完成之后,再得以生成一些可以供一些高層挖掘模塊使用的一些圖像特征,并且通過綜合處理形成一個(gè)數(shù)據(jù)庫,最后便可以在形成的數(shù)據(jù)庫的基礎(chǔ)之上,完成對于一些圖像的數(shù)據(jù)挖掘的相關(guān)操作。
除了圖像挖掘以外,視頻挖掘也是其中的一個(gè)重要的內(nèi)容,對于視頻的挖掘一般具有兩種,其一是根據(jù)視頻的結(jié)構(gòu)進(jìn)行的預(yù)處理,這種處理模式,其原理在于針對某些視頻在內(nèi)容構(gòu)造上的結(jié)構(gòu)特性,通過一定的規(guī)則算法來將這些視頻進(jìn)行劃分。其次是視頻運(yùn)動的目標(biāo)識別,這種模式的原理則在于,通過從視頻種對于跟蹤運(yùn)動目標(biāo)的分割,從而提取出運(yùn)動目標(biāo)的一些本質(zhì)上的特征以及運(yùn)動上的特征,由此實(shí)現(xiàn)視頻的挖掘。
作為一種聽覺媒體,音頻具有很多特征,其中包括基音、音調(diào)、旋律等等,而對于音頻的哇據(jù)也是重要的一個(gè)研究方向,其挖掘通常也有兩種途徑,其一是運(yùn)用語音識別的技術(shù),來將一段語音識別成文字,進(jìn)而將音頻挖掘轉(zhuǎn)換成文字挖掘。其二則是直接從一段音頻種提取聲音特征,進(jìn)而對音頻實(shí)現(xiàn)挖掘。
在多媒體挖掘和發(fā)展的整個(gè)過程中,我們面臨了很多問題,也解決了很多問題,在目前,多媒體的挖掘技術(shù)已經(jīng)取得了很大的進(jìn)展,而針對不同的媒體,比如圖像、視頻、音頻等等,我們應(yīng)當(dāng)采取不同的挖掘辦法,那么同時(shí),我們對于多媒體挖掘技術(shù)的深入研究,也將成為未來發(fā)展的一個(gè)重要點(diǎn),同時(shí)也會為將來的多媒體發(fā)展起到重要的作用。
[1]易黎,楊長春,馮建彪.基于多媒體數(shù)據(jù)庫的數(shù)據(jù)挖掘模型和方法[J].江蘇工業(yè)學(xué)院學(xué)報(bào),2010,22(01):35-39.
[2]康健輝.多媒體數(shù)據(jù)挖掘技術(shù)淺析[J].重慶科技學(xué)院學(xué)報(bào)(自然科學(xué)版),2007(04):85-88.
[3]王志鋒,李殿偉.多媒體數(shù)據(jù)庫的管理與數(shù)據(jù)挖掘研究[J].計(jì)算機(jī)與數(shù)字工程,2007(10):50-53+188.