【摘 要】對(duì)基于分子濾波的聲圖像分析進(jìn)行了深入分析,同樣對(duì)分析的辦法及目的進(jìn)行了探討。
【關(guān)鍵詞】分子濾波 聲圖像 分析
運(yùn)動(dòng)標(biāo)點(diǎn)的檢測(cè)與分析是視覺應(yīng)用范圍的一個(gè)重要的問題,對(duì)于視聲覺范圍而言,最后的目的也是要完成對(duì)水下標(biāo)點(diǎn)的分析和確定。參考分子濾波的發(fā)展形勢(shì)和分子濾波分析法容易完畢和強(qiáng)魯棒性等優(yōu)點(diǎn),所以本文只對(duì)基于分子濾波的分析算法進(jìn)行了研討。
運(yùn)動(dòng)標(biāo)點(diǎn)分析的目的即是找到同一標(biāo)點(diǎn)在不同幀中的位置。傳統(tǒng)的標(biāo)點(diǎn)跟蹤辦法只有:模型一致法、流光法、加爾門和擴(kuò)展加爾門等辦法,模型一致法也即是通過要檢測(cè)的標(biāo)點(diǎn)的模型與圖象中全部的未知物體進(jìn)行比較。如果某一未知物體與該模型一致,則該物體即被檢測(cè)出來,認(rèn)為是與模型相同的物體,這是一種簡單的標(biāo)點(diǎn)分析辦法,它完畢起來也比較容易,但一致歷程的搜索空間會(huì)隨著圖象大小和模型大小的增大而急劇增加,若非有專門的硬件支持,否則這種辦法會(huì)非常浪費(fèi)時(shí)間,大大降低標(biāo)點(diǎn)分析的效率;流光法是分析標(biāo)點(diǎn)運(yùn)動(dòng)的常用辦法,但在強(qiáng)雜波和強(qiáng)噪聲圖象背景下,流光分析辦法是不穩(wěn)妥的:加爾門濾波是有效的線性最優(yōu)推測(cè)科技,但不能處理非線性和非高思狀況。
人們?yōu)榇嗽岢隽薑aman Etended Filtter狀況推測(cè)科技,但其狀況推測(cè)的有效性仍然嚴(yán)重依賴范圍模型的精確性,而建立精確的范圍模型是非常困難的。近年來為了更好的處理非線性非高思情況下的運(yùn)動(dòng)范圍狀況推測(cè)問題,人們提出了分子濾(Particle Filter),分子濾波又叫Bayesian Bootstrap Filter或Monte Carlo Filter是以Monte Carlo隨機(jī)模擬理論為根基,通過范圍狀況后驗(yàn)分布用一組加權(quán)隨機(jī)模擬理論為根基,新的狀況分布利用這些隨機(jī)抽樣Bayesian迭代進(jìn)化產(chǎn)生。當(dāng)今分子濾波已成為視覺分析,機(jī)械學(xué)習(xí)和機(jī)械人確定等領(lǐng)域的一研討熱點(diǎn)。
一、分子濾波的聲圖像分析
拜頁思濾波與分子濾波器無論是在航天航空還是在自動(dòng)化,通訊等各個(gè)領(lǐng)域,都廣泛存在“推測(cè)”的問題。所謂“推測(cè)”,即是從帶有隨機(jī)誤差的觀察數(shù)據(jù)中推測(cè)出某些參考數(shù)值或某些狀況變量。對(duì)于圖象分析來說,利用對(duì)標(biāo)點(diǎn)的觀察(即獲取每幀圖象),可以對(duì)標(biāo)點(diǎn)每一時(shí)間的運(yùn)動(dòng)狀況進(jìn)行推測(cè)。這時(shí)標(biāo)點(diǎn)的運(yùn)動(dòng)狀況可以包括標(biāo)點(diǎn)的位置,姿態(tài),大小等等。推測(cè)問題基本分為三類:從當(dāng)前和過去的觀察值來推測(cè)訊號(hào)的當(dāng)前值,稱為濾波;從過去的觀察值來推測(cè)訊號(hào)的現(xiàn)在值或通過來值,稱為預(yù)測(cè)或外推;從過去的觀察值來推測(cè)過去的訊號(hào)值,稱為平滑或內(nèi)插。對(duì)于圖象分析來說,濾波的目的即是根據(jù)當(dāng)前時(shí)間獲得的圖象和之前所獲得的圖象,對(duì)標(biāo)點(diǎn)當(dāng)前時(shí)間的運(yùn)動(dòng)狀況進(jìn)行推測(cè)。
運(yùn)動(dòng)空間模型是一個(gè)非常重要的統(tǒng)計(jì)分析工具,它用范圍方程來描述狀況隨時(shí)間演變的歷程,并用觀察方程來描述與狀況有關(guān)的噪聲變量。拜頁思濾波理論基于上述運(yùn)動(dòng)空間模型的遞推結(jié)構(gòu),利用全部的已知訊息來建造范圍狀況變量的后驗(yàn)幾率密度,利用范圍模型預(yù)測(cè)狀況的先驗(yàn)幾率,再利用最新的觀察值進(jìn)行修正得到后驗(yàn)幾率密度,這樣它就包括了觀察值和先驗(yàn)知識(shí)在內(nèi)的全部可利用的訊息,推測(cè)誤差較小。另外,拜頁思濾波通過未知參考數(shù)值看作隨機(jī)變量,得到的推測(cè)值是該變量的一個(gè)特定完畢,所以拜頁思推測(cè)適合于處理非線性和非高思范圍的狀況推測(cè)問題。
蒙得加洛辦法又稱為隨機(jī)抽選法或統(tǒng)計(jì)試驗(yàn)辦法,其基本思路是把實(shí)際求解的問題描述成某種隨機(jī)變量,然后從已知幾率分布抽選,最后建立各種推測(cè)量。蒙得加洛辦法特別適用于無法用數(shù)學(xué)工具進(jìn)行精確描述的場合,分子濾波辦法是蒙得加洛辦法和拜頁思辦法的結(jié)合,是求解拜頁思推測(cè)問題的一個(gè)實(shí)用算法。分子濾波的中心思想是用一組加權(quán)的隨機(jī)抽樣。當(dāng)抽樣數(shù)足夠多時(shí),可以近似于真實(shí)的后驗(yàn)幾率分布。范圍運(yùn)動(dòng)求解由拜頁思迭代推理歷程完畢,分子濾波算法不用滿足范圍為線性,噪聲高思分布,后驗(yàn)幾率也是高思型的限制條件,所以應(yīng)用面更廣。同樣因?yàn)榉肿訛V波具有拜頁思濾波的時(shí)域遞推構(gòu)型,所以不用儲(chǔ)存全部時(shí)間的歷史數(shù)據(jù),運(yùn)算時(shí)也只需要上一時(shí)間的推測(cè)值和當(dāng)前時(shí)間的觀察值,對(duì)運(yùn)算機(jī)的儲(chǔ)存要求小,增加了運(yùn)算速度。
本文中所探討的均是基于識(shí)別的標(biāo)點(diǎn)分析辦法,綜上所述,對(duì)標(biāo)點(diǎn)的分析即是在聲圖象序列中尋找與標(biāo)點(diǎn)相一致的部位,這個(gè)尋找的歷程利用對(duì)標(biāo)點(diǎn)狀況進(jìn)行推測(cè)來完畢。通過分子濾波這種實(shí)用的推測(cè)問題求答案辦法引入聲圖象分析領(lǐng)域,建造出基于分子濾波的分析框圖,并結(jié)合標(biāo)點(diǎn)各個(gè)層次的特點(diǎn),建造性能良好的分析器,實(shí)驗(yàn)證明分子濾波分析辦法具有良好的魯棒性。
二、分析的辦法及目的
為簡化分析問題,本文只考慮平移模型,需要求解標(biāo)點(diǎn)的兩個(gè)運(yùn)動(dòng)參考數(shù)值T=TX,TY,其中T,X和T,Y分別為水平方向和垂直方向的標(biāo)點(diǎn)中心點(diǎn)的位置。這樣一個(gè)分子點(diǎn)就表示標(biāo)點(diǎn)的一種可能的運(yùn)動(dòng)狀況,即具有一組可能的運(yùn)動(dòng)參考數(shù)值(T)。根據(jù)分子的運(yùn)動(dòng)參考數(shù)值,即可求出該分子所對(duì)應(yīng)的標(biāo)點(diǎn)模型的一種變形情況,利用運(yùn)算這個(gè)變形模型與實(shí)際圖象的相關(guān)值,對(duì)分子賦予與相關(guān)值成比例的權(quán)值,由分子加權(quán)來表示標(biāo)點(diǎn)狀況的后驗(yàn)幾率。
標(biāo)點(diǎn)的先驗(yàn)知識(shí)標(biāo)點(diǎn)的先驗(yàn)知識(shí)包括圖象模型和標(biāo)點(diǎn)的初始運(yùn)動(dòng)參考數(shù)值。標(biāo)點(diǎn)模型具有一定的先驗(yàn)特點(diǎn),基本認(rèn)為是區(qū)別其他標(biāo)點(diǎn)的特點(diǎn),例如標(biāo)點(diǎn)的色度特點(diǎn),輪廓,和分布色度等。用于描述標(biāo)點(diǎn)的“模型”是標(biāo)點(diǎn)某些特點(diǎn)量的集合,根據(jù)對(duì)先驗(yàn)知識(shí)的利用程度,我們通過其分為三類:第一類是利用圖象部位區(qū)域象素點(diǎn)的色度構(gòu)成的模型;第二類是以圖象的底層特點(diǎn)構(gòu)成的模型,以輪廓為代表;第三類是圖象的高層特點(diǎn)構(gòu)成的模型,基本具有語義性質(zhì),并一致人類的一些視覺特點(diǎn),例如Gabbor小波特點(diǎn)等。本文選擇用色度分布來描述標(biāo)點(diǎn),并利用比較標(biāo)點(diǎn)抽樣和參考標(biāo)點(diǎn)的灰度分布,建立范圍觀察模型,同樣標(biāo)點(diǎn)的色度分布和描述的是一種比較適當(dāng)?shù)臉?biāo)點(diǎn)描述方法,它能減輕標(biāo)點(diǎn)的部位遮蓋,翻轉(zhuǎn)和型變對(duì)分析算法的影響。這種辦法的缺點(diǎn)是如果沒有更新模型,分析的穩(wěn)定性通過性下降,但本文通過聲圖象先處理成二值圖象再分析,這種缺點(diǎn)不是非常顯著。