圖像序列的顯著性目標區(qū)域檢測方法
柯洪昌,孫宏彬
摘要:目的:視覺注意機制可以快速定位到當前圖像中的一些顯著性區(qū)域。視覺注意計算機模型可以不用人工參與快速查找到圖像中感興趣區(qū)域,對圖像處理和圖像復原等技術提供支持。提出多通道參數(shù)估計方法,計算圖像感興趣區(qū)域與眼動感興趣區(qū)域的相似度,從而能準確定位目標在圖像上的位置。方法:設計并實現(xiàn)了一個融入運動特征的視覺顯著性模型,基于這個模型,提出一種基于多尺度差分的運動特征提取方法,在指導全局顯著圖的生成時,基于多通道參數(shù)估計方法計算各通道在整合時的權重,從而能準確定位目標在圖像上的位置。結果:用Matlab 進行仿真實驗,驗證算法的有效性。針對20 組視頻圖像序列(每組50 幀)進行了實驗,實驗選取所有測試視頻圖像序列來自CDNET2012 和CVPapers 庫。為體現(xiàn)根據(jù)任務情境實現(xiàn)的自頂向下的指導作用,所選取的圖像序列中大多含有單個或多個突出目標。提出的融入動態(tài)特征視覺顯著性模型生成的多通道顯著圖。從圖像中分別提取各通道的顯著性特征,經(jīng)過差分并歸一化后得到各通道的顯著圖。在場景中,靜態(tài)特征被有效抑制,圖像中具有運動特征的汽車和人得到了加強,從而驗證了提出的模型對于具有運動特征的目標區(qū)域檢測的有效性。通過分析比較顯著圖ROI 和眼動圖ROI 的相似度來評價提出算法的準確性和有效性。將全局顯著圖S 歸一化為0~255,提取出注意焦點,即ROI。其中3 組圖像序列(每組50 幀圖像)的4 個底層特征的權重值為每組圖像的平均值。給出了眼動ROI 和本文提出算法提取到的ROI 之間滿足最大相似度的各個特征通道的權值平均值。不同底層特征對ROI 的影響不同,同一底層特征對不同類型圖像的影響程度也不同,由于前兩組圖像中的汽車都有明顯的顏色特征和運動特征,所以顏色和運動特征的權重較大,由于第3 組圖像的3 個人相對其他目標運動特征較明顯,所以運動特征的權重較大,其他3 個特征權重較小,通過運動特征可以描述圖像的ROI,從而減少計算量。給出20 組視頻圖像序列中每組圖像最終計算的ROI 與眼動ROI的相似度平均值,可以看出本文算法的大部分圖像序列的平均相似度要大于Itti 算法的平均相似度,說明文本算法提取的ROI 更準確,從而可有效提高目標搜索的效率。結論:設計并實現(xiàn)了融入運動特征的視覺顯著性模型,并在此模型基礎上,利用基于多尺度差分的運動特征提取方法提取運動特征,然后生成運動顯著圖。在生成全局顯著圖時,提出了一種基于多通道參數(shù)估計算法,算法通過計算圖像感興趣區(qū)域(ROI)與眼動感興趣區(qū)域的相似度來估計多通道參數(shù),為目標在圖像上的準確定位提供計算機制。針對20 組視頻圖像序列(每組50 幀)進行了實驗,結果表明本文算法提取注意焦點即目標區(qū)域的平均相似度為0.87,能更高效準確地定位目標可能存在的區(qū)域。
來源出版物:中國光學, 2015, 8(5): 768-774
入選年份:2017