魯天舒
人類視覺系統(tǒng)能夠對圖像進行高效的解讀,可以快速地搜索到感興趣區(qū)域并對其進行解譯。但對于機器來說,其不具備人類視覺系統(tǒng)的圖像自動注意感興趣區(qū)域的能力。隨著人工智能以及機器人技術的發(fā)展,急需建立基于機器的圖像自動解譯系統(tǒng),而在圖像自動解譯系統(tǒng)中,視覺注意力機制的建立最為關鍵。
1.機器視覺
人類的視覺系統(tǒng)可以做到從外界獲得大量信息,對獲得的信息進行快速篩選并濾除無用信息。這種自發(fā)的信息過濾就是所謂的注意力機制。人類視覺系統(tǒng)可以在短時間內注意到一副圖像中的獨特部分,如圖1所示,在這些圖像中獨特的部分就是人們所關心的關鍵性內容。不具備人類視覺注意機制的機器,難以發(fā)覺圖像中的關鍵性信息,從而制約了人工智能與機器人技術的發(fā)展。
受到人類視覺系統(tǒng)注意力機制的啟發(fā),很多研究人員在建立機器對圖像自動處理與認知的過程中引入了模擬人類視覺對圖像信息的感知過程,建立了機器對于圖像數(shù)據(jù)的自動注意機制算法模型。這種注意機制算法模型能夠分配有限的計算機信息加工資源,將計算資源優(yōu)先分配給顯著區(qū)域,賦予機器對圖像信息自動注意的能力,將提高機器處理解譯圖像信息的效率。但到目前為止無論是心理學、生理學還是信息科學領域,都未能完全做到對選擇性注意機制進行完整的描述,因此,許多學者在該領域開展了大量的研究工作。其中“視覺注意”最早出現(xiàn)在Treisman和Gelade提出的“特征合并理論”。這一理論說明了視覺感知特性的重要性,但其未能體現(xiàn)視覺注意這一過程是由何種信息引導的。在此基礎上Koch和Itti等人提出了一種模型,通過模擬人眼對圖像信息接收的“注意”過程來建立相應的機器對圖像關鍵信息的注意機制,以及對關鍵信息的顯著性分析過程,從而建立了機器視覺中的注意機制體系。至此,打開了機器視覺注意機制研究領域的大門,更多的研究者進行了更深入的研究。針對這些研究工作,其機器視覺注意模型大致可以分為兩大類:①“自底向上”的視覺注意模型;②“自頂向下”的視覺注意模型。
其中“自頂向下”的視覺注意模型是通過特定任務約束的圖像注意機制。而“自底向上”的視覺注意模型是通過圖像信息中的差異性特征引導機器自動的關注關鍵性內容,這里的差異性特征指圖像信息中與無關背景信息差異較大的內容,例如圖1中能引起注意的內容是那些具有不同的形狀、顏色、大小和方向等的特征信息。
在此以探索機器視覺中注意力模型為目的,研究“自底向上”的視覺注意模型,結合遙感圖像覆蓋面積廣、包含目標種類多樣、關鍵信息復雜以及對于遙感圖像關鍵性信息搜索困難的問題,進行了遙感圖像目標顯著性分析的研究,提出了一種“自底向上”的機器視覺算法模型,實現(xiàn)了對大范圍遙感圖像中關鍵性目標內容的自主搜尋與注意過程?!白缘紫蛏稀币曈X注意模型算法流程如圖2所示,可以分為3個步驟:①差異特征提取(方向、局部對比度、全局對比度);②融合特征圖生成(顯著圖生成);③顯著性分析。
在特征提取階段為了建立有效的差異性特征自主注意機制,提出的算法選取方向、局部對比度和全局對比度這三方面特征作為機器視覺注意模型主要分析的差異性特征。為了公平統(tǒng)一地分析方向、局部對比度與全局對比度特征對于視覺注意模型的貢獻度,在進行融合特征圖前,分別對這三方面特征進行數(shù)據(jù)歸一化處理。在融合特征圖生成階段,考慮到三方面特征的差異性,根據(jù)其不同屬性以線性方程為基礎,構建了融合特征圖準則。最后,根據(jù)生成的融合特征圖,以“勝者為王”的策略完成“注意焦點”的自動選取,實現(xiàn)了對遙感圖像“自底向上”的目標顯著性分析。
2.方法
2.1遙感圖像預處理
從表1~表3中可以看出,本文方法具有較好目標顯著性特性與目標檢測指標,在參照方法中具有較好的Significance值。因此,機器視覺遙感圖像目標顯著性分析方法可以有效的幫助機器自主實現(xiàn)遙感圖像有效目標內的注意和搜索。
4.結束語
通過與3種經典視覺注意模型與CFAR檢測算法的對比仿真實驗結果,表明本文模型對遙感圖像目標的顯著區(qū)域提取效果更好,能夠準確檢測出圖像中的顯著目標區(qū)域,漏檢、虛警數(shù)量少,且目標區(qū)域具有較為清晰地目標輪廓和形狀,實現(xiàn)了較高精度的自主顯著區(qū)域檢測。