梁 曄,劉宏哲
(北京聯(lián)合大學 信息技術研究所,北京 100101)
基于視覺注意力機制的圖像檢索研究
梁 曄,劉宏哲
(北京聯(lián)合大學 信息技術研究所,北京 100101)
信息技術的發(fā)展使各種圖像信息日益膨脹,如何從中找到重要的信息一直是機器視覺和信息處理研究中長期面臨的重要問題。將視覺注意力機制引入到圖像分析領域,則能獲得高效的檢索能力。本文首先介紹了視覺注意力、視覺注意力計算模型及研究現(xiàn)狀,其次分析了圖像中引入視覺顯著性的必要性和重要性,論述了圖像視覺顯著性的層次、顯著性特征的選擇及度量;最后給出了有待研究的重點問題。
視覺注意力模型;視覺顯著性;基于內(nèi)容的圖像檢索
如何在浩海如煙的數(shù)字圖像數(shù)據(jù)中快速、高效、準確地找到人們所需要的圖像信息,已經(jīng)變成一個亟待解決的問題。人類對數(shù)據(jù)具有異常突出的篩選能力,能迅速覺察到與自身相關的重要信息,把目光集中到自己感興趣的方面。根據(jù)人類視覺原理,“注意”是人類信息加工過程中的一項重要的心理調(diào)節(jié)機制,它能夠對有限的信息加工資源進行分配,使感知具備選擇能力。這種具有選擇性和主動性的心理活動被稱為視覺注意機制。視覺注意機制的顯著區(qū)域檢測在圖像分析過程中有著非常重要的意義,越來越多的研究者將這種注意機制引入圖像分析領域,以獲得高效、準確的圖像檢索能力。
視覺注意是屬于神經(jīng)生物學范疇的概念,它是在生物視覺信息處理過程中是一個非常重要的過程。當視網(wǎng)膜擁有整個場景時,注意力一次只集中在一個或者為數(shù)很少的幾個區(qū)域上。圖1是幾個典型的視覺顯著性示例。
圖1 視覺注意示例
關于視覺系統(tǒng)中注意力機制一直是認知科學領域的一個重要研究課題,受到神經(jīng)科學、認知心理學以及相關學科的眾多研究者的關注[1-2]。人眼在觀察周圍視覺信息的時候,觀察者即使被給定了較長的瀏覽時間,仍將會把注意力聚集在一些特定的區(qū)域上。注意程度高的區(qū)域在人眼視網(wǎng)膜上的黃斑上成像,該區(qū)域的信息被選擇進入高層知覺過程;而散布在視網(wǎng)膜其他區(qū)域的桿狀細胞只能在弱光下檢測亮度信息,沒有色彩的感覺,分辨率較低,僅能分辨出視野景物中的一般輪廓。所以,圖像成像在黃斑之外的其他區(qū)域,僅僅可以獲得一個大概的影像信息。視覺生物神經(jīng)方面的研究成果為注意力機制提供了生物學基礎。
大多數(shù)視覺心理學研究結論[2]將早期視覺過程劃分為兩階段:前注意階段和注意階段。視覺顯著性是指在視覺前注意階段中,能夠迅速引起觀察者注意的程度。顯著性高的客體容易被觀察者選擇性接受。視覺注意力計算模型旨在模擬人的視覺感知過程,根據(jù)視覺對圖像中客體的注意程度計算顯著程度,即對視覺信息進行顯著性分析的過程。
2.2.1 自底向上和自頂向下視覺注意力模型
根據(jù)注意過程的引導方式,可將現(xiàn)有注意機制計算模型分為自底向上模型和自頂向下的模型[3]。
自底向上的注意機制模型是指由外界信號的特性而決定注意的導向。自底向上的注意模型沒有特定的目標約束,是人們在瀏覽外界視覺信息時,對具有顯著特征的客體進行選擇的過程,這個過程完全由外部視覺刺激觸發(fā)、不受意識支配的,沿著自下向上的方向被處理的,其特點主要有兩點:
1) 數(shù)據(jù)驅動。自底向上的選擇性注意機制是由作為底層數(shù)據(jù)的視覺刺激驅動的,與作為高層知識的觀察任務無關,我們無法有意識地控制其信息處理過程。
2) 自動加工。自底向上的選擇性注意機制是一種自動加工過程。它對視覺信息的處理速度很快,而且是以空間并行方式在多個通道中同時處理視覺信息的。
自頂向下的模型是選擇性注意力機制的另外一種類型。給定某個觀察任務,人類視覺在自頂向下的選擇性注意機制的幫助下,能夠迅速建立視覺期望,并在該期望的指導下按照一定的優(yōu)先級順序有選擇地對各個場景區(qū)域進行局部驗證,進而對其中經(jīng)過證實含有期望目標的場景區(qū)域進行局部處理。通常情況下,那些包含期望目標的場景區(qū)域都會由于其符合視覺期望的視覺刺激分布模式而具有較高的優(yōu)先級。顯然,將這種由觀察任務驅動的自頂向下的選擇性注意機制引入圖像信息處理過程是非常必要的。
2.2.2 視覺注意力模型分析
對視覺選擇性注意機制,目前多數(shù)研究的是如何建立隱式注意的自底向上的計算模型,這是因為顯式注意更加復雜,涉及更多目前還未知的東西,隱式注意相對來說有更多的實驗數(shù)據(jù)和認知模型可以參考。引導注意的自底向上因素主要來自于視覺任務,而視覺任務是千變?nèi)f化的,通常表現(xiàn)為知識,但對知識,目前還沒有很好的描述模型,而是具體問題具體對待。所以,人們更多地研究自底向上方面。一般而言,設計任何一個視覺注意的計算模型,首先都要涉及以下5個方面。
1) 確定模型是針對隱式注意還是顯式注意。不同的注意方式所引起處理過程是不一樣的,注意方式對處理過程起著決定性作用。
2) 確定模型中注意是否引入視覺物體識別。在生物視覺系統(tǒng)中,注意所在的“Where”通道和識別所在的“What”通道之間有著復雜的相互關系,注意和識別是密不可分的。但目前這兩者交互的機理還遠遠不為人們所了解。
3) 預注意階段。預注意階段主要進行一些早期視覺特征計算,那么到底哪些特征自下而上地引導注意呢?研究表明,既可以是一些基本的特征,如顏色、運動、方向以及尺度,也可以是特征的組合,如2D圖像或3D場景中的物體,甚至還可以是學習得到的特征,不同的特征對注意引導的作用依賴于它們在圖像中的對比度。
4) 顯著圖生成。在預注意階段,一些視覺特征被計算出來,將利用這些計算結果來引導視覺注意。現(xiàn)有的模型幾乎都是使用了基于顯著圖的方式?,F(xiàn)有模型之間的不同之處正是在于如何由一些早期視覺特征來融合得到顯著圖,這是一個模型的核心和關鍵之處。
5) 視覺轉移的控制策略。在得到顯著圖后,視覺如何轉移呢?通過認知實驗可知,它取決于兩點:一是對當前注視點的識別結果;二是一旦某個物體被注視過了,那么它的顯著性會被抑制[4]。
從以上可知,注意計算模型通常包括兩大模塊:早期視覺特征提取與顯著圖生成模塊和注視區(qū)域/物體選取與轉移模塊。顯著圖的生成是計算模型的核心。
越來越多的計算視覺研究者展開了基于視覺注意的顯著性計算方面的研究和應用,比較知名的研究機構有:美國加州工學院的 iLab、瑞典Neuchatel大學的 PRLab、麻省理工學院 AI Lab、以色列Weizmann工學院的 FMCS、法國 Neuchatel大學的的 PRLab、美國 George Washington大學的 VACLab和意大利Pavia大學的 CVLab等。國內(nèi)在理論和應用方面也有相應的研究。在認知心理學方面,中科院心理研究所、華南師大心理學系對注意機制的研究和上海交通大學李朝義院士關于神經(jīng)元整合野的理論研究比較突出。在計算視覺方面,微軟亞洲研究院、西安交通大學、國防科技大學、西北工業(yè)大學、中國科技大學、清華大學和北京交通大學等研究人員利用視覺認知理論解決計算機視覺方面的有關問題,取得了一定的研究成果。
經(jīng)過眾多學者對注意機理及其運作過程的多年研究,陸續(xù)產(chǎn)生出十多種相關理論結構模型[5-13]和視覺顯著性處理方法[14-26],這些模型都對視覺注意過程做出了一些合理性解釋,但多數(shù)還停留在假說層面上,要構建完整的理論體系還有很多工作要做。雖然相關理論尚未完善,還是有不少注意計算模型已經(jīng)被直接引入具體應用中,并產(chǎn)生了一些可行的算法或系統(tǒng),主要針對具體應用任務展開[27-30]。可以說,實際應用的急切需求很大程度地推動著相關研究的快速發(fā)展。
隨著信息技術的發(fā)展,圖像成為一種主要的信息載體。越來越多的圖像數(shù)據(jù)給人工處理和瀏覽造成了不便。眾所周知,人類在感受外界信息時,并不是對所有信息一視同仁的,大腦會選擇性地處理輸入信息,視覺感知過程中對外界信息表現(xiàn)出注意程度差異性。這種具有選擇性的視覺注意機制是人類視覺加工過程中的一項重要的心理調(diào)節(jié)機制,它在視覺感知過程中能夠實現(xiàn)信息過濾,使受注意程度高的信息進入高層感知過程。如果能夠將這種機制引入圖像分析和理解領域,將計算資源優(yōu)先分配給那些容易引起觀察者注意的區(qū)域,將極大地提高現(xiàn)有視覺信息內(nèi)容分析方法的工作效率,將視覺注意機制引入到圖像檢索中是必要的、可行的和重要的。
在圖像分析與理解中,顯著區(qū)域通常僅是圖像中的一小部分。所謂顯著區(qū)域,也可以理解為圖像中的主要目標,是人的視覺能夠在很短的時間內(nèi)將注意力集中到圖像中某個能激發(fā)人們興趣的區(qū)域。圖像檢索中,由于圖像背景通常占據(jù)了圖像的較大部分,在提取圖像特征的過程中,對圖像中主要目標的特征造成了一定影響。在提取圖像顯著區(qū)域之后再進行圖像檢索,從圖像的顯著區(qū)域入手,該方法更加有利于基于內(nèi)容的圖像檢索。此外,注意是低層視覺和高層視覺之間的橋梁,輸入和輸出相對簡單,其分析過程停留在視覺屬性層,不涉及復雜的語義分析,因此是可行的。
3.2.1 圖像視覺顯著性的3個層次
圖像內(nèi)容的描述和抽取是圖像理解的根本目的,也是視覺信息顯著性處理的核心輸出。圖像內(nèi)容的含義容易理解卻十分抽象,難以充分描述,簡單地說,就是圖像信息中那些實質性的或有意義的能夠被人理解的部分。圖像內(nèi)容的描述本質上是一種信息抽象化和結構化的過程,也就是對圖像信息從低層到高層進行處理、分析和理解的過程。
圖像的靜態(tài)視覺顯著特性可分為3類,即建立在局部特征度量之上的局部顯著性、建立在全局性結構信息度量之上的全局顯著性和建立在某個單特征之上并描述其全局或局部特殊性的特征顯著性。視覺顯著性的圖像描述形式一般可分為由低到高的3個層次,即顯著圖、注意焦點和顯著區(qū)域。一般顯著圖可以通過對簡單圖像特征的顯著性度量來獲得,然后依據(jù)顯著圖空間競爭產(chǎn)生注意焦點,再由注意焦點“種子”生長或感知群組獲得顯著區(qū)域。Koch和Itti首先提出了基于特征對比度的空間顯著圖概念和經(jīng)典的選擇性注意結構模型[5],并形成了比較詳盡的注意計算模型。
3.2.2 圖像視覺顯著性的選取
特征提取和顯著性分析是實現(xiàn)視覺注意力模型的兩個關鍵問題。已有大量認知心理學者對有關影響視覺注意程度的因素進行了研究,多數(shù)學者認為,影響視覺注意程度的因素可分為低層視覺特征和高層因素[31-32],列舉了其中一些主要因素,如表1所示。
表1 影響視覺注意程度的主要因素
根據(jù)任務特點選擇少量的有效的圖像特征參與處理,不但可以降低計算量,而且可以提高準確性。其次,需要建立一個靈活開放的具有可擴展性的特征提取機制,通過特征庫控制和存儲各種各樣的簡單圖像特征,根據(jù)任務需求選擇最佳的特征子集參與簡單圖像特征提取,也可以根據(jù)圖像信息處理結果調(diào)整對各個特征項的評價。此外,面向早期視覺特征的表述的需要,簡單圖像特征的選擇和設計還需要著重考慮以下幾個問題:
1) 選擇多層次的特征。圖像對象的層次性必然導致圖像特征的層次性,這里不妨將圖像特征劃分成兩類:一類是可以從圖像中直接提取的簡單特征,包括像元特征(如單像元的亮度、顏色、方位等)、鄰域特征(如像元鄰域的梯度、方向、頻率等);另一類是無法從圖像中直接提取的簡單特征,包括區(qū)域特征(如單區(qū)域的曲直、形狀、尺寸等)、區(qū)域集特征(如區(qū)域集的數(shù)目、縫隙、平行等)、目標特征(如目標的連接、包含、相交等)、場景特征(如圖像中所有目標的集合和關系)。
2) 需要多特征的合并和組合。一個圖像對象的視覺屬性往往是多方面的,這必然導致其圖像特征的多樣性。因此,要全面、準確地描述一個圖像對象,就需要針對其各個方面的視覺屬性選擇多種簡單圖像特征。同時,隨著圖像層次的增長,圖像對象的信息量增大,復雜度也會增加,這也使得其視覺屬性的類型也隨之增多,而且這種增多是具有繼承性的。所以,簡單圖像特征的提取需要同時考慮多特征提取和多特征組合。
3) 選擇可以從圖像直接提取和方便計算的簡單圖像特征。在圖像信息處理中,傳統(tǒng)的普通圖像特征為信息理解過程提供數(shù)據(jù)支持,而簡單圖像特征則為信息選擇過程提供數(shù)據(jù)支持。
3.2.3 圖像特征的顯著性度量
如何度量各個候選對象的視覺顯著性是顯著區(qū)域檢測過程中的核心環(huán)節(jié)。如果將視覺顯著性也看作是圖像對象的一種視覺屬性,那么,度量圖像對象的視覺顯著性實際上就是在提取其顯著性特征,方法大致可以劃分為3種類型。
1) 內(nèi)部提取法:該方法從候選對象內(nèi)部提取顯著性特征,它認為,視覺顯著性的產(chǎn)生是由于視覺對象本身具有某種能夠引起觀察者注意的特殊屬性。例如:像元鄰域的對稱性特征[33-34]、像元鄰域的復雜性特征[35]、像元鄰域不一致性特征[36],可以將這些特征稱為自顯著特征。
2) 外部提取法:該方法從候選對象與外界的比較中提取顯著性特征,它認為,視覺顯著性的產(chǎn)生是由于視覺對象與外界通過某種對比形成了能夠引起觀察者注意的新異刺激。有的用候選對象與周邊范圍比較產(chǎn)生的差異值或差異矢量來描述顯著性,如:基于 DOG算子的亮度差[37]、基于 LOG算子亮度、梯度和曲率差異[38]、基于“中心一周邊”算子的特征差異[39]。有的用候選對象與整幅圖像比較產(chǎn)生的差異值或差異矢量來描述顯著性,例如:邊緣密度差異[40]、基于進化規(guī)劃的形態(tài)差異[41]、基于錯分概率的空間密度顯著性[41]。
3) 綜合提取法:該方法將上述自顯著特征和互顯著特征結合起來作為候選對象的顯著性特征。例如:通過尺寸、形狀、方位這些自顯著特征和對比度、前景/背景這些互顯著特征描述分割區(qū)域的顯著性[43];通過分割區(qū)域在顏色、紋理、形狀上的多種自顯著特征和互顯著特征描述其顯著性[44];通過對稱性、方向、邊緣和對比度等多種特征描述像元鄰域的顯著性[45]。
實際上,除了上述由特征提取本身驅動的顯著性度量機制外,外部意圖系統(tǒng)對視覺顯著性的度量也發(fā)揮著重要的引導和調(diào)制作用。
關于視覺顯著性檢測技術的研究是認知心理學的研究者首先展開的。隨著計算機處理能力的迅速提升,視覺顯著性對圖像內(nèi)容無與倫比的高效感覺和認知能力重新得到信息處理領域的關注。雖然視覺注意和圖像處理都是各自領域的傳統(tǒng)問題,但是兩者的結合無論對于心理學,還是對于信息科學,都是新的研究方向,需要面對和解決的問題還很多。下面是重點研究問題。
1) 早期視覺特征的選擇和提取:哪些早期特征能對視覺產(chǎn)生基礎而強烈的刺激?如何快速地提取、度量和選擇不同尺度的視覺特征?如何選擇和組合多種圖像特征對視覺顯著性的貢獻?如何區(qū)別和融合靜態(tài)和運動特征對視覺顯著性的影響?
2) 顯著性度量:主要度量方法有內(nèi)部提取法、外部提取法和綜合提取法。除了由特征提取本身驅動的顯著性度量機制外,外部意圖系統(tǒng)對視覺顯著性的度量也發(fā)揮著重要的引導和調(diào)制作用。
3) 注意焦點的檢測和選擇:注意焦點的計算過程主要有自底向上和自頂向下的兩種處理模式,計算速度是需要優(yōu)先考慮的因素,如何快速地選擇注意焦點是至關重要的。
4) 算法設計和實驗平臺建設:有關算法的設計通??梢允紫冗x擇某種傳統(tǒng)算法,然后利用注意焦點對其進行調(diào)整,從而獲得新的算法流程;也可以建立相對統(tǒng)一的由視覺顯著性驅動的圖像處理的框架模型,然后針對具體的任務需求對框架中的個別模塊加以定制或擴展。
5) 現(xiàn)有模型的主要不足之處是:一是沒有考慮和識別結合,二是現(xiàn)有模型的注意結果都是用指定大小的一個形狀(通常用圓)來表示當前的注意區(qū)域,沒有進行局部最佳尺度選擇。
[1] Broadbent D E.Perception and communication[M].New York:Oxford University Press,1958.
[2 ] Neisser U.Cognitive psychology[M].New York:Appleton-Century-Crofts,1967.
[3] Charles E,Connor H E,Egeth S Y.Visual attention:bottom-up versus top-down[J].Current Biology,2004(14):850-852.
[4] 周建中.返回抑制研究的新進展[J].心理科學,2003,26(2):326-329.
[5] Itti L,Koch C,Niebur E.A model of saliency-based visual attention for rapid scene analysis[J].IEEE Trans on Pattern A-nalysis and Machine Intelligence,1998,20(11):1254 -1259.
[6] Koch C,Ullman S.Shifts in selective visual attention:towards the underlying neural circuitry[J].Human Neurobiology,1985,4(4):219-227.
[7] Deutsch J A,Deutsch D.Attention some the oretical considerations[J].Psychological Review,1963(70):80-90.
[8] Subutai A.VISIT:An efficient computational model of human visual attention[D].California:the University of Illinois Berkeley,1991.
[9] Itti L,Koch C.Computational model of visual attention[J].Nature Reviews Neuroscience,2001,2(3):194 -230.
[10] Benjamin J,Balas P S.Receptive field structures for recognition[J].Neural Computation,2005(18):1 -24.
[11] Baker G,Mertsching B.Two selection stages provide efficient object-based attentional control for dynamic vision[D].Austria:International Workshop on Attention and Performance in Computer Vision 2003.2003:9-16.
[12] Kang Woo Lee,Hilary Buxton,F(xiàn)eng Jianfeng.Cue-guided search:a computational model of selective attention[J].IEEE Transactions on Neural Networks,2003,16(4):910-924.
[13] Navalpakkam V.An integrated model of top-down and bottom-up attention for optimizing detection speed[D].Proceedings of the 2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition,2006.
[14] Timor K,Michael B.Saliency,scale and image description[J].Internatioanl Journal of Computer Vision,2001,45(2):83-105.
[15] Itti L,Braun J,Koch C.Single-filter gain changes and attentional threshole modulation[J].Investigative Opthalmology and Visual Science,2000(41):4,39.
[16] Itti L,Koch C.Saliency– based search mechanism for overt and covert shifts of visual attention[J].Vision Research,2000(40):1489-1506.
[17] Jonathon S H.Saliency for image description and retrieval[D].Faculty of Engineering,Science and mathematics School of Electronics and Computer Science,2006:4.
[18] Hu Yiqun,Deepu Rajan,Liang-Tien Chia.Robust subspace analysis for detecting visual attention regions in images[M].New York:Proceedings ACM Multimedia,2005.
[19] Liu Feng,Michael Gleicher.Region enhanced scaled-invariant saliency detection[D].Toronto,Canada:IEEE ICME 2006,2006.
[20] Liu Tie,Sun Jian,Zheng Nan-ning,et al.Learning to detect a salient object[C].CVPR2007,USA,2007.
[21] Radhakrishna Achanta,F(xiàn)rancisco Estrada,Patricia Wils,et al.Salient region detection and segmentation[M].ICVS2008.[S.l.]:Springer Berlin,2008.
[23] Viswanath Gopalakrishnan,Hu Yi-qun,Deepu Rajan.Salient region detection by modeling distributions of color and orientation[J].IEEE Transactions on Mullimedia,2009,11(5):892 -905.
[24] 王璐,陸筱霞,蔡自興.基于局部顯著區(qū)域的自然場景識別[J].中國圖象圖形學報,2008,13(8):1594-1616.
[25] 田媚,羅四維,黃雅平,等.基于局部復雜度和初級視覺特征的自底向上注意信息提取算法[J].計算機研究與發(fā)展,2008,45(10):1739 -16746.
[26] 楊俊.圖像數(shù)據(jù)的視覺顯著性檢測技術及其應用[D].北京:國防科學技術大學,2007.
[27] 王岳環(huán),張?zhí)煨?基于視覺注意機制的實時紅外小目標預檢測[J].華中科技大學學報,2001,29(6):7-9.
[28] 張鵬,王潤生.基于視覺注意的遙感圖像分析方法[J].電子與信息學報,2005,27(12):1855-1860.
[29] 葉聰穎,李翠華.基于H SI的視覺注意力模型及其在船只檢測中的應用[J].廈門大學學報,2005,44(4):484-488.
[30] 葛濤,馮松鶴.基于層次和動態(tài)閾值的圖像顯著區(qū)域檢測方法[J].計算機應用,2006,26(11):2721-2723.
[31] Harold Pashler.The psychology of attention[M].Cambridge:MITPress Mass,1998.
[32] Obsberger W.A computational model of the humen visual system for image quality assessment[D].Australia:Queensland University of Technology,1999.
[33] Reisfield D.Constrained phase congruency:simultaneous detection if interest points and their scales[D].San Francisco:Proceedings of the Computer Vision and Pattern Recognition,CA.1996:562-567.
[34] Gesu V D,Valenti C,Strinati L.Local operrators to detect regions of interest[J].Pattern Recognition Letters,1997,18(11):177-181.
[35] Timor Kadir,Michael Brady.Saliency,scale and image description[J].International Journal of Computer Vision,2001,45(2):83-105.
[36] Alexander Dimai.Invariant scene description based on salient regions for preattentive similarity assessment[D].Washingten:Proceedings International Conference on image analysis and Processing1999.1999:957-962.
[37] Wai W Y K,Tsotsos J k.Directing attention to onset and offset of image events for eye-head movement control[J].The International Association for Pattern Recognition,1994(A):274-279.
[38] Ruggero Milanese,Bost J M,Pun T.A bottom-up attention system for active vision[D].Austria:The 10thEuropean Conference on Artificial Intelligence,1992,808-810.
[39] Itti L.Models of botttom-up and top-down visual attention[D].California:California Institute of technology,2000.
[40] Bourque E ,Dudek G,Ciaravola P.Robotic sightseeing:a method for automatically creating virtual enviroments[D].Belgium:Proc.of the IEEE International Conference on Robotics and Automation.1998:3186-3191.
[41] Fred W M.An evolutionary programming approach to the simulation of visual attention[D].Korea:Proc of the 2001 IEEE Congress on Evolutionary Computation,2001:851-858.
[42] Walker K N,Cootes T F,Taylor C J.Locating salient facial features using image invariants[C].Japan:Third International Conference on Automation Face and Gesture Recognition,1998:242-249.
[43] Grossberg S.The lind between brains,learning,attention and consciousness[J].Consciousness& Cognition,1999(8):1-44.
[44] Jiebo Luo,Cheng en Guo.Non-purposive perceptual region grouping[J].Proceedings 2002 International Conference on Image Processing.2002,2(2):749-752.
[45] Privitera C M ,Stark L W.Algorithms for defining visual regions of interest:comparison with eye fixations[J].IEEE Transactions on Pattern Analysis and Machine Intelligence.2000,22(9):970 -982.
Study of Image Retrieval Based on Vision Attention Mechanism
LIANG Ye,LIU Hong-zhe
(Institute of Information Technology,Beijing Union University,Beijing 100101,China)
Image information is increasing very fast with the development of information technology.How to find important information is always a critical problem in computer vision and information process study.High retrieval efficiency will be achieved if visual attention mechanism is adopted.Firstly,visual attention mechanism,visual attention computing model and the art state are introduced.Secondly,the need and importance of visual saliency in image are analyzed.In addition,the levels,extraction and measurement of visual saliency are discussed in detail.At last,open problems are put forward.
visual attention model;visual saliency;CBIR
TP 391.4
A
1005-0310(2010)01-0030-06
2009-11-11
國家自然科學基金項目資助(60972145)
梁曄(1978—),女,內(nèi)蒙古赤峰人,北京聯(lián)合大學信息學院講師,碩士,從事圖像檢索和本體的研究;劉宏哲(1971—),女,河北涿州人,北京聯(lián)合大學信息技術研究所講師,博士生,從事語義網(wǎng)和本體的研究。
(責任編輯 李亞青)