萬術(shù)娟 林川 李福章
摘? 要:已有研究表明,生物視覺系統(tǒng)中第二視覺通路主要是基于固視微動響應特性來完成視覺信息的特征提取.受此啟發(fā),提出一種基于固視微動與初級視覺皮層神經(jīng)機制的輪廓檢測模型,以注視中心為原點,通過不同角度下偏移的高斯一階導濾波器模擬視覺神經(jīng)細胞的固視微動特性,其中偏移量由圖像的局部特征信息計算得到;然后將不同偏好方向下多個角度偏移模板的濾波能量與注視中心的響應能量競爭得到經(jīng)典感受野的最優(yōu)能量響應;最后通過高斯差分函數(shù)對最優(yōu)能量響應進行紋理抑制并獲得最終的目標輪廓輸出.BSDS數(shù)據(jù)集的定性和定量實驗結(jié)果表明,所提出的檢測模型能夠獲得更完整更連續(xù)的輪廓特征,具有較高的性能評測指標.
關鍵詞:輪廓檢測;固視微動;初級視覺皮層;紋理抑制
中圖分類號:TP391.41? ? ? ? ? ? ? DOI:10.16375/j.cnki.cn45-1395/t.2020.04.011
0? ? 引言
在計算機視覺領域中,目標的輪廓信息作為中層視覺主要特征之一,是目標識別[1]、圖像分割[2]等高級任務的重要基礎,在運動分析[3]以及對象跟蹤[4]等領域也得到了廣泛的應用.在仿生型輪廓檢測研究中,主要通過研究哺乳動物初級視覺皮層V1區(qū)的視覺感知機制,來解決從復雜場景中提取到目標真實輪廓這一難題.V1區(qū)神經(jīng)元中心區(qū)域(經(jīng)典感受野)對外界刺激產(chǎn)生興奮性響應,其周邊廣大區(qū)域(非經(jīng)典感受野)對中心響應能量產(chǎn)生強烈的抑制性作用.受該機制啟發(fā),Grigorescu等[5]通過二維gabor函數(shù)和高斯差(DOG)函數(shù)分別模擬簡單細胞的經(jīng)典感受野和非經(jīng)典感受野,并提出了各向同性抑制和各向異性抑制兩種輪廓檢測模型,為后續(xù)基于生物視覺特性的輪廓檢測方法研究提供了深刻的啟發(fā).基于初級視覺皮層中同時存在方向選擇性和非方向選擇性的周邊抑制神經(jīng)元機制, Long和Yang等[6-7]進一步改進了方向選擇性模型并提出一種方向選擇性和非選擇性的融合方法,結(jié)果表明這種融合模型比單獨一種方向選擇性模型或者非選擇性抑制模型表現(xiàn)更出色.然而只考慮亮度或方向特征的視覺特征信息線索過于單一,往往導致部分細節(jié)輪廓的丟失.因此,Yang等[8-9]結(jié)合了方向(OI)、亮度(LI)、亮度對比度(CI)等多種特征線索,并將這些特征線索有效地融合,使得在復雜場景中也具有較高的輪廓檢測性能.視覺細胞感受野的動態(tài)特性是學者們一直以來的重點關注之一,潘亦堅等[10]將改進的神經(jīng)元激活函數(shù)sigmoid提取出感受野的局部尺度信息用于調(diào)制非經(jīng)典感受野的抑制響應,取得較好的輪廓檢測性能.相比同心圓拮抗式感受野的檢測模型,Sang和Zeng等[11- 12]發(fā)現(xiàn)非經(jīng)典感受野并不是嚴格的同心圓結(jié)構(gòu),他們認為抑制區(qū)域存在于感受野的兩側(cè),因此,他們提出蝶形的抑制模型,在保留輪廓的同時有效抑制更多的背景紋理.另一部分學者,考慮到人眼固視狀態(tài)下的微動特性,在傳統(tǒng)非經(jīng)典感受野模板的基礎上等間隔地選取8個方位的子區(qū)域,并通過每個角度方位的子區(qū)域置換數(shù)值的方法模擬固視微動[13-15],獲得較好的輪廓檢測效果.
上述模型對固視微動的模擬都是基于非經(jīng)典感受野模型的改進,未考慮固視微動對經(jīng)典感受野的影響.因此,本文在現(xiàn)有經(jīng)典感受野仿生模型的基礎上,以注視中心為原點,結(jié)合由局部特征信息計算得到的偏移量對高斯一階導濾波器進行多個角度偏移模擬視覺細胞的微動特性,并與模擬注視中心的響應能量競爭得到經(jīng)典感受野的最優(yōu)能量圖;然后由高斯差分函數(shù)(DOG)模擬的非經(jīng)典感受野對最優(yōu)能量圖進行抑制得到輪廓特征圖.為了檢驗所提出模型的性能,通過權(quán)威的BSDS數(shù)據(jù)集進行定性和定量的實驗測試,并與同類仿生輪廓檢測模型進行效果的對比.結(jié)果表明,本文模型能夠較準確地區(qū)分目標輪廓和背景紋理,在當前仿生輪廓檢測模型中具有較好的魯棒性.
1? ? 模型
當停止眼球的所有運動,靜止的圖像將變得模糊不清并突然消失[16].可見,眼球的微動對人類視覺的產(chǎn)生有著至關重要的作用.受此啟發(fā),將高斯一階導濾波器的注視中心向4個不同角度進行微動,模擬視覺細胞固視微動機制對視覺信息的響應過程.本文模型的檢測流程如圖1所示,輸入圖像分別與模擬注視中心的濾波器O以及4個不同角度偏移下的濾波器a、b、c、d卷積并通過競爭機制得到最優(yōu)能量圖,最優(yōu)能量圖經(jīng)過DOG函數(shù)抑制紋理后獲得輪廓特征圖.最后,通過非極大值抑制方法對輪廓特征圖進行特征信息的細化.
1.1? ? 結(jié)合固視微動的經(jīng)典感受野響應
在大腦中,根據(jù)視覺皮層的結(jié)構(gòu)和生理功能的差異將其劃分為V1、V2、V3、MT等多個腦區(qū)[17] ,V1區(qū)作為大腦視覺信息處理的第一站,具有檢測邊緣、線條等視覺要素的功能,并且在處理視覺信息的過程中表現(xiàn)出明顯的偏好方向選擇性.因此,用高斯一階導函數(shù)來模擬具有偏好方向選擇性的初級視覺皮層神經(jīng)元:
其中:[θ]表示神經(jīng)元的偏好方向參數(shù)[(θ∈[0, π))]; [γ]表示感受野長短軸比例的常數(shù)([γ=0.5]);[σ]為高斯函數(shù)中的標準偏差,其決定感受野的大小.
實際上,人類視覺系統(tǒng)對于靜止不動的物體,主要是通過眼球的固視微動機制來判斷物體的遠近距離并且增強物體的邊緣響應[18].因此,本文基于固視微動的生理機制,通過變換高斯一階導模板坐標,構(gòu)建具有微動特性的高斯一階導新模型.高斯一階導新模型的坐標變換方式如下:
[D]表示高斯一階導模板坐標的偏移量,在[x]和[y]方向設定相同的偏移量.k表示偏移量與感受野大小的相關程度,設定[k=1]. [g(x, y)]為輸入圖像[Ix, y]經(jīng)過高斯函數(shù)(公式(2),其中[γ=1])平滑并歸一化之后的結(jié)果.高斯函數(shù)濾波一方面是為了去除噪聲,使偏移量的計算更精準;另一方面考慮到偏移量由局部特征決定更符合生理特性.
在二維坐標中,有4個象限,因此,高斯一階導模板坐標偏移的角度就有4個,向坐標的正方向偏移用“+”號表示,反之則用“-”號.將偏移量的角度代入公式(5)(分別為[xd1=x+D],[yd1=y+D];[xd2=x-D],[yd2=y+D];[xd3=x-D],[yd3=y-D];[xd4=x+D],[yd4=y-D])就可表示朝各個角度偏移距離[D]的坐標變換.圖2以模板中心坐標為例,展示了朝各個角度偏移后的坐標變化.
在初級視皮層,結(jié)合固視微動特性的經(jīng)典感受野模型通過競爭機制,得到最優(yōu)響應:
1.2? ?非經(jīng)典感受野響應
視覺細胞的非經(jīng)典感受野存在于經(jīng)典感受野的外圈范圍,其直徑約為經(jīng)典感受野直徑的3~6倍[19].非經(jīng)典感受野對于經(jīng)典感受野的響應能量主要表現(xiàn)出一定程度上的調(diào)制作用.傳統(tǒng)的非經(jīng)典感受野模型采用DOG函數(shù)[20]來模擬抑制作用隨距離的增大而減小.DOG函數(shù)表達式如下:
2? ? 實驗結(jié)果與分析
為了表達更簡便,在后續(xù)的實驗及描述中將通過MPV模型來表示所提出的檢測模型.通過輪廓檢測領域內(nèi)權(quán)威的BSDS數(shù)據(jù)集,基于通用的F-measure性能評測體系[21]對所提出MPV模型的性能進行定性和定量的實驗測試(容差參數(shù)maxDist=0.007 5).其中,F(xiàn)-measure的具體計算如下:
其中:[TP]表示被正確檢測的輪廓像素個數(shù);[FP]表示被錯誤檢測的輪廓像素個數(shù);[FN]表示被遺漏檢測的輪廓檢測像素個數(shù);[P]表示精確率(Precision);[R]表示回歸率(Recall);[F]為二者的調(diào)和平均,表示模型的檢測輪廓與真實輪廓(Ground Truth)之間的相似性.通常,F(xiàn)-measure評判方法對應有3個標準的性能指標:ODS(整個數(shù)據(jù)集取最優(yōu)閾值)、OIS(每幅圖像取最優(yōu)閾值)和AP(平均精確率).
本文模型(MPV)的參數(shù)組合[σ∈{1.0, 1.5, 2.0, 2.5}],[θ∈{8, 12, 16}],[α∈{0.9, 1.0, 1.1, 1.2}],并通過在Berkley分割數(shù)據(jù)集(BSDS300/500)的實驗測試,取得最優(yōu)參數(shù)為[σ=1.5],[θ=8],[α=1].為了突出固視微動在提取圖像輪廓信息中的重要性,將文獻[5](ISO(Div))中沒有模擬固視微動機制的檢測輪廓圖與本文模型(MPV)的檢測輪廓圖作對比,如圖3所示.圖3(a)為自然圖像,圖3(b)為真實輪廓(Ground Truth),圖3(c)為 ISO(Div)模型檢測輪廓圖,圖3(d)為本文模型(MPV)檢測輪廓圖.實驗結(jié)果表明,在固視微動的作用機制下,檢測出更多的有效信息,使弱輪廓得到增強,保留的輪廓更完整.
3? ? 結(jié)論
在圖像處理及計算機視覺領域里,輪廓檢測作為一項基本研究任務,如何精準高效地區(qū)分目標輪廓和背景紋理一直是研究的重點和難點.近年來,眼動在研究上取得新的研究成果,為仿生型輪廓檢測提供了新的原理和方法.一直以來,學者們主要考慮固視微動生理機制在非經(jīng)典感受野區(qū)域?qū)y理抑制的作用效果,而忽略了在視覺細胞經(jīng)典感受野區(qū)域的應用.因此,本文通過圖像的局部信息計算得到高斯一階導濾波器的偏移量,并建立具有固視微動特性的高斯一階導新模型,有效地模擬了固視微動生理機制在視覺細胞經(jīng)典感受野的作用機制.實驗表明,引入了固視微動生理機制的高斯一階導新模型能夠檢測更多的輪廓細節(jié),抑制更多的背景紋理,表現(xiàn)出更優(yōu)的檢測性能.實際上,固視微動是一個復雜的生理過程,這一生理現(xiàn)象對視覺各層面都產(chǎn)生直接的影響.然而,本文只在初級視覺皮層考慮了環(huán)境周邊信息和偏移角度因素對固視微動的影響,沒有從時間的角度研究固視微動的動態(tài)變化,構(gòu)建的模型較理想化.其他因素(如顏色、亮度對比度、時間等)對固視微動的影響,以及固視微動在其他視覺層面對視覺信息處理所做的貢獻都有待進一步研究.
參考文獻
[1]? ? ?TANG Q L,SANG N,ZHANG T X. Extraction of salient contours from cluttered scenes[J]. Pattern Recognition,2007,40(11):3100-3109.
[2]? ? ?閆夏,譚光興,林川.基于免疫聚類算法的MRI膝關節(jié)圖像分割[J].廣西科技大學學報,2015,26(1): 70-74.
[3]? ? ?TANG Q L,SANG N,ZHANG T X. Contour detection based on contextual influences[J]. Image & Vision Computing,2006,25(8):1282-1290.
[4]? ? ?TANG Q L,SANG N,ZHANG T X. A neural network model for extraction of salient contours[C]// Proceedings of the Second International Conference on Advances in Neural Networks. Advances in Neural Networks – ISNN 2005:316-320.
[5]? ? ?GRIGORESCU C,PETKOV N,WESTENBERG M A.Contour detection based on nonclassical receptive field inhibition[J]. IEEE Transactions on Image Processing,2003,12(7):729-739.
[6]? ? ?LONG L,LI Y J. Contour detection based on the property of orientation selective inhibition of non-classical receptive field[C]// 2008 IEEE Conference on Cybernetics and Intelligent Systems. IEEE:1002-1006.
[7]? ? ?YANG K F,LI C Y,LI Y J. Potential roles of the interaction between model V1 neurons with orientation-selective and non-selective surround inhibition in contour detection[J].Frontiers in Neural Circuits,2015,9:30.
[8]? ? ?YANG K F,LI C Y,LI Y J. Multifeature-based surround inhibition improves contour detection in natural images[J]. IEEE Transactions on Image Processing,2014,23(12):5020-5032.
[9]? ? ?YANG K F,LI Y J. A coutour detection model based on surround inhibition with multiple cues[C]// Chinese Conference on Pattern Recognition,Beijing,China, September 24-26,2012. Berlin:Springer Heidelberg,2012:145-152. http://dx.doi.org/10.1007/978-3-642-33506-8_19.
[10]? ?潘亦堅,林川,郭越,等.基于非經(jīng)典感受野動態(tài)特性的輪廓檢測模型[J].廣西科技大學學報,2018,29(2):77-83.
[11]? ?桑農(nóng),唐奇伶,張?zhí)煨?基于初級視皮層抑制的輪廓檢測方法[J].紅外與毫米波學報,2007,26(1): 47-51,60.
[12]? ?ZENG C,LI Y J,YANG K F,et al. Contour detection based on a non-classical receptive field model with butterfly-shaped inhibition subregions[J]. Neurocomputing,2011,74(10):1527-1534.
[13]? ?林川,李亞,曹以雋.考慮微動機制與感受野特性的輪廓檢測模型[J].計算機工程與應用,2016,52 (24):210-216.
[14]? ?竇燕,康錦華,王麗盼.結(jié)合人眼微動的新型非經(jīng)典感受野模型[J].光學學報,2019,39(3):136-143.
[15]? ?LIN C,ZHANG Q,CAO Y. Multi-scale contour detection model based on fixational eye movement mechanism[J]. Signal,Image and Video Processing,2020,14(1):57-95.
[16]? ?DITCHBURN R W, GINSBORG B L. Vision with a stabilized retinal image[J]. Nature,1952,170(4314): 36-37.
[17]? ?WALLISCH P,MOVSHON J A. Structure and function come unglued in the visual cortex[J]. Neuron, 2008,60(2):195-197.
[18]? ?毛曉波,陳鐵軍.仿生型機器視覺研究[J].計算機應用研究,2008,25(10):2903-2905,2910.
[19]? ?壽天德. 視覺信息處理的腦機制[M].合肥:中國科學技術(shù)大學出版社,2010.
[20]? ?劉建立,沈菁,王蕾,等.織物紋理的簡單視神經(jīng)細胞感受野的選擇特性[J].計算機工程與應用,2014, 50(1):185-190.
[21]? ?MARTIN D R, FOWLKES C C,MALIK J. Learning to detect natural image boundaries using local brightness,color,and texture cues[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2004,26(5):530-549.
(責任編輯:黎? 婭)