杜馨瑜 李永杰 堯德中
(電子科技大學(xué)神經(jīng)信息教育部重點實驗室,成都 610054)
視覺是人類和高等動物賴以認識客觀世界的主要感覺。在輸入的全部感覺信息中,估計有70%以上與處理視覺信息有關(guān)[1]。一方面,現(xiàn)代信息技術(shù)的長足進步促進了視覺研究的深入;另一方面,對視覺基礎(chǔ)研究的深入,又反過來對信息技術(shù)提供了新的研究思路。
借鑒視覺機制建立圖像處理模型可以從以下兩個方面考慮,一類是基于視覺單細胞神經(jīng)元感受野電生理特性,如Marr等提出用雙高斯濾波器(DOG)來解釋人類視覺的底層行為,實現(xiàn)圖像邊緣提取[2],邱芳土等對非經(jīng)典感受野的三高斯模型改進用于圖像增強[3]。Ghosh等引入δ函數(shù)來表示非經(jīng)典感受野的高階Laplace特性,用于圖像增強,邊緣檢測和解釋視覺心理[4]。另一類是在考慮視覺神經(jīng)元系統(tǒng)的基礎(chǔ)上,在視覺神經(jīng)元的網(wǎng)絡(luò)功能層次上進行圖像處理建模,如脈沖耦合神經(jīng)網(wǎng)絡(luò)等。
Kayser等認為視覺系統(tǒng)高層次加工不僅僅是受單個細胞的影響[5,6]。因此,另一類模型在考慮視覺神經(jīng)元系統(tǒng)的基礎(chǔ)上,在視覺神經(jīng)元的網(wǎng)絡(luò)功能層次上進行圖像處理建模。如,Munder等采用帶有局部感受野的前向神經(jīng)網(wǎng)絡(luò)提取圖像特征對行人進行識別[7]。Wohler等采用延時神經(jīng)網(wǎng)絡(luò)模擬感受野群的時空特性對序列圖像進行分析[8]。Perez等采用前向神經(jīng)網(wǎng)絡(luò)模擬視覺系統(tǒng)多細胞感受野進行人臉識別和手寫字體識別[9]。Sejnowski和Olshausen分別從獨立成分分析和稀疏成分分析角度對視覺圖像編碼進行了探討[10-11]。
采用小波或Gabor變換模擬視覺系統(tǒng)在以上兩類模型中都有涉及。常用Gabor變換模擬視皮層單細胞神經(jīng)元感受野的神經(jīng)電生理特性,如朱舜山等利用Gabor變換模擬感受野,并用于圖像的重建、壓縮及解釋稀疏編碼[12]。Grigorescu等利用Gabor變換模擬感受野方位選擇性進行邊緣檢測[13]。Gaudart等認為,Gabor變換并不能更好的協(xié)調(diào)實際視覺特性和模擬的激勵響應(yīng),而應(yīng)擴展單一的Gabor核到一般的小波核在視覺神經(jīng)元網(wǎng)絡(luò)層次上建模[14],如Nuding等結(jié)合神經(jīng)網(wǎng)絡(luò)和小波分析,用非線性小波神經(jīng)網(wǎng)絡(luò)探討視覺特性[15]。
馬爾柯夫隨機場(Markov random field,MRF)由于把物理學(xué)中分析現(xiàn)象空間與背景依賴性的概率理論,與圖像處理中局部鄰域像素關(guān)聯(lián)性相聯(lián)系而成為圖像處理領(lǐng)域常用的模型之一。對MRF的詳細描述見文獻[16]。一些研究者更進一步采用多尺度MRF并在小波域進行建模。到目前為止,一些現(xiàn)有的小波域的馬爾柯夫隨機場金字塔模型,如文獻[17-19],僅僅是基于純技術(shù)領(lǐng)域的圖像處理模型,并沒有與神經(jīng)科學(xué)相聯(lián)系。與之類似,也有許多模擬視覺系統(tǒng)的模型,但這些模型并未利用MRF[20-22],或者這些模型并不是圖像處理模型[23]。
本研究中,首先采用小波變換來模擬視皮層細胞感受野對輸入圖像進行稀疏表示;接者,采用多尺度MRF處理前一階段的圖像稀疏表示信息。通過配置不同的參數(shù),模型可以完成不同的圖像分割任務(wù),如圖像區(qū)域分割和邊緣檢測。
本研究的組織結(jié)構(gòu)如下:在材料和方法部分,首先對視覺系統(tǒng)進行簡要介紹,然后提出模型結(jié)構(gòu),并對模型中的自底向上和自頂向下兩類信息流進行詳細描述。在結(jié)果部分,一些實際應(yīng)用中的生物醫(yī)學(xué)圖像分割實驗展示了該模型的圖像分割功能。最后,在討論部分,對全文進行總結(jié),并從神經(jīng)科學(xué)的角度對模型進行初步的討論。
編程環(huán)境:Matlab;圖像資料:采集到真實生物醫(yī)學(xué)圖像若干。
1.2.1 視覺機制簡介
視網(wǎng)膜是處理接收到的外界刺激信息(如圖像)的第一個環(huán)節(jié)。然后,這些經(jīng)視網(wǎng)膜預(yù)處理過的信息經(jīng)由外側(cè)膝狀體傳到基礎(chǔ)視皮層(V1區(qū))和高級視皮層進行更高層次的加工處理。視覺系統(tǒng)的特性可以概括為以下幾點:(1)等級層次性:視覺信息是分級處理的,也就是說,視覺信息從視網(wǎng)膜到視皮層分級依次處理;(2)雙向連接性:視覺神經(jīng)元之間的連接絕大多數(shù)是雙向的,即由前向連接和后向連接組成;(3)特征檢測器:例如大多數(shù)的V1區(qū)神經(jīng)元對具有朝向性的刺激很敏感;(4)學(xué)習(xí)機制:一般來說,視覺系統(tǒng)中的學(xué)習(xí)機制是自組織和非監(jiān)督的;(5)選擇注意機制:該特性可以使人類從復(fù)雜背景中快速發(fā)現(xiàn)感興趣的目標(biāo)。
1.2.2 從圖像處理的角度描述小波域多尺度馬爾柯夫隨機場模型
許多圖像分割的問題都可以看做是對圖像的標(biāo)記過程,也就是通過對原圖像的像素或其他特征,分配一系列適當(dāng)標(biāo)簽來完成特定的圖像分割任務(wù)[16]。特別對小波域多尺度馬爾柯夫隨機場模型(A multiscale Markov random field model in wavelet domain,W3M)而言,用對輸入圖像(觀測層)一層小波分解后系數(shù)(W)作為圖像特征,用X代表各個隱含層的標(biāo)簽集,如圖1(a)所示。從圖像處理的角度,當(dāng)給定觀測層W時,圖像分割問題可以轉(zhuǎn)化為通過貝葉斯公式尋找關(guān)于X的最大后驗概率(MAP)的問題,即
在多尺度模型中,不同尺度(金字塔的不同層)的標(biāo)簽集和相應(yīng)的位置集分別表示為X={X(0),X(1),…,X(L)}和S={S(0),S(1),…,S(L)},其中第0層表示金字塔的最底層,也就是最小尺度(最大分辨率)層;第L層表示金字塔的最頂層,也就是最大尺度(最小分辨率)層。從另一個方面來講,所提出的W3M模型是一個四叉樹和圖的混合結(jié)構(gòu)。其中四叉樹表示自底向上的標(biāo)記過程(如圖1(b)所示),而圖表示自頂向下的標(biāo)記修正過程(如圖1(c)所示)。從圖1可以看到,圖結(jié)構(gòu)比四叉樹稍微復(fù)雜。這是因為在圖結(jié)構(gòu)表示的自頂向下的過程中,3個父節(jié)點(如i,j,k)連接1個共有的子節(jié)點(如m),而在四叉樹表示的自底向上的過程中,各個父節(jié)點沒有共同的子節(jié)點。從總體而言,這兩種結(jié)構(gòu)充分利用上下文相關(guān)(鄰域)信息,更真實地反應(yīng)了實際視皮層神經(jīng)元連接的復(fù)雜性。
圖1 模型的基本結(jié)構(gòu)。(a)觀測層(特征提取層)W與標(biāo)記層X對應(yīng)關(guān)系簡圖;(b)自底向上過程的四叉樹結(jié)構(gòu);(c)自頂向下過程的圖結(jié)構(gòu)(i,j,k為父節(jié)點,m為公共子節(jié)點)Fig.1 The basic structures of the model.(a)The sketch map of the observed layer W and the labeled layer X;(b)The quadtree in the bottom-up procedure;(c)The graph in the top-down procedure(The nodes i,j and k are fathers and the node m is the son)
本研究中W3M模型的四叉樹與圖的混合結(jié)構(gòu)是建立在文獻[24]所采用的結(jié)構(gòu)基礎(chǔ)上的,做了三方面的改進:一是采用小波變換以提取更為豐富的信息,而不是只采用灰度作為特征;二是W3M模型通過不同的參數(shù)設(shè)置完成不同的圖像分割任務(wù);三是賦予模型視覺神經(jīng)科學(xué)方面的意義,從神經(jīng)科學(xué)的角度說明W3M所表示的意義。
W3M模型的金字塔結(jié)構(gòu)由L+1層組成,最上層定義為第L層,最下層定義為第0層。第n層的標(biāo)簽估計,根據(jù)參考文獻[24]及貝葉斯公式,可寫為
1.2.3 自底向上過程(圖1(b)所示的四叉樹結(jié)構(gòu))
式(2)右邊的第一個似然函數(shù)項可以寫為式(4)中,假設(shè)pw|x(0)(w|x(0))服從高斯分布。式(5)中,k為某一標(biāo)簽的值,M是標(biāo)簽的類別。θn∈[0,1]是標(biāo)簽轉(zhuǎn)移概率,表示第n層某一節(jié)點經(jīng)過與該節(jié)點同層的鄰域節(jié)點相互競爭,向其共同的第n+1層父節(jié)點向上傳遞當(dāng)前第n層該節(jié)點標(biāo)簽值的概率。這是尺度間多個子節(jié)點與一個父節(jié)點標(biāo)簽場向上的一階Markov性的體現(xiàn),表現(xiàn)為MRF。兩種極端情況,θn=1和θn=0的意義分別為完全成功向上傳遞和完全失敗傳遞。d-1(s)表示位置s處的子節(jié)點位置集合。式(5)的意義是:在第n+1層位置s處某一節(jié)點取標(biāo)簽值k的條件概率分布由該節(jié)點對應(yīng)的所有子節(jié)點標(biāo)簽值的加權(quán)概率密度分布所決定,并且這些子節(jié)點的標(biāo)簽值可以是k,也可以是其它值。對于不同的圖像分割任務(wù),使用下式代替式(4)
圖2 模型框架和計算流程。(a)模型框架(數(shù)字標(biāo)號對應(yīng)計算流程步驟號);(b)計算流程Fig.2 The framework and the flowchart of the model.(a)The framework of the proposed W3M model(The number designations correspond to the steps in the computational flowchart.)(b)The computational flowchart
式中,λLL,λLH,λHL,λHH是加權(quán)系數(shù),表示小波分解后低頻、中頻和高頻不同分量的混合比例。這種混合可以理解為初級視皮層感受野對信號進行多種處理后在高級視皮層的整合[25],調(diào)節(jié)不同的權(quán)重值可以完成不同的視覺任務(wù)。
1.2.4 自頂向下過程(圖1(c)所示的圖結(jié)構(gòu))
為了解釋式(2)中的第2項,假設(shè)某一層的1個節(jié)點與3個父節(jié)點相連。αn∈[0,1](n為當(dāng)前金字塔層數(shù))是該節(jié)點與它的某一父節(jié)點有相同標(biāo)簽的概率。這是尺度間多個父節(jié)點與一個子節(jié)點標(biāo)簽場向下的一階Markov性的體現(xiàn),表現(xiàn)為MRF。從另一方面,1-αn表示了該節(jié)點與它的某一父節(jié)點標(biāo)簽不一致的傳遞概率。因此,可以認為式(2)的第2項模擬了視覺系統(tǒng)自頂向下的反饋機制。把父節(jié)點標(biāo)記為i,j,k,子節(jié)點標(biāo)記為m,可以用下式來計算標(biāo)簽傳遞概率
考慮極端情況,αn=1代表了從父節(jié)點到子節(jié)點的標(biāo)簽完全確定性傳遞,各父節(jié)點的權(quán)重參考文獻[24]的設(shè)置,依次取為3/7、2/7、2/7,表明假設(shè)各個父節(jié)點對該子節(jié)點的影響并不是等同的,其中一個較另外兩個影響大;αn=0則表示在M類標(biāo)簽中完全隨機傳遞,每一類標(biāo)簽都有相等的概率傳遞給子節(jié)點。顯而易見,式(7)的意義在于W3M模型第n層位置s(對應(yīng)節(jié)點m)的標(biāo)簽由該節(jié)點的3個父節(jié)點的標(biāo)簽以及模型參數(shù)αn所決定。δ為克羅內(nèi)克函數(shù)。
根據(jù)以上各式,式(2)可以重新寫為
在上述的過程中,對αn和θn初始值設(shè)為任意的(0,1)區(qū)間值,在自底向上和自頂向下過程中采用EM算法反復(fù)迭代。即:最初的E步驟,人為設(shè)定αn和θn值,根據(jù)底層觀測場(小波分解系數(shù))以及使用模糊聚類得到的初始底層標(biāo)簽場,按照上述的自底向上以及自頂向下過程執(zhí)行一個循環(huán),得到一個暫時確定的各層標(biāo)簽場;再進行M步驟,根據(jù)得到的各層標(biāo)簽場和底層觀測場(小波分解系數(shù))進行極大期望似然估計,對初始設(shè)定的αn和θn值進行修正。如此反復(fù)的進行E步驟和M步驟。因此最終的αn和θn值以及各層標(biāo)簽場由EM算法迭代終止時所決定,最終的分割結(jié)果由底層標(biāo)簽場決定。極大期望似然估計公式形式可以參見文獻[24]的推導(dǎo)。由上所述,W3M模型的核心思想是:在金字塔最底層用小波提取輸入圖像特征并對這些特征進行相應(yīng)的組合并初始標(biāo)記;標(biāo)簽按四叉樹結(jié)構(gòu)和圖結(jié)構(gòu)分別進行自底向上和自頂向下的反復(fù)迭代傳遞;在每次迭代過程中,αn和θn被估計,并且根據(jù)式(8),圖像各個位置的標(biāo)簽也同時被更新,最后在最底層輸出圖像分割結(jié)果。W3M模型的框架以及流程圖分別如圖2中(a)和(b)所示。
通過兩組不同的實驗,展示W(wǎng)3M模型所具有的圖像區(qū)域分割和邊緣檢測能力,這些實驗都是采用真實采集到的生物醫(yī)學(xué)圖像。
圖3與圖4是圖像區(qū)域分割實驗。圖3(a)是待分割的顯微圖像。分割目標(biāo)是區(qū)分出高亮熒光染色體以便于計數(shù)。這里,為了展示模型性能,采用原圖像的灰度圖作為待分割圖像。圖3(b)為采用模糊均值聚類的結(jié)果,可以看出有許多誤分割。圖3(c)為采用W3M模型的分割結(jié)果,可以看到所有高亮熒光染色體都得到正確的分割。這里,采用的是雙正交小波(Matlab中表示為bior4.4),參數(shù)選擇為:λLL=0.5、λLH=1.0、λHL=1.0、λHH=0。圖4(a)是待分割的CT圖像。分割的目標(biāo)是骨皮質(zhì)的髂骨和骶骨以及微鈣化點。圖4(b)是采用模糊均值聚類的結(jié)果,圖4(c)是采用W3M模型分割的結(jié)果,可以看出在分割的細節(jié)方面,如微鈣化點的分割,所提出的模型要好于模糊均值聚類。這里采用哈爾小波(Matlab中表示為Haar),參數(shù)選擇為:λLL=1、λLH=1、λHL=1、λHH=0。
圖3 顯微圖像分割結(jié)果。(a)原圖像;(b)模糊聚類的結(jié)果;(c)W3M模型結(jié)果Fig.3 Comparison of image segmentation results on a micrograph image.(a)The input image;(b)The result of a fuzzy clustering method;(c)The result of the proposed model
圖5為邊緣檢測實驗的結(jié)果。目標(biāo)是勾勒出白質(zhì)邊緣。上圖是原始的一層磁共振掃描頭部去腦殼后的圖像。中間是用Canny算子邊緣檢測的結(jié)果,下圖是W3M模型邊緣檢測結(jié)果??梢钥闯?,所提出的模型在勾勒出的白質(zhì)邊緣上的視覺表現(xiàn)更為清晰。這里采用哈爾小波(Matlab中表示為Haar),參數(shù)選擇為:λLL=0、λLH=1、λHL=1、λHH=1。
圖4 腹部CT圖像分割結(jié)果。(a)原圖像;(b)模糊聚類的結(jié)果;(c)W3M模型結(jié)果,包括骨皮質(zhì)的髂骨和骶骨以及微鈣化點Fig.4 Comparison of image segmentation results on an abdominal CT image.(a)The input image;(b)The result of a fuzzy clustering method;(c)The results of the proposed model are the cortical bone of iliac bone and sacrum,including the microcalcifications
圖5 邊緣檢測結(jié)果比較(上圖為頭部MRI圖像;中圖為采用Canny算子結(jié)果;下圖為采用W3M模型結(jié)果)Fig.5 Comparison of edge detection on a head MR image(Top:input image;Middle:result of Canny detector;Bottom:result of the proposed model)
通過大量的實驗驗證及相應(yīng)的理論分析,主要選擇兩種小波基:雙正交小波基bior4.4和哈爾小波基Harr。雙正交小波bior4.4具有有限支撐、高階消失鉅,光滑性并且其對稱性保證了對應(yīng)的濾波器組具有線性相位,能更好地逼近原信號。而人類視覺對非線性相位的失真較為敏感,所以圖像處理中的具有對稱性的小波得到更廣泛的應(yīng)用。哈爾小波基具有對稱性,并且其最短的支撐保證對圖像空域的局部刻畫能力強。因此關(guān)于邊緣提取的實驗選用Haar小波。在區(qū)域分割的實驗中,由于受背景的干擾,過于細致的局部刻畫能力反而會影響最終的效果,選擇具有對稱性,且支撐長度適中的雙正交小波基bior4.4,就能達到較好的效果。
對于系數(shù)λLL、λLH、λHL、λHH(取值區(qū)間設(shè)定為[0,1])的選擇討論如下。在圖像區(qū)域分割實驗中,由于分割結(jié)果以區(qū)域的形式存在,即結(jié)果要有對應(yīng)于原圖像平坦區(qū)域的部分,以及去除孤立干擾點,這要求我們傾向于保留原圖像中能量相對集中的低頻和中頻成分進行分類,因此略去高頻系數(shù)λHH,讓水平分量系數(shù)和垂直分量系數(shù)相等(λLH=λHL=1.0),而低頻系數(shù)λLL的大小取決于圖像整體背景與分割目標(biāo)在分割過程中的交互作用對最終分割效果的影響。低頻系數(shù)λLL過小,使應(yīng)該提取的部分目標(biāo)誤分為背景,若低頻系數(shù)λLL過大,會使目標(biāo)提取過度,把一部分背景誤分為目標(biāo)。按經(jīng)驗設(shè)置λLL=0.5。在圖像邊緣提取實驗中,結(jié)果要對應(yīng)于原圖像的邊緣區(qū)域,理所當(dāng)然在參數(shù)設(shè)置中設(shè)置λLL=0.
本研究提出一個新的圖像處理模型W3M以模擬人類某些視覺機制,如等級層次性、雙向連接性、特征檢測器和學(xué)習(xí)機制。把上述機制整合到一個統(tǒng)一的框架內(nèi),所提出的模型可以通過選擇不同的參數(shù)來完成不同的圖像分割任務(wù)。將模型與人類視覺機制的關(guān)系總結(jié)成表1,并作簡要的討論。
表1 視覺機制與W3M模型的關(guān)系Tab.1 The relationship between visiual mechanism and W3M
如引言中所述,視皮層細胞感受野具有局部性、方向性和帶通濾波性,可以用小波變換來描述[14]。另外,視覺系統(tǒng)采用冗余壓縮的方式來記錄表示外部刺激,從而對感知到的信息提供了一種稀疏的表示[26],而小波變換恰恰也是一種信號稀疏表示的工具[27-28]。本研究中,小波變換用作特征檢測器對圖像進行稀疏表示,不同的小波系數(shù)組合可以完成不同的圖像分割任務(wù),即式(6)所示,參數(shù)λ=[λLL、λHL、λLH、λHH]由不同的任務(wù)所決定。根據(jù)小波不同頻段分解所代表的意義,對于圖像區(qū)域分割,一般保留低頻系數(shù)λLL以及中頻系數(shù)λHL和λLH,設(shè)置高頻系數(shù)λHH=0;對于邊緣檢測而言,一般設(shè)置低頻系數(shù)λLL=0,保留其余系數(shù)。
以金字塔結(jié)構(gòu)為基礎(chǔ)的多尺度信息處理思想與視覺系統(tǒng)的等級層次性相對應(yīng)。首先,視覺系統(tǒng)是由各層次的處理單元所組成,如視網(wǎng)膜、初級視皮層、高級視皮層等。并且各層之間都具有自底向上和自頂向下的雙向連接。體現(xiàn)在所提出的W3M模型中,可以看到模型每一層都由代表層感受野的許多節(jié)點所組成,并且所有的節(jié)點都相互連接。且每一層節(jié)點所影響的范圍(代表該層感受野)的大小隨著金字塔結(jié)構(gòu)自底向上逐層增大,這也與視覺系統(tǒng)中的感受野層次越高,影響范圍越大相對應(yīng)。
視知覺從哪里來是一個本源性問題。一種解釋是直接來源于神經(jīng)生理學(xué)的神經(jīng)還原論[29]。該理論認為可以用作為特征檢測器的濾波器組模擬感受野,對輸入圖像信息進行逐級提取,并拋棄冗余信息[30]。本模型采用小波作為特征檢測器,并且在金字塔模型中用參數(shù)θn自底向上逐級競爭提取信息的思想與上述理論是相符合的。
另一種解釋是格式塔理論的知覺組織原則。該理論強調(diào)整體知覺組織原則在視知覺中的重要性。MRF通過勢團內(nèi)的局部連接性(馬爾柯夫性),以及實際計算中采用的等價吉布斯隨機場全局勢函數(shù)表現(xiàn)出的圖像全局性,表現(xiàn)出視覺系統(tǒng)所具有的格式塔特性。MRF與格式塔心理學(xué)之間的關(guān)系也已由Zhu等建立的相關(guān)數(shù)學(xué)理論所描述[31]。本研究模型在不同的尺度下形成MRF,建立層與層之間因果關(guān)系,用參數(shù)αn表示視覺神經(jīng)系統(tǒng)自頂向下的反饋連接特性,體現(xiàn)了具有更多全局信息的父節(jié)點對表現(xiàn)更多局部特征的子節(jié)點的控制,符合格式塔學(xué)派強調(diào)整體的觀點。
另外,金字塔各層之間的側(cè)向連接性提供了一種自學(xué)習(xí)機制[20]。正如參數(shù)θn,αn,一經(jīng)初始設(shè)定,在本模型的算法中自動改變不需人為干預(yù),體現(xiàn)了一種自學(xué)習(xí)特性。
本研究提出的W3M模型在一定程度上模擬了視覺機制,通過不同的參數(shù)設(shè)置完成不同的圖像分割任務(wù),展示了在生物醫(yī)學(xué)圖像處理中的應(yīng)用潛力。在后續(xù)研究中,將會用本模型對能夠采集到的更多類型的真實生物醫(yī)學(xué)圖像進行測評;另外將采用更為先進的技術(shù)手段增加模型的運算速度。
[1]徐科.神經(jīng)生物學(xué)綱要[M].北京:科學(xué)出版社2005:209.
[2]Shapiro LG,Stockman GC.計算機視覺[M].北京:機械工業(yè)出版社,2005:115.
[3]邱芳土,李朝義.同心圓感受野去抑制特性的數(shù)學(xué)模擬[J].生物物理學(xué)報,1995,11(2):214-220.
[4]Ghosh K,Sarkar S,Bhaumik K.Understanding image structure from a new multi-scale representation of higher order derivative filters[J].Image Vision Comput,2007,25(8):1228-1238.
[5]Kayser C,Einhauser W,Kongig P.Processing of complex stimuli and nature scenes in the visual cortex[J].Current Opinion in Neurobiol,2004,14(4):468-473.
[6]Kayser C,Einhauser W,Kongig P.Responses to Natural Secenes in Cat V1[J].J Neurophysiol,2003,90(3):1910-1920.
[7]Munder S,Gavrila DM.An experimental study on pedestrian classification[J].IEEE Trans Pattern Anal Mach Intell,2006,28(11):1863-1868.
[8]Wohler C,Anlauf JK.An adaptable time-delay eural-network algorithm for image sequence analysis[J].IEEE Trans Neural Networ,1999,10(6):1531-1536.
[9]Perez CA,Salinas CA,etc.Genetic design of biologically inspired receptive fields for neural pattern recognition[J].IEEE Trans Syst Man Cy B,2003,33(2):258-270.
[10]Bell AJ,Sejnowski TJ.The“independent components”of natural scenes are edge filters[J].Vision Res,1997,37(23):3327-3338.
[11]Olshausen BA,F(xiàn)ield DJ.Sparse coding with an.overcomplete basis set:A strategy employed by V1?[J].Vision Res,1997,37(23):3311-3325.
[12]朱舜山,齊翔林,汪云九.基于視覺編碼的圖像處理研究[J].生物物理學(xué)報,1996,12(2):297-309.
[13]Grigorescu C,Petkov N,Westenberg MA.Contour detection based on nonclassical receptive field inhibition[J].IEEE Trans Image Process,2003,12(7):729-739.
[14]Gaudart L,Crebassa J,Petrakian JP.Wavelet transform in human visual channels[J].Appl Opt,1993,32(23):4119-4127.
[15]Nuding U,Zetzsche C.Learning the selectivity of V2 and V4 neurons using non-linear multi-layer wavelet networks[J].Biosystems,2007,89(1-3):273-279.
[16]Li SZ.Markov random field modeling in image analysis[M].Berlin:Springer-Verlag,2009:1-20.
[17]NodaH,ShiraziM,KawaguchiE.MRF-based texture segmentation using wavelet decomposed images[J].Pattern Recogn,2002,35(4):771-782.
[18]劉國英,茅力非,王雷光,等.基于小波域分層Markov模型的紋理分割[J].武漢大學(xué)學(xué)報(信息科學(xué)版),2009,34(5):531-534.
[19]李旭超,朱善安,朱勝利.基于小波域?qū)哟?Markov模型的圖像分割[J].中國圖象圖形學(xué)報,2007,12(2):308-314.
[20]George D,HawkinsJ.A hierarchicalBayesian modelof invariant pattern recognition in the visualcortex[C]//Prokhorov DV,eds.2005 IEEE International Joint Conference on Neural Networks(IJCNN’05).Piscataway:IEEE Press,2005:1812-1817.
[21]Lee TS,Mumford D.Hierarchical bayesian inference in the visual cortex[J].J Opt Soc Am,2003,20(7):1434-1448.
[22]Serre T,Wolf L.Robust object recognition with cortex-like mechanisms[J]IEEE Trans Pattern Anal Mach Intell,2007,29(3):411-426.
[23]Dean T.A computational model of the cerebral cortex[C]//Veloso M,Kambhampati S,eds.Proceedings of Twentieth National Conference on Artificial Intelligence(AAAI’05).Menlo Park:AAAI Press,2005:938-943.
[24]Bouman C,Shapiro M.A Multiscale Random Field Model for Bayesian Image Segmentation[J].IEEE Trans Image Process,1994,3(2):162-177.
[25]尼克爾斯等著,楊雄里,等譯.神經(jīng)生物學(xué)——從神經(jīng)元到腦(第4版)[M].北京:科學(xué)出版社,2009:499-519.
[26]Attneave F.Some informational aspects of visual perception[J].Psychol Revnt,1954,61:183-193.
[27]Bronstein A,Bronstein M.Sparse ICA for blind separation of transmitted and reflected images[J].Int J Imag Syst Tech,2005,15(1):84-91.
[28]Olshausen B,F(xiàn)ield D.Sparse coding of sensory input[J]Curr Opin Neurobiol,2004,14(4):481-487.
[29]Barlow HB.Single units and sensation:a neuron doctrine for perceptual psychology?[J].Perception,1972,1(4):371-394.
[30]Daugman J.Complete discrete 2-D Gabor transform by neural networks for image analysis and compression[J].IEEE Trans Acoust,Speech,Signal Process,1988,36(7):1169-1179.
[31]Zhu SC,Wu YN.From local features to global perception—A perspective of Gestalt psychology from Markov random field theory[J].Neurocomputing,1999,26-27(6):939-945.