【摘要】人臉研究一直是計算機視覺、模式識別和計算機圖形學領(lǐng)域中的熱點研究問題之一?,F(xiàn)今,通過監(jiān)視器得到的人臉圖像分辨率不高,以至于給人臉識別和跟蹤等后續(xù)應用帶來很大的難度。本文提出一種基于學習的超分辨率重構(gòu)算法來得到清晰的人臉圖像,采用對圖像塊搜索操作進行位置限制和檢查圖像分塊間重疊區(qū)域水平兼容性的思想,降低了搜索的復雜度,提高了匹配相關(guān)性。
【關(guān)鍵詞】人臉圖像識別;超分辨率重構(gòu);學習算法
Abstract:The research of face image is one of hot questions in the field of the pattern recognition and computer graphics.Now adays,the human face image resolution through the monitoring device is not effective and it’s not so helpful to the human face recognition and the track and so on.We propose a novel algorithm that uses the location-restraint operation and the most compatible neighboring patches along horizontal dimension of the face to directly mosaic the high-resolution patches into the outcome.This method can reduce the complexity of search order,enhance the match relevance.
Key Words:Human face image recognition;Super resolution;Learning-based algorithm
1.前言
很多應用領(lǐng)域如醫(yī)學,遙感,監(jiān)視系統(tǒng),常常需要高分辨率的圖像,但是通常的成像系統(tǒng)由于受到成像條件和成像方式的限制,我們不能得到很高分辨率的圖像。因此需要對得到的觀測圖像進行放大處理。很多傳統(tǒng)單幀縮放算法,如最近鄰域法,雙線性插值法,三次卷積法等算法都可實現(xiàn)圖像的放大效果,但是由于受到信息量的限制,這些單幅圖像處理后高頻細節(jié)被丟失,放大以后也不清晰。本文提出一種基于超分辨率圖像重構(gòu)技術(shù)(Super Resolution Image Reconstruction,SR)來獲得較高分辨率圖像的方法。
SR技術(shù)的基本思想是,以若干模糊、有噪、頻譜混疊的低分辨率(Low Resolution,LR)圖像為輸入源,通過信號處理技術(shù)融合出一幅高分辨率(Hight Resolution,HR)圖像[1][2]。由于SR技術(shù)可以克服圖像系統(tǒng)的內(nèi)在分辨率限制,同時還能夠消除噪聲以及由有限檢測器尺寸和光學元件產(chǎn)生的模糊,改進圖像處理中大多數(shù)圖像的質(zhì)量,且具有低成本的特點,現(xiàn)有的LR成像系統(tǒng)仍可以使用。
近年來,一種基于學習(learning-based algorithm)的SR方法正在興起。學習算法主張,利用訓練圖像集中的HR圖像與LR圖像的對應關(guān)系來幫助定義PDF。本文利用馬爾可夫網(wǎng)絡模型來學習訓練庫中與低分辨率圖像不同區(qū)域相對應的高分辨率圖像的精細細節(jié),然后利用學習得到的關(guān)系來預測輸入低分辨率圖像的細節(jié)信息。
2.生成低分辨率圖像訓練庫
通過對原始高分辨率圖像IH應用幾何扭曲,模糊和子采樣,得到低分辨率圖像IL,然后在其中加入噪聲,產(chǎn)生的模型可描述為:
(1)
在(1)式中,矩陣A表示一些線性降階處理,而被認為是0域和白高斯隨機矢量,其概率為:
(2)
對訓練用的高分辨率圖像和對應的低分辨率圖像進行分塊,使訓練圖像集由塊對(patch pair)構(gòu)成。分塊的最小尺度是一個像素,但在本文提出的方案中,實驗表明分塊太小不僅會增加匹配計算量,而且會降低有限次匹配操作內(nèi)找到相容鄰居的概率。但是分塊也不能過大,過大的分塊會減少訓練圖像集中合適樣本的數(shù)量。本文采用的分塊大小是3×3和4×4。
一個HR圖像的分塊數(shù)與一個LR圖像的分塊數(shù)是相等的。這樣,就得到訓練圖像的分塊集合:
由(7)式可知,當d值為0或者很小時,表示圖像完全一樣或者相似度很高。但此方法只能用于圖像對齊的情況。,一般情況下,人臉圖像都是對齊的,所以可以采用歐幾里德距離規(guī)范來解決塊匹配問題。
算法將在整個訓練集中,對每一個圖像ILp的每一個分塊進行匹配操作,以確定距離最近的k個分塊。得到k個LR分塊后,利用訓練集的對應關(guān)系,確定這k個LR分塊所對應的k個HR分塊。依次把每一個IL[m,n]塊對應的k個HR分塊拼鑲起來即得到k個HR圖像IH|ki=1。用上述方法得到的HR圖像,與輸入圖像對應的原高分辨率圖像有一定程度的相似性。
為了降低搜索空間的復雜度,本文采用一種限位匹配技術(shù)。在訓練集中為一個低分辯圖像塊尋找最相似的分塊,最好在相同性質(zhì)的區(qū)域進行,例如尋找一個眼部分塊的匹配塊應當在訓練圖像的眼部區(qū)域進行。如果不作這種位置限制,一個眼部分塊的相似分塊很可能會出現(xiàn)在其他部位(如嘴部)。算法的基本過程就是在每一幅ILp圖像中找出每一個IL[k,l]的K個最鄰近塊。
4.實驗結(jié)果
算法最后采用樣本拼鑲技術(shù)直接輸出超分辨率圖像。本文提出的算法在VC++軟件平臺上實現(xiàn)。訓練集來自于湖南工學院學生信息庫,圖2為人臉庫中的中示例,圖3為采集圖像模糊處理后的圖像,圖4為算法處理后圖像。分析和實驗表明,在同等訓練集條件下,不僅具有良好的輸出質(zhì)量,而且具有更好的實用性和實時性。
參考文獻
[1]Kenneth.R.Castleman.數(shù)字圖像處理[M].朱志剛,等,譯.電子工業(yè)出版社,1998.
[2]張新明.圖像融合技術(shù)的初步研究——超分辨率復原[D].博士學位論文,北京工業(yè)大學,2002,4.
[3]黃華,樊鑫,等.基于識別的凸集投影人臉圖像超分辨率重建[J].計算機研究與發(fā)展,2005,42(10):1718-1725.
[4]Sung Cheol Park,Min Kyu Park,Moon Gi Kang.Super-Resolution Image Reconstruction.A Technical Overview.IEEE Signal Processing Magazine,2003:21-36.
[5]Sina Farsiu,Dirk Robinson,Michael Elad,et al.Advances and Challenges in Super-Resolution.International Journal of Imaging Systems and Technology,2004,14(2):47-57.
[6]Tasso R.M.Sales,G..M.Morris.Fundamental limits of optical superresolution.Optics Letters,2005,22(9):582-584.
本項工作得到湖南省高等學??茖W研究項目資助(項目批準號:11C0368)。