施水才,楊忱,王濤,呂學(xué)強(qiáng)
1.北京信息科技大學(xué) 中文信息處理研究中心,北京 100101 2.北京拓爾思信息技術(shù)股份有限公司,北京100101
基于自商圖像的人臉圖像增強(qiáng)
施水才1,2,楊忱1,王濤1,2,呂學(xué)強(qiáng)1,2
1.北京信息科技大學(xué) 中文信息處理研究中心,北京 100101 2.北京拓爾思信息技術(shù)股份有限公司,北京100101
人臉識(shí)別技術(shù)是計(jì)算機(jī)視覺和模式識(shí)別領(lǐng)域的中一個(gè)重要研究課題,而且在身份認(rèn)證、智能監(jiān)控、電子商務(wù)等領(lǐng)域有著廣泛的應(yīng)用前景。在實(shí)際情況下,人臉識(shí)別的效果易受光照和姿態(tài)等因素的影響。在很多情況下,由于光照引起的圖像變化比不同身份的引起的變化要更顯著,因此,光照問題是人臉識(shí)別中的重點(diǎn)和難點(diǎn)問題之一。
目前,典型的處理光照的方法有商圖像法[1-2]、光椎體法[3]和球諧函數(shù)[4-5]法等。其中商圖像法與其他方法相比,不需要構(gòu)建人臉的三維模型,計(jì)算量小,更適合在實(shí)際中應(yīng)用。商圖像法有前提條件:假設(shè)物體的三維形狀相同,紋理不同;要求物體是凸朗伯表面,忽略鏡面反射和陰影。這些假設(shè)條件在實(shí)際應(yīng)用中,很難完全滿足。王海濤[6]等分析了Retinex算法[7]像的關(guān)系后,提出了自商圖像。自商圖像的特點(diǎn)是只需要一幅圖像,不需要預(yù)先訓(xùn)練;沒有額外的假設(shè)條件,但是容易受到高頻噪聲的影響。
本文基于自商圖像的方法,結(jié)合反銳化掩模濾波[8]多層次自商圖像的方法,將每次得到的反射系數(shù)按比例進(jìn)行融合。實(shí)驗(yàn)結(jié)果表明,本文方法能夠一定程度上去除高頻噪聲的影響,使得人臉識(shí)別效果有所提高。
2.1 反射-光照模型
反射-光照模型理論將原始圖像分解為光照?qǐng)D像和反射系數(shù)圖像兩部分。
其中,I(x,y)是原始圖像,R(x,y)是反射系數(shù),L(x,y)是光照成分。反射系數(shù)是物體本身的屬性,反映了物體的紋理特征,是識(shí)別所需要的。
經(jīng)典的Retinex算法假設(shè)光照成分在這個(gè)圖像中是平滑的,變化是緩慢的,對(duì)應(yīng)圖像的低頻分量;反射系數(shù)在區(qū)域內(nèi)是平滑的,在邊界變化是劇烈的,對(duì)應(yīng)圖像的高頻分量。Retinex算法把對(duì)原始圖像進(jìn)行低通濾波后的圖像作為光照成分,因此
其中,F(xiàn)是低通濾波核。濾波核過大,則在估計(jì)出的反射系數(shù)中,邊緣附近會(huì)出現(xiàn)光暈現(xiàn)象;如過小,則會(huì)丟失反射系數(shù)中的信息。
為了方便計(jì)算,令
2.2 自商圖像
王海濤等提出的自商圖像方法采用加權(quán)的高斯濾波器進(jìn)行各向異性濾波,具體步驟如下:
(1)選擇不同尺度的高斯核Gi,和對(duì)應(yīng)的權(quán)值Wi。
(2)對(duì)原圖1進(jìn)行平滑濾波,得到光照成分Li。
(3)根據(jù)公式計(jì)算反射系數(shù)Ri。
(4)為了降低高頻噪聲的干擾,引入非線性變換:
(5)對(duì)各個(gè)尺度下的的自商圖像計(jì)算加權(quán)和:
圖1 自商圖像效果圖
2.3 多層次的自商圖像
從圖1中可以看出,在原圖陰影區(qū)域中,可能會(huì)存在一定的高頻噪聲,使得提取的反射圖像不是特別理想。平滑處理可以有效地減少這些噪聲。因此,將光照成分L作為原圖再進(jìn)行一次自商,得到新的光照成分L′和反射系數(shù)R′,效果如圖2。
可見,對(duì)光照成分再次自商得到的反射圖像的噪聲有所減少。因此,采用多層次自商的方法,可以在一定程度上消除高頻噪聲的影響。但是隨著層數(shù)的的增多,高亮度部分的細(xì)節(jié)會(huì)逐漸減少。因此,將用原圖像取反,對(duì)取反圖像也使用多層自商圖像的方法獲取高亮度部分的細(xì)節(jié)信息。取反圖像自商圖像效果圖,如圖3。
圖2 多層次自商圖像效果圖
圖3 取反圖像自商圖像效果圖
對(duì)于濾波后的圖像L通常是模糊的,為了能更好地保留細(xì)節(jié)信息,通過反銳化掩模濾波的方法進(jìn)行圖像的細(xì)節(jié)增強(qiáng)。反銳化掩模的濾波效果,如圖4。
圖4 反銳化掩模濾波效果圖
反銳化掩模濾波的原理,是將原圖像的高頻成分加到原圖中來獲得增強(qiáng)圖像。
其中,I′是增強(qiáng)圖像,I是原圖,H是高頻成分,λ是增強(qiáng)系數(shù)。
高頻成分H又可以表示成原圖與低頻成分的差,即
本文將多層次自商圖像所得的反射系數(shù)按照公式融合:
其中,Ri表示第i層所得的反射系數(shù),λi是權(quán)重,滿足本文方法的設(shè)計(jì)流程:
(1)將原圖作為輸入圖像I和取反圖像I′。
(2)通過公式(8)對(duì)I和I′進(jìn)行反銳化掩模濾波,得到增強(qiáng)圖像H和H′。
(3)對(duì)進(jìn)行高斯平滑H和H′,獲得低頻光照?qǐng)D像Li和。
(4)通過公式(2)自商圖像,得到反射系數(shù)Ri和Ri'。
(5)令輸入圖像I=Li,I′=。
(6)循環(huán)執(zhí)行(2)到(5)n次。
(7)通過公式(9)得到的反射系數(shù)R和R′,將R和R′融合,得到最終的反射系數(shù)。
本文方法的增強(qiáng)效果,如圖5。
圖5 本文方法增強(qiáng)效果圖
本文實(shí)驗(yàn)所用的圖像來自YaleB人臉庫(kù)[9],包含10個(gè)人共5 850幅圖像。實(shí)驗(yàn)共分10組,每組每個(gè)人隨機(jī)選出一張圖像作為訓(xùn)練圖像,剩余的作為檢測(cè)圖像。采用PCA和Sift兩種方法,實(shí)驗(yàn)結(jié)果如圖6和圖7。
圖6 PCA實(shí)驗(yàn)結(jié)果
實(shí)驗(yàn)結(jié)果表明,自商圖像的方法可以有效地去除光照的影響,本文方法可以在一定程度上彌補(bǔ)自商圖像方法的不足,因此效果稍好。由圖7可以看出,自商圖像方法獲得的反射圖像的紋理不夠連續(xù),因此使用Sift特征的效果有時(shí)不如原圖,改進(jìn)后基本上可以消除這類效果。
圖7 Sift實(shí)驗(yàn)結(jié)果
為了降低光照對(duì)人臉識(shí)別的影響,本文基于自商圖像,結(jié)合反銳化掩模濾波,采用了多層次自商圖像并融合反射系數(shù)的方法。與自商圖像相比,本文方法能夠去除高頻噪聲的影響。實(shí)驗(yàn)結(jié)果表明,本文方法處理后,識(shí)別效果比傳統(tǒng)自商圖像要好。但是,光照造成的影響不能完全消除,特別是在影子的邊緣無法去除,如何處理還有待今后進(jìn)一步研究。
[1]Riklin-Raviv T,Shashua A.The quotient image:class-based re-rendering and recognition with varying illumination conditions[J].IEEE Transaction on Pattern Analysis and Machine Intelligence,2001,23(2):129-139.
[2]Shashua A.On photometric issues in 3D visual recognition from a single 2D image[J].International Journal of Computer Vision,1997,21(1/2).
[3]Georghiades A S,Belhumeur P N,Kriegman D J.From few to many:illumination cone models for face recognition under variable lighting and pose[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2001,23(6):643-660.
[4]Ramamoorthi R,Hanrahan P.On the relationship between radiance and irradiance:determining the illumination for images of a convex Lambertian object[J].Journal of the Optical Society of America,2001,18(10).
[5]Wen Z,Li U Z,Huang T.Face relighting with radiance environment maps[C]//Proceedings of International Conference on Computer Vision and Pattern Recognition,2003,2:158-165.
[6]Wang H,Li S,Wang Y.Face recognition under varying lighting conditions using self quotient image[C]//Proceedings of the 6th IEEE International Conference on Automatic Face and Gesture Recognition,2004:819-824.
[7]Land E,McCann J.Lightness and retinex theory[J].Journal of the Optical Society of America,1971,61(1):1-11.
[8]Leu J G.Edge sharpening through ramp width reduction[J].Image and Vision Computing,2000,18(6/7):510-514.
[9]Luo J,Oubong G.A comparison of SIFT,PCA-SIFT and SURF[J]. International Journal of Image Processing,2009,3(4):143-152.
SHI Shuicai1,2,YANG Chen1,WANG Tao1,2,LV Xueqiang1,2
1.Chinese Information Processing Research Center,Beijing Information Science and Technology University,Beijing 100101,China
2.Beijing TRS Information Technology Co.,Ltd.,Beijing 100101,China
In order to reduce the light on the face recognition effect,a method of obtaining reflection coefficient through the multi-level self-quotient image is proposed.Firstly,source image as input image is enhanced through the method of non-linearity unsharp masking.It can get reflection coefficient and light component through self-quotient image method.Then,the paper takes the light component as a new input image and repeats the above operations.Finally,it can obtain the final reflection coefficient after all reflection coefficients got in each level is fusion.The results on YaleB face database show that the method can remove the influence of light,make the face recognition rate has improved to a certain extent.
lambertian reflectance model;self-quotient Image;non-linearity unsharp masking
為了降低光照對(duì)人臉識(shí)別效果的影響,通過多層次自商圖像的方法獲得反射系數(shù)。將原圖作為輸入圖像采用反銳化掩模濾波的方式進(jìn)行增強(qiáng),再通過自商圖像方法獲得反射系數(shù)和光照成分;把光照成分作為輸入圖像,重復(fù)以上操作,對(duì)每次得到的反射系數(shù)按比例融合得到最終的反射系數(shù)。YaleB人臉庫(kù)上的實(shí)驗(yàn)結(jié)果表明,該方法能在一定程度上去除光照的影響,使人臉識(shí)別率有一定的提高。
反射光照模型;自商圖像;反銳化掩模濾波
A
TP751
10.3778/j.issn.1002-8331.1111-0011
SHI Shuicai,YANG Chen,WANG Tao,et al.Face image enhancement based on self-quotient Image.Computer Engineering and Applications,2013,49(13):142-144.
國(guó)家自然科學(xué)基金(No.60872133);北京市自然科學(xué)基金(No.4092015);北京市教委科技發(fā)展計(jì)劃項(xiàng)目(No.KM201110772021);國(guó)家科技支撐計(jì)劃課題(No.2011BAH11B03)。
施水才(1966—),教授,主要研究方向:中文和多媒體信息處理,信息檢索;楊忱(1985—),碩士生,主要研究領(lǐng)域?yàn)閿?shù)字圖像處理,圖像檢索。E-mail:yangchen49781932@sina.com
2011-11-10
2012-01-17
1002-8331(2013)13-0142-03
CNKI出版日期:2012-04-25http://www.cnki.net/kcms/detail/11.2127.TP.20120425.1722.079.html