紀(jì)姝伊
(長春理工大學(xué) 計(jì)算機(jī)科學(xué)技術(shù)學(xué)院,長春 130022)
當(dāng)前,各種現(xiàn)代科技快速發(fā)展,人們獲取圖像的方式也更加的便捷,在此基礎(chǔ)上,人臉的識別技術(shù)也有了長足的進(jìn)展[1-3]。在近幾年,對人臉識別的研究,大多數(shù)是使用深度學(xué)習(xí)類的方法,該類方法具有很好的識別性[4-5]。這主要是針對人的面部識別方面進(jìn)行的研究,以人工神經(jīng)網(wǎng)絡(luò)作為基礎(chǔ)創(chuàng)建的,當(dāng)前的深度學(xué)習(xí)手段已經(jīng)比較普及,而且具有很高的識別度。這種識別手段主要來自人工的神經(jīng)網(wǎng)絡(luò)系統(tǒng),通過對人的大腦進(jìn)行模擬分析進(jìn)而建立相關(guān)的數(shù)據(jù),仿照人的大腦對相關(guān)圖像參數(shù)進(jìn)行解析,這是一種無需監(jiān)督的學(xué)習(xí)手段。深度學(xué)習(xí)有比較多的方法,卷積神經(jīng)網(wǎng)絡(luò)就是簡稱為CNN的一種深度學(xué)習(xí)手段,這種學(xué)習(xí)方法使用的比較多,因?yàn)樗木W(wǎng)絡(luò)模型比較簡單而且具有自動化的識別數(shù)據(jù),不過對于人的面部辨識方面來說很多經(jīng)典的手段還是值得更加深入的研究的,比方說是參數(shù)的降維解析算法,本文主要對以稀疏表示為基礎(chǔ)的圖嵌入降維解析算法進(jìn)行更加深入的分析,進(jìn)一步使面部識別時辨識度得到提高。
表情圖像的預(yù)處理包括表情圖像子區(qū)域的分割以及表情圖像的歸一化處理,前者指從表情圖像分割出與表情最相關(guān)的子區(qū)域,而后者包括圖像的灰度均衡和尺度歸一。圖像預(yù)處理的好壞直接影響表情特征提取的效果和計(jì)算量。
通過小波變換處理后,變換特征的維數(shù)有了明顯的提高,因此,在整個實(shí)驗(yàn)的過程中都通過均勻下采樣方法來處理Gabor小波,以此來實(shí)現(xiàn)降維。表情特征提取可分為兩步:歸一化后的表情圖像的網(wǎng)格化和彈性圖的構(gòu)造。
小波變換后生成的特征矢量模較大。針對上面分割及歸一化后的表情子圖像,首先對表情子圖像進(jìn)行網(wǎng)格化處理,即使用固定尺寸的網(wǎng)格進(jìn)一步分割表情子圖像。識別時采用彈性圖匹配算法,通過適當(dāng)改變表情模板的網(wǎng)格結(jié)點(diǎn)間距離,找到表情模板與待識別表情圖像的最佳匹配,從而實(shí)現(xiàn)表情的分類與識別。
本階段的任務(wù)是將經(jīng)網(wǎng)格化后的人臉子圖像轉(zhuǎn)換為表情特征彈性圖(或稱作表情屬性拓?fù)鋱D)。即對人臉子圖像的每一個網(wǎng)格進(jìn)行Gabor小波變換,取變換后的小波系數(shù)作為該網(wǎng)格的特征矢量,所有網(wǎng)格的特征矢量則構(gòu)成了表情特征彈性圖。
通過SR-Graph方法來進(jìn)行模型的建立,尋找樣本點(diǎn)Xi的鄰近樣本點(diǎn)。采用歐氏距離作為測度來尋找每個樣本點(diǎn)Xi的k個最近鄰的樣本點(diǎn)??捎肵n來表示這k個最近鄰的樣本點(diǎn)組成的集合,求解樣本點(diǎn)間的權(quán)值矩陣權(quán)Wij,表示第j個樣本點(diǎn)對重構(gòu)第i個樣本點(diǎn)的貢獻(xiàn),當(dāng)兩個數(shù)據(jù)點(diǎn)越相近時,兩者之間的權(quán)值也就越大。該方法的特點(diǎn)有兩個方面:一是使用SR-Graph方法,能夠在降維的過程中保持很好的魯棒性,能夠盡可能的保證不依賴參數(shù);二是能夠同時確定權(quán)值和圖邊,進(jìn)而能更容易的建立優(yōu)良模型。
借助Matlab手段進(jìn)行相關(guān)的仿真模擬,進(jìn)而更好的對前文提出的以稀疏表示為基礎(chǔ)的圖嵌入降維解析算法進(jìn)行解析,下面選取PIE參數(shù)存儲空間里的少量Pose-05作為示例,選取示例遵循以下準(zhǔn)則:首先是選擇第一個人的第二張圖片作為測試示例,以隨機(jī)選擇的十個人中的前面二十張照片作為訓(xùn)練示例的集合(不包括測試示例),所說的字典指的就是它,下面的圖1表示的是用字典以稀疏表示的手段進(jìn)行測試示例分析從而得到的所有參數(shù)圖像,字典里面除了零以外的參數(shù)相對應(yīng)的原子情況也在圖中。通過實(shí)驗(yàn)?zāi)軌虻玫剑簣D里面有五個參數(shù)是非零的,它們是1號、4號、11號、15號、17號,與之相對的原則參數(shù)是這些非零系數(shù)所對應(yīng)的原則數(shù)值,為0.008,0.2103,0.0297,0.0923,0.6435。除去非零的參數(shù)以外,還可以知道有不是絕對零值的參數(shù),之所以這樣是因?yàn)檫@些數(shù)據(jù)都比較小,影響不大,可以忽略。其次,使用以上非零參數(shù)相對的結(jié)果圖片進(jìn)行二號測試圖片的再一次構(gòu)造時,重構(gòu)的殘差十分小,這就表示之前選取的樣本中已經(jīng)具有二號圖像的參數(shù)。所以,能夠在訓(xùn)練樣本的集合中直接將二號圖像刪除。
圖1 2號圖像稀疏表示后的系數(shù)及其對應(yīng)的圖片
圖2表示的是二號樣本相對別的樣本的歐氏距離,本文為了將結(jié)果比較明顯的表示出來把前面三十個距離進(jìn)行了增大,可以參見圖3。
通過圖2展現(xiàn)的二號測試圖片相對全部訓(xùn)練樣本的歸一化距離,能夠發(fā)現(xiàn)二號的歸一化距離相對別的樣本而言比較小。
圖2 2號測試圖像與所有訓(xùn)練樣本的歸一化距離
圖3 2號測試圖像與前30個訓(xùn)練樣本的歸一化距離
通過圖3能夠發(fā)現(xiàn):對于之前提到的非零參數(shù)對應(yīng)的圖像以及二號測試樣本來說,它們的歐式距離全都相對小得多,不過這并不能說明其稀疏數(shù)值大小不為零,比方說11號圖像,通過稀疏表示選取的樣本相對通常根據(jù)距離選擇樣本的不同之處就在于此,同時也就比較好的表示稀疏描述在人大腦的主觀感知表示參數(shù)的具體情況。
本文主要使用ORL免費(fèi)的人臉存儲空間對以稀疏表示的圖嵌入降維解析手段進(jìn)行效果檢驗(yàn)。本文使用的以稀疏表示為基礎(chǔ)的圖嵌入降維解析算法,主要是兩個可以變化的參數(shù),它們是:重構(gòu)殘差閾值λ以及稀疏表示的系數(shù)閾值μ。此次測試再一次選擇隨機(jī)的樣本集合(不能選擇前一次已經(jīng)選取的樣本),測試的條件同前一次測試一樣,一個小組要做十次平行測試,以十組測試的平均值作為辨別度。假設(shè)確定的數(shù)值λ大小為0.145,通過變換稀疏表示的系數(shù)閾值,分別獲得在稀疏閾值不一樣時的辨識度以及壓縮好壞。得到的相關(guān)數(shù)據(jù)參見下面的表格1和2。
如表1所示,從ORL人臉數(shù)據(jù)庫中λ=0.145時的識別率中可以看出,本文提出的基于稀疏表示的圖嵌入降維算法在ORL人臉數(shù)據(jù)庫中λ=0.145時具有比較好的識別率。
通過表2里的相關(guān)數(shù)據(jù),能夠發(fā)現(xiàn)當(dāng)選取的樣本數(shù)量越多的時候,稀疏表示的系數(shù)閾值就會隨之增大。對于ORL參數(shù)存儲空間來說,每一個人都會有一張不同的面部表情圖片。能夠?qū)⑦@些圖片作為訓(xùn)練的樣本,因?yàn)樯厦娴娜N非負(fù)矩陣的解析方法全部是無監(jiān)督的解析手段,也就是說,能夠以不同的類別為依據(jù)迅速地找到相關(guān)的訓(xùn)練樣本。緊接著,對其做降維操作,進(jìn)而將維度較高的面部圖片換算成維度較低的參數(shù)。
表1 ORL人臉數(shù)據(jù)庫中λ=0.145時的識別率(%)
以稀疏表示為基礎(chǔ)的圖嵌入降維解析的面部辨識流程如圖4所示。第一就是要提前對測試以及訓(xùn)練的相關(guān)圖片進(jìn)行處理,其次就要通過Gabor的小波變換獲得圖片里的表征性參數(shù),緊接著用以稀疏表示為基礎(chǔ)的圖嵌入降維解析手段得到需要的面部辨識結(jié)果。
表2 ORL人臉數(shù)據(jù)庫中λ=0.145時的選樣樣本數(shù)
圖4 稀疏表示的圖嵌入降維算法的人臉識別過程
人臉識別的使用會受到光照以及障礙物等諸多條件的影響,這些外在因素會對實(shí)際使用面部識別時造成很大的影響,進(jìn)而導(dǎo)致分辨率下降。通過對前人的成果進(jìn)行分析以及自己測試的基礎(chǔ)上能夠知道:對于人的面部識別來說,以稀疏表示為基礎(chǔ)的解析算法具有自身特殊的優(yōu)勢,當(dāng)面部識別受到光照以及遮擋的時候,其展現(xiàn)了令人滿意的魯棒性以及優(yōu)越性。因此,在圖嵌入的降維解析算法里引進(jìn)稀疏表示的手段可以增強(qiáng)識別率。
[1]王心醉,郭立紅,楊麗梅,等.基于AdaBoost的人臉檢測算法[J].長春理工大學(xué)學(xué)報(bào):自然科學(xué)版,2009,32(2):248-250.
[2]李陽.基于三維模型子空間監(jiān)督學(xué)習(xí)法的二維人臉識別[J].長春理工大學(xué)學(xué)報(bào):自然科學(xué)版,2009,32(3):442-446,435.
[3]胡建軍.稀疏表示在人臉識別中的應(yīng)用[D].長沙:中南大學(xué),2014.
[4]張其文,莊新磊.基于監(jiān)督協(xié)同近鄰保持投影的人臉識別算法[J].計(jì)算機(jī)科學(xué),2015,42(5):309-314.
[5]丁正明.流形學(xué)習(xí)方法在視頻人臉識別中的應(yīng)用基礎(chǔ)研究[D].成都:電子科技大學(xué),2013.
[6]邢云.基于壓縮感知理論的人臉識別方法研究[D].大連:大連理工大學(xué),2010.
[7]張翠萍,蘇光大.人臉識別技術(shù)綜述[J].中國圖像圖形學(xué)報(bào),2000,5(11):885-894.
[8]鄧承志.圖像稀疏表示理論及其應(yīng)用研究[D].武漢:華中科技大學(xué),2008.
[9]郭志強(qiáng).基于子空間分析的人臉識別算法研究[D].武漢:武漢理工大學(xué),2010.
[10]張春梅,尹中科,肖明霞.基于冗余字典的信號超完備表示與稀疏分解[J].科學(xué)通報(bào),2006,51(6):628-633.