□孫 茜
壓縮感知(CS)理論是目前信息工程相關(guān)領(lǐng)域研究的前沿?zé)狳c之一。它打破了傳統(tǒng)的奈奎斯特采樣定理,相比于其要求的最小采樣頻率,CS理論證明了能夠從更低數(shù)目的采樣中以高概率完整地恢復(fù)原始信號,在保證信息特征不丟失的前提下節(jié)省了數(shù)據(jù)采集和處理的時間成本。
壓縮感知理論本質(zhì)上可以視為處理線性信號恢復(fù)問題的工具,因此在求解信號和圖像的逆問題上有著顯而易見的優(yōu)勢。信號的采樣速率也不僅由帶寬決定,與信號或信息的稀疏性密切相連。稀疏在模式識別領(lǐng)域的概念可以簡要概括為信號中的非零元素較少,也就是眾多信號的系數(shù)均為零或趨近于零。
壓縮感知理論的核心思想之一,便是現(xiàn)在在模式識別領(lǐng)域應(yīng)用廣泛的稀疏表示分類算法,即SRC(sparse representation-based classifier),這是一種對于光照、噪聲較為魯棒的分類方法。
SRC算法可以被視為一個將輸入圖像轉(zhuǎn)化為具有光照、表情等訓(xùn)練圖像的線性組合的過程。假設(shè)我們有n組,第i類有ni個訓(xùn)練樣本,ai,j∈RD×1表示第i類中的第j個人臉樣本圖像,所構(gòu)成的D表示圖像特征向量的維數(shù),Ai=[ai,1,ai,2,…,ai,ni]∈RD×ni包含第i類的訓(xùn)練圖像。A=[A1,A2,…,An]表示全部的訓(xùn)練集,y代表一個輸入測試圖像。為避免l0模引起的NP-hard問題,SRC通常使用l1模最小化約束進(jìn)行分類:
(1)
其中,x是稀疏系數(shù)特征,ε是與有界能量的噪聲項相關(guān)的參數(shù)。x*T=[x1*T,x2*T,…,xn*T]表示最優(yōu)解,xi包含著第i類的相關(guān)系數(shù)。
SRC算法雖然已獲得很好的識別性能,但一個潛在的問題在于SRC算法中測試圖像可能是被不同對象的訓(xùn)練樣本所表示出來。在人臉識別過程中,這個問題容易造成錯誤的識別。理論上,測試圖像應(yīng)該只被其對應(yīng)對象的訓(xùn)練圖像所表示。針對這一問題,Elhamifar等人提出一種更為魯棒的分組稀疏表示分類方法,該方法主要是盡可能少的對象的訓(xùn)練圖像表示出測試樣本,首先將訓(xùn)練數(shù)據(jù)字典劃分為不同組,每一組由來自同一個對象的訓(xùn)練圖像組成,然后搜索出一種在進(jìn)行識別時使用最少分組數(shù)目的表示方法。這等價于將分類問題轉(zhuǎn)化為結(jié)構(gòu)稀疏恢復(fù)問題。
給定一個測試圖像y,通過以下的凸問題得到稀疏系數(shù)x,從而最大限度減少字典中的非零組數(shù)目。
(2)
其中,xi表示第i類相關(guān)的系數(shù),ε是相關(guān)噪聲參數(shù),A=[A1,A2,…,An]表示一個完整的訓(xùn)練集。
人臉識別是一項正應(yīng)用在諸多行業(yè)的計算機(jī)通信領(lǐng)域技術(shù),例如,應(yīng)用于企業(yè)單位考勤系統(tǒng)、應(yīng)用于學(xué)校識別師生信息、應(yīng)用于公安系統(tǒng)識別案件相關(guān)人員等,但人臉識別技術(shù)在實際應(yīng)用時,往往識別對象會有不同的姿態(tài)與表情,進(jìn)行識別時的光照條件也不穩(wěn)定,所以人臉識別在面對光照、姿態(tài)、表情等變化時效果會受到一定的影響。
人臉識別技術(shù)的主要原理是利用一系列圖像處理技術(shù)從圖像中提取人像特征點,第一,對采集到的人臉圖像進(jìn)行有效特征信息的檢測,例如,檢測人臉的直方圖特征、結(jié)構(gòu)特征及顏色特征等。第二,在檢測到人臉特征的基礎(chǔ)上進(jìn)行圖像的光線補(bǔ)償、濾波及銳化等操作,這是為了減少人臉原圖上存在各種信息干擾。第三,在獲取已經(jīng)過預(yù)處理的人臉圖像后,對人臉進(jìn)行特征信息的提取,例如,對人臉圖像上的眼睛、鼻子、嘴和下巴等特征元素進(jìn)行提取,描述這些特征元素之間的結(jié)構(gòu)關(guān)系。第四,將已提取出的人臉特征信息與已收集好的人臉數(shù)據(jù)庫進(jìn)行對比,也即是與數(shù)據(jù)庫中的人臉特征模板進(jìn)行比較,通過比較二者之間的相似程度,對測試的人臉身份信息進(jìn)行相應(yīng)的判斷。
基于壓縮感知的稀疏表示SRC技術(shù)由于對光照和噪聲變化較為魯棒而廣泛應(yīng)用在圖像處理領(lǐng)域,例如,對圖像進(jìn)行噪聲去除、對圖像的模糊信息進(jìn)行處理、對圖像分辨率的處理等,并在此基礎(chǔ)上,不斷探索與創(chuàng)新如何將其應(yīng)用于日常實際工作領(lǐng)域之中,當(dāng)下運用最為廣泛的方面之一便是人臉識別技術(shù)領(lǐng)域。
稀疏表示應(yīng)用在人臉識別領(lǐng)域的首次探索是在2009年,當(dāng)時由Wright等人提出基于稀疏表示的分類方法,旨在尋找單張人臉圖像在人臉圖像數(shù)據(jù)庫中的最稀疏表示。Yang M等人在2010年提出基于Gabor特征的稀疏表示方法,使用圖像的局部Gabor特征用于稀疏表示之中,但這一方法并未考慮到數(shù)據(jù)的內(nèi)部特征。Elhamifar等人在2011年提出基于分組稀疏表示的人臉識別分類方法GSRC,解決了SRC并未考慮訓(xùn)練數(shù)據(jù)字典內(nèi)部結(jié)構(gòu)信息的問題,進(jìn)一步提高了人臉識別的有效率。而后幾年基于核的稀疏表示分類方法KSRC成為研究熱點,進(jìn)一步提升了人臉圖像分類效果。2015年Jiang X等人提出用于人臉識別的通過字典分解的稀疏與稠密相混合的表示方法SDR,改善了在實際應(yīng)用之中訓(xùn)練樣本足夠和訓(xùn)練數(shù)據(jù)無遮擋這兩點影響識別性能的問題。
張濤、吳鍵2017年在《基于PCA和SRC算法的人臉識別儲物柜系統(tǒng)的設(shè)計與實現(xiàn)》中提出將主成分特征提取方法PCA應(yīng)用于人臉圖像的特征提取中,并最后使用稀疏表示進(jìn)行人臉圖像分類的新方法。首先介紹了PCA特征法提取人臉圖像特征向量的工作原理,闡述了如何實現(xiàn)稀疏表示分類,再聯(lián)系人臉識別儲物柜進(jìn)行硬件實現(xiàn)和軟件流程的介紹,最后進(jìn)行人臉識別的分類試驗。
2018年木立生、呂迎春針對人臉識別在有遮擋、表情、光照的變化或受到噪聲污染時魯棒性變差問題,提出一種基于稀疏表示與特征融合的人臉識別新方法。首先考慮將人臉原始圖像變換為更為簡潔的人臉,該新方法提出可以通過低秩恢復(fù)算法進(jìn)行實現(xiàn),再提取上一步得到的干凈人臉圖像的特征向量,即LBP,HOG,Gabor特征;然后對部分訓(xùn)練樣本進(jìn)行稀疏表示分類測試,根據(jù)識別結(jié)果與分類殘差計算出最小的權(quán)重向量;最后根據(jù)該權(quán)重向量重構(gòu)規(guī)則化殘差進(jìn)行分類。
王國權(quán)和鞏燕在2019年提出在人臉識別過程中將圖像小波特征分析與稀疏表示相結(jié)合新方法,通過小波分析將圖像進(jìn)行分層,得到一副低頻分量與水平、垂直、對角線分量,然后對人臉圖像進(jìn)行主成分特征提取和降維,稀疏表示各個圖像,再根據(jù)分類器性能不同,判斷多個分類結(jié)果,實現(xiàn)不同復(fù)雜干擾情況下的圖像識別。
2020年吳慶洪和高曉東考慮到支持向量機(jī)對特征提取的優(yōu)越性能,而稀疏表示分類方法對光照、噪聲變化較為魯棒,提出將二者相結(jié)合的人臉識別新方法,該方法首先對非理想環(huán)境下人臉特征進(jìn)行提取操作,組合成為一個非理想環(huán)境下的人臉識別的特征字典;然后,采用特征字典對非理想環(huán)境人臉識別訓(xùn)練樣本和測試樣本進(jìn)行處理,構(gòu)建非理想環(huán)境人臉識別的學(xué)習(xí)樣本;最后,采用支持向量機(jī)建立非理想環(huán)境人臉識別的分類器來對非理想環(huán)境人臉進(jìn)行識別。
2021年王鈺、劉凡等人提出一種基于自編碼器和稀疏表示的單樣本人臉識別算法,在保留身份信息的同時自動生成帶變化的人臉圖像用于單樣本條件下的字典擴(kuò)充,一定程度上緩解了單樣本條件下的欠采樣問題,對人臉圖像訓(xùn)練集與測試集之間的人臉信息的變化與不同進(jìn)行了彌補(bǔ),讓稀疏表示方法也可以在應(yīng)用于單樣本人臉識別。
此后,曹玉濤與吳愛弟提出基于小波分析和復(fù)矩陣稀疏表示的人臉識別方法,該方法通過對人臉圖像進(jìn)行2層小波分解,提取出第2層小波分解得到的低頻部分和高頻部分,將3個方向的高頻子帶分別做分塊處理,計算每個子塊能量值,而后在每個方向上選取若干子塊,且這些子塊是其中信息量較多的,再將這些子塊進(jìn)一步整合成為一個新的高頻子帶,再將新的高頻子帶和原低頻子帶構(gòu)成1個復(fù)矩陣。最后,使用稀疏表示SRC進(jìn)行人臉圖像的分類。
由于在提取人臉圖像的特征時,常會得到許多不相關(guān)的冗余信息,而編碼不充分稀疏時,也無法得到簡潔的人臉圖像,宋珊、馮巖等提出基于正交稀疏約束非負(fù)張量分解的人臉識別新方法,主要在人臉特征提取時采用非負(fù)張量分解這一新方法,在保有人臉特征的內(nèi)部結(jié)構(gòu)完整的基礎(chǔ)上,降低特征之間的不相關(guān)性,最后通過稀疏表示方法及余弦相似度來進(jìn)行人臉圖像的分類與識別。
人臉識別的過程往往會受到遮擋、表情變化、姿態(tài)變化等因素的干擾,狄嵐、矯慧文等針對這一問題,提出了稀疏綜合字典學(xué)習(xí)的識別方法,構(gòu)造混合特色字典,利用鏡像原理和Fisher準(zhǔn)則增加人臉圖像訓(xùn)練樣本的多樣性,從而提高測試人臉圖像的識別率。
這些基于稀疏表示,并進(jìn)一步將稀疏表示與不同圖像處理方法相結(jié)合的人臉識別新方法,都在諸如AR、ORL等不同的人臉圖像數(shù)據(jù)庫上進(jìn)行了方法測試,并將其與傳統(tǒng)人臉識別技術(shù)進(jìn)行識別率的對比,其結(jié)果均表明稀疏表示算法對于在不同姿態(tài)、不同表情和不同光照下的人臉識別具有較優(yōu)魯棒性。