于愛華,白 煌,孫斌斌,侯北平
(1.浙江工業(yè)大學(xué) 信息工程學(xué)院, 浙江 杭州 310023;2.浙江工業(yè)大學(xué) 浙江省信號處理重點(diǎn)實(shí)驗(yàn)室,浙江 杭州 310023;3.浙江科技學(xué)院 自動化及電氣工程學(xué)院, 浙江 杭州 310023)
基于優(yōu)化投影矩陣的人臉識別技術(shù)研究
于愛華1,2,3,白煌1,2,孫斌斌1,2,侯北平3
(1.浙江工業(yè)大學(xué) 信息工程學(xué)院, 浙江 杭州 310023;2.浙江工業(yè)大學(xué) 浙江省信號處理重點(diǎn)實(shí)驗(yàn)室,浙江 杭州 310023;3.浙江科技學(xué)院 自動化及電氣工程學(xué)院, 浙江 杭州 310023)
摘要:針對大數(shù)據(jù)背景下人臉識別技術(shù)存在的問題,提出一種基于壓縮感知的人臉識別技術(shù)架構(gòu).系統(tǒng)首先利用人臉訓(xùn)練樣本優(yōu)化設(shè)計投影矩陣,然后利用優(yōu)化的投影矩陣進(jìn)行人臉圖像的壓縮感知,利用同倫算法進(jìn)行快速稀疏表示分類.這樣人臉識別系統(tǒng)一方面避免大數(shù)據(jù)傳輸和存儲壓力,另一方面可以有效保證系統(tǒng)識別率,實(shí)驗(yàn)仿真證實(shí)了研究工作的有效性.
關(guān)鍵詞:人臉識別;壓縮感知;投影矩陣;同倫算法
人臉識別技術(shù)作為機(jī)器視覺和圖像處理技術(shù)的重要研究方向之一,越來越受到學(xué)術(shù)界的高度關(guān)注[1-4].隨著數(shù)字技術(shù)應(yīng)用的不斷深入,大數(shù)據(jù)背景下人臉識別技術(shù)對圖像信息采集、傳輸、存儲和處理等硬件設(shè)備提出越來越高要求.傳統(tǒng)的解決方案是先對信號壓縮,如基于離散余弦變換的JPEG標(biāo)準(zhǔn)[5]和基于小波變換的JPEG2000標(biāo)準(zhǔn)[6]等.它利用圖像數(shù)據(jù)像素點(diǎn)間的相關(guān)性進(jìn)行壓縮,丟棄大部分冗余信息以得到壓縮數(shù)據(jù)用于傳輸,后臺接收端重建圖像,提取圖像特征用于身份識別.特征提取常用的方法有主成分分析(Principle components analysis,PCA)[7]、線性鑒別分析(Linear discriminant analysis,LDA)[8]等.PCA是尋找特征主要方向,其算法實(shí)現(xiàn)簡單,但并沒有考慮分類特點(diǎn).LDA利用訓(xùn)練樣本信息,使得類別內(nèi)的點(diǎn)距離越近越好(集中),類別間的點(diǎn)越遠(yuǎn)越好,這樣有利于分類.LDA降維的特征維度比類別的個數(shù)小,特征太少不利于分類.對圖像進(jìn)行識別分類的算法包括K最鄰近分類算法(K-nearestNeighbor,KNN)[9]、支持向量機(jī)(Support vector machine,SVM)[10]、基于稀疏表示的分類器(Sparse representation based classifier,SRC)[11]以及符合圖像物理特性的基于非負(fù)稀疏表示的分類器(Non-negative sparse representation based classifier,NNSRC)[12]以及神經(jīng)網(wǎng)絡(luò)[13-14]等.KNN不需要訓(xùn)練算法簡單,但是效果一般.SVM和神經(jīng)網(wǎng)絡(luò)訓(xùn)練,識別率較高,但是要求有足夠訓(xùn)練樣本,且訓(xùn)練時間很長,容易陷入局部最優(yōu).SRC和NNSRC是通過稀疏表示分類,對遮掩有較好的識別效果,其識別過程較長,NNSRC增加了稀疏系數(shù)非負(fù)的約束,有較好的物理意義,但是其稀疏表示殘余差較大,容易誤判.
針對傳統(tǒng)識別技術(shù)存在的問題,既然不需要圖像中冗余信息,那么是否可以研究一種技術(shù)直接對圖像信號進(jìn)行壓縮采樣(特征提取),避免高速采樣和丟棄信息過程造成的資源浪費(fèi),壓縮感知(Compressed sensing,CS)理論就是一種試圖完成這一目標(biāo)的新興理論[15-18],該理論一經(jīng)提出就受到學(xué)術(shù)界的廣泛關(guān)注.本算法的研究目標(biāo)是利用壓縮感知算法直接對圖像進(jìn)行特征提取,并利用投影矩陣優(yōu)化技術(shù),通過調(diào)整互相關(guān)性因子,使得同類測量數(shù)據(jù)互相關(guān)性提高,不同類別互相關(guān)性降低,來提高系統(tǒng)的識別率.
1壓縮感知理論模型
對于一個輸入的高維信號,x∈RN×1將其在矩陣Φ線性投影得到投影值,y過程為
y=Φx∈RM×1
(1)
其中Φ∈RM×N稱為投影矩陣.CS理論研究的就是當(dāng)M?N對于給定的投影值y和投影矩陣Φ,如何求解原高維信號x.顯然,式(1)為一個欠定問題,即方程個數(shù)少于未知數(shù)個數(shù),存在無數(shù)多個解.因此,在求解過程中還需要對x加以限制.稀疏性約束就是CS理論中的一個關(guān)鍵因素,這個條件要求信號x可由L個基向量{ψl}線性表示為
(2)
其中:Ψ∈RN×L為字典(矩陣);s為一個大部分元素為零的稀疏向量,如果s含有K個非零元素,則x稱為在Ψ下K稀疏.
將式(2)代入式(1)得
y=Φx=ΦΨsDs,‖s‖0≤K
(3)
其中D∈RM×L稱為等效字典.
2基于CS的人臉識別系統(tǒng)
2.1壓縮感知分類器的結(jié)構(gòu)
基于壓縮感知的分類器(Compressedsensingbasedclassifier,CSC),流程如圖1所示.
圖1基于壓縮感知的識別流程圖
Fig.1FR based on CS flowchart
當(dāng)M?N時,y數(shù)據(jù)量遠(yuǎn)少于x,這大大減小信道傳輸數(shù)據(jù)及后臺存儲、處理數(shù)據(jù)的壓力.但是實(shí)際應(yīng)用中,投影矩陣Φ對圖像重建與識別效果影響較大,因此投影矩陣優(yōu)化設(shè)計也是研究的主要內(nèi)容之一.對于CS系統(tǒng),投影矩陣的作用一方面是對輸入信號的壓縮,另一方面也是對信號的特征提取過程,經(jīng)過優(yōu)化設(shè)計的投影矩陣可大大提高信號識別分類及恢復(fù)的精度[17-18].
2.2基于CS人臉識別分類器的模型
假設(shè)一個人臉庫中存儲有L個人的臉部樣本,其中每個人又都有許多不同角度、不同表情、不同光照的樣本,每個樣本的尺寸均相同.對每個人隨機(jī)選中其Q個不同的樣本,每個樣本圖像按照同樣的排列規(guī)則形成一個列向量并分別做l2范數(shù)歸一化處理,尺寸設(shè)為N×1,作為字典庫中的一個原子,這樣形成字典庫Ψ=[Ψ1,Ψ2,…,Ψi,…,ΨI]={ψl}∈RN×L對任意的1≤i≤I字典子塊Ψi∈RN×Q,是第i個人的樣本集合,易見L=IQ.對1≤l≤L,ψl∈RN×1且‖ψl‖2=1是字典的一個列向量,即原子.
對于任意輸入的測試樣本,首先調(diào)整大小并按照上述排列圖像的規(guī)則將其形成一個N×1的列向量x,則x在字典庫Ψ下的表示方程為
x=Ψs+ε
(4)
其中ε∈RN×1為誤差.研究的基于CS的人臉識別,將測試樣本x進(jìn)行壓縮投影得到投影信號y∈RM×1(M y=Φx=ΦΨs+ΦεDs+e (5) 其中:Φ∈RM×N為設(shè)計好的具有一定性質(zhì)的投影矩陣;D=ΦΨ∈RM×L為等效字典;e=Φε∈RM×1為投影域誤差.CS理論要求信號x在字典Ψ下可稀疏表示,即s中含有很多的零元素,才可以從測量值y中精確地重構(gòu)x.對于研究的人臉識別系統(tǒng),字典庫由I個不同人的樣本組成,因此在重構(gòu)s時利用塊稀疏的性質(zhì). y=Φ(Ψ1s1+…+ψisi+…+ψIsI)+e (6) 對于所有s選取情況,要求非零元素只能存在于某一個si中,而其他部分均為零值.基于上述討論,將式(6)拆解為 (7) 這個問題本身是一個NP-hard問題,在多項(xiàng)式時間內(nèi)難以求解.可以通過貪婪算法如正交匹配追蹤(OMP),和迭代收縮方法近似求得.在滿足RIP條件下l0范數(shù)優(yōu)化問題可以等價為l1范數(shù)優(yōu)化問題.定義 Di=ΦΨi∈RM×Q (8) 這是一個凸優(yōu)化問題可以有很多算法來解決如凸松弛類算法,迭代閾值法,Bregman迭代算法等.但是,這些算法復(fù)雜度高,這里使用同倫算法[19].該優(yōu)化算法為 (9) 其中W為一個對角線上為λ的正對角矩陣. 求解這樣一個同倫問題,即 (10) u (11) 第一步根據(jù)人臉樣本,按照一定要求構(gòu)造字典庫Ψ=[Ψ1,…,Ψi,…,ΨI],將測試圖像x0預(yù)處理形成列向量x. 第二步根據(jù)Ψ設(shè)計投影矩陣Φ. 3投影矩陣優(yōu)化設(shè)計 延用前文記號,字典子塊Ψi∈RN×Q,字典庫Ψ=[Ψ1…,Ψi,…,ΨI]∈RN×L,等效字典為 D=ΦΨ=[D1,…,Di,…,DI]∈RM×L (12) 其中:投影矩陣Φ∈RM×N;Di=ΦΨi∈RM×Q. 學(xué)界關(guān)于CS系統(tǒng)中投影矩陣優(yōu)化的研究已經(jīng)取得許多理論成果[20-23],大體來看,這些成果的思路基本為 (13) 其中:‖·‖F(xiàn)定義為Frobenius范數(shù);G為等效字典D的Gram矩陣;對于給定的字典Ψ,G只與投影矩陣Φ有關(guān);Gt為一個目標(biāo)Gram矩陣.式(13)的目的就是通過設(shè)計投影矩陣使得等效字典對應(yīng)的Gram矩陣逼近一個給定的具有一定性質(zhì)的目標(biāo)Gram矩陣. 近年來,Cleju的研究表明[23]:對于不能在字典下完全稀疏表示的信號,比如圖像信號,如果通過設(shè)計投影矩陣Φ使得等效字典D具有字典Ψ類似的性質(zhì),那么這樣的CS系統(tǒng)將具備非常好的性能,此時選取的目標(biāo)Gram矩陣為Gt=ΨTΨGΨ.對于研究的人臉圖像樣本,其在字典Ψ下的稀疏表示方程如式(4),一般情況下ε都不會是全零向量,因此可以考慮將Gt作為目標(biāo)Gram矩陣來設(shè)計投影矩陣Φ. 字典庫Ψ由I個不同人的臉部樣本組成,即使是同一個人的樣本也會因?yàn)榻嵌?、表情和光照等方面的區(qū)別而使得相關(guān)性變差,即同一個子塊Ψi中的原子兩兩之間內(nèi)積較小.另一方面,對于不同的兩個人,即不同的字典子塊之間,我們希望原子兩兩之間的相關(guān)性應(yīng)該盡可能的小.令 (14) 對目標(biāo)Gram矩陣做改進(jìn),即 Gt=ΨTΨ+Δ (15) 其中修正矩陣Δ∈RL×L可表達(dá)為 對任意1≤i≤P,1≤j≤P,Δij的尺寸均與Ψij相同;1≤m≤L,1≤n≤L,{δmn}為Δ中對應(yīng)位置的元素且 (16) 其中η為互相關(guān)性調(diào)整因子,它是一個大于零的小常數(shù),稱為修正常數(shù).通過式(15)構(gòu)造的Gt既減小不同字典子塊原子間的相關(guān)性,對同一字典子塊內(nèi)原子間的相關(guān)性又有適當(dāng)加強(qiáng).需要說明的是,前文提到字典庫的每個原子都進(jìn)行了歸一化處理,即任意1≤l≤L,‖ψl‖2=1,因此原子間內(nèi)積最大為1,即GΨ的對角線元素.為了使更新的Gt物理意義更明確,我們強(qiáng)制Gt中元素值最大為1因此對于其對角線元素我們并不改變它們的大小,而非對角元素在修正之后也不允許其超過1要大于零,這就對修正常數(shù)η的選取有了一定的要求.由此,形成投影矩陣設(shè)計問題 (17) Gt由式(15)定義. 設(shè)字典Ψ的SVD分解式為 (18) (19) 由此可選取 (21) 其中V22為任意尺寸為M×M的正交矩陣. 由此可見:關(guān)于投影矩陣Φ的優(yōu)化設(shè)計只與字典Ψ和修正常數(shù)η有關(guān),因此對于固定的Ψ及η,系統(tǒng)只要線下求得Φ,無需對每個輸入測試圖像都進(jìn)行投影矩陣設(shè)計步驟,而且式(21)是解析解結(jié)果,計算代價并不大.此外,該結(jié)果中還存在兩個自由度U及V22,這為進(jìn)一步提高系統(tǒng)性能提供了可能性. 4實(shí)驗(yàn)結(jié)果分析 通過實(shí)驗(yàn)仿真驗(yàn)證基于CS的人臉識別系統(tǒng)的性能以及投影矩陣優(yōu)化對系統(tǒng)性能的改進(jìn)情況.實(shí)驗(yàn)中所用到的人臉樣本庫包括ORL庫、Yale庫、Yale-EXTENDED庫(記為Yale-E)以及CMUPIE庫(記為PIE). 仿真中對每個人臉庫分別構(gòu)造字典Ψ∈RN×L,其中對i=1,2,…,I,每個字典子塊Ψi∈RN×Q,通過字典設(shè)計投影矩陣Φ∈RM×N.對每個庫中的每個人臉樣本均按照32×32的尺寸進(jìn)行預(yù)處理并將其分別形成1 024×1的列向量,即N=1 024.對ORL庫中40個人,每人隨機(jī)選取5個臉部樣本共200個原子組成字典庫,此時P=40,Q=5;對Yale庫15個不同人,每人隨機(jī)選取8個臉部樣本共120個原子組成字典庫,此時P=15,Q=8;對Yale-E庫38個不同人,每人隨機(jī)50個臉部樣本共1 900個原子組成字典庫,此時P=38,Q=50;對PIE庫68個不同的人,每人40個臉部樣本共2 720個原子組成字典庫,此時P=68,Q=40.對每個人臉庫剩余樣本,盡量隨機(jī)選取5個樣本作為測試信號,每次識別都重復(fù)進(jìn)行10次實(shí)驗(yàn),將10次實(shí)驗(yàn)結(jié)果取算術(shù)平均值作為最終結(jié)果進(jìn)行識別率分析,同倫算法初始化參數(shù)λ=0.05. 4.1投影矩陣優(yōu)化參數(shù)設(shè)置 針對上節(jié)投影矩陣優(yōu)化設(shè)計中的幾個參數(shù)進(jìn)行測試.η值的選取:首先測試互相關(guān)性因子η對系統(tǒng)性能的影響.設(shè)定壓縮投影值M=80,壓縮率即為1 024/80,對不同的η取值,通優(yōu)化算法設(shè)計投影矩陣Φ.圖2描繪的是對于不同人臉庫系統(tǒng)識別率隨η變化曲線. 圖2 系統(tǒng)識別率隨η變化曲線Fig.2 System recognition rate vary with η 從圖2中分析可知:對于Yale庫和Yale-E庫,保持系統(tǒng)原來互相關(guān)性就已經(jīng)有很高的識別率,調(diào)整互相關(guān)性因子η對系統(tǒng)識別率沒有明顯改善作用;而對于ORL庫和PIE庫,適當(dāng)選取的η確實(shí)提高了系統(tǒng)識別率.綜合考慮,在后續(xù)仿真中固定修正常數(shù)η=0.03,對于這4人臉庫而言均可取得較好的識別效果. 從CS理論分析可知:當(dāng)壓縮投影值M較大時,系統(tǒng)重建圖像的精度也相對更高,但是相應(yīng)的此時信道傳輸數(shù)據(jù)及后臺處理數(shù)據(jù)的壓力也越大.因此對于不同的應(yīng)用場景,我們要權(quán)衡利弊.這部分主要驗(yàn)證M值的選取對系統(tǒng)識別率的影響,對于不同的M取值,通過優(yōu)化算法設(shè)計投影矩陣Φ,圖3描繪的是對于不同人臉庫系統(tǒng)識別率隨M變化曲線. 圖3 系統(tǒng)識別率隨M變化曲線Fig.3 System recognition vary with M 從圖3中分析可知:系統(tǒng)識別率并非隨著壓縮投影值M單調(diào)變化.不同M值,Yale庫識別率基本不變,由文獻(xiàn)[25]可知:識別誤差受其人臉類總數(shù),類間最小距離,噪聲誤差影響,Yale庫種類較小,類內(nèi)變化也不大,所以當(dāng)M=26時候,在很高壓縮率下其識別率就已經(jīng)較高;對于ORL庫和Yale-E庫,當(dāng)M=80時系統(tǒng)識別率穩(wěn)定在一個比較理想的位置;而PIE庫雖然識別率不是隨著M值單調(diào)增大,但整體上依舊還有上升的趨勢.考慮到有效性問題,后續(xù)仿真中固定M=80,即壓縮率為1 024/80. 4.2CSC性能測試 將測試信號按照上述設(shè)計好的投影矩陣進(jìn)行投影壓縮,再對投影值進(jìn)行識別分類,分類方法分別采用KNN,SVM,NNSRC以及CSC,對4人臉庫的識別率統(tǒng)計如表1所示. 表1 不同分類器識別率比較 由表1可見:對于ORL,Yale和Yale-E這3人臉庫,CSC均得到最大的系統(tǒng)識別率,但應(yīng)用于PIE庫時,效果略差于NNSRC系統(tǒng). 4.3投影矩陣優(yōu)化算法性能測試 將測試信號按照PCA,壓縮,隨機(jī)采樣,無壓縮4種方式稀疏表示分類識別,對4人臉庫的識別率統(tǒng)計如表2所示. 表2 不同壓縮方法識別率比較 由表2數(shù)據(jù)表明:投影矩陣設(shè)計方法相對于隨機(jī)采樣及PCA在系統(tǒng)識別率上均達(dá)到最大值,尤其是對Yale庫和PIE庫的改善情況;但是相對于無壓縮的情形,PIE庫識別率依舊較低.M值的選取部分仿真預(yù)示,對PIE庫系統(tǒng)識別率隨M增加還有改善的趨勢,因此嘗試?yán)^續(xù)增大M,對PIE庫系統(tǒng)識別率變化曲線如圖4所示. 圖4 對PIE庫系統(tǒng)識別率隨M變化曲線Fig.4 The recognition rate of PIE dataset vary with M 由圖4可見:對PIE人臉庫,當(dāng)M值取到120時,系統(tǒng)識別率已經(jīng)超過表2中無壓縮的情形,而當(dāng)M=240,系統(tǒng)識別率更是達(dá)到了98.24%,此時壓縮率為1 024/240. 4.4圖像重建效果測試 σmse‖ 信號重建性能采用峰值信噪比(Peaksignaltonoiseratio,PSNR)來衡量,定義為 σpsnr 其中r=8為每個像素點(diǎn)的編碼比特數(shù).圖5描繪了σpsnr隨著壓縮投影值M的變化曲線. 圖5 σpsnr隨M變化曲線Fig.5 σpsnrvary with M 圖5中每個人臉庫σpsnr隨M的變化趨勢與圖3中系統(tǒng)識別率的趨勢基本吻合,均不隨M值單調(diào)增大,但總體趨勢是在上升. 5結(jié)論 以優(yōu)化投影矩陣為基礎(chǔ),提出了基于壓縮感知的人臉識別技術(shù)框架,系統(tǒng)首先根據(jù)訓(xùn)練樣本的互相關(guān)矩陣,優(yōu)化設(shè)計投影矩陣,然后對輸入信號進(jìn)行投影壓縮,最后利用基于l1范數(shù)的同倫快速算法進(jìn)行稀疏表示分類;通過對參數(shù)η優(yōu)化,進(jìn)一步提高識別率,對4個人臉庫仿真結(jié)果證實(shí)在少量測量數(shù)據(jù)下,系統(tǒng)仍然保證有較高的識別精度并且有較好的重建效果. 參考文獻(xiàn): [1]ZHAO W Y, CHELLAPPA R., PHILLIP S P J,et al. Face recognition: a literature survey[J]. ACM computer surveys,2003,35(4):399-458. [2]LIU C J, WECHSLER H. Gabor feature based classification using the enhanced fisher linear discriminate model for face recognition[J]. IEEE transactions on neural networks,2002,11(4):467-476. [3]CHEN W L, ER M J, WU S Q. PCA and LDA in DCT domain[J].Pattern recognition letters,2005,26(15):2474-2482. [4]鄭博,毛劍飛,梁榮華.基于紋理權(quán)重的AAM人臉特征點(diǎn)檢測方法[J].浙江工業(yè)大學(xué)學(xué)報,2012,40(6):661-665. [5]WALLACE G K. The JPEG still picture compression standard[J].IEEE transactions on consumer electronics,1992,38(1):153-165. [6]TAUBMAN D S, MARCELLIN M W. JPEG2000: image compression fundamentals, standards and practice[M]. Berlin, German:Springer,2002. [7]TURK M, PENTLAND A. Eigen faces for recognition[J]. Cognitive neuroscience,1991,3(1):72-86. [8]SWETS D L, WENG J. Using discriminate eigen features for image retrieval[J]. IEEE transactions on pattern analysis and machine intelligence,1996,18(8):831-836, [9]WONG M, LANE T, A kth nearest neighbor clustering procedure[J]. Royal statistical society, series B, methodological,1983,45(3):362-368. [10]CORTES C, VAPNIC V. Support vector networks[J]. Machine learning,1995,20(1):1-25. [11]WRIGHT J, YANG A Y, GANESH A. Robust face recognition via sparse representation[J]. IEEE transactions on pattern analysis and machine intelligence,2009,31(2):210-227. [12]GAO Y, WANG X S,CHENG Y H. Dimensionality reduction of hyper spectral data using non-negative scarcity graph[J]. Electronics and information technology,2013,35(5):1177-1184. [13]呂剛,郝平.基于神經(jīng)網(wǎng)絡(luò)的數(shù)字驗(yàn)證碼識別研究[J].浙江工業(yè)大學(xué)學(xué)報,2010,38(4):433-436. [14]朱海濤,徐建明,何德峰,等.基于最小均方delta規(guī)則的神經(jīng)網(wǎng)絡(luò)工件識別[J].浙江工業(yè)大學(xué)學(xué)報,2014,42(2):219-236. [15]CANDES E J, ROMBERG J, TAO T. Robust uncertainty principles: exact signal reconstruction from highly incomplete frequency information[J]. IEEE transactions on information theory,2006,52(2):489-509. [16]DONOHO D L. Compressed sensing[J]. IEEE transactions on information theory,2006,52(4):1289-1306. [17]CANDES E J, TAO T. Near optimal signal recovery from random projection: universal encoding strategies[J]. IEEE transactions on information theory,2006,52(12):5406-5426. [18]CANDES E J, WAKIN M B. An introduction to compressive sampling[J]. IEEE transactions on signal processing,2008,25(2):21-30. [19]ASIF M S,ROMBERG J. Sparse signal recovery for streaming signals using L1-homotopy[J]. IEEE transactions on signal processing,2013,46(7):3401-3413. [20]ZELNIK M L, ROSENBLUM K,ELDAR Y C. Sensing matrix optimization for block-sparse decoding[J]. IEEE transactions on signal processing,2011,59(9):4300-4312. [21]ABOLGHASEMI V, FERDOWSI S, SANEI S. A gradient-based alternating minimization approach for optimization of the measurement matrix in compressive sensing[J]. Transactions on signal processing,2012,92(4):999-1009. [22]LI G., ZHU Z H, YANG D H. On projection matrix optimization for compressive sensing systems[J]. IEEE transactions on signal processing,2013,61(11):2887-2898. [23]CLEJU N. Optimized projections for compressed sensing via rank-constrained nearest correlation matrix[J]. Applied and computational harmonic analysis,2014,36(3):495-507. [24]YU A H, ZHU Z H, BAI H, IIAN Q R,et al. Multi-objects classification via optimized compressive sensing projection[C]//2013 9th International Conference on Information, Communications and Signal Processing. Taiwan:IEEE,2013:1430-1434. [25]HORN R A,JOHNSON C R. Matrix analysis 2nd edition[M]. London, UK:Cambridge University Press,2012. (責(zé)任編輯:劉巖) Research on the face recognition technology based on optimized projection matrix YU Aihua1,2,3, BAI Huang1,2, SUN Binbin1,2, HOU Beiping3 (1.College of Information Engineering, Zhejiang University of Technology, Hangzhou 310023, China;2.Zhejiang Key Laboratory for Signal Processing, Zhejiang University of Technology, Hangzhou 310023, China;3.School of Automation and Electrical Engineering, Zhejiang University of Science and Technology, Hangzhou 310023, China) Abstract:To solve the face recognition (FR) problem existed under the background of big data, a new kind of FR technology based on compressed sensing (CS) is proposed in this paper. Firstly, the projection matrix is optimized using the face train samples. Then, the optimized projection matrix are used on the face images based on compressed sensing and the homotopy algorithm is used in the compressed sparse representation classification. With these modifications, the new FR technology can avoid large data transmission and storage pressure. On the other hand, the system recognition rate can be guaranteed. The simulation experiments show that the proposed method is valid. Keywords:face recognition; compressed sensing; projection matrix; homotopy algorithm 收稿日期:2015-11-13 基金項(xiàng)目:國家自然科學(xué)基金資助項(xiàng)目(61273195,61304124,61413262,61503339);浙江省自然科學(xué)基金資助項(xiàng)目(LY13F010009,LQ14F030008);浙江省教育廳項(xiàng)目(Y201430687) 作者簡介:于愛華(1975—),男,江蘇海安人,博士研究生,主要從事數(shù)字信號處理研究,E-mail:yuaihua_seu@163.com. 中圖分類號:TP391 文獻(xiàn)標(biāo)志碼:A 文章編號:1006-4303(2016)04-0392-07