楊彩鳳,劉 濤
(安徽工程大學(xué)計(jì)算機(jī)與信息學(xué)院,安徽蕪湖241000)
科學(xué)技術(shù)發(fā)展推動(dòng)了社會(huì)的發(fā)展,人們?cè)谙硎芸萍及l(fā)展帶來成果的同時(shí),伴隨著出現(xiàn)個(gè)人身份鑒定、信息安全保護(hù)等問題,也成為現(xiàn)在必須解決的社會(huì)關(guān)鍵問題[1]。人們對(duì)于身份鑒別的要求不僅在于實(shí)現(xiàn)其身份鑒別的功能,而且對(duì)其鑒別的可靠性、實(shí)時(shí)性等也有要求。簡單來說,身份鑒別就是利用各種技術(shù)獲取生物的特征,在模板數(shù)據(jù)庫對(duì)比的基礎(chǔ)上來識(shí)別一個(gè)人的身份,判斷是不是真正的你[2]。生物特征識(shí)別[3]發(fā)展至今,各種生物特征識(shí)別技術(shù)如雨后春筍般涌出,每種識(shí)別技術(shù)所針對(duì)的生物特征也不一樣,其通用性、識(shí)別性、持久性等各方面也有所差異,人臉識(shí)別具有高廣泛性、高采集性、高接受性等優(yōu)點(diǎn),其應(yīng)用也越來越廣泛。人臉識(shí)別的研究經(jīng)歷了漫長的階段,1888年Galton[4]在Nature上發(fā)表的論文中提出人臉識(shí)別,隨后,在1910年提出了人臉特征向量[5],并且將所提出的特征向量應(yīng)用在人臉識(shí)別中,然而這一階段的人臉識(shí)別并不是自動(dòng)的人臉識(shí)別。20世紀(jì)60年代自動(dòng)人臉識(shí)別才開始出現(xiàn),其中主要代表成果是1965 年Chan[6]在Panoramic Research Incorporated 上發(fā)表的報(bào)告,此報(bào)告闡述了自動(dòng)識(shí)別人臉的方法。
人臉識(shí)別的研究在不斷推進(jìn),從研究內(nèi)容、技術(shù)方法等方面來看,從最早的1964年至今,可以將人臉識(shí)別的研究劃分為3個(gè)主要階段。第一階段:1964—1990年。這一階段的人臉識(shí)別是作為一般性的模式識(shí)別問題來研究,主要是利用人臉幾何結(jié)構(gòu)來實(shí)現(xiàn)人臉識(shí)別,是屬于人臉識(shí)別研究的初級(jí)階段,研究成果也不多。第二階段:1991—1997年。在這一階段中,隨著圖像、數(shù)據(jù)庫、模式識(shí)別等的不斷發(fā)展,人臉識(shí)別也得到迅速地發(fā)展,專家學(xué)者們陸續(xù)提出各種較理想的算法,這些算法不僅在人臉識(shí)別上得到應(yīng)用,在對(duì)象配合等方面也有很好地應(yīng)用。這一時(shí)期的主流技術(shù)與第一階段的人臉識(shí)別技術(shù)有明顯的不同,主要應(yīng)用統(tǒng)計(jì)的知識(shí),比如統(tǒng)計(jì)表現(xiàn)模型、統(tǒng)計(jì)模式識(shí)別等等;其次還有局部子空間的發(fā)展,比如2D人臉圖像線性子空間判別分析,這些方面的發(fā)展都推動(dòng)自動(dòng)人臉識(shí)別不斷前進(jìn)。第三階段:1998 年至今。人臉識(shí)別技術(shù)繼續(xù)發(fā)展,目前的研究熱點(diǎn)是光照條件不理想,圖像姿態(tài)復(fù)雜,人臉數(shù)據(jù)庫種類多、規(guī)模大等的人臉識(shí)別,備受關(guān)注的技術(shù)有非線性建模方法、基于非負(fù)矩陣分解(NMF)的方法等等。
NMF 算法是一種子空間分析方法,它具有非負(fù)約束,這種方法也能對(duì)數(shù)據(jù)進(jìn)行降維。由于人臉識(shí)別的一大難點(diǎn)是人臉圖像數(shù)據(jù)龐大,又需要識(shí)別精度高、速度快,所以對(duì)圖像數(shù)據(jù)降維是解決這一問題的最好辦法。我們所熟悉的降維方法有經(jīng)典的主成分分析(PCA)[7]方法、線性判別分析(LDA)[8]方法、獨(dú)立分量分析(ICA)[9]方法、局部線性嵌入(LLE)10]方法、矢量量化(VQ)[11]方法和投影尋蹤(PP)[12]方法等,但這些傳統(tǒng)的降維方法在結(jié)果中會(huì)出現(xiàn)負(fù)值,而NMF則有天然的非負(fù)性,并且NMF有較強(qiáng)的靈活性,它可以與其他思想相結(jié)合,形成一種融合算法,一般情況而言,能達(dá)到提高識(shí)別精度和降低識(shí)別時(shí)間的目的,擴(kuò)展了實(shí)際應(yīng)用的范圍。NMF自提出以來,就在人臉識(shí)別上得到較好的應(yīng)用,許多專家學(xué)者也對(duì)其做出非常多的改進(jìn),不僅可以提高人臉識(shí)別的速度和精確度,還可以減少數(shù)據(jù)訓(xùn)練的時(shí)間等等。
各種應(yīng)用領(lǐng)域的人臉識(shí)別過程在細(xì)節(jié)上有所不同,但人臉識(shí)別的大致流程是相同的,典型的人臉識(shí)別流程主要包括圖像采集、人臉檢測、預(yù)處理、特征提取、分類識(shí)別等步驟。人臉圖像采集:從人臉識(shí)別發(fā)展以來,人臉圖像基本都可以通過攝像頭來采集,攝像頭可以在不同場合采集不同的人臉圖像,現(xiàn)在的攝像技術(shù)也越來越高,對(duì)建立人臉數(shù)據(jù)庫和人臉識(shí)別都有益處。人臉檢測:在得到人臉圖像后,圖像中往往不止人臉,還有其他背景因素,在人臉識(shí)別中,這些因素可視為干擾因素,檢測就是在圖像中檢測出人臉,分割那些干擾因素,要能夠?qū)⑷四樀奈恢煤洼喞笮?zhǔn)確地定位出來,為后續(xù)步驟打下基礎(chǔ)。圖像預(yù)處理:雖然在上一步驟中能檢測人臉,但在實(shí)際中還存在許多其他干擾因素,使得到的圖像不能直接使用,甚至得不到結(jié)果,為了能夠達(dá)到識(shí)別目的,必須經(jīng)過歸一化、濾波等預(yù)處理。人臉圖像特征提?。禾卣魈崛∈翘崛∪四槇D像的主要特征以進(jìn)行識(shí)別,是人臉識(shí)別的關(guān)鍵步驟之一,有效的特征提取能大幅提高識(shí)別效果,這也是一個(gè)特征建模的過程,為下一步分類服務(wù)。分類識(shí)別:這是一個(gè)人臉圖像對(duì)比識(shí)別的過程,把前面工作得到的數(shù)據(jù)與數(shù)據(jù)庫中的模板數(shù)據(jù)進(jìn)行對(duì)比,得到識(shí)別結(jié)果。在這一過程中,有不同的分類器,合適的分類器也是提高識(shí)別的一大利器,典型的比如機(jī)器學(xué)習(xí)中支持向量機(jī)的分類器。
特征提取在人臉識(shí)別中起著重要作用,特征提取方法備受關(guān)注,各種改進(jìn)的提取方法不斷被提出??傮w來講,人臉識(shí)別的特征提取方法可以概括為兩種:一種是基于整體人臉的特征提取方法,比如早期的PCA方法;另一種是基于人臉局部特征的方法,典型的就是NMF方法?;谡w人臉的方法對(duì)光照、遮擋等條件較敏感,而基于人臉局部特征的方法具有更多優(yōu)良性能。
Lee等[13]于1999年首次提出了NMF,并且將它應(yīng)用在人臉識(shí)別中,并詳細(xì)給出NMF算法的公式推導(dǎo)過程[14]。人臉由各個(gè)不同部分組成,NMF方法得到的圖像是局部特征的圖像,有效地對(duì)應(yīng)人臉的局部概念。在人臉識(shí)別中,將每張人臉圖像進(jìn)行向量化表示,可將人臉圖像數(shù)據(jù)庫視為一個(gè)矩陣Vn×m,其中,人臉圖像的張數(shù)為m,V中每個(gè)元素代表一個(gè)像素點(diǎn),每張人臉的向量化表示的長度為n,則NMF問題可描述為:求得基準(zhǔn)圖像矩陣Wn×k=[Wik],(i=1,2,…,n)和編碼矩陣Hk×m=[Hkj],(j=1,2,…,m),滿足如下公式:
其中,k是數(shù)據(jù)的聚類簇?cái)?shù),一般k滿足(n+m)k<n×m,從而壓縮了矩陣V,這表明,NMF對(duì)原始的人臉圖像數(shù)據(jù)進(jìn)行了降維,簡化了數(shù)據(jù)。NMF的W和H有更多的0,因此是稀疏的,這一點(diǎn)表明NMF具有稀疏性,所以NMF用于人臉識(shí)別中,有天然的非負(fù)性和稀疏性。
從(1)式中可以看出,想求W和H的最優(yōu)解,則等式需無限逼近,Lee[14]等分別給出了歐式距離的誤差函數(shù)和Kullback-Leibler商的誤差函數(shù):
從而,在歐式距離誤差函數(shù)和Kullback-Leibler商的誤差函數(shù)下分別進(jìn)行迭代,即
從隨機(jī)初始條件開始,可迭代推出最優(yōu)解的W和H,適合人臉識(shí)別,使得V≈WH有最優(yōu)結(jié)果。
雖然Lee等[13-14]提出的NMF算法在人臉識(shí)別領(lǐng)域得到廣泛應(yīng)用,效果突出,但這個(gè)算法也有其缺點(diǎn):該方法不能從任何數(shù)據(jù)庫中學(xué)習(xí)到部分表示,比如從極端不同的視角觀察圖像或高度清晰的對(duì)象;有些復(fù)雜的學(xué)習(xí)可能需要具有多層次隱藏變量的完全分層模型,而不是NMF中的單層模型;非負(fù)約束可能有助于某些模型學(xué)習(xí)基于部分的表示,但并不代表僅有非負(fù)的約束就足夠了;在這個(gè)過程中有隱藏變量,而NMF假設(shè)這些隱藏變量都是非負(fù)的,但沒有進(jìn)一步假設(shè)它們的統(tǒng)計(jì)相關(guān)性等。
這里運(yùn)用上述NMF算法[13]來仿真圖片的降維過程。在Matlab上進(jìn)行仿真實(shí)驗(yàn),現(xiàn)有的人臉數(shù)據(jù)庫有很多,方便調(diào)用,這里使用ORL人臉數(shù)據(jù)庫中的人臉圖片,處理二維矩陣,這里僅展示一張圖片的仿真結(jié)果。本實(shí)驗(yàn)中,分解矩陣的秩設(shè)為100,每次實(shí)驗(yàn)分別迭代10次、100次、1 000次,并對(duì)結(jié)果進(jìn)行對(duì)比,如圖1所示。從圖1可以看出,NMF可以實(shí)現(xiàn)數(shù)據(jù)降維,迭代次數(shù)越多越接近原圖,所以可以總結(jié)出非負(fù)矩陣的優(yōu)勢(shì)是降維,劣勢(shì)是結(jié)果要求越精確,迭代次數(shù)就越多。
圖1 迭代(a)10次、(b)100次、(c)1 000次人臉識(shí)別效果
為了適應(yīng)各種不同需求,提高識(shí)別精度和速度,國內(nèi)外專家學(xué)者對(duì)傳統(tǒng)的NMF算法作出各種改進(jìn),不斷提高人臉識(shí)別應(yīng)用效果。現(xiàn)有的NMF改進(jìn)算法有添加不同的約束方法,包括人臉圖像特征的局部性、正交性、稀疏性、流形性等約束;與其他方法相結(jié)合,包括圖保留屬性、fisher編碼、神經(jīng)網(wǎng)絡(luò)等;改進(jìn)迭代規(guī)則等。大量不同人臉數(shù)據(jù)庫中的實(shí)驗(yàn)結(jié)果表明,這些改進(jìn)的算法能提高識(shí)別的精度和減少識(shí)別的時(shí)間,提高應(yīng)用范圍。
Li等[15]提出了局部非負(fù)矩陣分解(LNMF)的方法,這也是一種子空間方法,通過加約束得到的新方法,用于學(xué)習(xí)視覺模式的空間局部性。在基礎(chǔ)組件中強(qiáng)加特征的局部性,并且為了表現(xiàn)形式適合于特征定位的任務(wù),定義了一個(gè)目標(biāo)函數(shù)來施加局部約束,以及非負(fù)性約束。
讓A=[aij]=WTW,B=[bij]=HHT,使得V=WH,LNMF的目的是通過在NMF基礎(chǔ)上強(qiáng)加以下三個(gè)額外的限制來學(xué)習(xí)特征,即∑iaii=min,∑i≠jaij=min,∑ibii=max。目標(biāo)函數(shù):
其中,常數(shù)α,β>0,具有調(diào)節(jié)作用。
迭代公式:
其中,l為中間變量。
Lu等[16]提出局部二進(jìn)制特征學(xué)習(xí)與編碼(SLBFLE)的方法,這種方法屬于無監(jiān)督特征學(xué)習(xí)方法,可以學(xué)習(xí)人臉表示(在原始圖像中),且這個(gè)學(xué)習(xí)過程是自動(dòng)的,能夠從原始圖像像素層面上去提取比較強(qiáng)的判別信息,提高識(shí)別精確度。Yang等[17]不僅將雙圖模型和NMF相結(jié)合,而且對(duì)特征空間的NMF施加L2,1范數(shù)約束,基于此,提出了一種新的聚類算法,它是基于特征選擇的、屬于局部判別聚類算法,該聚類算法在幾何空間上有兩大優(yōu)點(diǎn):第一,可以保持?jǐn)?shù)據(jù)空間的幾何結(jié)構(gòu);第二,可以保持特征空間的幾何結(jié)構(gòu)。在迭代更新規(guī)則上,兩個(gè)非負(fù)矩陣不是單獨(dú)更新,而是可以迭代交互更新,并且還充分利用了稀疏的自表示信息。從文中的實(shí)驗(yàn)結(jié)果可以看出,在魯棒性和優(yōu)越性上都表現(xiàn)突出。Patil等[18]將圖形分為上、下兩個(gè)部分,再將上、下兩個(gè)部分分別劃分成為重疊的3塊,一共將人臉圖像分為6個(gè)部分,這些部分是重疊的部分,其中,上部分為眼睛和鼻子,下部分為嘴巴和鼻子。對(duì)每個(gè)重疊區(qū)域作變換直方圖,用兩個(gè)二維的小波變換處理局部特征,包括離散正交小波變換與離散半減銳小波變換,提高識(shí)別率。
Liu等[19]結(jié)合稀疏編碼和非負(fù)矩陣,形成一種新的算法,稱為稀疏非負(fù)矩陣分解(SNMF)算法。在這個(gè)新的模型中,通過添加稀疏表示,使得非負(fù)矩陣分解的結(jié)果更加稀疏,從而得到更好的降維效果;與封閉模型非負(fù)稀疏編碼相比,由于采用了廣義Kullback-Leibler發(fā)散,而不是傳統(tǒng)的平均平方誤差作為近似誤差,該模型可以通過完全乘法來更新學(xué)習(xí)基于部分的表示。SNMF公式化的優(yōu)化問題:
其中,α為稀疏調(diào)節(jié)因子。約束優(yōu)化的乘法更新規(guī)則如下:
Patrik等[20]提出非負(fù)稀疏編碼,屬于另外一種稀疏表示,也是基于非負(fù)矩陣分解;Yang等[21]用稀疏約束魯棒回歸,提出一種基于魯棒稀疏編碼的人臉識(shí)別,這種方法對(duì)于有遮擋問題的識(shí)別有很好的效果;Fang等[22]提出一種多任務(wù)稀疏模型,利用Gabor特征的人臉識(shí)別,從而進(jìn)一步建成模型,還提出了多任務(wù)自適應(yīng)稀疏的有效算法。孫靜等[23]在基本的NMF基礎(chǔ)之上,利用了兩個(gè)優(yōu)化方法、增量學(xué)習(xí)和圖正則約束,在優(yōu)化過后還添加了稀疏的約束條件,進(jìn)而提出了一種新的NMF算法,該算法的稀疏性通過在系數(shù)矩陣上添加L2范數(shù)實(shí)現(xiàn),此方法有效地提高了數(shù)據(jù)表示的稀疏度。楊亮東等[24]也利用了增量學(xué)習(xí)和稀疏的優(yōu)點(diǎn),提出了另外一種魯棒的改進(jìn)算法,也有良好的效果。Huang等[25]在核心為圖的圖正則NMF的啟發(fā)下,同時(shí)想更好地捕捉數(shù)據(jù)的流行結(jié)構(gòu),利用稀疏表示構(gòu)造了一個(gè)稀疏超圖,并且將稀疏超圖代替原來的圖結(jié)構(gòu)引入到NMF 之中,提出了稀疏超圖正則化NMF,添加了該稀疏性后,算法的魯棒性更高,也能更好地利用高階判別流行信息進(jìn)行數(shù)據(jù)表示。王靜等[26]利用鄰近交替線性化,同時(shí)結(jié)合稀疏性,該算法的稀疏性是通過正則項(xiàng)施加實(shí)現(xiàn),即偏差函數(shù),此偏差函數(shù)是一個(gè)非凸的函數(shù),經(jīng)過平滑剪切處理,在人臉數(shù)據(jù)庫上的實(shí)驗(yàn)結(jié)果顯示,提出的算法聚類性能良好。Melisew 等[27]在對(duì)稱NMF上施加稀疏約束,所獲得的基矩陣比基礎(chǔ)的NMF所獲得的基矩陣更稀疏。此外對(duì)稱NMF區(qū)別于基礎(chǔ)的NMF,具有兩大優(yōu)點(diǎn),一是節(jié)省了大量的存儲(chǔ)空間,二是增強(qiáng)了局部特征的提取效果,這些優(yōu)點(diǎn)能更好地表示原始數(shù)據(jù)的潛在特征。作者通過對(duì)對(duì)稱NMF施加L1范數(shù)約束,構(gòu)造了一個(gè)新的稀疏對(duì)稱NMF模型。徐慧敏等[28]也利用了稀疏約束增加圖正則的NMF的稀疏性,可以理解為兩步增加稀疏性:一是利用稀疏線性表示,該稀疏線性是同類樣本之間的;二是與大多數(shù)算法實(shí)現(xiàn)稀疏一樣,通過L2,1范數(shù)來施加。
2017年,鄭明秋等[29]結(jié)合了當(dāng)下流行的神經(jīng)網(wǎng)絡(luò),并且克服非負(fù)矩陣分解的迭代問題,基于迭代原理對(duì)迭代進(jìn)行改進(jìn),提出了新的神經(jīng)網(wǎng)絡(luò)人臉識(shí)別算法,該算法基于改進(jìn)的分解結(jié)果,結(jié)果表明,改進(jìn)的NMF算法對(duì)降低神經(jīng)網(wǎng)絡(luò)分類訓(xùn)練的負(fù)荷量與運(yùn)算量有很好的效果。
將原始NMF 分解的V≈WH兩邊同時(shí)左乘VT,這里重新寫成Y≈UH,其中Y=VTV,U=VTW,得出新的誤差函數(shù)和迭代公式。
其中,η是一個(gè)常數(shù),對(duì)算法具有調(diào)節(jié)作用。對(duì)U,H分別求偏導(dǎo):
迭代公式:Unum+1=Unum-δU·?FUi,k(U,H),Hnum+1=Hnum-δH·?FHk,j(U,H),可計(jì)算出δU,δH,代入以下公式看是否符合其形式:
若符合,執(zhí)行δψ÷α,直到不符合以上形式,那么δψ=δψ×α;若不符合,則執(zhí)行δψ×α,直到符合,那么δψ=δψ。其中num、α∈(0,1)為常量。
2018年,周靜等[30]對(duì)非負(fù)矩陣進(jìn)行改進(jìn),概括起來分為三大點(diǎn)。第一,提出了新目標(biāo)函數(shù),該目標(biāo)函數(shù)是一種收斂約束的目標(biāo)函數(shù);第二,針對(duì)凸非負(fù)矩陣分解(CNMF)改進(jìn)了迭代規(guī)則,所提出的新的目標(biāo)函數(shù)表達(dá)更加簡單,易于計(jì)算;第三,為了稀疏基矩陣,得到更加稀疏化的結(jié)果,設(shè)定了閾值,該閾值在迭代過程中起到作用,最終基矩陣稀疏為0~1的矩陣。
凸非負(fù)矩陣分解形式:由W=VA,得到CNMF算法的分解形式V=VAH。新的目標(biāo)函數(shù):
迭代規(guī)則:
2019年,Tong等[31]為了得到一種更具判別性和稀疏性的低維表示方法,將稀疏約束、圖正則化、判別信息運(yùn)用到NMF之中,提出了改進(jìn)的NMF算法,可以將其縮寫為NEDMF_SR。不同于其他的利用判別分析改進(jìn)的NMF方法,該方法不僅在系數(shù)矩陣中引入了稀疏約束,而且結(jié)合了類內(nèi)和類間判別信息,提高了低維表示的判別能力,具體改進(jìn)可概括為三點(diǎn):第一,將局部不變性和判別性引入目標(biāo)函數(shù),構(gòu)造一個(gè)新的類內(nèi)約束項(xiàng),提高類內(nèi)緊湊性;第二,構(gòu)造一個(gè)新的類間懲罰項(xiàng),使樣本空間中任何兩個(gè)類在新基上區(qū)別最大,也進(jìn)一步增強(qiáng)判別性;第三,對(duì)于目標(biāo)函數(shù),該算法將稀疏約束項(xiàng)引入,進(jìn)而將數(shù)據(jù)表示的稀疏性、局部不變性和判別性集成到一個(gè)統(tǒng)一的框架之中。進(jìn)而得到該算法的兩大優(yōu)點(diǎn),一是類間離散懲罰項(xiàng)最大,二是類內(nèi)緊湊項(xiàng)和低維表示的稀疏約束都能達(dá)到最小。
在基礎(chǔ)NMF之上,設(shè)為第i類第j個(gè)樣本在新基空間中的表示,類內(nèi)聚合度Si表示為
其中Ni為第一類樣本的數(shù)量。將C類的類內(nèi)總內(nèi)聚度Sw定義為類內(nèi)約束項(xiàng):
將C類的類內(nèi)聚度均值作為準(zhǔn)則,即將作為準(zhǔn)則,并且i類的類內(nèi)緊湊權(quán)系數(shù)為rati,即
利用Wi,j表示類i與類j之間的相似性:
其中,σ為heat kernel參數(shù),xi和xj分別表示第i類和第j類的均值向量。
進(jìn)一步地,對(duì)類間樣本進(jìn)行優(yōu)化,施加不同的系數(shù)W′i.j,該系數(shù)是不同類之間的離散權(quán)系數(shù),對(duì)樣本作進(jìn)一步的相似分離:
將稀疏增強(qiáng)正則化器ψ(H)作為系數(shù)矩陣的稀疏約束項(xiàng),提高其稀疏表示能力,該項(xiàng)定義為
其中,λ為稀疏參數(shù),且λ>0。
NEDMF_SR的目標(biāo)函數(shù)為:
其中,k表示第k模塊,k∈[1,K],K代表模塊的總數(shù),V(K)是所有第k個(gè)模塊組成的矩陣。η(ji)(k)=Hs(k),s=Ni(i-1)+j,j∈[1,Ni],HS(k)代表系數(shù)矩陣H(k)的第s列。γ是類內(nèi)正則參數(shù),δ代表類間的調(diào)節(jié)離散懲罰項(xiàng)參數(shù),λ代表一個(gè)控制參數(shù),該參數(shù)作用于稀疏系數(shù)矩陣。
迭代規(guī)則:
Wang等[32]將判別思想引入到NMF算法中,提出基于Fisher限制的NMF算法。Nikitidis等[33]提出了子類別NMF算法,將一個(gè)類分割成幾個(gè)子類,從而將復(fù)雜的空間問題分割成幾個(gè)簡單問題。Cai等[34]引入流形思想,提出基于流形的NMF 算法。Kim 等[35]將低秩引入到流形NMF 中,提出權(quán)重NMF 算法。Wang等[36]引入特征域流形,保證了降維后的數(shù)據(jù)與原始數(shù)據(jù)在空間上的相鄰關(guān)系盡可能保持一致。蔡競等[37]引入增量學(xué)習(xí),提出增量式鑒別NMF算法,提高人臉識(shí)別效率。王靜等[38]利用最小二乘算法框架的優(yōu)點(diǎn),對(duì)基礎(chǔ)的NMF進(jìn)行改進(jìn),其中,這個(gè)框架的非負(fù)是交替的,并且運(yùn)用在人臉識(shí)別中,取得理想效果。該算法還利用了兩種方法來提高收斂速度,第一是自適應(yīng)BB步長,第二是梯度的Lipschitz常數(shù),與其他算法不同之處是該算法證明了全局收斂性。Chen等[39]運(yùn)用左半張量積和右半張量積,提出一種新的廣義NMF方法,所提出的模型能夠消除傳統(tǒng)NMF模型要求的維度匹配約束。實(shí)驗(yàn)結(jié)果表明,該方法在增量人臉訓(xùn)練中實(shí)現(xiàn)了節(jié)省存儲(chǔ)空間和減少計(jì)算時(shí)間。曹佳偉等[40]從圖譜理論和已知樣本的約束規(guī)則兩個(gè)方面,提出了NMF改進(jìn)方法,該方法不僅可以學(xué)習(xí)大量的結(jié)構(gòu)信息,而且提高了聚類效果,此外利用L2,1范數(shù)也增強(qiáng)了算法的魯棒性。Wan 等[41]也利用了判別信息準(zhǔn)則和圖形嵌入技術(shù),改進(jìn)NMF 算法,能充分表示圖的結(jié)構(gòu)。Leng等[42]將Lp約束納入NMF,利用L1-norm和L2-norm的優(yōu)點(diǎn),產(chǎn)生更加平滑的表示,同時(shí)也結(jié)合了圖正則的思想,發(fā)現(xiàn)隱藏的語意。對(duì)部分文獻(xiàn)中給出的實(shí)驗(yàn)結(jié)果進(jìn)行了對(duì)比,具體如表1所示。
表1 幾種改進(jìn)算法下的人臉識(shí)別的實(shí)驗(yàn)結(jié)果對(duì)比
本文主要對(duì)經(jīng)典的基于NMF算法的人臉識(shí)別進(jìn)行介紹與分類,利用Matlab實(shí)現(xiàn)NMF算法對(duì)圖片降維的過程,分析降維結(jié)果;對(duì)不同的改進(jìn)算法進(jìn)行介紹,分析了其目標(biāo)函數(shù)和迭代公式,最后對(duì)幾種算法的結(jié)果進(jìn)行直觀化地對(duì)比和總結(jié)。
人臉識(shí)別的重點(diǎn)和難點(diǎn)在于如何提高識(shí)別率和識(shí)別速度?,F(xiàn)如今,對(duì)于人臉識(shí)別,在光照不足、遮擋、表情變化、雙胞胎等情況下也需要較高的識(shí)別率和識(shí)別速度,應(yīng)用的廣泛性也很重要。在以后的研究中,用于人臉識(shí)別的非負(fù)矩陣分解算法可以在以下幾個(gè)方面繼續(xù)研究和發(fā)展:提高NMF算法的分解速度;NMF算法的分解維數(shù)的研究;在遮擋、光照不足等情況下如何提高識(shí)別率和識(shí)別速度;設(shè)計(jì)出新的NMF算法,使人臉識(shí)別的應(yīng)用更加廣泛;在大規(guī)模人臉數(shù)據(jù)庫中提高識(shí)別速度等等。
安慶師范大學(xué)學(xué)報(bào)(自然科學(xué)版)2020年3期