金麗麗
摘 要:隨著計算機(jī)技術(shù)和信息技術(shù)的發(fā)展,人臉檢測與識別技術(shù)的研究已經(jīng)越來越成熟,但目前人臉識別的應(yīng)用還是集中在門禁系統(tǒng)和防盜系統(tǒng)方面,在人們生活中的應(yīng)用還不夠廣泛。文章綜述國內(nèi)外研究現(xiàn)狀,基于深度學(xué)習(xí)的人臉識別方法表現(xiàn)最為優(yōu)異,設(shè)計了一種基于深度學(xué)習(xí)人臉識別的圖像分類系統(tǒng)方案,旨在解決人們電腦或手機(jī)中存儲的大量圖片分類不方便的問題。
關(guān)鍵詞:人臉識別;深度學(xué)習(xí);圖像分類
0 引言
隨著人們生活水平的提高和信息技術(shù)的不斷發(fā)展,拍照已經(jīng)成為人們工作、學(xué)習(xí)以及日常生活中必不可少的一部分,但隨著照片越拍越多,手機(jī)或電腦中存儲了大量的照片,當(dāng)人們想要使用或查找某一類照片時就非常不方便,而圖像分類系統(tǒng)正是一個很好的解決方案。圖像分類在日常生活中的應(yīng)用非常廣泛,例如各類購物軟件上的拍照購服務(wù),各種搜索引擎中的圖片搜索服務(wù),停車場使用的車牌識別技術(shù)以及智能門鎖、火車站閘機(jī)等使用的人臉識別技術(shù)等,都與圖像分類有著密切聯(lián)系。隨著人工智能技術(shù)的崛起,作為人工智能領(lǐng)域重要的一環(huán),圖像分類在未來必將有著更廣闊的發(fā)展前景。
目前,人臉識別技術(shù)的研究與發(fā)展已經(jīng)較為成熟,人臉識別也成了近30年來模式識別和圖像處理中最為熱門的研究課題之一。但目前人臉識別的應(yīng)用大多是在門禁系統(tǒng)和防盜系統(tǒng)等領(lǐng)域,在人們貼身生活中的應(yīng)用還不多[1]。本文所研究的課題旨在解決生活中最常見的問題,提出一種基于人臉識別的圖像分類系統(tǒng)方案,將手機(jī)或電腦中大量的照片高效率地分類管理。
1? ? 圖像分類方法
傳統(tǒng)的圖像分類方法大多數(shù)是基于圖像特征的分類,就是利用圖像處理算法來提取經(jīng)過人工設(shè)計的一些定量或定性表達(dá)的特征,然后對這些圖像特征進(jìn)行數(shù)學(xué)統(tǒng)計分析或通過分類器運(yùn)算得出分類結(jié)果。所提取的圖像特征主要有圖像的顏色、形狀和紋理等底層視覺特征,以及方向梯度直方圖、局部二值模式和尺度不變特征變換等局部不變性特征,而這些人工設(shè)計特征的泛化性能并不好,且過于依賴設(shè)計者的先進(jìn)知識和對分類任務(wù)的理解[2]。目前,海量、高維度的數(shù)據(jù)也使得人工設(shè)計特征的難度大大增加。
目前,新興的圖像分類方法是基于深度學(xué)習(xí)的圖像分類,與傳統(tǒng)圖像分類方法相比,基于深度學(xué)習(xí)的圖像分類方法不需要去人工設(shè)計圖像特征,而是通過神經(jīng)網(wǎng)絡(luò)自主地從訓(xùn)練樣本中學(xué)習(xí)圖像特征,從而提取出抽象的、高維度的特征,且這些特征和分類器緊密相連,很好地解決了傳統(tǒng)圖像分類中關(guān)于人工提取特征和分類器選擇的問題[3]。由于深度學(xué)習(xí)的圖像分類方法可以通過深層架構(gòu)自主學(xué)習(xí)更多高維、抽象層次的數(shù)據(jù)特征,因此,基于深度學(xué)習(xí)的圖像分類比傳統(tǒng)圖像分類方法的分類效果要好很多。
2? ? 人臉識別技術(shù)
傳統(tǒng)的人臉識別方法中早期采用的是基于幾何特征的識別方法,這種方法主要是使用專用儀器來找出一組人臉圖像的面部特征點,然后去測量這些特征點之間的相對位置和歐氏距離,從而得到人臉特征的矢量,這種方法比較簡單,但識別精度較低[4]。后來,基于特征臉的識別方法和基于特征方法的識別方法相繼問世。
基于特征臉的識別方法是一種基于主成分分析的方法。所謂特征臉就是將人臉圖像的統(tǒng)計特性進(jìn)行正交變換,消除原有向量分量之間的相關(guān)性,得出一組特征向量,這組特征向量就叫特征臉。這是一種基于變換系數(shù)特征的算法,這種方法比較簡單實用,識別速度也比較快,但容易受到圖像拍攝角度、光照以及面部表情的影響,識別效果也跟訓(xùn)練集和測試集之間的相關(guān)性有很大的關(guān)系,因此局限性非常大。
基于特征方法的識別方法是將人臉圖像劃分成不同的區(qū)域來提取人臉局部特征的方法,這種方法比提取人臉整體特征的方法魯棒性更好,也不容易受到圖像拍攝角度、光照、面部遮擋、面部表情等的影響,但這種方法由于將人臉圖像劃分了多個分區(qū),每個分區(qū)都需要進(jìn)行特征提取,因此需要檢測的人臉圖像數(shù)據(jù)的存儲量和算法的計算量都比較大,識別速度較慢,消耗的資源也較多[5]。
目前,新興的人臉識別檢測方法是基于深度學(xué)習(xí)的識別方法,這種方法利用大量的人臉圖像數(shù)據(jù)來進(jìn)行訓(xùn)練,通過在訓(xùn)練集中的自主學(xué)習(xí)來得到不同類型的類內(nèi)差異,如光照、面部遮擋、面部表情等,數(shù)據(jù)集越豐富,如果能包含人臉識別中遇到的各種情況,那么系統(tǒng)通過自主學(xué)習(xí)就能克服各種困難所帶來的影響,識別的效果就更好?;谏疃葘W(xué)習(xí)的人臉識別中方法中最常用的是卷積神經(jīng)網(wǎng)絡(luò),這種方法不像傳統(tǒng)的人臉識別一樣需要去設(shè)計針對圖像的特定特征,且提取到的人臉特征對光照、面部表情和局部遮擋等都具有很好的魯棒性,因此基于深度學(xué)習(xí)的人臉識別比傳統(tǒng)的人臉識別方法效果更突出。
3? ? 圖像分類系統(tǒng)設(shè)計方案
3.1? 系統(tǒng)結(jié)構(gòu)
本系統(tǒng)由用戶操作模塊、人臉識別檢測模塊和圖片分類歸檔模塊3個部分組成。其中用戶操作模塊為系統(tǒng)的人機(jī)交互部分,用戶可進(jìn)行添加樣本、刪除樣本、選擇目標(biāo)路徑及選擇輸出路徑等操作。而人臉識別檢測模塊和圖片分類歸檔模塊為系統(tǒng)的數(shù)據(jù)處理部分,根據(jù)用戶提供的樣本對一個目錄下的多張圖片通過人臉識別技術(shù)進(jìn)行分類歸檔,分類方式為根據(jù)人臉識別結(jié)果,將圖片分為單人照、2人照、3人照、多人照及其他照片,并另存到相對應(yīng)的路徑下,其中單人照、2人照、3人照、多人照這4個路徑存儲的都是與樣本相關(guān)的照片,而其他照片路徑存儲的是與樣本無關(guān)的照片。
3.2? 系統(tǒng)設(shè)計
添加樣本:用戶選擇一張圖片作為分類樣本,系統(tǒng)將根據(jù)樣本中的人臉數(shù)據(jù)對目標(biāo)圖片進(jìn)行分類。
刪除樣本:刪除用戶已選擇的樣本圖片,等待用戶重新選擇樣本。
選擇目標(biāo)路徑:用戶選擇待分類的圖片路徑,系統(tǒng)會將該路徑下所有圖片進(jìn)行分類歸檔。
選擇輸出路徑:用戶選擇圖片分類歸檔的路徑,系統(tǒng)會在該路徑下新建單人照、2人照、3人照、多人照及其他圖片等文件夾,然后將分類后的圖片存入各自對應(yīng)的文件夾。
人臉識別檢測模塊:識別樣本和目標(biāo)圖片中的人臉,然后進(jìn)行判斷,并對目標(biāo)圖片進(jìn)行標(biāo)記。
圖片分類歸檔模塊:根據(jù)目標(biāo)圖片的標(biāo)記值將目標(biāo)圖片進(jìn)行分類歸檔,將標(biāo)記值為1的圖片存入單人照路徑下,標(biāo)記值為2的圖片存入2人照路徑下,標(biāo)記值為3的圖片存入3人照路徑下,標(biāo)記值為4的圖片存入多人照路徑下,標(biāo)記值為5的圖片存入其他照片路徑下。系統(tǒng)設(shè)計流程如圖1所示。
4? ? 結(jié)語
本文主要針對人們電腦和手機(jī)中存儲的大量圖片自動分類管理困難的問題,探討一種基于人臉識別的圖像分類系統(tǒng)方案,利用基于深度學(xué)習(xí)的人臉識別技術(shù),提取圖像中的人臉特征,通過與樣本圖片的人臉特征數(shù)據(jù)對比,得出目標(biāo)圖片與樣本圖片之間的相似度,從而實現(xiàn)圖片的自動分類管理。
[參考文獻(xiàn)]
[1]賈寧,高楠,力貴才,等.基于OpenCV的圖像分類軟件的設(shè)計與實現(xiàn)[J].計算機(jī)科學(xué),2014(S2):150-153.
[2]蘇賦,呂沁,羅仁澤.基于深度學(xué)習(xí)的圖像分類研究綜述[J].電信科學(xué),2019(11):58-74.
[3]劉洋.從圖片驗證看圖像分類的研究現(xiàn)狀[J].通訊世界,2019(1):186-187.
[4]蔣阿娟,張文娟.人臉識別綜述[J].電腦知識與技術(shù),2019(2):173-174,190.
[5]李霖潮.淺析人臉識別技術(shù)的發(fā)展[J].新型工業(yè)化,2020(3):129-133.
(編輯 姚 鑫)