摘要:隨著計算機視覺技術(shù)的發(fā)展,人臉識別技術(shù)已被廣泛應用于多個領域,包括安全認證和個人身份驗證。相較于傳統(tǒng)的考勤方法,如簽到表或指紋識別,基于識別的考勤方法提供了一種更高效、可靠且便捷的解決方案。為了提高考勤管理的效率和準確性,設計了一個基于卷積神經(jīng)網(wǎng)絡的人臉考勤系統(tǒng)。系統(tǒng)由人臉注冊和人臉識別兩大模塊組成,能在各種光照和姿勢下準確識別員工面部特征??紤]到計算需求,選用了dlib庫中的HOG檢測器和基于ResNet的人臉識別模型,優(yōu)化了考勤流程并保證了實時性。測試結(jié)果表明,該系統(tǒng)在單人及多人考勤場景下有效工作,實現(xiàn)了高識別準確率。
關(guān)鍵詞: 人臉考勤; 人臉識別; 卷積神經(jīng)網(wǎng)絡
中圖分類號:TP391.4 文獻標識碼:A
文章編號:1009-3044(2024)17-0039-04 開放科學(資源服務)標識碼(OSID) :
0 引言
隨著計算機視覺技術(shù)的迅猛發(fā)展,人臉識別技術(shù)已經(jīng)從理論研究走向了實際應用,并廣泛應用于安全認證、公共安全、個人身份驗證等領域。在日??记诠芾碇?,傳統(tǒng)的考勤方法如簽到表、刷卡或指紋識別等手段逐漸顯示出其局限性,如易于偽造、代簽、考勤效率低下以及隱私問題等。因此,開發(fā)一種高效、可靠且便捷的考勤系統(tǒng)顯得尤為重要。卷積神經(jīng)網(wǎng)絡(CNN) 作為一種深度學習架構(gòu),其設計來自生物的視覺感知機制,能夠自動并有效地從圖像數(shù)據(jù)中提取復雜的特征表示,在物體檢測、圖像識別等視覺任務中展現(xiàn)出的卓越性能。
近年來,CNN已成為人臉檢測和人臉識別的核心技術(shù)。本文旨在設計一個基于卷積神經(jīng)網(wǎng)絡的人臉考勤系統(tǒng),該系統(tǒng)可以自動識別并記錄員工的考勤狀態(tài),能夠在各種光照和姿勢條件下準確識別員工的面部特征,同時確保了處理速度和系統(tǒng)的實時性,從而提高考勤管理的效率和準確性。
1 人臉檢測算法概述
人臉檢測是人臉識別系統(tǒng)中的首要步驟,作為計算機視覺領域的一個重要研究方向,經(jīng)歷了從早期的特征驅(qū)動方法到近現(xiàn)代的深度學習技術(shù)的演變,這個過程不僅推動了人臉檢測技術(shù)的發(fā)展,也為其他計算機視覺任務提供了重要的技術(shù)基礎。
Haar特征是人臉檢測領域的一種早期方法,它基于簡單的矩形特征進行人臉檢測。2001年Viola 和Jones提出了一種使用Haar特征和AdaBoost算法結(jié)合的人臉檢測框架[1],該框架通過構(gòu)建一個強分類器的級聯(lián),實現(xiàn)了快速有效的人臉檢測,這種方法的成功開創(chuàng)了基于特征的人臉檢測技術(shù),但其對光照和姿態(tài)變化較為敏感。2005年Dalal和Triggs首次將HOG特征用于行人檢測[2],之后這種方法也被應用于人臉檢測領域,它通過計算和統(tǒng)計圖像局部區(qū)域的梯度方向直方圖來表征圖像的形狀和紋理信息,相較于Haar特征,能更好地處理光照變化的問題,但在復雜背景下的性能仍有限。隨著深度學習技術(shù)的興起,CNN[3]開始在人臉檢測領域展現(xiàn)出強大的能力,它能夠自動學習和提取高層次的特征,極大地提高了人臉檢測的準確性和魯棒性,自2012年以來,隨著硬件計算能力的提升和大規(guī)模標注數(shù)據(jù)集的可用,CNN成為人臉檢測的主流方法之一。SSD[4]檢測算法,通過單次的前向傳播實現(xiàn)對圖像中多個對象的檢測和分類,并在人臉檢測中的應用展現(xiàn)了高效和準確性的平衡。MTCNN[5]結(jié)合了人臉檢測與人臉對齊(通過關(guān)鍵點檢測)的多任務框架,進一步提升了人臉檢測的性能,展現(xiàn)了優(yōu)異的檢測效果。
2 人臉識別算法概述
人臉識別技術(shù)是計算機視覺領域的一項關(guān)鍵技術(shù),它涉及從圖像或視頻中識別或驗證個體身份的過程。隨著技術(shù)的發(fā)展,人臉識別經(jīng)歷了從傳統(tǒng)算法到深度學習算法的重大轉(zhuǎn)變。
早期,人臉識別主要依靠幾何特征,如眼睛、鼻子和嘴巴之間的距離和角度,這種基于幾何特征的人臉識別方法直觀且容易理解,但對于姿態(tài)、表情和光照變化非常敏感,準確性和魯棒性有限。隨著計算能力的提升和算法的發(fā)展,基于模板[6]的方法逐漸興起,這類方法通過比較輸入人臉圖像與存儲的模板之間的相似度來進行識別,典型的算法包括Eigenfaces(基于主成分分析PCA) 和Fisherfaces(基于線性判別分析LDA) ,這些算法通過提取面部的全局特征來進行匹配,相比基于幾何特征的方法有所改進,但仍受到外部條件變化的影響。為了提高識別的魯棒性,研究者提出了一些基于局部特征匹配的算法[7],如局部二值模式(LBP) ,這類方法關(guān)注于人臉的局部區(qū)域,通過比較細節(jié)特征來進行識別,對于光照和表情變化具有較好的適應性,但對特征選取和參數(shù)設置較為敏感,需要大量的調(diào)優(yōu)。
深度學習的興起徹底改變了人臉識別技術(shù)的發(fā)展方向,CNN[8]的引入標志著人臉識別技術(shù)進入了一個新的時代。CNN能夠自動學習和提取高層次的抽象特征,通過多層次的結(jié)構(gòu)自動學習數(shù)據(jù)的層次性特征,從而能夠捕捉從簡單到復雜的人臉特征,這些特征比傳統(tǒng)手工設計的特征更具判別性和魯棒性。通過在大規(guī)模數(shù)據(jù)集上進行訓練,CNN模型能夠?qū)W習到人臉的一般性特征,這些特征對于未見過的人臉圖像也具有很好的泛化能力,能夠處理多種復雜情況,包括不同的光照條件、表情變化、遮擋情況,以及姿態(tài)差異。與傳統(tǒng)方法相比,基于CNN的人臉識別技術(shù)能夠?qū)崿F(xiàn)端到端學習,直接從原始像素到識別結(jié)果,無須手工設計特征或復雜的預處理步驟。這簡化了模型的訓練和部署流程,同時提高了識別的效率和準確性,例如,AlexNet、VGG、ResNet[9]等深度網(wǎng)絡結(jié)構(gòu)在人臉識別任務中得到了廣泛的應用?;诰矸e神經(jīng)網(wǎng)絡的人臉識別技術(shù)已成為當前人臉識別領域的主流方法,這些優(yōu)勢使得CNN方法不僅適用于學術(shù)研究,也極大地推動了人臉識別技術(shù)在安全、監(jiān)控、互動媒體等領域的應用發(fā)展。
3 總體設計及主要模塊介紹
系統(tǒng)設計流程,如圖1所示,由人臉注冊和人臉識別兩大模塊組成。首先,將待考勤人員的人臉特征存入到人臉特征庫中。然后,對考勤人員的人臉特征進行實時提取,并與人臉特征庫特征進行比對。最后,將考勤結(jié)果計入考勤記錄表中(考勤成功,將登記時間記入表中,否則,考勤失?。?。
3.1 人臉注冊模塊
人臉注冊模塊負責采集用戶的面部圖像,提取面部特征,并將這些數(shù)據(jù)存儲到系統(tǒng)的特征庫中以供將來識別使用,具體實現(xiàn)步驟如下:
1) 輸入帶考勤人員的基本信息:姓名、ID號和采集人臉圖像數(shù)量。這一步是為了將采集到的面部信息與用戶的身份信息關(guān)聯(lián)起來。
2) 初始化攝像頭,開始視頻捕捉人臉圖像。如圖2所示,在 WIDER FACE數(shù)據(jù)集上基于CNN模型的人臉檢測方法對于人臉的復雜變化(如姿態(tài)、表情、遮擋)具有更好的適應性。但是,雖然基于卷積神經(jīng)網(wǎng)絡(CNN) 的人臉檢測算法相較于傳統(tǒng)的人臉檢測技術(shù)在準確性上有顯著提升,但其較大的計算量需求導致了檢測速度的減緩。如圖3所示,在人臉背景相對較為簡單,人臉數(shù)目較少情況下,基于傳統(tǒng)和基于CNN 模型的方法檢測效果相當,但是傳統(tǒng)方法簡單高效。鑒于人臉考勤系統(tǒng)所涉及的人臉檢測任務相對簡單,因此在選擇人臉檢測方法時,本文使用dlib 庫中的HOG檢測器檢測視頻幀中的人臉。
3) 對于每個檢測到的人臉,使用dlib庫的68點關(guān)鍵點檢測器來找到人臉的關(guān)鍵點。
4) 使用dlib庫中的基于ResNet的人臉識別模型,從每個檢測到的人臉中提取面部特征描述符。
5) 將采集的特征描述符被轉(zhuǎn)換成列表形式,與人臉的標簽ID和姓名一起,寫入一個人臉特征庫CSV 文件中。
3.2 人臉識別模塊
人臉識別模塊是人臉考勤系統(tǒng)的核心組成部分,主要負責通過對比識別出特定個體的面部特征,具體實現(xiàn)步驟如下:
1) 從視頻流中,檢測待考勤人員臉部和面部關(guān)鍵點信息,其步驟同人臉注冊模塊的1~3步。
2) 如圖4所示為基于Fisher的傳統(tǒng)識別方法和基于ResNet模型的深度學習方法,對相同人臉Yale數(shù)據(jù)集的識別結(jié)果,基于ResNet模型對56張測試集中的圖像,識別正確率100%,而基于Fisher 的方法僅為79.63%。由于基于卷積神經(jīng)網(wǎng)絡的人臉識別模型,較傳統(tǒng)識別模型識別率較高,所以本文選用dlib庫中的基于ResNet模型作為人臉識別模型。用選用識別模型,從每個檢測到的人臉中提取面部特征描述符。
3) 將提取的人臉特征與特征庫中的特征進行比對,計算歐幾里得距離,以找出最相似的人臉特征。
4) 若最小距離小于設定閾值,則認為匹配成功,識別出人臉,顯示識別結(jié)果,并根據(jù)特定條件(如一定時間內(nèi)未重復識別)記錄到考勤信息CSV文件中。若大于閾值,則考勤失敗。
4 系統(tǒng)測試
4.1 人臉注冊功能測試
考勤前需對待考勤人員進行人臉特征錄入。首先,需設置采集人臉特征的圖像張數(shù),考勤人員的姓名和ID號碼。如圖5所示為設置采集人臉特征圖像張數(shù)為3時的采集結(jié)果。
4.2 人臉考勤功能測試
在人臉考勤模塊中,需要設置閾值大?。ㄏ到y(tǒng)設置閾值為0.3) ,可以進行單人和多人同時考勤。如圖6a) 所示為單人考勤結(jié)果,最右側(cè)為考勤人員姓名及考勤成功時間;圖6b) 所示為多人同時考勤結(jié)果,最右側(cè)為考勤人員姓名及考勤成功時間。
5 結(jié)束語
本文設計并實現(xiàn)了一個基于卷積神經(jīng)網(wǎng)絡的人臉考勤系統(tǒng),該系統(tǒng)不僅優(yōu)化了傳統(tǒng)考勤方法的局限性,如提高了考勤效率和準確性,而且還能夠在復雜環(huán)境下準確識別員工的面部特征。通過采用dlib庫中的HOG檢測器和基于ResNet的人臉識別模型,展現(xiàn)了對于人臉的復雜變化(如姿態(tài)、表情、遮擋)的良好適應性,同時保證了處理速度和系統(tǒng)的實時性。盡管本系統(tǒng)在實驗和測試中表現(xiàn)出色,但我們也認識到還有進一步改進的空間。未來的研究可以探索更高效的人臉檢測和識別算法,以進一步提高系統(tǒng)的識別速度和準確率。
參考文獻:
[1] VIOLA P,JONES M.Rapid object detection using a boosted cas?cade of simple features[C]//Proceedings of the 2001 IEEE Com?puter Society Conference on Computer Vision and Pattern Rec?ognition.CVPR.Kauai,HI,USA.IEEE,2001:I.
[2] DALAL N,TRIGGS B.Histograms of oriented gradients for hu?man detection[C]//2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR′05).San Di?ego,CA,USA.IEEE,2005:886-893.
[3] ZAMIR M,ALI N,NASEEM A,et al.Face detection & recogni?tion from images & videos based on CNN & raspberry pi[J].Computation,2022,10(9):148.
[4] 蘇海濤,張守棋.注意力機制優(yōu)化SSD的戴口罩人臉快速檢測研究[J].電腦知識與技術(shù),2023,19(19):30-34,38.
[5] 楊玉潔,陳天星,石林坤,等.偏轉(zhuǎn)角度情況下MTCNN人臉檢測算法改進[J]. 計算機與數(shù)字工程,2023,51(9):2074-2078,2206.
[6] 謝毓湘,王衛(wèi)威,欒悉道,等.基于膚色與模板匹配的人臉識別[J].計算機工程與科學,2008,30(6):54-56,59.
[7] 黃璞,沈陽陽,杜旭然,等.基于局部約束特征線表示的人臉識別[J].計算機科學,2022,49(S1):429-433,536.
[8] 左棟,楊明遠.基于ResNet50網(wǎng)絡特征融合的人臉識別技術(shù)研究[J].電腦與信息技術(shù),2023,31(1):22-24.
[9] KANAKA DURGA B, RAJESH V. A ResNet deep learning based facial recognition design for future multimedia applica?tions[J]. Computers and Electrical Engineering, 2022(104):108384.
【通聯(lián)編輯:聞翔軍】
基金項目:智慧助老——助力老人融入智慧社會(202310478031) (2023 年河南省本科高校大學生創(chuàng)新創(chuàng)業(yè)訓練計劃項目)