杜瑞慶 李庚辰
摘要:隨著人臉識別技術(shù)的發(fā)展,通過“人臉比對”技術(shù)找出冒名頂替上大學(xué)人員成為現(xiàn)實(shí)。人臉比對是通過提取照片的特征值進(jìn)行比對,得到置信度進(jìn)而判斷是否為同一人。在Visual C#與百度AI基礎(chǔ)上開發(fā)和設(shè)計(jì)了學(xué)生人臉比對系統(tǒng),通過對比同一名學(xué)生在各時(shí)期學(xué)籍照片、身份證照片進(jìn)而找出冒名頂替的可疑者,確保招生公平公正,維護(hù)高校辦學(xué)秩序,促進(jìn)教學(xué)改革。論文從開發(fā)背景、人臉比對理論、百度AI人臉識別功能、學(xué)生人臉比對系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)等方面進(jìn)行了闡述。
關(guān)鍵詞:百度AI;人臉比對;特征值;Visual C#;教學(xué)改革
中圖分類號:TP391? ? ? 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2023)13-0039-03
開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID)
0 引言
隨著互聯(lián)網(wǎng)技術(shù)和信息化的發(fā)展,教育現(xiàn)代化信息化越來越得到重視。普通高等學(xué)校的學(xué)生信息的正確性對于確保招生公平公正、維護(hù)高校辦學(xué)秩序起到非常大的作用,新生入學(xué)資格復(fù)查和學(xué)籍電子注冊工作的重要性不言而喻。各高校必須嚴(yán)格按照《普通高等學(xué)校學(xué)生管理規(guī)定》和學(xué)籍電子注冊規(guī)定,認(rèn)真開展新生入學(xué)資格復(fù)查,并通過“人像比對”等技術(shù)嚴(yán)防冒名頂替。目前,各高校選擇百度AI作為人像比較的技術(shù)越來越多[1],因此,開發(fā)一款能夠高效準(zhǔn)確比對照片的系統(tǒng)成為必然。
1 人臉比對理論
人臉比對,是通過對人臉區(qū)域的特征進(jìn)行對比,對比兩張或多張圖像中的人臉信息,分析面部特征,進(jìn)行比較和匹配的過程,根據(jù)人臉的相似度判斷是否為同一人或者在人群中找到目標(biāo)人物,人臉比對基于的理論基礎(chǔ)主要包括人臉特征提取、特征匹配算法和人臉識別模型訓(xùn)練等。
在這個(gè)過程中,還應(yīng)建立人臉數(shù)據(jù)庫,所謂人臉數(shù)據(jù)庫,是指建立一個(gè)包含多個(gè)人臉圖像及其特征向量的數(shù)據(jù)庫,通過數(shù)據(jù)庫中的信息使得在人臉比對時(shí)可以快速地檢索和匹配數(shù)據(jù)。并且使用人臉數(shù)據(jù)庫可以對不同的識別度進(jìn)行客觀分析和評估,提高系統(tǒng)的響應(yīng)速度和系統(tǒng)的靈活性能。
在比對過程中,每張照片都需要首先進(jìn)行人臉檢測,其中包括性別、年齡、表情、人臉角度、眼部狀態(tài)、嘴部狀態(tài)、視線檢測,由此找到關(guān)鍵點(diǎn)坐標(biāo),這些關(guān)鍵點(diǎn)包括人臉輪廓、眼睛、眉毛、嘴唇及鼻子輪廓。根據(jù)關(guān)鍵點(diǎn)設(shè)定坐標(biāo),準(zhǔn)確識別面部五官屬性,包括三庭五眼及面部各部位,包括眉毛、眼睛、鼻子、嘴巴、下巴等屬性分類,進(jìn)行面部特征值抽取,形成數(shù)字特征向量[2]。隨著圖像識別技術(shù)的研究深入,面部特征識別由最初幾個(gè)點(diǎn)已經(jīng)擴(kuò)展到相當(dāng)數(shù)量的面部特征點(diǎn),特征點(diǎn)數(shù)量的選擇可以根據(jù)所研究的內(nèi)容進(jìn)行選取,圖1為一些常用的人臉特征的位置以及標(biāo)定順序。
在成功獲取兩張圖片的面部特征后,檢測并標(biāo)識圖片中的關(guān)鍵點(diǎn)信息,包括人臉的五官與輪廓,這些關(guān)鍵點(diǎn)信息數(shù)量甚至?xí)^1 000,同時(shí)得到人的臉框坐標(biāo)。通過將這些關(guān)鍵點(diǎn)連接,生成曲線,可以得到人臉照片中的五官區(qū)域和輪廓。將兩張圖片的五官區(qū)域和輪廓進(jìn)行對比評分,最終得到一個(gè)范圍在[0,100]以內(nèi)的結(jié)果置信度,數(shù)字越大越表示兩張照片中人臉可能來自同一個(gè)人。高??梢愿鶕?jù)學(xué)生兩張或多張照片采集時(shí)間的遠(yuǎn)近設(shè)置一定的置信度作為是否同一人的標(biāo)準(zhǔn)[3]。
2 百度AI人臉識別功能
百度AI(Artificial Intelligence,人工智能)開放平臺致力于將圖像、語音、自然語言、視頻、知識圖譜等技術(shù)通過API (Application Programming Interface,應(yīng)用編程接口)、SDK(Software Development Kit,軟件開發(fā)工具包)等簡單易用的方式向企業(yè)及開發(fā)者全面開放人工智能技術(shù)[4]。百度AI人臉離線識別SDK,包含人臉采集、活體檢測、人臉對比、識別、人臉庫管理等能力,并全部離線化、本地化,可完全在無網(wǎng)環(huán)境下工作,所有數(shù)據(jù)皆在設(shè)備本地運(yùn)行處理,可根據(jù)業(yè)務(wù)需要進(jìn)行上層開發(fā)。百度AI的人臉識別的精準(zhǔn)度達(dá)到了99%以上,且提供了離線SDK,為各高校開發(fā)學(xué)生人臉比對系統(tǒng)提供了技術(shù)支撐。
3 學(xué)生人臉比對系統(tǒng)的設(shè)計(jì)
學(xué)生人臉比對系統(tǒng)需要解決的問題與方案如下所示:
1) 選擇什么時(shí)期的照片進(jìn)行對比?為了找出冒名頂替者,需要選取學(xué)生高中學(xué)籍照片、大學(xué)入學(xué)照片、大學(xué)畢業(yè)照片、身份證照片分別進(jìn)行對比。大部分照片可以從“中國高等教育學(xué)生信息網(wǎng)(學(xué)信網(wǎng))”上獲取,包括高中學(xué)籍照片、大學(xué)畢業(yè)照片等,大學(xué)入學(xué)時(shí)可通過照片采集獲取學(xué)生入學(xué)照片,身份證照片可通過身份證讀卡器進(jìn)行讀取。
2) 照片如何命名與存儲(chǔ)?照片采集結(jié)束后,以身份證號命名,放在不同文件夾。所有照片都以身份證命名,便于人臉比對時(shí)提高搜索速度,最終提高比對速度。
3) 置信度的設(shè)置?由于學(xué)生不同照片之間的拍攝時(shí)間間隔較長,置信度不宜設(shè)置過大。該比對系統(tǒng)將大于75%的兩張人臉照片認(rèn)定為同一學(xué)生照片,結(jié)果為“是”;將50%~74%的認(rèn)定為可疑,結(jié)果為“可能是”;將50%以下的認(rèn)定為不是同一學(xué)生照片,結(jié)果為“否”。
4) 比對結(jié)果的保存?要對大量照片進(jìn)行比對,百度AI線下SDK提供了便利,為了更好保存比對結(jié)果,將比對結(jié)果存儲(chǔ)到“.csv”文件中,也便于后期進(jìn)行統(tǒng)計(jì)與分析。
項(xiàng)目流程如圖2所示。
4 學(xué)生人臉比對系統(tǒng)的實(shí)現(xiàn)
Visual C#是美國微軟公司開發(fā)的C#編程語言規(guī)格之集成開發(fā)環(huán)境使用者接口,便于開發(fā)Windows窗體應(yīng)用。Microsoft Visual Studio系列中包含 Visual C#,這是通過功能齊全的代碼編輯器、項(xiàng)目模板、設(shè)計(jì)器、代碼向?qū)А⒐δ軓?qiáng)大且易于使用的調(diào)試器以及其他工具實(shí)現(xiàn)的。通過 .NET Framework 類庫,可以訪問多種操作系統(tǒng)服務(wù)和其他有用的精心設(shè)計(jì)的類,這些類可顯著加快開發(fā)周期。正是依托這些強(qiáng)大的特性和能力,使得Visual C#成為一個(gè)被廣泛應(yīng)用于各種開發(fā)領(lǐng)域的強(qiáng)大開發(fā)工具。
此外,Visual C#中還提供了圖形界面設(shè)計(jì)工具,通過可視化的操作,可以快速地生成Windows窗體等程序應(yīng)用元素[5]。在學(xué)生人臉比對系統(tǒng)中,為了便于使用者使用,采用Visual C#開發(fā)了圖形界面,如圖3所示。
在運(yùn)行人臉比對系統(tǒng)時(shí),首先點(diǎn)擊“文件夾1”與“文件夾2”選擇需要比對的照片文件夾,文件夾中的照片均以身份證號命名。然后,點(diǎn)擊“人臉比對”,調(diào)用百度AI離線SDK中的函數(shù)對相同身份證的照片進(jìn)行比對,并在下方文本框中顯示比對結(jié)果。之后點(diǎn)擊“導(dǎo)出結(jié)果”,形成簡易對比報(bào)告,并且以Word文檔形式存儲(chǔ)在文件夾1中;當(dāng)出現(xiàn)“導(dǎo)出成功”的界面,點(diǎn)擊“確定”打開導(dǎo)出的Word文檔,在Word文檔中便可以看到導(dǎo)出的學(xué)生人臉比對系統(tǒng)簡易報(bào)告,系統(tǒng)比對結(jié)果包括照片的對比度,對比結(jié)果和簡要總結(jié)等有關(guān)信息,圖4為Word文檔部分內(nèi)容。
對比結(jié)束后,文件夾1中將增加6個(gè)文件夾與2個(gè)文件,文件夾目錄中只剩下結(jié)果“是”的照片。
1) dir2Nofile文件夾:存儲(chǔ)結(jié)果為“不存在”的照片,即文件夾1中有文件夾2中沒有的照片。
2) doubt文件夾:存儲(chǔ)結(jié)果為“可能是”的原文件夾1中的照片。
3) doubtDir2文件夾:存儲(chǔ)結(jié)果為“可能是”的原文件夾2中的照片。
4) rightDir2文件夾:存儲(chǔ)結(jié)果為“是”的原文件夾2中的照片。
5) wrong文件夾:存儲(chǔ)結(jié)果為“否”的原文件夾1中的照片。
6) wrongDir2文件夾:存儲(chǔ)結(jié)果為“否”的原文件夾2中的照片。
7) “日期時(shí)間.csv”文件:存儲(chǔ)對比結(jié)果,與主界面結(jié)果一致,便于進(jìn)行排序、匯總等操作,如圖5所示。
8) “output日期時(shí)間.docx”文件,照片對比結(jié)果文件。
5 結(jié)束語
百度AI提供的離線SDK為開發(fā)學(xué)生人臉比對系統(tǒng)提供了技術(shù)支撐,用于幫助開發(fā)者更加便捷、更加高效地使用技術(shù)和產(chǎn)品。在離線SDK中,學(xué)生人臉比對系統(tǒng)可以直接在本地設(shè)備上進(jìn)行計(jì)算相似度、特征提取和人臉檢測的有關(guān)功能操作,具備高效快速等方面的優(yōu)點(diǎn)。學(xué)生人臉比對系統(tǒng)通過對大量照片的高效準(zhǔn)備比對,找出可疑者,為后續(xù)驗(yàn)證工作奠定了良好的基礎(chǔ),確保招生公平公正,維護(hù)了高校辦學(xué)秩序,保障了高校的教學(xué)質(zhì)量,促進(jìn)了教學(xué)改革。幫助高校實(shí)現(xiàn)更好的數(shù)字化、現(xiàn)代化和智能化的管理,大大提高了教育的信息化建設(shè)發(fā)展水平。
參考文獻(xiàn):
[1] 黎智輝,謝蘭遲,王桂強(qiáng),等.基于人臉特征相似度分?jǐn)?shù)似然比的人臉比對方法[J].刑事技術(shù),2019,44(1):1-8.
[2] 劉鵬.人臉識別技術(shù)在安防領(lǐng)域的實(shí)踐應(yīng)用[J].通訊世界,2018(9):228-229.
[3] 嚴(yán)輝,邢子昊.基于人臉識別技術(shù)的門禁系統(tǒng)軟件設(shè)計(jì)[J].電子技術(shù)與軟件工程,2020(22):34-35.
[4] 史遠(yuǎn)航,饒欣宇,解佳坤,等.基于百度AI的人臉識別新生報(bào)到系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2021(6):43-45.
[5] 杜聰,杜文華,曾志強(qiáng),等.基于Visual C#的圖像實(shí)時(shí)采集及處理[J].計(jì)算機(jī)工程與設(shè)計(jì),2014,35(8):2939-2943.
【通聯(lián)編輯:謝媛媛】