錢澤凱 ,童彥澎 ,劉紹輝 ,王雨桐 ,王詩語
(1.哈爾濱工業(yè)大學(xué) 計算機(jī)科學(xué)與技術(shù)學(xué)院,黑龍江 哈爾濱 150006;2.哈爾濱工業(yè)大學(xué) 軟件學(xué)院,黑龍江 哈爾濱 150006;3.哈爾濱工業(yè)大學(xué) 建筑學(xué)院,黑龍江 哈爾濱 150006)
隨著神經(jīng)網(wǎng)絡(luò)的再度崛起與深度學(xué)習(xí)技術(shù)迅猛發(fā)展,人臉識別的準(zhǔn)確率和性能不斷提升,人臉識別技術(shù)在各領(lǐng)域得以快速發(fā)展,在行政、公共安全、交通、商業(yè)等各領(lǐng)域發(fā)揮重要作用。然而,人臉識別技術(shù)在提升便捷性的同時,也遭到了濫用,個人隱私安全問題迫在眉睫。
在近年中一些調(diào)研中,文獻(xiàn)[1]發(fā)現(xiàn)包括人臉信息在內(nèi)的生物特征信息泄露問題越來越嚴(yán)重。2019年8 月,生物識別平臺BioStar2 泄露超過2 780 萬條記錄,數(shù)據(jù)量達(dá)23 GB,其中包括指紋、人臉識別和用戶圖片、未加密的用戶名和口令及員工數(shù)據(jù)等。2021 年3 月科勒衛(wèi)浴、寶馬等企業(yè)在主體不知情情況下,對人臉信息捕捉、記錄,并對該信息進(jìn)行行為分析,導(dǎo)致個人行蹤泄露。同時根據(jù)《南方都市報》個人信息保護(hù)研究中心人工智能倫理課題組和軟件專項治理工作組發(fā)布的《人臉識別應(yīng)用公眾調(diào)研報告(2020)》[2]發(fā)現(xiàn),當(dāng)前人臉識別技術(shù)普及率高,但仍存在強(qiáng)制使用等問題,六成受訪者認(rèn)為人臉識別技術(shù)有被濫用的趨勢。此外,針對目前幾類較有爭議的人臉識別應(yīng)用場景,受訪者最不能接受的是商城使用人臉識別收集顧客的行為數(shù)據(jù)。在各大商場、酒店、旅游景點等具有爭議的公共場合,人臉信息過度采集與非法存儲行為屢見不鮮,甚至在很多安全級別低且不必要的場景中強(qiáng)制要求人臉認(rèn)證。其次,用戶對于人臉識別認(rèn)證的態(tài)度也日趨保守與抵觸。根據(jù)具《南方都市報》發(fā)布的《人臉識別應(yīng)用場景合規(guī)報告(2021)》[2]顯示,在感受人臉識別便捷性的同時,大眾對人臉識別的安全性保持擔(dān)憂。
針對人臉識別的安全性問題已經(jīng)有相關(guān)研究,目前的系統(tǒng)中通常使用更精準(zhǔn)的人臉識別手段過濾不安全的人臉,從而保護(hù)系統(tǒng)的安全性。常用的手段是三維結(jié)構(gòu)光識別[3],該技術(shù)將編碼的光柵或線光源等投射到被測物上,根據(jù)它們產(chǎn)生的畸變來解調(diào)出被測物的三維信息。但所有的技術(shù)只是關(guān)注系統(tǒng)的安全性,忽略了人臉隱私安全問題,所有的人臉識別技術(shù)離不開數(shù)字化特征值的提取[2],提取的人臉特征具有唯一性、不可撤銷性,一旦遭到攻擊、篡改或泄露,則意味著終生泄露,用戶隱私安全正面臨巨大威脅。
針對以上的問題,本文從人臉識別中使用的人臉數(shù)據(jù)出發(fā),對提取的數(shù)據(jù)進(jìn)行合適的加密和處理,從底層解決了人臉隱私泄露的問題。進(jìn)行了全面的背景調(diào)研、系統(tǒng)設(shè)計、功能實現(xiàn)以及系統(tǒng)測試。系統(tǒng)主要分為前端與后端兩個部分。后端主要包括數(shù)據(jù)庫的部署與搭建、接口設(shè)計以及模型訓(xùn)練。前端開發(fā)了軟件端與網(wǎng)頁端。系統(tǒng)具有封閉安全、輕量高效、準(zhǔn)確率高、公開透明的特點,同時還具可拓展性和移植性,幾乎可以適用于人臉識別的各種場合。不僅適用于高級機(jī)密的安全場所,更能從普羅大眾所接觸到日常生活中的各個場景解決人臉隱私泄露的問題,可以代替大部分場景下的人臉識別系統(tǒng)。
系統(tǒng)在普通版本的基礎(chǔ)上,開發(fā)了大量其他的應(yīng)用場景模擬系統(tǒng)。主要針對設(shè)備解鎖、上班打卡、微信取紙等具體的多種應(yīng)用場景進(jìn)行了設(shè)計。在不同場景下,簽名與密鑰的形式便捷多樣,如NFC 卡、手機(jī)序列號、手機(jī)號碼等,能夠滿足用戶在多種場景下的需求,有效防范人臉信息的非法盜取與濫用。最后在系統(tǒng)上實現(xiàn)了上述提出的想法。系統(tǒng)是開源的,開源網(wǎng)址為:https://github.com/qzkinhit/MAEBased -Face -Privacy -Protection -and -Authentication -System。
現(xiàn)行人臉識別技術(shù)基于數(shù)字化特征值的提取[2],而后通過特征向量的相似性比對來確認(rèn)用戶身份。提取的人臉特征具有唯一性、不可撤銷性,一旦遭到攻擊、篡改或泄露,則意味著終生泄露。針對該問題,本系統(tǒng)在數(shù)據(jù)庫中僅存儲缺失位置信息的殘缺人臉?biāo)槠幋a,利用數(shù)據(jù)切片技術(shù)實現(xiàn)去人臉化。在認(rèn)證時利用遮罩自編碼模型進(jìn)行復(fù)原,將復(fù)原圖像與實時采集圖像進(jìn)行比對來完成認(rèn)證。系統(tǒng)將圖像位置信息與現(xiàn)有密鑰技術(shù)相結(jié)合,采用傳統(tǒng)密鑰/生物特征密鑰實現(xiàn)雙重認(rèn)證,進(jìn)一步提高系統(tǒng)的安全性。在認(rèn)證過程的用戶人臉實時采集階段,現(xiàn)行身份認(rèn)證系統(tǒng)針對照片臉、模型臉、視頻臉、雙胞胎臉、二次翻拍等人臉造假手段,多未進(jìn)行特殊處理,容易被偽造人臉欺騙。本系統(tǒng)采用活體防偽技術(shù)與可遮擋口罩識別,有效拒識偽造人臉,且支持用戶佩戴口罩情況下的識別,符合當(dāng)下疫情的時代主題。此外,系統(tǒng)采用數(shù)據(jù)簽名環(huán)技術(shù),保證信道安全。原理詳細(xì)闡述如下。
本系統(tǒng)使用的關(guān)鍵技術(shù)是遮罩自編碼模型(Masked Autoencoders,MAE)[4]。本模型將自然語言處理領(lǐng)域的語義補(bǔ)全方式用于計算機(jī)視覺領(lǐng)域。模型大致訓(xùn)練過程為:先將輸入圖像的隨機(jī)部分予以遮罩,再重建丟失的像素。經(jīng)過海量數(shù)據(jù)的學(xué)習(xí)和訓(xùn)練,人工智能模型會理解圖像的語義信息,并將圖像復(fù)原。
整個MAE 模型大體上分為非對稱的編碼器和解碼器兩部分。首先將一幅完整的圖片分成一行16 塊、一列16 塊的圖像塊,并得到每一個圖像塊的嵌入表示,這樣就可以按照自然語言序列的形式將圖片輸入到模型的編碼器中。模型的編碼器實際上就是一個視覺轉(zhuǎn)換器網(wǎng)絡(luò)(Vision Transformer,VIT)[5],但編碼器的輸入并不是整幅圖像,而是隨機(jī)遮掩住一部分圖像塊(通常的遮掩比例為75%,通過大量對比實驗確定);然后將剩余的圖像塊輸入到編碼器網(wǎng)絡(luò)中,同時輸入每一個圖像塊的位置信息,以便在解碼器輸入前重建出整個圖像的位置信息。
在通過編碼器網(wǎng)絡(luò)后,可以得到關(guān)于輸入圖像的隱藏層信息表示。之后根據(jù)每一個圖像塊的位置信息重建出原始圖像塊順序,其中被遮罩的圖像塊都用一個統(tǒng)一的形式表示。然后將所有編碼器輸出信息按原始的圖像塊順序輸入到模型的解碼器中,解碼器試圖從這些輸入信息中重建出原始圖像。最后將解碼器得到的輸出圖像與原始圖像進(jìn)行比較,計算誤差并反向傳播更新模型的參數(shù),從而實現(xiàn)對整個模型的訓(xùn)練。
MAE 的基本架構(gòu)如圖1 所示。
圖1 MAE 模型架構(gòu)圖
本系統(tǒng)摒棄傳統(tǒng)人臉識別采用二維圖形處理模型,對人臉進(jìn)行三維結(jié)構(gòu)化處理。在人臉識別階段通過對人體行為及細(xì)節(jié)實時分析偵測,有效杜絕照片臉、模型臉、視頻臉、雙胞胎臉等作假手段,過濾檢測中不符合標(biāo)準(zhǔn)的人臉[6]。
同時為了符合當(dāng)前疫情防控的需求和提供更可靠的人臉隱私保護(hù),注冊和認(rèn)證時,本系統(tǒng)可以在使用口罩進(jìn)行遮擋的情況下,準(zhǔn)確地識別和分析人的身份信息[7-8]。
活體識別[6]首先使用基于圖片中人像的破綻(摩爾紋、成像畸形等),判斷目標(biāo)是否為活體,有效防止屏幕二次翻拍等作弊攻擊。其次,在攝像頭中采用3D 結(jié)構(gòu)光技術(shù),亦可有效對抗非活體攻擊。紅外攝像頭喚醒點陣投影器,繪制出人臉深度圖像,從而有效對抗2D 非活體攻擊。
依托于MAE 圖像語義補(bǔ)全模型的技術(shù),系統(tǒng)在數(shù)據(jù)存儲和處理過程中具有不可逆的圖像處理流程,保證了數(shù)據(jù)庫中信息即使被盜取,也不可能復(fù)原初始圖像信息。
系統(tǒng)通過遮罩實現(xiàn)人像分離采集,對攝像頭采集的圖像進(jìn)行實時“去人臉化”處理,即只保留25%的圖像。隨后,對圖像塊的切片與劃分后形成無序碎片信息,并通過MAE 編碼器自注意力特征提取去圖形化。在經(jīng)過MAE 模型的編碼器后,圖像僅為向量化特征表示,從而達(dá)到去圖形化的操作。
這樣的手段具有不可逆性,經(jīng)過碎片化和去圖像化處理的數(shù)據(jù)難以還原成人像,即便竊取密鑰與模型進(jìn)行還原,也無法獲得原圖,僅為缺失關(guān)鍵生物信息的模糊人臉圖。而只有最后去圖形化的信息才會存入服務(wù)器端數(shù)據(jù)庫中,這一技術(shù)從源頭上避免了用戶人像照片被竊取并還原的可能。
人們比較熟知的密鑰技術(shù)是通過助記詞算法生成私鑰,傳統(tǒng)的助記詞模式具有易被竊取、易丟失等諸多問題,生物特征密鑰摒棄了這一做法。生物特征生成密鑰時,將從用戶實時上傳的清晰人臉中去提取分析。和傳統(tǒng)密鑰技術(shù)不一樣,生物特征密鑰實時產(chǎn)生,并不會存儲在任何地方,也無法從模糊或碎片化的人臉圖像中提取,保證了密鑰的安全。
通過人臉檢測定位,檢測圖片中的人臉并標(biāo)記出人臉坐標(biāo),精準(zhǔn)定位包括臉、眉、眼、口、鼻等人臉五官及輪廓的72 個關(guān)鍵點,分析臉型、眼睛形狀等人臉特征作為身份特征密鑰,同時綜合分析膚色、性別、人種等穩(wěn)定特征的生物特征信息,具體分析位點如圖2 所示。通過這些生物特征信息,系統(tǒng)就可以將這些信息編碼成密鑰。
圖2 人臉分析詳細(xì)位點示意圖
針對實時產(chǎn)生的生物特征密鑰的穩(wěn)定性,本系統(tǒng)制定了相應(yīng)實驗測試,生成了生物特征的穩(wěn)定性排序,具體實驗方法和結(jié)果見實驗測試部分。
在系統(tǒng)中,由用戶設(shè)備碼等信息形成身份簽名,使用身份簽名可以保證節(jié)點獨立、一個身份簽名對應(yīng)唯一的一個節(jié)點,恢復(fù)人臉次數(shù)盡量少的情況下,泄露可能性就越低。
系統(tǒng)設(shè)計了一種簽名環(huán)技術(shù),具體內(nèi)容如下:在進(jìn)行注冊和認(rèn)證操作時,使用實時生成的生物特征密鑰,將認(rèn)證時獲取的人臉原圖進(jìn)行分塊打亂,并丟棄其中75%的圖像塊,將剩余的25%的圖像塊進(jìn)行加密編碼。多種公鑰共同組成缺口數(shù)據(jù)簽名環(huán),與用戶人臉特征密鑰、加密編碼、身份簽名一起形成完整的簽名環(huán)。經(jīng)過人臉環(huán)形簽名技術(shù)簽名的數(shù)據(jù),外界無法獲知到底是誰進(jìn)行了該簽名,確保了簽名身份的隱匿,保證了信道安全。
綜上,系統(tǒng)基于MAE 模型與數(shù)據(jù)切片實現(xiàn)去圖像化,將傳統(tǒng)密鑰/生物特征密鑰與MAE 模型中的圖像位置信息結(jié)合,實現(xiàn)雙重認(rèn)證,采用活體防偽技術(shù)與可遮擋口罩識別增強(qiáng)認(rèn)證時人臉采集的安全性,并采用數(shù)據(jù)簽名環(huán)技術(shù)保證信道安全。
本系統(tǒng)主要包括人臉提取和密鑰生成兩大核心,功能架構(gòu)如圖3 所示。
圖3 “見微”系統(tǒng)功能架構(gòu)
2.1.1 人臉提取
系統(tǒng)對用戶人像進(jìn)行提取,并進(jìn)行相應(yīng)的處理和加密。系統(tǒng)中的人像有三種形態(tài),包括完整人像、人像碎片與復(fù)原人像,每種形態(tài)的人像各自的功能和適用范圍。
(1)完整人像
在系統(tǒng)的實時錄入階段需要獲取用戶完整、清晰的人像,主要用于活體防偽并過濾不合格人臉。
完整人像示例圖如圖4 所示。完整人臉在通過密鑰加密處理后生成人臉?biāo)槠瘓D像后就會銷毀丟棄,不會被存儲和發(fā)送,從而杜絕了被泄露的可能。同時,用戶可以選擇不提供完整人像,在識別階段進(jìn)行人臉遮擋,如佩戴口罩或墨鏡識別,系統(tǒng)將根據(jù)裸露的生物特征進(jìn)行分析。
圖4 完整人臉圖像舉例
(2)遮罩圖像與人像碎片
遮罩圖像是在客戶端對人臉原圖隨機(jī)遮罩75%生成的部分的圖像;人像碎片[9]是由密鑰生成的、遮罩后劃分出的圖像塊。人像碎片只提取原人像中25%的臉信息,同時隱匿圖像塊原本的位置信息,在沒有密鑰參與的情況下,人像碎片就成為了無意義數(shù)據(jù),即使數(shù)據(jù)庫被攻擊,也無法泄露用戶隱私。
示例如圖5 所示,遮罩圖像只是展示使用,不存儲在數(shù)據(jù)庫中。碎片化圖像去除位置信息,分塊并以去圖像化編碼的形式存儲在數(shù)據(jù)庫中。
圖5 遮罩圖像(上)與碎片化圖像(下)舉例
(3)復(fù)原圖像
復(fù)原人像是在認(rèn)證階段由用戶提供密鑰和數(shù)據(jù)庫存儲的人像碎片編碼共同參與,通過MAE 模型進(jìn)行圖像語義補(bǔ)全,最終得到的產(chǎn)物。復(fù)原人像用于認(rèn)證時的比對,相似度合格后比對通過。
示例如圖6 所示,在此種手段下復(fù)原的人像準(zhǔn)確性高,誤識率小于萬分之一,同時它具有足夠模糊的特點,使其被盜用價值低,保證了用戶隱私安全。
圖6 復(fù)原后的圖像舉例
2.1.2 密鑰生成
系統(tǒng)將實時生成不被存儲的密鑰,用于生成圖像塊的位置信息。密鑰由用戶存儲,在服務(wù)器端實時獲取。主要有兩種設(shè)置方式:用戶手動設(shè)置和人臉生物特征提取。
(1)手動設(shè)置
可由用戶自行選擇是否設(shè)置密鑰,若選擇自行手動設(shè)置,密鑰將掌握在用戶手中,若無用戶主動提供信息,任何一方無法獲取、復(fù)原人臉信息。適用于機(jī)密級別高的安全場景,由用戶掌握自身的隱私安全。
(2)人臉生物特征提取
然而,在多數(shù)場景下,用戶手動設(shè)置與輸入密鑰的交互方式過于繁瑣,且一旦忘記,找回密鑰需重新進(jìn)行注冊,流程較繁瑣。因此,本系統(tǒng)開發(fā)了另一種更加人性化的密鑰設(shè)置方式——生物特征密鑰提取。注冊與登錄環(huán)節(jié)實時獲取用戶人臉圖,自動分析眉眼間距、臉型等參數(shù),在線分析并獲取密鑰。生物特征提取只會應(yīng)用于客戶端和不存儲人像的錄入階段,且其他不符合要求的人臉圖片無法得到正確結(jié)果,在便捷的同時保證了安全性。
系統(tǒng)運行示意圖如圖7 所示,為了方便示意,流程圖中的分塊只分25 塊,實際應(yīng)用中的分塊數(shù)目更多,一般不少于256 塊。
圖7 系統(tǒng)運行示意圖
(1)系統(tǒng)的注冊流程。首先,系統(tǒng)實時獲取用戶人臉圖,通過AI 自動分析眉眼間距、臉型等參數(shù),獲取人臉特征密鑰(即1.4 節(jié)提及的生物特征密鑰),由人臉特征密鑰生成遮罩75%部分的位置信息對人像進(jìn)行遮罩,之后丟棄人臉原圖。隨后,系統(tǒng)提取剩余25%未遮罩的、沒有位置信息的圖像碎塊生成加密編碼,進(jìn)行信道傳輸時,由公鑰組成缺口數(shù)據(jù)簽名環(huán),與用戶人臉特征密鑰、加密編碼、身份簽名一起形成完整的簽名環(huán)發(fā)送至服務(wù)器端。最后,服務(wù)器端解析簽名環(huán)并將各個要素提取出,通過系統(tǒng)獨有的MAE 框架將碎片化圖像進(jìn)行復(fù)原,通過復(fù)原的情況,以此來驗證簽名環(huán)的有效性,隨后將身份簽名和加密編碼進(jìn)行保存,并立即丟棄用戶的人臉特征密鑰。
(2)系統(tǒng)的認(rèn)證流程。首先,和注冊部分的流程基本一致,用戶在客戶端被采集一張新的人臉圖像,但在采集過程中進(jìn)行活體防偽檢測,有效防止人臉偽造攻擊。而后經(jīng)過同樣的加密方式發(fā)送至服務(wù)器端。隨后,服務(wù)器端解析簽名環(huán)將各個要素提取出后,需要先匹配注冊時留下的身份簽名,并通過MAE框架用人臉特征密鑰將數(shù)據(jù)庫中保存的碎片化圖像編碼和接收到的碎片化圖像編碼分別進(jìn)行復(fù)原。最后,將兩個復(fù)原的人臉圖對比相似度,判定合格后認(rèn)證通過。
本實驗針對訓(xùn)練模型、密鑰安全穩(wěn)定性和遮擋條件下的性能分別進(jìn)行了測試與分析。系統(tǒng)也被投放到實際應(yīng)用場景中,供志愿者測試與使用。
測試過程中的數(shù)據(jù)采用哥倫比亞大學(xué)于2009年發(fā)布的人臉數(shù)據(jù)集[10]。該數(shù)據(jù)集是一個大型人臉數(shù)據(jù)集,主要用于人臉識別和身份鑒定,其涵蓋互聯(lián)網(wǎng)上200 人的58 797 張圖像,不同于大多數(shù)現(xiàn)有面部數(shù)據(jù)集,這些圖像是在主體完全不受控制的情況下拍攝的,因此不同圖像中姿勢、光照、表情、場景、相機(jī)、成像條件和參數(shù)存在較大差異,適合用于實驗測試。
系統(tǒng)包括后端方案和前端方案兩個部分。具體方案設(shè)計如圖8 所示。
圖8 系統(tǒng)方案設(shè)計
作為客戶端,前端用于提供多元化、多平臺的系統(tǒng)場景方案模擬。本文設(shè)計了網(wǎng)頁端和軟件移動端兩類實現(xiàn)方案,保證不同人群的多平臺使用習(xí)慣。同時,針對前期調(diào)研中的敏感隱私場景,設(shè)計了多元化的場景實現(xiàn)方案。網(wǎng)頁端包括上班打卡系統(tǒng)的設(shè)計實現(xiàn),軟件移動端包括雙重認(rèn)證系統(tǒng)、門禁打卡系統(tǒng)、應(yīng)用設(shè)備鎖和刷臉取紙等前期調(diào)研中的敏感隱私場景的設(shè)計實現(xiàn)。
作為服務(wù)器端,后端負(fù)責(zé)連接數(shù)據(jù)庫進(jìn)行數(shù)據(jù)存儲,同時為前端提供接口以幫助其使用。其核心是MAE 圖像復(fù)原模型的實現(xiàn),需要實現(xiàn)MAE 框架對人臉圖像復(fù)原的應(yīng)用,包括利用密鑰生成遮罩位置、圖像預(yù)處理、編碼器解碼器模型結(jié)構(gòu)實現(xiàn)、模型訓(xùn)練等步驟。此外,系統(tǒng)需要通過人臉面部分析,實現(xiàn)人臉識別認(rèn)證、活體檢測和生物密鑰提取功能。
模型的實際效果可以用復(fù)原后圖像和實際圖像之間的相似度進(jìn)行評價。選用的相似度評價指標(biāo)是兩幅圖像之間的結(jié)構(gòu)相似性度量,即結(jié)構(gòu)相似性(Structural Similarity,SSIM)指標(biāo)[11]。該指標(biāo)從圖像中提取三個關(guān)鍵特征,分別為亮度、對比和結(jié)構(gòu)。
給定兩個圖像x 和y,兩張圖像的結(jié)構(gòu)相似性可按照下式求出:
式中μx是x 的平均值,μy是y 的平均值,是x 的方差,是y 的方差,σxy是x 和y 的協(xié)方差,c1和c2是用來維持穩(wěn)定的常數(shù)。
由此可以計算兩張圖片之間的結(jié)構(gòu)相似性。SSIM 值越大,說明圖像失真越小,兩張圖像越相似。所以SSIM 可以作為對復(fù)原圖像效果進(jìn)行評價的一個指標(biāo)。最終,在實驗數(shù)據(jù)上測得SSIM 指標(biāo)的平均值為0.879 0。由結(jié)果可以看出,整個模型對被掩碼圖像的復(fù)原效果較好,只存儲少量人臉圖像塊即實現(xiàn)對整個人臉進(jìn)行識別。
系統(tǒng)通過客戶端在線分析出人臉72 個關(guān)鍵位點,以幫助密鑰的生成。結(jié)合分析出的皮膚特征,可以分析出人臉形狀、眼睛形狀、膚色、人種、皮膚質(zhì)量等生物特征作為密鑰使用,保證同一個用戶人臉的密鑰一致。但是對于不同的提取特征,需要考慮其受角度、光照、時間等因素影響,來計算穩(wěn)定性的差異,通常穩(wěn)定性越強(qiáng)的特征越需要較少的資源去識別。經(jīng)過試驗和測試,最終分析出生物特征的穩(wěn)定性排序策略,如表1 所示。
表1 人臉生物特征穩(wěn)定性排序策略
考慮到實際使用中用戶會戴口罩進(jìn)行人臉識別,本實驗針對遮擋條件下的數(shù)據(jù)進(jìn)行性能的測試與分析。
本系統(tǒng)測得用戶在戴口罩和不戴口罩的情況下的平均注冊時間、平均登錄時間和登錄時的平均SSIM 指標(biāo)如表2 所示。戴口罩注冊和登錄時花費的時間略長于不戴口罩花費的時間,但仍在接受范圍之內(nèi);戴口罩登錄時獲得的SSIM 指標(biāo)會略有下降,但是仍在有效識別的范圍內(nèi)。
表2 戴口罩與不戴口罩情況下各項指標(biāo)對比
此外本實驗還對用戶進(jìn)行登錄時,上傳的人臉圖像在不同遮擋方式和遮擋比例的條件下獲得的平均SSIM 指標(biāo)進(jìn)行測定,結(jié)果如表3 所示。
表3 不同遮擋方式和遮擋比例下的平均SSIM 指標(biāo)
從表3 中可以看出,除上部遮擋以外,其余的遮擋方式在遮擋比例高達(dá)50%的條件下也可以得到比較可靠的比對結(jié)果;而人臉下部被遮擋70%的條件下,比對結(jié)果依然可靠。該測試結(jié)果說明,人臉的眼部及以上的區(qū)域包含了較為重要的信息,如果該區(qū)域被遮擋,即對應(yīng)上部遮擋50%及以上的結(jié)果,則會使得人臉比對的可靠度明顯下降;相反,若該區(qū)域的人臉信息得以保留,則比對效果依然可靠。
現(xiàn)在考慮實際應(yīng)用中的場景,最有可能發(fā)生的面部大比例遮擋的情況應(yīng)當(dāng)是用戶佩戴口罩進(jìn)行認(rèn)證,大致對應(yīng)于下部被遮擋50%的情況。實驗結(jié)果顯示,在該遮擋條件下獲得的對比結(jié)果依然可靠;而用戶面部上部被遮擋超過50%的情況十分少見;而其他常見的遮擋比例超過50%的可能性很小。由此可得,身份認(rèn)證系統(tǒng)在絕大多數(shù)面部遮擋情況下都具有一定的魯棒性,可以保證比對結(jié)果安全可靠。
為了評估最終產(chǎn)品的可靠性,100 名志愿者對開發(fā)的安卓App 中的4 個使用場景進(jìn)行了試用。志愿者的性別和年齡組成數(shù)據(jù)如表4 和表5 所示。
表4 測試者的性別組成
表5 測試者的年齡組成
志愿者分別體驗了雙重認(rèn)證、門禁打卡、設(shè)備解鎖以及刷臉取紙4 個應(yīng)用場景下的注冊和登錄功能。經(jīng)過測試,這100 名實驗者均成功在所有場景下完成了身份的注冊,而注冊后進(jìn)行身份認(rèn)證的測試結(jié)果如表6 所示。
可見,基于系統(tǒng)設(shè)計實現(xiàn)的產(chǎn)品在實際使用中能夠發(fā)揮出較高的可靠性。針對不同年齡性別的人群以及不同的使用場景、周邊環(huán)境下,該產(chǎn)品均能較為出色地發(fā)揮其功能。對于其中出現(xiàn)的極少數(shù)認(rèn)證失敗的情況,分析是用戶在采集人臉圖像時周邊環(huán)境的光照條件不良、鏡頭出現(xiàn)抖動導(dǎo)致圖像較為模糊等原因?qū)е碌?。用戶可以在排除這些因素后再次進(jìn)行注冊或身份認(rèn)證,正常使用本系統(tǒng)。
當(dāng)前時代背景下,個人隱私泄露問題愈加嚴(yán)重,公眾對人臉識別不信任情緒加劇。諸多具有爭議的場合,對人臉信息存在過度采集與非法存儲等問題。目前,人臉識別手段具有唯一性和不可撤銷性,一旦遭到攻擊篡改,就會終生泄露。
針對上述問題,本文設(shè)計了基于MAE 人臉隱私保護(hù)方法的雙重認(rèn)證系統(tǒng)。本系統(tǒng)從去人像化的圖像化信息入手,設(shè)計人臉識別與認(rèn)證的各個環(huán)節(jié),結(jié)合實際的應(yīng)用場景,杜絕隱私泄露的可能,有效保護(hù)用戶人像隱私,讓人臉信息這一私人核心數(shù)據(jù)真正由用戶自己掌控。從安全性角度考慮,本系統(tǒng)采集可遮擋,身份被隱匿,即使被盜取,也很難重建原信息。同時,本系統(tǒng)達(dá)成了輕量高效、準(zhǔn)確率高、公開透明的預(yù)期效果,針對設(shè)備解鎖、上班打卡、微信取紙等具體的隱私敏感場景進(jìn)行了模擬,具有實用的前景。未來,將針對一些已有的人臉識別系統(tǒng)進(jìn)行遷移,提高本系統(tǒng)的可移植性,同時對比遷移前后的系統(tǒng)性能,進(jìn)而提高系統(tǒng)的準(zhǔn)確率和效率。