中圖分類號(hào):D922.1 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-8207(2025)07-0001-16
一、引言
人臉識(shí)別技術(shù)是一項(xiàng)通過對人臉信息的自動(dòng)化處理,實(shí)現(xiàn)驗(yàn)證個(gè)人身份、辨識(shí)特定自然人或者預(yù)測分析個(gè)人特征等目的的一項(xiàng)生物識(shí)別技術(shù)。[1]\"刷臉\"的技術(shù)特征就是模仿人的認(rèn)知模式,其底層技術(shù)邏輯是通過捕獲圖像、人臉檢測、人臉提取和匹配,最終完成驗(yàn)證或識(shí)別。人臉識(shí)別屬于一種身份識(shí)別機(jī)制,是繼實(shí)體身份證后一種新的身份證明方案。在政務(wù)服務(wù)實(shí)踐中,人臉識(shí)別作為一種輔助方式被廣泛運(yùn)用,它降低了識(shí)別相對人身份的成本,有效提升了行政效率,重塑了行政行為過程,已經(jīng)成為一種新型基礎(chǔ)設(shè)施。2018年,國務(wù)院辦公廳通報(bào)了在民生服務(wù)中應(yīng)用刷臉登錄技術(shù)來優(yōu)化營商環(huán)境的典型做法。迄今,各級政府均能夠提供基于人臉識(shí)別技術(shù)核驗(yàn)身份的政務(wù)服務(wù)??梢哉f,通過人臉識(shí)別技術(shù)完成人證核驗(yàn)已成為數(shù)字化政務(wù)服務(wù)的前置條件。人臉識(shí)別技術(shù)以算法和數(shù)據(jù)為基礎(chǔ)支撐,有效提升了政務(wù)服務(wù)便捷性。但有實(shí)驗(yàn)表明,在算法透明度不足的情形下,其對識(shí)別不同種族和民族錯(cuò)誤率較高。2由此可見,人臉識(shí)別技術(shù)在提升政務(wù)便捷性的同時(shí),與之相隨的新型風(fēng)險(xiǎn)也必定沖擊傳統(tǒng)的行政法治模式:一是算法誤差增加了相對人的程序性義務(wù)。在依申請行政中,算法誤差使相對人必須提供大量的其他證明材料來糾正人臉識(shí)別技術(shù)所形成的誤判。在給付行政中,行政相對人對自己身份一般只需要提供初步性證明材料,對證明材料的核驗(yàn)義務(wù)主要由行政機(jī)關(guān)承擔(dān)。如果出現(xiàn)人臉識(shí)別的算法誤差,必然將證明材料的核驗(yàn)義務(wù)轉(zhuǎn)嫁給行政相對人。二是算法誤差影響了相對人的實(shí)體性權(quán)利。一旦出現(xiàn)人臉識(shí)別算法誤差,可能使相對人不能及時(shí)獲取其合法應(yīng)得的服務(wù)、資質(zhì)、權(quán)利、利益和給付。而且,在部門數(shù)據(jù)共享的情形下,一個(gè)行政機(jī)關(guān)的人臉識(shí)別算法誤差形成的數(shù)據(jù)記錄很可能被其他行政機(jī)關(guān)所共享。繼而使誤差借“算法之手\"被進(jìn)一步強(qiáng)化,又因機(jī)器深度學(xué)習(xí)進(jìn)一步惡化。因此,如何對政務(wù)服務(wù)中人臉識(shí)別算法誤差問題加以規(guī)制,并為技術(shù)創(chuàng)新留有余地,成為使用人臉識(shí)別技術(shù)提升政府治理能力必須同步解決的法治難題。筆者著眼于探究政務(wù)服務(wù)中人臉識(shí)別技術(shù)算法誤差的成因,并試圖以全過程法律規(guī)制為視角提出相應(yīng)的規(guī)制思路,以期在無法通過技術(shù)手段完全消解算法誤差的情境下,建立有效的法律機(jī)制及時(shí)預(yù)防其可能的不良后果。
二、人臉識(shí)別技術(shù)的原理、發(fā)展及應(yīng)用
(一)人臉識(shí)別技術(shù)的基本原理
人臉識(shí)別技術(shù)是通過運(yùn)用生物特征圖像捕獲工具將個(gè)人生物特征明確地與他們的索引數(shù)據(jù)進(jìn)行關(guān)聯(lián),進(jìn)而驗(yàn)證身份或識(shí)別個(gè)人的數(shù)字技術(shù)。身份驗(yàn)證指將人臉與已知人臉圖像進(jìn)行匹配并驗(yàn)證確認(rèn)他們的身份;識(shí)別個(gè)人則是一種查詢方法,將人臉圖像與已被確認(rèn)身份圖像進(jìn)行對比。3人臉識(shí)別技術(shù)主要涉及計(jì)算機(jī)視覺、模式識(shí)別等理論,其基本流程包括人臉檢測、人臉對齊、人臉特征提取和人臉匹配。人臉檢測用于在圖像中定位人臉區(qū)域,常用方法有基于Haar特征[4]和AdaBoost[5]的方法、基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的方法等。這些方法可以快速高效地檢測出圖像中的人臉區(qū)域。人臉對齊是將檢測到的人臉區(qū)域進(jìn)行歸一化處理,使面部主要特征點(diǎn)對齊,以減小相同人臉在不同姿態(tài)、光照條件下的變化,常用方法為線性映射等仿射變換。人臉特征提取用于提取人臉圖像的融合特征,經(jīng)典方法有基于PCA的方法[6]、基于LDA的Fisherface方法[7]等。近年來基于深度學(xué)習(xí)的CNN方法也被廣泛用于特征提取。人臉匹配是將輸入人臉圖像與數(shù)據(jù)庫中的人臉進(jìn)行比對,判斷其是否為同一人。匹配方法包括基于距離分類的方法、基于判別模型的方法等。端到端的人臉識(shí)別系統(tǒng)則將上述模塊組合起來,形成輸入人臉圖像、輸出人臉身份的完整流程。深度學(xué)習(xí)方法通過構(gòu)建卷積神經(jīng)網(wǎng)絡(luò),可以完成上述所有過程,實(shí)現(xiàn)端到端人臉識(shí)別。人臉識(shí)別技術(shù)的主要難點(diǎn)在于處理不同姿態(tài)、光照、表情、時(shí)序等變化,以提高識(shí)別準(zhǔn)確率。其中,大量實(shí)際人臉數(shù)據(jù)的訓(xùn)練是提高性能的關(guān)鍵,而努力構(gòu)建可區(qū)分這些變化而保持對同一人穩(wěn)定特征的模型是未來算法發(fā)展的重點(diǎn)方向。
(二)人臉識(shí)別技術(shù)的發(fā)展歷程
人臉識(shí)別技術(shù)經(jīng)歷了從早期基于幾何特征的方法,到基于子空間分析的方法,再到當(dāng)前基于深度學(xué)習(xí)的方法的發(fā)展歷程,識(shí)別準(zhǔn)確率、魯棒性①持續(xù)提高,深度學(xué)習(xí)成為驅(qū)動(dòng)未來發(fā)展的主要技術(shù)。
1.基于幾何特征的人臉識(shí)別方法。早期的人臉識(shí)別技術(shù)主要依賴于人臉圖像的幾何特征,例如眼睛、鼻子、嘴巴等部位的位置、大小、間距等。這種方法首先需要檢測出人臉區(qū)域,然后定位出眼睛、鼻子、嘴巴等關(guān)鍵點(diǎn),再計(jì)算眼晴間距、鼻子大小等幾何特征,將這些特征組合成特征向量,并與數(shù)據(jù)庫中的面部圖像特征進(jìn)行匹配,從而實(shí)現(xiàn)人臉識(shí)別。代表性的方法有Eigenface[8]、Fisherface9]等。這種方法實(shí)現(xiàn)簡單,計(jì)算效率高,但對姿態(tài)、表情、光照等變化比較敏感。基于兒何特征方法的優(yōu)點(diǎn)是計(jì)算量相對較小,識(shí)別速度快,且對姿態(tài)變化不太敏感。但是,其識(shí)別準(zhǔn)確率較低,對表情變化、光照變化敏感度高,魯棒性較差,在實(shí)際應(yīng)用中難以取得理想效果。
2.基于子空間分析的人臉識(shí)別方法。隨著計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)理論的發(fā)展,人臉識(shí)別技術(shù)進(jìn)一步發(fā)展為基于子空間分析的方法。這類方法通常會(huì)構(gòu)建一個(gè)面部圖像的子空間,然后將樣本圖像映射到這個(gè)子空間進(jìn)行特征提取和比較。代表性的子空間分析方法包括主成分分析(PCA)[10]、線性判別分析(LDA)[1]獨(dú)立成分分析(ICA)[12]等。這些方法可以提取面部圖像的全局特征,并可以有效地減小數(shù)據(jù)的維數(shù)。與基于幾何特征的方法相比,子空間方法能夠提供更加緊湊和富有表達(dá)能力的特征描述,從而提高了人臉識(shí)別的魯棒性和準(zhǔn)確率。但這類方法仍然存在一些局限性,如對光照、姿態(tài)、表情等變化敏感,難以處理出現(xiàn)大量遮擋的情況,且需要手動(dòng)設(shè)計(jì)特征提取方法。
3.基于深度學(xué)習(xí)的人臉識(shí)別方法。隨著深度學(xué)習(xí)的發(fā)展,人臉識(shí)別技術(shù)進(jìn)入了基于深度學(xué)習(xí)的新階段。深度學(xué)習(xí)可以自動(dòng)學(xué)習(xí)數(shù)據(jù)的高級特征表示,無需人工設(shè)計(jì)和提取特征。目前,卷積神經(jīng)網(wǎng)絡(luò)(CNN)是人臉識(shí)別中最成功的深度學(xué)習(xí)模型,代表性的CNN模型包括DeepFace[13]、DeepID[14]系列、FaceNet[15]等,利用CNN學(xué)習(xí)面部的深層特征,大幅提升了識(shí)別準(zhǔn)確率,特別是在姿態(tài)、表情、光照等方面的魯棒性,已逐漸成為目前人臉識(shí)別技術(shù)的主流。此外,一些新方法如ArcFace使用加性邊緣特征(Additive Angular Margin Loss)增強(qiáng)了模型在不同面部角度下的判別能力。16]而SphereFace提出了A-Softmax損失函數(shù),可以用不同類別人臉特征向量角度求解人臉識(shí)別問題。[17]后續(xù)基于深度學(xué)習(xí)的人臉識(shí)別方法出現(xiàn)了一些集成和融合模型,例如基于Ensem-bleof Models和Multicolumn Deep Neural Networks的人臉識(shí)別方法,這些集成模型進(jìn)一步優(yōu)化了不同CNN模型的融合效果。基于深度學(xué)習(xí)的方法突破了傳統(tǒng)方法的局限性,準(zhǔn)確率顯著提高,在處理光照、姿態(tài)、表情等方面變化時(shí)也更加具有精準(zhǔn)性和穩(wěn)定性。目前深度學(xué)習(xí)在人臉識(shí)別領(lǐng)域已成為主流,并呈現(xiàn)出巨大的發(fā)展?jié)摿Α?/p>
(三)人臉識(shí)別技術(shù)應(yīng)用中的算法誤差
目前,無論是全國性統(tǒng)一的國家政務(wù)服務(wù)平臺(tái),還是省級政務(wù)平臺(tái),或者各級政府線下的政務(wù)服務(wù)中心,都普遍運(yùn)用人臉識(shí)別來進(jìn)行“人證合一\"的身份核驗(yàn)。2018年,國務(wù)院辦公廳印發(fā)了《關(guān)于部分地方優(yōu)化營商環(huán)境典型做法的通報(bào)》,通報(bào)廣東推出集成民生服務(wù)微信小程序“粵省事”,用戶通過人臉識(shí)別等方式完成實(shí)名認(rèn)證,即可全平臺(tái)辦理居住證、駕駛證等一系列民生服務(wù)。人臉識(shí)別在政務(wù)服務(wù)中的具體場景大致有以下五種:一是全國性綜合政務(wù)服務(wù)平臺(tái),二是全國性專業(yè)類政務(wù)服務(wù)平臺(tái),三是地方性綜合服務(wù)平臺(tái),四是地方政務(wù)服務(wù)中心,五是行政處罰等當(dāng)場辦理的業(yè)務(wù)。其中,前三種均為行政相對人通過網(wǎng)絡(luò)線上辦理,后兩種為行政相對人線下辦理。但無論何種使用場景,數(shù)字化的政務(wù)服務(wù)都以核驗(yàn)相對人身份為前提條件。線上的政務(wù)類app通常需要在注冊后先進(jìn)行身份證的核驗(yàn),才能在具體辦理業(yè)務(wù)時(shí)使用人臉核驗(yàn);還有少部分輔助性業(yè)務(wù)通過單一識(shí)別人臉確認(rèn)相對人身份,如在政務(wù)大廳的排隊(duì)取號(hào)。
人臉識(shí)別技術(shù)的算法誤差在政務(wù)實(shí)踐中最主要的表現(xiàn)形態(tài)有四種:一是受限于相對人所處環(huán)境導(dǎo)致人證核驗(yàn)失敗,進(jìn)而無法正常辦理線上業(yè)務(wù),增加了相對人辦理業(yè)務(wù)的時(shí)間成本;二是數(shù)據(jù)庫中采集的人臉信息存在誤差,導(dǎo)致相對人無論是線上還是線下業(yè)務(wù)都無法正常通過人臉核驗(yàn);三是相對人臉部特征發(fā)生變化,比如濃妝、過敏、整容等,導(dǎo)致識(shí)別失?。籟18四是算法品質(zhì)不高致使相對人識(shí)別錯(cuò)誤,比如將A識(shí)別成B,這會(huì)直接導(dǎo)致部分僅需要人臉核驗(yàn)的業(yè)務(wù)出現(xiàn)錯(cuò)誤。前三種情況主要會(huì)影響到當(dāng)事人業(yè)務(wù)的正常辦理,影響行政效率,而第四種則可能存在安全隱患,例如相對人丟失手機(jī)后,算法誤差致使錯(cuò)誤識(shí)別,相對人權(quán)益保護(hù)的屏障亦隨之瓦解。
三、政務(wù)服務(wù)中人臉識(shí)別流程及誤差成因
(一)政務(wù)服務(wù)中人臉識(shí)別流程
人臉識(shí)別的技術(shù)流程包含人臉檢測、預(yù)處理、特征提取、對比特征四個(gè)主要步驟(見圖1)。其中,對比特征的具體操作過程因具體應(yīng)用而異。如果是人證對比應(yīng)用,則需要分別提取人臉和證件照上的特征進(jìn)行對比;如果不需要提供證件,則需要將人臉特征與國家人口基礎(chǔ)信息庫或者國家網(wǎng)絡(luò)身份認(rèn)證公共服務(wù)信息庫進(jìn)行比對。以下對于對比特征的描述主要聚焦于人證比對。
1.人臉檢測與人臉對齊。人臉檢測是人臉識(shí)別的首要步驟,目的是在輸入圖像中準(zhǔn)確定位出人臉區(qū)域,為后續(xù)識(shí)別環(huán)節(jié)框定基準(zhǔn)。早期常用的人臉檢測方法是Viola-Jones提出的基于Haar特征的級聯(lián)分類器。這種方法對面部姿態(tài)變化魯棒性較差。隨著深度學(xué)習(xí)的發(fā)展,基于CNN的人臉檢測算法成為主流,例如單發(fā)多框(SSD)檢測器直接在卷積特征上進(jìn)行回歸和分類,實(shí)現(xiàn)端到端人臉檢測,對多尺度人臉魯棒性好。FasterR-CNN使用區(qū)域建議網(wǎng)絡(luò)產(chǎn)生人臉提議框,可以檢測到小人臉。19然而,這些兩階段檢測器速度較慢。相比之下,單階段檢測算法在計(jì)算速度與效果實(shí)現(xiàn)方面均取得斐然成績,如基于FPN的RetinaNet。[20]實(shí)際應(yīng)用中,可以根據(jù)場景需要選擇速度優(yōu)先還是效果優(yōu)先,確定人臉檢測器。實(shí)際拍攝的人臉圖像存在不同角度的旋轉(zhuǎn)以及仰角變化等情況,必然對后續(xù)的人臉特征提取產(chǎn)生影響。因此,人臉檢測之后需要進(jìn)行人臉對齊,使每張人臉都保持正向的標(biāo)準(zhǔn)姿態(tài)。常用的對齊方法是檢測面部關(guān)鍵點(diǎn),例如眼睛、鼻子、嘴巴等部位,然后構(gòu)建仿射變換,將人臉對齊到標(biāo)準(zhǔn)姿態(tài)中。同時(shí),采用空間變換網(wǎng)絡(luò)等算法,提高對姿態(tài)變化的魯棒性,使得基于不同角度所提取的人臉特征也具有可比性。由于相對人在使用線上政務(wù)服務(wù)時(shí)所處的人臉識(shí)別環(huán)境千差萬別,人臉對齊成為保證后續(xù)特征提取結(jié)果一致性的重要步驟。
2.人臉特征提取與人臉數(shù)據(jù)庫特征提取。人臉特征提取是人臉識(shí)別系統(tǒng)的核心模塊,目的是從人臉圖像中提取出高維的特征向量,作為這個(gè)人臉的數(shù)字特征表示。人臉特征提取環(huán)節(jié)的效果也直接決定了下游識(shí)別和驗(yàn)證的性能。這個(gè)模塊常采用預(yù)訓(xùn)練的深度CNN模型,輸入人臉圖像,輸出網(wǎng)絡(luò)瓶頸層的特征向量。經(jīng)典的模型包括VGGFace[21]、Inception ResNet[22]等,均可以提取出良好的人臉特征。隨著面向移動(dòng)端設(shè)備的輕量級模型接連發(fā)布,如MobileFaceNet[23],手機(jī)上的應(yīng)用體驗(yàn)變得更加智能高效。相對人可以在手機(jī)上進(jìn)行實(shí)時(shí)人臉識(shí)別,在此過程中提取出的高維特征往往需要進(jìn)行歸一化、L2正則化等后處理,以提升特征的表達(dá)能力和區(qū)分度。該模型一般還需要引入中心學(xué)習(xí)等損失函數(shù)進(jìn)行微調(diào),使得同一人不同圖片的特征更加緊密。人臉特征提取環(huán)節(jié)的效果直接決定了下游識(shí)別和驗(yàn)證的性能。與提取人臉特征類似,從證件照中提取人臉特征也需要一個(gè)CNN模型,輸入人證圖像,獲得證件的數(shù)字特征,其中的關(guān)鍵是網(wǎng)絡(luò)需要自行訓(xùn)練。一種方法是使用人臉識(shí)別模型作為初始化,去掉最后的分類層,然后在有限的人證數(shù)據(jù)上微調(diào)網(wǎng)絡(luò)參數(shù)。也可以僅利用證件人像進(jìn)行訓(xùn)練。此外,還可以使用文字區(qū)域遮擋、對比度增強(qiáng)等預(yù)處理,提升證件特征的識(shí)別能力。當(dāng)然,特征提取需要考慮從嬰兒到老人不同階段的魯棒性,這對于政務(wù)服務(wù)中的人臉核驗(yàn)來說至關(guān)重要。相比于人臉識(shí)別,人證識(shí)別受年齡變化的影響較大。因?yàn)橄鄬θ宿k理政務(wù)服務(wù)的頻次遠(yuǎn)低于其他商業(yè)服務(wù),這就導(dǎo)致人臉數(shù)據(jù)是有限的。為解決人證樣本有限的問題,可以合成不同年齡段的證件圖片進(jìn)行數(shù)據(jù)增強(qiáng)和模型優(yōu)化。
3.特征對比與自動(dòng)化決策。獲得人臉圖像和人證圖片對應(yīng)的特征向量后,需要進(jìn)行特征對比,計(jì)算兩者的相似度或距離,判斷是否為同一人。通過設(shè)定閾值,如果相似度大于某值,或者距離小于某值,則判定人臉和人證匹配,否則為不匹配。同時(shí),還需要設(shè)計(jì)對不同年齡段變化、表情變化等情況的穩(wěn)健算法,防止產(chǎn)生誤匹配。考慮到單次特征對比可能產(chǎn)生誤匹配的情況,重要的人證識(shí)別一般需要系統(tǒng)多次重復(fù)對比。系統(tǒng)可以設(shè)置多個(gè)閾值對應(yīng)不同的通過置信度,同時(shí)需要考慮檢測失敗、特征提取失敗等異常情況的處理,對于輸出錯(cuò)誤及時(shí)提示,避免系統(tǒng)無響應(yīng)。經(jīng)過多次對比與反復(fù)校正,系統(tǒng)得以輸出人證驗(yàn)證的最終結(jié)果。此外,系統(tǒng)部署到實(shí)際應(yīng)用中還需要考慮效率優(yōu)化,例如使用輕量級網(wǎng)絡(luò)加速檢測和特征提取過程,借助模型壓縮來減少存儲(chǔ)和計(jì)算需求,采用并行計(jì)算提速等。如上所述描繪了一個(gè)典型的基于深度學(xué)習(xí)的人臉識(shí)別系統(tǒng)流程。在政務(wù)服務(wù)的實(shí)際應(yīng)用中還需要考慮安全性、倫理規(guī)范等問題。從價(jià)值取向上看,技術(shù)革新無疑有助于貫徹落實(shí)高效便民原則,但也應(yīng)貫徹合法性原則和比例原則來防范算法誤差給相對人帶來的利益損害。
(二)政務(wù)服務(wù)中人臉核驗(yàn)誤差成因
政務(wù)服務(wù)中的人臉識(shí)別是算法系統(tǒng)與作為行政相對人的公民“人機(jī)互動(dòng)\"的技術(shù)應(yīng)用。其中,算法系統(tǒng)是數(shù)據(jù)的處理方,行政相對人是數(shù)據(jù)的輸入方,人臉核驗(yàn)誤差的成因也隱匿于雙方的運(yùn)行環(huán)境、系統(tǒng)和流程之中。
1.算法系統(tǒng)的局限性。一方面,模型與數(shù)據(jù)限制。深度學(xué)習(xí)模型的目標(biāo)是能夠?qū)τ?xùn)練數(shù)據(jù)進(jìn)行擬合,并能夠很好地泛化到新的測試數(shù)據(jù)。為達(dá)致目標(biāo),選擇合適的模型復(fù)雜度顯得尤為重要。而衡量深度學(xué)習(xí)模型性能的指標(biāo)則是誤差(Error),誤差是由偏差(Bias)、方差(Variance)和噪聲(Noise)三部分相加組成。[24]其中,偏差衡量模型擬合訓(xùn)練數(shù)據(jù)的能力,反映的是所有采樣得到的大小相同的訓(xùn)練集訓(xùn)練出的所有模型的輸出平均值和真實(shí)模型輸出之間的偏差,即模型本身的精確度。方差描述的是預(yù)測值的變化范圍,也就是離其期望值的距離,其反映的是模型每一次輸出結(jié)果與模型輸出期望之間的誤差,即模型的穩(wěn)定性。噪聲描述了在當(dāng)前任務(wù)上任何學(xué)習(xí)算法所能達(dá)到的期望泛化誤差的下界,即刻畫了學(xué)習(xí)問題本身的難度。模型方差與偏差之間的關(guān)系可以用射靶的例子描述(見圖2)。其中,靶點(diǎn)是模型對于每一個(gè)樣本的預(yù)測結(jié)果,靶心位置代表預(yù)測結(jié)果相對正確,低偏差、低方差結(jié)果是模型訓(xùn)練的理想化最佳情況。
復(fù)雜模型擁有更強(qiáng)大的表達(dá)能力,可以學(xué)習(xí)并記憶訓(xùn)練數(shù)據(jù)中的更多特征組合和細(xì)微規(guī)律,對訓(xùn)練集的擬合程度更好。模型復(fù)雜度越高,擬合訓(xùn)練數(shù)據(jù)的能力就越強(qiáng),訓(xùn)練誤差通常會(huì)越低。但過于復(fù)雜的模型雖然能使訓(xùn)練誤差降低,卻可能導(dǎo)致過擬合,使驗(yàn)證誤差增大。隨著模型復(fù)雜度的提高,通常訓(xùn)練誤差會(huì)先快速下降,而驗(yàn)證誤差先下降后上升,形成一個(gè)U形曲線,出現(xiàn)一個(gè)最低點(diǎn)。繼續(xù)提高復(fù)雜度會(huì)使模型產(chǎn)生過擬合,驗(yàn)證誤差上升。模型誤差與模型復(fù)雜度的關(guān)系見圖3。
參數(shù)量和計(jì)算量較大的模型在上萬甚至上百萬級的人臉訓(xùn)練集模型上表現(xiàn)出色,在數(shù)億計(jì)訪問量的人臉識(shí)別需求中反而可能表現(xiàn)不佳,這是因?yàn)檫^于復(fù)雜的模型會(huì)更專注于訓(xùn)練集中人臉的特有特征,而忽視實(shí)際場景中所有人臉的共性特征。當(dāng)前人工智能領(lǐng)域已經(jīng)從理論上證明一個(gè)模型中的低偏差與低方差結(jié)果是一對矛盾項(xiàng),即一個(gè)模型無法同時(shí)達(dá)到低偏差和低方差。25]盡管可以采用正則化[26]、早停[27]等策略來防止過擬合,但在實(shí)際操作中模型一般傾向于朝著低偏差、高方差的方向進(jìn)行優(yōu)化,這會(huì)使得一部分樣本的預(yù)測結(jié)果不正確。同時(shí),在政務(wù)服務(wù)中行政相對人使用頻次較低,使算法訓(xùn)練不充分,更會(huì)嚴(yán)重影響算法正確率。
另一方面,參數(shù)估計(jì)誤差。參數(shù)估計(jì)誤差是指在深度學(xué)習(xí)模型訓(xùn)練過程中,通過有限的訓(xùn)練數(shù)據(jù)估計(jì)出的模型參數(shù)(如神經(jīng)網(wǎng)絡(luò)中的權(quán)重和偏置)與其真實(shí)最優(yōu)值之間的偏差。參數(shù)估計(jì)誤差的消減需要一個(gè)持續(xù)不斷、漸進(jìn)優(yōu)化的過程,當(dāng)前的深度學(xué)習(xí)模型還遠(yuǎn)未達(dá)到全局最優(yōu)的效果。出現(xiàn)參數(shù)估計(jì)誤差的主要原因有以下三點(diǎn):第一,訓(xùn)練數(shù)據(jù)有限。目前能夠收集到的訓(xùn)練數(shù)據(jù)只是樣本空間中極小一部分,這些有限的數(shù)據(jù)在規(guī)模上和結(jié)構(gòu)上都無法完全反映真實(shí)數(shù)據(jù)分布的全貌。在圖像分類模型中,最多只能收集到幾百萬張圖像,而世界上可能的圖像數(shù)量接近無窮。這些訓(xùn)練數(shù)據(jù)不可能覆蓋模型在實(shí)際使用中遇到的各種情況,特別是政務(wù)服務(wù)中相對人可能所處的環(huán)境幾乎是無法窮盡的。可見,模型通過有限數(shù)據(jù)訓(xùn)練出來的參數(shù)難免會(huì)存在誤差,當(dāng)遇到未覆蓋的新數(shù)據(jù)時(shí)就可能產(chǎn)生錯(cuò)誤預(yù)測。第二,模型容量有限。深度學(xué)習(xí)模型也有表達(dá)能力的上限,不能任意逼近極其復(fù)雜的真實(shí)映射函數(shù)。28例如計(jì)算資源和時(shí)間限制了神經(jīng)網(wǎng)絡(luò)的層數(shù)和參數(shù)量,導(dǎo)致模型對高度非線性函數(shù)建模的能力受到約束。這導(dǎo)致模型在擬合訓(xùn)練數(shù)據(jù)時(shí)就可能已經(jīng)達(dá)到瓶頸,難以再提高精度,所以最終參數(shù)估計(jì)會(huì)存在偏差。模型本身的結(jié)構(gòu)限制了其表示能力,這是導(dǎo)致參數(shù)誤差的重要原因。第三,優(yōu)化困難。訓(xùn)練復(fù)雜的深度網(wǎng)絡(luò)是一個(gè)非凸優(yōu)化問題,尋找全局最優(yōu)解計(jì)算上不可實(shí)現(xiàn)。[29]目前人工智能領(lǐng)域只能用SGD[30]、Adam[31]等優(yōu)化方法盡可能找到接近全局最優(yōu)的局部最優(yōu)解,這就導(dǎo)致最后模型收斂到的解可能會(huì)距離全局最優(yōu)解很遠(yuǎn),參數(shù)值存在偏差。另外,損失函數(shù)設(shè)置不當(dāng)也可能導(dǎo)致模型優(yōu)化困難。如果損失函數(shù)對參數(shù)空間非光滑,則會(huì)產(chǎn)生很多局部最優(yōu)點(diǎn),增加找到全局最優(yōu)的難度,最終導(dǎo)致參數(shù)估計(jì)誤差。
2.行政相對人的局限性。一方面,輸入場景的隨機(jī)性。由于每個(gè)人進(jìn)行人臉識(shí)別的使用場景、時(shí)間、地點(diǎn)等多種多樣,政務(wù)系統(tǒng)輸入的人臉圖片必然存在差異。在理想情況下,輸入的人臉圖片應(yīng)該面部無遮擋、光線均勻充足、強(qiáng)度適中、圖片背景簡單。但受限于環(huán)境與個(gè)人因素,行政相對人在實(shí)際使用過程中的圖像質(zhì)量通常難以達(dá)到理想水平,最常見的情況就是光照角度較大或者光照強(qiáng)度過強(qiáng)。主要原因在于,人臉是非剛性的,容易受到光照、姿態(tài)、表情等因素的影響。例如,光照問題一直是人臉識(shí)別領(lǐng)域的一個(gè)重大的難點(diǎn)問題,也是人臉識(shí)別系統(tǒng)進(jìn)行大規(guī)模推廣的一個(gè)阻礙。[32]同一個(gè)人在不同的光照情況下得到的人臉圖像甚至比不同人在相同光照條件下的差異還要大。
另一方面,安全攻擊威脅。谷歌大腦新近的研究表明,任何機(jī)器學(xué)習(xí)分類器都可能被欺騙,給出不正確的預(yù)測。[33]這意味著盡管當(dāng)前深度學(xué)習(xí)模型在很多實(shí)際生活場景中發(fā)揮了重要的作用,但并不意味著它具有完全理性。相反,越是性能優(yōu)異的模型往往對擾動(dòng)越敏感,也更易被一些人為設(shè)計(jì)的擾動(dòng)所欺騙。這種擾動(dòng)一般像素值范圍較小,無法被人眼察覺,不影響人類對于原有目標(biāo)類型的理解。但是,這種擾動(dòng)具有一定的形狀特征,并與圖像內(nèi)目標(biāo)類型相關(guān),對深度學(xué)習(xí)模型的判斷影響很大。比如給人臉施加不遮蓋人臉特征的面具或者固定形狀的眼鏡等配件(見圖4)。
根據(jù)是否預(yù)先獲知分類模型的內(nèi)在參數(shù),現(xiàn)有的對抗攻擊技術(shù)根據(jù)是否預(yù)先獲知分類模型的內(nèi)在參數(shù)分為白盒攻擊與黑盒攻擊。白盒攻擊利用已知的網(wǎng)絡(luò)結(jié)構(gòu)、參數(shù)以及訓(xùn)練數(shù)據(jù)集等信息對已有模型進(jìn)行針對性攻擊,其攻擊效率一般更高;黑盒攻擊是指在不提前獲知目標(biāo)模型的任何信息參數(shù)下進(jìn)行的攻擊,具有泛化性,可對多個(gè)模型產(chǎn)生有效的攻擊。例如,2016年Sharif等人提出鏡框?qū)构舴椒ā?4]該方法由于佩戴了對抗眼鏡,被攻擊的模型會(huì)將上下兩張圖誤判為同一人(見圖5)。因此,政務(wù)系統(tǒng)應(yīng)用中的人臉識(shí)別算法雖然對于個(gè)人用戶而言不能直接訪問,但由于當(dāng)前存在黑盒攻擊方法,其人臉識(shí)別模型本身依然存在被攻擊而導(dǎo)致識(shí)別錯(cuò)誤的風(fēng)險(xiǎn)。
四、建立全過程人臉識(shí)別算法誤差補(bǔ)正的法律機(jī)制
我國現(xiàn)有的關(guān)于人臉識(shí)別技術(shù)的法律規(guī)范,如《中華人民共和國個(gè)人信息保護(hù)法》以下簡稱《個(gè)人信息保護(hù)法》)、《關(guān)于審理使用人臉識(shí)別技術(shù)處理個(gè)人信息相關(guān)民事案件適用法律若干問題的規(guī)定》《網(wǎng)絡(luò)數(shù)據(jù)安全管理?xiàng)l例(征求意見稿)》等,主要聚焦于事前的風(fēng)險(xiǎn)防控。2023年國家網(wǎng)信辦發(fā)布的《人臉識(shí)別技術(shù)應(yīng)用安全管理規(guī)定(試行)(征求意見稿)》(以下簡稱《試行征求意見稿》)對使用人臉識(shí)別技術(shù)的相關(guān)規(guī)定作出進(jìn)一步細(xì)化,但仍缺乏事中對算法誤差監(jiān)控的有力手段,以及事后對權(quán)利救濟(jì)的有效渠道,使技術(shù)的表達(dá)不可避免地游離出法治的軌道。為此,建立涵蓋全過程的人臉識(shí)別算法誤差補(bǔ)正法律機(jī)制,將成為推動(dòng)技術(shù)健康發(fā)展、消弭隱私風(fēng)險(xiǎn)的關(guān)鍵所在。
(一)建立事前的算法誤差防范機(jī)制
1.建立對生物識(shí)別技術(shù)方案限制性使用制度。目前數(shù)字化已覆蓋絕大多數(shù)政務(wù)服務(wù)中業(yè)務(wù),比如辦事排隊(duì)取號(hào),甚至是24小時(shí)辦理區(qū)的門禁都需要使用人臉核驗(yàn)。在目前算法誤差仍客觀存在的情況下,如此廣泛的算法應(yīng)用雖然可以給公民帶來便捷,卻嚴(yán)重架空甚至可能侵犯了少數(shù)公民的正當(dāng)權(quán)利。相較之下,人工審核的可靠性和準(zhǔn)確性在短期內(nèi)仍然是人臉識(shí)別技術(shù)所無法替代的優(yōu)勢:一是身份識(shí)別的精確性。通過多種方式,如核對身份證件、詢問個(gè)人信息等,人工審核能夠更加精確地驗(yàn)證個(gè)人身份。二是公民隱私的保護(hù)。人工審核還能根據(jù)具體情況靈活處理各種問題,例如處理面部識(shí)別失敗的情況或解決個(gè)人隱私問題。三是弱勢群體的關(guān)懷。政務(wù)服務(wù)的宗旨是為每一位需要服務(wù)的群眾提供便利。人工審核身份能夠提供精準(zhǔn)有效的適老、適殘、適動(dòng)服務(wù)??傊瑧?yīng)該充分認(rèn)識(shí)到人臉識(shí)別技術(shù)在政務(wù)服務(wù)中的局限性,更加重視優(yōu)化人工審核的流程,更好發(fā)揮人工審核的作用。因事而異、因人而異、應(yīng)情而變地將二者妥善結(jié)合,才可能為人民群眾提供更加高效、可靠的政務(wù)服務(wù)。
因此,出于對相對人重大利益的審慎考量,應(yīng)當(dāng)建立對生物識(shí)別方案限制性使用制度。該制度主要貫徹兩個(gè)原則:一是重大利益處分人工審核身份原則。對于涉及相對人重大利益處分的,應(yīng)當(dāng)堅(jiān)持人工審核個(gè)人身份,確保身份核驗(yàn)的準(zhǔn)確性以保障相對人的正當(dāng)權(quán)益。二是非生物特征識(shí)別技術(shù)方案同等條件優(yōu)先原則。在非生物特征識(shí)別技術(shù)方案能達(dá)到同等業(yè)務(wù)目的時(shí),應(yīng)該優(yōu)先使用非生物特征技術(shù)方案。通過限制范圍和保留非生物特征識(shí)別技術(shù)方案能夠有效降低相對人權(quán)益損失的可能性,同時(shí)也兼顧了人臉識(shí)別技術(shù)所帶來的行政效率提升?!对囆姓髑笠庖姼濉芬呀?jīng)比較明確地展現(xiàn)了對生物識(shí)別技術(shù)方案進(jìn)行限制性使用的立法意圖。該稿第四條規(guī)定:“實(shí)現(xiàn)相同目的或者達(dá)到同等業(yè)務(wù)要求,存在其他非生物特征識(shí)別技術(shù)方案的,應(yīng)當(dāng)優(yōu)先選擇非生物特征識(shí)別技術(shù)方案。\"同時(shí),第十二條更是禁止性地規(guī)定了“涉及社會(huì)救助、不動(dòng)產(chǎn)處分等個(gè)人重大利益的,不得使用人臉識(shí)別技術(shù)替代人工審核個(gè)人身份,人臉識(shí)別技術(shù)可以作為驗(yàn)證個(gè)人身份的輔助手段”。
2.建立國家權(quán)威數(shù)據(jù)庫優(yōu)先使用制度?!对囆姓髑笠庖姼濉返谒臈l第二款明確規(guī)定:“使用人臉識(shí)別技術(shù)驗(yàn)證個(gè)人身份、辨識(shí)特定自然人的,鼓勵(lì)優(yōu)先使用國家人口基礎(chǔ)信息庫、國家網(wǎng)絡(luò)身份認(rèn)證公共服務(wù)等權(quán)威渠道?!睓?quán)威的數(shù)據(jù)庫是有效解決數(shù)據(jù)限制的途徑之一,也是算法進(jìn)一步深度學(xué)習(xí)的前置條件。優(yōu)先使用權(quán)威數(shù)據(jù)庫能夠有效提高識(shí)別準(zhǔn)確率。國家權(quán)威數(shù)據(jù)庫優(yōu)勢明顯:一是圖像質(zhì)量高、樣本量大,可以讓算法獲得足夠的優(yōu)質(zhì)訓(xùn)練數(shù)據(jù),提升模型識(shí)別效果;二是來源可靠,數(shù)據(jù)真實(shí)有效,有助于減少算法錯(cuò)誤識(shí)別率;三是有明確的使用規(guī)范,能夠保證人臉數(shù)據(jù)合法合規(guī)使用,防止數(shù)據(jù)濫用;四是優(yōu)先調(diào)用權(quán)威庫可以降低企業(yè)自建庫的需求,簡化算法準(zhǔn)入條件。進(jìn)言之,權(quán)威數(shù)據(jù)庫服務(wù)化可以推動(dòng)企業(yè)與數(shù)據(jù)庫提供方形成協(xié)作共建的良性生態(tài)。
因此,應(yīng)當(dāng)通過相關(guān)立法促進(jìn)政府、企業(yè)、監(jiān)管機(jī)構(gòu)等多方協(xié)作,進(jìn)一步加強(qiáng)對權(quán)威數(shù)據(jù)庫的支持和完善。一是鼓勵(lì)和支持權(quán)威數(shù)據(jù)庫向社會(huì)開放訪問服務(wù),提供豐富的人臉識(shí)別算法培訓(xùn)和驗(yàn)證數(shù)據(jù)集。將權(quán)威數(shù)據(jù)庫開放和共享可以幫助研究者更好地開發(fā)和優(yōu)化算法,從而提高人臉識(shí)別的效果。二是建立數(shù)據(jù)共享和調(diào)用授權(quán)制度,方便企業(yè)合規(guī)獲取和使用權(quán)威數(shù)據(jù)庫。不僅需要共享官方的權(quán)威數(shù)據(jù)庫,還應(yīng)該鼓勵(lì)研究者、企業(yè)和其他機(jī)構(gòu)共享他們的數(shù)據(jù)集,從而形成一個(gè)更大的、更全面的數(shù)據(jù)集。此外,研究建立權(quán)威人臉庫與其他生物識(shí)別數(shù)據(jù)庫的融合機(jī)制,構(gòu)建統(tǒng)一的身份驗(yàn)證平臺(tái)。三是推動(dòng)權(quán)威數(shù)據(jù)庫不斷完善。應(yīng)當(dāng)繼續(xù)擴(kuò)充權(quán)威數(shù)據(jù)庫樣本量,提高識(shí)別覆蓋面。尤其要增加特殊人群樣本,及時(shí)更新權(quán)威數(shù)據(jù)庫,保證數(shù)據(jù)同步到最新,避免因時(shí)間差導(dǎo)致的識(shí)別錯(cuò)誤。四是制定算法評測規(guī)范?;跈?quán)威數(shù)據(jù)庫設(shè)立算法準(zhǔn)入條件,明確算法的性能指標(biāo)和評估標(biāo)準(zhǔn),只有達(dá)標(biāo)的算法才被允許調(diào)用權(quán)威數(shù)據(jù)庫。五是建立嚴(yán)格的數(shù)據(jù)安全保護(hù)制度,防止數(shù)據(jù)庫泄露導(dǎo)致的算法濫用風(fēng)險(xiǎn)。在收集和分享數(shù)據(jù)時(shí),必須嚴(yán)格遵守隱私保護(hù)的原則,確保個(gè)人信息不被濫用??梢钥紤]對數(shù)據(jù)進(jìn)行匿名化處理,或使用加密技術(shù)來保護(hù)數(shù)據(jù)的安全。同時(shí),監(jiān)管和第三方機(jī)構(gòu)要加強(qiáng)過程監(jiān)測,確保算法開發(fā)企業(yè)安全有效調(diào)用權(quán)威數(shù)據(jù)庫。
(二)建立事中的防止誤差擴(kuò)大機(jī)制
1.建立替代性路徑并行機(jī)制。在法治政府建設(shè)與優(yōu)化營商環(huán)境的大背景下,為了更好地保障相對人權(quán)利和更高效地提供公共服務(wù),需要提供更加高效的替代性路徑。替代性路徑并行機(jī)制是指不將人臉識(shí)別作為身份核驗(yàn)的唯一方案,而必須提供多種并行身份識(shí)別方案供相對人選擇。該機(jī)制不僅賦予相對人業(yè)務(wù)辦理路徑選擇的自由,保證相對人享有“免受算法支配權(quán)”,而且對于及時(shí)化解人臉識(shí)別算法誤差至關(guān)重要。雖然《試行征求意見稿》已經(jīng)明確規(guī)定了應(yīng)保留替代性路徑,即生物識(shí)別信息不能作為唯一的身份識(shí)別方案,但目前這兩部法規(guī)都尚未施行。在實(shí)踐中,部分線下服務(wù)網(wǎng)點(diǎn)為了節(jié)省人力,只設(shè)立了業(yè)務(wù)咨詢窗口,而不再設(shè)立業(yè)務(wù)辦理窗口。這就導(dǎo)致當(dāng)相對人在線上身份核驗(yàn)失敗時(shí),即使他們選擇前往線下網(wǎng)點(diǎn),仍然可能面臨無法辦理業(yè)務(wù)或者被“踢皮球\"的情況。這種做法無疑給相對人帶來了極大的不便,也損害了他們的合法權(quán)益。因此,建立替代性途徑并行機(jī)制非常必要。具體而言,替代性路徑并行機(jī)制一則指向人工方式,二則指向線上視頻。原有人工方式可以作為替代性路徑提供給相對人。但是,這種方式往往受制于時(shí)空限制,效率低下,無法滿足大規(guī)模、快速響應(yīng)的需求?,F(xiàn)有技術(shù)完全有能力支持線上視頻接入等方案來實(shí)現(xiàn)身份核驗(yàn)。通過線上視頻接入的方式,可以讓人工核驗(yàn)人員遠(yuǎn)程完成人臉核驗(yàn)工作。這種方式不僅可以避免因線下服務(wù)網(wǎng)點(diǎn)不足或排隊(duì)等待等問題而浪費(fèi)時(shí)間,而且可以隨時(shí)隨地提供服務(wù),極大地提高服務(wù)質(zhì)量和服務(wù)效率。
2.健全算法誤差更正機(jī)制。歐盟通用數(shù)據(jù)保護(hù)條例(GDPR)第十六條規(guī)定了信息主體的“更正權(quán)”,允許信息主體在不違反處理目的的前提下,完善或更正不充分的個(gè)人信息。[35]《中華人民共和國網(wǎng)絡(luò)安全法》第四十三條最先規(guī)定了在網(wǎng)絡(luò)運(yùn)營者收集、存儲(chǔ)的其個(gè)人信息有錯(cuò)誤等情形中,個(gè)人有權(quán)要求網(wǎng)絡(luò)運(yùn)營者予以更正。之后,《中華人民共和國民法典》也明確規(guī)定發(fā)現(xiàn)信息有錯(cuò)誤的,有權(quán)提出異議并請求及時(shí)采取更正等必要措施?!秱€(gè)人信息保護(hù)法》第四十六條規(guī)定:“個(gè)人發(fā)現(xiàn)其個(gè)人信息不準(zhǔn)確或者不完整的,有權(quán)請求個(gè)人信息處理者更正、補(bǔ)充。個(gè)人請求更正、補(bǔ)充其個(gè)人信息的,個(gè)人信息處理者應(yīng)當(dāng)對其個(gè)人信息予以核實(shí),并及時(shí)更正、補(bǔ)充?!庇纱丝梢?,在現(xiàn)有法律框架下,“更正權(quán)\"主要是針對底層數(shù)據(jù)或個(gè)人信息進(jìn)行更正,而無法直接更正算法的邏輯錯(cuò)誤。然而,隨著技術(shù)的發(fā)展,算法錯(cuò)誤或算法歧視等問題逐漸凸顯,這些問題可能對相對人的權(quán)利產(chǎn)生更嚴(yán)重影響。因此,僅僅建立信息更正機(jī)制是遠(yuǎn)遠(yuǎn)不夠的,還需要進(jìn)一步健全算法誤差更正機(jī)制。在事中建立算法誤差更正機(jī)制,能夠及時(shí)地解決相對人在業(yè)務(wù)辦理中的困境。在業(yè)務(wù)辦理過程中,如果發(fā)現(xiàn)個(gè)人信息或算法存在錯(cuò)誤,相對人可以隨時(shí)提出對信息進(jìn)行更正或?qū)λ惴ㄟM(jìn)行糾偏的請求,從而大幅壓縮因算法誤差導(dǎo)致的時(shí)間成本,保障相對人順利地完成后續(xù)業(yè)務(wù)辦理?!案龣?quán)”的充分行使不僅能夠糾正個(gè)人信息的錯(cuò)誤,還能夠確保算法的準(zhǔn)確性和公正性。在算法出現(xiàn)錯(cuò)誤的情況下,替代性路徑雖然可以解決一時(shí)的誤差,但若要根本性地解決問題,更正個(gè)人信息和算法是必不可少的。
(三)建立事后的主動(dòng)補(bǔ)正誤差機(jī)制
1.明確行政機(jī)關(guān)是對外承擔(dān)責(zé)任的唯一主體。當(dāng)自動(dòng)化應(yīng)用失靈損害當(dāng)事人利益時(shí),自動(dòng)化應(yīng)用的使用方未必是唯一應(yīng)當(dāng)承擔(dān)責(zé)任的主體,技術(shù)開發(fā)方、信息處理方乃至看似中立的平臺(tái)皆有可能是潛在的責(zé)任方。36]在人臉識(shí)別算法誤差侵權(quán)行為中,行政機(jī)關(guān)、行政相對人、軟件開發(fā)方、圖像處理方等任何一方或多方都可能是引發(fā)侵權(quán)行為的主體。大部分情況下,由算法誤差引發(fā)的侵權(quán)責(zé)任是模糊不清的,甚至可能陷入無法歸責(zé)與救濟(jì)的困境。如果單純依賴民事法律規(guī)范,相對人將面臨難以獲得有效救濟(jì)的窘境,救濟(jì)的時(shí)效性也會(huì)大打折扣。
在對人臉識(shí)別算法誤差侵權(quán)行為歸責(zé)時(shí),主要有以下四種情況:一是相對人過錯(cuò)致使侵權(quán)行為發(fā)生。例如,相對人冒用他人人臉信息惡意騙取行政許可。二是軟件開發(fā)方、圖像處理方、服務(wù)提供方等過錯(cuò)致使侵權(quán)行為發(fā)生。例如,人臉識(shí)別技術(shù)提供方為謀取不正當(dāng)利益惡意篡改算法,致使侵權(quán)行為發(fā)生。三是行政機(jī)關(guān)過錯(cuò)致使侵權(quán)行為發(fā)生。例如,行政機(jī)關(guān)并未認(rèn)真核對人臉核驗(yàn)結(jié)果而直接進(jìn)行行政處罰。四是各方都無過錯(cuò),但客觀上發(fā)生了算法誤差致使侵權(quán)。在現(xiàn)有的法律規(guī)范中,前三種情況已經(jīng)能夠通過行政、民事、刑事等多種手段進(jìn)行處理并給予受害者及時(shí)有效的救濟(jì)。第四種情況目前歸責(zé)機(jī)制尚不明晰,而實(shí)踐中算法誤差所致侵權(quán)大都是第四種情況。在多方都無過錯(cuò)的情況下,行政機(jī)關(guān)作為政務(wù)服務(wù)的提供方應(yīng)當(dāng)優(yōu)先向行政相對人承擔(dān)責(zé)任,或是及時(shí)補(bǔ)正行政行為,確保相對人的權(quán)利得到及時(shí)有效的救濟(jì),避免在歸責(zé)問題上出現(xiàn)推諉扯皮的情況。而行政機(jī)關(guān)與軟件開發(fā)方、圖像處理方、服務(wù)提供方之間的責(zé)任則需行政機(jī)關(guān)擔(dān)責(zé)之后重新厘定,這些主體之間構(gòu)成非真正的連帶責(zé)任。即待行政機(jī)關(guān)向行政相對人承擔(dān)了責(zé)任后,依據(jù)其服務(wù)合同的約定或者法律的強(qiáng)制性規(guī)定來對其他責(zé)任主體進(jìn)行追償或者追責(zé)。之所以這樣設(shè)計(jì)歸責(zé)機(jī)制,主要是因?yàn)檎鳛楣卜?wù)的提供者,負(fù)有向相對人提供公共服務(wù)的義務(wù)。人臉識(shí)別技術(shù)在政務(wù)應(yīng)用中極大地提升了身份驗(yàn)證的效率,有效降低了行政成本,但政府在享受技術(shù)便利的同時(shí)也需要承擔(dān)算法誤差所帶來的風(fēng)險(xiǎn)。既然政府選擇了人臉識(shí)別技術(shù)作為提供服務(wù)時(shí)驗(yàn)證相對人身份的一種方式,就應(yīng)當(dāng)負(fù)擔(dān)起因算法客觀誤差導(dǎo)致侵權(quán)的責(zé)任。
2.建立誤差主動(dòng)補(bǔ)正機(jī)制。合理的救濟(jì)路徑為保障相對人合法權(quán)益砌筑起最后一道防線。事后的救濟(jì)與補(bǔ)正亦是目前維護(hù)行政相對人權(quán)益的主要方案。在現(xiàn)有的救濟(jì)機(jī)制中,無論是依據(jù)《中華人民共和國行政訴訟法》還是新修訂的《中華人民共和國行政復(fù)議法》,人臉核驗(yàn)誤差導(dǎo)致的行政行為錯(cuò)誤大多是可以被提起復(fù)議或訴訟的。然而,現(xiàn)有的行政復(fù)議和行政訴訟的救濟(jì)模式仍然存在一定滯后性,無法及時(shí)為相對人提供充分的救濟(jì)。因此,算法誤差發(fā)生后行政機(jī)關(guān)的主動(dòng)補(bǔ)正顯得尤為重要,包括及時(shí)更正信息與算法,以及糾正錯(cuò)誤的行政行為。所謂誤差主動(dòng)補(bǔ)正機(jī)制,是指涉及人臉核驗(yàn)誤差的問題,行政機(jī)關(guān)都應(yīng)該在接到申訴、復(fù)議或被訴后及時(shí)對原行政行為進(jìn)行審查;若確有錯(cuò)誤,應(yīng)當(dāng)主動(dòng)及時(shí)補(bǔ)正。這是誤差結(jié)果已成既定事實(shí)后的應(yīng)有之措,也是最大程度降低相對人損失的必要之舉。除了申訴、復(fù)議或訴訟外,還應(yīng)當(dāng)為相對人提供簡便易行的誤差核查申請程序,例如撥打12345熱線等。行政機(jī)關(guān)在接到誤差核查申請后,應(yīng)當(dāng)及時(shí)主動(dòng)地進(jìn)行核查,確保原行政行為的效力沒有瑕疵。此外,一旦確認(rèn)人臉核驗(yàn)的錯(cuò)誤,則應(yīng)當(dāng)及時(shí)通知服務(wù)提供方,更正信息及算法。若事后依舊不能及時(shí)更正數(shù)據(jù)庫信息以及算法誤差,相對人可能會(huì)繼續(xù)陷入無法證明自身身份的困境。
結(jié)語
在“人機(jī)互動(dòng)”的過程中,受算法的復(fù)雜性與不透明性等因素影響,人類往往難以識(shí)別隱藏于算法之中的風(fēng)險(xiǎn)。目前,政務(wù)服務(wù)中使用的人臉識(shí)別算法受模型與數(shù)據(jù)限制、參數(shù)估計(jì)誤差、輸入場景的隨機(jī)性以及安全攻擊威脅等因素影響,客觀上存在著短期內(nèi)無法通過技術(shù)手段消解的誤差。這無疑將進(jìn)一步加劇行政相對人面對算法時(shí)的弱勢地位,亟需重塑法律機(jī)制來建構(gòu)良性的“技法互動(dòng)”。全過程人臉識(shí)別算法誤差法律規(guī)制路徑旨在穿透算法的不透明性,消除算法運(yùn)行的灰色區(qū)域,構(gòu)建一種人機(jī)平等交互的范式。在該范式中,切實(shí)貫徹“平等武裝”①思想來對行政相對人進(jìn)行法律賦權(quán)并配以相應(yīng)的機(jī)制建設(shè),改善行政相對人在與算法互動(dòng)中的弱勢地位,以此引導(dǎo)算法向善、算法便民和算法為民。[37][38]惟其如此,方能始終堅(jiān)持\"以人民為中心\"的價(jià)值導(dǎo)向,促進(jìn)人臉識(shí)別技術(shù)向著安全可靠、高效便民的方向良性發(fā)展。
【參考文獻(xiàn)】
[1]郭鋒,陳龍業(yè),賈玉慧,等.《關(guān)于審理使用人臉識(shí)別技術(shù)處理個(gè)人信息相關(guān)民事案件適用法律若干問題的規(guī) 定》的理解與適用[J].人民司法,2021(25):37-42.
[2]趙慧津.人臉識(shí)別技術(shù)應(yīng)用的行政法規(guī)制研究[D].濟(jì)南:山東大學(xué)碩士學(xué)位論文,2021:20.
[3](英)伊恩·伯爾勒.人臉識(shí)別:看得見的隱私[M].趙精武,唐林垚,譯.上海:上海人民出版社,2022::11.
[4]PaulA.Violaamp; Michael J.Jones.Rapid Object Detection Usinga Boosted Cascade of Simple Features,in Proceedings of the 2OOl IEEE Computer Society Conference on Computer Vision and Patern Recognition, IEEE,2001,Vol.1,p.I-I.
[5]Xiangxin Zhu,Deva Ramanan.Face Detection,Pose Estimation,andLandmark LocalizationintheWild,in 2012IEEE Conference on Computer Vision and Pattern Recognition,IEEE,p.2879-2886.
[6][8]Mathew Turk,Alex P.Pentland.Face Recognition Using Eigenfaces,in Proceedings of the 1991 IEEE Computer Society Conference on Computer Vision and Pattern Recognition,IEEE,p.586-587.
[7][9]PeterN.Belhumeur,Joao P.Hespanha amp;DavidKriegman.Eigenfacesvs.Fisherfaces:RecognitionUsing Class Specific Linear Projection,IEEE Transactions on Pattern Analysisand Machine Inteligence,Vol.19(7),p. 711-720(1999).
[10]Harold Hoteling.Simplified Calculationof Principal Components,Psychometrika,Vol.1(1),p.27-35(1936).
[11]DavidM.Blei,AndrewY.Ng,Michael IJordan.LatentDirichletAllocation,JournalofMachineLearning Research,Vol.3,p.993-1022(2003).
[12]Christian Jutten,JHerault.Blind Separation of Sources,PartI:AnAdaptive Algorithm BasedonNeuromimetic Architecture,Signal Processing,Vol.24(1),p.1-10(1991).
[13]Yaniv Taigman,Ming Yang.Marc’Aurelio Ranzato amp; Lior Wolf,L,Deepface:Closing the Gap to Humanlevel Performance in Face Verification,in Proceedingsof the IEEE Conference on Computer Visionand Pattern Recognition,IEEE,pp.1701-1708.
[14]Sun Y,et al.Deepid3:Face Recognition with very Deep Neural Networks,at https://arxiv.org/abs/1502.00873.
[15]Florian Schrof,Dmitry Kalenichenkoamp;JPhilbin.Facenet:A Unified Embedding forFace Recognitionand Clustering,inProceedingsof the IEEE Conference on Computer Visionand Pattern Recognition,IEEE,pp.815- 823.
[16]Jiankang Deng,etal.Arcface:Additive Angular Margin Lossfor Deep Face Recognition,in Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition,IEEE/CVF,pp.4690-4699.
[17]Weiyang Liu,etal.Sphereface:Deep Hypersphere Embedding forFace Recognition,in Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,IEEE,pp.212-220.
[18]劉成,張麗.“刷臉\"治理的應(yīng)用場景與風(fēng)險(xiǎn)防范[J].學(xué)術(shù)交流,2021(7):151-162.
[19]Shaoqing Ren,et al.Fasterr-cnn:TowardsReal-time Object Detection With Region Proposal Networks, Advances in Neural Information Processing Systems,p.28(2015).
[20]Tsung-YiLin,etal.Focal Loss forDense Object Detection,in Proceedingsof theIEEE International Conference on Computer Vision,IEEE,p.2980-2988.
[21]Omkar M.Parkhi,Andrea Vedaldiamp; Andrew Zisserman.Deep Face Recognition,in BMVC 2O15-Proceedings of the British Machine Vision Conference 2O15,British Machine Vision Association.
[22]Christian Szegedy,et al.Inception-v4,Inception-resnetand the Impact of Residual Connections on Learning. in Proceedings of the AAAI Conference on Artificial Intelligence,AAAI,Vol.31,No.1.
[23]Sheng Chen,et alMobilefacenets:Eficient Cnns for Accurate Real-time Face Verificationon Mobile Devices. In Biometric Recognition:13th Chinese Conference,CCBR 2018,Urumqi,China,August11-12,2018,SpringerInternational Publishing,p.428-438.
[24]Stuart Geman,Elie Bienenstock amp;RenéDoursat.Neural Networksandthe Bias/Variance Dilemma,Neural computation,Vol.4(1),p.1-58(1992).
[25]Mikhail Belkin,et al.Reconciling Modem Machine-learning Practice and the Classical Bias-variance Tradeoff,Procedings of the National Academy of Sciences,Vol.116(32),p.15849-15854(2019).
[26]Robert Tibshirani.Regresion Shrinkage and SelectionVia the Lasso,Journal of the Royal Statistical Society SeriesB:Statistical Methodology,Vol.58(1),p.267-288(1996).
[27]Yuan Yao,Lorenzo Rosasco amp; Andrea Caponneto.On Early Stopping in Gradient Descent Learning,Constructive Approximation,Vol.26,p.289-315(2007).
[28]Maithra Raghu,etal.On TheExpressve Power of DeepNeural Networks,in International Conferenceon Machine Learning,PMLR,p.2847-2854.
[29]KenjiKawaguchi.Deep Learning Without Poor Local Minima,Advances in Neural Information Processing Systems,p.29(2016).
[30]HerbertRobbins,Sutton Monro.AStochastic Approximation Method,The Annalsof Mathematical Statistics, Vol.1951,p.400-407(1951).
[31]Kingma D P amp; Ba J.Adam:A Method for Stochastic Optimization,at htps://arxiv.org/abs/1412.6980. [32]劉篤晉,孫淑霞,李思明.人臉識(shí)別中光照處理方法的分析[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2011(1):160-162+191. [33]Nguyen T,RaghuMamp; Kornblith S.Do WideandDeep NetworksLearn the Same Things?Uncovering How Neural Network Representations Vary With Widthand Depth,at htps://arxiv.org/abs/2010.15327(Last visited on September 30.2022). [34]MahmoodSharif,etalAcessorize toa Crime:Realand StealthyAttacksonState-of-the-artFaceRecognition, inProceedings of the 2O16 Acm Sigsac Conference on Computer and Communications Security,ACM,pp.1528- 1540.
[35]歐盟一般數(shù)據(jù)保護(hù)條例[M].任虎,譯.上海:華東理工大學(xué)出版社,2018:41.
[36]唐林圭.算法治理與治理算法[M].北京:社會(huì)科學(xué)文獻(xiàn)出版社,2021:12.
[37]陳瑞華.刑事審判原理論[M].北京:北京大學(xué)出版社,1996:261.
[38]冀祥德.控辯平等論[M].北京:法律出版社,2008:59.
Legal Regulation of Facial Recognition Algorithm Errors in Government Services
Han Chunhui,Zuo Fukun
Abstract:Face recognition technology hasbeenwidelyused inthe fieldof government services due to itslow cost and high eficiency.However,risk and technology go hand in hand.In thealgorithmic system dimension, therisksare mainly reflected inmodelanddata limitationsandparameter estimationerrors,which directly restrict theaccuracyand stabilityofface recognition.Inthe dimension of administrative relative person,the relative person is often faced with multiple threatssuch asrandomness,interferenceandsecurityatacks in the inputscene,which further magnifies thealgorithm error.Thedual limitations of thealgorithmsystem dimension andtheadministrative counterpart dimensionsuperimpose oneach other,resulting in theinevitable potential riskssuch as failure to match witnessesand erors offacerecognition technologyinthepractical application of government services,which leads to a series of negative problems such as increasing the procedural obligations ofadministrative counterparts,reducing their substantiverights,andforming“technology dependence”in government services.In view of this,itis urgent to build a set of whole-process,systematic andclosed-loop legal regulationsystemof pre-prevention,in-processcontrol andpost-relief,inordertopreventand resolve theadverseeffcts of algorithm errorscaused bythe application offace recognition technology in government services.In the prior stage,thealgorithmerror prevention mechanismshould beestablished,and thealgorithm errorshouldbe prevented through therestricteduse system of biometric technology schemeand the priority mechanism of national authoritative database.In the middle stage,the algorithm error control mechanism should beestablished to prevent the expansion of error through alternative path parallel mechanism andalgorithm error corrction mechanism.In the post-event stage,we should establish the active correction err mechanism, clearresponsibility to establish the active correction error mechanism to achieve error correction.
Key words:government services; facial recognition;algorithm error; legal regulation
(責(zé)任編輯:王正橋)