唐林垚
數(shù)據(jù)泄露泛濫成災(zāi),推動(dòng)隱私保護(hù)法律密集出臺,但過度監(jiān)管令可合法使用的有效數(shù)字資源日益稀缺。以“賦能科技”面目出現(xiàn)的隱私計(jì)算(Privacy-Preserving Computation)技術(shù),在打通應(yīng)用通道、破除行業(yè)壁壘、化解信息孤島方面有著得天獨(dú)厚的優(yōu)勢,成為世界各國競相追逐的技術(shù)高地。隱私計(jì)算也稱隱私增強(qiáng)技術(shù),是“面向隱私信息全生命周期保護(hù)的計(jì)算理論和方法,是隱私信息所有權(quán)、管理權(quán)和使用權(quán)三權(quán)分離時(shí),隱私度量、隱私泄露代價(jià)、隱私保護(hù)與隱私分析復(fù)雜性的可計(jì)算模型與公理化系統(tǒng)”。(1)國家工業(yè)信息安全發(fā)展研究中心:《中國隱私計(jì)算產(chǎn)業(yè)發(fā)展報(bào)告(2020-2021)》,https://www.sohu.com/a/472290299_121124365, 2021-05-20。雖有廣闊的應(yīng)用前景,隱私計(jì)算的潛在風(fēng)險(xiǎn)也不可忽視,作為與其他人工智能技術(shù)深度融合的底層技術(shù),隱私計(jì)算具備顛覆重構(gòu)算法應(yīng)用流程的潛力。如果說,對數(shù)據(jù)共享擊穿隱私保護(hù)底線的擔(dān)憂尚屬庸人自擾,那么,隱私計(jì)算引發(fā)轉(zhuǎn)譯偏誤、放大數(shù)據(jù)瑕疵、加劇算法歧視等近憂則不應(yīng)被置若罔聞。
近年來,科技界、監(jiān)管層和立法者均已意識到問題的緊迫性,發(fā)改委、網(wǎng)信辦、工信部和能源局《關(guān)于推進(jìn)“上云用數(shù)賦智”行動(dòng) 培育新經(jīng)濟(jì)發(fā)展實(shí)施方案》《加快構(gòu)建全國一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系的指導(dǎo)意見》《全國一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系算力樞紐實(shí)施方案》等政策文件,與中國支付清算協(xié)會《多方安全計(jì)算金融應(yīng)用評估規(guī)范》以及剛頒布不久的《數(shù)據(jù)安全法》《個(gè)人信息保護(hù)法》等形成聯(lián)動(dòng),規(guī)定了信息轉(zhuǎn)委托、信息共同處理規(guī)則,明確了處理者的數(shù)據(jù)安全保護(hù)義務(wù),但在規(guī)制隱私計(jì)算方面尚存在火候不足、體系不全和應(yīng)對不利的問題。
隱私計(jì)算的風(fēng)險(xiǎn)并非技術(shù)變革的產(chǎn)物,而是前沿科技打破傳統(tǒng)算法應(yīng)用中數(shù)據(jù)處理慣例的必然結(jié)果。(2)參見楊楠:《大國“數(shù)據(jù)戰(zhàn)”與全球數(shù)據(jù)治理的前景》,《社會科學(xué)》2021年第7期。就此而論,隱私計(jì)算的法律規(guī)制需要深入反省既有保護(hù)機(jī)制的外部性溢出原因,厘清風(fēng)險(xiǎn)嵌入隱私計(jì)算的技術(shù)路徑,與此同時(shí),還應(yīng)結(jié)合我國實(shí)情,向前檢視當(dāng)前數(shù)據(jù)安全法律體系的制度余量,向后探索符合隱私計(jì)算技術(shù)發(fā)展規(guī)律的規(guī)制框架。
技術(shù)不成熟、安全措施不充裕、結(jié)果準(zhǔn)確性無法保證,是隱私計(jì)算開發(fā)和部署中面臨的主要風(fēng)險(xiǎn)。隱私計(jì)算由三項(xiàng)核心技術(shù)組成,分別是:(1)安全多方計(jì)算,即非信任主體在數(shù)據(jù)相互保密的前提下進(jìn)行高效融合計(jì)算的技術(shù);(2)聯(lián)邦學(xué)習(xí),即在不共享本地?cái)?shù)據(jù)前提下,實(shí)現(xiàn)機(jī)器學(xué)習(xí)模型多方協(xié)同訓(xùn)練的技術(shù);(3)可信執(zhí)行環(huán)境,即通過硬件形成隔離環(huán)境以兌現(xiàn)隱私保護(hù)承諾的技術(shù)。各項(xiàng)技術(shù)在應(yīng)用前端(代碼編寫)、中端(數(shù)據(jù)聚合)和后端(結(jié)果輸出)均可能引致不同程度的系統(tǒng)性風(fēng)險(xiǎn)。
隱私計(jì)算的第一重風(fēng)險(xiǎn),是加劇數(shù)據(jù)處理過程中的轉(zhuǎn)譯偏差。弱人工智能階段,算法邏輯直接映射自然人邏輯,開發(fā)者的價(jià)值觀負(fù)載和內(nèi)隱性偏見將導(dǎo)致自動(dòng)化決策系統(tǒng)失誤。(3)參見蔡星月:《算法決策權(quán)的異化及其矯正》,《政法論壇》2021年第5期。例如,在代碼編寫環(huán)節(jié),美國科羅拉多州公共福利系統(tǒng)的程序員曾將“無家可歸”不恰當(dāng)?shù)剞D(zhuǎn)譯為“行乞?yàn)樯?,使得本該獲得政府救濟(jì)的流浪者們被算法拒之門外。(4)參見張凌寒:《算法權(quán)力的興起、異化及法律規(guī)制》,《法商研究》2019年第4期。隱私計(jì)算為算法自動(dòng)化決策施加了諸多限制性條件,使得開發(fā)者在前端編寫過程中不得不心懷更多顧慮,轉(zhuǎn)譯過程的精確性更加無法保證。具體而言,安全多方計(jì)算通常以降低數(shù)據(jù)清洗成本為起點(diǎn),技術(shù)方有時(shí)會摒棄清洗成本較高的非結(jié)構(gòu)化數(shù)據(jù),采用生成對抗網(wǎng)絡(luò)(GAN)生成的模擬數(shù)據(jù);聯(lián)邦學(xué)習(xí)中參與“集訓(xùn)”的初始模型必須具備相當(dāng)程度的適應(yīng)性品格,才能在多個(gè)數(shù)據(jù)源間“往返流轉(zhuǎn)”。為此,開發(fā)者在建模時(shí)一般不對模型目的進(jìn)行確定和統(tǒng)一;可信執(zhí)行環(huán)境的硬件嵌套帶來了兼容、銜接和協(xié)作方面的問題,也將加劇轉(zhuǎn)譯過程偏差和耗散。總之,程序員的內(nèi)心偏見將阻撓正確、中立的意思在代碼中的表達(dá)。如何降低轉(zhuǎn)譯偏差,強(qiáng)化對技術(shù)性較高環(huán)節(jié)的監(jiān)管,是隱私計(jì)算規(guī)則構(gòu)建時(shí)需要考慮的第一層問題。
隱私計(jì)算的第二重風(fēng)險(xiǎn),是運(yùn)算結(jié)果不準(zhǔn)確。隱私計(jì)算擴(kuò)展了數(shù)據(jù)來源渠道,但問題也由此產(chǎn)生:首先,互聯(lián)網(wǎng)等外部渠道數(shù)據(jù)的來源合法性難以甄別;其次,共享模式下數(shù)據(jù)流轉(zhuǎn)更加復(fù)雜和難以控制,數(shù)據(jù)使用邊界無法限定;再次,各方數(shù)據(jù)問題可能相互傳染,激發(fā)數(shù)據(jù)安全的連帶風(fēng)險(xiǎn)。本來,多個(gè)渠道的數(shù)據(jù)合并有望修正數(shù)據(jù)采集的天然瑕疵。最理想的情況是,數(shù)據(jù)集樣本分布過于離散、過于集中、漏誤等問題,都能因不同數(shù)據(jù)集之間的取長補(bǔ)短得以彌補(bǔ)。例如,方言數(shù)據(jù)集的導(dǎo)入,可以提升語音識別軟件的正確率;全國違法數(shù)據(jù)的加權(quán)平均,可以減少警務(wù)預(yù)測系統(tǒng)對外地人的偏見。(5)參見李成:《人工智能歧視的法律治理》,《中國法學(xué)》2021年第2期。但是,隱私計(jì)算經(jīng)常在相互滲透的行業(yè)間進(jìn)行,數(shù)據(jù)聚合過程反而可能會放大數(shù)據(jù)集的原本缺陷,使過去存在的問題更加嚴(yán)重。如何將數(shù)據(jù)資源的差異性考慮在內(nèi),建立科學(xué)的數(shù)據(jù)篩選和容忍機(jī)制,是隱私計(jì)算規(guī)則構(gòu)建時(shí)需要考慮的第二層問題。
隱私計(jì)算的第三重風(fēng)險(xiǎn),是系統(tǒng)被破解或破壞。隱私計(jì)算具有“白盒特性”,各參與方都可以直接獲取完整的全局模型參數(shù),惡意攻擊者同樣可以利用該特性偽裝成誠實(shí)參與方竊取運(yùn)算結(jié)果、扭曲模型或破解可信環(huán)境。隱私計(jì)算的安全研究尚處于起步階段,防御體系的升級速度長期落后于數(shù)據(jù)量的指數(shù)級增長。(6)參見Z. Wang, et al., “Beyond Inferring Class Representatives: User-Level Privacy Leakage from Federated Learning”, 1 Proceedings of IEEE Infocom Conference On Computer Communications, (1)2019, pp.2512-2520。研究表明,即便有所防范,訓(xùn)練集中只要包含3%的中毒數(shù)據(jù),模型誤差將從12%上升至23%。如何引導(dǎo)各參與方懷抱誠實(shí)和善意,在“你中有我,我中有你”的格局下做到“人人為我,我為人人”,是隱私計(jì)算規(guī)則構(gòu)建時(shí)需要考慮的第三層問題。
隱私計(jì)算的第四重風(fēng)險(xiǎn),是算法歧視從個(gè)體歧視轉(zhuǎn)變?yōu)槿后w歧視?!皞€(gè)人信息具有共享屬性,具有公共利益價(jià)值?!?7)劉迎霜:《大數(shù)據(jù)時(shí)代個(gè)人信息保護(hù)再思考——以大數(shù)據(jù)產(chǎn)業(yè)發(fā)展之公共福利為視角》,《社會科學(xué)》2019年第3期。數(shù)據(jù)集偏差或數(shù)據(jù)缺陷可能導(dǎo)致算法歧視,在隱私計(jì)算中,不同來源數(shù)據(jù)間的強(qiáng)搭和錯(cuò)配可能對聯(lián)合數(shù)據(jù)造成沖擊與擾亂,造成歧視規(guī)模性放大。除了數(shù)據(jù)投毒等極端手段,某些參與方的數(shù)據(jù)輸入因數(shù)據(jù)梯度同其他參與方相差過大,也可能間接導(dǎo)致模型被“污染”,輸出歧視性結(jié)果。單次歧視的即時(shí)危害雖不易被察覺,卻足以在更長時(shí)間維度和更長數(shù)據(jù)鏈條上產(chǎn)生積累式影響,聯(lián)邦學(xué)習(xí)全局模型的不斷輪回最容易導(dǎo)致群體歧視泛濫。例如,當(dāng)不同學(xué)校的畢業(yè)生數(shù)據(jù)被用于訓(xùn)練招聘篩選系統(tǒng)、當(dāng)男性占絕對多數(shù)的IT行業(yè)數(shù)據(jù)和其他行業(yè)數(shù)據(jù)被共同用于訓(xùn)練升職評價(jià)系統(tǒng)時(shí),同身份緊密捆綁的群體歧視將從數(shù)據(jù)向模型蔓延。如何減少隱私計(jì)算中的算法歧視,是隱私計(jì)算規(guī)則構(gòu)建時(shí)需要考慮的第四層問題。
隱私計(jì)算的第五重風(fēng)險(xiǎn),是擾亂智能應(yīng)用市場的良好秩序。在隱私計(jì)算應(yīng)用大規(guī)模部署前,面對相似或相異的受眾,傳統(tǒng)的智能應(yīng)用之間存在競爭關(guān)系,只有安全穩(wěn)定、受消費(fèi)者信賴的智能應(yīng)用才能獲得更高市場份額,不重視隱私保護(hù)的智能應(yīng)用將面臨被淘汰的命運(yùn),因嚴(yán)重違法違規(guī)收集使用個(gè)人信息而被強(qiáng)制下架的“滴滴出行”即為一典例。(8)國家互聯(lián)網(wǎng)信息辦公室:《關(guān)于下架“滴滴出行”的通報(bào)》,http://www.cac.gov.cn/2021-07/04/c_1627016782176163.htm. 2021-07-08。隱私計(jì)算的大規(guī)模部署,極有可能導(dǎo)致數(shù)據(jù)處理模式趨同。對規(guī)整性要求不高、通信成本更低的智能應(yīng)用,或?qū)㈦S著隱私計(jì)算的跑馬圈地,逆向淘汰相對保守的傳統(tǒng)智能應(yīng)用。如何引導(dǎo)科技向善、避免智能應(yīng)用“檸檬市場化”,是隱私計(jì)算規(guī)則構(gòu)建時(shí)需要考慮的第五層問題。
在法治社會中,有風(fēng)險(xiǎn)的存在就定然有規(guī)制的需求。面對隱私計(jì)算風(fēng)險(xiǎn),世界各國的立法者制定的一系列監(jiān)測、識別、防范與救濟(jì)的措施,主要包括信任維系、目標(biāo)規(guī)范、集體訴訟、缺陷彌補(bǔ)和強(qiáng)制脫敏等機(jī)制,但這些機(jī)制尚未聯(lián)結(jié)成足以應(yīng)對隱私計(jì)算風(fēng)險(xiǎn)的動(dòng)態(tài)規(guī)范。
技術(shù)的信任維系機(jī)制,以技術(shù)優(yōu)勢方的信息披露為基礎(chǔ)。一直以來,算法可解釋性的合規(guī)要求,是世界各國人工智能法的核心要旨。(9)張欣:《算法解釋權(quán)與算法治理路徑研究》,《中外法學(xué)》2019年第6期。在隱私計(jì)算嵌套進(jìn)算法決策過程后,可解釋性變得更加難以實(shí)現(xiàn)。隱私計(jì)算的各項(xiàng)技術(shù)構(gòu)成了一系列法益依附的黑箱,由于受商業(yè)秘密的保護(hù),監(jiān)管者難以強(qiáng)制技術(shù)方公開披露技術(shù)細(xì)節(jié)。公共管理部門的隱私計(jì)算方案更是關(guān)涉公共安全,將內(nèi)部技術(shù)細(xì)節(jié)置于公眾審視之下容易遭受輿論非難,且必然削弱系統(tǒng)的防御力。除此之外,隱私計(jì)算中環(huán)環(huán)相扣的符碼規(guī)則進(jìn)一步打斷了算法可解釋性的鏈條;多重加密手段的運(yùn)用,更是以減少不透明度作為隱私計(jì)算中的個(gè)人信息保護(hù)屏障。(10)參見劉志勇、何忠江等:《大數(shù)據(jù)安全特征與運(yùn)營實(shí)踐》,《電信科學(xué)》2021年第5期。由此可見,算法可解釋性在隱私計(jì)算中的匱乏,本就是保障隱私安全的策略和手段,如此一來,基于算法可解釋性的信任維持機(jī)制在隱私計(jì)算中必將面臨重塑。
知情同意框架,是數(shù)據(jù)處理活動(dòng)的基本保護(hù)范式,因知情而同意或不同意,共同勾勒出數(shù)據(jù)主體在數(shù)據(jù)處理活動(dòng)中的能動(dòng)性邊界,使數(shù)據(jù)處理活動(dòng)的目的被錨定在合理的區(qū)間之內(nèi)。在數(shù)據(jù)處理活動(dòng)中,用戶同意的知情前提常因各種原因被削弱,導(dǎo)致目的規(guī)范機(jī)制無法發(fā)揮作用。例如,用戶協(xié)議可能篇幅過長,即便語言平實(shí)易懂,用戶也不可能潛心閱讀完畢。由于相當(dāng)多的意外情況在日后的數(shù)據(jù)處理活動(dòng)中才可能發(fā)生,數(shù)據(jù)主體在對一系列關(guān)切自身重大利益的事項(xiàng)進(jìn)行“一攬子同意”時(shí),通常無法準(zhǔn)確評估合同的每一條款可能使自身面臨的風(fēng)險(xiǎn),難謂表意自由。就隱私計(jì)算而論,數(shù)據(jù)主體可能無法想象,允許數(shù)據(jù)處理者與其他受托方或第三方共享用戶數(shù)據(jù),將帶來巨大的數(shù)據(jù)保護(hù)空白;數(shù)據(jù)主體也可能無法預(yù)料,出于實(shí)現(xiàn)公共利益的善心,適當(dāng)允許處理者擴(kuò)大數(shù)據(jù)采集范圍,反而將助長數(shù)據(jù)剩余權(quán)利濫用、隱私迫害等情況的滋生。數(shù)據(jù)處理者可以就隱私計(jì)算技術(shù)細(xì)節(jié)提供詳實(shí)的用戶協(xié)議,數(shù)據(jù)主體也對此表示同意,但不能因此完全認(rèn)可此間法律關(guān)系的產(chǎn)生、變更或消滅的合理性,畢竟,數(shù)據(jù)主體根本無力深究長篇累牘用戶協(xié)議中可能存在的“雷區(qū)”,更無法從技術(shù)層面知曉自己的數(shù)據(jù)何時(shí)被調(diào)取或使用;意思表示真實(shí)性和有效性大打折扣,“同意”與“事實(shí)上知情”存在斷層。
隱私計(jì)算的涉眾基數(shù),遠(yuǎn)大于普通算法應(yīng)用的受眾基數(shù)。一般情況下,集體訴訟被認(rèn)為是應(yīng)對大規(guī)模侵權(quán)行為和群體性小額爭議的“靈丹妙藥”,(11)鐘瑞華:《美國消費(fèi)者集體訴訟初探》,《環(huán)球法律評論》2005年第3期。受害人的維權(quán)成本在群體中分擔(dān),數(shù)名相同境況的人遭受“共同損害”的事實(shí)有助于建立技術(shù)使用和損害發(fā)生間的因果關(guān)系,例如,利用用戶弱點(diǎn)的釣魚營銷對單個(gè)用戶而言可能是無法察覺和舉證的“隱形侵權(quán)行為”,但當(dāng)海量用戶都被釣魚營銷時(shí),侵權(quán)行為便不再隱秘。(12)參見柯蒂斯·E.A.卡諾、陳吉棟、王冉冉:《運(yùn)用傳統(tǒng)侵權(quán)法理論“迎接”機(jī)器人智能》,《產(chǎn)權(quán)法治研究》2019年第1期。但是,隱私計(jì)算“分布式學(xué)習(xí)”的技術(shù)樣態(tài)在事實(shí)上降低甚至消滅了受害者的聚合可能。隱私計(jì)算的數(shù)據(jù)傳輸過程,本是通過層層加密手段、服務(wù)器分屬不同區(qū)域的物理隔絕措施以及去標(biāo)識化和匿名化等必要處理方式,實(shí)現(xiàn)個(gè)人數(shù)據(jù)的“可用不可見”;而受害人身份的群體互識,只有在加密方式被破解、服務(wù)器被攻陷以及去標(biāo)識化和匿名化被逆轉(zhuǎn)的情況下,才可能發(fā)生。易言之,隱私計(jì)算本是通過杜絕數(shù)據(jù)主體之間的相互識別達(dá)到提升安全性的效果,這種機(jī)制本身導(dǎo)致了隱私計(jì)算中數(shù)據(jù)主體將集體維權(quán)困難。
各國立法者從數(shù)據(jù)主體的“個(gè)人信息自決”(information self-determination)入手,賦予了數(shù)據(jù)主體一系列權(quán)利救濟(jì)途徑。例如,歐盟《通用數(shù)據(jù)保護(hù)條例》(以下簡稱GDPR)第17條規(guī)定了“被遺忘權(quán)”:“數(shù)據(jù)主體有權(quán)要求數(shù)據(jù)控制者擦除關(guān)于其個(gè)人數(shù)據(jù)的權(quán)利?!睂?shí)現(xiàn)被遺忘權(quán)的方式是“清除同個(gè)人數(shù)據(jù)相關(guān)的鏈接、備份或復(fù)制”,此舉因?qū)嵺`成本極高且有悖信息自由而飽受詬病。(13)參見劉文杰:《被遺忘權(quán):傳統(tǒng)元素、新語境與利益衡量》,《法學(xué)研究》2018年第2期。美國《加州消費(fèi)者隱私法案》(以下簡稱CCPA)第三章規(guī)定了“刪除權(quán)”,“如果服務(wù)提供商收到消費(fèi)者提出的刪除其個(gè)人數(shù)據(jù)的可驗(yàn)證請求,則應(yīng)從其系統(tǒng)中刪除消費(fèi)者個(gè)人數(shù)據(jù),并指示任何‘從服務(wù)提供商’從其系統(tǒng)中相應(yīng)刪除消費(fèi)者個(gè)人數(shù)據(jù)”,較之于被遺忘權(quán)更具可操作性。(14)參見丁曉東:《被遺忘權(quán)的基本原理與場景化界定》,《清華法學(xué)》2018年第6期。我國《信息安全技術(shù)個(gè)人信息安全規(guī)范》(以下簡稱《安全規(guī)范》)第8條第3款和《個(gè)人信息保護(hù)法》第47條借鑒了CCPA刪除權(quán)的思路,但通過適當(dāng)降低刪除權(quán)實(shí)質(zhì)內(nèi)涵的方式進(jìn)一步降低了技術(shù)方的合規(guī)成本:只要個(gè)人數(shù)據(jù)在日常業(yè)務(wù)功能所涉及的系統(tǒng)中不能被“檢索或訪問”,即滿足《安全規(guī)范》第3條第10款對“刪除”的定義。由于沒有實(shí)質(zhì)性刪除個(gè)人數(shù)據(jù)或清除同個(gè)人數(shù)據(jù)相關(guān)的鏈接、備份或復(fù)制,《安全規(guī)范》為刪除權(quán)設(shè)定的最低門檻在特定情況下仍然可以被技術(shù)性逆轉(zhuǎn),恢復(fù)“被檢索或被訪問”的狀態(tài)。(15)參見唐林垚:《“脫離算法自動(dòng)化決策權(quán)”的虛幻承諾》,《東方法學(xué)》2020年第6期。隱私計(jì)算本為鏈接數(shù)據(jù)庫而生,此時(shí),為降低企業(yè)合規(guī)成本而允許技術(shù)方采取“名義刪除”的做法將不再有效。除此之外,被遺忘權(quán)、刪除權(quán)的實(shí)用性在隱私計(jì)算中也大打折扣。由于過度依賴在數(shù)據(jù)集中添加混淆數(shù)據(jù)以提升安全性,“實(shí)質(zhì)刪除”的難度大大增加;具有不可篡改特性的區(qū)塊鏈技術(shù)在隱私計(jì)算系統(tǒng)中的穿插應(yīng)用,令不可逆轉(zhuǎn)的刪除難以實(shí)現(xiàn)??傊?,隱私計(jì)算中的數(shù)據(jù)主體需要不同于被遺忘權(quán)或刪除權(quán)的信息自決手段,才能真正實(shí)現(xiàn)對自身數(shù)據(jù)權(quán)利的保障和救濟(jì)。
技術(shù)對個(gè)人隱私的侵蝕愈演愈烈,對個(gè)人信息進(jìn)行脫敏化處理已經(jīng)成為全球個(gè)人信息保護(hù)立法的共識,信息處理方有責(zé)任采取技術(shù)手段保證任何人或組織無法以倒推的方式,知曉信息主體的真實(shí)身份?!栋踩?guī)范》規(guī)定了去標(biāo)識化和匿名化兩種脫敏方式,前者是指不借助額外信息便無法識別、關(guān)聯(lián)或復(fù)原個(gè)人信息的技術(shù)處理方式,后者是讓個(gè)人信息不能被識別、關(guān)聯(lián)或復(fù)原的技術(shù)處理方式。問題在于,隨著數(shù)據(jù)如滾雪球般積累,完全匿名化的狀態(tài)將不可能保持。(16)參見蘇宇、高文英:《個(gè)人信息的身份識別標(biāo)準(zhǔn):源流、實(shí)踐與反思》,《交大法學(xué)》2019年第4期。“數(shù)據(jù)最小化、匿名化等原則,在大數(shù)據(jù)反向識別和預(yù)測性挖掘等技術(shù)下失去了應(yīng)有的保護(hù)作用。”(17)徐明:《大數(shù)據(jù)時(shí)代的隱私危機(jī)及其侵權(quán)法應(yīng)對》,《中國法學(xué)》2017年第1期。單獨(dú)看來沒有任何痕跡殘余的匿名化數(shù)據(jù),極有可能因?yàn)閿?shù)據(jù)聚合而露出蛛絲馬跡。誠然,隱私計(jì)算的數(shù)據(jù)加密和權(quán)限管理,在很大程度上阻斷了多方大數(shù)據(jù)“實(shí)質(zhì)合并”的可能,但機(jī)器學(xué)習(xí)模型在各參與方之間的多次往返流轉(zhuǎn)也極有可能泄露出足以識別“去標(biāo)識化”數(shù)據(jù)的線索。極端情況下,掌握了足夠多的單向反饋和模型變動(dòng),完全碎片化的匿名數(shù)據(jù)也有可能被復(fù)原。(18)參見唐林垚:《常態(tài)化數(shù)字抗疫時(shí)代的個(gè)人信息保護(hù)》,《中國政法大學(xué)學(xué)報(bào)》2021年第4期。總之,隱私計(jì)算中數(shù)據(jù)交流的爆炸式增長,將使得任何匿名化處理手段都難以有效消弭匿名數(shù)據(jù)的“剩余風(fēng)險(xiǎn)”。
傳統(tǒng)應(yīng)對機(jī)制在上述幾個(gè)方面的失靈并非是互不相關(guān)的,它們一起共同揭示了這樣的現(xiàn)實(shí):隱私計(jì)算的“去中心化”特征,正在逐步瓦解企業(yè)、部門和平臺的邊界,基于邊界概念的安全防護(hù)體系將不復(fù)適用。隱私計(jì)算的法律規(guī)制應(yīng)當(dāng)在充分把控隱私計(jì)算發(fā)展趨勢的基礎(chǔ)上,補(bǔ)強(qiáng)傳統(tǒng)法律規(guī)制的短板,發(fā)展出平衡隱私計(jì)算各參與方利益、促進(jìn)技術(shù)增益數(shù)據(jù)價(jià)值、保護(hù)數(shù)據(jù)主體綜合權(quán)益的法律規(guī)則。以“法定義務(wù)的履行和技術(shù)標(biāo)準(zhǔn)的遵守有機(jī)整合”為目標(biāo),(19)趙精武、周瑞玨:《隱私計(jì)算技術(shù):數(shù)據(jù)流動(dòng)與數(shù)據(jù)安全的協(xié)同保護(hù)規(guī)則構(gòu)建》,《信息通信技術(shù)與政策》2021年第7期。隱私計(jì)算的體系化規(guī)制策略應(yīng)由開發(fā)行為規(guī)范、外部審查體系、動(dòng)態(tài)協(xié)商框架、主體賦權(quán)制度和統(tǒng)一行業(yè)標(biāo)準(zhǔn)共同組成。
促進(jìn)技術(shù)向善最有效的手段,是通過法律將標(biāo)準(zhǔn)和原則植入技術(shù)應(yīng)用的底層行動(dòng)邏輯,因勢利導(dǎo)出政策制定者期望的結(jié)果。就隱私計(jì)算而言,立法者可以將倫理先行原則、聲譽(yù)評價(jià)機(jī)制等植入開發(fā)行為規(guī)范,為不同類型的技術(shù)應(yīng)用創(chuàng)設(shè)差異化的社群規(guī)則。
隱私計(jì)算的技術(shù)應(yīng)用首先需要滿足倫理先行原則,不得游走于現(xiàn)有法律體系的灰色地帶進(jìn)行監(jiān)管套利。由于匯聚了海量大數(shù)據(jù),技術(shù)方極易經(jīng)不住誘惑,利用算法壓榨個(gè)體、攝取不成比例的回報(bào)。由于同算法決策息息相關(guān),隱私計(jì)算同樣包含價(jià)值判斷,立場抉擇關(guān)涉多方利益。因此,技術(shù)方案選擇不應(yīng)是簡單的效益至上或是性能擇優(yōu)。隱私計(jì)算的倫理先行體現(xiàn)在,各參與方的效益增長勢必要同步拉動(dòng)社會公共利益提升。從數(shù)據(jù)主體的視角來看,隱私計(jì)算的技術(shù)紅利應(yīng)當(dāng)雨露均沾,技術(shù)方必須要努力兌現(xiàn)在用戶授權(quán)時(shí)對用戶的承諾,否則數(shù)據(jù)主體有權(quán)主張隱私計(jì)算的合同自始無效。
此外,技術(shù)方還應(yīng)當(dāng)主動(dòng)引入聲譽(yù)概念作為參與方信任度的衡量指標(biāo),凈化隱私計(jì)算環(huán)境。從可以采取的技術(shù)手段來看,多權(quán)重的主觀邏輯模型使基于聲譽(yù)的可信賴客戶端之間的“朝上競爭”成為可能,配合區(qū)塊鏈技術(shù)的不可篡改特性,分布式信譽(yù)管理不再是癡人說夢,例如,可以利用區(qū)塊鏈技術(shù)跟蹤全局模型更新,對積極參與隱私計(jì)算的用戶給予豐厚獎(jiǎng)勵(lì),結(jié)合局部模型參數(shù)篩選客戶端子集,實(shí)現(xiàn)更高穩(wěn)定性和收斂效率等。不過,自我修復(fù)的技術(shù)嘗試有時(shí)也存在技術(shù)間的相互掣肘,隱私計(jì)算的主導(dǎo)方需“量力而行”。例如,區(qū)塊鏈技術(shù)的公共賬本特性存在通信延遲、數(shù)據(jù)吞吐量大等問題,與隱私計(jì)算技術(shù)相結(jié)合,必然對通信設(shè)備、服務(wù)器帶寬以及主機(jī)算力等提出更高要求。
信息不對等必然誘發(fā)權(quán)力濫用。隱私計(jì)算的層層技術(shù)黑箱極大地削弱了算法可解釋性的制約效力。由于技術(shù)具有嬗變性,多環(huán)節(jié)技術(shù)疊加還有可能造成脫離造物者預(yù)設(shè)程序但短期內(nèi)難以被人察覺的情況。(20)參見唐林垚:《公共衛(wèi)生領(lǐng)域算法治理的實(shí)現(xiàn)途徑及法律保障》,《法學(xué)評論》2021年第3期。因此,“心懷善意”的技術(shù)方至多作出“自以為正確的解釋”,其實(shí)錯(cuò)誤乃至虛假的信息披露是隱私計(jì)算中的常態(tài)。職是之故,有必要引入外部審查機(jī)制、深入探查隱私計(jì)算的潛藏風(fēng)險(xiǎn)。
隱私計(jì)算方案的外部審核主體應(yīng)當(dāng)由獨(dú)立的第三方機(jī)構(gòu)擔(dān)任,實(shí)施審核的專家委員會由具備相關(guān)技術(shù)背景、同各參與方無利益往來的專家組成。“專家會診”不宜簡單地將安全凌駕于精準(zhǔn)度、效率、公平和收益等價(jià)值之上,而需要通過最低限度的盡職調(diào)查,平衡縱橫交錯(cuò)的多元訴求,在保障基本安全的前提下盡可能促進(jìn)數(shù)據(jù)效能的最大釋放。功能單一的剛性標(biāo)準(zhǔn),很難對不同技術(shù)手段的差異性訴求給予全面而有效回應(yīng),甚至?xí)€(gè)別數(shù)據(jù)主體的獨(dú)特性利益造成壓制。因此,在隱私計(jì)算的各個(gè)技術(shù)場景中,彈性治理的意義大為凸顯。(21)參見李晟:《略論人工智能語境下的法律轉(zhuǎn)型》,《法學(xué)評論》2018年第1期。根據(jù)應(yīng)用場景的不同,可以從審核強(qiáng)度、價(jià)值位階和優(yōu)先防御手段等多個(gè)維度共同確定隱私計(jì)算的“滑動(dòng)審核標(biāo)準(zhǔn)”,如表1所示。
表1 隱私計(jì)算的滑動(dòng)審核標(biāo)準(zhǔn)
除了上述標(biāo)準(zhǔn)之外,外部審核主體還應(yīng)著重關(guān)注技術(shù)方在降低算法歧視方面是否盡力而為。例如檢視隱私計(jì)算的數(shù)據(jù)聚合機(jī)制,(22)參見羅智敏:《算法歧視的司法審查——意大利戶戶送有限責(zé)任公司算法歧視案評析》,《交大法學(xué)》2021年第2期。尤其隱私計(jì)算參與方的自身稟賦、行業(yè)特點(diǎn)和地域限制,在何種程度上影響了數(shù)據(jù)樣本的生成。無論如何清洗,來源于同一主體的數(shù)據(jù)通常會被打上難以察覺的烙印,具有隱性的身份化表征,在無形之中限定了隱私計(jì)算的格局。不同數(shù)據(jù)間集體身份在隱私計(jì)算中的相互排斥和博弈越明顯,得出的運(yùn)算結(jié)果或訓(xùn)練出的公共模型就越有可能產(chǎn)生歧視。說到底,原本稀松平常的數(shù)據(jù),可能由于同其他非適配數(shù)據(jù)的聯(lián)合,導(dǎo)致數(shù)據(jù)池難以自洽。在隱私計(jì)算的過程鏈條上,被污染的數(shù)據(jù)池?zé)o法訓(xùn)練出穩(wěn)定的模型,也無法確保準(zhǔn)確客觀的結(jié)果,最終造成了數(shù)據(jù)共享機(jī)制和自動(dòng)化決策機(jī)制共同構(gòu)成的整體解決方案走樣。既然,歧視主要根源于數(shù)據(jù),外部審核主體應(yīng)當(dāng)確保技術(shù)方在數(shù)據(jù)清洗過程中引入缺省數(shù)據(jù)篩選機(jī)制,去除冗余、不相關(guān)、不合格數(shù)據(jù),降低通信成本、提升運(yùn)算精度,避免隱私計(jì)算的各參與方因?yàn)椤皵?shù)據(jù)饑渴”而“來者不拒”,從源頭“掐斷”算法歧視群體化的苗頭。
雖然知情同意框架有著諸多缺陷,但至今仍然廣泛地被各國立法者前置為信息處理全周期的“第一閘口”,主要是因?yàn)闃?biāo)準(zhǔn)化的模式無論對于數(shù)據(jù)主體還是數(shù)據(jù)處理主體而言,均為最有效減少交易成本的解決方案。可以預(yù)計(jì),在隱私計(jì)算作為算法應(yīng)用基礎(chǔ)設(shè)施的全新業(yè)態(tài)中,知情同意框架仍將發(fā)揮巨大的作用,但亟需根據(jù)隱私計(jì)算的業(yè)務(wù)特征進(jìn)行更新和鞏固。
隱私計(jì)算的適用場景呈現(xiàn)高度動(dòng)態(tài)化特征,數(shù)據(jù)處理者必須結(jié)合節(jié)點(diǎn)狀態(tài)、合約策略、加密方式、環(huán)境閉合等情況臨機(jī)應(yīng)變,清晰、穩(wěn)定、透明的數(shù)據(jù)處理方式不再具有可期待性。這種動(dòng)態(tài)化的業(yè)務(wù)特征,決定了知情同意框架也必須相應(yīng)處于動(dòng)態(tài)變化之中,數(shù)據(jù)主體只有做到與時(shí)俱進(jìn)的“知曉”,才能作出真正符合其意思表示的“同意”,否則無異于“緣木求魚”。例如,因加密或傳輸方式的革新導(dǎo)致數(shù)據(jù)使用方式的改變、數(shù)據(jù)處理者對新模型訓(xùn)練請求的授權(quán)、新硬件模塊在可信執(zhí)行環(huán)境中的導(dǎo)入等,數(shù)據(jù)處理者均需通過正當(dāng)程序,依次與數(shù)據(jù)主體之間達(dá)成合意。
從學(xué)理上看,隱私計(jì)算下的知情同意框架所對應(yīng)的合同類型,不再是多次即時(shí)結(jié)清的靜態(tài)合同,而是當(dāng)事人各方處于“繼續(xù)性合作伙伴關(guān)系”的動(dòng)態(tài)合同。合同各方在任何一個(gè)時(shí)間點(diǎn)上無法準(zhǔn)確定性未來的數(shù)據(jù)處理情況,只能將彼此之間的交易視為“在很大程度上屬于未知領(lǐng)域的整體活動(dòng)的一部分”。(23)I. R. Macneil, Contracts: Exchange Transactions and Relations, New York: Foundation Press, 1978, p.13.同傳統(tǒng)的靜態(tài)合同各方始終受初始條件的拘束不同,動(dòng)態(tài)合同關(guān)系中各方的權(quán)利和義務(wù)將長期處于一種開放式的、不斷修正的狀態(tài)之中。由于用戶協(xié)議的一攬子授權(quán)同意不能覆蓋隱私計(jì)算的整個(gè)數(shù)據(jù)處理流程,數(shù)據(jù)主體的初始同意不應(yīng)當(dāng)視為對自身信息權(quán)益的永久授權(quán)。即使是去標(biāo)識化、匿名化的個(gè)人數(shù)據(jù)參與隱私計(jì)算,數(shù)據(jù)處理主體也應(yīng)當(dāng)“逐次、分別、主動(dòng)”請求用戶授權(quán)。
反復(fù)征詢必然降低隱私計(jì)算效率,反過來又可能對數(shù)據(jù)主體隱私權(quán)中的安寧權(quán)造成損害,而且極有可能導(dǎo)致疲憊之下用戶的一攬子授權(quán)或一攬子拒絕。為了避免這種情況的發(fā)生,應(yīng)當(dāng)為隱私計(jì)算中的個(gè)別情形設(shè)置授權(quán)豁免。筆者認(rèn)為,在兩種情形中,數(shù)據(jù)處理者無需再次征求用戶同意。其一,當(dāng)隱私計(jì)算的確不涉及個(gè)人權(quán)益時(shí),數(shù)據(jù)處理者在履行通知義務(wù)后可參與隱私計(jì)算,用戶雖無收益但權(quán)益不受損害。其二,對于符合《民法典》第1037條規(guī)定,自然人“自行公開或者其他已經(jīng)合法公開”以及基于公共利益與他人權(quán)利的維護(hù)而需要處理的個(gè)人數(shù)據(jù)是否參與隱私計(jì)算,數(shù)據(jù)處理者有權(quán)自行決定。
對于社會福利的衡量,卡爾多—希克斯標(biāo)準(zhǔn)認(rèn)為,資源配置可能使部分人受益,也可能使部分人受損,但只要受益者的收益足以賠償受損者的損失,那么社會福利就是增加的,即便這種賠償并未實(shí)際發(fā)生。從《民法典》的相關(guān)規(guī)定來看,自然人對其個(gè)人生物識別信息享有民事權(quán)益中的人格權(quán)益,而人格權(quán)益具備一經(jīng)成立即附著于復(fù)雜社會關(guān)系的特殊性?!巴V骨趾Α薄胺颠€財(cái)產(chǎn)”“賠償損失”“賠禮道歉”等責(zé)任承擔(dān)方式均無法在實(shí)質(zhì)上消除個(gè)人生物識別信息泄露的惡劣影響。因此,在隱私計(jì)算中,卡爾多—希克斯效率的計(jì)算方式毫無用武之地,宜將“統(tǒng)一增進(jìn)社會福利”的帕累托標(biāo)準(zhǔn)作為隱私計(jì)算的理想目標(biāo)。雖然為了社會效益的增長,個(gè)人數(shù)據(jù)權(quán)益的克減不可避免,但在有多個(gè)參與方的交易中,如果部分參與方的利益主要體現(xiàn)為財(cái)產(chǎn)利益,其余參與方的利益主要體現(xiàn)為人格權(quán)益,人格權(quán)益方應(yīng)當(dāng)被優(yōu)先保護(hù)。
隱私計(jì)算中的數(shù)據(jù)主體宜享有以自身利益為目的而行使的“自益權(quán)”,這種權(quán)利的行使應(yīng)具有便捷性,且限制較少。CCPA中的“選擇退出權(quán)(Opt-out)”就是一個(gè)極好的范例,允許消費(fèi)者限制企業(yè)同其他第三方分享個(gè)人數(shù)據(jù)。不過,“選擇退出權(quán)”的創(chuàng)設(shè)背景,是數(shù)據(jù)主體對數(shù)據(jù)處理行為的“默認(rèn)同意”,不適用于數(shù)據(jù)處理主體應(yīng)當(dāng)“逐次、分別、主動(dòng)”請求用戶授權(quán)的隱私計(jì)算。將數(shù)據(jù)主體視為個(gè)人數(shù)據(jù)的最佳處分權(quán)人,與隱私計(jì)算多環(huán)節(jié)、多目的特征相匹配,筆者主張?jiān)O(shè)置“斷鏈權(quán)”,將《個(gè)人信息保護(hù)法》第15條的“撤回同意”在隱私計(jì)算場景中不折不扣地落實(shí)。通過行使該權(quán)利,數(shù)據(jù)主體可以打斷數(shù)據(jù)主處理者和從處理者對其個(gè)人數(shù)據(jù)的后續(xù)處理行為。權(quán)利性質(zhì)上,斷鏈權(quán)為形成權(quán),是依照數(shù)據(jù)主體單方面意思表示即可使已成立的數(shù)據(jù)處理關(guān)系發(fā)生變動(dòng)的權(quán)利。斷鏈權(quán)同時(shí)具備撤銷權(quán)屬性,行權(quán)結(jié)果是使已經(jīng)發(fā)生效力的意思表示歸于消滅。
斷鏈權(quán)的坐標(biāo)定位可以通過同其他權(quán)利的比較予以明晰。其一,斷鏈權(quán)非刪除權(quán)。數(shù)據(jù)主體行使斷鏈權(quán),中止的是信息處理主體對個(gè)人數(shù)據(jù)的“使用權(quán)”,而非“持有權(quán)”,數(shù)據(jù)處理主體將不再有權(quán)收集數(shù)據(jù)主體任何個(gè)人新數(shù)據(jù),若無特別法定事由,也不得對繼續(xù)持有的原個(gè)人數(shù)據(jù)進(jìn)行任何形式的處理。其二,斷鏈權(quán)非更正權(quán)。在隱私計(jì)算的任何階段,數(shù)據(jù)處理行為因數(shù)據(jù)主體的“層層同意”或“逐次授權(quán)”具有合法性基礎(chǔ),數(shù)據(jù)主體行使斷鏈權(quán),僅對之后的信息處理行為生效,既不產(chǎn)生溯及既往的效力,也不改變既有自動(dòng)化決策結(jié)果。其三,同被遺忘權(quán)相比,斷鏈權(quán)是“個(gè)人信息自決”更為直接的權(quán)利表達(dá)范式。斷鏈權(quán)的行使不以侵權(quán)行為的存在為前提,能夠成為過于孱弱的知情同意框架和相對極端的刪除權(quán)、被遺忘權(quán)之間的良性緩沖。
數(shù)字化轉(zhuǎn)型現(xiàn)狀下,金融、保險(xiǎn)、醫(yī)療、銷售、教育等行業(yè)都向數(shù)據(jù)處理行業(yè)轉(zhuǎn)型。2021年6月28日,中國支付清算協(xié)會發(fā)布《多方安全計(jì)算金融應(yīng)用評估規(guī)范》,這是我國第一個(gè)有關(guān)隱私計(jì)算的金融規(guī)范。數(shù)據(jù)標(biāo)準(zhǔn)統(tǒng)一、技術(shù)規(guī)范明晰,是上下游法律聯(lián)動(dòng)的基礎(chǔ)。隱私計(jì)算各項(xiàng)技術(shù)流派眾多,數(shù)據(jù)采集和處理方式差別迥異。金融行業(yè)之外,其他行業(yè)主管部門也應(yīng)當(dāng)聯(lián)合牽頭制定跨行業(yè)共同遵守適用的“數(shù)據(jù)辭典”,打造數(shù)據(jù)交換的“通用語言”,做到數(shù)據(jù)編碼、制式、口徑、格式方面標(biāo)準(zhǔn)的統(tǒng)一,保證數(shù)據(jù)來源、內(nèi)涵、處理邏輯可被“反事實(shí)校驗(yàn)”。建立跨行業(yè)的統(tǒng)一標(biāo)準(zhǔn),還將有利于構(gòu)建新興技術(shù)適用的安全漏洞知識庫:行業(yè)主管部門應(yīng)將零散的概念、實(shí)例和規(guī)則整合成體系化的檢索庫,在地址、端口、服務(wù)、屬性、協(xié)議五元組層面實(shí)現(xiàn)隱私計(jì)算的知識圖譜化。
政府部門,處于數(shù)據(jù)和關(guān)鍵信息基礎(chǔ)設(shè)施的要沖,是最龐大、最完整的數(shù)據(jù)擁有者。政府部門向各行各業(yè)定向開放“國家教育資源公共服務(wù)平臺”“國家科技管理信息系統(tǒng)公共服務(wù)平臺”“國家社會保險(xiǎn)公共服務(wù)平臺”“全國企業(yè)信用信息公示系統(tǒng)”“個(gè)人信用信息公示系統(tǒng)”等數(shù)據(jù)庫,有助于賦能各個(gè)產(chǎn)業(yè)的數(shù)字化轉(zhuǎn)型。目前,國家級和區(qū)域級的大數(shù)據(jù)交易所已在我國漸次成型。2021年3月31日,北京國際大數(shù)據(jù)交易所成立,系我國首家基于“數(shù)據(jù)可用不可見,用途可控可計(jì)量”新型交易范式的數(shù)據(jù)交易所。(24)徐佩玉:《北京國際大數(shù)據(jù)交易所成立》,《人民日報(bào)》2021年4月3日。在行業(yè)標(biāo)準(zhǔn)統(tǒng)一之后,可以交易所為依托,選擇政府?dāng)?shù)據(jù)作為權(quán)威可信數(shù)據(jù)源開展隱私計(jì)算試點(diǎn),在金融普惠、智慧醫(yī)療、教育監(jiān)管等領(lǐng)域率先打造技術(shù)沙盒,之后再以點(diǎn)帶面逐步向全國、全行業(yè)示范推廣,有的放矢完善隱私計(jì)算的確權(quán)模式,循序漸進(jìn)推動(dòng)隱私計(jì)算的應(yīng)用落地。
跨場景、跨行業(yè)的數(shù)據(jù)動(dòng)態(tài)利用,是人工智能時(shí)代隱私計(jì)算技術(shù)的生命力之所在。但是數(shù)據(jù)環(huán)境越復(fù)雜,技術(shù)方就越有可能以合法形式繞開預(yù)設(shè)約束,迂回實(shí)現(xiàn)自身利益的最大化,進(jìn)而損害社會公共利益。辯證地看,隱私計(jì)算的各項(xiàng)風(fēng)險(xiǎn),也孕育著利用技術(shù)治理風(fēng)險(xiǎn)的契機(jī)。立法者應(yīng)從開發(fā)行為、業(yè)務(wù)樣態(tài)、代碼規(guī)則、技術(shù)發(fā)展和社會法益衡量等角度,綜合打造以變應(yīng)變的法律應(yīng)對體系。一言以蔽之,只有通過聯(lián)結(jié)化的努力,將零散獨(dú)立的應(yīng)對機(jī)制和法律規(guī)則整合為成體系的規(guī)制策略,隱私計(jì)算才能真正發(fā)揮其作為“賦能科技”的正向效用。文中對于隱私計(jì)算法律規(guī)制的系統(tǒng)性思考,希望為日后各項(xiàng)技術(shù)規(guī)則的單獨(dú)細(xì)化拋磚引玉。在開發(fā)行為規(guī)范、外部審查體系、動(dòng)態(tài)協(xié)商框架、主體賦權(quán)制度和統(tǒng)一行業(yè)標(biāo)準(zhǔn)的有機(jī)互動(dòng)下,隱私計(jì)算得以強(qiáng)化法律保護(hù),數(shù)據(jù)共享阻礙得以徹底根除,行業(yè)壁壘得以逐漸消解,法律和技術(shù)由此相互增益。