摘 要: 公共數(shù)據(jù)質(zhì)量不僅直接或間接影響公民和法人權(quán)益, 也因影響數(shù)據(jù)驅(qū)動型判斷和決策的結(jié)果而深刻影響公共利益。 我國在保障公共數(shù)據(jù)質(zhì)量方面已制定了系列法律規(guī)范和政策文件,并采取了一定治理舉措, 但公共數(shù)據(jù)質(zhì)量的體系化保障依然面臨法律關(guān)系界定、 參與途徑設(shè)置和監(jiān)測體系擴(kuò)展等方面的難題。 解決這些難題應(yīng)秉持 “通過設(shè)計(jì)的精細(xì)保護(hù)” 思路, 建立公共數(shù)據(jù)法益確認(rèn)制度、 質(zhì)量缺陷參與治理制度和數(shù)據(jù)質(zhì)量深度監(jiān)測制度, 強(qiáng)化公共數(shù)據(jù)的質(zhì)量保障。
關(guān)鍵詞: 公共數(shù)據(jù); 數(shù)據(jù)污染; 數(shù)據(jù)質(zhì)量; 數(shù)字行政法
數(shù)字政府需要高質(zhì)量的公共數(shù)據(jù)。 公共數(shù)據(jù)的質(zhì)量缺陷不僅顯著影響個(gè)人和組織的合法權(quán)益、損害相對人依法獲取行政給付、 行政獎勵乃至行政許可的機(jī)會, 更將深刻影響依賴公共數(shù)據(jù)的判斷與決策, 關(guān)涉 “數(shù)據(jù)驅(qū)動型” 政務(wù)決策和公共治理的能力。 “數(shù)據(jù)要素×” 在國家治理和公共行政領(lǐng)域也將發(fā)揮 “杠桿作用” 和 “乘數(shù)效應(yīng)”, 公共數(shù)據(jù)質(zhì)量的提升或下降日益可能產(chǎn)生倍數(shù)乃至指數(shù)級別的正負(fù)面間接影響, 因而保障公共數(shù)據(jù)質(zhì)量必將成為數(shù)字政府建設(shè)的重中之重。
全面保障公共數(shù)據(jù)質(zhì)量并非易事。 某一項(xiàng)特定公共數(shù)據(jù)質(zhì)量的保障任務(wù)或許可以通過運(yùn)動式治理、 集中人力財(cái)力的方式完成, 但對體量極其龐大的公共數(shù)據(jù)穩(wěn)定實(shí)現(xiàn)整體的質(zhì)量保障則需要法律制度的系統(tǒng)性支持。 在未來數(shù)十年間, 已基本可預(yù)見數(shù)字行政過程將逐步取代傳統(tǒng)行政過程,然而行政法學(xué)對于公共數(shù)據(jù)質(zhì)量保障問題尚未給予充分關(guān)注, 導(dǎo)致相關(guān)方面的行政法治建設(shè)缺乏系統(tǒng)和清晰的理論指引。 對此, 強(qiáng)化相關(guān)理論與制度供給刻不容緩。
一、 公共數(shù)據(jù)質(zhì)量缺陷的來源與影響
公共數(shù)據(jù)質(zhì)量缺陷主要是指公共數(shù)據(jù)在適用性、 客觀性、 時(shí)效性等方面的欠缺, 導(dǎo)致數(shù)據(jù)難以被正常利用, 或者存在導(dǎo)致利用數(shù)據(jù)的判斷或計(jì)算結(jié)果偏離正常值的風(fēng)險(xiǎn)。公共數(shù)據(jù)質(zhì)量缺陷來源復(fù)雜, 影響深遠(yuǎn)。 法律治理必須首先辨識相關(guān)缺陷的來源及影響, 方能因事制宜、 精準(zhǔn)施策。
(一) 公共數(shù)據(jù)質(zhì)量缺陷的主要形態(tài)與原因
公共數(shù)據(jù)質(zhì)量缺陷的具體形態(tài)相當(dāng)豐富, 實(shí)踐中廣泛存在的主要缺陷形態(tài)包括數(shù)據(jù)粒度(granularity) 不佳、 時(shí)效性不足、 客觀性與完整性缺失等方面, 其原因則主要包括數(shù)據(jù)收集不當(dāng)、處理鏈條停滯和數(shù)據(jù)污染。
1. 公共數(shù)據(jù)質(zhì)量缺陷的主要形態(tài)
數(shù)據(jù)客觀性與完整性的缺失是公共數(shù)據(jù)質(zhì)量缺陷的最主要形態(tài)。 此種缺陷廣泛存在, 部分?jǐn)?shù)據(jù)的質(zhì)量問題尤為突出。 例如, 四川省廣元市在 2023 年 6 月專項(xiàng)工作開展之初, 住房公積金數(shù)據(jù)的數(shù)據(jù)質(zhì)量評估僅得 48. 66 分, 涉及數(shù)據(jù) 12 萬余條, 數(shù)據(jù)項(xiàng)合格率 92. 43%。 數(shù)據(jù)指標(biāo)合格率僅為 45. 26%。數(shù)據(jù)客觀性缺陷的具體事例可謂隨處可見: 大件運(yùn)輸車輛因軸重等檢測錯(cuò)誤數(shù)據(jù)重復(fù)過磅, 復(fù)檢后數(shù)據(jù)正確, 車輛重新駛?cè)敫咚伲?但初始錯(cuò)誤數(shù)據(jù)未刪除, 導(dǎo)致系統(tǒng)依然誤判為超限數(shù)據(jù)。湖南文理學(xué)院大量學(xué)生的數(shù)據(jù)出現(xiàn)錯(cuò)誤, 多名學(xué)生名下被登記房產(chǎn)信息, 被辦公積金、經(jīng)營許可證, 名下辦結(jié)的業(yè)務(wù)還包括 “出租汽車駕駛員從業(yè)資格注冊” “防雷裝修竣工驗(yàn)收”, 甚至還有 “領(lǐng)養(yǎng)證明” 等。這些基礎(chǔ)性的缺陷廣泛制約著公共數(shù)據(jù)質(zhì)量的提升。
數(shù)據(jù)時(shí)效性不足是影響公共數(shù)據(jù)價(jià)值利用的關(guān)鍵原因。 利用數(shù)據(jù)的本質(zhì)是利用其中的信息,而信息的價(jià)值會隨時(shí)間推移而變化。 盡管時(shí)間推移對于信息價(jià)值變化的影響非常復(fù)雜, 但一般情況下, 信息會伴隨時(shí)間推移而貶值; 反過來, 獲取決策信息的成本通常會隨時(shí)間推移而降低, 因?yàn)樵叫陆男畔⒃绞窍∪焙碗y以獲取。每一項(xiàng)數(shù)據(jù)的價(jià)值時(shí)效性不同, 部分?jǐn)?shù)據(jù)的高價(jià)值時(shí)間窗口非常短, 因而收集和利用 “過期” 數(shù)據(jù)幾乎沒有什么意義。 公共數(shù)據(jù)時(shí)效性不足包括兩個(gè)方面的問題: 一是政府和公共機(jī)構(gòu)獲取的數(shù)據(jù)時(shí)效性不足, 二是公眾可獲取的開放公共數(shù)據(jù)時(shí)效性不足, 后者往往更為常見。 在政務(wù)數(shù)據(jù)開放平臺和統(tǒng)計(jì)部門發(fā)布的數(shù)據(jù)中, 部分?jǐn)?shù)據(jù)已無法發(fā)揮高價(jià)值時(shí)間窗口時(shí)期的價(jià)值。 部分城市的政府?dāng)?shù)據(jù)開放平臺的數(shù)據(jù)更新整體滯后。 另一方面, 不少城市在經(jīng)濟(jì)金融、 勞動就業(yè)、 教育科研、 醫(yī)療衛(wèi)生、 科技創(chuàng)新等關(guān)乎群眾切身利益、 產(chǎn)業(yè)發(fā)展的重要領(lǐng)域的數(shù)據(jù)更新不及時(shí)。 數(shù)據(jù)越接近實(shí)時(shí), 數(shù)據(jù)收集與后續(xù)處理成本越高, 數(shù)據(jù)時(shí)效性不足的問題或許需要通過更強(qiáng)的制度激勵解決。
數(shù)據(jù)粒度不佳是制約公共數(shù)據(jù)利用價(jià)值的另一重要原因。 現(xiàn)實(shí)中的決策往往是基于不完備決策系統(tǒng)進(jìn)行跨數(shù)據(jù)粒度的決策, 而不完備多粒度標(biāo)記決策系統(tǒng)存在最優(yōu)粒度選擇問題。在利用不同粒度信息進(jìn)行挖掘、 判斷和決策時(shí), 需要遵循可證粒度原則 (the principle of justifiable granularity), 這一原則提供了兩個(gè)關(guān)鍵標(biāo)準(zhǔn)用于評估信息粒度的合理性: 覆蓋標(biāo)準(zhǔn)衡量我們所關(guān)心的目標(biāo)信息被信息粒度包含的程度, 特異性標(biāo)準(zhǔn)則表示信息粒度的具體程度, 這兩個(gè)標(biāo)準(zhǔn)在實(shí)踐中往往存在沖突, 難以兼顧。因此, 并非所有公共數(shù)據(jù)都處于最優(yōu)粒度狀態(tài), 數(shù)據(jù)粒度過粗的問題在人口統(tǒng)計(jì)數(shù)據(jù)等公共數(shù)據(jù)中不同程度地存在。數(shù)據(jù)的粒度與數(shù)據(jù)利用需求不匹配往往導(dǎo)致公共數(shù)據(jù)的價(jià)值利用受限。 例如, 傳統(tǒng)交通檢測數(shù)據(jù)由于檢測粒度粗, 只能在單一方面刻畫交叉口的交通需求, 無法全面表征交叉口的交通需求特征, 也為后續(xù)的人工智能訓(xùn)練造成了不便;粗粒度的數(shù)據(jù)難以充分表達(dá)致災(zāi)因子、 孕災(zāi)環(huán)境和承災(zāi)體的時(shí)空差異, 不利于開展區(qū)域精細(xì)尺度極端氣候事件風(fēng)險(xiǎn)識別與評估工作;等等。 提升數(shù)據(jù)粒度亦受成本約束, 很可能同時(shí)增加數(shù)據(jù)采集、 存儲、加工等各種處理成本, 如果采取非自動化方式采集, 還可能增加采集對象的治理負(fù)擔(dān), 因此數(shù)據(jù)粒度不佳的問題在實(shí)踐中并不容易克服。
2. 公共數(shù)據(jù)質(zhì)量缺陷的主要原因
實(shí)踐中, 數(shù)據(jù)收集方式、 工具、 程序以及數(shù)據(jù)來源等方面的缺陷是公共數(shù)據(jù)質(zhì)量缺陷的最主要原因。 數(shù)據(jù)收集缺陷既來源于通過登記、 錄入、 掃描等方式向數(shù)據(jù)庫輸入數(shù)據(jù)過程中人為篡改、處理失誤或操作不規(guī)范等情形, 也來源于通過觀測、 爬取、 檢索等技術(shù)手段獲取的數(shù)據(jù)本身不準(zhǔn)確、 不可靠。 易言之, 數(shù)據(jù)收集缺陷的主要原因包括對象和過程兩方面, 前者是數(shù)據(jù)來源本身的問題, 后者則包括人為惡意影響、 操作規(guī)范欠缺和技術(shù)工具缺陷等。 迄今為止, 數(shù)據(jù)收集缺陷過程中的操作性和技術(shù)性原因可能是導(dǎo)致公共數(shù)據(jù)質(zhì)量缺陷的主要成因, 由此而造成的數(shù)據(jù)連續(xù)性缺失等問題制約了公共數(shù)據(jù)質(zhì)量的提升和保障。 如后續(xù)數(shù)據(jù)清洗和管理不足, 這些缺陷就將伴隨公共數(shù)據(jù)持續(xù)存在。 部分?jǐn)?shù)據(jù)收集任務(wù)涉及跨區(qū)域協(xié)調(diào)難題。 例如, 對保障性住房進(jìn)行數(shù)據(jù)采集相關(guān)流程而言, 由于其在采集相關(guān)數(shù)據(jù)的過程中缺少規(guī)范上的統(tǒng)一, 并且不同區(qū)域及相關(guān)機(jī)構(gòu)之間出現(xiàn) “信息孤島” 等現(xiàn)象, 相互難以進(jìn)行相關(guān)數(shù)據(jù)傳遞, 從而極易導(dǎo)致工作出現(xiàn)重復(fù)化, 不但浪費(fèi)了大量的人力資源, 而且也難以有效保障數(shù)據(jù)采集質(zhì)量。
在數(shù)據(jù)來源導(dǎo)致的質(zhì)量缺陷中, 爬取數(shù)據(jù)的缺陷比較復(fù)雜。 利用技術(shù)工具自動化觀測獲得的數(shù)據(jù), 如果操作規(guī)程及工具本身并無問題, 一般不會在獲取數(shù)據(jù)方面出現(xiàn)明顯缺陷。 爬取數(shù)據(jù)則不然, 爬取的數(shù)據(jù)既有可能本身不真實(shí)、 不可靠, 也有可能被 “投毒”。 特別是利用爬取數(shù)據(jù)訓(xùn)練模型時(shí), 機(jī)器獲得的數(shù)據(jù)中可能隱含著各種形式的后門, 在一定條件下觸發(fā)模型的有害表現(xiàn)。 盡管已有技術(shù)可以協(xié)助模型管理者發(fā)現(xiàn)和凈化被毒害的參數(shù),相關(guān)技術(shù)在不斷變換的攻擊方式面前仍然難言成熟, 并且也將為政務(wù)類領(lǐng)域模型的運(yùn)行帶來不可忽視的安全負(fù)擔(dān)。
在數(shù)字時(shí)代, 數(shù)據(jù)污染正日益成為公共數(shù)據(jù)質(zhì)量缺陷的重要來源。 “數(shù)據(jù)污染” (data contami nation) 主要包含兩種含義: (1) 數(shù)據(jù)集中存在異常值的情況, 這些異常值可能來自由于記錄錯(cuò)誤、 在非標(biāo)準(zhǔn)或預(yù)期條件下進(jìn)行測量而產(chǎn)生的觀測值;(2) (人工智能模型訓(xùn)練時(shí)) 任何違反在實(shí)驗(yàn)規(guī)程中對數(shù)據(jù)集嚴(yán)格控制要求的情況, 包括指導(dǎo)方針污染、 文本污染和注釋污染等。此外,訓(xùn)練數(shù)據(jù)中可能包含測試數(shù)據(jù)的情形也經(jīng)常被作為大模型的數(shù)據(jù)污染討論, 但不在本文的研究范圍。 前述兩種情形都有可能對公共數(shù)據(jù)質(zhì)量造成影響, 而以數(shù)據(jù)集記錄錯(cuò)誤、 被人為篡改或發(fā)生處理失誤之情形為甚。
人為篡改、 刪除和網(wǎng)絡(luò)攻擊都可以被視為對公共數(shù)據(jù)的污染。 如果未經(jīng)授權(quán)的人或系統(tǒng)對數(shù)據(jù)進(jìn)行了更改, 無論是故意還是意外, 都可能導(dǎo)致數(shù)據(jù)完整度 (integrity) 喪失, 不僅直接影響相對人和利害關(guān)系人的合法權(quán)益, 也可能導(dǎo)致繼續(xù)使用受污染的系統(tǒng)或損壞的數(shù)據(jù)形成不準(zhǔn)確的判斷或決策。外部攻擊導(dǎo)致的公共數(shù)據(jù)污染則早已不乏實(shí)例, 如 2023 年 9 月斯里蘭卡政府云系統(tǒng)遭受一次大規(guī)模勒索軟件攻擊, 導(dǎo)致長達(dá)三個(gè)多月的公共數(shù)據(jù)永久丟失;2017 年蘭州公安部門破獲公安部督辦網(wǎng)安專案, 打掉了一支通過入侵政府網(wǎng)站、 非法寫入人員信息并制販假證的犯罪團(tuán)伙。犯罪嫌疑人共入侵政府網(wǎng)站獲取管理員身份信息 3000 多條、 非法寫入辦理假證人員信息 7. 3 萬余條, 涉及甘肅、 青海等 28 個(gè)省市、 自治區(qū)的 90 余個(gè)政府網(wǎng)站。此種情形下, 數(shù)據(jù)污染與網(wǎng)絡(luò)安全問題交織, 更考驗(yàn)防治責(zé)任主體的技術(shù)能力與管理水平。
在大模型時(shí)代, 對公共數(shù)據(jù)的污染并不一定僅針對數(shù)據(jù)處理系統(tǒng)、 平臺及傳輸數(shù)據(jù)的網(wǎng)絡(luò)節(jié)點(diǎn)進(jìn)行, 面向人工智能模型的 “數(shù)據(jù)投毒” 更具技術(shù)性, 也在風(fēng)險(xiǎn)治理上更具挑戰(zhàn)。 “數(shù)據(jù)投毒”和數(shù)據(jù)集中的后門植入可以惡意影響乃至在特定條件下操縱大模型的表現(xiàn)。無論是基于開源還是閉源模型研發(fā)的政務(wù)類領(lǐng)域模型, 此種后門在模型研發(fā)或更新參數(shù)時(shí)就已經(jīng)留存、 潛伏, 待滿足一定條件后再發(fā)動攻擊。 此種隱蔽的攻擊為未來公共數(shù)據(jù)質(zhì)量保障造成了不可忽視的潛在挑戰(zhàn)。
上述種種可能影響公共數(shù)據(jù)價(jià)值可靠、 充分利用的情形, 都可以被籠統(tǒng)地歸納為 “公共數(shù)據(jù)質(zhì)量缺陷”。 這一包羅甚廣的概念為公共數(shù)據(jù)質(zhì)量缺陷的治理帶來了認(rèn)知上的含混和復(fù)雜性, 系統(tǒng)性梳理公共數(shù)據(jù)質(zhì)量缺陷的影響尤為棘手。
(二) 公共數(shù)據(jù)質(zhì)量缺陷的主要影響
由于公共數(shù)據(jù)質(zhì)量缺陷來源多樣, 產(chǎn)生影響的路徑和特點(diǎn)自然亦有所差別。 整體上, 公共數(shù)據(jù)質(zhì)量缺陷導(dǎo)致對組織、 個(gè)人合法權(quán)益和社會公共利益的侵害路徑相當(dāng)復(fù)雜, 需要根據(jù)影響鏈條的不同而區(qū)分對待。
1. 直接影響
公共數(shù)據(jù)質(zhì)量缺陷很有可能直接導(dǎo)致侵害相對人權(quán)益的結(jié)果。 直接的侵害結(jié)果是對相對人合法權(quán)益的證實(shí)和行使形成障礙 (需要通過一定程序修正數(shù)據(jù)再維護(hù)權(quán)益)。 在修正數(shù)據(jù)不影響后續(xù)權(quán)益正常取得和行使的情況下, 數(shù)據(jù)質(zhì)量缺陷對相對人的影響就僅限于直接影響, 即行權(quán)成本的提升, 此種成本并不僅僅是可直接計(jì)量的一般性時(shí)間消耗, 因?yàn)樵诩m正數(shù)據(jù)缺陷、 維護(hù)自身權(quán)益而額外付出的時(shí)間可能是臨時(shí)加急 “征調(diào)” 的時(shí)間, 此種時(shí)間對比可計(jì)劃的時(shí)間安排而言, 經(jīng)常包含更高的機(jī)會成本。 如果數(shù)據(jù)難以被修正, 或者修正所需時(shí)間成本過高, 導(dǎo)致某些需要一定時(shí)效性的重要關(guān)聯(lián)權(quán)益喪失, 則可能產(chǎn)生更強(qiáng)的直接影響。 如果行權(quán)障礙已經(jīng)實(shí)質(zhì)性地導(dǎo)致關(guān)聯(lián)權(quán)益喪失, 此種后果亦可被認(rèn)為屬于數(shù)據(jù)質(zhì)量缺陷的直接影響。
2. 間接影響
數(shù)據(jù)質(zhì)量缺陷的間接影響包括對利害關(guān)系人合法權(quán)益的影響和對公共利益的影響。 對利害關(guān)系人的間接影響主要存在于相關(guān)數(shù)據(jù)表征前置性法律關(guān)系或法律狀態(tài)的情形, 并不限于多階段行政行為中的前置性階段, 也不限于個(gè)人信息處理場景。 例如, 錯(cuò)誤的犯罪記錄可能導(dǎo)致相對人的近親屬就業(yè)受影響; 公共信用信息數(shù)據(jù)的污染不僅可能導(dǎo)致相對人 “被失信”, 也有可能侵害其子女的受教育權(quán)益, 同樣, 此種污染不僅可能導(dǎo)致相關(guān)企業(yè)信用評級的異常下降, 也可能在特定條件下恰好導(dǎo)致政府采購因此失去理論上最優(yōu)的商品和服務(wù)來源。 《中華人民共和國個(gè)人信息保護(hù)法》 (以下簡稱 《個(gè)人信息保護(hù)法》 ) 和 《中華人民共和國政府信息公開條例》 (以下簡稱 《政府信息公開條例》 ) 等賦予信息主體自身以更正權(quán), 但受間接影響的其他利害相關(guān)方則難以尋求救濟(jì), 尤其當(dāng)此種質(zhì)量缺陷并未構(gòu)成對第三方主觀公權(quán)利的侵害而僅影響 “反射利益” 時(shí)更是如此。 理論上, 只要某一行政決定的作出需要先查詢某一數(shù)據(jù)庫或信息平臺, 都有可能受數(shù)據(jù)質(zhì)量缺陷的間接影響。
數(shù)據(jù)質(zhì)量缺陷對于公共利益的影響更為深遠(yuǎn), 大數(shù)據(jù)分析、 數(shù)據(jù)驅(qū)動決策乃至政務(wù)類領(lǐng)域模型的表現(xiàn)都受其影響。 在數(shù)據(jù)存在污染的情形下, 樣本的統(tǒng)計(jì)特性不能被準(zhǔn)確呈現(xiàn), 關(guān)鍵決策依據(jù)也可能出錯(cuò), 從而至少使得模型更加復(fù)雜、 計(jì)算成本更高,嚴(yán)重情況下會產(chǎn)生方向性的偏離乃至錯(cuò)誤。 存在質(zhì)量缺陷的數(shù)據(jù)被模型學(xué)習(xí)后, 可能干擾模型的正常表現(xiàn), 這在對數(shù)據(jù)質(zhì)量要求較高的領(lǐng)域模型中影響尤其突出。 如果數(shù)據(jù)質(zhì)量缺陷僅限于個(gè)別數(shù)據(jù), 尚可通過穩(wěn)健設(shè)計(jì)等技術(shù)方案進(jìn)行彌補(bǔ); 但如果缺陷已經(jīng)影響到數(shù)據(jù)的統(tǒng)計(jì)特征, 對依賴數(shù)據(jù)的判斷或決策準(zhǔn)確度可能造成不易防范的損害。
根據(jù)特定時(shí)空的數(shù)據(jù)質(zhì)量水準(zhǔn)和經(jīng)驗(yàn)性的證據(jù), 為防范數(shù)據(jù)質(zhì)量缺陷而付出的成本同樣也可以被理解為數(shù)據(jù)質(zhì)量缺陷的間接影響。 即便不存在數(shù)據(jù)的真實(shí)性、 準(zhǔn)確性問題, 數(shù)據(jù)精度和完整度等問題也會產(chǎn)生此方面的影響, 因?yàn)槠浒瞬煌潭鹊男畔⑾∪?(scarcity of information)。 過于雜亂而無法高效分析的信息稀缺往往不會隨著更多信息的產(chǎn)生而消失, 而是需要投入決策資源來整理和理解信息。隨著公共數(shù)據(jù)體量的快速增長, 保持?jǐn)?shù)據(jù)質(zhì)量的算力、 時(shí)間、 技術(shù)和人力成本將日益不可忽略, 在數(shù)據(jù)質(zhì)量缺陷問題頻發(fā)時(shí), 安全冗余可能會被提升, 數(shù)據(jù)安全相關(guān)開銷和負(fù)擔(dān)即相應(yīng)增長。 當(dāng)然, 此種間接影響能夠一定程度上消除由于缺陷造成的其他直接和間接影響,因而是相對應(yīng)追求的選擇。
數(shù)字政府建設(shè)必須充分考慮公共數(shù)據(jù)質(zhì)量缺陷的直接和間接影響, 但并不需要追求完全消除這些風(fēng)險(xiǎn)和影響, 只能盡量將其限制在可接受的水平。 關(guān)鍵是如何通過法律制度構(gòu)筑數(shù)據(jù)質(zhì)量保障的 “基礎(chǔ)防線”, 結(jié)構(gòu)化地維持較高水準(zhǔn)的公共數(shù)據(jù)質(zhì)量, 這對于缺乏相應(yīng)法學(xué)理論支持的數(shù)字政府基礎(chǔ)法律制度而言, 尚屬有一定難度的考驗(yàn)。
二、 公共數(shù)據(jù)質(zhì)量保障實(shí)踐評析: 規(guī)范依據(jù)與現(xiàn)實(shí)舉措
在數(shù)字政府建設(shè)和數(shù)據(jù)要素利用進(jìn)程中, 數(shù)據(jù)質(zhì)量問題不可避免備受關(guān)注。 盡管這一進(jìn)程方興未艾, 我國相關(guān)法律規(guī)范已開始持續(xù)體現(xiàn)對公共數(shù)據(jù)質(zhì)量保障的重視, 也已就數(shù)據(jù)質(zhì)量保障采取若干舉措, 但仍需要進(jìn)一步加強(qiáng)數(shù)據(jù)質(zhì)量保障, 充分應(yīng)對未來數(shù)字政府、 智慧政務(wù)和智慧城市建設(shè)對公共數(shù)據(jù)質(zhì)量的需求。
(一) 規(guī)范依據(jù)
公共數(shù)據(jù)質(zhì)量保障的法律依據(jù)在中央與地方層面已陸續(xù)出現(xiàn)。 在中央層面, 法律、 行政法規(guī)及部門規(guī)章對公共數(shù)據(jù)質(zhì)量保障的關(guān)注度尚屬有限。 《中華人民共和國統(tǒng)計(jì)法》 等法律規(guī)范雖然已經(jīng)注意到數(shù)據(jù)質(zhì)量問題, 但還沒有應(yīng)用相關(guān)術(shù)語和技術(shù)體系。 行政法規(guī)層面首次提及 “數(shù)據(jù)質(zhì)量” 當(dāng)屬 2000 年 《第五次人口普查辦法》, 但僅有一條簡單的總則式規(guī)定。 2004 年制定的 《全國經(jīng)濟(jì)普查條例》 兩處提及 “數(shù)據(jù)質(zhì)量”, 并在其第 28 條專門規(guī)定: “地方各級經(jīng)濟(jì)普查機(jī)構(gòu)應(yīng)當(dāng)根據(jù)國務(wù)院經(jīng)濟(jì)普查領(lǐng)導(dǎo)小組辦公室的統(tǒng)一規(guī)定, 建立經(jīng)濟(jì)普查數(shù)據(jù)質(zhì)量控制崗位責(zé)任制, 并對經(jīng)濟(jì)普查實(shí)施中的每個(gè)環(huán)節(jié)實(shí)行質(zhì)量控制和檢查驗(yàn)收?!?這一規(guī)定可謂早年公共數(shù)據(jù)質(zhì)量保障方面的代表性規(guī)定。 其后, 統(tǒng)計(jì)調(diào)查方面的法律規(guī)范中有關(guān)數(shù)據(jù)質(zhì)量保障的內(nèi)容日漸豐富和精細(xì), 但在統(tǒng)計(jì)調(diào)查工作之外, 中央層面法律、 法規(guī)中對公共數(shù)據(jù)質(zhì)量的關(guān)注仍然有限。 值得注意的是,2024 年 1 月公布的 《碳排放權(quán)交易管理暫行條例》 第 11 條第 1 款對公共數(shù)據(jù)質(zhì)量控制進(jìn)行了精細(xì)的規(guī)定: “重點(diǎn)排放單位應(yīng)當(dāng)……制定并嚴(yán)格執(zhí)行溫室氣體排放數(shù)據(jù)質(zhì)量控制方案, 使用依法經(jīng)計(jì)量檢定合格或者校準(zhǔn)的計(jì)量器具開展溫室氣體排放相關(guān)檢驗(yàn)檢測, 如實(shí)準(zhǔn)確統(tǒng)計(jì)核算本單位溫室氣體排放量……” 這一規(guī)定表明政府已關(guān)注到部分公共數(shù)據(jù)源頭的質(zhì)量問題, 并以法治化的方式規(guī)范 “源頭治理” 的需求。
在地方層面, 不少地方性法規(guī)和地方政府規(guī)章已經(jīng)意識到公共數(shù)據(jù) (包括政務(wù)數(shù)據(jù)) 質(zhì)量保障的重要性。 早在 2020 年, 《浙江省數(shù)字經(jīng)濟(jì)促進(jìn)條例》 第 20 條就對公共數(shù)據(jù)質(zhì)量保障作出專門規(guī)定。 2021 年較有影響力的兩部法規(guī)——— 《上海市數(shù)據(jù)條例》 和 《深圳經(jīng)濟(jì)特區(qū)數(shù)據(jù)條例》 都關(guān)注到公共數(shù)據(jù)質(zhì)量問題。 2021 年通過的 《上海市數(shù)據(jù)條例》 多條提及數(shù)據(jù)質(zhì)量管理, 其中第 35條要求 “建立健全本系統(tǒng)、 行業(yè)公共數(shù)據(jù)質(zhì)量管理體系” 及 “組織開展公共數(shù)據(jù)的質(zhì)量監(jiān)督, 對數(shù)據(jù)質(zhì)量進(jìn)行實(shí)時(shí)監(jiān)測和定期評估, 并建立異議與更正管理制度?!?第 73 條又將數(shù)據(jù)質(zhì)量管理列入長三角區(qū)域數(shù)據(jù)標(biāo)準(zhǔn)化體系建設(shè)中需要建立的 “基礎(chǔ)性標(biāo)準(zhǔn)和規(guī)范” 之范圍。 類似地, 《深圳經(jīng)濟(jì)特區(qū)數(shù)據(jù)條例》 也多處涉及公共數(shù)據(jù)質(zhì)量保障, 其第 39 條專門規(guī)定: “市政務(wù)服務(wù)數(shù)據(jù)管理部門應(yīng)當(dāng)組織制定公共數(shù)據(jù)質(zhì)量管理制度和規(guī)范, 建立健全質(zhì)量監(jiān)測和評估體系, 并組織實(shí)施。公共管理和服務(wù)機(jī)構(gòu)應(yīng)當(dāng)按照公共數(shù)據(jù)質(zhì)量管理制度和規(guī)范, 建立和完善本機(jī)構(gòu)數(shù)據(jù)質(zhì)量管理體系, 加強(qiáng)數(shù)據(jù)質(zhì)量管理, 保障數(shù)據(jù)真實(shí)、 準(zhǔn)確、 完整、 及時(shí)、 可用……” 同類規(guī)定迅速出現(xiàn)在其后多地的法規(guī)、 規(guī)章條文中, 為地方政府開展公共數(shù)據(jù)質(zhì)量保障工作提供了規(guī)范依據(jù)。
隨著地方性立法對公共數(shù)據(jù)質(zhì)量日益重視, 其中一些理念和措施尤為值得關(guān)注。 在理念層面,2022 年制定的 《浙江省公共數(shù)據(jù)條例》 第 20 條在規(guī)范層面明確提出 “數(shù)據(jù)全流程質(zhì)量管控體系”, 與同年通過的 《重慶市數(shù)據(jù)條例》 《遼寧省大數(shù)據(jù)發(fā)展條例》 《廣西壯族自治區(qū)大數(shù)據(jù)發(fā)展條例》 等法規(guī)中要求建立的 “質(zhì)量檢測和評估體系/ 機(jī)制” 等相得益彰, 為公共數(shù)據(jù)質(zhì)量保障提供了更系統(tǒng)的規(guī)范認(rèn)知依據(jù)。 在措施層面, 《江西省數(shù)據(jù)條例》 《蘇州市數(shù)據(jù)條例》 《杭州城市大腦賦能城市治理促進(jìn)條例》 《北京市公共數(shù)據(jù)專區(qū)授權(quán)運(yùn)營管理辦法 (試行) 》 等規(guī)定了公共數(shù)據(jù)質(zhì)量管控機(jī)制、 數(shù)據(jù)質(zhì)量實(shí)時(shí)監(jiān)測機(jī)制、 異議與更正管理機(jī)制、 數(shù)據(jù)質(zhì)量核查和問題數(shù)據(jù)糾錯(cuò)機(jī)制、 數(shù)據(jù)質(zhì)量逐級倒查反饋機(jī)制等, 為公共數(shù)據(jù)質(zhì)量保障工作提供了更具系統(tǒng)性的規(guī)則集合形式, 便利系列具體規(guī)則的形成和調(diào)整。
(二) 現(xiàn)實(shí)舉措
與上述立法進(jìn)程并行的是各類政策對公共數(shù)據(jù)質(zhì)量問題的重視。 圍繞公共數(shù)據(jù)質(zhì)量的保障與提升, 中央層面已給予高度關(guān)注。 2022 年國務(wù)院辦公廳印發(fā)的 《全國一體化政務(wù)大數(shù)據(jù)體系建設(shè)指南》 (國辦函 〔2022〕 102 號) 明確指出, “政務(wù)云平臺建設(shè)與管理不協(xié)同, 政務(wù)云資源使用率不高, 缺乏一體化運(yùn)營機(jī)制。 政務(wù)數(shù)據(jù)質(zhì)量問題較為突出, 數(shù)據(jù)完整性、 準(zhǔn)確性、 時(shí)效性亟待提升”, 總體上要求 “構(gòu)建完善數(shù)據(jù)全生命周期質(zhì)量管理體系”, 并且提出了一系列具體的目標(biāo)和要求。 2024 年 9 月, 中共中央辦公廳、 國務(wù)院辦公廳又印發(fā)了 《關(guān)于加快公共數(shù)據(jù)資源開發(fā)利用的意見》, 明確要求 “不斷提升政務(wù)數(shù)據(jù)質(zhì)量和管理水平”, 并且專門強(qiáng)調(diào) “強(qiáng)化數(shù)據(jù)源頭治理和質(zhì)量監(jiān)督檢查, 實(shí)現(xiàn)數(shù)據(jù)質(zhì)量可反饋、 使用過程可追溯、 數(shù)據(jù)異議可處置”。 在中央文件的指引下,各地采取了一系列舉措, 展示了地方政府提升公共數(shù)據(jù)質(zhì)量的意向和目標(biāo)。
在提升公共數(shù)據(jù)質(zhì)量的實(shí)踐舉措中, 以下三類尤為值得關(guān)注: 一是數(shù)據(jù)質(zhì)量方面的標(biāo)準(zhǔn)編制。例如, 浙江省杭州市自 2022 年著手制定 “公共數(shù)據(jù)質(zhì)量治理” 系列地方標(biāo)準(zhǔn), 其中 《公共數(shù)據(jù)質(zhì)量治理 第 1 部分: 體系架構(gòu)》 (DB 3301 / T 0364. 1-2022) 明確 “公共數(shù)據(jù)質(zhì)量治理” 是指 “提升公共數(shù)據(jù)質(zhì)量過程中能力建設(shè)、 問題發(fā)現(xiàn)、 數(shù)據(jù)整改、 績效評價(jià)等活動的集合”, 并形成了公共數(shù)據(jù)質(zhì)量治理體系架構(gòu)圖。 這一標(biāo)準(zhǔn)對于全面、 系統(tǒng)地保障公共數(shù)據(jù)質(zhì)量的政務(wù)實(shí)踐而言可謂首開先河。 二是數(shù)據(jù)質(zhì)量保障和提升的專項(xiàng)行動。 例如, 泰州市數(shù)據(jù)局開展 2024 年度公共數(shù)據(jù)質(zhì)量提升攻堅(jiān)行動, 其中包括編制高標(biāo)準(zhǔn)高可用數(shù)據(jù)目錄、 建立數(shù)據(jù)質(zhì)量反饋整改責(zé)任機(jī)制, 建立數(shù)據(jù)異議統(tǒng)一受理通道, 建設(shè)個(gè)人數(shù)據(jù)空間、 企業(yè)數(shù)據(jù)空間、 行業(yè)數(shù)據(jù)空間等主專題庫等措施。前述C 省 G 市專項(xiàng)治理工作開展后, 數(shù)據(jù)質(zhì)量評估得分提升至 59. 5 分, 數(shù)據(jù)項(xiàng)合格率提升至 99. 47%,數(shù)據(jù)指標(biāo)合格率提升至 81. 37%, 問題發(fā)生率降至 0. 03%。三是數(shù)據(jù)質(zhì)量保障方面的組織建設(shè),如 N 市某區(qū)構(gòu)建 “專班+專人” 的數(shù)據(jù)更新機(jī)制, 區(qū)級成立數(shù)據(jù)管理專班, 各數(shù)據(jù)提供單位安排專人負(fù)責(zé)按時(shí)按質(zhì)完成數(shù)據(jù)更新, 專班直接將數(shù)據(jù)要求和整改意見直接通知到專人。 ③相關(guān)舉措對數(shù)據(jù)質(zhì)量的保障和提升已經(jīng)產(chǎn)生了積極的效果。
整體上, 我國已經(jīng)形成公共數(shù)據(jù)質(zhì)量保障從法律規(guī)范、 技術(shù)標(biāo)準(zhǔn)到政策文件的一系列制度化要求, 也積累了數(shù)據(jù)質(zhì)量保障的有益經(jīng)驗(yàn)。 在此基礎(chǔ)上, 解決公共數(shù)據(jù)質(zhì)量保障的若干關(guān)鍵共性難題是建立完備制度保障的重要前提。
三、 公共數(shù)據(jù)質(zhì)量保障的進(jìn)路: 通過設(shè)計(jì)的精細(xì)保障
前述法律與政策實(shí)踐盡管已取得一定進(jìn)展, 但整個(gè)公共數(shù)據(jù)質(zhì)量保障體系尚未全面建立, 而三個(gè)關(guān)鍵問題仍然有待解決: 一是數(shù)據(jù)質(zhì)量保障相關(guān)法律關(guān)系的清晰界定; 二是質(zhì)量維護(hù)途徑與法益影響結(jié)構(gòu)的精準(zhǔn)匹配; 三是數(shù)據(jù)質(zhì)量監(jiān)控體系的深度擴(kuò)展。 這幾個(gè)問題頗為棘手, 或許都需要在 “通過設(shè)計(jì)的精細(xì)保障” 這一進(jìn)路中得到解決。
(一) 保障進(jìn)路的待決難題: 法律關(guān)系、 維護(hù)途徑與監(jiān)控體系
國內(nèi)公共數(shù)據(jù)質(zhì)量保障法律與政策實(shí)踐表明, “數(shù)據(jù)質(zhì)量” 系列術(shù)語正日漸超越統(tǒng)計(jì)管理領(lǐng)域, 而法律和政策在數(shù)據(jù)缺陷治理方面正在由過去的 “信息維護(hù)范式” 轉(zhuǎn)變?yōu)?“數(shù)據(jù)質(zhì)量管理范式”。 然而, 此種新的范式尚未全面進(jìn)入公法學(xué)視野, 無論是法理層面還是 “技術(shù)—規(guī)則” 層面都仍然存在基礎(chǔ)性的待決難題。
1. 數(shù)據(jù)質(zhì)量保障相關(guān)法律關(guān)系的清晰界定
行政法釋義學(xué)尚未發(fā)掘數(shù)據(jù)中潛藏的法律關(guān)系。 如果數(shù)據(jù)可以左右權(quán)利和合法利益的得失或損益, 甚至影響決策方向, 就有必要通過法律關(guān)系確認(rèn)和保障其中值得保護(hù)的法益。 對于其中復(fù)雜的直接與間接影響, 行政法律關(guān)系的結(jié)構(gòu)化功能可以發(fā)揮積極作用, 為不同路徑形成的法律關(guān)系建構(gòu)出一個(gè)層級化的法律關(guān)系秩序?;诨旌戏申P(guān)系 ( gemischte Rechtsverh?ltnisse) 和事物聯(lián)系理論 (Sachzusammenhangstheorie), 基于履行公共職能過程中形成的公共數(shù)據(jù)對公共職能履行的密切關(guān)聯(lián)性以及其中包含的公法義務(wù), 無論具體處理上述公共數(shù)據(jù)的機(jī)構(gòu)為何種機(jī)構(gòu), 這些數(shù)據(jù)法律關(guān)系均宜被認(rèn)定具有公法性質(zhì)。數(shù)據(jù)法律關(guān)系較之傳統(tǒng)法律關(guān)系圖式有其獨(dú)特性: 數(shù)據(jù)是可被復(fù)制的, 而且數(shù)據(jù)利用并不必然需要控制數(shù)據(jù), 許多情況下接觸者僅獲悉其中的信息即足以實(shí)現(xiàn)數(shù)據(jù)利用目的, 因此一項(xiàng)數(shù)據(jù)可能被無限次復(fù)用, 而不同主體的利用對于法律秩序及公共利益目標(biāo)而言利弊多有不同, 其法律關(guān)系必然更多地架設(shè)于使用或利用層面。 對此, 私法研究中已不乏類似洞見,而公法已有類似的制度安排。 例如在德國, 為了有效地保障基本權(quán)利, 數(shù)據(jù)保護(hù)法制要求在利用層面上實(shí)行嚴(yán)格目的限定: 數(shù)據(jù)只能用于其被收集時(shí)的目的 (訪問、 處理和使用期限的目的綁定); 此種目的限定還通過透明度的要求得到保障, 包括通知受影響者、 報(bào)告義務(wù)、文檔義務(wù)以及有效的處理控制 (知情權(quán)、 反對權(quán)、 獨(dú)立的監(jiān)控機(jī)構(gòu)等)。
然而, 當(dāng)前的行政法律關(guān)系理論框架尚較為粗疏, 無論是人/ 物二分還是實(shí)體/ 程序二分, 都難以涵蓋數(shù)據(jù)之上的公法法律關(guān)系。 行政法釋義學(xué)僅僅認(rèn)識到 “數(shù)據(jù)保護(hù)不僅僅是在數(shù)字化電子行政中的特定問題, 而是整個(gè)行政管理領(lǐng)域的事務(wù)”是不夠的, 必須引入適合的法律關(guān)系框架以承載公共數(shù)據(jù)污染治理的制度實(shí)踐需求。 例如, 受數(shù)據(jù)質(zhì)量缺陷影響的組織和個(gè)人應(yīng)有機(jī)會有效參與數(shù)據(jù)質(zhì)量缺陷發(fā)現(xiàn)和修復(fù)過程, 此種道義上的應(yīng)然性需要轉(zhuǎn)化為法律上的請求權(quán) (甚至形成權(quán)和支配權(quán)) 方能在行政法上得以完整展開, 既包括查詢、 校驗(yàn)、 更正乃至一定前提下撤回和刪除的權(quán)利, 也包括未來參與預(yù)防、 發(fā)現(xiàn)和修復(fù)數(shù)據(jù)缺陷的更廣范圍 “權(quán)利束”。 這就要求公法建立某種 “數(shù)據(jù)法律關(guān)系” 的框架, 全面發(fā)現(xiàn)和確認(rèn)數(shù)據(jù)之上承載的法益及影響鏈條, 并通過恰當(dāng)?shù)姆申P(guān)系配置發(fā)揮其 “結(jié)構(gòu)化功能”, 為各類主體防止和消除相應(yīng)負(fù)面影響配置必要的 “程序公權(quán)”, 并確立侵犯相關(guān) “數(shù)據(jù)法益” 的法律責(zé)任, 使公共數(shù)據(jù)質(zhì)量缺陷防范與修復(fù)進(jìn)程在行政法治視野及行政法釋義學(xué)框架內(nèi)進(jìn)行。
2. 質(zhì)量維護(hù)途徑與法益影響結(jié)構(gòu)的合理匹配
基于多元化的法益影響結(jié)構(gòu)和缺陷發(fā)現(xiàn)能力, 公共數(shù)據(jù)質(zhì)量保障需要實(shí)現(xiàn)維護(hù)途徑與法益影響結(jié)構(gòu)的合理匹配。 單純自上而下的公共數(shù)據(jù)質(zhì)量保障進(jìn)路難以妥善、 高效地解決三個(gè)現(xiàn)實(shí)問題:第一, 公共數(shù)據(jù)質(zhì)量保障動力有限。 單憑有限的責(zé)任機(jī)制, 不足以促使負(fù)有相應(yīng)職責(zé)的部門或機(jī)構(gòu)努力發(fā)現(xiàn)和消除數(shù)據(jù)質(zhì)量缺陷, 尤其是僅直接或間接影響個(gè)人、 組織權(quán)益而幾乎不會干擾行政決策的缺陷, 也難以對抗部分情況下人為篡改相關(guān)記錄的利益沖動。 否則很難解釋公共數(shù)據(jù)中的部分錯(cuò)誤記錄何以持續(xù)存在。 第二, 發(fā)現(xiàn)數(shù)據(jù)質(zhì)量缺陷的信息源不足。 僅靠自行檢查并不能充分有效發(fā)現(xiàn)數(shù)據(jù)質(zhì)量缺陷, 尤其是不會引起系統(tǒng)報(bào)錯(cuò)及明顯偏離數(shù)據(jù)分布的缺陷, 也難以發(fā)現(xiàn)數(shù)據(jù)粒度不佳和時(shí)效性不足等往往在數(shù)據(jù)利用過程中暴露的缺陷, 待數(shù)據(jù)質(zhì)量缺陷風(fēng)險(xiǎn)外溢而延及權(quán)益侵害后果或數(shù)據(jù) “空轉(zhuǎn)” 局面發(fā)生時(shí), 很可能為時(shí)已晚。 第三, 應(yīng)對數(shù)據(jù)質(zhì)量缺陷的技術(shù)視野不足。 相關(guān)部門和機(jī)構(gòu)如有條件依托政務(wù)數(shù)據(jù)中臺等系統(tǒng)和數(shù)據(jù)處理工具, 可以應(yīng)對傳統(tǒng)形態(tài)和已預(yù)見的數(shù)據(jù)質(zhì)量缺陷, 但對于新型數(shù)據(jù)質(zhì)量缺陷和攻擊風(fēng)險(xiǎn)的防御能力尚屬有限。 對此, 走向由眾多利益關(guān)聯(lián)方和技術(shù)服務(wù)提供者支持的參與式治理可謂勢在必行。 結(jié)構(gòu)化的參與式治理可以回應(yīng)公共數(shù)據(jù)質(zhì)量保障動力與信息源的不足。 信息和行動能力高度不對稱條件下, 參與式治理正是防范法益遭受隱蔽侵害的關(guān)鍵途徑。 根據(jù)利益的重要性區(qū)分參與程度和形式是公眾參與的重要實(shí)踐經(jīng)驗(yàn)。通過確定特定行政過程涉及或者將要影響的各種利益, 甚至進(jìn)行利益評估與分層, 以便界定相應(yīng)的 “參與強(qiáng)度”, 才能實(shí)現(xiàn)公平、 公正的治理過程。也唯有通過參與式治理, 才可能引入更寬廣的視角和信源, 突破服務(wù)商對公共部門客戶的 “單向透明玻璃”, 尋求數(shù)據(jù)質(zhì)量缺陷的深層防治方案。
不過, 在參與式治理中, 質(zhì)量維護(hù)途徑與法益影響結(jié)構(gòu)的合理匹配并非易事。 行政過程中的參與關(guān)系 (Partizipationsverh?ltnis) 凸顯了當(dāng)事人間的衡平機(jī)制, 但卻在行政計(jì)劃與規(guī)范制定方面呈現(xiàn)出難以用傳統(tǒng)法律關(guān)系思維梳理的復(fù)雜圖景。程序法上的各類衡平機(jī)制缺乏有效的蓋然性量化判斷, 但在數(shù)據(jù)質(zhì)量維護(hù)中卻必須對此予以考慮。 設(shè)想所有利害關(guān)系方 (包括個(gè)人和組織) 均可直接訪問和修改數(shù)據(jù)是不可能的理想化方案。 在保護(hù)合理訪問與修改機(jī)會及效率的同時(shí)也需要防范藉由修改而可能產(chǎn)生的篡改數(shù)據(jù)風(fēng)險(xiǎn)、 不正當(dāng)競爭風(fēng)險(xiǎn)、 侵害個(gè)人信息乃至數(shù)據(jù)安全風(fēng)險(xiǎn)(如竊取其他數(shù)據(jù)、 發(fā)動 SQL 注入攻擊等); 對于受間接影響的利害關(guān)系方而言, 法益影響程度、保護(hù)需求和訪問乃至修改數(shù)據(jù)的風(fēng)險(xiǎn)與成本之間也存在微妙的平衡, 應(yīng)設(shè)置一定的參與門檻和參與路徑以實(shí)現(xiàn)最優(yōu)的行權(quán)效率與風(fēng)險(xiǎn)控制目標(biāo)平衡, 這就需要在參與結(jié)構(gòu)中嵌入精準(zhǔn)的、 細(xì)粒度的權(quán)限控制和風(fēng)險(xiǎn)防控方案。 不僅如此, 對于受數(shù)據(jù)質(zhì)量缺陷影響的公共利益而言, 還需要在復(fù)雜的條塊組織結(jié)構(gòu)中尋求合適的行權(quán)代表和行權(quán)機(jī)制, 盡可能恰如其分地代表受數(shù)據(jù)驅(qū)動型決策影響的多元視角與利益。
3. 數(shù)據(jù)質(zhì)量監(jiān)測體系的深度擴(kuò)展
既有法律規(guī)范與政策實(shí)踐都關(guān)注到了數(shù)據(jù)質(zhì)量監(jiān)測體系, 在技術(shù)視角中, 這對于科學(xué)保障公共數(shù)據(jù)質(zhì)量而言至關(guān)重要, 能否發(fā)現(xiàn)數(shù)據(jù)質(zhì)量存在問題是實(shí)現(xiàn)數(shù)據(jù)質(zhì)量缺陷治理的關(guān)鍵前提。 實(shí)踐中, 數(shù)據(jù)質(zhì)量監(jiān)控體系正在走向成熟, 數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)、 數(shù)據(jù)感知工具、 數(shù)據(jù)剖析工具、 數(shù)據(jù)驗(yàn)證工具、 數(shù)據(jù)清洗工具、 血緣追蹤 (Lineage Tracking) 工具、 比對校驗(yàn)工具、 元數(shù)據(jù)管理工具等已逐漸完備并在數(shù)據(jù)倉庫等系統(tǒng)中集成。 公法制度接納日漸成熟的技術(shù)系統(tǒng)而構(gòu)建數(shù)據(jù)質(zhì)量監(jiān)控體系并非難題, 關(guān)鍵是如何確保公共數(shù)據(jù)處理和利用的全過程始終在法治框架內(nèi)接受數(shù)據(jù)質(zhì)量監(jiān)控體系的保障, 其中首要難題也是公共數(shù)據(jù)監(jiān)測體系的發(fā)展。 制約這一目標(biāo)實(shí)現(xiàn)的主要因素不僅有公共數(shù)據(jù)的廣泛分散, 系統(tǒng)配置與運(yùn)行成本壓力, 還包括公共數(shù)據(jù)處理的規(guī)模化發(fā)展、 數(shù)據(jù)污染途徑和數(shù)據(jù)污染發(fā)現(xiàn)與防御手段的持續(xù)升級迭代。 這就需要建設(shè)動態(tài)發(fā)展的專門性機(jī)制實(shí)現(xiàn)復(fù)雜條件下大規(guī)模、 分散化的公共數(shù)據(jù)質(zhì)量監(jiān)測任務(wù)。 此種專門性機(jī)制應(yīng)當(dāng)有能力從紛繁復(fù)雜的巨大體量的數(shù)據(jù)中全方位挖掘數(shù)據(jù)質(zhì)量信息, 深入發(fā)現(xiàn)可能存在的質(zhì)量缺陷, 并為此提供進(jìn)一步定位和治理缺陷的路徑與建議。
前述種種待決難題要求數(shù)據(jù)質(zhì)量保障制度具有顯著的開放性、 精確性與技術(shù)性, 這就需要一條能夠充分連接法律規(guī)則與技術(shù)架構(gòu)的數(shù)據(jù)質(zhì)量保障進(jìn)路, 并由數(shù)據(jù)質(zhì)量保障相關(guān)法律制度給予認(rèn)可與支持。
(二) 通過設(shè)計(jì)的精細(xì)保障: 基本理念與技術(shù)支持
上述所有待解決難題的 “解題之道” 都指向這樣一個(gè)規(guī)則體系: 能夠有效識別公共數(shù)據(jù)的法益影響鏈條并確認(rèn)不同主體在不同條件下的請求權(quán)、 形成權(quán)與支配權(quán), 進(jìn)而為此配置恰當(dāng)?shù)脑L問與更正權(quán)限; 能夠有效容納開放性的數(shù)據(jù)利用與質(zhì)量監(jiān)測需求并提供確定性的回應(yīng)與反饋鏈路;能夠追溯和防控質(zhì)量缺陷治理過程中的數(shù)據(jù)安全風(fēng)險(xiǎn)。 通過 “法律 3. 0” 的模式,此種規(guī)則體系可以基于一定的技術(shù)設(shè)計(jì)集成化、 精細(xì)化實(shí)現(xiàn)。 對于此種融合法律規(guī)則與技術(shù)支持的融合式設(shè)計(jì),已有 “通過設(shè)計(jì)的隱私” (privacy by design) “通過設(shè)計(jì)的保護(hù)” (protection by design) 等系列實(shí)踐。公共數(shù)據(jù)質(zhì)量保障的進(jìn)路, 也可以類似地表述為 “通過設(shè)計(jì)的精細(xì)保障”。 這一進(jìn)路的基本理念是盡可能通過技術(shù)機(jī)制精細(xì)地在實(shí)現(xiàn)數(shù)據(jù)質(zhì)量保障需求時(shí)控制伴生風(fēng)險(xiǎn), 使基于不同法律關(guān)系和法益影響的各類權(quán)能可以在數(shù)據(jù)質(zhì)量控制體系內(nèi)部高效精準(zhǔn)行使。
這一進(jìn)路除基礎(chǔ)性的權(quán)益確認(rèn)工作外, 各種數(shù)據(jù)質(zhì)量缺陷發(fā)現(xiàn)與治理措施都可以陸續(xù)集成到整個(gè)數(shù)據(jù)質(zhì)量保障體系中來。 數(shù)據(jù)和算法技術(shù)的發(fā)展已為此準(zhǔn)備了必要條件。 除常規(guī)的感知、 清洗、 剖析、 驗(yàn)證、 追蹤、 校驗(yàn)、 容災(zāi)備份、 自動恢復(fù)、 權(quán)限控制、 審計(jì)軌跡等工具外, 即便是一些比較棘手的數(shù)據(jù)質(zhì)量問題, 也有了針對性的發(fā)現(xiàn)和保障技術(shù), 同時(shí)一系列有助于減輕數(shù)據(jù)質(zhì)量缺陷對數(shù)據(jù)驅(qū)動決策影響的技術(shù)亦可集成到這一體系中。 例如矩陣恢復(fù)算法能夠?qū)仃嚁?shù)據(jù)作補(bǔ)全或去噪處理;穩(wěn)健設(shè)計(jì)可以通過選擇最優(yōu)參數(shù)組合或者改變估計(jì)方法來減少系統(tǒng)對噪聲變化的敏感性, 從而達(dá)到減少系統(tǒng)性能波動的目的。
通過設(shè)計(jì)的精細(xì)保障要求在公共數(shù)據(jù)處理系統(tǒng)或平臺設(shè)計(jì)時(shí)即預(yù)留上述技術(shù)工具的加載空間和途徑, 待相關(guān)技術(shù)工具應(yīng)用條件成熟時(shí)逐步加入數(shù)據(jù)處理過程。 對于公共數(shù)據(jù)處理與利用的一般場景, 法律規(guī)范只需要就公共數(shù)據(jù)質(zhì)量保障過程規(guī)定若干基礎(chǔ)性規(guī)則, 例如同政府部門和公共機(jī)構(gòu)的數(shù)據(jù)匯聚后, 對數(shù)據(jù)真實(shí)性和準(zhǔn)確性 (或客觀性與完整性) 存在異議的, 應(yīng)當(dāng)有暢通的渠道和機(jī)制接受投訴, 數(shù)據(jù)處理平臺應(yīng)當(dāng)就此專門設(shè)置數(shù)據(jù)校核請求權(quán)和數(shù)據(jù)更正請求權(quán)的行使途徑;對于某些易被污染或質(zhì)量缺陷高發(fā)的公共數(shù)據(jù)系統(tǒng), 需要通過技術(shù)標(biāo)準(zhǔn)確認(rèn)專門的檢測方法、 過程和指標(biāo),實(shí)行數(shù)據(jù)質(zhì)量實(shí)時(shí)或定期檢測。 進(jìn)一步的質(zhì)量控制與保障要求 (尤其是數(shù)據(jù)利用層面對時(shí)效性和顆粒度的要求) 可以訴諸法律規(guī)范指向的相關(guān)技術(shù)標(biāo)準(zhǔn)。 對于數(shù)據(jù)質(zhì)量保障及數(shù)據(jù)安全需求較高的場景, 法律、 法規(guī)或規(guī)章應(yīng)針對性地作出專門規(guī)定, 包括質(zhì)量保障目標(biāo)、 主要措施與制定和完善相關(guān)標(biāo)準(zhǔn)的授權(quán)。
通過設(shè)計(jì)的精細(xì)保障進(jìn)路與未來政務(wù)云平臺建設(shè)和全國一體化政務(wù)大數(shù)據(jù)體系的形成趨勢是相符的。 2022 年, 國務(wù)院發(fā)布 《國務(wù)院關(guān)于加強(qiáng)數(shù)字政府建設(shè)的指導(dǎo)意見》 (國發(fā) 〔2022〕 14號, 以下簡稱 《指導(dǎo)意見》 ), 明確要求 “依托全國一體化政務(wù)大數(shù)據(jù)體系, 統(tǒng)籌整合現(xiàn)有政務(wù)云資源, 構(gòu)建全國一體化政務(wù)云平臺體系, 實(shí)現(xiàn)政務(wù)云資源統(tǒng)籌建設(shè)、 互聯(lián)互通、 集約共享。 國務(wù)院各部門政務(wù)云納入全國一體化政務(wù)云平臺體系統(tǒng)籌管理。 各地區(qū)按照省級統(tǒng)籌原則開展政務(wù)云建設(shè), 集約提供政務(wù)云服務(wù)。 ……” 盡管 《指導(dǎo)意見》 中的要求未必迅速成為現(xiàn)實(shí), 但客觀需求和發(fā)展規(guī)律使政務(wù)云建設(shè)勢在必行。 隨著公共數(shù)據(jù)體量的日漸龐大、 計(jì)算開銷的大幅增長、 智慧政務(wù)的持續(xù)發(fā)展、 數(shù)據(jù)安全要求的不斷提高以及云原生技術(shù)的成熟, 政務(wù)數(shù)據(jù)乃至更大范圍內(nèi)的公共數(shù)據(jù)不斷 “上云” 集約處理當(dāng)屬大勢所趨。 云平臺對于精細(xì)劃分權(quán)限、 多用戶多任務(wù)并發(fā)處理、 保留訪問和操作記錄等已可謂駕輕就熟, 并不需要成本高昂的額外軟硬件工具即可實(shí)現(xiàn)大部分精細(xì)保護(hù)需求, 還可以內(nèi)置一般性的及按需定制的數(shù)據(jù)質(zhì)量監(jiān)測模塊, 為不同權(quán)限的使用者對相關(guān)數(shù)據(jù)實(shí)施質(zhì)量監(jiān)測提供便利。 由此, 在技術(shù)條件日益成熟的前提下, 如何通過合理的法律制度支持 “通過設(shè)計(jì)的精細(xì)保障” 即為問題之關(guān)鍵。
四、 公共數(shù)據(jù)質(zhì)量保障的基礎(chǔ)性制度設(shè)計(jì)
通過設(shè)計(jì)的精細(xì)保障在邏輯上要求先明確 “保護(hù)什么”, 繼而回應(yīng) “誰來保護(hù)” 的問題, 隨后解決 “如何保護(hù)” 的具體措施安排, 這就要求公共數(shù)據(jù)質(zhì)量保障方面的法律規(guī)范包含若干關(guān)鍵基礎(chǔ)性制度設(shè)計(jì), 形成質(zhì)量保障制度的核心架構(gòu), 進(jìn)而在實(shí)踐探索中逐漸引入更為豐富的規(guī)則和標(biāo)準(zhǔn), 形成日益完備的數(shù)據(jù)質(zhì)量保障體系。 “保護(hù)什么” 意味著首先需要確認(rèn)受公共數(shù)據(jù)質(zhì)量影響的法益; “誰來保護(hù)” 要求建立結(jié)構(gòu)化的參與式治理制度; “如何保護(hù)” 則需要全面吸納不斷發(fā)展的數(shù)據(jù)質(zhì)量保障技術(shù), 探索建立能夠應(yīng)對不同場景下海量分散公共數(shù)據(jù)質(zhì)量監(jiān)控任務(wù)的規(guī)則和機(jī)制。
(一) 公共數(shù)據(jù)法益確認(rèn)制度
公共數(shù)據(jù)法益確認(rèn)制度既有助于為保障數(shù)據(jù)質(zhì)量提供動力, 也有助于保護(hù)受數(shù)據(jù)質(zhì)量缺陷影響的法益。 行政法釋義學(xué)并未對受公共數(shù)據(jù)質(zhì)量缺陷影響的法益提供現(xiàn)成的法理, 相關(guān)法益的辨識和確認(rèn)需要探索合適的認(rèn)知架構(gòu)。 總體上, 受公共數(shù)據(jù)質(zhì)量缺陷影響且法律予以保護(hù)的利益有兩個(gè)方面: 一是政府和公共機(jī)構(gòu)利用數(shù)據(jù)處理相關(guān)事務(wù)的相對人, 數(shù)據(jù)表征了相對人在 “數(shù)字空間” 中的某種狀態(tài); 二是各類用戶利用開放公共數(shù)據(jù)或公共數(shù)據(jù)授權(quán)運(yùn)營產(chǎn)品、 服務(wù)可能依法獲取的經(jīng)濟(jì)利益。 前一種利益包含了傳統(tǒng)實(shí)體法益、 程序法益和個(gè)人信息保護(hù)方面的法益, 數(shù)據(jù)質(zhì)量方面的缺陷可以影響當(dāng)事人的法律狀態(tài), 導(dǎo)致相關(guān)數(shù)據(jù)表征的法益遭受風(fēng)險(xiǎn), 可以借鑒德國法上保護(hù)個(gè)人或法人已經(jīng)擁有的法律地位或權(quán)利的 “維持現(xiàn)狀利益” (Bestandsinteresse) 而稱之為“狀態(tài)法益”。 后一種利益則包含了數(shù)據(jù)利用活動本可能產(chǎn)生的正當(dāng)利益, 本質(zhì)上來源于數(shù)據(jù)的使用, 可以稱之為 “使用法益”。 公共數(shù)據(jù)相關(guān)法益的確認(rèn)應(yīng)該涵蓋狀態(tài)法益和使用法益。
對于狀態(tài)法益而言, 直接影響所對應(yīng)的狀態(tài)法益只需要概括性的法律規(guī)則即可確認(rèn), 《個(gè)人信息保護(hù)法》 和 《政府信息公開條例》 等法律法規(guī)甚至提供了部分直接行權(quán)途徑。 不過, 既有法律法規(guī)的規(guī)定均僅針對個(gè)人或組織自身的信息, 而不及于其他主體可能與特定個(gè)人或組織存在利害關(guān)系的信息, 因此關(guān)鍵是如何確認(rèn)受間接影響的狀態(tài)法益。 對此, 需要全面辨識現(xiàn)行法律制度中各類超出個(gè)人或機(jī)構(gòu)自身意志控制范圍的確定性和高度蓋然性連帶影響 (如犯罪記錄對近親屬就業(yè)的影響、 “董監(jiān)高” 違法犯罪記錄對企業(yè)上市和股票發(fā)行的影響、 特定職業(yè)禁入和禁止參與特定業(yè)務(wù)名單對部分單位正常開展業(yè)務(wù)的影響等), 包括公法和私法上各種連帶義務(wù)、 連帶責(zé)任、 連帶性權(quán)利取得與行使條件以及其他形態(tài)的利害關(guān)系, 并為此專門列舉行使數(shù)據(jù)質(zhì)量缺陷修復(fù)請求權(quán)的前提條件, 支持狀態(tài)法益受間接影響的主體維護(hù)合法權(quán)益。 確認(rèn)受直接和間接影響的狀態(tài)法益, 將為利害相關(guān)方參與維護(hù)數(shù)據(jù)的客觀性、 完整性充分暢通權(quán)益保障與救濟(jì)渠道。
對于使用法益而言, 公共數(shù)據(jù)質(zhì)量的缺陷將不同程度上影響用戶利用開放公共數(shù)據(jù)或授權(quán)運(yùn)營數(shù)據(jù)產(chǎn)品、 服務(wù)的經(jīng)濟(jì)收益。 受使用法益影響的主體不僅重視數(shù)據(jù)的客觀性和完整性, 也相對更有動力發(fā)現(xiàn)公共數(shù)據(jù)在時(shí)效性和顆粒度方面的缺陷。 在公共數(shù)據(jù)的利用收益尚難以完全確定、社會利益與經(jīng)濟(jì)利益兼?zhèn)涞那疤嵯拢?需要為用戶參與發(fā)現(xiàn)和反饋質(zhì)量缺陷提供更廣闊的通道。 只要使用者實(shí)際上直接參與了公共數(shù)據(jù)的開發(fā)利用, 不論其直接期望從中獲益多少, 均應(yīng)確認(rèn)其使用法益存在, 并且明確其有權(quán)反饋數(shù)據(jù)的時(shí)效性、 顆粒度等影響利用價(jià)值方面的缺陷, 為其參與數(shù)據(jù)質(zhì)量缺陷發(fā)現(xiàn)和治理提供便利。
(二) 質(zhì)量缺陷參與治理制度
公共數(shù)據(jù)質(zhì)量保障需要建立全方位的質(zhì)量缺陷參與治理制度。 在宏觀層面上, 這一制度可以嵌入信息行政法 (Informationsverwaltungsrecht)。 信息的收集和傳遞是合作知識生成和決策的基礎(chǔ),而完整、 及時(shí)且可靠的知識提供是行政行為質(zhì)量和合法性的中心條件之一。 與行政聯(lián)合體(Europ?ischen Verwaltungsverbundes) 相應(yīng)的信息聯(lián)合體對此負(fù)有保密和數(shù)據(jù)保護(hù)的責(zé)任, 這在今天已經(jīng)成為信息行政法的一部分。盡管獨(dú)立的主權(quán)國家不存在所謂的行政聯(lián)合體或信息聯(lián)合體,但相應(yīng)的知識提供和數(shù)據(jù)保護(hù)責(zé)任也需要為公共事務(wù)處理的法理所確認(rèn)。 在微觀層面上, 這一制度需要根據(jù)受影響的法益類型和數(shù)據(jù)權(quán)屬設(shè)計(jì)兼容多元主體參與的質(zhì)量保障機(jī)制, 確立體系化的公共數(shù)據(jù)更正 (請求) 權(quán)及權(quán)利行使程序, 并有效控制數(shù)據(jù)安全風(fēng)險(xiǎn)。
原則上, 狀態(tài)法益受數(shù)據(jù)質(zhì)量缺陷影響時(shí), 相關(guān)法律主體可以對來源自身的數(shù)據(jù)依法行使更正權(quán), 而對非來源于自身的數(shù)據(jù)行使更正請求權(quán), 相關(guān)數(shù)據(jù)系統(tǒng)應(yīng)為各種行權(quán)途徑預(yù)留技術(shù)支持空間, 實(shí)現(xiàn) “通過設(shè)計(jì)的精細(xì)保障”。 在民法學(xué)的討論中, 基于數(shù)字勞動理論和洛克式的財(cái)產(chǎn)權(quán)限制要件, 數(shù)據(jù)來源者權(quán)利的正當(dāng)性得以證成, 權(quán)利內(nèi)容具體包括訪問權(quán) (含控制權(quán))、 使用權(quán)、 收益權(quán)。這一框架對于公法學(xué)而言有一定參考價(jià)值, 但尚存在不足。 數(shù)據(jù)來源者對于與來源自身的公共數(shù)據(jù)通常應(yīng)當(dāng)享有訪問權(quán)和更正權(quán) (國防、 國家安全、 治安等領(lǐng)域列入保密范圍的數(shù)據(jù)除外), 但此種權(quán)利的來源并非數(shù)字勞動, 而是基于程序公正和行權(quán)效率的公共利益考量, 由數(shù)據(jù)來源者對自身數(shù)據(jù)進(jìn)行核對與修改是最為合理的, 但相關(guān)訪問與修改必須留存記錄且接受相應(yīng)行政機(jī)關(guān)或公共機(jī)構(gòu)的校核。 狀態(tài)法益受非來源于自身數(shù)據(jù)的質(zhì)量缺陷影響時(shí), 如果訪問相關(guān)數(shù)據(jù)不涉及國家秘密、 商業(yè)秘密和個(gè)人信息保護(hù)等法律限制, 法益主體應(yīng)享有對整個(gè)法益影響鏈條上的數(shù)據(jù)的訪問權(quán)和更正請求權(quán); 如訪問相關(guān)數(shù)據(jù)受法律限制, 而法益主體有理由認(rèn)為自身的狀態(tài)法益受數(shù)據(jù)質(zhì)量缺陷的不利影響, 則法律至少應(yīng)當(dāng)賦予其數(shù)據(jù)校核請求權(quán), 請求有權(quán)組織校核數(shù)據(jù)的客觀性、 完整性, 并告知結(jié)果。
使用法益受數(shù)據(jù)質(zhì)量影響時(shí), 由于利用公共數(shù)據(jù)已存在范圍限制 (如外部用戶可利用的數(shù)據(jù)應(yīng)為脫敏脫密數(shù)據(jù)), 具備使用法益的主體應(yīng)有權(quán)在安全可控的前提下對所利用公共數(shù)據(jù)的質(zhì)量實(shí)施監(jiān)測, 并向?qū)ο嚓P(guān)公共數(shù)據(jù)質(zhì)量負(fù)責(zé)的部門或機(jī)構(gòu)反饋結(jié)果。 此種反饋結(jié)果并不限于數(shù)據(jù)客觀性、 完整性缺陷, 諸如數(shù)據(jù)粒度過粗、 數(shù)據(jù)時(shí)效性不足或數(shù)據(jù)統(tǒng)計(jì)方式不合理等亦可作為反饋內(nèi)容。 相關(guān)制度設(shè)計(jì)的關(guān)鍵在于要求系統(tǒng)設(shè)計(jì)時(shí)集成數(shù)據(jù)質(zhì)量保障工具乃至預(yù)留安全可控的外部監(jiān)測工具接口, 支持?jǐn)?shù)據(jù)使用者運(yùn)用各種安全可控的監(jiān)測工具對數(shù)據(jù)質(zhì)量作深度觀察分析, 同時(shí)鼓勵公共數(shù)據(jù)處理平臺運(yùn)用隱私計(jì)算、 同態(tài)加密、 零知識證明等技術(shù), 在原始數(shù)據(jù)不出域和計(jì)算負(fù)擔(dān)合理的情況下, 向用戶提供部分不宜直接訪問的數(shù)據(jù)的部分質(zhì)量監(jiān)測結(jié)果和關(guān)于特定數(shù)據(jù)集客觀性、 完整性的有效信息, 便于用戶基于自身所擁有及可訪問的數(shù)據(jù)進(jìn)行交叉驗(yàn)證, 發(fā)現(xiàn)潛在的數(shù)據(jù)質(zhì)量問題。 鑒于提升數(shù)據(jù)粒度和時(shí)效性等關(guān)系利用價(jià)值的質(zhì)量指標(biāo)往往存在成本約束, 相關(guān)反饋機(jī)制還應(yīng)允許用戶報(bào)告數(shù)據(jù)利用的具體質(zhì)量需求與預(yù)期經(jīng)濟(jì)利益, 以便政府部門與用戶 (有時(shí)還包括公共數(shù)據(jù)授權(quán)運(yùn)營組織) 之間就提升數(shù)據(jù)質(zhì)量展開協(xié)商, 針對性地改進(jìn)公共數(shù)據(jù)質(zhì)量。
支撐此種參與式治理的關(guān)鍵是需要構(gòu)建兼具確定性與建設(shè)性的反饋回應(yīng)機(jī)制。 數(shù)據(jù)質(zhì)量監(jiān)控體系的完整建立需要在技術(shù)性數(shù)據(jù)質(zhì)量監(jiān)控系統(tǒng)之外全面、 動態(tài)地強(qiáng)化符合數(shù)據(jù)質(zhì)量提升規(guī)律的正向反饋循環(huán)。 數(shù)據(jù)質(zhì)量存在的缺陷與問題只有在使用中才會被充分發(fā)現(xiàn)和體驗(yàn), 而使用者發(fā)現(xiàn)問題是否有足夠的意愿、 能力和暢通的渠道提供反饋, 反饋問題后是否會受到及時(shí)重視、 回應(yīng)與解決, 相關(guān)主體是否有動力和資源處理相應(yīng)問題, 都制約著反饋循環(huán)的建立和數(shù)據(jù)質(zhì)量的提升。關(guān)于問題是否可能得到有效解決的主觀感知很可能受到實(shí)際回應(yīng)態(tài)度、 時(shí)間和解決問題概率的貝葉斯式影響, 而且會在一定圈層內(nèi)產(chǎn)生傳播效應(yīng), 因此實(shí)際回應(yīng)和解決問題的比例下降, 均可能引發(fā)反饋問題占發(fā)現(xiàn)問題比值的相應(yīng)非線性下降。 同時(shí), 使用者未必能精準(zhǔn)地判斷數(shù)據(jù)質(zhì)量缺陷的來源與程度, 往往也很難判斷問題得到解決的準(zhǔn)確概率, 可能只能感受到一個(gè)模糊的概率區(qū)間,因此, 法律制度應(yīng)當(dāng)明確要求相關(guān)質(zhì)量保障部門對有具體內(nèi)容的反饋?zhàn)鞒霭鞔_判斷的有效回應(yīng), 并對有實(shí)質(zhì)內(nèi)容的模糊反饋?zhàn)鞒鼋ㄔO(shè)性回應(yīng), 既致力于維持有效回應(yīng)率和暢通信息交互渠道,也致力于從交流中發(fā)現(xiàn)數(shù)據(jù)質(zhì)量缺陷的線索。
在上述參與途徑的基礎(chǔ)上, 參與式治理制度中還應(yīng)包含數(shù)據(jù)修改意見沖突處理機(jī)制, 由對相關(guān)公共數(shù)據(jù)質(zhì)量負(fù)責(zé)的部門或機(jī)構(gòu)對爭議數(shù)據(jù)進(jìn)行校核, 聽取各方當(dāng)事人的意見, 最終作出數(shù)據(jù)處理決定并說明理由。 盡管公法學(xué)未必能夠就公共數(shù)據(jù)處理一蹴而就地確立某種 “數(shù)據(jù)正當(dāng)程序” 的法理, ①但通過此種制度安排, 可以逐步形成數(shù)據(jù)正當(dāng)程序的制度輪廓, 進(jìn)而在未來支撐更深入的數(shù)據(jù)質(zhì)量參與式治理機(jī)制實(shí)施。 上述數(shù)據(jù)處理需求均應(yīng)在相關(guān)系統(tǒng)設(shè)計(jì) (包括開發(fā)階段或升級迭代) 時(shí)嵌入, 實(shí)現(xiàn) “法律—技術(shù)” 過程的有效融合。
(三) 數(shù)據(jù)質(zhì)量深度監(jiān)測制度
前述兩方面的基礎(chǔ)性制度設(shè)計(jì)主要是充分調(diào)動受數(shù)據(jù)質(zhì)量影響的各方主體參與數(shù)據(jù)質(zhì)量治理,盡可能在合理成本負(fù)擔(dān)前提下發(fā)現(xiàn)并修正各種集中或分散存在的公共數(shù)據(jù)質(zhì)量缺陷。 伴隨數(shù)字政府建設(shè)、 公共數(shù)據(jù)體量持續(xù)膨脹和智慧政務(wù)、 智慧城市等進(jìn)一步發(fā)展, 零敲碎打式的分散治理途徑并不能承載公共數(shù)據(jù)質(zhì)量保障的主要壓力。 公共數(shù)據(jù)質(zhì)量保障的主干途徑仍然應(yīng)當(dāng)聚焦集約化的數(shù)據(jù)質(zhì)量監(jiān)控與提升途徑, 建立和完善可由公共數(shù)據(jù)處理平臺負(fù)責(zé)實(shí)施的數(shù)據(jù)質(zhì)量深度監(jiān)測制度, 有效應(yīng)對成規(guī)模、 高負(fù)擔(dān)的數(shù)據(jù)質(zhì)量治理需求。
數(shù)據(jù)質(zhì)量的深度監(jiān)測需要深入考察數(shù)據(jù)間的相關(guān)性和因果性, 引入多層次、 多模型的交叉驗(yàn)證, 維護(hù)數(shù)據(jù)的客觀性、 完整性和時(shí)效性。 公共數(shù)據(jù)之間存在廣泛的潛在相互關(guān)聯(lián), 通過挖掘關(guān)聯(lián)性可以實(shí)現(xiàn)對不同數(shù)據(jù)項(xiàng)的驗(yàn)證和估計(jì)。 某指數(shù)用新增用電量、 新增鐵路貨運(yùn)量、 新增銀行貸款三項(xiàng)數(shù)據(jù)估計(jì)經(jīng)濟(jì)狀況數(shù)據(jù),本質(zhì)上就是利用了公共數(shù)據(jù)之間的相關(guān)性和潛藏的因果關(guān)系。 在不同數(shù)據(jù)源之間的數(shù)據(jù)進(jìn)行交叉驗(yàn)證, 并不局限于簡單的數(shù)值比對, 而是需要進(jìn)一步擴(kuò)展到模型級別的相互核驗(yàn), 相當(dāng)于將各個(gè)數(shù)據(jù)源視為缺失數(shù)據(jù)集, 進(jìn)行廣泛的因果關(guān)系發(fā)現(xiàn), 驗(yàn)證各模型之間的一致性, 及時(shí)發(fā)現(xiàn)數(shù)據(jù)失真、 缺漏及部分?jǐn)?shù)據(jù)集時(shí)間滯后等導(dǎo)致數(shù)據(jù)一致性、 聯(lián)合分布和因果關(guān)系異常的問題。 缺失數(shù)據(jù)集因果關(guān)系發(fā)現(xiàn)的研究成果在各個(gè)領(lǐng)域都有廣泛的應(yīng)用, 最起碼能夠?qū)崿F(xiàn)一定條件下的數(shù)據(jù)補(bǔ)全, 這就足以實(shí)現(xiàn)一定程度上的交叉驗(yàn)證;基于各個(gè)數(shù)據(jù)源的因果發(fā)現(xiàn), 還可以進(jìn)一步了解數(shù)據(jù)間不一致的可能成因及缺陷所在。 即便自動化的數(shù)據(jù)質(zhì)量保障工具無法確定和修復(fù)缺陷, 也可以指引工作人員進(jìn)行人工排查與修復(fù)。 惟有模型級別的交叉驗(yàn)證才能應(yīng)對海量多源數(shù)據(jù)的復(fù)雜質(zhì)量保障需求, 進(jìn)而在公共數(shù)據(jù)得到相關(guān)數(shù)據(jù)平臺的全面數(shù)字化處理時(shí),實(shí)現(xiàn)涵蓋 “云—庫—表” 各層次的數(shù)據(jù)質(zhì)量動態(tài)監(jiān)控。
當(dāng)然, 公共數(shù)據(jù)的大規(guī)模匯集可能引發(fā)越權(quán)決定、 程序違法、 數(shù)據(jù)操控等風(fēng)險(xiǎn)并放大數(shù)據(jù)隱私和安全風(fēng)險(xiǎn), ③但此種數(shù)據(jù)質(zhì)量深度監(jiān)測方式并不要求數(shù)據(jù)的匯集, 而只需要交換數(shù)據(jù)補(bǔ)全和因果發(fā)現(xiàn)后的比對結(jié)果, 提供數(shù)據(jù)質(zhì)量缺陷的可疑路徑及分析證據(jù), 并不需要向各部門、 各機(jī)構(gòu)披露不屬于其職能范圍的原始數(shù)據(jù), 產(chǎn)生類似于隱私計(jì)算的結(jié)果。 公共數(shù)據(jù)質(zhì)量保障的法律制度僅需要為此種深度監(jiān)測提供實(shí)施多方計(jì)算的授權(quán)和規(guī)定數(shù)據(jù)安全保障及個(gè)人信息保護(hù)要求, 至于是否需要及何種程度上匯聚公共數(shù)據(jù), 則可以由立法者根據(jù)公共數(shù)據(jù)利用與數(shù)據(jù)安全、 個(gè)人信息保護(hù)及相關(guān)權(quán)益保障之間的平衡具體決定, 并以相應(yīng)技術(shù)標(biāo)準(zhǔn)或指南指引未來公共數(shù)據(jù)處理平臺的技術(shù)設(shè)計(jì)及數(shù)據(jù)處理過程管理規(guī)則的形成。
五、 結(jié) 語
在數(shù)字政府和數(shù)字社會的建設(shè)與發(fā)展進(jìn)程中, 公共數(shù)據(jù)的質(zhì)量舉足輕重。 盡管 “數(shù)字行政法” 和 “數(shù)據(jù)公權(quán)” 等重要的法理基礎(chǔ)仍有待發(fā)展, 強(qiáng)化公共數(shù)據(jù)的質(zhì)量保障已屬時(shí)不我待。 隨著公共數(shù)據(jù)規(guī)模的持續(xù)膨脹和數(shù)據(jù)利用方式的日益復(fù)雜, 公共數(shù)據(jù)的質(zhì)量保障必將成為一項(xiàng)支撐整個(gè)數(shù)字政府和智慧政務(wù)基礎(chǔ)的大型制度工程。 本文可以被視為拋磚引玉式的初步嘗試, 隨著公共數(shù)據(jù)洪流自 “一葦可航” 發(fā)展至 “連山排海”, 亦必將催生更深入、 更豐富的后續(xù)研究。 數(shù)字行政法需要面向數(shù)據(jù)洪流構(gòu)筑堤壩、 挖掘引渠和布設(shè)濾網(wǎng), 始終防止公共數(shù)據(jù)的處理和利用非法或不當(dāng)侵蝕公民和法人的合法權(quán)益, 也防范數(shù)據(jù)質(zhì)量缺陷對公共利益目標(biāo)的種種危害, 為數(shù)據(jù)價(jià)值在公共領(lǐng)域的釋放豎立堅(jiān)實(shí)屏障。
(責(zé)任編輯: 王玎)