羅敏 姜鑫
摘要:隨著開放獲取運動的不斷深入發(fā)展,檔案機構陸續(xù)加入開放數(shù)據(jù)的陣營中并迅速發(fā)展。通過對國外檔案館數(shù)據(jù)開放獲取政策的考察分析,探討如何在保護個人隱私的前提下促進檔案館開展開放獲取運動,有助于發(fā)揮檔案數(shù)據(jù)開放獲取的社會價值和經(jīng)濟效益,并為完善我國檔案館數(shù)據(jù)開放政策提供參考性建議。因此,文章研究使用內(nèi)容分析法,在調(diào)研國外檔案館制定和執(zhí)行的有關個人數(shù)據(jù)開放獲取政策基礎上,結合各國已有的數(shù)據(jù)保護法,從數(shù)據(jù)存儲規(guī)范、數(shù)據(jù)重用規(guī)范和數(shù)據(jù)權益規(guī)范著手,針對檔案數(shù)據(jù)開放獲取政策中開放個人數(shù)據(jù)的規(guī)定進行了研究解讀。最終提出國外檔案館數(shù)據(jù)開放政策中對個人數(shù)據(jù)保護的規(guī)定較為成熟,我國在豐富的檔案數(shù)據(jù)開放理論研究和實踐中,應盡快完善開放獲取頂層設計,加強個人數(shù)據(jù)保護制度建構,搭建開放數(shù)據(jù)平臺,實現(xiàn)資源共享。
關鍵詞:科學數(shù)據(jù);開放獲?。粰n案館;個人數(shù)據(jù);隱私保護
分類號:G275
Research on the Open Access Policies of Personal Data in Archives in the Context of Open Scientific Data
Luo Min1,Jiang Xin2
(1. College of Information Management of Heilongjiang University, Harbin, Heilongjiang, 150080; 2. Research Center of Information Resources Management of Heilongjiang University, Harbin, Heilongjiang, 150080)
Abstract:With the continuous development of the open access movement, the archives have been promoted to join the open- data camp and develop rapidly. Through the investigation and analysis of the open access policy of data in foreign archives, we can explore how to promote the open access movement of archives under the premise of protecting personal privacy. Give full play to the social value and economic benefits of open access to archival data, and provide reference suggestions for perfecting the open access policy of data in archives in China. Therefore, this paper uses content analysis method on the basis of the policy on open access to personal data developed and implemented by foreign archives, and in combination with the data protection laws already in place in various countries, the research and interpretation of the provisions of open personal data in the open access policy of archives data should be carried out from the basis of data storage norms, data reuse norms and data rights and interests norms. Finally, this paper puts forward to that the provisions on personal data protection in the data opening policy of foreign archives are more mature, and in the rich research and practice of open data in archives, we should improve the top-level design of open access as soon as possible, strengthen the construction of the personal data protection system, and set up an open data platform to realize the sharing of resources.
Keywords:Scientific Data; Open Access; Archives; Personal Data; Privacy Protection
在科學數(shù)據(jù)開放共享的大環(huán)境下,數(shù)據(jù)已成為國家基礎性戰(zhàn)略資源,為開展科研活動和促進社會創(chuàng)新發(fā)展帶來更多的機會。以歐美為代表的眾多國家都已制定了推動科學數(shù)據(jù)開放獲取的政策。如歐盟于2014年發(fā)布“地平線2020計劃”,要求所支持科研項目的研究成果、研究報告和科學數(shù)據(jù)都必須開放獲取,確保研究結果的公開和透明;2018年9月歐洲科研資助機構聯(lián)盟發(fā)布“開放獲取S計劃”,闡述了未來科學數(shù)據(jù)開放獲取的基本原則[1]。我國國務院于2018年頒布《科學數(shù)據(jù)管理辦法》,明確了科學數(shù)據(jù)從采集、匯交、保存到共享利用等規(guī)定。然而,數(shù)據(jù)量的增長和信息技術的快速發(fā)展使科學數(shù)據(jù)開放獲取面臨許多實際問題。
作為提供公共服務的數(shù)據(jù)中心,檔案機構存儲著大量且密集的數(shù)據(jù),是推動數(shù)據(jù)開放的核心力量,但由于檔案的特殊性,側重“保密”的責任定位在一定程度上阻礙了檔案館有效開展數(shù)據(jù)開放運動。為解決這一問題,美國國家檔案與記錄管理局發(fā)布《2018—2022戰(zhàn)略計劃》,提出讓公眾公開獲取聯(lián)邦政府記錄來提高透明度、培養(yǎng)公眾參與以及加強民主[2];新西蘭檔案館頒布的《2057戰(zhàn)略》提出三個戰(zhàn)略領域,其中之一是堅持信息公開透明以支持開放政府行動[3]。此外,考慮到檔案館密集的館藏資源可能包含個人隱私數(shù)據(jù),在開放獲取過程中難免與隱私保護產(chǎn)生沖突,要明確數(shù)據(jù)開放并不是無限制的開放,還需對可能帶來潛在影響的矛盾進行關注和研究。即如何在開放數(shù)據(jù)的背景下協(xié)調(diào)好數(shù)據(jù)開放工作和個人數(shù)據(jù)保護問題是當前各國檔案機構需盡快解決的問題。
研究采用內(nèi)容分析法,通過調(diào)研國外檔案館網(wǎng)站開放獲取數(shù)據(jù)政策,從數(shù)據(jù)存儲規(guī)范、數(shù)據(jù)重用規(guī)范、數(shù)據(jù)權益規(guī)范三個方面著手,針對政策文本內(nèi)容進行深入分析,并提煉評述性的說明。
國外檔案館大部分已經(jīng)頒布了關于個人數(shù)據(jù)歸檔管理及開放獲取數(shù)據(jù)的政策,或者遵循本國信息委員會發(fā)布了數(shù)據(jù)管理文件(見表1)。在已有的數(shù)據(jù)保護法下各國更加重視開放數(shù)據(jù)過程中個人數(shù)據(jù)的保護。筆者對國外檔案館在開放科學數(shù)據(jù)背景下開放個人數(shù)據(jù)的政策規(guī)定進行研究,探討如何在保護個人隱私的前提下充分實現(xiàn)檔案數(shù)據(jù)開放獲取的社會價值,創(chuàng)造經(jīng)濟效益,以促進檔案館開放數(shù)據(jù)運動的發(fā)展,并確保數(shù)據(jù)使用者和數(shù)據(jù)主體間的利益雙向平衡,從而為我國檔案館數(shù)據(jù)開放政策制定和完善提供參考。
國外檔案館頒布的數(shù)據(jù)開放政策旨在通過指導檔案部門正確處理包含個人數(shù)據(jù)的檔案資源以平衡開放獲取與個人隱私安全之間存在的緊張關系。自檔案移交進館時起,檔案管理人員首先根據(jù)價值鑒定判定是否長期保存,同時規(guī)范數(shù)據(jù)存儲格式和標準,以確保數(shù)據(jù)質(zhì)量和數(shù)據(jù)可用性;其次,在數(shù)據(jù)開放利用階段,需要明確受到豁免或限制的特殊情況,在發(fā)揮開放數(shù)據(jù)價值時保護利益主體的權益?;诖耍P者就搜集的政策文本進行內(nèi)容分析,分別論述個人數(shù)據(jù)的存儲規(guī)范、重用規(guī)范和權益規(guī)范,并總結個人數(shù)據(jù)歸檔工作依據(jù)各國不斷修正更新的數(shù)據(jù)保護法所做出的調(diào)整。
2.1個人數(shù)據(jù)存儲規(guī)范
(1)數(shù)據(jù)存儲格式及標準
檔案管理工作中,數(shù)據(jù)格式和標準規(guī)范性對推進數(shù)據(jù)開放和個人數(shù)據(jù)保護起著重要作用。開放數(shù)據(jù)常??赡芤驗閿?shù)據(jù)標準或格式的不一致直接影響數(shù)據(jù)的獲取和利用,對此,美國數(shù)據(jù)門戶網(wǎng)站Data.gov和英國Data.gov.uk的開放數(shù)據(jù)集均以統(tǒng)一的數(shù)據(jù)標準和通用數(shù)據(jù)格式發(fā)布在國家級的政府數(shù)據(jù)開放平臺[12],俄羅斯聯(lián)邦檔案署推行的指標則要求以RDF格式開放數(shù)據(jù)集[13]。
進入信息時代以來,為適應信息技術發(fā)展環(huán)境,電子數(shù)據(jù)和電子文件的歸檔標準也有了新的要求。美國國家檔案與記錄管理局發(fā)布的《2018—2022年度戰(zhàn)略計劃》提出,NARA正致力于以“開放政府”原則為基礎實現(xiàn)轉型,引領電子文件和電子檔案的管理實踐[14],并提出在現(xiàn)代化的電子檔案存檔2.0信息系統(tǒng)中開發(fā)處理電子檔案記錄的新應用。
(2)數(shù)據(jù)存儲原則
檔案需要經(jīng)過價值鑒定來決定是否長期保存,這樣有利于緩解數(shù)據(jù)保護和利益獲取之間的沖突,保障具有持久價值的數(shù)據(jù)歸檔以及提高檔案質(zhì)量和減少檔案館后期重新整理數(shù)據(jù)的成本。歸檔的目的在于確保和維護數(shù)據(jù)處于可用狀態(tài),為公共利益服務。所以在考慮永久保存?zhèn)€人資料時,應考慮其在多大程度上促進了公共利益,特別是研究人員用于科學研究方面的作用。事實上,具有永久保存價值的數(shù)據(jù)量很少,根據(jù)維基百科顯示,在美國聯(lián)邦機構開展政府業(yè)務過程中創(chuàng)建或接收的所有記錄,大約只有1%至3%被認為具有永久保存價值并轉移到國家檔案館永久保存和查閱[15]。
數(shù)據(jù)的存檔和管理遵循最小化原則,即根據(jù)處理目的將所收集、處理的個人數(shù)據(jù)限制在必要的內(nèi)容上,使接觸數(shù)據(jù)的工作人員控制在最小可行范圍內(nèi)。特定條件下應該設立個人數(shù)據(jù)保護信息專員,授予更多權利來維護個人利益,包括賦予調(diào)查權、追責權及處罰權。
2.2個人數(shù)據(jù)重用規(guī)范
(1)科學數(shù)據(jù)研究豁免
數(shù)據(jù)保護法中對科學數(shù)據(jù)研究豁免做出相關的說明,指出存檔需要符合公共利益?!锻ㄓ脭?shù)據(jù)保護條例》提到,擁有公共利益記錄的政府當局或私人機構,應根據(jù)聯(lián)邦或成員國法律,為一般公共利益提供獲取、保存、評估、整理、描述、交流、推廣、傳播和訪問持久公共價值記錄的服務[16]。以公共利益為目的的數(shù)據(jù)重用允許機構在不經(jīng)同意的情況下處理個人數(shù)據(jù),不受目的限制的約束,比如用于統(tǒng)計、科學和歷史的研究、言論和信息自由的處理,但是仍應實施適當?shù)谋U洗胧?,保障?shù)據(jù)主體的權益和自由,尊重數(shù)據(jù)保護的本質(zhì),盡量減少不利影響。
(2)隱私影響評估
披露檔案個人數(shù)據(jù)之前還應進行隱私影響評估(Privacy Impact Assessments,PIA),結合數(shù)據(jù)的性質(zhì)、數(shù)據(jù)主體年齡和背景等因素,考慮重用是否會對數(shù)據(jù)主體造成經(jīng)濟、生理或精神層面的持續(xù)性損害。美國國家檔案館的隱私政策指出,PIA用于分析如何收集、存儲、保護、共享和管理個人身份信息,其目的是證明系統(tǒng)所有者和開發(fā)人員在系統(tǒng)的整個生命周期中都有意識地考慮到了隱私保護[17]。澳大利亞信息委員會于2014年發(fā)布《隱私影響評估指南》[18],說明了隱私影響評估的過程。英國內(nèi)閣辦公室在2012年發(fā)布《開放數(shù)據(jù)白皮書:釋放數(shù)據(jù)潛力》,提出在數(shù)據(jù)開放過程中進行隱私影響評估[19]。
2.3個人數(shù)據(jù)權益規(guī)范
(1)數(shù)據(jù)主體權益
數(shù)據(jù)保護法強調(diào)數(shù)據(jù)主體對個人數(shù)據(jù)感知和控制的重要性,給予公民更多的個人數(shù)據(jù)控制權,即數(shù)據(jù)主體的知情同意權、擦除權、更正權等,認為數(shù)據(jù)主體有權知道自己的數(shù)據(jù)為什么被收集、有什么用途、是否正在被處理以及申請擦除或修改不當?shù)膫€人數(shù)據(jù),但是在可能損害公共利益實現(xiàn)的情形下,這些權利則不適用。
當數(shù)據(jù)發(fā)布、重用和訪問時,為確保所披露的信息在任何情況下都不能指向特定的主體,可以采取匿名化處理,即刪除可識別出數(shù)據(jù)主體的標識符,使數(shù)據(jù)主體不能從特定文檔的信息中被識別出來。在結構化的數(shù)據(jù)集中,可以通過刪除記錄級別的標識符實現(xiàn),使其指向特定的集合而非單獨的個體,如指向整個地理區(qū)域中的全部個體。
(2)數(shù)據(jù)使用者權益
原始記錄性是檔案的本質(zhì)屬性,所體現(xiàn)出來的憑證價值使其區(qū)別于并優(yōu)于其他資料[20]。為了讓檔案使用者能有效地利用檔案數(shù)據(jù),數(shù)據(jù)歸檔之前的收集工作應該以明確的目的,保證其合法性、公正性和透明性。所有新收集的檔案,無論是數(shù)字檔案還是紙質(zhì)檔案,都應酌情進行風險評估和抽樣,以確定這些檔案是否包括法律規(guī)定的個人數(shù)據(jù),保障數(shù)據(jù)來源的可靠,以及數(shù)據(jù)本身的真實、完整和可用性。
作為檔案保存的個人數(shù)據(jù)并不需要實時更新,最重要的是展現(xiàn)歷史的完整性,而非當前的準確性,在更正時可以通過補充語句來保證原始數(shù)據(jù)的完整。
新形勢下個人數(shù)據(jù)歸檔工作更加注重對個人數(shù)據(jù)的隱私保護,經(jīng)考察分析,國外檔案館數(shù)據(jù)開放政策在不斷更新的數(shù)據(jù)保護法下相應地進行了一些調(diào)整:第一,強調(diào)數(shù)據(jù)主體對個人數(shù)據(jù)的控制權,如知情同意權、擦除權、更正權等;第二,要求設置數(shù)據(jù)保護官、數(shù)據(jù)保護專員,對個人進行大規(guī)模、定期和系統(tǒng)的監(jiān)測;第三,通知數(shù)據(jù)主體個人數(shù)據(jù)泄露情況;第四,對申請獲取個人數(shù)據(jù)的檔案服務請求進行隱私影響評估;第五,聲明用于科學歷史研究的個人數(shù)據(jù)處理豁免;第六,任何可能造成數(shù)據(jù)主體經(jīng)濟損失或人身傷害的處理,都必須有適當?shù)谋U洗胧┮跃S護數(shù)據(jù)主體的權益。綜上所述,考慮我國目前檔案館開放數(shù)據(jù)發(fā)展實際情況,筆者對國外檔案館開放數(shù)據(jù)政策內(nèi)容要點進行了梳理(如表2所示)。
檔案館作為科學數(shù)據(jù)的管理者,支持和推動科學數(shù)據(jù)開放共享運動[21]。在我國豐富的檔案理論研究與實踐的基礎上,科學數(shù)據(jù)開放獲取是時代的新要求和事業(yè)的新發(fā)展,檔案館確立自己的行業(yè)標準不僅是響應國家數(shù)據(jù)開放政策,也是適應數(shù)據(jù)開放環(huán)境變化的必經(jīng)之路。
4.1完善頂層設計,平衡檔案管理工作與開放共享需求
檔案館是收集、保管檔案的機構,其一貫的嚴謹作風與開放共享的大環(huán)境有著不可避免的沖突和矛盾,隨著開放獲取運動的推行,檔案館應根據(jù)實際情況開展檔案管理工作,將開放獲取更好地融入日常管理之中,避免固步自封。其中政策的支持和指導是平衡檔案管理工作有效開展和推進開放獲取運動持續(xù)健康發(fā)展的關鍵,在開放獲取環(huán)境下能夠有效引領檔案數(shù)據(jù)開放實踐。從國家層面完善政策細節(jié),為檔案工作提供可靠的支撐,進一步促進國家檔案數(shù)據(jù)開放的有序進行,建立具有中國特色的檔案數(shù)據(jù)開放獲取政策體系[22]。
4.2推動制定專門的個人數(shù)據(jù)保護法
個人隱私需要法律的強制執(zhí)行力來維護,英國、美國、德國、澳大利亞等多個國家已經(jīng)制定和頒布了個人數(shù)據(jù)保護法律,成為各國相關法律的標桿。雖然我國的許多行政法規(guī)包含保護個人隱私的規(guī)定,但是太過分散,仍需一部基礎性的法規(guī)適用于不同場景下的個人隱私保護。2019年12月20日在全國人大常委會法工委的第三次記者會上,發(fā)言人岳仲明表示中國將于2020年制定個人信息保護法、數(shù)據(jù)安全法等[23]。此外,檔案個人數(shù)據(jù)主體的權益、檔案保管者的責任、檔案使用者利用檔案的權利應當同保護隱私的義務相協(xié)調(diào)[24],將檔案開放利用環(huán)節(jié)中所涉及的關鍵各方納入隱私保護法制定的考慮因素。
4.3加強檔案館開放數(shù)據(jù)建設
隨著大數(shù)據(jù)的縱深發(fā)展,檔案工作逐步從傳統(tǒng)檔案管理走向新時代檔案數(shù)據(jù)管理[25],數(shù)據(jù)與檔案服務間的結合引起越來越多的關注,其中個人數(shù)據(jù)保護問題、檔案管理技術變革問題、開放數(shù)據(jù)下政府對檔案工作的執(zhí)法問題等較為突出,且人們獲取信息的渠道越來越多樣,檔案館需要開辟更多的途徑讓公民接觸檔案[26]。將開放數(shù)據(jù)融入檔案工作,建立檔案館開放數(shù)據(jù)共享平臺,不僅能夠為檔案館數(shù)據(jù)服務提供更為便捷的獲取途徑,也可以通過檔案工作進一步促進數(shù)據(jù)開放。檔案館開放數(shù)據(jù)建設使檔案管理工作更好地適應新時代數(shù)據(jù)服務要求,實現(xiàn)開放數(shù)據(jù)價值,推動社會發(fā)展與進步。
社會的數(shù)字化變革使傳播和獲取海量數(shù)據(jù)成為可能,與此同時,人們呼吁保護他們的個人隱私。在大數(shù)據(jù)技術的發(fā)展和支持下,我國檔案資源的開放利用有序展開,而檔案利用和隱私權保護兩者之間存在不可忽視的沖突,檔案機構和檔案工作者需要做出相應改變以應對這一挑戰(zhàn)。為實現(xiàn)檔案數(shù)據(jù)開放獲取的穩(wěn)定推進以及適應科學數(shù)據(jù)開放環(huán)境的要求,我國應結合社會發(fā)展的實際情況,做好開放獲取的個人數(shù)據(jù)保護制度建構,加強檔案人員數(shù)據(jù)管理能力和電子檔案利用管理工作,完善檔案數(shù)據(jù)開放獲取頂層設計,保障檔案數(shù)據(jù)的準確性和持續(xù)可用狀態(tài),以平衡檔案有效利用和個人數(shù)據(jù)保護之間的關系,充分發(fā)揮檔案數(shù)據(jù)開放獲取的價值,使檔案數(shù)據(jù)管理工作和個人數(shù)據(jù)保護工作在開放環(huán)境下日趨規(guī)范化和標準化。
*本文系國家社會科學基金項目“科學數(shù)據(jù)開放政策分析與評估研究”(項目編號:16BTQ060)和黑龍江省高?;究蒲袠I(yè)務費專項資金項目“基于政策文本分析的科學數(shù)據(jù)開放共享政策研究”(項目編號:RWSKCX201922)階段性研究成果。
[1]范昊,王賀.歐洲開放獲取政策及其啟示——以“開放獲取S計劃”為例[J].圖書館學研究,2019(9):37-43+73.
[2]NARA.Strategic Plan 2018—2022[EB/OL].[2020- 02-13].https://www.archives.gov/about/plans- reports/strategic- plan/ strategic-plan-2018-2022#toc-nara-mission-vision-and-values.
[3]Archives New Zealand. Archives 2057 STRATEGY[EB/ OL].[2020-05-18].https://assets.ctfassets.net/etfoy87fj9he/ 3P6g4z4tVLrCzd3L5fYj2F/a30f98886043c7122304303e7e269c1/ archives_2057_-_strategy_english_1.pdf.
[4]The National Archives. Guide to archiving personal data[EB/OL].[2020-05-22].https://www.nationalarchives.gov.uk/documents/information-management/guide-to-archiving-personal-data.pdf.
[5]NARA.Open Data Policy[EB/OL].[2020-01-20].https:// www.archives.gov/data.
[6]OMB. Guidance on Inter-Agency Sharing of Personal Data[EB/OL].[2020-02-10]. https://obamawhitehouse.archives.gov/ omb/memoranda_m01-05.
[7]OMB. Privacy and Personal Information in Federal Records[EB/OL].[2020-02-10]. https://clintonwhitehouse3.archives. gov/OMB/pubpress/privacy.html.
[8]OAIC. Protective Security Policy Framework[EB/OL].[2020- 02- 12].https://www.protectivesecurity.gov.au/sites/default/ files/2019-12/pspf-infosec-08-sensitive-classified-information.pdf.
[9]OAIC. Guide to securing personal information[EB/OL].[2020- 02- 12].https://www.oaic.gov.au/privacy/guidance- and- advice/guide-to-securing-personal-information/.
[10]LAC. Guidelines for information management[EB/OL].[2020-02-13].http://www.bac-lac.gc.ca/eng/services/governmentinformation-resources/guidelines/Pages/introduction.aspx.
[11]Archives New Zealand. guidance on how to determine access levels[EB/OL].[2020-01-21].https://archives.govt.nz/publications/records-containing-personal-information-held-at-archives.
[12]陳展.檔案數(shù)據(jù)開放推進路徑探略[J].浙江檔案,2019(1):20-22.
[13]肖秋會.俄羅斯聯(lián)邦檔案署的開放機制建設與開放數(shù)據(jù)方案[J].檔案與建設,2017(4):21-23+35.
[14]馬海群.檔案數(shù)據(jù)開放的發(fā)展路徑及政策框架構建研究[J].檔案學通訊,2017(3):50-56.
[15]維基百科.國家檔案和記錄管理局[EB/OL].[2020-01-24].https://wiki.hk.wjbk.site/baike-國家檔案和記錄管理局.
[16]EU. General Data Protection Regulation[EB/OL].[2020-05-25].https://gdpr-info.eu/.
[17]NARA. Privacy Impact Assessments[EB/OL].[2020-05-30].https://www.archives.gov/ privacy/privacy-impact-assessments.
[18]OAIC. Guide to undertaking privacy impact assessments[EB/OL].[2020- 02- 15]. https://www.oaic.gov.au/privacy/guidance- and- advice/guide- to- undertaking- privacy- impact- assessments/#is-a-pia-necessary.
[19]黃如花,劉龍.英國政府數(shù)據(jù)開放中的個人隱私保護研究[J].圖書館建設,2016(12):47-52.
[20]劉旭光,劉蔚.檔案利用率質(zhì)疑[J].檔案學通訊,2011(3):98-101.
[21]盛小平,王毅.利益相關者在科學數(shù)據(jù)開放共享中的責任與作用——基于國際組織科學數(shù)據(jù)開放共享政策的分析[J].圖書情報工作,2019(17):31-39.
[22]侯衡.中西方檔案開放理論比較研究[J].浙江檔案, 2015(1):13-16.
[23]法工委.全國人大常委會法制工作委員會發(fā)言人第三次記者會[EB/OL].[2020-05-20]. http://www.npc.gov.cn/wszb/ wzzb7/wszb_wzsl.shtml.
[24]閆靜.美國檔案開放利用中隱私保護立法經(jīng)驗及特點分析[J].檔案,2015(10):52-55.
[25]陳雪燕,于英香.從檔案管理走向檔案數(shù)據(jù)管理:大數(shù)據(jù)時代下的檔案管理范式轉型[J].山西檔案,2019(5):24-32.
[26]馮惠玲,劉越男,馬林青.文件管理的數(shù)字轉型:關鍵要素識別與推進策略分析[J].檔案學通訊,2017(3):4-11.