徐淋楠,段美珍,寇晶晶
大數(shù)據(jù)時(shí)代,數(shù)據(jù)已成為科學(xué)研究和產(chǎn)業(yè)經(jīng)濟(jì)發(fā)展的關(guān)鍵核心,受到了世界各國的高度重視。在科學(xué)研究領(lǐng)域,科學(xué)研究方法和知識(shí)生產(chǎn)的范式都發(fā)生了巨大變化[1],封閉式的科學(xué)研究已經(jīng)不再適應(yīng)時(shí)代的發(fā)展,打破“信息孤島”、消除數(shù)據(jù)閉塞已成為世界各國科研工作者的共識(shí)。尤其是在構(gòu)建人類命運(yùn)共同體的時(shí)代發(fā)展背景下,跨地域、跨機(jī)構(gòu)和跨學(xué)科研究成為常態(tài),開放合作與數(shù)據(jù)共享成為使眾多科學(xué)問題得以進(jìn)一步深入探究與解決的關(guān)鍵,這一點(diǎn)在全球應(yīng)對(duì)新型冠狀病毒肺炎的問題上已經(jīng)得到了充分的驗(yàn)證。作為推動(dòng)開放科學(xué)發(fā)展的關(guān)鍵組成部分,科學(xué)數(shù)據(jù)開放共享不僅能夠降低科研成本和投入,實(shí)現(xiàn)公眾利益最大化,還能夠?yàn)榭茖W(xué)研究成果的可重復(fù)、可驗(yàn)證創(chuàng)造條件,有助于提升科研成果的透明性和準(zhǔn)確性等,進(jìn)而達(dá)到肅清學(xué)術(shù)風(fēng)氣的目的。但作為國家社會(huì)經(jīng)濟(jì)和科研創(chuàng)新發(fā)展的重要戰(zhàn)略資源,科學(xué)數(shù)據(jù)在開放共享的過程中,也出現(xiàn)了許多數(shù)據(jù)安全問題。
保障科學(xué)數(shù)據(jù)安全,是開放共享的基礎(chǔ)和前提[2]。為此,多個(gè)國家和地區(qū)出臺(tái)了相關(guān)政策以推進(jìn)科學(xué)數(shù)據(jù)安全保障的落實(shí)。僅2018 年一年就有歐盟《一般數(shù)據(jù)保護(hù)條例》(General Data Protection Regulation,GDPR)[3]、英國《2018 數(shù)據(jù)保護(hù)法》(Data Protection Act 2018)[4]、我國《科學(xué)數(shù)據(jù)管理辦法》[5]等政策的出臺(tái)。2020 年9 月,我國在主題為“抓住數(shù)字機(jī)遇,共謀合作發(fā)展”的國際研討會(huì)上提出了《全球數(shù)據(jù)安全倡議》,呼吁各國秉持發(fā)展和安全并重的原則,保護(hù)好涉及本國國家安全、公共安全、經(jīng)濟(jì)安全和社會(huì)穩(wěn)定的重要數(shù)據(jù)[6]。2021 年6 月,我國出臺(tái)了第一部專門針對(duì)數(shù)據(jù)安全的法律《中華人民共和國數(shù)據(jù)安全法》[7]。這些政策和倡議的提出充分體現(xiàn)了科學(xué)數(shù)據(jù)對(duì)國家科技發(fā)展和創(chuàng)新的重要性,也充分說明了各國政府對(duì)科學(xué)數(shù)據(jù)安全問題的重視。數(shù)據(jù)作為與勞動(dòng)、資本等生產(chǎn)要素比肩的核心生產(chǎn)要素,已成為國家之間競(jìng)爭(zhēng)的焦點(diǎn)。誰掌握了和占有了更多的科學(xué)數(shù)據(jù)資源,誰就更有可能在新一輪的科技競(jìng)爭(zhēng)中掌握話語權(quán)。因此,我國必須重視關(guān)于開放共享下科學(xué)數(shù)據(jù)安全問題的研究,建構(gòu)出與時(shí)代發(fā)展相契合的安全戰(zhàn)略和治理路徑以應(yīng)對(duì)激烈的國際競(jìng)爭(zhēng)和博弈。
關(guān)于數(shù)據(jù)安全的討論,國內(nèi)學(xué)術(shù)界主要集中在“政府公共數(shù)據(jù)”[8-11]、“個(gè)人隱私數(shù)據(jù)”[12-14]、“健康醫(yī)療數(shù)據(jù)”[15-17]等方面,專門針對(duì)科學(xué)數(shù)據(jù)安全問題的討論相對(duì)較少。現(xiàn)有的科學(xué)數(shù)據(jù)安全研究主要包括對(duì)科學(xué)數(shù)據(jù)共享后隱私保護(hù)的政策解讀[18-20]和方法探析[21]、對(duì)科學(xué)數(shù)據(jù)知識(shí)產(chǎn)權(quán)方面的法律探討[22]、對(duì)保障科學(xué)數(shù)據(jù)開放安全的技術(shù)研究[23],以及對(duì)影響科學(xué)數(shù)據(jù)開放安全程度的因素分析[24]等方面。除此之外,有一些學(xué)者從不同角度對(duì)開放共享環(huán)境下科學(xué)數(shù)據(jù)安全的治理路徑提出了建議。如有學(xué)者從科學(xué)數(shù)據(jù)的機(jī)密性、完整性、可用性角度提出了針對(duì)科學(xué)數(shù)據(jù)安全的治理對(duì)策[25],有學(xué)者從制度、基礎(chǔ)設(shè)施、數(shù)據(jù)素養(yǎng)、實(shí)施4 個(gè)層面構(gòu)建了高校安全數(shù)據(jù)的治理框架[26],還有學(xué)者從研發(fā)人員、作者、我國政府、外國政府4 個(gè)主體的角度提出了云環(huán)境下科學(xué)數(shù)據(jù)的治理范式[27]。本文則主要基于信息生命周期理論,從科學(xué)數(shù)據(jù)的存儲(chǔ)、管理、應(yīng)用3 個(gè)層級(jí)由下至上展開討論,進(jìn)而從宏觀、中觀和微觀的視角提出開放共享環(huán)境下科學(xué)數(shù)據(jù)安全的治理路徑。
科學(xué)數(shù)據(jù)安全問題貫穿在數(shù)據(jù)管理的每一個(gè)流程和環(huán)節(jié)中,各環(huán)節(jié)又受多重因素的影響。結(jié)合有學(xué)者提出的信息生命周期管理的層次模型與科學(xué)數(shù)據(jù)管理實(shí)踐[28],本文認(rèn)為可以從存儲(chǔ)、管理、應(yīng)用3 個(gè)層級(jí)和階段對(duì)科學(xué)數(shù)據(jù)管理中可能存在的安全問題進(jìn)行梳理提煉。
根據(jù)WSR 系統(tǒng)方法論,即“物理(Wuli)—事理(Shili)—人理(Renli)方法論”,在分析某一個(gè)對(duì)象或解決某一問題時(shí)通常會(huì)涉及物理、事理、人理3 個(gè)方面的要素和內(nèi)容。其中,“物理”主要是指在分析某一個(gè)對(duì)象或解決某一個(gè)問題時(shí)人所面對(duì)的物質(zhì)客觀存在。在科學(xué)數(shù)據(jù)安全治理過程中,“物理”主要涉及設(shè)備和技術(shù)等客觀的物理存在。“事理”主要是指改變物理層面的客觀存在及其規(guī)律時(shí)所應(yīng)用的有效方式和對(duì)策。在科學(xué)數(shù)據(jù)安全治理過程中,“事理”主要指治理主體制定的相關(guān)制度規(guī)范和策略?!叭死怼笔侵冈诜治瞿骋粚?duì)象或解決某一問題時(shí)涉及到的主體(人、人群和團(tuán)體)及其之間的關(guān)系和變化,使人們能根據(jù)可接納的道理實(shí)現(xiàn)項(xiàng)目或達(dá)成問題的原定目標(biāo)。在科學(xué)數(shù)據(jù)安全治理過程中,“人理”主要涉及政府、科研機(jī)構(gòu)和科研人員等科學(xué)數(shù)據(jù)安全治理的利益相關(guān)主體。在具體安全問題分析的過程中,本文結(jié)合現(xiàn)有研究成果和實(shí)踐中存在的問題,按照制度、技術(shù)、設(shè)施和人員的要素分析思路,對(duì)存儲(chǔ)、管理、應(yīng)用3 個(gè)不同層級(jí)和階段中可能出現(xiàn)的科學(xué)數(shù)據(jù)治理問題及成因進(jìn)行詳細(xì)梳理。
最后,從利益相關(guān)者角度出發(fā),按照政府、科研機(jī)構(gòu)和科研人員等參與主體分類,探究開放共享環(huán)境下科學(xué)數(shù)據(jù)安全的治理路徑(圖1)。
圖1 開放共享環(huán)境下科學(xué)數(shù)據(jù)安全研究框架
科學(xué)數(shù)據(jù)的保存和存儲(chǔ)是科學(xué)數(shù)據(jù)管理的第一步,在這一過程中可能會(huì)出現(xiàn)存儲(chǔ)數(shù)據(jù)丟失、數(shù)據(jù)存儲(chǔ)格式不規(guī)范、數(shù)據(jù)版本不完整等數(shù)據(jù)安全問題。
2.1.1 存儲(chǔ)數(shù)據(jù)丟失
存儲(chǔ)數(shù)據(jù)丟失通常涉及設(shè)施、技術(shù)和人員3個(gè)方面的問題。設(shè)施設(shè)備方面,如用于存儲(chǔ)的硬件設(shè)備可能會(huì)由于超出容量等各種突發(fā)原因崩潰、損壞或丟失,造成存儲(chǔ)的部分甚至全部數(shù)據(jù)丟失;技術(shù)方面,如存儲(chǔ)系統(tǒng)在存儲(chǔ)操作過程中可能會(huì)被病毒入侵或操作失誤使數(shù)據(jù)遭到損壞或丟失但無法復(fù)原等;人員方面,如科研人員未及時(shí)上傳相關(guān)研究數(shù)據(jù)或未進(jìn)行充分的數(shù)據(jù)備份,以及其他管理人員誤操作等都會(huì)導(dǎo)致相關(guān)數(shù)據(jù)缺失或丟失。
2.1.2 數(shù)據(jù)存儲(chǔ)格式不規(guī)范
數(shù)據(jù)存儲(chǔ)格式問題受制度規(guī)范影響較大。目前國際和國內(nèi)還未形成標(biāo)準(zhǔn)化的科學(xué)管理規(guī)范,不同機(jī)構(gòu)對(duì)同一學(xué)科甚至同一類型科學(xué)數(shù)據(jù)的存儲(chǔ)要求都大相徑庭。各種主客觀原因?qū)е聰?shù)據(jù)存儲(chǔ)格式多樣,數(shù)據(jù)與軟件不兼容,原始數(shù)據(jù)無法訪問和互操作。在這種情況下,即使數(shù)據(jù)按規(guī)定上傳和共享,也不具備通用性,無法供其他研究人員使用。
2.1.3 數(shù)據(jù)存儲(chǔ)版本不完整
存儲(chǔ)版本不完整、存儲(chǔ)數(shù)據(jù)有誤等操作性問題通常與實(shí)施數(shù)據(jù)操作的人員有較大關(guān)聯(lián)。在實(shí)際研究過程中,科研人員可能缺乏數(shù)據(jù)版本保存意識(shí),僅上傳最終科研成果中涉及的數(shù)據(jù)。然而,得出實(shí)驗(yàn)結(jié)果的前置數(shù)據(jù)也同樣具有較高的存儲(chǔ)價(jià)值,如果僅上傳最后的結(jié)果數(shù)據(jù),則其他研究人員無法重復(fù)進(jìn)行實(shí)驗(yàn)以驗(yàn)證實(shí)驗(yàn)結(jié)果的有效性,也無法利用已有實(shí)驗(yàn)數(shù)據(jù)得到更多的科學(xué)發(fā)現(xiàn)。對(duì)于長(zhǎng)期受資助的項(xiàng)目,如果科研人員未按研究機(jī)構(gòu)規(guī)定定期上傳和管理科學(xué)數(shù)據(jù),那么造成的損失和后果將更為嚴(yán)重。除此之外,一些有價(jià)值的科學(xué)數(shù)據(jù)被創(chuàng)建后,可能被研究人員誤認(rèn)為無須保存導(dǎo)致被刪除等,從而影響后續(xù)的科研工作。
科學(xué)數(shù)據(jù)集中存儲(chǔ)后需要對(duì)其進(jìn)行合理、高效的管理,在這一層面可能面臨統(tǒng)一的數(shù)據(jù)安全分級(jí)標(biāo)準(zhǔn)缺失、數(shù)據(jù)泄漏和數(shù)據(jù)竊取等數(shù)據(jù)安全問題。
2.2.1 缺乏統(tǒng)一的數(shù)據(jù)安全分級(jí)標(biāo)準(zhǔn)
不同階段的科學(xué)數(shù)據(jù)的價(jià)值和保密程度不同,因此需要根據(jù)不同價(jià)值和密級(jí)制定對(duì)應(yīng)的保密管理和審查策略。在國內(nèi),雖然國務(wù)院辦公廳發(fā)布的《科學(xué)數(shù)據(jù)管理辦法》提出了科學(xué)數(shù)據(jù)要分級(jí)分類管理,但目前國內(nèi)仍然沒有較為統(tǒng)一規(guī)范的數(shù)據(jù)安全分級(jí)標(biāo)準(zhǔn)。此外,不同類型科學(xué)數(shù)據(jù)的開放尚未統(tǒng)一參考標(biāo)準(zhǔn),這就導(dǎo)致各科研機(jī)構(gòu)開放程度差異較大。有的科研機(jī)構(gòu)過于謹(jǐn)慎,封鎖絕大多數(shù)科學(xué)數(shù)據(jù)使其難以共享;有的科研機(jī)構(gòu)則對(duì)科學(xué)數(shù)據(jù)的重視程度不夠,隨意公開科學(xué)數(shù)據(jù),導(dǎo)致科研成果被竊取等。即使在科學(xué)數(shù)據(jù)管理實(shí)踐發(fā)展較好的國家,不同機(jī)構(gòu)的數(shù)據(jù)安全分級(jí)標(biāo)準(zhǔn)也難以統(tǒng)一規(guī)范。以美國高校為例,加利福尼亞大學(xué)伯克利分校根據(jù)數(shù)據(jù)的敏感性提出了3 級(jí)科學(xué)數(shù)據(jù)分級(jí)標(biāo)準(zhǔn),哈佛大學(xué)基于其信息安全準(zhǔn)則制定了5 級(jí)科學(xué)數(shù)據(jù)分級(jí)標(biāo)準(zhǔn)[29]。
2.2.2 數(shù)據(jù)泄漏
數(shù)據(jù)泄露現(xiàn)象的產(chǎn)生受科學(xué)數(shù)據(jù)利益相關(guān)主體多方面主客觀因素的影響??茖W(xué)數(shù)據(jù)管理過程中涉及的環(huán)節(jié)和人員較多,數(shù)據(jù)泄露風(fēng)險(xiǎn)較大。從科研人員和數(shù)據(jù)管理人員的角度來說,部分人員數(shù)據(jù)安全保護(hù)意識(shí)不強(qiáng)、數(shù)據(jù)安全級(jí)別識(shí)別能力不足等都會(huì)導(dǎo)致數(shù)據(jù)泄露。從政府和機(jī)構(gòu)層面來說,現(xiàn)行科學(xué)數(shù)據(jù)的安全等級(jí)劃分不夠明確、數(shù)據(jù)管理系統(tǒng)的安全性能和技術(shù)保障能力不足等,都不利于科學(xué)數(shù)據(jù)安全工作的開展。此外,國內(nèi)法律法規(guī)對(duì)科學(xué)數(shù)據(jù)泄露和侵權(quán)的懲處力度較低,會(huì)存在部分科研機(jī)構(gòu)的數(shù)據(jù)管理人員受到利益誘惑主動(dòng)將重要的科學(xué)數(shù)據(jù)泄露給其他科研機(jī)構(gòu)的現(xiàn)象。
2.2.3 數(shù)據(jù)竊取
科學(xué)數(shù)據(jù)被竊取是引發(fā)科學(xué)數(shù)據(jù)安全問題的又一關(guān)鍵因素,并且這一現(xiàn)象時(shí)有發(fā)生。如2021年,英國開放大學(xué)發(fā)現(xiàn)其開放獲取知識(shí)庫中的大量博士論文被掛在亞馬遜上售賣,影響較為惡劣。為了保護(hù)學(xué)生的著作權(quán)益,英國開放大學(xué)被迫停止了其機(jī)構(gòu)知識(shí)庫的開放獲取。涉及國家安全層面的科學(xué)數(shù)據(jù)被竊取問題尤為突出。部分國家為了在國際上獲取更多的話語權(quán),以高科技技術(shù)手段大規(guī)模竊取、監(jiān)視他國的重要科學(xué)數(shù)據(jù),這對(duì)構(gòu)建共建共享、合作共贏的世界數(shù)字經(jīng)濟(jì)體系產(chǎn)生了極大的損害。數(shù)據(jù)竊取造成的數(shù)據(jù)安全問題雖然對(duì)科學(xué)數(shù)據(jù)管理的利益相關(guān)者而言屬于不可抗力,也非其主觀意愿,但仍應(yīng)從技術(shù)設(shè)備等要素出發(fā)對(duì)數(shù)據(jù)安全問題進(jìn)行排查和反思,以避免數(shù)據(jù)竊取風(fēng)險(xiǎn)[30]。
科學(xué)數(shù)據(jù)開放共享的最終目的是為了應(yīng)用,科研人員在實(shí)際應(yīng)用中可能會(huì)遇到數(shù)據(jù)所有權(quán)模糊、數(shù)據(jù)篡改和數(shù)據(jù)濫用等安全問題。
2.3.1 數(shù)據(jù)所有權(quán)模糊
缺乏明確規(guī)范的科學(xué)數(shù)據(jù)產(chǎn)權(quán)界定制度是導(dǎo)致數(shù)據(jù)所有權(quán)模糊,進(jìn)而引發(fā)科學(xué)數(shù)據(jù)安全應(yīng)用問題的關(guān)鍵因素之一。如科研人員在獲取科學(xué)數(shù)據(jù)后由于權(quán)利邊界的不確定性,可能存在不敢使用或過度使用的現(xiàn)象;當(dāng)數(shù)據(jù)的所有權(quán)為多個(gè)主體時(shí),數(shù)據(jù)開放帶來的權(quán)益分配也可能引發(fā)糾紛。因此,在推進(jìn)科學(xué)數(shù)據(jù)開放共享的進(jìn)程中,必須要正視數(shù)據(jù)權(quán)益問題,明確數(shù)據(jù)主權(quán)和治權(quán)。
2.3.2 數(shù)據(jù)篡改
信任是開放科學(xué)數(shù)據(jù)的基礎(chǔ),也是開放科學(xué)環(huán)境下科學(xué)合作的基石。無論是開放前數(shù)據(jù)的篡改,還是開放后數(shù)據(jù)應(yīng)用的篡改,對(duì)科學(xué)研究的發(fā)展都會(huì)產(chǎn)生嚴(yán)重的影響??茖W(xué)數(shù)據(jù)應(yīng)用階段的數(shù)據(jù)篡改不僅涉及數(shù)據(jù)安全問題,還是違反學(xué)術(shù)誠信和學(xué)術(shù)道德的表現(xiàn)。如在實(shí)際科研過程中,部分科研人員會(huì)存在不標(biāo)明數(shù)據(jù)來源,將他人的科研成果占為己有,篡奪他人的知識(shí)產(chǎn)權(quán)的現(xiàn)象;有些科研人員甚至?xí)谡撐囊煤蟠鄹脑紨?shù)據(jù),使其強(qiáng)行符合自己的研究結(jié)果等。
2.3.3 數(shù)據(jù)濫用
有一些學(xué)科領(lǐng)域和研究課題所涉及的科學(xué)數(shù)據(jù)通常包含了個(gè)人和機(jī)構(gòu)等不宜隨意公開應(yīng)用的數(shù)據(jù)信息。尤其是在醫(yī)藥衛(wèi)生領(lǐng)域和統(tǒng)計(jì)學(xué)領(lǐng)域,較多臨床數(shù)據(jù)和調(diào)查數(shù)據(jù)包含了個(gè)人隱私信息,這些數(shù)據(jù)信息在開放共享后,使用者獲取的門檻和成本降低,容易導(dǎo)致隱私數(shù)據(jù)的泄漏和濫用。
政府、科研機(jī)構(gòu)及科研人員是科學(xué)數(shù)據(jù)開放共享過程中最為核心的主體,在科學(xué)數(shù)據(jù)的生產(chǎn)、資助、組織、管理、利用過程中扮演著不同的角色。其中,政府是科學(xué)數(shù)據(jù)的宏觀層面的管理者,主要承擔(dān)了研究資金資助和政策法律制定的責(zé)任??蒲袡C(jī)構(gòu)是中觀層面的管理者,負(fù)責(zé)制定符合科研誠信和學(xué)術(shù)道德的科學(xué)數(shù)據(jù)管理規(guī)范,管理科研人員受資助項(xiàng)目的實(shí)施,提出科學(xué)數(shù)據(jù)向公眾開放的策略,保障開放共享下科學(xué)數(shù)據(jù)的安全。科研人員既是科學(xué)數(shù)據(jù)的生產(chǎn)者和利用者,也是微觀層面的管理者,需要按照規(guī)定及時(shí)公開計(jì)劃內(nèi)應(yīng)共享的科學(xué)數(shù)據(jù),遵守科學(xué)數(shù)據(jù)的管理規(guī)范和相關(guān)的法律法規(guī)。
政府在完善和優(yōu)化科學(xué)數(shù)據(jù)的安全治理工作中首先應(yīng)解決我國數(shù)據(jù)安全頂層設(shè)計(jì)不完備的問題。雖然目前我國已有包括《科學(xué)數(shù)據(jù)管理辦法》在內(nèi)的多項(xiàng)數(shù)據(jù)管理政策,但相關(guān)政策缺乏系統(tǒng)性,完備、細(xì)致的制度框架還未形成,不能很好地解決當(dāng)前科學(xué)數(shù)據(jù)所面臨的安全問題。因此,我國政府需持續(xù)細(xì)化和完善相關(guān)制度。
3.1.1 建立健全科學(xué)數(shù)據(jù)的產(chǎn)權(quán)制度
針對(duì)科學(xué)數(shù)據(jù)所有權(quán)模糊的問題,我國尚無明確的法律法規(guī)出臺(tái)。因此,應(yīng)在國家層面推進(jìn)科學(xué)數(shù)據(jù)產(chǎn)權(quán)制度的建立,厘清科學(xué)數(shù)據(jù)的所有權(quán)邊界,明確科學(xué)數(shù)據(jù)的認(rèn)定、轉(zhuǎn)讓、使用規(guī)則,規(guī)范科學(xué)數(shù)據(jù)各利益相關(guān)主體在保護(hù)科學(xué)數(shù)據(jù)上所應(yīng)承擔(dān)的責(zé)任,健全科學(xué)數(shù)據(jù)知識(shí)產(chǎn)權(quán)的保護(hù)制度。除此之外,對(duì)數(shù)據(jù)竊取、泄漏、濫用等數(shù)據(jù)侵權(quán)問題,除了《數(shù)據(jù)安全法》中提出的加大懲處力度、提高違法成本、細(xì)化懲處機(jī)制外,還應(yīng)加快健全個(gè)人信息的授權(quán)保護(hù)制度,通過強(qiáng)制明示授權(quán)許可等方式切實(shí)保護(hù)用戶的權(quán)利。
3.1.2 制定科學(xué)數(shù)據(jù)分級(jí)保護(hù)制度
《中華人民共和國數(shù)據(jù)安全法》第三章第十九條提出要對(duì)數(shù)據(jù)實(shí)行分級(jí)分類保護(hù),但并未制定出詳細(xì)的數(shù)據(jù)分級(jí)保護(hù)指導(dǎo)標(biāo)準(zhǔn)。因此,我國政府需要細(xì)化制定科學(xué)數(shù)據(jù)安全分級(jí)管理的具體準(zhǔn)則,在鼓勵(lì)依法合規(guī)使用非敏感科學(xué)數(shù)據(jù)的同時(shí),保護(hù)敏感科學(xué)數(shù)據(jù)的安全,避免可開放的不開放及不可開放的被泄漏等情況。在科學(xué)數(shù)據(jù)的分級(jí)上,已有部分大學(xué)及科研機(jī)構(gòu)進(jìn)行了實(shí)踐。如美國國家航空與宇宙航行局(National Aeronautics and Space Administration,NASA)對(duì)地觀測(cè)數(shù)據(jù)信息系統(tǒng)(Earth Observing System Data and Information System,EOS DIS)將科學(xué)數(shù)據(jù)處理層級(jí)分為level 0、level 1A、level 1B、level 2、level 3、level 4 共6 個(gè)層級(jí)以輔助海量科學(xué)數(shù)據(jù)的處理[31]。美國加利福尼亞大學(xué)伯克利分校將科學(xué)數(shù)據(jù)劃分為極低(公共信息)、低(非公開、不敏感和去身份的信息)、中(中度敏感的個(gè)人可識(shí)別信息)、高(非常敏感的個(gè)人可識(shí)別信息)4 個(gè)級(jí)別[32],以實(shí)現(xiàn)嚴(yán)格的科學(xué)數(shù)據(jù)保護(hù)。我國政府也應(yīng)基于現(xiàn)實(shí)需要和已有經(jīng)驗(yàn)完善科學(xué)數(shù)據(jù)的分級(jí)保護(hù)制度。
除此之外,科學(xué)數(shù)據(jù)安全分級(jí)規(guī)則的制定還要考慮學(xué)科和行業(yè)的特點(diǎn),數(shù)據(jù)處理的程度受到數(shù)據(jù)用途、數(shù)據(jù)價(jià)值及數(shù)據(jù)采集等多個(gè)因素的影響。如果是宇宙理論方面的探索,則需要對(duì)儀器產(chǎn)生的異常值、缺失值數(shù)據(jù)進(jìn)行加工處理后將其納入分析進(jìn)程,但如果是探究宇宙生命的可能性,則需要盡可能地保存原始的、全面的、完整的信息。因此,科學(xué)數(shù)據(jù)分級(jí)不能一概而論,需要具體問題具體分析。
3.1.3 通過關(guān)鍵主體將制度政策落到實(shí)處
國內(nèi)科研資助機(jī)構(gòu)通常是政府實(shí)施科研資助與管理等的關(guān)鍵主體,在科學(xué)數(shù)據(jù)安全治理方面發(fā)揮重要的作用。因此,在科學(xué)數(shù)據(jù)安全政策落實(shí)過程中,政府宏觀管理部門應(yīng)充分發(fā)揮所轄機(jī)構(gòu)和組織的主體作用,根據(jù)其職能權(quán)力賦予相應(yīng)的職責(zé)和任務(wù)。同時(shí),相關(guān)主體應(yīng)在國家和政府宏觀政策和法律的指導(dǎo)下,積極制定既符合國家和政府訴求,又能夠保障科研機(jī)構(gòu)、科研人員等其他相關(guān)者利益的細(xì)則和要求。如科研資助機(jī)構(gòu)可通過制定科學(xué)數(shù)據(jù)管理指南等,強(qiáng)制要求受資助的科研機(jī)構(gòu)和科研人員按照科研項(xiàng)目資助的周期階段,對(duì)科學(xué)數(shù)據(jù)進(jìn)行管理和提交,并將受資助的科研項(xiàng)目的數(shù)據(jù)安全管理作為項(xiàng)目完成的指標(biāo)之一進(jìn)行審核。國家科學(xué)數(shù)據(jù)管理平臺(tái)作為數(shù)據(jù)管理的實(shí)際操作者,要從數(shù)據(jù)管理具體實(shí)施機(jī)制的制定、技術(shù)設(shè)施和人員的配置等更加微觀的層面提升系統(tǒng)平臺(tái)的數(shù)據(jù)安全管理能力和數(shù)據(jù)可重用水平等,以期為中觀和微觀層面科學(xué)數(shù)據(jù)的安全治理提供借鑒和補(bǔ)充。
科研機(jī)構(gòu)作為中觀層面的管理者擔(dān)任了承前啟后的責(zé)任,既是政府制定相關(guān)法律政策的具體實(shí)施者,又是科研人員是否履行科學(xué)數(shù)據(jù)安全保護(hù)責(zé)任的監(jiān)督者。因此,作為海量科學(xué)數(shù)據(jù)的集中地,科研機(jī)構(gòu)需在精進(jìn)數(shù)據(jù)安全保護(hù)技術(shù)的基礎(chǔ)上,構(gòu)建全面的數(shù)據(jù)安全管理機(jī)制。
3.2.1 建立科學(xué)數(shù)據(jù)隱私保護(hù)機(jī)制
科研機(jī)構(gòu)首先應(yīng)對(duì)包含隱私信息的科學(xué)數(shù)據(jù)進(jìn)行處理,通過數(shù)據(jù)匿名、限制準(zhǔn)入、資格審查等手段對(duì)科學(xué)數(shù)據(jù)進(jìn)行保護(hù)。以蘇格蘭縱向研究(The Scottish Longitudinal Study,SLS)[33]對(duì)敏感數(shù)據(jù)的處理為例,SLS 擁有人口普查數(shù)據(jù)、重大事件數(shù)據(jù)(出生、婚姻、死亡)、教育數(shù)據(jù)、衛(wèi)生數(shù)據(jù)等信息,用來審視和解決一系列社會(huì)經(jīng)濟(jì)問題,是寶貴的社會(huì)決策信息來源。為了保護(hù)個(gè)人隱私和數(shù)據(jù)安全,SLS 采取了如下措施:一是數(shù)據(jù)集以匿名形式存在,調(diào)查中涉及到的個(gè)人會(huì)模糊掉姓名和地址;二是數(shù)據(jù)存儲(chǔ)在有密碼保護(hù)的獨(dú)立網(wǎng)絡(luò)上,用戶只能在特定的受保護(hù)位置訪問數(shù)據(jù);三是負(fù)責(zé)維護(hù)和督導(dǎo)的理事會(huì)審查每一個(gè)研究申請(qǐng),并進(jìn)行風(fēng)險(xiǎn)評(píng)估,不授權(quán)任何需要確認(rèn)個(gè)人數(shù)據(jù)的研究;四是嚴(yán)格控制訪問程序,如果科研人員需要遠(yuǎn)程分析數(shù)據(jù),則由現(xiàn)場(chǎng)相關(guān)人員代為運(yùn)行統(tǒng)計(jì)程序。我國科研機(jī)構(gòu)應(yīng)參考已有成功經(jīng)驗(yàn),依據(jù)數(shù)據(jù)特性完善科學(xué)數(shù)據(jù)的隱私保護(hù)機(jī)制。
3.2.2 制定科學(xué)數(shù)據(jù)使用管理機(jī)制
科學(xué)數(shù)據(jù)格式、標(biāo)準(zhǔn)的不統(tǒng)一對(duì)數(shù)據(jù)的完整性和通用性造成了阻礙,因此需要對(duì)科學(xué)數(shù)據(jù)的上傳和引用標(biāo)準(zhǔn)進(jìn)行規(guī)范。在科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)化方面,Open AIRE 為我國提供了很好的參考。Open AIRE 作為歐盟委員會(huì)開放政策的基礎(chǔ)支撐機(jī)構(gòu),為科研人員提供了覆蓋所有科學(xué)數(shù)據(jù)類型的標(biāo)準(zhǔn)指南[34]。在數(shù)據(jù)引用方面為科學(xué)數(shù)據(jù)制定了唯一的引用標(biāo)識(shí),使其能夠如其他文獻(xiàn)資源一般自由、規(guī)范地流通。我國可參考德、英、澳等國家聯(lián)合建立的DataCite 機(jī)構(gòu)的運(yùn)行程序來構(gòu)建此類機(jī)制。DataCite 等機(jī)構(gòu)專門用于登記科學(xué)數(shù)據(jù)并為其分配永久標(biāo)識(shí)符,使科學(xué)數(shù)據(jù)可作為獨(dú)立的、可應(yīng)用的、唯一的科學(xué)對(duì)象被使用[35]。
3.2.3 完善科學(xué)數(shù)據(jù)備份容災(zāi)機(jī)制
建立科學(xué)數(shù)據(jù)的備份容災(zāi)機(jī)制是應(yīng)對(duì)科學(xué)數(shù)據(jù)遺失的重要手段??蒲袡C(jī)構(gòu)需采用合適的數(shù)據(jù)備份介質(zhì)和策略,以應(yīng)對(duì)供電中斷、硬件崩潰等突發(fā)情況。當(dāng)然這一機(jī)制也需要科學(xué)數(shù)據(jù)存繳者的配合,如美國地震科學(xué)注冊(cè)研究中心(Incorporated Research Institutions for Seismology,IRIS)在其數(shù)據(jù)提交協(xié)議中規(guī)定[36],數(shù)據(jù)提交者必須周期性地將科學(xué)數(shù)據(jù)轉(zhuǎn)錄到新媒體中,通過對(duì)數(shù)據(jù)的定期管理來保證數(shù)據(jù)的安全性和永久可用性,維護(hù)數(shù)據(jù)集的多個(gè)副本以防止單個(gè)數(shù)據(jù)集的丟失或物理損壞。
3.2.4 強(qiáng)化科學(xué)數(shù)據(jù)追蹤防御機(jī)制
開放共享科學(xué)數(shù)據(jù)對(duì)當(dāng)前的信息技術(shù)提出挑戰(zhàn),必須開發(fā)滿足共享機(jī)密、敏感數(shù)據(jù)的安全技術(shù)來防止意外事故和蓄意攻擊。當(dāng)前我們不能僅通過對(duì)源代碼和安全系統(tǒng)架構(gòu)保密的方式保障數(shù)據(jù)安全,還需要開放源代碼等信息,在攻擊者分析漏洞并攻擊后對(duì)系統(tǒng)進(jìn)行更為徹底的測(cè)試,這種“開放性最終形成更好的安全性(openness ultimately breeds better security)”的做法可以幫助我們更好地保障數(shù)據(jù)安全。除了對(duì)現(xiàn)有系統(tǒng)的測(cè)試,科研機(jī)構(gòu)還應(yīng)重視數(shù)據(jù)溯源技術(shù)應(yīng)用,以達(dá)到防篡改、防泄露、防攻擊、防病毒的目的。
科研人員作為生產(chǎn)和利用科學(xué)數(shù)據(jù)的重要主體,受到政府和科研機(jī)構(gòu)的雙重管理,是上述政策和機(jī)制的踐行者。從這一層面維護(hù)科學(xué)數(shù)據(jù)安全,需要科研人員遵守法律和道德的雙層約束。
3.3.1 遵守科學(xué)數(shù)據(jù)管理規(guī)范
科研人員作為科學(xué)數(shù)據(jù)的生產(chǎn)者時(shí),一方面要配合科研機(jī)構(gòu)的備份容災(zāi)機(jī)制,按規(guī)定程序制定數(shù)據(jù)管理計(jì)劃,定時(shí)上傳管理科學(xué)數(shù)據(jù),做好科研項(xiàng)目全流程的數(shù)據(jù)記錄及備份,積極履行數(shù)據(jù)公開和共享的責(zé)任,在數(shù)據(jù)出現(xiàn)突發(fā)問題時(shí),及時(shí)向負(fù)責(zé)機(jī)構(gòu)報(bào)告并就此緊急事件快速作出反應(yīng);另一方面,提交數(shù)據(jù)時(shí)應(yīng)按照科研機(jī)構(gòu)的統(tǒng)一標(biāo)準(zhǔn)進(jìn)行上傳,遵守科學(xué)數(shù)據(jù)管理規(guī)范,保證數(shù)據(jù)的可用性和完整性。
3.3.2 增強(qiáng)科研誠信道德意識(shí)
科研人員作為科學(xué)數(shù)據(jù)的使用者時(shí),首先要遵守政府制定的各項(xiàng)法律法規(guī),以我國《科學(xué)數(shù)據(jù)管理辦法》和《中華人民共和國數(shù)據(jù)安全法》為參考,對(duì)科學(xué)數(shù)據(jù)的存儲(chǔ)、管理、應(yīng)用進(jìn)行謹(jǐn)慎處理,不因經(jīng)濟(jì)利益等做出數(shù)據(jù)泄漏、篡改、竊取等數(shù)據(jù)侵權(quán)行為,遵守學(xué)術(shù)道德。當(dāng)然,在個(gè)人數(shù)據(jù)權(quán)益被侵犯時(shí),也應(yīng)運(yùn)用法律武器追究侵權(quán)行為,維護(hù)自己的合法權(quán)益。其次要遵守科研機(jī)構(gòu)數(shù)據(jù)獲取程序,按準(zhǔn)入和使用要求合規(guī)利用數(shù)據(jù),規(guī)范科學(xué)數(shù)據(jù)處理行為,促進(jìn)科學(xué)數(shù)據(jù)的開放共享。
科學(xué)數(shù)據(jù)走向開放共享是大數(shù)據(jù)時(shí)代的主流趨勢(shì),保障這一趨勢(shì)下的科學(xué)數(shù)據(jù)安全對(duì)降低科研成本、推動(dòng)學(xué)科創(chuàng)新、肅清學(xué)術(shù)風(fēng)氣、增強(qiáng)科研實(shí)力具有重要意義。本文基于制度、技術(shù)、設(shè)施、人員等要素對(duì)科學(xué)數(shù)據(jù)存儲(chǔ)、管理、應(yīng)用中可能存在的安全問題進(jìn)行分析,并從政府、科研機(jī)構(gòu)和人員等利益相關(guān)主體的角度提出了開放共享環(huán)境下科學(xué)數(shù)據(jù)安全的治理路徑,有一定的指導(dǎo)價(jià)值。但本文研究還存在一定的不足,后續(xù)將研究和制定更加具體的實(shí)施細(xì)則,助力中國數(shù)據(jù)安全戰(zhàn)略的構(gòu)建和實(shí)施。
中華醫(yī)學(xué)圖書情報(bào)雜志2022年6期