劉少芳
(廣東省科技圖書館(廣東省科學院信息研究所),廣東 廣州 510070)
隨著5G、云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)及人工智能等技術(shù)的飛速發(fā)展,數(shù)據(jù)量急劇增加,網(wǎng)絡安全威脅也持續(xù)放大。 數(shù)據(jù)作為網(wǎng)絡運行的核心載體,保護其安全是應對網(wǎng)絡安全挑戰(zhàn)的重中之重。 2017 年實施的《中華人民共和國網(wǎng)絡安全法》明確規(guī)定鼓勵開發(fā)網(wǎng)絡數(shù)據(jù)安全保護和利用技術(shù),促進公共數(shù)據(jù)資源開放,采取重要數(shù)據(jù)備份和加密等措施,維護網(wǎng)絡數(shù)據(jù)的保密性、完整性和可用性[1]。 2021 年發(fā)布的《中華人民共和國國民經(jīng)濟和社會發(fā)展第十四個五年規(guī)劃和2035 年遠景目標綱要》14 次提及網(wǎng)絡安全,5 次提及數(shù)據(jù)安全[2],對加強網(wǎng)絡安全保障體系及能力建設、確保公共數(shù)據(jù)安全做出了重要部署,可見網(wǎng)絡安全和數(shù)據(jù)安全是國家安全體系的核心要素,并已逐步成為國家戰(zhàn)略。 此外,2021 年我國又相繼發(fā)布了《中華人民共和國數(shù)據(jù)安全法》和《網(wǎng)絡數(shù)據(jù)安全管理條例(征求意見稿)》,網(wǎng)絡數(shù)據(jù)安全的重要性日益凸顯。
研究數(shù)據(jù)作為網(wǎng)絡數(shù)據(jù)的重要組成部分,是科學研究過程中產(chǎn)生的原始記錄及其衍生數(shù)據(jù),承載著重要的研究信息,是支撐科學研究發(fā)展的重要戰(zhàn)略資源,其安全問題不容小覷,尤其在網(wǎng)絡安全背景下,研究數(shù)據(jù)安全管理越來越受到關(guān)注。
筆者選取加拿大10 家具有代表性的圖書館為調(diào)研對象,包含9 家研究型大學的圖書館,1 家公共圖書館,通過網(wǎng)絡調(diào)研和文獻調(diào)研等方法,從政策管理、組織實施、基礎(chǔ)設施保障、教育培訓等方面梳理加拿大圖書館在研究數(shù)據(jù)安全管理服務領(lǐng)域的實踐經(jīng)驗,詳見下頁表1。
表1 加拿大圖書館調(diào)研清單
在政策規(guī)劃方面,加拿大通過聯(lián)邦政府、資助機構(gòu)、圖書館等層級頒布政策予以支持引導。 2014年,加拿大政府啟動“開放數(shù)據(jù)”行動,旨在促進科學研究產(chǎn)出數(shù)據(jù)的開放獲取,驅(qū)動科技創(chuàng)新[3]。2016 年,加拿大自然科學和工程研究理事會、加拿大衛(wèi)生研究院、加拿大社會科學和人文科學研究理事會三大基金組織聯(lián)合頒布《關(guān)于數(shù)字數(shù)據(jù)管理原則的三方聲明》,明確了研究人員、研究群體、研究機構(gòu)和科研資助機構(gòu)在研究數(shù)據(jù)管理過程中各自所應承擔的職責[4]。 2018 年,加拿大出臺《三部門研究數(shù)據(jù)管理政策咨詢草案》,目的是通過推廣完善的數(shù)據(jù)管理實踐促進開展追求卓越的科研活動[5]。多家加拿大圖書館從信息安全、數(shù)據(jù)保密、知識產(chǎn)權(quán)、數(shù)據(jù)館藏發(fā)展等不同維度制定了數(shù)據(jù)管理內(nèi)部政策,如:皇后大學圖書館制定了《研究數(shù)據(jù)管理的數(shù)據(jù)保存政策》,對研究數(shù)據(jù)的保存標準、數(shù)據(jù)庫建設及數(shù)據(jù)存儲等提出了指導性建議。
在研究數(shù)據(jù)管理計劃(DMP)方面,DMP 規(guī)定了項目每個階段如何組織、存儲、共享研究數(shù)據(jù),這是一種實時文檔,可以調(diào)整項目研究過程的變化,主要包括工具和計劃清單兩種服務方式。 工具有三種,即DMP 助手、DMP 工具和DMP 在線,DMP 助手是加拿大自主開發(fā)的雙語工具(英語和法語),可內(nèi)置個性化模板,適應性好,從管理工具層面就開始保護研究數(shù)據(jù)的安全性;DMP 工具由加利福尼亞數(shù)字圖書館托管,美國國家科學基金會等10 多家美國資助機構(gòu)提供定制DMP 模板;DMP 在線是由英國數(shù)據(jù)監(jiān)管中心創(chuàng)建的免費DMP 工具。 計劃清單服務內(nèi)容包括數(shù)據(jù)采集、文檔和元數(shù)據(jù)、儲存與備份、數(shù)據(jù)共享、責任與資源、道德與知識產(chǎn)權(quán)等,覆蓋研究數(shù)據(jù)全生命周期。
資助者或其他有意者建立新聯(lián)系,提供安全存儲的權(quán)威數(shù)據(jù)副本,可能被另一項研究發(fā)現(xiàn)并應用等。在數(shù)據(jù)共享方面,麥吉爾大學圖書館介紹了如何合理合法地共享研究數(shù)據(jù),包括獲得知情同意后才能共享數(shù)據(jù)、通過匿名保護個人/機密/敏感信息、限制數(shù)據(jù)訪問量或添加禁令、申請許可證等方式[7]。 阿爾伯塔大學圖書館和維多利亞大學圖書館則推薦采用Dataverse 共享數(shù)據(jù)。 Dataverse 系統(tǒng)在上傳文件時會頒發(fā)一個已在DataCite 注冊的永久性標識(DOI),而DataCite 允許通過各種搜索工具挖掘數(shù)據(jù)。 此外,加拿大國家圖書館暨檔案館與加拿大各地的學術(shù)機構(gòu)和圖書館等共同制定了共享館藏管理策略,包括跟蹤、分類和保存加拿大出版物的最新版本。 在數(shù)據(jù)引用方面,英屬哥倫比亞大學圖書館建議通過開放獲取的數(shù)據(jù)庫查找和引用研究數(shù)據(jù),可在谷歌學術(shù)等網(wǎng)站注冊免費賬戶,同時將研究數(shù)據(jù)唯一的網(wǎng)址或DOI 鏈接添加到用戶配置文件當中[8],以保障研究數(shù)據(jù)安全。
數(shù)據(jù)共享引用為發(fā)現(xiàn)和重復利用數(shù)據(jù)集提供了途徑,同時也有助于評估研究數(shù)據(jù)的影響力[6]。 在信任的數(shù)據(jù)庫中共享研究數(shù)據(jù)具有以下優(yōu)點:允許他人驗證數(shù)據(jù),增加引用量,有利于與潛在合作方、整個項目周期會不斷產(chǎn)出研究數(shù)據(jù),數(shù)據(jù)丟失對推動項目研究進程極其不利,因而保障項目全周期的數(shù)據(jù)儲存安全、備份和維護至關(guān)重要。 多倫多大學圖書館等建議研究數(shù)據(jù)存儲應遵循3—2—1 備份規(guī)則,即至少存儲三份數(shù)據(jù)副本,將副本存儲于兩種不同介質(zhì)(如硬盤、云存儲、光盤),將一份備份副本存儲在異地。 加拿大圖書館研究數(shù)據(jù)的長期存儲和共享方式主要有校內(nèi)/校外研究數(shù)據(jù)機構(gòu)庫、特定學科數(shù)據(jù)庫和數(shù)據(jù)機構(gòu)庫聯(lián)盟等4 種,其中3 家圖書館建有校內(nèi)研究數(shù)據(jù)機構(gòu)庫,分別是英屬哥倫比亞大學圖書館的UBC IT Storage、阿爾伯塔大學圖書館的ERA 和渥太華大學圖書館的uOResearch;使用較多的校外數(shù)據(jù)機構(gòu)庫有Compute Canada、ICPSR和Dryad 等,系統(tǒng)定期備份,以保護用戶數(shù)據(jù)的安全性和完整性。 此外,阿爾伯塔大學圖書館等還推薦使用特定的學科數(shù)據(jù)庫,如Re3data.org、OAD 等,以滿足不同研究者的需求。 Re3data. org 由德國研究基金會資助,是涵蓋不同學科的研究數(shù)據(jù)存儲庫,為研究人員、資助機構(gòu)、出版商和學術(shù)機構(gòu)提供永久存儲和訪問數(shù)據(jù)集服務。 在數(shù)據(jù)機構(gòu)庫聯(lián)盟方面,除了英屬哥倫比亞大學圖書館和加拿大國家圖書館暨檔案館,其他8 家圖書館均使用Dataverse。 Dataverse 是一個可公開訪問的免費數(shù)據(jù)存儲庫,能夠保護和共享研究數(shù)據(jù),還可設置訪問權(quán)限,與特定個人共享數(shù)據(jù),保障數(shù)據(jù)安全。
除了阿爾伯塔大學圖書館和加拿大國家圖書館暨檔案館,其他8 家圖書館均提供教育培訓,形式包括在線培訓、論壇、專題研討會、講座等。 其中,6 家圖書館推薦MANTRA 培訓課程,該課程面向研究生、科學家、高學歷人員和信息專業(yè)人員,培訓內(nèi)容包括數(shù)據(jù)管理計劃、元數(shù)據(jù)、文件格式與轉(zhuǎn)換、存儲與安全、共享與引用等;5 家圖書館推薦使用加拿大數(shù)字圖書館聯(lián)盟的培訓資源[9],該聯(lián)盟提供了一系列可免費獲取的培訓材料,涵蓋研究數(shù)據(jù)的生命周期,包括一頁指南、在線培訓模塊、在線視頻等,資源面向研究人員、圖書館數(shù)據(jù)專家、數(shù)據(jù)管理人員以及相關(guān)領(lǐng)域的學科專家。
政府層面的政策是實現(xiàn)研究數(shù)據(jù)安全管理與共享的基石。 加拿大的研究數(shù)據(jù)管理政策可分為“政府—資助機構(gòu)—圖書館”三個層面,從頂層設計開始規(guī)劃數(shù)據(jù)安全管理。 我國也應構(gòu)建“中央—地方政府—科研管理部門—圖書館”自上而下的政策體系,按照“誰擁有,誰負責”“誰開放,誰受益”原則,明確研究數(shù)據(jù)管理各環(huán)節(jié)主體的職責分工。 目前,國務院已出臺我國首個國家層面的科學數(shù)據(jù)管理辦法,四川、山東、吉林、安徽等省份也相繼頒布了科學數(shù)據(jù)管理政策,后續(xù)應進一步完善多層級的政策體系,鼓勵科研管理部門和圖書館制定相應的內(nèi)部政策,通過強化頂層設計,逐步引導全社會提高研究數(shù)據(jù)管理和維護意識,促進研究數(shù)據(jù)安全管理和共享氛圍的形成。
加拿大圖書館在研究數(shù)據(jù)管理的計劃制訂、存儲及共享引用等環(huán)節(jié)均有相應的安全管理措施。 我國圖書館可借鑒其經(jīng)驗,在研究數(shù)據(jù)管理的關(guān)鍵環(huán)節(jié)上下功夫,切實做好數(shù)據(jù)安全管理工作,如:在數(shù)據(jù)管理方面鼓勵有能力的機構(gòu)自主研發(fā)符合本地實際且能滿足科研人員需求的個性化DMP 工具,通過本土管理工具保護數(shù)據(jù)安全;在數(shù)據(jù)存儲方面鼓勵科研人員對重要的研究數(shù)據(jù)進行異地備份,同時加強研究數(shù)據(jù)安全管理制度和宣傳保護工作;在數(shù)據(jù)共享引用方面推薦安全的數(shù)據(jù)共享、獲取途徑,引導科研人員通過獲得知情同意、申請許可等方式共享研究數(shù)據(jù),并在其科研成果中規(guī)范引用所使用和參考的研究數(shù)據(jù)。 此外,我國圖書館還可將研究數(shù)據(jù)安全管理服務嵌入科研項目的研究過程,通過一站式服務調(diào)動科研人員參與數(shù)據(jù)管理的積極性和主動性,在保證數(shù)據(jù)安全的基礎(chǔ)上,提升研究數(shù)據(jù)的開放共享水平。
研究數(shù)據(jù)的長期安全保存和共享需要強大的基礎(chǔ)設施作保障。 加拿大圖書館有的通過自主研發(fā)或二次開發(fā)Dataverse 等開源軟件的方法搭建數(shù)據(jù)機構(gòu)庫,有的借助外部數(shù)據(jù)機構(gòu)庫儲存數(shù)據(jù),還有的提供國內(nèi)外外部存儲庫導航服務。 我國圖書館可以借鑒上述做法,通過設立數(shù)據(jù)管理平臺專項加大基金扶持力度,鼓勵有能力的圖書館自主研發(fā)數(shù)據(jù)機構(gòu)庫,從數(shù)據(jù)儲存的源頭保障數(shù)據(jù)安全;加強圖書館界的合作交流,利用開源軟件合力搭建可提供定制服務的研究數(shù)據(jù)管理平臺。 搭建研究數(shù)據(jù)管理平臺不僅可以確保數(shù)據(jù)安全,還是實現(xiàn)研究數(shù)據(jù)開放獲取、開放共享的有力保障。
加拿大圖書館開展了內(nèi)容多樣化、渠道多元化、服務差異化的研究數(shù)據(jù)管理培訓活動,線下方式涵蓋課程、講座、研討會等,線上方式主要是在線課程、網(wǎng)絡資源導航等。 我國圖書館的研究數(shù)據(jù)管理培訓工作可借鑒其線上線下相結(jié)合的模式,根據(jù)服務對象知識層面和需求的不同開展個性化培訓服務,如:針對高校學生開設研究數(shù)據(jù)管理課程,從教育階段開始培養(yǎng)數(shù)據(jù)安全管理意識和技能;針對科研人員開設嵌入式研究數(shù)據(jù)管理流程培訓,通過開展一系列教育培訓活動強化科研人員管理和維護研究數(shù)據(jù)的意識,提高其數(shù)據(jù)獲取和利用能力;針對圖書館員開設研究數(shù)據(jù)的服務培訓課程,提升其數(shù)據(jù)管理能力和服務水平。