胡雪環(huán)等 屈寶強
(中國科學(xué)技術(shù)信息研究所,北京 100038)
美國普渡大學(xué)圖書館的科學(xué)數(shù)據(jù)管理服務(wù)
胡雪環(huán)等 屈寶強
(中國科學(xué)技術(shù)信息研究所,北京 100038)
對普渡大學(xué)的科學(xué)數(shù)據(jù)管理政策進行解讀,在此基礎(chǔ)上對其主要政策內(nèi)容進行整合并將之歸納為數(shù)據(jù)收集政策、數(shù)據(jù)保存政策、數(shù)據(jù)使用規(guī)定、數(shù)據(jù)管理與維護四大部分,進一步總結(jié)出高校在制定數(shù)據(jù)管理政策時的注意事項,從微觀層面為我國高校圖書館制定科學(xué)數(shù)據(jù)管理政策內(nèi)容提供具體參考和借鑒。
高校圖書館;科學(xué)數(shù)據(jù)管理;收集政策;保存政策;使用規(guī)定
作為高校教學(xué)和科研信息資源保障中心,圖書館應(yīng)充分利用自身優(yōu)勢,積極探索符合本校的科學(xué)數(shù)據(jù)管理計劃和完善的數(shù)據(jù)管理政策,主動承擔(dān)起高??茖W(xué)數(shù)據(jù)管理的重要職能,并將計劃的制定、政策的維護、版本的更新、數(shù)據(jù)管理與服務(wù)等工作納入正常業(yè)務(wù)范圍,以滿足科研人員、資助機構(gòu)以及學(xué)生對本校科研數(shù)據(jù)發(fā)現(xiàn)、使用、管理、保存和開放共享的長期需求。高校是科學(xué)研究的主要陣地之一,其科學(xué)數(shù)據(jù)的有效管理和保存對于追蹤高校科研數(shù)據(jù)來源、避免重復(fù)研究、促進數(shù)據(jù)再利用和加快科學(xué)研究進程等方面發(fā)揮著重要的作用。在E-science環(huán)境下,科學(xué)數(shù)據(jù)管理、保存和共享的需求越來越高,已引起各國政府和學(xué)校的高度重視。2007年,美國國家科學(xué)基金會(NSF)啟動了DataNet計劃,明確提出以圖書館為主體實施科學(xué)數(shù)據(jù)管理[1]。英、美等國多所高校也相繼制定了科學(xué)數(shù)據(jù)管理政策,比如:愛丁堡大學(xué)制定了研究數(shù)據(jù)管理政策,牛津大學(xué)制定了研究數(shù)據(jù)及記錄管理政策,斯坦福大學(xué)制定了研究數(shù)據(jù)保存、獲取政策,杜克大學(xué)制定了研究保存、共享、所有權(quán)政策等,從政策上確保了科研數(shù)據(jù)管理與服務(wù)的長期有效開展。在我國,盡管部分高校圖書館已經(jīng)開展了科學(xué)數(shù)據(jù)管理的實踐和探索,但是沒有像英、美等國諸多高校那樣制定了成熟的數(shù)據(jù)管理政策和指南。這種缺乏完善政策指導(dǎo)的實踐不利于高??蒲袛?shù)據(jù)的長久管理與共享利用。
面對英、美等國高校比較成熟的科學(xué)數(shù)據(jù)管理政策和國內(nèi)高校系統(tǒng)相關(guān)政策規(guī)定的缺失,有必要對一些有代表性的高??茖W(xué)數(shù)據(jù)管理政策進行深入的解讀和探究,從政策內(nèi)容的具體制定層面為我國高校圖書館科學(xué)數(shù)據(jù)管理政策的制定提供一定的范本和參考。普渡大學(xué)是美國典型的研究型大學(xué),并且較早開展了科學(xué)數(shù)據(jù)管理與服務(wù)。其圖書館承擔(dān)了主要的數(shù)據(jù)管理工作且制定了完善的科學(xué)數(shù)據(jù)管理政策,并在實踐中不斷地得到更新與修訂。本文將對美國普渡大學(xué)圖書館的科學(xué)數(shù)據(jù)管理政策進行分析,重點闡述普渡大學(xué)的數(shù)據(jù)收集政策、數(shù)據(jù)保存政策、研究倉儲使用規(guī)定、數(shù)據(jù)管理與維護以及面臨的挑戰(zhàn)與風(fēng)險,并通過普渡大學(xué)圖書館數(shù)據(jù)管理政策的內(nèi)容,探知在政策制定中需要注意的若干關(guān)鍵問題,從而形成幾點啟示,以供我國高校圖書館制定具體政策內(nèi)容時參考。
美國普渡大學(xué)是一所典型的研究型大學(xué),比較早地開展了科學(xué)數(shù)據(jù)管理與服務(wù)。 在制定科學(xué)數(shù)據(jù)管理政策之初,普渡大學(xué)便明確規(guī)定了開展數(shù)據(jù)管理工作的主要目的是向該??蒲腥藛T和學(xué)生提供數(shù)據(jù)資源和服務(wù),促進科研數(shù)據(jù)管理、傳播和保存。具體目標(biāo)是:收集、發(fā)布和保存隸屬于普渡大學(xué)或者與普渡大學(xué)研究項目相關(guān)的數(shù)據(jù)集和數(shù)據(jù)文檔;幫助普渡大學(xué)的研究人員滿足基金資助機構(gòu)對管理、共享和保存研究數(shù)據(jù)的需求;為研究者、政策制定者及其他人發(fā)現(xiàn)和獲取研究數(shù)據(jù)集提供一種渠道和方式;提供可持續(xù)的保存環(huán)境,使存放的研究數(shù)據(jù)能夠支持研究的歷史記錄,并且方便獲取使用最新科研知識[2]。
當(dāng)前,普渡大學(xué)圖書館主要開展8項數(shù)據(jù)管理服務(wù):(1)在線普渡大學(xué)研究資源庫(Purdue University Research Repository,簡稱PURR);(2)幫助科研人員制定數(shù)據(jù)管理計劃;(3)元數(shù)據(jù)處理及數(shù)據(jù)保存;(4)提供分布式管理中心,進行專業(yè)的數(shù)據(jù)引用和高效科研培訓(xùn);(5)開展課堂教學(xué)和實驗數(shù)據(jù)管理指導(dǎo)和教育;(6)組織、獲取、保存和記錄大數(shù)據(jù);(7)數(shù)據(jù)咨詢服務(wù);(8)數(shù)字對象標(biāo)識符(DOI)服務(wù)[3]。PURR是由普渡大學(xué)圖書館和普渡大學(xué)信息技術(shù)部以及研究副校長辦公室合作研發(fā)與提供支持,是開展上述8項系列服務(wù)的重要平臺,各項服務(wù)的開展和相關(guān)說明均被納入到該研究資源庫政策中進行解釋和規(guī)定。
3.1 數(shù)據(jù)收集
(1)數(shù)據(jù)收集的特定對象
在收集政策中指出,PURR是一個提供服務(wù)和虛擬研究環(huán)境的機構(gòu)知識庫,主要為普渡大學(xué)的研究人員和其直接相關(guān)的合作者提供數(shù)據(jù)管理支持,凡是普渡大學(xué)的教師、職員、學(xué)生和任何從普渡大學(xué)畢業(yè)的研究生,都可以創(chuàng)建項目和提交數(shù)據(jù)。非普渡大學(xué)的合作者則需要至少與一個有效的普渡大學(xué)注冊用戶有關(guān)(比如合作開展科研工作等)才有資格提交數(shù)據(jù)集[4]。
(2)數(shù)據(jù)收集的學(xué)科范圍和條件
收集政策的目的是加強普渡大學(xué)所有學(xué)科領(lǐng)域研究數(shù)據(jù)的收集和管理,從各個領(lǐng)域和學(xué)科收集來的數(shù)據(jù)在PURR進行發(fā)布或存檔需要滿足以下條件:數(shù)據(jù)的提供者是PURR指定的成員;被提交的數(shù)據(jù)必須是普渡大學(xué)、圖書館、PURR以及他們各自的政策和規(guī)定所允許的;被提交的數(shù)據(jù)必須是法律部門和法規(guī)條例所允許的;當(dāng)一個用戶提交一個數(shù)據(jù)集,他或她便授予大學(xué)非獨占許可權(quán),使普渡大學(xué)對數(shù)據(jù)集有永久管理、發(fā)布的權(quán)利[4]。
(3)數(shù)據(jù)收集的格式推薦
PURR的數(shù)據(jù)收集包括研究數(shù)據(jù)集和相關(guān)信息。其中,研究數(shù)據(jù)集通常是文件和元數(shù)據(jù)的集合,包括與研究數(shù)據(jù)相關(guān)的保存和顯示信息以及注釋和輔助內(nèi)容。所有的提交內(nèi)容將以數(shù)字化形式存在。提交的數(shù)據(jù)必須與普渡大學(xué)的科研項目和研究教學(xué)任務(wù)有關(guān),且接收的數(shù)據(jù)范圍更側(cè)重于原始數(shù)據(jù)的輸入輸出,如電子表格、傳感器和儀表數(shù)據(jù)、調(diào)查、記錄、圖片、視頻和軟件源代碼等[3]。另外,在數(shù)據(jù)格式推薦部分,不僅列出了PURR可接受的數(shù)據(jù)格式,而且針對不同的數(shù)據(jù)格式,指明了哪些適合于長期持續(xù)存儲,哪些是PURR支持但不利于長期存儲的以及哪些是無法進行長期持續(xù)保存的數(shù)據(jù)格式,以指導(dǎo)用戶根據(jù)特定需求選擇合理的數(shù)據(jù)格式[5](表1)。
在進行數(shù)據(jù)收集時,由PURR的工作人員進行文件格式識別,并驗證文件的原始格式,未來任何有關(guān)數(shù)據(jù)的轉(zhuǎn)換和遷移工作都將包括原始文件格式信息和任何有關(guān)該對象數(shù)據(jù)集的歷次修改信息。
3.2 數(shù)據(jù)保存
PURR作為普渡大學(xué)的研究數(shù)據(jù)資源庫,必須用來支持教學(xué)、科研等活動,因此,圖書館的一個關(guān)鍵使命就是要保存該校學(xué)術(shù)信息資源,負責(zé)識別和保存不斷增加的數(shù)字格式資源,使這些數(shù)據(jù)能夠支持大學(xué)的研究、教學(xué)和學(xué)習(xí)需要。
(1)數(shù)據(jù)保存參與者角色與職責(zé)分配
雖然圖書館員和檔案員在保存和提供學(xué)術(shù)資源訪問方面擔(dān)任著主要責(zé)任,但是從當(dāng)前來看,數(shù)字資源的保存已經(jīng)成為所有利益相關(guān)者的共同責(zé)任。PURR指導(dǎo)委員會(包括圖書館館長、研究副校長以及信息技術(shù)部副校長和首席信息官)要負責(zé)評估和批準(zhǔn)有關(guān)提交給PURR的資源內(nèi)容的相關(guān)政策和規(guī)程。檔案員和圖書館學(xué)科專家負責(zé)甄別和篩選長期保存的數(shù)字內(nèi)容。而對于從事科學(xué)數(shù)據(jù)長期保存的教職員工以及其他研究人員則有義務(wù)將其科研數(shù)據(jù)轉(zhuǎn)換成符合PURR要求的數(shù)據(jù)保存格式、元數(shù)據(jù)和相關(guān)配合行動[5]。
此外,普渡大學(xué)圖書館、信息技術(shù)部和研究副校長室等相關(guān)責(zé)任部門也在致力于通過合作發(fā)展的途徑使PURR成為一個持久可信的數(shù)據(jù)倉儲,積極倡導(dǎo)與其他大學(xué)、圖書館、機構(gòu)和組織的合作,進一步就數(shù)字內(nèi)容保存的技術(shù)等方面進行探討,以共同實現(xiàn)數(shù)字資源有效保存共享的愿景[5]。
圖書館的數(shù)字保存工作雖然有識別、保護、提供數(shù)據(jù)保存方法的責(zé)任以確??沙掷m(xù)訪問選定的數(shù)字資產(chǎn)。但是并不意味著所有存儲在PURR里的數(shù)據(jù)資源將被永久保存和收錄。對于上傳到PURR的數(shù)據(jù)會有一個10年的基本保存期限;超出了10年的數(shù)據(jù)將根據(jù)長期保存項目的相關(guān)標(biāo)準(zhǔn)由專業(yè)館員進行篩選保留,而這一行動的有效實施還要依賴于相關(guān)的待批準(zhǔn)的預(yù)算以及其他資源的保障[5]。因此,普渡大學(xué)圖書館必須考慮對這些數(shù)據(jù)進行合理分類,并設(shè)定合理的優(yōu)先保存規(guī)則,目前,針對以下幾種數(shù)據(jù)將優(yōu)先享有保存資格[5]:與出版發(fā)表的論文或著作相關(guān)的數(shù)據(jù)集;獨立的數(shù)據(jù)出版物;有較高的研究教學(xué)價值的數(shù)據(jù)集;其他經(jīng)過篩選的數(shù)據(jù)文件和材料。
表1 數(shù)據(jù)格式推薦
(3)數(shù)據(jù)保存原則
該部分詳細列出了普渡大學(xué)數(shù)據(jù)保存具體遵循的原則,比如:遵守開放檔案信息系統(tǒng)(OAIS)參考模型標(biāo)準(zhǔn)和其他數(shù)字保護標(biāo)準(zhǔn);尋求符合ISO 16363標(biāo)準(zhǔn)認證要求的可信數(shù)字倉儲;遵守一切知識產(chǎn)權(quán)、版權(quán)和所有權(quán)的保護規(guī)定;建立安全的和充分的數(shù)據(jù)備份和災(zāi)難恢復(fù)保障等,以力求PURR能實現(xiàn)長久地發(fā)展和持續(xù)訪問的目標(biāo)[5]。
(4)數(shù)據(jù)保存標(biāo)準(zhǔn)
在開展數(shù)據(jù)保存行動時,對于需要保存的數(shù)據(jù)進行篩選和收錄的原則主要是基于定期檢查和更新的通用標(biāo)準(zhǔn)規(guī)范。同時,對于篩選出來的用于持續(xù)保存的內(nèi)容要求能夠支持普渡大學(xué)的教學(xué)和學(xué)術(shù)研究,除此之外,要符合國家和國際館藏的發(fā)展和維護標(biāo)準(zhǔn)。其他有關(guān)數(shù)字保存形式和功能的標(biāo)準(zhǔn),由于對數(shù)字資源的持久有效保存有重要影響,在保存數(shù)據(jù)篩選原則和標(biāo)準(zhǔn)的制定中而被考慮。此外,增強普渡大學(xué)圖書館館藏的內(nèi)容范圍也是圖書館開展數(shù)據(jù)保存行動的指導(dǎo)方針之一。因此,針對保存在其他數(shù)據(jù)倉儲中但對該校教學(xué)科研有重要影響的數(shù)據(jù)也會擇優(yōu)被PURR收錄保存[5]。
(5)數(shù)據(jù)保存級別
進入PURR的每一類數(shù)據(jù)對象都將根據(jù)數(shù)據(jù)集自身特征和保存目標(biāo)等按照某一特定類型的保存策略進行保存。PURR提供了3種級別的保存策略:位級保存(Bit-level Preservation),即基礎(chǔ)的保存級別;有限保存(Limited Preservation),即較高級別的保存;完全保存(Full Preservation),即最高級別的保存。每一個保存級別下都對應(yīng)著具體的保存行動,見表2所示。
3.3 數(shù)據(jù)使用
其中:式(10)為銷售商產(chǎn)品發(fā)貨量與進貨量庫存量約束關(guān)系,式(11)為銷售商吞吐能力約束,式(12)為缺貨補充平衡關(guān)系。
普渡大學(xué)圖書館致力于其科研數(shù)據(jù)的開放獲取,認可開放存取的柏林宣言的核心理念。可訪問的用戶包括普渡大學(xué)的教師、研究人員、研究生,與普渡大學(xué)有合作的相關(guān)研究者;隸屬于其他研究機構(gòu)的教師、學(xué)生和研究人員;獨立學(xué)者和公眾等。雖然普渡大學(xué)致力于科研數(shù)據(jù)的開放共享,但是,仍要遵守相關(guān)的知識產(chǎn)權(quán)法律法規(guī),部分機密性數(shù)據(jù)不會給予公開,部分不適合向大眾開放的數(shù)據(jù)只能在小范圍內(nèi)公開等。具體的使用條款、保證條款等簡介如下。
(1)使用條款
在PURR使用條款部分,主要包括協(xié)議的修改說明;注冊,訪問和終止用戶使用PURR的條件說明;用戶在上傳數(shù)據(jù)時的隱私和保密選擇說明;使用PURR必須遵循的行為規(guī)范和禁止行為說明;普渡大學(xué)對于PURR用戶數(shù)據(jù)損壞或丟失等情況的免責(zé)聲明;在發(fā)生法律糾紛時所遵循的法律選擇和律師費等情況說明[8]。
(2)保證條款
使用普渡大學(xué)研究倉儲必須同意其保證條款,該部分規(guī)定了數(shù)據(jù)發(fā)布者在發(fā)布數(shù)據(jù)前必須同意的系列條款,其中包括授予普渡大學(xué)在一定范圍內(nèi)的復(fù)制權(quán)、分發(fā)權(quán)等;同時要求數(shù)據(jù)發(fā)布者保證上傳的科研數(shù)據(jù)不侵犯他人知識產(chǎn)權(quán),不違反相關(guān)法律條款;在上傳的具體內(nèi)容里不應(yīng)包含任何軟件病毒或任何其他有可能破壞數(shù)據(jù)管理系統(tǒng)的程序代碼,也不能含有高風(fēng)險的機密信息;涉及人類敏感問題的科研數(shù)據(jù)需征得IRB部門批準(zhǔn)等[9]。
(3)侵權(quán)說明
由于數(shù)據(jù)的開放共享,侵權(quán)行為在所難免。在侵權(quán)說明部分,主要是指導(dǎo)PURR使用者如何按照合理的程序方式解決侵權(quán)問題,比如:當(dāng)使用者發(fā)現(xiàn)版權(quán)侵犯行為時,需要提交相應(yīng)的材料和收集足夠的證據(jù),最好是有完整的URL等事實證據(jù),以幫助快速定位內(nèi)容,維護相應(yīng)權(quán)益[10]。
表2 不同級別的保存策略及其具體保存行動[7]
(4)訪問聲明
為了盡可能地提高網(wǎng)站的可訪問性和可用性,該部分主要列出了網(wǎng)站遵循的一系列指導(dǎo)方針和標(biāo)準(zhǔn)規(guī)范、技術(shù)測試規(guī)定等[11]。
3.4 數(shù)據(jù)管理與維護
PURR有責(zé)任保護其用戶提交的數(shù)據(jù)完整性,以確保數(shù)據(jù)能夠持續(xù)訪問。因此,制定了完備的數(shù)據(jù)管理與維護措施[12]。
(1)元數(shù)據(jù)保存:每一個提交到PURR的數(shù)據(jù)集都將全面實現(xiàn)其元數(shù)據(jù)保存,PURR采用多個元數(shù)據(jù)標(biāo)準(zhǔn)以確保充分描述不同數(shù)據(jù)集的特殊格式和獨特性質(zhì)。Dublin Core Metadata Initiative用于提供發(fā)現(xiàn)和引用數(shù)據(jù);MODS (Metadata Object Description Schema)用于記錄數(shù)據(jù)集的創(chuàng)造者和訪問權(quán)限; PREMIS(Preservation Metadata Maintenance Activity)用于記錄每個數(shù)據(jù)集所經(jīng)歷的保存事件和法律權(quán)利分配; METS(Metadata Encoding and Transmission Standard)用于表示數(shù)據(jù)文件的結(jié)構(gòu)和層次體系結(jié)構(gòu)。
(2)數(shù)據(jù)格式識別:對獲取的每個數(shù)據(jù)集進行文件格式分析。采用技術(shù)注冊表, PRONOM和格式識別工具、DROID來驗證每個數(shù)據(jù)集的格式,該信息用于記錄對象的整個生命周期中潛在的數(shù)據(jù)轉(zhuǎn)換、遷移和固定性檢查等。
(3)安全存儲和備份:所有PURR保存的數(shù)據(jù)都將被完整的復(fù)制,并備份到另外的網(wǎng)站,以預(yù)防災(zāi)難性的信息損失或者定期檢查時造成的數(shù)據(jù)丟失。
(4)固定性檢查:所有的PURR保存的數(shù)據(jù)都將定期進行固定性檢查,以確保沒有數(shù)據(jù)丟失,并對已經(jīng)損壞的無用數(shù)據(jù)進行定期清除。
(5)變換/標(biāo)準(zhǔn)化:由于提交到PURR的數(shù)據(jù)集在一開始不是結(jié)構(gòu)化的數(shù)據(jù),所以必須對數(shù)據(jù)進行相應(yīng)的格式轉(zhuǎn)換和標(biāo)準(zhǔn)化處理,使之符合保存的基本格式要求。當(dāng)然,在可能的情況下,PURR會盡量保存數(shù)據(jù)的原生格式;即使因為長期保存和標(biāo)準(zhǔn)化的需要必須轉(zhuǎn)換格式,轉(zhuǎn)化數(shù)據(jù)也將被記錄在其整個生命周期的數(shù)據(jù)元數(shù)據(jù)中。
(6)遷移:為了確保長期保存和訪問獲取,對于那些已過時的格式保存的數(shù)據(jù)將進行轉(zhuǎn)換,轉(zhuǎn)換遷移可能包括升級數(shù)據(jù)集到一個新的版本,轉(zhuǎn)換到一個新的文件格式或文件結(jié)構(gòu)。當(dāng)然,這些變化也會在描述數(shù)據(jù)集的元數(shù)據(jù)中有所記錄和體現(xiàn)。
3.5 數(shù)據(jù)管理挑戰(zhàn)和風(fēng)險
數(shù)字資源的管理與保存涉及的內(nèi)容遠遠不只是資源的有無,還包括技術(shù)、資金、人力等各個方面的因素。在政策部分,普渡大學(xué)圖書館也列出了其在進行科學(xué)數(shù)據(jù)管理時面臨的各類風(fēng)險和挑戰(zhàn),主要包括以下幾點[6]:一是技術(shù)的識別以及跟上技術(shù)的發(fā)展變化;二是成本,主要包括涉及人員、設(shè)備、軟件和基礎(chǔ)設(shè)施的費用以及其他各項費用;三是開發(fā)和維護一個成功的溝通框架,針對開發(fā)商、管理員和用戶不斷變化的需求、實踐等,能及時充分地識別和應(yīng)對;四是如何實現(xiàn)長久的數(shù)據(jù)保存,保存計劃貫穿于整個數(shù)據(jù)管理過程,而完成整個項目數(shù)據(jù)的保存并非易事;五是適應(yīng)各種各樣的數(shù)據(jù)集,未來數(shù)據(jù)的存在會有更多類型、格式、大小等,充滿復(fù)雜性。
PURR的發(fā)展雖然面臨諸多挑戰(zhàn),但是,隨著越來越多的基金資助機構(gòu)要求科研項目承擔(dān)者必須提交相應(yīng)的科研數(shù)據(jù)管理計劃,以描述其數(shù)據(jù)管理細節(jié),因此,PURR在幫助科研基金申請者滿足資助機構(gòu)的數(shù)據(jù)管理需求上有著巨大的優(yōu)勢。而且,PURR對收錄的數(shù)據(jù)集會分配相應(yīng)的數(shù)字資源唯一標(biāo)識符(DOI),以方便其他科研人員發(fā)現(xiàn)和引用數(shù)據(jù),這也給普渡大學(xué)提供了一個證明其科研影響力的良好機遇。
透過普渡大學(xué)圖書館數(shù)據(jù)管理政策的內(nèi)容,探知在政策制定中需要注意的若干關(guān)鍵問題,僅供我國高校圖書館制定具體政策內(nèi)容時參考。
(1)明確各利益團體的責(zé)任和義務(wù)??蒲袛?shù)據(jù)的管理、保存和利用涉及多方利益:科研人員或科研團體、基金資助機構(gòu)、數(shù)據(jù)保存管理機構(gòu)、數(shù)據(jù)使用者等。在政策制定時,一定要明確各方的責(zé)任和義務(wù)并進行具體的文字規(guī)定,比如科研人員在提交數(shù)據(jù)時需要知悉哪些事項,同意對哪些數(shù)據(jù)進行處理的規(guī)定;數(shù)據(jù)保存機構(gòu)對于科研人員上傳的數(shù)據(jù)有哪些處理權(quán)限,對于不同保存級別的數(shù)據(jù)有哪些具體的管理行為;使用者在使用數(shù)據(jù)時需要遵循哪些版權(quán)規(guī)定等。只有這樣,才能有效避免因知識產(chǎn)權(quán)問題帶來的系列數(shù)據(jù)管理和使用糾紛,保證科學(xué)數(shù)據(jù)從收集到保存利用的順利進行。
(2)對數(shù)據(jù)保存中有可能導(dǎo)致的數(shù)據(jù)丟失或損壞問題劃定責(zé)任歸屬。圖書館作為科研數(shù)據(jù)的具體管理和保存機構(gòu),有義務(wù)最大限度地保持數(shù)據(jù)的完整性。但是在管理保存科學(xué)數(shù)據(jù)時,由于數(shù)據(jù)的篩選、遷移和格式轉(zhuǎn)換等過程中會不可避免地出現(xiàn)一定的數(shù)據(jù)丟失,因此,針對數(shù)據(jù)丟失或者損壞的問題,一方面要劃清責(zé)任歸屬問題,另一方面要對數(shù)據(jù)管理保存中可能出現(xiàn)的問題在政策中予以明確說明,避免由于此類問題而產(chǎn)生的數(shù)據(jù)丟失糾紛。
(3)制定全面的數(shù)據(jù)收集、篩選、保存標(biāo)準(zhǔn)和使用規(guī)定等。政策的制定是為了更有效地指導(dǎo)科學(xué)數(shù)據(jù)管理工作的開展,高校圖書館在收集科學(xué)數(shù)據(jù)時主要有兩方面的考慮:一是要滿足數(shù)據(jù)使用者對共享利用的需求,二是要滿足圖書館進行長期數(shù)據(jù)保存的需求。因此,數(shù)據(jù)收集的范圍、數(shù)據(jù)篩選的標(biāo)準(zhǔn)、數(shù)據(jù)保存的標(biāo)準(zhǔn)和級別、數(shù)據(jù)的使用條款、訪問聲明等必須作為政策制定的重點內(nèi)容加以細化。同時,考慮到數(shù)據(jù)長期保存的需要,在政策制定時,需要對科學(xué)數(shù)據(jù)的管理與維護制定詳細的實施策略,比如:針對不同格式、不同類型的文件要有完整的元數(shù)據(jù)配套方案;針對不同級別的科研數(shù)據(jù),必須制定有針對性的數(shù)據(jù)保存策略,以防止后期由于成本、人力和數(shù)據(jù)的快速增長所導(dǎo)致的存儲容量問題,針對不斷出現(xiàn)的新型數(shù)據(jù)格式及保存平臺,要制定合理的數(shù)據(jù)遷移和固定性檢查措施,盡量減少數(shù)據(jù)丟失。總之,在政策制定時,建立完善的后期維護與檢查機制至關(guān)重要,是科學(xué)數(shù)據(jù)得以長期保存和持續(xù)獲取訪問的有效保障。
科學(xué)數(shù)據(jù)的長期管理和共享利用是科研領(lǐng)域未來發(fā)展的必然趨勢,高校作為科學(xué)數(shù)據(jù)產(chǎn)生的重要機構(gòu)。為了將來科學(xué)數(shù)據(jù)管理活動的順利實施,應(yīng)該將政策的制定納為科研管理實踐的重要內(nèi)容之一。從當(dāng)前開始,國內(nèi)各高校圖書館和相關(guān)負責(zé)領(lǐng)導(dǎo)應(yīng)該主動增強科研人員對科學(xué)數(shù)據(jù)管理的重要性認識和數(shù)據(jù)共享的自覺意識。圖書館要主動承擔(dān)新的服務(wù)職能,重視學(xué)科館員和學(xué)科專家在數(shù)據(jù)篩選時的重要作用,定期開展有效的數(shù)據(jù)培訓(xùn)工作,培養(yǎng)新型學(xué)科專家,嘗試牽頭擬定科學(xué)數(shù)據(jù)管理政策并負責(zé)相關(guān)解釋工作等,這也為圖書館在數(shù)字化環(huán)境下實現(xiàn)服務(wù)轉(zhuǎn)型提供了一條重要途徑。
科學(xué)數(shù)據(jù)的長期管理和共享利用是科研領(lǐng)域未來發(fā)展的必然趨勢,對于實現(xiàn)科學(xué)數(shù)據(jù)資源的有效增值,推動科技自主創(chuàng)新,減少科技領(lǐng)域的資源浪費具有積極作用[13]??茖W(xué)數(shù)據(jù)管理政策對于科學(xué)數(shù)據(jù)管理服務(wù)與實踐有著重要的指導(dǎo)作用。本文主要對普渡大學(xué)圖書館開展的科學(xué)數(shù)據(jù)管理服務(wù)的政策內(nèi)容進行了詳細的解讀與歸納分析,在此基礎(chǔ)上為我國研究型大學(xué)圖書館制定科學(xué)數(shù)據(jù)管理政策提出若干需注意的關(guān)鍵問題,并呼吁高校圖書館工作人員應(yīng)在開展科研數(shù)據(jù)管理實踐的伊始將政策問題落到實處,以此為科研數(shù)據(jù)管理的長期發(fā)展提供有效的政策保障。此外,筆者也會繼續(xù)關(guān)注國內(nèi)外科學(xué)數(shù)據(jù)管理政策制定的相關(guān)動態(tài),為我國高校圖書館科學(xué)數(shù)據(jù)管理政策的制定提供參考。
[1]謝春枝,燕今偉.國內(nèi)外高校科學(xué)數(shù)據(jù)管理和機制建設(shè)研究[J].圖書情報工作,2013,57(6): 11-17,38.
[2]PURR Digital Preservation Policy[EB/OL].[2015-05-09]. https://purr.purdue.edu/legal/digitalpreservation.
[3]Researchdata[EB/OL].[2015-05-09]. https://www.lib. purdue.edu/researchdata
[4]Collection Policy[EB/OL].[2015-05-09]. https://purr. purdue.edu/legal/collection-policy.
[5]File Format Recommendations[EB/OL].[2015-05-09]. https://purr.purdue.edu/legal/file-format-recommendations.
[6]PURR Digital Preservation Policy[EB/OL].[2015-05-09]. https://purr.purdue.edu/legal/digitalpreservation
[7]Preservation Support Policy[EB/OL].[2015-05-09]. https://purr.purdue.edu/legal/preservation-support-policy.
[8]Terms of Use [EB/OL].[2015-05-09]. https://purr.purdue.edu/legal/terms.
[9]Purdue University Research Repository (PURR) Terms of Deposit [EB/OL].[2015-05-09]. https://purr.purdue. edu/legal/termsofdeposit.
[10]Copyrights[EB/OL].[2015-05-09]. https://purr.purdue. edu/legal/dmcapolicy.
[11]HUBzero Accessibility Statement[EB/OL].[2015-05-09]. https://purr.purdue.edu/legal/accessibility.
[12]Preservation Strategies[EB/OL].[2015-05-09]. https:// purr.purdue.edu/legal/preservation-strategies.
[13]王凱,彭潔,屈寶強,等.科學(xué)數(shù)據(jù)管理與共享領(lǐng)域文獻計量研究[J].中國科技資源導(dǎo)刊,2015,47(4): 31-39.
Research on Scientific Data Management Policy in Purdue University Library
Hu Xuehuan, Qu Baoqiang
(Institute of Scientific and Technical Information of China, Beijing 100038)
This article mainly introduces the scientific data management policy in Purdue University. On this basis, summarizes the contents into four parts :data collection policy, data preservation policy, data use rules and data management and maintenance , Further summarize the considerations needed to be aware of when universities make data management policies ,in order to provide content references for the research data management policy of university library in our country.
academic library, scientific data management, collection policy, preservation policy, use rules
G350
A
10.3772/j.issn.1674-1544.2015.06.011
胡雪環(huán)*(1990-),女,中國科學(xué)技術(shù)信息研究所碩士研究生,研究方向:數(shù)字圖書館與數(shù)字出版;屈寶強(1980-),男,中國科學(xué)技術(shù)信息研究所副研究員,研究方向:文獻共享、數(shù)據(jù)共享。
2015年7月13日。