, , ,
在大規(guī)模生產(chǎn)、分享及應用數(shù)據(jù)的新時代,越來越多的科研人員認識到數(shù)據(jù)和數(shù)據(jù)分析對數(shù)據(jù)密集型科學和工程領(lǐng)域的研究及教育的發(fā)展至關(guān)重要[1]。2012年3 月 29 日美國政府推出的“大數(shù)據(jù)的研究和發(fā)展計劃”更是將大數(shù)據(jù)提升到全球性戰(zhàn)略發(fā)展的高度。許多IT 巨頭都已投入到大數(shù)據(jù)軟硬件技術(shù)整合、大數(shù)據(jù)信息處理等技術(shù)研發(fā)之中,力求在新一輪的信息競爭中搶得戰(zhàn)略先機與技術(shù)制高點[2]。擁有海量文獻資源和數(shù)據(jù)的圖書館也在悄然發(fā)生變化[3]。美國國家科學基金會提出,研究型圖書館應該在數(shù)據(jù)監(jiān)護方面給予科研機構(gòu)業(yè)務和技術(shù)支持,為他們提供相應的數(shù)據(jù)服務[4]。美國、英國、澳大利亞等國家的一些高校圖書館已把科研數(shù)據(jù)管理作為一項服務[5],并由此催生了數(shù)據(jù)館員。
近年來,在信息與網(wǎng)絡技術(shù)迅猛發(fā)展的推動下,從宏觀到微觀、從自然到社會的觀察、感知、計算、仿真、傳播等活動都產(chǎn)生了大量科學數(shù)據(jù)[6]??茖W家通過對這些數(shù)據(jù)實時、動態(tài)的監(jiān)測與分析解決原來難以解決或不可觸及的科學問題,也可以把數(shù)據(jù)作為科學研究的對象和工具,基于數(shù)據(jù)來思考、設計和實施科學研究[7]??茖W數(shù)據(jù)逐步成為“制數(shù)據(jù)權(quán)”的戰(zhàn)略資源,因而科學數(shù)據(jù)管理受到科學界的重視。
2009年12月,來自10個國家的15個機構(gòu)共同成立了DataCite國際聯(lián)盟[8]。2011年,美國國家醫(yī)學圖書館(NLM)開始為接受美國國立衛(wèi)生研究院(NIH)基金資助的研究團隊提供學科館員服務補充基金[9]。2013年的《美國學術(shù)圖書館的發(fā)展和未來趨勢》[10]指出,數(shù)據(jù)研究管理已成為圖書館一大發(fā)展方向。美國航空航天局(NASA)、疾病控制與預防中心(CDC)、英國研究理事會及其下屬的7個研究理事會以及維康信托基金會、澳大利亞研究理事會(ARC)等,相繼制定了科研數(shù)據(jù)管理政策[11]。蓬勃發(fā)展的科研數(shù)據(jù)管理工作催生了新的工作崗位,即數(shù)據(jù)館員[12]。美國的耶魯大學圖書館、英國的愛丁堡大學圖書館、澳大利亞墨爾本大學圖書館和加拿大多倫多大學圖書館等都設立了專門的數(shù)據(jù)館員崗位,國內(nèi)學者也紛紛開展相關(guān)研究。
科學研究完成前的所有過程數(shù)據(jù)、半成品以及科學研究完成后的成果皆為科學數(shù)據(jù)管理的對象,包括手稿、視頻、音頻、圖片出版物、繪畫、設計圖紙、過程手稿、圖形、工作流圖、設備、數(shù)據(jù)文檔、數(shù)據(jù)處理或計算機程序(軟件)、研究數(shù)據(jù)統(tǒng)計記錄等[13]。
科學數(shù)據(jù)管理(Research Data Management,RDM)是指對在科學研究活動中產(chǎn)生的科學數(shù)據(jù)進行統(tǒng)籌協(xié)調(diào)、科學配置、整合管理,涉及對各類型科學數(shù)據(jù)進行采集、分類、標準化、發(fā)布及共享,以形成管理科學數(shù)據(jù)的理念、政策、規(guī)范、環(huán)境、措施與體系,發(fā)揮科學研究數(shù)據(jù)資源的最大效益[14]。
不同學者對數(shù)據(jù)館員有不同的理解和定義。Read認為數(shù)據(jù)館員(data librarian)或數(shù)據(jù)服務館員(data service librarian)就是提供數(shù)據(jù)服務的圖書館員[15];蔣麗麗等認為數(shù)據(jù)館員是在數(shù)據(jù)管理、保存、存儲等方面經(jīng)過系統(tǒng)和專業(yè)訓練,并具有行業(yè)資格的人員[16];魏來等認為數(shù)據(jù)館員是數(shù)據(jù)創(chuàng)造者、數(shù)據(jù)專家和數(shù)據(jù)主管[17];孟祥保等則認為數(shù)據(jù)館員是指在數(shù)據(jù)管理、保存和存儲方面經(jīng)過系統(tǒng)專門的訓練,并具有行業(yè)資質(zhì)的人員[18]。綜上所述,數(shù)據(jù)館員是指為了更好持久地利用科研數(shù)據(jù),運用相應的技術(shù)(主要是計算機技術(shù))和相關(guān)學科知識,科學地管理科研數(shù)據(jù)的圖書館員。數(shù)據(jù)館員應發(fā)揮自己的優(yōu)勢,利用圖書館這一科研數(shù)據(jù)密集的主要平臺實施科學數(shù)據(jù)管理。
隨著越來越多的科研人員逐漸認識到科研數(shù)據(jù)的重要價值,數(shù)據(jù)館員的作用也愈發(fā)突顯。針對美國研究型圖書館協(xié)會館員的一項調(diào)查表明,他們已意識到研究數(shù)據(jù)管理對于科學研究與圖書館發(fā)展的重要性,且大多數(shù)館員認為自己能勝任數(shù)據(jù)館員崗位。國內(nèi)圖書館業(yè)界也開始意識到研究數(shù)據(jù)管理的重要性并行動起來。2012年11月在北京大學圖書館召開的國際學術(shù)討論會上,“數(shù)據(jù)管理與數(shù)據(jù)服務”成為分主題之一。CALIS三期建設項目已經(jīng)設立“科學數(shù)據(jù)管理預研項目”,開展了高??茖W數(shù)據(jù)管理相關(guān)問題的研究。
數(shù)據(jù)館員進行科學數(shù)據(jù)管理的意義主要體現(xiàn)在以下幾個方面。首先,科學數(shù)據(jù)完全基于客觀事實,是實際試驗的記錄,沒有摻雜科研人員的主觀思維影響,或許能給我們的科研提供更多的發(fā)展方向。第二,科學數(shù)據(jù)的應用具有多向性,根據(jù)一組科學數(shù)據(jù)可以向潛在的多種可能性推演發(fā)展,使其他人利用現(xiàn)有數(shù)據(jù)提出新的科學問題[19]。第三,通過有效的科學數(shù)據(jù)管理,實現(xiàn)科學數(shù)據(jù)共享,促進科研人員的研究工作,提高科研成果的產(chǎn)生速度和科學數(shù)據(jù)的價值[20]。第四,長期保存科學數(shù)據(jù),保證科學研究的完整性,可以增強數(shù)據(jù)再利用效益。但是總體而言,目前國內(nèi)科學數(shù)據(jù)管理工作做得還不夠系統(tǒng)和深入,其重要原因之一是缺乏相應的數(shù)據(jù)管理政策和對數(shù)據(jù)館員的作用缺乏足夠認識[18]。
數(shù)據(jù)管理與服務領(lǐng)域影響最大的國際組織是國際社會科學信息服務與技術(shù)協(xié)會(International Association for Social Science Information Services & Technology, IASSIST)。根據(jù)IASSIST調(diào)查和各大高校官網(wǎng)信息,很多高校已經(jīng)開展了科研數(shù)據(jù)管理工作,主要管理部門多為圖書館,其他部門予以支持,尤其是技術(shù)部門,但是具體的服務方式和內(nèi)容因?qū)W校和具體部門不同而存在較大差異(表1)。
圖書館在數(shù)據(jù)管理方面具有得天獨厚的優(yōu)勢。圖書館可以依托各種商業(yè)數(shù)據(jù)庫的科學數(shù)據(jù)和圖書館資源平臺,開設專門的數(shù)據(jù)平臺,結(jié)合機構(gòu)自身需要,添加相應的國際組織數(shù)據(jù)(如聯(lián)合國下設的世界衛(wèi)生組織)、各國政府部門及統(tǒng)計機構(gòu)(如美國食品藥品監(jiān)督管理局、中國衛(wèi)生和計劃生育委員會)的數(shù)據(jù)、專業(yè)數(shù)據(jù)協(xié)會及數(shù)據(jù)聯(lián)盟(如密歇根大學的政治和社會研究方面的校際聯(lián)盟)[27]等組織的開放數(shù)據(jù)。但是在我國,科研數(shù)據(jù)管理和服務還是新鮮事物,其發(fā)展面臨著制度保障缺位、人員配備不足、平臺支撐欠缺等方面的突出問題,亟待解決。
序號 研究所成立時間/年所長數(shù)/位平均任職年限/年1斯克里普斯研究所19288112冷泉港實驗室18987173薩克研究所1960964懷特黑德研究所1982485Broad研究所20031126杰克遜實驗室19297127斯托瓦斯醫(yī)學研究所2000288拉霍亞過敏和免疫學研究所1988399Gladstone研究所197931210Sanford-Burnham研究所197648
國外已經(jīng)建立了數(shù)據(jù)館員崗位制度,如普渡大學圖書館設置了副館長負責支撐研究的服務工作,并下設數(shù)據(jù)服務專家、跨學科研究館員和分布式數(shù)據(jù)管理中心;俄勒崗州立大學設立了數(shù)字學術(shù)與服務中心,其中一項重要業(yè)務工作就是科研數(shù)據(jù)管理,主要任務包括幫助研究人員按照美國國家科學基金會(NSF)和NIH的要求制定數(shù)據(jù)管理計劃和資源統(tǒng)一標識符(如DOI)等[18];愛丁堡大學、康奈爾大學圖書館和哥倫比亞大學圖書館也有先例。
在我國數(shù)據(jù)館員還鮮有聽聞。究其原因,首先是國家科技管理層尚未充分認識到科學數(shù)據(jù)管理的重要意義,更沒有提出科學數(shù)據(jù)管理的硬性要求;其次是科研機構(gòu)和科研人員也沒有提出數(shù)據(jù)管理的實際需求,數(shù)據(jù)管理工作尚未有效開展起來。宏觀科研數(shù)據(jù)管理政策缺位和科研人員不重視對科學數(shù)據(jù)的系統(tǒng)管理,皆導致處于數(shù)據(jù)管理執(zhí)行層面的圖書館沒有明確導向,數(shù)據(jù)管理工作只能在摸索中前進。
要想破除僵局,圖書館必須積極推動相關(guān)科技政策的出臺,加快數(shù)據(jù)館員制度的建立。首先要了解學習國外的數(shù)據(jù)管理政策,同時嘗試開展數(shù)據(jù)管理和服務,做好科研數(shù)據(jù)管理工作,適應數(shù)據(jù)密集型科研模式對圖書館的要求,并用圖書館員和科研人員的行動推進科研數(shù)據(jù)相關(guān)政策的落實執(zhí)行,建立數(shù)據(jù)館員制度,設立專門崗位??偠灾诳蒲袛?shù)據(jù)管理政策和科研數(shù)據(jù)管理實踐兩方面著手推進數(shù)據(jù)管理工作。
在設立數(shù)據(jù)館員崗位時,可以先選擇有一定數(shù)據(jù)知識基礎的館員兼職數(shù)據(jù)館員,從科研數(shù)據(jù)管理相關(guān)支持服務中的數(shù)據(jù)管理需求調(diào)研、國內(nèi)外基金政策、數(shù)據(jù)模板、數(shù)據(jù)管理計劃的工具、OA數(shù)據(jù)、引用標準、分析大量數(shù)據(jù)的工具等工作中積累經(jīng)驗,待工作開展一段時間后,再依具體需求設立部分專職數(shù)據(jù)館員。這種從兼職到專職數(shù)據(jù)館員過渡的模式,不會帶來過大的轉(zhuǎn)型風險和壓力,也有利于科研用戶逐漸熟悉和適應科研數(shù)據(jù)管理的過程,使科研數(shù)據(jù)管理工作更容易開展。
數(shù)據(jù)館員應該具有開展數(shù)據(jù)素養(yǎng)教育、數(shù)據(jù)管理計劃咨詢、數(shù)據(jù)管理服務咨詢的能力,對科研或數(shù)據(jù)政策、科學研究流程有一定了解,能夠利用一定的工具分析科研數(shù)據(jù),如統(tǒng)計分析軟件SPSS、SAS等[22]。傳統(tǒng)圖書館員的職能任務主要是讀者服務、資源建設和信息咨詢。由于我國圖書館還沒有專門從事過數(shù)據(jù)管理工作的館員(包括數(shù)據(jù)館員和從事數(shù)據(jù)服務的學科館員),因此只能選拔一批具有計算機及相關(guān)背景的館員,通過培養(yǎng)和實踐鍛煉,使之成為合格的數(shù)據(jù)館員。具有計算機相關(guān)背景的館員,熟悉元數(shù)據(jù)配置、數(shù)據(jù)存儲、數(shù)據(jù)復用等專業(yè)領(lǐng)域知識,可能具備開發(fā)數(shù)據(jù)管理軟件的能力、熟悉數(shù)據(jù)的標準格式和生命周期、對機構(gòu)知識庫很了解,還可能寫過課題及基金申請書,熟悉科技管理政策,如NSF對科研項目資助中數(shù)據(jù)管理計劃的要求,具備一定的版權(quán)知識,是數(shù)據(jù)館員潛在的候選人。
圖書館應該鼓勵和推動這些預備數(shù)據(jù)館員自主學習數(shù)據(jù)管理的知識,并組織內(nèi)部的交流探討,推廣分享數(shù)據(jù)管理知識。此外,數(shù)據(jù)館員還應該多參加圖書館業(yè)界舉辦的各種數(shù)據(jù)管理培訓班和研討會,以提升業(yè)務能力和開闊視野[5]。如英國數(shù)字保管中心(Digital Curation Centre, DDC)不定期開設短期數(shù)據(jù)管理培訓課程,并將培訓資料發(fā)布在網(wǎng)上免費共享[28];DCC每隔半年面向科研人員、數(shù)字資源庫管理者、圖書館員、信息研究組織、數(shù)據(jù)管理員、數(shù)據(jù)科學家及基金會等舉辦一次研究數(shù)據(jù)管理論壇;美國雪城大學在NSF的資助下開設科學數(shù)據(jù)素養(yǎng)教程,為未來從事科學數(shù)據(jù)管理的人員和科學圖書館員提供主修課程[29];國際社會科學信息服務和技術(shù)協(xié)會(IASSIST)、公共數(shù)據(jù)用戶協(xié)會(APDU)、美國校際社會科學研究聯(lián)盟(ICPSR)等組織也每年或每兩年舉辦一次的學術(shù)會議[27];加拿大研究圖書館學會數(shù)據(jù)管理咨詢分會專門開設研究數(shù)據(jù)管理服務在線課程,推進數(shù)據(jù)管理教育,提升館員專業(yè)能力[13]。數(shù)據(jù)館員應該充分利用這些學術(shù)研討會和培訓班,掌握數(shù)據(jù)管理相關(guān)技術(shù),提高數(shù)據(jù)管理能力,從而順利地開展科研數(shù)據(jù)管理工作。
支撐平臺也是數(shù)據(jù)管理的一個必要條件。圖書館應依據(jù)自身預計提供的數(shù)據(jù)服務范圍和內(nèi)容,以及前臺用戶的體驗和后臺的管理方便和安全性,思考需要什么樣的平臺或設備,是重新建立一個數(shù)據(jù)管理平臺,還是在原有的圖書館網(wǎng)站或已有的機構(gòu)知識庫中增建一個數(shù)據(jù)管理平臺,平臺是自建還是與外部合作[20],是否可以利用開源軟件建設機構(gòu)自用的平臺等一系列問題。
對于平臺建設框架,如果整合于機構(gòu)知識庫平臺的數(shù)據(jù)管理平臺不能充分發(fā)揮其應有的作用,而且整改成本較高時就應構(gòu)架獨立的數(shù)據(jù)管理平臺。從節(jié)約費用的角度,應盡可能利用開源軟件和工具,在已有開放軟件接口上構(gòu)建自己的數(shù)據(jù)管理服務平臺。從集中力量做好數(shù)據(jù)服務的角度考慮,可以把與數(shù)據(jù)管理與服務這一核心工作不直接相關(guān)的平臺開發(fā)外包出去,與專門的軟件公司合作完成。建立數(shù)據(jù)管理平臺之后,數(shù)據(jù)館員可以根據(jù)數(shù)據(jù)管理流程,從擬定數(shù)據(jù)管理計劃開始,提供數(shù)據(jù)存儲格式與標準、數(shù)據(jù)共享政策與模式、數(shù)據(jù)評估分析方法、數(shù)據(jù)引用方式等,完善科研數(shù)據(jù)管理與服務流程[30]。
數(shù)據(jù)館員和科學數(shù)據(jù)管理在實踐過程中必然會遇到諸多問題和困難。以上對制度、人員、平臺等方面的考慮或許可以提供一點解決的思路。另外,我們還要跟蹤了解國外科學數(shù)據(jù)管理的進展,借鑒國外的成熟經(jīng)驗,更好地開展科學數(shù)據(jù)管理工作。