摘要通過調(diào)研國內(nèi)外數(shù)據(jù)驅(qū)動(dòng)研究現(xiàn)狀、趨勢(shì)和用戶需求,分析研究數(shù)據(jù)管理服務(wù)的國內(nèi)外發(fā)展情況,研究提出高校研究數(shù)據(jù)管理服務(wù)體系,并介紹北京大學(xué)研究數(shù)據(jù)管理服務(wù)的研究成果、框架設(shè)計(jì)、構(gòu)建經(jīng)驗(yàn)與服務(wù)效果,為高校建設(shè)一流研究數(shù)據(jù)管理服務(wù)、支持用戶數(shù)據(jù)驅(qū)動(dòng)研究范式需求,提供研究與實(shí)踐經(jīng)驗(yàn)。以促進(jìn)數(shù)據(jù)驅(qū)動(dòng)研究,推動(dòng)開放科學(xué)。
關(guān)鍵詞數(shù)據(jù)驅(qū)動(dòng)研究研究數(shù)據(jù)管理數(shù)據(jù)服務(wù)體系數(shù)據(jù)服務(wù)數(shù)據(jù)政策
分類號(hào)G251
DOI10.16603/j.issn1002-1027.2019.02.008
1引言
隨著云計(jì)算、移動(dòng)互聯(lián)網(wǎng)的應(yīng)用普及,以及可穿戴智能設(shè)備的出現(xiàn),一場(chǎng)全新的、以大規(guī)模數(shù)據(jù)生產(chǎn)、分享、使用為代表的技術(shù)革命正在發(fā)生,數(shù)據(jù)成為寶貴的資源、資產(chǎn)和生產(chǎn)要素。對(duì)海量數(shù)據(jù)及其隱含信息、知識(shí)的收集、分析、挖掘、有效整合,將為科學(xué)研究、社會(huì)經(jīng)濟(jì)發(fā)展帶來巨大的紅利。大數(shù)據(jù)的廣泛應(yīng)用開啟了一個(gè)全新的智能時(shí)代[1]。2017年,以谷歌阿爾法狗(AlphaGo)和阿爾法元(AlphaZero)為代表,深度學(xué)習(xí)技術(shù)取得突破,標(biāo)志著人工智能元年到來。大數(shù)據(jù)和人工智能時(shí)代,世界各國對(duì)數(shù)據(jù)的依賴快速上升,搶占大數(shù)據(jù)發(fā)展先機(jī),已成為國家戰(zhàn)略。美國、日本、韓國、中國、歐盟等國家和地區(qū)紛紛將大數(shù)據(jù)利用上升為國家戰(zhàn)略,積極推進(jìn)數(shù)據(jù)政策,希望利用大數(shù)據(jù)技術(shù)實(shí)現(xiàn)研究和產(chǎn)業(yè)領(lǐng)域的突破[2]。
數(shù)據(jù)科學(xué)已經(jīng)成為全球高校發(fā)展最快的專業(yè)。數(shù)據(jù)科學(xué)社區(qū)(Data science Community)的數(shù)據(jù)顯示,截至2018年12月,全球共有26個(gè)國家的361所高校開設(shè)了597個(gè)數(shù)據(jù)科學(xué)相關(guān)學(xué)位專業(yè),其中美國高校開設(shè)的數(shù)據(jù)科學(xué)專業(yè)數(shù)量最多。全美有247所高校共設(shè)置461個(gè)數(shù)據(jù)科學(xué)學(xué)位專業(yè),占全球總量的77%[3]。在中國,2016年2月,北京大學(xué)、對(duì)外經(jīng)濟(jì)貿(mào)易大學(xué)、中南大學(xué)首次成功申請(qǐng)到“數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)”本科新專業(yè)。2017年3月,第二批32所高校獲批。2018年3月,教育部公布的高校新增專業(yè)名單中,有248所學(xué)校獲批,是過去兩次審批通過額度的近8倍[4]。
2017年11月24日至2018年4月3日,由北京大學(xué)圖書館和北京大學(xué)信息管理系發(fā)起與組織,多家機(jī)構(gòu)合作,成功舉辦了“首屆全國高校數(shù)據(jù)驅(qū)動(dòng)創(chuàng)新研究大賽”(以下簡(jiǎn)稱大賽)。大賽吸引了全國眾多高校學(xué)生積極參與。比賽期間,有近4萬用戶訪問大賽主頁,共吸引來自北京大學(xué)等全國169所高校的1892名同學(xué)報(bào)名參賽,共有593組隊(duì)伍,涉及56個(gè)一級(jí)學(xué)科。最終,來自121所高校的968人(共289支隊(duì)伍)成功提交了參賽作品,涉及45個(gè)一級(jí)學(xué)科。成功提交作品最多的前20個(gè)一級(jí)學(xué)科中,圖書館、情報(bào)和檔案學(xué)科隊(duì)伍最多,達(dá)到59組,其次是應(yīng)用經(jīng)濟(jì)學(xué)、社會(huì)學(xué)、管理科學(xué)與工程、計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)也分別達(dá)到達(dá)50組、27組、23組、19組、19組。在通過形式審核的233篇論文中,有103篇論文使用平臺(tái)已有數(shù)據(jù),135篇論文使用自產(chǎn)的原創(chuàng)性數(shù)據(jù),同時(shí)使用平臺(tái)已有數(shù)據(jù)和自己原創(chuàng)數(shù)據(jù)的共有5篇。參賽隊(duì)伍使用數(shù)據(jù)情況與筆者前期調(diào)研情況表明:數(shù)據(jù)已是絕大多數(shù)學(xué)科研究的基礎(chǔ),研究者需要高質(zhì)量的大數(shù)據(jù)提交、發(fā)布和研究服務(wù)平臺(tái);高質(zhì)量調(diào)查數(shù)據(jù)、招聘數(shù)據(jù)與社交媒體數(shù)據(jù)仍是人文社科經(jīng)濟(jì)學(xué)領(lǐng)域研究者重點(diǎn)關(guān)注的研究數(shù)據(jù)。
隨著數(shù)據(jù)量與數(shù)據(jù)需求的飛速增長,大數(shù)據(jù)和海量數(shù)據(jù)的管理、共享、發(fā)布和保存面臨著巨大的成本與效率考驗(yàn)。研究數(shù)據(jù)的存儲(chǔ)形式、存儲(chǔ)容量與存儲(chǔ)效率制約著研究使用數(shù)據(jù)規(guī)模與利用形式,成為研究數(shù)據(jù)管理的挑戰(zhàn)。重視與發(fā)展研究數(shù)據(jù)的管理與服務(wù),已成為國家層面與科研機(jī)構(gòu)未來提升學(xué)術(shù)競(jìng)爭(zhēng)力和影響力的重要發(fā)展戰(zhàn)略之一。2018年4月2日,國務(wù)院國務(wù)院辦公廳關(guān)于印發(fā)科學(xué)數(shù)據(jù)管理辦法的通知,以研究數(shù)據(jù)全生命周期為中心,加強(qiáng)和規(guī)范研究數(shù)據(jù)的管理,推動(dòng)開放共享[5]。順應(yīng)教學(xué)和研究需求,建設(shè)一流的研究數(shù)據(jù)管理服務(wù)體系,提供研究數(shù)據(jù)支撐服務(wù),成為全球研究型圖書館的必然選擇。
本文將調(diào)研國內(nèi)外研究數(shù)據(jù)管理服務(wù)的發(fā)展情況,提出建設(shè)研究數(shù)據(jù)管理服務(wù)體系的建議。并以北京大學(xué)研究數(shù)據(jù)管理服務(wù)體系的建設(shè)經(jīng)驗(yàn)為例,為圖書館推動(dòng)研究數(shù)據(jù)管理服務(wù)提供參考。
一流高校研究數(shù)據(jù)管理服務(wù)體系的研究與建設(shè)/崔海媛,羅鵬程,李國俊,朱玲
Research and Implementation on Research Data Management Services Supporting the Data Driven Research Demand/Cui Haiyuan,Luo Pengcheng,Li Guojun,Zhu Ling
一流高校研究數(shù)據(jù)管理服務(wù)體系的研究與建設(shè)/崔海媛,羅鵬程,李國俊,朱玲
Research and Implementation on Research Data Management Services Supporting the Data Driven Research Demand/Cui Haiyuan,Luo Pengcheng,Li Guojun,Zhu Ling
2研究綜述
原中國科學(xué)院圖書館館長張曉林指出,在全學(xué)科數(shù)據(jù)驅(qū)動(dòng)研究成為趨勢(shì)的時(shí)代,圖書館需要重新定義服務(wù)目標(biāo)、內(nèi)容、方式和能力,在大數(shù)據(jù)的基礎(chǔ)上,基于新技術(shù)和方法,提供全新知識(shí)服務(wù)。美國麻省理工學(xué)院、美國國家醫(yī)學(xué)圖書館和英國大英圖書館等都已經(jīng)調(diào)整戰(zhàn)略,融匯數(shù)據(jù)資源,重構(gòu)知識(shí)服務(wù)的平臺(tái)、機(jī)制[6]。原上海圖書館館長吳建中通過對(duì)20年來全球知識(shí)開放運(yùn)動(dòng)的梳理和分析,提出研究數(shù)據(jù)管理對(duì)推進(jìn)知識(shí)開放和共享的重要意義,并提出4點(diǎn)建議:①加大宣傳力度,增強(qiáng)開放共享意識(shí);②制定相關(guān)政策,推進(jìn)開放科學(xué)發(fā)展;③整合各類資源,建設(shè)數(shù)字基礎(chǔ)設(shè)施;④培育專業(yè)人才,提升數(shù)據(jù)管理水平[7]。
國際上,研究數(shù)據(jù)作為科學(xué)研究的重要成果受到國際學(xué)術(shù)界和出版界越來越多的重視。2009年以來,美國、英國、澳大利亞、歐盟等國家和地區(qū)紛紛出臺(tái)開放數(shù)據(jù)政策。2011年,美國自然科學(xué)基金委要求項(xiàng)目申請(qǐng)書必須包含“數(shù)據(jù)管理計(jì)劃”[8],美國多個(gè)資助機(jī)構(gòu)的數(shù)據(jù)管理政策陸續(xù)發(fā)布。歐盟與歐洲資助機(jī)構(gòu)出臺(tái)一系列數(shù)據(jù)政策。2011年,英國聯(lián)合信息系統(tǒng)委員會(huì)(Joint Information Systems Committee)和電子科學(xué)核心計(jì)劃(EScience Core Programme)聯(lián)合組建的“國家數(shù)據(jù)監(jiān)管中心(National Digital Curation Center)”發(fā)布《制定數(shù)據(jù)管理與共享計(jì)劃》[9]。英國皇家學(xué)會(huì)(Royal Society)于2012 年7 月發(fā)布報(bào)告《科學(xué)是開放事業(yè)》(Science as an Open Enterprise),確立共享和開放科學(xué)數(shù)據(jù)的基本原則、機(jī)遇與面臨的挑戰(zhàn)[10]。歐盟2020計(jì)劃規(guī)定,2017年開始全面實(shí)施科研數(shù)據(jù)開放制度,推動(dòng)“開放科學(xué)”戰(zhàn)略[11]。截至2018年6月,在資助機(jī)構(gòu)開放獲取政策查詢數(shù)據(jù)庫SHERPA/JULIET中,144個(gè)資助機(jī)構(gòu),41個(gè)資助機(jī)構(gòu)政策中要求必須開放研究數(shù)據(jù),19個(gè)機(jī)構(gòu)鼓勵(lì)開放[12]。
在各種政策驅(qū)動(dòng)下,研究數(shù)據(jù)管理倉儲(chǔ)發(fā)展迅速。截至2018年12月,根據(jù)國際研究數(shù)據(jù)倉儲(chǔ)注冊(cè)組織(Registry of Research Data Repositories)的統(tǒng)計(jì),全世界至少有2250多個(gè)研究數(shù)據(jù)倉儲(chǔ)[13]。哈佛大學(xué)等世界頂尖高校均建立了自己的數(shù)據(jù)倉儲(chǔ)??茖W(xué)數(shù)據(jù)出版期刊不斷涌現(xiàn),2011年2月,美國《科學(xué)》(Science)刊登“數(shù)據(jù)處理(Dealing with Data)”專題[14],Wiley公司于2012年推出了期刊《地球科學(xué)數(shù)據(jù)》(Geoscience Data Journal)[15],自然集團(tuán)在2014年推出期刊《科學(xué)數(shù)據(jù)》(Scientific Data)[16],中國科學(xué)院也于2016年推出期刊《中國科學(xué)數(shù)據(jù)》[17],研究數(shù)據(jù)逐漸成為出版領(lǐng)域搶占的制高點(diǎn)。數(shù)據(jù)引用及引文數(shù)據(jù)庫也得到越來越多的應(yīng)用,原湯森路透公司于2012年在Web of Science中推出了“數(shù)據(jù)引用索引”(Data Citation Index),用于數(shù)據(jù)的檢索和引用跟蹤。
國家、基金會(huì)和機(jī)構(gòu)數(shù)據(jù)政策推動(dòng)數(shù)據(jù)管理服務(wù)需求,研究數(shù)據(jù)管理(Research Data Management, RDM)成為研究型圖書館的重要服務(wù),相關(guān)研究與實(shí)踐發(fā)展迅速。
卡羅·泰諾普(Carol Tenopir)等在2016年2月向333個(gè)歐洲大學(xué)圖書館發(fā)送郵件調(diào)查研究數(shù)據(jù)管理服務(wù)的開展情況,共有119個(gè)圖書館回復(fù)郵件。90%以上的圖書館都已經(jīng)開展或計(jì)劃開展研究數(shù)據(jù)的管理計(jì)劃制定、培訓(xùn)、開發(fā)等服務(wù),319%的圖書館已經(jīng)參與到研究項(xiàng)目中,提供數(shù)據(jù)服務(wù)[18]。 阿楊尹(Ayoung Yoon)等在2015年10月-12月期間,對(duì)185個(gè)美國研究型大學(xué)圖書館的網(wǎng)站進(jìn)行調(diào)查分析后,發(fā)現(xiàn)美國研究型圖書館開展的研究數(shù)據(jù)管理服務(wù)主要包括:咨詢幫助(help/ask librarians,795%)、數(shù)據(jù)管理(Data deposit,60%)、研究數(shù)據(jù)管理計(jì)劃(Data management planning,411%)、數(shù)據(jù)咨詢(Data consultation,384%)、數(shù)據(jù)出版和共享(data publishing and sharing,276%)、數(shù)據(jù)方法(data methodology,157%)[19]。
2017年3月,美國聯(lián)機(jī)計(jì)算機(jī)圖書館中心(Online Computer Library Center,OCLC)發(fā)布“研究數(shù)據(jù)管理現(xiàn)實(shí)”系列報(bào)告,報(bào)告以12個(gè)北美、歐洲和澳大利亞的圖書館的研究為基礎(chǔ),重點(diǎn)對(duì)愛丁堡大學(xué)(英國)、伊利諾伊大學(xué)厄巴納-香檳分校(美國)、蒙納士大學(xué)(澳大利亞)和瓦赫寧根大學(xué)(荷蘭)等4所大學(xué)的服務(wù)進(jìn)行案例分析, 研究這些機(jī)構(gòu)的研究數(shù)據(jù)管理能力,總結(jié)研究數(shù)據(jù)管理服務(wù)為三大領(lǐng)域:教育類、解決方案類和長期保存類[20]。
澳大利亞國際數(shù)據(jù)服務(wù)中心(The Australian National Data Service)提出數(shù)據(jù)管理能力的5個(gè)要素:政策和流程、信息架構(gòu)、服務(wù)能力、元數(shù)據(jù)管理和研究數(shù)據(jù)管理。并給出五個(gè)發(fā)展階段的成熟度[21]。伊蓮·馬?。‥laine R. Martin)提出基于圖書館以用戶為中心開展數(shù)據(jù)管理服務(wù)的框架,主要涵蓋:數(shù)據(jù)服務(wù)、數(shù)據(jù)管理實(shí)踐指導(dǎo)、信息素養(yǎng)、存檔保存和政策服務(wù)[22]。英國的數(shù)字策管中心(The Digital Curation Centre)根據(jù)研究生命周期,提出研究數(shù)據(jù)管理支持服務(wù)框架應(yīng)涵蓋:政策和規(guī)劃、可持續(xù)性發(fā)展、研究數(shù)據(jù)管理計(jì)劃、元數(shù)據(jù)管理、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)存檔策略、數(shù)據(jù)管理、培訓(xùn)指南等[23]。于飛(Fei YU)等(2017年)介紹了澳大利亞昆士蘭大學(xué)在對(duì)大學(xué)用戶進(jìn)行調(diào)查后,設(shè)計(jì)與開展基于生命周期的研究數(shù)據(jù)管理服務(wù)內(nèi)容包括:①研究數(shù)據(jù)管理計(jì)劃和準(zhǔn)備(數(shù)據(jù)指南、數(shù)據(jù)培訓(xùn)、研究數(shù)據(jù)管理計(jì)劃等);②研究過程支持服務(wù)(數(shù)據(jù)工具、管理和分析、培訓(xùn)等);③數(shù)據(jù)保存、出版和傳播(數(shù)據(jù)發(fā)布平臺(tái)、長期保存和數(shù)據(jù)出版等)。見圖1[24]。
3研究數(shù)據(jù)管理服務(wù)體系的設(shè)計(jì)與建設(shè)
2015年,北京大學(xué)圖書館制定2018行動(dòng)計(jì)劃,調(diào)整組織機(jī)構(gòu),重新組織與設(shè)計(jì)服務(wù),將原系統(tǒng)部更名為信息化與數(shù)據(jù)中心,設(shè)置數(shù)據(jù)管理與服務(wù)崗位,全面開展研究數(shù)據(jù)管理平臺(tái)、工具和服務(wù)建設(shè),設(shè)計(jì)數(shù)據(jù)管理服務(wù)框架。另外組建研究支持中心,設(shè)置數(shù)據(jù)館員,開展信息素養(yǎng)和數(shù)據(jù)咨詢等服務(wù)。數(shù)據(jù)資源成為資源建設(shè)的重要組成部分。2015年12月25日,北京大學(xué)圖書館正式發(fā)布開放研究數(shù)據(jù)服務(wù)平臺(tái)(以下簡(jiǎn)稱“開放數(shù)據(jù)平臺(tái)”)、機(jī)構(gòu)知識(shí)庫、開放出版-期刊網(wǎng)和學(xué)者主頁,構(gòu)建新型學(xué)術(shù)交流生態(tài)系統(tǒng),推動(dòng)開放獲取與研究數(shù)據(jù)管理服務(wù),成為國內(nèi)高校相關(guān)建設(shè)的引領(lǐng)者。并在開放數(shù)據(jù)平臺(tái)的基礎(chǔ)上,開展平臺(tái)、服務(wù)、培訓(xùn)、政策制定與推進(jìn)等一系列研究和服務(wù)工作,推動(dòng)北京大學(xué)建設(shè)成為研究數(shù)據(jù)匯集、管理與服務(wù)的引領(lǐng)者。
3.1需求調(diào)研
2013年起,筆者團(tuán)隊(duì)從調(diào)研開始,定位研究者需求,掌握國際發(fā)展動(dòng)態(tài),開發(fā)數(shù)據(jù)服務(wù)平臺(tái),全面推廣服務(wù),完成北京大學(xué)研究數(shù)據(jù)管理服務(wù)框架的初步構(gòu)建,為未來研究和服務(wù)奠定基礎(chǔ)。圖2列出北京大學(xué)研究數(shù)據(jù)管理服務(wù)的建設(shè)歷程。
2014年,筆者團(tuán)隊(duì)對(duì)校內(nèi)教師進(jìn)行問卷調(diào)查,獲取50份教師的反饋,并對(duì)26名教師進(jìn)行一對(duì)一需求訪談。調(diào)研發(fā)現(xiàn):高達(dá)87.5%的受訪者愿意在一定條件下開放研究數(shù)據(jù),開放的最大動(dòng)機(jī)是通過開放數(shù)據(jù),提升數(shù)據(jù)價(jià)值、提高成果引用率與增強(qiáng)數(shù)據(jù)曝光度。開放的最大疑慮是他人利用數(shù)據(jù)搶先發(fā)表成果。開放條件中,受訪者最需要“審核使用者身份和數(shù)據(jù)使用用途后提供”功能。通過調(diào)研,準(zhǔn)確定位研究者對(duì)研究數(shù)據(jù)管理服務(wù)的實(shí)際需求。
一對(duì)一訪談發(fā)現(xiàn):①數(shù)據(jù)開放程度與學(xué)科特點(diǎn)密切。對(duì)于數(shù)據(jù)驅(qū)動(dòng)、數(shù)據(jù)密集特征明顯的學(xué)科,數(shù)據(jù)開放比較標(biāo)準(zhǔn)和規(guī)范,可以推進(jìn)到原始數(shù)據(jù)的程度,例如社會(huì)調(diào)查學(xué)科和生物信息學(xué)科。在生物信息學(xué)科,發(fā)表期刊時(shí)發(fā)表數(shù)據(jù)已經(jīng)是趨勢(shì),大多向期刊指定數(shù)據(jù)庫提交,或者自己建立數(shù)據(jù)庫。對(duì)于其他學(xué)科,數(shù)據(jù)開放也存在,但向大多數(shù)同行開放的僅是整理后的成果數(shù)據(jù),原始數(shù)據(jù)只與直接合作者共享。②數(shù)據(jù)開放具有明顯的時(shí)滯期。幾乎所有的學(xué)者都強(qiáng)調(diào),數(shù)據(jù)必須在自己的成果發(fā)表之后,才考慮開放。這與學(xué)者對(duì)“數(shù)據(jù)被他人搶先發(fā)表成果”的擔(dān)心是一致的。③研究數(shù)據(jù)開放行為多為學(xué)者自發(fā),缺乏政策激勵(lì)機(jī)制和維護(hù)更新平臺(tái),缺乏基于數(shù)據(jù)引用、認(rèn)可和學(xué)術(shù)聲譽(yù)的良性反饋,亟需規(guī)范的數(shù)據(jù)服務(wù)平臺(tái)。
2017年,筆者對(duì)校內(nèi)本科生與研究生的課程調(diào)研發(fā)現(xiàn):全校約26個(gè)院系開設(shè)數(shù)據(jù)驅(qū)動(dòng)研究的研究生課程約有56門,本科生課程有85門,不僅分布于理工學(xué)部,也分布于人文與社會(huì)科學(xué)學(xué)部。對(duì)9名課程教師進(jìn)行訪談,調(diào)研發(fā)現(xiàn):教師課程教學(xué)急需高質(zhì)量開放研究數(shù)據(jù)平臺(tái)。教師獲取數(shù)據(jù)的難度遠(yuǎn)遠(yuǎn)超過獲取文獻(xiàn)。
2018年,筆者對(duì)國外27所大學(xué)(美國12所、英國11所和澳大利亞4所)的研究數(shù)據(jù)管理服務(wù)主頁進(jìn)行調(diào)研,梳理國內(nèi)外研究機(jī)構(gòu)和大學(xué)的研究數(shù)據(jù)管理服務(wù)內(nèi)容。調(diào)研結(jié)果見表1,可以發(fā)現(xiàn)研究數(shù)據(jù)管理服務(wù)內(nèi)容主要包括:數(shù)據(jù)管理計(jì)劃、數(shù)據(jù)服務(wù)、數(shù)據(jù)素養(yǎng)、數(shù)據(jù)管理、長期保存和數(shù)據(jù)政策幾部分。圍繞研究和研究數(shù)據(jù)生命周期,提供全流程的數(shù)據(jù)管理服務(wù)。
3.3建設(shè)過程
(1)數(shù)據(jù)建設(shè)
在數(shù)據(jù)建設(shè)方面,截至2018年12月,開放數(shù)據(jù)平臺(tái)發(fā)布數(shù)據(jù)空間37個(gè)、數(shù)據(jù)集236個(gè)、數(shù)據(jù)文件1096個(gè),收錄中國家庭追蹤調(diào)查、中國健康與養(yǎng)老追蹤調(diào)查、綜合型語言知識(shí)庫、中國歷代人物傳記資料庫等多個(gè)高質(zhì)量、具有國際影響力的數(shù)據(jù)集。
(2)比較與分析不同研究數(shù)據(jù)發(fā)布平臺(tái),推出符合北京大學(xué)需求的開放數(shù)據(jù)平臺(tái)
在調(diào)研與測(cè)試多個(gè)軟件平臺(tái)與工具的基礎(chǔ)上,確定應(yīng)用開源軟件Dataverse建設(shè)北京大學(xué)研究數(shù)據(jù)開放服務(wù)平臺(tái),開發(fā)實(shí)現(xiàn)中英雙語界面、校統(tǒng)一認(rèn)證、用戶審核管理、DOI注冊(cè)、數(shù)據(jù)統(tǒng)計(jì)等新功能,滿足數(shù)據(jù)提交、管理與服務(wù)需求。實(shí)現(xiàn)數(shù)據(jù)成果交互與揭示,數(shù)據(jù)平臺(tái)與機(jī)構(gòu)知識(shí)庫實(shí)現(xiàn)互操作,將基于平臺(tái)數(shù)據(jù)集的研究成果通過機(jī)構(gòu)知識(shí)庫進(jìn)行保存與服務(wù)。推動(dòng)國際平臺(tái)交互與揭示,數(shù)據(jù)平臺(tái)與國際數(shù)據(jù)倉儲(chǔ)Re3data、國際數(shù)據(jù)引用索引平臺(tái)(Data Citation Index)實(shí)現(xiàn)數(shù)據(jù)交互、收錄與揭示,提高數(shù)據(jù)平臺(tái)國際可見度。
建設(shè)云存儲(chǔ)、云筆記、唯一標(biāo)識(shí)符管理系統(tǒng)、長期保存框架等相關(guān)平臺(tái)和服務(wù)。在提供開放數(shù)據(jù)服務(wù)的基礎(chǔ)上,研究與應(yīng)用項(xiàng)目管理工具、平臺(tái)服務(wù)。
(3)全面開展北京大學(xué)研究數(shù)據(jù)管理服務(wù)
以合作促發(fā)展,通過建立校內(nèi)多部門、多院系合作機(jī)制,為課程、項(xiàng)目與教師提供持續(xù)服務(wù),并與院系、教師課題組、政府、企業(yè)建立數(shù)據(jù)合作關(guān)系,立足高校實(shí)際需求,與國際同步發(fā)展,建立良性、可持續(xù)發(fā)展機(jī)制。
(4)推動(dòng)建設(shè)北京大學(xué)研究數(shù)據(jù)長期保存與共享服務(wù)機(jī)制
調(diào)研研究數(shù)據(jù)管理服務(wù)政策、長期保存與共享服務(wù)機(jī)制,將數(shù)據(jù)政策研究納入到北京大學(xué)開放獲取政策推動(dòng)項(xiàng)目中。推出北京大學(xué)數(shù)據(jù)唯一標(biāo)識(shí)符服務(wù),提供數(shù)據(jù)的長期保存與國際數(shù)據(jù)中心互操作服務(wù)。
(5)服務(wù)營銷
在中國研究數(shù)據(jù)相關(guān)政策滯后于國際的情況下,如何讓更多研究者了解、參與和受益于研究數(shù)據(jù)管理服務(wù),成為一項(xiàng)挑戰(zhàn)。筆者團(tuán)隊(duì)通過策劃多種方案,推動(dòng)研究數(shù)據(jù)管理服務(wù)建設(shè)。
首先,通過營銷提升影響力。
對(duì)開放數(shù)據(jù)平臺(tái)進(jìn)行搜索引擎優(yōu)化(Search Engine Optimization),改進(jìn)與提高搜索引擎排名,優(yōu)化后,平臺(tái)搜索進(jìn)入百度和谷歌搜索結(jié)果第一。在北京大學(xué)主頁科學(xué)研究欄目下發(fā)布開放數(shù)據(jù)平臺(tái)鏈接,增加平臺(tái)入口。通過北京大學(xué)37個(gè)院系圖書館分館發(fā)放研究數(shù)據(jù)管理宣傳冊(cè),并在校圖書館管理委員會(huì)年度會(huì)議、科研秘書年度會(huì)議和在國內(nèi)外學(xué)術(shù)會(huì)議上廣泛宣傳北京大學(xué)研究數(shù)據(jù)管理服務(wù)。與國際數(shù)據(jù)倉儲(chǔ)Re3data和國際數(shù)據(jù)引用索引平臺(tái)Data Citation Index合作,將平臺(tái)數(shù)據(jù)在國際平臺(tái)上收錄與揭示,增強(qiáng)國際可見度,擴(kuò)大數(shù)據(jù)的國際影響力。
其次,服務(wù)營銷案例-首屆全國高校數(shù)據(jù)驅(qū)動(dòng)研究大賽。
為廣泛宣傳研究數(shù)據(jù)管理服務(wù),2016年11月7日至12月16日,北京大學(xué)圖書館舉辦第三屆搜索達(dá)人大賽——“開放數(shù)據(jù)”篇。大賽共吸引300多名師生參與,幫助師生拓展開放數(shù)據(jù)視野,提高開放數(shù)據(jù)搜索和分析的實(shí)踐技能,激發(fā)利用開放數(shù)據(jù)進(jìn)行教學(xué)科研的熱情,以更好地開展科學(xué)數(shù)據(jù)管理與利用相關(guān)服務(wù)、助力教學(xué)科研、推動(dòng)科學(xué)數(shù)據(jù)開放共享。
2017年12月至2018年4月,由北京大學(xué)圖書館發(fā)起,聯(lián)合校內(nèi)外機(jī)構(gòu),成功舉辦“全國高校數(shù)據(jù)驅(qū)動(dòng)創(chuàng)新研究大賽”。大賽吸引全國高校萬余人的關(guān)注,在報(bào)名階段,共吸引來自全國160多所高校近600支隊(duì)伍(近2000名選手)參賽報(bào)名。最終由來自全國120余所高校的289支隊(duì)伍(近1000人)成功提交參賽作品。評(píng)選出13支現(xiàn)場(chǎng)答辯隊(duì)伍和120支優(yōu)秀隊(duì)伍。2018年4月3日下午,答辯活動(dòng)在北京大學(xué)舉行,現(xiàn)場(chǎng)評(píng)選出特等獎(jiǎng)、一等獎(jiǎng)、二等獎(jiǎng)和三等獎(jiǎng)共計(jì)十三項(xiàng)大獎(jiǎng)。大賽得到廣泛關(guān)注,全國數(shù)十個(gè)高校發(fā)布相關(guān)信息,主流媒體進(jìn)行報(bào)道,參賽者對(duì)大賽極為重視,提交的高質(zhì)量、有創(chuàng)新研究成果的參賽作品,得到評(píng)審專家們的充分肯定。
大賽達(dá)到了營銷開放數(shù)據(jù)平臺(tái)的目標(biāo)。在大賽舉辦之前,平臺(tái)的日均訪客數(shù)為52人,大賽宣傳報(bào)名期間開放數(shù)據(jù)平臺(tái)日均訪客數(shù)為753人,大賽結(jié)束后日均訪客數(shù)為477人。通過大賽,平臺(tái)日均訪問量增加了近10倍,大賽期間,數(shù)據(jù)下載量達(dá)到過去兩年總和的5倍,新增用戶數(shù)量達(dá)到過去兩年總和的4倍。
34未來規(guī)劃
抓住大數(shù)據(jù)發(fā)展機(jī)遇,將北京大學(xué)建設(shè)成為研究數(shù)據(jù)匯集、管理與服務(wù)的世界一流引領(lǐng)者,已成為北京大學(xué)圖書館的重要發(fā)展目標(biāo)之一。北京大學(xué)圖書館未來將在以下方面推進(jìn)研究數(shù)據(jù)管理:加強(qiáng)在數(shù)據(jù)工具、軟件、管理與服務(wù)等方面的研究與應(yīng)用,以數(shù)據(jù)服務(wù)為凝聚力,建設(shè)持續(xù)匯集國內(nèi)外高質(zhì)量研究數(shù)據(jù)的研究數(shù)據(jù)平臺(tái),提供基于數(shù)據(jù)的教學(xué)與研究的支撐平臺(tái);開展數(shù)據(jù)創(chuàng)新研究、教學(xué)與產(chǎn)業(yè)孵化活動(dòng)與比賽;與校外數(shù)據(jù)資源豐富的政府、企事業(yè)單位合作,尋求互補(bǔ)共贏的合作模式;推動(dòng)數(shù)據(jù)教學(xué)與科研創(chuàng)新。
在數(shù)據(jù)服務(wù)和數(shù)據(jù)管理平臺(tái)建設(shè)方面,將通過以下方式加快發(fā)展:
為教學(xué)提供支撐服務(wù),促進(jìn)與課程相關(guān)的數(shù)據(jù)和論文的保存、積累。
融入教師的科研過程,通過數(shù)據(jù)館員與教師展開深入合作,推進(jìn)研究數(shù)據(jù)的全生命周期管理。
推動(dòng)北京大學(xué)制定研究數(shù)據(jù)管理與服務(wù)政策,推動(dòng)研究數(shù)據(jù)的收集、保存、管理和共享。
優(yōu)化平臺(tái)性能與功能,發(fā)展為國際一流數(shù)據(jù)平臺(tái)。
提升平臺(tái)的數(shù)據(jù)量承載能力,構(gòu)建基于大數(shù)據(jù)、高并發(fā)的數(shù)據(jù)管理系統(tǒng),促進(jìn)平臺(tái)對(duì)生物、醫(yī)學(xué)、社會(huì)科學(xué)等學(xué)科大數(shù)據(jù)的支撐。
提高數(shù)據(jù)平臺(tái)與其他系統(tǒng)的互操作性,促進(jìn)數(shù)據(jù)與論文成果、學(xué)者主頁、項(xiàng)目成果的關(guān)聯(lián),加速數(shù)據(jù)的流動(dòng)和共享。
4結(jié)語
在大數(shù)據(jù)和人工智能環(huán)境下,研究數(shù)據(jù)呈指數(shù)級(jí)增長,數(shù)據(jù)驅(qū)動(dòng)研究成為全學(xué)科研究態(tài)勢(shì),數(shù)據(jù)管理和服務(wù)的需求日益迫切。2018年12月2日—4日,在第14屆開放獲取柏林會(huì)議上,中國國家自然科學(xué)基金委、國家科技圖書文獻(xiàn)中心、中科院文獻(xiàn)情報(bào)中心代表在會(huì)議上發(fā)布立場(chǎng)聲明,明確表示中國支持歐盟倡議的OA2020和開放獲取S計(jì)劃,支持公共資助項(xiàng)目研究論文立即開放獲取[25]。S計(jì)劃包括研究數(shù)據(jù)的開放獲取,此聲明意味著中國的開放數(shù)據(jù)政策可能也即將出臺(tái)。對(duì)研究型圖書館來說,這既是挑戰(zhàn),也是機(jī)遇。圖書館應(yīng)重視研究數(shù)據(jù)管理服務(wù),助力中國高等教育的“雙一流”建設(shè),把握研究數(shù)據(jù)管理服務(wù)發(fā)展契機(jī),加快研究與實(shí)踐,成為研究數(shù)據(jù)匯集、管理與服務(wù)的引領(lǐng)者。
參考文獻(xiàn)
1黃曉艷, 馬珉. 大數(shù)據(jù)開啟智能時(shí)代——訪中國科學(xué)院院士鄂維南 [J]. 高科技與產(chǎn)業(yè)化, 2017, (6): 36-41.
2張影強(qiáng), 張大璐, 梁鵬. 發(fā)達(dá)國家如何布局大數(shù)據(jù)戰(zhàn)略 [J]. 中國經(jīng)濟(jì)報(bào)告, 2018, (1): 87-89.
3College & university data science degrees[EB/OL]. [2018-12-20]. http://datascience.community/colleges.
4283所高校獲批數(shù)據(jù)科學(xué)與大數(shù)據(jù)專業(yè)[EB/OL]. [2018-05-10]. http://36kr.com/p/5125134.html.
5國務(wù)院辦公廳關(guān)于印發(fā)科學(xué)數(shù)據(jù)管理辦法的通知[EB/OL]. [2018-05-01]. http://www.gov.cn/zhengce/content/2018-04/02/content_5279272.htm.
6張曉林. 顛覆性變革與后圖書館時(shí)代——推動(dòng)知識(shí)服務(wù)的供給側(cè)結(jié)構(gòu)性改革 [J]. 中國圖書館學(xué)報(bào), 2018, 44(1): 4-16.
7吳建中. 推進(jìn)開放數(shù)據(jù) 助力開放科學(xué) [J]. 圖書館雜志, 2018, 37(2): 4-10.
8Nsf data sharing policy[EB/OL]. [2018-10-01]. https://www.nsf.gov/bfa/dias/policy/dmp.jsp.
9陳大慶. 英國科研資助機(jī)構(gòu)的數(shù)據(jù)管理與共享政策調(diào)查及啟示 [J]. 圖書情報(bào)工作, 2013(8): 5-11.
10Science as an open enterprise[EB/OL]. [2018-12-02]. https://royalsociety.org/topicspolicy/projects/sciencepublicenterprise/report/.
11COMMISSION E. Open access & data management[EB/OL]. [2018-07-10]. http://ec.europa.eu/research/participants/docs/h2020fundingguide/crosscuttingissues/openaccessdissemination_en.htm.
12Research funders open access policies[EB/OL]. [2018-05-31]. http://v2.sherpa.ac.uk/juliet/.
13Re3data.Org[EB/OL]. [2018-12-20]. https://www.re3data.org/.
14Special online collection: Dealing with data[EB/OL]. [2018-06-19]. http://www.sciencemag.org/site/special/data/#opennewwindow.
15Geoscience data journal [EB/OL]. [2018-06-19]. https://rmets.onlinelibrary.wiley.com/journal/20496060.
16Welcome, scientific data[EB/OL]. [2018-06-19]. https://www.nature.com/news/welcomescientificdata1.15293.
17中國科學(xué)數(shù)據(jù)[EB/OL]. [2018-06-19]. http://www.csdata.org/p/static/33/.
18Tenopir C, Talja S, Horstmann W, et al. Research data services in european academic research libraries [J]. Liber Quarterly, 2017, 27(1): 23-44.
19Yoon A, Schultz T. Research data management services in academic libraries in the us: A content analysis of libraries websites [J]. College & Research Libraries, 2017, 78(7): 920-933.
20Bryant R, Lavoie B, Malpas C, et al. A tour of the research data management (rdm) service space. The realities of research data management, part 1 [J]. 2017,
21Creating a data management framework[EB/OL]. [2018-06-07]. https://www.ands.org.au/guides/creatingadatamanagementframework.
22Martin E R. The role of librarians in data science: a call to action [J]. Journal of eScience Librarianship, 2016, 4(2): 7-9.
23How to develop rdm services—a guide for heis[EB/OL]. [2018-05-01]. http://www.dcc.ac.uk/resources/howguides/howdeveloprdmservices.
24Yu F, Deuble R, Morgan H. Designing research data management services based on the research lifecycle–a consultative leadership approach [J]. Journal of the Australian Library and Information Association, 2017, 66(3): 287-298.
25張曉林. 讓所有科研論文免費(fèi)閱讀,中國機(jī)構(gòu)明確力挺開放獲取[EB/OL]. [2018-12-20]. http://zhishifenzi.com/depth/depth/4778.html.
作者單位:北京大學(xué)圖書館,北京,100871
收稿日期:2018年7月7日