江銀鳳
(第三軍醫(yī)大學(xué),重慶 400038)
?
基于長尾數(shù)據(jù)監(jiān)管的圖書館服務(wù)研究
江銀鳳
(第三軍醫(yī)大學(xué),重慶 400038)
摘要:文章結(jié)合大數(shù)據(jù)時代長尾理論,探討長尾數(shù)據(jù)在圖書館服務(wù)中需求的增長、圖書館參與數(shù)據(jù)監(jiān)管服務(wù)的迫切性及圖書館在長尾數(shù)據(jù)監(jiān)管中所產(chǎn)生的形態(tài),論述長尾數(shù)據(jù)監(jiān)管在圖書館服務(wù)中的應(yīng)用,包括監(jiān)管重心轉(zhuǎn)移、資源長尾聚合、知識產(chǎn)權(quán)保護(hù)及服務(wù)角色轉(zhuǎn)變等對策措施,以期為圖書館長尾數(shù)據(jù)監(jiān)管實踐提供參考。
關(guān)鍵詞:長尾數(shù)據(jù);數(shù)據(jù)監(jiān)管;數(shù)據(jù)生命周期
網(wǎng)絡(luò)數(shù)據(jù)的級數(shù)非線性增長,將我們帶入大數(shù)據(jù)時代,數(shù)據(jù)量的海量、高速、復(fù)雜度以及非結(jié)構(gòu)化的特性,給我們帶來了更好的數(shù)據(jù)價值及體驗,但也讓數(shù)據(jù)的監(jiān)管和存儲變得越來越復(fù)雜,圖書館的數(shù)據(jù)量也不例外。OCLC副主席Dempsey曾說:圖書館集聚了研究、學(xué)習(xí)和文化資源的長尾[1]。圖書館在網(wǎng)絡(luò)的沖擊下,用戶資源被搜索引擎等分流,已逐漸喪失了其作為學(xué)術(shù)資源中心的最佳聚合度。相對于大數(shù)據(jù)對應(yīng)的大科學(xué)平臺的關(guān)注度體量大,處于數(shù)據(jù)長尾的小科學(xué)以及新興學(xué)科領(lǐng)域,在科學(xué)研究動態(tài)循環(huán)的過程中,由于缺乏必要的關(guān)注度,對科學(xué)數(shù)據(jù)第一手資料及實驗數(shù)據(jù)的記錄、存儲及維護(hù)、再利用的過程就得不到其應(yīng)有的價值。在此背景下,圖書館作為科研數(shù)據(jù)監(jiān)管及存儲的最佳機(jī)構(gòu)[2],其長尾服務(wù)優(yōu)勢已體現(xiàn)出來,這就是本文研究的目的之所在。
1相關(guān)研究概述
1.1 長尾數(shù)據(jù)及數(shù)據(jù)監(jiān)管概述
趙艷枝在《長尾數(shù)據(jù)監(jiān)護(hù)與圖書館的職責(zé)——伊利諾伊香檳大學(xué)圖書館范例研究》中,將長尾數(shù)據(jù)定義為:科研團(tuán)隊或個人投資較小或非基金資助科研項目研究過程中產(chǎn)生的數(shù)據(jù)[3]。楊鶴林將這類科學(xué)稱為科學(xué)界的“地方志”,以方便認(rèn)識和了解特定的局部事物[4]。伊利諾伊大學(xué)香檳分校的實踐也說明了圖書館的監(jiān)管重心是在“小科學(xué)”[5]。圖書館對長尾數(shù)據(jù)資源的服務(wù)需求的增長不言而喻。除此之外,科學(xué)成果的產(chǎn)生需要原始數(shù)據(jù)作為基礎(chǔ),在后續(xù)的研究中對其他科研項目的推進(jìn)也具有很好的參考價值。小型科學(xué)項目一般是以小團(tuán)體或個體研究的形式進(jìn)行的,產(chǎn)生的數(shù)據(jù)小眾卻量大,但一般只注重項目所產(chǎn)生的結(jié)果,對整個科研過程的前期、中期及后期所產(chǎn)生的數(shù)據(jù)未有詳細(xì)記錄。這些數(shù)據(jù)可能帶來更為前沿的創(chuàng)新領(lǐng)域,對未來科學(xué)的發(fā)展與進(jìn)步可能具有重要價值,但一般只保存在科研人員手里,如果圖書館不加以集中監(jiān)管,則不利于其永久保存。
數(shù)據(jù)監(jiān)管一詞,美國學(xué)術(shù)界將其統(tǒng)一為Data Curation,由微軟研究員、圖靈獎得主Jim Gray在2002年提出,被日本、澳大利亞、荷蘭等國沿用。而英國學(xué)者常用Digital Curation作為其專業(yè)術(shù)語[6]。中國學(xué)者在引用該術(shù)語時將其翻譯為“數(shù)據(jù)策展”“數(shù)據(jù)字典”“數(shù)據(jù)醫(yī)療”“數(shù)據(jù)存管”“數(shù)據(jù)監(jiān)護(hù)”“數(shù)據(jù)監(jiān)管”“數(shù)據(jù)管理”等,意義不盡相同,而對數(shù)據(jù)的界定則統(tǒng)一為科研數(shù)據(jù)。國外的定義,主要從數(shù)據(jù)生命周期的過程展開,即從數(shù)據(jù)的產(chǎn)生、利用、保存、歸檔、維護(hù)、再利用等這一系列的活動的總和的開展過程。國內(nèi)的定義可歸納為兩個方面:一個是與國外相類似的數(shù)據(jù)的選擇、組織、存儲及管理,另一個是為揭示數(shù)據(jù)監(jiān)管所產(chǎn)生的附加價值與知識效能。而本文用數(shù)據(jù)監(jiān)管一詞來界定,注重數(shù)據(jù)的持續(xù)性、動態(tài)性及可管理性的特點(diǎn),顯示對數(shù)據(jù)的監(jiān)管不僅是對數(shù)據(jù)整個生命周期的監(jiān)視管理,更是為滿足周期中數(shù)據(jù)持續(xù)性管理的要求。
1.2 國內(nèi)外圖書館數(shù)據(jù)監(jiān)管現(xiàn)狀與實踐
針對數(shù)據(jù)監(jiān)管,國外關(guān)注較早。最初的研究都是從對數(shù)據(jù)及數(shù)據(jù)共享的政策規(guī)范等開始,逐漸過渡到數(shù)據(jù)管理直至更為細(xì)致化的數(shù)據(jù)監(jiān)管。從國際性組織到校際聯(lián)盟,從大學(xué)再細(xì)化到公共及大學(xué)圖書館,關(guān)于數(shù)據(jù)監(jiān)管的研究一直都沒有間斷過。國際性組織如美國國家科學(xué)基金會(NSF)2011年提出對所收集的數(shù)據(jù)的管理計劃的詳細(xì)說明,啟動 DATANET計劃;英國、荷蘭、澳大利亞等對數(shù)據(jù)管理作了計劃研究及政策管理,更是通過法案的形式限定數(shù)據(jù)政策,以保證數(shù)據(jù)管理能有效操作與共享。美國校際政治和社會科學(xué)研究聯(lián)盟(ICPSR)、英國聯(lián)合信息系統(tǒng)委員會(JISC)與巴斯大學(xué)的資助合作[7];康奈爾大學(xué)、加州大學(xué)圣地亞哥分校等國外很多所大學(xué)有關(guān)數(shù)據(jù)管理網(wǎng)站、計劃、協(xié)議、政策、機(jī)制及服務(wù)等,與圖書館結(jié)合,給予了充分的數(shù)據(jù)需求形式。由ARL,CNI和專業(yè)組織主辦的監(jiān)管相關(guān)活動(ACM/IEEE,ASIS&T,ACRL)[8],加上圖書館為發(fā)展支持?jǐn)?shù)據(jù)監(jiān)管進(jìn)行的研究生教育計劃,都表明了數(shù)字?jǐn)?shù)據(jù)的監(jiān)管在研究型圖書館界的重要性。
國內(nèi)圖書館有關(guān)數(shù)據(jù)監(jiān)管的研究,主要是從機(jī)構(gòu)知識庫的角度,以存儲科學(xué)文獻(xiàn)中的期刊論文、學(xué)位論文、本校原生文獻(xiàn)資源、教案課件及預(yù)印本等為主。CALIS三期有關(guān)于科學(xué)數(shù)據(jù)管理的預(yù)研項目[9],中國科學(xué)院、清華大學(xué)、復(fù)旦大學(xué)等也有相應(yīng)資源,上海交通大學(xué)的情報分析服務(wù),也是對本??蒲袛?shù)據(jù)資源的分析。臺灣大學(xué)圖書館聯(lián)合伊利諾伊大學(xué)香檳分校所做的研究[10],定位了大學(xué)圖書館在科學(xué)數(shù)據(jù)管理中的新角色。而在軍隊院校圖書館中,三個軍醫(yī)大學(xué)都有各自相應(yīng)的自建特色庫的原生數(shù)據(jù)資源,主要以醫(yī)學(xué)實驗類為主提供學(xué)科服務(wù),這就需要圖書館員在科研實驗過程中參與數(shù)據(jù)進(jìn)程,才能有效將數(shù)據(jù)保存再利用。
總體來說,國外有關(guān)數(shù)據(jù)監(jiān)管的研究已相對成熟,國家、機(jī)構(gòu)以及圖書館的合作也使數(shù)據(jù)監(jiān)管服務(wù)開展更為順利,而國內(nèi)在圖書館方面的應(yīng)用實踐還相對較少,數(shù)據(jù)能被利用的價值還有待提高。
2長尾理論在圖書館數(shù)據(jù)監(jiān)管中的作用實施
有文章調(diào)查顯示[11],科研數(shù)據(jù)的來源主要是從實驗過程以及網(wǎng)絡(luò)采集中所獲得的第一手?jǐn)?shù)據(jù)資料,大科學(xué)項目的數(shù)據(jù)記錄有專門的數(shù)據(jù)機(jī)構(gòu)。但小的科研項目中的長尾數(shù)據(jù),處于科研長尾的80%卻很少受到關(guān)注,要想將這些長尾數(shù)據(jù)永久保存并能有效利用,就需要圖書館對其進(jìn)行收集、存儲、監(jiān)管并延伸到再利用的生命周期中去。
2.1 長尾數(shù)據(jù)在圖書館管理服務(wù)中的需求分析
圖書館數(shù)據(jù),是圖書館網(wǎng)站上的數(shù)據(jù)資源,主要包括學(xué)位論文庫、專業(yè)數(shù)據(jù)庫、特色數(shù)據(jù)庫、視頻圖片數(shù)據(jù)庫等自建資源,也有CNKI、Elsevier、Springer、PubMed等標(biāo)準(zhǔn)資源,外加新聞消息、通知教務(wù)信息資源等。這些數(shù)據(jù)集成在圖書館網(wǎng)站上,構(gòu)成了圖書館數(shù)據(jù)的整體。圖書館長尾數(shù)據(jù)即是在此基礎(chǔ)上衍生出來的小科研項目集成數(shù)據(jù),相應(yīng)的數(shù)據(jù)特征、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)分布特點(diǎn)、隱私與產(chǎn)權(quán)信息、數(shù)據(jù)獲取方式、內(nèi)容形式、數(shù)據(jù)量大小及更新周期等,是圖書館服務(wù)內(nèi)容的一部分。圖書館作為知識傳遞的渠道,在當(dāng)前用戶被分流的環(huán)境下,重構(gòu)服務(wù)內(nèi)容,讓用戶重新逆回到以圖書館為學(xué)術(shù)資源聚合中心,是面臨的一大挑戰(zhàn)。
現(xiàn)有圖書館有關(guān)數(shù)據(jù)的管理以機(jī)構(gòu)知識庫為主,存儲本校師生自有的期刊論文、學(xué)位論文、工作文稿等,而研究中的實驗數(shù)據(jù)、假想數(shù)據(jù)、視頻圖像、算法程序等科研數(shù)據(jù)卻沒有有效集中管理,只注重科研成果而缺乏相關(guān)科研支撐材料。本文以長尾數(shù)據(jù)監(jiān)管觀照圖書館所提供的服務(wù),研究的對象以科研數(shù)據(jù)為主,目的是為科研數(shù)據(jù)信息的再利用,倡導(dǎo)對科研產(chǎn)生的數(shù)據(jù)進(jìn)行全程收集存儲、元數(shù)據(jù)標(biāo)準(zhǔn)的規(guī)范、長期保存及管理,以方便后續(xù)研究以此為基礎(chǔ)進(jìn)行再處理利用,挖掘數(shù)據(jù)信息的價值,達(dá)到數(shù)據(jù)增值的目的,從而強(qiáng)化圖書館在科研過程中的知識服務(wù)價值。
圖書館是為全社會服務(wù)的非盈利性的機(jī)構(gòu),在資源使用中,長尾資源的出現(xiàn)是不可避免的。應(yīng)用長尾理論聚合數(shù)據(jù)資源,聚合用戶需求,能使用戶接觸到那些原本很少利用的信息,并能有效地利用到自己的研究之中。
2.2 圖書館參與數(shù)據(jù)監(jiān)管的實施方法途徑
大數(shù)據(jù)時代,傳統(tǒng)的圖書館服務(wù)方式已不再適應(yīng)用戶需求,急需對其重新定位,以更好為用戶服務(wù)。圖書館數(shù)據(jù)監(jiān)管服務(wù)的出現(xiàn),即是對其服務(wù)方式實施轉(zhuǎn)型的主要形式。美國國家科學(xué)基金會(NSF)自2011年始規(guī)定所有申請NSF的科研基金項目必須以補(bǔ)充文件的形式提交其相關(guān)的研究數(shù)據(jù)管理計劃[12],即是有關(guān)數(shù)據(jù)監(jiān)管的數(shù)據(jù)長期保存、共享形式、訪問方式等,且其DATANET項目將圖書館作為主體參與者放到此項工作中。大數(shù)據(jù)時代圖書館轉(zhuǎn)變其服務(wù)方式,開展更為深層次的信息服務(wù),也對數(shù)據(jù)監(jiān)管理論與實踐的研究有很大價值。
圖書館在技術(shù)、數(shù)據(jù)標(biāo)準(zhǔn)等方面的便利性,以及圖書館員所具有的文獻(xiàn)管理知識,讓其能在傳統(tǒng)文獻(xiàn)分類組織、元數(shù)據(jù)、資源描述、編目檢索等基礎(chǔ)領(lǐng)域有很高的專業(yè)水平。數(shù)據(jù)監(jiān)管服務(wù)的出現(xiàn),圖書館及其館員的知識內(nèi)容能很好沿用。圖書館在現(xiàn)有知識庫的基礎(chǔ)上,由從關(guān)注科研成果轉(zhuǎn)向為關(guān)注數(shù)據(jù)這一支撐科研整個過程的材料,由被動的資源收藏者變?yōu)橹鲃拥闹R管理者。數(shù)據(jù)監(jiān)管過程中,相應(yīng)的數(shù)據(jù)平臺的建立、用戶信息需求的服務(wù)、數(shù)據(jù)標(biāo)準(zhǔn)形式等,都能與圖書館有效服務(wù)洽和。
2.3 圖書館在長尾數(shù)據(jù)監(jiān)管中的生命周期形態(tài)
在不同領(lǐng)域資源集合日趨完善的今天,我們還沒有協(xié)調(diào)好一個很好的模式比例來描述小型科研項目中產(chǎn)生的研究級數(shù)據(jù)集合[13],這些科學(xué)長尾數(shù)據(jù)在聚合集合中具有高度的異質(zhì)性[14],往往是分離的,要想跨越長尾科學(xué)及相關(guān)數(shù)據(jù)的監(jiān)管,即是在數(shù)據(jù)生命周期的基礎(chǔ)上形成圖書館監(jiān)管新形態(tài),以利于數(shù)據(jù)的使用,如圖1所示。
圖1圖書館長尾數(shù)據(jù)監(jiān)管生命周期形態(tài)
長尾數(shù)據(jù)從被納入科學(xué)假想開始,就開啟了其生命周期的形態(tài),雖然周期會短一些,但接下來的科學(xué)實驗、分析設(shè)計、數(shù)據(jù)成型、得出結(jié)論、出現(xiàn)成果直至成果的發(fā)表,且成果發(fā)表之后所產(chǎn)生的效應(yīng)以及后續(xù)的數(shù)據(jù)、文獻(xiàn)資源的引用,形成相應(yīng)的理論,其每一個階段都會產(chǎn)生一定量的科研數(shù)據(jù),這就包括長尾數(shù)據(jù)生命周期的上中下游。
而圖書館在其相應(yīng)的生命周期里,數(shù)據(jù)監(jiān)管工作的重心在數(shù)據(jù)的收集選取、數(shù)據(jù)的挖掘分析、檢索利用、語義匹配及長尾聚合等不同階段亦有差異。這就要求圖書館在不同的長尾數(shù)據(jù)監(jiān)管階段,給予不同的服務(wù)形態(tài)。在項目進(jìn)行前期的假想實驗數(shù)據(jù)階段,通過對數(shù)據(jù)的收集選取,對數(shù)據(jù)的動態(tài)采集、鑒定、選擇及更新。與相關(guān)的機(jī)構(gòu)研究者合作,制定相應(yīng)的監(jiān)管計劃,對數(shù)據(jù)產(chǎn)生的類型、數(shù)量、形式、保存期限、訪問權(quán)限等予以規(guī)定。規(guī)范數(shù)據(jù)標(biāo)準(zhǔn)及格式以方便互操作,以關(guān)聯(lián)數(shù)據(jù)的方式,可以將整個長尾數(shù)據(jù)的生命周期過程關(guān)聯(lián)起來,也可以對不同項目的相似數(shù)據(jù)、同一項目不同研究者的數(shù)據(jù)之間建立關(guān)聯(lián),以利于數(shù)據(jù)的統(tǒng)一集合形成資源的聚合。圖書館現(xiàn)有的數(shù)據(jù)資源,主要有數(shù)據(jù)庫資源平臺、相關(guān)的制作標(biāo)準(zhǔn)、以及流動的網(wǎng)絡(luò)數(shù)據(jù),這些資源都可為圖書館的數(shù)據(jù)監(jiān)管提供便利條件。通過圖書館技術(shù)搭建數(shù)據(jù)平臺,制定相應(yīng)的元數(shù)據(jù)格式標(biāo)準(zhǔn),以利于長尾數(shù)據(jù)的存儲。對數(shù)據(jù)知識的存儲與再利用以及知識產(chǎn)權(quán)的保護(hù)方面的安全防護(hù)也是圖書館后期服務(wù)中要考慮的內(nèi)容。
3長尾數(shù)據(jù)監(jiān)管在圖書館服務(wù)中的對策思考
面對數(shù)據(jù)密集型科研時代及用戶知識需求的轉(zhuǎn)變,圖書館應(yīng)發(fā)揮其應(yīng)有的學(xué)術(shù)價值,為中小型性質(zhì)的科研、教學(xué)等予以數(shù)據(jù)監(jiān)管,完善其科研數(shù)據(jù)的生命周期管理,同時也要延展其在數(shù)據(jù)長期存儲方面的作用。
3.1 轉(zhuǎn)移數(shù)據(jù)監(jiān)管重心
在缺乏相應(yīng)監(jiān)管計劃及管理制度的要求上,大部分科學(xué)數(shù)據(jù)保存在科研人員自己手中,一旦項目結(jié)束或結(jié)題,相應(yīng)數(shù)據(jù)就會被遺忘,很難再被共享或利用,數(shù)據(jù)也因此可能會被毀壞或丟失,這樣它的隱藏價值就不會被挖掘出來。長尾數(shù)據(jù)的生命周期形態(tài),要求圖書館數(shù)據(jù)監(jiān)管工作從項目申報開始就提供相應(yīng)服務(wù),將監(jiān)管重心由只注重收集研究成果改為加強(qiáng)對數(shù)據(jù)生命周期的上游及中游各類數(shù)據(jù)的管理。在項目初期即與科研人員充分合作,或直接加入到科研團(tuán)隊中,項目進(jìn)行中對推導(dǎo)或者中間數(shù)據(jù)進(jìn)行有效管理,最后生成的成果數(shù)據(jù)也有其原生價值。圖書館要在國家相關(guān)政策的基礎(chǔ)上,制定數(shù)據(jù)監(jiān)管計劃,厘清不同學(xué)科數(shù)據(jù)產(chǎn)生的類型、數(shù)據(jù)形態(tài),弄清楚哪些是需要納入監(jiān)管體系的數(shù)據(jù),如何對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化、格式化、結(jié)構(gòu)化、知識化處理,數(shù)據(jù)特征的描述、數(shù)據(jù)的體量及其更新周期、內(nèi)容形式等,將其囊括到自有的監(jiān)管計劃中,進(jìn)行動態(tài)實時化監(jiān)管,以利于發(fā)揮長尾數(shù)據(jù)監(jiān)管的價值。
3.2 轉(zhuǎn)變長尾資源聚合
圖書館現(xiàn)有的長尾資源主要表現(xiàn)在讀者長尾、資源長尾以及服務(wù)長尾三個方面,其可持續(xù)發(fā)展的長尾點(diǎn)是轉(zhuǎn)變其資源聚合方式,即以數(shù)據(jù)監(jiān)管服務(wù)作為生長點(diǎn),實現(xiàn)資源長尾的供應(yīng)聚合??茖W(xué)生命周期的上中下游所產(chǎn)生的數(shù)據(jù),體量大且有暫時性、動態(tài)性,這就要求圖書館高度重視用戶生產(chǎn)出的內(nèi)容的收集存儲以及長期性的保存,利用圖書館所占有的技術(shù)及管理優(yōu)勢給予統(tǒng)一管理,聚合數(shù)字資源,從而有效擴(kuò)展圖書館的內(nèi)容空間和信息數(shù)量[15]。同時在長期存檔中亦需要圖書館這一主體給予數(shù)據(jù)的維護(hù)和再利用的資源,發(fā)掘出長尾用戶的潛在需求,延展長尾數(shù)據(jù)資源,方便研究用戶充分發(fā)現(xiàn)、獲得及利用資源,實現(xiàn)其循環(huán)周期的價值。除此之外,圖書館在世界范圍內(nèi)的分布已經(jīng)形成了一個圖書館網(wǎng),但資源的聚合程度還有待進(jìn)一步挖掘,數(shù)據(jù)資源更是各成體系,沒有統(tǒng)一標(biāo)準(zhǔn)。而圖書館資源長尾的聚合不是單靠一個館的力量就能實現(xiàn)的,而是需要圖書館在網(wǎng)絡(luò)環(huán)境下有機(jī)結(jié)合,共同參與,將數(shù)據(jù)資源充分納入到管理體系中來,在方便用戶的同時也實現(xiàn)了長尾資源的整合統(tǒng)一。
3.3 保護(hù)知識產(chǎn)權(quán)信息
圖書館存儲數(shù)據(jù)資源,在收集存儲上傳過程以及長期保存再利用中,都會涉及到數(shù)據(jù)存儲方式及位置、訪問與使用權(quán)限、數(shù)據(jù)共享利用管理等安全性問題,亦即數(shù)據(jù)中包含的知識產(chǎn)權(quán)問題??蒲许椖恐袌D書館所收集到的長尾數(shù)據(jù),如果未對使用權(quán)給予清晰的界定,尤其是軍隊院校會涉及到一些敏感數(shù)據(jù)及信息的所有權(quán)及使用權(quán)問題,很容易導(dǎo)致數(shù)據(jù)信息的泄露,這顯然違背了數(shù)據(jù)監(jiān)管服務(wù)的初衷。因此,圖書館在保障數(shù)據(jù)生命周期監(jiān)管共享之外,數(shù)據(jù)資源知識產(chǎn)權(quán)的保護(hù)也是非常重要的一個方面。在數(shù)據(jù)備份的監(jiān)管方面,伊利諾伊大學(xué)香檳分校圖書館對科研數(shù)據(jù)文檔監(jiān)管,建議對其備份三份,包括原始文檔備份、外部本地備份和外部遠(yuǎn)程備份[16],根據(jù)版權(quán)許可和發(fā)布協(xié)議將數(shù)據(jù)存儲在庫中,亦可通過web站點(diǎn)聯(lián)機(jī)發(fā)布,我國圖書館可以根據(jù)本館實際參考借鑒其做法。在長尾數(shù)據(jù)使用的監(jiān)管方面,圖書館要根據(jù)不同密級等級的數(shù)據(jù),設(shè)置相應(yīng)的瀏覽使用權(quán)限,并對數(shù)據(jù)使用者的身份給予審核,提供對應(yīng)的數(shù)據(jù)信息,同時要求其在數(shù)據(jù)引用過程中要明確注明出處、作者信息及必要的出版信息等,數(shù)據(jù)監(jiān)管員在服務(wù)過程中亦要遵守產(chǎn)權(quán)規(guī)則。只有保證了數(shù)據(jù)提供者的知識產(chǎn)權(quán)權(quán)利,長尾數(shù)據(jù)才能不間斷地存儲及再利用,這與圖書館生長著的有機(jī)體這一定律不謀而合。
3.4 變化服務(wù)職責(zé)角色
國外圖書館在數(shù)據(jù)領(lǐng)域已經(jīng)開始設(shè)置專門崗位角色,Data Scientist、Data Services Librarian、Data Research Scientist、Data Manager等,國外圖書館員已經(jīng)被NSF、NEH及其他管理者確認(rèn)為能幫助研究人員、機(jī)構(gòu)和組織解決問題的關(guān)鍵角色之一[17]。圖書館的工作服務(wù)邊界也已擴(kuò)展到數(shù)據(jù)服務(wù)階段。這些學(xué)科館員在圖書館服務(wù)過程中,在與讀者交互的過程中,其角色定位、職責(zé)范圍、服務(wù)方式等都有一定的轉(zhuǎn)變。數(shù)據(jù)監(jiān)管員(data curator)的角色,就是在整個長尾數(shù)據(jù)監(jiān)管生命周期的過程中,明晰用戶需求及規(guī)范需求類別,以數(shù)據(jù)的價值為增值點(diǎn),具備數(shù)據(jù)監(jiān)管專業(yè)知識,以及小科學(xué)科研項目領(lǐng)域相關(guān)知識,與科研人員交互數(shù)據(jù)信息,提供圖書館與科研數(shù)據(jù)之間的人機(jī)接口,在科研初始階段即參與到科研數(shù)據(jù)的操作過程中,規(guī)范數(shù)據(jù)框架及標(biāo)準(zhǔn),將研究軌跡信息中的隱性知識挖掘出來,以為數(shù)據(jù)共享服務(wù)提供保障。這對我國現(xiàn)階段圖書館人員的能力要求提出了較大的考驗,數(shù)據(jù)監(jiān)管崗位越來越成為圖書館的重要崗位,圖書館服務(wù)職責(zé)角色轉(zhuǎn)變,要求圖書館要做好數(shù)據(jù)監(jiān)管員的準(zhǔn)備工作,做好人才儲備及綜合知識的考量,重點(diǎn)培訓(xùn)相應(yīng)的學(xué)科數(shù)據(jù)服務(wù)人員,跟進(jìn)最新研究進(jìn)展,立足長尾數(shù)據(jù),擴(kuò)展長尾知識技能,以更好地為用戶服務(wù),保障圖書館數(shù)據(jù)監(jiān)管中心的能力。
4結(jié)語
圖書館的數(shù)據(jù)監(jiān)管服務(wù)為其學(xué)科化服務(wù)帶來了新的生命力[18],尤其是長尾數(shù)據(jù)的監(jiān)管,更是其抓住用戶需求的生長點(diǎn)。但這一服務(wù)在國內(nèi)還不夠成熟,監(jiān)管形態(tài)也不夠明晰,這就需要圖書館參與進(jìn)來,在未來服務(wù)中通過更好的實踐應(yīng)用,大膽創(chuàng)新。
參考文獻(xiàn):
[1] 陳錦紅.基于長尾理論的圖書館服務(wù)的深化[J].情報資料工作,2010(5).
[2] 張秋彥.高??茖W(xué)數(shù)據(jù)監(jiān)護(hù)研究[J].情報科學(xué),2013(5).
[3] 趙艷枝.長尾數(shù)據(jù)監(jiān)護(hù)與圖書館的職責(zé)——伊利諾伊香檳大學(xué)圖書館范例研究[J].國家圖書館學(xué)刊,2015(3).
[4] 楊鶴林.數(shù)據(jù)監(jiān)護(hù):美國高校圖書館的新探索[J].大學(xué)圖書館學(xué)報,2011(2).
[5] Digital Curation[EB/OL].[2015-12-29].https://en.wikipedia.org/wiki/Digital_ curation.
[6] 張文彥,武瑞原,于潔.大數(shù)據(jù)時代的圖書館初探[J].圖書與情報,2012(6).
[7] Anna Gold: Short-Term Developments, Long-Term Prospects. Data Curation and Libraries. April 4, 2010.
[8] 謝春枝,燕今偉.國內(nèi)外高校科學(xué)數(shù)據(jù)管理和機(jī)制建設(shè)研究[J].圖書情報工作,2013,57(6).
[9] 陳德容.基于關(guān)聯(lián)數(shù)據(jù)的圖書館數(shù)據(jù)發(fā)布及數(shù)據(jù)服務(wù)[J].圖書館工作與研究,2015(2).
[10] 胡永生,劉穎.基于用戶調(diào)查的高??蒲袛?shù)據(jù)管理需求分析[J].圖書情報工作,2013,57(6).
[11] 范愛紅,Deborah J. Schmidle.學(xué)科服務(wù)發(fā)展趨勢與學(xué)科館員新角色:康奈爾范例研究[J].圖書情報工作,2012,56(5).
[12] Philip Lord, Alison Macdonald, Liz Lyon, etc. From Data Deluge to Data Curation[C].In Proc 3th UK e-Science All Hands Meeting, 2011.
[13] Carole L. Palmer, Melissa H. Cragin, P. Bryan Heidorn, etc. Data Curation for the Long Tail of Science: The Case of Environmental Sciences. JANUARY 2007.
[14] 胡舒莉.圖書館學(xué)五定律與長尾理論[J].圖書館工作與研究,2009(8).
[15] 趙艷枝.科學(xué)研究中的長尾數(shù)據(jù)及其監(jiān)護(hù)[J].情報資料工作,2015(3).
[16] 顏世霞.州理工大學(xué)圖書館數(shù)據(jù)監(jiān)管需求評估項目的啟示和思考[J].醫(yī)學(xué)信息學(xué)雜志,2014,35(12).
[17] 葉蘭.國外圖書館數(shù)據(jù)監(jiān)護(hù)崗位的設(shè)置與需求分析[J].大學(xué)圖書館學(xué)報,2013(5).
[18] 沈婷婷,盧志國.數(shù)據(jù)監(jiān)管在我國高校圖書館的應(yīng)用展望[J].圖書情報工作,2012,56(7).
(責(zé)任編輯:曹高峰)
中圖分類號:G251
文獻(xiàn)標(biāo)識碼:A
文章編號:1006-1525(2016)04-0073-05
作者簡介:江銀鳳,女,助理館員。
收稿日期:2016-01-13
Research on Library Services of Long-tail Data Supervision
JIANG Yin-feng
(Third Military Medical University, Chongqing400038, China)
Abstract:Combining with the long-tail theory in the big data era, this paper discusses the increasing needs of the long-tail data in library service, the urgency of library service involved in data supervision, and the producing form in long-tail data supervision of library. This paper also expounds the application of the long-tail data in library service, including supervision focus shifted, resource long-tail aggregated, intellectual property protected, and service roles transformed to provide the reference for the long-tail data supervision practice in library.
Key words:long-tail data; data supervision; data life cycle