摘要:本文在大數(shù)據(jù)的時代背景下,探討了大數(shù)據(jù)的基本內(nèi)涵與特征,它給醫(yī)院圖書館信息服務方面帶來的挑戰(zhàn),以及通過對大數(shù)據(jù)在醫(yī)院圖書館信息服務方面的應用,期望能夠為未來的醫(yī)院圖書館信息服務創(chuàng)新體系提供一些參考。
關鍵詞:大數(shù)據(jù);信息服務;圖書館
大數(shù)據(jù)已成為2012年以來的研究熱點。大數(shù)據(jù)被稱為\"碎片中的智慧\",被視為驅(qū)動新一輪技術革命的關鍵力量,它正在顯現(xiàn)出巨大的價值。根據(jù)麥肯錫咨詢公司測算,大數(shù)據(jù)每年可為美國醫(yī)療服務業(yè)節(jié)省3000億美元,使零售業(yè)凈利潤增長60%,幫助制造業(yè)在產(chǎn)品研發(fā)、組裝等環(huán)節(jié)降低50%的成本。美國將大數(shù)據(jù)定義為\"未來的新石油\", 全球500強企業(yè)中90%以上的重要決策都取決于深入的數(shù)據(jù)挖掘和分析。大數(shù)據(jù)已經(jīng)滲透到當今每一個行業(yè)和業(yè)務職能領域,成為重要的生產(chǎn)因素。并隨著近年來互聯(lián)網(wǎng)和信息行業(yè)的發(fā)展而引起人們關注。
本文在大數(shù)據(jù)的時代背景下,探討了大數(shù)據(jù)的基本內(nèi)涵與特征,它給醫(yī)院圖書館帶來的挑戰(zhàn),以及通過對大數(shù)據(jù)在醫(yī)院圖書館信息服務方面的應用,期望能夠為未來的醫(yī)院圖書館信息服務創(chuàng)新體系提供一些參考。
1大數(shù)據(jù)的內(nèi)涵與特征
1.1大數(shù)據(jù)的內(nèi)涵 大數(shù)據(jù)目前還沒有統(tǒng)一的定義。維基百科定義大數(shù)據(jù)為巨量數(shù)據(jù)、海量數(shù)據(jù)、大資料,指的是所涉及的數(shù)據(jù)量規(guī)模巨大到無法通過人工,在合理時間內(nèi)達到截取、管理、處理、并整理成為人類所能解讀的信息。
1.2大數(shù)據(jù)的特征 大數(shù)據(jù)的特征歸納為4個\"V\"。①數(shù)據(jù)體量巨大。從TB級別,躍升到PB級別;②數(shù)據(jù)類型繁多。網(wǎng)絡日志、視頻、圖片、地理位置信息等等。③處理速度快,1秒定律,可從各種類型的數(shù)據(jù)中快速獲得高價值的信息,這一點也是和傳統(tǒng)的數(shù)據(jù)挖掘技術有著本質(zhì)的不同。④只要合理利用數(shù)據(jù)并對其進行正確、準確的分析,將會帶來很高的價值回報。業(yè)界將其歸納為4個\"V\"--Volume(大量)、Variety(多樣)、Velocity(高速)、Value(價值)。
2大數(shù)據(jù)與圖書館
依據(jù)大數(shù)據(jù)定義,單體圖書館數(shù)據(jù)總量雖然還沒有達到PB級,但從圖書館存儲數(shù)據(jù)種類和數(shù)量以及未來發(fā)展趨勢上來說,已經(jīng)初步具備了大數(shù)據(jù)基本特征。圖書館除了館藏的圖書、期刊、論文等紙質(zhì)資源外,還擁有大量的數(shù)據(jù)庫資源、多媒體資源、電子圖書、電子文檔,還有圖書館管理系統(tǒng)信息。此外,伴隨著平板電腦、智能手機等移動設備以及社交網(wǎng)絡的出現(xiàn),移動終端用戶行為和服務等非結(jié)構(gòu)化數(shù)據(jù)量逐年增加[1]。
2010年底,國家圖書館數(shù)字資源已達到480 TB,到\"十二五\"末,國家圖書館數(shù)字資源總量要達到1000 TB,每個省級數(shù)字圖書館可用數(shù)字資源量將達100 TB,每個市級數(shù)字圖書館可用數(shù)字資源量達30 TB,每個縣級數(shù)字圖書館可用數(shù)字資源量達4 TB。文化共享工程將建設\"公共文化數(shù)字資源基礎庫群\",資源總量達到530 TB。
3大數(shù)據(jù)環(huán)境下對醫(yī)院圖書館信息服務的挑戰(zhàn)
當前數(shù)字時代,醫(yī)院數(shù)字圖書館結(jié)構(gòu)化資源內(nèi)容豐富,結(jié)構(gòu)完整,包括電子圖書、電子期刊、電子報紙、數(shù)據(jù)庫、網(wǎng)絡資源在內(nèi)的海量數(shù)字資源。非結(jié)構(gòu)化數(shù)據(jù)如聲音、視頻、音頻、圖片等可視可聽的數(shù)據(jù),因為信息技術原因以及不夠重視而缺乏。圖書館在此結(jié)構(gòu)化資源基礎上盡力實現(xiàn)用戶的最大滿意和最大程度利用。但在大數(shù)據(jù)時代,醫(yī)學信息量以指數(shù)的態(tài)勢增長。要求醫(yī)院圖書館對醫(yī)療專業(yè)部門的支撐越來越強,醫(yī)務工作者沒有足夠的時間和精力查詢相關專業(yè)資訊,這就要求圖書館對醫(yī)學專業(yè)具有較強的支撐能力,能夠在浩如煙海的信息中找到最有效的信息,乃至參與醫(yī)療決策[2]。
4大數(shù)據(jù)環(huán)境下醫(yī)院圖書館信息服務
大數(shù)據(jù)時代要求醫(yī)院圖書館信息服務將向數(shù)據(jù)分析、數(shù)據(jù)挖掘方向轉(zhuǎn)移,利用大量的結(jié)構(gòu)化、非結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)去挖掘讀者行為,預測和分析讀者的興趣和潛在需求,從而主動的為用戶提供個性化、精準化的信息服務。
4.1提供主動的、有針對性服務 醫(yī)院圖書館的服務對象主要可以分為:臨床醫(yī)護人員、醫(yī)技人員、科研人員、行政管理人員和進修生、實習生人員。顯然,各類用戶群對信息的需求差異很大,同一類用戶群中因為層次不同,信息需求也存在較大差異。通過大數(shù)據(jù)平臺的挖掘分析,區(qū)分開用戶群,然后針對不同用戶群開展不同層次的服務。醫(yī)療科研人員的學科專業(yè)性非常明顯,信息需求主要集中在與專業(yè)領域緊密相關的生物醫(yī)學文獻上,不同專業(yè)的用戶需求差異明顯,而相同專業(yè)的用戶具有相近的興趣度,根據(jù)其相似性,可以得出某一時期某一學科的科研熱點,以及該領域的研究進展,實時動態(tài)地為他們提供專屬信息,提高文獻推送效率,使醫(yī)療科研人員更快地洞察最新的科研走向。
4.2提供個性化、精準化服務 在大數(shù)據(jù)時代,用戶面對眾多數(shù)據(jù)資源,深受大數(shù)據(jù)所帶來的困擾,很難方便、快捷、準確地檢索到所需數(shù)據(jù)資料。圖書館可通過大數(shù)據(jù)分析平臺對每個用戶的檢索關鍵詞、瀏覽歷史、下載數(shù)據(jù)、流量數(shù)據(jù)、讀者留言、新書推薦以及其博客、微博、移動圖書館等各種社交媒體產(chǎn)生的交互信息的分析,挖掘每個用戶的隱性信息需求,發(fā)現(xiàn)并預測其信息需求特點以及趨勢,針對每個用戶提供精準的、個性化的信息,以提高每個用戶獲取信息的速度和深度。
5加強大數(shù)據(jù)人才培養(yǎng)
大數(shù)據(jù)時代對醫(yī)院圖書館工作提出了更高的信息服務標準,要求醫(yī)院圖書館不但能夠通過結(jié)構(gòu)化數(shù)據(jù)了解現(xiàn)在醫(yī)療科研人員需要什么服務,也能夠利用非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)深度挖掘預測和分析將來會發(fā)生什么。美國研究圖書館協(xié)會提出,研究數(shù)據(jù)管理是下一代圖書館員的能力之一。研究型生物醫(yī)學專業(yè)圖書館應盡快引進或培養(yǎng)一支大數(shù)據(jù)管理專業(yè)隊伍。當前的任務是如何在現(xiàn)有基礎上,拓寬館員知識面,增強業(yè)務能力,使之成為大數(shù)據(jù)知識服務信息資源的組織者、傳播者、導航者和教育者[3]。
6對用戶隱私的保護
大數(shù)據(jù)收集了用戶的個人信息、搜索歷史、地理位置等大量信息,很可能威脅到用戶的隱私,讓用戶有知情權,個人數(shù)據(jù)保存期限和用途將有用戶自行設置,這樣既解除了用戶的顧慮,圖書館又能合法的利用數(shù)據(jù),在不暴露用戶個人隱私的前提下為醫(yī)療科研人員提供優(yōu)質(zhì)的個性化服務。
7結(jié)論
大數(shù)據(jù)技術將有力推動醫(yī)學信息服務向更深層次和更廣范圍拓展。醫(yī)學圖書館員必須抓住發(fā)展機遇,不斷提升核心競爭力,利用大數(shù)據(jù)創(chuàng)新信息服務,滿足醫(yī)療科研人員日益增長的信息需求。
參考文獻:
[1]王捷.大數(shù)據(jù)時代下圖書館開展信息服務的對策[J].現(xiàn)代情報,2013,33(3):81-83.
[2]宋倩.大數(shù)據(jù)時代醫(yī)院圖書館發(fā)展定位研究[J].價值工程,2014,(18):222-223.
[3]陳銳,馮占英.大數(shù)據(jù)時代醫(yī)學專業(yè)圖書館面臨的挑戰(zhàn)與對策[J].中華醫(yī)學圖書情報雜志,2014,23(1):2-6.
編輯/肖慧