摘 要:大數(shù)據(jù)是高校圖書館中藥館藏內(nèi)容之一,其特征明顯,影響深遠,從大數(shù)據(jù)的內(nèi)涵出發(fā),本文闡述了大數(shù)據(jù)給高校圖書館帶來的新挑戰(zhàn)及新模式,并從不同的側(cè)面分析了大數(shù)據(jù)如何管理才能為讀者提供更好的服務,以達到大數(shù)據(jù)所提出的個性化、智慧化服務需求。
關鍵詞:大數(shù)據(jù);數(shù)據(jù)分析;數(shù)據(jù)描述;數(shù)據(jù)驅(qū)動
1 大數(shù)據(jù)的基本特征
大數(shù)據(jù)具有“海量、高速、易變”的特點,基本特征可用“五大”做簡單概括。
一是數(shù)據(jù)體量大。互聯(lián)網(wǎng)的數(shù)據(jù)、信息量已達到了前所未有的程度,總量每兩年就增加一倍,大數(shù)據(jù)以全面滲透到高校圖書館中,現(xiàn)已成為圖書館館藏資源的重要組成部分。
二是數(shù)據(jù)范圍大。目前,高校圖書館館藏資源早已不單單是文本形式,還包括網(wǎng)絡、微博、視頻、音頻、圖片、郵件等大量電子資源數(shù)據(jù),甚至包括虛擬館藏等多媒體資源。大范圍的數(shù)據(jù)資源,為未來移動圖書館的普及創(chuàng)造了先決條件。
三是數(shù)據(jù)變化大。所謂變化大,是說數(shù)據(jù)資源的類別與形式發(fā)生了巨大變化,許多數(shù)據(jù)從原來的文本數(shù)據(jù)變成了電子數(shù)據(jù),從固態(tài)數(shù)據(jù)變身成了動態(tài)數(shù)據(jù),數(shù)據(jù)種類繁多,給高校圖書館的資源構成帶來了深刻變革。
四是數(shù)據(jù)移動大。由于以網(wǎng)絡平臺為傳輸途徑和服務渠道的移動信息數(shù)據(jù),大多以手機和平板電腦為工具,移動閱讀、移動搜索、移動查詢?nèi)找嬖龆?,醫(yī)用移動設備所產(chǎn)生的交互與交流在不斷加快。大數(shù)據(jù)里很多是實時數(shù)據(jù),客觀上促使圖書館處理數(shù)據(jù)要加速,分析處理應立竿見影。
五是數(shù)據(jù)價值大。很多最有價值、最有用的信息資源往往隱藏在大量的數(shù)據(jù)信息后面。盡管大數(shù)據(jù)能提供大價值,但價值總量并不能和信息總量成正比,因為很多無用信息也包含在大數(shù)據(jù)之中,像大浪淘沙一樣,需過濾和沖洗才能找到“真金”,這恰恰是大數(shù)據(jù)給高校圖書館提出的挑戰(zhàn)。
2 整合資源要靠大數(shù)據(jù)作支撐
信息時代使圖書館具有了大數(shù)據(jù)的特征,作為知識數(shù)據(jù)信息資源的集散地,圖書館應以大數(shù)據(jù)作支撐,為科學研究和科學創(chuàng)新營造良好環(huán)境,提供更多方便。在大數(shù)據(jù)背景下,一個圖書館幾乎可以收集到所有的數(shù)據(jù)資源,但這些資源來自于不同的機構,不同的知識庫,不同的讀者個人,不一定直觀的表現(xiàn)出數(shù)據(jù)本身的意義。不整合這些龐大的數(shù)據(jù),就很難發(fā)揮出大數(shù)據(jù)的重大價值。因此,圖書館必須充分利用機構優(yōu)勢,完成對各類數(shù)據(jù)源的定位和連接,實現(xiàn)數(shù)據(jù)的采集、傳輸與匯集,同時利用各類數(shù)據(jù)資源的特點,逐步建立起數(shù)據(jù)的統(tǒng)一標準,通過對原數(shù)據(jù)的加工、整理和數(shù)據(jù)發(fā)布,建立起以數(shù)據(jù)資源匯集與融合為核心的知識庫,并運用網(wǎng)絡索引方式為讀者提供內(nèi)容豐富、格式統(tǒng)一,結(jié)構清晰的網(wǎng)絡數(shù)據(jù)平臺,進而實現(xiàn)數(shù)據(jù)共享的服務目標。
3 知識挖掘要靠大數(shù)據(jù)作分析
為讀者提供快捷、簡單、易用的資源發(fā)現(xiàn)和獲取,是高校圖書館義不容辭的職責。而現(xiàn)今不斷增長的數(shù)據(jù)共享與大數(shù)據(jù)管理需求,也為高校圖書館挖掘知識,提供高品質(zhì)服務開辟了廣闊天地。經(jīng)驗表明,推薦過濾算法是目前比較普遍又很成功的方法,這種方法以大數(shù)據(jù)的科學分析為前提,用最短的時間幫助讀者,從海量的數(shù)據(jù)中快捷的發(fā)現(xiàn)并獲取最有價值的資源??茖W分析可按類分別展開,如按用戶檢索下載的文獻特征,分析歸納出某個學科,在某個時期讀者最感興趣的主題,靠數(shù)據(jù)關聯(lián),數(shù)據(jù)挖掘,數(shù)據(jù)檢驗分別作出相關分析,回歸分析和量化分析,以滿足讀者的迫切需求。如對科學熱點預測和交叉學科的深入研究,通過展現(xiàn)學者、期刊、會議、文章之間的知識網(wǎng)絡,并依賴大數(shù)據(jù)的有序處理進行學科趨勢分析,為讀者提供最實用的獲取服務。總之,以大數(shù)據(jù)為細節(jié)的知識發(fā)現(xiàn)分析,是保證大數(shù)據(jù)增值的有效手段之一。
4 實用信息靠大數(shù)據(jù)做描述
由于大數(shù)據(jù)具有數(shù)量大、類型多、變化快的特性,為方便讀者快速獲取最有價值的實用信息,高校圖書館不僅要對數(shù)據(jù)做深入分析、歸類,而且更需要對數(shù)據(jù)做出準確的定位和描述,以幫助讀者從大數(shù)據(jù)中發(fā)現(xiàn)科學規(guī)律、經(jīng)濟規(guī)律和社會規(guī)律,這些規(guī)律的發(fā)現(xiàn)對讀者來說就是最實用的信息,也是最有價值的潛在資源。因此,高校圖書館應依靠對大數(shù)據(jù)的準確描述,為讀者提供一種全新的服務模式。所謂對大數(shù)據(jù)的準確描述,是指對大數(shù)據(jù)進行技術處理的手段或方法,達到更有效地組織、分析及利用信息的目的。當前,在高校圖書館比較推崇的有效方法便是信息可視化。這種方法對有效組織、揭示、掌握、利用信息作用十分明顯??梢暬蔀樽x者提供一個方便、易用的知識環(huán)境。主題可視化,有利于描述檢索結(jié)果和檢索結(jié)果之間的關系;數(shù)據(jù)可視化,有利于描述潛藏的知識價值所在;時間分布可視化,有利于描述知識領域的發(fā)展趨勢及走向;作者合作關系可視化,有利描述知識領域的結(jié)構與屬性。
5 智慧服務靠大數(shù)據(jù)做驅(qū)動
大數(shù)據(jù)已滲透到圖書館的信息資源中,對讀者的吸引力也將愈來愈大。大數(shù)據(jù)服務技術將成為讀者與圖書館共同關注的熱點。隨著讀者對知識需求的轉(zhuǎn)變,個性化需求將被提升到突出位置,同時滿足個性化需求也必將列入圖書館工作的重點之中。個性化需求實質(zhì)上就是讀者對知識信息使用行為習慣及對信息的特定需求。要滿足個性化需求,圖書館就要在分析、預測讀者個體信息需求的基礎上,主動向所有讀者提供其可能需求但又無法及時獲取的信息資源。因為大數(shù)據(jù)的價值是隱藏在海量數(shù)據(jù)之后的,其規(guī)模龐大,變化不定,易給讀者帶來無所適從的困惑。所以,圖書館應憑借組織和專業(yè)優(yōu)勢,靠大數(shù)據(jù)驅(qū)動為讀者提供智慧服務。因為圖書館有大數(shù)據(jù)存在而掌握著大量的讀者行為信息數(shù)據(jù)。如讀者查詢書目產(chǎn)生的日志信息數(shù)據(jù),讀者借還書產(chǎn)生的流通數(shù)據(jù),讀者瀏覽下載電子資源產(chǎn)生的數(shù)據(jù),用戶訪問產(chǎn)生的流量數(shù)據(jù),以及各種媒體、網(wǎng)絡產(chǎn)生的流通數(shù)據(jù),利用這些數(shù)據(jù),圖書館一方面可以了解讀者的個人信息,另一方面還能發(fā)現(xiàn)讀者帶有規(guī)律性的需求,進而把握讀者行為,做到定位準確,預測科學,使服務更貼近實際、更貼近讀者。
參考文獻:
[1]朱靜薇,李紅艷.大數(shù)據(jù)時代下圖書館的挑戰(zhàn)及其應對策略[J].現(xiàn)代情報,2013.5.
[2]胡海鷹.大數(shù)據(jù)趨勢下數(shù)字圖書館的服務創(chuàng)新策略[J].圖書館工作與研究,218期.