張 穎 / 重慶師范大學涉外商貿(mào)學院
淺談圖書館如何簡單應用大數(shù)據(jù)特性
張 穎 / 重慶師范大學涉外商貿(mào)學院
隨著現(xiàn)代社會和科學技術的發(fā)展,以及大數(shù)據(jù)的概念出現(xiàn)以后,大數(shù)據(jù)已經(jīng)漸漸融入到我們生活中的各個領域,正改變著人們的生活方式。圖書館作為文獻信息中心,更應該接受和適應這種變化,并且利用大數(shù)據(jù)的特性進行發(fā)展和改變,來突出圖書館的特點和職能。
圖書館;大數(shù)據(jù);特性;簡單應用
“大數(shù)據(jù)”(Big data)研究機構Gartner給出了這樣的定義?!按髷?shù)據(jù)”是需要新的處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力,用來適應海量的、高增長率和多樣化的信息資產(chǎn)。對于大數(shù)據(jù)這個概念大家并不陌生。
大數(shù)據(jù)有四特性:
1.大量
2.高速
3.多樣性
4.低價值密度
隨著社會和科技的發(fā)展,大數(shù)據(jù)已經(jīng)融入到我們的生活中的各個領域。圖書館擔負著教學和科研服務的雙重任務,是培養(yǎng)人才和開展科學研究的重要基地,不僅要更好的融入當今社會的大數(shù)據(jù)時代,更應該更好的應用大數(shù)據(jù)的特性為廣大讀者服務。
首先大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)相比較,最明顯是特點就是在于大數(shù)據(jù)的信息量巨大。
現(xiàn)在的圖書館已經(jīng)不再是只用來存放紙質(zhì)載體圖書的建筑物,它還包括有電子資源以及各種不同形式、不同載體的信息和資源,圖書館的功能和內(nèi)容正在發(fā)生轉變。傳統(tǒng)紙質(zhì)圖書載體能容納的內(nèi)容相對于大數(shù)據(jù)大量的概念來說已經(jīng)不值得一提。而隨著現(xiàn)代科技發(fā)展,出現(xiàn)的電子圖書的信息量也是不能與大數(shù)據(jù)相比的。
原來所說的電子圖書和數(shù)字資源一般都指存儲于圖書館內(nèi)的本地數(shù)據(jù)庫中存儲的資源。一般的電子圖書和數(shù)字資源具有容量遠遠大于傳統(tǒng)紙質(zhì)載體圖書,并且具有使用和檢索都比紙質(zhì)載體圖書來的更為方便和快捷等優(yōu)勢。但在大數(shù)據(jù)環(huán)境下,使我們的這一概念發(fā)生了翻天覆地的變化。大數(shù)據(jù)的應用方式,在理論上可使圖書館的容量無限擴大。
大數(shù)據(jù)即將大量數(shù)據(jù)通過互聯(lián)網(wǎng)聚集到某個特定點,也可以看成是把互聯(lián)網(wǎng)上的所有數(shù)據(jù)集中在某一個特定數(shù)據(jù)庫中,這個特定點或特定數(shù)據(jù)庫存在于互聯(lián)網(wǎng)中。事實上我們所說的特定點或者特定數(shù)據(jù)庫只是把互聯(lián)網(wǎng)中各個不同的數(shù)據(jù)庫做成開放性數(shù)據(jù)庫,讓各個數(shù)據(jù)庫之間進行相互通訊,而形成的一個整體數(shù)據(jù)庫。
因此,圖書館也可以鏈接并使用這一特定的整體的數(shù)據(jù)庫。通過此鏈接,不僅可以無限擴大本館自身的館藏資源,還能使本館資源得到開放,更加有效充分的利用館藏資源,并實現(xiàn)數(shù)據(jù)交流和資源共享。
大數(shù)據(jù)和傳統(tǒng)數(shù)據(jù)最大的區(qū)別在于大數(shù)據(jù)的高速特性,它對于數(shù)據(jù)處理的能力要求必須非常出色。
大數(shù)據(jù)在進行數(shù)據(jù)處理的時候,既能對數(shù)據(jù)進行流處理,也同時能具備對數(shù)據(jù)進行批處理的能力。也就是說,大數(shù)據(jù)處理要求在連續(xù)不斷處理數(shù)據(jù)的同時,能夠?qū)ν蝗缙鋪淼呐繑?shù)據(jù)進行計算和處理。
大數(shù)據(jù)的高速運行,要求數(shù)據(jù)有時效性。隨著時間推移,數(shù)據(jù)的價值會折舊,不同年齡階段的數(shù)據(jù)具有不同的價值,如期刊類,報紙類。這就要求圖書館及時更新其館藏。好在大數(shù)據(jù)時代的資源和數(shù)據(jù)能夠互相連接,彌補了部分館藏和資源不能高速運行更新的缺點。
從數(shù)據(jù)開發(fā)來看,圖書館存儲了大量的數(shù)據(jù)和資源。當這些數(shù)據(jù)和資源被聚集到一起時,會形成數(shù)據(jù)和資源的“礦山”,那么“挖礦”的效率就要求非常高,大數(shù)據(jù)高速運行就成了“挖礦”的優(yōu)勢。
在圖書檢索上,大數(shù)據(jù)的高速運行查找能夠快速、精準的定位每一本圖書的位置。對于不熟悉圖書分類法的讀者來說,利用大數(shù)據(jù)進行圖書資料的查找和檢索無疑是最方便快捷和準確的。
大數(shù)據(jù)的數(shù)據(jù)來源的多樣性,這是傳統(tǒng)數(shù)據(jù)做不到的。
對于圖書館來說,產(chǎn)生數(shù)據(jù)的方式多種多樣,有日常的統(tǒng)計數(shù)據(jù)報表,有人工借還和自助借還數(shù)據(jù),有讀者檢索圖書產(chǎn)生的數(shù)據(jù),有使用網(wǎng)絡圖書館產(chǎn)生的點擊量、瀏覽量等多種數(shù)據(jù)來源??梢钥闯鲎x者自身也是數(shù)據(jù)的創(chuàng)造者。
在大數(shù)據(jù)環(huán)境下,圖書館通過記錄、收集并保存產(chǎn)生的一切數(shù)據(jù),待數(shù)據(jù)量達到一定規(guī)模的時候,通過對多樣數(shù)據(jù)的各種提煉和分析,了解讀者需求,更好的提供多樣化的資源和優(yōu)質(zhì)的服務。
通過分析讀者的閱讀需求等數(shù)據(jù),可幫助圖書館優(yōu)化自身的館藏結構,幫助圖書館紙質(zhì)圖書館藏的剔舊、電子資源的購買和更新等工作更科學的進行。
大數(shù)據(jù)的低價值密度是指數(shù)據(jù)的真實性。
大數(shù)據(jù)追求的是數(shù)據(jù)的高質(zhì)量,大數(shù)據(jù)的基本在于為決策提供幫助,因此大數(shù)據(jù)必須擁有絕對的真實性。
從來源上分析,傳統(tǒng)數(shù)據(jù)的來源是從宏觀上采集的。數(shù)據(jù)的采集有原則性,有規(guī)律,采集的對象有階段性有針對性,或者直接是進行抽樣采集的。傳統(tǒng)數(shù)據(jù)的采集方式?jīng)Q定了傳統(tǒng)數(shù)據(jù)在真實性上會有所欠缺。
大數(shù)據(jù)的采集方法與傳統(tǒng)數(shù)據(jù)迥異。大數(shù)據(jù)的數(shù)據(jù)采集方式是從微觀采集,它進行的是個體采集,每個個體都有自己單獨的數(shù)據(jù)集合,也是產(chǎn)生數(shù)據(jù)的來源。大數(shù)據(jù)對于數(shù)據(jù)的采集是沒有標準的,它的采集方法源于對個體的行為與現(xiàn)象記錄。通過對大量真實數(shù)據(jù)進行提煉、分析和總結出來的有用數(shù)據(jù),其真實性是毋庸置疑的。
圖書館應用低價值密度這一特性,可以幫助圖書館對文獻進行開發(fā)。因為圖書館所提供的文獻、資源、信息等必須具有權威性和真實性。以大數(shù)據(jù)為基礎的參考信息作為文獻開發(fā)依據(jù)具備了真實性的原則。
大數(shù)據(jù)能真實的分析讀者使用圖書館的習慣和讀者的讀書習慣。通過記錄和分析讀者的閱讀傾向的數(shù)據(jù)和讀者使用館舍的數(shù)據(jù)等等,能真實分析出哪些是讀者使用的重點資源,哪些是讀者不常使用的次要資源。通過對讀者的閱讀傾向的數(shù)據(jù)進行記錄和分析,可幫助圖書館加強對讀者重點使用的資源的建設。而對讀者使用館舍情況的記錄和分析,可以對圖書館館舍進行科學的改造和布置,讓讀者使用圖書館更感舒適。
大數(shù)據(jù)真實的記錄和分析讀者閱讀和使用圖書館的各種數(shù)據(jù),可以引導讀者進行閱讀。挑選讀者重點使用的資源設立專門的閱讀區(qū)域,可在設立的閱讀區(qū)內(nèi)進行與重點資源的相關參考內(nèi)容的引導和推薦工作,方便讀者更好更有效的使用圖書館資源。
通過大數(shù)據(jù)對讀者數(shù)據(jù)的捕捉,圖書館能提供更優(yōu)質(zhì)的服務。建立數(shù)據(jù),統(tǒng)計數(shù)據(jù)和應用數(shù)據(jù),可使圖書館更具有競爭力。有大數(shù)據(jù)的真實為支撐的基礎上,圖書館在現(xiàn)有基礎上,能更好的優(yōu)化和深化服務。
大數(shù)據(jù)的四個特性,并不一定是獨立的,在很多方面,這四個特性都是融會貫通在一起的。應用其特性并不是只會用到其中的一個特性。圖書館對大數(shù)據(jù)特性進行合理的應用,能更好的建設發(fā)展自身,適應和滿足社會的需求。
[1]李恬.大數(shù)據(jù)理念與圖書館大數(shù)據(jù)[J].新世紀圖書館,2014,(6):24-27.
[2]韓翠峰.大數(shù)據(jù)帶給圖書館的影響與挑戰(zhàn)[J].圖書情報,2012,(5)37-40.
[3]黃馥妃.大數(shù)據(jù)時代高校圖書館個性化服務研究[J].文化視野,2016.