胡家磊 孫婷婷
摘 要: 大數(shù)據(jù)的到來為圖書館的建設(shè)帶來了新的機遇與挑戰(zhàn),如何建立以大數(shù)據(jù)支撐的圖書館個性服務(wù),文章對此問題進行了研究。
關(guān)鍵詞: 大數(shù)據(jù) 圖書館 應(yīng)用
1.大數(shù)據(jù)的概述
大數(shù)據(jù)的概念起源于阿爾文·托夫勒在《第三次浪潮》中提出“大數(shù)據(jù)”一詞。直到最近幾年,由世界著名的咨詢公司麥肯錫正式向世界提出“我們的大數(shù)據(jù)時代已經(jīng)來臨了”。政府與信息行業(yè)迅速以最高熱情投入研究過程中。匯聚各種知識與信息的圖書館集合了信息新技術(shù)和新理念的前沿,當然“大數(shù)據(jù)”在圖書館亦是如此。在美國等發(fā)達國家,大數(shù)據(jù)已經(jīng)充分被應(yīng)用在圖書館等重要的領(lǐng)域中。
雖然大數(shù)據(jù)的提出已經(jīng)有段時間,但是學(xué)術(shù)界至今對大數(shù)據(jù)還沒能達成統(tǒng)一意見。對大數(shù)據(jù)的研究可以從以下方面進行:一是大數(shù)據(jù)是一個技術(shù)領(lǐng)域,其包括對數(shù)據(jù)的采集、保存、加工、分析、挖掘及對應(yīng)用領(lǐng)域未來的預(yù)測和反饋結(jié)果。二是大數(shù)據(jù)是一種思維模式,認為在大量的已公開信息中,分析數(shù)據(jù)之間的內(nèi)在聯(lián)系,可以從紛繁復(fù)雜的信息中找到人們亟待解決問題的答案。三是大數(shù)據(jù)是一種資源,是一種信息多樣化、增長速率快、多樣化的信息資源,所以處理大數(shù)據(jù)需要新的處理模式。
大數(shù)據(jù)中的“大”比不是單指數(shù)據(jù)量的條目多、數(shù)據(jù)包數(shù)量多就是大,而是指在當今這個信息多元化的世界中,對某一對象的描述需要多方面的完整描述。在這一描述的過程中有時間和空間上的多維度全方位的描述?!皵?shù)”指的是使用數(shù)據(jù)將對象具現(xiàn)化,只有將對象數(shù)據(jù)化之后才可以被計算機分析統(tǒng)計?!皳?jù)”為證據(jù),將現(xiàn)有數(shù)據(jù)中隱藏的預(yù)見性信息具現(xiàn)化。
2.圖書館在大數(shù)據(jù)下的發(fā)展機遇
2.1大數(shù)據(jù)為圖書館注入新的血液。在科技信息化時代,所有事物均可以數(shù)據(jù)化,事物的產(chǎn)生、發(fā)展、變化、滅亡都可以產(chǎn)生出大量數(shù)據(jù),甚至這些變化的數(shù)據(jù)可以達到海量。信息的產(chǎn)生存在于各行各業(yè)中,每時每刻都有新的數(shù)據(jù)產(chǎn)生。如個人、科研、社會事物都能產(chǎn)生出巨量數(shù)據(jù)。這些數(shù)據(jù)的產(chǎn)生來源于社會活動或科研活動,與人類的生活息息相關(guān),同時也關(guān)系著社會、經(jīng)濟、軍事、科研等一系列相關(guān)事物。從這些數(shù)據(jù)中開發(fā)出并利用其中有用的數(shù)據(jù)可以對社會的進步與人類的生活產(chǎn)生極大的好處。圖書館作為數(shù)據(jù)的集中地,對收集這些大多數(shù)都是免費的數(shù)據(jù)有著先天的優(yōu)勢,這些數(shù)據(jù)對圖書館也是豐富的館藏資源,可以極大地豐富圖書館的現(xiàn)存數(shù)據(jù)量,同時可以為社會科研提供大數(shù)據(jù)源和挖掘數(shù)據(jù)價值;圖書館可以利用這些數(shù)據(jù)源中的信息分析用戶需求,指導(dǎo)圖書館的信息建設(shè)、提高服務(wù)質(zhì)量、擴大服務(wù)范圍。
2.2大數(shù)據(jù)技術(shù)促使圖書館服務(wù)能力得以可持續(xù)發(fā)展。在信息技術(shù)高速發(fā)展的今天,傳統(tǒng)的圖書館服務(wù)平臺已經(jīng)無法完全滿足用戶的需求,同時傳統(tǒng)的服務(wù)模式和傳統(tǒng)的IT架構(gòu)也無法適應(yīng)數(shù)據(jù)量日益龐大的服務(wù)要求。因此,圖書館需要應(yīng)用以大數(shù)據(jù)支撐的新型服務(wù)模式,不僅提供圖書館傳統(tǒng)的數(shù)據(jù)獲取、傳遞和存儲,更實現(xiàn)數(shù)據(jù)挖掘的新技術(shù),對數(shù)字信息資源進行更高層次的挖掘,建立更加智能的知識服務(wù)引擎。將學(xué)術(shù)搜索和資源搜索引擎、后臺信息資源推薦引擎、知識實體服務(wù)引擎、使用者數(shù)據(jù)信息需求分析引擎及多媒體數(shù)據(jù)獲取、存儲、傳遞、分析預(yù)測引擎等。
在存儲數(shù)據(jù)方面,圖書館坐擁論文數(shù)據(jù)庫資源、期刊報紙等媒體資源、讀者的歷史借閱和檢索記錄、瀏覽者的個人信息等資源,在平日的工作中可以積累大量與社會經(jīng)濟文化息息相關(guān)的數(shù)據(jù)資源。在傳統(tǒng)模式的服務(wù)下,這些數(shù)據(jù)在使用后就會被認為是無用的數(shù)據(jù),被作為數(shù)據(jù)垃圾清理掉。但從大數(shù)據(jù)的新服務(wù)模式下看,這些被遺忘、沉睡、丟棄的垃圾數(shù)據(jù)可以產(chǎn)生出巨大的價值,產(chǎn)生出驚人的能量。例如,每個人都有興趣愛好,在日常讀書時就能反映出對某一方面的喜愛,那么在圖書館的檢索記錄就能充分反映出一位讀者的個性愛好。有這么一部《大衛(wèi)·貝克漢姆》的圖書,就是從反向操作,對讀者的瀏覽歷史記錄進行數(shù)據(jù)挖掘,為特定讀者群體“私人定制”圖書。經(jīng)過總結(jié)認識發(fā)現(xiàn),數(shù)據(jù)對圖書館的戰(zhàn)略性作用,并隨著大數(shù)據(jù)感念逐漸進入人們的生活。圖書館工作人員更加清晰地認識到大數(shù)據(jù)是圖書館的戰(zhàn)略資源,得數(shù)據(jù)者得天下,同時對歷史數(shù)據(jù)進行挖掘,觀察數(shù)據(jù)產(chǎn)生的規(guī)律預(yù)測未來。大力收集各類多維度數(shù)據(jù);積極進行深度數(shù)據(jù)挖掘,為社會上的數(shù)據(jù)供應(yīng)商、出版社和企業(yè)等不同群體提供信息資源增值服務(wù),實現(xiàn)數(shù)據(jù)共享產(chǎn)生聯(lián)盟,展開與供應(yīng)商、出版社和企業(yè)的合作。拓寬圖書館的業(yè)務(wù)基礎(chǔ),提高服務(wù)質(zhì)量,實現(xiàn)圖書館的可持續(xù)發(fā)展。
3.大數(shù)據(jù)下圖書館服務(wù)的新發(fā)展
3.1增加多維度數(shù)據(jù)資源的采集,拓展圖書館的數(shù)字資源。圖書館作為人類文明的記憶地,肩負著保護人類文明的重要作用。大數(shù)據(jù)是人類文明的重要體現(xiàn),尤其是其中的半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。這些數(shù)據(jù)恰是圖書館提供細節(jié)服務(wù)不可或缺的資源。例如在中國和美國都有類似于國家記憶的項目,用來收集國家歷史文化的特藏。隨著大數(shù)據(jù)產(chǎn)業(yè)化發(fā)展,對于一般的圖書館而言,沒必要收集所有數(shù)據(jù)存儲,這樣只能造成數(shù)據(jù)的冗余。一般性圖書館只收集兩類資源,一是科研資源性數(shù)據(jù),二是在圖書館新產(chǎn)生的RFID數(shù)據(jù)。
3.2植入科研過程。大數(shù)據(jù)環(huán)境下,科學(xué)研究進入了一個新的歷史階段。計算機圖靈獎得主提出了以第四范式的協(xié)同化、數(shù)據(jù)化、網(wǎng)絡(luò)化為主要特征的密集型科研。其中尤以大數(shù)據(jù)支撐的數(shù)據(jù)化最重要。通過數(shù)字化的交互管理數(shù)據(jù),對海量的科研數(shù)據(jù)進行分析挖掘融匯,幫助科研工作者更加準確地得到預(yù)期結(jié)果。
3.3更加精準化的服務(wù)。圖書館的個性化服務(wù)一直是圖書館追求的目標和發(fā)展方向,也是圖書館持續(xù)發(fā)展的重要保證。在知識獲取日益方便的今天,圖書館已經(jīng)不是獲取知識的唯一途徑,這就促使圖書館服務(wù)需要更加個性化,為每一位讀者提供更好的知識獲取體驗,為用戶提供滿意的可增值的信息服務(wù)。通過對用戶的信息行為的分析,清晰把握用戶的興趣、意愿及偏好和知識應(yīng)用能力,對用戶的信息需求進行預(yù)測,為用戶提供跟蹤服務(wù)、知識關(guān)聯(lián)服務(wù)等,建立以讀者為核心的知識服務(wù)體系。
服務(wù)是圖書館的核心和靈魂,大數(shù)據(jù)的到來為圖書館注入了新的活力,帶來了新的技術(shù)與思想及豐富的數(shù)字資源,通過大數(shù)據(jù)一定能建設(shè)出更加出色的圖書館。
參考文獻:
[1]韋曉凱.大數(shù)據(jù)時代高校圖書館工作思考[J].河北科技圖苑,2014(1):54-56.
[2]維克爾·邁爾—舍恩伯格,肯尼思·庫克耶.大數(shù)據(jù)時代[M].浙江:浙江人民出版社,2013:107.
[3]喻國明.大數(shù)據(jù)的價值及分析技術(shù)的關(guān)鍵[J].新聞與寫作,2014(4):1.
[4]樊偉紅,等.圖書館需要怎樣的“大數(shù)據(jù)”[J].圖書館雜志,2012(11):63-68.