鄭 艷
(武漢職業(yè)技術(shù)學(xué)院,湖北 武漢 430074)
在互聯(lián)網(wǎng)信息時(shí)代,現(xiàn)代網(wǎng)絡(luò)科技的迅猛發(fā)展助力圖書(shū)館行業(yè)發(fā)生了巨大的變革,轉(zhuǎn)變了傳統(tǒng)圖書(shū)館的構(gòu)成模式、閱讀渠道,也隨之改變了圖書(shū)館的管理與服務(wù)方式。盡管從大數(shù)據(jù)技術(shù)應(yīng)用層面來(lái)看,現(xiàn)代圖書(shū)館在資源獲取、圖書(shū)內(nèi)容、閱讀服務(wù)等方面顛覆了人們對(duì)原有圖書(shū)館的認(rèn)知,然而從社會(huì)地位性、認(rèn)可度方面來(lái)看卻不及傳統(tǒng)圖書(shū)館時(shí)期。究其原因,主要還是信息化的便利性使得讀者改變了傳統(tǒng)的閱讀方式,很多讀者不再往返于圖書(shū)館耗時(shí)耗力獲取資料,這也成為現(xiàn)代圖書(shū)館在轉(zhuǎn)型期發(fā)展的陣痛,我國(guó)圖書(shū)館行業(yè)正面臨著重大的機(jī)遇和挑戰(zhàn)[1]。因此,如何在大數(shù)據(jù)時(shí)代,利用網(wǎng)絡(luò)科技的力量獲得成功轉(zhuǎn)型、重新得到讀者青睞,現(xiàn)已成為圖書(shū)館行業(yè)的重要使命。
在大數(shù)據(jù)時(shí)代各行各業(yè)都與數(shù)據(jù)掛鉤,“大數(shù)據(jù)”這個(gè)名詞已經(jīng)膾炙人口,如今社會(huì)企業(yè)、醫(yī)療機(jī)構(gòu)、高等院校、金融領(lǐng)域等都在分析使用大數(shù)據(jù)。大數(shù)據(jù)技術(shù)讓人們從數(shù)據(jù)系統(tǒng)中獲取到更多有深度價(jià)值的信息資源,幫助人們及時(shí)做出重大決策,這也對(duì)大數(shù)據(jù)研究提供了重要依據(jù)。鑒于存儲(chǔ)、分析大數(shù)據(jù)所需的軟硬件成本較低而實(shí)用性很強(qiáng),這也就使得越來(lái)越多的行業(yè)對(duì)大數(shù)據(jù)產(chǎn)生了興趣,傳統(tǒng)圖書(shū)館行業(yè)更要在逆境中求生存、化阻力為動(dòng)力,利用大數(shù)據(jù)技術(shù)轉(zhuǎn)變管理及服務(wù)模式。在現(xiàn)代圖書(shū)館管理中,大數(shù)據(jù)技術(shù)能夠?qū)D書(shū)館數(shù)據(jù)轉(zhuǎn)化為信息資源,為讀者提供個(gè)性化服務(wù)。因此,當(dāng)前大量的大數(shù)據(jù)研究都在分析圖書(shū)館大數(shù)據(jù)的應(yīng)用問(wèn)題,力求通過(guò)大數(shù)據(jù)技術(shù)優(yōu)化圖書(shū)館工作效率及服務(wù)品質(zhì)。在大數(shù)據(jù)背景下,現(xiàn)代圖書(shū)館數(shù)據(jù)庫(kù)具備以下特點(diǎn):
從圖書(shū)館表面管理來(lái)看,圖書(shū)館中的各類圖書(shū)、雜志、刊物等數(shù)據(jù)組織井井有條,讀者可以通過(guò)類別查詢所需內(nèi)容;然而針對(duì)存儲(chǔ)的圖書(shū)研究數(shù)據(jù)卻不盡人意。通常大部分圖書(shū)館的數(shù)據(jù)較為混亂,數(shù)據(jù)研究者慣于使用自我認(rèn)知來(lái)分類組織數(shù)據(jù),這些數(shù)據(jù)通常經(jīng)項(xiàng)目管理,而項(xiàng)目完成了數(shù)據(jù)也就受到封存。
數(shù)據(jù)研究者在組織數(shù)據(jù)時(shí)沒(méi)有規(guī)范格式標(biāo)準(zhǔn),盡管有些圖書(shū)學(xué)科或領(lǐng)域已創(chuàng)建數(shù)據(jù)標(biāo)準(zhǔn),然而大部分學(xué)科往往都缺少規(guī)范化,尤其是政治、社會(huì)研究這類集中的數(shù)據(jù)庫(kù)。此外,數(shù)據(jù)格式也缺乏統(tǒng)一性,數(shù)據(jù)研究者慣于用自己的格式對(duì)數(shù)據(jù)進(jìn)行收集,即便是同一個(gè)數(shù)據(jù)研究者,不同數(shù)據(jù)格式也會(huì)用于不同項(xiàng)目,這就給收集數(shù)據(jù)帶來(lái)很大阻力[2]。
圖書(shū)館數(shù)據(jù)庫(kù)中所存儲(chǔ)的數(shù)據(jù)龐大,鑒于圖書(shū)多源異構(gòu)的特征,這個(gè)大數(shù)據(jù)也不同于其他數(shù)據(jù)領(lǐng)域,因此在圖書(shū)館數(shù)據(jù)收集、處理、分析及轉(zhuǎn)換等方面均存在一定問(wèn)題。圖書(shū)館大數(shù)據(jù)要獲得科學(xué)合理應(yīng)用,其應(yīng)用技術(shù)區(qū)別于其他領(lǐng)域,這也正是當(dāng)前圖書(shū)館大數(shù)據(jù)存在的不足之處。
作為圖書(shū)館數(shù)據(jù)分析師,不但要掌握基本的計(jì)算機(jī)和統(tǒng)計(jì)學(xué)技術(shù),同時(shí)必要具備圖書(shū)館管理領(lǐng)域知識(shí)和技能。當(dāng)前,大部分圖書(shū)館之所以在大數(shù)據(jù)技術(shù)方面應(yīng)用不足,主要是專業(yè)人員技術(shù)力量的不足,圖書(shū)館管理人員更需要加強(qiáng)大數(shù)據(jù)信息的管理培訓(xùn),這是一個(gè)循序漸進(jìn)的過(guò)程,絕非靠短期突擊學(xué)習(xí)所能達(dá)成。
在互聯(lián)網(wǎng)信息時(shí)代,大數(shù)據(jù)的挖掘來(lái)源于行業(yè)各個(gè)領(lǐng)域,現(xiàn)在很多行業(yè)并未實(shí)質(zhì)做好大數(shù)據(jù)的研究準(zhǔn)備工作。據(jù)了解,社會(huì)半數(shù)以上的行業(yè)機(jī)構(gòu)因缺少專業(yè)人才、應(yīng)用平臺(tái)而無(wú)法實(shí)現(xiàn)大數(shù)據(jù)的處理及應(yīng)用。然而,圖書(shū)館行業(yè)的大數(shù)據(jù)研究起步甚至更晚,究其原因主要還是基于圖書(shū)館更像是一個(gè)獨(dú)立的組織單位,自成一體與其他行業(yè)的關(guān)聯(lián)性不強(qiáng)。
盡管現(xiàn)在很多人都明白應(yīng)用大數(shù)據(jù)分析的優(yōu)勢(shì),但大數(shù)據(jù)研究還需要一些較大的成本投資,比如高性能的計(jì)算機(jī)服務(wù)系統(tǒng)、分析服務(wù)系統(tǒng)等?;谟行﹫D書(shū)館規(guī)模較小、成本預(yù)算不足,無(wú)法將大數(shù)據(jù)技術(shù)普及到圖書(shū)館實(shí)際管理中;同時(shí)專業(yè)人才成本較高,其所研究數(shù)據(jù)極少能受到充分重視也是問(wèn)題之一。據(jù)了解,當(dāng)前很多圖書(shū)館研究數(shù)據(jù)仍為多年前所產(chǎn)生的,顯然資源數(shù)字化本非一項(xiàng)簡(jiǎn)單工作,還需要耗費(fèi)大量的時(shí)間和精力。
大數(shù)據(jù)要實(shí)現(xiàn)使用功能,必須要經(jīng)過(guò)數(shù)據(jù)收集、存儲(chǔ)、處理、轉(zhuǎn)換等環(huán)節(jié),通過(guò)這些技術(shù)應(yīng)用才能呈現(xiàn)真實(shí)的數(shù)據(jù)信息。圖書(shū)館數(shù)據(jù)庫(kù)中的數(shù)據(jù)類型多且雜,其數(shù)據(jù)表象不同,一些數(shù)據(jù)沒(méi)有數(shù)字化;同時(shí)大量數(shù)據(jù)中還包含了許多錯(cuò)誤、無(wú)意義的數(shù)據(jù),要排除這些無(wú)用數(shù)據(jù)則需要花費(fèi)更多的數(shù)據(jù)處理時(shí)間。鑒于圖書(shū)館數(shù)據(jù)類型、格式的特異性,大數(shù)據(jù)研究者要將其實(shí)現(xiàn)集成必定是一項(xiàng)龐大且困難的工作,很多類型的數(shù)據(jù)看似具備可用性,實(shí)則在通過(guò)處理之后其可用性會(huì)明顯降低;同時(shí)基于數(shù)據(jù)的可訪問(wèn)性,圖書(shū)館數(shù)據(jù)庫(kù)發(fā)生系統(tǒng)入侵的風(fēng)險(xiǎn)問(wèn)題也必須慎重考慮。
眾所周知,傳統(tǒng)圖書(shū)館運(yùn)營(yíng)模式下,讀者首先要確定自己需要哪本或哪個(gè)方面的書(shū)籍,隨之通過(guò)圖書(shū)館查詢系統(tǒng)搜索該書(shū)籍所在館內(nèi)具體位置實(shí)現(xiàn)借閱,或是自行瀏覽圖書(shū)館挑選感興趣的書(shū)籍。但隨著知識(shí)學(xué)科的進(jìn)步發(fā)展,現(xiàn)在的圖書(shū)資源越來(lái)越豐富,此種傳統(tǒng)借閱方式將消耗讀者大量的查找時(shí)間;同時(shí)由于書(shū)籍的多樣性,讀者的選擇困難度更高,亟待通過(guò)技術(shù)行為幫助其解決找書(shū)問(wèn)題,那么大數(shù)據(jù)技術(shù)的優(yōu)勢(shì)就顯現(xiàn)出來(lái)了。圖書(shū)館通過(guò)借閱系統(tǒng)中的個(gè)人借閱信息,應(yīng)用大數(shù)據(jù)技術(shù)分析其近期借閱書(shū)籍的喜好和關(guān)注點(diǎn),繼而以此為依據(jù)給讀者推薦合適的書(shū)籍。如依據(jù)借閱信息判斷讀者喜歡的圖書(shū)類別,通過(guò)借閱時(shí)長(zhǎng)分析讀者的喜好程度。圖書(shū)館管理人員將所有讀者的借閱信息進(jìn)行分類、量化、評(píng)估,再與其他館內(nèi)圖書(shū)進(jìn)行相似計(jì)算,就可以實(shí)現(xiàn)類似書(shū)籍的自動(dòng)推薦,幫助讀者獲取到一些他們可能感興趣但未能觸及的書(shū)籍。
實(shí)現(xiàn)閱讀推廣是發(fā)揮圖書(shū)館服務(wù)的一項(xiàng)重要工作。圖書(shū)館除了優(yōu)選推薦讀物給受眾者,還應(yīng)通過(guò)書(shū)評(píng)為讀者精確推廣閱讀內(nèi)容。圖書(shū)館以引薦指導(dǎo)讀者為目的創(chuàng)建書(shū)評(píng)資源庫(kù),可以邀請(qǐng)一些專業(yè)領(lǐng)域?qū)W者綜合對(duì)館內(nèi)所有藏書(shū)進(jìn)行多方位評(píng)價(jià),將一些精品書(shū)、好書(shū)通過(guò)書(shū)評(píng)方式引薦給讀者。圖書(shū)館還能通過(guò)大數(shù)據(jù)技術(shù)搜集網(wǎng)絡(luò)書(shū)評(píng),獲取一些熱門網(wǎng)上書(shū)店如當(dāng)當(dāng)網(wǎng)、天貓書(shū)城、文軒網(wǎng)等在線書(shū)評(píng),包括圖書(shū)購(gòu)買問(wèn)答區(qū)的評(píng)價(jià)信息,利用大數(shù)據(jù)處理技術(shù)對(duì)這些數(shù)據(jù)進(jìn)行分類、整合再向讀者進(jìn)行推薦,從而為讀者提供閱讀決策意見(jiàn),提高圖書(shū)推薦的精準(zhǔn)性。
行為數(shù)據(jù)分析包括很多內(nèi)容,有讀者的圖書(shū)查詢檢索記錄、借還流通日志、下載資源地址等,這些行為數(shù)據(jù)經(jīng)過(guò)分析可以反饋出讀者群體的閱讀需求、閱讀時(shí)間、閱讀趨向等。圖書(shū)館可以充分利用這些大數(shù)據(jù)為其管理決策做出有效支撐。例如,在采購(gòu)圖書(shū)時(shí),可以通過(guò)大數(shù)據(jù)技術(shù)對(duì)圖書(shū)借閱量進(jìn)行數(shù)據(jù)分析,及時(shí)了解哪些圖書(shū)資源匱乏,進(jìn)行有針對(duì)性的補(bǔ)充;針對(duì)搜索次數(shù)多、預(yù)定借閱多、瀏覽簡(jiǎn)介多、續(xù)借次數(shù)多的書(shū)籍,我們都應(yīng)該增加復(fù)本數(shù)量,以保證讀者的借閱需求。據(jù)實(shí)踐了解,借助大數(shù)據(jù)技術(shù)以讀者意愿驅(qū)動(dòng)采購(gòu),能夠促進(jìn)圖書(shū)借閱率獲得顯著提高。尤其是在高校圖書(shū)館方面,鑒于教學(xué)的時(shí)間規(guī)律性特點(diǎn),高校的圖書(shū)館往往會(huì)有圖書(shū)借閱高峰期,那么借助讀者借閱行為數(shù)據(jù)的分析,就能知悉不同時(shí)間段的圖書(shū)借閱頻率,更有利圖書(shū)館合理安排工作人數(shù),并實(shí)現(xiàn)圖書(shū)館的高效管理和服務(wù)。
鑒于圖書(shū)館數(shù)據(jù)庫(kù)信息的龐大復(fù)雜性,加之互聯(lián)網(wǎng)病毒侵襲、網(wǎng)絡(luò)故障等問(wèn)題均有可能導(dǎo)致圖書(shū)館數(shù)據(jù)庫(kù)系統(tǒng)產(chǎn)生故障、系統(tǒng)崩潰。為提高圖書(shū)館數(shù)據(jù)庫(kù)系統(tǒng)的安全性,盡量減少故障發(fā)生率、減小損失率,對(duì)數(shù)據(jù)庫(kù)進(jìn)行定期維護(hù)是圖書(shū)館管理工作中的一項(xiàng)必要任務(wù)。鑒于當(dāng)前圖書(shū)館信息數(shù)據(jù)海量陡增,需要在傳統(tǒng)圖書(shū)館管理工作思維的基礎(chǔ)上,強(qiáng)化數(shù)據(jù)備份處理功能,在原有冷備份方式上采用網(wǎng)絡(luò)備份新技術(shù),進(jìn)一步提高數(shù)據(jù)備份的效率,降低圖書(shū)館數(shù)據(jù)庫(kù)的故障產(chǎn)生率。
在大數(shù)據(jù)背景下,圖書(shū)館行業(yè)要順應(yīng)時(shí)代發(fā)展需求,充分利用大數(shù)據(jù)及時(shí)實(shí)現(xiàn)數(shù)字化圖書(shū)館的管理與服務(wù),才能在新時(shí)代的大弄潮中占有一席之地。通過(guò)大數(shù)據(jù)技術(shù)的應(yīng)用,改變傳統(tǒng)圖書(shū)館模式、提高圖書(shū)館管理效率、提升知識(shí)服務(wù)層次、提供個(gè)性化服務(wù)需求,以此發(fā)揮出圖書(shū)館的最大最優(yōu)功效。