●許碧文
(杭州圖書(shū)館,杭州310028)
論大數(shù)據(jù)時(shí)代圖書(shū)館服務(wù)的發(fā)展與創(chuàng)新
●許碧文
(杭州圖書(shū)館,杭州310028)
大數(shù)據(jù)時(shí)代;數(shù)據(jù)挖掘;圖書(shū)館服務(wù);知識(shí)服務(wù)
大數(shù)據(jù)時(shí)代,要主動(dòng)應(yīng)對(duì)大數(shù)據(jù)對(duì)傳統(tǒng)圖書(shū)館服務(wù)的沖擊和挑戰(zhàn),重點(diǎn)建設(shè)數(shù)據(jù)資源網(wǎng)絡(luò)體系,打造公共數(shù)據(jù)存儲(chǔ)和服務(wù)中心,深化知識(shí)服務(wù)及增強(qiáng)圖書(shū)館服務(wù)的針對(duì)性和有效性,努力探索大數(shù)據(jù)技術(shù)和觀念的創(chuàng)新及應(yīng)用,切實(shí)促進(jìn)圖書(shū)館服務(wù)的發(fā)展與創(chuàng)新。
大數(shù)據(jù)時(shí)代的到來(lái),必將對(duì)當(dāng)前圖書(shū)館的發(fā)展理念、工作定位、服務(wù)模式等產(chǎn)生巨大沖擊,圖書(shū)館事業(yè)亦將面臨一個(gè)重大抉擇和發(fā)展起點(diǎn)。圖書(shū)館界如何迎接大數(shù)據(jù)帶來(lái)的各種挑戰(zhàn),如何利用大數(shù)據(jù)創(chuàng)新發(fā)展圖書(shū)館服務(wù),如何提升圖書(shū)館在信息技術(shù)革命潮流中的競(jìng)爭(zhēng)力,如何借助大數(shù)據(jù)帶來(lái)的機(jī)遇突圍圖書(shū)館事業(yè)發(fā)展的困境和瓶頸,成為當(dāng)前圖書(shū)館界亟待研究的重要理論和實(shí)踐問(wèn)題。
(1)全面優(yōu)化數(shù)據(jù)資源的收集存儲(chǔ)。過(guò)去,無(wú)論是傳統(tǒng)圖書(shū)館還是數(shù)字圖書(shū)館,主要側(cè)重?cái)?shù)字資源庫(kù)、機(jī)構(gòu)知識(shí)庫(kù)、語(yǔ)義化信息等結(jié)構(gòu)化數(shù)據(jù)的收集和存儲(chǔ),而對(duì)半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)關(guān)注較少。目前世界上非結(jié)構(gòu)化數(shù)據(jù)占比高達(dá)80%以上,如果對(duì)這部分?jǐn)?shù)據(jù)忽視,將意味著對(duì)大部分有價(jià)值的信息視而不見(jiàn)。大數(shù)據(jù)時(shí)代,半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)的收集、存儲(chǔ)和開(kāi)發(fā)運(yùn)用技術(shù)得以突破和迅速發(fā)展。為此,圖書(shū)館數(shù)據(jù)收集存儲(chǔ)中應(yīng)延伸到所有承載人類(lèi)文明記錄的資源,即全媒體資源,要多關(guān)注半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)收集,包括郵件、視頻、微博、頁(yè)面點(diǎn)擊等數(shù)據(jù)。圖書(shū)館可以在服務(wù)中積極運(yùn)用web2.0技術(shù),開(kāi)辟交互式共享平臺(tái),開(kāi)設(shè)用戶互助吧、論壇、社區(qū)等欄目,為館員和用戶、用戶與用戶之間開(kāi)辟實(shí)時(shí)的交流通道,了解讀者的閱讀愛(ài)好和閱讀習(xí)慣。積極通過(guò)射頻識(shí)別(RFⅠD)、門(mén)禁通過(guò)等技術(shù),收集日常用戶的身份關(guān)系、借閱記錄、存儲(chǔ)信息行為、搜索方式、行為痕跡等結(jié)構(gòu)化和非結(jié)構(gòu)化信息。由此,讓圖書(shū)館收集存儲(chǔ)的信息“活起來(lái)”,成為立體化、動(dòng)態(tài)性、關(guān)聯(lián)性的知識(shí)譜系。
(2)聯(lián)通數(shù)據(jù)資源的共享網(wǎng)絡(luò)。大數(shù)據(jù)時(shí)代下,超體量的數(shù)據(jù)迅速增長(zhǎng),單個(gè)圖書(shū)館要對(duì)如此龐大的數(shù)據(jù)群進(jìn)行收集、存儲(chǔ)不僅不可能,也毫無(wú)必要,必須形成協(xié)調(diào)合作網(wǎng)絡(luò)體系,才能真正實(shí)現(xiàn)數(shù)據(jù)的共有共享,提升信息服務(wù)能力。隨著分布式緩存、大規(guī)模并行處理(MPP)數(shù)據(jù)庫(kù)、分布式文件系統(tǒng)、云計(jì)算平臺(tái)、各種NoSQL分布式存儲(chǔ)系統(tǒng)等大數(shù)據(jù)技術(shù)的運(yùn)用,很大程度上加強(qiáng)了數(shù)據(jù)收集、存儲(chǔ)和共享能力,為圖書(shū)館在資源共享網(wǎng)絡(luò)建設(shè)方面提供了巨大的技術(shù)支持和發(fā)展前景。具體說(shuō),圖書(shū)館在推進(jìn)數(shù)據(jù)資源網(wǎng)絡(luò)體系建設(shè)中,首先,深化圖書(shū)館數(shù)字化,把各類(lèi)資源轉(zhuǎn)化為電子數(shù)據(jù),在此基礎(chǔ)上,共同推進(jìn)全國(guó)乃至全世界圖書(shū)館資源共享。雖然我國(guó)目前沒(méi)有任何一所圖書(shū)館占有的數(shù)據(jù)資源達(dá)到了PB級(jí),但全國(guó)圖書(shū)館數(shù)據(jù)資源總量卻是一個(gè)龐大的數(shù)據(jù)集。其次,推進(jìn)與檔案館、博物館、藝術(shù)館等公共機(jī)構(gòu)的資源共享,各部門(mén)應(yīng)充分利用大數(shù)據(jù)時(shí)代提供的技術(shù)支撐,積極轉(zhuǎn)變觀念,理順體制機(jī)制,加強(qiáng)圖書(shū)、檔案、博物館等之間的“一體化”建設(shè)。再者,選擇性地與其他各類(lèi)信息中心合作,信息時(shí)代,各大型信息中心迅速產(chǎn)生,如Google的學(xué)術(shù)搜索、圖書(shū)搜索服務(wù),百度的“百科”、“知道”服務(wù)等,甚至包括商業(yè)中心、社會(huì)服務(wù)中心、娛樂(lè)中心和工作空間等在內(nèi)的信息中心,在數(shù)據(jù)占有、數(shù)據(jù)挖掘和分析中具有重要意義,圖書(shū)館應(yīng)利用大數(shù)據(jù)技術(shù),有選擇性地與其聯(lián)網(wǎng)共享。
(1)搭建政府公共數(shù)據(jù)連接池。大數(shù)據(jù)時(shí)代,政府政務(wù)的數(shù)字化及政務(wù)數(shù)據(jù)的透明化迅速增強(qiáng),政府作為公共數(shù)據(jù)“托管人”,為公眾提供訪問(wèn)數(shù)據(jù)窗口成為不可逆轉(zhuǎn)的潮流。我國(guó)正處于城鎮(zhèn)化高速發(fā)展、民主法治迅速推進(jìn)的轉(zhuǎn)型期,通過(guò)開(kāi)發(fā)政府公共數(shù)據(jù),對(duì)緩解交通擁堵、資源緊缺等問(wèn)題,消除社會(huì)爭(zhēng)端、群體對(duì)抗等矛盾,顯得極為迫切。這也是大數(shù)據(jù)最具潛力的應(yīng)用領(lǐng)域之一。[1]圖書(shū)館作為法定的政府信息公開(kāi)承辦單位,在當(dāng)前管理體制下,就推動(dòng)政府?dāng)?shù)據(jù)公開(kāi)方面可作為的還很有限。但公開(kāi)是一種趨勢(shì),而且也正在不斷推進(jìn)中,圖書(shū)館應(yīng)該在可為的范圍內(nèi),充分利用大數(shù)據(jù)技術(shù),積極搭建政府公共數(shù)據(jù)連接池,不斷推進(jìn)公共數(shù)據(jù)的開(kāi)放。
(2)做科研數(shù)據(jù)監(jiān)護(hù)的引領(lǐng)者。我國(guó)除重大科研項(xiàng)目采取了有規(guī)劃的數(shù)據(jù)管理外,大部分科研數(shù)據(jù)仍處于無(wú)序狀態(tài),這對(duì)于大數(shù)據(jù)時(shí)代下的科研創(chuàng)新將造成無(wú)法估量的損失。圖書(shū)館在數(shù)據(jù)監(jiān)護(hù)工作中所承擔(dān)的職責(zé)包括分析數(shù)據(jù)集合的存儲(chǔ)、數(shù)據(jù)管理規(guī)劃、最佳實(shí)踐經(jīng)驗(yàn)傳播、收集與傳播數(shù)據(jù)集合以及完成數(shù)據(jù)保存標(biāo)準(zhǔn)的制定等。[1]而大數(shù)據(jù)時(shí)代,在超大體量數(shù)據(jù)的收集、存管、共享技術(shù)方面有較大發(fā)展,為圖書(shū)館履行數(shù)據(jù)監(jiān)護(hù)職責(zé),嵌入到科研一線獲取數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行持續(xù)系統(tǒng)性維護(hù),根據(jù)科學(xué)研究需要推送數(shù)據(jù)服務(wù)等方面提供了重要支持。為此,我國(guó)圖書(shū)館特別是高校圖書(shū)館,應(yīng)抓住這一發(fā)展機(jī)遇,創(chuàng)新服務(wù)業(yè)務(wù),提升能力水平,通過(guò)為科研項(xiàng)目提供數(shù)據(jù)監(jiān)護(hù)服務(wù),搶占科研數(shù)據(jù)發(fā)布、存儲(chǔ)、利用和管理的重要陣地,擴(kuò)大圖書(shū)館服務(wù)效益。
3.1 借助數(shù)據(jù)挖掘技術(shù)深化圖書(shū)館的知識(shí)服務(wù)
大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘和數(shù)據(jù)分析,不是傳統(tǒng)意義上的一般性統(tǒng)計(jì)計(jì)算,而是深層次的數(shù)據(jù)整合與挖掘,須廣泛運(yùn)用分布式系統(tǒng)基礎(chǔ)架構(gòu)Hadoop、非關(guān)系型數(shù)據(jù)庫(kù)技術(shù)NoSQL等大數(shù)據(jù)技術(shù),從而高速捕捉、發(fā)現(xiàn)和分析大容量、多類(lèi)型的數(shù)據(jù)并獲得價(jià)值。如何充分利用好積累的或者正在產(chǎn)生的巨量數(shù)據(jù)信息,掌握背后的潛在價(jià)值,將成為大數(shù)據(jù)時(shí)代政府機(jī)構(gòu)、企業(yè)及科研機(jī)構(gòu)等首要關(guān)注的問(wèn)題。在這種強(qiáng)烈的市場(chǎng)需求和發(fā)展趨勢(shì)下,圖書(shū)館的核心能力不在于所擁有的信息資源,而在于具備利用廣泛信息資源為用戶創(chuàng)造有價(jià)值的知識(shí)和能力,圖書(shū)館服務(wù)必須走向知識(shí)服務(wù)、知識(shí)咨詢,并以此作為圖書(shū)工作新的生長(zhǎng)點(diǎn)。[2]但從目前看,我國(guó)圖書(shū)館的知識(shí)服務(wù)還處于初級(jí)階段,主要局限在參考咨詢、信息咨詢等知識(shí)導(dǎo)航、收集及提供等方面,對(duì)于以解決問(wèn)題為導(dǎo)向,提供技術(shù)發(fā)展預(yù)測(cè)、趨勢(shì)分析、宏觀決策咨詢及基于專業(yè)技術(shù)層面的知識(shí)咨詢等服務(wù)模式還有待推進(jìn)。[3]
大數(shù)據(jù)時(shí)代,帶來(lái)了更豐富的數(shù)據(jù)資源和更專業(yè)的數(shù)據(jù)分析技術(shù),形成了新的解決問(wèn)題的思維模式,提供了更廣闊的信息合作視野,[4]為數(shù)據(jù)分析業(yè)務(wù)帶來(lái)了重大變化和支撐,也為知識(shí)服務(wù)向?qū)I(yè)化、個(gè)性化、決策與創(chuàng)新型發(fā)展,帶來(lái)了巨大的發(fā)展機(jī)遇。圖書(shū)館是人類(lèi)社會(huì)的知識(shí)寶庫(kù)和智慧發(fā)源地,充分利用大數(shù)據(jù)的各種技術(shù),迅速轉(zhuǎn)變數(shù)據(jù)處理的范圍、方式、對(duì)象、目的等理念和方式,積極推進(jìn)圖書(shū)館信息服務(wù)等傳統(tǒng)業(yè)務(wù)向數(shù)據(jù)分析、數(shù)據(jù)挖掘方向轉(zhuǎn)移,開(kāi)展更有深度、廣度的知識(shí)服務(wù),把為政府、企業(yè)等做各類(lèi)數(shù)據(jù)分析服務(wù)、數(shù)據(jù)挖掘服務(wù)變?yōu)榇髷?shù)據(jù)時(shí)代圖書(shū)館的常態(tài)服務(wù)內(nèi)容。這將是大數(shù)據(jù)時(shí)代,圖書(shū)館服務(wù)發(fā)展和創(chuàng)新最具挑戰(zhàn)的領(lǐng)域,也將是催生圖書(shū)館服務(wù)創(chuàng)新發(fā)展的新的平臺(tái)和機(jī)遇,更是圖書(shū)館現(xiàn)代服務(wù)的生成及實(shí)現(xiàn)的基本途徑。[5]
3.2 提升圖書(shū)館服務(wù)的針對(duì)性和個(gè)性化
(1)增強(qiáng)閱讀推廣服務(wù)的效果。目前,圖書(shū)館在閱讀推廣方面的工作存在許多不足,特別是可持續(xù)性、實(shí)效性方面亟待提升。據(jù)資料顯示,亞馬遜網(wǎng)站充分利用大數(shù)據(jù)相關(guān)性分析,通過(guò)有效的圖書(shū)推薦使其圖書(shū)銷(xiāo)售量增加三分之一以上。人們之所以閱讀,也是基于推薦的理由。在大數(shù)據(jù)時(shí)代,圖書(shū)館也可以通過(guò)廣泛的數(shù)據(jù)分析,如通過(guò)對(duì)讀者借閱情況、書(shū)籍出版信息、社交網(wǎng)站評(píng)論、經(jīng)濟(jì)社會(huì)發(fā)展?fàn)顩r等各類(lèi)數(shù)據(jù)分析,找出各類(lèi)相關(guān)性,了解特定時(shí)期、特定群體的知識(shí)需求、閱讀薄弱點(diǎn)以及閱讀興奮點(diǎn)和關(guān)注點(diǎn),主動(dòng)創(chuàng)新方法有針對(duì)性地開(kāi)展閱讀推廣工作。不僅可開(kāi)展面上的閱讀推廣,也可開(kāi)展點(diǎn)對(duì)點(diǎn)的閱讀推廣。例如,通過(guò)收集和分析讀者借閱情況、生活閱歷、工作崗位等方面的半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù),總體把握讀者的閱讀習(xí)慣和知識(shí)需求,有針對(duì)性地向其開(kāi)展圖書(shū)推薦、知識(shí)推送等工作,增強(qiáng)閱讀推廣效果。
(2)提升社區(qū)圖書(shū)館、流動(dòng)圖書(shū)館等工作效率。研究表明,當(dāng)前,我國(guó)圖書(shū)館利用率低的一個(gè)重要原因是圖書(shū)館距離用戶太遠(yuǎn),當(dāng)圖書(shū)館與用戶保持合適距離,可有效促進(jìn)公眾對(duì)圖書(shū)館的利用。社區(qū)圖書(shū)館、流動(dòng)圖書(shū)館等是圖書(shū)館深入用戶、親近用戶的有效載體,是圖書(shū)館服務(wù)的“神經(jīng)末梢”,擴(kuò)大了圖書(shū)館輻射范圍,本可以解決這一難題。但現(xiàn)實(shí)效果并不理想,普遍反應(yīng)是“無(wú)法閱讀到合適的、需要的圖書(shū)”。造成這種情況的原因主要是社區(qū)圖書(shū)館、流動(dòng)圖書(shū)館沒(méi)有根據(jù)用戶的需要有針對(duì)性地分派圖書(shū),及時(shí)更新書(shū)籍。大數(shù)據(jù)時(shí)代,可以通過(guò)數(shù)據(jù)分析,把握特定區(qū)域的人群結(jié)構(gòu),判斷他們亟需的圖書(shū)服務(wù),準(zhǔn)確掌握服務(wù)的時(shí)間、內(nèi)容、形式和地點(diǎn)等,大大提高圖書(shū)的利用率,發(fā)揮圖書(shū)館的作用。
(3)打造舒適親和的圖書(shū)館物理空間。隨著網(wǎng)絡(luò)化信息服務(wù)、數(shù)字化圖書(shū)館的發(fā)展,實(shí)體圖書(shū)館作為資料儲(chǔ)存、展示的功能逐漸退化,越來(lái)越成為“身體和靈魂的放松、愉悅空間”。將海量信息的科技體驗(yàn)和美妙空間的藝術(shù)體驗(yàn)融為一體,讓讀者到圖書(shū)館,除完成檢索信息的主要目的之外,還可以學(xué)習(xí)、辦公、開(kāi)會(huì)、交友、參觀、體驗(yàn)、欣賞,甚至是約會(huì)、小憩,將成為實(shí)體圖書(shū)館發(fā)展的一大目標(biāo)。在大數(shù)據(jù)時(shí)代,提升圖書(shū)館資料擺放合理性方面,可以借鑒沃爾瑪“尿布和啤酒”經(jīng)典案例做法,通過(guò)對(duì)讀者進(jìn)出圖書(shū)館的行走路線、取閱書(shū)籍的習(xí)慣、書(shū)籍資料關(guān)聯(lián)性等方面數(shù)據(jù)分析,挖掘出潛在的價(jià)值和判斷,優(yōu)化圖書(shū)資料分布組合及擺放格局,提高圖書(shū)資料的利用率,方便讀者的取閱查找等。在圖書(shū)館空間布局方面,收集讀者對(duì)舒適度、審美、光線等要求方面的數(shù)據(jù),對(duì)家具和設(shè)備的組合性、伸縮性、移動(dòng)性和體驗(yàn)感進(jìn)行優(yōu)化,讓讀者在獲取信息中體驗(yàn)藝術(shù)般的享受。
[1]關(guān)志剛編譯.大數(shù)據(jù)最具潛力的三大應(yīng)用領(lǐng)域[EB/OL].[2013-11-18].http://www.ctocio.com/ bigdata/8293.html.
[2]張曉林.走向知識(shí)服務(wù):尋找新世紀(jì)圖書(shū)情報(bào)工作的生長(zhǎng)點(diǎn)[J].中國(guó)圖書(shū)館學(xué)報(bào),2000(5):30-35.
[3]史海燕.我國(guó)數(shù)字圖書(shū)館知識(shí)服務(wù)模式及實(shí)踐研究[J].現(xiàn)代情報(bào),2010(9):15-18.
[4]王天泥.知識(shí)咨詢:大數(shù)據(jù)時(shí)代圖書(shū)館的知識(shí)服務(wù)增長(zhǎng)點(diǎn)[J].圖書(shū)與情報(bào),2013(2):74-77.
[5]李雪冰,梁杰.圖書(shū)館現(xiàn)代服務(wù)的生成及實(shí)現(xiàn)途徑——基于知識(shí)管理角度[J].圖書(shū)館理論與實(shí)踐,2012(1):10-13.
G254.97
A
1005-8214(2014)12-0019-02
許碧文(1978-),女,碩士,館員,研究方向:圖書(shū)館服務(wù)、圖書(shū)館信息化建設(shè)。
2014-05-26[責(zé)任編輯]李金甌