謝 松,朱海東,李小華
(贛南師范大學(xué) 圖書館,江西 贛州 341000)
2012年7月在第六屆上海國(guó)際圖書館論壇上,大數(shù)據(jù)概念第一次被引入了圖書情報(bào)界,為圖書情報(bào)界帶來(lái)了巨大的發(fā)展機(jī)遇,同時(shí)也給信息服務(wù)帶來(lái)了前所未有的挑戰(zhàn)。作為學(xué)??蒲邪l(fā)展的重要支撐部門——高校圖書館,應(yīng)該努力思考如何利用大數(shù)據(jù)技術(shù)優(yōu)勢(shì),并結(jié)合高校圖書館自身的特點(diǎn),重新進(jìn)行自我審視和定位,加強(qiáng)自身資源優(yōu)勢(shì),拓展資源建設(shè)與服務(wù)理念,重視用戶數(shù)據(jù)信息利用行為,從而開創(chuàng)新的服務(wù)空間,謀劃新的發(fā)展之路。
大數(shù)據(jù)的引入需要圖書館從新的角度去分析和重構(gòu)信息數(shù)據(jù),這就給圖書館信息資源的建設(shè)帶來(lái)了新的挑戰(zhàn),下面結(jié)合贛州高校圖書館的現(xiàn)狀來(lái)分析面對(duì)大數(shù)據(jù)沖擊下高校圖書館信息資源建設(shè)的幾點(diǎn)思考和建議。
大數(shù)據(jù)的基本特征體現(xiàn)在4個(gè)“V”:Volume數(shù)據(jù)規(guī)模大;Variety數(shù)據(jù)種類多;Velocity生成速度快;Value價(jià)值密度低。從數(shù)據(jù)的角度來(lái)理解,大數(shù)據(jù)是海量、多源、異構(gòu)、動(dòng)態(tài)的大型數(shù)據(jù)集,其數(shù)據(jù)價(jià)值密度相對(duì)較低,需要進(jìn)行分析處理和數(shù)據(jù)挖掘才能得到對(duì)用戶有用的信息,實(shí)現(xiàn)數(shù)據(jù)價(jià)值,這就要求信息資源的共享及高效利用。贛州因?yàn)榻?jīng)濟(jì)政治方面的原因,以及各高校行政管理本身具有非常大的局限,高校圖書館沒有對(duì)信息數(shù)據(jù)進(jìn)行有效的收集整理和共享,沒有建立起一個(gè)對(duì)高校圖書館資源進(jìn)行統(tǒng)籌、保護(hù)、共享的信息化平臺(tái),因此,當(dāng)前的高校圖書館信息資源依然存在利用率較低的問(wèn)題。
大數(shù)據(jù)的特質(zhì)之一就是生成速度快,海量信息以非??斓乃俣冗M(jìn)行聚集更新,這對(duì)高校圖書館信息資源建設(shè)帶來(lái)了巨大的沖擊。高校圖書館資源建設(shè)遵循一定的流程,比如申報(bào)、審批、采購(gòu)、整合等流程,耗時(shí)費(fèi)力,且需要耗費(fèi)不少的時(shí)間周期,這就使得高校圖書館信息資源建設(shè)的進(jìn)度緩慢,從而影響圖書館信息資源建設(shè)的時(shí)效性。
當(dāng)前贛州高校圖書館信息資源建設(shè)的最重要的制約因素是信息化建設(shè)和管理的專業(yè)人才太少,圖書館專業(yè)人才設(shè)置中,圖書情報(bào)類專業(yè)的人居多,而信息技術(shù)類的人員非常少。因?yàn)樾畔⒓夹g(shù)人才應(yīng)用前景廣闊,大量的專業(yè)人才都流向了一二線城市,或者流向了政府機(jī)關(guān)或高校的教學(xué)科研崗位,留在圖書館的信息類人才幾乎沒有。高校圖書館在培養(yǎng)自己的信息專業(yè)人才或跨學(xué)科復(fù)合型人才方面做得也不好,這就導(dǎo)致了贛州高校圖書館信息專業(yè)人才方面的匱乏。
贛州高校圖書館人才、設(shè)備、資源有限,想要長(zhǎng)足發(fā)展只能整合現(xiàn)有資源,將幾所高校圖書館聯(lián)合起來(lái)建立大數(shù)據(jù)中心,集中資源辦大事。大數(shù)據(jù)中心要解決的是設(shè)備問(wèn)題和標(biāo)準(zhǔn)化問(wèn)題。
2.1.1 要整合現(xiàn)有存儲(chǔ)設(shè)備。大數(shù)據(jù)的特質(zhì)是數(shù)據(jù)規(guī)模大,數(shù)據(jù)生成速度快。各個(gè)高校現(xiàn)有的存儲(chǔ)設(shè)備很難滿足大數(shù)據(jù)存儲(chǔ)及處理的需要。大數(shù)據(jù)中心需要整合升級(jí)高?,F(xiàn)有存儲(chǔ)資源,使其能滿足大數(shù)據(jù)存儲(chǔ)需求。此外,還需要升級(jí)大數(shù)據(jù)服務(wù)器及文件系統(tǒng),使其滿足大數(shù)據(jù)計(jì)算、挖掘和傳輸。
2.1.2 要確定信息系統(tǒng)數(shù)據(jù)標(biāo)準(zhǔn)。大數(shù)據(jù)的特質(zhì)之一就是數(shù)據(jù)種類多,且多為非結(jié)構(gòu)化和非關(guān)系型數(shù)據(jù),這與圖書館傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)大為不同。所以,在建立大數(shù)據(jù)系統(tǒng)之前,要對(duì)收集的數(shù)據(jù)進(jìn)行分析和設(shè)計(jì),建立相應(yīng)的數(shù)據(jù)標(biāo)準(zhǔn),加強(qiáng)對(duì)非結(jié)構(gòu)化信息的收集、加工、存儲(chǔ)和挖掘,使信息數(shù)據(jù)系統(tǒng)實(shí)現(xiàn)標(biāo)準(zhǔn)和智能化。還要對(duì)圖書館現(xiàn)有的信息資源進(jìn)行二次開放及整合,使其潛在價(jià)值和意義被充分利用,實(shí)現(xiàn)圖書館信息資源多元化。
2.1.3 合理選擇和使用大數(shù)據(jù)系統(tǒng)工具。想要搭建高效的大數(shù)據(jù)信息系統(tǒng),選擇合適的、高性能的大數(shù)據(jù)系統(tǒng)工具至關(guān)重要。建立一個(gè)高性能的大數(shù)據(jù)平臺(tái),要從各個(gè)方面綜合考慮,比如經(jīng)費(fèi)、需求、人才、技術(shù)、硬件等。自行開發(fā)系統(tǒng)顯然不可行,那么可以從現(xiàn)有的、比較成熟高效的工具中選擇。Hadoop是一個(gè)很好的選擇,它的核心是HDFS(分布式文件系統(tǒng))和MapReduce(分布式并行編程模型),且具有可靠、高效、成本低、跨平臺(tái)等優(yōu)點(diǎn),并可以部署在廉價(jià)的計(jì)算機(jī)集群中,完成海量的數(shù)據(jù)存儲(chǔ)和計(jì)算。數(shù)據(jù)庫(kù)的選用也比較多,有HBase、Redis、HIve等,各有特色。數(shù)據(jù)可視化工具可以從Easel.ly、Tableau、魔鏡、ECharts等工具中選擇適合需求的軟件。
贛州高校圖書館現(xiàn)有的電子資源種類比較繁雜,有紙質(zhì)圖書的Marc、館藏、借閱數(shù)據(jù),有電子圖書(如超星)資源數(shù)據(jù),有電子期刊(CNKI、萬(wàn)方)資源數(shù)據(jù),有多媒體視頻類的資源數(shù)據(jù),還有很多其他種類的電子資源數(shù)據(jù)及網(wǎng)絡(luò)上一些開源數(shù)據(jù)庫(kù),各個(gè)圖書館還有自建的一些特色數(shù)據(jù)庫(kù)。一些比較著名的數(shù)據(jù)庫(kù)比如CNKI、萬(wàn)方、超星、EBM、人大報(bào)刊,贛州的幾所高校都購(gòu)買了上述幾種數(shù)據(jù)庫(kù)資源,這些資源對(duì)高校師生工作學(xué)習(xí)幫助巨大,但是也造成了資源建設(shè)的重復(fù)投入。如何高效科學(xué)的建設(shè)高校圖書館的信息資源,可以從以下幾個(gè)方面考慮。
2.2.1 幾所高校集中人力物力成立大數(shù)據(jù)中心的前提下,由大數(shù)據(jù)中心統(tǒng)一購(gòu)買這些數(shù)據(jù)資源。幾所高校共享,不僅可以節(jié)省經(jīng)費(fèi),大數(shù)據(jù)中心還可以有效的整合資源,開發(fā)出更好的圖書館服務(wù)平臺(tái)及手機(jī)端移動(dòng)平臺(tái),充分地利用這些數(shù)據(jù)進(jìn)行分析統(tǒng)計(jì),更加科學(xué)、高效地進(jìn)行資源建設(shè),同時(shí)也為讀者提供更加便捷、個(gè)性化的一站式資源檢索和以用戶為導(dǎo)向的精準(zhǔn)服務(wù)。
2.2.2 大數(shù)據(jù)中心可以結(jié)合贛州的歷史風(fēng)貌及經(jīng)濟(jì)發(fā)展特點(diǎn),結(jié)合高校的師資力量及科研水平,積極建立一些特色資源數(shù)據(jù)庫(kù)。比如客家文化資源數(shù)據(jù)、紅色革命老區(qū)數(shù)據(jù)庫(kù)、臍橙種植信息數(shù)據(jù)庫(kù)及有色金屬數(shù)據(jù)庫(kù)等等,為高校師生服務(wù)的同時(shí)也為贛州的經(jīng)濟(jì)建設(shè)貢獻(xiàn)自己的力量。
2.2.3 大數(shù)據(jù)中心及高校圖書館要想提高自身競(jìng)爭(zhēng)力,做好信息資源建設(shè),需要有大量的資源和技術(shù),就要開展跨界合作。比如贛州市政府主導(dǎo)的“贛州數(shù)字經(jīng)濟(jì)發(fā)展規(guī)劃”項(xiàng)目,大數(shù)據(jù)庫(kù)中心可以積極參與進(jìn)去,利用自己的技術(shù)及數(shù)據(jù)優(yōu)勢(shì),更好地為贛州的數(shù)字經(jīng)濟(jì)發(fā)展服務(wù)。
大數(shù)據(jù)技術(shù)在高校圖書館的應(yīng)用,需要圖書館培養(yǎng)一批有圖書情報(bào)專業(yè)知識(shí)背景和掌握大數(shù)據(jù)技術(shù)的復(fù)合型專業(yè)人才。高校圖書館首先要改革人才制度和管理制度,創(chuàng)造適合人才成長(zhǎng)的工作環(huán)境,設(shè)置專門工作崗位及人才培養(yǎng)計(jì)劃。招聘一些具有計(jì)算機(jī)專業(yè)或圖書情報(bào)專業(yè)的年輕人才,然后開展定期和不定期的大數(shù)據(jù)專業(yè)知識(shí)培訓(xùn)課程,使其熟悉、掌握自身學(xué)科以外的專業(yè)知識(shí),樹立大數(shù)據(jù)與自己學(xué)科的交叉領(lǐng)域。同時(shí),圖書館還要積極開展對(duì)外交流學(xué)習(xí),改革崗位管理機(jī)制,增強(qiáng)館員的資源服務(wù)理念,努力為高校圖書館培養(yǎng)大數(shù)據(jù)管理的發(fā)展環(huán)境。
傳統(tǒng)高校圖書館的服務(wù)模式是被動(dòng)式服務(wù),讀者來(lái)圖書館搜索、借閱圖書,圖書館提供借閱服務(wù)。利用大數(shù)據(jù)技術(shù),高校圖書館可以改變被動(dòng)服務(wù)模式為主動(dòng)服務(wù)模式——精準(zhǔn)服務(wù)。精準(zhǔn)服務(wù)是建立在當(dāng)前圖書館一般性服務(wù)的基礎(chǔ)上,以用戶問(wèn)題為導(dǎo)向的圖書館服務(wù)模式,強(qiáng)調(diào)的是,從依據(jù)用戶共性需求配置資源到依據(jù)用戶個(gè)性化需求配置資源的轉(zhuǎn)變。利用大數(shù)據(jù)系統(tǒng)綜合采集圖書數(shù)據(jù)、讀者搜索借閱信息、移動(dòng)終端位置、讀者專業(yè)信息等數(shù)據(jù),分析讀者行為數(shù)據(jù),挖掘讀者的潛在需求,為讀者提供精準(zhǔn)服務(wù),將是大數(shù)據(jù)技術(shù)下高校圖書館發(fā)展的方向。
圖書館資源建設(shè)的評(píng)估是高校圖書館資源建設(shè)工作必不可少的重要環(huán)節(jié)??茖W(xué)有效的資源評(píng)價(jià)體系是合理配置資源的基礎(chǔ)。相應(yīng)的,在大數(shù)據(jù)環(huán)境下高校圖書館也需要變革資源評(píng)價(jià)的內(nèi)容與方法,以指導(dǎo)新形勢(shì)下的資源建設(shè)。高校圖書館利用大數(shù)據(jù)工具,能夠?qū)?lái)自圖書館系統(tǒng)和社交網(wǎng)絡(luò)等不同渠道的異構(gòu)數(shù)據(jù)加以整合,綜合運(yùn)用各種新型的資源評(píng)價(jià)指標(biāo)和新興評(píng)估方法,實(shí)現(xiàn)更全面的數(shù)據(jù)分析,促進(jìn)資源評(píng)價(jià)效果的提升。
贛州高校圖書館在信息化建設(shè)發(fā)展過(guò)程中存在不少問(wèn)題,發(fā)展相對(duì)落后。希望贛州高校圖書館能利用大數(shù)據(jù)技術(shù)發(fā)展的契機(jī),不吝投入,積極進(jìn)行大數(shù)據(jù)環(huán)境下的信息資源建設(shè)和人才培養(yǎng),從資源、技術(shù)、管理、人才建設(shè)等多個(gè)方面共同推進(jìn),為贛州高校圖書館未來(lái)發(fā)展打下堅(jiān)實(shí)的基礎(chǔ)。