李新亮 徐家毅 張建華(上海商學(xué)院圖書館 上海 201400)
?
大數(shù)據(jù)背景下高校圖書館的生態(tài)重構(gòu)
李新亮 徐家毅 張建華(上海商學(xué)院圖書館 上海 201400)
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,“大數(shù)據(jù)”對作為信息技術(shù)主要應(yīng)用場所的圖書館提出了生態(tài)體系重構(gòu)的要求,本文從高校圖書館的發(fā)展理念、資源、平臺、服務(wù)、館舍、架構(gòu)等方面提出了重構(gòu)高校圖書館生態(tài)體系的設(shè)想。
大數(shù)據(jù) 高校圖書館 生態(tài)重構(gòu)
大數(shù)據(jù)已經(jīng)深入到我們生活的各個方面。2011年,全球著名的咨詢公司——麥肯錫公司在《McKinsey-Big data The next frontier for innovation, competition, and productivity》報告中,最早提出了“大數(shù)據(jù)時代的到來”[1]。自此,“大數(shù)據(jù)”逐漸成為新時代的主題詞,大數(shù)據(jù)帶來的信息風(fēng)暴正在變革我們的生活、工作和思維,大數(shù)據(jù)開啟了一次重大的時代轉(zhuǎn)型[2]。
高校圖書館,如何在大數(shù)據(jù)背景下,通過數(shù)據(jù)的收集、管理和應(yīng)用,更加洞察用戶,建立共享協(xié)作機(jī)制,提供更精確、主動的服務(wù),從而改變高校圖書館原有的生態(tài)系統(tǒng),就成為一個值得研究的問題。
高校圖書館是信息技術(shù)的主要應(yīng)用場所。在關(guān)注高校圖書館結(jié)構(gòu)化信息資源需求的同時,大數(shù)據(jù)技術(shù)在高校圖書館中的應(yīng)用則意味著可以經(jīng)濟(jì)高效地分析非結(jié)構(gòu)化數(shù)據(jù)。將大數(shù)據(jù)引入并應(yīng)用到圖書館服務(wù)中,需要以下幾個流程:
1.1數(shù)據(jù)采集
高校圖書館的存儲資源豐富、數(shù)據(jù)種類繁多,不僅有紙質(zhì)資源、數(shù)據(jù)庫資源、光盤資源等結(jié)構(gòu)化信息,還有論文、課件、讀者信息、服務(wù)信息等半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。即使是一所高校圖書館內(nèi)部,這些數(shù)據(jù)的編碼方式、數(shù)據(jù)格式、應(yīng)用特征都無法統(tǒng)一。為了更好地利用這些數(shù)據(jù),必須對這些數(shù)據(jù)進(jìn)行抽取和集成,并對抽取和集成后的數(shù)據(jù)進(jìn)行清洗。另外,隨著用戶獲取信息方式的不斷變化,圖書館的信息服務(wù)功能也在相應(yīng)地不斷提高,高校圖書館為了滿足用戶的需求,必須對大數(shù)據(jù)進(jìn)行有效的采集。
1.2數(shù)據(jù)管理
大數(shù)據(jù)應(yīng)用的關(guān)鍵不在于擁有數(shù)據(jù)量的大小,而是對數(shù)據(jù)價值的再發(fā)現(xiàn)。數(shù)據(jù)價值再發(fā)現(xiàn)的前提則是高效的數(shù)據(jù)管理。由于高校圖書館數(shù)據(jù)庫中包含大量信息,且信息間價值密度低,因此,對大數(shù)據(jù)的管理要根據(jù)不同的應(yīng)用目的進(jìn)行不同分類。
現(xiàn)在高校圖書館數(shù)據(jù)一般可分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)可以利用傳統(tǒng)的關(guān)系型數(shù)據(jù)庫進(jìn)行管理,非結(jié)構(gòu)化數(shù)據(jù)則可以依據(jù)數(shù)據(jù)價值建立分級管理。把數(shù)據(jù)的來源、格式、流向、信息等方面的差異性作為非結(jié)構(gòu)化數(shù)據(jù)分類管理的依據(jù),并依賴搜索引擎技術(shù)、智能分類技術(shù)、分詞技術(shù)、大眾分類技術(shù)以及影像分析、檢索、識別技術(shù)等,對非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行自動提取檢索信息,建立非結(jié)構(gòu)化數(shù)據(jù)的索引表,實現(xiàn)對非結(jié)構(gòu)化數(shù)據(jù)的管理[3]。
1.3數(shù)據(jù)應(yīng)用
大數(shù)據(jù)背景下,高校圖書館的海量數(shù)據(jù)并沒有形成真正的知識源以供研究人員利用,還需要數(shù)據(jù)化的過程。大數(shù)據(jù)的應(yīng)用可以分為三個層面:收集信息;把信息轉(zhuǎn)化為知識;借助于分析工具和其他子系統(tǒng)獲得預(yù)測和判斷的智慧。通過數(shù)據(jù)清洗、抽取、集成、組織、備份等方式對大數(shù)據(jù)進(jìn)行管理,通過數(shù)據(jù)挖掘、統(tǒng)計分析、機(jī)器學(xué)習(xí)等分析技術(shù)對高校圖書館海量數(shù)據(jù)進(jìn)行深層次的挖掘和分析,甄選出隱藏在這些數(shù)據(jù)里的有價值的信息,利用數(shù)據(jù)挖掘技術(shù)對大規(guī)模的海量數(shù)據(jù)進(jìn)行分析并提煉出用戶需要的、真正有價值的知識,要能夠把知識轉(zhuǎn)化為決策智慧,找到大數(shù)據(jù)和高校圖書館信息服務(wù)的契合點。例如:一個高校圖書館的數(shù)據(jù)來源有很多,既有來自于高校圖書館本身館藏文獻(xiàn)的基礎(chǔ)信息、指導(dǎo)圖書文獻(xiàn)進(jìn)行組織和分類等有序化工作的方法和技術(shù)的信息、根據(jù)圖書文獻(xiàn)有序化的指導(dǎo)信息產(chǎn)生的衍生信息等內(nèi)部數(shù)據(jù),還有通過學(xué)校各種信息系統(tǒng)收集的用戶個人的外部數(shù)據(jù)。但這些數(shù)據(jù)一方面相對孤立,使用率不高,使高校圖書館的資源利用遠(yuǎn)遠(yuǎn)低于購買的價值。另一方面,師生用戶對高校圖書館的信息化要求不斷提高,這種張力就是現(xiàn)在高校圖書館面臨的嚴(yán)峻課題。
在這種情況下就需要把這些海量數(shù)據(jù)通過統(tǒng)計分析提煉出“規(guī)律”,把這些繁雜數(shù)據(jù)轉(zhuǎn)化為知識。利用這些提煉出的知識,學(xué)校和圖書館管理層就可以獲得預(yù)測和研判的能力,為其提供決策的依據(jù),把知識轉(zhuǎn)化為智慧。例如:可以通過門禁系統(tǒng)、圖書借閱系統(tǒng)、教務(wù)系統(tǒng)等多個系統(tǒng)對接交互而提供的多維度數(shù)據(jù)進(jìn)行分析,找出學(xué)生成績與來圖書館的次數(shù)的關(guān)系,圖書購置、電子資源購置與圖書館資源的利用頻率之間的關(guān)系,為管理層在“圖書館在學(xué)校中的定位”、“高校圖書館資源的購置范圍”等問題的決策提供依據(jù);再如:將館藏信息、新購置圖書信息、電子資源應(yīng)用信息與用戶行為信息結(jié)合分析后,可以對某個專業(yè)、科研方向,甚至某一個特定用戶進(jìn)行有效的信息推送、私人定制等進(jìn)行決策??傊?,在大數(shù)據(jù)背景下,基于大量結(jié)構(gòu)和非結(jié)構(gòu)數(shù)據(jù)的收集、管理和應(yīng)用,不僅能推進(jìn)高校圖書館數(shù)字化建設(shè),而且可以為高校圖書館帶來極大的輔助決策價值。
2.1洞察用戶
大數(shù)據(jù)的使用,使高校圖書館精確掌握用戶的信息需求和實現(xiàn)個性化服務(wù)成為可能。通過對用戶年齡、性別、工作性質(zhì)、知識結(jié)構(gòu)、教育背景等基本信息的搜集和整理,并與用戶的行為信息如瀏覽信息的方式、發(fā)表的學(xué)術(shù)成果、使用的社交工具等相結(jié)合,高校圖書館能夠為用戶建立用戶專門信息庫,利用大數(shù)據(jù)挖掘技術(shù)對用戶信息經(jīng)過發(fā)現(xiàn)、采集、去重等處理后,發(fā)現(xiàn)用戶真實和潛在的信息需求,為用戶提供頁面定制、信息推送服務(wù)、學(xué)術(shù)信息導(dǎo)航服務(wù)和參考咨詢服務(wù)等個性化的信息服務(wù)。
2.2協(xié)作共享
大數(shù)據(jù)背景下,高校圖書館為網(wǎng)絡(luò)用戶提供信息服務(wù),它的內(nèi)部業(yè)務(wù)和對外服務(wù)都需要網(wǎng)絡(luò)。換句話說,高校圖書館的運轉(zhuǎn)依附于數(shù)字通信網(wǎng)絡(luò),圖書館的數(shù)字化信息是通過網(wǎng)絡(luò)來流通的。另外,每一個高校圖書館都有自己的特色,而單個高校圖書館無法采集到全部的文獻(xiàn)資源。這樣,高校圖書館就可以通過跨地域、甚至跨國界的虛擬聯(lián)合體提供資源共建的協(xié)作化與資源共享的快速化,這種協(xié)作共享模式將會突破原先信息資源共享的壁壘,打破“數(shù)字鴻溝”,優(yōu)化了傳統(tǒng)高校圖書館那種用戶泛在式、嵌入式、無縫服務(wù)的模式,使高校圖書館用戶無時間、地域、空間的限制對資源進(jìn)行訪問,開創(chuàng)了信息無障礙共享的新時代,實現(xiàn)了信息資源共享無處不在的目的,成為全社會圖書館服務(wù)現(xiàn)代化進(jìn)程的推動力。
2.3精準(zhǔn)式主動服務(wù)
對用戶行為信息如瀏覽的網(wǎng)站、檢索的痕跡、下載的數(shù)字化信息資源、分享的信息資源、評價信息等的挖掘,是發(fā)現(xiàn)用戶信息需求的基礎(chǔ)。在此基礎(chǔ)上,再結(jié)合用戶按照學(xué)科、職業(yè)等細(xì)分的專門數(shù)據(jù)庫,為用戶建立與其需求相匹配的專門資源庫,幫助用戶從海量的信息中迅速找到其所需的信息,從而可以探索個性化、精確化和智能化地進(jìn)行推送服務(wù),使得高校圖書館傳統(tǒng)的被動式信息服務(wù)變?yōu)橹鲃邮叫畔⒎?wù),也就是以用戶為中心、以用戶需求和行為習(xí)慣為主導(dǎo)、根據(jù)用戶的信息需求提供個性化信息服務(wù)的全新服務(wù)模式,從而提高高校圖書館服務(wù)水平和用戶的滿意度。此舉能夠幫助圖書館贏得更多和更準(zhǔn)確的用戶群,大大提高高校圖書館的核心競爭力。
3.1用戶理念
首先,在傳統(tǒng)高校圖書館中,“為讀者服務(wù)”、“讀者第一”是圖書館不斷強調(diào)的宗旨,但“讀者”更多地體現(xiàn)了“以自我為中心”的理念。通過大數(shù)據(jù),高校圖書館能夠洞察用戶及其需求,樹立“用戶為中心”的理念,從根本上轉(zhuǎn)變了“圖書館本位”的舊觀念。
其次,在傳統(tǒng)高校圖書館中,圖書館和讀者之間是單向的關(guān)系,讀者僅作為信息需求者。在大數(shù)據(jù)背景下,用戶則變成了信息的重要貢獻(xiàn)者,甚至是信息的管理者。
第三,傳統(tǒng)高校圖書館的服務(wù)對象相對固定,這種固定讀者群的形成與讀者的年齡、性別、興趣愛好、教育背景、知識結(jié)構(gòu)、閱讀習(xí)慣等有關(guān)。其一,通過大數(shù)據(jù)應(yīng)用,改變了用戶獲取信息的需求和方式,用戶獲取圖書館的信息資源受時空限制變小,信息服務(wù)對象的范圍更廣;其二,圖書館對用戶的理解是立體、全方位的,可以依據(jù)不同標(biāo)準(zhǔn)來進(jìn)行用戶群體細(xì)分,便于提供更為準(zhǔn)確和精細(xì)化的服務(wù),也會吸引更多的用戶;其三,由于用戶不僅是信息的需求者,還是信息的提供者和管理者,在高校圖書館統(tǒng)一的平臺上,不同時空的用戶可以根據(jù)不同的維度自行組織成一個虛擬團(tuán)體,使用戶的范圍得以擴(kuò)大。
3.2資源
傳統(tǒng)高校圖書館的資源主要是紙質(zhì)版書本、報刊等文獻(xiàn)資料。大數(shù)據(jù)背景下,高校圖書館資源種類繁多、形式多樣:不僅包含館藏紙質(zhì)文獻(xiàn)、數(shù)字資源等的信息資源,還包括構(gòu)建于云上的存儲資源、網(wǎng)絡(luò)資源等;用戶上網(wǎng)產(chǎn)生的信息,包括瀏覽圖書館網(wǎng)站,檢索圖書館的數(shù)據(jù)庫等信息資源也會成為高校圖書館資源的重要組成部分,網(wǎng)絡(luò)上的資源都可以成為高校圖書館的信息對象。
“開放”是高校圖書館迎接大數(shù)據(jù)時代的最佳選擇,增加多觸點及外部通路是大數(shù)據(jù)時代高校圖書館的生存之道。資源的分享將會成為高校圖書館資源再生產(chǎn)的主要方式,分享第三方數(shù)據(jù)、同時向第三方開放數(shù)據(jù),才可避免自己變成“信息孤島”。
隨著計算機(jī)技術(shù)的發(fā)展,高校圖書館的數(shù)字化信息資源會越來越多,資源的收集和儲存在大數(shù)據(jù)背景下不再是一件很困難的事情。高校圖書館資源的提供者也不僅僅限于專業(yè)的信息供應(yīng)商,甚至用戶本身也可變成資源的提供者。孤立的數(shù)據(jù)缺少價值,因此,把非結(jié)構(gòu)化的信息進(jìn)行挖掘才是最重要的工作。
3.3平臺
大數(shù)據(jù)時代,平臺為王。在大數(shù)據(jù)背景下,數(shù)據(jù)量快速增長、個性化信息推送服務(wù)、智能搜索引擎、智能化交互共享等都是基于大數(shù)據(jù)技術(shù)的智能平臺,所以,高校圖書館必須通過云計算環(huán)境把分散的圖書館軟硬件設(shè)備、信息資源、圖書館管理、業(yè)務(wù)處理與用戶聯(lián)系在一起,為用戶提供一個統(tǒng)一界面的高校圖書館服務(wù)平臺。
3.4人才
傳統(tǒng)高校圖書館館員主要搜集、整理和保存信息資源以滿足讀者的信息需求,是資料保管員。但大數(shù)據(jù)時代,除了平臺等硬件要跟上之外,數(shù)據(jù)挖掘與深度分析的專業(yè)人員更不可缺,這要求高校圖書館員除了要像傳統(tǒng)圖書館員那樣,熟練掌握圖書館學(xué)、情報學(xué)、信息管理學(xué)等專業(yè)知識,還要具有數(shù)據(jù)開發(fā)和分析的能力。其次,隨著高校圖書館用戶理念的樹立,圖書館也從“館藏為主”過渡到“參與為主”,需要圖書館館員具備相關(guān)學(xué)科專業(yè)背景和知識基礎(chǔ),這也對大數(shù)據(jù)分析具有幫助作用。最后,高校圖書館館員負(fù)責(zé)知識推廣和用戶信息的維護(hù)等工作,需要其具有一定的法律背景,能夠處理知識產(chǎn)權(quán)和用戶隱私等法律問題。
總之,高校圖書館的人才建設(shè)觀念要發(fā)生變革,要建立具有大數(shù)據(jù)思維的“云館員”隊伍。
3.5服務(wù)
大數(shù)據(jù)背景下,高校圖書館的服務(wù)對象、服務(wù)模式和服務(wù)技術(shù)都是對傳統(tǒng)圖書館的提高和完善。隨著計算機(jī)、智能手機(jī)、平板電腦的普及,人們更傾向于通過網(wǎng)絡(luò)終端、移動設(shè)備來閱讀信息,這就使高校圖書館的用戶打破了時空限制,也改變了用戶的年齡結(jié)構(gòu)、學(xué)科結(jié)構(gòu)、學(xué)歷結(jié)構(gòu)等。在這種情況下,高校圖書館信息服務(wù)的對象有所改變。
高校圖書館服務(wù)模式也在不斷變化,從傳統(tǒng)的“以圖書館館員為中心”、“以資源產(chǎn)品為中心”的服務(wù)模式向“以用戶為中心”的服務(wù)模式轉(zhuǎn)變;從傳統(tǒng)的根據(jù)館藏為讀者提供信息服務(wù)到根據(jù)用戶個性化信息需求而進(jìn)行的信息服務(wù)。大數(shù)據(jù)數(shù)量大、結(jié)構(gòu)復(fù)雜、類型繁多、生命周期短,所以,建立在大數(shù)據(jù)技術(shù)上的高校圖書館信息服務(wù)模式要從數(shù)據(jù)、信息、知識、智慧四個層次展開,包括:基于數(shù)據(jù)整合的一站式資源服務(wù)、基于數(shù)據(jù)分析的學(xué)科知識服務(wù)、基于數(shù)據(jù)應(yīng)用的信息可視化服務(wù)和基于數(shù)據(jù)挖掘的智慧服務(wù)[4]。
大數(shù)據(jù)背景下高校圖書館服務(wù)主是建立在對大數(shù)據(jù)分析、處理基礎(chǔ)上挖掘出用戶的實際信息需求和潛在的信息需求,然后有針對性的為用戶提供信息服務(wù)。這需要服務(wù)技術(shù)上有所革新,第一需要客觀的技術(shù),也就是需要數(shù)據(jù)化的技術(shù)和數(shù)據(jù)分析、挖掘技術(shù);第二需要館員的服務(wù)技術(shù),也就是館員要掌握這些新技術(shù)和服務(wù)專業(yè)技能,滿足用戶的各種信息需求,并能夠應(yīng)用到服務(wù)實踐中。
3.6館舍
高校圖書館的館舍是圖書館主要的硬件構(gòu)成,傳統(tǒng)高校圖書館館舍設(shè)計考慮的重要功用是文獻(xiàn)資料的儲存。大數(shù)據(jù)時代,由于資料的易得性和交互的虛擬性,高校圖書館在某種程度從固定的館舍、館藏轉(zhuǎn)變成云圖書館,因此高校圖書館館舍的功用也應(yīng)更多地考慮互動(包括網(wǎng)絡(luò)互動)和分享空間的設(shè)計。
3.7機(jī)構(gòu)
傳統(tǒng)高校圖書館的組織架構(gòu)基本是基于紙質(zhì)文獻(xiàn)的采購、編目和流通而設(shè)置的,大數(shù)據(jù)時代下則應(yīng)圍繞著數(shù)據(jù)的采集、分析和應(yīng)用而設(shè)置,這就要求負(fù)責(zé)大數(shù)據(jù)的“數(shù)據(jù)管理與分析”部門位于圖書館的核心地位,以“數(shù)據(jù)驅(qū)動”來實現(xiàn)對現(xiàn)有組織架構(gòu)進(jìn)行重組。傳統(tǒng)架構(gòu)將被“數(shù)據(jù)采集部門、平臺維護(hù)部門、數(shù)據(jù)分析部門、數(shù)據(jù)應(yīng)用部門”四大類取代。在實際的操作中要防止各部門間組織結(jié)構(gòu)的割裂情形,以免數(shù)據(jù)呈現(xiàn)離散與孤立狀態(tài),要盡力打通數(shù)據(jù),讓數(shù)據(jù)自由流動,發(fā)揮多重效能,這是組織架構(gòu)很重要的方面。
數(shù)字信息的爆炸式增長催生出“大數(shù)據(jù)”概念。在大數(shù)據(jù)背景下,也催生了高校圖書館數(shù)據(jù)的搜集、管理與應(yīng)用的全新技術(shù)體系。在“數(shù)據(jù)驅(qū)動”下,高校圖書館生態(tài)也將漸漸得以重構(gòu),這將對高校圖書館的知識服務(wù)的拓展和深化帶來重大影響。
[1] James Manyika, Michael Chui, Brad Brown, et al. Big data: The next frontier for innovation,competition, and productivity[R]. McKinsey Global Institute,2011.
[2] 維克托·邁爾-舍恩伯格.大數(shù)據(jù)時代[M].周濤,譯.杭州:浙江人民出版社,2012.
[3] 王紅.圖書館大數(shù)據(jù)管理與分析[J].現(xiàn)代情報,2014(8).
[4] 蘇蓉.基于大數(shù)據(jù)的數(shù)字圖書館信息服務(wù)研究[D].武漢:華中師范大學(xué),2014.
李新亮 館員,上海商學(xué)院圖書館。