(蘭州商學院網(wǎng)絡中心 甘肅蘭州 730020)
在大數(shù)據(jù)環(huán)境下,首先,數(shù)字圖書館管理數(shù)據(jù)與服務數(shù)據(jù)呈現(xiàn)海量增加,并從TB級別躍升到PB級別。對硬件與軟件服務系統(tǒng)性能提出了較高要求。其次,隨著圖書館個性化數(shù)字服務的快速發(fā)展,圖書館系統(tǒng)與網(wǎng)絡日志、監(jiān)控與服務視頻、圖片、音頻和增值服務信息等非結(jié)構化數(shù)據(jù)量,將遠遠超越傳統(tǒng)圖書館以數(shù)字文本為主的結(jié)構化數(shù)據(jù)量,占據(jù)數(shù)據(jù)總量的80%以上。第三,圖書館海量數(shù)據(jù)的價值密度較低,數(shù)據(jù)年增長率與數(shù)據(jù)的價值密度呈現(xiàn)反比關系。第四,圖書館數(shù)據(jù)處理的時效性較高,可通過高效、快速的數(shù)據(jù)處理過程,來提高數(shù)據(jù)的價值密度和可用性。
1.2.1 可對讀者閱讀需求和行為進行準確分析
目前,隨著計算機與通信技術的快速發(fā)展,科學技術已不是制約讀者數(shù)字閱讀體驗質(zhì)量的最主要因素。圖書館能否準確預測、分析讀者閱讀需求和行為,并通過個性化推送式服務來提高讀者信息獲取的效率、準確性、經(jīng)濟性和便捷性,成為提高讀者閱讀質(zhì)量和降低圖書館服務成本的關鍵。
數(shù)據(jù)量的急劇膨脹是數(shù)字圖書館集團面臨的一個嚴峻問題。要求通過構建新的數(shù)據(jù)挖掘、分析和決策策略,采用大規(guī)模并行處理技術和分布式系統(tǒng)架構,來實現(xiàn)海量數(shù)據(jù)的高效處理和深度挖掘。確保正確把握圖書館與讀者之間、不同服務數(shù)據(jù)之間、讀者與服務數(shù)據(jù)之間的關系和發(fā)展趨勢,確保讀者個性化定制服務的有效性和可用性?!?〕
1.2.2 大數(shù)據(jù)管理平臺具有較強功能性和可用性的需求
大數(shù)據(jù)平臺首先應具備對用戶、管理、服務和其他相關信息進行數(shù)據(jù)采集、處理、判定和高級分析的能力,并實現(xiàn)價值數(shù)據(jù)和分析結(jié)果的可視化表現(xiàn)。其次,圖書館大數(shù)據(jù)平臺應具備良好的兼容性和可擴展性,可為新的數(shù)據(jù)管理與分析軟件提供高性能支持平臺。通過為主數(shù)據(jù)創(chuàng)建可信賴的視圖,來優(yōu)化數(shù)據(jù)的管理流程和實現(xiàn)工作負載均衡。第三,大數(shù)據(jù)管理平臺應支持元數(shù)據(jù)共享、自動查詢和數(shù)據(jù)管理模式的自適應優(yōu)化,實現(xiàn)數(shù)據(jù)的高效整合、即時分析、智能處理和服務的自動化響應。第四,大數(shù)據(jù)管理平臺應實現(xiàn)對數(shù)據(jù)庫結(jié)構化和非結(jié)構化數(shù)據(jù)的實時訪問,可通過智能化管理策略來降低圖書館大數(shù)據(jù)環(huán)境的復雜度,提高管理員數(shù)據(jù)分析效率和降低系統(tǒng)平臺的響應時間。
1.2.3 可幫助圖書館進行服務分析與決策
首先,圖書館需要建設高效的大數(shù)據(jù)管理系統(tǒng)和制定集成的大數(shù)據(jù)解決方案,提高大數(shù)據(jù)時代圖書館對數(shù)據(jù)挖掘、分析、管理和決策的智能化水平。并在保證服務質(zhì)量與符合大數(shù)據(jù)標準的前提下,有效控制服務成本和運營風險,提高讀者的閱讀收益率。其次,在大數(shù)據(jù)環(huán)境下,圍繞數(shù)據(jù)價值產(chǎn)生的關聯(lián)應用復雜多變。讀者、圖書館、云服務與網(wǎng)絡服務商均應重新定位自身角色和相互關系,構建以數(shù)據(jù)價值為核心,以服務、對象、技術、產(chǎn)品和應用為一體的個性化推送服務。第三,數(shù)據(jù)的集成、管理、挖掘、處理與分析過程,應涉及圖書館服務平臺構建、服務創(chuàng)建和服務推送的全過程,并在數(shù)據(jù)挖掘、業(yè)務分析、服務決策和服務推送過程實現(xiàn)適時監(jiān)測和讀者互動?!?〕
1.2.4 讀者數(shù)字閱讀隱私保護的需求
隨著大數(shù)據(jù)時代數(shù)字圖書館信息量的快速增加,以及數(shù)據(jù)采集、存儲、分析和處理效率的不斷提高,如何有效保護讀者閱讀活動的敏感數(shù)據(jù)和個人隱私,防止個人敏感和隱私數(shù)據(jù)被截獲、竊取、篡改和破壞,成為保證圖書館大數(shù)據(jù)環(huán)境安全和個人閱讀隱私應重點關注的問題。首先,面對大數(shù)據(jù)環(huán)境下不同的數(shù)據(jù)源、合作伙伴、數(shù)據(jù)管理系統(tǒng)和服務對象,數(shù)字圖書館應統(tǒng)一數(shù)據(jù)采集、存儲、分析和處理的標準,并保證數(shù)據(jù)類型和應用過程符合大數(shù)據(jù)環(huán)境相關安全規(guī)定。此外,圖書館管理員在監(jiān)控、采集讀者閱讀行為數(shù)據(jù)和瀏覽個人隱私信息時,應制定詳細的管理員閱讀權限管理、數(shù)據(jù)保密管理和已采集數(shù)據(jù)網(wǎng)絡安全傳輸管理的制度,防止非法用戶利用大數(shù)據(jù)環(huán)境對讀者數(shù)據(jù)進行分析,進而明確讀者的隱私、閱讀習慣和閱讀需求的發(fā)展趨勢。
構建戰(zhàn)略理論、制定詳細方案和服務實踐,是圖書館服務模式構建與服務實踐的三個主要步驟。
圖書館大數(shù)據(jù)環(huán)境的科學性、可用性、可控性和經(jīng)濟性,是圖書館科學建設與制定服務戰(zhàn)略理論的前提,是用戶服務模式變革的基礎。同時也是保證用戶服務實踐過程中數(shù)據(jù)的有效整合,實現(xiàn)大數(shù)據(jù)生命周期全程管理的要求。首先,圖書館應提高基于云服務平臺的大數(shù)據(jù)采集、處理和分析能力,保證大數(shù)據(jù)管理平臺具有較強的系統(tǒng)資源管理、分配、優(yōu)化和安全性,能夠為圖書館提供正確、可靠和高價值的決策數(shù)據(jù)。其次,圖書館應樹立以大數(shù)據(jù)為中心的服務價值理念。通過對所收集到的海量數(shù)據(jù)進行價值過濾和收益評估,構建出符合讀者需求、用戶服務收益和管理效率提升的新服務模式。第三,應通過對圖書館海量數(shù)據(jù)做統(tǒng)計性的搜索、比較、聚類和分類等分析歸納,完成大數(shù)據(jù)全局環(huán)境下的服務價值挖掘、預測讀者服務商機和預測經(jīng)營風險,為讀者提供可滿足內(nèi)在閱讀活動需求的個性化推送式服務。〔3〕
對讀者閱讀行為和閱讀需求實時分析的準確性、及時性,是圖書館有效結(jié)合大數(shù)據(jù)環(huán)境下用戶閱讀需求和環(huán)境變化實際,進而調(diào)整圖書館服務目的、策略、內(nèi)容和方法的關鍵。首先,傳統(tǒng)數(shù)字圖書館對讀者需求、閱讀有效性和滿意度的統(tǒng)計,是基于已采集數(shù)據(jù)的基礎之上的。而大數(shù)據(jù)環(huán)境下,圖書館可實時、準確地對所采集的數(shù)據(jù)進行分析、處理、判定和決策,并通過自我學習來提高系統(tǒng)的智能、自動化水平。同時,可對讀者進行實時的閱讀情緒與閱讀收益分析,不斷提高讀者閱讀質(zhì)量和滿意度。其次,閱讀服務的可擴展性是保證服務質(zhì)量的又一個重要因素。傳統(tǒng)數(shù)字環(huán)境下,圖書館是通過關聯(lián)規(guī)則和協(xié)同式過濾等技術來實現(xiàn)信息推送式服務。而大數(shù)據(jù)環(huán)境下,通過大數(shù)據(jù)技術對跨多個信息平臺的數(shù)據(jù)實現(xiàn)過濾、分析與整合,確保信息推送式服務可根據(jù)讀者需求而無限擴展。第三,大數(shù)據(jù)環(huán)境下,應通過對大數(shù)據(jù)系統(tǒng)的分析,發(fā)現(xiàn)影響讀者閱讀有效性、愉悅感和滿意度的瓶頸因素,并根據(jù)影響力評估指標的內(nèi)容、影響因子和判定方法進行修訂,提高評估的科學性、準確性和實時性。〔4〕
實行基于大數(shù)據(jù)技術的用戶個性化服務管理,是圖書館掌握用戶閱讀需求、提升讀者個性化服務質(zhì)量和避免讀者流失的保證。
首先,大數(shù)據(jù)環(huán)境下,圖書館通過對采集的半結(jié)構化和非結(jié)構化數(shù)據(jù)進行鑒別、過濾、分類和處理,可根據(jù)閱讀需求、行為對讀者特征進行標示,為用戶提供個性化推送式數(shù)字閱讀服務。圖書館可通過對讀者統(tǒng)一身份認證和統(tǒng)一權限管理,利用論壇、微博、電子郵箱、移動服務和其他第三方增值服務等方式,利用多種信息推送渠道為讀者提供“一站式”閱讀服務,保證讀者個性化閱讀服務具有較強的移動性和即時性。其次,在用戶個性化閱讀管理中,應采集正確、可用的讀者個性化閱讀行為數(shù)據(jù)、圖書館服務可用性數(shù)據(jù)、讀者閱讀需求和滿意度評估數(shù)據(jù),并建立讀者閱讀體驗滿意度分析模型、讀者閱讀行為分析模型、個性化服務模式對用戶流失的影響力模型等。通過對所采集的數(shù)據(jù)進行有效分析,保證管理與服務策略的制定與執(zhí)行過程科學、高效、經(jīng)濟、可用。第三,圖書館業(yè)務的完整性、讀者群的可靠性、閱讀活動信息的價值和可獲取性、用戶服務的經(jīng)濟性和低碳性,是大數(shù)據(jù)環(huán)境下決定圖書館市場競爭力的關鍵因素。因此,應通過大數(shù)據(jù)技術加強圖書館數(shù)據(jù)處理能力和跨平臺的數(shù)據(jù)整合能力,真正為讀者閱讀活動提供個性化推送服務。〔5〕
在大數(shù)據(jù)環(huán)境下,首先,圖書館數(shù)據(jù)可用性和大數(shù)據(jù)技術有效性,是評估圖書館大數(shù)據(jù)系統(tǒng)重點考慮的內(nèi)容。重點評估圖書館數(shù)據(jù)采集、有效數(shù)據(jù)過慮、快速處理、云計算和科學決策的能力,是否能夠及時發(fā)現(xiàn)、預測和修正圖書館系統(tǒng)運行缺陷,以及在讀者服務模式變革、運營成本變化和讀者閱讀服務保障等方面存在的不足。其次,圖書館通過大數(shù)據(jù)平臺與技術,可將不同內(nèi)容、數(shù)據(jù)模式和使用對象的無關數(shù)據(jù)孤島,整合為一個統(tǒng)一的大數(shù)據(jù)平臺。通過對讀者特征 (年齡、性別、學歷等)、地理區(qū)域 (所處的地域或國家)、閱讀習慣和閱讀收益 (信息獲取效率、知識可用性、閱讀成本和閱讀愉悅感等)等數(shù)據(jù)進行分析,可即時、情景地感知與洞察服務用戶水平,并有效評估圖書館在服務優(yōu)化、服務模式轉(zhuǎn)變和降低服務風險等方面的能力。第三,圖書館服務安全性的評估。隨著圖書館服務模式、內(nèi)容的不斷發(fā)展,圖書館服務系統(tǒng)基礎設施結(jié)構和服務模式的復雜度不斷增強,其安全防御的對象、內(nèi)容和難度成倍增長。同時,黑客也可利用云計算、大數(shù)據(jù)等技術,采用多種攻擊方法和途徑對圖書館管理與服務系統(tǒng)、讀者進行攻擊。有效利用大數(shù)據(jù)平臺、網(wǎng)絡平臺、云計算平臺和智能運營管道等,對圖書館所面臨的安全威脅、不穩(wěn)定因素、安全防御與實時檢測系統(tǒng)進行科學評估,是增強圖書館系統(tǒng)安全性和服務可靠性的關鍵?!?〕
1.漆晨曦.電信企業(yè)大數(shù)據(jù)分析、應用及管理發(fā)展策略.電信科學,2013(3):12-15
2.百度百科.大數(shù)據(jù).〔2013 -06 -02〕.http://baike.baidu.com/view/6954399.htm
3.康波,劉勝強.基于大數(shù)據(jù)分析的互聯(lián)網(wǎng)業(yè)務用戶體驗管理.電信科學,2013(3):32-35
4.Cerra A,Easterwood K,Power J.Transforming Business- Big Data,Mobility,and Globalization.Wiley,UK,2012
5.陶彩霞,謝曉軍,陳康,郭利榮,劉春.基于云計算的移動互聯(lián)網(wǎng)大數(shù)據(jù)用戶行為分析引擎設計.電信科學,2013(3):27-31
6.科技中國.大數(shù)據(jù)時代.〔2013 -06-01〕.http://www.techcn.com.cn/index.php?edition-view -185281 -2.html