張怡華
摘要 互聯(lián)網(wǎng)科技在人們身邊無處不在,大數(shù)據(jù)已經(jīng)潛移默化的來到人們身邊。圖書館作為現(xiàn)代社會的有價值的信息系統(tǒng),通過大量的非結構化數(shù)據(jù)、半結構化數(shù)據(jù)可以幫助我們尋找隱藏在數(shù)據(jù)背后的世界。本文分析基于大數(shù)據(jù)挖掘與決策分析體系的高校圖書館個性化服務研究,希望能為以后研究提供參考。
【關鍵詞】大數(shù)據(jù) 挖掘 決策 個性化服務
1 大數(shù)據(jù)時代圖書館面臨的挑戰(zhàn)和個性化需求
1.1 大數(shù)據(jù)時代服務平臺的系統(tǒng)結構更加復雜和開放
1.1.1 服務架構和應用程序復雜度快速增長
目前的軟件體系結構越來越難以應對和處理日益增長的軟件復雜性,如何實現(xiàn)圖書館基礎設施硬件個性化需求是我們孜孜不倦的追求。隨著微服務架構的興起,大規(guī)模整體式應用程序向著分布式微服務架構遷移,加大了系統(tǒng)結構的復雜性。
1.1.2 網(wǎng)絡和大數(shù)據(jù)資源的開放性
隨著互聯(lián)網(wǎng)技術的飛速發(fā)展,可以利用網(wǎng)絡進行傳播,實現(xiàn)資源的最大共享。但是有利必有其弊,大數(shù)據(jù)的開放性涉及數(shù)據(jù)安全和隱私保護。相比于傳統(tǒng)的數(shù)據(jù)資源形式,云計算、大數(shù)據(jù)、傳感技術具有開放性、復雜性、多樣性和海量性等特征。
1.1.3 以非結構化數(shù)據(jù)為主體
非結構化數(shù)據(jù)處理是大數(shù)據(jù)分析技術的難點和重點也逐漸得到客戶對其價值的認可。過去那種有限內(nèi)容和結構單一的數(shù)據(jù)庫已經(jīng)無法滿足客戶多樣化需求,尤其是在圖書館個性化服務更是以非結構化數(shù)據(jù)為主體。
1.1.4 改變了傳統(tǒng)信息安全交付模式
大數(shù)據(jù)時代的到來,給圖書館的服務帶來了更大的挑戰(zhàn)和機遇,一方面是大數(shù)據(jù)帶來的個性化服務,另一方面是大數(shù)據(jù)改變了圖書館在傳統(tǒng)IT情況下的信息安全交付模式。
1.2 圖書館大數(shù)據(jù)QOS(服務質(zhì)量)保障與用戶隱私保護沖突激
1.2.1 讀者個性化服務中數(shù)據(jù)被過度分析
如果對用戶數(shù)據(jù)存在過度的分析和使用,不僅僅不能幫助圖書館實現(xiàn)個性化服務,反而會導致分析的結果失真。更有甚者,引起用戶隱私的泄露,帶來被控訴的官司。
1.2.2 黑客會最大限度地收集圖書館和讀者的個人信息
大數(shù)據(jù)環(huán)境下經(jīng)常出現(xiàn)圖書館用戶隱私泄露,如何有效保護讀者隱私權,己成為加強圖書館與讀者之間信任感的重要武器。大數(shù)據(jù)時代,信息獲取渠道增多,給圖書館用戶的隱私保護帶來極大的風險,進行數(shù)據(jù)分析和數(shù)據(jù)挖掘應該在不暴露用戶個人隱私的前提下。
1.3 大數(shù)據(jù)挖掘與決策分析的圖書館個性化需求
1.3.1 輔助事前預測
我們應該利用此項技術來對自身的數(shù)據(jù)進行整理、組織、分析,為圖書館服務的模式、對未來發(fā)展趨勢提供分析與預測。尋找用戶的訴求,進而改進服務規(guī)模,提高服務質(zhì)量,達到圖書館對大眾的資源和服務的雙向滿足。
1.3.2 輔助事中感知
大數(shù)據(jù)的容量如此龐大,在海量數(shù)據(jù)中對有價值的數(shù)據(jù)進行甄別與篩選,再對其進行科學系統(tǒng)的挖掘,絕非易事,因此要提早作好各方面的準備。比如天津圖書館每個周六都有講座活動,所以那一天來圖書館的讀者比較多。中文報紙閱覽室正對著報告廳,每一場報告結束,許多讀者還會直接走進閱覽室。有的老讀者會直接向你反映這場報告會都講了什么、感受如何,打動人心的地方在哪兒。這些讀者的反饋是圖書館講座服務的一面鏡子,這是圖書館人在工作中所作的小數(shù)據(jù)集合。
1.3.3 輔助事后反饋
在大數(shù)據(jù)中“沙里淘金”,需要事后實時反饋,事后做好相關文字記錄,跟蹤設備的記錄。大數(shù)據(jù)還能為圖書館構建全新的知識服務引擎提供必要的技術支撐。并且在技術應用于管理過程中還可以不斷反饋信息
2 高校圖書館大數(shù)據(jù)挖掘及決策分析體系的架構和流程
2.1 高校圖書館的大數(shù)據(jù)挖掘及決策分析流程
2.1.1 多維度提取數(shù)據(jù)來源
從從各類業(yè)務和大數(shù)據(jù)存儲交換平臺內(nèi)提取數(shù)據(jù),或者從外部互聯(lián)網(wǎng)(直接裝載入爬蟲引擎)提取數(shù)據(jù)。
2.1.2 評估數(shù)據(jù)規(guī)模和樣例分析
高校圖書管理系統(tǒng),用綜合效益評價體系和評價方法,根據(jù)規(guī)模大小選擇合適的分布式并行計算應用架構,也進行樣例分析。
2.1.3 根據(jù)實際需求確定建模方式
讀者用戶監(jiān)控和分析、分類、預測及輔助決策需要用數(shù)學建模方法,我們需要一種全新的面向Agent的需求建模方式。
2.1.4 根據(jù)需求確定輸出方式和優(yōu)化
確定了各評價指標的權重,運用TOPSIS方法對直接輸出分析報告,確定一套科學的質(zhì)量評價指標。
2.2 高校圖書館的大數(shù)據(jù)挖掘及決策分析的架構
圖書館的大數(shù)據(jù)服務體系,其服務與運行模式的核心是客戶,將圖書的搜尋、查找、借閱、管理等流程加以優(yōu)化,并有機的結合起來,利用云技術進行分析、預測和智能的輔助服務,建立具有特色的科學性很強的實用圖書管理模塊。大數(shù)據(jù)計算服務后,在大數(shù)據(jù)計算服務內(nèi)進行一些數(shù)據(jù)計算和算法模型的訓練。然后再將計算的結果導入ADS和云數(shù)據(jù)庫中,其中導入的ADS支持BI系統(tǒng),并且ADS能夠多值列查詢和毫秒級的實時響應,有利于生成BI報表;另一部分數(shù)據(jù)存入云數(shù)據(jù)庫中,不僅降低了存儲成本,同時也提高了數(shù)據(jù)的安全性。
3 大數(shù)據(jù)挖掘及決策分析體系在高校圖書館個性化服務中的應用
3.1 基于用戶行為模型的個性化服務方案
3.1.1 用戶行為本體數(shù)據(jù)庫構建過程
如何構建合適的用戶行為模型并基于海量的行為日志數(shù)據(jù)提供個性化服務,其本質(zhì)是從異質(zhì)的市場中尋找用戶行為習慣及特點等諸多。構建大數(shù)據(jù)的存儲、搜索、共享、分析和可視化等管理行為,科學構建CRM大數(shù)據(jù)庫和管理信息系統(tǒng)。
3.1.2 用戶顯性興趣和隱性興趣本體提取過程
通過分析用戶的瀏覽方式和內(nèi)容,實時獲取用戶興趣信息,設計一種利用用戶日志庫提取用戶顯性興趣和隱性需求本體的個性化服務方案。高校圖書館大數(shù)據(jù)應用模式框架抓取工具,提出數(shù)字圖書館個性化用戶興趣領域本體的動態(tài)過程。
參考文獻
[1]孫琳,大數(shù)據(jù)時代圖書館服務體系創(chuàng)新研究[J].理論觀察,2013 (04).
[2]胡蓮香.走向大數(shù)據(jù)知識服務:大數(shù)據(jù)時代圖書館服務模式創(chuàng)新[J],農(nóng)業(yè)圖書情報學刊,2014 (02).