熊濤
摘 要:在大數(shù)據(jù)時代中,數(shù)據(jù)已成為最重要的資源。高校圖書館開展數(shù)據(jù)監(jiān)護工作,實現(xiàn)高效管理和妥善保存意義重大。本文對高校圖書館的主要數(shù)據(jù)做了簡單分類,并介紹了高校圖書館數(shù)據(jù)的主要內(nèi)容,最后分析了高校圖書館進行數(shù)據(jù)監(jiān)護的重要性,為今后高校圖書館開展數(shù)據(jù)監(jiān)護工作打下理論基礎。
關鍵詞:大數(shù)據(jù);高校圖書館;數(shù)據(jù)監(jiān)護
1 高校圖書館數(shù)據(jù)分類
大數(shù)據(jù)可根據(jù)其組成結構不同分為結構化數(shù)據(jù)、半結構化數(shù)據(jù)和非結構化數(shù)據(jù)這三種類型。其中能夠用二維表結構來邏輯表示的數(shù)據(jù)稱為結構化數(shù)據(jù),否則稱為非結構化數(shù)據(jù);而半結構化數(shù)據(jù)是一種數(shù)據(jù)庫集成的數(shù)據(jù)模型,具有一定的結構性,但是其結構性不是統(tǒng)一的。大數(shù)據(jù)的最小單位為bit,依據(jù)順序從小到大還有Byte、kB、MB、GB、TB、PB等單位,1kB=1024Byte,1MB=1024kB,以此類推。圖書館的大數(shù)據(jù)是復雜多樣的,以上3種類型的數(shù)據(jù)都有,其中以結構化數(shù)據(jù)為主,如果按照這種方式對圖書館大數(shù)據(jù)進行分類并不能較好地表達圖書館的數(shù)據(jù)。根據(jù)圖書館的工作特點,應該將圖書館的大數(shù)據(jù)分為基礎數(shù)據(jù)、用戶行為數(shù)據(jù)和其他數(shù)據(jù)[1]。
1.1 基礎數(shù)據(jù)
基礎數(shù)據(jù)包括圖書館基本數(shù)據(jù)、讀者數(shù)據(jù)、紙質(zhì)資源數(shù)據(jù)、電子資源數(shù)據(jù)等。圖書館基本數(shù)據(jù)包括圖書館人員、圖書館資產(chǎn)、辦公等方面數(shù)據(jù)。讀者數(shù)據(jù)為圖書館借閱系統(tǒng)中的讀者基本情況、圖書館的微信微博用戶數(shù)據(jù)和圖書館座位預約系統(tǒng)數(shù)據(jù)等用戶數(shù)據(jù)。以上幾類數(shù)據(jù)為結構化的,量不大,為MB級別,增長速度緩慢,易于管理。紙質(zhì)資源數(shù)據(jù)包括館藏書目信息、期刊目錄信息、報紙信息等,此類數(shù)據(jù)為結構化數(shù)據(jù),量比較大,為GB級別,增長速度一般,每年以相差不多的速度增長。電子資源數(shù)據(jù)包括圖書館購買的各種電子資源數(shù)據(jù)、特色資源數(shù)據(jù)和光盤數(shù)據(jù)等。電子資源數(shù)據(jù)為結構化數(shù)據(jù),量非常大,為PB級別,增長速度較快,幾乎每時每刻都在變化,由于目前大部分高校購買的電子資源為遠程鏡像,所以不易管理,也不易統(tǒng)計。
1.2 用戶行為數(shù)據(jù)
用戶行為數(shù)據(jù)包括紙質(zhì)資源利用情況、電子資源利用情況、微信利用情況、圖書館主頁訪問情況、門禁數(shù)據(jù)、空間利用情況、VPN遠程訪問數(shù)據(jù)等數(shù)據(jù)。紙質(zhì)資源利用情況數(shù)據(jù)包括讀者借閱信息和圖書利用情況數(shù)據(jù)等。電子資源利用情況數(shù)據(jù)包括讀者訪問信息、檢索信息、瀏覽下載信息、文獻傳遞信息等。空間利用情況數(shù)據(jù)包括自習室座位預約系統(tǒng)利用數(shù)據(jù)、研修空間和研討空間利用數(shù)據(jù)等。VPN遠程訪問數(shù)據(jù)包括用戶賬號信息、訪問途徑、訪問內(nèi)容、下載流量信息等。以上4類信息數(shù)據(jù)量較大,為GB級別,時間長可達到TB級別;數(shù)據(jù)結構較復雜,3種類型的數(shù)據(jù)都有,有在本地的,也有在異地的,不易管理。電子資源利用情況不易獲取,增長速度非??臁N⑿爬们闆r、圖書館主頁訪問情況和門禁數(shù)據(jù)的數(shù)據(jù)級別為GB級,類型為結構化數(shù)據(jù),增長速度緩慢,易于管理。
1.3 其他數(shù)據(jù)
其他數(shù)據(jù)包括學科服務、閱讀推廣服務、咨詢服務、講座培訓等方面的數(shù)據(jù)。學科服務數(shù)據(jù)包括服務專業(yè)情況、服務對象數(shù)據(jù)、學科服務績效數(shù)據(jù)等。閱讀推廣服務數(shù)據(jù)包括閱讀推廣組織數(shù)據(jù)、參與群體信息和閱讀推廣效果信息等。咨詢服務為解答讀者相關問題的回復,其數(shù)據(jù)包括咨詢者信息、問題信息和解答信息等。講座培訓數(shù)據(jù)包括講座內(nèi)容信息、參與者信息和講座培訓效果等數(shù)據(jù)。其他數(shù)據(jù)普遍具有數(shù)據(jù)量?。∕B級別)、分布廣泛、獲取難度較大的特點,大部分為半結構化和非結構化數(shù)據(jù),需要對數(shù)據(jù)進行深加工才能加以利用。
2 高校圖書館實施數(shù)據(jù)監(jiān)護的重要性
2.1 有效促進數(shù)字資源共享
建立健全高校圖書館大數(shù)據(jù)的監(jiān)護管理工作體制,可以有效促進數(shù)據(jù)資源共享,且防止數(shù)據(jù)丟失。對于要分享給他人的科研數(shù)據(jù)來說,可以省去作者本身對數(shù)據(jù)的管理監(jiān)護,既節(jié)省了精力又節(jié)省了財力,只要管理得當,數(shù)據(jù)可以永久性保存,不會丟失。而對于其他的科研人員,可以通過高校圖書館的平臺搜索自己想要的信息,從已有的數(shù)據(jù)信息中查到相關的數(shù)據(jù),給自己的工作以啟發(fā),也很好地避免了重復性工作的出現(xiàn)。當前科研人員交流的內(nèi)容主要是科研成果,而研究的第一手原始數(shù)據(jù)資料尚沒有合適的交流渠道。在當前數(shù)字化背景下,科研工作者的各項科研活動都可以通過計算機完成,包括實驗數(shù)據(jù)、調(diào)查記錄等,這就形成了大量的電子數(shù)據(jù),為網(wǎng)絡化共享提供了可行性。而且如果研究數(shù)據(jù)丟失將會導致科研成果不完整,降低科研價值。圖書館憑借高穩(wěn)定性和可信度優(yōu)勢,可以建立一個由專人負責的長期運作的數(shù)據(jù)平臺,用以完整地收藏此類電子數(shù)據(jù),符合數(shù)字化時代的信息需求。
2.2 為讀者尋找信息提供了便捷
圖書館對采集到的各類服務器監(jiān)測的歷史數(shù)據(jù)和讀者的閱讀行為、社會關系、個體特征數(shù)據(jù)進行整理、分析和決策,以此來準確預測和分析讀者的閱讀需求,監(jiān)控讀者閱讀活動的輿情,提升讀者行為安全和質(zhì)量管理水平,為圖書館改革服務模式,創(chuàng)新服務舉措提供精準的數(shù)據(jù)決策支持,切實提升讀者服務水平。為此,圖書館應重點關注基于物聯(lián)網(wǎng)的大數(shù)據(jù)采集與管理平臺,加強以讀者服務為中心的數(shù)據(jù)感知層、平臺層和應用層的數(shù)據(jù)監(jiān)護,確?;诖髷?shù)據(jù)決策的準確性、科學性和前瞻性。除了數(shù)據(jù)共享方面的重要性,通過數(shù)據(jù)監(jiān)護管理的整理分析及更新,高校圖書館監(jiān)護管理系統(tǒng)能為讀者快速地尋找到想要的信息提供了便捷。
2.3 可以大大的促進圖書館自身的發(fā)展
隨著讀者需求和用戶QS標準的不斷提高,以往傳統(tǒng)的數(shù)字資源保存方法已不能滿足大數(shù)據(jù)時代的需求?,F(xiàn)代圖書館大數(shù)據(jù)管理除了要保證數(shù)據(jù)資源的可用性、安全性、經(jīng)濟性和易控性,還需要根據(jù)數(shù)據(jù)生命周期的規(guī)律,依據(jù)最新的大數(shù)據(jù)監(jiān)護技術對數(shù)據(jù)資源進行存儲和管理,并不斷地進行完善和優(yōu)化[2]。高校圖書館大數(shù)據(jù)監(jiān)護管理系統(tǒng)的運行大大促進了圖書館自身的發(fā)展。隨著信息服務領域競爭的日益激烈,高校圖書館要想在競爭中屹立不倒,充分發(fā)揮自身的價值,就要有自己的獨特之處。大數(shù)據(jù)監(jiān)護管理系統(tǒng)的發(fā)展運行,將科研數(shù)據(jù)有效融合到高校圖書館管理之中,既方便了讀者對科研信息的瀏覽查閱,也充分發(fā)揮了高校圖書館的價值,更有利于自身發(fā)展。
參考文獻
[1]袁梁.大數(shù)據(jù)時代高校圖書館個性化服務研究[J].圖書情報導刊,2018,3(10):19-22.
[2]李成.高校圖書館大數(shù)據(jù)監(jiān)護系統(tǒng)的研究[J].新課程研究(中旬刊),2016(08):102-103.