高校圖書館對于編目數(shù)據(jù)的規(guī)范和分類有著較多的研究和實踐應(yīng)用,傳統(tǒng)概念中的圖書館數(shù)據(jù)也以編目數(shù)據(jù)為主要內(nèi)容。隨著計算機和網(wǎng)絡(luò)技術(shù)越來越多的應(yīng)用于高校圖書館,高校圖書館的各類業(yè)務(wù)系統(tǒng)越來越多,數(shù)字化資源越來越多,各類業(yè)務(wù)系統(tǒng)產(chǎn)生和積累的數(shù)據(jù)量越來越大,數(shù)據(jù)類型越來越多,早已遠遠超出編目數(shù)據(jù)所能覆蓋的范圍和規(guī)模;尤其是近年來隨著大數(shù)據(jù)理論發(fā)展和應(yīng)用范圍的不斷擴大,高校圖書館也在不斷探索和應(yīng)用大數(shù)據(jù)來提高服務(wù)水平和擴大服務(wù)范圍,不少高校圖書館已經(jīng)在提供年度的數(shù)據(jù)報告,館內(nèi)業(yè)務(wù)的發(fā)展和館外服務(wù)需求的多元化都對圖書館數(shù)據(jù)的規(guī)范化和標準化管理及應(yīng)用提出了更高的要求。
數(shù)據(jù)已成為當(dāng)今社會發(fā)展進程中最重要資源的之一。高等院校圖書館理應(yīng)抓住技術(shù)發(fā)展的契機,挖掘數(shù)據(jù)價值,讓數(shù)據(jù)紅利最大限度的釋放出來,從沉淀的數(shù)據(jù)中發(fā)現(xiàn)有價值的信息,深入挖掘、綜合利用、轉(zhuǎn)化為知識,才是信息系統(tǒng)真正價值的體現(xiàn),而這方面可拓展的空間幾乎是不可限量的[1]。
高校圖書館日常工作與讀者服務(wù)中產(chǎn)生的各種數(shù)據(jù),已經(jīng)成為其轉(zhuǎn)型、創(chuàng)新的最為可靠的信息源和決策依據(jù)之一。網(wǎng)絡(luò)信息技術(shù)的飛速進步以及其不斷深入的融入圖書館各類業(yè)務(wù)中,既增加了高校圖書館數(shù)據(jù)的存儲量也加快了數(shù)據(jù)流動的速度,給圖書館的數(shù)據(jù)管理和統(tǒng)計等工作增加了的難度。門禁數(shù)據(jù)屬于圖書館的基礎(chǔ)數(shù)據(jù)之一,門禁數(shù)據(jù)中的讀者進出館記錄是讀者到訪圖書館最直觀的反映,而進館人次、進館人數(shù)以及在館時長則可以反映圖書館的利用效率和讀者喜愛圖書館的程度[2]。對這個海量數(shù)據(jù)進行不同維度的統(tǒng)計分析,將對圖書館服務(wù)策略的制定有很大的指導(dǎo)意義[3]。
2019 年度,開館共358 天合計5 370 小時(開館時間7:00-22:00),有26 127 位讀者2 083 731 次入館,入館讀者類型分布情況如圖1 所示,本科生占了入館讀者的80%以上。
圖1 入館讀者類型分布
林大圖書館每天開館時間為7:00-22:00(實際運行過程中,每天7:00 以前就開館,閉館也在22:00 之后),以平均數(shù)來衡量,如表1 所示(每個整點指的是此后一個小時的時間,比如6 指的是6:00-7:00 之間,其他以此類推),每天的7 點至9點、12 點至13 點和17 點至19 點為入館高峰時間段,每天的10 點至11 點、16 點至17 點和21 點至22點為入館的人次最少的時間段,就不同類型的讀者而言,本科生讀者的入館時間分布與以上規(guī)律完全吻合,而研究生入館的高峰時間段則更為集中,相對而言,教工讀者入館在每個時間段都比較少,對每個時間段的入館總?cè)藬?shù)幾乎沒什么影響。
表1 每小時入館人次統(tǒng)計表
在入館高峰時間段,考驗著門禁系統(tǒng)和設(shè)備的可靠性,也考驗著圖書館的容納能力和服務(wù)能力;在高峰時間段,人員配備上要有所側(cè)重,一旦出現(xiàn)突發(fā)狀況要及時處理;對于入館讀者而言,如果時間上沒有要求,可以選擇入館人次少的時間段。
如圖2 所示,一周中周五是本科生入館最少的一天,而研究生和教工則是在周末入館最少。除去入館最少的一天,其余時間各類讀者每天入館人次較為均衡。
圖2 一周內(nèi)每天入館人次統(tǒng)計
如圖3 所示,各類型讀者以月度入館情況來看,有著明顯的不同,本科生在11 月入館人次最多,研究生入館人次最多的月份是3 月,教工讀者入館最多月份在9 月,相對而言,寒暑假對教工讀者入館的影響沒有學(xué)生讀者那么明顯。
圖3 每月入館人次統(tǒng)計
按年級統(tǒng)計,本科生15-19 級入館人次分別是:202 017(上半年),752 491,411 132,233 925,125 222(下半年),高年級入館人次明顯更多一些,按月份統(tǒng)計,各年級入館情況又有所不同,如圖4 所示,畢業(yè)生(16 級)入館高峰月份是9 月和11 月,而其他年級則是從9 月開始,每月逐步增多(10 月由于國慶假期影響,入館總?cè)舜温杂邢陆担?2 月達到最高峰,另外,6 月也是入館高峰月。
圖4 本科生各年級每月入館人次統(tǒng)計
如圖5 所示,經(jīng)濟管理學(xué)院的本科生入館人次最多,其次是園林學(xué)院和工學(xué)院,馬克思主義學(xué)院和草學(xué)院由于最近幾年才成立,在校學(xué)生數(shù)量少,入館人次也明顯少。
圖5 各學(xué)院本科生每月入館人次統(tǒng)計
根據(jù)不同類型的讀者在各時間段的入館數(shù)據(jù)的統(tǒng)計結(jié)果,本科生、研究生和教工在一天內(nèi)入館時間分布基本相似;如果按照一周內(nèi)的每天的入館數(shù)據(jù)來觀察,則本科生和研究生及教工有所不同,研究生和教工在周末入館較少,而本科生則不然;按月份來觀察,本科生、研究生和教工入館高峰月份各不相同。
就本科生而言,越高的年級入館人次越多,學(xué)院之間入館人次差別比較大。
對讀者入館數(shù)據(jù)進行多種維度的統(tǒng)計和分析,會得到關(guān)于讀者入館的較為全面的數(shù)據(jù)和信息,將多維度的數(shù)據(jù)和信息進行更加深入的融合、處理和分析,將會為圖書館在提高服務(wù)質(zhì)量、精準服務(wù)等方面提供良好的決策輔助支持。入館數(shù)據(jù)信息除了可以應(yīng)用在圖書館自身發(fā)展和完善方面之外,如果把更多類別的數(shù)據(jù)比如教務(wù)數(shù)據(jù)、一卡通數(shù)據(jù)等多種信息和入館數(shù)據(jù)結(jié)合起來進行數(shù)據(jù)挖掘,將可以得到更多更有價值的數(shù)據(jù)規(guī)律和信息,為學(xué)校的長遠規(guī)劃和發(fā)展策略制訂提供數(shù)據(jù)和信息支持。
要以數(shù)據(jù)為依托去規(guī)劃和計劃高校圖書館未來和業(yè)務(wù),或者說在充分掌握和分析數(shù)據(jù)的基礎(chǔ)上去考慮圖書館的業(yè)務(wù)和服務(wù);無論拓展什么業(yè)務(wù)、提供什么資源、創(chuàng)新什么服務(wù),要有數(shù)據(jù)依據(jù),要考慮到數(shù)據(jù)的存儲、處理和融合,要在大數(shù)據(jù)環(huán)境下進行思考、規(guī)劃和行動。
圖書館的數(shù)據(jù)存在于不同的平臺,依附于不同的業(yè)務(wù)流程,數(shù)據(jù)的標準、格式、類型、表現(xiàn)形式和存儲結(jié)構(gòu)千差萬別。在現(xiàn)有技術(shù)條件下,完全收集、整理和處理這些數(shù)據(jù)是一件非常困難的事情[4]。宜制定合適的數(shù)據(jù)價值評估標準,將不同的數(shù)據(jù)賦予不同的權(quán)重,再按照其重要性進行排序與分類,將數(shù)據(jù)價值進行合理分布,也有利于收集核心數(shù)據(jù)。更方便后續(xù)收集、存儲和利用數(shù)據(jù)。通常來說,圖書館的大數(shù)據(jù)采集要涵蓋資源、讀者、服務(wù)等主題,每個主題要有不同的屬性特征。此外,要從大數(shù)據(jù)的角度出發(fā),根據(jù)實際需求確定需要哪些數(shù)據(jù)、缺少哪些數(shù)據(jù)、哪些數(shù)據(jù)的精度還不符合具體實施的要求,主動地協(xié)同相關(guān)部門或者廠商來補充和生產(chǎn)這些數(shù)據(jù),形成一個循環(huán)可持續(xù)發(fā)展的數(shù)據(jù)體系。
大數(shù)據(jù)背景下,圖書館的管理方式、工作方式發(fā)生了翻天覆地的變化,這要求館員要能夠在海量的信息中發(fā)現(xiàn)有價值的信息,對數(shù)字資源進行篩選、評估、判斷、處理,同時也要求館員具有一定的管理能力以及創(chuàng)新思維,這對圖書館館員,特別是對于非圖情專業(yè)人員來說,是一個巨大的挑戰(zhàn)[5]。
在大數(shù)據(jù)時代,高校圖書館普遍面臨的問題就是如何建設(shè)一支兼具數(shù)據(jù)管理能力和管理能力的館員隊伍,具體來說就是如何實現(xiàn)對具有傳統(tǒng)知識結(jié)構(gòu)的館員進行全面的業(yè)務(wù)能力和素質(zhì)提升。大多數(shù)高校圖書館不具備對館員進行數(shù)據(jù)管理方面知識培訓(xùn)的設(shè)施及能力,對普通館員而言,學(xué)習(xí)交流和深造的機會也比不多。
目前同時具備主動服務(wù)意識、數(shù)據(jù)處理和分析能力、開發(fā)隱性知識的能力、基本的專業(yè)學(xué)科知識、開拓創(chuàng)新能力的館員少之又少,數(shù)據(jù)方面的高精尖人才相當(dāng)匱乏;國內(nèi)一些高校已經(jīng)開展了多年的大數(shù)據(jù)碩士和博士的培養(yǎng),高校圖書館應(yīng)采取有力措施加強這類專門人才的引進;增強對高層次的專業(yè)人才、復(fù)合型人的吸引力,要加強這方面人才的培養(yǎng)和儲備,不斷加強人力資源建設(shè),為高校圖書館的轉(zhuǎn)型打下有力基礎(chǔ)。
各高校圖書館的數(shù)據(jù)組成不完全相同,但有很多數(shù)據(jù)是屬于高校圖書館都擁有的,比如數(shù)目數(shù)據(jù)、讀者數(shù)據(jù)、電子資源數(shù)據(jù)、入館數(shù)據(jù)等,對于這一類數(shù)據(jù),各高校圖書館宜加強協(xié)作,形成統(tǒng)一的標準和規(guī)范,有利于數(shù)據(jù)的共享和利用,也有利于館際之間橫向比較,更利于各高校圖書館深度挖掘分析數(shù)據(jù),制定符合本館實際的發(fā)展策略。
要在具體業(yè)務(wù)和工作中運用大數(shù)據(jù)技術(shù)面臨著不少的挑戰(zhàn),比如數(shù)據(jù)源、數(shù)據(jù)處理和分析的技術(shù)與人才,以及支撐大數(shù)據(jù)運行的設(shè)備、設(shè)施等,依靠本館的力量來完成,對很多高校圖書館來說是非常困難的,即便圖書館聯(lián)合起來,完成某些大數(shù)據(jù)的應(yīng)用也有相當(dāng)大的難度。所以不僅業(yè)內(nèi)要聯(lián)合,還要積極和技術(shù)廠商合作,不能僅僅局限與購買廠商的技術(shù)和設(shè)備,而是高校圖書館要積極參與其中,雙方各自發(fā)揮優(yōu)勢來為讀者提供更好的服務(wù)。另外,要和本校的相關(guān)部門加強合作,如教務(wù)處、科研處、研究生學(xué)院、學(xué)生處、規(guī)劃處等等,多部門共享數(shù)據(jù),協(xié)作共贏。
大數(shù)據(jù)的出現(xiàn),徹底改變了我們對數(shù)據(jù)的傳統(tǒng)看法與認識,很多有價值的信息和規(guī)律隱含在數(shù)據(jù)之中,通過對大數(shù)據(jù)的整理、提煉、分析、轉(zhuǎn)化、應(yīng)用,我們會找到隱藏在大量數(shù)據(jù)背后的世界,從而指導(dǎo)我們各項工作的努力方向,大數(shù)據(jù)的應(yīng)用是多種技術(shù)和方法的高度集成應(yīng)用,需要人工智能、數(shù)學(xué)算法、商業(yè)智能、自然語言理解、信息技術(shù)等多個跨學(xué)科領(lǐng)域的知識和技術(shù)。只有在實踐中不斷的摸索其發(fā)展規(guī)律、不斷的積累分析,方能真正的挖掘出其隱藏的價值。
高校圖書館作為技術(shù)敏感度很高的機構(gòu),應(yīng)持續(xù)關(guān)注技術(shù)發(fā)展,積極思考并嘗試利用最新的信息技術(shù)尤其是數(shù)據(jù)技術(shù)來解決圖書館信息服務(wù)和資源發(fā)現(xiàn)中的各類問題,全面掌握和讀者的行為數(shù)據(jù),理解和發(fā)現(xiàn)讀者的信息需求,以期獲得新突破,完成高校圖書館從管理型圖書館向服務(wù)型圖書館的轉(zhuǎn)型升級。
大數(shù)據(jù)時代一個顯著的特點是開放性,在這個大平臺上,數(shù)據(jù)是開放式的,資源也是開放式的,通過數(shù)據(jù)共享,圖書館可以確保其資源得到最大限度的利用,價值實現(xiàn)最大化,但同時,最大的安全隱患便是個人隱私受到了嚴重威脅[6]。
高校圖書館獲取或者存儲的所有與讀者身份、讀者行為相關(guān)的數(shù)據(jù),一切以為讀者提供更好的服務(wù)為目的,這也是唯一的目的,必須保障數(shù)據(jù)的完整性和安全性;圖書館在提供各種服務(wù)時,要充分考慮不同類型用戶對隱私信息保護的不同訴求,為保護用戶隱私提供安全、穩(wěn)定和持續(xù)性的、可信的有力措施。