司新霞
(三峽大學 圖書館,湖北 宜昌 443002)
《普通高等學校圖書館規(guī)程》(教高〔2015〕14號)第三條規(guī)定“圖書館的主要職能是教育職能和信息服務(wù)職能”。高校圖書館的兩大職能都需要通過服務(wù)功能來體現(xiàn)。做好用戶服務(wù)已經(jīng)成為圖書館工作的永恒主題。傳統(tǒng)圖書館以文獻為描述單元,以《中國文獻編目規(guī)則》為依據(jù),通過文獻分類編目組織文獻資源,形成書目數(shù)據(jù),為圖書館用戶提供查閱、借還等服務(wù)。傳統(tǒng)書目組織模式已不能完全適應(yīng)并滿足大數(shù)據(jù)環(huán)境下用戶不斷變化的信息知識需求[1]。如何更好地利用ICT(information and communications technology,信息與通信技術(shù))技術(shù),為用戶提供更精準的服務(wù),已經(jīng)成為圖書館用戶服務(wù)中必須面對的重要課題。筆者先分析了圖書館用戶服務(wù)環(huán)境和用戶需求的變化,再比較了文獻資源數(shù)字化與文獻資源數(shù)據(jù)化的異同,最后,探討了通過文獻資源數(shù)據(jù)化,將文獻資源分解成更細粒度的知識元,依據(jù)用戶需求重組更細粒度的知識元,得到滿足圖書館用戶需求的知識,達到提供更精準的圖書館用戶服務(wù)的目的。
ICT技術(shù)的快速發(fā)展,圖書館用戶服務(wù)環(huán)境發(fā)生了深刻的變化。移動互聯(lián)網(wǎng)、大數(shù)據(jù)、云計算等技術(shù)為延伸圖書館用戶服務(wù)的時間和空間、提升圖書館用戶服務(wù)水平提供了堅實的基礎(chǔ)。
移動互聯(lián)網(wǎng)是移動通信和PC互聯(lián)網(wǎng)融合的產(chǎn)物,繼承了移動通信無時不在、無處不在和PC互聯(lián)網(wǎng)開放互聯(lián)、共享融通的優(yōu)勢,它讓圖書館用戶服務(wù)不再受限于時間和空間。
進行圖書館借還等業(yè)務(wù)時,PC和移動App系統(tǒng)記錄了用戶與圖書館相關(guān)的各類數(shù)據(jù),利用大數(shù)據(jù)技術(shù)通過用戶唯一的ID號將分散在各類系統(tǒng)中的數(shù)據(jù)進行融合,構(gòu)建用戶畫像,有利于用戶的個性化、精準化服務(wù)。
世界著名的未來學家約翰·奈斯比特曾在其著作《大趨勢》所寫:“我們雖然淹沒在信息的海洋中,但是卻渴求所需的知識?!?這句話道出了用戶服務(wù)的現(xiàn)狀和用戶需求的變化。用戶已不再滿足于通過文獻信息檢索、原文傳遞、館際互借、查收查引、定題跟蹤、科技查新等圖書館用戶服務(wù)方式提供的文獻集合。用戶需要的是通過分析、重組等多種方式而得到的滿足他們需求的內(nèi)容。
隨著“網(wǎng)絡(luò)移民”的退休,“網(wǎng)絡(luò)原住民”逐漸成為圖書館用戶的主流。這些用戶具有鮮明的時代特征,他們受教育程度高、知識面廣、個性鮮明等。這些用戶的需求已經(jīng)從圖書借還等的共性需求轉(zhuǎn)化為面向特定專業(yè)領(lǐng)域、面向特定研究問題等的個性需求。這些用戶對能滿足不同類型用戶個性需求的圖書館智能推介服務(wù)有了更多的期待。
隨著“網(wǎng)絡(luò)原住民”成為圖書館用戶的主流,他們鮮明的時代標簽決定了這類圖書館用戶的需求不再局限于單一的紙質(zhì)文獻、單一的線下服務(wù),而是轉(zhuǎn)變?yōu)榧堎|(zhì)文獻和電子文獻的同步需求,線上、線下服務(wù)的共同需求。
基于這些變化,圖書館需要通過文獻資源數(shù)據(jù)化,重組細粒度的文獻信息 “知識元”,才能深度揭示館藏資源,在現(xiàn)有數(shù)字化的基礎(chǔ)上更進一步,為提供更精準的知識服務(wù)打下基礎(chǔ)。
所謂文獻資源數(shù)字化是指利用鍵盤、鼠標、掃描儀等輸入設(shè)備,將文本、圖像等各類文獻資源轉(zhuǎn)化為0、1表示的二進制編碼的過程。通過這樣的轉(zhuǎn)換,各類文獻資源得以存入磁盤等計算機存儲設(shè)備中[2],為后續(xù)文獻資源的組織、開發(fā)和利用打下了堅實的基礎(chǔ)。文獻資源數(shù)字化的核心是以計算機為工具去管理和共享海量的文獻資源。文獻資源數(shù)字化的方法有:DC元數(shù)據(jù)、TEI元數(shù)據(jù)、MARC元數(shù)據(jù)等。圖書館界普遍采用的文獻資源數(shù)字化的方法是MARC(機器可讀目錄)元數(shù)據(jù)。MARC最初由美國國會圖書館研制,后經(jīng)多次修訂,歷經(jīng)MARCII、UNIMARC等多個版本,現(xiàn)已成為一個國際標準。中國國家圖書館同仁以UNIMARC 格式為基礎(chǔ)并結(jié)合中國的實際情況,于1991年提出了與UNIMARC完全兼容的CNMARC(中國機器可讀目錄),用于中文信息資源的數(shù)字化,方便了海量中文文獻資源的查找[3,4]。然而,由于其對文獻自身所包含的知識內(nèi)容揭示不夠,因此難以滿足用戶從這類數(shù)字化的文獻資源中獲得相關(guān)知識的需求。
ICT技術(shù)的快速發(fā)展,使從更細粒度分析和利用文獻資源成為現(xiàn)實,同時也將文獻資源數(shù)字化帶到文獻資源數(shù)據(jù)化的發(fā)展階段。數(shù)據(jù)化是指一種把現(xiàn)象變成可制表分析的量化形式的過程[5]。而文獻資源數(shù)據(jù)化是指以數(shù)字化的文獻資源為基礎(chǔ),將這些文獻資源組織為數(shù)據(jù)、公式、事實、結(jié)論等細粒度“知識元”的過程。知識元是知識控制與處理的基本單位,是知識結(jié)構(gòu)的基元[6]。將眾多的知識元按照一定的語義鏈接在一起,發(fā)掘、揭示它們之間的各種關(guān)聯(lián),可以帶來知識價值的增值,并創(chuàng)造出新的知識。文獻資源數(shù)據(jù)化的意義是將利用文獻的方式從“讀”轉(zhuǎn)變?yōu)椤胺治觥保浜诵姆椒ㄊ侵亟M文獻內(nèi)容,置入使用者所建立的新的文本或數(shù)據(jù)結(jié)構(gòu)中,即文獻的結(jié)構(gòu)化[7]。
“用戶畫像”(Persona)的概念由Alan Cooper首次提出,認為它是現(xiàn)實生活中真實用戶的虛擬表示,是建立在一系列真實數(shù)據(jù)基礎(chǔ)上的用戶模型[8]。為了用戶服務(wù)的精準性,圖書館利用大數(shù)據(jù)、移動互聯(lián)網(wǎng)等現(xiàn)代信息技術(shù)收集、整理與分析專業(yè)背景、社會屬性、信息行為等標簽化的用戶數(shù)據(jù),并以此為基準進行模型化構(gòu)建,從而得到圖書館用戶畫像[9]。圖書館用戶畫像一般由屬性標簽、行為標簽、興趣標簽、場景標簽等來構(gòu)成。圖書館用戶屬性標簽主要包括圖書館用戶的專業(yè)、教育程度、年齡、性別等;圖書館用戶行為標簽主要包括登錄圖書館網(wǎng)站、CNKI等中外文數(shù)據(jù)庫平臺,借閱各類圖書、期刊,下載與閱讀各類專業(yè)數(shù)據(jù)庫資源,參加各類數(shù)據(jù)庫系統(tǒng)使用的培訓(xùn),利用微信公眾號等移動平臺的訪問、續(xù)借、咨詢等。圖書館用戶畫像較好地反映了該圖書館用戶的信息需求,并會隨著該圖書館用戶信息行為的變化而變化。同時,根據(jù)圖書館用戶信息需求的群體屬性特征,聚類形成的圖書館用戶群體畫像分析,還可呈現(xiàn)出不同群體圖書館用戶的行為特征[10]。
文獻資源數(shù)據(jù)化主要是重組文獻信息細粒度的“知識元”,滿足圖書館用戶日益變化的信息需求,提供更精準的圖書館用戶服務(wù)。①基于文獻資源數(shù)據(jù)化的專題服務(wù)。專題服務(wù)是圖書館用戶精準服務(wù)的主要手段。先獲取需要提供專題服務(wù)用戶的用戶畫像,通過大數(shù)據(jù)ETL、大數(shù)據(jù)融合等技術(shù)將文獻資源先“知識元”化,然后根據(jù)用戶畫像的數(shù)據(jù)標簽,將選取的 “知識元”重組為滿足圖書館用戶需求的“知識單元”。②基于文獻資源數(shù)據(jù)化的跟蹤服務(wù)。隨著時間的推移,圖書館用戶的信息需求會發(fā)生相應(yīng)的改變,同時反映圖書館用戶需求的圖書館用戶畫像也會發(fā)生相應(yīng)的改變。根據(jù)變化后的圖書館用戶畫像中的數(shù)據(jù)標簽,系統(tǒng)定期自動重組“知識元”,生成新的“知識單元”,從而滿足圖書館用戶新的“信息需求”。③基于文獻資源數(shù)據(jù)化的個性化推薦服務(wù)。針對一些特定時間(比如新生入學、考研季、就業(yè)季等)和特定群體圖書館用戶(比如:低年級本科生、高年級本科生、碩士研究生、博士研究生等)等,根據(jù)特定群體圖書館用戶畫像開展有針對性的個性化推薦服務(wù),比如:通過重組數(shù)據(jù)化的考研信息、考研輔導(dǎo)書,為考研的圖書館用戶推薦他們合適的學校、專業(yè)以及提供考研過程中的一些建議。