范家巧
20世紀末圖書館學界開始研究數(shù)字資源融合課題,重點以圖書館資源為研究對象,對數(shù)字資源整合問題進行探討,取得了較多成果。相關(guān)研究側(cè)重于數(shù)字資源整合目標、意義、內(nèi)涵、功能、方式、環(huán)境等問題研究。大數(shù)據(jù)技術(shù)的出現(xiàn)和發(fā)展為數(shù)字資源整合帶來了新的機遇與挑戰(zhàn)。國外較早開展相關(guān)研究,研究內(nèi)容多元化,理論成果豐富。國內(nèi)外學術(shù)界共同關(guān)注大數(shù)據(jù)技術(shù)相關(guān)的數(shù)據(jù)挖掘、分析及處理技術(shù),區(qū)別在于國外更關(guān)注基礎理論及技術(shù)方面問題,我國側(cè)重于具體的應用問題,探討分析大數(shù)據(jù)技術(shù)對不同行業(yè)、領(lǐng)域的影響以及應用方式[1-5]。數(shù)字資源融合是較受關(guān)注的領(lǐng)域,探討分析數(shù)字圖書館的資源融合與信息共享問題,雖然已經(jīng)取得豐富的理論研究成果,但仍然無法從根本上克服數(shù)字資源分布分散性、建設重復性、利用水平低下等不足,影響了數(shù)字資源的綜合價值與利用潛力[6-8]。在大數(shù)據(jù)環(huán)境中,圖書館數(shù)字資源得到新的發(fā)展,類型不斷豐富,總量高速擴張。對圖書館而言,數(shù)據(jù)資源融合可以理解為數(shù)字資源與大數(shù)據(jù)融合發(fā)展的過程,是以同一平臺為基礎的數(shù)據(jù)融合,進而實現(xiàn)平臺、服務與技術(shù)的全面融合,在數(shù)據(jù)資源高度共享與充分利用的基礎上,提升服務質(zhì)量[9]。其特點主要表現(xiàn)在4個方面:
(1)資源無縫鏈接。數(shù)字資源融合能夠突破圖書館數(shù)字資源的時間與空間局限性,實現(xiàn)不同圖書館分散零碎數(shù)據(jù)資源的整合,形成更完善、規(guī)模更龐大的圖書館大數(shù)據(jù),避免“數(shù)據(jù)孤島”問題對圖書館數(shù)字資源利用的影響,為不同圖書館資源共享提供無縫鏈接的平臺,既提升資源利用率,也為數(shù)據(jù)開發(fā)利用提供更有效的支持。
(2)數(shù)據(jù)關(guān)聯(lián)分析。2006年后關(guān)聯(lián)數(shù)據(jù)成為圖書館領(lǐng)域關(guān)注重點,為了優(yōu)化業(yè)務和服務,圖書館以大數(shù)據(jù)技術(shù)為基礎開展關(guān)聯(lián)分析,分析用戶行為偏好,進行用戶畫像,進而分析圖書館資源與用戶之間的相互關(guān)系,從而對自身資源分布情況進行優(yōu)化,更好地滿足用戶需求。
(3)知識轉(zhuǎn)化發(fā)現(xiàn)?;诖髷?shù)據(jù)技術(shù)的資源融合能夠?qū)D書館數(shù)字資源進行整合,構(gòu)建不同領(lǐng)域的數(shù)據(jù)庫,開展數(shù)據(jù)挖掘和數(shù)據(jù)處理,對整合資源進行科學分析,準確把握數(shù)據(jù)的內(nèi)在關(guān)聯(lián),幫助用戶構(gòu)建起知識體系,發(fā)揮關(guān)聯(lián)資源的融合效應,實現(xiàn)資源的充分利用和價值創(chuàng)造。
(4)服務融合創(chuàng)新。在激烈的競爭環(huán)境下,服務質(zhì)量成為圖書館發(fā)展關(guān)鍵。為了實現(xiàn)科學發(fā)展,服務功能的拓展與服務質(zhì)量的提升成為核心工作。圖書館服務表現(xiàn)為個性化、多樣化、定制化等特征,基于大數(shù)據(jù)技術(shù)的綜合服務成為趨勢。
在此背景下,如何應用大數(shù)據(jù)技術(shù)對圖書館數(shù)字資源進行高效融合與轉(zhuǎn)化成為值得關(guān)注的問題。本文從理論研究層面對大數(shù)據(jù)技術(shù)背景下的圖書館數(shù)字資源的特征、發(fā)展模式、創(chuàng)新理念進行梳理和總結(jié),對數(shù)據(jù)共享、信息開放、資源融合等理念進行闡述,進一步完善數(shù)字資源理論的內(nèi)容,以期為圖書館數(shù)字資源管理與利用模式的科學創(chuàng)新提供理論依據(jù)。
海量數(shù)據(jù)的有機融合是數(shù)字資源融合的具體表現(xiàn),是將不同圖書館所擁有的數(shù)字資源進行全部融合,實現(xiàn)數(shù)據(jù)跨時間、跨空間的高度融合;是與圖書館有關(guān)的所有數(shù)據(jù)的統(tǒng)一整合,從而為數(shù)據(jù)挖掘和利用提供充分的數(shù)據(jù)支持,以此實現(xiàn)數(shù)據(jù)價值的最大化?;跁r間維度,圖書館數(shù)字資源的融合是數(shù)據(jù)在時間層面的積累與整合,是對過去、當前與未來數(shù)據(jù)的全面融合;基于空間維度,圖書館數(shù)字資源的融合是對不同地區(qū)、不同圖書館數(shù)據(jù)的全面整合,也是對資源數(shù)據(jù)、業(yè)務數(shù)據(jù)、用戶數(shù)據(jù)、行業(yè)數(shù)據(jù)的全面整合。因此,對于圖書館而言,數(shù)字資源的整合需要對不同主體、不同來源、不同類型的數(shù)據(jù)進行融合,是一項復雜的系統(tǒng)工程。
在大數(shù)據(jù)技術(shù)高速發(fā)展推動下,應用內(nèi)容不斷豐富,逐漸形成多種不同的技術(shù)體系。不同技術(shù)體系在數(shù)據(jù)處理流程及方法上存在差異,但大致可概括為大數(shù)據(jù)的采集、導入和預處理、統(tǒng)計分析、挖掘等4個不同步驟。具體到圖書館領(lǐng)域,大數(shù)據(jù)處理同樣基于4個基本流程完成。通過上述步驟,能夠簡單完成數(shù)字資源的融合。但由于圖書館資源呈現(xiàn)出顯著的服務特性,使得簡單的資源融合無法滿足實際需求,必須在服務融合的基礎上保證服務質(zhì)量,以此滿足用戶不斷提升的服務需求。基于大數(shù)據(jù)技術(shù)環(huán)境,圖書館數(shù)字資源融合可采取以下思路:
(1)大數(shù)據(jù)收集。從時間與空間兩個維度出發(fā),完成所有數(shù)據(jù)的收集工作,確保數(shù)據(jù)收集的完整性與可靠性。該項工作需要完善的基礎設施和先進的存儲技術(shù),對存儲容量也有更高的要求。
(2)大數(shù)據(jù)組織加工。圖書館大數(shù)據(jù)不可避免地存在重復、冗余、錯誤數(shù)據(jù)信息,這會影響數(shù)據(jù)處理的準確性與效率。因此,在具體應用中,首先需要對數(shù)據(jù)進行預處理,完成數(shù)據(jù)清洗之后將有效信息導入融合系統(tǒng),并由系統(tǒng)對數(shù)據(jù)進行分類和轉(zhuǎn)換,確保數(shù)據(jù)的適用性與可靠性。
(3)大數(shù)據(jù)分析應用。以用戶的特定需求為出發(fā)點,一是可以借助大數(shù)據(jù)技術(shù)對圖書館的數(shù)字資源進行處理,為問題的解決提供依據(jù);二是在未提前明確需求的基礎上,借助數(shù)據(jù)挖掘技術(shù)對大規(guī)模數(shù)據(jù)進行分析,從中挖掘潛在價值,從而為圖書館各項業(yè)務提供科學指導,也以大數(shù)據(jù)服務的形式滿足用戶的需求。
圖1 數(shù)字資源融合轉(zhuǎn)化體系
大數(shù)據(jù)技術(shù)環(huán)境下,圖書館資源融合的主要內(nèi)容可以分為數(shù)據(jù)、平臺與服務等3個層面上的要素融合,從而構(gòu)建起資源高度共享與利用的交互平臺。具體而言,資源融合的基礎為數(shù)據(jù)融合,關(guān)鍵技術(shù)環(huán)節(jié)為平臺融合,最終目標則是不同圖書館的服務融合。數(shù)據(jù)融合能實現(xiàn)海量異構(gòu)數(shù)據(jù)在同一平臺上的融合,并在此基礎上構(gòu)建起圖書館的業(yè)務與服務平臺,為用戶提供更加全面高效的信息服務,提升自身的競爭力[10]。基于大數(shù)據(jù)技術(shù)的資源融合與轉(zhuǎn)化過程如圖1所示。
在數(shù)據(jù)融合層,資源融合的對象是不同圖書館所擁有的不同的數(shù)字資源,上述數(shù)字資源以原始資源的形式作為融合對象,針對不同圖書館數(shù)據(jù)資源的分散、異構(gòu)等問題,通過科學有效的方法對其進行處理,構(gòu)建起數(shù)據(jù)資源充分融合與高度共享的體系,以此滿足用戶的資源查詢與處理需求。圖書館的原始數(shù)據(jù)資源主要包括資源數(shù)據(jù)、業(yè)務數(shù)據(jù)、用戶數(shù)據(jù)、行業(yè)數(shù)據(jù)等,涉及圖書館、用戶、外部機構(gòu)等多個主體。在圖書館數(shù)字資源融合過程中,則需要重點解決相關(guān)數(shù)據(jù)的公開性與安全性問題,在充分保護用戶數(shù)據(jù)安全的基礎上,盡可能提升數(shù)據(jù)的共享水平和利用效率[11]。此外,為了確保數(shù)據(jù)資源融合的充分性與可靠性,必須針對數(shù)據(jù)龐大、并發(fā)程度高等現(xiàn)實問題,構(gòu)建一個多中心、多層次的綜合型數(shù)據(jù)平臺,實現(xiàn)數(shù)據(jù)資源的集中管理,對不同區(qū)域、不同圖書館、不同類型的數(shù)字資源進行集中存放和統(tǒng)一管理,并基于元數(shù)據(jù)實現(xiàn)不同數(shù)據(jù)的科學關(guān)聯(lián)。
在大數(shù)據(jù)技術(shù)實現(xiàn)過程中,需要良好的基礎設施與處理技術(shù)才能確保大數(shù)據(jù)的充分利用,因此首先需要解決技術(shù)問題,才能為圖書館數(shù)字資源融合提供支持。圖書館大數(shù)據(jù)存在來源廣、規(guī)模大、異構(gòu)性、復雜性等特點,圖書館資源融合面臨較大的困難,無論是數(shù)據(jù)的采集、加工、處理還是應用,各個環(huán)節(jié)都比較困難,導致數(shù)據(jù)融合的風險較高,實施效果得不到充分保證。基于大數(shù)據(jù)技術(shù)環(huán)境,圖書館數(shù)字資源的融合必須以最新、最先進的數(shù)據(jù)處理技術(shù)為基礎,通過數(shù)據(jù)采集、數(shù)據(jù)挖掘、數(shù)據(jù)存儲、云計算、可視化技術(shù)、知識發(fā)現(xiàn)等技術(shù)共同完成數(shù)據(jù)資源的融合,為資源融合平臺的構(gòu)建提供充分的數(shù)據(jù)支持,從而實現(xiàn)良好的數(shù)據(jù)共享[12]。
圖書館龐大的數(shù)據(jù)資源能夠充分滿足圖書館的數(shù)據(jù)服務需求并保證圖書館的服務質(zhì)量,而良好的數(shù)據(jù)服務也是圖書館資源融合的目標所在。基于大數(shù)據(jù)技術(shù)環(huán)境,數(shù)據(jù)挖掘、數(shù)據(jù)分析是最基本、最核心的業(yè)務,也是大數(shù)據(jù)應用的關(guān)鍵環(huán)節(jié)。對于圖書館而言,數(shù)字資源的融合是大勢所趨,只有實現(xiàn)良好的數(shù)字融合,才能夠真正發(fā)揮其資源優(yōu)勢,提升圖書館的用戶服務水平,滿足現(xiàn)代用戶對數(shù)據(jù)資源的多樣性、個性化需求,從而充分挖掘資源價值?;诖髷?shù)據(jù)技術(shù)應用,能夠?qū)崿F(xiàn)對海量數(shù)字資源的科學整合與高效利用,并且在數(shù)據(jù)分析的基礎上準確把握用戶需求,從而實現(xiàn)數(shù)據(jù)服務的個性化與精準化,并通過數(shù)據(jù)挖掘、關(guān)聯(lián)分析、知識發(fā)現(xiàn)等技術(shù)方法不斷挖掘數(shù)字資源的潛在價值,更好的滿足用戶的資源需求,從而積極有效地提升圖書館的整體服務質(zhì)量,為圖書館的科學發(fā)展奠定良好基礎,以此實現(xiàn)圖書館數(shù)字資源融合的快速與穩(wěn)定發(fā)展。
重組網(wǎng)絡數(shù)據(jù)資源,對圖書館的知識資源進行科學加工,挖掘知識資源的潛在價值并實現(xiàn)知識創(chuàng)新?;谠獢?shù)據(jù)技術(shù),在完成本體的創(chuàng)建工作之后,可通過圖書館的原始數(shù)據(jù)對本體進行處理,實現(xiàn)數(shù)據(jù)資源的概念化與標準化轉(zhuǎn)換,并實現(xiàn)基于元數(shù)據(jù)標簽的數(shù)據(jù)聯(lián)結(jié),以此完成數(shù)據(jù)融合工作并充分保證數(shù)據(jù)融合的完整性與全面性。與此同時,數(shù)據(jù)聯(lián)結(jié)可以通過不同維度的方式進行關(guān)聯(lián),即表現(xiàn)為語義關(guān)系網(wǎng)絡的建構(gòu)過程,經(jīng)過映射后數(shù)據(jù)資源能夠建成集中網(wǎng)絡系統(tǒng),可以讓用戶的數(shù)據(jù)需求更好地得到調(diào)取與滿足,通過潛在語義網(wǎng)絡對數(shù)據(jù)資源進行挖掘和處理,從而實現(xiàn)知識創(chuàng)造并提升數(shù)據(jù)資源的價值。
這是利用主題內(nèi)容將語詞進行表達的文獻信息組織檢索的方式,可以利用大數(shù)據(jù)環(huán)境來實現(xiàn)有效應用。這種形式的資源融合可以將主題詞作為核心,將相關(guān)圖書館數(shù)字信息進行資源融合。根據(jù)圖書館中已有的資源數(shù)據(jù)信息,將相關(guān)數(shù)據(jù)實現(xiàn)完整融合,對于用戶來說,可以利用相關(guān)的關(guān)鍵詞,快速并模糊地找到檢索信息。對于圖書館大數(shù)據(jù)業(yè)務信息來說,利用某種具體業(yè)務作為核心主題,能夠?qū)崿F(xiàn)數(shù)據(jù)的有效融合,以大數(shù)據(jù)分析的方式來完成信息業(yè)務的展開研究。按照用戶數(shù)據(jù)進行類別劃分,通過不同的職業(yè)、年齡、性別、偏好等等,可以劃分出用戶具體的借閱模式,并根據(jù)用戶愛好進行信息內(nèi)容的推送。按照主題模式選擇融合方法,可以將主題核心詞通過關(guān)聯(lián)性確定下來,由此完成對語詞主題信息的融合。
信息融合的最終目的是為用戶提供更好的服務,以綜合性優(yōu)質(zhì)信息來建立以人為本信息服務方式。圖書館數(shù)字資源的融合基礎是用戶,這就是“用戶為中心”的服務理念建構(gòu),以用戶需求為核心,通過用戶特定信息將相關(guān)的數(shù)據(jù)融合到一起。依托大數(shù)據(jù)信息環(huán)境,幫助用戶解決在復雜多變資源環(huán)境中尋找具體數(shù)據(jù)信息的問題,通過信息檢索的方式確定用戶所需要的內(nèi)容。但是,現(xiàn)有檢索系統(tǒng)限制較多,難以完成“用戶中心”這個要求,所以應盡快進行合理的調(diào)整和解決,將信息數(shù)據(jù)實現(xiàn)市場化,實現(xiàn)與信息商間的競爭優(yōu)勢,確保信息服務領(lǐng)域能夠獲得更好的升級,由此滿足用戶對圖書館信息的需求。
該融合方式可以在應用層面實現(xiàn)邏輯上的無縫對接,滿足實時集成要求。圖書館的多個不同業(yè)務部門以不同信息服務方式將數(shù)據(jù)保留到數(shù)據(jù)庫表中,建構(gòu)數(shù)字資源融合平臺時,能夠以相關(guān)應用邏輯來定義具體的庫表內(nèi)外的動態(tài)關(guān)聯(lián)關(guān)系。此類融合模式表現(xiàn)出顯著的實時性與動態(tài)性特征,能夠通過應用邏輯完成數(shù)據(jù)資源的關(guān)系定義。
基于大數(shù)據(jù)技術(shù)應用環(huán)境,數(shù)據(jù)開放、信息公開已成必然趨勢,客觀地推動了圖書館數(shù)字資源的科學融合與高效利用,從而形成了更加完善、規(guī)模更加龐大的圖書館數(shù)據(jù)信息庫,實現(xiàn)不同圖書館數(shù)字資源的高度共享與科學整合,實現(xiàn)了數(shù)字資源的高效利用,為數(shù)據(jù)分析、處理奠定了良好基礎,也極大提升了數(shù)據(jù)挖掘效果,提高了數(shù)字資源的綜合利用率,促使圖書館的服務水平不斷提升,并且呈現(xiàn)出多元化的發(fā)展趨勢,有效地滿足不同用戶的使用需求與服務需求,實現(xiàn)了全方位、全過程的一站式數(shù)字資源服務模式。
基于云計算、大數(shù)據(jù)技術(shù)的優(yōu)勢功能,能顯著提升圖書館數(shù)字資源的融合水平,實現(xiàn)對數(shù)字資源的科學統(tǒng)籌與設計規(guī)劃,極大提升了圖書館數(shù)字化轉(zhuǎn)型發(fā)展速度,形成了以云計算為基礎、以大數(shù)據(jù)技術(shù)為核心的更加安全、高效、全面的數(shù)字資源平臺,極大地提升圖書館資源管理與服務的集約化、效率化水平,在有效降低資源管理與資源服務成本的同時,也提升了資源共享水平和應用水平,充分發(fā)揮了大數(shù)據(jù)、云計算等技術(shù)的優(yōu)勢功能,打造更加全面、完善的數(shù)字資源系統(tǒng),從而贏得用戶的廣泛認可,為自身發(fā)展奠定了良好的客戶基礎與服務基礎。
基于大數(shù)據(jù)技術(shù)的數(shù)據(jù)處理機制與管理流程,圖書館的數(shù)字資源將得到充分的融合發(fā)展,實現(xiàn)數(shù)據(jù)資源的有效獲取、科學存儲、高效處理與合理利用,提升圖書館的安全管理與標準化建設水平,滿足不同用戶的數(shù)字資源服務需求,提升服務能力,從而充分發(fā)揮數(shù)字融合的優(yōu)勢。
(1)圖書館大數(shù)據(jù)的獲取。在數(shù)據(jù)獲取環(huán)境,數(shù)字圖書館通常以RFID、傳感器技術(shù)、終端技術(shù)、視頻監(jiān)控技術(shù)等工具,通過合法的途徑對社會各個領(lǐng)域、行業(yè)的相關(guān)數(shù)據(jù)資源進行廣泛收集與科學整理,從而不斷豐富圖書館的數(shù)字資源,并在數(shù)據(jù)處理、分析和提煉的基礎上不斷充實數(shù)據(jù)庫,不斷提升數(shù)字資源服務水平。在圖書館的數(shù)據(jù)獲取環(huán)節(jié),主要是對現(xiàn)有的資源、業(yè)務、社交、用戶等數(shù)據(jù)進行收集和整理,針對不同的數(shù)據(jù)采取差異性的技術(shù)手段,充分保證數(shù)據(jù)資源的全面性與完善性,為數(shù)據(jù)分析和處理提供有效的數(shù)據(jù)資源,充分保證數(shù)據(jù)分析處理的水平,從而為數(shù)據(jù)挖掘奠定良好基礎,以此提升數(shù)據(jù)挖掘效果,為各項管理和服務提供更加可靠的依據(jù)。
(2)圖書館大數(shù)據(jù)的存儲與處理。在獲取所需數(shù)據(jù)之后,需要采取科學方法對數(shù)據(jù)進行存儲。數(shù)據(jù)存儲是數(shù)據(jù)分析處理的前提基礎,存儲管理水平將直接影響數(shù)據(jù)質(zhì)量和后續(xù)處理效率。在具體應用中,圖書館大數(shù)據(jù)主要通過實時采集、批量導入等方式完成數(shù)據(jù)獲取工作,然后在對數(shù)據(jù)進行優(yōu)化和處理后將其存儲于不同的介質(zhì)內(nèi),有效克服數(shù)據(jù)規(guī)模龐大、異構(gòu)問題對數(shù)據(jù)關(guān)聯(lián)的不利影響,充分保證數(shù)據(jù)處理與應用的水平?;诖髷?shù)據(jù)技術(shù)背景,圖書館的數(shù)據(jù)資源規(guī)模將迅速擴大,數(shù)據(jù)類型也日益復雜,若采取分布式的數(shù)據(jù)管理方式必然涉及各種不同類型數(shù)據(jù)的集中處理和存儲,需要采取科學有效的方法克服數(shù)據(jù)異地、異質(zhì)、異構(gòu)等問題的不利影響,充分保證數(shù)據(jù)存儲管理的科學水平,為數(shù)據(jù)分析、處理奠定良好基礎。大數(shù)據(jù)處理技術(shù)是圖書館大數(shù)據(jù)管理的另一重要任務,該任務以用戶需求、業(yè)務目標為出發(fā)點,采取多種多樣的技術(shù)方法對數(shù)據(jù)進行全面研究分析,保證不同數(shù)據(jù)的處理效果和整體質(zhì)量,充分滿足數(shù)據(jù)應用的相關(guān)需求。
(3)圖書館大數(shù)據(jù)的應用。應用是大數(shù)據(jù)技術(shù)的根本目標?;跀?shù)據(jù)處理結(jié)果,針對不同服務需要對數(shù)據(jù)資源進行科學利用,準確高效地滿足數(shù)字服務需求?;诖髷?shù)據(jù)技術(shù)環(huán)境,大數(shù)據(jù)應用的核心內(nèi)容是基于數(shù)據(jù)相關(guān)性分析結(jié)果,對數(shù)據(jù)進行科學融合從而準確預測客戶需求并提供針對性的服務,提升客戶決策質(zhì)量。以圖書館為核心,以一站式的數(shù)字資源服務為模式,將成為未來數(shù)據(jù)資源應用的重要方式之一,為數(shù)據(jù)挖掘技術(shù)、智慧服務技術(shù)的發(fā)展提供有力支持。
本文將數(shù)字資源融合定義為基于大數(shù)據(jù)技術(shù),將此作為平臺來完成圖書館的信息資源集成,并實現(xiàn)整合與共享。根據(jù)理論和實踐兩個視角探索具體的創(chuàng)新方向,將帶給現(xiàn)代圖書館很多轉(zhuǎn)型契機,但是也存在很多問題,解決這些矛盾和沖突,應該成為現(xiàn)階段圖書館的數(shù)字資源融合處理核心,其解決方式和措施等能夠給圖書館提供明確的資源融合方式。
圖書館數(shù)字資源融合必須通過理念轉(zhuǎn)變才能實現(xiàn)。這種轉(zhuǎn)變主要有兩個方向:第一,做好數(shù)據(jù)資源的保護和利用。作為現(xiàn)代知識資源存儲、供應的主體,圖書館表現(xiàn)出顯著的公益性特征,龐大的數(shù)據(jù)資源是其最典型的優(yōu)勢,以此為基礎,可以構(gòu)建一種以數(shù)據(jù)資源的儲存、保護為主要目的的開放式信息應用模式。但是,這種機構(gòu)性質(zhì)中存在明顯的沖突矛盾。比如,網(wǎng)絡環(huán)境推動下圖書館也逐漸將實體文獻資源進行網(wǎng)絡化處理,但是并未實現(xiàn)有效的全面開放,這種大數(shù)據(jù)時代的來到,讓人們在大數(shù)據(jù)價值不斷增加過程中,對數(shù)據(jù)信息的需求量越來越大。所以,從這個角度來說,圖書館應該順勢而變,在有效完成數(shù)字資源處理任務的基礎上,同時做好數(shù)字資源的保護工作,并充分保證資源的利用水平,兼顧資源保護與共享。這是推動圖書館數(shù)據(jù)資源信息共享效率的關(guān)鍵,本質(zhì)就是將“信息孤島”問題解決。第二,圖書館館員成為管理數(shù)字資源的重要人力資源。通過對館員大數(shù)據(jù)思維的培養(yǎng),建立新時代的“用戶中心”理念,提升自身解決數(shù)據(jù)采集、處理和分析的能力,利用圖書館已有資源,進行新的服務范圍拓展和服務內(nèi)容增加等。
對于現(xiàn)代圖書館數(shù)字資源的管理來說,需要通過平臺建設、大數(shù)據(jù)處理等方式,根據(jù)現(xiàn)有技術(shù)實現(xiàn)更好的改進,這是實現(xiàn)資源融合順利展開的重要前提。對于數(shù)據(jù)采集來說,需要通過圖書館大數(shù)據(jù)多樣性,準確、全面地實現(xiàn)具體采集流程,從而將寬帶制約、采集效率、數(shù)據(jù)質(zhì)量等問題合理保證。在該過程中,存在一個數(shù)據(jù)存儲容量問題,對于能夠達到PB級海量數(shù)據(jù)時,圖書館管理系統(tǒng)能夠?qū)ζ浜A繑?shù)據(jù)進行有效存儲,并充分保證數(shù)據(jù)存儲的安全性與可靠性,提供與數(shù)據(jù)規(guī)模匹配的存儲空間。而數(shù)據(jù)保護則可以理解為對不同類型、結(jié)構(gòu)特征的數(shù)字資源進行挖掘時,可以通過保存數(shù)量多少、保存時間等限制,做出并不相同的挖掘行為,由此來發(fā)揮數(shù)據(jù)資源信息的價值特征。數(shù)據(jù)組織時的數(shù)據(jù)標準規(guī)范化過程,就是在圖書館數(shù)字資源融合平臺上,可以根據(jù)標準化的數(shù)據(jù)語言,將不同類型的數(shù)據(jù)進行轉(zhuǎn)化,使其具備良好的兼容能力,為數(shù)據(jù)共享奠定基礎,這時就需要將數(shù)據(jù)采集實現(xiàn)壁壘破除。數(shù)據(jù)安全問題的含義是在數(shù)字資源利用和處理過程中,根據(jù)數(shù)據(jù)可能存在的丟失、泄漏問題,完成對安全風險的分析和劃分,根據(jù)相關(guān)風險的發(fā)展方向,由此判定文件、數(shù)據(jù)的可行性、有效性。由于傳統(tǒng)安全管理模式存在很多矛盾沖突問題,特別是技術(shù)漏洞、日志文件缺失、數(shù)據(jù)發(fā)現(xiàn)不清晰等都會導致無法使用、數(shù)據(jù)不可靠等問題。因此,應該從網(wǎng)絡、數(shù)據(jù)存儲、數(shù)據(jù)備份等方面的安全性出發(fā),完成對風險的管理、運營和治理等行為,并以此判斷和探究具體的解決對策。在進行數(shù)據(jù)處理與分析時,可以將空間與時間維度的數(shù)據(jù)關(guān)聯(lián)進行綜合運用,將圖書館大數(shù)據(jù)資源進行深層次挖掘,為分析提供有效基礎。將軟件進行平臺算法的先進性開發(fā)后,實現(xiàn)多重處理方式的應用。對于可視化呈現(xiàn)方式來說,可以將可視化軟件工具利用起來,將圖書館大數(shù)據(jù)間巨大、復雜的潛在邏輯關(guān)聯(lián)進行梳理,從而進行相關(guān)的圖書館業(yè)務支撐和決策分析。
現(xiàn)階段圖書館的大數(shù)據(jù)環(huán)境特征之一就是其整合必須建立在基礎功能之上,以融合所有資源的方式來完成相關(guān)的資源內(nèi)容有效建設,改善原本的分布散逸狀態(tài),將信息獲取難度過大、垃圾數(shù)據(jù)太多等問題進行優(yōu)化,這是實現(xiàn)圖書館數(shù)字資源共享、共建和有效利用的前提。通過綜合衡量的方式,使得圖書館數(shù)字資源融合可以有效地、順利地展開。
在實際融合與轉(zhuǎn)化時,應該將經(jīng)濟成本問題重視起來,將成本控制等問題作為關(guān)鍵因素進行研究分析。由于圖書館數(shù)字資源利益關(guān)聯(lián)者的多樣性,使得資源融合的環(huán)境比較復雜,必須要將這機構(gòu)經(jīng)費收入合理保障,具體是:(1)費用分攤。指的是各個主體將資源融合實現(xiàn)共同承擔,由此完成對數(shù)字融合成本費用的科學管理與有效控制,實現(xiàn)成本費用的合理分攤。(2)成本控制。針對數(shù)字資源融合與轉(zhuǎn)化的不同環(huán)節(jié)與要素,將圖書館數(shù)據(jù)信息進行采集、加工、組織、處理,這些都是需要有基本的人力物力投入,必須對成本進行控制,通過科學的管理措施提升資源要素的利用水平和融合效率,從而降低整體成本。(3)利益均衡。在數(shù)字資源實現(xiàn)融合與轉(zhuǎn)化過程中,可通過控制主體投入實現(xiàn)利益的科學分配,充分保證不同主體的利益,從而獲得不同主體的支持,提高融合與轉(zhuǎn)化的效率。充足的經(jīng)費將直接促使數(shù)字資源融合與轉(zhuǎn)化的發(fā)展,這是中國圖書館事業(yè)發(fā)展最主要的問題,應該獲得中央與地方政府財政收入的支持。
以實際融合過程來說,前提是健全管理機制,為數(shù)字資源融合具體工作提供科學的依據(jù)。在實踐時可以將面臨的具體問題通過分解環(huán)節(jié)來有效解決,從而實現(xiàn)穩(wěn)定融合,確保各類矛盾沖突問題得到合理解決。因為各個圖書館類型不同,所使用的系統(tǒng)也各不相同,以管理部門差異性的設置方式來看,可以實現(xiàn)有效的監(jiān)督和約束,確保部門職能的順利實現(xiàn)。由于認知的差異性,要求主管部門從一開始就應確認各類職能的分配,但是這種模式可能會導致各個圖書館合作不暢的問題。統(tǒng)一管理可以從三個層面展開:一是建立專業(yè)管理機構(gòu),配備專業(yè)工作人員,實施統(tǒng)一規(guī)劃標準;二是不斷創(chuàng)新管理制度,以更富有激勵性、創(chuàng)新性的制度規(guī)劃,將圖書館各個工作人員都納入到管理系統(tǒng)中;三是強化整合運營模式,將不同管理機構(gòu)基本職能劃分清楚,融合平臺中同樣要劃分出統(tǒng)一管理的基本模式,確保圖書館數(shù)字資源能夠得到合理開發(fā)。
圖書館數(shù)字資源融合必須通過專業(yè)人才來完成系統(tǒng)技術(shù)的應用。大數(shù)據(jù)時代催生了多重技術(shù)應用方式,管理人員、服務人員基本素質(zhì)都必須提高。從這個角度來說,圖書館必須與時俱進,以積極的培訓、講座、研討會等促進館員綜合素質(zhì)的提升。在支持和鼓勵工作人員不斷提升自我能力的同時,加強外部合作,將專業(yè)人才對大數(shù)據(jù)的使用更合理、更有效。圖書館應該認識到人才儲備、培養(yǎng)、引進的重要性,建構(gòu)大數(shù)據(jù)思維方式,通過技術(shù)系統(tǒng)的設立而建構(gòu)專業(yè)人才隊伍,實現(xiàn)圖書館數(shù)字資源融合的最初目標。