龐 楠 薛衛(wèi)雙
(1.華北理工大學(xué) 河北唐山 063210;2. 山東管理學(xué)院圖書館 濟南 250357)
當今世界,新技術(shù)、新概念、新理論層出不窮,大數(shù)據(jù)技術(shù)即是這個時代下誕生的最為成功的科技創(chuàng)新產(chǎn)物。Gartner認為,所謂的大數(shù)據(jù)就是通過新的處理模式獲取海量多樣化的信息數(shù)據(jù),而所獲得的信息將以極高的增長率爆炸式膨脹。在這個背景下,數(shù)據(jù)生態(tài)系統(tǒng)應(yīng)運而生,并很快在圖書館領(lǐng)域進行了應(yīng)用性有機融合[1]。大數(shù)據(jù)為圖書館的數(shù)據(jù)建設(shè)和服務(wù)提供了非常強大的技術(shù)支持。隨著大數(shù)據(jù)技術(shù)日漸成熟,麥肯錫全球研究所將大數(shù)據(jù)定義為:一種大規(guī)模獲取、分析傳統(tǒng)數(shù)據(jù)的集合,其憑借多元化、快速傳播及價值密度低等優(yōu)勢,為各行各業(yè)提供科學(xué)有效的數(shù)據(jù)服務(wù)。2016年3月,《中華人民共和國國民經(jīng)濟和社會發(fā)展第十三個五年規(guī)劃綱要》提出要“把大數(shù)據(jù)作為基礎(chǔ)性戰(zhàn)略資源,全面實施促進大數(shù)據(jù)發(fā)展行動,加快推動數(shù)據(jù)資源共享開放和開發(fā)應(yīng)用,助力產(chǎn)業(yè)轉(zhuǎn)型升級和社會治理創(chuàng)新”。具體內(nèi)容包括“加快政府數(shù)據(jù)開放共享”“促進大數(shù)據(jù)產(chǎn)業(yè)健康發(fā)展”[2]。大數(shù)據(jù)時代,與新興信息技術(shù)融合已經(jīng)成為傳統(tǒng)圖書館向圖書館轉(zhuǎn)型的重要驅(qū)動力[3]。但不容忽視是,大數(shù)據(jù)在積極促進各行各業(yè)發(fā)展的同時,也帶來了信息安全、隱私泄露等一系列隱患。對圖書館領(lǐng)域而言,如何在發(fā)揮大數(shù)據(jù)技術(shù)優(yōu)勢進行數(shù)據(jù)管理的同時避免其不利影響,成為亟待解決的問題之一。這既是對圖書館管理人員的一種考驗,也是迎合數(shù)字化、智能化數(shù)據(jù)服務(wù)的需求,是圖書館未來的發(fā)展趨勢。
相關(guān)調(diào)查數(shù)據(jù)顯示,國外在圖書館數(shù)據(jù)生態(tài)系統(tǒng)的搭建及數(shù)據(jù)治理路徑分析等方面的研究起步較早,綜合來看主要分為兩大類。
一類是基于大數(shù)據(jù)的發(fā)展。2008年9月,《科學(xué)》(Science)雜志發(fā)表了一篇有關(guān)大數(shù)據(jù)的文章,這是“大數(shù)據(jù)”一詞首次被公開提出,很快在世界范圍內(nèi)廣泛傳播[4];2011年,大數(shù)據(jù)調(diào)研報告首次發(fā)布;同年5月,EMC舉辦了“云計算相遇大數(shù)據(jù)”大會,在此次會議中“大數(shù)據(jù)”概念正式誕生[5]。由此,大數(shù)據(jù)技術(shù)進入了飛速發(fā)展的快車道,在信息技術(shù)的支撐下迅速迭代升級。時隔僅一年,美國奧巴馬政府在2012年正式推出“大數(shù)據(jù)的研究和發(fā)展計劃”,該計劃將“大數(shù)據(jù)”作為全球性發(fā)展戰(zhàn)略,集合多部門,大力推動數(shù)據(jù)的采集、整合、分析等技術(shù)的優(yōu)化升級。美國英領(lǐng)出版公司的市場研究總監(jiān)Magoulas認為,只有當數(shù)據(jù)達到一定的規(guī)模和性能,并符合數(shù)據(jù)管理分析系統(tǒng)的重組設(shè)計要求時,這樣的數(shù)據(jù)才能被稱為真正的“大數(shù)據(jù)”[6]。
另一類是基于信息生態(tài)系統(tǒng)發(fā)展。20世紀80年代初,韋里克教授提出了SWOT分析法,他從四個方面詮釋了數(shù)據(jù)生態(tài)系統(tǒng)的圖書館數(shù)據(jù)治理路徑;20世紀80年代末,德國學(xué)者進一步提出了“信息生態(tài)學(xué)”的概念[7];20世紀90年代,美國學(xué)者在前人的基礎(chǔ)上,正式提出了“信息生態(tài)系統(tǒng)”的概念,并從信息主體的角度對信息生態(tài)系統(tǒng)的結(jié)構(gòu)展開了研究[8];近幾年,有學(xué)者將生態(tài)系統(tǒng)的概念引入圖書館領(lǐng)域,將圖書館看作一個有機生態(tài)系統(tǒng),分析并總結(jié)了圖書館發(fā)展至今受到的諸多影響,其中分別涵蓋了文化、經(jīng)濟、地理以及數(shù)字化技術(shù)等各個方面的因素[9]。
國外現(xiàn)有的研究資料為本文的研究提供了比較有價值的參考,但在具體的應(yīng)用實踐中,這些研究資料還有很多不足,需要進一步完善。
我國有關(guān)數(shù)據(jù)生態(tài)系統(tǒng)以及圖書館數(shù)據(jù)治理路徑問題的研究起步于20世紀90年代,至今已有不少研究成果問世,相關(guān)領(lǐng)域的學(xué)者們各自從不同的角度對此展開了分析和探究,大致包含以下幾個方面:
首先,我國的數(shù)據(jù)生態(tài)系統(tǒng)研究與大數(shù)據(jù)技術(shù)的研究并不對稱,將相對落后的前者與較為先進的后者進行有效融合,是以往國內(nèi)相關(guān)領(lǐng)域?qū)W者們主要的研究方向。郭自寬、張興旺等把基于大數(shù)據(jù)基礎(chǔ)的數(shù)據(jù)處理模式與圖書館進行結(jié)合,進一步提出了圖書館數(shù)據(jù)生態(tài)系統(tǒng)的框架雛形[10],并主要研究了數(shù)據(jù)管理中信息數(shù)據(jù)的采集、處理、儲存、分析挖掘以及應(yīng)用和展現(xiàn)等關(guān)鍵性技術(shù)與圖書館生態(tài)系統(tǒng)的結(jié)合。在這一時期,我國針對這一領(lǐng)域的研究,在某種程度上存在著以傳統(tǒng)思維研究新興技術(shù)的尷尬情況,更多地將注意力放在了圖書館等具體的單位上,而忽略了對大數(shù)據(jù)技術(shù)本身價值的關(guān)注。不過,這種情況很快發(fā)生了改變,有研究者開始將研究重點放在研究數(shù)據(jù)價值的體現(xiàn)及挖掘等方面,使大數(shù)據(jù)技術(shù)真正地成為圖書館數(shù)據(jù)生態(tài)系統(tǒng)的核心。
其次,大數(shù)據(jù)技術(shù)為圖書館數(shù)據(jù)管理提供了新的思路,但同時也帶來了新的危機。彭羽佳等人從生態(tài)危機的角度對圖書館數(shù)據(jù)治理路徑進行分析,發(fā)現(xiàn)自數(shù)據(jù)信息從GB時代向TB時代轉(zhuǎn)變后,大數(shù)據(jù)外部環(huán)境發(fā)生了巨大改變,主要體現(xiàn)在圖書館數(shù)據(jù)生態(tài)系統(tǒng)的產(chǎn)生和發(fā)展兩個方面。他們認為在該環(huán)境下,外界干擾壓力過大會使生態(tài)系統(tǒng)的變化超出其自我調(diào)節(jié)能力的承受限度,系統(tǒng)的自我調(diào)節(jié)能力會隨之喪失,此時圖書館的數(shù)據(jù)生態(tài)系統(tǒng)就會受到嚴重的損害甚至崩塌[11],這就是學(xué)者們常說的“生態(tài)系統(tǒng)危機”。胡文靜等人以“大數(shù)據(jù)”時代圖書館生態(tài)系統(tǒng)的解構(gòu)和重構(gòu)為研究重心,從系統(tǒng)平衡的角度研究圖書館數(shù)據(jù)生態(tài)系統(tǒng),并從交互層面分析了圖書館數(shù)據(jù)治理所遇到的瓶頸,提出了基于數(shù)據(jù)生態(tài)系統(tǒng)的數(shù)據(jù)治理路徑[12]。
最后,SWOT分析法為大數(shù)據(jù)背景下的數(shù)據(jù)治理提供了指導(dǎo)方向。王紅芳等人從大數(shù)據(jù)環(huán)境下圖書館數(shù)據(jù)管理的角度出發(fā),通過SWOT法深入分析了其優(yōu)勢和劣勢[13],認為所謂的SWOT分析,是基于內(nèi)外部競爭環(huán)境和競爭條件下的態(tài)勢分析,其中影響數(shù)據(jù)生態(tài)系統(tǒng)的內(nèi)部因素包括優(yōu)勢和劣勢,外部因素包括機會和威脅,將這些分析結(jié)果按照矩陣的形式一一排列,可從中得出結(jié)論,有針對性地對圖書館的數(shù)據(jù)生態(tài)系統(tǒng)展開數(shù)據(jù)治理。
SWOT分析法自20世紀80年代被提出到現(xiàn)在,其策略分析已經(jīng)得到普遍應(yīng)用。結(jié)合該分析方法,本文對圖書館數(shù)據(jù)生態(tài)系統(tǒng)展開了可行性分析。
2.1.1 外部因素
SWOT矩陣的外部因素涵蓋機會與威脅兩方面,而圖書館數(shù)據(jù)生態(tài)系統(tǒng)同樣也面臨著機遇和挑戰(zhàn),要在機遇和挑戰(zhàn)中維持系統(tǒng)穩(wěn)定,必須厘清其外部的影響因素(見表1)。首先,在政府出臺一系列相關(guān)政策以后,日漸成熟的大數(shù)據(jù)技術(shù)為圖書館的數(shù)據(jù)管理帶來了前所未有的機會,有效地推動了圖書館由傳統(tǒng)時代到數(shù)字時代的轉(zhuǎn)型[14]。其次,對圖書館而言,這也是威脅與挑戰(zhàn)。大數(shù)據(jù)技術(shù)雖然強化了其數(shù)據(jù)管理能力,但也使信息數(shù)據(jù)的體量驟增。需要注意的是,我國在數(shù)據(jù)管理相關(guān)方面的體系制度仍有很多不足,如信息數(shù)據(jù)獲取途徑較為單一、信息數(shù)據(jù)相對封閉、信息數(shù)據(jù)的無節(jié)制使用等。此外,隱私信息數(shù)據(jù)也因為挖掘信息技術(shù)的應(yīng)用而存在一定程度的安全隱患。
表1 SWOT矩陣外部因素
2.1.2 內(nèi)部因素
SWOT矩陣的內(nèi)部因素也涵蓋兩個方面,分別是優(yōu)勢與劣勢。只有厘清圖書館數(shù)據(jù)生態(tài)系統(tǒng)的優(yōu)勢及劣勢,才能確定未來的發(fā)展方向。優(yōu)勢方面,大數(shù)據(jù)技術(shù)是技術(shù)革命的產(chǎn)物,它讓人類使用樣本代替全局的統(tǒng)計方法漸漸成為過去,真正做到利用全局數(shù)據(jù)對事物進行統(tǒng)計,相比較而言,除了能提升效率,它與真相也更加接近。此外,大數(shù)據(jù)技術(shù)能夠同事物進行有機連接,圖書館借此可以了解用戶的行為習(xí)慣,針對用戶的偏好以及閱讀習(xí)慣提供個性化的數(shù)據(jù)服務(wù)。劣勢方面,在某種程度上,大數(shù)據(jù)的優(yōu)勢也導(dǎo)致了它的劣勢,比如海量的信息體量會導(dǎo)致硬件需求劇增,給圖書館管理帶來成本的劣勢;開放共享的個性化數(shù)據(jù)技術(shù),會帶來隱私數(shù)據(jù)泄露的風(fēng)險;而專業(yè)技術(shù)人才短缺,則更是發(fā)展大數(shù)據(jù)技術(shù)的短板。
表2 SWOT矩陣內(nèi)部因素
2.2.1 內(nèi)外優(yōu)勢相結(jié)合
揚長避短是內(nèi)外優(yōu)勢結(jié)合的核心辦法。其一,大數(shù)據(jù)時代是圖書館數(shù)據(jù)管理的背景,技術(shù)升級給圖書館的用戶帶來了服務(wù)上的變革,除海量的信息數(shù)據(jù)以外,還有多元化的個性化服務(wù)等優(yōu)勢,所以,圖書館有必要借助移動互聯(lián)網(wǎng)有針對性地擴大宣傳范圍,提升宣傳效果,發(fā)揮大數(shù)據(jù)時代新媒體的優(yōu)勢作用;其二,個性化服務(wù)的進一步完善,需要利用大數(shù)據(jù)的技術(shù)優(yōu)勢,進行全局分析,并模擬用戶的偏好以及行為習(xí)慣,主動推送服務(wù)。
2.2.2 避免內(nèi)部劣勢和外部威脅
避免內(nèi)外部的威脅,核心是逆轉(zhuǎn)劣勢:其一,大數(shù)據(jù)環(huán)境下的信息有一個很大的問題,即信息數(shù)據(jù)的碎片化,圖書館在解決此類問題時,可以利用各種新興的技術(shù),與之有機融合,進一步加強信息數(shù)據(jù)的整合,以期徹底扭轉(zhuǎn)該劣勢;其二,雖然大數(shù)據(jù)開放共享的模式帶來了安全隱患,但圖書館也可以利用該技術(shù)主動搭建安防平臺,對可能帶來不利影響的潛在危險因素進行評估和預(yù)測,化危機為轉(zhuǎn)機。
3.1.1 圖書館數(shù)據(jù)生態(tài)系統(tǒng)的基礎(chǔ)
在大數(shù)據(jù)背景下,圖書館的生態(tài)基礎(chǔ)是信息數(shù)據(jù)。信息數(shù)據(jù)以一種跨越虛擬與現(xiàn)實的形式存在于整個生態(tài)系統(tǒng)之中,其存在的具體形式,理論上可分為泛信息空間和感知信息空間[15]。其中,信息空間的概念最早由北卡羅萊納州立大學(xué)圖書館館長Donlad Beagle于1999年提出。由于技術(shù)上的局限性,彼時的信息空間還只是針對物理空間與數(shù)據(jù)信息進行研究。直到進入無線網(wǎng)絡(luò)高度發(fā)達的時代,移動互聯(lián)網(wǎng)的廣泛普及和社交網(wǎng)絡(luò)的極度發(fā)達,使網(wǎng)絡(luò)數(shù)據(jù)信息所依托的數(shù)字虛擬空間無限拓展,以至于它和物理空間之間的界限日漸模糊,數(shù)字信息開始可以用各種形式隨意在兩種空間之間穿梭[16]。當人們將人的思維模式結(jié)合進去,一種以交互為特征的新型理念與大數(shù)據(jù)技術(shù)相結(jié)合,全新的感知空間在信息的收集、篩選、傳遞等各方面,幾乎可以滿足圖書館用戶的所有需求。正是在這種背景下,圖書館充分利用新興技術(shù),并與之進行了科學(xué)有效的融合,借助其開放而真實的各類數(shù)據(jù),為圖書館用戶提供翔實而又精準的信息服務(wù)[17]。
在圖書館中,幾乎所有資源都可以被當作該生態(tài)系統(tǒng)中的信息數(shù)據(jù),包括圖書館自身的運行數(shù)據(jù)、互聯(lián)網(wǎng)數(shù)據(jù)、大量圖書以及文獻資料等等。這些數(shù)據(jù)幾乎全部是對社會開放共享的,受益的不僅僅有個人用戶,還有政府單位、商業(yè)公司、科研部門等各行各業(yè)的組織機構(gòu)。在升級迭代的過程中,圖書館的數(shù)據(jù)生態(tài)系統(tǒng)還融合了大數(shù)據(jù)、物聯(lián)網(wǎng)、云計算等新興技術(shù),且先后衍生出了聯(lián)系數(shù)字空間和物理空間的諸多圖書館服務(wù),如基于智能終端的移動圖書館、基于物聯(lián)網(wǎng)和云計算的智慧圖書館等。而這一切的實現(xiàn),都是以信息數(shù)據(jù)為前提和基礎(chǔ)。
3.1.2 圖書館生態(tài)系統(tǒng)數(shù)據(jù)的生命周期
本文在描述圖書館的數(shù)據(jù)生態(tài)系統(tǒng)時,借鑒了生物領(lǐng)域中關(guān)于生態(tài)的概念,作為這個生態(tài)系統(tǒng)中的基礎(chǔ),信息數(shù)據(jù)即如生物鏈中的寄生蟲[18],其從中間宿主進入最終宿主的過程,可被看作一個生命周期。信息數(shù)據(jù)在圖書館的生態(tài)系統(tǒng)中,從一個信息加工空間到另一個信息空間,然后被存儲起來,等待被再次發(fā)現(xiàn)、利用。信息數(shù)據(jù)在生態(tài)系統(tǒng)中實現(xiàn)空間轉(zhuǎn)換的過程,被視為一個生命周期。通常來說,數(shù)據(jù)生命周期中存在數(shù)據(jù)的高級加工階段,也可以理解為給數(shù)據(jù)增加一定的附加值。本文借鑒了利茲-里昂基于e-Research的數(shù)據(jù)周期模型[19],即數(shù)據(jù)的創(chuàng)建和存儲→數(shù)據(jù)的處理→知識交換系統(tǒng)→賦予數(shù)據(jù)附加值→數(shù)據(jù)的高級加工。所有數(shù)據(jù)就是在這個不斷循環(huán)的過程中,進行交互與更新。數(shù)據(jù)的具體處理方式見圖1。
圖1 圖書館數(shù)據(jù)生態(tài)系統(tǒng)的數(shù)據(jù)處理方式
在進一步探討圖書館信息數(shù)據(jù)生命周期的主體階段時,我們將其劃分為以下四個階段:①信息數(shù)據(jù)的創(chuàng)建階段。信息數(shù)據(jù)的創(chuàng)建是圖書館數(shù)據(jù)生態(tài)系統(tǒng)構(gòu)建和持續(xù)的基礎(chǔ),數(shù)據(jù)源作為數(shù)據(jù)生態(tài)系統(tǒng)的數(shù)據(jù)創(chuàng)建者,其來源涵蓋互聯(lián)網(wǎng)數(shù)據(jù)與傳統(tǒng)行業(yè)積累下來的數(shù)據(jù),幾乎包括了所有可以公開獲取的信息,這在某種程度上保證了圖書館生態(tài)系統(tǒng)數(shù)據(jù)的多樣性與可持續(xù)性。②信息數(shù)據(jù)的交換階段。實際上這也是一個數(shù)據(jù)獲取與傳遞的過程,圖書館生態(tài)系統(tǒng)利用標準化技術(shù)將生產(chǎn)者創(chuàng)建的數(shù)據(jù)進行整合存儲,然后等待下個階段進一步的加工與交換。③信息數(shù)據(jù)的使用階段。這一階段實際上是為了滿足圖書館用戶或消費者的需求,圖書館會根據(jù)用戶的偏好與習(xí)慣,為用戶提供數(shù)據(jù)的搜索、閱讀等服務(wù)。除此以外,圖書館還會依托大數(shù)據(jù)技術(shù)將各類信息數(shù)據(jù)進行關(guān)聯(lián),繼而實現(xiàn)其附加值的增加。④信息數(shù)據(jù)的加工階段。該階段作為一個生命周期的最終階段,既扮演了終點的角色,同時也是下一個周期的轉(zhuǎn)接點。在這個過程中,系統(tǒng)會對所有信息數(shù)據(jù)進行再加工,以期進一步增加其附加值。這也是使信息數(shù)據(jù)實現(xiàn)其價值的主要階段。
3.1.3 圖書館生態(tài)系統(tǒng)數(shù)據(jù)的多樣性內(nèi)涵
圖書館數(shù)據(jù)生態(tài)系統(tǒng)的信息數(shù)據(jù)一般涵蓋了傳統(tǒng)信息數(shù)據(jù)和互聯(lián)網(wǎng)信息數(shù)據(jù),既有結(jié)構(gòu)化的數(shù)據(jù)也有非結(jié)構(gòu)化的數(shù)據(jù)。傳統(tǒng)數(shù)據(jù)的特征往往集中且單一,只具有一種屬性,而大數(shù)據(jù)內(nèi)涵已經(jīng)發(fā)生了翻天覆地的變化。依托于移動互聯(lián)網(wǎng)和智能移動終端的廣泛普及,各類社交媒體以及電商應(yīng)用以井噴之勢迅速占據(jù)了人們的生活。基于龐大用戶群體的個人信息數(shù)據(jù)以及消費數(shù)據(jù),被匯集成了蘊含巨大潛在商業(yè)價值的海量信息數(shù)據(jù)。正是這種在信息數(shù)據(jù)類型上的廣泛融合,使圖書館能在傳統(tǒng)數(shù)據(jù)的基礎(chǔ)之上,充分利用大數(shù)據(jù)的商業(yè)價值,進而使其數(shù)據(jù)生態(tài)系統(tǒng)充分發(fā)揮影響與作用。
研究發(fā)現(xiàn),在具體實踐中,圖書館用戶或數(shù)據(jù)消費者的需求發(fā)生改變、時代風(fēng)口帶來的各種紅利、政府相關(guān)政策的頒布和實施,都會對圖書館數(shù)據(jù)生態(tài)系統(tǒng)帶來一定程度的影響。①圖書館用戶或數(shù)據(jù)消費者的需求。在傳統(tǒng)的市場環(huán)境里,圖書館對用戶需求的滿足程度,受生產(chǎn)資料、勞動力以及科技水平的影響。也就是說,在生產(chǎn)資料、勞動力基本不變的前提下,科技水平?jīng)Q定了圖書館滿足用戶能力的大小。傳統(tǒng)圖書館由于能力有限,很難滿足用戶各種各樣的需求。但是,隨著大數(shù)據(jù)時代到來,無論科技水平還是信息數(shù)據(jù),都有了質(zhì)和量的飛躍。這就使得滿足圖書館用戶多元、精準、個性化的需求成為可能,也促進了圖書館數(shù)據(jù)生態(tài)系統(tǒng)有方向性地進行迭代更新。②時代風(fēng)口。大數(shù)據(jù)技術(shù)不但為人們的生活帶來便利條件,更引導(dǎo)世界進入了“數(shù)據(jù)驅(qū)動經(jīng)濟”的時代。圖書館出于自身發(fā)展的需求,應(yīng)該抓住時代的風(fēng)口,積極運用新興技術(shù),進一步完善數(shù)據(jù)生態(tài)系統(tǒng)。③政府相關(guān)政策的頒布和實施。除了以上兩點,政府基于我國的實際情況出臺的相關(guān)政策法規(guī)也會帶來一些較為積極的影響。如2015年8月國務(wù)院發(fā)布的《促進大數(shù)據(jù)發(fā)展行動綱要》、2017年發(fā)布的《大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃》以及2018年發(fā)布的《推動企業(yè)上云實施指南》等等,這些都會對與大數(shù)據(jù)相關(guān)企業(yè)的發(fā)展產(chǎn)生促進作用,基于大數(shù)據(jù)技術(shù)的圖書館數(shù)據(jù)生態(tài)系統(tǒng)顯然也會受到積極影響。所以,營造健康的政策環(huán)境,對圖書館生態(tài)系統(tǒng)的良性發(fā)展具有積極推動作用。
大數(shù)據(jù)背景下,圖書館數(shù)據(jù)的體量和質(zhì)量都得到了極大的發(fā)展,為構(gòu)建數(shù)據(jù)生態(tài)系統(tǒng)提供了不可或缺的基礎(chǔ)條件。本研究的模型搭建(見圖2)借鑒了生態(tài)學(xué)中的概念,以信息數(shù)據(jù)為基礎(chǔ),在各個信息加工空間中不斷進行轉(zhuǎn)移,循環(huán)往復(fù)。生態(tài)系統(tǒng)運轉(zhuǎn)的過程,也是各個要素之間相互適應(yīng)磨合的過程,系統(tǒng)在運轉(zhuǎn)中維持一定程度的平衡。除了系統(tǒng)內(nèi)部環(huán)境外,以政治、經(jīng)濟、文化為代表的外部環(huán)境的健康程度也會對系統(tǒng)產(chǎn)生相應(yīng)的影響。
圖2 模型搭建
圖書館的數(shù)字資源就是數(shù)字化的信息數(shù)據(jù),這也是圖書館數(shù)據(jù)生態(tài)系統(tǒng)中最重要的組成部分。通常情況下,圖書館的數(shù)字資源通過購買商業(yè)性數(shù)據(jù)、獲取免費數(shù)據(jù)、將館藏圖書資料數(shù)字化這三種渠道獲得。前文的SWOT分析指出,圖書館生態(tài)系統(tǒng)在信息數(shù)據(jù)的獲取方式上存在著獲取途徑過于單一、信息數(shù)據(jù)相對封閉、信息管理混亂等問題[20]。所以,我國圖書館的數(shù)據(jù)治理做到有的放矢很有必要,應(yīng)該針對相關(guān)問題及困境提出相應(yīng)的解決方案。
對此,圖書館應(yīng)該擴展自有信息數(shù)據(jù)的體量,因為只有高質(zhì)量且多元化的數(shù)據(jù)才能滿足當前用戶的多樣化需求。一般而言,圖書館在資金并不充裕的情況下,合法增加信息數(shù)據(jù)體量的途徑是獲取免費信息數(shù)據(jù)和將館藏文獻數(shù)字化[21]。但通過以上途徑獲取的信息數(shù)據(jù)資源和傳統(tǒng)的數(shù)據(jù)資源仍存在一定差異,所以在進行信息數(shù)據(jù)加工時,方法和工具也會有差異。除此以外,根據(jù)所服務(wù)用戶的不同,選擇獲取的途徑也要有針對性地改變。如針對科研人員的學(xué)術(shù)類信息數(shù)據(jù),勢必要獲得高校的支持,圖書館與之共享各類專業(yè)性資源能使數(shù)據(jù)庫在廣度和深度方面更上一層樓。
針對自身各類具體業(yè)務(wù)的實體數(shù)據(jù),圖書館可以建立專門的描述數(shù)據(jù)庫,在優(yōu)化元數(shù)據(jù)管理效率的同時,促進實體數(shù)據(jù)在其生命周期內(nèi)被更加高效、規(guī)范地利用,以產(chǎn)生應(yīng)有的價值,同時還能進一步提升信息數(shù)據(jù)的質(zhì)量。這既滿足了圖書館用戶多元化、個性化的需求,也使信息數(shù)據(jù)相對封閉以及信息管理混亂等問題得到了有效的治理。
我國圖書館進行數(shù)據(jù)管理的時日尚短,在國內(nèi)相關(guān)領(lǐng)域幾乎沒有成熟的經(jīng)驗可以借鑒,只能摸著石頭過河。因此,借鑒國外相對成熟的管理經(jīng)驗以確保信息數(shù)據(jù)的科學(xué)有效十分必要。圖書館應(yīng)該依照數(shù)據(jù)的生命周期對數(shù)據(jù)展開管理,這就對數(shù)據(jù)管理責任者提出了較高的要求,即:明確圖書館各部門的職責劃分,在數(shù)據(jù)的獲取、整理、分析、存儲等階段各司其職以提高數(shù)據(jù)處理效率[22]。除此以外,大數(shù)據(jù)時代的數(shù)據(jù)安全尤為重要,規(guī)范化的信息數(shù)據(jù)管理很有必要。信息數(shù)據(jù)在復(fù)制、轉(zhuǎn)移以及版本迭代的過程中可能存在丟失的安全隱患,而多部門、多人員的參與,進一步增加了此類風(fēng)險。所以,圖書館在數(shù)據(jù)生命周期的管理實踐中設(shè)置相關(guān)操作規(guī)則,將在一定程度上提升數(shù)據(jù)的安全性。
除了信息數(shù)據(jù)的獲取和整理以外,圖書館在進行數(shù)據(jù)的生命周期管理時,同樣有必要提升其數(shù)據(jù)服務(wù)的能力。根據(jù)已往的研究成果,我們可以將針對數(shù)據(jù)的相關(guān)服務(wù)劃分為三個層級[23]:首先是針對圖書館信息數(shù)據(jù)生命周期的基本維護,如數(shù)據(jù)存儲、元數(shù)據(jù)庫、信息交互等項目的構(gòu)建和維護,除此之外,如何科學(xué)地使數(shù)據(jù)生命周期進行穩(wěn)定且有效的循環(huán)也是該層級需要解決的問題;其次是在數(shù)據(jù)生命周期中,提升對信息數(shù)據(jù)處理的支持能力,為相關(guān)用戶提供更加多元化的數(shù)據(jù)服務(wù);最后是對信息數(shù)據(jù)獲取與搜索的無限強化,通過建立功能強大的信息數(shù)據(jù)中心以及搜索引擎,為圖書館用戶提供將各類數(shù)據(jù)進行科學(xué)鏈接的數(shù)據(jù)服務(wù)。
當圖書館數(shù)據(jù)由傳統(tǒng)數(shù)據(jù)時代過渡到以大數(shù)據(jù)為代表的數(shù)字化時代后,數(shù)據(jù)的大規(guī)?;图s化就成為了信息數(shù)據(jù)在數(shù)字時代的基本特征。但很多問題也隨之出現(xiàn),例如數(shù)據(jù)管理的隱私問題存在安全隱患,大數(shù)據(jù)技術(shù)對數(shù)據(jù)生態(tài)系統(tǒng)可持續(xù)性的支持如何得到保障,都是亟待解決的問題。圖書館可以通過數(shù)據(jù)治理解決以上問題,這就需要完善相關(guān)制度,明確管理責任。
完善制度和明確責任在數(shù)據(jù)治理的實踐中,具體表現(xiàn)就是在組織結(jié)構(gòu)與職責上設(shè)置科學(xué)合理的指導(dǎo)原則,強調(diào)各部門的分工合作,從圖書館的實際情況出發(fā),展開元數(shù)據(jù)、實體信息等相關(guān)數(shù)據(jù)的具體管理工作。在大數(shù)據(jù)背景下的數(shù)字時代,海量信息的無節(jié)制使用,造成了很多隱私數(shù)據(jù)存在泄露的風(fēng)險,并且信息數(shù)據(jù)的網(wǎng)絡(luò)安全也暴露出一些問題。圖書館對于這些問題應(yīng)有針對性地開展數(shù)據(jù)治理,加強信息數(shù)據(jù)的保護,同時軟硬兼施,雙管齊下:一方面對數(shù)據(jù)安全系統(tǒng)進行全方位的更新升級,并對相關(guān)數(shù)據(jù)實行分級加密;另一方面則要提升圖書館工作人員的法律意識,加強隱私信息數(shù)據(jù)的保護。如運用大數(shù)據(jù)技術(shù)搭建智能化的安防平臺,針對信息數(shù)據(jù)的潛在風(fēng)險進行評估。除此以外,保障實體信息數(shù)據(jù)安全的主要做法是防止其被盜用,對擁有知識產(chǎn)權(quán)的信息,更是要拿起法律武器確保利益不受到損害。
大數(shù)據(jù)對圖書館數(shù)據(jù)生態(tài)系統(tǒng)的技術(shù)支持至關(guān)重要,只有實現(xiàn)大數(shù)據(jù)技術(shù)的可持續(xù)性發(fā)展,才能更好地保障實體信息數(shù)據(jù)價值的實現(xiàn)。而未來大數(shù)據(jù)除了實現(xiàn)信息數(shù)據(jù)的資源化,更要與云計算深度融合以增強其核心競爭力,這對于圖書館數(shù)據(jù)生態(tài)系統(tǒng)的深度強化將具有明顯的促進作用。
大數(shù)據(jù)時代下的圖書館與傳統(tǒng)意義上的圖書館已有極大差異,前者適應(yīng)了當今時代圖書館用戶漸趨整合式的需求,對信息數(shù)據(jù)的管理方式做出了一定程度的調(diào)整[24]。當下既是大數(shù)據(jù)時代,也是知識經(jīng)濟時代,人們對知識的需求程度遠遠超過以往任何一個時代。因此一種集合多種類數(shù)據(jù)資源、可以對信息數(shù)據(jù)進行檢索和獲取的整合平臺應(yīng)運而生,這也成為數(shù)據(jù)資源管理未來的發(fā)展趨勢。但是,當前多數(shù)門戶平臺的信息數(shù)據(jù)都有碎片化的局限性[25],圖書館信息數(shù)據(jù)兼具深度和廣度的優(yōu)勢就此顯現(xiàn)出來?;诖?,圖書館數(shù)據(jù)管理的未來趨勢是創(chuàng)建一個以檢索和獲取信息數(shù)據(jù)為主的門戶式數(shù)據(jù)中心,它能夠?qū)⒎植加诟鱾€數(shù)據(jù)庫、相對孤立封閉的數(shù)據(jù)資源關(guān)聯(lián)起來,實現(xiàn)內(nèi)部與外部所有信息數(shù)據(jù)的共享及融合,為所有圖書館用戶提供開放且系統(tǒng)化的信息數(shù)據(jù)服務(wù)。
大數(shù)據(jù)作為這個時代集大成的科技創(chuàng)新產(chǎn)物,為圖書館的數(shù)據(jù)管理帶來了全新的模式。融合了大數(shù)據(jù)技術(shù)的全新數(shù)據(jù)生態(tài)系統(tǒng),能夠為用戶提供多元化、個性化的數(shù)據(jù)服務(wù)。本文結(jié)合SWOT分析法解析了該生態(tài)系統(tǒng),并根據(jù)研究機理,搭建了模型框架,并據(jù)此就圖書館的數(shù)據(jù)治理提出了相關(guān)實踐路徑建議,對圖書館數(shù)據(jù)生態(tài)系統(tǒng)的理論研究及數(shù)據(jù)管理的創(chuàng)新具有一定的啟發(fā)意義,但怎樣才能由理論走向?qū)嵺`,是未來需要考慮的關(guān)鍵問題。