李嬌等
摘 要:隨著大數(shù)據(jù)時(shí)代迅速來臨,給社會文化與各行各業(yè)都帶來了巨大變革,圖書館同樣不例外。就大數(shù)據(jù)來說,圖書館界先后進(jìn)行了一系列學(xué)術(shù)研究以及實(shí)踐,但圖書館事業(yè)當(dāng)中大數(shù)據(jù)的運(yùn)用仍然存在著許多問題,這些問題的存在對圖書館正常發(fā)展及運(yùn)營造成了嚴(yán)重影響,因此優(yōu)化其應(yīng)用程序尤其關(guān)鍵。
關(guān)鍵詞:大數(shù)據(jù)時(shí)代;圖書館;發(fā)展
基金項(xiàng)目:重慶市高等教育教學(xué)改革研究項(xiàng)目(133023,1203036)。
1.前言
隨著大數(shù)據(jù)時(shí)代的到來,對圖書館的建設(shè)和服務(wù)等工作產(chǎn)生了很大的影響。比如,出現(xiàn)了圖書館的大數(shù)據(jù)存儲能力不夠、容易泄露讀者的保密數(shù)據(jù)及其閱讀隱私等問題。當(dāng)前,為保證圖書館順應(yīng)時(shí)代發(fā)展的需求,及時(shí)做好相應(yīng)的應(yīng)對措施,實(shí)現(xiàn)大數(shù)據(jù)在圖書館管理中的可用性,已成為圖書館準(zhǔn)確、高效地滿足讀者閱讀需求,優(yōu)化服務(wù)模式的關(guān)鍵。因此,圖書館應(yīng)科學(xué)的進(jìn)行大數(shù)據(jù)的采集、分析及判定和決策,以實(shí)現(xiàn)大數(shù)據(jù)的可控性、有效性和經(jīng)濟(jì)性。
2.對圖書館運(yùn)用大數(shù)據(jù)的主要問題
2.1 圖書館的大數(shù)據(jù)運(yùn)行技術(shù)及基礎(chǔ)設(shè)施條件不夠
圖書館數(shù)據(jù)具有資源總量大、增長迅速快的特點(diǎn),其種類以及數(shù)量隨著信息時(shí)代的到來逐超越紙質(zhì)版的學(xué)術(shù)資源,將成為圖書館的重要館藏部分,也是數(shù)字圖書館日后可依據(jù)的重要資產(chǎn)。因此,出現(xiàn)了圖書館的大數(shù)據(jù)運(yùn)行技術(shù)及基礎(chǔ)設(shè)施條件不夠的問題。當(dāng)前,將新興的大數(shù)據(jù)技術(shù)合理的運(yùn)用于數(shù)字化的圖書館,構(gòu)建出大數(shù)據(jù)圖書館所需的基礎(chǔ)設(shè)施條件,已是大數(shù)據(jù)時(shí)代背景下圖書館進(jìn)行建設(shè)的一項(xiàng)重要挑戰(zhàn)。一方面,信息時(shí)代,讀者產(chǎn)生的數(shù)據(jù)信息中會存在很多半結(jié)構(gòu)化和非結(jié)構(gòu)化的信息數(shù)據(jù),致使信息數(shù)據(jù)的結(jié)構(gòu)類型和格式形態(tài)等都更加復(fù)雜。因此,極速增長的數(shù)據(jù)量給圖書館的存儲能力帶來了很大的挑戰(zhàn),當(dāng)前現(xiàn)有的圖書館的整體性的知識服務(wù)結(jié)構(gòu)并不完善,其數(shù)據(jù)處理技術(shù)很難實(shí)現(xiàn)大數(shù)據(jù)的應(yīng)用需求。另一方面,大數(shù)據(jù)種類的復(fù)雜化給圖書館的常規(guī)分析帶來了很大的挑戰(zhàn),這就要求必須突破對大量異構(gòu)數(shù)據(jù)的處理和分析不足的問題。當(dāng)前,大數(shù)據(jù)時(shí)代產(chǎn)生的數(shù)據(jù)總量及類型的急劇變化使圖書館的基礎(chǔ)設(shè)施承受著很大的壓力,由于受到成本的制約,現(xiàn)階段的大部分圖書館難以在短時(shí)間內(nèi)在技術(shù)、基礎(chǔ)設(shè)施的建設(shè)等方面滿足建設(shè)大數(shù)據(jù)圖書館的實(shí)際要求[1]。
2.2 大數(shù)據(jù)的不確定性對圖書館管理提出了新的挑戰(zhàn)
大數(shù)據(jù)存在一定的不確定性,這種不確定性特征會致使網(wǎng)絡(luò)數(shù)據(jù)很難被建模及有效學(xué)習(xí),從而難以發(fā)揮其有效利用的價(jià)值。數(shù)據(jù)本身存在的不確定性、并不完全準(zhǔn)確的原始數(shù)據(jù)、對數(shù)據(jù)采集的處理力度以及應(yīng)用需求等因素致使數(shù)據(jù)在不同的維度和尺度方面均出現(xiàn)了不確定性;大數(shù)據(jù)的模型也具有不確定性,由于數(shù)據(jù)自身具有的不確定性會要求數(shù)據(jù)的處理方式應(yīng)該不同于傳統(tǒng)的數(shù)據(jù)處理方法,這就要求圖書館在大數(shù)據(jù)的管理方面應(yīng)該提出相應(yīng)的新模型并把握好模型的表達(dá)能力,最終致使新選擇的大數(shù)據(jù)模型也具有了一定程度的不確定性;大數(shù)據(jù)的學(xué)習(xí)具有不確定性,數(shù)據(jù)模型一般情況下都需要學(xué)習(xí)模型參數(shù),但是通常情況下很難找到模型的最優(yōu)解。因此,大部分學(xué)習(xí)問題都只是采用一個(gè)近似但并不確定的方法找出一個(gè)相對而言可用的解。在大數(shù)據(jù)時(shí)代的要求下,傳統(tǒng)的近似學(xué)習(xí)方法則需要面對時(shí)效和規(guī)模的雙重挑戰(zhàn),這樣一來,便要求圖書館要盡量提高技術(shù)性管理水平來應(yīng)對大數(shù)據(jù)學(xué)習(xí)中的不確定性[2]。
2.3 大數(shù)據(jù)為圖書館數(shù)據(jù)帶來安全隱患的問題
在大數(shù)據(jù)信息時(shí)代,使用信息的安全和讀者的閱讀隱私問題已經(jīng)成為當(dāng)前建設(shè)大數(shù)據(jù)圖書館的一大挑戰(zhàn)。開放數(shù)據(jù)和共享數(shù)據(jù)是進(jìn)行大數(shù)據(jù)模式的核心精神,現(xiàn)階段的各組織機(jī)構(gòu)包括圖書館都開始公開、共享出各自領(lǐng)域的信息數(shù)據(jù),在很大程度上消除了以往的“數(shù)據(jù)孤島和數(shù)據(jù)割據(jù)”的狀態(tài),逐漸實(shí)現(xiàn)了共建圖書館數(shù)據(jù)以及數(shù)據(jù)價(jià)值最大化發(fā)展。但是,隨著而來的信息安全問題也從傳統(tǒng)的計(jì)算機(jī)網(wǎng)絡(luò)的保密性管理、可控性管理逐漸轉(zhuǎn)變?yōu)殡y于預(yù)見信息安全隱患和信息管理出現(xiàn)不可控的困境。隨著近年來大數(shù)據(jù)的不斷整合和大數(shù)據(jù)技術(shù)門檻的日益降低,導(dǎo)致圖書館大數(shù)據(jù)中所包含的大量的涉及用戶隱私的商業(yè)情報(bào),甚至是部分涉及國家安全的信息都成了難以保護(hù)的重要對象。由此,致使大數(shù)據(jù)背景下的圖書館數(shù)據(jù)的安全隱患問題日益嚴(yán)重化[3]。
3.圖書館應(yīng)對大數(shù)據(jù)時(shí)代影響的有效對策
3.1 開發(fā)圖書館的大數(shù)據(jù)運(yùn)行技術(shù),使圖書館滿足運(yùn)行大數(shù)據(jù)的條件
在大數(shù)據(jù)背景下,只有開發(fā)圖書館的大數(shù)據(jù)運(yùn)行技術(shù),才能使圖書館滿足運(yùn)行大數(shù)據(jù)的條件。當(dāng)前,圖書館建設(shè)的當(dāng)務(wù)之急應(yīng)該是樹立大數(shù)據(jù)的發(fā)展戰(zhàn)略,做好管理的頂層設(shè)計(jì),科學(xué)推動圖書館完成大數(shù)據(jù)的轉(zhuǎn)型。圖書館應(yīng)該基于全局戰(zhàn)略及局部戰(zhàn)略的角度,根據(jù)自身實(shí)際條件對建立大數(shù)據(jù)的戰(zhàn)略角色進(jìn)行定位,并緊密結(jié)合圖書館所在區(qū)域的主要服務(wù)對象的館藏特點(diǎn)等因素,建立起分級、分類的具體性實(shí)施策略,積極探索大數(shù)據(jù)的業(yè)務(wù)、服務(wù)、技術(shù)等模型。圖書館穩(wěn)定發(fā)展的主要競爭力是其占有數(shù)據(jù)信息的規(guī)?;钚院蛯?shù)據(jù)的分析、挖掘、運(yùn)用能力,當(dāng)前,傳統(tǒng)方法的數(shù)據(jù)定量分析已難以滿足大數(shù)據(jù)的分析需求。圖書館可以采用統(tǒng)計(jì)學(xué)及模式識別等各種技術(shù),從圖書館大量的數(shù)據(jù)中提取出信息中所潛在的各種價(jià)值信息。同時(shí),圖書館應(yīng)該成立適用的數(shù)據(jù)管理部門來專門負(fù)責(zé)信息數(shù)據(jù)的采集、收儲和利用工作,通過館內(nèi)各部門間的協(xié)調(diào)工作,使圖書館滿足運(yùn)行大數(shù)據(jù)的條件。
3.2 圖書館應(yīng)構(gòu)建科學(xué)的大數(shù)據(jù)存儲系統(tǒng)
圖書館大數(shù)據(jù)存儲系統(tǒng)需要具有存儲架構(gòu)科學(xué)、存儲容量大、存儲區(qū)域網(wǎng)絡(luò)化等,這些特性直接關(guān)系著圖書館的大數(shù)據(jù)管理效率和管理質(zhì)量。因此,為順應(yīng)大數(shù)據(jù)時(shí)代的要求,構(gòu)建科學(xué)的大數(shù)據(jù)存儲系統(tǒng),圖書館應(yīng)該做好以下幾個(gè)方面的工作:(1)關(guān)注大數(shù)據(jù)系統(tǒng)結(jié)構(gòu)的科學(xué)合理性,存儲數(shù)據(jù)應(yīng)該嚴(yán)格按照數(shù)據(jù)信息的類型、應(yīng)用需求和安全保障等對信息文件進(jìn)行分塊存儲。 (2)采用認(rèn)證用戶身份及設(shè)置訪問權(quán)限的管理模式,控制用戶對大數(shù)據(jù)存儲平臺的數(shù)據(jù)訪問。 (3)圖書館大數(shù)據(jù)存儲系統(tǒng)應(yīng)該具備比較強(qiáng)的數(shù)據(jù)容錯(cuò)力,以保證數(shù)據(jù)存儲的可用性。(4)應(yīng)根據(jù)圖書館的未來管理方向和服務(wù)數(shù)據(jù)量的增長情況,建設(shè)存儲系統(tǒng)時(shí)應(yīng)該保證系統(tǒng)可實(shí)現(xiàn)通過增加數(shù)據(jù)信息的節(jié)點(diǎn)數(shù)量或數(shù)據(jù)塊的服務(wù)器數(shù)量,便可以自由進(jìn)行數(shù)據(jù)存儲能力的擴(kuò)展。
3.3 確保圖書館大數(shù)據(jù)的可控性和可靠性
為確保圖書館大數(shù)據(jù)的可控性和可靠性,圖書館在進(jìn)行數(shù)據(jù)采集時(shí),通常希望可以最大范圍地對數(shù)據(jù)進(jìn)行采集和分析。這就需要圖書館運(yùn)用科學(xué)的大數(shù)據(jù)采集方法進(jìn)行數(shù)據(jù)的采集,以保證采集數(shù)據(jù)的精確性、價(jià)值密度和數(shù)據(jù)間的因果關(guān)系等。因此,為了保證圖書館大數(shù)據(jù)的準(zhǔn)確性、高效性和可用性,圖書館應(yīng)做好以下幾個(gè)方面的工作:(1)圖書館應(yīng)該根據(jù)運(yùn)營服務(wù)和系統(tǒng)管理的實(shí)際需求,建立大數(shù)據(jù)的質(zhì)量評估標(biāo)準(zhǔn)以及可用性的保障體系。通過利用評估系統(tǒng)科學(xué)的對大數(shù)據(jù)的數(shù)據(jù)信息的可用性以及數(shù)據(jù)間的關(guān)系進(jìn)行評估,然后通過評估結(jié)果進(jìn)而實(shí)時(shí)反饋,并采取相應(yīng)的對策,進(jìn)而保證圖書館大數(shù)據(jù)平臺的科學(xué)性、經(jīng)濟(jì)性和可控性。(2)在對大數(shù)據(jù)進(jìn)行采集、存儲、管理和應(yīng)用的過程中,圖書館應(yīng)確保數(shù)據(jù)信息具有廣泛的數(shù)據(jù)視角、長期性的原始格式存儲類型、可快速的實(shí)現(xiàn)數(shù)據(jù)自身價(jià)值并為用戶提供服務(wù)等。(3)圖書館應(yīng)該根據(jù)數(shù)據(jù)價(jià)值的發(fā)掘程度及其未來的可用性,對高價(jià)值的數(shù)據(jù)進(jìn)行長期性的安全存儲及查詢優(yōu)化,保證高價(jià)值的大數(shù)據(jù)安全、穩(wěn)定及未來可用。
3.4 強(qiáng)化圖書館數(shù)據(jù)的安全建設(shè)與管理
一直以來,保護(hù)國家情報(bào)安全和用戶的個(gè)人圖書情報(bào)都是圖書館的重要責(zé)任。但是,在大數(shù)據(jù)時(shí)代的背景下,大數(shù)據(jù)進(jìn)行開放數(shù)據(jù)和共享數(shù)據(jù)致使國家情報(bào)安全和用戶的個(gè)人圖書情報(bào)出現(xiàn)了很大的安全問題,這一問題制約著圖書館進(jìn)入大數(shù)據(jù)時(shí)代的速度。 面對這一問題,圖書館應(yīng)該做好以下幾個(gè)方面的工作,以切實(shí)保護(hù)用戶的數(shù)據(jù)安全:(1)圖書館需要研發(fā)或者引進(jìn)實(shí)現(xiàn)大數(shù)據(jù)條件下保護(hù)用戶隱私的安全技術(shù),以有效防止惡意入侵盜取和破壞數(shù)據(jù)的不法行為發(fā)生。同時(shí)規(guī)范數(shù)據(jù)的開放流程及接口,以保障圖書館的數(shù)據(jù)資源的科學(xué)有序的開放、安全使用。(2)圖書館是數(shù)據(jù)的守衛(wèi)者,圖書館工作人員必須要提高自身的專業(yè)素養(yǎng)及職業(yè)道德水平,切實(shí)保護(hù)用戶的個(gè)人數(shù)據(jù)信息安全,嚴(yán)格控制好信息的傳播和開放范圍,同時(shí)做好國家情報(bào)機(jī)密的保護(hù)工作,維護(hù)國家的信息安全性 。(3)政府應(yīng)該研究并出臺保護(hù)大數(shù)據(jù)安全的相關(guān)法律法規(guī),通過立法的手段保護(hù)圖書館大數(shù)據(jù)的安全性。只有制定法律嚴(yán)厲的懲罰數(shù)據(jù)入侵者和數(shù)據(jù)破壞者,對其造成的危害后果追究相應(yīng)的刑事責(zé)任,才能從根本上避免圖書館大數(shù)據(jù)安全問題的發(fā)生。
3.5 構(gòu)建結(jié)構(gòu)化及經(jīng)濟(jì)化的圖書館大數(shù)據(jù)平臺
科學(xué)的構(gòu)建結(jié)構(gòu)化及經(jīng)濟(jì)化的圖書館大數(shù)據(jù)平臺,圖書館應(yīng)該做好如下工作:一方面圖書館在建設(shè)大數(shù)據(jù)平臺時(shí),應(yīng)該堅(jiān)持“統(tǒng)一標(biāo)準(zhǔn)、開放兼容”的基本原則,以有效減少建設(shè)平臺系統(tǒng)的成本,并合理降低軟件系統(tǒng)對硬件設(shè)備技術(shù)指標(biāo)的參數(shù)要求。另一方面,進(jìn)行大數(shù)據(jù)的存儲、管理分析和應(yīng)用建設(shè),應(yīng)該堅(jiān)持“開源平臺、保證軟件可擴(kuò)展及可移植”的重要原則,以確保系統(tǒng)方便操作、管理。此外,大數(shù)據(jù)平臺應(yīng)該通過對服務(wù)資源進(jìn)行動態(tài)調(diào)配和擴(kuò)展等模式,在保證實(shí)現(xiàn)數(shù)據(jù)存儲、管理、分析過程中的最高收益的基礎(chǔ)上,有效降低運(yùn)營成本的投入。同時(shí),大數(shù)據(jù)平臺的性能設(shè)計(jì)應(yīng)該滿足圖書館的全周期管理、多類型數(shù)據(jù)、多功能使用以及全天候的連續(xù)性的綜合性服務(wù)需求。
3.6 保證圖書館大數(shù)據(jù)的即時(shí)性和可用性
在大數(shù)據(jù)時(shí)代的背景下,圖書館的用戶服務(wù)和讀者的閱讀活動所產(chǎn)生的數(shù)據(jù)具有了流動性和實(shí)時(shí)性的特點(diǎn)。這些隨時(shí)產(chǎn)生的信息數(shù)據(jù),對圖書館的用戶服務(wù)模式以及服務(wù)質(zhì)量都具有動態(tài)調(diào)控和即時(shí)判定的重要作用。一方面,圖書館應(yīng)該通過獲取的各種實(shí)時(shí)信息,對圖書館服務(wù)平臺的系統(tǒng)性能以及服務(wù)質(zhì)量等情況進(jìn)行提前的預(yù)警,并進(jìn)行實(shí)時(shí)監(jiān)測和動態(tài)跟蹤,最后做出相應(yīng)決策,以全面提高圖書館服務(wù)的智能化和自動化水平。另一方面,圖書館應(yīng)該通過對收集起來的讀者閱讀模式、閱讀內(nèi)容、讀者資料以及讀者的群關(guān)系等基本信息進(jìn)行合理分析,以準(zhǔn)確的掌握用戶的服務(wù)模式以及讀者的閱讀需求方向等,進(jìn)而為圖書館的服務(wù)模式轉(zhuǎn)型提供大數(shù)據(jù)的決策支持。此外,圖書館可通過挖掘所收集的數(shù)據(jù)信息,全面掌握讀者群的具體閱讀興趣和所需求的一些服務(wù)模式和內(nèi)容,進(jìn)而為提高圖書館對讀者的推送式的服務(wù)質(zhì)量[4]。
4 結(jié)束語
綜上所述,正確面對和解決大數(shù)據(jù)時(shí)代給圖書館帶來的影響,可以使圖書館與時(shí)俱進(jìn)的發(fā)展。隨著大數(shù)據(jù)時(shí)代的到來和快速發(fā)展,大數(shù)據(jù)給圖書館帶來了各種問題,在短時(shí)間內(nèi)嚴(yán)重影響了圖書館的正常運(yùn)營。圖書館是進(jìn)行整個(gè)社會的信息服務(wù)中心,其穩(wěn)定發(fā)展肩負(fù)著對社會的責(zé)任。因此,圖書館應(yīng)積極利用先進(jìn)的科學(xué)技術(shù)進(jìn)行改革,同時(shí),做好風(fēng)險(xiǎn)的管理工作,進(jìn)而將挑戰(zhàn)轉(zhuǎn)變?yōu)榘l(fā)展的機(jī)遇,最終促進(jìn)圖書館的可持續(xù)發(fā)展。
參考文獻(xiàn)
[1]許玲.大數(shù)據(jù)時(shí)代圖書館面臨的挑戰(zhàn)與對策思考[J].中共福建省委黨校學(xué)報(bào),2014,01(05):118.
[2]劉瓊.大數(shù)據(jù)環(huán)境下圖書館面臨的影響與挑戰(zhàn)[J].理論觀 察,2013,01(08):113.
[3]馬曉亭.大數(shù)據(jù)時(shí)代圖書館數(shù)據(jù)可用性:價(jià)值、挑戰(zhàn)和保障[J].圖書館理論與實(shí)踐,2014,01(10):6.
[4]馬曉亭.大數(shù)據(jù)時(shí)代圖書館數(shù)據(jù)長期可用性保障研究[J].現(xiàn)代情報(bào),2013,33(12):64.
作者簡介
李嬌(1981-),女,江蘇南通,博士,館員,研究方向?yàn)閳D書館管理及相關(guān)技術(shù),材料科學(xué)與工程。