魯黎
(中共湘西州委黨校,湖南吉首,416000)
大數(shù)據(jù)的顯著特點在于巨量的資料信息,將類型復(fù)雜繁瑣、數(shù)量巨多的數(shù)據(jù)信息構(gòu)建成數(shù)據(jù)庫,利用云計算等信息技術(shù)實現(xiàn)對數(shù)據(jù)信息的精準(zhǔn)提煉、分析處理與實時共享,其核心作用價值在于數(shù)據(jù)信息的集成處理與數(shù)據(jù)增值,旨在為日常經(jīng)營管理提供有價值的數(shù)據(jù)服務(wù)。對于圖書館而言,大數(shù)據(jù)信息化背景下圖書館呈現(xiàn)出系統(tǒng)化的發(fā)展特點,隨著社會經(jīng)濟的快速發(fā)展,圖書館所涉及的巨量數(shù)據(jù)信息資源不斷崛起,引起圖書館服務(wù)模式的必然轉(zhuǎn)變。為進一步推動圖書館信息化服務(wù)的建設(shè)發(fā)展,大數(shù)據(jù)信息技術(shù)的有效應(yīng)用多圍繞“服務(wù)”這一主題來開展,包括平臺服務(wù)方式、數(shù)據(jù)信息資料的分析處理以及服務(wù)對象的轉(zhuǎn)變等等,將讀者產(chǎn)生的閱讀行為習(xí)慣轉(zhuǎn)化為數(shù)據(jù)信息,從而不斷強化圖書館信息化服務(wù)工作,更好地適應(yīng)信息化時代發(fā)展的需要。
首先表現(xiàn)為數(shù)據(jù)信息的實時共享,圖書館管理終端可充分利用大數(shù)據(jù)信息技術(shù)來快速精準(zhǔn)的提取讀者的相關(guān)數(shù)據(jù)信息,實現(xiàn)對讀者行為習(xí)慣的準(zhǔn)確分析,從而更好地實施個性化服務(wù),讀者能夠獲取到所需的有效信息,從而提高數(shù)據(jù)信息的高效使用。同時利用大數(shù)據(jù)信息技術(shù)能夠不斷拓展圖書館圖書資源的采購范圍,通過對讀者行為習(xí)慣、數(shù)據(jù)信息進行分析整合之后來為讀者采購更多所需的圖書資源,并為國家科教文化事業(yè)的建設(shè)發(fā)展提供相關(guān)的數(shù)據(jù)信息,借助大數(shù)據(jù)信息的實時共享特性來不斷提升圖書館信息化服務(wù)水平。
其次表現(xiàn)為數(shù)字化、信息化的資源存儲。利用大數(shù)據(jù)信息技術(shù)構(gòu)建數(shù)字化圖書館,形成數(shù)據(jù)信息服務(wù)鏈。一方面能夠?qū)⒁恍^藏時間較久,且借閱率、展覽率不高的文本資料借助信息化平臺來向讀者全面生動的呈現(xiàn),有利于我國優(yōu)秀傳統(tǒng)文化的持續(xù)傳播,同時最大限度的保護了版權(quán)許可規(guī)定。另一方面對于日常大量的圖書資源信息能夠保證安全的、數(shù)字化資源存儲,不僅方便信息的檢索提取,還為圖書館節(jié)省了一定的空間場所[1]。
再次表現(xiàn)為信息交流的交互性和隨意性。傳統(tǒng)圖書館服務(wù)模式下,圖書的借閱歸還、口頭咨詢等多采用面對面的服務(wù)模式,而大數(shù)據(jù)信息化技術(shù)能夠打破時間、空間的壁壘,讀者不受空間限制能夠進行信息資料的隨時獲取或者進行有關(guān)咨詢,有效簡化了圖書資源的借閱手續(xù),通過借助智能終端設(shè)備就能查閱相關(guān)數(shù)據(jù)資料。
為進一步提升圖書館信息化服務(wù)水平,需要熟練掌握信息服務(wù)技術(shù)的有效應(yīng)用,在此主要介紹與數(shù)據(jù)信息挖掘相關(guān)的技術(shù),方便應(yīng)用于圖書語音識別、圖書采購以及移動借閱、數(shù)字圖書館的建設(shè)等方面。首先深度神經(jīng)網(wǎng)絡(luò)是近年來機器學(xué)習(xí)深度研究的一個重要方向,通過模擬人腦并進行分析的形式來解釋圖像、聲音文本等相關(guān)數(shù)據(jù),利用深度神經(jīng)網(wǎng)絡(luò)技術(shù)來對圖書館相關(guān)的資源信息進行逐層提取、自動化提取,無需人工手動干預(yù),大數(shù)據(jù)與深度神經(jīng)網(wǎng)絡(luò)技術(shù)的結(jié)合為數(shù)字圖書館的建設(shè)與智能化發(fā)展開創(chuàng)了一個新的方向。利用深度神經(jīng)網(wǎng)絡(luò)技術(shù)對館內(nèi)可視化、音視頻文本等進行語音識別,識別精讀能夠提升近30%,同時應(yīng)用于圖書圖像識別分類能夠大大降低誤差率。除此之外還可應(yīng)用于圖書館內(nèi)大數(shù)據(jù)信息資源檢索系統(tǒng)以及各類信息識別軟件中。為最大限度地實現(xiàn)數(shù)據(jù)信息的自動過濾與逐層分類,需要重點借助信息過濾技術(shù),首先在于內(nèi)容的過濾與信息檢索,通過模擬構(gòu)建讀者感興趣的文本信息模型來實現(xiàn)信息檢索與過濾;其次在于協(xié)作過濾,憑借信息過濾技術(shù)能夠依據(jù)最近用戶感興趣的信息對其進行分析判斷,從而將得出的結(jié)果信息推送給其他用戶,協(xié)作過濾可充分應(yīng)用于一些較為復(fù)雜多變的概念。最后針對信息過濾技術(shù),可應(yīng)用移動Agent信息過濾算法來智能分析讀者的閱讀喜好,建立相應(yīng)的用戶信息采集庫,對于出現(xiàn)的高頻詞、關(guān)鍵詞進行過濾,從而方便管理人員有針對性的向讀者推送個性化信息服務(wù)。如下圖通過數(shù)據(jù)挖掘來進行信息過濾并構(gòu)建出讀者個性化模型,實現(xiàn)圖書服務(wù)的針對性、個性化推薦,極大的提高了圖書館數(shù)據(jù)信息服務(wù)水平。
圖1 個性化推薦模型
數(shù)據(jù)資源分析是提升圖書館信息化服務(wù)質(zhì)量的現(xiàn)實需求,利用大數(shù)據(jù)信心技術(shù)能夠促使讀物形式、業(yè)務(wù)功能更加多元化,數(shù)據(jù)資源的使用頻率也越來越高,同時更多圖書活動也相繼開展,這些表現(xiàn)對于數(shù)據(jù)信息的分析有著極高的要求。隨著館內(nèi)各項數(shù)據(jù)信息資源的擴增,想要實現(xiàn)數(shù)據(jù)資源結(jié)構(gòu)化、半結(jié)構(gòu)化的整合形式相對困難,因而需要全面加強對數(shù)據(jù)分析的重視。一方面數(shù)據(jù)分析更符合線上線下讀者的個性化閱讀需求,通過手機終端、郵箱等來獲取所需的資源信息,避免了讀者從海量的資料中查找自己想要信息的情況。另一方面有助于推動正確決策的制定與管理,借助數(shù)據(jù)聚類分析挖掘、可視化分析技術(shù)以及數(shù)據(jù)集成等信息技術(shù)來挖掘并發(fā)現(xiàn)海量數(shù)據(jù)信息之間存在的關(guān)聯(lián),以關(guān)聯(lián)規(guī)律來分析判斷圖書館服務(wù)工作發(fā)展趨勢,從而確保發(fā)展決策制定的可行性。如下圖是對結(jié)構(gòu)化、半結(jié)構(gòu)化以及非結(jié)構(gòu)化數(shù)據(jù)的交叉同和,有利于運用大數(shù)據(jù)技術(shù)進行資源整合。
圖2 數(shù)據(jù)交叉融合
最主要的在于讀者借閱數(shù)據(jù)的分析,讀者是圖書館信息化服務(wù)的核心,通過對線上線下讀者的借閱數(shù)據(jù)、互聯(lián)網(wǎng)資源訪問數(shù)據(jù)以及各項圖書資源檢索行為習(xí)慣進行整合與分析,從而形成讀者特有的行為關(guān)聯(lián)規(guī)律以及興趣偏向,從而與圖書館服務(wù)改革創(chuàng)新方向結(jié)合,為讀者提供更加準(zhǔn)確的服務(wù)。一是需要從全局發(fā)展角度去看待讀者整體的借閱數(shù)據(jù),包括讀者人均借閱情況、季度借閱情況、借閱總量、借閱分類以及讀者借還周期、借閱量的增長情況等,將這些不同類型的借閱指標(biāo)作為讀者借閱情況數(shù)據(jù)分析參數(shù),從各種角度去詳細看待圖書館讀者借閱的全部情況,從而有針對性的采取相應(yīng)的應(yīng)對措施。二是需要對圖書資源采購相關(guān)數(shù)據(jù)進行分析,當(dāng)前圖書館圖書采購多以書商作為主要采購渠道,在節(jié)省了采購時間獲得一定便利的同時也面臨著相應(yīng)的問題,圖圖書采購質(zhì)量以及實際到書率、館內(nèi)圖書上架效率等較為欠缺,隨著圖書館采購需要以及圖書市場的發(fā)展變化,圖書館圖書采購需要從源頭上加強數(shù)據(jù)分析,從而合理選擇圖書采購類型以及采購渠道、方式。首先將全國性新書目錄、書商征訂目錄的數(shù)據(jù)信息進行比對,有利于圖書館更準(zhǔn)確的了解采購出版的新書比率,從而合理統(tǒng)計每年度需要訂購的圖書種類、冊數(shù)以及費用比例等相關(guān)信息,同時圖書采購人員可參考其他圖書館或者以往的圖書訂購情況作出綜合評估。其次準(zhǔn)確統(tǒng)計不同書商的實際到書日期以及已到、未到書的數(shù)量和具體原因,對整體到書率進行評估之后可考慮對未到書進行催缺或者進行換訂購。最后對各書商相關(guān)信息進行綜合評估,制定不同的評書級別,同時對館內(nèi)圖書從驗收到上架的周期進行評估。三是圖書館館藏數(shù)據(jù)分析,主要指文獻資源、紙本圖書等資源,通過對館藏資源進行調(diào)查統(tǒng)計和量化分析,從而進一步提高圖書館館藏管理質(zhì)量和服務(wù)水平,并借助數(shù)據(jù)分析情況來優(yōu)化調(diào)整館藏資源結(jié)構(gòu),促進紙本、文獻資源的優(yōu)化配置。首先結(jié)合資源的年代日期、語言種類以及文獻類型等多項指標(biāo)對館藏資源進行調(diào)查統(tǒng)計與分析評估,為優(yōu)化館藏結(jié)構(gòu)打下堅實的基礎(chǔ)。其次通過對館藏文獻資源年度、種類等借閱情況進行分析可判斷出館藏實際利用率,從而依據(jù)館藏發(fā)展趨勢來合理剔除部分館藏資料,計算出實際的館藏剔除率[4]。
建設(shè)數(shù)字化圖書館,做好館藏資源數(shù)字化開發(fā)工作,理應(yīng)引進Web開發(fā)技術(shù)、數(shù)據(jù)挖掘技術(shù)和WEBGIS技術(shù)。Web開發(fā)技術(shù)起源于1991年,該技術(shù)能準(zhǔn)確監(jiān)測和收集各種動態(tài)信息,為圖書館搭建更完善的館藏資源開發(fā)平臺,同時,也方便管理數(shù)字化書籍信息。在數(shù)據(jù)挖掘技術(shù)的支撐下,圖書館內(nèi)部大數(shù)據(jù)存儲平臺具有良好的兼容功能,因而能保存大量不同種類、不同結(jié)構(gòu)的書籍文化數(shù)據(jù)信息,包括各學(xué)科的電子書、學(xué)術(shù)文獻、專利項目、圖書館發(fā)展史與相關(guān)檔案等。而且,大數(shù)據(jù)時代在實現(xiàn)信息開放與共享的同時依然能做好隱私安全保護工作,避免讀者信息泄漏。WEBGIS技術(shù)用于搭建圖書檔案網(wǎng)絡(luò)管理平臺,能準(zhǔn)確測繪和采集書籍資源相關(guān)信息,并對這些信息進行提煉處理、準(zhǔn)確傳輸、分類存儲、安全管理、查詢檢索、客觀分析和應(yīng)用,從而使圖書檔案管理工作更有效[5]。
其次為進一步規(guī)范讀者借閱管理行為,提高精細化管理水平,有必要創(chuàng)建相應(yīng)的資源數(shù)知識庫。一方面對讀者的借閱行為進行規(guī)范管理,最大程度地保證讀者的借閱規(guī)范性和借閱質(zhì)量。另一方面對借閱管理進行精細劃分,以精細化管理模式來促進圖書管理的系統(tǒng)化、規(guī)?;约敖M織化,通過創(chuàng)建數(shù)據(jù)知識庫來加強圖書精細化管理的全面落實,為其提供強大的數(shù)據(jù)支撐,包括對服務(wù)工作的管理目標(biāo)、方向、具體流程以及人員考核評價等進行精細化管理,將涉及的所有數(shù)據(jù)信息保存到數(shù)據(jù)知識庫中,方便管理人員對以往相關(guān)數(shù)據(jù)信息進行有效提取。
本文通過對大數(shù)據(jù)環(huán)境下圖書館信息化服務(wù)發(fā)展特征進行重點分析探討,從而依據(jù)圖書館館藏管理、讀者服務(wù)以及圖書采購借閱等需要,對大數(shù)據(jù)技術(shù)系統(tǒng)、數(shù)據(jù)庫平臺的搭建以及圖書館數(shù)據(jù)資源分析進行了全方位的闡述說明,充分發(fā)揮出大數(shù)據(jù)信息技術(shù)的作用和價值,在滿足讀者多元化閱讀需求的基礎(chǔ)上形成多元化與個性化相結(jié)合的服務(wù)模式。