文/甘肅省蘭州市民族法制文化研究所 李爽
在大數(shù)據(jù)時代,對圖書館館藏進行數(shù)字資源的整合,是信息組織自動化、動態(tài)化的需要,也是信息組織標(biāo)準(zhǔn)化、多模式的需要。圖書館館藏實現(xiàn)數(shù)字資源的整合,有利于更大程度地實現(xiàn)資源共享,提高資源利用率。因此圖書館館藏應(yīng)該尋找科學(xué)的數(shù)字資源整合策略設(shè)計方案和存儲體系。圖書館應(yīng)該利用海量圖書資源平臺,使用大數(shù)據(jù)處理技術(shù),高效地進行數(shù)據(jù)獲取和整合,為用戶提供更加優(yōu)質(zhì)的服務(wù)。
(一)數(shù)字資源整合是信息組織自動化、動態(tài)化的需要。在信息技術(shù)不發(fā)達的時代,圖書館的各項操作都依靠人工完成,耗時耗力,并且出錯率高。圖書館在整理資料時同樣也使用人工手動的方式,工作人員需要對書籍資料進行標(biāo)注、分類,并在整理過程中手動添加檢索的關(guān)鍵詞等書目的各項索引信息。這種傳統(tǒng)的錄入方式除了給圖書管理增加工作量外,也不便于用戶對所需信息的查找。如今,互聯(lián)網(wǎng)技術(shù)、云計算技術(shù)、多媒體技術(shù)等技術(shù)產(chǎn)業(yè)的快速發(fā)展使得網(wǎng)絡(luò)中可以存儲大量資源,這也標(biāo)志著我們進入了大數(shù)據(jù)時代。現(xiàn)在網(wǎng)絡(luò)上許多數(shù)字資源都具有時效性,倘若如今我們還用人工的方式進行整理,那么將會延長用戶使用資料的時間,造成資源的浪費。因此圖書館應(yīng)該實現(xiàn)數(shù)字資源自動標(biāo)注分類和整理,數(shù)字資源關(guān)鍵詞自動化錄入,這些都是圖書館當(dāng)下的重點研究方向。現(xiàn)如今網(wǎng)上的數(shù)字資源數(shù)量大、種類多、構(gòu)成成分比較復(fù)雜,人工整理的難度加大,這些非文本的資源整理是傳統(tǒng)手工整理方式無法實現(xiàn)的。
(二)數(shù)字資源整合是信息組織的標(biāo)準(zhǔn)化、應(yīng)用性的需要。因特網(wǎng)是一個結(jié)合多個網(wǎng)絡(luò)的整合體結(jié)構(gòu),其中的數(shù)字資源分布是雜亂無序的。信息網(wǎng)絡(luò)主要是以信息處理為主,并且可以進行海量存儲,添加和整理的整合型網(wǎng)絡(luò)結(jié)構(gòu)。不同網(wǎng)絡(luò)之間實現(xiàn)信息交流,也需要多方面的技術(shù)支持,所以要想整合網(wǎng)絡(luò)資源,就要有信息整理和加工的標(biāo)準(zhǔn)。例如有統(tǒng)一的數(shù)據(jù)格式索引或者描述語言。在如今的大數(shù)據(jù)背景下,大部分人都可以接觸到手機、平板以及電腦,都可以使用這些互聯(lián)網(wǎng)終端工具在數(shù)字圖書館上進行操作,獲取自己想要的資源。但需要注意的是,數(shù)字資源平臺應(yīng)該照顧到不同用戶的操作水平參差不齊,在設(shè)計平臺時,應(yīng)該簡潔明了,便于操作,使得所有的用戶都能夠檢索到自己所需要的數(shù)字資源,提高平臺的使用率,增強便民服務(wù)意識。
(一)為資源共享提供技術(shù)保障。在大數(shù)據(jù)背景下,僅僅利用現(xiàn)代化操作手段整合圖書館館藏數(shù)字資源是不夠的,還需要在整合資源之后用先進的信息處理技術(shù)來存儲圖書館館藏資源,其中珍貴的光盤以及文獻制品等都需要重點存儲維護。圖書館可以采用簡易信息聚合技術(shù)、標(biāo)簽技術(shù)以及web2.0技術(shù)進行資源的存儲。這些技術(shù)不僅具有技術(shù)成熟、應(yīng)用面廣、壽命長等優(yōu)點,還可以對用戶實行個性化的推送服務(wù)和檢索服務(wù),讓用戶更快地掌握書籍信息以及檢索方式?;谏鲜龅募夹g(shù)圖書館才能夠加強與用戶的交流,讓用戶有更多的機會加入信息交流中,并且能夠?qū)崿F(xiàn)個性化的信息資源服務(wù)。
(二)有利于提高文獻資源的利用率。在圖書館館藏中許多文獻資源十分珍貴,有很多資源都絕無僅有,所以在面臨眾多用戶需求的情況下,必須要實現(xiàn)資源的數(shù)字化。這樣即可以滿足讀者的閱讀需求,還可以較好的維護文獻資源,提高資源利用率。除此之外,數(shù)字化資源可以較好地整合信息,如一本書有1000多頁,在進行處理之后可以整理成六張平片存儲。因此圖書館應(yīng)該具備音像制品、微縮制品以及光盤管理和存儲技術(shù)等現(xiàn)代科技資源,否則將無法進行數(shù)據(jù)化資料信息的整理,存儲和共享。
(一)圖書館資源整合方案。在大數(shù)據(jù)背景下,圖書館數(shù)字資源的整合主要由大數(shù)據(jù)資源板塊、資源過濾和解析板塊、資源整合板塊、資源整合系統(tǒng)反饋控制板塊等組成。首先,在大數(shù)據(jù)資源層主要負責(zé)管理數(shù)據(jù),包括系統(tǒng)管理數(shù)據(jù)和客戶管理數(shù)據(jù),該層次可以通過數(shù)據(jù)使用的特點分類存儲到不同的管理庫中,為整個管理系統(tǒng)提供最基礎(chǔ)的信息管理服務(wù)。其次,資源過濾與解析層起到承上啟下的作用,主要是對數(shù)據(jù)的初次整理,負責(zé)提取數(shù)據(jù)特征、整理數(shù)據(jù)和規(guī)范數(shù)據(jù)的格式,以期來提高數(shù)據(jù)的存儲密度和價值度。再次,資源整合層是按照大數(shù)據(jù)讀取和轉(zhuǎn)化的準(zhǔn)則,將過濾后的數(shù)據(jù)轉(zhuǎn)化為可存儲在主數(shù)據(jù)庫中的數(shù)據(jù)。最后,資源整合反饋與控制層是數(shù)據(jù)最后的整合階段,該層需要對數(shù)據(jù)進行評估和優(yōu)化,并且還會全程監(jiān)管數(shù)據(jù)的整合過程,及時的發(fā)現(xiàn)和改正問題,不斷提高數(shù)據(jù)的可控性,以便于提供給用戶更加安全和準(zhǔn)確的數(shù)據(jù)。
(二)實現(xiàn)數(shù)據(jù)在采集終端的過濾和整合策略。數(shù)字圖書館需要承擔(dān)起大量數(shù)據(jù)的處理工作,不僅要收集,還要整合用戶數(shù)據(jù)。圖書館會使用傳感器、服務(wù)器日志監(jiān)測系統(tǒng)以及終端數(shù)據(jù)收集器等系統(tǒng)來收集和整理數(shù)據(jù)。需要注意的是,由于數(shù)字圖書館需要處理大量的數(shù)據(jù),必然會面對數(shù)據(jù)量網(wǎng)絡(luò)傳輸之間的負荷承載問題,超負荷會影響數(shù)據(jù)的傳輸。因此,數(shù)字圖書館應(yīng)該對收集的信息進行過濾整合,這樣會減少網(wǎng)絡(luò)傳輸超負荷的情況。
其中對信息進行過濾和整合需要先進的技術(shù),來降低大數(shù)據(jù)噪音,去除數(shù)據(jù)的多余信息,提煉有價值數(shù)據(jù)存儲,這樣便可以提高數(shù)據(jù)的有效性和利用率。
(三)圖書館館藏數(shù)字資源的存儲系統(tǒng)設(shè)計策略。圖書館的數(shù)據(jù)存儲系統(tǒng)將使用云端網(wǎng)絡(luò),此系統(tǒng)可以提供高水平的網(wǎng)絡(luò)計算服務(wù),可以運用分布式技術(shù)擴展web網(wǎng)絡(luò)服務(wù)器,還可以為不同地點的圖書館提供檢索計算和存儲服務(wù)。圖書館的數(shù)據(jù)存儲系統(tǒng)主要有應(yīng)用服務(wù)層、平臺服務(wù)層和基礎(chǔ)設(shè)施服務(wù)層等,以上層次按照不同的功用進行分類。首先,應(yīng)用服務(wù)層是提供具體系統(tǒng)功能的層次,該層次為圖書館存儲系統(tǒng)的高層,可以為圖書館提供其所需的基本服務(wù),可以按照用戶的需求以租用的方式提供給用戶及其他組織。其提供的服務(wù)主要有信息訂閱服務(wù)、信息檢索服務(wù)、個性化信息服務(wù)、用戶咨詢服務(wù)以及企業(yè)競爭監(jiān)管服務(wù)等。其次,平臺服務(wù)層為圖書館存儲系統(tǒng)的中層部分,其設(shè)立的主要目的就是整合系統(tǒng)的復(fù)用性軟件和通用性軟件。該層次提供的服務(wù)主要有六個方面:第一,信息系統(tǒng)管理接口功能,對資源進行專門的分類管理。第二,平臺核心服務(wù)接口功能,對數(shù)據(jù)進行分析,整合和檢索等。第三,信息發(fā)布接口功能,為用戶定制信息和資源導(dǎo)航等功能。第四,信息規(guī)劃接口功能,對信息資源進行整體的規(guī)劃。第五,信息資源加工接口功能,是對信息數(shù)據(jù)生產(chǎn)和統(tǒng)計。第六,資源庫發(fā)布接口功能。最后,基礎(chǔ)設(shè)施服務(wù)層是圖書館存儲系統(tǒng)的基礎(chǔ)部分,對存儲信息的整體框架具有重要的作用。該層次主要有兩方面的功能,第一,利用虛擬化和抽象化的方式對數(shù)字圖書館中的各個硬件進行整合,使用戶使用時能夠當(dāng)成一個整體,便于用戶獲取所需要的硬件和軟件資源。第二,利用虛擬化和抽象化的方式為用戶提供備份服務(wù),負載管理服務(wù)和存儲數(shù)據(jù)管理等服務(wù)??梢娀A(chǔ)設(shè)施服務(wù)層保障著整個存儲系統(tǒng)的正常運行。其中,在存儲系統(tǒng)中,終端是存儲系統(tǒng)的最高層,它不僅聯(lián)系著用戶,也聯(lián)系著服務(wù)器,使得用戶只要訪問終端就可以登錄客戶端。
如今的大數(shù)據(jù)背景下,實現(xiàn)數(shù)字圖書館的資源共享模式是當(dāng)今時代的大勢所趨,只有順應(yīng)時代的發(fā)展,圖書館才能夠更好地滿足用戶的需求。圖書館借助數(shù)字資源整合技術(shù),實現(xiàn)了對數(shù)據(jù)的規(guī)?;幚恚沟没ヂ?lián)網(wǎng)上的數(shù)據(jù)可以互聯(lián)互通,更大程度上提高了資源的利用率。我們應(yīng)該大力發(fā)展圖書館數(shù)字資源整合和存儲技術(shù),提高圖書館的管理水平。