胡金艷
摘要:隨著數(shù)字化圖書(shū)館建設(shè)規(guī)模的不斷擴(kuò)大,數(shù)字化圖書(shū)館在為讀者提供廣泛的數(shù)字信息資源的同時(shí),也由于信息資源的無(wú)序性、開(kāi)放性等特點(diǎn)增加讀者的搜索難度,因此基于數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的應(yīng)用對(duì)提高數(shù)字圖書(shū)館資源整合、提高決策科學(xué)化具有重要的意義。本文以數(shù)據(jù)倉(cāng)庫(kù)技術(shù)在數(shù)字化圖書(shū)館中應(yīng)用的必要性作為切入點(diǎn),闡述數(shù)據(jù)倉(cāng)庫(kù)技術(shù)在圖書(shū)館應(yīng)用設(shè)計(jì)的具體對(duì)策,以此提高數(shù)字化圖書(shū)館的資源價(jià)值。
關(guān)鍵詞:數(shù)據(jù)倉(cāng)庫(kù);圖書(shū)館;應(yīng)用設(shè)計(jì)
中圖分類(lèi)號(hào):TP311.13 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2017)05-0134-02
基于互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,高校數(shù)字化圖書(shū)館建設(shè)規(guī)模不斷提升,數(shù)字化圖書(shū)館為師生提供了廣泛的數(shù)字化信息資源,提高了信息資源的利用率,然而數(shù)字化圖書(shū)館信息資源龐大,而學(xué)生對(duì)于信息資源需求不同,因此容易形成異構(gòu)數(shù)據(jù),不利于資源的最大利用,因此本文基于數(shù)據(jù)倉(cāng)庫(kù)技術(shù),提出構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)圖書(shū)館工作模式,以此提高數(shù)字資源的利用價(jià)值。
1 數(shù)據(jù)倉(cāng)庫(kù)的概述
數(shù)據(jù)倉(cāng)庫(kù)就是面向主題的、集成的,隨時(shí)間變化的,非易失性的數(shù)據(jù)集合,用于支持管理層的決策過(guò)程。數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的產(chǎn)生可以將分析決策所需要的大量數(shù)據(jù)從傳統(tǒng)的操作型環(huán)境分離出來(lái),從而將分散的、難以訪問(wèn)的數(shù)據(jù)轉(zhuǎn)化為統(tǒng)一、隨時(shí)可用的數(shù)據(jù)存儲(chǔ)環(huán)境。因此數(shù)據(jù)倉(cāng)庫(kù)呈現(xiàn)以下特點(diǎn):面向主題性,數(shù)據(jù)倉(cāng)庫(kù)主要是從人們所關(guān)注的主題入手,將數(shù)據(jù)按照主題進(jìn)行分類(lèi);集成性,數(shù)據(jù)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)之前需要對(duì)數(shù)據(jù)的一致性進(jìn)行分析與判斷,保證數(shù)據(jù)倉(cāng)庫(kù)內(nèi)的信息完整一致;相對(duì)穩(wěn)定性,一般數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)不會(huì)被修改,并且能夠得到長(zhǎng)時(shí)間的保存。
由于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)主要來(lái)源于多個(gè)數(shù)據(jù)庫(kù)平臺(tái),因此需要根據(jù)用戶的需求對(duì)數(shù)據(jù)進(jìn)行選擇處理,以此將處理好的數(shù)據(jù)存儲(chǔ)在已經(jīng)建好的數(shù)據(jù)倉(cāng)庫(kù)中,一般數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)主要包括:數(shù)據(jù)來(lái)源、數(shù)據(jù)存儲(chǔ)與管理、數(shù)據(jù)分析工具以及用戶四個(gè)部分。
2 數(shù)據(jù)倉(cāng)庫(kù)技術(shù)應(yīng)用在數(shù)字化圖書(shū)館中的可行性
數(shù)字化圖書(shū)館信息服務(wù)具有高度集成特點(diǎn),信息資源豐富,讀者需求差異明顯,因此如何將豐富的數(shù)字化資源準(zhǔn)確的提供給讀者,滿足數(shù)字資源的高效利用是圖書(shū)館建設(shè)的重要技術(shù)問(wèn)題,而數(shù)據(jù)倉(cāng)庫(kù)擁有的信息處理能力和內(nèi)在穩(wěn)定性為數(shù)字化圖書(shū)館建設(shè)提供了技術(shù)支撐,因此將數(shù)字倉(cāng)庫(kù)技術(shù)要應(yīng)用到數(shù)字化圖書(shū)館建設(shè)中具有切實(shí)意義:
(1)數(shù)據(jù)倉(cāng)庫(kù)技術(shù)具有面向主題的信息組織,能夠根據(jù)數(shù)字化圖書(shū)館將多樣的數(shù)據(jù)轉(zhuǎn)化為容易被讀者所理解的語(yǔ)義,以便更好地為讀者的檢索能夠便利。例如通過(guò)數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的處理,可以將不符合學(xué)生檢索需求的信息排除出去,提高學(xué)生檢索信息的效率,從而提高圖書(shū)館數(shù)據(jù)資源的最大利用,實(shí)現(xiàn)查詢結(jié)果的準(zhǔn)確性。
(2)數(shù)字化圖書(shū)館建設(shè)的目的就是為讀者提供信息資源服務(wù),而數(shù)據(jù)倉(cāng)庫(kù)技術(shù)為數(shù)字化圖書(shū)館在提供信息服務(wù)時(shí)提供穩(wěn)定的系統(tǒng)支撐。以數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的穩(wěn)定性為例,由于數(shù)字化圖書(shū)系統(tǒng)需要涵蓋大量的信息資源,同時(shí)還需要不斷引入新的信息資源等,基于不同讀者的需求,要求系統(tǒng)要具有穩(wěn)定的操作性,尤其是對(duì)于數(shù)據(jù)信息不能隨意的修改,而數(shù)據(jù)倉(cāng)庫(kù)技術(shù)則有效的保護(hù)了數(shù)據(jù)資源的不被修改,從而為讀者提供了準(zhǔn)確的數(shù)據(jù)信息。
(3)數(shù)據(jù)倉(cāng)庫(kù)技術(shù)有助于提高數(shù)字化圖書(shū)館的戰(zhàn)略決策的科學(xué)性。信息化背景下,數(shù)字化圖書(shū)館不僅要注重?cái)?shù)據(jù)信息資源,還必須要注重服務(wù)質(zhì)量以及科研工作等,尤其是在信息資源傳播途徑不斷豐富的環(huán)境下,高校數(shù)字圖書(shū)館必須要在決策上、管理上創(chuàng)新,要利用完善的數(shù)據(jù)信息,對(duì)決策進(jìn)行優(yōu)化,提高服務(wù)質(zhì)量。
將數(shù)據(jù)倉(cāng)庫(kù)技術(shù)應(yīng)用到數(shù)字化圖書(shū)館中需要解決好以下關(guān)鍵技術(shù):聯(lián)機(jī)分析處理技術(shù),元數(shù)據(jù),數(shù)據(jù)挖掘技術(shù)。
3 數(shù)字化圖書(shū)館數(shù)據(jù)倉(cāng)庫(kù)技術(shù)設(shè)計(jì)的策略
數(shù)據(jù)倉(cāng)庫(kù)技術(shù)在數(shù)字化圖書(shū)館中的應(yīng)用對(duì)提高數(shù)字圖書(shū)館資源利用率,實(shí)現(xiàn)圖書(shū)館服務(wù)具有重要的作用,因此基于數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的數(shù)字化圖書(shū)館設(shè)計(jì)主要包括以下方面:
3.1 數(shù)字化圖書(shū)館數(shù)據(jù)倉(cāng)庫(kù)概念模型設(shè)計(jì)
圖書(shū)館書(shū)數(shù)據(jù)倉(cāng)庫(kù)是按照主題進(jìn)行數(shù)據(jù)組織的,因此在具體的設(shè)計(jì)中需要明確以下兩個(gè)方面:一是界定系統(tǒng)的邊界。系統(tǒng)邊界的界定主要是明確讀者的閱讀規(guī)律、文獻(xiàn)信息的閱讀狀況以及讀者信息資源閱讀的傾向,因此數(shù)據(jù)倉(cāng)庫(kù)的構(gòu)建需要以下數(shù)據(jù):讀者的基本信息、數(shù)據(jù)信息的基本信息以及信息資源的瀏覽數(shù)據(jù)。數(shù)據(jù)倉(cāng)庫(kù)具有主題性,因此數(shù)據(jù)倉(cāng)庫(kù)的主題包括,讀者、文獻(xiàn)信息以及讀者借閱;二是明確系統(tǒng)的主題。根據(jù)上述說(shuō)明,信息文獻(xiàn)是數(shù)字圖書(shū)館建設(shè)的基本要素,也是圖書(shū)館的基礎(chǔ)。讀者是數(shù)字圖書(shū)館參與的重要主體,尤其是在網(wǎng)絡(luò)環(huán)境下數(shù)字圖書(shū)館服務(wù)模式由以“文獻(xiàn)”為中心轉(zhuǎn)化為以“讀者”為中心?;跀?shù)據(jù)倉(cāng)庫(kù)系統(tǒng)邊界及主題的確定,數(shù)字圖書(shū)館數(shù)據(jù)倉(cāng)庫(kù)概念模型見(jiàn)圖1所示。
3.2 邏輯模型設(shè)計(jì)
邏輯模型是整個(gè)系統(tǒng)設(shè)計(jì)的基礎(chǔ),在該模型的設(shè)計(jì)中需要對(duì)數(shù)據(jù)倉(cāng)庫(kù)實(shí)體進(jìn)行定義,這主要基于在設(shè)計(jì)的過(guò)程中每個(gè)維度實(shí)體之間存在一定的交錯(cuò)現(xiàn)象,因此為了降低因?yàn)榫S度不同而造成的空間浪費(fèi)現(xiàn)象,需要對(duì)實(shí)體進(jìn)行統(tǒng)一的定義,以此達(dá)到系統(tǒng)的最優(yōu)化設(shè)計(jì)。
3.3 物理模型設(shè)計(jì)
物理模型是數(shù)據(jù)倉(cāng)庫(kù)最底層的數(shù)據(jù)模型,可以直接生成物理數(shù)據(jù)庫(kù)。它是邏輯模型在數(shù)據(jù)倉(cāng)庫(kù)中的實(shí)現(xiàn),包括數(shù)據(jù)的物理存儲(chǔ)方式、存儲(chǔ)結(jié)構(gòu)、存儲(chǔ)位置和存儲(chǔ)分配等。
3.4 數(shù)據(jù)倉(cāng)庫(kù)的實(shí)現(xiàn)
實(shí)現(xiàn)數(shù)據(jù)倉(cāng)庫(kù)需要解決好以下流程:首先是解決數(shù)據(jù)倉(cāng)庫(kù)與業(yè)務(wù)處理系統(tǒng)接口集成問(wèn)題,實(shí)現(xiàn)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的多元化問(wèn)題;其次構(gòu)建完善的數(shù)據(jù)倉(cāng)庫(kù)體系結(jié)構(gòu),實(shí)現(xiàn)邏輯模型和物理模型的優(yōu)化,保證構(gòu)建的數(shù)據(jù)倉(cāng)庫(kù)與設(shè)計(jì)方案相一致;三是對(duì)數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)進(jìn)行加載處理,實(shí)現(xiàn)了系統(tǒng)的最優(yōu)化運(yùn)行。
4 實(shí)現(xiàn)數(shù)字圖書(shū)館數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)的注意事項(xiàng)
首先數(shù)字圖書(shū)館數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)必須要獲得高校管理的支持,其次加強(qiáng)與讀者的溝通交流。數(shù)字圖書(shū)館的功能就是為讀者提供個(gè)性化的信息服務(wù),如果圖書(shū)館所提供的信息資源不能滿足讀者的信息需求,數(shù)字圖書(shū)館就失去了存在的意義,因此在數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)前必須要對(duì)讀者的信息需求以及服務(wù)模式等進(jìn)行調(diào)查,加強(qiáng)與讀者的溝通。
總之,基于互聯(lián)網(wǎng)技術(shù)的發(fā)展,數(shù)字化圖書(shū)館在高校教學(xué)中的應(yīng)用越來(lái)越重要,與此同時(shí),數(shù)字資源的廣泛性也增加了圖書(shū)館服務(wù)功能的完善程度,尤其是對(duì)于數(shù)字圖書(shū)館數(shù)字資源的優(yōu)化配置的影響,而數(shù)據(jù)倉(cāng)庫(kù)技術(shù)則為數(shù)字化圖書(shū)館提供了基礎(chǔ)技術(shù)支撐,有效的對(duì)數(shù)字資源進(jìn)行合理配置。
參考文獻(xiàn)
[1]張宏武.數(shù)據(jù)倉(cāng)庫(kù)技術(shù)在高校圖書(shū)館中的應(yīng)用研究[J].渭南師范學(xué)院學(xué)報(bào),2011(12):80-84.
[2]李康.圖書(shū)館網(wǎng)絡(luò)綜合布線的理念與設(shè)計(jì)實(shí)施[J].新疆師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2011,03:91-93.endprint
數(shù)字技術(shù)與應(yīng)用2017年5期