關(guān)鍵詞:云計(jì)算;數(shù)字資源;資源整合
摘要:文章分析了目前數(shù)字資源整合的現(xiàn)狀,闡述了數(shù)字資源整合的內(nèi)容、方式,重點(diǎn)討論面向云計(jì)算環(huán)境的數(shù)字資源整合的相關(guān)理論,結(jié)合云計(jì)算的特點(diǎn),提出了云計(jì)算環(huán)境下的數(shù)字資源整合技術(shù)的應(yīng)用與改進(jìn)。
中圖分類號:G250.7文獻(xiàn)標(biāo)識碼:A文章編號:1003-1588(2014)11-0126-04
收稿日期:2014-10-21
作者簡介:伏琰(1980-),鄭州大學(xué)圖書館館員。
*本文為河南省軟科學(xué)研究項(xiàng)目“云計(jì)算環(huán)境下的數(shù)字資源整合與服務(wù)模式研究”的階段性成果之一,項(xiàng)目編號:132400410558。1引言
隨著數(shù)字化、網(wǎng)絡(luò)化環(huán)境的形成,數(shù)字信息已逐步成為信息傳遞的主流媒體,數(shù)字資源組織也成為信息管理領(lǐng)域的主要研究方向和工作內(nèi)容。據(jù)國際數(shù)據(jù)公司(International Data Corporation,簡稱IDC)2013年3月發(fā)布的最新數(shù)字宇宙研究報(bào)告《大數(shù)據(jù),更大的數(shù)字身影,最大增長在遠(yuǎn)東》[1]顯示,隨著全球范圍內(nèi)個(gè)人電腦、智能手機(jī)等設(shè)備的普及和新興市場內(nèi)不斷增長的互聯(lián)網(wǎng)訪問量,使數(shù)字宇宙的規(guī)模在最近兩年翻了一番,達(dá)到驚人的2.8 ZB。IDC預(yù)計(jì),數(shù)字宇宙從現(xiàn)在開始將每兩年翻一番的速度發(fā)展,到2020年,地球上人均占有5247GB的數(shù)據(jù),數(shù)字宇宙規(guī)模將達(dá)到40ZB。
數(shù)字信息迅速發(fā)展,3G的普及、無線網(wǎng)絡(luò)的發(fā)展,激發(fā)了人們通過網(wǎng)絡(luò)利用數(shù)字信息資源的熱情。中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)2014年7月21日發(fā)布的第34次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》[2]顯示,截至2014年6月,中國網(wǎng)民規(guī)模達(dá)6.32億,互聯(lián)網(wǎng)普及率為46.9%,互聯(lián)網(wǎng)發(fā)展重心從“廣泛”向“深入”轉(zhuǎn)換,各項(xiàng)網(wǎng)絡(luò)應(yīng)用深刻改變網(wǎng)民生活。
云計(jì)算技術(shù)與智能終端的應(yīng)用與普及,人們獲取信息知識的行為和方式發(fā)生了根本性的變革,網(wǎng)絡(luò),特別是無線網(wǎng)絡(luò)成為人們尋求信息知識的重要渠道。但數(shù)字資源孤島和數(shù)字資源超載成為阻礙有效數(shù)字資源獲取的兩大困境。如何利用云計(jì)算技術(shù)提高數(shù)字資源的利用效率,對數(shù)量龐大的異構(gòu)數(shù)字資源進(jìn)行有效的整合、集成與重組,是目前數(shù)字資源整合急待解決的難題。
2數(shù)字資源與數(shù)字資源整合
2.1數(shù)字資源及特征
通過網(wǎng)絡(luò)以數(shù)字形式發(fā)布、處理、存取、傳遞和開發(fā)利用的信息資源總和通稱為數(shù)字資源,數(shù)字資源既包括傳統(tǒng)信息資源的數(shù)字化,也包括直接以數(shù)字化方式生產(chǎn)的數(shù)字信息。信息資源的數(shù)字化也是信息的集成化、有序化、便利化,包括對文字、圖表、圖形、圖像、音頻、視頻等所有媒體文獻(xiàn)的數(shù)字化。在網(wǎng)絡(luò)環(huán)境中,只有數(shù)字化的信息才能成為用戶可利用的信息,網(wǎng)絡(luò)環(huán)境是數(shù)字信息生產(chǎn)、傳播和利用最主要的場合。
數(shù)字資源在生產(chǎn)制作方式、發(fā)布、存取、傳遞和開發(fā)利用等方面與傳統(tǒng)載體文獻(xiàn)完全不同,它具有高度的共享性、局部的有序性、類型的多樣性和資源的動態(tài)性等主要特征。數(shù)字信息的這些特征對其組織與整合提出了更高的要求,無論是數(shù)字資源整合的方法和技術(shù)還是管理模式都發(fā)生了重大變革。
2.2數(shù)字資源整合
數(shù)字資源整合是以用戶需求為導(dǎo)向,依據(jù)數(shù)字資源的屬性特征,按照一定的原則和方法,運(yùn)用集成技術(shù)將分散無序、相對獨(dú)立異構(gòu)資源系統(tǒng)集成在一起,并通過知識組織的技術(shù)和方法,將所集成的各種信息資源進(jìn)行規(guī)范、科學(xué)地類聚、融合和重組,使其重新組織為一個(gè)新的有機(jī)整體,形成一個(gè)效能更好、效率更高的新的數(shù)字資源體系,以供方便、快捷、高效地利用[3]。
首先,在云環(huán)境下的數(shù)字資源整合不僅要將分散的異構(gòu)資源集中起來,更重要的是要對數(shù)字資源的內(nèi)容特征和外部特征進(jìn)行序化和揭示,同時(shí)對數(shù)字資源之間的關(guān)系進(jìn)行描述,將數(shù)字資源進(jìn)行自動化聚類與分類從而方便用戶獲得按需、易擴(kuò)展的信息和資源。其次,通過虛擬化技術(shù)融合、集成多種數(shù)字資源,實(shí)現(xiàn)無序信息流向有序信息流的轉(zhuǎn)換,使之形成更高級的信息產(chǎn)品,促進(jìn)開發(fā)過程各個(gè)環(huán)節(jié)的資源共享、彼此互補(bǔ),共同創(chuàng)造價(jià)值。最后,為整合后的信息資源建立索引形成信息資源云,這就極大地方便了知識服務(wù)模型通過數(shù)字信息資源索引這個(gè)透明接口獲取信息資源從而為用戶提供按需的知識服務(wù)。
2.3數(shù)字資源整合的基本內(nèi)容
2.3.1數(shù)字資源的優(yōu)化選擇
優(yōu)化選擇是數(shù)字資源整合的第一步,是在浩瀚的網(wǎng)絡(luò)數(shù)字信息海洋里發(fā)現(xiàn)并確認(rèn)具有組織、整理和保存價(jià)值的信息。由于數(shù)字資源易于生成、發(fā)布、復(fù)制與傳播,在信息生成階段,又缺乏一個(gè)完善的選擇、評價(jià)制度,故數(shù)字信息的質(zhì)量與價(jià)值參差不齊。因此,對數(shù)字信息資源進(jìn)行整理,提高信息資源質(zhì)量,就必須進(jìn)行優(yōu)化選擇。
2.3.2數(shù)字資源的分析
數(shù)字資源分析是按照一定的邏輯關(guān)系,從語義和語法上對選擇過的數(shù)字資源進(jìn)行細(xì)化、挖掘、加工整理,通過計(jì)算、分析、比較研究,以便創(chuàng)造出更為系統(tǒng)、更能揭示資源本質(zhì)內(nèi)容的活動。他是數(shù)字資源描述與揭示的前提和基礎(chǔ),是數(shù)字資源整合不可或缺的重要環(huán)節(jié)之一,對數(shù)字資源整合的質(zhì)量有直接的影響。通過對數(shù)字資源的分析和研究,數(shù)字資源將更具有使用價(jià)值和實(shí)踐指導(dǎo)意義。
2.3.3數(shù)字資源的描述與揭示
信息描述與揭示是指根據(jù)數(shù)字資源整合和信息檢索的需要,對信息的主題內(nèi)容、形式特征、載體形態(tài)等進(jìn)行分析、選擇、記錄的活動。信息描述主要描述信息的外部特征;信息揭示主要揭示信息的內(nèi)容特征。信息描述與揭示是信息組織的重要內(nèi)容,在信息組織中起著至關(guān)重要的作用。
伏琰:云計(jì)算環(huán)境下數(shù)字資源整合模式研究*伏琰:云計(jì)算環(huán)境下數(shù)字資源整合模式研究*2.3.4數(shù)字資源的整理與存儲
數(shù)字資源存儲是將經(jīng)過加工整理序化后的信息按照一定的格式與順序存儲在特定載體中,其目的是為了數(shù)字資源管理者和用戶快速、準(zhǔn)確地識別、定位和檢索信息,各種光盤檢索系統(tǒng)、網(wǎng)絡(luò)信息檢索工具都是信息存儲的方式。信息存儲于各種檢索工具中意味著信息組織過程的終結(jié),也意味著信息檢索和信息服務(wù)活動的開始。endprint
整合是對異構(gòu)規(guī)范性資源和非規(guī)范性資源的優(yōu)化組合,是一種創(chuàng)造性的融合和重組資源的過程。其目的是為了整體改進(jìn)、整合系統(tǒng)的結(jié)構(gòu)和功能,使得數(shù)字資源系統(tǒng)能夠發(fā)揮最大的作用和使用效率。數(shù)字資源整合具有手段自動化、內(nèi)容綜合化和技術(shù)多樣化的特點(diǎn)。作為一個(gè)全面、系統(tǒng)的工程,數(shù)字資源整合在實(shí)施過程中要遵循整體性、連續(xù)性、層次性、針對性的原則。
3云計(jì)算技術(shù)
云計(jì)算通過互聯(lián)網(wǎng)來提供動態(tài)的、易擴(kuò)展的、虛擬化的資源,是基于互聯(lián)網(wǎng)的相關(guān)服務(wù)的增加、使用和交付模式[4]。目前廣為接受的是美國國家標(biāo)準(zhǔn)與技術(shù)研究院(NIST)定義:云計(jì)算是一種按使用量付費(fèi)的模式,這種模式提供可用的、便捷的、按需的網(wǎng)絡(luò)訪問,進(jìn)入可配置的計(jì)算資源共享池(資源包括網(wǎng)絡(luò)、服務(wù)器、存儲、應(yīng)用軟件、服務(wù)),這些資源能夠被快速地提供,只需投入很少的管理工作,或與服務(wù)供應(yīng)商進(jìn)行很少的交互。使用云計(jì)算技術(shù)不僅是對各類資源的簡單匯集,而且為我們提供了一種便捷的管理機(jī)制,讓開發(fā)者具有透明的獲取資源、使用資源的自由。在“云”服務(wù)模式下,資源的整合與調(diào)度將以用戶的需求為出發(fā)點(diǎn)和立足點(diǎn),動態(tài)自適應(yīng)性地聚合信息資源與服務(wù)系統(tǒng),全程引導(dǎo)、跟蹤用戶信息行為。通過使用云計(jì)算的方法和技術(shù)以建立不同渠道、不同來源以及不同載體的資源的整合并形成新的知識的聚合過程,實(shí)現(xiàn)知識服務(wù)內(nèi)涵的深化,支持知識檢索和主動的推送服務(wù)。
相對于傳統(tǒng)計(jì)算,云計(jì)算關(guān)鍵特性在于:①配置資源動態(tài)化。系統(tǒng)動態(tài)分配或釋放不同的虛擬或物理資源完全取決于用戶的需求,當(dāng)需求增加時(shí),可快速匹配可用的資源,為用戶提供彈性的資源;而當(dāng)用戶不再需要使用某資源時(shí),這些資源可以被快速釋放。云計(jì)算是為用戶提供無限使用的IT資源,實(shí)現(xiàn)資源的可擴(kuò)展性。② 服務(wù)需求自助化。云計(jì)算為用戶提供的資源服務(wù)采用自助化的方式,用戶不需要與供應(yīng)商交互,通過云計(jì)算系統(tǒng)為用戶提供一定的應(yīng)用服務(wù)目錄,用戶可以根據(jù)自身的需求,選擇一定的服務(wù)內(nèi)容或項(xiàng)目,采取自助服務(wù)自己獲得計(jì)算資源的能力及繳納購買服務(wù)所需的費(fèi)用。③資源池透明化。對云服務(wù)供應(yīng)商來說,所有的底層資源(儲存、計(jì)算、網(wǎng)絡(luò)、邏輯等)形成“資源池”,可以被統(tǒng)一管理和調(diào)度,各種資源的邊界被打破,異構(gòu)性被屏蔽起來;對使用資源的用戶來說,不用了解各個(gè)系統(tǒng)的內(nèi)部結(jié)構(gòu),只關(guān)注自己的需求,其所需的資源是無限的、透明的。④網(wǎng)絡(luò)化。云計(jì)算的服務(wù)通過互聯(lián)網(wǎng)為用戶提供,用戶通過借助各種不同的終端設(shè)備及標(biāo)準(zhǔn)的應(yīng)用程序訪問網(wǎng)絡(luò)上無處不在的云資源與云服務(wù)。
4云計(jì)算環(huán)境下數(shù)字資源整合方式
4.1數(shù)據(jù)整合
數(shù)據(jù)整合是指對于異構(gòu)資源系統(tǒng)中的、具有獨(dú)立結(jié)構(gòu)的數(shù)據(jù)在邏輯或物理上有機(jī)的集中整合,為用戶提供統(tǒng)一的顯示和查詢,從而實(shí)現(xiàn)多種異構(gòu)資源系統(tǒng)的互聯(lián)與共享。資源實(shí)體是數(shù)據(jù)整合的主要對象。根據(jù)整合需求的不同,形成了不同的數(shù)據(jù)整合方式,基于數(shù)據(jù)倉庫的整合和基于中介模式的整合是其主要表現(xiàn)形態(tài)。
數(shù)據(jù)倉庫組織技術(shù)是一種面向復(fù)雜的信息分析和高層次決策支持的信息集成與深層次信息組織技術(shù),其顯著特點(diǎn)是可將各類數(shù)字信息中大量的歷史與現(xiàn)時(shí)信息轉(zhuǎn)換成公共的數(shù)據(jù)模型進(jìn)行集成和組織管理。為了方便用戶查詢信息,數(shù)據(jù)倉庫還附帶向用戶提供了聯(lián)機(jī)分析處理和數(shù)據(jù)挖掘功能,以便在深層次上強(qiáng)化數(shù)字信息組織對高層次決策活動的支撐。
基于中間件的異構(gòu)系統(tǒng)統(tǒng)一平臺式資源整合方式需要在用戶和各異構(gòu)數(shù)據(jù)庫系統(tǒng)之間構(gòu)造一個(gè)中間層,用戶通過統(tǒng)一的檢索平臺,發(fā)出檢索式,系統(tǒng)通過借助中間層將檢索式翻譯成對應(yīng)于各個(gè)數(shù)據(jù)庫的檢索語句,同時(shí)對多個(gè)數(shù)據(jù)庫進(jìn)行調(diào)用或通過搜索引擎進(jìn)行資源檢索,各數(shù)據(jù)庫返回的檢索結(jié)果,再經(jīng)中間層進(jìn)行歸類、去重、排序后統(tǒng)一推送到讀者面前,從而實(shí)現(xiàn)一站式的訪問?;谥虚g件的資源整合系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)需要計(jì)算機(jī)、網(wǎng)絡(luò)和數(shù)據(jù)庫等各項(xiàng)技術(shù)的支撐,需要考慮統(tǒng)一跨庫檢索界面、權(quán)限管理、去重等多個(gè)方面的問題。
4.2信息整合
信息整合的主要對象是信息實(shí)體之間的關(guān)系,通過某種標(biāo)準(zhǔn)或機(jī)制,對不同來源、性質(zhì)和格式的數(shù)字資源進(jìn)行描述與鏈接,揭示相對獨(dú)立的資源實(shí)體之間的聯(lián)系,從而實(shí)現(xiàn)數(shù)字資源的全方位整合,使用戶能夠一步到位地獲取所需資源。根據(jù)資源整合范圍和應(yīng)用需求的不同,形成了不同的信息整合方式,其主要表現(xiàn)形態(tài)有:基于信息鏈接的整合和基于信息門戶的整合。
通過統(tǒng)一資源定位符(URL)建立的數(shù)字資源導(dǎo)航系統(tǒng)能夠有序、有效、合理、有機(jī)地整合龐雜的數(shù)字資源內(nèi)的信息實(shí)體及其屬性間的內(nèi)在關(guān)系并提供檢索,能夠幫助用戶更全面清晰地了解全部的資源情況,并為用戶迅速找到所需數(shù)字資源,根據(jù)所定位的文獻(xiàn)類型的不同,可以建立電子圖書、電子期刊、電子版報(bào)紙等導(dǎo)航系統(tǒng)?;趯?dǎo)航的數(shù)字資源整合系統(tǒng)不能提供內(nèi)容層面的服務(wù)只能定位在數(shù)據(jù)層面,且對日常維護(hù)的要求較高,應(yīng)變性差,如果數(shù)據(jù)庫資源系統(tǒng)存儲位置或地址調(diào)整改變,都會使導(dǎo)航的鏈接無法正常打開,影響導(dǎo)航的使用效果。
聯(lián)機(jī)公共目錄查詢系統(tǒng)(OPAC)是讀者查找和利用圖書館資源的重要途徑。OPAC是反映圖書館全部館藏的一個(gè)窗口,書目數(shù)據(jù)是基于OPAC系統(tǒng)的數(shù)字資源整合的核心,通過對書目數(shù)據(jù)的檢索,向一次性獲得目次、全文、音視頻等有關(guān)主題的不同載體的館藏信息資源全方位擴(kuò)展。
4.3知識整合
在信息整合的基礎(chǔ)上,在知識組織體系的支撐下,對內(nèi)在于資源知識體系中的知識結(jié)構(gòu)及概念關(guān)系進(jìn)行的整合和梳理稱為知識整合。知識整合的主要表現(xiàn)形態(tài)是基于本體和基于語義網(wǎng)技術(shù)的資源整合方式。
語義網(wǎng)技術(shù)通過規(guī)范,充分完備地定義和組織數(shù)據(jù)資源內(nèi)容,在語義上建立人與計(jì)算機(jī)之間的理解與合作,從而有效解決語義異構(gòu)問題,實(shí)現(xiàn)自動化的數(shù)據(jù)資源訪問。由于傳統(tǒng)的基于關(guān)鍵字匹配的信息檢索模式信息檢索質(zhì)量不高,查準(zhǔn)率、查全率偏低,而語義網(wǎng)以機(jī)器可理解格式描述、發(fā)布和訪問數(shù)據(jù)資源,使用計(jì)算機(jī)可以理解元數(shù)據(jù)的語義并進(jìn)行自動的處理,從而滿足智能主體對各類異構(gòu)的分布式數(shù)字資源進(jìn)行有效檢索和訪問。語義網(wǎng)通過構(gòu)建知識網(wǎng)絡(luò),向用戶提示智能知識,實(shí)現(xiàn)了數(shù)字資源在語義層上的全方位互聯(lián)與知識層面輔助查詢,幫助用戶獲得最佳的檢索效果,在更大范圍內(nèi)實(shí)了現(xiàn)資源整合的高級模式,大大地提高了信息檢索的效率。endprint
上述三種方式是資源整合的三個(gè)不可缺少的方面,基于數(shù)據(jù)在邏輯或物理上合并的數(shù)據(jù)整合是資源整合體系的最低層面,整合在一定程度上解決了異構(gòu)系統(tǒng)數(shù)據(jù)共享和互通的問題。但是數(shù)據(jù)整合僅表現(xiàn)為資源數(shù)量上的變化,數(shù)據(jù)之間沒有關(guān)聯(lián)。基于數(shù)據(jù)整合的信息整合處于資源整合體系的中間層面,其對數(shù)字資源進(jìn)行了一定的優(yōu)化,在數(shù)據(jù)量綜合的同時(shí)也揭示了數(shù)據(jù)間的關(guān)聯(lián),但仍然沒有涉及語義?;跀?shù)據(jù)整合和信息整合的知識整合處于資源整合體系中最高層,側(cè)重于概念和關(guān)系的重組,是資源整合的最終目標(biāo)。在數(shù)字資源整合的實(shí)踐中,一般是以某一種整合方式為主并兼有、混合其他的整合方式;它們共同構(gòu)成了一個(gè)完整的數(shù)字資源整合體系。數(shù)據(jù)整合、信息整合和知識整合顯示出相互交叉重合并且逐層遞進(jìn)的數(shù)字資源整合的發(fā)展過程。
參考文獻(xiàn):
[1]比特網(wǎng).IDC最新數(shù)字宇宙研究報(bào)告顯示中國增長最顯著. [2014-5-10].http://m.chinabyte.com/storage/270/12553270_m.shtml.
[2]中國互聯(lián)網(wǎng)絡(luò)信息中心.中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告.[2014-8-30]. http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201407/t20140721_47437.htm.
[3]馬文峰,杜小勇.數(shù)字資源整合:理論、方法與應(yīng)用[M].北京:北京圖書館出版社,2007:46.
[4]百度百科.云計(jì)算.[2014-8-30].http://baike.baidu.com/.
[5]謝芳.論高校智慧圖書館的功能與構(gòu)建[J],圖書館學(xué)研究,2014(6):15-20+11.
[6]魏萍.基于云計(jì)算的數(shù)字圖書館服務(wù)模型研究[J].蘭臺世界,2014(2):43-44.
[7]黎春蘭,鄧仲華.面向圖書館的云計(jì)算研究綜述[J].圖書館雜志,2014(5):68-77.
[8]王平.云計(jì)算在圖書館資源整合與檢索中的運(yùn)用[J].圖書館學(xué)刊,2013(4):115-117.
[9]鄧小燕.基于云計(jì)算的數(shù)字圖書館建設(shè)構(gòu)想——以數(shù)字圖書館推廣工程為背景[J].圖書館研究,2013(5):93-96.
[10]常盛.云計(jì)算數(shù)據(jù)庫查詢算法在圖書館數(shù)字服務(wù)中的應(yīng)用[J].數(shù)字技術(shù)與應(yīng)用,2013(5):156.
[11]殷紅,劉煒.新一代圖書館服務(wù)系統(tǒng):功能評價(jià)與愿景展望[J].中國圖書館學(xué)報(bào),2013(5):26-33.
[12]李曉明,姜曉曦.云計(jì)算對圖書館基本業(yè)務(wù)框架的影響研究[J].圖書館建設(shè),2013(10):56-60.
(編校:嚴(yán)真)endprint