黃素君
〔摘 要〕基于IBAS E數(shù)據(jù)庫的數(shù)字圖書館系統(tǒng)有獨(dú)特的結(jié)構(gòu)及特點(diǎn)?為數(shù)字化信息的來源與提取技術(shù)和海量數(shù) 字信息的存貯和管理提供了可能?IBASE非結(jié)構(gòu)化數(shù)據(jù)庫系統(tǒng)對數(shù)字圖書館信息資源建設(shè)提 供了有效解決方案?
〔關(guān)鍵詞〕IBASE;數(shù)字圖書館; 處理方案
〔中圖分類號〕G250.76 〔文獻(xiàn)標(biāo)識碼〕A 〔文章編 號〕1008-0821(2009)08-0081-03
Study on the Digital Library and
Handling Scheme Based on IBASE LanguageHuang Sujun
(Library,Guangdong Sheng CPC Committee Party School,Guangzhou 510053,China)
〔Abstract〕The digital library system based on IBASE database has its unique struct ure and characteristics.It makes the source and extraction technology,storage an d management of digital information possible.IBASE has provided the efficient ha ndling scheme for information resource construction of digital library.
〔Key words〕IBASE;digital li brary;handling scheme
隨著網(wǎng)絡(luò)信息技術(shù)的飛速發(fā)展,傳統(tǒng)的圖書館管理方式正面臨著深刻的變化,用戶對信 息的需求也提高到一個全新的水平?如何利用先進(jìn)的網(wǎng)絡(luò)信息技術(shù)實(shí)現(xiàn)圖書館的數(shù)字化?網(wǎng) 絡(luò)化建設(shè),增強(qiáng)自己在網(wǎng)絡(luò)社會的競爭力,以更好地為社會和讀者服務(wù),成為未來社會的公共信息中心和樞紐,正成為各類型?各專業(yè)圖書館共同尋求的現(xiàn)代運(yùn)作模式?非結(jié)構(gòu)化數(shù)據(jù) 庫是針對關(guān)系數(shù)據(jù)庫模型過于簡單?不便表達(dá)復(fù)雜的嵌套需要以及支持?jǐn)?shù)據(jù)類型有限等局限 ,從數(shù)據(jù)模型入手而提出的全面基于因特網(wǎng)應(yīng)用的新型數(shù)據(jù)庫理論?
1 基于IBASE數(shù)據(jù)庫的數(shù) 字圖書館系統(tǒng)結(jié)構(gòu)及特點(diǎn)
1.1 系統(tǒng)結(jié)構(gòu)概述
IBASE數(shù)據(jù)庫是一種嶄新的非結(jié)構(gòu)化數(shù)據(jù)庫,在處理非結(jié)構(gòu)化信息和全文檢索方面獲得了突 破?它能夠處理包括結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)在內(nèi)的復(fù)雜的Web數(shù)據(jù),能通過獨(dú)特的子字段? 變長字段和重復(fù)字段的數(shù)據(jù)模型結(jié)構(gòu),來處理復(fù)雜的嵌套和變長數(shù)據(jù),支持全文檢索,支持圖像?聲音等多媒體數(shù)據(jù)的新型數(shù)據(jù)庫?IBASE數(shù)據(jù)庫最核心的技術(shù),實(shí)際上就是對數(shù)據(jù)的 變長存儲和智能檢索技術(shù)?在數(shù)據(jù)存儲上,IBASE數(shù)據(jù)庫在數(shù)據(jù)模型上主要采用了面向?qū)ο?技術(shù),以XML技術(shù)為其核心,能根據(jù)數(shù)據(jù)對象自動分配存儲空間,實(shí)現(xiàn)數(shù)據(jù)自適應(yīng)存儲和管 理,大大節(jié)省存儲空間;同時,IBASE數(shù)據(jù)庫的數(shù)據(jù)表突破關(guān)系數(shù)據(jù)庫嚴(yán)格的二維表結(jié)構(gòu), 數(shù)據(jù)庫記錄內(nèi)的每一個字段都是可以重復(fù)的,而每一個字段可以有一個或者多個子字段,甚 至可以嵌套一個二維表,從而解決原來關(guān)系數(shù)據(jù)庫需要多個表來表示的復(fù)雜關(guān)系?
1.2 系統(tǒng)結(jié)構(gòu)特點(diǎn)
IBASE數(shù)據(jù)庫針對關(guān)系數(shù)據(jù)庫在存儲機(jī)制和索引機(jī)制局限,使得它在技術(shù)?性能等多方面滿 足了圖書館實(shí)際業(yè)務(wù)及數(shù)字化建設(shè)的要求?IBASE數(shù)字圖書館為“信息源——圖書館——讀 者”三角架構(gòu),利用IBASE數(shù)據(jù)庫強(qiáng)大的數(shù)據(jù)管理和全文查詢能力,以統(tǒng)一的標(biāo)準(zhǔn)和規(guī)范為 基礎(chǔ),以數(shù)字化的各種信息資源為底層,以分布式海量資源庫群為支撐,以智能檢索技術(shù)為 手段,以電子商務(wù)為管理方式,為公共圖書館?高校圖書館和各類專業(yè)圖書館用戶提供完善 的數(shù)字化圖書館解決方案?其實(shí)質(zhì)是基于IBASE數(shù)據(jù)庫的一個企業(yè)級數(shù)據(jù)庫應(yīng)用系統(tǒng),它通 過數(shù)字信息的制作與獲取?存儲與管理?權(quán)限管理?內(nèi)容管理和信息檢索與服務(wù)等五項(xiàng)綜合 功能,涉及圖書館數(shù)字信息資源的生產(chǎn)?加工?存儲?管理?檢索?傳遞?利用?歸檔?出 版的全過程,為數(shù)字化圖書館的建設(shè)提供了一個多媒體信息資源管理系統(tǒng)平臺和一整套符合 標(biāo)準(zhǔn)規(guī)范的數(shù)字圖書館賴以運(yùn)作的軟件系統(tǒng)?
基于IBASE非結(jié)構(gòu)化數(shù)據(jù)庫,為數(shù)字化信息的來源與提取技術(shù)和海量數(shù)字信息的存貯和管理 提供了可能?
2 非結(jié)構(gòu)化數(shù)據(jù)及數(shù)據(jù)庫
2.1 非結(jié)構(gòu)化數(shù)據(jù)
非結(jié)構(gòu)化數(shù)據(jù)是沒有經(jīng)過人為處理的不規(guī)整的信息,如文件?聲音?圖像等?非結(jié)構(gòu)化數(shù)據(jù) 必須借助對應(yīng)的解釋軟件才能打開并直觀瀏覽?因此,無法從數(shù)據(jù)本身直接獲取其表達(dá)的物 理屬性,亦即不易于理解?非結(jié)構(gòu)化數(shù)據(jù)不具備嚴(yán)格的結(jié)構(gòu),較之結(jié)構(gòu)化信息更難以標(biāo)準(zhǔn)化 ,管理起來較為困難?在對非結(jié)構(gòu)化數(shù)據(jù)的存儲上,可以采用傳統(tǒng)的關(guān)系型數(shù)據(jù)庫或多媒體 數(shù)據(jù)庫?但這兩種數(shù)據(jù)庫都不是針對非結(jié)構(gòu)化數(shù)據(jù)創(chuàng)建的數(shù)據(jù)庫管理系統(tǒng),因此,在對非結(jié) 構(gòu)化數(shù)據(jù)的處理過程中存在不足之處?
2.2 非結(jié)構(gòu)化數(shù)據(jù)庫
所謂非結(jié)構(gòu)化數(shù)據(jù)庫是指能夠?qū)Ψ墙Y(jié)構(gòu)化數(shù)據(jù)進(jìn)行處理的數(shù)據(jù)庫?在非結(jié)構(gòu)化數(shù)據(jù)庫中,字 段長度可變,并且每個字段的記錄又可以由可重復(fù)或不可重復(fù)的子字段構(gòu)成,允許創(chuàng)建許多 不同類型的非結(jié)構(gòu)化或任意格式的字段,從而突破了關(guān)系數(shù)據(jù)庫嚴(yán)格的表格結(jié)構(gòu)限定,解決 了關(guān)系數(shù)據(jù)庫模型過于簡單?不便表達(dá)復(fù)雜嵌套的問題?對于多媒體信息的存儲和管理,非 結(jié)構(gòu)化數(shù)據(jù)庫系統(tǒng)采用外部文件方式,摒棄了傳統(tǒng)關(guān)系型數(shù)據(jù)庫采用二進(jìn)制字段存儲的方式 ,實(shí)現(xiàn)了對于圖像?聲音等多媒體信息的高效管理?正是由于非結(jié)構(gòu)化數(shù)據(jù)庫支持子字段? 重復(fù)字段和變長字段,具有高效處理圖書館領(lǐng)域內(nèi)數(shù)據(jù)的能力,加之內(nèi)嵌全文檢索引擎,支 持對聲音?圖像等多媒體數(shù)據(jù)存儲處理,使非結(jié)構(gòu)化數(shù)據(jù)庫成為眾多圖書館進(jìn)行數(shù)字化建設(shè) 的首選系統(tǒng)?非結(jié)構(gòu)化數(shù)據(jù)庫內(nèi)嵌全文檢索引擎,避免了圖書館使用關(guān)系數(shù)據(jù)庫進(jìn)行資源建 設(shè)后,在提供全文檢索服務(wù)時需要再選購一套全文檢索系統(tǒng)的雙重投資問題?因此,越來越 多的圖書館在信息資源建設(shè)上開始使用非結(jié)構(gòu)化數(shù)據(jù)庫?非結(jié)構(gòu)化數(shù)據(jù)庫在對數(shù)據(jù)處理上, 采用了面向?qū)ο蠹夹g(shù),不僅可以處理不同類型的文本文件,而且可對圖像?音頻?視頻?計(jì) 算機(jī)程序以及網(wǎng)址資源進(jìn)行編目和數(shù)字化處理,覆蓋了圖書館領(lǐng)域內(nèi)幾乎所有的文獻(xiàn)數(shù)據(jù)類 ?同時,非結(jié)構(gòu)化數(shù)據(jù)庫支持外掛文件的全文檢索,其獨(dú)特的外部文件支持能力使圖書館能 輕松實(shí)現(xiàn)二次文獻(xiàn)掛接全文的功能?
3 數(shù)字圖書館發(fā)展方向及特點(diǎn)
3.1 數(shù)字圖書館發(fā)展方向
數(shù)字圖書館是用數(shù)字技術(shù)處理和存儲各種圖文并茂文獻(xiàn)的圖書館,實(shí)質(zhì)上是一種多媒體制作 的分布式信息系統(tǒng)?它把各種不同載體?不同地理位置的信息資源用數(shù)字技術(shù)存貯,以便于 跨區(qū)域?面向?qū)ο蟮木W(wǎng)絡(luò)查詢和傳播?它涉及信息資源加工?存儲?檢索?傳輸和利用的全 過程?
高校圖書館在經(jīng)歷了傳統(tǒng)圖書館?現(xiàn)代圖書館之后,正在向數(shù)字圖書館發(fā)展?數(shù)字圖書館是 高校圖書館建設(shè)與發(fā)展的方向和必然趨勢?高校數(shù)字圖書館建設(shè)與發(fā)展是高等教育事業(yè)發(fā)展 的需要,更是高校自身建設(shè)與發(fā)展的需要?
3.2 數(shù)字圖書館特點(diǎn)
高校數(shù)字圖書館是一個寬帶多媒體網(wǎng)絡(luò)和海量信息管理系統(tǒng),它所面對的存儲對象和技術(shù)領(lǐng) 域遠(yuǎn)遠(yuǎn)超出了目前傳統(tǒng)圖書館的范圍?存儲對象包括數(shù)字化的圖書?音像?軟件?電子出版 物?互聯(lián)網(wǎng)內(nèi)容等各種各樣的人文與科學(xué)數(shù)據(jù),因而涉及到大量的管理問題?數(shù)字圖書館涉 及的技術(shù)領(lǐng)域很寬廣,需要大量的技術(shù)突破作為支撐,例如基于內(nèi)容的多媒體檢索技術(shù)和智 能化?個性化和自動化服務(wù)技術(shù),這樣數(shù)字圖書館的真正潛力才能發(fā)揮出來?高校圖書館資 源載體類型較多,有紙制的載體,也有磁?光?電介質(zhì)的載體?館藏電子信息資源不僅包括 TXT?DOC?EXCEL?PPT?PDF?S2?PS2等流行的數(shù)據(jù)文件類型,而且還存有大量的圖像?音 頻?視頻等數(shù)據(jù)信息?圖書館信息資源建設(shè)的過程,實(shí)際上就是將資源電子化?數(shù)字化后建 成各種類型數(shù)據(jù)庫的過程?圖書館資源即包括本地資源,又存在異地資源,即有國內(nèi)資源, 又存在國外資源,不同國別,不同地域的文獻(xiàn)資料在數(shù)據(jù)著錄格式上存在著差別?高校數(shù)字圖書館應(yīng)具有:充實(shí)的在線資源;發(fā)現(xiàn)和使用信息資源的必備工具;用于采選?描述?保存 ?管理和分發(fā)數(shù)字資產(chǎn)的商業(yè)構(gòu)架;能夠在數(shù)字信息前景下操作的信息專家等特性?
4 IBASE數(shù)字圖書館處理方案
4.1 基于IBASE的數(shù)字圖書館
目前國內(nèi)的非結(jié)構(gòu)化數(shù)據(jù)庫最有代表性的是國信貝斯(IBASE)?IBASE數(shù)據(jù)庫是一種面向最終 用戶的非結(jié)構(gòu)化數(shù)據(jù)庫,在處理非結(jié)構(gòu)化信息?全文信息?多媒體信息和海量信息等領(lǐng)域以 及Internet/Intranet應(yīng)用上處于國際先進(jìn)水平,在非結(jié)構(gòu)化數(shù)據(jù)的管理和全文檢索方面獲 得突破?IBASE非結(jié)構(gòu)化數(shù)據(jù)庫系統(tǒng)不僅能夠支持IBASE非結(jié)構(gòu)化數(shù)據(jù)庫的直接上網(wǎng)發(fā)布和全 文檢索,對于傳統(tǒng)關(guān)系型數(shù)據(jù)庫,如Oracle?Sybase?Sql Server?DB2?Informix等,也 提供了導(dǎo)入和鏈接的支持,用戶可以采用導(dǎo)入方式,將傳統(tǒng)關(guān)系數(shù)據(jù)庫轉(zhuǎn)換為IBASE非結(jié)構(gòu) 化數(shù)據(jù)庫,再進(jìn)行網(wǎng)上發(fā)布和開發(fā)全文檢索應(yīng)用?用戶也可采用鏈接方式,對傳統(tǒng)關(guān)系數(shù)據(jù) 庫構(gòu)建本地化索引,從而通過本地化索引實(shí)現(xiàn)對關(guān)系數(shù)據(jù)庫的全文檢索支持,IBASE非結(jié)構(gòu) 化數(shù)據(jù)庫系統(tǒng)充當(dāng)關(guān)系數(shù)據(jù)庫應(yīng)用服務(wù)器,系統(tǒng)的檢索效率也將受關(guān)系數(shù)據(jù)庫自身檢索效率 和應(yīng)用服務(wù)器交互效率的影響?針對Internet應(yīng)用的特殊性,IBASE非結(jié)構(gòu)化數(shù)據(jù)庫系統(tǒng)主 要解決了文檔型和多媒體數(shù)據(jù)類型的支持問題?數(shù)據(jù)庫的全文檢索問題和Internet數(shù)據(jù)庫應(yīng) 用中的查詢和檢索效率問題?
4.2 IBASE軟件數(shù)據(jù)庫建設(shè)
IBASE系列軟件主要包括IBASE DMC數(shù)據(jù)管理中心和IBASE IPAC圖書館文獻(xiàn)信息資源發(fā)布與檢 索系統(tǒng)?IBASE DMC(數(shù)據(jù)管理中心)可以完成特色數(shù)據(jù)庫的建設(shè)?利用IBASE DMC數(shù)據(jù)管理中 心提供的方便快捷的建庫功能,可以將館藏資源建成滿足用戶的個性化?專業(yè)化需求?突出 館藏特色和科研方向?為教學(xué)科研提供高層次?高效率特色數(shù)據(jù)庫?利用IBASE IPAC圖書館 文獻(xiàn)信息資源發(fā)布與檢索系統(tǒng),圖書館可以建立起圖書館信息服務(wù)網(wǎng)站,將各種資源動態(tài)發(fā) 布上網(wǎng)實(shí)現(xiàn)資源的共享是圖書館數(shù)字化建設(shè)的最終目的?利用IBASE IPAC圖書館文獻(xiàn)信息資 源發(fā)布與檢索系統(tǒng)強(qiáng)大的發(fā)布功能圖書館無須任何編程,就能將特色數(shù)據(jù)庫發(fā)布上網(wǎng)?
4.3 IBASE數(shù)字圖書館處理方案
IBASE數(shù)字圖書館處理方案是基于“信息源——圖書館——讀者”三角架構(gòu),利用IBASE數(shù)據(jù) 庫強(qiáng)大的數(shù)據(jù)管理和全文查詢能力,以統(tǒng)一的標(biāo)準(zhǔn)和規(guī)范為基礎(chǔ),以數(shù)字化的各種信息資源 為底層,以分布式海量資源庫群為支撐,以智能檢索技術(shù)為手段,以電子商務(wù)為管理方式, 為高校圖書館提供完善的數(shù)字化圖書館解決方案?使用IBASE數(shù)據(jù)庫可以實(shí)現(xiàn):數(shù)字化信息 的制作與獲取;海量數(shù)字信息的存貯和管理;用戶權(quán)限認(rèn)證及計(jì)費(fèi)管理;網(wǎng)站內(nèi)容管理;信 息檢索和個性化服務(wù)?除此之外,IBASE數(shù)據(jù)庫還可以實(shí)現(xiàn)圖書館新聞/公告?用戶意見箱 ?BBS?FAG?網(wǎng)上用戶教育等輔助功能?
5 結(jié)束語
目前,國內(nèi)很多高校的圖書館都選購了以IBASE IPAC圖書館文獻(xiàn)信息資源發(fā)布與檢索系統(tǒng)為 核心的IBASE系列軟件,應(yīng)用于其特色數(shù)據(jù)庫建設(shè)?信息資源管理以及圖書館WEB站點(diǎn)和信息 服務(wù)的建設(shè)中,使IBASE數(shù)據(jù)庫成為圖書館數(shù)字化建設(shè)的核心平臺,極大地推動了圖書館特 色庫?論文庫?導(dǎo)航庫及圖書館網(wǎng)站的建設(shè),取得了良好的反響?除此之外,在電子商務(wù)等 領(lǐng)域也可以應(yīng)用IBASE系列軟件?
參考文獻(xiàn)
[1]雷菊霞,孫魁明,賈西蘭.數(shù)字圖書館建設(shè)的實(shí)踐與思考[J].大學(xué)圖 書館學(xué)報,2007,(3):39-42.
[2]瞿曉靜.非結(jié)構(gòu)化數(shù)據(jù)庫技術(shù)綜述[J].農(nóng)業(yè)圖書情報學(xué)刊,2004,(7):8-10.
[3]張德政,張萍萍.非結(jié)構(gòu)化信息管理[J].微計(jì)算機(jī)信息,2006,22(3):218-219,2 39.
[4]錢智勇.基于非結(jié)構(gòu)化館藏電子文獻(xiàn)數(shù)據(jù)庫的開發(fā)研究[J].情報技術(shù),2003,(5): 46-47.
[5]夏萍.基于知識管理的高校數(shù)字圖書館建設(shè)[J].現(xiàn)代情報,2007,(2):99-100.
[6]李德玲.遼寧高校數(shù)字圖書館建設(shè)與發(fā)展研究[J].沈陽大學(xué)學(xué)報,2005,17(3):12 7-130.
[7]張紹武,吳建西.非結(jié)構(gòu)化數(shù)據(jù)庫在數(shù)字化圖書館發(fā)展中的應(yīng)用[J].圖書館理論與 實(shí)踐,2003,(4):75-76,88.
[8]蘭麗輝.基于IBASE的高校數(shù)字圖書館解決方案[J].現(xiàn)代情報,2008,(7):88-92.