【摘 要】本文闡述了數(shù)字圖書館和數(shù)字圖書的概念,及如何構(gòu)建數(shù)字圖書館,以及數(shù)字圖書在博物館中的應(yīng)用。
【關(guān)鍵詞】博物館 數(shù)字圖書館 數(shù)字圖書
數(shù)字圖書館是一門全新的科學(xué)技術(shù),是網(wǎng)絡(luò)環(huán)境下產(chǎn)生的一個(gè)新生事物,也是一個(gè)不斷完善和發(fā)展的事物。簡(jiǎn)言之,數(shù)字圖書館是一種擁有多種媒體內(nèi)容的數(shù)字化信息資源,能夠?yàn)橛脩籼峁┓奖恪⒖旖?、高水平的信息化服?wù)機(jī)制。盡管它的概念提出僅僅只有二十多年的時(shí)間,但是卻有一個(gè)良好的發(fā)展前景。
博物館作為一個(gè)文化載體,它所收藏的眾多文物中,有許多文獻(xiàn)資料,為了更好地提供給觀眾查閱,建立數(shù)字圖書館,顯得尤為重要。
一、數(shù)字圖書館的概述
(一)數(shù)字圖書館的定義
數(shù)字圖書館,又叫電子圖書館,是通過數(shù)字信息技術(shù),將圖像、文字、語音、影像、軟件和科學(xué)數(shù)據(jù)等信息進(jìn)行數(shù)字化加工,并提供在廣域網(wǎng)上,以實(shí)現(xiàn)高速橫向跨庫(kù)連接的電子存取服務(wù),供讀者使用。
(二)數(shù)字圖書館的構(gòu)成要素
數(shù)字圖書館有三個(gè)基本構(gòu)成要素:數(shù)字化資源、網(wǎng)絡(luò)化存取、分布式管理。
數(shù)字化資源:海量的數(shù)字化資源是數(shù)字圖書館的物質(zhì)基礎(chǔ),沒有這個(gè)基礎(chǔ),數(shù)字圖書館就是無源之水、無本之木。這些數(shù)字化資源應(yīng)該能夠直接提供給讀者所需的信息,其中既有二次文獻(xiàn),也有大量的一次文獻(xiàn)。數(shù)字化資源的載體方式也千姿百態(tài),其中多媒體成為數(shù)字化資源的主要組成部分。
網(wǎng)絡(luò)化存取:數(shù)字通信網(wǎng)絡(luò)是數(shù)字圖書館的存在基礎(chǔ),沒有這個(gè)基礎(chǔ),海量的數(shù)字化信息資源就無法得到利用和傳播。數(shù)字圖書館是依附于網(wǎng)絡(luò)而存在的,對(duì)內(nèi)的業(yè)務(wù)和對(duì)外的服務(wù)也都是以網(wǎng)絡(luò)作為工具或載體。在網(wǎng)絡(luò)環(huán)境中,數(shù)字圖書館可以最大地發(fā)揮自己的資源優(yōu)勢(shì),充分為讀者提供各種服務(wù)。
分布式管理:這是數(shù)字圖書館發(fā)展的高級(jí)階段,也是數(shù)字圖書館成熟的標(biāo)志。全球的數(shù)字化資源通過Internet聯(lián)為一體,組成了一個(gè)巨大的世界范圍的數(shù)字圖書館,人類可以共享和共建所有的數(shù)字資源。
二、數(shù)字圖書的概述
(一)數(shù)字圖書的概念
目前“數(shù)字”一詞已滲透到各個(gè)領(lǐng)域,可以說,數(shù)字化是信息化的核心內(nèi)容,只有通過數(shù)字化后才能運(yùn)用計(jì)算機(jī)操作并在網(wǎng)上發(fā)布。
數(shù)字圖書也稱電子書,它有別于以紙張為載體的傳統(tǒng)出版物,是通過數(shù)碼方式記錄在以光、電、磁為介質(zhì)的設(shè)備中,借助于特定的設(shè)備來讀取、復(fù)制、傳輸。數(shù)字圖書通俗地說就是電子書籍,是數(shù)字化的出版物,既可以理解為以PDF、DOC、CEB、TXT或者圖片格式存在的書籍,也可以理解為是數(shù)字化的文字內(nèi)容。
(二)數(shù)字圖書的類型
掃描書:對(duì)印刷型圖書進(jìn)行電子掃描后生成的電子圖像序列,書的每一頁都是一張電子圖像。其優(yōu)勢(shì)是加工技術(shù)簡(jiǎn)單,但由于是用圖像的方式保存成的電子圖書,所以占用較大的存儲(chǔ)空間,而且不能進(jìn)行全文檢索,也無法實(shí)現(xiàn)頁面標(biāo)注、摘錄、字體縮放等編輯功能。這種掃描書主要是數(shù)字圖書館發(fā)展初期使用較多的一種電子圖書,隨著數(shù)字加工技術(shù)的發(fā)展,這種掃描書將逐漸被其他數(shù)字圖書所取代。但是對(duì)一些珍貴文獻(xiàn)進(jìn)行數(shù)字化加工時(shí),掃描仍是一種無法取代的方式,例如手抄本、古籍、木刻等歷史文獻(xiàn)的數(shù)字化,掃描仍是主要手段。
OCR識(shí)別書:OCR是光學(xué)字符識(shí)別的縮寫,是通過掃描等光學(xué)輸入方式將各種報(bào)刊、書籍、文稿及其他印刷品的文字轉(zhuǎn)化為圖像信息,再利用文字識(shí)別技術(shù)將圖像信息轉(zhuǎn)化為可以使用的計(jì)算機(jī)輸入技術(shù)。OCR識(shí)別書不僅可以實(shí)現(xiàn)全文檢索,而且還可以進(jìn)行頁面標(biāo)注、摘 要、字體縮放等編輯功能,存儲(chǔ)空間相對(duì)掃描書也大大降低。但是單純的OCR識(shí)別技術(shù)存在兩個(gè)顯著地特點(diǎn),一是識(shí)別率不高,二是不能保留原書的版式,文字和圖片的關(guān)聯(lián)消失。
錄入書:即將印刷圖書重新錄入生成的電子圖書??梢詫?shí)現(xiàn)全文檢索,也可以實(shí)現(xiàn)頁面標(biāo)注、摘 要、字體縮放等功。但是需要人工錄入、排版、校隊(duì),最終結(jié)果的質(zhì)量完全取決于錄入人員的水平。
排版書:目前,圖書出版已經(jīng)實(shí)現(xiàn)了數(shù)字化,一些印刷版圖書的電子版作為電子圖書直接存入相應(yīng)數(shù)據(jù)庫(kù)中可供讀者閱讀。但是這些數(shù)字化的排版書都要經(jīng)過格式轉(zhuǎn)換。這是因?yàn)橛糜谟∷⒌呐虐嫖募粌H存儲(chǔ)數(shù)據(jù)量較大,而且格式難以統(tǒng)一,解析成可供讀者閱讀的格式較為困難。采用格式轉(zhuǎn)化的方式可以將上述用于印刷的排版文件直接生成為一種統(tǒng)一的格式,并且能完整地保留原排版文件內(nèi)容和版式信息,還能把數(shù)據(jù)量降到最低。這種轉(zhuǎn)換的排版書的質(zhì)量與通過出版社多次校對(duì)把關(guān)的排版文件完全一致,也能實(shí)現(xiàn)全文檢索以及各種編輯功能,這也是目前質(zhì)量較高的數(shù)字圖書。
三、數(shù)字圖書館的構(gòu)建
(一)數(shù)字圖書館硬件平臺(tái)的建設(shè)
基礎(chǔ)平臺(tái)是指支持客戶應(yīng)用運(yùn)行的基礎(chǔ)環(huán)境,包括硬件(服務(wù)器、存儲(chǔ)設(shè)備、網(wǎng)絡(luò))、系統(tǒng)軟件、管理軟件方面的建設(shè),這是信息化的前提。硬件設(shè)備的購(gòu)置應(yīng)遵循安全性、技術(shù)先進(jìn)性、成熟性和兼容性。
基礎(chǔ)網(wǎng)絡(luò)建設(shè):在考慮當(dāng)前需求的同時(shí),還要充分考慮到將來擴(kuò)展的需要。系統(tǒng)平臺(tái)、網(wǎng)絡(luò)協(xié)議、網(wǎng)絡(luò)技術(shù)及網(wǎng)管標(biāo)準(zhǔn)都應(yīng)遵循國(guó)際化標(biāo)準(zhǔn)。
網(wǎng)絡(luò)環(huán)境:數(shù)字圖書館本質(zhì)上是基于網(wǎng)絡(luò)環(huán)境下的海量數(shù)據(jù)庫(kù)及其應(yīng)用。網(wǎng)絡(luò)操作系統(tǒng)應(yīng)當(dāng)為當(dāng)前的主流網(wǎng)絡(luò)操作系統(tǒng),要能支持多種網(wǎng)絡(luò)協(xié)議。
服務(wù)器:其選購(gòu)必須是面向海量處理的服務(wù)器,在海量計(jì)算、海量通信、海量存儲(chǔ)和海量通道上可構(gòu)筑一個(gè)全新的計(jì)算平臺(tái)。故主頻、系統(tǒng)的控制器的傳輸頻率、數(shù)據(jù)頻寬、傳輸率等參數(shù)必須作為重要參考,使得處理速度、數(shù)據(jù)吞吐量必須能完全滿足多用戶對(duì)數(shù)字圖書館中數(shù)據(jù)加工、檢索、閱讀等方面的要求,并使其支持硬盤、網(wǎng)卡、電源等的熱插拔功能,從而有效提升系統(tǒng)工作的可靠性和穩(wěn)定性。
存儲(chǔ)設(shè)備:光盤、文件服務(wù)器、磁盤陣列為數(shù)字圖書館常見的存儲(chǔ)設(shè)備,并且數(shù)據(jù)的災(zāi)難備份及恢復(fù)也是要考慮的一個(gè)重要因素。
交換機(jī):一般館內(nèi)主干采用快速以太網(wǎng)即可。
(二)數(shù)字圖書館軟件平臺(tái)的建設(shè)
數(shù)字圖書館軟件平臺(tái)主要由數(shù)字圖書館發(fā)布系統(tǒng)、數(shù)字圖書館管理系統(tǒng)以及數(shù)字圖書館全文檢索系統(tǒng)組成。其中,數(shù)字圖書館發(fā)布系統(tǒng)主要進(jìn)行如下工作:數(shù)字信息資源的獲取以及整理→格式轉(zhuǎn)換→元數(shù)據(jù)標(biāo)引→目錄制作→分類→鏈接制作→檢查→發(fā)布;數(shù)字圖書館管理系統(tǒng)主要進(jìn)行用戶管理、圖書管理以及系統(tǒng)管理的工作;數(shù)字圖書館全文檢索系統(tǒng)提供模糊檢索、精確檢索、二次檢索、關(guān)鍵詞檢索、全文檢索等檢索功能。
1.數(shù)字信息資源的獲?。?/p>
錄入方式:這種方式速度慢,錯(cuò)誤多,需要大量人力、物力。掃描方式:涉及到信息轉(zhuǎn)換技術(shù)、信息識(shí)別技術(shù)、信息壓縮技術(shù)、信息儲(chǔ)存技術(shù)、信息保護(hù)技術(shù)等主要技術(shù),為實(shí)現(xiàn)高速掃描,高速掃描儀選購(gòu)時(shí)要注意其掃描速度、識(shí)別通過率、卡紙及失敗率等技術(shù)指標(biāo)。直接購(gòu)買數(shù)字資源。
2.數(shù)字信息資源海量數(shù)據(jù)的存儲(chǔ)和管理:
數(shù)字圖書館系統(tǒng)必須具備海量存儲(chǔ)的能力,有足夠的輸出能力,能快捷地進(jìn)行資料整理,以及能提供檢索功能。目前,數(shù)字圖書館信息資源保存的主要方式如下:
光盤:采用光盤作存儲(chǔ)設(shè)備是一種比較廣泛的數(shù)字信息存儲(chǔ)方案。其優(yōu)點(diǎn)是價(jià)格低,但讀取速度慢且光盤容易劃傷磨損。
文件服務(wù)器:文件服務(wù)器也是存儲(chǔ)數(shù)字信息的主要方式,其特點(diǎn)是響應(yīng)速度快,網(wǎng)絡(luò)數(shù)據(jù)傳輸量大,但成本高。
磁盤陣列:磁盤陣列主要用于大容量、高要求環(huán)境下的重要數(shù)據(jù)備份,其傳輸速度更快、容量更大而且能自動(dòng)容錯(cuò),但成本昂貴。從存儲(chǔ)技術(shù)的發(fā)展來看,必然向更高速、更大容量及更低價(jià)格發(fā)展。因此,可以將光盤與磁盤陣列結(jié)合,以此來滿足大容量實(shí)時(shí)數(shù)據(jù)應(yīng)用的需求。
3.數(shù)字信息資源共享
發(fā)布系統(tǒng)是將信息數(shù)字化后的數(shù)據(jù)發(fā)布到數(shù)字圖書館系統(tǒng)之中,以供用戶和讀者使用。其涉及到從海量信息存儲(chǔ)到面向?qū)ο蟮姆植际焦芾?,從模式識(shí)別、基于知識(shí)內(nèi)容的數(shù)據(jù)挖掘和檢索到人機(jī)界面技術(shù)等等。
檢索系統(tǒng):在圖書館學(xué)上被理解為公共電子書目,提供了讀者信息查詢、書刊目錄查詢、網(wǎng)上信息發(fā)布、最新書刊查詢等網(wǎng)絡(luò)化的業(yè)務(wù)服務(wù)。數(shù)字圖書館的真實(shí)含義是數(shù)字資料庫(kù),其中全文檢索系統(tǒng)最為關(guān)鍵。目前,應(yīng)用數(shù)據(jù)檢索技術(shù),能準(zhǔn)確高效地搜索相關(guān)的數(shù)據(jù)內(nèi)容,實(shí)現(xiàn)優(yōu)化二次檢索。這些技術(shù)的發(fā)展完善了數(shù)字圖書館的全文檢索系統(tǒng),使讀者能方便地進(jìn)行基于內(nèi)容的全文檢索和基于作者、標(biāo)題、摘 要、分類的檢索和模糊查詢。
(三)數(shù)字圖書館人才隊(duì)伍的建設(shè)
傳統(tǒng)圖書館館員的角色只是知識(shí)的保存者和管理者,其借書、閱覽、參考咨詢等服務(wù)是以館藏印刷性資料為基礎(chǔ)的,服務(wù)主要依靠手工來完成———手工編目、人工標(biāo)引、卡片目錄、裝訂、上架、排架及校點(diǎn)圖書等等,只是進(jìn)行簡(jiǎn)單的圖書資料的分類存放、借閱催還工作。然而,數(shù)字圖書館的出現(xiàn)給傳統(tǒng)圖書館帶來了巨大沖擊,主要表現(xiàn)在信息存儲(chǔ)、處理、檢索、傳遞、管理等方式將發(fā)生根本變化。數(shù)字圖書館建設(shè)需要高水平的計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)、數(shù)字化技術(shù)等專業(yè)人才,這要求數(shù)字圖書館館員應(yīng)該是一個(gè)高素質(zhì)、高技能的復(fù)合型人才,其肩負(fù)著設(shè)備的采購(gòu)、系統(tǒng)的維護(hù)、讀者服務(wù)的提供等任務(wù)。因此,需要對(duì)現(xiàn)有館員進(jìn)行必要的培訓(xùn),以及引進(jìn)相應(yīng)的人才,形成一支優(yōu)秀的數(shù)字圖書館人才隊(duì)伍,才能保證數(shù)字圖書館的建設(shè)、維護(hù)和管理。
數(shù)字圖書館,作為現(xiàn)代博物館的拓展,符合博物館智能化、信息化的理念,在博物館事業(yè)的長(zhǎng)遠(yuǎn)發(fā)展中,占據(jù)著越來越重要的地位。數(shù)字化將是博物館的發(fā)展方向。
參考文獻(xiàn):
[1]郭衛(wèi)真.數(shù)字圖書館的建設(shè).遼寧工程技術(shù)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2001(4)
[2]毛垣生.數(shù)字圖書館的建設(shè)與發(fā)展.中國(guó)市場(chǎng)出版社,2006(8)
[3]李秋之.數(shù)字圖書館發(fā)展模式之探討.圖書館工作與研究,2007(1)