摘要:本文從目前多個(gè)館藏中醫(yī)古籍?dāng)?shù)據(jù)庫在利用過程中發(fā)現(xiàn)的問題出發(fā),指出建立館藏中醫(yī)古籍?dāng)?shù)字化共享平臺(tái)的必要性和可行性,并具體設(shè)計(jì)了共享平臺(tái)的總體目標(biāo)、組建結(jié)構(gòu)和組建方法。
關(guān)鍵詞:中醫(yī)古籍;數(shù)字化;共享平臺(tái)
自上世紀(jì)90年代我館開展古籍?dāng)?shù)字化研究工作以來,在各級(jí)課題的資助下先后建立\"珍善本中醫(yī)古籍檔案管理系統(tǒng)\"、\"中醫(yī)藥珍善本古籍多媒體數(shù)據(jù)庫\"、\"館藏中醫(yī)古籍書目數(shù)據(jù)庫\"、\"中國中醫(yī)科學(xué)院古籍管理系統(tǒng)\"、\"中醫(yī)養(yǎng)生數(shù)據(jù)庫\"和\"中醫(yī)藥古籍資源數(shù)據(jù)庫\"等多個(gè)數(shù)據(jù)庫。這些數(shù)據(jù)庫在不同的時(shí)期都發(fā)揮了各自不同的作用,不斷地推進(jìn)我館中醫(yī)古籍?dāng)?shù)字化保護(hù)和利用工作。然而隨著數(shù)據(jù)庫數(shù)量的增加,在利用這些數(shù)據(jù)庫的過程中也出現(xiàn)了一些新的問題。
1 目前存在的主要問題
1.1用戶查詢不便利 不同的數(shù)據(jù)庫資源是相對(duì)獨(dú)立的,相互之間缺乏必要的聯(lián)系,在對(duì)古籍信息進(jìn)行全面查詢時(shí),需要將每本古籍在每個(gè)數(shù)據(jù)庫里都查詢一遍。這樣查詢起來十分的繁瑣,工作量也很大。
1.2內(nèi)容和功能存在重復(fù) 由于都是中醫(yī)古籍?dāng)?shù)據(jù)庫,除了各自特有的功能外,都會(huì)對(duì)古籍的基本內(nèi)容進(jìn)行描述或查詢,甚至是用戶管理等方面都存在很多相似之處。這樣就會(huì)造成重復(fù)建設(shè),而且增加了存儲(chǔ)空間。
1.3更新不同步 不同的數(shù)據(jù)庫由不同的管理員來管理,一個(gè)數(shù)據(jù)庫的信息被更新后,其它的數(shù)據(jù)庫管理員很難及時(shí)得到這些信息并對(duì)所負(fù)責(zé)的數(shù)據(jù)庫進(jìn)行及時(shí)有效地更新。這種不同步很容易造成查詢結(jié)果的遺漏。
此外,如果把各個(gè)數(shù)據(jù)庫的管理與自身發(fā)展看做是縱向的,那么,組建一個(gè)橫向的共享平臺(tái)將是十分必要的。它可以將各個(gè)數(shù)據(jù)庫的資源串聯(lián)在一起,從而形成一種類似矩陣管理的結(jié)構(gòu)模式。而且隨著數(shù)據(jù)庫技術(shù)和網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,館藏中醫(yī)古籍?dāng)?shù)字化共享平臺(tái)的組建在技術(shù)上也是切實(shí)可行的。
2 總體設(shè)想目標(biāo)
為了實(shí)現(xiàn)館藏中醫(yī)古籍的資源共享和方便、快捷的信息檢索服務(wù),通過對(duì)現(xiàn)有的館藏中醫(yī)古籍?dāng)?shù)據(jù)庫(主要包括\"館藏中醫(yī)古籍書目數(shù)據(jù)庫\"、\"中國中醫(yī)科學(xué)院古籍管理系統(tǒng)\"和\"中醫(yī)藥古籍資源數(shù)據(jù)庫\"三個(gè)數(shù)據(jù)庫)的整合,組建一個(gè)面向用戶需求的集數(shù)據(jù)加工管理和應(yīng)用服務(wù)為一體的古籍資源網(wǎng)絡(luò)共享平臺(tái)。
該平臺(tái)以交互性強(qiáng)、簡捷方便為特點(diǎn),具有良好的信息導(dǎo)航、數(shù)據(jù)管理和在線服務(wù)等功能,可以滿足用戶個(gè)性化的服務(wù)要求,實(shí)現(xiàn)用戶和管理員各自內(nèi)部以及相互之間的信息交流和數(shù)據(jù)傳遞。
3 具體組建結(jié)構(gòu)
該平臺(tái)可由數(shù)據(jù)管理系統(tǒng)和對(duì)外服務(wù)系統(tǒng)兩部分組成。每部分之間是相互聯(lián)系的,而且可根據(jù)實(shí)際需要分設(shè)不同的子系統(tǒng)。
3.1數(shù)據(jù)管理系統(tǒng)
3.1.1內(nèi)容管理系統(tǒng) 內(nèi)容管理系統(tǒng)是指對(duì)有關(guān)中醫(yī)古籍的各種數(shù)字資源,包括文本、圖片,甚至是視頻、3D模型等,進(jìn)行存儲(chǔ)和管理。這部分是整個(gè)共享平臺(tái)的基礎(chǔ)。
內(nèi)容管理系統(tǒng)可分為存儲(chǔ)模塊和管理模塊。存儲(chǔ)模塊是指對(duì)各種數(shù)字資源進(jìn)行存儲(chǔ)和備份,也對(duì)數(shù)字資源的各種元數(shù)據(jù)進(jìn)行存儲(chǔ)。這樣既可以保護(hù)各種資源,也可以保存各個(gè)媒體類型之間的關(guān)系以及其他諸如用戶對(duì)某個(gè)資源擁有的權(quán)限等關(guān)系。管理模塊是指對(duì)各種數(shù)字資源進(jìn)行描述、分類、核查、加工、整合以及統(tǒng)計(jì)分析等方面的管理。
3.1.2用戶管理系統(tǒng) 用戶管理系統(tǒng)是指對(duì)各種用戶進(jìn)行信息描述和需求分析的管理。各種用戶包括不同數(shù)據(jù)庫的數(shù)據(jù)庫管理員和不同層次的外部用戶,主要是指外部用戶。
用戶管理系統(tǒng)可分為用戶信息模塊和用戶需求分析模塊。
用戶信息模塊主要包括用戶元信息和個(gè)性化特征的信息。如用戶姓名、性別、年齡、單位、聯(lián)系地址、專業(yè)、職業(yè)、職稱等;用戶的收藏書目;用戶的請(qǐng)求歷史;用戶每次的檢索記錄等等。
用戶需求分析模塊主要是針對(duì)直接或間接獲得的用戶需求信息進(jìn)行分析。包括:通過用戶描述,獲取用戶請(qǐng)求;對(duì)用戶注冊(cè)資料、使用習(xí)慣等個(gè)性化信息進(jìn)行分析,主動(dòng)跟蹤用戶平時(shí)感興趣的信息,調(diào)整系統(tǒng)個(gè)性服務(wù)的角度和內(nèi)容,建立用戶個(gè)性化需求模式;維護(hù)用戶的數(shù)據(jù)信息等。
3.1.3數(shù)據(jù)庫管理系統(tǒng) 數(shù)據(jù)庫管理系統(tǒng)是指對(duì)整個(gè)共享平臺(tái)的硬件和軟件進(jìn)行管理和維護(hù)。包括數(shù)據(jù)庫定義、數(shù)據(jù)裝入、數(shù)據(jù)庫操縱、數(shù)據(jù)庫控制、數(shù)據(jù)庫維護(hù)、數(shù)據(jù)通信等等。這是整個(gè)共享平臺(tái)正常運(yùn)行的重要保障。
3.2對(duì)外服務(wù)系統(tǒng)
3.2.1檢索服務(wù)系統(tǒng) 檢索服務(wù)系統(tǒng)是通過友好的用戶檢索口直接面向用戶需求提供不同層次的檢索服務(wù),包括簡單檢索、組合檢索、智能檢索等等。這部分是共享平臺(tái)的主要服務(wù)窗口。檢索服務(wù)系統(tǒng)要簡便、易操作,對(duì)于登陸平臺(tái)的任何用戶都可以提供服務(wù)。
3.2.2個(gè)性化服務(wù)系統(tǒng) 個(gè)性化指根據(jù)用戶的信息使用行為、習(xí)慣、偏好和特定需求,向用戶提供滿足其個(gè)性需求的信息內(nèi)容和功能的一種服務(wù)。個(gè)性化服務(wù)系統(tǒng)是根據(jù)用戶的定制需求,提供個(gè)性化的界面設(shè)置、個(gè)性化的信息環(huán)境以及個(gè)性化的信息快報(bào)。特別是用戶可以定制個(gè)人館藏,提高用戶的檢索效率,從而使用戶的個(gè)性化需求能得到最大限度的滿足。這是與用戶管理系統(tǒng)相連接的。
3.2.3用戶交流系統(tǒng) 用戶交流系統(tǒng)是指利用群組軟件等協(xié)同工具給不同類型或不同興趣的用戶提供一個(gè)共享和交流空間。通過用戶彼此之間的討論與交流,整合組織所有資源,加強(qiáng)成員之間的溝通,提升組織信息產(chǎn)品服務(wù)的質(zhì)量和效率。其目的在于實(shí)現(xiàn)不同子系統(tǒng)的信息同步,提供知識(shí)共享,利用開放的環(huán)境,促進(jìn)不同用戶之間的群體合作。
4 組建方法
4.1數(shù)據(jù)庫比較 對(duì)\"館藏中醫(yī)古籍書目數(shù)據(jù)庫\"、\"中國中醫(yī)科學(xué)院古籍管理系統(tǒng)\"和\"中醫(yī)藥古籍資源數(shù)據(jù)庫\"三個(gè)數(shù)據(jù)庫的結(jié)構(gòu)、內(nèi)容和功能進(jìn)行全面的比較,分析三者之間的相同點(diǎn)和不同點(diǎn),尤其是各自的特色功能。
4.2資源整合
4.2.1結(jié)構(gòu)整合 對(duì)于結(jié)構(gòu)相同的數(shù)據(jù),進(jìn)行數(shù)據(jù)合并。對(duì)于結(jié)構(gòu)不同的數(shù)據(jù),可以兼容的,進(jìn)行字段合并,并對(duì)每條數(shù)據(jù)進(jìn)行補(bǔ)充;不可以兼容的,進(jìn)行結(jié)構(gòu)重建,并對(duì)每條數(shù)據(jù)進(jìn)行修改和完善。
4.2.2內(nèi)容整合 對(duì)于內(nèi)容相同的數(shù)據(jù),進(jìn)行完善、去重;對(duì)于內(nèi)容不同的數(shù)據(jù),進(jìn)行修改和補(bǔ)充。
4.2.3功能整合 對(duì)于相同的功能,進(jìn)行去重;對(duì)于不同的功能,尤其是各自的特色功能,進(jìn)行改進(jìn)和優(yōu)化。對(duì)于以前沒有的功能,尤其是用戶個(gè)性化服務(wù)功能,進(jìn)行補(bǔ)充。
4.3開發(fā)平臺(tái)選擇 系統(tǒng)開發(fā)平臺(tái)的選擇主要考慮3個(gè)因素:①是成本因素,指開發(fā)系統(tǒng)需要部署產(chǎn)品的許可費(fèi)用、購買開發(fā)工具的費(fèi)用及其他開發(fā)費(fèi)用;②是時(shí)間因素,可以從學(xué)習(xí)時(shí)間和開發(fā)時(shí)間來衡量;③是安全性因素,是指信息在保存處理傳遞過程中的安全性因素。
結(jié)合我館的實(shí)際情況,館藏中醫(yī)古籍?dāng)?shù)字化共享平臺(tái)的具體服務(wù)方式可采用B/S多層架構(gòu)體系,即整個(gè)的應(yīng)用服務(wù)由基于Web的應(yīng)用服務(wù)器、中間件服務(wù)器和后臺(tái)數(shù)據(jù)倉庫組成。系統(tǒng)對(duì)外服務(wù)的主服務(wù)器、鏡像服務(wù)器選用LINUX;應(yīng)用服務(wù)器上的數(shù)據(jù)庫系統(tǒng)采用ORACLE數(shù)據(jù)庫;編程語言采用PHP和JavaScript語言,Web服務(wù)器采用Apache Web服務(wù)器。這幾種技術(shù)都有免費(fèi)開源的特點(diǎn),而目功能強(qiáng)大、互相集成,易于建設(shè)、維護(hù)、提高使用效率和保護(hù)后臺(tái)數(shù)據(jù)。
4.4系統(tǒng)發(fā)布 該平臺(tái)可在中國中醫(yī)科學(xué)院圖書館網(wǎng)上進(jìn)行發(fā)布。這樣可以為用戶提供更多的中醫(yī)古籍信息,也方便用戶查詢自己所需要的信息和資源。
5 總結(jié)
館藏中醫(yī)古籍?dāng)?shù)字化共享平臺(tái)的組建和運(yùn)行是一個(gè)長期復(fù)雜的工程。在建設(shè)的過程中,必須遵循服務(wù)用戶、統(tǒng)籌規(guī)劃、共建共享的原則,通過各方面的人力、物力和資金的配合與支持,才能形成一個(gè)簡捷方便的網(wǎng)絡(luò)共享平臺(tái),從而更好地為用戶服務(wù),為中醫(yī)古籍的保護(hù)和利用服務(wù),為中醫(yī)事業(yè)的發(fā)展創(chuàng)新服務(wù)。
參考文獻(xiàn):
[1]范文安.徽省科技文獻(xiàn)資源共建共享平臺(tái)及其建設(shè)方案[J].科技情報(bào)開發(fā)與經(jīng)濟(jì),2007,17(22):113-114.
[2]干冬力.高校圖書館信息資源共享平臺(tái)構(gòu)建分析[J].科技情報(bào)開發(fā)與經(jīng)濟(jì),2007,17(13):22-23.
[3]朱義華,郭昭輝,武港山.數(shù)字資源共享平臺(tái)框架的設(shè)計(jì)和實(shí)現(xiàn)[J].計(jì)算機(jī)應(yīng)用研究,2007,24(5):214-217.
[4]梅瑞峰,王盾.寧夏農(nóng)業(yè)信息資源整合及共享平臺(tái)建設(shè)[J].圖書館理論與實(shí)踐,2007,(6):112-113.
[5]邱燕燕.基于數(shù)字圖書館的個(gè)性化信息服務(wù)研究[J].圖書館論壇,2004,24(5):152-154.
編輯/哈濤