曾朝輝 王俊杰 劉曉麗 夏曉飛 程曉 李健文
摘 要 北京自然博物館結合生物分類系統(tǒng)與數(shù)據(jù)字典技術開發(fā)出生物分類字典,運用到藏品信息管理系統(tǒng)中,并以其在數(shù)據(jù)錄入、物種統(tǒng)計等方面的實際應用為例,探討生物分類字典在自然類博物館中推廣的可行性。
關鍵詞 生物分類字典 自然類博物館 藏品信息管理系統(tǒng)
0 引言
藏品是博物館業(yè)務活動的物質基礎,所有社會教育和服務、陳列、研究都離不開藏品。藏品的數(shù)量和質量決定了博物館的規(guī)模和地位。對自然類博物館而言,館藏標本的種類和數(shù)量尤其重要,必須及時、準確地獲取館藏物種豐富度,掌握館藏空白物種情況。目前,自然類博物館的藏品信息管理系統(tǒng)中,信息錄入的工作量相當大,且不能直接生成館藏標本名錄。因此如何運用數(shù)據(jù)庫技術提高工作效率,是我們迫切需要解決的問題。
數(shù)據(jù)字典是用于保存數(shù)據(jù)元素(數(shù)據(jù)項)和數(shù)據(jù)特征的說明文件。通過數(shù)據(jù)字典可以生成有關數(shù)據(jù)規(guī)模、類型、格式以及含義的報告。它實際上就是“關于系統(tǒng)數(shù)據(jù)的數(shù)據(jù)庫”。最初用于數(shù)據(jù)庫管理系統(tǒng),在系統(tǒng)開發(fā)過程以及系統(tǒng)運行后的維護階段起著重要作用,如確保數(shù)據(jù)在系統(tǒng)中的完整性和一致性;實現(xiàn)系統(tǒng)內部數(shù)據(jù)模式、代碼與圖式圖例標準化,進行信息交換、數(shù)據(jù)共享以及集成化統(tǒng)計、分析等綜合處理工作;相互參照,便于系統(tǒng)修改。
數(shù)據(jù)字典技術在數(shù)據(jù)處理方面具有明顯的優(yōu)勢。自20世紀80年代開始,經(jīng)過多年發(fā)展,這項技術取得了很大的進步,廣泛應用在多個領域,諸如網(wǎng)絡漁業(yè)詞典、地質災害數(shù)據(jù)庫等。北京自然博物館將數(shù)據(jù)字典技術與生物分類系統(tǒng)結合,引入到藏品信息管理系統(tǒng),實現(xiàn)館藏物種種類、數(shù)量和空白物種情況在不同分類階元層級上的直觀展示和統(tǒng)計。
1 生物分類字典的概念
生物分類系統(tǒng)是階元系統(tǒng),由界、門、綱、目、科、屬、種七個分類階元組成。根據(jù)生物之間相同、相異的程度與親緣關系的遠近,使用不同等級特征,將生物逐級分類。目前,生物分類學上使用較廣的是五界分類系統(tǒng),由美國生物學家魏泰克(Robert Harding Whittaker)于1969年提出,把生物界分成了原核生物界、原生生物界、真菌界、植物界和動物界。如表1所示,以動物分類系統(tǒng)為例,任何一個已知的動物均可無例外地歸屬于這些階元之中。
生物分類字典從數(shù)據(jù)字典演變而來,并針對自然類博物館的藏品特點進行開發(fā)。生物分類字典中的內容具有相關性,其中的每一條記錄都有與其相關的父記錄或子記錄。這也是生物分類字典與數(shù)據(jù)字典的本質區(qū)別。也就是說,數(shù)據(jù)字典只能在字段的根項下擴展子項,而生物字典則可以組合多個字段,并設定這些字段的上下層關系。通過把每個字段下的某一項與其上的某一項進行關聯(lián),形成一組有關聯(lián)關系的指標組,當實際調用任意一層的內容時,與其相關的字段也會自動帶入。
2 生物分類字典的建立和實現(xiàn)
生物分類字典是在分析借鑒現(xiàn)有的生物分類學研究成果和已公布的中國生物物種信息名錄的基礎上,利用現(xiàn)代信息技術建立的一套基于Web的生物分類系統(tǒng)。其由軟件工程師編寫程序,預先導入分類系統(tǒng)數(shù)據(jù)。如表2、表3所示,在生物分類字典的建立過程中,分類階元的層次關系通過關系數(shù)據(jù)庫實現(xiàn)。
在實現(xiàn)數(shù)據(jù)檢索時,我們選擇了適用于中小型數(shù)據(jù)庫的Windows 2000+Internet Information Services+SQL Server配置,并采用目前比較流行的ASP語言動態(tài)讀取客戶端頁面,對后臺進行實時更新及維護。如圖1所示,整個數(shù)據(jù)庫由后臺管理模塊和前臺檢索模塊組成。后臺管理模塊主要負責階元的添加、修改、刪除和校對;前臺檢索模塊主要負責階元的展示和統(tǒng)計。
3 生物分類字典的基本功能
3.1 自動調取藏品分類信息
過去在登錄藏品信息時,編目中的分類信息需逐條輸入相應的字段里,錄入速度慢,且容易出錯。如圖2所示,在新的藏品信息管理系統(tǒng)中,借助生物分類字典,一旦錄入物種名稱后,便可直接從后臺調用其對應的學名、界、門、綱、目、科、屬、種以及保護級別、瀕危等級等信息。
3.2 快速查詢和統(tǒng)計館藏標本
生物分類字典憑借多層級分類階元,實現(xiàn)了館藏標本信息的可視化展示。通過點擊分類系統(tǒng)樹,便可查看本館物種的種類、數(shù)量以及藏品的詳細情況。同時,還能生成某一門類的館藏標本名錄,并支持文件導出和在線打印,為館內外科研人員開展學術研究與交流提供方便。
3.3 動態(tài)顯示館藏物種總數(shù)
根據(jù)生物分類字典的統(tǒng)計結果,在藏品信息管理系統(tǒng)的首頁動態(tài)顯示館藏物種總數(shù)。這種方式同樣也適用于屬、科、目等層級。另外,我們可以通過查詢數(shù)量為0的物種來了解館藏空白物種,為今后的標本采集、征集和館際交換工作提供參考。
4 生物分類字典的優(yōu)勢
4.1 提高存儲效率,節(jié)省存儲空間
數(shù)據(jù)字典的主要目的是實現(xiàn)關系數(shù)據(jù)庫的共享、重用、交互。數(shù)據(jù)字典在整個數(shù)據(jù)庫管理系統(tǒng)中獨立形成一個文件,以指針映射類型將內容對應到不同管理對象的記錄中。這樣通過數(shù)據(jù)字典的繼承關系和標準化描述,運用分層式樹狀結構調取數(shù)據(jù),減少了同質信息,避免數(shù)據(jù)庫中大量數(shù)據(jù)的重復存儲。
4.2 簡化數(shù)據(jù)庫系統(tǒng)的維護
基于最新的研究進展,生物分類系統(tǒng)要對一些物種的分類階元進行調整,如拆分或合并物種、提升物種地位、整理物種名稱(包括同物異名)等。不同于以往的繁瑣流程,現(xiàn)在我們通過修改生物分類字典,即可快速更新相應館藏物種的分類地位和從屬關系。筆者建議每年統(tǒng)一修訂一次生物分類字典,以保證內容的科學、準確。出于數(shù)據(jù)庫安全的考量,必須由專業(yè)人員負責數(shù)據(jù)的批量修改,并及時進行備份,以防止因操作不當造成的數(shù)據(jù)丟失。
5 生物分類字典的應用前景
自然界生物門類眾多,數(shù)據(jù)量龐大,建立哪些門類的分類系統(tǒng),主要取決于本館的館藏情況。北京自然博物館的收藏以動物、植物、古生物、古人類為主,因此在《GB/T 15628.1—2009 中國動物分類代碼第1部分:脊椎動物》和《GB/T 14467—93 中國植物分類與代碼》的基礎上,我們查閱了近些年發(fā)表的新物種記錄,建立了動物界脊索動物門、節(jié)肢動物門昆蟲綱和植物界被子植物門、裸子植物門的生物分類字典,其他門類之后也將視情況陸續(xù)錄入。
經(jīng)過三年的實際運行,北京自然博物館開發(fā)的面向自然類博物館的生物分類字典功能模塊取得了良好的效果。在開發(fā)過程中,我們將國家標準分類術語代碼引入建模系統(tǒng),使用標準術語來輔助設計。因此,生物分類字典是一個標準化的數(shù)據(jù)字典,可以移植到各個不同類型的藏品信息管理系統(tǒng)。同時,若將全國自然類標本登錄到同一平臺,在標本查詢、物種統(tǒng)計等方面能起到統(tǒng)一和規(guī)范的作用。
參考文獻
[1]北京博物館學會.博物館藏品保管工作指引[M].北京:中國書籍出版社,2012.
[2]吳維寧.網(wǎng)絡漁業(yè)詞典中水生生物分類系統(tǒng)的建立和實現(xiàn)[J].上海水產(chǎn)大學學報,2003(1):56-60.
[3]吳林寰,劉翟,杜曉萌,等.生物信息數(shù)據(jù)庫通用數(shù)據(jù)字典標準化研究[J].科技創(chuàng)新導報,2009(26):10,13.
[4]趙新穎,湯卓煒.從古生物標本的整理分類及其檢索看自然博物館的庫房管理[J].博物館研究,1996(1):82.