• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      中國植物標本館數(shù)字化發(fā)展的縮影

      2022-04-30 00:20:32劉啟新褚曉芳董曉宇惠紅周義峰
      廣西植物 2022年13期
      關鍵詞:江蘇省數(shù)據(jù)庫數(shù)字化

      劉啟新 褚曉芳 董曉宇 惠紅 周義峰

      摘 要:? 江蘇省中國科學院植物研究所標本館(NAS)是中國最早的植物標本館之一,也是國內最早開展植物標本數(shù)字化的標本館,其標本數(shù)字化發(fā)展經(jīng)歷了4個階段: 20世紀80年代后期嘗試的標本文字信息數(shù)字化的起步階段;20世紀90年代末的標本圖像數(shù)字化和文字信息數(shù)字化規(guī)范階段;2004年以后的標本批量數(shù)字化與信息網(wǎng)絡共享快速發(fā)展階段;2018年后的標本數(shù)字化信息維護與優(yōu)化階段。這一過程集中代表和反映了中國植物標本數(shù)字化的發(fā)展歷程。此外,近年來開始了發(fā)掘和利用江蘇植物標本的數(shù)字化信息工作,包括建設江蘇省級數(shù)字植物標本館、開發(fā)江蘇省維管植物標本時空分布可視化系統(tǒng)、開展標本采集-入庫過程數(shù)字化等。今后,將不斷深化標本數(shù)字化的工作,以期形成有NAS特色的數(shù)字化植物標本館。

      關鍵詞: 江蘇省,? 植物標本,? 標本圖像,? 標本信息, 數(shù)字化, 數(shù)據(jù)庫

      中圖分類號:? Q94

      文獻標識碼:? A

      文章編號:? 1000-3142(2022)增刊1-0071-16

      收稿日期:? 2022-08-12

      基金項目:? 國家標本資源共享平臺項目(2005DKA21400); 國家科技資源共享服務平臺項目(E2117G1001); 江蘇省省屬公益類科研院所植株科研課題(JSPKL202058)。

      第一作者: 劉啟新(1958-),碩士,研究員,主要研究方向為植物分類學,(E-mail)naslqx@qq.com。

      通信作者:? 周義峰,碩士,副研究員,研究方向為植物資源學,(E-mail)njgzhou@163.com。

      Development epitome of digitization of plant specimens

      of herbaria in China: Herbarium of Institute

      of Botany, Jiangsu Province and Chinese

      Academy of Sciences (NAS)

      LIU Qixin, CHU Xiaofang, DONG Xiaoyu, HUI Hong, ZHOU Yifeng*

      ( Herbarium of Institute of Botany, Jiangsu Province and Chinese Academy of Sciences (Nanjing

      Botanical Garden Mem. Sun Yat-Sen), Nanjing 210014, China )

      Abstract:? The Herbarium of Institute of Botany, Jiangsu Province and Chinese Academy of Sciences (NAS) is one of the earliest herbarium in China, and it is also the earliest herbarium to carry out the digitization of plant specimens in China. The digitization development process has gone through four stages: the initial stage of trying to digitize the text information of specimens in the late 1980s, the standardization stage of digitization of specimen image and text information in the late 1990s, the stage of batch digitization of specimens and sharing specimens information on network after 2004, and the stage of maintenance and optimization to digitization information of specimen after 2018. This process concentratedly represents and reflects the development of digitization of specimens in Chinas herbaria. In addition, in recent years, digital information of plant specimens from Jiangsu Province has been excavated and utilized, including the construction of Jiangsu Virtual Herbarium, development of a visualization system for the temporal and spatial distribution of vascular plant specimens in Jiangsu Province, and digital management in the whole process from specimen collection to specimen warehousing. In the future, the work of specimen digitization will continue to deepen, with a view to forming a digital herbarium with NASs characteristics。

      Key words: Jiangsu Province, plant specimens, image of specimens, information of specimens, digitization, database

      植物標本是開展植物學研究的一類重要實物材料,不僅承載了植物的形態(tài)特征和遺傳物質信息,而且記錄或攜帶著植物的產(chǎn)地、采集和資源信息,甚或載有植物種類的鑒定信息、標本研究信息以及鑒定與研究的歷史信息,在植物學研究領域,諸如植物分類、植物地理、植物區(qū)系等學科的研究中備受關注,特別是模式標本,是植物種類及其名稱的唯一實物憑證,具有不可替代性,其地位尤其特殊和重要。因此,業(yè)界極為重視對于植物標本的收集、保藏、研究與應用。

      標本館的重要任務之一,就是長期妥善保藏植物標本,并為學術研究和社會利用提供支撐和服務。但是,植物標本(尤其是臘葉標本)具有隨著時間的延長而逐漸老化或極易破損的局限性,加之保存條件的不適或過多翻閱易造成標本實體損壞,甚或天災及人為失誤可造成標本損毀或丟失,因此在實際工作中標本的保護與利用往往產(chǎn)生矛盾,特別是對于保存時間久且已“老化”的標本,矛盾愈顯突出。這一現(xiàn)象在很長一段時間內困擾著標本館管理人員,也是標本館工作的難點和必須解決的問題。

      20世紀中后期,隨著計算機的普及與應用,利用計算機技術將標本信息數(shù)字化,為標本館解決管理和應用方面的矛盾和困難提供了十分有效的方法和途徑。數(shù)字化的植物標本信息以數(shù)據(jù)庫的數(shù)字形式與標本實體分離,不僅在一定程度上減少直接查閱植物標本實物才能獲取相關信息的依賴性或局限性,而且可以減少人為活動造成標本損失,實現(xiàn)多人同時、多次、異地獲得完全相同的標本信息。這是傳統(tǒng)方式管理植物標本所不能及的,更能有效地延續(xù)實體標本壽命。無疑,標本的數(shù)字化為標本的管理、檢索、利用和保護提供了嶄新的途徑。正因如此,計算機一經(jīng)引入標本館管理,國內外的主要標本館都陸續(xù)啟用并迅速推進館藏標本的數(shù)字化工作(王利松等, 2010; Sobeeon, 1999; 李鳴光等, 1995; 馬波等, 2001)。

      江蘇省中國科學院植物研究所標本館(NAS,原名為中國科學院南京中山植物園標本館;以下簡稱“本館”)源于1923年的我國第一個生物研究機構——中國科學社生物研究所和建立于1934年的原動植物研究所的標本室。與國內其他植物標本館相比,本館應是我國最早的植物標本館,至今已近百年,是國內四大植物標本館之一,也是華東地區(qū)最大的植物標本館,保存有被子植物、裸子植物、蕨類植物及苔蘚植物的臘葉標本80余萬份,模式標本5 000余份。本館最大的保存特色和優(yōu)勢是有眾多模式標本、大批20世紀20年代至40年代我國早期植物學家采集的標本以及來自世界其他標本館早年的標本。中國植物學研究最早發(fā)起于南京和上海,我國早期植物學家在開展植物學研究過程中采集有許多植物標本,如秦仁昌、方文培、耿以禮、蔣英、王啟無、蔡希陶、陳煥鏞、賀賢育等在我國植物分類學發(fā)展中做出杰出貢獻的專家和學者,他們在西南(滇川貴)、華東、華南等地采集的大量標本,多數(shù)保存于本館。此外,還有一些外國植物學家(如P. J. M. Delavay、C. C. Courtois、H. Migo、J. F. Rock、Y. Yabe等人)在中國各地采集的許多標本和震旦博物院(Musee Heude)的館藏標本等。這些都是新中國成立中國科學院時收藏的主要植物標本,本所作為中國科學院專設的高等植物分類研究所將這部分標本予以全盤接收并存于本館中。這些植物標本經(jīng)歷了抗日戰(zhàn)爭期間從南京西遷至重慶、戰(zhàn)后又遷回的顛沛,以及“文革”時期的易地搬遷,保存至今,非常不易(薛攀皋, 1992)。上述標本,許多僅保存于本館,在我國近代植物學研究中發(fā)揮了重要作用,具有特殊的地位和極高的價值,十分珍貴。如何妥善保存這些標本是本館工作的重中之重,也成為本館積極開展標本數(shù)字化工作最直接、最迫切的原動力之一。

      除此之外,隨著學科的發(fā)展和信息化的深入,植物科學工作者,尤其是植物分類學家,除了到館實地查看植物標本細節(jié),更希望通過網(wǎng)絡平臺獲取或關注標本的相關信息,加之為了更好地全面保護館藏標本,也為了讓人們更方便、有效地利用這些標本的信息資源,在較大的范圍內做到信息共享,本館不僅充分認識到植物標本數(shù)字化的重要性,而且及早開展標本數(shù)字化工作,并在1984年就率先在國內開始建設植物標本數(shù)據(jù)庫,從此拉開了我國植物標本館開展標本信息化建設的序幕。

      1 本館標本數(shù)字化的經(jīng)歷與發(fā)展

      階段

      縱觀中國植物標本館將計算機技術應用于植物標本的管理并進行標本信息數(shù)字化的過程,本館最有代表性——開始于20世紀80年代,率先在國內建立了植物標本數(shù)據(jù)庫,歷經(jīng)了各個發(fā)展階段,成為我國植物標本數(shù)字化平臺的重要參與單位,是國內開展標本數(shù)字化最早、歷程最長的標本館。回顧本館植物標本數(shù)字化過程以及開展的工作,即可管窺我國植物標本館數(shù)字化的歷程,概為縮影。就本館開展的標本數(shù)字化的工作與經(jīng)歷,大體可以分為4個階段。

      1.1 第一階段:率先在國內嘗試將計算機應用于標本管理——建立植物模式標本管理系統(tǒng)(MSBS)

      20世紀60年代開始,國外就將計算機技術應用于植物標本的管理,主要用于簡單的植物類群檢索系統(tǒng)和列表;20世紀70年代中期,一些有代表性的植物研究單位的標本館根據(jù)各自的特點和優(yōu)勢獨立研發(fā),擴大標本信息的貯存和檢索功能,如密蘇里植物園的植物標本數(shù)據(jù)庫(1970s)、愛丁堡皇家植物園植物標本館的PANDORA項目(1986)、史密森研究院的植物標本數(shù)據(jù)庫(1970s)(Shetler, 1973; Pankhurst, 1993; 李鳴光, 2000)。在此國際發(fā)展大趨勢的背景下,伴隨著密蘇里植物園與我國簽署編寫Flora of China的合作協(xié)議的逐步實施,本標本館于1984年至1986年與南京工學院(現(xiàn)東南大學)生物醫(yī)學工程系聯(lián)合研發(fā)了植物標本計算機管理系統(tǒng),并利用該系統(tǒng)對125科290屬約2 000份模式標本進行了信息數(shù)字化(凌萍萍和湯儆杉, 1988)。這是我國標本館第一次嘗試開發(fā)的植物標本信息系統(tǒng),并開始標本數(shù)字化管理。

      該系統(tǒng)實現(xiàn)了植物標本信息的存貯、排序、查詢、檢索、增加和刪除等功能,顯著提高了植物標本(特別是模式標本)的管理水平。一方面避免了人工查閱標本造成的磨損,能更有效地保護標本,有利于標本的長期保存;另一方面又可準確、多次顯示植物標本的信息,避免因人工觀察和記錄造成所獲信息的誤差,尤其是在進行大量標本查閱和涉及的分類群較多時,人工查詢往往會產(chǎn)生各種差錯,而且工作量大。此外,實現(xiàn)了標本信息的異地查閱,可以大幅度節(jié)省研究費用,縮短查閱時長。

      由于技術的限制,當年所有標本信息首先采用人工登記(圖1),再通過人工將這些信息錄入計算機(微機)系統(tǒng)中。整個標本管理系統(tǒng)軟件是在IBM-PC/XT計算機和Lotus 1-2-3集成軟件基礎上開發(fā)的(圖2),資料數(shù)據(jù)的輸入工作以Lotus 1-2-3的編輯方式進行,輸入?yún)^(qū)、輸出區(qū)和標準查詢區(qū)的范圍用資料命令功能塊進行制作,而應用程序則用宏匯編進行編制。用戶可以通過顯示屏窗口查看數(shù)據(jù)庫的內容, 包括標本信息和操作程序,使得植物標本管理實現(xiàn)了計算機化。

      本館標本數(shù)字化最早使用的是美國國際商用機器公司(IBM)于1983年發(fā)布的個人電腦產(chǎn)品IBM PC/XT臺式計算機,這是當時比較先進的硬件設備,采取XT設計,使用了Intel的8088芯片,引入了標準的16位ISA總線以及采用了當時最新的英特爾80286處理器,硬盤為10 MB,預裝了DOS 2.0系統(tǒng),支持“文件”的概念,并以“目錄樹”形式存儲文件。這是硬盤第一次成為PC的標準配置。標本數(shù)據(jù)貯存器是5.25 in的軟磁盤(1.2 M),后期改用了3.5 in軟磁盤(圖3)。

      該系統(tǒng)將所有標本分別存放于11個信息庫中,每份標本信息包括(標本館)標本流水號,標本植物隸屬的科號、科名、屬名和種名,種名的異名或俗名,種名發(fā)表的原始文獻,標本采集的采集人、采集號、采集日期、產(chǎn)地、生境和海拔,植物的習性、葉、花、果、雄蕊、雌蕊、用途、分布,標本的模式類型等等,共30項信息。

      用戶可以調用任何一個庫中的標本信息,也可以隨時增加、刪除和修改這些信息,還可以根據(jù)需要對存放的標本信息進行檢索,不僅能對每份標本進行檢索,而且能從10個角度或方面查詢標本。例如:①植物種名發(fā)表的原始文獻;②植物標本隸屬的科、屬、種的名稱;③標本的采集人;④標本的產(chǎn)地;⑤標本的生境;⑥標本采集地的海拔高度;⑦植物的性狀;⑧花色;⑨模式類型;⑩植物用途。也可以采取多種或復合條件進行查詢,如查詢某人在某地、某生境下采集的某科草本植物標本,還可以對植物標本的科、屬、種的數(shù)目和標本份數(shù)進行統(tǒng)計。

      系統(tǒng)操作以“菜單”的選擇方式進行。先顯示出文件索引(調檔)、統(tǒng)計、檢索、排序、打印、貯存、編輯等主菜單;選擇了主菜單的某菜單項后,可點擊它,以顯示出下級的子菜單;再根據(jù)需要,在子菜單中進行選項操作;如此逐層往復,直至完成一次檢索,系統(tǒng)會返回到主菜單。系統(tǒng)易于掌握,使用方便。

      根據(jù)標本管理的要求,將植物標本管理軟件系統(tǒng)劃分為資料數(shù)據(jù)庫、表格圖形區(qū)和應用程序區(qū)3個主要部分:(1)資料數(shù)據(jù)庫可分為輸入、標準查詢和輸出3個區(qū),其中輸入?yún)^(qū)供用戶手工輸入每份標本的30項信息;標準查詢區(qū)供用戶建立欄位的查詢標準,以滿足用戶不同的查詢要求;輸出區(qū)供用戶顯示各種檢索結果,可在顯示器上視閱,也可打印輸出。(2)表格圖形區(qū)可將輸出的任意植物標本中每一項信息填入表格中,得到標本信息的表格形式,或者可將輸出的某些數(shù)據(jù)加以統(tǒng)計,獲得直觀的圖形顯示,這些表格或圖形也可打印輸出。(3)應用程序區(qū)供存放應用程序,應用程序將資料數(shù)據(jù)庫與表格圖形區(qū)聯(lián)系在一起,組成層狀疊套的“菜單”工作方式,使系統(tǒng)能按一定方式自動進行(圖2)。

      但是,限于當時的技術水平,該系統(tǒng)也有不足之處。一是系統(tǒng)使用的是英文;二是系統(tǒng)采用的Lotus集成軟件具有一定局限性,植物標本信息需分別存放于若干個庫中,使用前要根據(jù)所查詢標本所在的科或屬進行調庫,操作基本上按庫進行;三是打印信息只能按已編好的格式進行,而且用戶自行進行組織打印格式比較復雜;四是受限于當時的計算機容量等硬件條件,該系統(tǒng)只有標本的文字信息,缺乏標本的圖像信息,不能直觀地看到標本圖像。

      考慮到電子產(chǎn)品的性能具有一定不穩(wěn)定性和標本數(shù)據(jù)庫軟件系統(tǒng)的安全性,本館在進行標本數(shù)字化時首先將標本信息進行文字紙質記錄,以作為數(shù)字化信息的一種傳統(tǒng)備份形式。

      本館首次開展的標本數(shù)字化僅涉及模式標本。之所以如此,一是模式標本是一類比普通標本更加重要和特殊的標本,二是本館的模式標本是單庫另存,便于試點和操作。但是,如同所有標本館一樣,本館保存最多的標本是普通標本,對標本館的管理和標本查詢而言,更需要對普通植物標本信息進行數(shù)字化。然而,本館這一時期開發(fā)的標本數(shù)據(jù)庫未涉及普通標本。同時,此數(shù)據(jù)庫僅有標本的文本信息,而且數(shù)據(jù)庫開發(fā)尚未采用Internet技術——可使世界各地的用戶通過網(wǎng)絡直接查詢數(shù)據(jù)庫信息,能在更大范圍、更有效地實現(xiàn)標本信息資源共享。

      盡管如此,這項工作在我國具有開先河性,為本館以及我國植物標本館開展植物標本數(shù)字化建設奠定了基礎,而且本館植物模式標本數(shù)據(jù)庫(名為MSBS)也被美國IOPI網(wǎng)站收載。這是當時我國唯一一個被國外知名網(wǎng)站收載的植物標本信息管理系統(tǒng),說明該項工作跟上了國外標本館現(xiàn)代化管理的發(fā)展潮流。此后,我國其他部分植物標本館聞息或來訪交流后,逐漸開始了植物標本數(shù)字化軟件的開發(fā)工作??梢姳攫^在我國館藏標本數(shù)字化啟動階段中起到了示范或促進作用。

      1.2 第二階段:開始普通標本圖像數(shù)字化和標本數(shù)字化規(guī)范建設

      1.2.1 參與國家科技部首次啟動的植物標本數(shù)字化項目——館藏植物標本圖文信息系統(tǒng)建設 20世紀90年代,伴隨著數(shù)碼相機和掃描儀的興起,標本圖像數(shù)字化成為標本數(shù)字化的重要內容。此時,國外標本館愈加重視標本的數(shù)字化,不僅有了標本圖像信息,而且標本數(shù)字化的規(guī)模也越來越大。如阿拉巴馬大學于20世紀80年代末牽頭建設了美國東南部地區(qū)各小型標本館的植物標本信息系統(tǒng)SERFIS;1991年賓夕法尼亞州Carnegie博物館開始建設植物標本數(shù)據(jù)庫;20世紀90年代初加利福尼亞大學Berkeley分校牽頭的美國西部地區(qū)加利福尼亞植物標本管理系統(tǒng)SMASCH等。在此期間,本館在原有數(shù)據(jù)庫基礎上,開始普通標本的數(shù)字化工作,同期國內其他植物標本館也紛紛開始建立自己的標本數(shù)字化軟件系統(tǒng),如1994年中山大學植物標本館與美國阿拉巴馬大學合作研制植物標本數(shù)據(jù)庫,1995年中國科學院華南植物研究所標本館開始嘗試建立植物標本館數(shù)據(jù)庫,1997年在國家自然科學基金的資助下,中山大學標本館與廣西植物研究所標本館聯(lián)合研制共享標本數(shù)據(jù)庫。與此同時,中國科學院植物研究所標本館也開始研發(fā)植物標本管理系統(tǒng)。

      20世紀90年代末,科技部首次啟動標本數(shù)字化建設項目。1999年科技部基礎司同時資助了與植物標本館的標本數(shù)據(jù)庫有關的4個基礎性工作項目(由華東地區(qū)的江蘇省中國科學院植物研究所、華南地區(qū)的中山大學、西南地區(qū)的四川大學和東北地區(qū)的東北師范大學等單位承擔),并加以合并,形成由4個單位共同參與建設的“植物標本信息系統(tǒng)”項目,本館為參與單位之一。同年12月,科技部在中山大學主持召開了由廣東省科委、4個參建單位以及特邀的中國科學院植物研究所和華南植物研究所等單位的領導和科研人員(共36人)參加的專題討論會,以期統(tǒng)一數(shù)據(jù)庫的規(guī)范,為今后數(shù)據(jù)共享打下基礎,建成的信息系統(tǒng)可以在全國通用。會上同時演示了中山大學基于Access系統(tǒng)軟件和中國科學院植物研究所基于Foxfro系統(tǒng)軟件各自開發(fā)的植物標本信息系統(tǒng)數(shù)據(jù)庫,2個軟件平臺各有利弊,但都能適應或滿足當時的發(fā)展需求,會議最后確定各單位可以根據(jù)自身需要任選其中之一。這次會議標志著植物標本數(shù)字化以及建立信息系統(tǒng)平臺引起了國家的重視,并有意向標準化、共享和普及推進,成為后來國家科技部啟動植物標本標準化整理、整合及共享平臺項目的基礎。

      隨后,項目組以中山大學生命科學學院標本館為主,聯(lián)合研制了植物標本信息共享數(shù)據(jù)庫,并擬定了植物標本信息錄入內容的試行標準,以及可選項及其錄入內容。

      在該項目支持下, 本館以此系統(tǒng)為基礎開展了館內普通植物標本的數(shù)字化——標本文本和圖像數(shù)字化,其中植物標本數(shù)據(jù)庫的錄入系統(tǒng)采用的是“植物標本信息系統(tǒng)4.4”(李鳴光, 2000),共完成了4萬份普通標本信息的錄入,包括標本的文字信息和圖像信息,并采用光盤和硬盤保存。為了保證數(shù)據(jù)的安全,所有數(shù)據(jù)分別采用了系統(tǒng)、光盤和硬盤的雙備份(圖4)與之前本館開發(fā)的植物模式標本數(shù)據(jù)庫相比,本數(shù)據(jù)庫具有如下的特點和改進:(1)為了適應我國各標本館仍以個人電腦為主的現(xiàn)狀,該數(shù)據(jù)庫基于個人電腦,并以微軟公司的Access軟件為平臺開發(fā)。(2)除了進行標本文字信息數(shù)字化,還對標本圖像進行數(shù)字化(數(shù)碼圖像),但受限于當時數(shù)碼相機的成像技術,圖片像素只有300萬。(3)標本信息中增加了標本鑒定的歷史記錄,即將標本上不同時期的所有鑒定標簽信息(包括學名、鑒定人和鑒定時間)均全部錄入數(shù)據(jù)庫。(4)數(shù)據(jù)庫服務器軟硬件配置有了明顯的提升。此時已有了Microsoft windows 2000 server version網(wǎng)絡服務器操作系統(tǒng)、Microsoft SQL Server數(shù)據(jù)庫管理系統(tǒng)、雙硬盤的服務器等,同時數(shù)據(jù)保存條件也有了極大改進,存貯性能和容量有明顯提高(如光盤和移動硬盤)。(5)新開發(fā)的標本數(shù)據(jù)庫是教學和科研兩大系統(tǒng)的多個單位合作形成的,兼顧多方需求和特點,適應性強,便于推廣使用。

      1.2.2 參與中國科學院的生物標本信息系統(tǒng)建設項目——江蘇省中國科學院植物研究所植物標本數(shù)據(jù)庫建設 2000年,中國科學院生物局開展了生物標本館網(wǎng)絡建設項目。本館作為參與建設單位承擔了本所標本館網(wǎng)絡信息系統(tǒng)建設任務,其中植物標本數(shù)據(jù)庫建設作為獨立的部分,重點是進行標本數(shù)字化。由于該項目恰巧與科技部的“標本館基礎設施維修改造及信息網(wǎng)絡建設”項目相銜接或相近,因此實際上這2個項目有部分套合,但又有所改進。

      在該項目的錄入工作中,標本文字信息或數(shù)據(jù)項共有20個:標本館代碼、標本流水號(臺紙?zhí)枺?、拉丁科名、拉丁屬名、拉丁種名、種下等級拉丁名、定名人、模式標本類型、采集人、采集號、采集時間、采集地[包括國家、省、縣、具體采集地(如鄉(xiāng)鎮(zhèn)、水系、山體、景區(qū)等)]、生境、海拔、經(jīng)度、緯度、鑒定人、鑒定日期、標本照片、備注等。此外,數(shù)據(jù)庫中的標本信息還包括圖像信息,其中普通標本每個物種(包括種下等級)須包括1張標本整體實物照片,模式標本原則上須附1張標本整體實物照片。

      在該項目的支持下,本館共完成了8萬份標本的數(shù)字化,包括館藏模式標本、蕨類植物和裸子植物兩大類群的全部標本以及被子植物部分科的部分標本。每份標本附圖片1張, 并且每份標本附有唯一的條形碼,而標本圖片與文字數(shù)據(jù)通過標本條形碼一一對應。通過該項目,本館初步建設了具有一定規(guī)模的植物標本信息數(shù)據(jù)庫,并且該數(shù)據(jù)庫可通過網(wǎng)絡進行標本信息查詢。

      此次開展的標本數(shù)字化項目,與前述的兩次數(shù)據(jù)庫建設相比,在如下幾方面有不同或改進。

      (1)在標本信息內容上有別于其他標本館:① 將館代碼編入標本條形碼中,即館代碼+8位數(shù)字編碼,如NAS00003450,以便與其他標本館的標本區(qū)別或進行網(wǎng)絡平臺檢索時能區(qū)分出本館的標本;② 增加了本館的標本流水號(即臺紙編號),因為本館的標本臺紙流水號在館內是唯一的,而且流水號的先后次序表明每一份標本裝訂時的先后時間和次序,可以從一個側面反映標本入館的時期和館藏的歷史階段;③ 增加了備注,用以記錄標本上采集信息和鑒定信息以外的其他文字說明,以及錄入標本信息時需要對標本進行必要的補充說明。

      (2)標本信息全部提供給中國科學院的標本信息網(wǎng)絡平臺,供網(wǎng)絡查詢。

      (3)標本實物采用數(shù)碼相機進行拍攝記錄,圖片的像素達到500萬。但根據(jù)網(wǎng)絡平臺要求,限于平臺的容量,真正上網(wǎng)的圖片經(jīng)過壓縮,僅有200 K。

      (4)第一次采取了館內與館外、在職與非在職人員相結合的方式共同開展和完成相關工作。

      (5)本館標本的保存采用的是具軌集裝箱式密集柜方式,并且標本庫內空間有限,標本數(shù)字化不宜在庫內隨取隨錄,需在庫外進行。因此,為了最大限度地保護標本,減少標本移動次數(shù),在標本的鑒定基礎上,采取標本整理與標本圖像拍攝合一、標本文字信息直接錄自標本圖片、文字信息校對直接參照標本圖像信息的做法。只有當錄入信息有誤時,才按條形碼回庫查找標本。

      (6)結合標本數(shù)字化,對館內標本加強了精細化管理。在此次標本數(shù)字化的過程中,除了對尚無種名的已裝訂標本集中進行物種鑒定,還對館內已有種類鑒定信息的標本進一步精細化管理,重點開展了4個方面的工作: ① 對標本上原有信息進行審核認定,查閱有關資料,弄清每個信息的來源和正誤,包括標本上文字的書寫辨析和確認;② 結合標本鑒定和標本圖像采集,對館內標本進行全面的次序整理,對于錯誤鑒定的標本,根據(jù)新定種名進行必要的位置調整;③ 對于破損標本進行補救,尤其是有一些老標本使用頻率高,加上早期保存條件有限,急需補損補缺;④ 對于早期標本的采集信息,由于記載簡約、地名更替、記錄丟失等不同歷史原因,重點進行了查考。

      (7)由于標本信息數(shù)據(jù)量大,這些信息的保存開始采用了DVD光盤和大容量移動硬盤。

      1.3 第三階段:植物標本批量數(shù)字化與信息共享平臺的快速發(fā)展時期

      1.3.1 參與科技部的“植物標本標準化整理、整合及共享平臺建設”項目(I期) 2004至2008年,本館參加了國家科技部項目“植物標本標準化整理、整合及共享平臺建設”(I期)。對于本館而言,這是標本數(shù)字化的第三階段。

      經(jīng)過近10年的發(fā)展,我國各個標本館的標本數(shù)字化軟件和硬件條件都得到了改善,植物標本信息系統(tǒng)開發(fā)也逐漸成熟。在此期間,科技部更是積極推進這項事業(yè)。在1999年啟動了“植物標本信息管理系統(tǒng)”項目之后,2000年又在四川大學主持召開了“實物數(shù)據(jù)共享研討會”,在原有參與單位的基礎上增加了中國科學院動物研究所、中國科學院細胞研究所、中國醫(yī)學科學院基礎醫(yī)學研究所和中國地質大學4個單位。本館參與了該會議。此會為科技部提出“植物標本標準化整理、整合及共享平臺建設”項目做了充分的準備。

      本館作為重要的參與單位之一參加了該項目。在此期間,根據(jù)項目的要求,標本數(shù)字化采用的是中國科學院植物研究所生態(tài)中心包伯堅先生等人研發(fā)的輸錄軟件系統(tǒng)——植物標本數(shù)據(jù)管理軟件(網(wǎng)絡版) Davidia 2.0及Davidia 3.0(圖5),將植物標本的采集信息、鑒定信息以及標本的圖像信息進行了數(shù)字化。在此期間,本館共完成了30萬份普通標本的數(shù)字化。所有標本的數(shù)據(jù)(文字和圖像)均提交至項目管理和共享平臺中心,其中本館的圖像數(shù)據(jù)均采用移動硬盤保存。

      1.3.2 繼續(xù)參加“植物標本標準化整理、整合及共享平臺建設”項目(Ⅱ期) 從2009年至今,本館繼續(xù)參與了科技部的標本數(shù)字化項目(Ⅱ期),并成為國家數(shù)字植物標本館(CVH)平臺建設的主要標本館之一。通過該平臺,本館完成的數(shù)字化標本信息向社會公開,并借以此平臺與教學平臺和保護區(qū)平臺合并后構建的國家標本資源共享平臺NSII,進一步擴大了這些標本的共享范圍和價值。

      從2009至2012年,本館標本數(shù)字化錄入采用的是中國科學院植物研究所包伯堅等人研發(fā)的植物標本錄入查詢軟件Ginkgo 3(單機版)以及后期的在線錄入信息系統(tǒng),繼續(xù)對普通標本進行數(shù)字化。其中本館于2010年后開始在以往開展標本數(shù)字化的基礎上,對原有數(shù)據(jù)進行補充和修訂,以及數(shù)據(jù)庫的維護和升級。2013年開始,重點開展了下列多類標本的圖文數(shù)字化,包括全部單子葉類群的標本、西藏植物專項采集的標本、新編《江蘇植物志》連續(xù)多年普查的標本、鄔文祥先生家人捐贈的標本、薔薇科和菊科新鑒定的標本,以及近年新采集的標本。在此期間共完成12.5萬份標本的數(shù)字化。此時標本圖像的拍攝設備有了很大改善(圖6),圖片的像素和質量都有了進一步的提升。

      1.4 第四階段:植物標本數(shù)字化信息的維護與優(yōu)化

      時至今日,本館已數(shù)字化的標本共約50萬份,其中包括蕨類植物39科2.06萬份、裸子植物10科6 951份、被子植物230科47.24萬份,其中模式標本4 000余份。但是,本館的標本數(shù)字化工作遠沒有結束,其中重要的工作之一就是對已經(jīng)數(shù)字化的標本信息進行維護和優(yōu)化,尤其對于早期數(shù)字化的標本,或作信息補充、糾正,或進行圖像更新等。這是本館植物標本數(shù)字化建設的最重要階段,也是今后相當長一段時間內的重點工作。

      1.4.1 館藏植物模式標本高精度數(shù)字化 20世紀80年代,本館的植物標本數(shù)字化工作始于模式標本的數(shù)字化。但彼時植物標本數(shù)字化工作屬于起步階段,有許多不完善:一是僅記錄了標本采集和鑒定的文字信息;二是尚無標本圖像信息;三是僅對少量標本進行了數(shù)字化信息采集。

      隨著本館標本數(shù)字化的不斷深入和硬件設備的改進,在開展“植物標本標準化整理、整合及共享平臺建設”項目的同時,另行專項重新對館藏植物模式標本進行了數(shù)字化——標本圖像高精度數(shù)字化。此次數(shù)字化工作,采用了共享平臺提供的、量身定做的標本掃描儀采集圖像信息(圖7),像素可達到6 000萬。在該項目的支持下,共完成了4 000份模式標本的高精度數(shù)字化。此次模式標本圖像數(shù)字化是在第一次模式標本數(shù)字化基礎上的升級版,無論在模式標本的數(shù)量上還是在圖像質量上都有了全面的提升,極大提高了模式標本的利用效率和價值。

      與第一次模式標本數(shù)字化工作相比,有2個重要進展:一是所有的標本都進行了高像素的掃描;二是所有標本都按種類附上新種發(fā)表原始文獻的掃描版(圖8)。同時還有兩個特點:一是采用了掃描儀獲取圖像信息,像素精度有了極大提高;二是每份標本既有高像素的標本圖片,也有新種發(fā)表原始文獻的圖片,完全不同于普通標本的數(shù)字化。

      1.4.2 館藏標本早期數(shù)字化信息與圖像的更新優(yōu)化 本館標本數(shù)字化起步比較早,開展圖像數(shù)字化的時間跨度也比較長,館內保存的不同時期的數(shù)字化標本圖像在質量上存在很大差異。相比之下,早期拍攝的圖片質量普遍不佳,像素較小、分辨率低,主要是當時的數(shù)碼相機分辨率不高,同時與標本拍攝經(jīng)驗和拍攝條件有關,但這部分照片的數(shù)量有限。就數(shù)碼相機而言,從當初的富士、柯達,到現(xiàn)在使用的Canon 5DSr,其中經(jīng)歷了多代更新,像素分辨率從原來的100萬到目前的5 000萬,相差50倍。此外,早期數(shù)碼相機拍攝的標本照片,雖然原圖清晰,但放大后部分細微結構的清晰度已遠不如當今高清晰的數(shù)碼相機。由于現(xiàn)在拍攝條件有了很大的改善,對于早期拍攝的少量標本進行必要的復拍。

      與上相似,本館的標本數(shù)字化經(jīng)歷了不同發(fā)展時期、采用不同數(shù)據(jù)庫及其標準,一些條目和規(guī)定有一定的差異,加之本館保存的許多早期采集的標本的信息甄別和錄入比較困難,諸如手寫文字不易辨認(主要源于手寫字體不規(guī)整、不規(guī)范或潦草,還因標本年代久遠而字痕變淡),非英文的外文采集信息難以辨識和錄入,紀年隨時代和個人習慣變更而不同,地名隨時代變更而變得難以考證等等,導致有些標本信息需要考證或糾正。這些數(shù)據(jù)錯誤中,除少量采集人、鑒定人名錯誤能夠通過批量處理來修改以外,其他均需人工校對,投入更多時間,提高早期數(shù)據(jù)的質量。

      1.4.3 開展全國江蘇標本信息的專家核查 中國國家標本網(wǎng)絡平臺的標本數(shù)據(jù)來自國內各個研究單位和教學單位的標本館/室,參與人員廣泛,標本來源復雜,標本信息質量難免參差不齊,需要提高準確率。作為我國國家標本網(wǎng)絡平臺標本信息數(shù)據(jù)的主要參建單位之一,理應在這方面有所貢獻;身為華東及江蘇的標本館,更應該加強江蘇標本的核查。近年來,本館除了繼續(xù)推進庫存標本數(shù)字化工作,還開始對包括本館早期錄入在內的、網(wǎng)絡平臺上已有(含國內其他標本館錄入)的江蘇標本信息進行清理與核查,例如,2021年起我館開展了NSII平臺中江蘇地區(qū)全部標本數(shù)據(jù)的專家核查工作(不含花果、樹皮等非主要檢索性狀),對其進行清理校對。一方面用以支持區(qū)域植物學、生物多樣性等方面的研究工作,另一方面可指導本館后續(xù)的標本采集與數(shù)字化的方向。

      2 本館標本數(shù)字化的深化與利用

      截止到2018年,本館標本數(shù)字化工作僅局限于將標本圖片數(shù)字化,以及采集和鑒定的文本信息數(shù)字化。但對于植物研究者來說,這些工作及其信息有一定的局限性;對于標本館的數(shù)字化管理而言,這些工作和信息有待完善和提高。有鑒于此,根據(jù)館內標本收藏特點和數(shù)字化現(xiàn)狀,本館從2018年開始,在對余下的標本繼續(xù)進行常規(guī)標準的圖文數(shù)字化的同時,加強了標本數(shù)字化的信息深化工作,重點對已有數(shù)字化的標本信息進行發(fā)掘與利用。

      2.1 開展江蘇省標本數(shù)字化網(wǎng)絡平臺建設——省級數(shù)字標本館

      2018至2019年,本館參加了NSII平臺的省級數(shù)字植物標本館聯(lián)盟,籍于此創(chuàng)建了省級數(shù)字植物標本館Web平臺(簡稱PVH)(圖9),為開展本省植物研究的研究者提供植物名錄的編輯與維護,以及名錄參考的標本庫、圖像庫、文獻庫的在線維護與管理等服務,形成開放式的區(qū)域植物學研究平臺。其要點:一是根據(jù)新版《江蘇植物志》(2013—2015)與文獻,整理并上傳江蘇植物基礎名錄(每種均有出處),包括蕨類植物、裸子植物和被子植物共計235科1 240屬3 494種;二是對所有植物種類的憑證標本進行了審核,共計14.9萬份,其中對2 037種指定了2 804份憑證標本;三是開展了江蘇植物的原色圖像庫建設,并上傳了1 318種的彩色圖片共計4 182張。

      2.2 開發(fā)江蘇植物時空分布可視化軟件

      為了利用標本館數(shù)字化建設的優(yōu)勢,為植物研究者提供更加豐富的地方性植物分布信息,為地方建設發(fā)揮應有的作用,在上述工作的基礎上,本館開展了江蘇地區(qū)植物時空分布規(guī)律與變化的分析,同時與軟件公司合作,開發(fā)了標本時空分布的可視化軟件——維管植物標本時空分布可視化系統(tǒng)(圖10)。目前,該軟件的制作已經(jīng)完成。將校準、“清洗”過的標本數(shù)據(jù)導入軟件后,可以實現(xiàn):(1)在指定時間段內,基于標本采集數(shù)量和物種數(shù),估算出實際物種數(shù)量,并投射在本省的網(wǎng)格化地圖上;(2)可對比指定的兩個時間段內各網(wǎng)格化區(qū)域中物種數(shù)量的增減;(3)可展示各時間段中各科的占比。

      3 開展標本采集—入庫全過程數(shù)字化

      為了加強館內工作暨標本的信息化管理,從2019年開始,本館開始采用時任中國科學院昆明植物研究所標本館館員的徐洲鋒工程師開發(fā)的“Biotracks”手機App、“標本館助手”和“Kingdonia”系列軟件,實現(xiàn)野外標本采集至入庫全過程的標本信息化管理(圖11)。

      本館的做法大體如下:(1)在野外采集標本的同時,應用“Biotracks”手機App同步記錄采集信息,包括采集的時間、地點和地理坐標,以及采集人、采集號和植物性狀信息,還有采集軌跡和同步拍攝的植物數(shù)碼照片(每份標本的實物及其生境);壓制標本時,可補充野外記錄以及相關標注(如留存DNA樣本)。這些信息可同步到服務器,同時整理所有數(shù)碼照片至按標本采集號命名的文件夾。(2)標本鑒定后,自“Biotracks”下載當次野外采集全部記錄,生成Excel文本,錄入相應鑒定信息,并使用“標本館助手”程序,將其統(tǒng)一為DarwinCore格式的表格,并轉換為打印格式,打印一份留作采集記錄存檔,另外根據(jù)采集份數(shù)打印帶條碼格式的采集-鑒定合并記錄簽。(3)標本經(jīng)裝訂和再次冷凍殺蟲后,即可入中轉庫,進行數(shù)碼照片的拍攝。標本采集信息通過“標本館助手”轉化,生成Kingdonia可讀取格式后,上傳至Kingdonia標本管理平臺的緩沖區(qū),即可與上傳至Kingdonia的標本照片自動識別及匹配。標本數(shù)據(jù)經(jīng)人工審核與校錯后,便可以釋放至公共數(shù)據(jù)庫,也可以其他格式導出保存,提交或共享至其他平臺。目前,由于本館原采集數(shù)據(jù)關鍵檢索詞的分割方式與Kingdonia平臺不同,且舊數(shù)碼相片的像素無法滿足平臺自動識別與關聯(lián)的要求,需要大量人工處理的工作,目前這部分工作尚在進行中。

      Kingdonia平臺除了能讓標本采集至入庫的流程更系統(tǒng)化以外,也可添加標本對應的野外照片,并自動關聯(lián)“Biotracks”中野外記錄標本信息時拍攝的照片。這就為標本查閱者提供了該植物更翔實豐富的外部形態(tài)信息,也可作為文本信息中“生境”信息的補充。同時,Kingdonia與“標本館助手”的配套使用也為標本提供了庫區(qū)內定位的功能,能夠通過在庫內掃描網(wǎng)格二維碼及標本條形碼,來標注標本在庫區(qū)內的位置及出入庫情況,避免了過去清理和借還標本時因疏漏而導致標本無法查找乃至遺失的問題。這項工作的開展,極大提高了標本管理的效率。由于本館標本數(shù)量較大,因此目前該工作正在起步階段。

      4 結論

      本館是我國開展植物標本數(shù)字化最早的標本館,也是我國最有代表性的植物標本館, 標本數(shù)字化工作前后經(jīng)歷了四個發(fā)展階段,包括20世紀80年代末嘗試標本文字信息數(shù)字化的起步階段,20世紀90年代末的標本圖像數(shù)字化和文字信息數(shù)字化規(guī)范階段,2004年后的標本批量信息化以及信息網(wǎng)絡共享的快速發(fā)展階段,以及2018年后的已有標本數(shù)字化信息維護與優(yōu)化階段,其中第一個階段對我館的數(shù)字化建設有著重要的意義,是國內其他標本館未經(jīng)歷過的。作為我國植物標本數(shù)字化網(wǎng)絡平臺(CVH和NSII)建設的重要單位之一,本館進行的數(shù)字化標本信息已經(jīng)共享于平臺,而且也開始數(shù)字化標本信息的深化工作。但是,截至目前,數(shù)字化工作主要局限于將標本圖片和文本信息的數(shù)字化,國內其他標本館也幾乎類似。從標本館的數(shù)字化管理和開展的研究看,仍存在一些不足和問題,例如:(1)標本文本信息化過程中標準化程度不高,導致關鍵詞檢索匹配度較低,甚至出現(xiàn)錯誤;(2)標本采集制作過程中,更多有價值的信息未錄入數(shù)據(jù)庫,包括采集時拍攝的大量生境、伴生植物和植物分類特征細節(jié)等的數(shù)碼照片,無法展現(xiàn)給查閱者;(3)目前的數(shù)字化工作并未備注其在實體館中的位置,無法實現(xiàn)館內庫區(qū)的信息化管理;(4)可提供數(shù)據(jù)統(tǒng)計分析的平臺尚未完善,不足以支撐更多的應用需求。由此可見,時至今日,雖然本館的館藏標本數(shù)字化工作從館藏量上看已近完成,但是標本數(shù)字化的工作仍任重道遠,不僅尚有部分標本(與之前已數(shù)字化的標本相比在信息完善上往往要花費更多的時間和精力)未及時進行數(shù)字化,而且標本數(shù)字化信息的維護、優(yōu)化、發(fā)掘、利用則剛剛開始。

      致謝 本館植物標本數(shù)字化工作得到標本館和信息中心許多同仁的參與和幫助,如劉心恬高級實驗師作為早中期階段的主要成員負責了數(shù)據(jù)的整理與核查;鄧懋彬研究員為該項工作鑒定了大量的標本,解決了許多信息錄入過程中的書寫疑問;姚淦工程師和徐增萊研究員在后期階段的標本信息錄入過程中,在疑難標本的鑒定以及文字識別方面給予了很多幫助;陳岳高級工程師隨時解決軟硬件出現(xiàn)的問題;熊豫寧和馬振秀參與標本的整理,做了大量工作。正因為上述各位的大力協(xié)助,使得本館的標本數(shù)字化得以順利開展,在此一并表示誠摯的感謝。

      參考文獻:

      LI MG, 2000. Plant specimen information system 4.4: system management [J]. Acta Sci Nat Univ Sunyatseni, 2: 29.? [李鳴光, 2000. 植物標本信息系統(tǒng)4.4: 系統(tǒng)管理 [J]. 中山大學學報(自然科學版), 2: 29.]

      LI MG,MIAO RH, XU ZR, et al., 2000. Plant specimen database and biodiversity research [M]// Biodiversity Community, Chinese Academy of Sciences. Biodiversity conservation in China facing the 21st century. Beijing: China Forestry Press: 450-454.? [李鳴光, 繆汝槐,? Zhaoran XU, 2000. 植物標本數(shù)據(jù)庫與生物多樣性研究 [M]//中國科學院生物多樣性委員會. 面向21世紀的中國生物多樣性保護. 北京: 中國林業(yè)出版社: 450-454.]

      LI MG, XU ZR, GUAN DF, et al., 1995. Conceptual issues in the development of English-Chinese bilingual botanical databases [J]. Acta Sci Nat Univ Sunyatseni, 34(4): 76-81.? [李鳴光, Zhaoran XU, 關朵霏, 等, 1995. 植物標本漢英雙語數(shù)據(jù)庫管理系統(tǒng)的概念與實踐 [J]. 中山大學學報(自然科學版), 34(4): 76-81.]

      LING PP, TANG JS, 1988. The microcomputer management system of specimens in Jiangsu Institute of Botany [M]//Bulletin of Nanjing Botanical Garden Mem. Sun Yat-Sen 1987. Nanjing: Jiangsu Technology and Science Press: 39-42.? [凌萍萍, 湯儆杉, 1988. 江蘇省植物研究所微型計算機植物標本管理系統(tǒng) [M]//南京中山植物園研究論文集1987. 南京: 江蘇科學技術出版社: 39-42.]

      MA B, LI ML, LIU JK, et al., 2001. The construction of Sichuan University botanical specimen database [J]. J Sichuan Univ (Nat Sci Ed), 38(6): 839-843.? [馬波, 李夢龍, 劉冀昆, 等, 2001. 四川大學植物標本館館藏標本網(wǎng)絡數(shù)據(jù)庫的構建 [J]. 四川大學學報(自然科學版), 38(6): 839-843.]

      PANKHURST R, 1993. Taxonomic databases: the PANDORA System [M]//FORTUNER R. Advances in computer methods for systematic biology. Baltimore: The Johns Hopkins University Press: 229-590.

      SHETLER SG, 1973. An introduction to the botanical type specimen register [M]. Washington: Smithsonian Institution Press: 1-25.

      SOBEEON J, 1999. Linking biodiversity information sources [J]. Trends Ecol Evol, 14: 291.

      WANG LS, CHEN B, JI LQ, et al., 2010. Progress in biodiversity informatics [J]. Biodivers Sci,18(5): 429-443.? [王利松, 陳彬, 紀力強, 等, 2010. 生物多樣性信息學研究進展 [J]. 生物多樣性, 18(5): 429-443.]

      XU PG, 1992. The first biological research institute in China [J]. Chin Mater Sci Technol, 13(2): 47-57.? [薛攀皋, 1992. 中國科學社生物研究所——中國最早的生物學研究機構 [J]. 中國科技史料, 13(2): 47-57.]

      (責任編輯 蔣巧媛 鄧斯麗)

      猜你喜歡
      江蘇省數(shù)據(jù)庫數(shù)字化
      家紡業(yè)亟待數(shù)字化賦能
      江蘇省交通圖
      江蘇年鑒(2021年0期)2021-03-09 05:19:44
      高中數(shù)學“一對一”數(shù)字化學習實踐探索
      高中數(shù)學“一對一”數(shù)字化學習實踐探索
      江蘇省政區(qū)圖
      江蘇年鑒(2018年0期)2019-01-10 05:32:22
      數(shù)據(jù)庫
      財經(jīng)(2017年2期)2017-03-10 14:35:35
      數(shù)字化制勝
      數(shù)據(jù)庫
      財經(jīng)(2016年15期)2016-06-03 07:38:02
      數(shù)據(jù)庫
      財經(jīng)(2016年3期)2016-03-07 07:44:46
      數(shù)據(jù)庫
      財經(jīng)(2016年6期)2016-02-24 07:41:51
      盐池县| 阿瓦提县| 钟祥市| 那曲县| 化隆| 新田县| 来凤县| 博白县| 中宁县| 涡阳县| 澜沧| 松溪县| 桦南县| 桦川县| 甘泉县| 高要市| 抚松县| 商城县| 托克托县| 辉南县| 仪陇县| 鱼台县| 浮山县| 宾阳县| 青龙| 许昌市| 泸定县| 通州区| 邳州市| 龙门县| 揭阳市| 丹寨县| 新疆| 新丰县| 兴业县| 鸡西市| 万载县| 公安县| 浦城县| 龙陵县| 五家渠市|