劉慧圓 陳天翔 韓國霞 李奕 李榮貴 李敏 許哲平 覃海寧
摘 要:? 作為國家標(biāo)本資源共享平臺主要的子平臺和最早的共享網(wǎng)站,植物標(biāo)本子平臺及其共享網(wǎng)站“中國數(shù)字植物標(biāo)本館(CVH)”的發(fā)展經(jīng)歷了試點期、發(fā)展期、驗收考核期、整改服務(wù)期和創(chuàng)新發(fā)展期5個時期。植物子平臺和CVH的建設(shè)組織100多家標(biāo)本館完成近800萬份標(biāo)本的數(shù)字化表達和實現(xiàn)網(wǎng)上共享。這一成果對我國分類學(xué)研究、生物多樣性保護以及生物信息的發(fā)展等起到了重要作用,植物子平臺和CVH也成為全國生物多樣性信息共享合作的重要項目和平臺。參建標(biāo)本館數(shù)字化建設(shè)能力得到提升,基本實現(xiàn)了信息化現(xiàn)代化的管理。
關(guān)鍵詞: 植物標(biāo)本, 數(shù)字化, 植物學(xué)數(shù)據(jù)庫, 分類學(xué), 生物多樣性保護, 信息學(xué), 合作項目, 標(biāo)本館現(xiàn)代化管理
中圖分類號:? Q94
文獻標(biāo)識碼:? A
文章編號:? 1000-3142(2022)增刊1-0003-15
收稿日期:? 2022-09-20
基金項目:? 國家植物標(biāo)本資源庫 (E0117G1001)。
第一作者: 劉慧圓(1982-),博士,工程師,主要從事植物地理、生物多樣性保護和科學(xué)數(shù)據(jù)研究,(E-mail)liuhy@ibcas.ac.cn。
通信作者:? 覃海寧, 博士, 主要從事植物分類學(xué)、生物多樣性信息化和生物多樣性保護研究,(E-mail )hainingqin@ibcas.ac.cn; 許哲平, 博士, 副研究館員, 主要從事科學(xué)數(shù)據(jù)、 科技情報和開放科學(xué)研究, (E-mail)xuzp@mail.las.ac.cn。
On the history and function of? the Plant Specimen Sub-
Platform and Chinese Virtual Herbarium (CVH)
LIU Huiyuan1, CHEN Tianxiang1, HAN Guoxia1, LI Yi, LI Ronggui1,
LI Min1, XU Zheping2,3,4*, QIN Haining1*
( 1. State Key Laboratory of Systematic and Evolutionary Botany, Institute of Botany, Chinese Academy of Sciences, Beijing 100093, China;
2. Key Laboratory of Intelligent Information, National Science Library, Chinese Academy of Sciences, Beijing 100190, China; 3. Key Laboratory of New
Publishing and Knowledge Services for Scholarly Journals, Beijing 100190, China; 4. School of
Economics and Management, University of Chinese Academy of Sciences, Beijing 100190, China)
Abstract:? The development history of Plant Specimen Sub-Platform (PS-SP) and its sharing website CVH can be defined as five phases i.e. testing, development, acceptance, improvement and innovation phase. The accomplished of PS-SP and CVH has brought the achievement of nearly eight million digitized herbarium specimens, and all are available online, through which they play? important roles to the national phytotaxonomy, bioinformatics and biodiversity conservation. Furthermore, PS-SP and CVH have been act as a botanical collaborative network at national level, and the participant herbaria benefit a lot for their modernization management and capacity building, etc.
Key words: herbarium specimens, digitization, botanical database, taxonomy, biodiversity conservation, bioinformatics, collaborative project, herbarium modernization management
我國植物(生物)標(biāo)本數(shù)字化及其信息共享工作自20世紀(jì)80年代末啟動至今的30余年間取得了長足發(fā)展。大多數(shù)植物標(biāo)本館館藏實現(xiàn)了數(shù)字化,共有1 000多萬份標(biāo)本通過網(wǎng)站實現(xiàn)共享,有力支撐了分類學(xué)等相關(guān)科學(xué)研究和我國政府制定生物多樣性保護對策及國際履約,并在國家層面建立了生物物種信息數(shù)字化合作平臺。上述成就的取得主要得益于20世紀(jì)90年代末科技部啟動的由江蘇省中國科學(xué)院植物研究所和數(shù)所主要大學(xué)共同建設(shè)的“植物標(biāo)本信息系統(tǒng)”項目、21世紀(jì)初中國科學(xué)院實施的“中國科學(xué)生物標(biāo)本館網(wǎng)絡(luò)信息系統(tǒng)建設(shè)”項目以及(科技部)國家科技基礎(chǔ)條件平臺(簡稱“總平臺”)項目“國家標(biāo)本資源共享平臺建設(shè)”等數(shù)個重要項目的實施(許哲平等,2012;劉啟新等,2022)。以總平臺資助項目“國家標(biāo)本資源共享平臺”為例,在15年間(2004—2019,包括2009—2011驗收認定考核期)通過組織植物、動物、教學(xué)、自然保護區(qū)、巖礦化石和極地6個標(biāo)本子平臺(課題)建設(shè),共完成全國200余家單位近1 500萬份自然科學(xué)標(biāo)本(藏品)的數(shù)字化,包含1 000多萬份植物標(biāo)本和370萬份動物標(biāo)本,并通過項目網(wǎng)站及各個子平臺共享網(wǎng)站,如植物標(biāo)本子平臺(Plant Specimen Sub-Platform, PS-SP)(簡稱植物子平臺)的中國數(shù)字植物標(biāo)本館(Chinese Virtual Herbarium,www.cvh.ac.cn,CVH)實現(xiàn)信息在線共享。
2019年,科技部、財政部發(fā)布關(guān)于國家科技資源共享服務(wù)平臺優(yōu)化調(diào)整結(jié)果的通知(國科發(fā)基〔2019〕194號)。該通知對原有國家平臺進行優(yōu)化調(diào)整,確定成立包括“國家植物標(biāo)本資源庫”“國家動物標(biāo)本資源庫”和“國家?guī)r礦化石標(biāo)本資源庫”等在內(nèi)的30個國家生物種質(zhì)與實驗材料資源庫。至此,植物子平臺和CVH 作為官方(課題)名稱完成了歷史使命。
CVH作為國家標(biāo)本資源共享平臺,是國內(nèi)上線時間最早、數(shù)據(jù)量最大、受眾面最廣的信息共享網(wǎng)站,植物子平臺作為國家標(biāo)本資源共享項目最主要的課題,對整個項目實施乃至全國植物標(biāo)本規(guī)范化整理、數(shù)字化表達、信息共享和數(shù)字化隊伍建設(shè)及協(xié)作網(wǎng)絡(luò)搭建等發(fā)揮了重要作用。本文及本期的陳天翔等(2022)兩篇文章通過對歷史資料的梳理,對植物子平臺及CVH的工作做一總結(jié)性介紹,茲以紀(jì)念且為今后國家植物標(biāo)本資源庫建設(shè)等相關(guān)工作提供參考。
曾有數(shù)篇文章對植物子平臺和CVH做過介紹。許哲平和趙莉娜(2010)介紹了CVH研發(fā)歷程及技術(shù)特色;許哲平等(2012)討論了CVH資源管理和共享應(yīng)用方面存在問題,并提出解決對策;劉慧圓等(2017)介紹了CVH各類數(shù)據(jù)資源和植物子平臺在標(biāo)本信息化技術(shù)研發(fā)、技術(shù)服務(wù)方面的工作;肖翠等(2017,2018)在對原國家標(biāo)本資源共享平臺(NSII)發(fā)展及現(xiàn)狀的介紹中包含了CVH和植物子平臺部分相關(guān)信息等。但是,缺乏系統(tǒng)論述植物子平臺和CVH建設(shè)的作用和成效,對植物子平臺運作機制、技術(shù)特點等鮮有提及。我們嘗試通過本文及本期的陳天翔等(2022)兩篇文章來彌補上述不足。其中,前者(本文)在簡述植物子平臺和CVH發(fā)展歷程后,側(cè)重介紹其建設(shè)效果和意義,后者(陳天翔等,2022)則主要介紹植物子平臺作為課題經(jīng)多年建設(shè)形成的一整套運行機制和技術(shù)方法,包括操作過程和經(jīng)驗體會等。
1 植物子平臺建設(shè)及CVH共享網(wǎng)
站發(fā)展的主要歷程
2003年,科技部與發(fā)改委、財政部、教育部等有關(guān)部門聯(lián)合啟動了自然科技資源共享平臺建設(shè)重點領(lǐng)域試點項目“生物標(biāo)本描述標(biāo)準(zhǔn)和規(guī)范的制定及共享試點”(國家標(biāo)本資源共享平臺的前身)被批準(zhǔn)作為首批試點項目之一于2004年正式實施,項目承擔(dān)單位(主持單位)為中國科學(xué)院植物研究所,主管部門為中國科學(xué)院。在項目啟動初期,標(biāo)本資源共享平臺項目組就對標(biāo)建設(shè)一個國家級共享平臺做好了規(guī)劃和頂層設(shè)計。按照總平臺統(tǒng)一部署,對全國生物標(biāo)本資源尤其是植物標(biāo)本資源現(xiàn)狀及歷史等各個方面進行系統(tǒng)性調(diào)查分析,并結(jié)合國際發(fā)展趨勢和國內(nèi)20世紀(jì)80、90年代標(biāo)本信息化建設(shè)經(jīng)驗制訂了國家型植物標(biāo)本信息共享平臺建設(shè)的原則策略(賈渝等,2005;馬克平,2007;王運紅等,2008a)。該原則策略包括數(shù)字化標(biāo)準(zhǔn)規(guī)范(制訂)先行、用優(yōu)質(zhì)標(biāo)本(館)資源作數(shù)字化試點取得經(jīng)驗再行推廣、以標(biāo)本信息為主整合相關(guān)生物(植物)數(shù)據(jù)庫和以科研用戶服務(wù)體驗為導(dǎo)向的平臺建設(shè)思想等。植物子平臺在往后這些年的建設(shè)一直圍繞上述原則策略進行,并根據(jù)平臺任務(wù)要求結(jié)合學(xué)科發(fā)展和用戶新需求作適當(dāng)調(diào)整。
按照平臺建設(shè)目標(biāo)、共享效果及實施主體等特點,把2004—2019年間植物子平臺和CVH建設(shè)歷程劃分為標(biāo)準(zhǔn)和規(guī)范的制定及數(shù)字化試點、數(shù)字化發(fā)展及信息整合共享、平臺驗收認定考核、資源質(zhì)量整改及提升運行服務(wù)水平和植物子平臺創(chuàng)新發(fā)展5個時期(階段)(表1)。
本文所介紹的工作內(nèi)容包括了國家標(biāo)本資源共享平臺項目前期部分或大部分工作。植物子平臺(課題)名義上首次出現(xiàn)在2006年,但在2014年之前,植物子平臺的運作和CVH的建設(shè)基本上是在項目層面直接指揮和安排下開展工作的。
1.1? 標(biāo)準(zhǔn)和規(guī)范的制定及數(shù)字化試點期(簡稱“試點期”)(2004,2005)
本期工作內(nèi)容包括標(biāo)本描述及信息化標(biāo)準(zhǔn)和規(guī)范的制定、館藏標(biāo)本標(biāo)準(zhǔn)化整理、標(biāo)本數(shù)字化表達以及實現(xiàn)信息共享4個方面。在植物方面: 共組織專家完成36項標(biāo)準(zhǔn)和規(guī)范的制定,內(nèi)容涉及高等植物各大類群的標(biāo)本采集、整理與保存規(guī)范、標(biāo)本描述規(guī)范、植物描述術(shù)語標(biāo)準(zhǔn),以及標(biāo)本數(shù)據(jù)庫建設(shè)規(guī)范、地名庫與專家?guī)斓慕ㄔO(shè)規(guī)范等(馬克平,2006;覃海寧等,2010);兩年共完成中國科學(xué)院4家研究所和中山大學(xué)、四川大學(xué)和南京大學(xué)等7家大學(xué),共計11家標(biāo)本館156萬份標(biāo)本的數(shù)字化工作,包括標(biāo)簽信息錄入和圖像制作,并通過項目內(nèi)部網(wǎng)絡(luò)如原“中國植物科學(xué)網(wǎng)”(現(xiàn)已關(guān)停)和提交國家自然科技資源e-平臺等形式實現(xiàn)標(biāo)本信息的初步共享(王運紅等,2008b;馬克平,2007)。數(shù)年后,e-平臺演變?yōu)閲铱萍假Y源共享網(wǎng)(www.escience.org.cn/)。
1.2 數(shù)字化發(fā)展及信息整合共享期(簡稱“發(fā)展期”)(2006—2008)
國家標(biāo)本資源共享平臺項目經(jīng)過前期試點工作積累了建設(shè)國家型共享平臺的經(jīng)驗,尤其是通過選擇中國科學(xué)院和大學(xué)等幾所歷史悠久、標(biāo)本質(zhì)量上乘、技術(shù)力量雄厚的標(biāo)本館開展標(biāo)本數(shù)字化,為組織多家標(biāo)本館基于統(tǒng)一方案開展數(shù)字化工作探索出一套工作方法和經(jīng)驗,為開展更大規(guī)模的數(shù)字化活動奠定了基礎(chǔ)。
在2006—2008三年期間,植物標(biāo)本數(shù)字化及其共享事業(yè)得到很大發(fā)展。共完成331萬份標(biāo)本的數(shù)字化,28家參建單位(標(biāo)本館)涵蓋了中國科學(xué)院系統(tǒng)全部14家標(biāo)本館以及院外一些代表性標(biāo)本館,包括3家省級研究院所和11家大專院校,共分布在全國19個省區(qū)22個城鎮(zhèn)。按館藏量分類: 21家為中大型標(biāo)本館,包括館藏量在50萬份以上的全部8家大型標(biāo)本館;7家雖為館藏量在10萬份以下小型標(biāo)本館,但他們的館藏頗具特色,如廣西中醫(yī)藥研究院(GXMI)、湖南科技大學(xué)(HUST)、杭州植物園(HHBG)、貴州科學(xué)院生物研究所(HGAS)等。
CVH 的正式上線是本階段另一個重大進展!此后,總平臺有了專門對外展示數(shù)字化成果及工作交流的重要窗口和平臺。
我們基于學(xué)科積累和項目試點期完成的標(biāo)準(zhǔn)和規(guī)范研制了中國植物名稱及其發(fā)表文獻、 研究人名,以及標(biāo)本采集地名新舊對照等一批數(shù)據(jù)庫,加上征集來的植物野外生活照片等10余個植物學(xué)數(shù)據(jù)庫,并與標(biāo)本信息對接成為在線標(biāo)本館的雛形(圖1),通過網(wǎng)站對外提供信息共享服務(wù)。
模式標(biāo)本是植物分類命名學(xué)的重要依據(jù),是實體標(biāo)本館的“鎮(zhèn)館之寶”,在數(shù)字化中占據(jù)重要的地位。本期組織8家標(biāo)本館完成1.7萬份(號)模式標(biāo)本的整理及數(shù)字化表達,并實現(xiàn)網(wǎng)絡(luò)共享。與普通標(biāo)本相比,模式標(biāo)本的整理及數(shù)字化表達較為復(fù)雜,具體技術(shù)方法參見陳天翔等(2022)。
1.3 平臺驗收考核認定期(簡稱“考核認定期”)(2009—2011)
總平臺自2008年上半年起組織對平臺在研項目進行進展評估、對“十一五”平臺建設(shè)成效進行階段性驗收和撰寫回顧與展望報告,并結(jié)合“十二五”規(guī)范討論和制訂平臺建設(shè)目標(biāo)和發(fā)展思路等一系列活動。整個活動一直延續(xù)至2011年初。總平臺為此制訂了平臺認定和績效考核指標(biāo)。最終包括國家標(biāo)本資源共享平臺在內(nèi)共有25個平臺通過評議和驗收,得以繼續(xù)運行(三年間均無平臺經(jīng)費資助)。此外,總平臺還指導(dǎo)各個平臺制訂運行服務(wù)管理細則等。
在2009—2011三年期間,植物子平臺除了參與標(biāo)本項目組織的驗收評估活動外,由于缺乏專項經(jīng)費支持沒有開展新的標(biāo)本數(shù)字化工作,而將主要精力放在數(shù)據(jù)整理和CVH網(wǎng)站運維上。例如,2009年,對標(biāo)Darwin Core數(shù)據(jù)標(biāo)準(zhǔn)對數(shù)據(jù)做了規(guī)范化整理,包括地標(biāo)化整理182萬份標(biāo)本、整理82萬份物種名稱,有效地提高了數(shù)據(jù)質(zhì)量。同時,CVH采用LSID(Life Sciences Identifier,生命科學(xué)標(biāo)識)國際標(biāo)準(zhǔn)對基于物種名的各類數(shù)據(jù)進行關(guān)聯(lián),建立與EOL(Encyclopedia of Life,生命大百科全書)、BHL(Biodiversity Heritage Library,生物多樣性遺產(chǎn)圖書館)、IPNI(International Plant Names Index,國際植物名稱索引)等國際主流生物多樣性信息平臺之間的關(guān)聯(lián),為生物信息全球信息共享奠定了基礎(chǔ)(許哲平等,2012)。隨著CVH新版(CVH 3.0)的研發(fā),這些高質(zhì)量數(shù)據(jù)得到開放,使科學(xué)家和專業(yè)用戶更好地對多源數(shù)據(jù)進行共享和集成。
1.4 資源質(zhì)量整改及提升運行服務(wù)水平期(簡稱“整改服務(wù)期”)(2012,2013)
隨著“考核認定期”的結(jié)束,總平臺自2012年起重新啟動和資助平臺建設(shè)。本期建設(shè)目標(biāo)是根據(jù)上一期的考核及驗收結(jié)果,進一步提高共享數(shù)據(jù)質(zhì)量,結(jié)合平臺改造進一步提升網(wǎng)站運維和服務(wù)水平。本期植物子平臺工作包括對標(biāo)本數(shù)據(jù)庫及其他植物學(xué)數(shù)據(jù)庫的清理和完善,新增臘葉標(biāo)本照片和生境照片、裸子植物物種信息庫、栽培植物數(shù)據(jù)庫、亞洲苔蘚植物數(shù)據(jù)庫等新庫,采集地地標(biāo)化、植物名稱及采集人名稱更新,以及CVH共享網(wǎng)站的改造以提升用戶體驗等兩大方面。CVH4.0、國家標(biāo)本共享平臺(NSII)網(wǎng)站均正式上線,后者成為國家標(biāo)本資源共享平臺的門戶網(wǎng)站。
本期共組織中國科學(xué)院系統(tǒng)7家標(biāo)本館完成30.5萬份標(biāo)本的數(shù)字化,以及0.5萬份模式標(biāo)本的整理和數(shù)字化。這些數(shù)據(jù)都實時在CVH和NSII網(wǎng)站上提供查詢共享,并匯交至國家科技資源共享網(wǎng)。
1.5 植物子平臺創(chuàng)新發(fā)展期 (簡稱 “創(chuàng)新期”)(2014—2019)
截至2013年底,國家標(biāo)本資源平臺(NSII)共完成植物數(shù)字化標(biāo)本700多萬份。其中三分之二由植物子平臺完成,三分之一由教學(xué)標(biāo)本子平臺完成。此時,國家科技基礎(chǔ)條件平臺經(jīng)過10年建設(shè),標(biāo)本數(shù)字化增速大為降低。數(shù)字化標(biāo)本雖然只占全國館藏量(2 150萬份)(覃海寧等,2019)的三分之一,但囊括了條件較好的中國科學(xué)院系統(tǒng)及重要大學(xué)的主要標(biāo)本館,而尚未開展數(shù)字化標(biāo)本的大多為標(biāo)本質(zhì)量欠佳、采集信息不全或未整理鑒定標(biāo)本、數(shù)字化難度大且保藏在眾多大專院校和地方行業(yè)研究院所(園、館)的小型標(biāo)本館中,這些標(biāo)本館專業(yè)技術(shù)力量薄弱。
植物子平臺于2014年正式獨立,成為與其他子平臺平行運營的課題。借此機會,植物子平臺在充分調(diào)研后提出一套新的課題運作方法(模式),以突破老舊小標(biāo)本館數(shù)字化瓶頸。該方法包括課題實施前實地調(diào)研考察、執(zhí)行“兩頭嚴”(嚴格把關(guān)合同簽字、嚴格審查結(jié)題上交數(shù)據(jù))、“中間緊”(緊抓中期進展)和強化對平臺參建單位技術(shù)支持等(具體運作方法和技術(shù)參見本期的陳天翔等(2022)。同時,把組織中國科學(xué)院及地方研究院所開展標(biāo)本數(shù)字化的子平臺(園、館)標(biāo)本館列為重點吸收對象,并將工作范圍延伸至高校。
經(jīng)過6年的努力,到2019年底,植物子平臺期間共組織92家單位完成230萬份標(biāo)本的數(shù)字化。92家參建標(biāo)本館中,68家為館藏量在10萬份以下的小型標(biāo)本館,占參建館的74%,74家為首次參加數(shù)字化單位(占80%),其中地方研究院所(園、館)25家,比2014年前(3家)多了22家,增加7倍,大專院校45家,比2014年前(13家)多了32家,增加3.5倍(表2)。
截至2019年底,植物子平臺組織100多家標(biāo)本館完成的790萬份數(shù)字標(biāo)本(含5萬份模式,下同)同其他植物學(xué)數(shù)據(jù)庫一道通過本期上線的CVH5.0對外提供共享服務(wù)。該版CVH嘗試以提供專家輔助工作平臺、 構(gòu)建標(biāo)本在線管理平臺和開發(fā)人工智能系統(tǒng)iHerbarium為創(chuàng)新點,并取得成效(李敏等,2018)。
1.6 CVH發(fā)展迭代歷程 (2006—2019)
有關(guān)CVH的發(fā)展歷程,曾有三階段(許哲平,趙莉娜,2010)和四階段(劉慧圓等,2017)的分法。CVH作為植物子平臺共享網(wǎng)站,其發(fā)展目標(biāo)和迭代階段與子平臺的發(fā)展歷程基本契合。結(jié)合植物子平臺建設(shè)發(fā)展歷程,將CVH在2006—2019年間的發(fā)展歷程劃分為五個階段(表3,圖2)。
Ⅰ期: 數(shù)據(jù)匯總期 (2006—2008)。本階段CVH1.0作短暫試驗后下線,主要以2.0版本運行。主要提供在線共享中國主要標(biāo)本館數(shù)字化標(biāo)本信息,并根據(jù)來源館情況分別采用集中式和分布式、總館與分館相結(jié)合的方式進行共享。此后,隨著數(shù)字化項目的持續(xù)開展, 新增數(shù)字化標(biāo)本信息穩(wěn)定上傳至網(wǎng)站。除了標(biāo)本數(shù)據(jù)外,CVH還建設(shè)共享了物種名稱、圖片和文獻等一批數(shù)據(jù)庫,構(gòu)成支持分類學(xué)研究的主要數(shù)據(jù)體系。此外,CVH還提供一些早期的標(biāo)本數(shù)字化工具及流程和標(biāo)準(zhǔn)規(guī)范。
Ⅱ期 (數(shù)據(jù)標(biāo)準(zhǔn)化和規(guī)范化)和Ⅲ期 (基于SOA的e-Science平臺)(2009—2012)。共歷時4年,研發(fā)功能較多,均以CVH3.0為載體實現(xiàn),又分為Ⅱ期和Ⅲ期。Ⅱ期以標(biāo)本規(guī)范化整理為主,并嘗試引入國際數(shù)據(jù)標(biāo)準(zhǔn),包括站內(nèi)數(shù)據(jù)與國際著名數(shù)據(jù)系統(tǒng)的關(guān)聯(lián);Ⅲ期根據(jù)CVH數(shù)據(jù)系統(tǒng)特點打造模塊化管理模式,并建立面向研究型群體的e-Science平臺。
Ⅳ期: 信息整合服務(wù)期(2013—2019)。本期因網(wǎng)站開發(fā)人員更迭,研制了CVH 4.0和5.0兩個版本,特色仍然是基于現(xiàn)有標(biāo)本等信息的整合,為各類用戶提供更好的服務(wù)體驗。在本階段中,CVH強化了面向標(biāo)本館和分類學(xué)專家的服務(wù),即為各標(biāo)本館設(shè)計了標(biāo)本館子站和標(biāo)本在線錄入系統(tǒng),并設(shè)置標(biāo)本館用戶權(quán)限以及專家用戶權(quán)限,還開發(fā)了適用于智能手機的“iHerbarium標(biāo)本館伴侶”,嘗試將植物標(biāo)本數(shù)字化流程融入標(biāo)本的采集、鑒定、入庫等環(huán)節(jié),助力提升標(biāo)本館的工作效率和管理水平。
Ⅴ期: CVH6.0或稱“國家植物標(biāo)本資源庫在線服務(wù)平臺”(2020至今)。本期繼承了前期版本網(wǎng)站的服務(wù)宗旨,關(guān)注用戶使用習(xí)慣,進一步提升用戶體驗,并結(jié)合科技部對國家種質(zhì)資源庫的要求,整合共享資源庫植物標(biāo)本、植物彩色照片、植物DNA條形碼等數(shù)字化資源,同時在線提供資源庫社會服務(wù)、信息公開和工作進展等內(nèi)容。在數(shù)據(jù)共享方面,提供了完整的線上數(shù)據(jù)獲取工作流程、推廣標(biāo)準(zhǔn)化的數(shù)據(jù)引用方式。在標(biāo)本館能力建設(shè)方面,本期網(wǎng)站嘗試建立數(shù)字-實體標(biāo)本館聯(lián)動橋梁,建設(shè)專家系統(tǒng)、標(biāo)本館信息管理、標(biāo)本鑒定同步,實現(xiàn)與實體標(biāo)本館的互動。
2 植物子平臺建設(shè)及CVH網(wǎng)站共
享的重要意義
2.1 完成核心標(biāo)本資源數(shù)字化,極大推動我國生物信息共享和應(yīng)用
截至2019年底,植物子平臺共組織完成數(shù)字化標(biāo)本790萬份(含5萬份模式標(biāo)本),同時通過CVH等網(wǎng)站實現(xiàn)共享。參加數(shù)字化標(biāo)本館共104家(附表1;另有5家菌物標(biāo)本館),約占我國活躍標(biāo)本館(226家,覃海寧等,2019)的一半,包括中國科學(xué)院系統(tǒng)全部標(biāo)本館 (16 家)、地方科研院所(植物園、博物館)的大部分(32家),其余56家為大專院校標(biāo)本館(圖3:A)。因此,可以說所完成的790萬數(shù)字化標(biāo)本代表著我國植物標(biāo)本資源中最重要、最集中的部分。
自21世紀(jì)初以來,國內(nèi)外數(shù)字標(biāo)本依托互聯(lián)網(wǎng)等媒介逾越信息孤島,快速實現(xiàn)大范圍共享,極大推動標(biāo)本信息在植物分類及其相關(guān)科學(xué)研究、生物多樣性保護和科學(xué)傳播等領(lǐng)域的應(yīng)用(Beaman & Cellinese, 2012;Wen et al., 2015;Borsch, Stevens & H?ffner, 2020;賀鵬等,2021)。CVH 自2006年上線以來,迅速受到國內(nèi)外用戶訪問,成為用戶了解和獲取中國植物標(biāo)本及其植物學(xué)信息的門戶網(wǎng)站(許哲平和趙莉娜,2010;劉慧圓等,2017)。據(jù)統(tǒng)計,自2010年以來,CVH年平均用戶數(shù)達30萬人,日均訪問IP穩(wěn)定在2萬以上。僅2019年一年總訪問量就達到38.3萬人次,頁面點擊量1 169.9萬次,數(shù)據(jù)傳輸量達6 395.5 GB,網(wǎng)站注冊用戶達1 900人,訪問用戶來自全球90個國家(表4)。另據(jù)不完全統(tǒng)計,2007—2020年間,使用CVH數(shù)據(jù)所發(fā)表的同行評議文章達1 400多篇,包括中文(含學(xué)位論文)1 000多篇,英文400多篇,文章涵蓋了氣候變化、外來入侵物種的管理、生物多樣性調(diào)查、分類學(xué)研究、瀕危物種評估、植物保護、中醫(yī)藥植物分析等50多個主題;共應(yīng)用于355項各類科技計劃和項目,包含重大專項6個、重點研發(fā)項目18個、自然科學(xué)基金76個、省部級項目18 個、其他項目237個(圖3:B)。國家標(biāo)本共享平臺多次被中國政府列為支撐履行《生物多樣性公約》的重要國家戰(zhàn)略設(shè)施(國家環(huán)境保護局,2005,2014)。
2.2 大力提升我國植物標(biāo)本館的信息化和現(xiàn)代化管理能力
成員館在參加標(biāo)本數(shù)字化項目和提供信息共享的同時,也改善和提高了自身的保藏條件和管理水平。許多標(biāo)本館通過實施數(shù)字化專題,對全館標(biāo)本進行清查和整理,既摸清了家底,又改善了
標(biāo)本保存條件,提高了標(biāo)本鑒定率;數(shù)字化活動還需添置高性能相機等數(shù)字化裝備;技術(shù)人員經(jīng)過培訓(xùn)熟練掌握了標(biāo)本數(shù)字化技能等。館藏標(biāo)本的數(shù)字化加上人員技能提升和軟硬件條件的改善,有力地促進了我國生物標(biāo)本館管理的規(guī)范化和現(xiàn)代化(張莉莉,2016)。據(jù)調(diào)查,我國除中國科學(xué)院系統(tǒng)以外,其余部門及高校標(biāo)本館普遍缺乏專門的標(biāo)本館維護運行費。植物子平臺和CVH 104家參建單位中,連續(xù)2年及以上參加數(shù)字化項目的有59家,其中大部分(43家)為地方研究院所(15家)和高校標(biāo)本館(28家),參加標(biāo)本共享平臺項目可為他們帶來標(biāo)本館管理必需的一部分資金。另據(jù)統(tǒng)計,2006—2008年間,28家標(biāo)本館共2 000多人參加數(shù)字化工作(表1),包括大量大學(xué)生、研究生和青年職工,他們普遍接受和掌握了數(shù)字化技術(shù)培訓(xùn)和技能,成為我國生物多樣性研究及共享隊伍的強大后備力量。
2.3 建立起國家型標(biāo)本數(shù)字化工作平臺
國家標(biāo)本資源共享平臺經(jīng)過10余年建設(shè)和經(jīng)營,成功搭建起一座覆蓋全國的生物(植物)多樣性信息化建設(shè)協(xié)作網(wǎng)絡(luò)/平臺。國家型平臺的建設(shè)宗旨、服務(wù)對象、服務(wù)信息來源及其建設(shè)規(guī)范、平臺運行機制以及成員單位入選標(biāo)準(zhǔn)等,經(jīng)過長期探索已經(jīng)形成一整套行之有效的經(jīng)驗和做法。同時,平臺建立起一支專業(yè)齊全且穩(wěn)定的維護團隊和經(jīng)驗豐富的專家顧問團隊。
國家型數(shù)字化工作協(xié)作平臺將既是延續(xù)項目“國家植物標(biāo)本資源庫”建設(shè)的重要抓手,也是我國今后開展其他生物多樣性信息建設(shè)和共享業(yè)務(wù)的重要基礎(chǔ)和重要依托。
2.4 對我國生物多樣性信息學(xué)發(fā)展發(fā)揮重要作用
許哲平等(2012)曾指出,CVH發(fā)展歷程對于目前我國科研數(shù)據(jù)庫建設(shè)具有較好的參考價值。作為標(biāo)本資源共享平臺主要子平臺和最早的共享網(wǎng)站, 植物子平臺和CVH無論是其框架思想、展現(xiàn)形式和效果還是相關(guān)的研討介紹均對我國生物多樣性信息學(xué)發(fā)展產(chǎn)生影響。在這個過程中,CVH對生物多樣性信息學(xué)技術(shù)的普及和應(yīng)用都起到極大作用, 在一定程度上提高了我國在這方面的建設(shè)能力和人才培養(yǎng)能力。CVH的數(shù)據(jù)庫系統(tǒng)和表現(xiàn)形式、總館與分館架構(gòu),提出的中國生物多樣性e-Science平臺框架和建設(shè)思路,以及子平臺的“兩頭嚴”“中間緊”和“三有標(biāo)本”管理模式等,為國內(nèi)同類信息系統(tǒng)和管理平臺提供了榜樣和借鑒。一些現(xiàn)行的重要網(wǎng)站或直接脫胎于CVH網(wǎng)站或其主創(chuàng)人員即為原來CVH和子平臺團隊的骨干,如植物智(www.iplant.cn)、中國植物圖像庫(ppbc.iplant.cn)、中國植物主題數(shù)據(jù)庫(www.plant.csdb.cn)和中國自然標(biāo)本館(CFH,www.cfh.ac.cn)。同時,國家標(biāo)本共享平臺網(wǎng)站(NSII,nsii.org.cn)在2013年上線時也借鑒了CVH的建設(shè)經(jīng)驗。
共享平臺團隊通過參加國內(nèi)國際學(xué)術(shù)會議交流、培訓(xùn)和撰寫生物多樣性信息學(xué)文章(王利松等,2010;許哲平和趙莉娜,2010;許哲平等2010,2011)等方式報道標(biāo)本資源平臺及CVH網(wǎng)站建設(shè)歷程、成效和經(jīng)驗,介紹國際學(xué)科發(fā)展趨勢,并且提出中國生物多樣性信息學(xué)建設(shè)思路和框架等。這些宣傳報道對我國的科研數(shù)據(jù)庫建設(shè)及科技資源共享具有重要的參考價值,引起了眾多同行對科學(xué)數(shù)據(jù)庫和共享平臺建設(shè)的思考,影響了國內(nèi)一大批共享網(wǎng)站的建設(shè),推動了我國生物多樣性信息學(xué)的發(fā)展(沈曉琳等,2008,2010;李勇,2015;張洋等,2015;張洋,2016;陳建平等,2018;吳倩倩等,2019;肖灑,2019)。
4 總結(jié)
十幾年來,植物子平臺和CVH網(wǎng)站在建設(shè)過程中,按照國家科技基礎(chǔ)條件平臺要求和國家標(biāo)本資源共享平臺項目的指導(dǎo)意見,在不斷強化頂層設(shè)計、持續(xù)進行數(shù)據(jù)積累、探索提升運行服務(wù)水平等方面作了不少有益的嘗試;在提升國家生物信息共享水平、支持政府決策制定和加強隊伍建設(shè)方面均發(fā)揮著重要作用。但是,也存在不少缺陷和未盡事宜。例如,在標(biāo)本數(shù)據(jù)的清理、為專業(yè)用戶建立在線協(xié)同研究平臺、與實體館的在線信息聯(lián)動以及與國際著名信息系統(tǒng)對接和擴大海外宣傳推廣等方面,雖然做過不少嘗試和努力,但效果欠佳,或事倍功半或半途而廢等。希望后人在繼續(xù)開展類似信息共享建設(shè)時能吸取教訓(xùn)、引以為戒。
生物多樣性信息化及共享化建設(shè)永遠在路上!
致謝 植物子平臺和CVH網(wǎng)站建設(shè)得到100多家標(biāo)本館千余位老師同學(xué)的支持;對參建館各位館長的大力支持表示誠摯的謝意;非常感謝國家標(biāo)本資源共享平臺項目負責(zé)人馬克平老師和項目辦崔金鐘老師、陳鐵梅老師、肖翠老師的指導(dǎo)、監(jiān)督和幫助;感謝原研究組包伯堅、王利松、楊永、何強、趙莉娜、周世良、于勝祥、單章建、謝丹等老師、同學(xué)的支持和幫助;感謝所在研究室“系統(tǒng)與進化植物學(xué)國家重點室”歷任主任、館長的支持和指導(dǎo);感謝科技部和財政部對標(biāo)本資源共享項目的鼎立支持,感謝賈渝、陳彬、陳建平、來金朋、王錦秀、林祁、楊志榮、林秦文等老師的指導(dǎo)和幫助。
參考文獻:
BEAMAN RS, CELLINESE N, 2012. Mass digitization of scientific collections: New opportunities to transform the use of biological specimens and underwrite biodiversity science [J]. ZooKeys, 209: 7-17.
BERENDSOHN WG, GNTSCH A, 2012. Open Up! Creating a cross-domain pipeline for natural history data [J]. ZooKeys, 209: 47-54.
BORSCH T, STEVENS AD, H?FFNER E, 2020. A complete digitization of German herbaria is possible, sensible and should be started now [J]. Res Ideas Outcomes, 6: e50675.
CHEN JP, GUO L, GAO YP, et al., 2018. PVH: Development and application of Provincial Virtual Herbarium [J]. Front Data? Comput, 9(5): 84-93. [陳建平, 郭莉, 高燕萍, 等, 2018. PVH: 省級數(shù)字植物標(biāo)本館平臺的開發(fā)與應(yīng)用. 科研信息化技術(shù)與應(yīng)用 [J]. 科研信息化技術(shù)與應(yīng)用, 9(5): 84-93.]
國家環(huán)境保護局, 中國履行《生物多樣性公約》第三次國家報告(2005)、第五次國家報告(2014) [M]. 北京: 中國環(huán)境出版社.
HE P, CHEN J, KONG HZ, et al., 2021. Important supporting role of biological specimen in biodiversity conservation and research [J]. Bull Chin Acad Sci, 36(4): 425-435. [賀鵬, 陳軍, 孔宏智, 等, 2021. 生物樣本: 生物多樣性研究與保護的重要支撐 [J]. 中國科學(xué)院院刊, 36(4): 425-435.]
賈渝, 馬克平, 覃海寧, 2005. 生物標(biāo)本資源 [M]//王東陽. 自然科技資源共享政策法規(guī)研究. 北京: 科學(xué)出版社: 232-263.
LI M, XUAN J, ZHAO MY, et al., 2018. Birth and development prospect of iHerbarium [J]. Front Data Comput, 9(5): 36-40. [李敏, 宣晶, 趙明月, 等, 2018. 標(biāo)本館伴侶的誕生與發(fā)展前景 [J]. 科研信息化技術(shù)與應(yīng)用, 9(5): 36-40.]
LI Y, 2015. Digitization of herbarium and integration of biodiversity information: Taking Tianjin Natural History Museum as an example [J]. Sci Ed Mus, 1(1): 55-60. [李勇, 2015. 植物標(biāo)本數(shù)字化與生物多樣性信息整合——以天津自然博物館為例 [J]. 科學(xué)教育與博物館, 1(1): 55-60.]
LIU HY, QIN HN, LI M, 2017. Plant Specimen Resource Sharing Platform and plant specimen digital capability construction [J]. Front Data? Comput, 8(4): 13-23. [劉慧圓, 覃海寧, 李敏, 2017. 植物標(biāo)本資源共享平臺與標(biāo)本數(shù)字化能力建設(shè) [J]. 科研信息化技術(shù)與應(yīng)用, 8(4): 13-23.]
LIU QX, CHU XF, DONG XY, et al., 2022. Development epitome of digitization of plant specimens of herbaria in China: Herbarium of Institute of Botany, Jiangsu Province and Chinese Academy of Sciences (NAS) [J]. Guihaia, 42(Suppl. 1): 71-86. [劉啟新, 褚曉芳, 董曉宇, 等, 2022.? [J]. 廣西植物, 42(增刊1): 71-86.]
馬克平, 2006.? 生物標(biāo)本資源共性描述規(guī)范 [M]//曹一化, 劉旭. 自然科技資源共性描述規(guī)范. 北京: 中國科學(xué)技術(shù)出版社: 46-53.
馬克平, 2007. 植物標(biāo)本資源平臺 [M]//杜占元, 劉旭. 自然科技資源共享平臺建設(shè)的理論與實踐. 北京: 科學(xué)出版社: 523-532.
QIN HN, LIU HY, HE Q, et al., 2019. Index Herbariorum Sinicorum [M]. 2nd ed. Beijing: Science Press:preface. [覃海寧, 劉慧圓, 何強, 等, 2019. 中國植物標(biāo)本館索引 [M]. 第二版. 北京: 科學(xué)出版社: 前言.]
覃海寧等, 2010. 植物標(biāo)本的采集、制作和保存 [M]//伍玉明, 張春光, 覃海寧, 等, 2010. 生物標(biāo)本的采集、制作、保存與管理. 北京: 科學(xué)出版社: 297-384.
SHEN XL, LIU Y, LIN CR, 2010. Design and integration of Herbarium Database Sharing Platform [J]. Comput Modern, 12: 159-161. [沈曉琳, 劉演, 林春蕊, 2010. 植物標(biāo)本信息共享平臺設(shè)計與整合 [J]. 計算機與現(xiàn)代化, 12: 159-161.]
SHEN XL, ZHANG XL, LIAO H, et al., 2008. Design and realization of distributional plant specimen database [J]. Comp Telecommun, 8: 20-21. [沈曉琳, 張向利, 廖宏, 等, 2008. 分布式植物標(biāo)本數(shù)據(jù)庫的設(shè)計與實現(xiàn) [J]. 電腦與電信, 8: 20-21.]
THIERS BM, 2021. The worlds herbaria 2021: a summary report based on data from Index Herbariorum(Issue 6.0) [Index Herbariorum]. https://sweetgum.nybg.org/science/wp-content/uploads/2022/02/The_Worlds_Herbaria_Jan_2022.pdf.
WANG LS, CHEN B, JI LQ, et al., 2010. Progress in biodiversity informatics [J]. Biodivers Sci, 18(5): 429-433. [王利松, 陳 彬, 紀(jì)力強, 等, 2010. 生物多樣性信息學(xué)研究進展 [J]. 生物多樣性, 18(5): 429-433.]
WANG YH, DONG C, PENG J, 2008.Analysis of foreign policies and regulations for sharing natural scientific and technological resources and their implications for China [J]. Forum Sci Technol Chin, 6: 125-129. [王運紅, 董誠, 彭潔, 2008. 國外自然科技資源共享政策法規(guī)分析及對我國的啟示 [J]. 中國科技論壇, 6: 125-129.]
WANG YH, WU X, ZHAO W, 2009. Research on users and characteristics of shared services for natural scientific and technological resources [J]. Sci Technol Manage Res, 29(3): 310-312. [王運紅, 吳霞, 趙偉, 2009. 自然科技資源共享服務(wù)用戶及共享服務(wù)的特點研究 [J]. 科技管理研究, 29(3): 310-312.]
WANG YH, ZHANG G, SHEN XY, 2008. Research and practice on national infrastructure of natural resources for science and technology of China [J]. Chin Sci Technol Resour Rev, 4: 16-19. [王運紅, 張莞, 沈欣媛, 2008. 國家自然科技資源e-平臺建設(shè)實踐 [J]. 中國科技資源導(dǎo)刊, 4: 16-19.]
WEN J, ICKERT-BOND SM, APPELHANS MS, 2015.Collections-based systematics: Opportunities and outlook for 2050 [J]. J Syst Evol, 53(6): 477-488.
WU QQ, LI BC, SHI YY, et al., 2019. Construction of specimen digitization in natural history museums — A case of Shanghai Natural History Museum [J]. J Nat Sci Mus Res, 4(1): 15-19. [吳倩倩, 李必成, 石亞亞, 等, 2019. 自然博物館標(biāo)本數(shù)字化建設(shè)——以上海自然博物館為例 [J]. 自然科學(xué)博物館研究, 4(1): 15-19.]
XIAO C, LI MY, YE F, et al., 2018. Exploration of the development direction of NSII based on tens of millions of specimen records [J]. Front Data Comput, 9(5): 7-26. [肖翠, 李明媛, 葉芳, 等, 2018. 基于千萬標(biāo)本記錄的NSII發(fā)展方向的探索 [J]. 科研信息化技術(shù)與應(yīng)用, 9(5): 7-26.]
XIAO C, LUO HR, CHEN TM, et al., 2017. Progress and Analysis About Present Situation of National Specimen Information Infrastructure [J]. Front Data? Comput, 8(4): 6-12. [肖翠, 雒海瑞, 陳鐵梅, 等, 2017. 國家標(biāo)本資源共享平臺數(shù)字化進展與現(xiàn)狀分析 [J]. 科研信息化技術(shù)與應(yīng)用, 8(4): 6-12.]
XIAO S, 2019. An introduction to plant specimen digitization technology and its applications [J]. Agric Technol, 39(8): 2. [肖灑, 2019. 淺談植物標(biāo)本數(shù)字化技術(shù)及其應(yīng)用 [J]. 農(nóng)業(yè)與技術(shù), 39(8): 2.]
XU ZP, CUI JZ, QIN HN, et al., 2010. On the architecture of biodiversity e-Science infrastructure in China [J]. Biodivers Sci, 18(5): 480-488. [許哲平, 崔金鐘, 覃海寧, 等, 2010. 中國生物多樣性e-Science平臺建設(shè)構(gòu)想 [J]. 生物多樣性, 18(5): 480-488.]
XU ZP, QIN HN, CUI JZ, et al., 2011. Management and shared services of biodiversity information resources in China [J]. Proceedings of the 6th Conference on Promoting the Sharing of Scientific and Technological Information Resources. [許哲平, 覃海寧, 崔金鐘, 等, 2011. 中國生物多樣性信息資源管理和共享服務(wù) [C]. 第六屆科技信息資源共享促進會會議論文集.]
XU ZP, QIN HN, MA KP, et al., 2012.Research on management, sharing and application of natural science and technology resources: Taking Chinese Virtual Herbarium (CVH) for an example [J]. Chin Sci Technol Resour Rev, 44(1): 27-33. [許哲平, 覃海寧, 馬克平, 等, 2012. 自然科技資源的管理、共享和應(yīng)用研究——以中國數(shù)字植物標(biāo)本館為例 [J]. 中國科技資源導(dǎo)刊, 44(1): 27-33.]
XU ZP, ZHAO LN, 2010. Chinese Virtual Herbarium (CVH) Platform [J]. Sci Data Commun, 3: 33-36. [許哲平, 趙莉娜, 2010. 中國數(shù)字植物標(biāo)本館平臺(CVH) [J]. 科學(xué)數(shù)據(jù)通訊, 3: 33-36.]
ZHANG LL, CHEN J, QIAO GX, 2016. Status quo and prospect of biological specimen museums in China [J]. World Environ, (S1): 88-90. [張莉莉, 陳軍, 喬格俠, 2016. 我國生物標(biāo)本館現(xiàn)狀與展望 [J]. 世界環(huán)境, (S1): 88-90.]
ZHANG Y, 2016. Digital plant specimen technology and its application in museums of natural history [J]. Res Nat Hist Mus, 3: 84-87. [張洋, 2016. 植物標(biāo)本數(shù)字化技術(shù)及數(shù)字化標(biāo)本在自然博物館的應(yīng)用 [J]. 自然博物, 3: 84-87.]
ZHANG Y, ZHANG FG, FAN ZY, et al., 2015. Construction and considerations of the digital plant specimen platform in natural history museums [J]. J Zhejiang Agric Sci, 56(9): 1520-1523. [張洋, 張方鋼, 范忠勇, 等, 2015. 自然博物館植物標(biāo)本數(shù)字化平臺的構(gòu)建與思考 [J]. 浙江農(nóng)業(yè)科學(xué), 56(9): 1520-1523.]