關(guān)鍵詞:生物多樣性,數(shù)據(jù),信息,共享,標(biāo)準(zhǔn)化
DOI編碼:10.3969/j.issn.1002-5944.2024.12.007
0 引言
生物多樣性是人類賴以生存和發(fā)展的基礎(chǔ),是地球生命共同體的血脈和根基,不僅提供著人類基本所需的食物、藥物和工業(yè)原料,還是維持生態(tài)系統(tǒng)平衡的必要條件。但由于人類活動的加劇,物種滅絕的速度不斷加快[1]。近年來,全球生物多樣性的喪失已經(jīng)成了一個嚴(yán)重的環(huán)境問題。隨著全球環(huán)境問題的日益突出,生物多樣性研究已經(jīng)引起全球范圍內(nèi)的關(guān)注。例如由聯(lián)合國發(fā)起的全球最大的生物多樣性研究“全球生物多樣性倡議”,旨在促進(jìn)各國保護(hù)和恢復(fù)生物多樣性。在研究方法和技術(shù)手段方面,生物多樣性研究已經(jīng)取得了很大的進(jìn)展。例如采用分子標(biāo)記、DNA序列等技術(shù)對物種進(jìn)行精細(xì)分類和鑒定。隨著研究的進(jìn)步、技術(shù)的應(yīng)用,數(shù)據(jù)也在不斷地增加并趨于海量化,而因?yàn)榇罅繑?shù)據(jù)資源沒有統(tǒng)一的格式,很難與其他生物多樣性數(shù)據(jù)庫融合匯總實(shí)現(xiàn)有效的多樣性研究。因此,生物多樣性數(shù)據(jù)的標(biāo)準(zhǔn)研究顯得非常重要,其可以有效打破數(shù)據(jù)孤島,推動互聯(lián)互通。
1 生物多樣性發(fā)展
保護(hù)目標(biāo)難落實(shí)是當(dāng)前全球生物多樣性治理面臨的一個緊迫問題?!渡锒鄻有怨s》于1993年12月29日正式生效后,得到了廣泛認(rèn)可與支持,締約方達(dá)196個,是全球參與程度最高的國際環(huán)境公約。中國近10年新增和修復(fù)濕地80多萬公頃,現(xiàn)有國際重要濕地64處,13個地區(qū)入選“國際濕地城市”,是全球入選“國際濕地城市”數(shù)量最多的國家[2]。中國積極地推進(jìn)生物多樣性保護(hù)和恢復(fù),為全球生物多樣性保護(hù)作出了中國貢獻(xiàn),贏得了國際社會廣泛贊譽(yù)?!渡锒鄻有怨s》秘書處發(fā)布第五版《全球生物多樣性展望》報告,共提到中國14次,其中13次展示了中國在生物多樣性保護(hù)方面的成功經(jīng)驗(yàn)[3]。中國在生物多樣性編目、監(jiān)測信息系統(tǒng)方面進(jìn)行了大量的工作,累積了豐富的信息資料和經(jīng)驗(yàn)。2023年經(jīng)國務(wù)院批準(zhǔn)發(fā)布《中國生物多樣性保護(hù)戰(zhàn)略與行動計(jì)劃(2023—2030年)》,可以見得生物多樣性保護(hù)是目前國際的重點(diǎn)關(guān)注領(lǐng)域[4]。
2 標(biāo)準(zhǔn)化現(xiàn)狀
2.1 國際生物多樣性信息標(biāo)準(zhǔn)化情況
生物多樣性是生物及其與環(huán)境形成的生態(tài)復(fù)合體以及與此相關(guān)的各種生態(tài)過程的總和,由遺傳(基因)多樣性、物種多樣性和生態(tài)系統(tǒng)多樣性三個層次組成。生物多樣性是國際標(biāo)準(zhǔn)化活動中的新興領(lǐng)域。ISO國際標(biāo)準(zhǔn)化組織于2020年成立了ISO/TC 331 生物多樣性技術(shù)委員會(biodiversity),設(shè)立了5個工作組:AHG 3 保護(hù)、保育和恢復(fù)特別工作組(Protection, conservation and restoration);CAG Chair’s Advisory Group; WG 1 術(shù)語工作組(Ter minolog y);WG 2 測量、數(shù)據(jù)、監(jiān)測、評估特別工作組(Measurement, data, monitoring andassessment);WG 4 組織、戰(zhàn)略和可持續(xù)利用特別工作組(Organization , strategies and sustainable use)。截至2024年3月,ISO/TC 331 生物多樣性委員會正在制定的標(biāo)準(zhǔn)有4項(xiàng)[5](見表1)。
從制定的標(biāo)準(zhǔn)中可以看出,隨著《生物多樣性公約》的發(fā)布,許多國家致力于生物多樣性的保護(hù)。ISO/TC 331處于剛起步的狀態(tài),還未有很多標(biāo)準(zhǔn)立項(xiàng)在研,生物多樣性數(shù)據(jù)更是尚未開始。與之密切相關(guān)的委員會,如ISO/TC 276 生物技術(shù)委員會,專門下設(shè)了工作組WG 5 生物數(shù)據(jù)處理及整合(Dataprocessing and integration)用于數(shù)據(jù)規(guī)范,目前已發(fā)布7項(xiàng)數(shù)據(jù)類標(biāo)準(zhǔn),在研8項(xiàng)[6]。從已發(fā)布和在研的數(shù)量可以看出,在其他相關(guān)的委員會對數(shù)據(jù)領(lǐng)域是非常重視的。
2.2 我國生物多樣性信息標(biāo)準(zhǔn)化情況
我國在國際標(biāo)準(zhǔn)生物多樣性相關(guān)標(biāo)準(zhǔn)的參與度較低,且現(xiàn)有生物多樣性相關(guān)的國家標(biāo)準(zhǔn)很少能上升至國際標(biāo)準(zhǔn),大大影響了我國在標(biāo)準(zhǔn)化上的國際地位。生物多樣性相關(guān)的標(biāo)準(zhǔn)更多的是集中在生物多樣性保護(hù)方面,如調(diào)查監(jiān)測評估類標(biāo)準(zhǔn)、方法標(biāo)準(zhǔn)、采集保藏標(biāo)準(zhǔn)、檢疫防控類標(biāo)準(zhǔn)等[7]。目前尚無與生物多樣性信息相關(guān)的標(biāo)準(zhǔn)。與我國生物多樣性領(lǐng)域的發(fā)展相比,生物多樣性信息標(biāo)準(zhǔn)明顯滯后,如在數(shù)據(jù)管理和信息網(wǎng)絡(luò)建設(shè)方面都存在不足,數(shù)據(jù)分割管理造成了數(shù)據(jù)存儲格式不盡一致導(dǎo)致信息無法交匯,難以實(shí)現(xiàn)數(shù)據(jù)共享。
3 標(biāo)準(zhǔn)建設(shè)構(gòu)想
3.1 生物多樣性數(shù)據(jù)信息組成
生物多樣性數(shù)據(jù)涵蓋了許多不同類型的信息,如物種清單、物種分布、種群數(shù)量和密度、遺傳信息、生態(tài)學(xué)特征、生態(tài)系統(tǒng)功能、瀕危和受威脅物種信息等。這些數(shù)據(jù)可以通過野外調(diào)查、實(shí)地觀察、遙感技術(shù)、分子生物學(xué)方法等途徑進(jìn)行收集,并通過數(shù)據(jù)庫科學(xué)地進(jìn)行存儲和分享。這些數(shù)據(jù)對于生物多樣性保護(hù)、生態(tài)系統(tǒng)管理和可持續(xù)發(fā)展具有重要意義。圖1為生物多樣性數(shù)據(jù)信息組成示例。
3.2 生物多樣性數(shù)據(jù)要求
早期,生物多樣性數(shù)據(jù)主要以文本、圖片等非結(jié)構(gòu)化形式存在,缺乏統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)。隨著信息技術(shù)的發(fā)展,生物多樣性數(shù)據(jù)逐漸數(shù)字化,出現(xiàn)了一些數(shù)據(jù)標(biāo)準(zhǔn),如Darwin Core、EML等。國際組織和科研機(jī)構(gòu)開始倡導(dǎo)生物多樣性數(shù)據(jù)標(biāo)準(zhǔn)化,推動各方建立統(tǒng)一的數(shù)據(jù)格式和標(biāo)準(zhǔn),促進(jìn)數(shù)據(jù)的共享與交流。以下是生物多樣性數(shù)據(jù)的要求。
(1)數(shù)據(jù)類型
數(shù)據(jù)類型格式標(biāo)準(zhǔn)化是確保數(shù)據(jù)能夠被正確解釋和處理的重要步驟。數(shù)據(jù)類型包括了文本數(shù)據(jù)、數(shù)字?jǐn)?shù)據(jù)、日期時間數(shù)據(jù)等,通過選擇適合該類型的標(biāo)準(zhǔn)格式,如CSV(逗號分隔值)、JSON(JavaScript對象表示法)、XML(可擴(kuò)展標(biāo)記語言)等,將生物多樣性數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一的數(shù)據(jù)格式,以便后續(xù)存儲及分析。
(2)數(shù)據(jù)命名規(guī)范
不同的數(shù)據(jù)字段和變量使用一致的命名規(guī)范,以保持?jǐn)?shù)據(jù)的清晰和易讀性。例如使用駝峰命名法或下劃線命名法等。駝峰命名規(guī)范要求第一個單詞首字母小寫,后面其他單詞首字母大寫(e.g. intmyAge;)。下劃線命名法并不如駝峰式命名法那么備受推崇,但在宏定義和常量中使用比較多,通過下劃線來分割單詞,即要求單詞與單詞之間通過下劃線連接即可(e.g. int my_age;)。
(3)數(shù)據(jù)質(zhì)量
數(shù)據(jù)質(zhì)量是數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范的核心,對于生物多樣性領(lǐng)域的研究、保護(hù)和管理具有重要的影響,確保數(shù)據(jù)的準(zhǔn)確性、完整性和可靠性是保障生物多樣性研究成果和保護(hù)工作有效性的關(guān)鍵所在。GB/T36344—2018《信息技術(shù) 數(shù)據(jù)質(zhì)量評價指標(biāo)》提出的數(shù)據(jù)質(zhì)量評價指標(biāo)框架可以很好地保證數(shù)據(jù)質(zhì)量[8],如圖2所示。
規(guī)范性——數(shù)據(jù)符合數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)模型、業(yè)務(wù)規(guī)則、元數(shù)據(jù)或權(quán)威參考數(shù)據(jù)的程度。例如涉及物種命名、分類等方面的規(guī)范,通過比較數(shù)據(jù)中使用的物種名稱是否符合國際通用的分類系統(tǒng)和命名規(guī)范。
完整性——按照數(shù)據(jù)規(guī)則要求,數(shù)據(jù)元素被賦予數(shù)值的程度。例如記錄對象為植物時,記錄對象標(biāo)識必須含有規(guī)范的拉丁學(xué)名、日期、地址等必要信息。
準(zhǔn)確性——數(shù)據(jù)準(zhǔn)確表示其所描述的真實(shí)實(shí)體(實(shí)際對象)真實(shí)值的程度。例如記錄對象的類、科、目、種、棲息生境、觀測數(shù)據(jù)等。
一致性——數(shù)據(jù)與其他特定上下文中使用的數(shù)據(jù)無矛盾的程度。例如記錄對象的觀測數(shù)據(jù)與記錄是否匹配。
時效性——數(shù)據(jù)在時間變化中的正確程度。例如記錄對象的棲息生境、數(shù)量或是保護(hù)等級等信息有變化,需及時進(jìn)行修改更新。
可訪問性——數(shù)據(jù)能被訪問的程度。
(4)數(shù)據(jù)存儲
數(shù)據(jù)存儲規(guī)范是數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范中的重要內(nèi)容,它涉及數(shù)據(jù)的存儲方式、存儲周期等方面。制定數(shù)據(jù)存儲規(guī)范時,應(yīng)明確數(shù)據(jù)的存儲方式以及備份策略等,以便在不同系統(tǒng)和環(huán)境中存儲數(shù)據(jù)時能夠保證數(shù)據(jù)的一致性、可靠性和互操作性。數(shù)據(jù)存儲標(biāo)準(zhǔn)化通常涉及數(shù)據(jù)格式、數(shù)據(jù)命名規(guī)范、數(shù)據(jù)存儲結(jié)構(gòu)、數(shù)據(jù)安全性等方面的規(guī)范。通過數(shù)據(jù)存儲標(biāo)準(zhǔn)化,可以提高數(shù)據(jù)管理的效率,降低數(shù)據(jù)交換和共享的成本,同時也有利于數(shù)據(jù)的長期保存和開發(fā)利用。
(5)數(shù)據(jù)處理
數(shù)據(jù)處理是指對數(shù)據(jù)進(jìn)行清洗、整合、分析等操作的過程。制定數(shù)據(jù)處理規(guī)范時,應(yīng)明確數(shù)據(jù)處理的方法、流程以及質(zhì)量控制標(biāo)準(zhǔn)等,以確保處理后的數(shù)據(jù)滿足業(yè)務(wù)或技術(shù)的需求。如圖3所示。
通過數(shù)據(jù)處理標(biāo)準(zhǔn)化,可以提高數(shù)據(jù)處理的效率和質(zhì)量,降低數(shù)據(jù)處理過程中的錯誤和風(fēng)險。此外,數(shù)據(jù)處理標(biāo)準(zhǔn)化也有助于提高數(shù)據(jù)的可管理性和可追溯性,以及促進(jìn)數(shù)據(jù)共享和交換。
4 結(jié)論
根據(jù)目前的國際趨勢,生物多樣性領(lǐng)域?qū)?shù)據(jù)的需求不斷增加,生物多樣性數(shù)據(jù)管理和共享的重要性日益凸顯。遵循生物多樣性數(shù)據(jù)標(biāo)準(zhǔn)可以確保數(shù)據(jù)的長期保存和共享。標(biāo)準(zhǔn)化的數(shù)據(jù)格式和結(jié)構(gòu)有助于數(shù)據(jù)的長期保存和管理,同時也促進(jìn)了數(shù)據(jù)的共享和再利用,不僅為科學(xué)研究的開展和決策制定提供了依據(jù),也為生物多樣性保護(hù)與管理提供科學(xué)支持,并推動生物多樣性領(lǐng)域的智能化發(fā)展和應(yīng)用。
作者簡介
李啟沅,高級工程師,主要從事生物技術(shù)標(biāo)準(zhǔn)化研究。
吳靜靜,工程師,主要從事生物技術(shù)標(biāo)準(zhǔn)化研究。
武慶超,工程師,主要從事生物技術(shù)標(biāo)準(zhǔn)化研究。
孫建波,工程師,主要從事生物技術(shù)標(biāo)準(zhǔn)化研究。
王博,通信作者,副研究員,主要從事生物技術(shù)研究。
(責(zé)任編輯:張佩玉)