王江寧,韓艷,紀力強*
1.中國科學院動物研究所,北京 100101
數(shù)據(jù)庫(集)基本信息簡介
數(shù)據(jù)庫(集)名稱 中國粉蝶標本圖像特征數(shù)據(jù)集數(shù)據(jù)作者 王江寧,韓艷,紀力強數(shù)據(jù)通信作者 紀力強(ji@ioz.ac.cn)數(shù)據(jù)時間范圍 1994年地理區(qū)域 中國數(shù)據(jù)量 1.62 MB數(shù)據(jù)格式 *.xlsx數(shù)據(jù)服務系統(tǒng)網(wǎng)址 http://www.sciencedb.cn/dataSet/handle/483基金項目國家自然科學青年基金(2016),基于在線學習的昆蟲圖像識別方法的研究及其在蝴蝶識別中的應用(31501841);國家科技部國家科技基礎條件平臺項目“國家基礎科學數(shù)據(jù)共享服務平臺”(DKA2017-12-02-20)數(shù)據(jù)庫(集)組成本數(shù)據(jù)集收集了457幅中國粉蝶標本圖像的分類信息,從中提取的顏色、形狀、紋理特征數(shù)據(jù),以及原始標本縮略圖的索引。excel的sheet1表由4個字段組成,其數(shù)據(jù)樣本描述可以參考《中國鳳蝶標本圖像特征數(shù)據(jù)集》一文的數(shù)據(jù)樣本描述。關聯(lián)數(shù)據(jù)集 《中國鳳蝶標本圖像特征數(shù)據(jù)集》,發(fā)表于《中國科學數(shù)據(jù)》2016年第1卷第3期,網(wǎng)址:http://www.csdata.org/p/34/。關聯(lián)說明 數(shù)據(jù)集加工方法、質控方法的相同,標本數(shù)據(jù)源的生物類群不同。
動物的分類系統(tǒng)相對于其它生命的分類系統(tǒng)較為復雜、種類繁多,因此動物圖像采集與其它生物圖像采集相比較為困難。對于蝴蝶來說,從標本采集到圖像采集,再至特征提取,能夠使用的數(shù)據(jù)非常少。為了便于蝴蝶模式識別研究和應用,2016年我們發(fā)布了《中國鳳蝶標本圖像特征數(shù)據(jù)集》[1]。
粉蝶和鳳蝶是蝴蝶的兩大常見類群。繼收集整理《中國蝶類志》(1994版)[2]中的鳳蝶標本圖片后,我們采用類似的方法[1,3],從457幅經(jīng)過處理后的中國粉蝶標本圖像中提取顏色、形狀、紋理3個最常用特征的數(shù)值數(shù)據(jù),得到粉蝶圖像特征數(shù)據(jù)集,依然配有準確的分類學信息、模式識別方法。
由于本數(shù)據(jù)集與《中國鳳蝶標本圖像特征數(shù)據(jù)集》的采集方法、結構組成、質量評估和控制、使用方法等都相同,因此這些部分請參考關聯(lián)文獻[1],此處不再贅述。兩者的比較如表 1所示。兩者共同構成了更完整的蝴蝶標本圖像特征數(shù)據(jù)集。但是因為數(shù)據(jù)獲取需要時間,而且面向的蝴蝶類群不同,因此也是相對獨立的數(shù)據(jù)集,是對蝴蝶整體數(shù)據(jù)的重要補充。昆蟲分類學研究人員可以將其與鳳蝶標本圖像特征數(shù)據(jù)集結合使用。
表1 新舊數(shù)據(jù)集比較