司 莉賈 歡(.武漢大學(xué)信息資源研究中心 武漢 43007;.武漢大學(xué)信息管理學(xué)院 武漢 43007)
·新理念、新思潮、新視野論壇·
科學(xué)數(shù)據(jù)的標(biāo)準(zhǔn)規(guī)范體系框架研究*
司 莉1賈 歡2
(1.武漢大學(xué)信息資源研究中心 武漢 430072;2.武漢大學(xué)信息管理學(xué)院 武漢 430072)
科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范體系的建立有助于科學(xué)數(shù)據(jù)資源的交換與共享。通過調(diào)研科學(xué)數(shù)據(jù)相關(guān)平臺及查閱相關(guān)文獻(xiàn),初步構(gòu)建了科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范體系框架,并探討其具體內(nèi)容,涉及價值鑒定標(biāo)準(zhǔn)、數(shù)據(jù)質(zhì)量規(guī)范、元數(shù)據(jù)編寫規(guī)范及元數(shù)據(jù)標(biāo)準(zhǔn)、分類編碼標(biāo)準(zhǔn)、數(shù)據(jù)發(fā)布規(guī)范、引用標(biāo)準(zhǔn)六個方面,以期為我國科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范體系的建立提供借鑒。
科學(xué)數(shù)據(jù) 標(biāo)準(zhǔn)規(guī)范 元數(shù)據(jù) 引用標(biāo)準(zhǔn) 分類編碼
〔引用本文格式〕司莉, 賈歡.科學(xué)數(shù)據(jù)的標(biāo)準(zhǔn)規(guī)范體系框架研究[J].圖書館,2016 (5):5-9
科學(xué)數(shù)據(jù)是人類在認(rèn)識世界、改造世界的科技活動中所產(chǎn)生的原始性、基礎(chǔ)性數(shù)據(jù),以及按照不同需求系統(tǒng)加工的數(shù)據(jù)產(chǎn)品和相關(guān)信息[1]。在大數(shù)據(jù)科研環(huán)境下,對科學(xué)數(shù)據(jù)的獲取和利用是保障與促進(jìn)科研創(chuàng)新的前提。國內(nèi)外缺少統(tǒng)一的科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范體系,妨礙了不同領(lǐng)域科學(xué)數(shù)據(jù)的交換與共享。筆者在總結(jié)他人研究成果及調(diào)研現(xiàn)有科學(xué)數(shù)據(jù)平臺標(biāo)準(zhǔn)的基礎(chǔ)上,探討了科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)體系框架,認(rèn)為該標(biāo)準(zhǔn)體系由價值鑒定標(biāo)準(zhǔn)、數(shù)據(jù)質(zhì)量規(guī)范、元數(shù)據(jù)編寫規(guī)范及元數(shù)據(jù)標(biāo)準(zhǔn)、分類編碼標(biāo)準(zhǔn)、數(shù)據(jù)發(fā)布規(guī)范、引用標(biāo)準(zhǔn)六個方面構(gòu)成,以期對科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范體系的建立提供借鑒。
2.1科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范體系框架
我們認(rèn)為科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范體系框架由以下內(nèi)容組成:價值鑒定標(biāo)準(zhǔn)、數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)、元數(shù)據(jù)編寫規(guī)范及元數(shù)據(jù)標(biāo)準(zhǔn)、分類編碼標(biāo)準(zhǔn)、數(shù)據(jù)發(fā)布標(biāo)準(zhǔn)、引用標(biāo)準(zhǔn)。如圖1所示:
圖1 科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范體系框架
2.2框架構(gòu)成的要素
2.2.1價值鑒定標(biāo)準(zhǔn)
科學(xué)數(shù)據(jù)價值鑒定標(biāo)準(zhǔn)為衡量科學(xué)數(shù)據(jù)質(zhì)量提供了參考依據(jù)。我們在借鑒相關(guān)研究的基礎(chǔ)上[2],提出科學(xué)數(shù)據(jù)價值鑒定通用標(biāo)準(zhǔn),主要由以下內(nèi)容組成(見表1)。
表1 科學(xué)數(shù)據(jù)價值鑒定通用標(biāo)準(zhǔn)
其中,成本效益標(biāo)準(zhǔn)中的替代成本僅適用于除觀察與觀測數(shù)據(jù)外的科學(xué)數(shù)據(jù)。在實際對科學(xué)數(shù)據(jù)價值進(jìn)行判斷時,需要進(jìn)一步制定詳細(xì)的可量化價值鑒定標(biāo)準(zhǔn)指標(biāo),使標(biāo)準(zhǔn)具有可操作性。每一指標(biāo)所涵蓋的范圍應(yīng)明確,并盡量避免各指標(biāo)所涵蓋內(nèi)容之間的交叉。
2.2.2數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)
數(shù)據(jù)質(zhì)量測評是鑒定科學(xué)數(shù)據(jù)價值的首要依據(jù)。我們在參考中國科學(xué)院計算機網(wǎng)絡(luò)信息中心制定的《數(shù)據(jù)質(zhì)量評測方法與指標(biāo)體系》[3]的基礎(chǔ)上,歸納出數(shù)據(jù)質(zhì)量評價指標(biāo),如表2所示。
表2 數(shù)據(jù)質(zhì)量評價指標(biāo)
除了上述通用的數(shù)據(jù)質(zhì)量測評規(guī)范,我們還需要制定專業(yè)領(lǐng)域的數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)。如可借鑒中國林業(yè)科學(xué)研究院資源信息研究所針對林業(yè)領(lǐng)域制定的《林業(yè)專題空間數(shù)據(jù)質(zhì)量控制標(biāo)準(zhǔn)》[4],提出林業(yè)專題空間數(shù)據(jù)的質(zhì)量標(biāo)準(zhǔn)包括數(shù)據(jù)的完整性(包括數(shù)據(jù)覆蓋范圍和數(shù)據(jù)層完整)、位置精度(包括數(shù)學(xué)基礎(chǔ)精度、平面位置精度)、屬性精度、合理性(包括數(shù)據(jù)邏輯一致性、拓?fù)湟恢滦?、成圖合理性)等內(nèi)容。
2.2.3元數(shù)據(jù)編寫規(guī)范及元數(shù)據(jù)標(biāo)準(zhǔn)
(1)元數(shù)據(jù)編寫規(guī)范
元數(shù)據(jù)編寫規(guī)范包括數(shù)據(jù)集名稱規(guī)范和數(shù)據(jù)集摘要規(guī)范。如地球系統(tǒng)科學(xué)數(shù)據(jù)共享網(wǎng)制定了《元數(shù)據(jù)編寫規(guī)范(討論稿)》[5]。其數(shù)據(jù)集名稱應(yīng)包含數(shù)據(jù)統(tǒng)計時間、區(qū)域、精細(xì)程度、專題要素等內(nèi)容。如數(shù)據(jù)集名稱“全國1:10萬土地利用數(shù)據(jù)(1980s,1995,2000)”。其中“全國”為數(shù)據(jù)的區(qū)域;“1:10萬”為數(shù)據(jù)的精細(xì)程度;“土地利用”為專題要素;“1980s,1995,2000”表示數(shù)據(jù)統(tǒng)計時間。數(shù)據(jù)集摘要規(guī)范需說明數(shù)據(jù)來源和數(shù)據(jù)的加工生產(chǎn)與整理方法。在編寫元數(shù)據(jù)時,還應(yīng)注重元數(shù)據(jù)的粒度規(guī)范,即在哪個層次上(數(shù)據(jù)實體、數(shù)據(jù)集、數(shù)據(jù)庫)編寫元數(shù)據(jù),如地球系統(tǒng)科學(xué)數(shù)據(jù)共享網(wǎng)規(guī)定以數(shù)據(jù)集為基本單位進(jìn)行元數(shù)據(jù)的編寫。
(2)元數(shù)據(jù)標(biāo)準(zhǔn)
我們認(rèn)為,元數(shù)據(jù)標(biāo)準(zhǔn)包括通用的元數(shù)據(jù)標(biāo)準(zhǔn)和專業(yè)領(lǐng)域的元數(shù)據(jù)標(biāo)準(zhǔn)。
①通用的元數(shù)據(jù)標(biāo)準(zhǔn)。通用的元數(shù)據(jù)標(biāo)準(zhǔn)應(yīng)包括描述信息、元數(shù)據(jù)參考信息和聯(lián)系信息3個模塊。如中科院網(wǎng)絡(luò)信息中心制定了通用的《數(shù)據(jù)集核心元數(shù)據(jù)標(biāo)準(zhǔn)》[6]。其中描述信息、元數(shù)據(jù)參考信息均為必選模塊,聯(lián)系信息為輔助模塊。元數(shù)據(jù)元素由9個屬性來定義:中文名稱、英文名稱、標(biāo)識、定義、類型、值域、可選性、最大出現(xiàn)次數(shù)、注釋。3個模塊及其所包括的元數(shù)據(jù)元素如表3所示。②專業(yè)領(lǐng)域的元數(shù)據(jù)標(biāo)準(zhǔn)。為了解各專業(yè)領(lǐng)域科學(xué)數(shù)據(jù)的元數(shù)據(jù)標(biāo)準(zhǔn)現(xiàn)狀,筆者對地震[7]、林業(yè)[8]、生態(tài)[9]、煤地質(zhì)學(xué)[10]領(lǐng)域的專業(yè)元數(shù)據(jù)標(biāo)準(zhǔn),從元數(shù)據(jù)實體和元素的定義和描述方式及其屬性、元數(shù)據(jù)實體集模塊劃分3個方面對其元數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行歸納,如表4所示。
表3 核心元數(shù)據(jù)標(biāo)準(zhǔn)模塊及其元數(shù)據(jù)元素
表4 專業(yè)元數(shù)據(jù)標(biāo)準(zhǔn)及其元數(shù)據(jù)元素
由上表可知:a在元數(shù)據(jù)實體和元素的定義和描述方式中,地震和林業(yè)領(lǐng)域均包括摘要表示和字典表示兩種方式,地震領(lǐng)域還提出了用UML(Unified Model Language)圖方式。UML圖采用統(tǒng)一建模語言進(jìn)行模型的構(gòu)建,并用以表示元數(shù)據(jù)子集、元數(shù)據(jù)實體和元數(shù)據(jù)元素之間的關(guān)系。b在定義和描述方式的屬性元素中,地震和林業(yè)領(lǐng)域的摘要表示屬性相同,字典表示的屬性中,林業(yè)領(lǐng)域比地震領(lǐng)域多了“級別”屬性,地震領(lǐng)域中的一個屬性為“短名”,在林業(yè)中為“短名和域代碼”,其他屬性均相同,生態(tài)領(lǐng)域的數(shù)據(jù)元素屬性除了比地震領(lǐng)域的多“英文名稱”屬性外,其他的大致相同。c在元數(shù)據(jù)實體集模塊劃分方面:地震、林業(yè)、生態(tài)、煤地質(zhì)四個領(lǐng)域均包含標(biāo)識信息、分發(fā)信息、數(shù)據(jù)質(zhì)量信息三個模塊??梢?,在制定專業(yè)領(lǐng)域的元數(shù)據(jù)標(biāo)準(zhǔn)時,此三個模塊為必要模塊,其他模塊可根據(jù)專業(yè)領(lǐng)域的不同建立其特有的信息模塊。
2.2.4分類編碼標(biāo)準(zhǔn)
為了解各個專業(yè)領(lǐng)域的科學(xué)數(shù)據(jù)分類編碼現(xiàn)狀,筆者對基礎(chǔ)科學(xué)數(shù)據(jù)[1]、地震[11]、人口健康[12]、林業(yè)[13]、煤礦安全領(lǐng)域[14]的科學(xué)數(shù)據(jù)的分類編碼規(guī)范進(jìn)行分析,從編碼結(jié)構(gòu)/分類法、代碼形式、代碼長度、代碼表示方式四方面對專用分類編碼規(guī)范進(jìn)行歸類整理。如表5所示:
表5 專業(yè)領(lǐng)域的科學(xué)數(shù)據(jù)分類編碼規(guī)范
2.2.5數(shù)據(jù)發(fā)布規(guī)范
數(shù)據(jù)發(fā)布是數(shù)據(jù)共享的前提?!兜卣鹂茖W(xué)數(shù)據(jù)發(fā)布規(guī)范》包括數(shù)據(jù)的分級、元數(shù)據(jù)的發(fā)布要求、元數(shù)據(jù)的發(fā)布對象及發(fā)布方式、質(zhì)量控制等內(nèi)容[15]。地震科學(xué)數(shù)據(jù)分為四個等級。一級數(shù)據(jù)為可向社會公眾公開發(fā)布的數(shù)據(jù);二級數(shù)據(jù)為能夠向國內(nèi)、國外用戶提供的數(shù)據(jù);三級數(shù)據(jù)為可以向國內(nèi)用戶提供的數(shù)據(jù);四級數(shù)據(jù)為只允許向特定范圍的用戶提供的數(shù)據(jù)。發(fā)布方式有在線方式和離線方式。一至三級數(shù)據(jù)以在線方式為主發(fā)布,在線方式主要通過網(wǎng)站提供數(shù)據(jù)的查詢、瀏覽和下載,四級數(shù)據(jù)主要采取離線方式發(fā)布,離線方式主要通過光盤和紙介質(zhì)等媒體提供數(shù)據(jù)。元數(shù)據(jù)的發(fā)布要求應(yīng)為所有用戶提供查詢和下載服務(wù)。發(fā)布原始數(shù)據(jù)或加工數(shù)據(jù)時,應(yīng)同時發(fā)布與該數(shù)據(jù)集相關(guān)的基礎(chǔ)數(shù)據(jù);發(fā)布加工數(shù)據(jù)時,應(yīng)同時說明數(shù)據(jù)加工的方法和程序,以及使用的原始數(shù)據(jù)和基礎(chǔ)數(shù)據(jù);鼓勵發(fā)布與數(shù)據(jù)解釋或應(yīng)用所需的應(yīng)用程序;鼓勵對原始數(shù)據(jù)進(jìn)行加工和產(chǎn)品開發(fā),并發(fā)布加工數(shù)據(jù)和產(chǎn)品;應(yīng)盡可能提供數(shù)據(jù)的可視化展示;應(yīng)采用國家標(biāo)準(zhǔn)物理單位,并說明或標(biāo)明數(shù)據(jù)的單位;應(yīng)說明數(shù)據(jù)的質(zhì)量信息。數(shù)據(jù)的發(fā)布對象及發(fā)布方式如表6所示:
表6 科學(xué)數(shù)據(jù)的發(fā)布對象及發(fā)布方式
在發(fā)布數(shù)據(jù)時,一級、二級、三級數(shù)據(jù)均要求應(yīng)同時發(fā)布相應(yīng)的元數(shù)據(jù)或文檔說明,注明數(shù)據(jù)來源、內(nèi)容、格式、時間屬性(范圍和分辨率)、空間屬性(范圍和分辨率)、制作單位等。二級和三級數(shù)據(jù)還要求注明統(tǒng)計處理方法、質(zhì)量狀況和質(zhì)量控制方法。各級數(shù)據(jù)在發(fā)布前均需對數(shù)據(jù)進(jìn)行質(zhì)量控制,四級數(shù)據(jù)的要求最為嚴(yán)格,必須按照國家有關(guān)標(biāo)準(zhǔn)和規(guī)范制作,并經(jīng)過嚴(yán)格的質(zhì)量檢測后才能發(fā)布,發(fā)布時要采取必要的安全措施,保證數(shù)據(jù)的安全。
2.2.6引用標(biāo)準(zhǔn)
科學(xué)數(shù)據(jù)的規(guī)范化引用目的是借鑒傳統(tǒng)文獻(xiàn)評價體系,使用類似引文的評價方式,對數(shù)據(jù)創(chuàng)建者的貢獻(xiàn)給予承認(rèn)并量化貢獻(xiàn)度。數(shù)據(jù)規(guī)范引用有利于保護(hù)數(shù)據(jù)創(chuàng)建者的知識產(chǎn)權(quán),便于統(tǒng)計和分析數(shù)據(jù)引用情況。為用戶提供數(shù)據(jù)定位和參考機制,增加數(shù)據(jù)的重用與共享,并提供了驗證科研過程的路徑[16, 17]??茖W(xué)數(shù)據(jù)的規(guī)范化引用格式分別由通用領(lǐng)域和專業(yè)領(lǐng)域提出。
(1)通用領(lǐng)域科學(xué)數(shù)據(jù)引用規(guī)范
中國科學(xué)院計算機網(wǎng)絡(luò)信息中心提出科學(xué)數(shù)據(jù)通用領(lǐng)域的引用規(guī)范[18, 19]。其引用規(guī)范均包含兩種形式,分別為由必選元素組成的引用格式和由全部元素組成的引用格式兩種。
計算機網(wǎng)絡(luò)信息中心制定的《科學(xué)數(shù)據(jù)引用規(guī)范》對科學(xué)數(shù)據(jù)的引用包括八個必選要素(作者、名稱、發(fā)布機構(gòu)[發(fā)布機構(gòu)]、發(fā)布年份、傳播機構(gòu)[傳播機構(gòu)]、傳播時間、唯一標(biāo)識符和解析地址)和一個可選要素(版本)。其中,由必選元素組成的引用格式為:作者.名稱.發(fā)布機構(gòu)[發(fā)布機構(gòu)],發(fā)布年份.傳播機構(gòu)[傳播機構(gòu)],傳播時間.唯一標(biāo)識符;解析網(wǎng)址. 由全部元素組成的引用信息格式為:作者.名稱(版本).發(fā)布機構(gòu)[發(fā)布機構(gòu)],發(fā)布年份.傳播機構(gòu)[傳播機構(gòu)],傳播時間.唯一標(biāo)識符;解析網(wǎng)址.
(2)專業(yè)領(lǐng)域科學(xué)數(shù)據(jù)引用規(guī)范
筆者調(diào)研國家地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺,此平臺也為用戶提供了數(shù)據(jù)引用格式,如在數(shù)據(jù)直通車欄目的20個條目數(shù)據(jù)集中[20],除了2條的數(shù)據(jù)引用聲明元素中沒有解析網(wǎng)址,其他18條數(shù)據(jù)引用格式均為:作者.名稱.出版者,出版時間.唯一標(biāo)識符,解析網(wǎng)址。
如:張鐿鋰,李炳元,鄭度.《論青藏高原范圍與面積》一文數(shù)據(jù)的發(fā)表:青藏高原范圍界線與面積地理信息系統(tǒng)數(shù)據(jù).全球變化科學(xué)研究數(shù)據(jù)出版系統(tǒng),2014. DOI: 10.3974/geodb.2014.01.12.v1,http://www.geodoi. ac.cn/doi.aspx?doi=10.3974/geodb.2014.01.12.v1[21]。
筆者進(jìn)一步瀏覽本平臺的其他數(shù)據(jù)集,發(fā)現(xiàn)引用格式與數(shù)據(jù)直通車中的并不一致,說明此平臺引用標(biāo)準(zhǔn)還沒有完全統(tǒng)一。
目前,數(shù)據(jù)引用格式還需進(jìn)一步規(guī)范化。制定數(shù)據(jù)引用標(biāo)準(zhǔn)需要考慮以下幾個基本問題:數(shù)據(jù)版本、數(shù)據(jù)粒度、數(shù)據(jù)驗證、引用數(shù)據(jù)或數(shù)據(jù)論文、唯一標(biāo)識符分配[16, 17]。數(shù)據(jù)引用標(biāo)準(zhǔn)制定需要數(shù)據(jù)擁有者、數(shù)據(jù)出版商、數(shù)據(jù)用戶、數(shù)據(jù)整合者、數(shù)據(jù)監(jiān)管者等的共同努力。
筆者初步構(gòu)建由價值鑒定標(biāo)準(zhǔn)、數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)、元數(shù)據(jù)編寫規(guī)范及元數(shù)據(jù)標(biāo)準(zhǔn)、分類編碼標(biāo)準(zhǔn)、數(shù)據(jù)發(fā)布標(biāo)準(zhǔn)、引用標(biāo)準(zhǔn)組成的科學(xué)數(shù)據(jù)標(biāo)準(zhǔn)體系框架,并探討了其組成的要素。目前,還未建立關(guān)于價值鑒定標(biāo)準(zhǔn)的完整的指標(biāo)體系;在數(shù)據(jù)質(zhì)量規(guī)范方面,專有領(lǐng)域的質(zhì)量測評指標(biāo)有待細(xì)化;元數(shù)據(jù)標(biāo)準(zhǔn)中標(biāo)準(zhǔn)模塊、元數(shù)據(jù)表示方式及元數(shù)據(jù)要素屬性也需要進(jìn)一步規(guī)范;分類編碼還缺少通用標(biāo)準(zhǔn);引用標(biāo)準(zhǔn)因?qū)W科領(lǐng)域、平臺的不同而有所差異??茖W(xué)數(shù)據(jù)標(biāo)準(zhǔn)體系本身仍需進(jìn)一步完善,如將數(shù)據(jù)交換格式、數(shù)據(jù)資源加工規(guī)范、互操作技術(shù)規(guī)范、數(shù)據(jù)庫建設(shè)規(guī)范、資源唯一標(biāo)識符規(guī)范、數(shù)據(jù)服務(wù)規(guī)范等隨著研究的豐富與實踐的積累逐漸納入標(biāo)準(zhǔn)體系之中。對于科學(xué)數(shù)據(jù)的標(biāo)準(zhǔn)規(guī)范體系的探討還處于起步階段。
(來稿時間:2015年11月)
1.基礎(chǔ)科學(xué)數(shù)據(jù)分類規(guī)范[EB/OL].[2015-09-14].http://www. nsdc.cn/upload/110526/1105261317389550.pdf
2.鄧君,賈曉青,馬曉君,等.科學(xué)數(shù)據(jù)價值鑒定標(biāo)準(zhǔn)研究[J].情報科學(xué), 2013, 31(9):37-41
3. 數(shù)據(jù)質(zhì)量評測方法與指標(biāo)體系[EB/OL]. [2015-09-16]. http://www.nsdc.cn/upload/110526/1105261353505540.pdf
4. 林業(yè)專題空間數(shù)據(jù)質(zhì)量控制標(biāo)準(zhǔn)[EB/OL].[2015-09-16]. http://www.forestdata.cn/uploadword/7-linyezhuantikongjianshu juzhiliangkongzhibiaozhun.html
5. 地球系統(tǒng)科學(xué)數(shù)據(jù)共享網(wǎng)元數(shù)據(jù)編寫規(guī)范(討論稿)[EB/OL].[2015-08-25].http://www.geodata.cn/Portal/metadata/ publish.jsp?isCookieChecked=true
6. 數(shù)據(jù)集核心元數(shù)據(jù)標(biāo)準(zhǔn)[EB/OL].[2015-07-14].http://www. nsdc.cn/upload/110526/1105261308547770.pdf
7. 地震科學(xué)數(shù)據(jù)元數(shù)據(jù)編寫指南[EB/OL].[2015-09-15]. http://data.earthquake.cn/policy/metadata060301.doc
8. 林業(yè)科學(xué)數(shù)據(jù)元數(shù)據(jù)標(biāo)準(zhǔn)(V3.10版)[EB/OL]. [2015-09-15].http://www.forestdata.cn/uploadword/1-linyekexueshujugongxiangyuanshujubiaozhun(V3.10).html
9. 吳彬.生態(tài)科學(xué)數(shù)據(jù)元數(shù)據(jù)及其標(biāo)準(zhǔn)研究[J].中南林業(yè)科技大學(xué)學(xué)報, 2010, 30(12):75-79
10.曹代勇,郝偉.煤地質(zhì)學(xué)元數(shù)據(jù)標(biāo)準(zhǔn)化研究[J].煤炭學(xué)報, 2008, 33(3):285-288
11. 地震科學(xué)數(shù)據(jù)數(shù)據(jù)分類與編碼[EB/OL].[2012-09-12]. http://data.earthquake.cn/policy/fenleibianma.doc
12. 人口健康科學(xué)數(shù)據(jù)共享平臺數(shù)據(jù)資源分類與編碼方案 [EB/OL].[2015-09-03].http://www.ncmi.cn/UploadFile/7/0/b660 d6dbf9e0b9e97a4421fbdf765d07.pdf
13. 林業(yè)科學(xué)數(shù)據(jù)分類與編碼(V1.0)[EB/OL].[2015-09-16]. http://www.forestdata.cn/uploadword/5-linyekexueshujufenleiyubianma.html
14. 郝秦霞,趙安新,盧建軍.煤礦安全系統(tǒng)數(shù)據(jù)資源共享標(biāo)準(zhǔn)的構(gòu)建[J].礦業(yè)安全與環(huán)保, 2008, 35(2):31-33
15. 地震科學(xué)數(shù)據(jù)數(shù)據(jù)發(fā)布規(guī)范[EB/OL].[2015-09-12]. http://data.earthquake.cn/policy/shujufabu.doc
16. 王丹丹.科學(xué)數(shù)據(jù)規(guī)范引用關(guān)鍵問題探析[J].圖書情報工作, 2015, 59(8):42-47, 53
17. 張靜蓓,田野,呂俊生.科學(xué)數(shù)據(jù)引用規(guī)范研究進(jìn)展[J].圖書與情報, 2014(5):100-104
18. 科學(xué)數(shù)據(jù)引用規(guī)范[EB/OL].[2015-07-13].http://www.nsdc. cn/upload/120822/1208220929441440.pdf
19. Data Citation[EB/OL].[2015-09-05].http://ands.org.au/ cite-data/index.html
20. 數(shù)據(jù)直通車[EB/OL].[2015-09-08].http://www2.geodata. cn/thematicView/
21. 青藏高原范圍與界線數(shù)據(jù)[EB/OL].[2015-09-08]. http:// www2.geodata.cn/data/datadetails.html?dataguid=15975219648 1165
Study on Standard and Specification Systematic Framework of Scientific Data
Si Li1Jia Huan2
( 1.Center for Studies of Information Resources, Wuhan University;2.School of Information Management, Wuhan University )
〕Establishing standard and specification systematic framework of scientific data help scientific data resources exchanging and sharing. By investigating relevant scientific data platforms and reading literature, this article builds systematic framework and discusses its content which includes six aspects: value appraisal standard, data quality specification, metadata writing specification and metadata standard, classification and coding standard, data published specification, reference standard, so as to provide reference to establish the system of standard and specification for scientific data in China.
〕Scientific data Standard specification Metadata Quoted standard Classification and coding standard
G250
* 本文系教育部人文社會科學(xué)研究項目“我國科學(xué)數(shù)據(jù)集成與共享的保障研究”(項目編號:13YJA870016)、國家自然科學(xué)基金“大數(shù)據(jù)環(huán)境下科研數(shù)據(jù)機構(gòu)庫聯(lián)盟形成機理及其服務(wù)研究”(項目編號:71573198)成果之一。
司莉(1965-),女,博士,教授,研究方向:知識組織與知識管理;賈歡(1988-),女,博士研究生,研究方向:知識組織與知識管理。