許百泉,胡小平,朱衛(wèi)紅
(1.北京大學地球與空間科學學院,北京100871;2.中國地質調查局發(fā)展研究中心,北京100037;3.中國地質調查局西安地質調查中心,陜西 西安 710054)
NGGDPP—美國國家地質與地球物理數(shù)據(jù)保存計劃
許百泉1,2,胡小平2,朱衛(wèi)紅3
(1.北京大學地球與空間科學學院,北京100871;2.中國地質調查局發(fā)展研究中心,北京100037;3.中國地質調查局西安地質調查中心,陜西 西安 710054)
NGGDPP是美國的國家級地球科學數(shù)據(jù)保存計劃,該計劃主要由美國地質調查局實施并管理,覆蓋了國家地質調查局以及其他內政部保存有地質和地球物理資料和樣品的機構。NGGDPP的成員負責對國家地調局和內政部相關機構已經(jīng)收集的資料和數(shù)據(jù)進行編目,以便確定這些資料和數(shù)據(jù)是否需要保存和搶救維護;設計并構建一個國家級的數(shù)字地質資料和數(shù)據(jù)目錄;制定計劃資金分配指南和建立計劃實施的優(yōu)先權;研究地質和地球物理資料和數(shù)據(jù)的保存與歸檔基本標準、流程和數(shù)據(jù)傳送標準等。美國通過NGGDPP的執(zhí)行,提升了獲取和保存實物資料和數(shù)據(jù)的方式,使得這些信息對于科學的服務更為有效。本文通過介紹NGGDPP,為我國地質資料管理與服務提供參考。
NGGDPP;地質資料;美國
2005年,美國針對能源利用效率、可再生資源、石油和天然氣、煤炭、印第安能源、核物質、市政用車和燃料、氫能、環(huán)境變化等18個重點科研領域,研究、制定并通過了《能源政策法案》(The Energy Policy Act of 2005,Public Law 109-58,以下簡稱《法案》)[1]。在每個重點的領域,法案中都制定了詳細的標準和計劃,保證在未來,我們可以使用安全、廉價和可靠的能源?!斗ò浮返奶岢?,確定了各個重點科研領域的重大計劃及其相關參與機構,并為相關計劃獲取技術與資金支持的渠道提供了法律保障和國家監(jiān)管。
國家地質與地球物理數(shù)據(jù)保存計劃(NGGDPP)是《法案》中為了鼓勵美國各個州級地質調查機構,積極投入到石油和天然氣地質調查工作,專門設立的地質與地球物理資料保存計劃,由美國地質調查局(USGS)負責執(zhí)行。按照《法案》第351條規(guī)定[1,2],該 計 劃 在 美 國 內 政 部 (United States Department of the Interior,DOI)設立秘書處和顧問委員會,選出部分州立機構作為該計劃的參加成員,并按照年度給與資金支持;州級地質調查機構則負責改善地質資料的保管環(huán)境,保管地質與地球物理數(shù)據(jù)和標本。USGS及聯(lián)邦成員研究并制定通用的數(shù)據(jù)和標本保存標準、流程和協(xié)議,努力形成一個全國范圍的地學資料和數(shù)據(jù)保管的合作網(wǎng)絡,實現(xiàn)地質資料全國范圍內的通用共享、分散保管。
2012年,NGGDPP正式納入美國核心科學系統(tǒng)[3](Core Science Systems,CSS),并成為 CSS五大關鍵行動之一,接受美國國家科學基金會(National Science Foundation,NFS)的支持。CSS的另一項關鍵行動“美國核心科學分析與集成研究(Core Science Analytics and Synthesis,CSAS)”則為該計劃提供基于地理空間的數(shù)據(jù)和信息、標準和方法等一系列的技術性專門知識。目前,NGGDPP不斷開發(fā)系列工具,進行數(shù)據(jù)整合與分析,并和其他團隊進行協(xié)作研究,在CSS五大關鍵行動中起到了重要的作用,引領者USGS在地學標本數(shù)據(jù)管理與保存,提高了CSAS對地學數(shù)據(jù)的集成、分析和可視化能力。
目前,NGGDPP所有的地學資料通過基于網(wǎng)絡的國家數(shù)字化目錄(Internet-based National Digital Catalog)進行統(tǒng)一著錄與發(fā)布,形成了一個國家級、州級地調機構、學術與科研機構互聯(lián)互通的數(shù)據(jù)中心,統(tǒng)一向全國服務。目前這個國家級的數(shù)字目錄可以提供來自美國地調局和州級地質調查機構等200多萬條的地質樣品元數(shù)據(jù)信息。通過NGGDPP,美國提升了獲取和保存實物地質資料和數(shù)據(jù)的方式,提高了地學信息對科學的服務效率。
《法案》規(guī)定,美國國家地質與地球物理數(shù)據(jù)保存計劃共有四項基本任務[4]:①對地質、地球物理、工程數(shù)據(jù)、圖件、鉆孔和標本進行保存;②提供一個國家級的資料保管目錄;③提供技術和資金支持,幫助各州級地質調查機構和內政部相關部門保存資料。對美國地調局和內政部相關機構收集到的資料和數(shù)據(jù)進行編目,確定這些資料和數(shù)據(jù)是否需要保存和搶救維護;②設計并構建一個國家級的數(shù)字地質資料和數(shù)據(jù)目錄;③制定計劃資金分配指南,確定計劃實施的優(yōu)先權;④研究地質和地球物理資料和數(shù)據(jù)的保存與歸檔最低標準、流程和數(shù)據(jù)傳送規(guī)則等。通過以上四項基本任務,努力實現(xiàn)《法案》規(guī)定的三項計劃目標[4]:
NGGDPP計劃主要由美國地質調查局實施、監(jiān)督和管理,覆蓋了國家地質調查局以及其他內政部保存有地質和地球物理資料和樣品的機構。NGGDPP的聯(lián)邦成員為內政部(DOI)各聯(lián)邦機構,負責收集與維護地質與地球物理學數(shù)據(jù)和需要檔案保存的樣品;NGGDPP州級成員包括州立地質調查局、大學、科研機構和企業(yè)等類似的機構。國家地質與地球物理數(shù)據(jù)保存計劃正是通過聯(lián)合這些不同的機構,共同致力于美國地質資料信息的儲存與收集,確保數(shù)據(jù)的安全貯存及瀕危數(shù)據(jù)的及時挽救。USGS為該計劃各個項目的資金分布及項目優(yōu)先順序建立開發(fā)指導方案,同時建立地質與地球物理數(shù)據(jù)最低保存及歸檔標準、規(guī)程及條款等,該計劃的每個參加成員則依據(jù)相關標準設計與制作地質資料的元數(shù)據(jù),補充更新國家數(shù)字化目錄。
NGGDPP通過提供不設上限的科研基金,鼓勵其他組織機構積極地參與到相關的項目中。美國地質調查局則運用專門對該計劃額外撥付的經(jīng)費對計劃進行管理[5],確保經(jīng)費平均分配給參與計劃的各個機構。其中,聯(lián)邦成員在每個財政年度獲得的活動經(jīng)費所占份額不超過該財政年度聯(lián)邦撥款總額的三分之一,而各個州級成員通過1:1的形式,獲得聯(lián)邦財政撥款和非聯(lián)邦財政的共同支持,具體的數(shù)額取決于各州所提供的匹配資金數(shù)額。
2007年以來(見圖1和表1),能夠獲得財政補助項目的數(shù)量逐年遞減,財政撥款總額則保持在60萬美元左右;2013年開始,財政補助的項目數(shù)量和財政補助金額開始有所回升,并得到了大幅度的增長。2014年度,NGGDPP支持25個項目共計達82萬美元,平均每個項目獲得的資金支持為2.5萬美元。2015年,該計劃打算投入83萬美元,支持20到35個不同項目的申請。目前,該計劃已于2015年3月9日開始接收項目申請,7月15日至9月15日將正式撥款用以資助相關項目。
NGGDPP設有同行評審小組,通過競爭選拔的方式,針對每個年度提交的項目申請,設定該年度財政補助計劃[5]。提案的提交者可以是個人、符合條件的聯(lián)邦或州立機構,同時,該計劃鼓勵大學或私營企業(yè)通過合作關系加入到該計劃中,以便充分地利用所有可以獲取的資源。評審小組的成員通常由來自內政部和州立地質調查局各5名代表組成。項目的資金可以作為薪金和工資發(fā)放給項目運作的全體成員,也可以用于項目中所需物資以及固定設備的采購。
表1 美國州級地質調查機構獲得聯(lián)邦基金資助金額和項目數(shù)
圖1 美國州級地質調查機構獲得聯(lián)邦基金資助金額和項目數(shù)
為保證項目的成功實施,對于項目資金申請的綜合評議將會側重以下四個因素[5]:①項目的價值和技術可行性,以及在規(guī)定的期限內可能取得的成果;②項目與NGGDPP和數(shù)據(jù)長期保存計劃(Long-Range Data Preservation Plan)的相關性;③項目負責人和參加成員的能力和近期成果;④預算的合理性,包括聯(lián)邦與州級資助資金如何按照1∶1匹配。
CSAS為NGGDPP成員提供了先進的ScienceBase數(shù)據(jù)管理平臺[6],通過對許多數(shù)據(jù)源和信息源的數(shù)據(jù)進行集成,提供協(xié)作性的、動態(tài)的科學數(shù)據(jù)管理框架,進行復雜的集成和分析。ScienceBase既是一個數(shù)據(jù)管理平臺,也是一個綜合的數(shù)據(jù)庫,包括現(xiàn)有數(shù)據(jù)系統(tǒng)的資料、元數(shù)據(jù)目錄和開展創(chuàng)新的科學家名單等。
NGGDPP各成員采用國家通用的科學元數(shù)據(jù)著錄、保存、管理與交換標準[3],制作并提交相關元數(shù)據(jù)的加工文件,并將信息及元數(shù)據(jù)添加和編輯到國家數(shù)據(jù)目錄(National Data Catalog)。NGGDPP的門戶 網(wǎng) 站 (http://datapreservation.usgs.gov/index.shtml)提供地質資料元數(shù)據(jù)參考信息的說明,用戶通過這些說明,可以了解信息獲取和編輯的方法。對于數(shù)據(jù)提供者,該計劃提供信息獲取、編輯、制作、網(wǎng)絡上傳等的標準和要求[4]。
NGGDPP成員,按照NGGDPP公開的元數(shù)據(jù)標準,首先對本機構的數(shù)據(jù)進行文件分類和編碼,然后NGGDPP授權他們將這些整理好的數(shù)據(jù)錄入國家數(shù)字化目錄中,數(shù)據(jù)管理者則對這些數(shù)據(jù)進行相應的編輯和處理。州級用戶可以通過國家數(shù)據(jù)目錄,對這些資料的基本信息進行瀏覽、添加和更新。最終,公眾可以通過選定的地圖區(qū)域、原始標本類型和數(shù)據(jù)目錄查詢等多種方式,查閱資料和標本的詳細信息。
NGGDPP對地學信息按照不同州名以文件夾的形式進行編輯和展示。例如:Alaska州所有的地質資料將以一個文件夾的形式存在,這個文件夾中則擁有13個原始標本專題館藏文件夾,每個館藏文件夾中則會建立記錄相關的標本名稱的文件夾。對于每個標本的描述信息,則會以網(wǎng)頁和交互式地圖的形式進行展示,提供關于標本的所有基礎元數(shù)據(jù)信息。每個標本的元數(shù)據(jù)信息包括兩部分,第一部分是州級地質調查機構提供的有關子文件夾描述、館藏標本信息和標本采集地點;第二部分則是由NGGDPP編輯制作的CSV或者XML附件。
在信息的制作方面,每個被授權的州級用戶,都可以制作本州館藏地質資料的元數(shù)據(jù)信息,同時他們可以查閱美國所有州級用戶的館藏地質資料信息作為參考。NGGDPP的元數(shù)據(jù)信息制作都通過網(wǎng)絡操作,且在用戶登錄頁面中有詳細的操作說明,用戶進行表格式填寫即可。樣品元數(shù)據(jù)信息通常包含13個要素,其中規(guī)定7個要素為必填,分別是:樣品編號(Collection ID)、標題(Title)、摘要(Abstract)、數(shù) 據(jù) 類 型 (Data Type)、補 充 信 息(Supplemental Information)、坐標(Coordinates)、數(shù)據(jù)入庫時間(Dataset Reference Data)等。其中,樣品編號在國家數(shù)字目錄(NDC)中是唯一的編碼,可填“空”,最終在文件上傳時,由NDC自動賦值;數(shù)據(jù)入庫時間則采用ISO 8601標準(例如:2010;2010-08;20100801;2010-08-01)。NGGDPP對幾項特殊的元數(shù)據(jù)信息填寫做出了重點說明:標題(反映標本保管地點、來源和內容)、保存原因、提供者、時間(系統(tǒng)自動生成)、聯(lián)系方式和元數(shù)據(jù)文件(CSV或者XML)編輯等。
數(shù)據(jù)管理者在CSV或者XML制作完成后,即可將文件上傳至NGGDPP,并轉送給相關的館藏機構進行復核,同時提供館藏機構的官方網(wǎng)站網(wǎng)絡訪問地址。在NGGDPP進行文件的核對之后,會主動通知數(shù)據(jù)管理者并告知信息提供者。
國家數(shù)字目錄(National Digital Catalog)由科學數(shù)據(jù)庫聯(lián)盟負責管理,是一個基于網(wǎng)絡的全分布式系統(tǒng),許多資料能夠經(jīng)由因特網(wǎng)通過數(shù)字形式傳輸[6]。通過NGGDPP,美國地質調查局對全國范圍內的地質資料進行整理、審核,最終實現(xiàn)了對這些歸檔資料的電子化管理,豐富了國家數(shù)字目錄地學內容。國家數(shù)字目錄中的地學信息涵蓋了美國各州級地質機構保管的地質和地球物理等各種原始標本的元數(shù)據(jù)記錄,包括巖石標本、薄片、野外記錄、照片、地圖和數(shù)據(jù)庫等。NGGDPP采用通用的標準和規(guī)則來確定并發(fā)布描述這些地質資料的元數(shù)據(jù),使用戶可以更直接和更方便地查找、理解、獲得和使用美國任何地方公開有用的聯(lián)邦和州地球科學數(shù)據(jù),并有效地處理專業(yè)地球科學家期待的任何查詢。
在已有資料的基礎上,NGGDPP特別支持了三項基礎地學專題研究,并建立了相關的研究和服務中心,分別是位于Denver,Colorado州的巖心研究中心(Core Research Center),負責向來自政府、工業(yè)和學術機構的科學家和教員提供有價值的巖石標本;美國地質調查局伍茲霍爾海洋科學中心標本博物館(Woods Hole Coastal and Marine Science Center Samples Repository),負責管理USGS在伍茲霍爾進行的海岸帶和海洋研究形成的地質、生物和地球化學標本;國家冰芯研究實驗室(National Ice Core Laboratory),負責儲存、管理和研究在極地收集到的冰芯。
同時,用戶可以通過https://www.sciencebase.gov/上的NGGDPP Community,進行數(shù)據(jù)的上傳、問題的反饋、資料的專題搜索、標簽搜索和空間搜索,實現(xiàn)用戶和信息數(shù)據(jù)、用戶和館藏機構的即時互動和聯(lián)系,用戶可以方便、準確地獲取所需資料,資料保管機構可以及時了解用戶的需求,制作專題性的服務內容和產品,實現(xiàn)系統(tǒng)和目錄的效率最大化。
通過NGGDPP,美國地質調查局改建和新建了全國范圍的地質資料信息庫,增大了聯(lián)邦級和州級的實物地質資料庫的物理容量和存儲處理能力,改善了美國地質資料保管和信息服務能力;制定了地質資料信息“最低保管標準”和“最佳保管措施”,供全國各計劃成員參考執(zhí)行;改善了地質資料信息的制作和網(wǎng)絡傳輸機制;研究制定并推廣使用了統(tǒng)一的地質資料維護標準、目錄和元數(shù)據(jù)制作格式,把來自全國不同地質資料館藏機構的庫藏目錄匯編成了一套全國統(tǒng)一的地學數(shù)據(jù)和標本目錄,以便公眾查詢利用。
目前,我國對地質資料實行原始、成果、實物分級、分類及委托保管,缺少針對原始、成果和實物地質資料全國統(tǒng)一的元數(shù)據(jù)描述標準。原始地質資料的匯交與保管工作剛剛起步;全國各級?。▍^(qū)、市)館、全國館、地調局六大區(qū)和油氣委托等地質資料保管單位在成果地質資料管理和服務的標準上尚未有統(tǒng)一和通用的標準;實物地質資料管理辦法正在研究制定中,全國范圍的實物地質資料服務尚無統(tǒng)一的標準,針對科研工作和科普宣傳的專題性、個性化服務較少,全國范圍內的瀕危實物地質資料統(tǒng)計和挽救工作尚未開展。所以,地質資料從業(yè)人員要加大研究力度,盡快制定全國通用的地質資料保管和服務元數(shù)據(jù)標準,為下一步開展全國地質資料保管和服務工作做好基礎性研究。
2010年,我國開始實施地質資料信息服務集群化產業(yè)化工程,構建了“全國地質資料信息集群化共享服務平臺”和“全國地質資料目錄中心”,以館藏機構為重點,拓展保存地質資料的基層地勘單位、礦業(yè)公司和科研院所,逐步實現(xiàn)全國地質資料信息資源匯聚,但是電子數(shù)據(jù)傳輸和更新機制尚未完全建立,無法實時進行,導致用戶在查詢和使用相關地質資料時,存在資料找不到、資料無法滿足需求等問題。所以,地質資料從業(yè)人員要在地質資料目錄更新與電子數(shù)據(jù)傳輸方面,盡快研究合理和切實可行的機制,保證各地質資料館藏機構和用戶,可以隨時對已有地質資料進行訪問、編輯和分析等;同時,館藏機構定時或不定時的向公眾發(fā)布全國或者專業(yè)級的地質資料館藏目錄,方便公眾及時了解我國地質工作開展情況和地質資料館藏情況。
我國目前研發(fā)的地質資料共享服務平臺,提供的大多是館藏機構已有的基礎性地質資料,缺少對用戶的使用反饋調查和需求分析,暫時無法滿足用戶個性化和專業(yè)化的資料加工需求,用戶只能查找到地質資料的館藏機構。借鑒國外地質資料信息服務模式,我國應盡快開展基于網(wǎng)絡服務平臺的地質資料個性化、專業(yè)化服務,通過鼓勵公眾參與到地質資料的提供、共享、分析和利用中來,系統(tǒng)研發(fā)人員做好用戶需求分析,地質專業(yè)人員參與到地質資料信息挖掘和分析中來,做好地質科研與科普宣傳互動,及時準確地為用戶制定專題性、個性化的服務。
[1]美國能源政策法案[EB/OL].http://www.gpo.gov/fdsys/pkg/PLAW-109publ58/html/PLAW-109publ58.htm.
[2]關于美國國家地質與地球物理數(shù)據(jù)保存計劃[EB/OL].http://datapreservation.usgs.gov/about.shtml.
[3] 核心 科 學 系 統(tǒng) [EB/OL].http://pubs.usgs.gov/fs/2012/3009/contents/FS12-3009.pdf
[4]美國國家地質與地球物理數(shù)據(jù)保存計劃門戶網(wǎng)站[EB/OL].http://datapreservation.usgs.gov/index.shtml.
[5]GRANT PROGRAM ANNOUNCEMENT.No.G15AS00016,F(xiàn)or Fiscal Year 2015,UNITED STATES DEPARTMENT OF THE INTERIOR,U.S.GEOLOGICAL SURVEY[R].2015-01-08.
[6]美國國家科學數(shù)據(jù)庫[EB/OL].www.sciencebase.gov.
NGGDPP—national geological and geophysical data preservation program
XU Bai-quan1,2,HU Xiao-ping2,ZHU Wei-h(huán)ong3
(1.School of Earth and Space Science,Peking University,Beijing 100871,China;2.Development Research Center,China Geological Survey,Beijing 100037,China;3.Xi’an Center of Geological Survey,China Geological Survey,Xi’an 710054,China)
NGGDPP is the United States’national earth science data preservation program.The Program,administered by the USGS,comprises State geological surveys and agencies within the DOI that maintain geological and geophysical data and samples.NGGDPP partnerships are working to Inventory collections of materials and data that exist in State geological surveys and DOI agencies to identify preservation and data-rescue needs;design and begin populating a National Digital Catalog;develop guidelines for distribution of Program funds and establish priorities for Program activities,establish minimum standards,procedures,and protocols for preserving and archiving collections of geological and geophysical materials and data.Through the implementation of NGGDPP,it has improved the access and archiving methods of geological materials and data in the United States,so that the information is more effective for the science and research.This paper intends to introduce NGGDPP in the hope to provide references for China’s geological data management and services.
NGGDPP;geological data;United States
許百泉(1981-),男,博士,主要從事地質資料管理與服務工作。E-mail:xbaiquan@m(xù)ail.cgs.gov.cn。
TP311.13;P3
A
1004-4051(2015)09-0123-04
2015-02-01
中國地質調查“地質資料信息服務集群化產業(yè)化綜合研究”項目資助(編號:1212011220335)