諸云強(qiáng),朱琦,馮卓,曾劍峰,郭春霞,傅為華,李威蓉
(1. 中國科學(xué)院地理科學(xué)與資源研究所資源與環(huán)境信息系統(tǒng)國家重點實驗室,北京 100101;2. 江蘇省地理信息資源開發(fā)與利用協(xié)同創(chuàng)新中心,南京 210023;3. 環(huán)境保護(hù)部信息中心,北京 100029;4.義烏工商學(xué)院,義烏 322000;5.山東理工大學(xué),淄博 255000)
科學(xué)大數(shù)據(jù)開放共享機(jī)制研究及其對環(huán)境信息共享的啟示
諸云強(qiáng)1,2*,朱琦3,馮卓1,曾劍峰3,郭春霞3,傅為華4,李威蓉5
(1. 中國科學(xué)院地理科學(xué)與資源研究所資源與環(huán)境信息系統(tǒng)國家重點實驗室,北京 100101;2. 江蘇省地理信息資源開發(fā)與利用協(xié)同創(chuàng)新中心,南京 210023;3. 環(huán)境保護(hù)部信息中心,北京 100029;4.義烏工商學(xué)院,義烏 322000;5.山東理工大學(xué),淄博 255000)
摘 要科學(xué)大數(shù)據(jù)得以充分利用和增值的前提是開放共享,而影響數(shù)據(jù)開放共享的關(guān)鍵問題是共享機(jī)制。本文首先分析了科學(xué)大數(shù)據(jù)的產(chǎn)生方式、數(shù)據(jù)類型、投資方式、管理主體和服務(wù)定位及其與共享程度的關(guān)系。進(jìn)一步在分析國內(nèi)外自上而下和自下而上科學(xué)數(shù)據(jù)共享通用機(jī)制與原則的基礎(chǔ)上,結(jié)合國家地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺、全球變化科學(xué)數(shù)據(jù)出版等實踐,提出了數(shù)據(jù)匯交、數(shù)據(jù)出版、數(shù)據(jù)聯(lián)盟和服務(wù)激勵四種數(shù)據(jù)共享機(jī)制,并分析了每種機(jī)制中的關(guān)鍵問題及具體做法。最后,結(jié)合云計算、“互聯(lián)網(wǎng)+”等新一代信息技術(shù)和思維,對環(huán)境保護(hù)大數(shù)據(jù)共享機(jī)制提出四點建議,即:國家統(tǒng)一投資建設(shè)的環(huán)境保護(hù)核心業(yè)務(wù)數(shù)據(jù)強(qiáng)制匯交機(jī)制,其他部委、機(jī)構(gòu)環(huán)境保護(hù)相關(guān)數(shù)據(jù)聯(lián)盟交換機(jī)制,企業(yè)、科學(xué)家個人數(shù)據(jù)出版等激勵機(jī)制,以及社會公眾數(shù)據(jù)的“眾創(chuàng)機(jī)制”。
關(guān)鍵詞科學(xué)大數(shù)據(jù);環(huán)境保護(hù);共享機(jī)制;數(shù)據(jù)匯交;數(shù)據(jù)出版;眾創(chuàng)
科學(xué)數(shù)據(jù)是指人類社會科技活動所產(chǎn)生的基本科學(xué)技術(shù)數(shù)據(jù)、資料以及按照不同需求而加工的數(shù)據(jù)產(chǎn)品和相關(guān)信息[1]。科學(xué)數(shù)據(jù)是國家寶貴財富和戰(zhàn)略資源,不僅關(guān)系到國家的科技進(jìn)步與創(chuàng)新能力,而且也是社會經(jīng)濟(jì)發(fā)展決策的基礎(chǔ)。科學(xué)數(shù)據(jù)通常分為兩大類型,一類是行業(yè)部門按照統(tǒng)一的規(guī)范標(biāo)準(zhǔn)長期采集和管理的科學(xué)數(shù)據(jù);另一類是國家各類科技計劃項目在研究過程和結(jié)果中產(chǎn)生的,以及為支持科學(xué)研究而通過觀測、監(jiān)測、試驗等站點采集的科學(xué)數(shù)據(jù)[2]。
自20世紀(jì)70年代起,科學(xué)數(shù)據(jù)共享已經(jīng)受到廣泛的關(guān)注,一系列國際數(shù)據(jù)組織/計劃、國家數(shù)據(jù)中心和共享動議先后成立和啟動[3]。如,國際科聯(lián)(ICSU)的國際科學(xué)技術(shù)數(shù)據(jù)委員會(Committee on Data for Science and Technology, CODATA)、世界數(shù)據(jù)中心(系統(tǒng))(World Data Center or System, WDC or WDS)[4]、地球觀測組織(Group on Earth Observations, GEO)、研究數(shù)據(jù)聯(lián)盟(Research Data Alliance, RDA)和全球生物多樣性信息機(jī)構(gòu)(Global Biodiversity Information Facility, GBIF)等,美國建立的分布式最活躍數(shù)據(jù)檔案中心群(Distributed Active Archive Centers, DAACs)、全球變化主目錄(Global Change Master Directory, GCMD)、國立衛(wèi)生研究院數(shù)據(jù)共享庫(NIH Data Sharing Repositories)、地球觀測數(shù)據(jù)網(wǎng)Data Observation Network for Earth, DataOne), 歐洲空間信息基礎(chǔ)設(shè)施(INSPIRE)、加拿大的地球觀測數(shù)據(jù)網(wǎng)(The Canadian Earth Observation Network, GeoNET),中國啟動的科學(xué)數(shù)據(jù)共享工程、國家科技基礎(chǔ)條件平臺(National Science and Technology Infrastructure, NSTI)等。
從國際上看,科學(xué)數(shù)據(jù)共享已經(jīng)成為一種普遍性行為,但發(fā)展極不均衡[5]。各國科學(xué)數(shù)據(jù)共享發(fā)展不均衡的根本原因在于背后政策和共享機(jī)制的不同。盡管我國已經(jīng)出臺了一系列數(shù)據(jù)共享相關(guān)的政策和條例,然而這些政策和條例都有這樣或那樣的限制,極大影響了科學(xué)數(shù)據(jù)的共享,國家層面完善的數(shù)據(jù)共享機(jī)制,特別是針對不同類型和來源的科學(xué)數(shù)據(jù)共享機(jī)制并未形成[6,7]。因此,研究分析不同模式的共享機(jī)制,對于推進(jìn)科學(xué)數(shù)據(jù)共享具有重要的意義。特別是科學(xué)大數(shù)據(jù)的到來,一方面人們越來越意識到數(shù)據(jù)的價值,更加注重數(shù)據(jù)產(chǎn)權(quán)的保護(hù);另一方面大數(shù)據(jù)產(chǎn)生方式和利用模式的轉(zhuǎn)變,都要求我們重新審視和積極探索新的數(shù)據(jù)共享機(jī)制。本文首先分析科學(xué)大數(shù)據(jù)及其來源特征;然后結(jié)合國家地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺和全球變化科學(xué)數(shù)據(jù)出版等實踐,研究分析不同來源的科學(xué)大數(shù)據(jù)共享機(jī)制及其關(guān)鍵問題;最后,給出環(huán)境保護(hù)數(shù)據(jù)開放共享機(jī)制的建議。
大數(shù)據(jù)是指無法在可容忍的時間內(nèi)用傳統(tǒng)IT 技術(shù)和軟硬件工具對其進(jìn)行感知、獲取、管理、處理和服務(wù)的數(shù)據(jù)集合[8]。與科學(xué)相關(guān),反映和表征著復(fù)雜的自然和社會科學(xué)現(xiàn)象與關(guān)系的大數(shù)據(jù)稱之為科學(xué)大數(shù)據(jù)。除具有一般科學(xué)數(shù)據(jù)的特征(客觀性、分離性、長效性、不對稱性、非排他性、可傳遞性、增值性)[9]和大數(shù)據(jù)的特征(4V:Volume—體量浩大、Variety—模態(tài)繁多、Velocity—生成快速和Value—價值巨大但密度很低)外,科學(xué)大數(shù)據(jù)還具有高維(具有多重數(shù)據(jù)屬性)、高度計算復(fù)雜性(大多為非線性復(fù)雜系統(tǒng))和高度不確定性(具有一定的誤差和不完備性)等特征[10]。
從產(chǎn)生方式來看,科學(xué)大數(shù)據(jù)主要來源于地面觀測(監(jiān)測)、遙感遙測,考察調(diào)查、統(tǒng)計分析,實驗測試,加工處理、計算模擬,互聯(lián)網(wǎng)挖掘等手段;從數(shù)據(jù)類型來看,科學(xué)大數(shù)據(jù)包括空間數(shù)據(jù)(矢量、柵格等)、非空間數(shù)據(jù)(數(shù)據(jù)庫表、數(shù)值文本、統(tǒng)計圖等)、多媒體數(shù)據(jù)(文檔、圖片、音頻、視頻等);從投資方式來看,科學(xué)大數(shù)據(jù)主要由國家和地方財政、單位自主經(jīng)費和個人經(jīng)費等投資產(chǎn)生;從管理主體來看,科學(xué)大數(shù)據(jù)主要由專業(yè)機(jī)構(gòu)(數(shù)據(jù)中心)、科研團(tuán)隊和科學(xué)家個人等管理;從服務(wù)定位來看,科學(xué)大數(shù)據(jù)主要包括研究型(研究項目產(chǎn)生的數(shù)據(jù))、資源型(特定領(lǐng)域公共的數(shù)據(jù)庫)和參考型數(shù)據(jù)(長期積累的基礎(chǔ)性數(shù)據(jù))[11]。不同產(chǎn)生方式、數(shù)據(jù)類型,投資方式、管理機(jī)構(gòu)、服務(wù)定位的科學(xué)數(shù)據(jù),其開放共享的程度也不同(圖1)。
圖1 科學(xué)數(shù)據(jù)共享程度線性模型示意
圖1顯示,科學(xué)數(shù)據(jù)獲取方式越容易,意味著獲取成本越低,其共享也會越容易;科學(xué)數(shù)據(jù)類型越與地理空間位置無關(guān),保密程度就會越低,而開放共享限制也會越低;科學(xué)數(shù)據(jù)管理主體從個人、到團(tuán)隊再到專業(yè)機(jī)構(gòu)(如數(shù)據(jù)中心),管理的專業(yè)程度和穩(wěn)定性就會越來越高,因此,就會越容易共享;科學(xué)數(shù)據(jù)共享的法理基礎(chǔ)是納稅人,稅收是政府財政的主要來源,國家投資產(chǎn)生的科學(xué)數(shù)據(jù)應(yīng)當(dāng)向納稅人實行共享[12]。根據(jù)這一原則,國家財政經(jīng)費投資產(chǎn)生的科學(xué)數(shù)據(jù)理應(yīng)向全社會開放共享。因此,國家財政經(jīng)費資助產(chǎn)生的科學(xué)數(shù)據(jù)共享程度要遠(yuǎn)遠(yuǎn)高于企業(yè)和個人自有經(jīng)費投資的科學(xué)數(shù)據(jù)。研究型數(shù)據(jù)庫是指某一個或者若干個固定的研究項目產(chǎn)生的數(shù)據(jù)集,這些數(shù)據(jù)獲得的資金資助較少,資助周期也較短,數(shù)據(jù)可能沒有嚴(yán)格遵循相關(guān)的標(biāo)準(zhǔn),數(shù)據(jù)的規(guī)模和覆蓋范圍有限,因此只能為特定的研究群體服務(wù)[13]。資源型數(shù)據(jù)庫經(jīng)費直接來源于領(lǐng)域部門或相關(guān)的機(jī)構(gòu),通常遵循一定的數(shù)據(jù)規(guī)范進(jìn)行長期的建設(shè),可以服務(wù)于某一領(lǐng)域或?qū)W科的組織和機(jī)構(gòu)。參考型數(shù)據(jù)庫是由國家投資的基礎(chǔ)性數(shù)據(jù)資源,如基礎(chǔ)地理、水文地質(zhì)、氣象數(shù)據(jù)等。該類數(shù)據(jù)庫遵循嚴(yán)格的標(biāo)準(zhǔn)規(guī)范,通過普查、周期性更新或定期監(jiān)測等方式進(jìn)行長期的積累,數(shù)據(jù)規(guī)模大,可以作為其他科學(xué)數(shù)據(jù)的參考依據(jù)與基礎(chǔ)。因此,參考型數(shù)據(jù)用戶群體大、應(yīng)用影響面廣,開放共享要求也較資源型和研究型數(shù)據(jù)高。
2.1 科學(xué)數(shù)據(jù)共享通用機(jī)制與原則
科學(xué)數(shù)據(jù)共享政策和機(jī)制一般有兩種制定方式①Uhlir P.F. Development of Open Data and Data Sharing Principles by International Scientifi c Communities.International Workshop on Open Data in Developing Countries.Nairobi, Kenya. 6 August 2014.:
一是自上而下,由政府和跨政府組織、研究經(jīng)費資助機(jī)構(gòu)制定。如:美國根據(jù)“保障投資者獲得利益”這一數(shù)據(jù)共享基本原則,采用保密性管理、完全開放和市場運行三種不同的科學(xué)數(shù)據(jù)共享機(jī)制[14]:①對于有可能危及國家安全、有可能影響政府政務(wù)、有可能涉及個人隱私的數(shù)據(jù)和信息均納入保密性管理,并對這些內(nèi)容給以十分嚴(yán)格和明確的規(guī)定;②對國家所有和國家投資產(chǎn)生的、不會危及國家安全、影響政府政務(wù),不會涉及個人隱私的全部數(shù)據(jù)和信息都納入“完全與開放”的范疇;③對私營企業(yè)投資產(chǎn)生的科學(xué)數(shù)據(jù),則納入到市場運行的管理體系。2004年經(jīng)濟(jì)合作與發(fā)展組織發(fā)布了《公共研究數(shù)據(jù)訪問國際原則與指南聲明》,認(rèn)為公共研究數(shù)據(jù)訪問應(yīng)遵循如下原則:開放、靈活、透明、遵守法律、知識產(chǎn)權(quán)保護(hù)、正式的責(zé)任、專業(yè)化、互操作性、質(zhì)量、安全、效率、評估、可持續(xù)性[15]。2013年,加拿大、法國、德國、意大利、日本、俄羅斯、英國、美國等8個國家在G8峰會上簽署了《開放數(shù)據(jù)憲章》,規(guī)定了政府開放數(shù)據(jù)的五大原則和十四個重點開放領(lǐng)域[16]。五大原則:一是使開放數(shù)據(jù)成為規(guī)則,二是注重數(shù)據(jù)質(zhì)量和數(shù)量,三是讓所有人都可以使用,四是為了改善治理發(fā)布數(shù)據(jù),五是為激勵創(chuàng)新發(fā)布數(shù)據(jù)。其中最重要的思想就是“開放為默認(rèn),不開放為特例”。十四個重點開放領(lǐng)域,包括能源與環(huán)境、地理空間、全球發(fā)展、科學(xué)研究和統(tǒng)計等。
二是由下而上,由數(shù)據(jù)資源管理和擁有單位、非政府組織等制定。ICSU CODATA在2000年發(fā)布了“數(shù)據(jù)庫訪問:網(wǎng)絡(luò)時代下科學(xué)的一系列原則”,認(rèn)為,科學(xué)是一項重要的公共投資,將會對人類和經(jīng)濟(jì)社會的發(fā)展產(chǎn)生深遠(yuǎn)的影響;科學(xué)進(jìn)步依賴于完全和開放的數(shù)據(jù);市場模式的數(shù)據(jù)訪問政策是不適合于研究和教育領(lǐng)域的;對于科學(xué)研究和知識分發(fā)來說,數(shù)據(jù)出版是非常必要的;數(shù)據(jù)庫擁有者的利益必須與社會對數(shù)據(jù)開放共享的要求有一個很好的平衡;立法者必須考慮知識產(chǎn)權(quán)保護(hù)法律對于研究和教育領(lǐng)域的影響[17]。Uhlir等[18]認(rèn)為,對于公共財政資助的數(shù)據(jù)資源應(yīng)采用“完全開放和共享”的政策;對于公共和私有混合的數(shù)據(jù)應(yīng)采用面向非盈利研究、教育或發(fā)展中國家用戶開放,面向商業(yè)使用限制或簽訂協(xié)議的政策;對有私有數(shù)據(jù)應(yīng)采用在保障數(shù)據(jù)擁有者利益前提下鼓勵數(shù)據(jù)共享的政策。建議GEO應(yīng)采用強(qiáng)制(成員國或組織必須按照統(tǒng)一的協(xié)議共享地球觀測及相關(guān)的數(shù)據(jù))和鼓勵(鼓勵按照國際慣例和指南的最少要求,共享相關(guān)的數(shù)據(jù)集)兩種相結(jié)合的政策。
2.2 科學(xué)數(shù)據(jù)共享機(jī)制若干模式與關(guān)鍵問題
根據(jù)前面的分析,結(jié)合國家地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺、973計劃資源環(huán)境領(lǐng)域、科技基礎(chǔ)性工作專項項目數(shù)據(jù)匯交、全球變化科學(xué)數(shù)據(jù)出版和地學(xué)科研信息化環(huán)境的實踐,提出以下四種科學(xué)數(shù)據(jù)共享機(jī)制,并剖析每種數(shù)據(jù)共享機(jī)制的關(guān)鍵問題。
2.2.1 數(shù)據(jù)匯交機(jī)制
科學(xué)數(shù)據(jù)匯交屬于自上而下的強(qiáng)制性共享機(jī)制,主要的實施對象是國家財政經(jīng)費支持的行業(yè)部門和科研項目以及數(shù)據(jù)中心產(chǎn)生和管理的數(shù)據(jù)資源。
行業(yè)部門大多通過部發(fā)文的形式,規(guī)定部門科學(xué)數(shù)據(jù)自下而上的匯交或交換,如國土資源部的《國土資源數(shù)據(jù)管理暫行辦法》、中國氣象局的《氣象資料共享管理辦法》等。
相比于行業(yè)部門的數(shù)據(jù)匯交,由于缺乏行政手段的約束,科研項目數(shù)據(jù)的匯交在我國發(fā)展相對緩慢。盡管在一些科技計劃管理條法中規(guī)定了“科研項目數(shù)據(jù)”必須匯交的要求,但由于缺乏配套的管理辦法及操作規(guī)程,“交到哪”、“交什么”、“怎么交”等核心問題沒有解決,使得這些要求往往流于形式,并沒有真正實施起來。2007年、2013年科技部先后啟動了“973計劃資源環(huán)境領(lǐng)域”、“科技基礎(chǔ)性工作專項”項目數(shù)據(jù)匯交工作。為了促使項目數(shù)據(jù)匯交的順利推進(jìn),首先制定和頒發(fā)了《數(shù)據(jù)匯交管理辦法》,《辦法》規(guī)定:①項目數(shù)據(jù)匯交到科技部指定的數(shù)據(jù)管理中心。數(shù)據(jù)管理中心負(fù)責(zé)項目科學(xué)數(shù)據(jù)匯交標(biāo)準(zhǔn)規(guī)范制定、技術(shù)培訓(xùn),以及匯交數(shù)據(jù)的接收、保存、管理、共享與服務(wù);②匯交的內(nèi)容主要是項目研究產(chǎn)生的數(shù)據(jù)資料,以及輔助的科學(xué)數(shù)據(jù)(元數(shù)據(jù)、數(shù)據(jù)文檔)和工具軟件;③數(shù)據(jù)匯交具體分為數(shù)據(jù)計劃制定、匯交準(zhǔn)備、數(shù)據(jù)實體匯交和數(shù)據(jù)管理與共享服務(wù)四個階段。同時,制定了“數(shù)據(jù)計劃參考格式”、“數(shù)據(jù)匯交方案參考格式”、“科技項目數(shù)據(jù)匯交元數(shù)據(jù)標(biāo)準(zhǔn)”、“數(shù)據(jù)文檔編寫規(guī)范”、“數(shù)據(jù)匯交文件整理規(guī)范”、“數(shù)據(jù)審查規(guī)范”等配套的技術(shù)標(biāo)準(zhǔn)。具體實施時,按照分類型、分階段(新啟動、中期進(jìn)展、已結(jié)題)的策略進(jìn)行實施,即:新啟動項目要求編制數(shù)據(jù)計劃,依據(jù)數(shù)據(jù)計劃匯交科學(xué)數(shù)據(jù);中期進(jìn)展(在研)項目直接編制匯交方案,依據(jù)匯交方案開展數(shù)據(jù)的匯交;已結(jié)題項目補(bǔ)充數(shù)據(jù)匯交方案,依據(jù)匯交方案,由數(shù)據(jù)管理中心協(xié)助其進(jìn)行數(shù)據(jù)的匯交。通過上述模式,切實解決了科研項目數(shù)據(jù)匯交“交到哪”、“交什么”、“怎么交”等核心問題,有效推進(jìn)了重大科技項目數(shù)據(jù)匯交的問題[19]。
對于國家財政經(jīng)費支持的數(shù)據(jù)中心,必須按照“國家科技計劃及專項資金后補(bǔ)助管理規(guī)定”,對其進(jìn)行共享服務(wù)績效考核,并依據(jù)績效考核結(jié)果給予相應(yīng)的經(jīng)費補(bǔ)助。例如,中國科學(xué)地理科學(xué)與資源研究所承擔(dān)的國家科技基礎(chǔ)條件平臺—地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺①國家地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺:http://www.geodata.cn按照學(xué)科和區(qū)域并重的原則在全國設(shè)置了14個分中心和2個數(shù)據(jù)資源點。所有分中心和數(shù)據(jù)資源點按照統(tǒng)一的績效考核評價體系,每年進(jìn)行績效評估,依據(jù)評估結(jié)果進(jìn)行經(jīng)費的分配和動態(tài)的調(diào)整。在具體實施過程中,通過嚴(yán)格的“平臺管理辦法”及配套的技術(shù)規(guī)程,對其上網(wǎng)服務(wù)的數(shù)據(jù)質(zhì)量、服務(wù)流程和時效等進(jìn)行統(tǒng)一的規(guī)定,要求所有上網(wǎng)服務(wù)的數(shù)據(jù)必須是“元數(shù)據(jù)”、“數(shù)據(jù)服務(wù)”、“數(shù)據(jù)文檔”三位一體,通過“元數(shù)據(jù)”保證用戶能夠快速查找到數(shù)據(jù),通過“數(shù)據(jù)服務(wù)”能讓用戶快捷地訪問到數(shù)據(jù),通過“數(shù)據(jù)文檔”能夠正確指導(dǎo)用戶使用數(shù)據(jù),從而有效提高數(shù)據(jù)共享服務(wù)的質(zhì)量[20,21]。
2.2.2 數(shù)據(jù)出版機(jī)制
除了國家自上而下的數(shù)據(jù)共享政策外,在大數(shù)據(jù)時代,調(diào)動科研人員主動共享數(shù)據(jù)積極性的重要機(jī)制就是自下而上的科學(xué)數(shù)據(jù)出版[22,23]。數(shù)據(jù)出版是指在互聯(lián)網(wǎng)上公開數(shù)據(jù),并且支持除數(shù)據(jù)提供者之外的研究人員或者組織機(jī)構(gòu)下載、分析、再利用以及引用數(shù)據(jù)[24]。數(shù)據(jù)出版的關(guān)鍵是讓數(shù)據(jù)也像科技論文一樣公開出版(網(wǎng)絡(luò)出版或紙質(zhì)出版),讓科學(xué)數(shù)據(jù)也能夠被引用和追溯,并最終納入科研考核體系中,從而有效保障共享數(shù)據(jù)的科研人員的根本利益,促進(jìn)科研人員共享數(shù)據(jù)的積極性。
當(dāng)前,Nature等國際著名期刊已經(jīng)開始要求作者投稿時必須向期刊提供與論文相關(guān)的科學(xué)數(shù)據(jù),這些科學(xué)數(shù)據(jù)必須存儲到可公開訪問的相關(guān)數(shù)據(jù)庫中;一些學(xué)科出現(xiàn)了專門的數(shù)據(jù)期刊,如ESSD(Earth System Science Data)等;一些數(shù)據(jù)中心/機(jī)構(gòu)也倡導(dǎo)基于同行評審的數(shù)據(jù)論文發(fā)表,如GBIF(Global Biodiversity Information Facility)、DRYAD(Dryad Digital Repository)等。湯森路透公司也推出了數(shù)據(jù)引文索引(Data Citation Index,DCI),旨在推動科學(xué)數(shù)據(jù)的開放共享與引用,提高數(shù)據(jù)作者的知名度[25]。
2013年,中國科學(xué)院地理科學(xué)與資源研究所啟動了“全球變化科學(xué)數(shù)據(jù)出版”[22],利用數(shù)字對象唯一標(biāo)識(Digital Object Identifi er, DOI)對科學(xué)數(shù)據(jù)進(jìn)行全球唯一標(biāo)注,將電子版的數(shù)據(jù)集和數(shù)據(jù)論文在網(wǎng)上關(guān)聯(lián)發(fā)布①全球變化科學(xué)數(shù)據(jù)出版:http://www.geodoi.ac.cn,同時數(shù)據(jù)論文以紙質(zhì)版的形式在《地理學(xué)報(增刊)》上發(fā)表。全球變化科學(xué)數(shù)據(jù)出版流程包括數(shù)據(jù)投稿、同行評議、注冊發(fā)布、數(shù)據(jù)出版、數(shù)據(jù)引用、成果評價等環(huán)節(jié),如圖2所示。
數(shù)據(jù)投稿需要作者承諾[22]:①確認(rèn)數(shù)據(jù)集具有自主知識產(chǎn)權(quán),同意將數(shù)據(jù)按照承諾的公開范圍進(jìn)行共享,同意數(shù)據(jù)散發(fā)權(quán)、網(wǎng)絡(luò)傳播權(quán)等產(chǎn)權(quán)的轉(zhuǎn)讓權(quán)與數(shù)據(jù)出版者共同具有。該數(shù)據(jù)集(庫)出版權(quán)由數(shù)據(jù)出版者單獨所有;②符合國家安全、個人隱私和相關(guān)科學(xué)研究項目政策規(guī)定;③保證科學(xué)數(shù)據(jù)集(庫)的真實性,即沒有任何作假數(shù)據(jù);④沒有一稿多投(一個數(shù)據(jù)庫僅能出版一次,更新數(shù)據(jù)庫以不同版本)。數(shù)據(jù)投稿需要準(zhǔn)備:數(shù)據(jù)集(庫)的元數(shù)據(jù)、數(shù)據(jù)論文和實體數(shù)據(jù),三者缺一不可。元數(shù)據(jù)、數(shù)據(jù)論文和實體數(shù)據(jù)集(庫)均需要同行專家評議。通過同行評議的科學(xué)數(shù)據(jù),由數(shù)據(jù)注冊與出版技術(shù)系統(tǒng)分配DOI號后,向全球發(fā)布共享。
圖2 科學(xué)數(shù)據(jù)出版流程
不到兩年的時間內(nèi),全球變化科學(xué)數(shù)據(jù)出版已經(jīng)吸引了來自4個國家的174位作者投稿,公開出版了58個數(shù)據(jù)集,引起了國內(nèi)外數(shù)據(jù)界的廣泛關(guān)注。
2.2.3 數(shù)據(jù)聯(lián)盟機(jī)制
數(shù)據(jù)聯(lián)盟機(jī)制是國際數(shù)據(jù)共享常用的機(jī)制,數(shù)據(jù)(平臺)中心之間通常遵循共同協(xié)商的原則或聲明,利用統(tǒng)一的標(biāo)準(zhǔn)或接口(軟件系統(tǒng)),進(jìn)行元數(shù)據(jù)或數(shù)據(jù)的互操作。例如,WDC系統(tǒng)內(nèi)部許多數(shù)據(jù)中心之間開展了數(shù)據(jù)鏡像,其中WDC日地物理數(shù)據(jù)中心已經(jīng)在中國、俄羅斯、澳大利亞、日本和印度等國家建立鏡像,WDC古氣候數(shù)據(jù)中心已經(jīng)在中國、印度、阿根廷、南非和肯尼亞建立數(shù)據(jù)鏡像系統(tǒng),并通過OAI-PMH(Open Archives Initiative-Protocol for Metadata Harvesting)元數(shù)據(jù)收割服務(wù)協(xié)議實現(xiàn)整個WDC 系統(tǒng)的一站式數(shù)據(jù)搜索和共享服務(wù)[19];全球衛(wèi)星觀測委員會(CEOS)通過統(tǒng)一的目錄標(biāo)準(zhǔn)(CWIC)將其成員機(jī)構(gòu)(NOAA、NASA、USGS、INPE、GMU等)的數(shù)據(jù)目錄整合在一起提供有效的數(shù)據(jù)發(fā)現(xiàn)[26,27];全球變化主目錄(GCMD)通過統(tǒng)一的DIF(Directory Interchange Format)元數(shù)據(jù)標(biāo)準(zhǔn),各成員節(jié)點交換和共享元數(shù)據(jù);興都庫什—喜馬拉雅地區(qū)山地空間信息共享系統(tǒng),每成員國(中國、印度、尼泊爾、孟加拉、巴基斯坦等)之間通過采用統(tǒng)一的GeoNetwork共享軟件,實現(xiàn)元數(shù)據(jù)的實時交換與統(tǒng)一搜索[28,29]等。
2.2.4 服務(wù)激勵機(jī)制
對于個人數(shù)據(jù),可以采用積分和在線計算服務(wù)等形式,激勵和吸引科學(xué)家個人提供和交換科學(xué)數(shù)據(jù)。
(1)積分機(jī)制。科學(xué)家發(fā)布個人數(shù)據(jù)時可以設(shè)置一定的使用積分,當(dāng)其他用戶共享該數(shù)據(jù)時,需要支付相應(yīng)的積分給數(shù)據(jù)發(fā)布者。積分越多,可以共享的數(shù)據(jù)就越多。當(dāng)前,采用積分激勵機(jī)制的成功案例,如百度文度①百度文度:http://wenku.baidu.com、數(shù)據(jù)堂②數(shù)據(jù)堂:http://www.datatang.com等等。為了鼓勵科學(xué)家個人發(fā)布、使用數(shù)據(jù),參與并推進(jìn)數(shù)據(jù)共享,在筆者團(tuán)隊研發(fā)的地學(xué)科研信息化環(huán)境③地學(xué)科研信息化環(huán)境:http://wenku.baidu.com中也采用數(shù)據(jù)積分的形式[30,31]:當(dāng)數(shù)據(jù)擁有者發(fā)布數(shù)據(jù)時可以標(biāo)注使用積分,積分范圍為1~10分。發(fā)布數(shù)據(jù)的用戶系統(tǒng)自動給該用戶加2個積分。當(dāng)該數(shù)據(jù)審核未通過時扣2個積分,管理員認(rèn)為好的數(shù)據(jù)可以獎勵積分,具體積分?jǐn)?shù)由管理員定(不超過10分)。標(biāo)注積分的數(shù)據(jù)被使用后,標(biāo)注的積分從數(shù)據(jù)使用者中扣除,加到數(shù)據(jù)發(fā)布者頭上。使用免費數(shù)據(jù)的用戶不加分也不扣分。用戶對數(shù)據(jù)進(jìn)行評論時,系統(tǒng)自動給用戶加1個積分,用戶在評價數(shù)據(jù)的同時還反饋了數(shù)據(jù)使用的成果時加2個積分。管理員可對用戶評論進(jìn)行審核,視評論質(zhì)量進(jìn)行評論積分獎勵或扣減。
(2)在線計算服務(wù)機(jī)制。復(fù)雜環(huán)境保護(hù)數(shù)據(jù)處理和模擬分析往往需要在高性能計算環(huán)境下,通過專用的處理工具和模擬模型來實現(xiàn)。對于個人用戶而言,通常缺乏高性能計算能力,有時也很難獲取到專用的處理工具和模擬模型。在地學(xué)科研信息化環(huán)境中,我們利用分布式計算技術(shù),構(gòu)建了具有高性能計算能力的在線模型共享系統(tǒng),為用戶提供在線的地理空間數(shù)據(jù)處理、遙感反演計算和陸面過程模擬等。利用在線模型共享系統(tǒng)進(jìn)行在線計算時,用戶需要上傳模型輸入數(shù)據(jù),并指定是否保存計算過程數(shù)據(jù)和結(jié)果數(shù)據(jù)。用戶可以決定是否將上傳的輸入數(shù)據(jù)、計算過程數(shù)據(jù)和結(jié)果數(shù)據(jù)公開。如果選擇公開數(shù)據(jù),地學(xué)科研信息化環(huán)境就能夠不斷沉淀和積累模型用戶數(shù)據(jù),進(jìn)而實現(xiàn)動態(tài)的模型數(shù)據(jù)共享[30,31]。
3.1 環(huán)境保護(hù)大數(shù)據(jù)分析
環(huán)境保護(hù)數(shù)據(jù)是工業(yè)、農(nóng)業(yè)生產(chǎn)和民眾生活等實施主體開發(fā)利用和保護(hù)環(huán)境客體(大氣、水、土壤、生態(tài)等)過程中產(chǎn)生的各類數(shù)據(jù)資源(圖3),其核心就是反映環(huán)境保護(hù)對象的空間分布、質(zhì)量狀況和變化趨勢,以此來認(rèn)識環(huán)境的演變規(guī)律,控制潛在環(huán)境風(fēng)險。
圖3 環(huán)境保護(hù)數(shù)據(jù)產(chǎn)生概念模型
面向全球氣候變化的挑戰(zhàn),環(huán)境保護(hù)的內(nèi)涵不斷擴(kuò)大和豐富,參與的主體也越來越多。國家生態(tài)文明指出要進(jìn)一步加大自然生態(tài)系統(tǒng)和環(huán)境保護(hù)力度,正確處理經(jīng)濟(jì)發(fā)展與環(huán)境保護(hù)關(guān)系;未來地球計劃(Future Earth)(2014—2023)提出要圍繞動態(tài)星球(地球環(huán)境—社會系統(tǒng),即人地關(guān)系發(fā)展趨勢、驅(qū)動因素和過程及他們的相互作用)、全球發(fā)展(食物、水、生物多樣性、能源、材料)、可持續(xù)轉(zhuǎn)變(探索科技—社會—經(jīng)濟(jì)發(fā)展的可持續(xù)道路)三大主題展開研究,強(qiáng)調(diào)自然、社會科學(xué)家、政府決策者、企業(yè)的共同參與。
因此,環(huán)境保護(hù)數(shù)據(jù)正從傳統(tǒng)水、氣、聲、生態(tài)、土壤等核心要素的監(jiān)測數(shù)據(jù)向自然生態(tài)系統(tǒng)、人文社會系統(tǒng)數(shù)據(jù)的拓展,形成了跨部門、多來源、多類型的大數(shù)據(jù)特征(圖4)。
圖4 環(huán)境保護(hù)大數(shù)據(jù)范圍
3.2 環(huán)境保護(hù)大數(shù)據(jù)共享機(jī)制建議
環(huán)境保護(hù)大數(shù)據(jù)利用的基礎(chǔ)和前提仍然是數(shù)據(jù)的共享。當(dāng)前,由于缺乏部門之間的共享機(jī)制,環(huán)境信息共享難度大,信息資源開發(fā)利用難度更大,嚴(yán)重影響了環(huán)境信息化整體效益的發(fā)揮,制約了環(huán)境信息化的進(jìn)一步發(fā)展[32]。排污許可一證管理、環(huán)境責(zé)任終身追究[33]、公眾積極參與和志愿監(jiān)督等制度的建立都離不開環(huán)境信息的共享與公開?;谇笆隹茖W(xué)大數(shù)據(jù)共享機(jī)制的分析,為了推進(jìn)環(huán)境保護(hù)大數(shù)據(jù)的集成共享與利用,我們建議:
(1)面向國家統(tǒng)一投資建設(shè)的環(huán)境調(diào)查、監(jiān)測數(shù)據(jù)以及環(huán)境保護(hù)領(lǐng)域重大科技專項產(chǎn)生的數(shù)據(jù),包括污染源普查、污染物排放,大氣、水、聲、生態(tài)、土壤等監(jiān)測數(shù)據(jù),水專項、環(huán)保公益項目數(shù)據(jù)等,建議采取強(qiáng)制性數(shù)據(jù)匯交制度。
制定并頒發(fā)“環(huán)境保護(hù)數(shù)據(jù)匯交管理制度”和配套的技術(shù)標(biāo)準(zhǔn),將國家財政經(jīng)費投資產(chǎn)生的環(huán)境保護(hù)數(shù)據(jù)匯交作為一項基本制度,明確數(shù)據(jù)匯交的獎懲措施。規(guī)定環(huán)境保護(hù)數(shù)據(jù)匯交各參與主體的權(quán)、責(zé)、利。按照數(shù)據(jù)類型,建立環(huán)境保護(hù)數(shù)據(jù)匯交管理中心,明確各類數(shù)據(jù)資源匯交范圍與內(nèi)容、具體流程與技術(shù)要求、管理與開放共享原則,切實推進(jìn)環(huán)境保護(hù)核實業(yè)務(wù)和重大科研項目數(shù)據(jù)的匯交與開放共享。
(2)面向其他部委、機(jī)構(gòu)與環(huán)境保護(hù)管理、研究相關(guān)的基礎(chǔ)測繪、地質(zhì)、氣象、水文、生態(tài)與生物多樣性等科學(xué)數(shù)據(jù),建議采用聯(lián)盟交換的機(jī)制,促進(jìn)跨部門的信息交換與共享。
成立部際環(huán)境保護(hù)數(shù)據(jù)共享聯(lián)盟,明確聯(lián)盟成員的責(zé)任與義務(wù),規(guī)定核心交換數(shù)據(jù)集以及日常、應(yīng)急兩種情況的數(shù)據(jù)交換規(guī)則,制定數(shù)據(jù)安全使用管理辦法。梳理聯(lián)盟成員環(huán)境保護(hù)相關(guān)數(shù)據(jù)需求目錄和被需求目錄,定期溝通核實需求目錄和被需求目錄實施情況。按照統(tǒng)一的標(biāo)準(zhǔn)接口,建立網(wǎng)上在線數(shù)據(jù)交換平臺,實現(xiàn)聯(lián)盟成員核心數(shù)據(jù)的實時交換與“一站式”訪問,切實滿足生態(tài)環(huán)境治理現(xiàn)代化對科學(xué)數(shù)據(jù)的需求。
(3)面向企業(yè)、科學(xué)家個人的科學(xué)數(shù)據(jù),建議采用數(shù)據(jù)出版、積分、在線計算服務(wù)等激勵機(jī)制,吸引企業(yè)和科學(xué)家志愿共享數(shù)據(jù)。
聯(lián)合環(huán)境保護(hù)領(lǐng)域期刊和數(shù)據(jù)中心,發(fā)揮前者在論文審稿、出版的經(jīng)驗和后者在數(shù)據(jù)管理、開放共享的優(yōu)勢,開展環(huán)境保護(hù)數(shù)據(jù)出版。通過網(wǎng)絡(luò)和期刊兩種方式,將科學(xué)家個人的數(shù)據(jù)以數(shù)據(jù)論文的形式公開發(fā)表和出版,實現(xiàn)數(shù)據(jù)和論文的關(guān)聯(lián)共享。以積分的形式,鼓勵企業(yè)與企業(yè)、企業(yè)與政府、企業(yè)與科學(xué)家、科學(xué)家與政府、科學(xué)家與科學(xué)家之間數(shù)據(jù)的交換,形成“人人都是數(shù)據(jù)的使用者、又是貢獻(xiàn)者”的共享氛圍。同時,利用云計算技術(shù),構(gòu)建具有強(qiáng)大計算能力支撐的在線環(huán)境模擬分析平臺,面向缺乏高性能計算能力和專業(yè)模型的企業(yè)或科學(xué)家個人提供免費的在線計算分析服務(wù)。通過在線環(huán)境模擬分析平臺,不斷沉淀和開放計算用戶的原始輸入數(shù)據(jù)、過程計算和結(jié)果數(shù)據(jù)。
(4)利用“互聯(lián)網(wǎng)+”思維,開放政府環(huán)境保護(hù)數(shù)據(jù),研發(fā)有利于社會公眾參與環(huán)境保護(hù)的APP應(yīng)用和社交平臺,充分發(fā)揮社會公眾的積極性,不斷收集和共享社會公眾產(chǎn)生的環(huán)境保護(hù)大數(shù)據(jù),形成社會公眾數(shù)據(jù)的“眾創(chuàng)機(jī)制”。
按照“開放為默認(rèn),不開放為特例”的原則,制定環(huán)境保護(hù)信息公開條例,實現(xiàn)政府環(huán)境保護(hù)數(shù)據(jù)最大程度的開放,滿足社會公眾對環(huán)境保護(hù)信息的需求,并進(jìn)一步吸引社會公眾參與環(huán)境保護(hù)工作。研發(fā)有利于社會公眾在線辦事、信息查詢、交互參與的移動APP應(yīng)用,實現(xiàn)“隨手拍、隨手記、隨手傳”的社會公眾環(huán)境保護(hù)監(jiān)督和參與的氛圍,形成環(huán)境保護(hù)大數(shù)據(jù)社會公眾“眾創(chuàng)機(jī)制”。同時,通過開放政府環(huán)境保護(hù)數(shù)據(jù),支撐社會公眾自發(fā)開展環(huán)境數(shù)據(jù)分析與創(chuàng)新應(yīng)用,促進(jìn)環(huán)境保護(hù)領(lǐng)域的“萬眾創(chuàng)新”。
參考文獻(xiàn)
[1] 黃鼎成, 郭增艷. 科學(xué)數(shù)據(jù)共享管理研究[M]. 北京: 中國科學(xué)技術(shù)出版社, 2002.
[2] 孫九林, 王卷樂. 探索分散科學(xué)數(shù)據(jù)資源共享之路——記“地球系統(tǒng)科學(xué)數(shù)據(jù)共享網(wǎng)”[M]//國家科技基礎(chǔ)條件平臺. 國家科技基礎(chǔ)條件平臺回顧與展望. 北京: 中國科學(xué)技術(shù)出版社, 2008.
[3] 諸云強(qiáng), 孫九林, 廖順寶, 等. 地球系統(tǒng)科學(xué)數(shù)據(jù)共享研究與實踐[J]. 地球信息科學(xué)學(xué)報, 2010, 12(1): 1-8.
[4] 王卷樂, 孫九林. 世界數(shù)據(jù)中心(WDC)回顧、變革與展望[J]. 地球科學(xué)進(jìn)展, 2009, 24(6): 612-620.
[5] 李娟, 劉德洪, 江洪. 國際科學(xué)數(shù)據(jù)共享現(xiàn)狀研究[J]. 圖書館建設(shè), 2009, (2): 19-21, 25-25.
[6] 劉潤達(dá), 褚文博, 諸云強(qiáng). 國家科技基礎(chǔ)條件平臺運行服務(wù)階段關(guān)鍵問題探析[J]. 現(xiàn)代情報, 2012, 32(11): 51-57.
[7] Wan Z. China’s scientific progress hinges on access to data[J]. Nature, 2015, 520(7549): 587-587.
[8] 李國杰, 程學(xué)旗. 大數(shù)據(jù)研究: 未來科技及經(jīng)濟(jì)社會發(fā)展的重大戰(zhàn)略領(lǐng)域——大數(shù)據(jù)的研究現(xiàn)狀與科學(xué)思考[J].中國科學(xué)院院刊, 2012, 27(6): 647-657.
[9] 孫九林, 施慧中. 中國地球系統(tǒng)科學(xué)數(shù)據(jù)共享服務(wù)網(wǎng)的構(gòu)建[J]. 中國基礎(chǔ)科學(xué), 2003, (1): 76-81.
[10] 郭華東, 王力哲, 陳方, 等. 科學(xué)大數(shù)據(jù)與數(shù)字地球[J].科學(xué)通報, 2014, 59(12): 1047-1054.
[11] National Science Foundation. Long-lived Digital Data CollectionsEnabling Research and Education in the 21st Century[EB/OL]. (2005-9) [2015-10-26]. http: //www.nsf. gov/pubs/2005/nsb0540/nsb0540.pdf.
[12] 黃鼎成. 科學(xué)數(shù)據(jù)共享的理論基礎(chǔ)與共享機(jī)制[J]. 中國基礎(chǔ)科學(xué), 2003, (2): 22-27.
[13] 孫九林, 林海. 地球系統(tǒng)研究與科學(xué)數(shù)據(jù)[M]. 北京: 科學(xué)出版社, 2009.
[14] 劉闖. 美國國有科學(xué)數(shù)據(jù)共享管理機(jī)制及對我國的啟示[J]. 中國基礎(chǔ)科學(xué), 2003, (1): 34-39.
[15] OECD (Organisation for Economic Co-Operationand Development). OECD Principles and Guidelines for Access to Research Data from Public Funding[EB/OL]. (2007-4) [2015-10-26]. http://www.oecd.org/sti/sci-tech/38500813. pdf.
[16] Castro D,Korte T. Open Data in the G8: A Review of Progress on the G8 Open Data Charter[EB/OL]. (2015-3)[2015-10-26]. http://www2.datainnovation.org/2015-open-data-g8.pdf.
[17] ICSU CODATA Ad Hoc Group on Data and Information. ACCESS TO DATABASES: A Set of Principles for Science in the Internet Era[EB/OL]. (2000-6)[2015-10-25], http:// www.icsu.org/publications/icsu-position-statements/accessto-databases/389_DD_FILE_ACCESS_TO_DATABASES_ Jun_00_.pdf.
[18] Uhlir P F, Chen R S, Gabrynowicz J I,et al. Toward implementation of the global earth observation system of systems data sharing principles[J]. Data Science Journal, 2009, 8, doi:10.2481/dsj.35JSL201.
[19] 王卷樂, 楊雅萍, 諸云強(qiáng), 等. “973”計劃資源環(huán)境領(lǐng)域數(shù)據(jù)匯交進(jìn)展與數(shù)據(jù)分析[J]. 地球科學(xué)進(jìn)展, 2009, 24(8): 947-953.
[20] 諸云強(qiáng), 宋佳, 潘鵬, 等. 地學(xué)數(shù)據(jù)共享發(fā)展現(xiàn)狀、問題與對策研究[J]. 中國科技資源導(dǎo)刊, 2014, 46(4): 55-63.
[21] Wang J L, Sun J L, Zhu Y Q,et al. A study on the organizational architecture and standard system of the data sharing network of earth system science in China[J]. Data Science Journal,2013, (12), doi: 10.2481/dsj.13-031.
[22] 劉闖. 論全球變化科學(xué)研究數(shù)據(jù)出版[J]. 地理學(xué)報, 2014, 69(8): 3-11.
[23] 吳立宗, 王亮緒, 南卓銅, 等. 科學(xué)數(shù)據(jù)出版現(xiàn)狀及其體系框架[J]. 遙感技術(shù)與應(yīng)用, 2013, 28(3): 383-390.
[24] 何琳, 常穎聰. 國內(nèi)外科學(xué)數(shù)據(jù)出版研究進(jìn)展[J]. 圖書情報工作, 2014, 58(5): 104-110.
[25] Force M M,Robinson N J. Encouraging data citation and discovery with the data citation index[J].Journal of Computer-Aided Molecular Design, 2014, 28(10): 1043-1048, doi: 10.1007/s10822-014-9768-5.
[26] Bai Y Q, Di L P. Review of geospatial data systems’ support of global change studies[J]. British Journal of Environment and Climate Change, 2012, 2(4): 421-436.
[27] Shao Y Z, Di L P, Bai Y Q, et al. Federated catalogue for discovering earth observation datakonzeptfüreinenzent ralkatalogfürfernerkundungsdaten[J]. Photogrammetrie-Fernerkundung-Geoinformation, 2013, 2013(1): 43-52, doi: 10.1127/1432-8364/2013/0157.
[28] 劉潤達(dá), 諸云強(qiáng). 開源地理信息共享平臺GeoNetwork及其定制應(yīng)用實踐[J]. 地理信息世界, 2010, 8(6): 38-44.
[29] Zhu Y Q, Bajracharya R. Towards a regional geographic data-sharing network in the Himalayas[J]. Sustainable Mountain Development, 2011, 60: 38-39.
[30] 諸云強(qiáng), 孫九林, 馮敏, 等. 論地學(xué)科研信息化環(huán)境[J].中國科學(xué)院院刊, 2013, 28(4): 501-510.
[31] 苗茹, 諸云強(qiáng), 宋佳, 等. 基于云計算的地球系統(tǒng)科學(xué)數(shù)據(jù)共享研究與實踐[J]. 地球信息科學(xué)學(xué)報, 2014, 16(2): 264-272.
[32] 魏斌, 黃明祥. 新形勢下環(huán)境信息化發(fā)展展望[J]. 中國環(huán)境管理, 2015, 7(1): 14-17.
[33] 周宏春. 新形勢下我國環(huán)境管理與改革取向[J]. 中國環(huán)境管理, 2015, 7(1): 8-13.
致謝:感謝孫九林院士、劉闖研究員的指導(dǎo),特別感謝本文用以分析研究的國家地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺、973計劃資源環(huán)境領(lǐng)域項目數(shù)據(jù)匯交管理中心、全球變化科學(xué)數(shù)據(jù)出版系統(tǒng)等。本論文得到國家留學(xué)基金資助。
Scientifi c Big Data Sharing Mechanisms Research and Suggestions for
Environmental Information Sharing
Zhu Yunqiang1,2*, Zhu Qi3, Feng Zhuo1, Zeng Jianfeng3, Guo Chunxia3, Fu Weihua4, Li Weirong5
(1. State Key Lab of Resources and Environmental Information System, Institute of Geographic Sciences and Natural Resources Research, Chinese Academy of Sciences, Beijing 100101; 2. Jiangsu Center for Collaborative Innovation in Geographical Information Resource Development and Application, Nanjing 210023; 3. Information Center,Ministry of Environmental Protection, Beijing 100029; 4. Yiwu Industrial & Commercial College,Yiwu 322000; 5. Shandong University of Technology, Zibo 255000)
Abstract:The foundation and precondition of full using scientifi c big data and excavating their values is to open and share these data. Among impact factors of data sharing, the sharing mechanism is the most important. In this paper, fi rstly scientifi c big data characteristics were analyzed. Several factors of scientifi c big data including data’s generation mode, type, way of investment, governor and functional orientation will profoundly infl uence their open and sharing. Generally, scientifi c data sharing mechanisms are made by top-down or bottom-up approaches. The basic ideal of data sharing mechanism is to open and share data at maximum extentand meanwhile to protect reasonably interests of data contributors. After that based on the experiences of National Data Sharing Infrastructure for Earth System Science and Global Change Research Data Publication etc., authors put forward four data sharing mechanisms, i.e. data submission, data publication, data alliance, and service excitation, for respectively public and private data. Finally, considering thelatest IT and their ideas, like Could Computing and Internet plus, some sharing mechanism suggestions were proposed for environmental protection (EP) big data that are mandatory submission mechanism for EP core data funded by public fi nance, federal exchange mechanism for trans-ministries’EP related data, and incentive mechanism, like data publication, for enterprise and scientist individual data as well as crowd innovation mechanism for the public data.
Keywords:scientifi c big data;environmental protection; sharing mechanism; data submission; data publication; crowd innovation
中圖分類號:X321;G203
文獻(xiàn)標(biāo)識碼:A
文章編號:1674-6252(2015)06-0038-08
基金項目:科技基礎(chǔ)性工作專項重點項目(2013FY110900),國家科技基礎(chǔ)條件平臺(2005DKA32300),國家自然科學(xué)基金項目(41371381),國家重大科學(xué)儀器設(shè)備開發(fā)專項(2012YQ06002704),貴州省公益性基礎(chǔ)性地質(zhì)工作項目:貴州省巖溶地下水系統(tǒng)功能可持續(xù)利用性研究。
*責(zé)任作者: 諸云強(qiáng)(1977—),男,博士,中國科學(xué)院地理科學(xué)與資源研究所研究員,研究方向為地學(xué)數(shù)據(jù)共享關(guān)鍵技術(shù)、資源環(huán)境信息系統(tǒng)。