王 晴
(山西大學(xué)管理學(xué)院,山西太原 030006)
開放數(shù)據(jù)及其主體結(jié)構(gòu)、法律特征與利用機制探討
王 晴
(山西大學(xué)管理學(xué)院,山西太原 030006)
受到近年來諸多因素的交叉影響和積極推動,“數(shù)據(jù)權(quán)”已經(jīng)成為信息權(quán)利的重要內(nèi)容之一,公眾對行業(yè)開放數(shù)據(jù)抱有極大熱情和期望。認為開放數(shù)據(jù)能提高政府公信力、科學(xué)競爭力及社會生產(chǎn)力,開放數(shù)據(jù)的主體具有多樣性的特征,并且存在著較為復(fù)雜的權(quán)利義務(wù)關(guān)系,開放數(shù)據(jù)需要在一系列原則、標準和技術(shù)的支持下有序、穩(wěn)步開展,并需要全球化的資源整合與業(yè)務(wù)協(xié)作。
開放政府;開放數(shù)據(jù);法律特征;許可機制
信息技術(shù)的發(fā)展,使得各類組織搜集、組織和開發(fā)數(shù)據(jù)的能力空前提高,政府數(shù)據(jù)作為一種公共資源,理應(yīng)實現(xiàn)全民共享。近年來,英、美、澳、加等10余個國家陸續(xù)建立了國家層面的政府數(shù)據(jù)網(wǎng)站,將各類涉及民生的大量數(shù)據(jù)“上網(wǎng)”以迎合全民共享的愿望,掀起了一股保障公眾“數(shù)據(jù)權(quán)”的浪潮,并且從公共領(lǐng)域逐漸向商業(yè)領(lǐng)域推進。2010年8月,美國宣布“藍紐計劃”以幫助公眾管理自己的健康數(shù)據(jù)。2011年4月,英國宣布一項旨在推動全民數(shù)據(jù)權(quán)的名為“我的數(shù)據(jù)”的計劃,并得到了大型銀行、IT巨頭等不同行業(yè)的支持[1]。IT的迅猛發(fā)展已經(jīng)引領(lǐng)人們進入了大數(shù)據(jù)時代,它標志著人類從信息社會向知識社會邁進。在大數(shù)據(jù)時代,開放是最鮮明的價值理念,因此,開放數(shù)據(jù)成為行業(yè)的職責和義務(wù),而第三方對數(shù)據(jù)的開發(fā)和利用又給社會帶來了數(shù)據(jù)的增值,并向數(shù)據(jù)的需求者提供了更加便捷的訪問方式和獲取途徑。
“開放政府數(shù)據(jù)”中“開放”的含義是指任何人都可以利用、再利用和重新分配數(shù)據(jù)?!罢當?shù)據(jù)”是指由政府或政府控制的機構(gòu)生產(chǎn)的信息和數(shù)據(jù),開放政府數(shù)據(jù)是一個巨大的資源,作為其日常工作活動的一部分,政府收集了數(shù)量龐大的高質(zhì)量的數(shù)據(jù),只是大部分尚未開發(fā),如果公開這些數(shù)據(jù),可以產(chǎn)生巨大的潛在利益。誘人的是,不可能準確預(yù)測政府數(shù)據(jù)如何創(chuàng)造價值,這也正是創(chuàng)新的本質(zhì)所在。但顯而易見的是,開放政府數(shù)據(jù)已經(jīng)在某些重要領(lǐng)域發(fā)揮了積極的影響,如“透明度和民主管理”“公民參與”“改進和提供新的私人產(chǎn)品和服務(wù)”“創(chuàng)新”“政府效率”等[2]。
根據(jù)維基百科對“開放數(shù)據(jù)”的解釋,開放數(shù)據(jù)不是一個全新的概念,但卻沒有達成普遍認可的定義。一般來說,開放數(shù)據(jù)的應(yīng)用主要為非文字的資料素材,開放這些數(shù)據(jù)是因為這些資料本身內(nèi)含的商業(yè)價值或通過整合后可以成為有價值的產(chǎn)品[3]。開放數(shù)據(jù)具有以下主要價值特征。
(1)開放數(shù)據(jù)是提升政府公信力的新渠道。信息透明和數(shù)據(jù)公開是判斷政府公信的重要標準,政府存在的價值就是為了滿足社會成員的各種需求,而這一切都以信息和數(shù)據(jù)的開放為前提,尤其是統(tǒng)計數(shù)據(jù)的公布,涉及民生,關(guān)乎民計,進一步提高統(tǒng)計數(shù)據(jù)的質(zhì)量是提升政府公信力的一大法寶,也是規(guī)范政府行為,接受群眾監(jiān)督的基本要求,數(shù)據(jù)上的惡意隱瞞和弄虛作假,是影響政府公信力的最大因素。
(2)開放數(shù)據(jù)是增強科學(xué)競爭力的新措施??茖W(xué)數(shù)據(jù)是信息社會最活躍的戰(zhàn)略資源,是衡量國家發(fā)展水平和科技創(chuàng)新能力的重要標志,重視科學(xué)數(shù)據(jù)共享,促進科學(xué)數(shù)據(jù)開放是提升科技競爭力的源泉,是信息全球化背景下區(qū)域交流與合作的客觀要求,通過完善相關(guān)的法規(guī)、標準和管理機制,有助于突破界域限制,解決關(guān)鍵性問題。
(3)開放數(shù)據(jù)是提高社會生產(chǎn)力的新要求。整合數(shù)據(jù)和發(fā)現(xiàn)新知是推動經(jīng)濟社會發(fā)展的根本要求,在一定意義上講,數(shù)據(jù)也是生產(chǎn)力,它的價值不在于形式,而在于內(nèi)涵,如效率和成本是所有組織運行必須考慮的因素,降低成本、提高效率必須建立在充分地挖掘數(shù)據(jù)所蘊含的價值基礎(chǔ)之上,才能科學(xué)地利用和開發(fā)各類資源,不斷推動人類社會向前發(fā)展。
紅帽公司公共政策主任Paul Brownell指出,阻止數(shù)據(jù)開放的歷史要比開放數(shù)據(jù)概念本身要長遠得多。但是這種阻力正在被兩個主要因素所削弱(圖1),一是政府的政策,如歐美國家不斷增長的社會和政治運動,表現(xiàn)為公眾對于數(shù)據(jù)獲取理念的更新;二是技術(shù)進步,如邁向大數(shù)據(jù)的技術(shù)升級,以及開放源、開放內(nèi)容和開放社區(qū)等工作的不斷深入推進。同時,他指出,還存在著潛在的阻力,如既得利益者不愿意失去自我利益以及政府資助的研究開發(fā)。湯姆·斯里(Tom Slee)將其比作“開放政府數(shù)據(jù)幽靈”,即開放行為所包含的商業(yè)價值就像緊跟公眾的黑客一樣[4]。
開放數(shù)據(jù)的外延問題實質(zhì)上包含了3個方面:一是開放數(shù)據(jù)與其他類型數(shù)據(jù)的區(qū)別和聯(lián)系,二是開放數(shù)據(jù)的法律屬性,三是開放數(shù)據(jù)的利用機制。根據(jù)opensource.com網(wǎng)站提供的開放數(shù)據(jù)關(guān)系圖(圖2)可以看出,開放數(shù)據(jù)處于政府數(shù)據(jù)和公共領(lǐng)域數(shù)據(jù)之間,與私人數(shù)據(jù)一般沒有交集。這里涉及兩個問題,一是,公共領(lǐng)域數(shù)據(jù)的獲取和傳播并非全部免費,如珍貴古籍資料,既有家傳,也有國家保存,申請遺產(chǎn)保護后,進入公共領(lǐng)域的數(shù)據(jù)由于其特殊的歷史價值等原因,難以自由開放,因此在內(nèi)容范圍上不等于開放數(shù)據(jù);二是,開放數(shù)據(jù)與私人數(shù)據(jù)之間是可以轉(zhuǎn)化的,如高考考生的信息經(jīng)過某些部門的“有價轉(zhuǎn)讓”或“公開招標”等許可社會組織參與管理和開發(fā)后,實質(zhì)上也進入了公共領(lǐng)域,因此,兩者之間只是概念上的“不相干”而非內(nèi)容上的“無關(guān)聯(lián)”。
圖1 導(dǎo)入影響因素的開放數(shù)據(jù)利用機制
圖2 開放數(shù)據(jù)關(guān)系圖
開放數(shù)據(jù)的客體是數(shù)據(jù),但主體卻存在多樣性,因為數(shù)據(jù)的來源是復(fù)雜的,并且存在相互交織的事實。就目前來講,至少存在四類主體,即以政府(主導(dǎo))、科學(xué)機構(gòu)(支撐)、企業(yè)(開發(fā))、非政府組織(公共服務(wù))為核心的4種不同特點的主體結(jié)構(gòu)??茖W(xué)數(shù)據(jù)開放運動的興起要早于其他3類,但其中影響最廣泛的是政府的數(shù)據(jù)開放。以下重點介紹比較成熟的政府數(shù)據(jù)開放和科學(xué)數(shù)據(jù)開放的有關(guān)情況。
3.1 開放政府數(shù)據(jù)
萬維網(wǎng)基金會認為,開放政府數(shù)據(jù)(OGD)的倡議活動將對中低收入國家的未來發(fā)展產(chǎn)生至關(guān)重要的影響[5],尤其是政府工作模式的轉(zhuǎn)變,即強調(diào)利用信息、通信技術(shù)來傳遞服務(wù),意味著政府在行政過程中將提升政府透明度和問責制、政府效率和效益、公眾參與和融入、創(chuàng)新和發(fā)展、民主制度等五大要素。開放數(shù)據(jù)是開放政府的基本要求之一,是理念和技術(shù)的升級,也是公益性和商業(yè)性開發(fā)的新機遇。
2009年1月,奧巴馬政府發(fā)布《透明和開放政府備忘錄》,并指示管理和預(yù)算辦公室主管起草《開放政府指令》,宣稱“政府將致力于創(chuàng)造一個前所未有的開放環(huán)境以確保公眾的信任,并通過建立一種透明的、公眾參與的和合作的機制,增強社會的民主性,提高政府的有效性”[6]。由此可見,美國開放政府的三大原則是:透明度、參與、合作。為了達到上述目標,備忘錄還要求行政部門和機構(gòu)采取出版政府在線信息、提高政府信息質(zhì)量、創(chuàng)建并制度化開放政府的文化、創(chuàng)建并啟用開放政府政策框架等措施。
2009年10月,英國政府內(nèi)閣辦公廳發(fā)布英國新的開放數(shù)據(jù)倡議,提出透明度和問責制、賦予公民權(quán)利以推動公共服務(wù)改革、解除由納稅人付費的數(shù)據(jù)以實現(xiàn)其社會與經(jīng)濟價值、幫助英國科研和技術(shù)在下一代網(wǎng)絡(luò)中占據(jù)主導(dǎo)地位等四大目標,并指出,將使用第三方數(shù)據(jù)管理工具,將一部分數(shù)據(jù)轉(zhuǎn)換成關(guān)聯(lián)數(shù)據(jù)格式。特別是,所有數(shù)據(jù)面向商業(yè)和非商業(yè)用途,以激發(fā)創(chuàng)新能力,同時加緊制定相關(guān)政策和標準,通過公眾的參與和反饋來改進運行機制達到可持續(xù)發(fā)展[7]。
在美英等國家的積極引領(lǐng)下,開放數(shù)據(jù)已經(jīng)演變成一股國際性的潮流。根據(jù)開放數(shù)據(jù)網(wǎng)站官方主頁相關(guān)數(shù)據(jù)顯示,截至目前,世界上已有41個國家和地區(qū)設(shè)立了相應(yīng)的開放政府數(shù)據(jù)計劃。
2010年11月召開的國際開放政府數(shù)據(jù)會議的議題主要包括:(1)開放政府時代安全防范和個人隱私保護;(2)開放政府數(shù)據(jù)怎樣引領(lǐng)公眾的積極參與;(3)提升政府透明度的最佳實踐;(4)建立一個充滿活力的開放數(shù)據(jù)社區(qū);(5)元數(shù)據(jù)標準及數(shù)據(jù)可視化;(6)開放政府數(shù)據(jù)環(huán)境下的文化變革;(7)開放政府數(shù)據(jù)和指標的價值取向等[8]。2012年7月召開的IOGDC的主題是“將數(shù)據(jù)推向?qū)嵺`”,并從以下幾個方面探討了最新問題:(1)開放政府的影響;(2)政策的變化;(3)開放金融數(shù)據(jù)和公開數(shù)據(jù)生態(tài)系統(tǒng);(4)開放數(shù)據(jù)對發(fā)展中國家的影響;(5)社會參與和數(shù)據(jù)標準及可訪問性;(6)開放數(shù)據(jù)的價值實現(xiàn);(7)開放數(shù)據(jù)新聞學(xué);(8)合作及未來挑戰(zhàn)[9]。
3.2 開放科學(xué)數(shù)據(jù)
2002年11月9日,歐盟在籌備信息社會世界高峰會議時通過了《布加勒斯特宣言》,強調(diào)了建立健全法規(guī)體系,培育培養(yǎng)規(guī)章制度和政策環(huán)境的重要作用,以規(guī)范和保障數(shù)據(jù)開放系統(tǒng)的正常運行,保證開放的立法精神得到貫徹實施。僅2002-2005年,歐盟就陸續(xù)制定了10條與數(shù)據(jù)共享有關(guān)的指令(規(guī)則),其中最核心的內(nèi)容就是圍繞網(wǎng)絡(luò)環(huán)境下數(shù)據(jù)保護的立法問題,如英國和愛爾蘭兩國分別于1997年和2000年通過《信息自由法》,并依法設(shè)立“信息專員”(英國也稱“數(shù)據(jù)保護專員”,并設(shè)有信息法庭),通過信息立法的形式來調(diào)整不同信息主體之間的權(quán)利義務(wù)關(guān)系,以促進信息共享和數(shù)據(jù)開放,尤其是美國20世紀90年代以來制定的有關(guān)科學(xué)研究項目的一系列法規(guī)和條例,對數(shù)據(jù)的開發(fā)、使用和管理等行為起到了十分重要的規(guī)范作用,并對其他國家的數(shù)據(jù)開放政策的頒布產(chǎn)生了深遠的影響[10]。
2003年10月,我國科技部制定《國家科技計劃項目科學(xué)數(shù)據(jù)匯交暫行辦法(草案)》,通過建立“匯交制度”來規(guī)范數(shù)據(jù)開發(fā)與開放每個環(huán)節(jié)的責任義務(wù)。第四章明確規(guī)定了匯交義務(wù)人的權(quán)利和義務(wù)。第七章第49條規(guī)定:“科學(xué)數(shù)據(jù)管理機構(gòu)自收到匯交的科學(xué)數(shù)據(jù)之日起30個工作日內(nèi)予以公開”,對于在保護期內(nèi)的科學(xué)數(shù)據(jù),僅公開目錄,并對科學(xué)數(shù)據(jù)的使用期限和質(zhì)量要求作了相應(yīng)解釋[11]。類似的科學(xué)數(shù)據(jù)共享中心、網(wǎng)站或平臺有很多,如地震、遙感數(shù)據(jù)、海洋、農(nóng)業(yè)、氣象、交通等領(lǐng)域的科學(xué)數(shù)據(jù)中心或平臺。
中國社會調(diào)查開放數(shù)據(jù)庫[12]是由中國人民大學(xué)社會學(xué)系負責開發(fā)、運作和維護,用以存儲和發(fā)布在中國范圍內(nèi)執(zhí)行的社會調(diào)查數(shù)據(jù)、資料以及信息的在線數(shù)據(jù)庫平臺。它秉承全面性、開放性和標準化的宗旨,提供了1987年至2008年部分數(shù)據(jù),訪問下載數(shù)據(jù)需要注冊,但不收取任何費用。中國西部環(huán)境與生態(tài)科學(xué)數(shù)據(jù)中心受中國自然科學(xué)基金委資助,收集和整理“西部計劃”各項目在執(zhí)行期間產(chǎn)出的數(shù)據(jù)集,為中國西部環(huán)境與生態(tài)科學(xué)研究,乃至更廣泛意義上的地表表層科學(xué)研究服務(wù)。以四類關(guān)鍵詞為檢索方式,形成一個以生態(tài)環(huán)境為核心內(nèi)容的知識共享平臺,并制定了使用條款和免責聲明。首先,數(shù)據(jù)共享政策是“完全與開放”。其次,使用原則是尊重知識產(chǎn)權(quán)和維護網(wǎng)絡(luò)安全。最后,使用條款的核心內(nèi)容包括:使用數(shù)據(jù)需規(guī)范注明數(shù)據(jù)來源,僅用于科研目的,不得轉(zhuǎn)讓給第三方;使用行為應(yīng)在國家法律法規(guī)允許范圍內(nèi)并承擔保密義務(wù);不得刪除版權(quán)提示信息。同時,其還公布了6條免責聲明[13]。
開放數(shù)據(jù)的對象是數(shù)據(jù)集合或數(shù)據(jù)庫,尤其是科學(xué)數(shù)據(jù),多以數(shù)據(jù)庫的形式進行管理,數(shù)據(jù)的產(chǎn)權(quán)歸屬問題對開放或共享的影響較大。早在1996年,歐盟即通過的《歐洲議會和理事會關(guān)于數(shù)據(jù)庫法律保護的指令96/9/EC》,旨在建立一種特別的雙重保護機制為電子和非電子的數(shù)據(jù)庫予以產(chǎn)權(quán)保護,并引入一種重要的特殊權(quán)利來制止未經(jīng)許可的摘錄或再利用(根據(jù)該指令第7條(2)(a)和(b)相關(guān)條款的解釋,“摘錄”被定義為采取任何方式將數(shù)據(jù)庫的全部或?qū)嵸|(zhì)性內(nèi)容永久或暫時地轉(zhuǎn)移到其他載體上;“再利用”被定義為通過復(fù)制、租賃、在線或以其他任何形式將數(shù)據(jù)庫的全部或?qū)嵸|(zhì)性內(nèi)容提供給公眾。該指令的第9條規(guī)定了以下3種情形可以不受約束:私人目的,教學(xué)和研究目的,公共安全或行政管理以及司法目的。這3條都不能涉及商業(yè)性目的[14]。
科學(xué)數(shù)據(jù)的所有權(quán)歸屬問題涉及諸多因素,如實驗場所、人員及設(shè)備、資金來源與環(huán)境條件等。盡管多數(shù)科研人員沒有關(guān)注其科學(xué)數(shù)據(jù)所有權(quán)問題,但從一般意義上來講,他們往往依賴于一定數(shù)量的或不同程度的基金或其他資助,有回報學(xué)術(shù)界的心理動機,而作為受資助者,為了維持自身的數(shù)據(jù)價值,又不愿意過早地公開數(shù)據(jù),至少有縮小傳播范圍和延長共享時間的傾向,而主張科學(xué)數(shù)據(jù)的所有權(quán)又是基金或類似組織調(diào)節(jié)數(shù)據(jù)內(nèi)在價值的再利用的重要手段。因此,在所有權(quán)歸屬上,科學(xué)數(shù)據(jù)的生產(chǎn)者、保存者或管理者等不同主體的權(quán)利義務(wù)關(guān)系是復(fù)雜的。Carol Tenopir(2011)等通過對1329位科研人員的調(diào)查顯示,影響兩者關(guān)系的主要因素有:缺乏充足的時間,缺乏資金,缺乏標準,缺乏存儲空間以及贊助商不要求等[15]。
英國巴斯大學(xué)利茲里昂博士在顧問報告《處理數(shù)據(jù):角色,權(quán)利,責任和關(guān)系》中分析了數(shù)據(jù)處理過程中主體之間的權(quán)利義務(wù)關(guān)系:(1)資助機構(gòu)的資助政策對科研人員的行為產(chǎn)生直接影響;(2)不同的研究對象所依托的數(shù)據(jù)中心具有各異的存儲模式和管理方式;(3)數(shù)字資源庫主要面向銀行、學(xué)校、醫(yī)院等機構(gòu);(4)其他主體。將利益相關(guān)者的角色、權(quán)利、責任和關(guān)系可總結(jié)為表1所示[16]。
如表1所示,從“關(guān)系”列可以得出:協(xié)調(diào)和合作是數(shù)據(jù)成功開發(fā)的關(guān)鍵因素。從“機構(gòu)”行可以得出:科學(xué)家和研究人員通常是機構(gòu)的員工,且需要注意的是,這些主體具有不同的角色定位,如機構(gòu)也可以是一個出版商等。
5.1 開放數(shù)據(jù)的使用原則及許可機制
知識共享組織(Creative Commons,CC)在臺灣的正式名稱為“創(chuàng)用CC”,國內(nèi)學(xué)術(shù)研究一般翻譯為“創(chuàng)作共用”,CC官方網(wǎng)站中文版則稱之為“知識共享”。它是一個相對寬松的版權(quán)協(xié)議或授權(quán)方式,僅保留4種核心權(quán)利和6種常見組合,旨在增加創(chuàng)意作品的流通可及性和自由共享性。CC是非營利性組織,以法律和技術(shù)為基礎(chǔ),向成員提供一個簡單易用且標準化的版權(quán)許可,最大限度地提高數(shù)字創(chuàng)意,共享和創(chuàng)新。CC許可能夠輕松地改變版權(quán)條款,如從默認的“保留所有權(quán)利”到“保留部分權(quán)利”到“完全公開”。CC的發(fā)展目標是在默認的限制性規(guī)則日益增多的今天,構(gòu)建一個合理、靈活的著作權(quán)體系,不能完全地適用于商業(yè)性和科學(xué)數(shù)據(jù)的開發(fā)利用。CC在2005年啟動了Science Commons(SCs)項目,并制定了《實施開放獲取數(shù)據(jù)協(xié)議》,明確規(guī)定了開放獲取數(shù)據(jù)的3項原則,即促進法律的可預(yù)見性和確定性,易于使用和理解,盡量降低征收的交易成本[17]。
表1 開放數(shù)據(jù)主體的作用、權(quán)利、責任和關(guān)系總結(jié)表
由Peter MurrayRust等4位專家于2009年7月在英國劍橋潘頓街共同起草的《潘頓原則》于次年2月正式推出《潘頓原則》為數(shù)據(jù)的開放使用提供了指導(dǎo)原則[18],主要有以下三大原則:(1)公益優(yōu)先原則,開放數(shù)據(jù)的最大爭議在于其商業(yè)性使用,僅對學(xué)術(shù)交流和科學(xué)研究而言,非商業(yè)性使用足以滿足主要需求,且從CC許可的定義來看,使用者不得以任何方式進行以盈利性為目的的使用,若要進行商業(yè)性開發(fā),則需獲得相應(yīng)的授權(quán)許可;(2)利益平衡原則,商業(yè)性利用具有創(chuàng)新意識和高效產(chǎn)能,是其他組織無可比擬的優(yōu)勢,開放許可是以數(shù)據(jù)生產(chǎn)者(權(quán)利人)放棄所得利益或潛在經(jīng)濟利益為前提的行為,但商業(yè)機構(gòu)所設(shè)置的“使用壁壘”違背了原始宗旨,因此如何平衡私人利益和公共利益才是關(guān)鍵;(3)預(yù)先告知原則,即在開放數(shù)據(jù)或數(shù)據(jù)集的同時,應(yīng)附加相關(guān)說明性的使用條款,如數(shù)據(jù)集的子集是否被允許,再利用或變更用途是否可行等,且這個說明應(yīng)是一個明確的、不可撤銷的并保留解釋權(quán)限的法律依據(jù),數(shù)據(jù)開放時間點的把握是核心[19]。
另外,值得推薦開放數(shù)據(jù)共享組織(ODC)制定的三大協(xié)議,即“公共領(lǐng)域貢獻和許可協(xié)議”,“數(shù)據(jù)/數(shù)據(jù)庫歸屬協(xié)議”和“數(shù)據(jù)/數(shù)據(jù)庫相同共享貢獻協(xié)議”[20]。它與CC組織開發(fā)的“CC0”協(xié)議的共同之處在于促進法律的可執(zhí)行性有清晰的預(yù)期效果。區(qū)別在于:(1)ODC的協(xié)議僅適用于數(shù)據(jù)/數(shù)據(jù)庫,而CC的協(xié)議則適用于創(chuàng)意(內(nèi)容);(2)棄權(quán)內(nèi)容不同,ODC協(xié)議僅涉及版權(quán),而CC則使得相關(guān)內(nèi)容置于公共領(lǐng)域之內(nèi)[21]。開放政府許可(OGL)是由英國政府2010年發(fā)布的開放政府的數(shù)據(jù)、內(nèi)容及源代碼的免費許可,目的在于向公眾開放政府所擁有的數(shù)據(jù),目前的版本是OGLv1.0,主要內(nèi)容包括:一是免費要素。(1)免費獲取的范圍及使用途徑,即復(fù)制、出版、分發(fā)和傳播;(2)適應(yīng)信息;(3)可進行商業(yè)性開發(fā),或添加到自己的產(chǎn)品和程序中。二是例外情況。(1)個人數(shù)據(jù);(2)《信息自由法》和數(shù)據(jù)提供者未公布或出版;(3)包含標志、徽章(包括軍事徽章)的文件或數(shù)據(jù)集;(4)第三方提供的數(shù)據(jù)未得到原始所有者的授權(quán);(5)知識產(chǎn)權(quán);(6)證明性文件,如護照等。OGL協(xié)議涵蓋的范圍很廣,并且不受時空的限制,更多內(nèi)容可參見英國國家檔案館網(wǎng)站[22]。
5.2 開放數(shù)據(jù)的標準設(shè)定及協(xié)作機制
蒂姆·伯納斯-李(Tim Berners-Lee)2009年6月發(fā)表了《將政府數(shù)據(jù)上網(wǎng)》一文,強調(diào)政府數(shù)據(jù)開放的3個原因:提高公民對政府職能問責的意識,向世界貢獻更有價值的信息,使得政府、國家和世界有效地運作。他認為實現(xiàn)這些目標的最好方式是使用關(guān)聯(lián)數(shù)據(jù)(關(guān)聯(lián)數(shù)據(jù)主要由主體、客體和謂語3部分組成,是一種資源描述通用模型,不需要導(dǎo)入原始數(shù)據(jù),只需提供“鏈接”即可實現(xiàn)共享)標準,關(guān)聯(lián)數(shù)據(jù)被連接到網(wǎng)絡(luò)是至關(guān)重要的,為了規(guī)范用戶的網(wǎng)絡(luò)發(fā)布信息行為,2006年7月蒂姆·伯納斯-李發(fā)布了4項原則[23],分別是:使用URIs作為標識名稱;使用HTTP URIs以便能夠查閱這些名稱;向訪問者提供使用標準(如RDF,SPARQL);為了發(fā)現(xiàn)更多事物,應(yīng)提供相關(guān)的URIs。緊接著,英國和美國進行了政府關(guān)聯(lián)數(shù)據(jù)的嘗試,分別建立了data.gov.uk和Data.gov兩個采用了該標準的政府數(shù)據(jù)網(wǎng)站[24]。在英美兩國的影響下,其他國家也相繼建立了政府數(shù)據(jù)網(wǎng)站,如加拿大的Data.gc.ca,澳大利亞的Data.gov.au等。政府網(wǎng)站眾多且內(nèi)容廣泛,但是沒有統(tǒng)一的標準,影響政府數(shù)據(jù)的開放,關(guān)聯(lián)數(shù)據(jù)提供了一個全球范圍內(nèi)互動、協(xié)作的平臺和技術(shù),關(guān)聯(lián)政府數(shù)據(jù)是一項具有實踐意義的服務(wù)和技術(shù)。
開放數(shù)據(jù)的協(xié)作機制包含了3個方面的內(nèi)容。其一,包括了IT公司和政府部門在內(nèi)的技術(shù)研發(fā)體系。其二,數(shù)據(jù)共享平臺及管理體系。其三,協(xié)同工作的影響因素或稱之為阻力和動力。成立于2002年的開放數(shù)據(jù)小組(ODP)已經(jīng)開發(fā)了數(shù)個新技術(shù),如層次化模型和PMML標準,以提高大數(shù)據(jù)預(yù)測模型的開發(fā)和部署能力。2008-2010年間,ODP與開放云計算聯(lián)盟聯(lián)合開發(fā)了基于開源代碼的MalStone基準測試,用于對大數(shù)據(jù)的精確分析。使用Web發(fā)布的目的是促使更多的信息易于被訪問,但不同的信息格式又給開發(fā)利用帶來了困難。W 3C開發(fā)的資源描述框架(RDF)標準適合多種格式的交互式操作和數(shù)據(jù)關(guān)聯(lián),并在網(wǎng)上實現(xiàn)共享。圖3展示了一個較大的關(guān)聯(lián)開放數(shù)據(jù)云[25],其中包括464個相互關(guān)聯(lián)的RDF數(shù)據(jù)集和廣泛的生態(tài)系統(tǒng)正在使用的205個詞匯。有兩個典型例子,一是央行使用RSS-CB公布匯率,二是歐盟統(tǒng)計局、世界銀行和聯(lián)合國等使用的統(tǒng)計數(shù)據(jù)和元數(shù)據(jù)交換格式(SDMX)。另外,點擊圖片上的圓圈,就可以連接到相應(yīng)的數(shù)據(jù)集的網(wǎng)頁。從圖上數(shù)據(jù)集之間的關(guān)聯(lián)度可知,至少有5個數(shù)據(jù)集組,即每個組內(nèi)的數(shù)據(jù)集的內(nèi)容和數(shù)據(jù)之間存在明顯的相關(guān)度[26]。
為了保證與關(guān)聯(lián)數(shù)據(jù)原則及協(xié)議內(nèi)在要求的一致性,上文介紹的政府網(wǎng)站一般采用了國際通用的RDF數(shù)據(jù)模型、URI統(tǒng)一標識符、SPARQL查詢等技術(shù),實現(xiàn)國際網(wǎng)站數(shù)據(jù)內(nèi)容的互聯(lián)互通,通過將非結(jié)構(gòu)化數(shù)據(jù)項結(jié)構(gòu)化轉(zhuǎn)換,方便公眾的獲取和利用,Web3.0時代的云計算技術(shù)和語義網(wǎng)也為開放數(shù)據(jù)的共享、整合及管理提供支撐。
由于數(shù)據(jù)資源本身具有兩重性,即公益性和商業(yè)性,它的開發(fā)利用自然也面臨兩種不同的模式。因此,開放數(shù)據(jù)的進一步開發(fā)利用既有阻力也有動力,但從長遠趨勢判斷,開放數(shù)據(jù)的腳步不會停止,且涉及的內(nèi)容將更加廣泛。歸納起來表現(xiàn)為以下3個對立的方面。
(1)自由開放與限制存?。洪_放數(shù)據(jù)的倡議者們認為,數(shù)據(jù)的讀取、再次開發(fā)和分配不應(yīng)受到任何組織或機構(gòu)的監(jiān)管,不應(yīng)該違背公共利益而限制這些數(shù)據(jù)的自由存取,也不應(yīng)索取費用,但是需要考慮的是,數(shù)據(jù)的再次使用涉及數(shù)據(jù)擁有者的產(chǎn)權(quán)歸屬問題,如不同性質(zhì)的延伸性創(chuàng)作可以經(jīng)由授權(quán)組織來管控。
圖3 關(guān)聯(lián)開放數(shù)據(jù)云
(2)公益服務(wù)與商業(yè)開發(fā):開放數(shù)據(jù)的數(shù)據(jù)來源于不同領(lǐng)域,主要分為政府機關(guān)和科學(xué)界。2004年1月,經(jīng)合組織(OECD)的所有會員國的科技部部長簽署了一份共同聲明。聲明的主要內(nèi)容是:所有由國家機關(guān)出資收集的資料必要時需公開釋出,同時,要開放獲取研究數(shù)據(jù)以提高科學(xué)系統(tǒng)的質(zhì)量和效率。
(3)理念更新與技術(shù)支持:開放數(shù)據(jù)的內(nèi)涵有別于傳統(tǒng)意義上的理解,它是一種價值理念的更新和應(yīng)用,是在大數(shù)據(jù)時代背景下對數(shù)據(jù)資源的終極關(guān)懷,是信息社會下公眾獲取數(shù)據(jù)、利用數(shù)據(jù)的具體表現(xiàn),需要一系列的協(xié)議、規(guī)則或框架來約束主體行為,也需要IT基礎(chǔ)設(shè)施、云計算技術(shù)以及語義網(wǎng)等支持。
[1] 涂子沛.你的數(shù)據(jù),你做主![EB/OL].[2013-01-03]. http://tuzipei.blog.163.com/blog/static/ 1393030052011 42421512296/.
[2] What Is Open Government Data? Why Is It Important? [EB/OL].[2012-12-24].http://opengovernmentdata. org/about/.
[3] Open Data[EB/OL].[2012-12-25]. http://zh.w ikipedia. org/w iki/Open_Data.
[4] A New Skepticism on Open Data?[EB/OL].[2013-01-01].http://opensource.com/government/12/7/newskepticism-open-data.
[5] Project: Open Government Data [EB/OL]. [2012-12-24]. http://www.w ebfoundation.org/projects/opengovernment-data/.
[6] Open Government Directive[EB/OL]. [2012-12-24]. http://www.w hitehouse.gov/open/documents/opengovernment-directive.
[7] Lee Bryant. Preview of UK Government’s Open Data Site[EB/OL].[2012-12-24]. http://www.headshift.com/ our-blog/2009/10/05/preview-of-uk-governmentsopen/.
[8] 2010 International Open Government Data Conference [EB/OL].[2012-12-25]. http://www.data.gov/conference/archive.
[9] 2012 International Open Government Data Conference [EB/OL].[2012-12-25]. http://www.data.gov/communities/conference.
[10] 劉可靜.西方信息共享的理念及其法律保障體系[J].圖書情報工作,2007,51(3):56-59.
[11] 科學(xué)數(shù)據(jù)共享工程.國家科技計劃項目科學(xué)數(shù)據(jù)匯交暫行辦法(草案)[EB/OL].[2013-01-03].http://www. sciencedata.cn/fagui.php.
[12] Chinese Social Survey Open Database, CSSOD[EB/ OL].[2012-12-26]. http://www.cssod.org/about.php.
[13] “西部數(shù)據(jù)中心”使用條款和免責申明[EB/OL]. [2013-01-03].http://westdc.westgis. ac.cn/about/terms.
[14] 許春明.歐盟數(shù)據(jù)庫特殊權(quán)利剖析(上)——由英國BHB訴William Hill案引出[J].電子知識產(chǎn)權(quán), 2003(1):39-43,56.
[15] Carol Tenopir, Suzie A llard, K imberly Douglass,et al.Data Sharing by Scientists: Practices and Perceptions [J/OL]. PLoS ONE, 2011,6(6):1-21.
[16] Liz Lyon.Dealing w ith Data: Roles, Rights, Responsibilities and Relationships: Consultancy Report[R/OL]. [2013-01-01].http://www.ukoln.ac.uk/ukoln/staff/ e.j.lyon/reports/dealing_w ith_data_report-f nal.pdf.
[17] Protocol for Implementing Open Access Data [EB/OL]. [2013-01-03]. http://sciencecommons.org/projects/ publishing/open-access-data-protocol/.
[18] What Are the Panton Principles? [EB/OL]. [2013-01-02]. http://pantonprinciples.org/faq/#q1-what-arethe-panton-principles.
[19] 谷秀潔,李華偉.從Panton原則看科學(xué)數(shù)據(jù)的法律屬性與開放利用機制[J].圖書情報知識,2012(4):88-94,102.
[20] Licenses [EB/OL].[2013-01-02].http://opendatacommons.org/licenses/.
[21] About CC0 — “No Rights Reserved”[EB/OL]. [2013-01-02]. http: //creativecommons. org/ about/cc0.
[22] Open Government Licence for Public Sector Information [EB/OL]. [2013-01-03]. http://www. nationalarchives.gov.uk/doc/open-government-licence/.
[23] Linked Data [EB/OL].[2013-01-03].http://www. w3.org/DesignIssues/LinkedData.htm l.
[24] Putting Government Data Online [EB/OL]. [2013-01-03]. http://www.w3.org/DesignIssues/GovData.htm l.
[25] The Linking Open Data Cloud Diagram[EB/OL]. [2012-12-25]. http: //richard.cyganiak. de/ 2007/10/ lod/.
[26] Seán O'Riain, Edward Curry, Andreas Harth.XBRL and Open Data for Global Financial Ecosystems: A Linked Data Approach[J]. International Journal of Accounting Information Systems, 2012,13(2):141-162.
Research on the M ain Structure, Legal Characteristics and Related M echanism s of Open Data
Wang Qing
(School of management,Shanxi University,Taiyuan 030006)
Prom oted by a variety of factors,the “data rights” has becom e an im portant elem ent of inform ation rights,others are “right to privacy” and “right to know”,the public has great enthusiasm and high expectations of it. Open data can im prove government credibility,scientif c com petitiveness and social productive forces,the main body has diversity of characteristics,there are complex relationship of rights and obligations,open data needs series of principles,standards and technology,as well as global resources integration and operational collaboration.
open government, open data, legal characteristics, license mechanism
G203,D523
:ADOI:10.3772/j.issn.1674-1544.2013.04.004
王晴(1986- ),男,山西大學(xué)管理學(xué)院情報學(xué)碩士研究生,研究方向:信息政策與法律。
2013年5月24日。