周 眾
(山西傳媒學(xué)院 組織部,山西 榆次 030619)
隨著開放數(shù)據(jù)運動的推廣,越來越多的機構(gòu)參與到數(shù)據(jù)發(fā)布與使用的整體流程中。開放數(shù)據(jù)的經(jīng)濟價值越來越明顯,歐盟報告中預(yù)測2011年開放公開數(shù)據(jù)將帶來直接收益是每年400億歐元[1],世界銀行認為開放數(shù)據(jù)的經(jīng)濟潛力是巨大的[2]。但是,隨著開放數(shù)據(jù)數(shù)量的增加,數(shù)據(jù)質(zhì)量問題日益凸顯,數(shù)據(jù)價值本身受到用戶質(zhì)疑。如何有效地提高數(shù)據(jù)質(zhì)量,追蹤數(shù)據(jù)來源,提高數(shù)據(jù)生命周期,各個用戶的參與度將成為重要問題。數(shù)據(jù)管理不再是單純數(shù)據(jù)本身的問題,而應(yīng)該是涉及到人、所有權(quán)、技術(shù)、制度等多層面的問題。數(shù)據(jù)管理不再是單方向的信息處理問題,而應(yīng)該是雙向信息流的問題,尤其是用戶信息反饋流將對數(shù)據(jù)質(zhì)量的提升具有重大意義。生態(tài)系統(tǒng)強調(diào)系統(tǒng)構(gòu)成各部分之間相互依賴,通過合作與競爭實現(xiàn)系統(tǒng)的有序與平衡。采用生態(tài)系統(tǒng)的觀點認識數(shù)據(jù)管理,有助于提升數(shù)據(jù)管理水平,充分發(fā)揮數(shù)據(jù)的價值。整個生態(tài)鏈中,技術(shù)不再是核心,人的作用得到重視。社會環(huán)境中,需考慮各個構(gòu)成部分如何相互依賴相互影響,通過動態(tài)演化達到生態(tài)平衡。如何促進數(shù)據(jù)資源在生態(tài)鏈中快速順暢地流動,借助外部世界的反饋信息有效地調(diào)整自身行為,從而最大程度地發(fā)揮其在網(wǎng)絡(luò)經(jīng)濟中的價值。
2011年,開放數(shù)據(jù)生態(tài)系統(tǒng)最早在經(jīng)濟學(xué)家Pollock博客中提及[3],認為數(shù)據(jù)處理的基本模型應(yīng)從單方向向數(shù)據(jù)循環(huán)的動態(tài)系統(tǒng)轉(zhuǎn)換,中介者以重用方式發(fā)布清洗、正確、集成的數(shù)據(jù)集。2014年維基年會上,進一步肯定了開放數(shù)據(jù)帶來的廣泛影響,認為需增強數(shù)據(jù)發(fā)布者、分析者和使用者之間合作,以促使基于對話的數(shù)據(jù)生態(tài)系統(tǒng)的建立。毫無疑問,網(wǎng)絡(luò)環(huán)境下開放數(shù)據(jù)的出現(xiàn),進一步帶來了人們對營造良好數(shù)據(jù)生態(tài)環(huán)境的渴望。基于此,探討數(shù)據(jù)生態(tài)的提出到發(fā)展的演變過程,梳理信息生態(tài)、知識生態(tài)、數(shù)據(jù)生態(tài)三者之間的關(guān)系,提煉出不同研究者對于數(shù)據(jù)生態(tài)系統(tǒng)構(gòu)成要素的代表性觀點,旨在對國內(nèi)學(xué)者深入開展數(shù)據(jù)生態(tài)理論的研究奠定基礎(chǔ),為營造國內(nèi)良好的數(shù)據(jù)生態(tài)系統(tǒng)提供可參考性的建議,真正發(fā)揮數(shù)據(jù)在經(jīng)濟領(lǐng)域中的價值。
20世紀90年代,為獲得可持續(xù)的發(fā)展,許多企業(yè)紛紛引進信息系統(tǒng),但并未給企業(yè)帶來應(yīng)有的效益,針對當(dāng)時組織僅僅關(guān)注于信息技術(shù)的問題,1997年達文波特首次正式提出了“信息生態(tài)”概念,強調(diào)一個組織的信息生態(tài)是該組織的信息環(huán)境,由大量交互、互相聯(lián)系的社會、文化、政治子系統(tǒng)構(gòu)成,可以分為政策、文化及人員要素[4]。信息政策明確管理與使用信息的職責(zé),信息文化促使組織內(nèi)部員工形成共同的信息交換、共享、合作等信息行為規(guī)范和價值理念,信息技術(shù)專家及信息內(nèi)容加工專業(yè)人員是信息處理的關(guān)鍵。組織的信息生態(tài)影響到信息的生產(chǎn)及存儲狀態(tài)、信息獲取與信息需求數(shù)量及其信息價值。由此許多研究者展開了此研究[5],從各類型的研究成果中可以看出,信息生態(tài)理論研究注重于系統(tǒng)觀,將信息管理作為整體看待,其由各種不同的要素如技術(shù)、人、行為、文化、政策等構(gòu)成,如何有機地發(fā)揮各種要素之間相互依賴關(guān)系,如何重視人的作用,實現(xiàn)信息生態(tài)的平衡及良好運轉(zhuǎn),促進組織內(nèi)部的信息的創(chuàng)建、流動及其使用是信息生態(tài)學(xué)的研究目標(biāo)。
與此相應(yīng)地,信息生態(tài)比較成熟的理論應(yīng)用到許多相關(guān)領(lǐng)域,研究者提出了“知識生態(tài)”、“數(shù)字生態(tài)”等新概念。
知識管理環(huán)境下,如何將信息轉(zhuǎn)換為行動成為關(guān)注的核心,因此信息生態(tài)(以信息為核心)延伸到知識生態(tài)(以行動為核心),知識生態(tài)由知識節(jié)點、知識交換和知識流構(gòu)成。與信息生態(tài)更多地強調(diào)外部控制,比如采用激勵、獎勵、規(guī)章等方式相比,知識生態(tài)更強調(diào)如何構(gòu)建自適應(yīng)系統(tǒng),通過內(nèi)在激發(fā)、自我控制實現(xiàn)個人的主動積極參與。其更注重人的知識交流及其在交流上建立的關(guān)系,同時研究知識如何影響人的行為(包含潛在行為),以實現(xiàn)新知識的創(chuàng)造及舊知識的更新,促進知識的創(chuàng)造、集成、共享及使用。
數(shù)字生態(tài)指由媒介、通信及IT行業(yè)形成的聚合空間,其由用戶、公司、政府、社會及促進數(shù)字交互的通信設(shè)施構(gòu)成[6], 旨在支持該環(huán)境中各個不同獨立實體間的數(shù)據(jù)自由流動,促進公開、靈活、交互的信息環(huán)境的發(fā)展。其被應(yīng)用于不同的領(lǐng)域,如教育、醫(yī)學(xué)、生物、網(wǎng)絡(luò)。數(shù)字生態(tài)系統(tǒng)應(yīng)由一系列數(shù)字實體構(gòu)成,如網(wǎng)絡(luò)化個體或組織、服務(wù)、軟件、應(yīng)用,它們在數(shù)字化環(huán)境中通過信息及交易流相互聯(lián)接[7]。與信息生態(tài)相比,數(shù)字生態(tài)不再局限于圍繞信息系統(tǒng)為核心的信息環(huán)境,而是延伸到網(wǎng)絡(luò)信息技術(shù)變革所帶來的數(shù)字化環(huán)境。
數(shù)據(jù)提供者的日益增加導(dǎo)致數(shù)據(jù)量的激增,數(shù)據(jù)管理問題叢生,Parsons等提出創(chuàng)建跨學(xué)科全球數(shù)據(jù)生態(tài)系統(tǒng),通過技術(shù)、人、組織及其社會的協(xié)調(diào)適應(yīng)以形成不斷演化的科學(xué)數(shù)據(jù)生態(tài)系統(tǒng)[8],其成為數(shù)字生態(tài)的主要類型之一。隨著web2.0發(fā)展,用戶參與度進一步促進了網(wǎng)絡(luò)數(shù)據(jù)的開放、自由、透明,2007年首次提出了開放數(shù)據(jù)的概念,繼而興起了開放數(shù)據(jù)的運動,出現(xiàn)了開放獲取、開放資源、開放政府等。在此背景下,開放數(shù)據(jù)生態(tài)系統(tǒng)受到關(guān)注,旨在利用生態(tài)學(xué)理論促進開放數(shù)據(jù)的質(zhì)量提升,發(fā)揮開放數(shù)據(jù)的經(jīng)濟價值。大數(shù)據(jù)技術(shù)的出現(xiàn),促進了數(shù)據(jù)生產(chǎn)、管理、消費過程自動化,但大數(shù)據(jù)不僅僅是一個數(shù)據(jù)庫或者HADOOP問題,盡管大數(shù)據(jù)處理及分析構(gòu)成了技術(shù)核心,它應(yīng)該是存儲、處理、可視化及提交結(jié)果到目標(biāo)應(yīng)用的復(fù)雜構(gòu)成[9],大數(shù)據(jù)生態(tài)系統(tǒng)因此產(chǎn)生??梢钥闯?,數(shù)據(jù)量的猛增,數(shù)據(jù)處理技術(shù)的發(fā)展,以開放數(shù)據(jù)、大數(shù)據(jù)為核心的數(shù)據(jù)生態(tài)的理論研究及發(fā)展已受到各界學(xué)者的關(guān)注。
任何生態(tài)系統(tǒng)都是由若干子系統(tǒng)構(gòu)成,信息技術(shù)的快速發(fā)展改變了當(dāng)前的經(jīng)濟、社會環(huán)境,個人、組織機構(gòu)、政府等實體之間數(shù)字化交互頻繁、快速,數(shù)字化生態(tài)系統(tǒng)逐步形成。在此系統(tǒng)中,最核心的構(gòu)成是數(shù)據(jù)、信息、知識的流動。依據(jù)這三者在機構(gòu)中發(fā)揮的作用價值不同,因此將數(shù)字化生態(tài)系統(tǒng)分為數(shù)據(jù)生態(tài)、信息生態(tài)、知識生態(tài)三個子系統(tǒng)。其中數(shù)據(jù)生態(tài)強調(diào)數(shù)據(jù)流的高質(zhì)量、自由通暢及其交互反饋,其作為數(shù)字化生態(tài)系統(tǒng)的基礎(chǔ)構(gòu)成,制約了其它生態(tài)系統(tǒng)的發(fā)展,信息生態(tài)強調(diào)信息流的良好運轉(zhuǎn),實現(xiàn)數(shù)據(jù)流的再加工及更好利用,并進一步為知識生態(tài)系統(tǒng)運轉(zhuǎn)提供高質(zhì)量的輸入信息流。知識生態(tài)強調(diào)知識的創(chuàng)造及運用,與其它子系統(tǒng)相比,更強調(diào)人的主觀能動性,是數(shù)字生態(tài)系統(tǒng)中最具活力、創(chuàng)造力的生態(tài)環(huán)境。
從各個概念所提出的時間節(jié)點看,信息生態(tài)最先提出,知識生態(tài)其次,數(shù)據(jù)生態(tài)最晚,這與信息技術(shù)的發(fā)展規(guī)律相吻合。從20世紀60年代到90年代末,信息技術(shù)廣泛應(yīng)用于信息系統(tǒng)中,帶來了企業(yè)管理層面的變革,如何有效地發(fā)揮信息系統(tǒng)的作用,從信息生態(tài)學(xué)角度看待信息系統(tǒng)問題,成為學(xué)者及管理者關(guān)注的問題。隨著90年代初美國經(jīng)濟學(xué)家羅默和盧卡斯的新經(jīng)濟增長理論的提出,知識經(jīng)濟進入人們的視野,相比信息管理而言,知識管理的難度更大,對組織要求更高,而知識生態(tài)的提出旨在形成個人-知識-技術(shù)的三層網(wǎng)絡(luò)體系,達到知識共享交流與創(chuàng)造應(yīng)用。90年代后期網(wǎng)絡(luò)及通信技術(shù)的迅速發(fā)展,引起了經(jīng)濟、社會、政治等各個層面的變革,網(wǎng)絡(luò)經(jīng)濟、虛擬經(jīng)濟的提出,使人們更多地著眼于生態(tài)環(huán)境的數(shù)字化、開放性、自由性變化特征,在研究數(shù)字化生態(tài)環(huán)境的同時,人們既關(guān)注外部宏觀環(huán)境變化,注意到數(shù)據(jù)的價值,又重視微觀環(huán)境的審視研究,數(shù)據(jù)生態(tài)因此產(chǎn)生。隨著數(shù)字化信息的大量涌現(xiàn),如何有效地辨別數(shù)據(jù)質(zhì)量,提高數(shù)據(jù)加工處理效率、拓展數(shù)據(jù)的應(yīng)用價值成為重要問題。數(shù)據(jù)是產(chǎn)生信息、知識的原料,從信息生態(tài)延伸到數(shù)據(jù)生態(tài)問題,實際回歸到本原問題,只有創(chuàng)建良好的數(shù)據(jù)生態(tài)系統(tǒng),才可為信息生態(tài)、知識生態(tài)系統(tǒng)的發(fā)展提供原動力。
數(shù)據(jù)生態(tài)系統(tǒng)是一個有機體,其由各個構(gòu)成要素之間相互依賴相互作用而形成一個有序的整體。由于研究者分析角度的差異,各構(gòu)成要素的劃分標(biāo)準有所不同,但從其劃分中可窺見數(shù)據(jù)生態(tài)系統(tǒng)研究所關(guān)注的重點依然是數(shù)據(jù)本身。
數(shù)據(jù)生命周期理論的提出旨在提高數(shù)據(jù)管理及保存效率,促進數(shù)據(jù)的使用及重用。從所提出的理論看,數(shù)據(jù)生命周期包含幾個核心的階段: 數(shù)據(jù)收集、數(shù)據(jù)處理、數(shù)據(jù)發(fā)布、數(shù)據(jù)利用。研究者基于開放數(shù)據(jù)生態(tài)系統(tǒng),提出數(shù)據(jù)生態(tài)系統(tǒng)由數(shù)據(jù)審核、數(shù)據(jù)選取、數(shù)據(jù)發(fā)布、數(shù)據(jù)獲取及發(fā)現(xiàn)、用戶參與、評估等要素構(gòu)成[10]。
圖1 基于數(shù)據(jù)生命周期的數(shù)據(jù)生態(tài)系統(tǒng)要素劃分
數(shù)據(jù)審核需明確所發(fā)布數(shù)據(jù)的狀態(tài)(所有權(quán)、收集頻率、格式、價值等),選取價值高、影響度大、以需求驅(qū)動為主的數(shù)據(jù),保護數(shù)據(jù)穩(wěn)私,進行授權(quán)使用,發(fā)布高質(zhì)量的數(shù)據(jù)(格式、元數(shù)據(jù)、標(biāo)準、URI),確認用戶獲取數(shù)據(jù)的途徑,運用目錄或門戶網(wǎng)站組織數(shù)據(jù)以保證數(shù)據(jù)被發(fā)現(xiàn),獲得政府部門政策、財政、能力層面的支持,提供各種用戶反饋渠道(社交媒體、傳統(tǒng)媒體),提高用戶的參與度,積極提倡數(shù)據(jù)經(jīng)濟價值的發(fā)揮,對數(shù)據(jù)進行定期評估,支持數(shù)據(jù)的實踐活動。
數(shù)據(jù)生命周期理論下數(shù)據(jù)生態(tài)系統(tǒng),強調(diào)數(shù)據(jù)的計劃性管理方式,分層次按步驟地完成數(shù)據(jù)的高效率管理。各個要素之間互相依賴,前一個要素決定著后一個要素的實施效果,同樣,該循環(huán)應(yīng)該是一個閉合循環(huán),數(shù)據(jù)評估結(jié)果需反饋到數(shù)據(jù)的審核及選取環(huán)節(jié),提高數(shù)據(jù)的使用價值??梢钥闯?,該理論強調(diào)科學(xué)化數(shù)據(jù)管理方式,重視數(shù)據(jù)的質(zhì)量及其用戶的使用。
數(shù)據(jù)生態(tài)系統(tǒng)的核心資源是數(shù)據(jù),圍繞數(shù)據(jù)處理的主體,按照增值鏈條將數(shù)據(jù)生態(tài)系統(tǒng)分為數(shù)據(jù)提供者(Suppliers)數(shù)據(jù)中介(Intermediaries)、賦能者(Enablers)、數(shù)據(jù)消費者(Consumers)四大要素[11]。
圖2 數(shù)據(jù)處理主體劃分的數(shù)據(jù)生態(tài)系統(tǒng)要素
開放數(shù)據(jù)平臺中,數(shù)據(jù)提供者指那些收集、發(fā)布數(shù)據(jù)的機構(gòu),負責(zé)信息的更新與維護,旨在提高其聲譽度及參與度。中介者則使用開放數(shù)據(jù)向最終用戶提供開放數(shù)據(jù),主要分為三種類型聚合者(Aggregators)、開發(fā)者(Developers)、增值者(Enrichers)。聚合者負責(zé)收集、聚合開放數(shù)據(jù),通過數(shù)據(jù)間復(fù)雜關(guān)聯(lián)生成知識,開發(fā)者設(shè)計、實施、出售基于開放數(shù)據(jù)的應(yīng)用,增值者指利用開放數(shù)據(jù)提高當(dāng)前服務(wù)和產(chǎn)品??梢钥闯?,數(shù)據(jù)中介搭建了數(shù)據(jù)提供者與消費者之間的橋梁,通過數(shù)據(jù)的再加工實現(xiàn)增值服務(wù)(包括新的知識、應(yīng)用程序、基礎(chǔ)設(shè)施的服務(wù))。賦能者(Enablers)有助于促進開放數(shù)據(jù)使用,通過提供基礎(chǔ)設(shè)施來實現(xiàn)獲取、存儲、檢索數(shù)據(jù)的服務(wù)。數(shù)據(jù)消費者不僅瀏覽數(shù)據(jù),而且貢獻、提供反饋,他們可以編輯數(shù)據(jù)實現(xiàn)數(shù)據(jù)的糾錯及其更新,有助于數(shù)據(jù)的維護,他們也可對數(shù)據(jù)提供評論標(biāo)注。通過有效的反饋環(huán)節(jié)使數(shù)據(jù)生態(tài)系統(tǒng)中的數(shù)據(jù)趨于完善。
數(shù)據(jù)在生態(tài)系統(tǒng)中被循環(huán)反復(fù)處理,經(jīng)過不同的數(shù)據(jù)處理主體,實現(xiàn)進一步的編輯、更新、擴展及應(yīng)用,每一要素之間相互依賴,如果數(shù)據(jù)提供者不能充分地提供數(shù)據(jù),則數(shù)據(jù)中介則不能實現(xiàn)數(shù)據(jù)的再加工,數(shù)據(jù)消費者無從利用此數(shù)據(jù)。而數(shù)據(jù)消費者反饋信息渠道不暢,則會形成單向的信息傳遞,數(shù)據(jù)提供者、數(shù)據(jù)中介所處理的數(shù)據(jù)缺乏指向性、針對性,影響所生產(chǎn)數(shù)據(jù)的質(zhì)量。該理論強調(diào)各個數(shù)據(jù)處理主體之間的有效配合,重視數(shù)據(jù)的增值作用。
生態(tài)學(xué)強調(diào)生物與外界環(huán)境之間協(xié)調(diào)發(fā)展,生態(tài)系統(tǒng)的組分結(jié)構(gòu)是指生態(tài)系統(tǒng)中由不同生物類型或品種以及它們之間不同的數(shù)量組合關(guān)系所構(gòu)成的系統(tǒng)結(jié)構(gòu)。達爾波特所提出信息生態(tài)系統(tǒng)構(gòu)成劃分則體現(xiàn)了此思想,認為是由社會、文化、政治子系統(tǒng)構(gòu)成。同樣數(shù)據(jù)生態(tài)被看作是信息生態(tài)的一種類型,其應(yīng)該是人、數(shù)據(jù)、技術(shù)等復(fù)雜環(huán)境構(gòu)成的整體系統(tǒng),被應(yīng)用到不同領(lǐng)域研究者有不同的認識。開放政府生態(tài)系統(tǒng)中,研究者強調(diào)其由開放數(shù)據(jù)提供者及其由政策法律、文化、技術(shù)、組織機構(gòu)、資源等構(gòu)成的環(huán)境、數(shù)據(jù)使用者、政府構(gòu)成[12][13]。
圖3 基于組合結(jié)構(gòu)的數(shù)據(jù)生態(tài)系統(tǒng)要素
電子政府生態(tài)系統(tǒng)由網(wǎng)絡(luò)通訊基礎(chǔ)設(shè)施、電子政府、人力資源、政策及規(guī)章制度構(gòu)成[14]。大數(shù)據(jù)生態(tài)系統(tǒng)中,其由5V大數(shù)據(jù)屬性、數(shù)據(jù)模型及結(jié)構(gòu)、大數(shù)據(jù)基礎(chǔ)設(shè)施、大數(shù)據(jù)生命周期管理(數(shù)據(jù)流動),大數(shù)據(jù)安全設(shè)施構(gòu)成。
數(shù)據(jù)生態(tài)系統(tǒng)中,各個要素之間相互作用,共同影響著系統(tǒng)的運行。該理論強調(diào)數(shù)據(jù)管理中各參與要素的關(guān)系,尤其是軟要素,如政策制度、文化、人員影響,各個要素之間如何有效地交互,使整個數(shù)據(jù)生態(tài)系統(tǒng)趨于動態(tài)平衡且可持續(xù)發(fā)展是研究者關(guān)注的重心。
開放數(shù)據(jù)、大數(shù)據(jù)的出現(xiàn),進一步改變了互聯(lián)網(wǎng)的生態(tài)環(huán)境。如何利用豐富的數(shù)據(jù),發(fā)揮數(shù)據(jù)的價值,提高數(shù)據(jù)質(zhì)量成為用戶關(guān)注的問題。數(shù)據(jù)生態(tài)管理理論的提出及發(fā)展,將圍繞此核心問題開展的系列研究,無論從數(shù)據(jù)生命周期管理,還是價值增值鏈、組合結(jié)構(gòu)角度地分析,都旨在剖析數(shù)據(jù)生態(tài)系統(tǒng)的構(gòu)成要素,從而為深入分析各個要素之間的互動性奠定基礎(chǔ)。
[1]Vickery 1.,G.Review of recent studies on PSI re-use and related market developments.[N/OL].Information Economics,2011[2015-12-06].http://rcc.gov.pt/SiteCollectionDocuments/Final%20Version%20Study%20PSI.pdf.
[2]World Bank.Open data for economic growth[R/OL].2014-06-25[2015-12-14].http://www.worldbank.org/content/dam/Worldbank/document/Open-Data-for-Economic-Growth.pdf.
[3]Pollock R.Building the (Open) Data Ecosystem[N/OL].2011-09-13[2015-2-06].http://blog.okfn.org/2011/03/31/building-the-open-data-ecosystem/.
[4]Davenport,T.H.Information Ecology: Mastering the Information and Knowledge Environment[M].Oxford University Press: New York,1997:106
[5]Detlor B.The influence of information ecology on e-commerce initiatives[J].Internet Research,2001,11(4).
[6]The World Economic Forum.Digital Ecosystem Convergence between IT,Telecoms,Media and Entertainment: Scenarios to 2015[R/OL].2007[2015-11-07].http://www.weforum.org/pdf/scenarios/de_executive_summary.pdf.
[7]Caschera M C,D’Ulizia A,F(xiàn)erri F,et al.Studying network dynamics in digital ecosystems[C].Management of Emergent Digital EcoSystems.2009:21-27.
[8]Parsons M A,?ystein God?y,Ledrew E,et al.A conceptual framework for managing very diverse data for complex,interdisciplinary science[J].Journal of Information Science,2011,37(6).
[9]Membrey.Architecture Framework and Components for the Big Data Ecosystem[J].Journal of System and Network Engineering,2013(1).
[10]Deirdre Lee.Building an Open Data Ecosystem - An Irish Experience[C].ICEGOV2014,Guimaraes: Portugal,2014:351-360.
[11]Ponte,Diego.Enabling an Open Data Ecosystem[R/OL].2015[2015-12-13].http://aisel.aisnet.org/ecis2015_rip/55.
[12]Ubaldi B.Open Government Data: Towards Empirical Analysis of Open Government Data Initiatives[J].Oecd Working Papers on Public Governance,2013,27(3).
[13]Zuiderwijk A,Janssen M.Innovation with open data: Essential elements of open data ecosystems[J].Information Polity,2014(19).
[14]L.Abrahams,Innovation in monitoring and evaluation for e-development and transformational government[C/OL].Sustainable e-Government and e-Business Innovations (E-LEADERSHIP),2012:1-7.