王 娟(武漢大學 a.信息管理學院,b.圖書情報國家級實驗教學示范中心)
自2009年美國政府推出《開放政府指令》(Open Government Direct),并建立開放政府數(shù)據(jù)(Open GovernmentData,OGD)平臺Data.gov以來,政府數(shù)據(jù)開放行動浪潮席卷全球。各國紛紛通過頒布政府數(shù)據(jù)開放政策,建設(shè)開放平臺以促進政府數(shù)據(jù)的開放、獲取和利用,其中美國、英國、澳大利亞等國是政府數(shù)據(jù)開放的先行者。相對而言,我國的政府數(shù)據(jù)開放共享實踐起步較晚,但高度重視開放數(shù)據(jù)工作。2015年國務院印發(fā)的《促進大數(shù)據(jù)發(fā)展行動綱要》提出要實施政府數(shù)據(jù)資源開放共享工程,標志著我國政府數(shù)據(jù)開放共享作為頂層設(shè)計被正式提上日程。[1]
雖然政府數(shù)據(jù)開放行動已成為普遍共識,但是開放數(shù)據(jù)質(zhì)量依然是一個較為嚴峻的問題?!度驍?shù)據(jù)開放晴雨表(第四版)》指出,政府開放數(shù)據(jù)通常是不完整的、過時的、質(zhì)量低下且零散的。在政府機構(gòu)中,政府數(shù)據(jù)開放的時間表、流程和責任往往不夠明確,使開放數(shù)據(jù)管理和發(fā)布工作非常薄弱,而且容易產(chǎn)生多種錯誤。[2]然而,數(shù)據(jù)質(zhì)量是開放數(shù)據(jù)價值的關(guān)鍵,是影響用戶獲取與利用數(shù)據(jù)的關(guān)鍵因素,開放數(shù)據(jù)質(zhì)量的不確定性將對開放數(shù)據(jù)價值的實現(xiàn)造成巨大威脅。[3]《中國地方政府數(shù)據(jù)開放報告(第三版)》指出,數(shù)據(jù)層是政府數(shù)據(jù)開放的核心,而數(shù)據(jù)質(zhì)量則被中國開放數(shù)林指數(shù)評估專家委員會成員一致推選為數(shù)據(jù)層評估的核心。[4]
學術(shù)界圍繞政府開放數(shù)據(jù)的質(zhì)量展開了一系列研究,取得了一定的研究成果。本文通過文獻調(diào)研對國內(nèi)外政府開放數(shù)據(jù)質(zhì)量的相關(guān)文獻進行梳理與總結(jié),重點把握政府開放數(shù)據(jù)質(zhì)量研究的趨勢與方向,以期為本領(lǐng)域研究者提供參考與借鑒。
本文選取Web of Science和CNKI數(shù)據(jù)庫為數(shù)據(jù)源,以主題、摘要和關(guān)鍵詞為檢索字段,以政府開放數(shù)據(jù)質(zhì)量或開放政府數(shù)據(jù)質(zhì)量為檢索詞,進行模糊檢索,檢索時間截止為2018年12月31日,經(jīng)過篩重和刪除不相關(guān)或弱相關(guān)的文獻,共有26篇外文文獻,20篇中文文獻符合本文的研究目的。
本文運用文獻調(diào)查法,對文獻的研究對象和研究內(nèi)容進行分析和述評,全面系統(tǒng)地展現(xiàn)國內(nèi)外政府開放數(shù)據(jù)質(zhì)量研究的熱點和發(fā)展態(tài)勢。通過文獻調(diào)查發(fā)現(xiàn),目前國內(nèi)外對政府開放數(shù)據(jù)的價值、障礙以及政策的相關(guān)研究較多,但政府開放數(shù)據(jù)質(zhì)量研究相對薄弱,研究集中于開放數(shù)據(jù)質(zhì)量的影響因素、開放數(shù)據(jù)質(zhì)量管理與保障機制和開放數(shù)據(jù)質(zhì)量評價等方面。
政府開放數(shù)據(jù)質(zhì)量會受到多種因素影響,通過文獻分析,具體可歸納為技術(shù)、組織、政策法規(guī)和環(huán)境因素(見下表)。
表 政府開放數(shù)據(jù)質(zhì)量的影響因素
(1)技術(shù)因素。Conradi等人研究發(fā)現(xiàn)政府部門的數(shù)據(jù)收集、存儲和使用方式對當?shù)卣臄?shù)據(jù)開放有重要影響。政府數(shù)據(jù)開放之前會經(jīng)過一系列的處理流程,政府開放數(shù)據(jù)質(zhì)量勢必會受到其中各個環(huán)節(jié)的影響。[5]Yang等人從技術(shù)視角出發(fā),指出數(shù)據(jù)格式、元數(shù)據(jù)、信息系統(tǒng)外包和信息化水平是影響政府開放數(shù)據(jù)質(zhì)量的重要因素。[6]Kubler等人發(fā)現(xiàn)政府開放數(shù)據(jù)門戶中的元數(shù)據(jù)質(zhì)量對于政府開放數(shù)據(jù)的質(zhì)量以及政府數(shù)據(jù)開放的成功起著至關(guān)重要的作用。而當前的電子政務模型中幾乎沒有考慮元數(shù)據(jù)質(zhì)量。[7]這主要是因為政府部門工作人員普遍欠缺數(shù)據(jù)質(zhì)量意識和數(shù)據(jù)素養(yǎng)能力。[8-9]
(2)組織因素。政府數(shù)據(jù)開放仍是一項影響廣泛的新興運動,許多政府機構(gòu)尚未建立專門負責的OGD部門,由于人員編制、財政支持等資源限制,政府數(shù)據(jù)開放的許多工作由現(xiàn)有的員工執(zhí)行,增加了政府部門的額外工作量,且沒有對政府數(shù)據(jù)開放實踐的績效進行正式監(jiān)督,最終影響了政府開放數(shù)據(jù)的質(zhì)量。[10-12]Attard等人認為,組織文化和組織準備程度都對政府開放數(shù)據(jù)質(zhì)量有重要影響。[13]黃如花等人通過文獻調(diào)研,提出了中國政府數(shù)據(jù)開放障礙框架,指出受傳統(tǒng)體制觀念、風險規(guī)避和保守的組織文化影響,政府機構(gòu)總體上還沒有真正理解并接受政府開放數(shù)據(jù)的真實價值。[14]各級政府部門將數(shù)據(jù)資源看作本部門專有資源,[15]不愿意開放政府數(shù)據(jù)或者盡量少開放,更不愿花費額外成本提供優(yōu)質(zhì)數(shù)據(jù)。
(3)政策法規(guī)因素。Zuiderwijk等人認為,數(shù)據(jù)所有權(quán)風險和合法性問題是開放數(shù)據(jù)的主要挑戰(zhàn)。此外,開放政府數(shù)據(jù)還存在侵犯隱私的風險。[12]由于個人隱私等信息安全保護法規(guī)的不健全,隱私與開放透明之間的界限不清,也在一定程度上影響了政府開放數(shù)據(jù)的質(zhì)量。[16]李樵指出,現(xiàn)有的政府信息公開法律無法有效規(guī)定和保障政府公開數(shù)據(jù)的類型和標準,是造成數(shù)據(jù)質(zhì)量問題以及由于數(shù)據(jù)質(zhì)量不佳導致數(shù)據(jù)驅(qū)動的決策風險的重要原因。[17]Veenstra等人指出,統(tǒng)一的政策和法規(guī)對政府開放數(shù)據(jù)具有方向性的引導作用。[18]由于缺乏明確的法律規(guī)范,政府機構(gòu)在數(shù)據(jù)開放共享前反復檢查是否違反相應的約束,[6]勢必會對政府開放數(shù)據(jù)質(zhì)量造成影響。
(4)環(huán)境因素。Yang等人認為,媒體和公眾壓力、同行比較等因素也影響了政府開放數(shù)據(jù)質(zhì)量。[6]顯然,開放政府數(shù)據(jù)會受到媒體和公眾的審查,政府數(shù)據(jù)開放責任部門無法承受由于數(shù)據(jù)的不準確、不完整而使公眾遭受損害的責任。在政府數(shù)據(jù)開放運動愈演愈烈的今天,相關(guān)機構(gòu)不可避免會受到本地域乃至世界范圍內(nèi)的同行壓力,但是,同行壓力會促進政府部門提高開放數(shù)據(jù)的質(zhì)量。
(5)此外,樊博等人以上海、北京和武漢三地128個政府部門為樣本,從內(nèi)部組織和外部環(huán)境兩方面研究政府開放數(shù)據(jù)質(zhì)量的影響因素。研究發(fā)現(xiàn),政府部門的制度能力是政府開放數(shù)據(jù)質(zhì)量的重要影響因素,來自公眾和上級政府部門的外部壓力可以調(diào)節(jié)作為內(nèi)部組織因素的制度能力與政府開放數(shù)據(jù)質(zhì)量之間的關(guān)系。[19]
學者們分別從政府開放數(shù)據(jù)的發(fā)布機制、政府開放數(shù)據(jù)基礎(chǔ)架構(gòu)功能以及政府數(shù)據(jù)開放實踐等方面對政府開放數(shù)據(jù)質(zhì)量管理與保障機制進行研究。
YouGov總裁Stephan Shakespeare提出的“數(shù)據(jù)雙軌發(fā)布”辦法是提高政府開放數(shù)據(jù)質(zhì)量的有效方法。[20]這種發(fā)布機制可以克服體制和技術(shù)障礙,最終目的是要政府部門盡可能發(fā)布高質(zhì)量的數(shù)據(jù)。Zuiderwijk等人通過準實驗方式評估了政府開放數(shù)據(jù)架構(gòu)中數(shù)據(jù)質(zhì)量指標和用戶參與機制的重要性和有用性,研究表明,在政府開放數(shù)據(jù)門戶中增加信息討論、社交分享、評論等功能,可有效提高政府數(shù)據(jù)開放用戶參與度和數(shù)據(jù)質(zhì)量。[21]國內(nèi)學者譚必勇等人基于政府開放數(shù)據(jù)平臺的宏觀功能,對我國10個省、市的政府開放數(shù)據(jù)平臺的數(shù)據(jù)質(zhì)量現(xiàn)狀進行調(diào)查,研究發(fā)現(xiàn)各地方政府數(shù)據(jù)開放平臺的數(shù)據(jù)質(zhì)量良莠不齊,提出我國政府應從踐行開放理念、改善數(shù)據(jù)體驗和夯實平臺基礎(chǔ)三個方面來提升政府開放數(shù)據(jù)平臺的數(shù)據(jù)質(zhì)量。[22]黃如花等人針對我國政府開放數(shù)據(jù)中的基礎(chǔ)數(shù)據(jù),提出我國應在遵循國際開放定義和開放數(shù)據(jù)原則的前提下,明確政府開放數(shù)據(jù)的數(shù)據(jù)格式,建立基于數(shù)據(jù)生命周期的數(shù)據(jù)質(zhì)量保證框架,建立政府開放數(shù)據(jù)的元數(shù)據(jù)標準和政策等建議。[23]翟軍等人通過梳理英國政府開放數(shù)據(jù)“國家信息基礎(chǔ)設(shè)施”建設(shè)的相關(guān)政策和實施情況,歸納總結(jié)其數(shù)據(jù)質(zhì)量保障等方面的經(jīng)驗,為我國政府開放數(shù)據(jù)實踐提供借鑒和參考。[24]相麗玲等人以美國、英國、澳大利亞等國Data.Gov資料為基礎(chǔ),探索各國的政府數(shù)據(jù)開放在運行方式及保障機制方面的異同,并對各國在開放數(shù)據(jù)質(zhì)量控制及其方法等方面的共性與差異進行分析。[25]李樵通過文獻研究、政策法規(guī)調(diào)研和政府數(shù)據(jù)開放平臺調(diào)研,提出建立政府數(shù)據(jù)開放和開放政府數(shù)據(jù)質(zhì)量的監(jiān)督問責制等建議。[17]
這些研究為國內(nèi)外政府開放數(shù)據(jù)理論與實踐研究提供了有益借鑒,也被許多國家政府機構(gòu)采納,如英國吸納了Stephan Shakespeare提出的“數(shù)據(jù)雙軌發(fā)布”辦法,[20]將傳統(tǒng)的自上而下的政府開放數(shù)據(jù)發(fā)布機制與自下而上的市場需求拉動數(shù)據(jù)發(fā)布機制結(jié)合起來,將優(yōu)先級別高、影響范圍廣的數(shù)據(jù)高質(zhì)量發(fā)布出來。
數(shù)據(jù)質(zhì)量評價研究歷史由來已久,評估數(shù)據(jù)集的質(zhì)量是數(shù)據(jù)質(zhì)量管理項目的基本任務。[26]而政府開放數(shù)據(jù)質(zhì)量評價主要針對數(shù)據(jù)的可獲取性、準確性、可信度等方面作評價。政府開放數(shù)據(jù)質(zhì)量評價研究主要包括數(shù)據(jù)質(zhì)量評估標準、評估工具與方法以及實證評估研究三個方面。
政府開放數(shù)據(jù)質(zhì)量評估標準是政府開放數(shù)據(jù)質(zhì)量評價的基礎(chǔ),也是提高數(shù)據(jù)質(zhì)量的首要條件。學者們基于不同的研究視角,提出不同的政府開放數(shù)據(jù)質(zhì)量評估指標。
萬維網(wǎng)聯(lián)盟(W3C)創(chuàng)始人Tim Berners-Lee提出的“5星開放數(shù)據(jù)”標準是政府開放數(shù)據(jù)質(zhì)量評估標準中最重要的成果。[27]Ubaldi從政治、組織、技術(shù)等不同層面制定了一系列指標,從可用性、需求度和重復使用等方面衡量數(shù)據(jù)的質(zhì)量。[28]王今等人基于用戶滿意度視角建立了評價政府開放數(shù)據(jù)質(zhì)量的指標體系,采用層次分析法計算評價指標的權(quán)重,并通過模糊綜合評價法對我國政府開放數(shù)據(jù)質(zhì)量進行用戶滿意度測評,驗證了模型的有效性。[29]但是,政府開放數(shù)據(jù)質(zhì)量評價缺乏統(tǒng)一的標準,需要相關(guān)機構(gòu)和組織開展此項研究和標準編制工作。
國內(nèi)外學者在已有的數(shù)據(jù)質(zhì)量評估工具與方法研究的基礎(chǔ)上,結(jié)合政府開放數(shù)據(jù)的具體環(huán)境,構(gòu)建相應的評估工具與方法。
Behkamal等人參考ISO25012標準數(shù)據(jù)質(zhì)量模型構(gòu)建了一個具有20個維度的指標體系,并通過理論和經(jīng)驗兩種方式驗證了指標體系的適用性。[30]Kubler等人運用層次分析法構(gòu)建了一個開放數(shù)據(jù)門戶質(zhì)量評估體系,對259個開放數(shù)據(jù)門戶的元數(shù)據(jù)質(zhì)量進行分析與評估,驗證了指標體系的適用性。[7]韋忻伶等人對已有的政府開放數(shù)據(jù)質(zhì)量評估體系進行系統(tǒng)梳理,構(gòu)建了政府開放數(shù)據(jù)質(zhì)量評估動因、評估內(nèi)容和評估方法的循環(huán)迭代檢驗機制。[31]
政府開放數(shù)據(jù)質(zhì)量實證評估研究以國內(nèi)外政府開放數(shù)據(jù)平臺的真實數(shù)據(jù)為對象進行數(shù)據(jù)質(zhì)量評估,為改進政府開放數(shù)據(jù)質(zhì)量評估方法與工具提供了依據(jù),并對進一步提升政府開放數(shù)據(jù)質(zhì)量提出了針對性的建議或意見。
Oviedo等人在Tim Berners-Lee的五星質(zhì)量標準模型的基礎(chǔ)上,提出了一個新的開放門戶數(shù)據(jù)質(zhì)量評估模型,并對哥斯達黎加當?shù)卣_放數(shù)據(jù)進行實證研究以闡釋該模型的測量機制。[32]Viscusi等人探討了基于質(zhì)量的政府開放數(shù)據(jù)合規(guī)性評估框架,其中包括數(shù)據(jù)質(zhì)量維度和一系列衡量合規(guī)性指數(shù)的標準,并運用該框架對意大利當?shù)毓残姓C構(gòu)的開放數(shù)據(jù)樣本進行評估。[33]Vetrò等人在SPDQM數(shù)據(jù)質(zhì)量評估模型的基礎(chǔ)上,構(gòu)建了一個量化的開放數(shù)據(jù)質(zhì)量評估框架,并對意大利的兩組政府開放數(shù)據(jù)集進行實證研究,結(jié)果表明存在數(shù)據(jù)監(jiān)控和質(zhì)量控制過程的國家層面集中式發(fā)布的開放數(shù)據(jù)具有較好的質(zhì)量。[34]Torchiano等人基于ISO25024標準,制定了一系列政府開放數(shù)據(jù)質(zhì)量評估指標,以意大利公共行政部門的12個不同組織發(fā)布的數(shù)據(jù)集為例,通過開源軟件進行驗證,結(jié)果表明該組評估指標能夠?qū)崿F(xiàn)數(shù)據(jù)集質(zhì)量的初始自動評估。[35]李凡星構(gòu)建了一個政府開放數(shù)據(jù)平臺的評估體系,對北京、上海、浙江三地的地方政府開放數(shù)據(jù)平臺進行了基于數(shù)據(jù)質(zhì)量的實證評估研究,并從評估實施、政策、技術(shù)、管理、合作五個方面對政府開放數(shù)據(jù)平臺建設(shè)與實施提出建議。[36]李曉彤等人通過對北京、廣州和哈爾濱三個城市的1,900多個政府開放數(shù)據(jù)集質(zhì)量進行評估,發(fā)現(xiàn)三個城市的數(shù)據(jù)集質(zhì)量在完整性、準確性和一致性等維度上總體得分偏低,且不同數(shù)據(jù)集之間的質(zhì)量差異較大,提出政府部門要采取有效措施提升數(shù)據(jù)質(zhì)量。[37]
政府數(shù)據(jù)開放已成為不可逆轉(zhuǎn)的趨勢,政府數(shù)據(jù)開放受到全世界各國的高度重視的同時,開放數(shù)據(jù)質(zhì)量也得到廣泛的關(guān)注。通過對國內(nèi)外政府開放數(shù)據(jù)質(zhì)量研究的回顧,發(fā)現(xiàn)本領(lǐng)域的研究還存在著一些不足。① 研究比較薄弱。有待學者們針對具體數(shù)據(jù)質(zhì)量問題展開深入的研究與探討,形成一個整體的理論框架。② 缺乏政府開放數(shù)據(jù)質(zhì)量控制研究。后續(xù)研究可以從不同維度探索開放數(shù)據(jù)質(zhì)量控制的科學途徑,從而保障政府開放數(shù)據(jù)質(zhì)量,促進政府開放數(shù)據(jù)的獲取與再利用。③ 缺乏統(tǒng)一的政府開放數(shù)據(jù)質(zhì)量評估標準。盡管政府開放數(shù)據(jù)質(zhì)量評估方法呈現(xiàn)出多樣化特點,但是未形成統(tǒng)一而有效的評估標準,在實踐中評估效果也不盡如人意,對于政府開放數(shù)據(jù)質(zhì)量的評估可以從評估指標、評估效度及用戶滿意度等方面繼續(xù)深入展開研究。