王盟燏 王常玨 李玉海,3
1.華中師范大學信息管理學院 武漢 430079
2.海南經貿職業(yè)技術學院 ???571127
3.華中師范大學中國圖書館創(chuàng)新發(fā)展研究中心 武漢 430079
政府數據開放是由政府信息公開發(fā)展而來。最早的專門性的信息公開立法是1966年美國頒布的《信息自由法》。在2007年,我國也頒布了《中華人民共和國政府信息公開條例》[1]。政府數據開放是政府信息公開的延續(xù),起源于2009年數據開放運動——奧巴馬政府推出首個政府數據開放平臺“Data.gov”,英國、澳大利亞、愛爾蘭、法國、日本等國紛紛推出政府數據開放計劃,全球政府數據開放共享成為趨勢。自此國內外學界和業(yè)界對于政府數據開放開展了大量的研究和實踐。
華中師范大學信息管理學院和湖北省數據治理與智能決策研究中心在2020年發(fā)布的《中國政府開放數據利用研究報告》指出:政府開放數據是其他領域問題研究中不可缺少的一個環(huán)節(jié),由“特殊利用”走向“泛在利用”[2]。數據由樣本變?yōu)槿w,在大數據開放的背景下,數據是新的重要資源,將形成以數據為基礎的扁平化、網絡化、平臺化、數據化的新型生態(tài)[3]。在新型的社會生態(tài)環(huán)境中,政府的治理邏輯和結構流程創(chuàng)新重點離不開數據治理的創(chuàng)新發(fā)展,政府數據治理必須依靠數據,這不是簡單的對政府數據本身的治理,而是依據數據治理。政府數據治理能力與政府數據開放息息相關,政府數據開放共享是數據治理的重要內容。政府數據開放是政府數據治理的前提和基礎[4]。數據開放的核心在于將獨自掌握的原始數據資源提供給公眾獲取和使用[5]。
但是現階段我國政府數據的開放實踐整體效果卻不盡如人意,與美國、英國等國家政府數據開放相比還存在一定差距,如存在數據質量差異大、用戶參與度低、有效利用率不高等問題[6-7],政府數據治理面臨多方面的挑戰(zhàn)。為解決這些問題,黃如花、段堯清、陳朝冰、楊正等學者分別在2016、2017、2018、2019年對政府數據開放研究做過共享研究述評(2005-2015年)[8],采用詞頻統(tǒng)計、聚類分析和共享分析方法對中外政府開放數據領域的研究熱點與前沿問題進行分析[9],利用發(fā)表時間、作者、期刊等變量的分布特征和關鍵詞聚類的方法對政府數據開放做了進展與趨勢研究(2013-2017年)[10],利用Web of Science核心集)對政府數據開放利用做了科學計量分析[11]。但目前對我國政府數據開放研究文獻主題的內在關聯(lián)時序演化的深度挖掘和對研究成果來源及學科分析研究較少。隨著政府數據開放研究主題的深化、擴大,迫切需要厘清與梳理近10年來我國政府數據開放研究的理論方法與實踐應用研究,為新時代我國政府數據開放理論研究與實踐應用提供參考路徑。
本研究選取CNKI中國知識資源總庫收錄的主題詞為“政府數據開放”“政府開放數據”“開放政府數據”,論文發(fā)表時間限定為2011年1月1日至2020年12月31日,期刊來源類別選擇中國社會科學引文索引(CSSCI)和中文核心期刊要目總覽的中文期刊論文,經過人工剔除不相關文獻,檢索得到文獻622篇作為國內政府數據開放研究分析樣本。本文運用文獻調查法和知識可視化的方法,使用BICOMB2.0、COOC9.94等文獻分析軟件作為主要分析工具。
從圖1可知,我國政府數據開放發(fā)文量在2011-2018年呈快速發(fā)展階段,2019年至今發(fā)文量趨于穩(wěn)定。2017年和2018年是國內發(fā)文量高峰,表明近年來政府數據開放逐漸受到關注并具有持續(xù)研究關注度?;跇颖疚墨I的時間分布,政府數據開放研究分為3個階段:
圖1 2011-2020年政府數據開放研究文獻發(fā)文量
(1)起步期(2011-2014年)。此階段發(fā)文量較少,研究初期的主題分布差異性較大,研究最多的主題是電子政務[12-14]。此外,研究較多聚焦于對國外政府數據開放成果的引介,研究內容為國外政府數據開放數據管理與利用[15]、保障機制[16]、歷史與進展[17]、門戶功能[18]。在實踐方面,2012年我國建立了第一個政府數據開放平臺——上海政府數據服務網[19]。
(2)發(fā)展期(2015-2018年)。2015年國務院發(fā)布《促進大數據發(fā)展行動綱要》,標志著國家開放政府數據頂層設計正式啟動。此階段政府數據開放研究成果數量增長迅速,而電子政務和對國外政府數據開放理論和實踐的研究始終是重點內容[20-22],但是政府數據開放研究主題擴散到大數據[23]、數據治理[24]、公共服務[25-26]、政策[27-28]、元數據[29]等更寬泛的視域和更專深的研究。
(3)穩(wěn)定轉型期(2019-2020年)。2019年初,《中華人民共和國政府信息公開條例》修訂公布,此階段政府數據開放研究發(fā)展增速放緩并趨于穩(wěn)定,學者對大數據、電子政務、數據治理、政策、元數據等重點研究主題做了更深入的研究,如對政策進行演化分析和主題分析[30-31],在政府開放數據研究取得階段性成果后,更多的學者關注數據和數據平臺的質量保障和評估主題[7,32](特別是在應對突發(fā)事件的政府開放數據的質量評估)研究[33],我國政府數據開放共享標準體系構建也提上日程[34]。2020年4月9日,國務院發(fā)布了《關于構建更加完善的要素市場化配置體制機制的意見》,將數據資源作為一種新型生產要素[35],“數據要素”成為新的研究熱點,我國政府數據開放研究邁入轉型期。
運用CNKI及BICOMB2.0對我國政府數據開放研究樣本文獻的來源進行文獻分析。主要分析樣本文獻的發(fā)文作者和發(fā)文機構。
從樣本文獻發(fā)文作者來看,2011-2020年發(fā)文量在10以上的作者有10位(見表1),分別是:黃如花、馬海群、陳美、鄭磊、翟軍、夏義堃、周文泓、陳朝兵、段堯清、林巖。學者們對該領域問題進行了持續(xù)、深入研究,10位學者10年研究成果占總發(fā)文量的35%。
表1 樣本文獻中發(fā)文量在10篇以上的作者
從研究機構來看,研究成果分布較為集中。我國政府數據開放研究成果主要集中在高校信息管理學院及信息資源研究中心,發(fā)文數量前5位的高校是武漢大學、黑龍江大學、湖北工業(yè)大學、華中師范大學、四川大學。詳細情況見表2。
表2 樣本文獻中發(fā)文量10篇及以上的機構
運用CNKI及BICOMB2.0對我國政府數據開放研究樣本文獻的來源學科和刊文載體進行統(tǒng)計分析。主要分析樣本文獻學科分布(見圖2)和載文期刊(見表3)。
圖2 樣本文獻發(fā)文量前10學科
表3 樣本文獻刊文量10篇及以上的期刊
從學科領域來看,根據CNKI的學科分析工具,發(fā)文數量前5位的學科是行政學及國家行政管理、新聞與傳媒、圖書情報與數字圖書館、中國政治與國際政治、行政法及地方法制,分別占總研究樣本的42%、25%、12%、7%、5%。
從載文期刊來看,刊文量10篇及以上的期刊有13種,排名前5位的是《電子政務》(59篇)、《圖書情報工作》(40篇)、《情報理論與實踐》(37篇)、《情報雜志》(37篇)、《圖書館》(30篇)。13種期刊中11種屬于圖書情報學相關領域,1種屬于電子政務領域,1種屬于政府管理領域。政府數據開放研究成果在《電子政務》刊文量最大,但從期刊所屬領域總體來看,圖書情報學領域的期刊是研究成果的主要刊文陣地。
2011-2020年我國政府數據開放研究成果發(fā)文機構、研究學科和載文刊物較為集中。綜合來看,主要集中在武漢大學、黑龍江大學等高校的信息管理學院和信息資源管理研究中心;雖然行政學及國家行政管理學科發(fā)文量最多,但是發(fā)文機構來源較為分散;圖書情報學領域的期刊是樣本文獻研究成果的主要發(fā)文陣地。
為更直觀地分析2011-2020年我國政府數據開放研究主題分布,對622篇樣本文獻進行關鍵詞統(tǒng)計分析,選取出現頻次為10及以上的關鍵詞進行可視化社區(qū)聚類。
樣本文獻的主題分布見圖3。關于“政府數據開放”的研究高度集中在電子政務、政府信息公開、公共服務等內容,映射出該主題研究服務于電子政務信息公開的公共服務需求導向,其他主題詞頻度由高到低依次為:大數據、信息公開、隱私保護、政策、數據開放平臺、電子治理、信息資源、政府信息、信息安全、物聯(lián)網+、個人隱私等。
圖3 樣本文獻的主題分布
圖3表明,研究者對“政府數據開放”的研究方向主要圍繞開放數據平臺、數據質量及評估、元數據及元數據標準、政策協(xié)同及工具等問題展開研究。圖3還顯示,“政府數據”“數據開放”也是我國政府數據開放的研究重點,研究內容主要集中在數據治理、政府治理、數據管理、數據共享、開放平臺、政府數據治理、政策體系、數據安全、開放政策、法律法規(guī)等問題。
通過對樣本文獻的主題分布聚類分析,發(fā)現“政府數據開放”的研究領域較“開放政府數據”“政府開放數據”更為廣泛,學者們研究“政府數據開放”研究的目的是提高政府數據的利用效率,他們對政策法律、信息安全、隱私保護等問題有較多的理論研究。學者們對“開放政府數據”“政府開放數據”的研究主要圍繞數據平臺、數據質量及評估、元數據及元數據標準、政策工具等方面的實踐和應用展開。
我國政府數據開放研究樣本文獻主題的時序演進可視化分析是對樣本文獻時間和主題詞進行統(tǒng)計分析。本研究采用主題詞演化累積可視化分析(見圖3),圖中的主題詞統(tǒng)計標注在最早出現的年度,圓圈越大代表該主題詞在后續(xù)研究中出現的頻率越高,即關注熱度越高。筆者選取2011-2020年每年度主題詞詞頻排名前6位的關鍵詞進行主題詞演化累計可視化分析,以找到重要研究主題并梳理其發(fā)展脈絡,追蹤其研究關注度。
3.2.1 主題詞年度演進情況分析
表4為2011-2020年在樣本文獻中詞頻排名前6位的主題詞。由表4可知,“開放政府數據”“政府開放數據”“政府數據開放”作為獨立的研究主題分別出現于2011年、2012年、2013年,對政府開放數據的實踐及應用研究早于理論研究。
表4 樣本文獻年度主題詞詞頻排名前6位的關鍵詞
3.2.2 主題詞時序演進積累分析
(1)起步期(2011-2014年)?!伴_放數據”“開放政府數據”“電子政務”“信息公開”“關聯(lián)數據”“數據管理”“政府開放數據”“開放政府”“政府數據開放”“政府數據”“政府信息公開”“公共服務”“保障機制”“大數據”“英國”“政府”“開放數據平臺”學者們持續(xù)對以上主題保持研究熱度,“數據服務”“實證分析”“貿易開放”“數據密集型科學”“平臺建設”“大數據產業(yè)”等主題研究的關注度走低,缺乏研究持續(xù)力。
(2)發(fā)展期(2015-2018年)。這一時期學者們對起步期的主題做了深化研究,主要研究熱點有“地方政府”“數據治理”“政府治理”“數據開放平臺”“數據質量”“數據政策”“隱私保護”“元數據”“美國”,研究熱點主題逐漸穩(wěn)定,具有研究持續(xù)性;數據開放平臺、數據質量、數據政策、元數據、數據利用相關研究主題領域成果豐富。
(3)穩(wěn)定轉型期(2019-2020年)。這一時期學者們對政府數據開放研究主題呈現泛化和跨學科性,主要趨勢為更加重視社會和市場的研究維度,“數字經濟”“數據要素”“模糊集定性比較”“新智庫建設”“市場化配置”等成為新的研究熱點主題。
綜上所述,自2011年起學者們對政府數據治理的相關政策、法規(guī)、保障機制、隱私保護、數據管理、數據治理、數據質量、平臺建設等問題進行不斷深入的研究,這些一直是該領域的研究重點問題。2019年之后,學者們多從社會和市場的維度對該主題進行研究,主要研究數據的價值和利用。具體情況如圖4所示:
圖4 樣本文獻主題年度演進
本文運用文獻調研法和文獻分析工具,對文獻的研究對象和研究內容進行分析和述評,全面系統(tǒng)地展現了我國政府數據開放研究的熱點和發(fā)展態(tài)勢。在全球政府數據開放的背景下,我國學者對政府數據開放展開研究,致力于研究我國政府數據治理不同階段中亟需解決的重要問題。相關研究主要圍繞數據采集、數據組織、數據儲存、數據處理以及數據共享與利用等政府數據治理不同階段的政府數據開放全過程開展研究。筆者從核心作者(見表1)、發(fā)文主要機構(見表2),并結合主題分布(見表4)及時序演進(見圖4)進行綜合分析,發(fā)現學者們研究我國政府數據開放的范圍較廣,但是研究多集中在政府開放數據的保障、范圍、實現路徑及工具、發(fā)展目標4個方面。結合樣本文獻發(fā)文主題聚類分布,將研究文獻成果歸納為政策與法規(guī)研究、管理與治理研究、平臺研究、價值與利用研究4類,并選取具有代表性的文獻進行評述。
2013年以來,我國學者對政府數據開放政策及法律法規(guī)進行了大量研究,主要有以下4個方面:
(1)對國外政府數據開放的保障性法律進行研究。如王新才等[36]、孫旭培等[37]、龍非[38]等研究了《信息自由法》在美國、澳大利亞、德國的應用及對中國的啟示。
(2)對政府數據開放共享保障機制問題進行研究。黃如花等對這一問題進行了持續(xù)深入的研究,主要對英國[39]、丹麥[40]、美國[41]、法國[42]政府數據開放政策法規(guī)保障及對我國的啟示,政府數據開放共享政策與標準[27]、政策問題的構建[43]、政策框架與內容[44]、政策體系構建[45]、標準體系構建[46]等問題展開了研究。
(3)對政府數據開放過程中隱私保護問題的研究。陳美等對德國[47]、澳大利亞[48]的個人隱私保護政策及措施進行研究,對法國[49]、英國[50]、新西蘭[51]隱私風險評估與防控經驗進行研究;張曉娟等[52]以政府數據開放與個人隱私保護之間互為平衡、彼此促進的相互關系為切入點,梳理了中美在政府數據開放和個人隱私保護方面的各項政策和法律法規(guī),分析了兩國在實踐中的經驗。
(4)對現狀和問題的研究。馬海群等自2015年起對政府開放數據政策與治理進行比較研 究[53-54], 用 WSR(WuH-Shili-Renli System Approach)方法論對政策分析框架進行結構分析[55],對政策進行評估[56]和執(zhí)行力影響因素研究[57];劉新萍等[58]以上海市為例對政府數據開放的潛在風險和對策進行了研究;譚必勇等[59]以15個副省級城市為例對地方政府開放政策進行了研究。
黃如花、陳美、馬海群等學者主要對政府數據開放共享保障機制問題、隱私保護政策及風險評估與防控、政策分析及評估等問題展開持續(xù)深入的研究。目前我國政府數據開放法律法規(guī)和政策體系不健全,缺乏個人隱私保護的法律法規(guī)政策,對政府數據開放的監(jiān)管不到位存在潛在風險,我國各地方政府開放數據政策體系建設情況差距較大,尚處在起步階段。
關于政府數據開放中的管理和治理問題的研究按照關注熱度(見圖3)可以分為兩個階段,2011-2014年學者們主要研究方向為“數據管理”,2015之后學者們對“電子治理”“政府治理”“數據治理”等主題開展了更多的研究。
在第一個階段,徐慧娜等[60]從公共管理的視角對國際政府數據開放研究的文獻進行研究,其認為“政府數據開放”主要是對數據層面和管理層面進行管理,前者包括數據準確性、數據保密、數據整合、數據背景描述、數據所有權、數據位置、用戶對數據的使用和解讀能力等,后者包括權力結構、組織架構、部門利益、組織文化和人員意識等,這些影響因素間呈現動態(tài)互動關系;侯人華等[61]以美國www.data.gov為例, 從數據管理的視角,分別對其數據的特點、數據采集方式、數據管理策略、數據利用方式以及優(yōu)勢5個方面進行案例分析,通過對美國數據網站的開放政府數據集特征、管理和利用的分析來揭示美國數據網站在信息公開過程中對數據信息資源的管理與利用方式、方法和水平。
在第二個階段,夏義堃、翟軍、趙龍文等學者對這一問題進行了深入研究。夏義堃對政府數據治理的生成背景[62]、概念框架[24]、治理維度[63]和模式[64]、國際經驗[20]進行了研究,同時對政府首席數據官制度[65]進行了探討;翟
軍等主要從數據層面進行研究,主要對政府開放數據質量評價[66-67],元數據核心集[68]、方案[69]、本體設計[70],跟蹤研究美國、歐盟等元數據標準DCAT進展[71-73];趙龍文等主要基于語義和關聯(lián)對政府數據開放進行資源描述[74-76]、檢索[77],政府數據開放實現方法[78]和模式[79]等問題進行研究。
政府數據開放管理與治理研究領域學者們主要從數據層面和管理層面進行研究,在數據層面,學者翟軍和趙文龍等主要從數據質量及評價、元數據、元數據標準、數據的描述和檢索(語義和關聯(lián)維度)等主題展開研究;在管理層面,夏義堃對政府數據治理進行了綜合研究。目前我國政府數據開放的戰(zhàn)略和制度不夠健全,國內外規(guī)范標準和技術融合度不高,數據的價值屬性方面的研究成果不豐富。
2014-2020年,學者一直關注“開放數據平臺”“平臺建設”“數據開放平臺”“政府數據開放平臺”等研究主題,產生了大量的研究成果,主要研究方向有平臺保障政策研究、平臺數據研究、平臺軟件開發(fā)與功能研究、平臺質量及評估研究、平臺發(fā)展現狀分析等方面。這里為避免與上文重復,主要對后3個研究方向代表成果展開論述。
(1)平臺軟件開發(fā)與功能研究。錢曉紅等[80]基于數據集開放來構建政府數據開放平臺并提取了5個技術特征;李盼等[81]和陳美[82]認為可以應用Drupal和CKAN(the Comprehensive Knowledge Archive Network)建構我國政府數據開放平臺的框架體系。
(2)平臺質量及評估研究。馬海群等對這一類問題使用多種方法和工具進行深度研究,方法一是基于結構方程法建立政府開放數據網站服務質量評價的六維度測量模型[83];方法二是建立了政府開放數據網站評價指標體系,利用神經網絡的BP(Back Propagation)算法確定總體的評價結果[84],方法三是基于DEA(Data Envelopment Analysis)對我國8個具有代表性的政府開放數據網站效率進行評價[85]。
(3)平臺發(fā)展現狀分析。湯志偉等[86]對全國18個政府數據開放平臺進行實證分析,結論是政府數據開放平臺發(fā)展水平影響因素主要有數據開放政策數量、地方經濟發(fā)展水平和信息產業(yè)發(fā)展水平等因素。東方[87]、王萍等[88]學者對國內外政府數據開放平臺進行了調查分析并做了研究述評。
我國政府數據開放平臺研究成果豐富,形成了“省級—副省級—地方”層級式分布特征[88],但是存在功能單一、用戶參與度低、質量參差不齊、資源描述模糊、運營管理不及時、權限管理不清晰等問題[10,35,89]。學者們聚焦平臺軟件開發(fā)技術與國際融合,質量和評估與用戶利用提升關聯(lián)等問題進行研究,解決了我國政府數據開放平臺現階段實際問題。
2019年生效的美國《開放政府數據法案》和歐盟《開放數據指令》樹立了全球典范[90],2020年4月9日,國務院發(fā)布了《關于構建更加完善的要素市場化配置體制機制的意見》,提出了新型生產要素——數據資源。以上法案和意見的提出,為學者研究提供了新思路。2019-2020年,王衛(wèi)、段堯清、付熙雯和鄭磊等對政府數據開放的價值與利用集中展開研究。王衛(wèi)等主要對開放政府數據價值的保障機制[90]、實現理論及框架[91]、實現影響因素[92-93]等問題進行研究。段堯清等以開放數據本身作為切入點,分析了政府開放數據靜態(tài)利用狀況[94],并基于情境理論提煉出政府開放數據公眾初始接受行為的影響因素[95],結合數據與用戶,建立政府開放數據服務水平的評價指標體系[96],得出政府開放數據服務水平與數據可利用性具有較高的關聯(lián)性,且具有層次性,此外利用用戶的數據敏感度、補救時機、用戶感知與預期質量等變量構建政府開放數據服務失誤補救時機策略模型[97],以提升政府開放數據服務水平和政府開放數據利用價值。付熙雯和鄭磊等認為目前學界對政府開放數據價值的研究集中在探討政府開放數據的預期價值,主要有價值類型、價值生成機制以及價值測量3個方面,評價開放政府數據成效的終極指標是評估數據在開放和利用后所產生的價值,并從理論和實踐兩條路徑對開放政府數據價值測量進行研究[98-100]。
目前,對于政府開放數據價值及利用的研究缺乏對預期價值的實證研究,對價值生成機制和保障機制以及價值測量方法、框架、指標研究成果較少,還存在政府開放數據動態(tài)利用狀況研究不足,缺乏利用和效果之間的檢驗等問題。
通過梳理2011-2020年我國政府數據開放文獻,發(fā)現研究樣本具有政策導向、主題多元、學科交叉、成果較為集中等特點。
(1)我國政府數據開放發(fā)文量及研究主題受國家法律法規(guī)及政策影響大。政府數據開放研究分為3個階段:第一階段(2011-2014年),發(fā)文數量較少,相關研究國內學者較少關注;第二階段(2015-2018年),2015年國務院發(fā)布《促進大數據發(fā)展行動綱要》,此階段政府數據開放研究量成倍增長,在2018年達到高峰,備受國內學者關注;第三階段(2019-2020年),2019年《中華人民共和國政府信息公開條例》修訂公布,2020年4月國務院發(fā)布了《關于構建更加完善的要素市場化配置體制機制的意見》,此階段發(fā)文數量到達峰值后有所回落并趨于穩(wěn)定,學者開始聚焦在對政府開放數據的價值及利用方面進行研究。
(2)我國政府數據開放研究主題呈現泛化。我國政府數據開放研究從早期的關注概念、特征、技術、組織建設深化到政策、數據、用戶、平臺建設、價值與利用等方面??偠灾?,該研究領域已經產生了大量高質量研究成果,大數據、人工智能、數字經濟、數據要素等新技術理念的滲透帶來新的研究切入點。
(3)我國政府數據開放研究具有跨學科性。我國研究者主要來自于高校機構,利用行政管理、情報學、公共管理、計算機軟件及應用、經濟學、系統(tǒng)動力學等學科領域的理論、方法和技術來分析政府數據開放,具有多學科融合發(fā)展趨勢。
(4)我國政府數據開放研究成果較為集中。樣本文獻發(fā)文期刊主要集中在圖書情報、電子政務、政府管理領域。發(fā)文較多的作者主要集中在武漢大學信息管理學院和信息資源研究中心、湖北工業(yè)大學經濟與管理學院、華中師范大學信息管理學院、四川大學公共管理學院、黑龍江大學信息管理學院和信息資源管理研究中心等機構。綜上,我國政府數據開放高質量研究成果主要集中在圖書情報學、公共管理等學科領域。
(5)政府數據開放發(fā)展趨勢預測。根據研究樣本文獻分析,發(fā)現目前缺少數據的價值屬性的探索,數據動態(tài)利用、地方政府開放數據政策統(tǒng)一標準制定,可預測未來研究趨勢如下:①在數字經濟視域下,研究政府開放數據的價值生成機制、保障機制和市場化配置,有利于提高政府數據開放整體質量控制,提升數據要素經濟和社會價值;②價值測量的方法、框架、指標的研究,有助于提高數據的利用率;③關注用戶進行利用和效果之間的實證研究,有利于對開放數據進行監(jiān)督和管理;④增加更細粒度的法律法規(guī)政策,保障政府數據共享及使用過程中的安全問題。