數(shù)據(jù)資源越來越成為關(guān)系國家未來發(fā)展的重要戰(zhàn)略資源,開放數(shù)據(jù)也不再是哲學(xué)概念,已經(jīng)開始落實為具體的行動。2020年,美國發(fā)布《聯(lián)邦數(shù)據(jù)戰(zhàn)略》(Federal Data Strategy),表示未來十年全球數(shù)據(jù)開放發(fā)展將以數(shù)據(jù)利用為發(fā)展方向,提出要為公眾提供高價值的數(shù)據(jù)應(yīng)用。數(shù)據(jù)開放利用相關(guān)學(xué)術(shù)研究逐漸深入,對相關(guān)研究現(xiàn)狀進行梳理尤為必要。部分學(xué)者從宏觀角度,對國內(nèi)政府數(shù)據(jù)開放研究現(xiàn)狀和熱點進行梳理,將國內(nèi)外研究現(xiàn)狀進行對比,進而分析數(shù)據(jù)開放價值研究進展。此外,Hossain從背景、視角、研究方法、驅(qū)動因素、障礙、理論模型等多角度對現(xiàn)有文獻進行系統(tǒng)回顧。馬亮從府際關(guān)系及其對政府創(chuàng)新擴散影響的角度進行了相關(guān)文獻的歸納和總結(jié),分析中國政治體制的特征。Zuiderwijk則整理了政府數(shù)據(jù)開放影響因素和驅(qū)動因素相關(guān)文獻。政府開放數(shù)據(jù)綜述類文章層出不窮,我國雖有學(xué)者從開放數(shù)據(jù)價值角度對相關(guān)文獻進行梳理,但僅是對開放數(shù)據(jù)的價值類型進行了歸納總結(jié)或是對價值評估方法進行整理,缺乏對開放數(shù)據(jù)價值實現(xiàn)和開放數(shù)據(jù)利用的研究熱點、驅(qū)動因素和未來研究動向進行分析的研究。本文運用文獻計量法和CiteSpace、VOSviwer文獻可視化工具,探討我國政府開放數(shù)據(jù)利用未來的研究方向,以及如何提升政府開放數(shù)據(jù)利用并實現(xiàn)數(shù)據(jù)價值,以期為政府數(shù)據(jù)開放未來發(fā)展和相關(guān)學(xué)術(shù)研究提供有益借鑒。
本文采用中國知網(wǎng)(CNKI)和WOS作為檢索數(shù)據(jù)庫。中文文獻檢索關(guān)鍵詞為“數(shù)據(jù)開放”+“利用”/“價值”,英文文獻檢索關(guān)鍵詞為“open”+“government”+“data”+“use”,無論順序如何,時間截至2023年3月17日,總共得到了相關(guān)文獻1284條。在確保精確和全面的基礎(chǔ)上,通過略讀論文一一進行人工排查,以評估其是否符合本文的研究目標,去除與研究主題不相關(guān)的文獻和書評、會議記錄等非學(xué)術(shù)文獻,保證數(shù)據(jù)的權(quán)威性,最終得到與本研究主題相關(guān)的中文文獻264條和英文核心期刊數(shù)據(jù)庫文獻583條,最后將篩選出來的論文導(dǎo)入CiteSpace 6.2.R4進行數(shù)據(jù)轉(zhuǎn)化和自動去重,得到有效數(shù)據(jù)共計838條。將最終得到的數(shù)據(jù)運用CiteSpace 6.2.R4和VOSviwer 1.6.18進行可視化分析。
由圖1可知,國內(nèi)外發(fā)文量呈現(xiàn)連年遞增的趨勢,數(shù)據(jù)利用價值挖掘方興未艾,且保持了相當?shù)难芯繜岫?,未來仍然是學(xué)界探討的重要話題。國外政府數(shù)據(jù)開放利用研究較國內(nèi)早,最早的文獻出現(xiàn)在2000年,從2011年開始掀起了相關(guān)研究的熱潮。2020年新型冠狀病毒席卷全球,世界各國開始關(guān)注開放數(shù)據(jù)與疫情的關(guān)系,于是涌現(xiàn)出眾多關(guān)于防疫、抗疫以及和新冠病毒有關(guān)的其他研究,帶來了相關(guān)學(xué)術(shù)成果的井噴式增長。然而隨著疫情逐漸常態(tài)化,相關(guān)研究的增速也逐漸放緩,但總體趨勢仍然穩(wěn)步增長。國內(nèi)從2015年國務(wù)院頒布《促進大數(shù)據(jù)發(fā)展行動綱要》起要求加快各地區(qū)、各部門、各有關(guān)企事業(yè)單位及社會組織信用信息系統(tǒng)的互聯(lián)互通和信息共享,豐富面向公眾的信用信息服務(wù),提高政府服務(wù)和監(jiān)管水平。由此,國內(nèi)迎來了政策頒布的加速期,在政策的推動下開放數(shù)據(jù)利用研究驟增,形成快速增長的態(tài)勢。國內(nèi)相關(guān)研究雖開始較晚,但發(fā)展迅速,年增長量在2022年迎來大突破,大有后來居上之勢,未來數(shù)據(jù)開放利用仍是熱門研究領(lǐng)域。
發(fā)文期刊是學(xué)術(shù)研究的載體和重要關(guān)注點,對發(fā)文期刊進行分析有利于了解研究領(lǐng)域?qū)W科分布、引文軌跡,揭示相關(guān)領(lǐng)域知識發(fā)展脈絡(luò)。對檢索到的838條文獻進行分析,其中涉及中文期刊127個,英文期刊519個。表1和表2羅列了國內(nèi)外政府數(shù)據(jù)開放利用發(fā)文量前十的期刊,中文論文期刊多集中于社會科學(xué)和人文科學(xué)領(lǐng)域,英文文獻發(fā)表期刊分布較為分散,橫跨社會科學(xué)、醫(yī)學(xué)、環(huán)境科學(xué)、工程技術(shù)等學(xué)科,也進一步體現(xiàn)了國外數(shù)據(jù)開放利用研究聚焦行業(yè)應(yīng)用的特點。中文期刊在該領(lǐng)域發(fā)文量最高的《情報雜志》共發(fā)文25篇,其次是《電子政務(wù)》和《情報理論與實踐》等。英文期刊中發(fā)文量最高的是德國的Lecture Notes in Computer Science,共發(fā)文118篇,其次是美國的Plos One和英國的Nature分別發(fā)文111篇和83篇。國外期刊中大部分期刊均屬于美國,可見美國在數(shù)據(jù)開放利用研究中綜合影響力較強。
本文利用CiteSpace繪制國內(nèi)政府數(shù)據(jù)開放領(lǐng)域的高頻關(guān)鍵詞研究熱點發(fā)展時間線圖譜,進一步揭示該領(lǐng)域的研究演化趨勢(圖2)。圖2中可以看出共有227個關(guān)鍵詞,9個主題聚類,顏色由深到淺年份遞減,節(jié)點大小代表發(fā)文量多少。節(jié)點外圈出現(xiàn)紫色表示該關(guān)鍵詞影響最大,包括“政府數(shù)據(jù)”“開放數(shù)據(jù)”和“數(shù)據(jù)開放”。我國最早出現(xiàn)的研究主題是關(guān)聯(lián)數(shù)據(jù),前期研究更多的是總結(jié)國外實踐經(jīng)驗,尤其對美國開放數(shù)據(jù)利用關(guān)注較多,隨后研究主題演變?yōu)閿?shù)據(jù)開放、數(shù)據(jù)共享以及開放數(shù)據(jù)在教育領(lǐng)域的應(yīng)用。2015年數(shù)據(jù)利用領(lǐng)域開始關(guān)注價值研究,倡導(dǎo)挖掘數(shù)據(jù)價值,實現(xiàn)價值共創(chuàng)。從2016年開始我國政府數(shù)據(jù)開放利用開始引入數(shù)字政府建設(shè)領(lǐng)域。近幾年出現(xiàn)關(guān)于人工智能和用戶體驗相關(guān)研究,表明我國數(shù)據(jù)利用研究緊跟技術(shù)發(fā)展,開始從政府下沉到公眾,從2022年開始出現(xiàn)的關(guān)于公平利用和開放數(shù)據(jù)利用權(quán)屬關(guān)系問題的研究,體現(xiàn)了學(xué)術(shù)界對倫理規(guī)范和隱私保障的深刻思考。
利用VOSviwer對WOS數(shù)據(jù)庫的英文文獻進行共現(xiàn)關(guān)鍵詞分析,繪制研究熱點圖,顏色越深表示該研究主題越新,節(jié)點越大出現(xiàn)的頻率越高(圖3);圖4密度圖顏色越深表示出現(xiàn)頻率越高。在我國除了開放數(shù)據(jù)(open data)和關(guān)聯(lián)數(shù)據(jù)(linked open data)等出現(xiàn)較早使用頻率較高的該領(lǐng)域的核心詞匯,新型冠狀病毒(covid-19)、人工智能(artificial intelligence)、遙感(remote sensing)和機器學(xué)習(xí)(machine learning)等聚焦行業(yè)數(shù)據(jù)利用的研究主題是該領(lǐng)域的研究前沿,同時也是高頻熱點主題;國外學(xué)者則更關(guān)注生態(tài)系統(tǒng)(ecosystem)數(shù)據(jù),從開放數(shù)據(jù)的整個生態(tài)環(huán)境出發(fā)研究利益主體之間的互動關(guān)系,以及利益主體同環(huán)境的互動。智慧城市(smart city)雖然出現(xiàn)頻率較低但是從圖3可以看出,將政府開放的數(shù)據(jù)應(yīng)用到智慧城市發(fā)展和建設(shè)中以開發(fā)新服務(wù)和應(yīng)用也是近幾年新興話題。此外,國外研究還關(guān)注用戶采納(user acceptance),強調(diào)提高終端用戶體驗。
國內(nèi)近幾年在相關(guān)研究中發(fā)展迅速,緊跟國際研究前沿,后發(fā)借鑒優(yōu)勢突出,在研究熱點分析中,我國相關(guān)研究開始關(guān)注數(shù)據(jù)權(quán)責和用戶體驗,但相關(guān)研究仍需進一步深入。國外數(shù)據(jù)利用研究中聚焦行業(yè)發(fā)展是一大特色,從圖2可以看出我國已將開放數(shù)據(jù)應(yīng)用于智慧城市建設(shè)以及教育領(lǐng)域,但研究深度和廣度不足,未來應(yīng)持續(xù)聚焦行業(yè)應(yīng)用。
1.完善商業(yè)模式與經(jīng)濟框架
人們普遍認為公開數(shù)據(jù)有助于經(jīng)濟增長,然而經(jīng)濟的成功因素還有待研究。除了政府強制力以外不斷挖掘數(shù)據(jù)潛在的經(jīng)濟價值,搭建數(shù)據(jù)利用的經(jīng)濟框架,發(fā)掘數(shù)據(jù)開發(fā)的商業(yè)模式是未來開放數(shù)據(jù)研究的重要領(lǐng)域。我國在數(shù)據(jù)開放利用的經(jīng)濟效益和商業(yè)模式研究方面還存在研究空間。例如,數(shù)據(jù)收集和維護都需要資金,可以對開放數(shù)據(jù)進行定價和收費,但是應(yīng)該由誰來支付以及如何支付;除此之外,數(shù)據(jù)庫的建立、維護和升級的成本如何分攤,企業(yè)應(yīng)該如何分享利潤,如何彌補開放數(shù)據(jù)可能會減少的收入等。
2.加強數(shù)據(jù)權(quán)屬和倫理問題研究
政府開放數(shù)據(jù)問責機制有待完善。不開放無人追究,開放反而可能存在風險,這也導(dǎo)致開放工作推進逐漸放緩,因此部分學(xué)者提出健全法律框架,但數(shù)據(jù)權(quán)屬關(guān)系仍然不清晰。未來研究應(yīng)關(guān)注開放數(shù)據(jù)倫理和權(quán)屬關(guān)系問題,通過法律法規(guī)規(guī)定開放數(shù)據(jù)的界線,明確數(shù)據(jù)的所有權(quán),當公開數(shù)據(jù)被濫用時能夠認定誰應(yīng)承擔法律責任,以及什么獎罰模式是可接受的。對數(shù)據(jù)權(quán)屬和倫理進行深入研究的另一個原因是個人隱私安全問題,開放數(shù)據(jù)可能與隱私保護相沖突。未來的研究也要專注于隱私保護的影響因素,當公共利益與個人隱私發(fā)生沖突時應(yīng)該怎樣平衡,以及在個人隱私保護中政府應(yīng)該承擔的責任。
3.數(shù)據(jù)利用聚焦行業(yè)發(fā)展
國內(nèi)開放數(shù)據(jù)利用研究仍局限于開放平臺,擴大開放數(shù)據(jù)的用戶范圍,將政府開放的數(shù)據(jù)應(yīng)用到各行各業(yè)創(chuàng)造價值,才是提高數(shù)據(jù)利用率的關(guān)鍵所在。借鑒國外數(shù)據(jù)利用研究演變進程,我國數(shù)據(jù)開放以及利用的概念和對象需要進一步擴展,結(jié)合數(shù)字政府建設(shè),聚焦行業(yè)利用,挖掘數(shù)據(jù)價值,讓“沉睡”在開放數(shù)據(jù)平臺的數(shù)據(jù)“活起來”。
4.關(guān)注用戶視角
隨著研究的不斷深入,人們逐漸認識到開放數(shù)據(jù)利用的目的是服務(wù)公眾,將研究的重點由政府轉(zhuǎn)向公眾,由數(shù)據(jù)供應(yīng)轉(zhuǎn)向數(shù)據(jù)需求。國外政府數(shù)據(jù)開放利用多強調(diào)用戶體驗,注重從用戶視角展開研究,而國內(nèi)近幾年也有很多針對用戶的研究,但當前各類研究對用戶的實際調(diào)研還不足,對用戶的需求和偏好了解程度有限。另外,終端用戶數(shù)據(jù)利用能力弱是不得不面對的現(xiàn)實問題,如何提升公民的數(shù)字素養(yǎng)和感知能力,從而提高公眾的數(shù)據(jù)利用率是未來仍需進一步討論的問題。
本文結(jié)合Citespace和VOSviwer對國外政府數(shù)據(jù)開放利用的主要貢獻者、研究現(xiàn)狀和研究主題進行分析,發(fā)現(xiàn)國外相關(guān)研究較國內(nèi)早且呈現(xiàn)出聚焦行業(yè)應(yīng)用和關(guān)注用戶的特點。數(shù)據(jù)利用研究不應(yīng)僅關(guān)注開放數(shù)據(jù)平臺,還應(yīng)重點關(guān)注社會應(yīng)用,未來研究重點可向“人工智能”“機器學(xué)習(xí)”和“智慧城市”偏重,提高開放數(shù)據(jù)應(yīng)用在公民生產(chǎn)生活中的比重,加強數(shù)據(jù)開放利用生態(tài)系統(tǒng)研究,建立利益主體同環(huán)境的互動關(guān)系框架,不斷豐富理論研究,推動數(shù)據(jù)利用價值實現(xiàn)。
本研究考察了大量的相關(guān)文章并進行可視化分析,對該領(lǐng)域的未來研究方向提出建議。但是,目前的研究仍有一定的局限性:一是受研究范圍的限制,本文主要針對兩個主要的數(shù)據(jù)庫,即WOS數(shù)據(jù)庫和CNKI數(shù)據(jù)庫的文獻進行對比分析,可能存在一定的偏差和不足;二是本研究為了保證嚴謹性,在分析過程中更多的是強調(diào)期刊文章,然而書籍或會議記錄中的論文也可能存在能被用來支持政府數(shù)據(jù)開放利用研究的論點和闡述相關(guān)研究的論點。
參考文獻
[1]The United States Government.Federaldata Strategy 2020 Action Plan [EB/OL].[2023-04-08].https://strategy.data.gov/assets/docs/2020-federal-data-strategy-action-plan.pdf.
[2]姜紅波,張文麗,邵婷.國內(nèi)政府數(shù)據(jù)開放研究現(xiàn)狀的可視化分析[J].湖北文理學(xué)院學(xué)報,2021,42(2):61-67.
[3]高天鵬,莫太林,周長霞.基于知識圖譜的國內(nèi)政府數(shù)據(jù)開放研究現(xiàn)狀及熱點透析[J].現(xiàn)代情報,2017,37(11):147-155.
[4]盛小平,焦鳳枝.國內(nèi)外開放數(shù)據(jù)評價研究綜述[J].情報雜志,2022,41(8):131-137.
[5]段堯清,陳玲,徐玲.中外政府開放數(shù)據(jù)領(lǐng)域的研究熱點與前沿分析[J].情報科學(xué),2017,35(11):89-93.
[6]付熙雯,鄭磊.開放政府數(shù)據(jù)的價值:研究進展與展望[J].圖書情報工作,2020,64(9):122-132.
[7]陳美.開放政府數(shù)據(jù)價值評估:進展與啟示[J].情報雜志,2017,36(11):92-98.
[8]HOSSAIN M A ,DWIVEDI Y K ,RANA N P.State-of-the-art in open data research:Insights from existing literature and a research agenda[J]. Journal of Organizational Computing amp; Electronic Commerce,2016,26(1-2):14-40.
[9]馬亮.府際關(guān)系與政府創(chuàng)新擴散:一個文獻綜述[J].甘肅行政學(xué)院學(xué)報,2011(6):33-41+123.
[10]ZUIDERWIJK A,SHINDE R,JENG W.What drives and inhibits researchers to share and use open research data?A systematic literature review to analyze factors influencing open research data adoption[J].PLOS ONE,2020(9).
[11]黃如花,黃雨婷,李雅.國內(nèi)外開放政府數(shù)據(jù)利用研究:進展與動向[J].情報資料工作,2022,43(4):5-15.
[12]ZUIDERWIJK A ,JANSSEN M.The negative effects of open government data-Investigating the dark side of open data[C]//International Conference on Digital Government Research.ACM,2014:147-152.
[13]ALAMOl T,GUTIéRREZ D,MAMMARELLA M,et al.Covid-19:Open-Data Resources for Monitoring,Modeling, and Forecasting the Epidemic[J].Electronics,2020,9(827).
[14]YIANNAKOULIAS N, SLAVIK C E,STURROCK S L,et al.Open government data, uncertainty and coronavirus: an infodemiological case study-ScienceDirect[J].Social Science amp; Medicine,2020.
[15]BERRY I,SOUCY J,TUITE A,et al.Open access epidemiologic data and an interactive dashboard to monitor the COVID-19 outbreak in Canad[J].Canadian Medical Association Journal,2020,192(15):E420-E420.
[16]GARDNER L,RATCLIFF J,DONG E,et al.A need for open public data standards and sharing in light of COVID-19[J].The Lancet.Infectious diseases,2021,21(4):e80.
[17]BERRY I,SOUCY J P R,TUITE A,et al.Open access epidemiologic data and an interactive dashboard to monitor the COVID-19 outbreak in Canad[J].Canadian Medical Association Journal,2020,192(15):E420-E420.
[18]王健,楊柳,安實.政府數(shù)據(jù)開放政策主體協(xié)同網(wǎng)絡(luò)演化研究:基于中央層面政策文本量化分析[J/OL].北京航空航天大學(xué)學(xué)報(社會科學(xué)版),2022:1-12[2023-03-25].https://doi.org/10.13766/j.bhsk.1008-2204.2022.0725
[19]余文婷,吳丹.基于數(shù)據(jù)關(guān)聯(lián)的開放科學(xué)數(shù)據(jù)長期保存利用研究[J].信息資源管理學(xué)報,2014,4(2):87-93.
[20]李佳琪.試論大數(shù)據(jù)時代政府信息開放的價值[J].科技情報開發(fā)與經(jīng)濟,2015,25(17):114-116.
[21]王錫鋅,黃智杰.公平利用權(quán):公共數(shù)據(jù)開放制度建構(gòu)的權(quán)利基礎(chǔ)[J].華東政法大學(xué)學(xué)報,2022,25(2):59-72.
[22]IMMONEN A,PALVIAINEN M,OVASKA E.Requirements of an Open Data Based Business Ecosystem[J].IEEE Access,2014,2(2):88-103.
[23]MASUZZO P.Suppl Info-An open data ecosystem for cell migration research[J].2015.
(責任編輯:趙立杰)