黃 鶯,呂夏蘭
(西南民族大學計算機科學與工程學院,四川成都 610041)
在歐美國家開放政府數(shù)據(jù)浪潮的帶動下、由政府信息公開制度嬗變而來的開放政府數(shù)據(jù)(Open Government Data,以下簡稱OGD)進入國內(nèi)信息資源管理、公共管理領(lǐng)域的學者和專家們的研究視野.在過去的近十年里,圍繞OGD的各個方面,大量研究成果涌現(xiàn),有涉及OGD基礎(chǔ)理論的、有深入探析其開放機制和平臺技術(shù)的、有對國外經(jīng)驗總結(jié)后進行對比借鑒的.這些研究成果堆砌在一起,不加梳理和歸納,后續(xù)研究就容易出現(xiàn)重復和低效、甚至停滯的狀況.所以,對一個研究領(lǐng)域的文獻綜述和計量分析是把握其研究發(fā)展脈絡(luò)和趨勢的必要手段,是推動其研究體系不斷完善、研究內(nèi)容不斷豐富的有力工具.
2013年,徐慧娜、付熙雯、鄭磊教授從公共管理視視角梳理國外OGD的主要研究內(nèi)容、并對2006-2013年國內(nèi)對OGD及相近主題的研究文獻進行了系統(tǒng)梳理,這是國內(nèi)最早對OGD的研究綜述.此后,學者們從不同視角對國內(nèi)外的OGD研究進行了不同數(shù)據(jù)樣本、不同計量方法的梳理.比如,呂紅對中國學術(shù)期刊網(wǎng)絡(luò)出版總庫中152篇OGD主題的研究文獻進了計量分析.趙蓉英教授等以中文核心期刊和CSSCI數(shù)據(jù)庫里的相關(guān)研究成果為樣本,借助CiteSpaceV及VOSviewer等多種可視化工具梳理出了開放數(shù)據(jù)的6個研究主題,以及時間維度上的研究演化趨勢.最新的研究成果中,陳朝兵和郝文強對國內(nèi)外OGD的個人隱私保護研究進行了述評;王萍等對國內(nèi)外的OGD平臺研究進展加以述評.這些研究綜述和述評主要是對已有成果進行了梳理和歸納,但對OGD研究的趨勢發(fā)展分析不足.本文將利用文獻題錄信息統(tǒng)計工具SATI和Citespace軟件在分析國內(nèi)OGD研究發(fā)展脈絡(luò)的基礎(chǔ)上,通過可視化聚類和突變詞分析對今后的研究趨勢加以預判,這有助于研究們更好地定位自己的研究方向、提高研究效率;更有助于該領(lǐng)域研究內(nèi)容的充實和深入.
本文的分析對象是國內(nèi)的OGD研究現(xiàn)狀,故選擇中文社會科學引文索引核心數(shù)據(jù)庫(以下簡稱CSSCI)為樣本數(shù)據(jù)來源.為了提高檢全率,檢索主題詞為“開放政府數(shù)據(jù)”、“政府開放數(shù)據(jù)”、“開放政府”、“政府數(shù)據(jù)”,檢索時間設(shè)置為1998年至2019年,檢索日期是2020年3月10日到20日,共檢索到結(jié)果535條.再對535條檢索結(jié)果進行了剔除匯總、篩選比對,最終確定精確匹配的期刊論文326篇為后續(xù)分析的數(shù)據(jù)樣本.
可視化知識圖譜的繪制能以最直觀、多維的方式展示一個學科或主題方向研究發(fā)展的靜態(tài)概貌和動態(tài)變化趨勢,借助某種工具來繪制知識圖譜以把握某主題研究動態(tài)可以幫助后來的研究者更有效地挖掘研究的潛在空間,避免重復研究.SATI即文獻題錄信息統(tǒng)計分析工具(Statistical Analysis Toolkit for Informetrics),是一種誕生較早、應用廣泛的知識圖譜工具,其優(yōu)勢在于能導入包括EndNote、NoteExpress、Web of science、CSSCI 4種格式的國內(nèi)外文獻題錄數(shù)據(jù),最新的4.0網(wǎng)絡(luò)版還允許用戶使用SATI專有格式自行生成題錄.它能進行數(shù)據(jù)格式轉(zhuǎn)換、字段信息的抽取、詞條頻次統(tǒng)計、構(gòu)建知識單元共現(xiàn)矩陣,輔助生成聚類圖、多維尺度圖譜、網(wǎng)絡(luò)知識圖譜等可視化結(jié)果.Citespace軟件是最近幾年被學者們應用地最多的一種知識圖譜工具,該軟件以中心度作為關(guān)鍵指標來確定關(guān)鍵點作者、期刊、文獻,探測出某學科領(lǐng)域研究的前沿、熱點、趨勢和動向等.相比傳統(tǒng)考慮引文量的文獻計量分析,Citespace可以發(fā)現(xiàn)被忽略的重要節(jié)點,比如研究方向的變化.所以,本文研究選擇上述兩種分析軟件來繪制我國OGD研究的科學知識圖譜,提取突變詞,探究該領(lǐng)域的發(fā)展趨勢.
文獻的外部特征包括發(fā)表的年度、所屬學科、作者及機構(gòu)、被引頻次等.筆者將從CSSCI中提取的326篇論文的ENDNOTE格式的題錄載入SATI軟件,設(shè)置矩陣大小為50,高頻字段顯示個數(shù)為50,對源數(shù)據(jù)進行文獻去重、詞干提取、默認停用詞、應用分詞、智能清洗等處理步驟,對國內(nèi)OGD研究成果的外部性特征進行了分析和歸納.
文獻年代分布圖在一定程度上可以反映出該領(lǐng)域的發(fā)展趨勢及學者關(guān)注度的變化情況.如圖1所示,國內(nèi)OGD研究的成果從2011年的3篇上升到2017年99篇,7年間呈逐年上升趨勢,其中,2015~2017年增長速率最大,為快速成長階段,2012年以前為起步階段,2012到2015為發(fā)展階段.2015~2017增速最大的一個外因是國務(wù)院2015年發(fā)布的《促進大數(shù)據(jù)發(fā)展行動發(fā)展綱要》,該綱要的發(fā)布體現(xiàn)了國家層面對政府數(shù)據(jù)管理的重視,刺激了該領(lǐng)域?qū)W者們研究的積極性.2017年至數(shù)據(jù)獲取截至日期,發(fā)文量開始明顯下降,這表明國內(nèi)的OGD研究經(jīng)過了最炙熱的時期、正步入一個相對穩(wěn)定時期,即成熟階段.總體上來說,該研究發(fā)文量的增長趨勢變化符合文獻增長規(guī)律,即某主題領(lǐng)域的文獻增長是分階段進行的,經(jīng)過了一段急劇增長后,增長速度變緩,再趨于平穩(wěn).
圖1 國內(nèi)OGD研究的文獻增長曲線Fig.1 The literature growth curve of the domestic OGD research
由表1可知,國內(nèi)OGD研究機構(gòu)是以武漢大學、大連海事大學、中國人民大學、四川大學、華南理工大學等高等院校為主,這些院校的高水平文獻占據(jù)總體的50%以上,這表明國內(nèi)OGD研究領(lǐng)域已經(jīng)形成一批穩(wěn)定有實力的研究機構(gòu).在這些研究機構(gòu)中活躍著一批研究成果突出、研究方法先進的高產(chǎn)作者,如黃如花、陳美、翟軍、周文泓等,這些學者分屬不同院校(見表2).把兩個表結(jié)合起來不難發(fā)現(xiàn),高產(chǎn)作者黃如花、夏義堃、張曉娟、王春迎都來自武漢大學,武漢大學是我國OGD研究的領(lǐng)軍機構(gòu).大連海事大學、中國人民大學、四川大學也都是推動國內(nèi)OGD研究發(fā)展的重要力量.
表1 2011-2019年發(fā)文量前20位的核心機構(gòu)Table 1 The top 20 organizations from 2011 to 2019
7 8 9北京大學 13 17 山東大學 7華中師范大學 11 18 江蘇大學 6黑龍江大學 10 19 電子科技大學 6 10 中山大學 10 20 西南財經(jīng)大學 6
表2 2011-2019年發(fā)文量前20位的高產(chǎn)作者Table 2 The top 20 authors from 2011 to 2019
表3是前20篇高被引文獻,其中排在第一和第二位都是來自復旦大學的鄭磊教授的成果,第三和第四位的是來自武漢大學的陳美博士生.鄭磊教授的研究團隊對國內(nèi)的OGD具有非常重要的引領(lǐng)意義,其成果通過對OGD基礎(chǔ)性概念、關(guān)鍵因素、關(guān)系的梳理,奠定了國內(nèi)OGD研究的理論基礎(chǔ),對OGD平臺框架的研究、價值創(chuàng)造機制的研究也被其他研究者頻繁引用.陳美博士的成果則表明國內(nèi)OGD研究非常看重對國外、尤其是英美兩國OGD實踐經(jīng)驗的借鑒和參考.此外表中還有其他高被引的文獻是介紹美國、加拿大、法國等發(fā)達國家的經(jīng)驗借鑒的,這樣的文獻共計12篇.表中余下的文獻則主要圍繞國內(nèi)OGD平臺的建設(shè)、政策體系的構(gòu)建來展開.
表3 前20位的高被引文獻Table 3 The top 20 cited articles
?
利用SATI工具對前文的326篇文獻進行詞頻分析,以挖掘該領(lǐng)域的研究重心,發(fā)現(xiàn)關(guān)鍵詞總詞頻為1 400,獨立關(guān)鍵詞數(shù)621.由于很多關(guān)鍵詞存在語義高度相關(guān)關(guān)系、包含關(guān)系、等同關(guān)系,筆者再對這些獨立關(guān)鍵詞進行分組、合并,比如將“政府信息公開”和“信息公開”合并為“政府信息公開”、將“數(shù)據(jù)管理”和“數(shù)據(jù)治理”合并為“數(shù)據(jù)治理”,最終得到表4中頻數(shù)大于等于5的30個關(guān)鍵詞,它們代表了OGD研究的熱點和核心.
可以看出,OGD領(lǐng)域研究領(lǐng)域熱點眾多,通過對高頻詞頻次及樣本文獻內(nèi)容的綜合分析,“政府數(shù)據(jù)開放”、“政府數(shù)據(jù)”、“開放政府”、“政府信息公開”、“數(shù)據(jù)開放平臺”是OGD研究領(lǐng)域的基本標簽.
表4 OGD的高頻關(guān)鍵詞詞頻列表Table 4 The high-frequency words as regards OGD
7 政府數(shù)據(jù)開放共享 21 17 數(shù)據(jù)門戶 8 27 政府治理 5 8 數(shù)據(jù)開放平臺 17 18 保障機制 7 28 數(shù)據(jù)服務(wù) 5 9電子政務(wù) 16 19 關(guān)聯(lián)數(shù)據(jù) 7 29 法律法規(guī) 5 10 地方政府 15 20 數(shù)據(jù)質(zhì)量 7 30 評估體系 5
3.2.1 數(shù)據(jù)處理方法
LNG在低溫儲罐中的儲存壓力一般為常壓,溫度為-162℃,如需將LNG從低溫儲罐中送出,必須對其進行增壓。傳統(tǒng)的氣化站增壓方式一般分為兩種:一種為增壓氣化器結(jié)合氣動式增壓閥的方式;另外一種為增壓氣化器結(jié)合自力式增壓調(diào)節(jié)閥的方式。這兩種常用于中小型LNG氣化站,但考慮到空間排布問題,小型撬裝式LNG氣化站的低溫儲罐增壓方式使用最多的是通過低溫增壓泵來實現(xiàn)對儲罐內(nèi)的LNG增壓。
共詞分析的基本原理是對一組詞兩兩統(tǒng)計它們在同一組文獻中出現(xiàn)的次數(shù),通過這種共現(xiàn)次數(shù)來測度他們之間的親疏關(guān)系.本文采用Citespace工具通過關(guān)鍵詞共詞網(wǎng)絡(luò)來展示OGD研究的主題分布狀況,具體設(shè)定如下,Node Type為Keyword,TopN perslice設(shè)定為50,即指提取每個時間切片內(nèi)頻次出現(xiàn)排名前50位的關(guān)鍵詞;TopN%設(shè)定為10%,即指提取每個時間切片中排名前10%的對象.由于未進行裁剪的關(guān)鍵詞共詞網(wǎng)絡(luò)密度較大,因此筆者在生成關(guān)鍵詞聚類圖譜時采用尋徑網(wǎng)絡(luò)算法對聚類網(wǎng)絡(luò)進行分割,以降低網(wǎng)絡(luò)密度,提高網(wǎng)絡(luò)圖的可讀性.
3.2.2共詞分析
圖2 國內(nèi)OGD研究的關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)Fig.2 The keywords co-occurrence network of the domestic OGD research
圖2是以文獻關(guān)鍵詞為節(jié)點生成的關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò),由圖2可以看出OGD研究的主流脈絡(luò)和研究重心,該網(wǎng)絡(luò)以O(shè)GD為核心向多個方向延展開來.右上部分聚集的是“數(shù)據(jù)開放平臺”的相關(guān)內(nèi)容,研究主題主要包括“元數(shù)據(jù)標準”、“平臺建設(shè)”、“個人隱私”等.右下部分以“開放政府”為核心,周圍是“數(shù)據(jù)政策”、“協(xié)同治理”、“政府治理”等內(nèi)容.左邊部分的研究內(nèi)容多為交叉研究,圍繞“政府數(shù)據(jù)、“大數(shù)據(jù)”、“政府信息公開”、“電子政務(wù)”等主題,還涵蓋“隱私保護”、“價值評價指標”、“國外經(jīng)驗借鑒”、“地方政府”等多個方面.再將圖2和表4中的高頻詞進行對比分析,共詞網(wǎng)絡(luò)中的節(jié)點詞基本覆蓋了表4中的高頻詞,表明用SATI和CiteSpace兩種工具得到的研究熱點一致,國內(nèi)OGD研究發(fā)展趨于穩(wěn)定,已經(jīng)形成了一個穩(wěn)定的關(guān)鍵詞群.
3.2.3 主題聚類分析
圖3 國內(nèi)OGD研究的關(guān)鍵詞聚類圖Fig.3 The keywordsclustergram of the domestic OGD research
筆者再以關(guān)鍵詞作為節(jié)點進行聚類分析,得到一個包含13個聚類標簽、聚類模塊值Q=0.85、聚類結(jié)構(gòu)有效的圖譜.但13個標簽中“政府數(shù)據(jù)開放”和“政府開放數(shù)據(jù)”是內(nèi)涵相同的不同表達、“北京”和“地方政府”之間是包含關(guān)系,因此再對聚類結(jié)果根據(jù)聚類標簽參數(shù)和標簽語義進行調(diào)整,最終得到包含8個聚類標簽的關(guān)鍵詞聚類圖,如圖2所示.根據(jù)圖3的可視化圖譜聚類,并結(jié)合圖2的關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò),可將OGD研究歸為4個主題方向.
第一個主題方向以“數(shù)據(jù)開放平臺”為核心,包括了3號、5號、6號和7號標簽,與圖2的左上部分一致,是OGD研究的主體部分,成果最豐富.包含了“元數(shù)據(jù)標準”、“評估”、“關(guān)聯(lián)數(shù)據(jù)”、“數(shù)據(jù)質(zhì)量”、“個人隱私”、“平臺建設(shè)”、“數(shù)據(jù)利用”等多個關(guān)鍵詞.
第二個主題方向是有關(guān)開放政府及其數(shù)據(jù)治理的相關(guān)研究,即2號、9號標簽,并與圖2的右下部分和部分左下的共現(xiàn)網(wǎng)絡(luò)對應.這個研究方向關(guān)注的重點是開放環(huán)境下數(shù)據(jù)治理、協(xié)同治理、多元主體協(xié)作、數(shù)據(jù)服務(wù)等問題,是公共管理研究在大數(shù)據(jù)時代對數(shù)據(jù)治理相關(guān)問題深入推進;并與政府信息資源管理領(lǐng)域融合衍生而成的一個方向.
第三個主題方向是有關(guān)政府數(shù)據(jù)開放政策的研究,即0號標簽,與圖2左邊的中下部分一致.這個方向凸顯了OGD中政策體系的重要地位.
第四個主題方向是在大數(shù)據(jù)背景下展開OGD的研究,即1號標簽,與圖2左上部分對應.OGD的關(guān)鍵要素是數(shù)據(jù),必然與大數(shù)據(jù)戰(zhàn)略密切關(guān)聯(lián).大數(shù)據(jù)通常建立在開放數(shù)據(jù)的基礎(chǔ)上,數(shù)據(jù)的開放共享是大數(shù)據(jù)競爭戰(zhàn)略的基礎(chǔ)和核心.因此云計算、Web2.0等大數(shù)據(jù)技術(shù)和方法的應用必然推動OGD的發(fā)展.
3.2.4 研究趨勢分析
在關(guān)鍵詞共現(xiàn)和聚類的基礎(chǔ)上,可以通過突發(fā)性(Burstness)檢測OGD研究的突變關(guān)鍵詞.突變關(guān)鍵詞是指在特定研究領(lǐng)域的某一階段使用頻次驟增的關(guān)鍵詞,它有助于分析研究對象的研究熱點和變化趨勢.利用CiteSpace工具,筆者通過不斷修改參數(shù)來探測突變詞,最終探測到11個突變詞,如圖4所示.
圖4 國內(nèi)OGD研究的突變詞統(tǒng)計圖Fig.4 The top 11 burstness keywords of the domestic OGD research
根據(jù)圖4可把國內(nèi)OGD研究演變劃分為3個階段.首先是起步階段的兩、三年里,OGD與電子政務(wù)、政府信息公開、關(guān)聯(lián)數(shù)據(jù)、數(shù)據(jù)服務(wù)、云計算技術(shù)密切聯(lián)系在一起的,表明OGD的研究正逐漸從其誕生土壤中成長起來.第二階段2014到2017年期間,國內(nèi)的研究焦點轉(zhuǎn)移到國際比較、國外經(jīng)驗的借鑒,同時“公眾參與”體現(xiàn)了國內(nèi)OGD對開放政府研究主題的一種呼應,成為OGD和開放政府兩個研究領(lǐng)域的交叉地帶.第三是2018年至今,“數(shù)據(jù)利用”和“政策體系”兩個突變詞與圖3的0號標簽高度吻合,體現(xiàn)OGD研究的發(fā)展趨勢,即強調(diào)對開放數(shù)據(jù)的開發(fā)和利用、政策體系對開放數(shù)據(jù)利用的重要意義.
從論文數(shù)量時間分布可知,國內(nèi)OGD研究論文數(shù)量,從2017年起呈下降趨勢,開始出現(xiàn)研究弱化的跡象.究其原因,可以歸納為兩點.
一是從表1和表2可知,國內(nèi)OGD研究的核心作者和機構(gòu)分布較為集中,同時機構(gòu)間的協(xié)作有限.筆者使用Citespace進行作者合作網(wǎng)絡(luò)分析時發(fā)現(xiàn),在高產(chǎn)作者中,形成了三個較為顯著的合作網(wǎng)絡(luò),一是由黃如花、周志峰、王春迎、李白楊、周力虹等為成員組成的合作網(wǎng)絡(luò),他們調(diào)查了國內(nèi)外OGD門戶功能、分析了不同國家的政策體系、構(gòu)建OGD價值體系.二是由翟軍、袁長峰、林巖、于夢月等研究者組成的合作網(wǎng)絡(luò),主要探析了國外發(fā)達國家OGD的元數(shù)據(jù)標準及信息基礎(chǔ)設(shè)施建設(shè).三是以鄭磊教授為核心,陸建英、徐慧娜、付熙雯等作者構(gòu)成的合作網(wǎng)絡(luò),成果覆蓋OGD基礎(chǔ)理論、國外經(jīng)驗的借鑒、地方政府的OGD評估.這三個合作者網(wǎng)絡(luò)均是機構(gòu)內(nèi)的合作.再以機構(gòu)作為節(jié)點運行Citespace,也沒有得到機構(gòu)間的合作網(wǎng)絡(luò).這均說明目前對于國內(nèi)OGD研究,各機構(gòu)之間仍處于獨立狀態(tài),跨機構(gòu)的合作還未形成;同時,三個合作網(wǎng)絡(luò)的研究成果發(fā)表年份均較早,成果數(shù)量也不多,說明網(wǎng)絡(luò)中的學者們合作次數(shù)有限,新的合作網(wǎng)絡(luò)尚未形成.這些都在一定程度上阻礙了該研究領(lǐng)域的繁榮發(fā)展.
第二,表3高被引文獻列表中大量關(guān)于國外介紹的成果、圖3中由3號、5號、6號和7號標簽構(gòu)成的數(shù)據(jù)開放平臺的研究主體都表明國內(nèi)OGD研究熱點相對集中的問題.這種過于集中的研究主題必然導致后續(xù)的研究者很難有大的突破和創(chuàng)新.
再從學科角度看,由表3高被引文獻的來源期刊和高產(chǎn)作者機構(gòu)即知,OGD國內(nèi)的研究者主要集中在圖書情報學、公共管理學,及其個別來自法學、計算機科學.所以當前國內(nèi)OGD研究的學科范圍較小,學科之間缺少交融,研究的方法也就局限,研究主題難以通過學科融合得到衍生.因此就必須通過學科交叉、多學科方法的融合應用來促進OGD研究的主題衍生.
再參考一下國外OGD的研究,其研究已經(jīng)融合了多學科、多領(lǐng)域的方法,包括探索OGD的反腐價值、改善公共食品安全和社會治安的能力、企業(yè)通過OGD實現(xiàn)價值協(xié)同創(chuàng)造的案例;利用解釋結(jié)構(gòu)模型、模糊層次分析法等來研究OGD的障礙、影響因素等;構(gòu)建模型來分析利用OGD的不同用戶特征.
由此可見,國內(nèi)OGD研究的發(fā)展必須向多學科交叉、多方法融合應用、機構(gòu)間和機構(gòu)內(nèi)合作網(wǎng)絡(luò)的搭建這些方向發(fā)展,通過增強OGD領(lǐng)域與不同學科之間的交互性來促進主題衍生,最終形成更為完整的研究內(nèi)容體系和方法體系.