吳金紅,吳容正
基于知識圖譜的科學(xué)數(shù)據(jù)開放核心政策研究
吳金紅,吳容正
(武漢紡織大學(xué) 管理學(xué)院,湖北 武漢 430200)
對我國科學(xué)數(shù)據(jù)開放政策進行細粒度分析,探討我國科學(xué)數(shù)據(jù)開放的核心政策的影響情況與機制,為數(shù)字經(jīng)濟環(huán)境下制定促進數(shù)據(jù)高效共享政策提供參考。采用自頂向下方式,構(gòu)建知識圖譜模式層,識別并提取政策實體、屬性及關(guān)系構(gòu)建數(shù)據(jù)層,并存入Neo4j圖數(shù)據(jù)庫;實現(xiàn)語義層面的關(guān)聯(lián)查詢與可視化,從不同細粒度對政策文本進行多維分析。通過知識圖譜識別核心政策,結(jié)合政策工具進行政策文本多維分析,探究科學(xué)數(shù)據(jù)開放核心政策對現(xiàn)有政策體系的影響情況。發(fā)現(xiàn)科學(xué)數(shù)據(jù)開放的核心政策在政策演化過程中,能夠?qū)ζ潢P(guān)聯(lián)政策以及政策整體的政策目標(biāo)和政策工具使用產(chǎn)生影響。
科學(xué)數(shù)據(jù)開放;政策工具;知識圖譜;文本分析
自Jim Gray提出“第四范式:數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)”以來,科學(xué)數(shù)據(jù)的價值日益凸顯[1]。2020年3月,國務(wù)院頒布《關(guān)于構(gòu)建更加完善的要素市場化配置體制機制的意見》更是體現(xiàn)出國家對數(shù)據(jù)要素價值的高度認同。政策文件的設(shè)計、選擇與應(yīng)用對于科學(xué)數(shù)據(jù)開放運動的推廣與運行發(fā)揮著引導(dǎo)和規(guī)范作用。分析政策文本能夠揭示相關(guān)領(lǐng)域的發(fā)展與演化規(guī)律,而政策體系中存在政策引用與被引用關(guān)系構(gòu)成的政策網(wǎng)絡(luò),其能夠體現(xiàn)政策制定的擴散過程和方向,不斷完善我國科學(xué)數(shù)據(jù)開放政策體系的布局[2]。核心政策作為政策擴散的領(lǐng)導(dǎo)者,與其引用政策形成政策擴散網(wǎng)絡(luò),分析其隱含信息對政策整體是否具有引導(dǎo)作用,對于相關(guān)政策領(lǐng)域的全面深入研究具有重要意義。
核心政策隱含信息的挖掘與知識結(jié)構(gòu)化、核心政策的識別以及核心政策對政策整體的影響可借助知識圖譜實現(xiàn)。知識圖譜以具有知識表達屬性的三元組為基礎(chǔ),以具有語義關(guān)系的有向圖結(jié)構(gòu)描述政策中的相關(guān)概念及其關(guān)系。將知識圖譜技術(shù)應(yīng)用于政策文本研究中,能夠展現(xiàn)政策文本內(nèi)容的隱含信息,挖掘不同政策間的內(nèi)在聯(lián)系,實現(xiàn)政策的精細化利用。
基于此,本文提出一種基于知識圖譜的政策文本細粒度分析方法,利用知識圖譜良好的語義表達能力來識別科學(xué)數(shù)據(jù)開放的核心政策,通過知識圖譜發(fā)現(xiàn)核心政策與引用政策的主要條目、政策主體以及政策屬性之間的內(nèi)在關(guān)聯(lián),結(jié)合政策工具理論,探究科學(xué)數(shù)據(jù)開放核心政策對于政策整體的特征和演化規(guī)律的影響。
科學(xué)數(shù)據(jù)開放共享已有的研究更多集中在相關(guān)概念[3]、表現(xiàn)形式[4]、影響因素[5]、制度建設(shè)[6]與評價體系[7]上,相關(guān)研究成果較多,其中也有部分研究涉及到相關(guān)政策研究,包括對現(xiàn)有政策進行量化評價[8]、政策主體合作[9]、體系構(gòu)建[10]、國內(nèi)外政策比較研究[11]和政策工具[12]等??梢园l(fā)現(xiàn)目前對科學(xué)數(shù)據(jù)開放政策的分析大多是采用傳統(tǒng)的文件解讀方式,存在主觀性和片面性,政策文本量化分析采用量化的方法對政策文本分析,主要集中在三類:(1)政策工具,通常是借用Rothwell等[13]提出的政策工具法進行定量研究;(2)文獻計量,采用統(tǒng)計學(xué)的方法對政策文件進行描述型統(tǒng)計分析,從文件外部特征上對政策文件進行主體特征、政策現(xiàn)狀分析[14];(3)文本挖掘,采用文本挖掘方法,借助于機器學(xué)習(xí)、數(shù)據(jù)挖掘等,對政策文件的內(nèi)容進行情感分析[15]、語義分析[16]。政策文本量化雖有一定優(yōu)勢但缺乏文本內(nèi)容之間的語義關(guān)聯(lián),不利于全面理解相關(guān)政策的走勢。而知識圖譜強大的語義表示能力,能夠彌補不足之處。
知識圖譜是一種描述真實客觀實體之間關(guān)系的語義網(wǎng)絡(luò),通過<實體,關(guān)系,實體>或<實體,屬性,屬性值>形式表示實體之間的相互關(guān)系和實體所具有的屬性,形成語義知識庫,以圖形化方式增強計算機描述客觀世界中相關(guān)概念及其關(guān)系的能力[17]。由于其強大的語義表示能力,被廣泛應(yīng)用于個性化推薦[18]、語義搜索[19]、智能問答[20]、風(fēng)險識別及預(yù)警[21]等應(yīng)用領(lǐng)域。近年來,有不少學(xué)者對政策文本抽取知識,構(gòu)建語義化的政策知識圖譜。如張維沖等以貴州省大數(shù)據(jù)政策為樣本數(shù)據(jù)構(gòu)建貴州省大數(shù)據(jù)政策知識圖譜[22]。張雨等以科技政策文本為數(shù)據(jù)源,通過Bi-LSTM模型構(gòu)建科技政策知識圖譜[23]。
政策擴散表示政策之間發(fā)生引用、演化等一系列行為的過程[2]。與文獻計量學(xué)的引用與被引用相類似,一篇政策文件被其他政策文件引用或參照,體現(xiàn)出政策的繼承與發(fā)展關(guān)系。通過對政策擴散的過程研究,有助于了解政策制定的來龍去脈以及發(fā)展趨勢。學(xué)者們對于政策擴散的模式也展開了深入的研究,如Brown和Cox在總結(jié)政策擴散過程的三條規(guī)律基礎(chǔ)上提出“領(lǐng)導(dǎo)者與追隨者”的層級效應(yīng)[24]。Marsh和Sharman根據(jù)政策擴散在研究中受到的關(guān)注程度,提出了學(xué)習(xí)、競爭、脅迫和模仿等四種擴散機制,并分析了不同擴散機制的側(cè)重點[25]。許乾坤等結(jié)合科技政策篇章文本的形式語義和內(nèi)容語義兩個方面對政策文本結(jié)構(gòu)化處理和深度挖掘,提出科技政策的自組織方法[2]。
政策擴散路徑如圖1所示。與文獻引用相似,政策擴散是政策的引用與部分引用的一個過程,一篇政策的內(nèi)容是來源多篇政策,或者是政策被多篇政策借鑒和引用,而核心政策是政策擴散的源頭,是所有引用政策的“領(lǐng)導(dǎo)者”。與文獻引用的規(guī)范格式不同,政策引用則是以書名號的形式將參考政策名稱在文中羅列,有時甚至簡化參考的政策標(biāo)題對研究政策擴散產(chǎn)生極大阻礙。知識圖譜能夠通過政策引文關(guān)系探究政策擴散規(guī)律。其實體融合消岐的過程能有效解決政策引文關(guān)系格式不規(guī)范等問題。
圖1 政策擴散路徑模型
通常構(gòu)建政策知識圖譜都要考慮其兩個層面,分別是模式層和數(shù)據(jù)層。模式層是指所要構(gòu)建的政策文本中的概念和概念的特征,而數(shù)據(jù)層是對模式層的具體落實。政策知識圖譜構(gòu)建過程如圖2所示,知識圖譜的構(gòu)建是基于數(shù)據(jù)獲取、知識獲取、知識融合、知識加工的動態(tài)循環(huán)過程,從政策文本提取實體及其相關(guān)關(guān)系,同時對提取的內(nèi)容進行審核,從而得到相應(yīng)的模式層,并在模式層的基礎(chǔ)上更新數(shù)據(jù)層,最終構(gòu)建政策知識圖譜。
圖2 知識圖譜構(gòu)建過程
本文根據(jù)社會網(wǎng)絡(luò)分析中K核的概念來提取展示政策知識圖譜中的核心政策。K核分解是以不斷移去網(wǎng)絡(luò)中所有度值小于或等于K的節(jié)點的形式揭示網(wǎng)絡(luò)層級結(jié)構(gòu)特征。假設(shè)網(wǎng)絡(luò)G=(V,E)是一個無向網(wǎng)絡(luò),該網(wǎng)絡(luò)由|V|=N個節(jié)點和|E|=E條邊組成,則K核分解的定義如下[26]:由集合推導(dǎo)出的子網(wǎng)絡(luò)H=(C,E|C),當(dāng)且僅當(dāng)對C中的任意節(jié)點V,其度值均大于K,具有這一性質(zhì)的最大子網(wǎng)絡(luò)的補集被稱為K核。K核的分解始于網(wǎng)絡(luò)中最邊緣的節(jié)點,隨著K值的逐漸增大,由外到內(nèi)逐漸進入網(wǎng)絡(luò)的最核心區(qū)域,根據(jù)K核定義可知,最大K核節(jié)點代表網(wǎng)絡(luò)最核心節(jié)點。
本研究語料數(shù)據(jù)為科學(xué)數(shù)據(jù)開放主題相關(guān)的國家層面的政策文本,選取過程如下:在中國政府網(wǎng)和北大法寶檢索標(biāo)題或全文中含有“科學(xué)數(shù)據(jù)開放”、“數(shù)據(jù)開放”和“數(shù)據(jù)共享”關(guān)鍵詞的政策文本;篩選和剔除政策文本中與主題關(guān)聯(lián)較弱的政策文本以及答復(fù)和函這類參考價值較弱的政策格式;整理獲得2007-2022年208篇科學(xué)數(shù)據(jù)開放的政策文本。對收集到的政策文本正文部分按照一級標(biāo)題將一篇政策分割為若干個政策條文,保留與主題密切相關(guān)的政策條文內(nèi)容,即對包含“科學(xué)數(shù)據(jù)”、“開放”或“共享”關(guān)鍵詞的政策條文予以保留,最終獲得政策條文849條。
本文根據(jù)政策文本特點以及內(nèi)容組成要素,以全面反映科學(xué)數(shù)據(jù)開放政策演化過程中政策內(nèi)容包括政策目的、政策對象、政策類別、政策性質(zhì)為目標(biāo)構(gòu)建知識圖譜模式層。本文在融合政策工具理論和知識圖譜理論等基礎(chǔ)上,對政策文本進行細分,形成政策文件-政策條文的二級分層體系,并補充和調(diào)整一些實體、關(guān)系和屬性,構(gòu)建科學(xué)數(shù)據(jù)開放政策的知識圖譜模式層,如圖3所示:
圖3 科學(xué)數(shù)據(jù)開放政策知識圖譜模式
(1)實體定義。實體是對客觀個體的抽象。通過分析政策文本的特征,將涉及的實體分為兩個層面:政策文件層面和政策條文層面。政策文件層面的實體主要從政策外部特征來界定實體,政策條文層面主要從政策內(nèi)容進行界定,如表1所示。其中條文類別的劃分是在政策工具的分類的基礎(chǔ)上,結(jié)合科學(xué)數(shù)據(jù)開放政策進行分類,供給型條文類別包含信息科技支持、公共服務(wù)、人才培養(yǎng)和資金支持;環(huán)境型條文類別包含法規(guī)標(biāo)準(zhǔn)、工作制度、公民參與和目標(biāo)規(guī)劃;需求型條文類別包含消費市場、合作交流和政府采購。
(2)關(guān)系定義。在知識圖譜中,通常以節(jié)點表示實體,以節(jié)點之間的有向邊進一步表示實體之間的關(guān)系,本文的關(guān)系包括發(fā)布、包含、目標(biāo)、類別和隸屬等八類關(guān)系,如表2所示。
(3)屬性。屬性是對實體的抽象描述,政策文件層面的屬性包括發(fā)布時間、政策摘要和政策關(guān)鍵詞,條文層面的屬性包括條文關(guān)鍵詞。如表3所示。
本文采用Neo4j數(shù)據(jù)庫來存儲抽取的實體、屬性和關(guān)系。基本過程是先建立知識網(wǎng)絡(luò)的關(guān)系映射表,然后按照Neo4j要求將抽取的實體、關(guān)系和屬性實例化。采用Python的os、pandas、py2neo模塊將構(gòu)建好的實體及關(guān)系數(shù)據(jù)逐條導(dǎo)入neo4j的圖數(shù)據(jù)庫中,形成科學(xué)數(shù)據(jù)開放政策知識圖譜,共計實體1291個和關(guān)系5399條,并通過Cypher語言查詢發(fā)現(xiàn)政策知識圖譜節(jié)點間的內(nèi)在聯(lián)系。
表1 科學(xué)數(shù)據(jù)開放政策知識圖譜中的實體及描述
表2 科學(xué)數(shù)據(jù)開放政策知識圖譜中的關(guān)系類型及描述
表3 科學(xué)數(shù)據(jù)開放政策知識圖譜中的實體屬性及描述
知識圖譜能夠通過對節(jié)點間關(guān)系進行知識推理,發(fā)現(xiàn)政策間隱含的內(nèi)在關(guān)聯(lián)。根據(jù)K核分解,最終發(fā)現(xiàn)當(dāng)K=4時為最大K核,其代表的節(jié)點為核心政策,部分節(jié)點關(guān)系如圖4所示,其中K=1時政策共125個,K=2政策共27個、K=3政策共10個、K=4政策共3個,分別為2015年8月的《大數(shù)據(jù)發(fā)展行動綱要》(以下簡稱《大數(shù)據(jù)》)、2016年3月的《國民經(jīng)濟和社會發(fā)展第十三個五年規(guī)劃》(以下簡稱《十三五》)以及2016年7月的《國家信息化發(fā)展戰(zhàn)略綱要》(以下簡稱《信息化》)。
圖4 K=2時部分政策間引用關(guān)系
核心政策的政策目標(biāo)及政策工具使用情況以《大數(shù)據(jù)》為例(如圖5所示)?!洞髷?shù)據(jù)》的政策目標(biāo)中僅有產(chǎn)業(yè)發(fā)展,在政策工具使用時缺乏對法規(guī)標(biāo)準(zhǔn)、政府采購和公民參與的使用;《信息化》的政策目標(biāo)偏向創(chuàng)新驅(qū)動,政策工具的使用缺乏資金支持和政府采購;《十三五》的政策目標(biāo)偏向數(shù)據(jù)治理和產(chǎn)業(yè)發(fā)展,而在政策工具方面僅使用到了法規(guī)標(biāo)準(zhǔn)、工作制度、消費市場和公共服務(wù)。
圖5 《大數(shù)據(jù)》政策工具及目標(biāo)情況
通過對核心政策的發(fā)布時間屬性進行查詢,結(jié)合科學(xué)數(shù)據(jù)開放政策數(shù)量演化情況,如圖6所示,發(fā)現(xiàn)核心政策均發(fā)布于科學(xué)數(shù)據(jù)開放政策爆發(fā)式增長階段初期,相關(guān)政策集中發(fā)布于2016年和2017年,這與科學(xué)數(shù)據(jù)開放政策的整體變化趨勢相吻合,而在2018年后,核心政策的影響力逐漸衰弱,科學(xué)數(shù)據(jù)開放政策的發(fā)展步伐放緩。由此可見,核心政策可能影響了科學(xué)數(shù)據(jù)開放的進程。
圖6 政策時間分布頻次及變化
通過對比核心政策與整體的政策工具使用情況,可以研究核心政策對整體政策工具使用情況的影響。本文中核心政策的政策工具運用為供給型10條、環(huán)境型8條和需求型2條,偏向于運用供給型和環(huán)境型政策工具。根據(jù)圖7可以發(fā)現(xiàn),核心政策的政策工具使用情況與整體大致相似。值得注意的是,在核心政策的發(fā)布年份以及引用核心政策的科學(xué)數(shù)據(jù)開放政策數(shù)量最多的年份,即2015年至2017年中,供給型政策工具的使用情況略多余其他年份,說明核心政策在政策工具演化上產(chǎn)生了引導(dǎo)作用。
圖7 各年度政策工具分布占比
通過分析核心政策對引用核心政策的科學(xué)數(shù)據(jù)開放政策(以下簡稱關(guān)聯(lián)政策)在政策目標(biāo)和政策工具上產(chǎn)生的影響情況,有助于探究核心政策的具體影響機制。
3.4.1 核心政策對于關(guān)聯(lián)政策在政策目標(biāo)上的影響
通過研究核心政策的政策目標(biāo)偏向,探討其對關(guān)聯(lián)政策的政策目標(biāo)影響情況。在政策知識圖譜中分別匹配核心政策的關(guān)聯(lián)政策及其政策目標(biāo),關(guān)聯(lián)政策在政策目標(biāo)上的分布情況匯總?cè)绫?所示,結(jié)合核心政策在政策目標(biāo)上的偏好情況,發(fā)現(xiàn)《大數(shù)據(jù)》政策目標(biāo)中僅有產(chǎn)業(yè)發(fā)展,其關(guān)聯(lián)政策的政策目標(biāo)在產(chǎn)業(yè)發(fā)展政策目標(biāo)上的比重較高;在《十三五》的政策目標(biāo)中,數(shù)據(jù)治理包含2條,產(chǎn)業(yè)發(fā)展包含1條,而其關(guān)聯(lián)政策的政策目標(biāo)中亦是數(shù)據(jù)治理占比最高,產(chǎn)業(yè)發(fā)展次之;在《信息化》的政策目標(biāo)中僅有創(chuàng)新驅(qū)動,而在整體政策的政策目標(biāo)中,創(chuàng)新驅(qū)動僅占比7.6%,但在《信息化》的關(guān)聯(lián)政策的政策目標(biāo)中,創(chuàng)新驅(qū)動占比達到了27.3%。由此可見,在科學(xué)數(shù)據(jù)開放政策中核心政策的政策目標(biāo)偏向確實能夠?qū)ζ潢P(guān)聯(lián)政策的政策目標(biāo)產(chǎn)生影響,但這個影響還不足以對政策整體產(chǎn)生作用。
表4 各核心政策的關(guān)聯(lián)政策的政策目標(biāo)占比情況
3.4.2 核心政策對于關(guān)聯(lián)政策所使用政策工具的影響
通過研究核心政策的政策工具使用,探討核心政策對關(guān)聯(lián)政策使用政策工具情況的影響。在政策知識圖譜中分別匹配核心政策的關(guān)聯(lián)政策及其政策工具的使用,通過匯總核心政策的關(guān)聯(lián)政策和政策整體政策工具情況(如表5所示),結(jié)合核心政策的政策工具使用偏好情況,發(fā)現(xiàn)《大數(shù)據(jù)》在運用政策工具時,偏向于供給型,其次在使用需求型與環(huán)境型政策工具相對均衡,而在《大數(shù)據(jù)》關(guān)聯(lián)政策中供給型與需求型政策工具占比同樣高于整體情況;《十三五》中環(huán)境型與供給型政策工具使用較多,而在其關(guān)聯(lián)政策中體現(xiàn)為供給型與環(huán)境型政策工具占比差距較小;《信息化》中政策工具使用為供給型3條、環(huán)境型4條和需求型2條,相對于整體而言,核心政策《信息化》政策工具運用相對均衡,在其關(guān)聯(lián)政策中體現(xiàn)為需求型政策工具占比遠高于總體情況。由此發(fā)現(xiàn),關(guān)聯(lián)政策工具的使用情況大體與科學(xué)數(shù)據(jù)開放政策總體情況相似,但核心政策在三種類別政策工具中使用的具體工具并未對關(guān)聯(lián)政策產(chǎn)生明顯影響。
表5 各核心政策的關(guān)聯(lián)政策的政策工具占比情況
本文采用自頂向下的方式構(gòu)建知識圖譜,在分析語料數(shù)據(jù)的基礎(chǔ)上,構(gòu)建科學(xué)數(shù)據(jù)開放政策的模式層;基于模式層從語料庫里抽取出實體、屬性和關(guān)系,存入圖數(shù)據(jù)庫中。對我國科學(xué)數(shù)據(jù)開放政策現(xiàn)狀,以政策工具理論為基礎(chǔ),從知識圖譜的角度進行深入剖析,探究科學(xué)數(shù)據(jù)開放的核心政策對其關(guān)聯(lián)政策以及整體的政策目標(biāo)和政策工具使用變化的影響。
研究結(jié)果表明,科學(xué)數(shù)據(jù)開放的核心政策在政策演化過程中,能夠?qū)ζ潢P(guān)聯(lián)政策以及政策整體的政策目標(biāo)和政策工具使用產(chǎn)生影響。核心政策能夠調(diào)節(jié)政策整體的目標(biāo)偏好以及政策工具的使用情況,推動科學(xué)數(shù)據(jù)開放政策體系的平衡與完善。但就目前科學(xué)數(shù)據(jù)開放政策制定的現(xiàn)狀來看,我國核心政策發(fā)布數(shù)量較少,同時引用的關(guān)聯(lián)政策較少;核心政策的影響力減弱后,由于缺乏后續(xù)核心政策的發(fā)布,使得科學(xué)數(shù)據(jù)開放發(fā)展的步伐放緩。我國政府應(yīng)當(dāng)增加核心政策制定,以加強政策體系的結(jié)構(gòu)性,通過不斷發(fā)布新的核心政策,維持科學(xué)數(shù)據(jù)開放的發(fā)展動力,為推進我國科學(xué)數(shù)據(jù)開放的發(fā)展提供宏觀把控以及具體指引。
本文的研究中仍存在不足之處,選取政策文本數(shù)量較少,僅以國家層面的政策作為研究對象,而地方政策,作為中央政策的延續(xù)是政策體系不可或缺的一部分,更多的內(nèi)在聯(lián)系以及特征規(guī)律尚未被挖掘。
[1] 郭華東. 科學(xué)大數(shù)據(jù)―國家大數(shù)據(jù)戰(zhàn)略的基石[J]. 中國科學(xué)院院刊, 2018, 33(08): 768-773.
[2] 許乾坤, 劉耀. 科技政策隱性擴散路徑自組織研究[J/OL]. 情報資料工作, 1-14. http://kns. cnki.net/ kcms/ detail/11.1448.G3.20220118.1528.002.htm, [2022-04-14].
[3] 王瑞丹, 高孟緒, 石蕾, 等. 對大數(shù)據(jù)背景下科學(xué)數(shù)據(jù)開放共享的研究與思考[J]. 中國科技資源導(dǎo)刊, 2020, 52(01): 1-5+26.
[4] 章琰, 楊一圖, 吳健, 等. 我國科學(xué)數(shù)據(jù)共享運行機制模式創(chuàng)新探討——以產(chǎn)業(yè)技術(shù)聯(lián)盟為例[J]. 科學(xué)學(xué)研究, 2021, 39(11): 1970-1979.
[5] 劉文云, 劉莉. 歐盟開放科學(xué)實踐體系分析及啟示[J]. 圖書情報工作, 2020, 64(07): 136-144.
[6] 張娟. 歐盟開放科學(xué)戰(zhàn)略生態(tài)體系建設(shè)及其特征分析[J]. 世界科技研究與發(fā)展, 2021, 43(01): 64-76.
[7] 黃如花. 我國政府?dāng)?shù)據(jù)開放共享標(biāo)準(zhǔn)體系構(gòu)建[J]. 圖書與情報, 2020, (03): 17-19.
[8] 宋大成, 焦鳳枝, 范升. 我國科學(xué)數(shù)據(jù)開放共享政策量化評價——基于PMC指數(shù)模型的分析[J]. 情報雜志, 2021, 40(08): 119-126.
[9] 朱玲, 李國俊, 吳越. 國外科學(xué)數(shù)據(jù)開放共享政策中的主體分工合作框架及啟示[J]. 圖書情報知識, 2020, (01): 94-104.
[10] 衛(wèi)軍朝, 閆妍, 王海彪. 科學(xué)數(shù)據(jù)開放政策保障體系的構(gòu)建與應(yīng)用[J]. 圖書館學(xué)研究, 2017, (22): 46-54.
[11] 邢文明, 楊玲. 中美科學(xué)數(shù)據(jù)政策比較——以《科學(xué)數(shù)據(jù)管理辦法》和《促進聯(lián)邦資助科研成果獲取的備忘錄》為例[J/OL]. 圖書館論壇, 1-10. http://kns. cnki.net/kcms/detail/44.1306.G2.20210621.1728.007. html, [2022-04-14].
[12] 趙洋, 程雪涓. 政策工具視域下我國開放數(shù)據(jù)政策研究[J]. 圖書館雜志, 2021, 40(11): 31-38+47.
[13] Rothwell R, Zegveld W. Reindusdalization and Aechnol- ogy[M]. London: Logman Group Limited, 1985.
[14] Huang C, Su J, Xie X, et al. A bibliometric study of China’s science and technology policies: 1949-2010[J]. Scientometrics, 2014, 102(2): 1521-1539.
[15] 王亞民, 寧靜, 馬續(xù)補. 基于社會化媒體的公共政策輿情支持度研究[J]. 情報理論與實踐, 2018, 41(03): 95-100.
[16] 孫春升. 基于語義分析的我國煤炭行業(yè)政策趨勢研究[J]. 煤炭工程, 2018, 50(11): 167-171.
[17] 田玲, 張謹(jǐn)川, 張晉豪, 等. 知識圖譜綜述——表示、構(gòu)建、推理與知識超圖理論[J]. 計算機應(yīng)用, 2021, 41(08): 2161-2186.
[18] Huang G, Yuan M, Li C S, et al. Personalized Knowledge Recommendation Based on Knowledge Graph in Petroleum Exploration and Development[J]. International Journal of Pattern Recognition and Artificial Intelligence, 2020, 34(10): 2059033.
[19] Wu Q, Fu D, Shen B, et al. Semantic Service Search in IT Crowdsourcing Platform: A Knowledge Graph - Based Approach[J]. International Journal of Software Engineering and Knowledge Engineering, 2020, 30(6): 765-783.
[20] Yang Z, Wang Y, Gan J, et al. Design and Research of Intelligent Question-Answering(Q&A) System Based on High School Course Knowledge Graph[J]. Mobile Networks and Applications:1-7, 2021, 6(1):1884-1890.
[21] Boytcheva S, Angelova G, Angelov Z, et al. Enrichment of EHR with linked open data for risk factors identification[C]. ACM International Conference Proceeding Series, 2017. 84-90.
[22] 張維沖, 王芳, 黃毅. 基于圖數(shù)據(jù)庫的貴州省大數(shù)據(jù)政策知識建模研究[J]. 數(shù)字圖書館論壇, 2020, (04): 30-38.
[23] 張雨, 吳俊. 科技政策知識圖譜構(gòu)建研究[J]. 數(shù)字圖書館論壇, 2021, (08): 31-38.
[24] Brown L A, Cox K R. Empirical regularities in the diffusion of innovation[J]. Annals of the Association of American Geographers, 1971, 61(3): 551-559.
[25] Marsh D, Sharman J C. Policy diffusion and policy transfer[J]. Policy studies, 2009, 30(3): 269-288.
[26] 任卓明, 劉建國, 邵鳳, 等. 復(fù)雜網(wǎng)絡(luò)中最小K-核節(jié)點的傳播能力分析[J]. 物理學(xué)報, 2013, 62(10): 474-479.
[27] 盛小平, 吳紅. 科學(xué)數(shù)據(jù)開放共享活動中不同利益相關(guān)者動力分析[J]. 圖書情報工作, 2019, 63(17): 40-50.
Research on The Core Policy of Scientific Data Opening Based on Knowledge Graph
WU Jin-hong, WU Rong-zheng
(School of Management, Wuhan Textile University, Wuhan Hubei 430200, China)
This paper makes a fine-grained analysis of China's scientific data opening policy, and discusses the impact and mechanism of China's core policy of scientific data opening, so as to provide reference for formulating policies to promote efficient data sharing in the digital economy environment. Using the top-down method, build the knowledge graph pattern layer, identify and extract the policy entities, attributes and relationships, build the data layer, and store it in the Neo4j graph database; Realize the semantic level of association query and visualization, and conduct multi-dimensional analysis of policy text from different fine-grained. Identify the core policy through the knowledge graph, conduct multi-dimensional analysis of the policy text in combination with the policy tools, and explore the impact of the core policy of scientific data opening on the existing policy system. It is found that the core policy of scientific data opening can have an impact on its related policies, as well as the overall policy objectives and the use of policy tools in the process of policy evolution.
scientific data opening; policy tools; knowledge graph; text analysis
吳金紅(1974-),男,教授,博士,研究方向:競爭情報系統(tǒng)、大數(shù)據(jù)治理與商務(wù)智能.
2020年度湖北省社科基金前期資助項目(20ZD053).
G203
A
2095-414X(2022)05-0021-08