汪淑嫻
(華中師范大學,湖北 武漢 430070)
國內(nèi)關(guān)聯(lián)數(shù)據(jù)領(lǐng)域研究熱點分析
汪淑嫻
(華中師范大學,湖北 武漢 430070)
文章以中國知網(wǎng)為數(shù)據(jù)來源,利用關(guān)鍵詞共詞分析法,將BICOMB2.0與SPSS20.0相結(jié)合得出相關(guān)的圖表。通過研究發(fā)現(xiàn)關(guān)聯(lián)數(shù)據(jù)領(lǐng)域主要圍繞7大主題,這有利于關(guān)聯(lián)數(shù)據(jù)領(lǐng)域研究熱點的明確。圖書情報領(lǐng)域研究人員可以通過關(guān)注和把握關(guān)聯(lián)數(shù)據(jù)領(lǐng)域研究熱點,推進圖書館信息服務(wù)的發(fā)展。
關(guān)聯(lián)數(shù)據(jù);信息資源;模型架構(gòu);語義關(guān)聯(lián)
2006年,萬維網(wǎng)的創(chuàng)始人Tim burners-Lee第一次提出了“Linked Data”的概念,他認為“Linked Data”就是將所有的數(shù)據(jù)鏈接起來,并將其構(gòu)建成計算機能夠理解、高度結(jié)構(gòu)化和富含語義關(guān)系的數(shù)據(jù)網(wǎng)絡(luò)。2007年,Bizer發(fā)布了“How to publish Linked Data on theWeb”一文,又將關(guān)聯(lián)數(shù)據(jù)進行了新的定義:關(guān)聯(lián)數(shù)據(jù)就是一種在萬維網(wǎng)上發(fā)布和鏈接結(jié)構(gòu)化數(shù)據(jù)的方式,即關(guān)聯(lián)數(shù)據(jù)是利用萬維網(wǎng)來創(chuàng)建不同數(shù)據(jù)源之間的語義鏈接。同時,我可以通過維基百科搜索到其定義:關(guān)聯(lián)數(shù)據(jù)是一種推薦的最佳實踐,即在語義網(wǎng)中使用了URI和RDF發(fā)布、分享、連接各類數(shù)據(jù)、信息和知識。
圖1 關(guān)聯(lián)數(shù)據(jù)集云圖
關(guān)聯(lián)數(shù)據(jù)是網(wǎng)絡(luò)發(fā)展的一種趨勢,它伴隨著科學技術(shù)和信息技術(shù)的發(fā)展產(chǎn)生。隨著人類社會進入數(shù)字時代,特別是21世紀以來,科學研究的方式方法發(fā)生巨大的變革,在信息化基礎(chǔ)設(shè)施支持下的科研活動得到迅速發(fā)展,數(shù)據(jù)密集型科研方式興起。但是由于認知的限制,國內(nèi)的關(guān)聯(lián)數(shù)據(jù)的發(fā)展方向還在不斷的探討的過程中。網(wǎng)絡(luò)上以W3C推薦的關(guān)聯(lián)數(shù)據(jù)標準發(fā)布的關(guān)聯(lián)數(shù)據(jù)集已經(jīng)達到了數(shù)百多個,并且數(shù)據(jù)集的數(shù)量和數(shù)據(jù)集之間的關(guān)聯(lián)都在快速增加著。如圖1所示是截止到2014關(guān)聯(lián)數(shù)據(jù)集發(fā)展的情況。
通過文獻調(diào)研可以發(fā)現(xiàn),自2006年以來,關(guān)聯(lián)數(shù)據(jù)相關(guān)主題研究逐漸增多,大體分成兩大類:一是科學界從各自具體的學科角度出發(fā),研究相關(guān)領(lǐng)域關(guān)聯(lián)數(shù)據(jù)的發(fā)布與實現(xiàn)的問題;二是圖書情報學界將關(guān)聯(lián)數(shù)據(jù)中的數(shù)據(jù)作為信息資源管理對象,開展關(guān)聯(lián)數(shù)據(jù)與知識融合的研究。國外現(xiàn)在有很多將關(guān)聯(lián)技術(shù)作為網(wǎng)站構(gòu)建的比較完善的平臺比如有紐約時報、英國BBC、維基百科等。雖然有些平臺逐漸的運用了此項技術(shù),但是還不夠完善,用戶在實際的體驗中還未享受到不一樣的感受。國內(nèi)對此項技術(shù)的研究發(fā)展也在初步階段,所以在研究熱點方面還有許多值得探討的地方。
大數(shù)據(jù)系統(tǒng)要能處理關(guān)聯(lián)數(shù)據(jù),關(guān)鍵是要支持RDF數(shù)據(jù)的處理。這種支持,包括許多內(nèi)容,對系統(tǒng)性能的影響也很大,如數(shù)據(jù)結(jié)構(gòu)和查詢方式對查詢系統(tǒng)的性能影響就很大。目前,對關(guān)聯(lián)數(shù)據(jù)的處理流程還不規(guī)范,隨著IT技術(shù)的發(fā)展,這個問題將逐步解決。為了精確梳理近10年來關(guān)聯(lián)數(shù)據(jù)領(lǐng)域的研究成果,直觀展現(xiàn)它們所涉及的研究領(lǐng)域和主題,發(fā)現(xiàn)相關(guān)研究表現(xiàn)出的特征,特別是分析圖書情報領(lǐng)域相關(guān)研究的不足和未來走向,文章擬采用國際上較為常用的科學計量方法,以關(guān)鍵詞共詞法,聚類分析與多維尺度分析法為主要研究方法,來分析國內(nèi)關(guān)聯(lián)數(shù)據(jù)研究的熱點問題。
年6月30日。④檢索結(jié)果:檢索獲取766篇文獻記錄,經(jīng)過查重、篩選和取舍,并剔除了新聞報道、科普類短文等非研究性文獻,一共獲得277條記錄。
(2)研究工具。①書目共現(xiàn)分析系統(tǒng)Bicomb2.0;②統(tǒng)計產(chǎn)品與服務(wù)解決方案SPSS20.0。
(3)研究步驟。①文獻關(guān)鍵詞的選取、清洗和預(yù)處理;②應(yīng)用Bicomb2.0建立關(guān)鍵詞共詞詞頻矩陣;③應(yīng)用 SPSS20.0共詞詞頻矩陣進行分析,以樣本聚類獲得關(guān)鍵詞聚類樹圖;④過SPSS20.0進行多維尺度分析;⑤圍繞聚類樹圖進行研究熱點的分析。
(4)研究方法。文章運用關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖譜來分析關(guān)聯(lián)數(shù)據(jù)領(lǐng)域的研究熱點;運用共詞聚類分析法生成共詞聚類樹狀圖來分析關(guān)聯(lián)數(shù)據(jù)研究論文的主流研究領(lǐng)域的結(jié)構(gòu)及其關(guān)系。
詞頻分析法是利用能夠揭示或表達文獻核心內(nèi)容的關(guān)鍵詞或主題詞在某一研究領(lǐng)域文獻中出現(xiàn)的頻次高低來確定該領(lǐng)域研究熱點和發(fā)展動向的文獻計量方法。由于一篇文獻的關(guān)鍵詞或主題詞是文章核心內(nèi)容的濃縮和提煉,因此,如果某一關(guān)鍵詞或主題詞在其所在領(lǐng)域的文獻中反復(fù)出現(xiàn),則可反映出該關(guān)鍵詞或主題詞所表征的研究主題是該領(lǐng)域的研究熱點。
2.1 關(guān)鍵詞詞頻統(tǒng)計與分析
詞頻分析方法的詞頻統(tǒng)計、關(guān)鍵詞分析經(jīng)常被用于描述某學科領(lǐng)域的研究狀況,進而揭示該領(lǐng)域的研究熱點和發(fā)展趨勢。文章所選文獻總關(guān)鍵詞為596次,對標準化后、詞頻大于4的32個關(guān)鍵詞按照頻次進行排列,如表1所示。
表1 關(guān)鍵詞頻次排序
表1中,32個關(guān)鍵詞為491次,占關(guān)鍵詞總頻次726次的67.63%。前10位關(guān)鍵詞出現(xiàn)頻次均大于9,依次是:關(guān)聯(lián)數(shù)據(jù)(228次)、語義網(wǎng)(37次)、圖書館(26次)、RDF(14次)、本體(14次)、數(shù)據(jù)網(wǎng)絡(luò)(14次)、數(shù)字圖書館(13次)、關(guān)聯(lián)數(shù)(12次)、知識組織(11次)、知識發(fā)現(xiàn)(9次)。這些關(guān)鍵詞分布數(shù)據(jù)可以初步說明,關(guān)聯(lián)數(shù)據(jù)領(lǐng)域的研究主要集中在知識發(fā)現(xiàn)、關(guān)聯(lián)數(shù)據(jù)的構(gòu)建和發(fā)布等方面,圖書館在這些活動中扮演著重要的角色,數(shù)據(jù)發(fā)布平臺是關(guān)聯(lián)數(shù)據(jù)管理與共享的基本呈現(xiàn)形式。此外,要更深入揭示關(guān)鍵詞之間所形成和呈現(xiàn)的深層次關(guān)系,進而反映關(guān)聯(lián)數(shù)據(jù)研究領(lǐng)域的主題熱點,還需要圍繞關(guān)鍵詞的詞篇分布進行更多的數(shù)據(jù)分析和挖掘。
2.2 關(guān)鍵詞系數(shù)矩陣
為了進一步分析關(guān)鍵詞之間的關(guān)系,文章用BICOMB2.0共詞分析軟件對所有的關(guān)鍵詞進行了共詞分析,獲取了詞篇矩陣?!霸~篇矩陣”是針對主題詞——文獻矩陣而言的一種簡便稱呼,該矩陣的第一列是主題詞,第一行則是文獻記錄的號碼,其實質(zhì)是一種數(shù)據(jù)矩陣。其中間格子(“0”和“1”)分別代表該詞在對應(yīng)的文章中是否出現(xiàn),或者該論文是否被對應(yīng)來源文獻使用。事實上從詞篇矩陣看不出具有實質(zhì)性意義的研究熱點,它結(jié)合SPSS20.0的聚類分析可以進一步得到分析的結(jié)果。
由于論文文檔格式的限制,筆者只截取了其中的前10個詞篇矩陣的部分內(nèi)容。從表2可以看出:各個關(guān)鍵詞之間的還是存在著一定的聯(lián)系的。這些數(shù)值表明,關(guān)聯(lián)數(shù)據(jù)常常與語義網(wǎng)、圖書館、RDF知識組織和知識發(fā)現(xiàn)等有關(guān)的關(guān)鍵詞結(jié)合,也側(cè)面說明了關(guān)聯(lián)數(shù)據(jù)在如今的研究方向。
表2 關(guān)鍵詞的詞篇矩陣(部分)
2.3 關(guān)鍵詞聚類分析
為更加直觀地展示關(guān)鍵詞之間的親疏關(guān)系,文章還應(yīng)用了SPSS20.0軟件對詞篇矩陣進行了關(guān)鍵詞聚類分析,圖2位呈現(xiàn)的聚類數(shù)圖(部分)。從圖2可以看出關(guān)鍵詞分為了7類,具體分布如表3所示。
表3 關(guān)鍵詞聚類一覽表
圖2 關(guān)聯(lián)數(shù)據(jù)領(lǐng)域研究關(guān)鍵詞聚類樹狀圖
通過關(guān)鍵詞的聚類分析可知,關(guān)聯(lián)數(shù)據(jù)領(lǐng)域7類研究主題具體分布為:
(1)種類1主題主要為關(guān)聯(lián)數(shù)據(jù)的基本概述。該類主題主要包括:概念解析,即關(guān)聯(lián)數(shù)據(jù)概念的界定,國內(nèi)外根據(jù)關(guān)聯(lián)數(shù)據(jù)的發(fā)展情況,對關(guān)聯(lián)數(shù)據(jù)的定義。關(guān)聯(lián)數(shù)據(jù)與數(shù)據(jù)網(wǎng)絡(luò):關(guān)聯(lián)數(shù)據(jù)是構(gòu)建數(shù)據(jù)網(wǎng)絡(luò)的具體實踐,構(gòu)建數(shù)據(jù)網(wǎng)絡(luò)是關(guān)聯(lián)數(shù)據(jù)的目標。關(guān)聯(lián)數(shù)據(jù)與語義網(wǎng):雖然關(guān)聯(lián)數(shù)據(jù)自身不具備語義特征,但通過關(guān)聯(lián)數(shù)據(jù)可在數(shù)據(jù)層面建立語義關(guān)聯(lián),為最終實現(xiàn)語義網(wǎng)的遠景目標奠定堅實的基礎(chǔ),以及關(guān)聯(lián)數(shù)據(jù)的類型劃分。
(2)種類2主題主要為關(guān)聯(lián)數(shù)據(jù)的支撐技術(shù)。為基于現(xiàn)有網(wǎng)絡(luò)以最小代價構(gòu)建關(guān)聯(lián)數(shù)據(jù),關(guān)聯(lián)數(shù)據(jù)繼承了互聯(lián)網(wǎng)的兩項支撐技術(shù),即統(tǒng)一資源定位符(URI)和超文本傳輸技術(shù)(HTTP)。關(guān)聯(lián)數(shù)據(jù)還采用萬維網(wǎng)聯(lián)盟推薦的資源描述框架(RDF)對網(wǎng)絡(luò)上的任意類型資源進行組織、描述和交互。
(3)種類3主題主要為關(guān)聯(lián)數(shù)據(jù)構(gòu)建的原則與流程。關(guān)聯(lián)數(shù)據(jù)設(shè)定了一套標準的構(gòu)建的原則與流程。首先,建立了命名機制與調(diào)用機制,即使用URI來命名資源,使用HTTP URI來標識資源。然后,使用RDF提供與當前資源密切相關(guān)的其他有用信息。最后,主動提供相關(guān)資源的HTTP,URI語義鏈接。
(4)種類4主題主要為關(guān)聯(lián)數(shù)據(jù)的語義關(guān)聯(lián)描述模型。由于關(guān)聯(lián)數(shù)據(jù)本身不具備攜帶語義功能,因此,在構(gòu)建和發(fā)布關(guān)聯(lián)數(shù)據(jù)時,只有應(yīng)用被認可和廣泛使用的語義關(guān)聯(lián)描述框架才能更廣泛、深入地支持數(shù)據(jù)間的關(guān)聯(lián)和互操作。
(5)種類5主題主要為關(guān)聯(lián)數(shù)據(jù)構(gòu)建工具。盡管關(guān)聯(lián)數(shù)據(jù)的優(yōu)勢明顯,應(yīng)用前景廣泛,然而目前絕大部分數(shù)據(jù)并不滿足關(guān)聯(lián)數(shù)據(jù)的基本原則,大量數(shù)據(jù)以RDF、Word、CSV和Excel等傳統(tǒng)格式存在,或者存儲在關(guān)系型數(shù)據(jù)庫中。因此,關(guān)聯(lián)數(shù)據(jù)的研究社區(qū)開發(fā)了一系列實用工具,實現(xiàn)不同類型數(shù)據(jù)向關(guān)聯(lián)數(shù)據(jù)的轉(zhuǎn)換,例如:D2R,Drupal等。
(6)種類6主題主要為關(guān)聯(lián)數(shù)據(jù)在實際生活中的運用?,F(xiàn)在大部分實現(xiàn)的關(guān)聯(lián)數(shù)據(jù)都是以圖書館為基礎(chǔ)的,對圖書館資源的建設(shè),模式的構(gòu)造等方面都有很大的作用。在實現(xiàn)Linked Data瀏覽與檢索過程中,還有其他一些細節(jié)問題需要解決,如RDF數(shù)據(jù)的可視化、瀏覽軌跡的跟蹤、海量索引數(shù)據(jù)的存儲與快速檢索、數(shù)據(jù)訪問統(tǒng)計與用法評價、檢索結(jié)果的排名等。
(7)種類7主題主要是構(gòu)造關(guān)聯(lián)數(shù)據(jù)所需的底層架構(gòu)。關(guān)聯(lián)數(shù)據(jù)不是一個新生成的技術(shù),而是在各種技術(shù)和方法體系上形成的,需要深厚的知識底蘊。例如,在詞表構(gòu)建方面,需要熟悉不同的詞表分類;在模型建造的時候需要相關(guān)相似度算法的轉(zhuǎn)換。
(1)從文獻的時間分布來看,關(guān)聯(lián)數(shù)據(jù)領(lǐng)域相關(guān)文獻的發(fā)表量呈逐年上升趨勢,說明該領(lǐng)域逐漸獲得了學界和業(yè)界關(guān)注。隨著知識關(guān)聯(lián)和數(shù)據(jù)密集型科研的深入發(fā)展,對關(guān)聯(lián)數(shù)據(jù)領(lǐng)域的理論研究與實踐探索還會不斷升溫,只不過在不同的階段,研究的熱點主題與方向會有所變化。
(2)從研究熱點變化來看,關(guān)注點經(jīng)歷了從關(guān)聯(lián)數(shù)據(jù)共享平臺構(gòu)建轉(zhuǎn)向數(shù)據(jù)管理與服務(wù)的過程。關(guān)于對關(guān)聯(lián)數(shù)據(jù)的研究,一開始就呈現(xiàn)出理論領(lǐng)先于實踐研究的特征,文獻中占很大比例的是關(guān)于關(guān)聯(lián)數(shù)據(jù)有關(guān)知識的介紹以及相應(yīng)的模型架構(gòu)。在大數(shù)據(jù)層面實施關(guān)聯(lián)數(shù)據(jù)發(fā)布平臺的戰(zhàn)略背景下,關(guān)聯(lián)數(shù)據(jù)研究與實踐注重相關(guān)學科領(lǐng)域共享平臺構(gòu)建和數(shù)據(jù)資源的建設(shè)是必然的選擇,經(jīng)歷了平臺與資源的建設(shè)階段以后,才會逐漸地朝著數(shù)據(jù)服務(wù)的方向發(fā)展。
(3)從開展相關(guān)研究的群體來看,最初主要集中在學術(shù)界,從具體學科(農(nóng)業(yè),醫(yī)學)出發(fā)進行的實踐和理論探索,分析相關(guān)學科領(lǐng)域中關(guān)聯(lián)數(shù)據(jù)平臺的構(gòu)建與數(shù)據(jù)的管理問題。之后,圖書館學界與業(yè)界的人員逐漸參與到關(guān)聯(lián)數(shù)據(jù)的研究與實踐中,主要將關(guān)聯(lián)數(shù)據(jù)作為一種信息資源,從信息資源的組織與管理、信息服務(wù)的角度進行研究。
(4)2011年后,高校和高校圖書館開始加強對關(guān)聯(lián)數(shù)據(jù)管理與服務(wù)的實踐探索和理論研究。但是,從近幾年來總體的文獻分析來看,圖書館關(guān)于數(shù)據(jù)服務(wù)、數(shù)據(jù)監(jiān)護等方面的研究并沒有占據(jù)非常重要的地位,甚至還處于邊緣的狀態(tài)。然而,伴隨著大數(shù)據(jù)時代的到來以及科研創(chuàng)新的數(shù)據(jù)驅(qū)動,關(guān)聯(lián)數(shù)據(jù)管理與服務(wù)將成為圖書館信息服務(wù)的重要增長點,將是高校圖書館為適應(yīng)新的科研學術(shù)生態(tài)系統(tǒng)而做出的延伸和拓展。因此,一方面,今后一定時期內(nèi)圖書情報領(lǐng)域圍繞關(guān)聯(lián)數(shù)據(jù)管理與服務(wù)的文獻將大量增加,如圖書館關(guān)聯(lián)數(shù)據(jù)、面向關(guān)聯(lián)數(shù)據(jù)的語義數(shù)字圖書館的資源建設(shè)研究、基于關(guān)聯(lián)數(shù)據(jù)的圖書館信息聚合研究以及基于關(guān)聯(lián)數(shù)據(jù)的圖書館創(chuàng)新服務(wù)研究等;另一方面,圖書情報領(lǐng)域的研究人員應(yīng)該關(guān)注和把握關(guān)聯(lián)數(shù)據(jù)領(lǐng)域研究熱點的變換,并以此推進圖書館信息服務(wù)的發(fā)展。
數(shù)據(jù)是計算機和互聯(lián)網(wǎng)行業(yè)最基本、最古老概念,進入大數(shù)據(jù)和關(guān)聯(lián)數(shù)據(jù)時代后,數(shù)據(jù)的概念已經(jīng)產(chǎn)生了質(zhì)的飛躍。這里數(shù)據(jù)已發(fā)展為在互聯(lián)網(wǎng)上給予標識、組織、傳輸和管理的基本語義單元,是一條可被計算機識別、管理的知識?;ヂ?lián)網(wǎng)使使全世界的知識連成一體而成為一個“大數(shù)據(jù)”,而關(guān)聯(lián)數(shù)據(jù)技術(shù)使人們能夠通過計算機獲取并處理知識。
關(guān)聯(lián)數(shù)據(jù)的算法研究其實也是一種很重要的方面,因為關(guān)聯(lián)數(shù)據(jù)的目的是數(shù)據(jù)具有語義,但是實際上關(guān)聯(lián)數(shù)據(jù)本身是不具有語義的。要做的就是提供一種相似度算法使計算機能夠搭建關(guān)聯(lián)數(shù)據(jù)的模型框架。在現(xiàn)實生活中,語義相似度計算在很多應(yīng)用中起著重要作用,由于基于關(guān)鍵字檢索方式缺乏語義分析,造成查詢的結(jié)果越來越多,用戶篩選的工作量越來越大等問題,人們開始傾向于使用關(guān)聯(lián)數(shù)據(jù)(RDF數(shù)據(jù)類型)來表示信息。隨著網(wǎng)絡(luò)上的RDF數(shù)據(jù)的不斷增多,RDF實例的語義相似度計算方法的研究也變得越來越重要,對信息的智能化處理和語義挖掘都有著重要的意義。
[1]周志峰.中國大陸科學數(shù)據(jù)領(lǐng)域研究熱點分析——基于知識圖譜[J].情報雜志,2016,(1):81-86.
[2]鮮國建.農(nóng)業(yè)科技多維語義關(guān)聯(lián)數(shù)據(jù)構(gòu)建研究[D].北京:中國農(nóng)業(yè)科學院,2013.
[3]劉煒.關(guān)聯(lián)數(shù)據(jù):概念、技術(shù)及應(yīng)用展望[J].大學圖書館學報,2011,(2):5-12.
[4]沈志宏,張曉林.關(guān)聯(lián)數(shù)據(jù)及其應(yīng)用現(xiàn)狀綜述[J].現(xiàn)代圖書情報技術(shù),2010,(11):1-9.
[5]夏翠娟,劉煒,趙亮,等.關(guān)聯(lián)數(shù)據(jù)發(fā)布技術(shù)及其實現(xiàn)——以Drupal為例[J].中國圖書館學報,2012,(1):49-57.
[6]林海青,樓向英,夏翠娟.圖書館關(guān)聯(lián)數(shù)據(jù):機會與挑戰(zhàn)[J].中國圖書館學報,2012,(1):58-67+112.
[7]沈志宏,張曉林,黎建輝.OpenCSDB:關(guān)聯(lián)數(shù)據(jù)在科學數(shù)據(jù)庫中的應(yīng)用研究[J].中國圖書館學報,2012,(5):17-26.
[8]歐石燕.面向關(guān)聯(lián)數(shù)據(jù)的語義數(shù)字圖書館資源描述與組織框架設(shè)計與實現(xiàn)[J].中國圖書館學報,2012,(6):58-71.
[9]沈志宏,劉筱敏,郭學兵,等.關(guān)聯(lián)數(shù)據(jù)發(fā)布流程與關(guān)鍵問題研究——以科技文獻、科學數(shù)據(jù)發(fā)布為例[J].中國圖書館學報,2013,(2):53-62.
[10]劉煒,夏翠娟,張春景.大數(shù)據(jù)與關(guān)聯(lián)數(shù)據(jù):正在到來的數(shù)據(jù)技術(shù)革命[J].現(xiàn)代圖書情報技術(shù),2013,(4):2-9.
[11]賈君枝,趙潔.DDC關(guān)聯(lián)數(shù)據(jù)實現(xiàn)研究[J].中國圖書館學報,2014,(4):76-82.
[12]李楠.基于關(guān)聯(lián)數(shù)據(jù)的知識發(fā)現(xiàn)研究[D].北京:中國農(nóng)業(yè)科學院,2012.
[13]劉煒,胡小菁,錢國富,等.RDA與關(guān)聯(lián)數(shù)據(jù)[J].中國圖書館學報,2012,(1):34-42.
[14]張春景,劉煒,夏翠娟,等.關(guān)聯(lián)數(shù)據(jù)開放應(yīng)用協(xié)議[J].中國圖書館學報,2012,(1):43-48.
[15]游毅,成全.試論基于關(guān)聯(lián)數(shù)據(jù)的館藏資源聚合模式[J].情報理論與實踐,2013,(1):109-114.
[16]夏翠娟,劉煒.關(guān)聯(lián)數(shù)據(jù)的消費技術(shù)及實現(xiàn)[J].大學圖書館學報,2013,(3):29-37.
Research on Hot Points in the Field of National Correlation Data
WANG Shu-xian
(Huazhong Normal University,Wuhan,Hubei 430070,China)
The paper takes CNKI as data source,uses keywords co-term analysis methods,and gets relevant charts by SPSS20.0 and BICOMB2.0.The study found that linked data fields aremainly around 7main themes,which is good for the clearnessofhotpoints in the field ofcorrelation data,researchersofbooks intelligence can promote the developmentof library information service by grasping and concerning thehotpointsofcorrelation data.
linked data;information resources;modelstructure;semantic association
G359
A
2095-980X(2016)11-0039-03
?來源。①數(shù)據(jù)庫選擇:中國知網(wǎng)的中國學術(shù)期刊
總庫、中國博士學位論文全文數(shù)據(jù)庫、中國優(yōu)秀碩士學位論文全文數(shù)據(jù)庫、中國重要會議論文全文數(shù)據(jù)庫等。②檢索策略:主題詞為“關(guān)聯(lián)數(shù)據(jù)”,“語義網(wǎng)”。③檢索時間:2016
2016-10-16
汪淑嫻(1994-),女,湖北人,碩士研究生,主要研究方向:情報學。