羅琳 楊洋
〔摘 要〕[目的/意義]在圖書情報(bào)領(lǐng)域,本體的研究一直受到眾多學(xué)者所追捧。國(guó)內(nèi)外在圖情領(lǐng)域?qū)Ρ倔w的研究各有側(cè)重,本文為了了解國(guó)內(nèi)外圖書情報(bào)領(lǐng)域本體研究的發(fā)展?fàn)顩r。[方法/過(guò)程]本文選取2012-2017年CNKI中文數(shù)據(jù)庫(kù)、SCI外文數(shù)據(jù)庫(kù)中圖書情報(bào)領(lǐng)域的本體研究論文,對(duì)其進(jìn)行科學(xué)計(jì)量以及可視化表示,對(duì)其研究熱點(diǎn)關(guān)鍵詞和熱門作者進(jìn)行計(jì)量分析,從研究方向、研究程度和研究新穎性3個(gè)方面進(jìn)行對(duì)比分析。[結(jié)果/結(jié)論]得到國(guó)內(nèi)外圖書情報(bào)領(lǐng)域本體研究的對(duì)比分析結(jié)論,從而認(rèn)識(shí)到國(guó)內(nèi)外研究的差異,為后續(xù)研究者提供研究改進(jìn)方向。
〔關(guān)鍵詞〕圖書情報(bào);本體;可視化;Citespace;VOSviwer
DOI:10.3969/j.issn.1008-0821.2018.04.021
〔中圖分類號(hào)〕TP182;G250.252 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821(2018)04-0142-07
〔Abstract〕[Purpose/Meaning]In the field of library and information science,many scholars research on ontology.There is different focus on ontology research in domestic and international.This paper aimed at getting the development situation of ontology of library and information science in domestic and international.[Method/Process]This paper selected some papers about ontology of library and information science from CNKI Chinese database and SCI foreign language database from 2012 to 2017.Using tools to scientific analysis and visual presentation.The paper focused on the hot key words and popular authors.It analyzed there aspects:research direction,research level and research novelty.[Results/Conclusion]It get ontology of Library and information science in domestic and international comparative analysis.Thus it recognized the differences of research in domestic and international.and provided research direction to the follow-up researchers.
〔Key words〕library and information science;ontology;visualization;Citespace;VOSviewer
本體起源于哲學(xué)概念,指的是事物的根本存在[1]。自從20世紀(jì)計(jì)算機(jī)科學(xué)的興起和發(fā)展以來(lái),計(jì)算機(jī)領(lǐng)域就利用本體來(lái)表示某一個(gè)領(lǐng)域的概念和術(shù)語(yǔ),通常是一個(gè)詞匯表。本體是通過(guò)RDF和OWL建立概念的類和屬性,實(shí)例化類的對(duì)象為資源,表示出資源的屬性定義和關(guān)聯(lián),并且利用邏輯推理規(guī)則對(duì)于各個(gè)資源之間的關(guān)系進(jìn)行判斷和描述。這樣,一個(gè)領(lǐng)域的共有的概念構(gòu)成了知識(shí),從而形成了一個(gè)知識(shí)網(wǎng)絡(luò),可以被更好地共享和復(fù)用。在國(guó)內(nèi)外圖書情報(bào)領(lǐng)域當(dāng)中,有相當(dāng)一部分學(xué)者和研究機(jī)構(gòu)在進(jìn)行本體為主題的相關(guān)研究,圖書情報(bào)領(lǐng)域是本體研究的重要學(xué)科領(lǐng)域。
在2010年之后,隨著互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展,國(guó)內(nèi)外的圖情領(lǐng)域在本體研究的熱點(diǎn)主題上具有鮮明的時(shí)代特征。但是由于國(guó)內(nèi)外的學(xué)科發(fā)展水平不一致,同時(shí)受到本國(guó)科研發(fā)展大環(huán)境的影響,導(dǎo)致國(guó)內(nèi)外在圖書情報(bào)領(lǐng)域的本體研究當(dāng)中的側(cè)重點(diǎn)不同。本文旨在做國(guó)內(nèi)外圖書情報(bào)領(lǐng)域本體研究熱點(diǎn)的分析對(duì)比研究。本文選取2012-2017年之間,國(guó)外SCI數(shù)據(jù)庫(kù)和國(guó)內(nèi)CNKI數(shù)據(jù)庫(kù)內(nèi)相關(guān)文獻(xiàn),利用信息計(jì)量學(xué)的相關(guān)方法,從論文的發(fā)布數(shù)量,關(guān)鍵詞分布以及熱門作者這幾個(gè)方向進(jìn)行統(tǒng)計(jì)分析。數(shù)據(jù)搜集歸納完畢之后,利用社會(huì)網(wǎng)絡(luò)分析工具VOSviwer和陳超美博士的CitespaceⅡ來(lái)進(jìn)行知識(shí)圖譜的繪制,從而以可視化的方式來(lái)對(duì)國(guó)內(nèi)外圖書情報(bào)領(lǐng)域本體的研究熱點(diǎn)進(jìn)行分析比較,為我國(guó)相關(guān)研究者提供國(guó)內(nèi)外數(shù)據(jù)參考。
1 數(shù)據(jù)來(lái)源與獲取
國(guó)內(nèi)文獻(xiàn)選自CNKI,主題詞為“本體”,分類選擇期刊文獻(xiàn),文獻(xiàn)分類目錄限定在“圖書情報(bào)與數(shù)字圖書館”,發(fā)表時(shí)間限定在2012-2017年,來(lái)源類別勾選核心期刊和CSSCI期刊,檢索時(shí)間為2017年9月27日,經(jīng)過(guò)文獻(xiàn)的篩選以及剔除無(wú)效文獻(xiàn)后,篩選出有效文獻(xiàn)482條。
經(jīng)過(guò)篩選后得出,2012-2017年在國(guó)內(nèi)核心期刊上有關(guān)于圖書情報(bào)領(lǐng)域本體研究的發(fā)文數(shù)量分別為2012年91篇、2013年99篇、2014年102篇、2015年110篇、2016年95篇、2017年78篇。如圖1所示,2012-2015年呈逐年上升的趨勢(shì),2016年和2017年有關(guān)圖書情報(bào)領(lǐng)域本體的研究文獻(xiàn)又呈下降的趨勢(shì)。
根據(jù)“馬太效應(yīng)”,發(fā)現(xiàn)圖書情報(bào)領(lǐng)域本體的相關(guān)文獻(xiàn)在《圖書情報(bào)工作》有53篇、《情報(bào)科學(xué)》上有49篇、《情報(bào)理論與實(shí)踐》38篇、《圖書館學(xué)研究》34篇、《情報(bào)雜志》33篇等,大部分都集中在這些影響因子高的期刊上。如表1所示,筆者從CNKI上獲取近兩年來(lái)的圖書情報(bào)領(lǐng)域的期刊復(fù)合影響因子和綜合影響因子,發(fā)現(xiàn)所獲取的圖書情報(bào)領(lǐng)域本體研究的論文集中與本領(lǐng)域期刊影響因子排名大抵一致。
表2是CNKI中所統(tǒng)計(jì)的圖書情報(bào)領(lǐng)域發(fā)文機(jī)構(gòu)的發(fā)文量,從發(fā)文的機(jī)構(gòu)來(lái)看,以武漢大學(xué)、吉林大學(xué)和南京大學(xué)的發(fā)文量最多,居于前3的位置。這與這3所大學(xué)圖情專業(yè)的教學(xué)實(shí)力相當(dāng)。這說(shuō)明在圖書情報(bào)領(lǐng)域當(dāng)中的本體研究,有著與圖書情報(bào)領(lǐng)域其他研究熱點(diǎn)的聚集效應(yīng),即研究圖書情報(bào)領(lǐng)域的各熱點(diǎn)之間互相關(guān)聯(lián)。
國(guó)外文獻(xiàn)選自SCI,主題詞為“Ontology”,分類選擇“Library and Information Science”,發(fā)表時(shí)間限定在2012-2017年,文檔類型選擇“Article”檢索時(shí)間為2017年9月27日,經(jīng)過(guò)文獻(xiàn)的篩選以及剔除無(wú)效文獻(xiàn)后,篩選出有效文獻(xiàn)402條。
圖2是2012-2017年SCI上圖書情報(bào)本體領(lǐng)域的發(fā)文量統(tǒng)計(jì)。從圖2中可知,2012年的發(fā)文量為54篇,2013年的發(fā)文量為57篇,2014年的發(fā)文量為62篇,2015年的發(fā)文量為78篇,2016年的發(fā)文量為94篇,2017年的發(fā)文量為57篇。從趨勢(shì)上來(lái)講,2012-2016年呈逐年上升趨勢(shì),2016年達(dá)到一個(gè)峰值,2017年的發(fā)文量減少。
表3是SCI中所統(tǒng)計(jì)的圖書情報(bào)領(lǐng)域發(fā)文機(jī)構(gòu)的發(fā)文量,從發(fā)文的機(jī)構(gòu)來(lái)看,在本領(lǐng)域的研究有很明顯的國(guó)家偏向特點(diǎn)。主要的發(fā)文機(jī)構(gòu)集中在美國(guó)、印度、中國(guó)、英國(guó)和西班牙。中國(guó)的機(jī)構(gòu)是武漢大學(xué),因?yàn)楸疚氖且鰢?guó)內(nèi)外的研究對(duì)比,因此將中國(guó)的機(jī)構(gòu)在SCI上發(fā)文量剔除,再次經(jīng)過(guò)篩選后的文獻(xiàn)量為394篇。
2 國(guó)內(nèi)圖書情報(bào)領(lǐng)域本體研究熱點(diǎn)
關(guān)鍵詞反映了一個(gè)行業(yè)在一段時(shí)間內(nèi)的研究方向和熱點(diǎn),關(guān)鍵詞的聚類能夠集中的反映熱門內(nèi)容,作者是一個(gè)學(xué)科領(lǐng)域發(fā)展的中堅(jiān)力量,熱門作者的研究方向往往反映了一個(gè)領(lǐng)域的研究熱點(diǎn)。本文利用可視化軟件對(duì)國(guó)內(nèi)高頻的熱點(diǎn)關(guān)鍵詞進(jìn)行可視化分析,對(duì)熱門的關(guān)鍵詞類別進(jìn)行聚類,并給出研究熱點(diǎn)的代表性論文以及研究?jī)?nèi)容。同時(shí),對(duì)作者的發(fā)文量以及H指數(shù)進(jìn)行統(tǒng)計(jì)。
2.1 高頻熱點(diǎn)關(guān)鍵詞分析
將CNKI下載的文獻(xiàn)數(shù)據(jù)導(dǎo)入到Citespace軟件中,年份選擇2012-2017年,節(jié)點(diǎn)選擇為關(guān)鍵詞。閾值設(shè)置中,被引頻次c(citation)、兩篇文獻(xiàn)的共被引頻次cc(cocitation)和共被引系數(shù)ccv(cosinecoefficient)3個(gè)層次分別設(shè)置為(2,2,20)、(4,2,20)、(4,3,20)。運(yùn)行之后得到節(jié)點(diǎn)56個(gè),關(guān)聯(lián)109個(gè),聚類之后得到圖3。
根據(jù)聚類圖,我們得出排名前10的關(guān)鍵詞,如表4所示,因?yàn)橛谐霈F(xiàn)次數(shù)相同的關(guān)鍵詞出現(xiàn),因此在表4中所列出的關(guān)鍵詞根據(jù)一共有14個(gè)。除去本體這個(gè)核心概念,可以得到關(guān)聯(lián)數(shù)據(jù)、領(lǐng)域本體、數(shù)字圖書館、本體構(gòu)建等為2012-2017年期間圖書情報(bào)領(lǐng)域本體研究的熱點(diǎn)。從研究主題分類來(lái)看,有對(duì)本體自身相關(guān)的研究,其中有領(lǐng)域本體、本體集成、本體構(gòu)建等,具體可以從以下幾個(gè)方面來(lái)看:
1)在圖書情報(bào)領(lǐng)域的研究熱點(diǎn)中進(jìn)行本體構(gòu)建。本體作為一種工具,被用來(lái)描述相關(guān)領(lǐng)域詞匯和術(shù)語(yǔ)的關(guān)系,學(xué)者們構(gòu)建圖書情報(bào)領(lǐng)域中一些熱點(diǎn)研究問(wèn)題的本體,是為了提供該研究領(lǐng)域的術(shù)語(yǔ)規(guī)范和概念框架。比如在圖書情報(bào)中的信息檢索方向,為了提高搜索的查全率和查準(zhǔn)率,有學(xué)者建立基于推理引擎的JESS領(lǐng)域本體并建立系統(tǒng)進(jìn)行檢索,對(duì)相關(guān)的概念和術(shù)語(yǔ)進(jìn)行抽取[2];有的研究者對(duì)模糊Petri網(wǎng)進(jìn)行知識(shí)元語(yǔ)義集成,為了減少知識(shí)元的重復(fù),構(gòu)建領(lǐng)域知識(shí)元本體,從而實(shí)現(xiàn)知識(shí)元的集成[3];還有學(xué)者在特定的領(lǐng)域建立領(lǐng)域本體,中國(guó)運(yùn)載火箭技術(shù)研究院研究發(fā)展中心的研究員旨在用本體思想建立軍工企業(yè)的知識(shí)管理系統(tǒng),并且提出知識(shí)和用戶模型的表示方法[4]。
2)除了相關(guān)知識(shí)本體的構(gòu)建,近年來(lái)國(guó)內(nèi)學(xué)者對(duì)知識(shí)融合、知識(shí)表示、知識(shí)抽取、知識(shí)轉(zhuǎn)換這些有關(guān)知識(shí)領(lǐng)域的一些概念進(jìn)行了定義和闡釋[5],在知識(shí)系統(tǒng)的創(chuàng)建上也有所建樹。比如李智杰等指出知識(shí)組織新的突破點(diǎn)——知識(shí)組織系統(tǒng)自適應(yīng)構(gòu)建的概念[6],并舉出幾個(gè)例子對(duì)知識(shí)組織系統(tǒng)的構(gòu)建技術(shù)進(jìn)行總結(jié);有對(duì)于知識(shí)庫(kù)的構(gòu)建,翟東升等以云計(jì)算技術(shù)為支撐,構(gòu)建基于圖形數(shù)據(jù)庫(kù)的專利語(yǔ)義知識(shí)庫(kù),結(jié)果顯示,這種基于云計(jì)算的知識(shí)庫(kù)查詢是普通查詢速度的5.35倍[7]。
3)本體是語(yǔ)義網(wǎng)相關(guān)技術(shù)中對(duì)資源描述的一個(gè)重要形式,因此在圖書情報(bào)領(lǐng)域本體的研究中,也有一些本體與語(yǔ)義網(wǎng)技術(shù)相結(jié)合的研究,近年來(lái),有利用語(yǔ)義相關(guān)技術(shù)進(jìn)行有關(guān)技術(shù)的改進(jìn)以及語(yǔ)義標(biāo)注的應(yīng)用。為了實(shí)現(xiàn)數(shù)據(jù)集之間的語(yǔ)義互聯(lián)并且促進(jìn)領(lǐng)域隱性知識(shí)的發(fā)現(xiàn),牟冬梅等對(duì)語(yǔ)義方面對(duì)數(shù)字資源進(jìn)行語(yǔ)義聚合[8];王曉光等在《敘事型圖像語(yǔ)義標(biāo)注模型研究》中以敦煌壁畫為對(duì)象,設(shè)計(jì)了一個(gè)關(guān)于敘事型圖像語(yǔ)義標(biāo)注的本體模型,針對(duì)該敦煌壁畫進(jìn)行語(yǔ)義標(biāo)注[9];馮佳等通過(guò)領(lǐng)域本體的概念進(jìn)行映射,基于語(yǔ)義距離在矩陣和聚類效果維度上對(duì)共詞方法進(jìn)行改進(jìn),結(jié)果是在矩陣維度和聚類效果上都有所提升[10]。
4)關(guān)聯(lián)數(shù)據(jù)是一種成熟的資源描述方式,近五年來(lái),圖書情報(bào)領(lǐng)域的學(xué)者們也在將本體與關(guān)聯(lián)數(shù)據(jù)進(jìn)一步結(jié)合,對(duì)相關(guān)資源進(jìn)行描述和推薦。歐石燕等提出一個(gè)面向關(guān)聯(lián)數(shù)據(jù)數(shù)字圖書館資源描述框架,作者是構(gòu)建本體層和關(guān)聯(lián)數(shù)據(jù)層對(duì)圖情領(lǐng)域的數(shù)據(jù)進(jìn)行描述[11];鄧盼盼等提出將網(wǎng)絡(luò)敘詞表的發(fā)展為關(guān)聯(lián)數(shù)據(jù)的發(fā)布[12];田野等提出關(guān)聯(lián)數(shù)據(jù)驅(qū)動(dòng)的數(shù)字圖書推薦模型,是利用本體和關(guān)聯(lián)數(shù)據(jù)相關(guān)數(shù)據(jù)對(duì)讀者提供個(gè)性化的圖書推薦[13]。
吳志祥等在《2007-2011年我國(guó)圖書情報(bào)領(lǐng)域本體研究論文計(jì)量分析》中數(shù)據(jù)分析顯示[11],在2007-2011年終本體領(lǐng)域的關(guān)鍵詞排名前3的為領(lǐng)域本體,語(yǔ)義網(wǎng)和數(shù)字圖書館。從此可知,經(jīng)過(guò)近十年的發(fā)展,領(lǐng)域本體和數(shù)字圖書館在圖書情報(bào)領(lǐng)域的本體研究當(dāng)中仍然為重點(diǎn)。
2.2 熱門作者影響力分析
國(guó)內(nèi)圖情領(lǐng)域的研究中堅(jiān)力量主要集中在高校,較有影響力的高校有武漢大學(xué)、北京大學(xué)、南京大學(xué)、吉林大學(xué)、華中師范大學(xué)等。一般情況下,圖情領(lǐng)域的熱點(diǎn)主題研究作者都是來(lái)自于這些高校的老師或者碩博研究生。這些作者的研究方向以及研究合作關(guān)系往往反映了該主題的發(fā)展方向。因此,有必要對(duì)于國(guó)內(nèi)圖情領(lǐng)域中對(duì)于本體研究的作者的發(fā)文量、H指數(shù)等指標(biāo)做統(tǒng)計(jì)。H指數(shù)是一個(gè)作者的H篇文章被引用了H次的一個(gè)統(tǒng)計(jì)量,可以充分反映該作者的研究水平和論文影響力。由于做圖書情報(bào)領(lǐng)域本體的學(xué)者較為分散,因此本文就只截取了核心作者群體,國(guó)內(nèi)圖書情報(bào)領(lǐng)域在本體研究上形成了以武漢大學(xué)信息管理學(xué)院的邱均平教授,邱均平教授與其團(tuán)隊(duì)主要是圖書情報(bào)領(lǐng)域本體進(jìn)行科學(xué)計(jì)量研究,掌握其發(fā)展動(dòng)向。還有吉林大學(xué)管理學(xué)院教授畢強(qiáng)為核心的作者群體,畢強(qiáng)教授與其團(tuán)隊(duì)主要是做語(yǔ)義網(wǎng)的相關(guān)以及知識(shí)組織相關(guān)研究。
表5列出了高發(fā)文作者的發(fā)文量與作者的H指數(shù),可以看出邱均平教授、畢強(qiáng)教授、夏翠娟教授和司莉教授的H指數(shù)較高并且在本領(lǐng)域的發(fā)文量也排名靠前。這說(shuō)明了圖書情報(bào)領(lǐng)域本體的研究有著研究水平較強(qiáng)的科研人員,并且在做研究時(shí)有較強(qiáng)的團(tuán)隊(duì)合作性。
3 國(guó)外圖書情報(bào)領(lǐng)域本體研究熱點(diǎn)
3.1 高頻熱點(diǎn)關(guān)鍵詞分析
國(guó)外的圖書情報(bào)領(lǐng)域本體研究熱點(diǎn)我們將從SCI上下載的文獻(xiàn)數(shù)據(jù)導(dǎo)入到可視化工具VOSviewer中創(chuàng)建圖譜,選擇Binary Counting方法,最小共現(xiàn)主題選擇10個(gè)。軟件統(tǒng)計(jì)出有227個(gè)主題,為了增強(qiáng)圖譜的可讀性,只選擇前60%相關(guān)性高的主題來(lái)進(jìn)行可視化,因此一共選擇了136個(gè)主題詞。
如圖5、圖6分別是國(guó)外圖書情報(bào)領(lǐng)域研究熱點(diǎn)的疊加圖和密度圖。從圖5中可由不同顏色得知該主題詞匯在2012-2017年中由哪一年最先出現(xiàn)??芍狡t的聚類點(diǎn)越新,其中“Linked Data”,“Social Media”等都是近幾年在國(guó)外圖書情報(bào)領(lǐng)域中出現(xiàn)的熱點(diǎn)。這些主題詞匯之間的連線表示詞匯之間的共現(xiàn)性,連線越多的詞匯表示在本領(lǐng)域中與其他詞匯的共現(xiàn)性越高,也就是本領(lǐng)域詞匯中心性最高的詞。圖6的密度圖是模仿城市熱島效應(yīng),中心詞匯就如同城市CBD聚集在圖譜中心,其共現(xiàn)詞匯就如同城市的街道以及市集一般聚集在中心詞匯周圍。
對(duì)關(guān)鍵詞頻進(jìn)行統(tǒng)計(jì)之后,除去“Ontology”本體這個(gè)主題詞匯。筆者發(fā)現(xiàn)國(guó)外對(duì)語(yǔ)義網(wǎng)的研究較多,與此同時(shí)將圖情領(lǐng)域的本體研究與系統(tǒng)和網(wǎng)絡(luò)結(jié)合起來(lái),也有信息檢索和知識(shí)相關(guān)的研究,最后還有本體建模這方面的研究。
從國(guó)外圖書情報(bào)領(lǐng)域本體的高頻關(guān)鍵詞來(lái)看,除去本體這個(gè)核心詞匯。國(guó)外的關(guān)鍵詞更加的抽象和概念化,并且與計(jì)算機(jī)領(lǐng)域的結(jié)合性更強(qiáng)。這與國(guó)外研究偏重實(shí)用與技術(shù)有關(guān)。國(guó)外高頻關(guān)鍵詞可分為本體本身的概念和語(yǔ)義網(wǎng)的研究,信息系統(tǒng)、檢索,知識(shí)領(lǐng)域的研究還有有關(guān)本體的建模等。例如:
1)有關(guān)本體概念和建模的一些研究。Chakrabarty建立數(shù)字圖書館的基于個(gè)人信息的推薦本體,本文提出了一個(gè)需要人工干預(yù)新的上下文對(duì)齊方法,它可以將多個(gè)本體映射到生成用戶動(dòng)態(tài)利益,其目標(biāo)是設(shè)計(jì)和開發(fā)一個(gè)本體一致性模型,提供了更多的好處,使用它的在數(shù)字圖書館資源共享和搜索更具有優(yōu)先級(jí)[15]。Sayogo建立基于檢查過(guò)程的產(chǎn)品信息的本體模型,這篇文章介紹了本體的認(rèn)證和檢測(cè)開發(fā),以支持產(chǎn)品的智能信息披露,由此產(chǎn)生的本體支持信息集成和標(biāo)準(zhǔn)化,從而通過(guò)綜合不同數(shù)據(jù)源的信息來(lái)支持知識(shí)的發(fā)現(xiàn)和共享[16]。
2)在不同的領(lǐng)域中建立信息檢索系統(tǒng)。Lee建立用戶的音樂信息檢索系統(tǒng),作者調(diào)查了一般音樂用戶的需求和行為是否隨著時(shí)間的推移發(fā)生了顯著的變化,提出了個(gè)人音樂收藏的訪問(wèn)和使用的轉(zhuǎn)變,本體提供豐富的上下文信息的需求等一些新興主題[17]。Lhadj建立基于概念的語(yǔ)言模型來(lái)對(duì)信息檢索的準(zhǔn)確性進(jìn)行增強(qiáng)本文中,作者使用基于概念的語(yǔ)言建模方法來(lái)解決多義和同義詞不匹配問(wèn)題,該方法將來(lái)自外部資源的本體論概念與文檔收集中經(jīng)常發(fā)現(xiàn)的搭配聯(lián)系起來(lái),作者的模型在一個(gè)基于單詞的模型和Markov隨機(jī)場(chǎng)模型上取得了顯著的改進(jìn)[18]。
3)國(guó)外學(xué)者使用本體相關(guān)技術(shù)建立不同領(lǐng)域中的KOS,Lauruhn在他和團(tuán)隊(duì)的文章當(dāng)中對(duì)現(xiàn)在的知識(shí)組織系統(tǒng)進(jìn)行了改進(jìn),做成一個(gè)自動(dòng)抽取的KOS[19]。Scharnhorst基于Web的數(shù)據(jù)集合與數(shù)據(jù)和可視化分析相結(jié)合建立有關(guān)UDC的知識(shí)地圖[20]。Ko建立基于概念的術(shù)語(yǔ)本體,構(gòu)建基于結(jié)構(gòu)定義的術(shù)語(yǔ)本體系統(tǒng)和語(yǔ)義搜索評(píng)價(jià),最后也做成了一個(gè)KOS[21]。Alajmi指出知識(shí)組織在教育領(lǐng)域的應(yīng)用,本研究定量分析了KO課程描述,以確定這些LIS課程的課程模塊[22]。Marcondes研究了在生物醫(yī)學(xué)領(lǐng)域中有效的展示知識(shí)模型,本文作者提出了一種生物醫(yī)學(xué)的學(xué)術(shù)電子文章的語(yǔ)義模型,可以克服傳統(tǒng)平面記錄格式的局限性[23]。
4)語(yǔ)義網(wǎng)概念的一些應(yīng)用以及語(yǔ)義模型和系統(tǒng)的創(chuàng)建。Bertola在文中使用語(yǔ)義和社會(huì)網(wǎng)絡(luò)到自然語(yǔ)言處理等一系列學(xué)科的方法和工具,提供了創(chuàng)建語(yǔ)義社會(huì)空間的構(gòu)建模塊,以根據(jù)情感本體論來(lái)組織藝術(shù)作品[24]。Calaresu在文中探索和概念化語(yǔ)義網(wǎng),用來(lái)作為一個(gè)在圖書館和信息科學(xué)文獻(xiàn)中被廣泛提及的術(shù)語(yǔ),他們對(duì)語(yǔ)義網(wǎng)的概念采用一種解釋性、歷史和概念性的方法以及它提出了一個(gè)簡(jiǎn)化的概念模型[25]。Hsu提出了一種基于MIF的語(yǔ)義——角色映射智能系統(tǒng),由基于xml的文檔存儲(chǔ)庫(kù)、搜索引擎、推理引擎和轉(zhuǎn)換引擎組成,它提供不同的方法來(lái)呈現(xiàn)不同的元數(shù)據(jù)和知識(shí)表示[26]。
3.2 熱門作者影響力分析
表6是SCI中2012-2017年圖書情報(bào)領(lǐng)域本體研究的熱門作者,其中來(lái)自以色列Bar-Ilan大學(xué)的Zhitomirsky-Geffet M教授的發(fā)文量為7篇,他主要是做網(wǎng)絡(luò)用戶的信息行為的本體研究;來(lái)自巴西Fed Fluminense大學(xué)的Marcondes CH教授的發(fā)文量為5篇,她主要是做語(yǔ)義模型相關(guān)研究。根據(jù)本文第2章所做國(guó)外機(jī)構(gòu)發(fā)文量統(tǒng)計(jì),本領(lǐng)域主要發(fā)文機(jī)構(gòu)集中在美國(guó),歐洲等國(guó),但是下表7中前兩位發(fā)文量最高的兩位作者Zhitomirsky-Geffet和Marcondes分別來(lái)自以色列和巴西,這說(shuō)明國(guó)外的高產(chǎn)作者不一定來(lái)自高產(chǎn)機(jī)構(gòu),高產(chǎn)機(jī)構(gòu)中可能有多名研究學(xué)者在研究本方向,因此有著機(jī)構(gòu)高產(chǎn),作者分散的現(xiàn)象。
4 國(guó)內(nèi)外圖書情報(bào)領(lǐng)域本體研究熱點(diǎn)比較
通過(guò)對(duì)國(guó)內(nèi)外圖書情報(bào)領(lǐng)域本體的熱點(diǎn)關(guān)鍵詞以及熱門作者的可視化分析,發(fā)現(xiàn)國(guó)內(nèi)外在此領(lǐng)域的研究還是有一些差異。下面筆者將從研究方向、新穎性和未來(lái)發(fā)展趨勢(shì)來(lái)對(duì)比國(guó)內(nèi)外的差異。
1)從研究方向,國(guó)內(nèi)集中在圖書情報(bào)領(lǐng)域本體的科學(xué)計(jì)量以及知識(shí)管理方面,形成了以武漢大學(xué)的邱均平教授和吉林大學(xué)的畢強(qiáng)教授為首的科研團(tuán)隊(duì)。國(guó)外集中在語(yǔ)義網(wǎng)研究以及信息檢索方面,總的來(lái)說(shuō),國(guó)外的研究更加偏向于本體本身的技術(shù)層面,以及用本體來(lái)進(jìn)行相關(guān)的應(yīng)用實(shí)踐,而國(guó)內(nèi)的研究則偏重于以本體為研究背景來(lái)做研究,更多地運(yùn)用在理論的研究層面。
2)從發(fā)展程度上來(lái)看,國(guó)外的Library and Information Science學(xué)科領(lǐng)域在20世紀(jì)90年代,當(dāng)人工智能專家Neches將本體的概念引入到計(jì)算機(jī)科學(xué)領(lǐng)域之后,就已經(jīng)開始了相關(guān)的研究,在近幾年,國(guó)外的圖情領(lǐng)域本體發(fā)展越來(lái)越向技術(shù)層面發(fā)展,特別是這段時(shí)間以來(lái)人工智能和深度學(xué)習(xí)的發(fā)展。國(guó)內(nèi)的發(fā)展從總體上來(lái)說(shuō),21世紀(jì)初期為圖書情報(bào)領(lǐng)域本體研究的萌芽與較快發(fā)展時(shí)期,2000-2005年為圖情領(lǐng)域本體發(fā)展的萌芽期,主要研究?jī)?nèi)容為本體的基本概念與領(lǐng)域本體的構(gòu)建;2006-2012年為圖情領(lǐng)域本體研究的較快發(fā)展時(shí)期,這時(shí)期的主要研究?jī)?nèi)容是本體在知識(shí)管理中的應(yīng)用以及本體建模。過(guò)近十年的發(fā)展,2012年至2017年,這5年來(lái),圖情領(lǐng)域的本體研究的研究熱點(diǎn)還是領(lǐng)域本體和數(shù)字圖書館,在知識(shí)領(lǐng)域和關(guān)聯(lián)數(shù)據(jù)方面科研的成果也較多。國(guó)外的研究在近五年來(lái)說(shuō),在信息檢索與信息系統(tǒng)的研究較多,知識(shí)領(lǐng)域的建模也應(yīng)用在其他領(lǐng)域,對(duì)語(yǔ)義網(wǎng)技術(shù)的概念提出了更加符合當(dāng)今技術(shù)發(fā)展現(xiàn)狀的解釋。國(guó)外的研究從總體水平上來(lái)說(shuō),國(guó)外在圖書情報(bào)領(lǐng)域本體的發(fā)展程度比國(guó)內(nèi)要先進(jìn)。
3)從研究?jī)?nèi)容新穎性上來(lái)看,國(guó)內(nèi)的研究基本上還是本體研究的基礎(chǔ)內(nèi)容,比如本體構(gòu)建,語(yǔ)義檢索,知識(shí)管理等,有一點(diǎn)與實(shí)際生活相偏離。國(guó)外在圖書情報(bào)領(lǐng)域?qū)τ诒倔w的研究已經(jīng)與用戶信息行為,社交網(wǎng)絡(luò)等時(shí)下流行的研究元素相結(jié)合,在研究?jī)?nèi)容的新穎性上優(yōu)于國(guó)內(nèi)的基礎(chǔ)研究。
5 結(jié) 論
本文是對(duì)2012-2017年國(guó)內(nèi)外圖書情報(bào)領(lǐng)域本體研究的熱點(diǎn)進(jìn)行分析比較,對(duì)國(guó)內(nèi)外的發(fā)文量進(jìn)行統(tǒng)計(jì),國(guó)內(nèi)的統(tǒng)計(jì)了情報(bào)學(xué)領(lǐng)域的主要期刊的影響因子,國(guó)外的統(tǒng)計(jì)了機(jī)構(gòu)發(fā)文量。利用可視化軟件Citespace和VOSviewer對(duì)國(guó)內(nèi)外熱點(diǎn)關(guān)鍵詞進(jìn)行了可視化分析。對(duì)高發(fā)文的作者進(jìn)行了發(fā)文量統(tǒng)計(jì)和h指數(shù)的統(tǒng)計(jì)。并且發(fā)現(xiàn)了在圖書情報(bào)領(lǐng)域本體的研究上高發(fā)文作者與高發(fā)文機(jī)構(gòu)之間沒有必然聯(lián)系,但是高發(fā)文作者的研究方向往往是研究熱點(diǎn)。
在圖書情報(bào)領(lǐng)域本體研究的熱點(diǎn)對(duì)比上,在研究方向上,國(guó)內(nèi)偏重于本體的理論研究,國(guó)外側(cè)重于實(shí)踐與應(yīng)用。在發(fā)展程度上,國(guó)外發(fā)展早,研究?jī)?nèi)容比國(guó)內(nèi)更先進(jìn)。在研究問(wèn)題的新穎性上來(lái)看,國(guó)外的研究熱點(diǎn)更加與時(shí)俱進(jìn)。
綜上所述,國(guó)內(nèi)在圖書情報(bào)領(lǐng)域的本體研究雖然有優(yōu)秀的高校和科研機(jī)構(gòu)以及高水平的研究人員在做貢獻(xiàn),但是因?yàn)槲覈?guó)在此領(lǐng)域起步較晚,研究方向偏理論,在研究的深度和廣度上較國(guó)外的研究來(lái)說(shuō)較為欠缺。國(guó)內(nèi)的本體各方向的領(lǐng)域較為分散,本體、語(yǔ)義網(wǎng)、知識(shí)等關(guān)鍵詞放在一起研究的較少。而國(guó)外的研究則將諸多概念融合,從而形成新的理論和實(shí)踐研究?jī)?nèi)容。國(guó)外圖情領(lǐng)域的本體研究還涉及各個(gè)領(lǐng)域,如醫(yī)學(xué),化學(xué),音美等方面,更加地注重本體的構(gòu)建具體能做什么事情,而不只是局限于理論研究。今后我國(guó)研究者可注重將理論與實(shí)踐相結(jié)合,將本體研究深入到我國(guó)的醫(yī)藥學(xué),生物,化學(xué)或者工農(nóng)業(yè)領(lǐng)域當(dāng)中。
參考文獻(xiàn)
[1]Grigoris A,Paul G et.語(yǔ)義網(wǎng)基礎(chǔ)教程[M].北京:機(jī)械工業(yè)出版社,2014:5-6.
[2]夏立新,段菲菲,翟?shī)檴?基于本體的JESS推理實(shí)證研究[J].情報(bào)科學(xué),2017,(5):106-110.
[3]王靜,劉成山,秦春秀.一種基于模糊Petri網(wǎng)的知識(shí)元語(yǔ)義集成方法[J].情報(bào)理論與實(shí)踐,2017,(9):140-144.
[4]賈倩,王彥靜,楊玉堃.基于本體的統(tǒng)一知識(shí)模型表達(dá)及應(yīng)用[J].情報(bào)理論與實(shí)踐,2017,(9):125-128.
[5]劉曉娟,李廣建,化柏林.知識(shí)融合:概念辨析與界說(shuō)[J].圖書情報(bào)工作,2016,(13):13-19.
[6]李智杰,曾文,喬曉東.知識(shí)組織系統(tǒng)構(gòu)建技術(shù)研究[J].情報(bào)理論與實(shí)踐,2017,(1):115-120.
[7]翟東升,劉鶴,張杰,等.基于圖形數(shù)據(jù)庫(kù)的專利語(yǔ)義知識(shí)庫(kù)構(gòu)建技術(shù)研究[J].現(xiàn)代圖書情報(bào)技術(shù),2016,(12):66-75.
[8]牟冬梅,王萍,張艷俠,等.VIVO在信息資源聚合中的應(yīng)用研究[J].情報(bào)科學(xué),2017,(3):57-62.
[9]徐雷,王曉光.敘事型圖像語(yǔ)義標(biāo)注模型研究[J].中國(guó)圖書館學(xué)報(bào),2017,(5):70-83.
[10]馮佳,張?jiān)魄?基于LDA和本體的科學(xué)前沿識(shí)別與分析方法研究[J].情報(bào)理論與實(shí)踐,2017,(8):49-54.
[11]歐石燕,唐振貴.面向圖書館關(guān)聯(lián)數(shù)據(jù)的自動(dòng)問(wèn)答技術(shù)研究[J].中國(guó)圖書館學(xué)報(bào),2015,(6):44-60.
[12]鄧盼盼,常春.本體模式下網(wǎng)絡(luò)敘詞表的發(fā)展[J].情報(bào)理論與實(shí)踐,2013,(4):99-101.
[13]田野,祝忠明.關(guān)聯(lián)數(shù)據(jù)驅(qū)動(dòng)的數(shù)字圖書推薦模型[J].圖書情報(bào)工作,2013,(17):34-38.
[14]吳志祥,王昊,姜霖.2007-2011年我國(guó)圖書情報(bào)領(lǐng)域本體研究論文計(jì)量分析[J].情報(bào)科學(xué),2015,(10):66-71.
[15]Chakrabarty A,Roy S.Personalised Information Recommender Using Framework for Ontology Alignment Among Digital Libraries[J].Desidoc Journal of Library & Information Technology,2016,(36):199-204.
[16]Sayogo DS,Ran WJ.Ontological Modeling of Certification and Inspection Process to Support Smart Disclosure of Product Information[J].International Journal of Public Administration in the Digital Age,2016,(3):86-108.
[17]Lee JH,Cho H.Users Music Information Needs and Behaviors:Design Implications for Music Information Retrieval Systems[J].Journal of the Association for Information Science and Technology,2016,(67):1301-1330.
[18]Lhadj LS,Boughanem M.Enhancing Information Retrieval Through Concept-Based Language Modeling and Semantic Smoothing[J].Journal of the Association for Information Science and Technology,2016,(67):2909-2927.
[19]Lauruhn M,Groth P.Sources of Change for Modern Knowledge Organization Systems[J].Knowledge Organization,2016,(43):622-629.
[20]Scharnhorst A,Smiraglia RP.Knowledge Maps of the UDC:Uses and Use Cases[J].Knowledge Organization,2016,(43):641-654.
[21]Ko YM,Song MS.Construction of the Structural Definition-Based Terminology Ontology System and Semantic Search Evaluation[J].Library Hi Tech,2016,(34):705-732.
[22]Alajmi B,Rehman SU.Knowledge Organization Trends in Library and Information Education:Assessment and Analysis[J].Education for Information,2016,(32):411-420.
[23]Marcondes CH,da Costa LC.A Model to Represent and Process Scientific Knowledge in Biomedical Articles with Semantic Web Technologies[J].Knowledge Organization,2016,(43):86-101.
[24]Bertola F,Patti,V.Ontology-Based Affective Models to Organize Artworks in the Social Semantic Web[J].Information Processing & Management,2016,(52):139-162.
[25]Calaresu M,Shiri A.Understanding Semantic Web:A Conceptual Model[J].Library Review,2015,(64):82-100.
[26]Hsu IC,Lee JY.Integrating Semantic Web Technologies with XML Schema Using Role-Mapping Annotations[J].Electronic Library,2014,(32):147-169.
(責(zé)任編輯:郭沫含)