張 蓉 張 瀾
(華中師范大學,湖北 武漢 430070)
大數(shù)據(jù)時代下,龐雜多樣的數(shù)據(jù)從各種不同的渠道產(chǎn)生,對比單一數(shù)據(jù)源的研究,對這些多源、異構(gòu)的數(shù)據(jù)進行分析和研究,可以更好地把握問題的整體性, 因而多源數(shù)據(jù)融合就成了研究的一大難點和重點。知識融合是在數(shù)據(jù)融合的基礎上發(fā)展而來的,數(shù)據(jù)融合最初應用于軍事方面綜合多個數(shù)據(jù)來輔助分析[1],之后數(shù)據(jù)融合的概念和研究又擴展到了信息融合,其處理對象還包括了多源信息,范圍要更加廣泛[2]。而如今研究范疇又擴展到了知識融合,不僅局限于數(shù)據(jù)和信息,更將知識庫或者已有信息庫中的知識納入到各種方法、專家經(jīng)驗等[3]。
然而,目前學者對于知識融合的概念并沒有統(tǒng)一的認識,同時知識融合的相近概念又很多,如知識整合、知識聚合等,知識融合的基礎理論研究仍需完善。知識融合的研究還處于起步階段,目前的研究并不算很多,已有研究紛繁雜亂,為了更好的了解目前圖書情報領域知識融合研究現(xiàn)狀,本文采用共現(xiàn)分析、聚類分析等對近年來知識融合的相關文獻進行分析,把握知識融合現(xiàn)狀,分析目前研究的熱點以及未來可以繼續(xù)研究的方向,以期更好地在這個領域進行研究。
本文選擇中國知網(wǎng)數(shù)據(jù)庫進行文獻分析與研究。中國知網(wǎng)數(shù)據(jù)庫是中國第一個連續(xù)的大規(guī)模多功能、集成化學術期刊全文檢索系統(tǒng),收錄范圍涵蓋各個領域[4]。在中國知網(wǎng)數(shù)據(jù)庫中,限定領域為圖書情報學,以“知識融合”作為關鍵詞進行檢索(檢索截止到2019年11月),共檢索到469篇文獻,剔除無關文獻之后剩余418篇。
本研究獲取相關數(shù)據(jù)后,首先得到知識融合相關研究的時間和空間特征,然后對知識融合研究主體分布進行分析,之后采用SATI、UCINET等工具挖掘出研究的關鍵詞,并進行高頻關鍵詞共現(xiàn)分析以揭示研究內(nèi)容特征,然后采用SPSS做聚類分析,把握研究的集團化特征,最后總結(jié)目前知識融合研究的熱點及不足,針對這些問題提出若干建議。
2.1.1 知識融合年度發(fā)文量分析
通過對年度知識融合文獻產(chǎn)量進行統(tǒng)計分析,可以直觀的看出知識融合領域整體發(fā)展態(tài)勢。從圖1可以看出,目前知識融合研究仍然還有很多的發(fā)展前景,自從2002年我國首次發(fā)表知識融合的論文以來,知識融合相關研究都不是很多,說明很長一段時間學者的關注度都不夠,處于起步階段。從2015至今知識融合研究逐漸引起關注,文獻產(chǎn)量開始增加,但還未到達高峰期,說明知識融合研究逐漸進入學者的視野,未來擁有廣闊的可能。
圖1 知識融合研究年度產(chǎn)量分布
2.1.2 知識融合研究的期刊分布特征
期刊分布可以了解知識融合研究的核心期刊特征。經(jīng)過分析知識融合相關文獻發(fā)布于240種期刊,有194種期刊只發(fā)表了一篇文獻。在剩余的46種期刊中,又有14種期刊發(fā)文量大于2篇,如圖2所示。從圖2可以看出,《情報理論與實踐》發(fā)表的知識融合文獻最多,為10篇,其次為《圖書情報工作》《圖書館學研究》,同時可以看出,除圖書情報學之外,還有一部分學科處于交叉狀態(tài),如教育學、工程學。
圖2 知識融合期刊發(fā)文量
對領域內(nèi)學者分布特征進行分析,可以有效發(fā)現(xiàn)目前知識融合領域內(nèi)核心力量和學者之間的合作關系。經(jīng)統(tǒng)計,知識融合相關文獻的學者共有814位,其中絕大多數(shù)學者只發(fā)表了一篇論文,發(fā)表兩篇及以上的作者僅有64位,邱均平發(fā)表數(shù)量最多為6篇,其次鄒湘軍發(fā)表了5篇。
對這些學者之間的合著關系進行研究,結(jié)果如圖3所示,圖中的節(jié)點為作者,節(jié)點之間的連線代表相關學者之間的合作關系,如果學者之間的連線形成網(wǎng)狀,代表本領域?qū)W者間的聯(lián)系緊密,交流頻繁。而圖3所示知識融合領域內(nèi)學者的聯(lián)系多為小團體,這些小團體各自分散,形成一個個“孤島”,表明知識融合領域目前學者之間的關聯(lián)很小,大部分都是獨自研究或者與本機構(gòu)同事合作,聯(lián)系松散。
圖3 知識融合領域著者合作關系網(wǎng)
2.3.1 關鍵詞分布特征
關鍵詞是一篇文獻研究內(nèi)容最為簡潔、凝練的概括,通過對關鍵詞的統(tǒng)計和分析,可以發(fā)現(xiàn)目前領域內(nèi)學者研究的主要方向。本文統(tǒng)計了目前知識融合領域內(nèi)關鍵詞頻次,共有1136個關鍵詞,其中167個關鍵詞出現(xiàn)了兩次及兩次以上,出現(xiàn)頻次最高的為知識圖譜,共計22次,如圖4所示。圖4展示了頻次為3及3以上的關鍵詞,除知識融合外,知識圖譜、本體出現(xiàn)最為頻繁,與知識融合的關系最為密切。
圖4 知識融合領域高頻關鍵詞
2.3.2 關鍵詞共現(xiàn)分析
對出現(xiàn)頻次最高的57個關鍵詞(頻次>=3)做關鍵詞共現(xiàn)分析,得到關鍵詞共現(xiàn)網(wǎng)絡,并進行點度中心性計算,形成點度中心性網(wǎng)絡,網(wǎng)絡中節(jié)點越大,其中心性越高,節(jié)點越重要,節(jié)點間線條粗細則反映了關鍵詞之間聯(lián)系的緊密度。如圖5可得出結(jié)論:目前知識融合領域內(nèi),知識圖譜研究、知識庫、知識推理、大數(shù)據(jù)、知識推理等節(jié)點與知識融合的連線較粗,處在網(wǎng)絡的中心位置,與另外的關鍵詞之間的聯(lián)系較多,在知識融合中處于重要地位,這些也是目前知識融合領域內(nèi)研究熱點,與知識融合未來的發(fā)展方向息息相關。
圖5 高頻關鍵詞點度中心共現(xiàn)網(wǎng)絡
2.3.3 關鍵詞聚類分析
將關鍵詞共詞矩陣轉(zhuǎn)化為相異矩陣,在SPSS軟件中進行聚類分析。具體方法是用SATI得到關鍵詞相異矩陣之后,將數(shù)據(jù)導入SPSS,采用組內(nèi)連接得到冰柱圖和聚類樹狀圖如圖6、圖7所示。
圖6 關鍵詞聚類冰柱
圖7 關鍵詞聚類樹狀圖
對比圖6、圖7展示的知識融合相關關鍵詞聚類結(jié)果,可以將關鍵詞劃分為表1所示的5個類團。前三類都只含有兩個關鍵詞,第5類包含最多的關鍵詞,而可以看出在類團5眾多的關鍵詞中,既有理論研究,又有相關應用研究,同時知識融合領域本身就容易與其他領域?qū)崿F(xiàn)交叉,因而本文根據(jù)表1結(jié)果結(jié)合實際對知識融合研究內(nèi)容進行歸類。
表1 關鍵詞聚類
(1)知識融合支撐技術、方法研究。由于知識融合起源于傳感器信息的融合,因而知識融合過程離不開計算機、信息技術領域的滲透。近年來語義網(wǎng)、XML、RDFS、多Agent系統(tǒng)等跨學科領域技術方法已經(jīng)應用于知識融合領域[5],成為支撐知識融合研究重要的技術手段。知識融合方法更是廣泛借鑒了信息融合算法如貝葉斯網(wǎng)絡等[6]。與此同時,基于知識區(qū)別信息和數(shù)據(jù)具有延伸性,可以通過推理來獲得新知識,因而知識推理的方法同樣適用于知識融合,如基于語義規(guī)則的方法[7]與本體論的方法[8]。
(2)知識融合體系、系統(tǒng)研究。知識融合系統(tǒng)的體系架構(gòu)是指實施知識融合時系統(tǒng)所采用的一般性原理和形式,包括實施知識融合的組成要素及其相互作用等[9]。依照不同的體系架構(gòu),融合過程的技術、選擇方法、組成部分都會有不同,進而造成融合結(jié)果的不同。關于知識融合框架在研究內(nèi)容中占據(jù)重要位置,周利琴等以知識服務需求為導向,構(gòu)建了面向物化知識倉庫、面向虛擬知識網(wǎng)絡和面向混合模式的知識融合過程模型,知識融合過程與應用結(jié)合起來,促進用戶需求的最大化滿足[10];朱娟等構(gòu)建了集數(shù)據(jù)層、模型層以及應用層為一體的個性化推薦模型,融合用戶、商品、情境信息等多源知識融合[11]。
(3)領域應用研究。知識融合最終是面向服務,面向用戶的,因而最終都會落腳于實證以解決實際需求。類團中出現(xiàn)了“政府網(wǎng)站”和“信息資源”以及“軍民融合”、“競爭情報”這種關鍵詞團體,在軍事、政治、教育各種領域內(nèi)多源知識的融合對決策的準確性、全面性至關重要。如教育學中通過理論與實踐的多源知識融合,豐富和拓展教學內(nèi)容, 激發(fā)學習興趣和創(chuàng)新能力, 促進教學進步[12];化工領域?qū)⑾到y(tǒng)故障數(shù)據(jù)與專家知識系統(tǒng)通過權重D-S證據(jù)理論融合,提高不確定性故障診斷的正確率[13]。
本文通過使用SATI、UCINET、Netdraw等工具,對CNKI上獲取的知識融合文獻進行分析,在目前研究現(xiàn)狀進行梳理的同時發(fā)現(xiàn)所存在的問題和不足,旨在促進知識融合的進一步發(fā)展。
結(jié)果表明現(xiàn)階段知識融合研究雖然已有一定成果,但是存在以下問題:①整體研究仍未達到峰值,后續(xù)仍有發(fā)展?jié)摿?;②目前知識融合研究多為技術、方法、實證研究,基礎理論研究還未完善;③學者、機構(gòu)之間各自為政,交流、合作較少,不易于知識共享和創(chuàng)新;④研究內(nèi)容廣泛、分散,尚未形成整體的、系統(tǒng)的領域體系架構(gòu)與穩(wěn)定的研究主題。
以上的分析結(jié)論對于知識融合的未來發(fā)展具有重要意義:①知識融合研究要緊跟國內(nèi)外研究態(tài)勢,跟隨時代發(fā)展的需要和變化,做到與時代要求緊密關聯(lián)。在廣泛研究發(fā)展的同時,要注意形成本領域穩(wěn)定的研究主題與整體的體系架構(gòu),形成本領域區(qū)別于其他領域的核心競爭力;②學者、機構(gòu)之間要加強交流和知識共享,由于知識融合包含計算機、信息技術等各種領域的交叉滲透,因而各個領域人員之間的交流合作對本領域發(fā)展有促進作用;③科研人員在立足于實際需求的同時,要注意基礎理論的完善,在理論指導下進行發(fā)揮領域優(yōu)勢,改善知識服務實際需求。