楊瑞仙,朱甜甜(鄭州大學信息管理學院)
國內外知識融合研究現(xiàn)狀比較分析
楊瑞仙,朱甜甜(鄭州大學信息管理學院)
在知識服務的實現(xiàn)進程中,大數(shù)據(jù)拓寬了知識服務的寬度和廣度,但與此同時也給知識服務帶來了新的難題。知識融合作為大數(shù)據(jù)環(huán)境下對知識進行收集、分析、處理的有效途徑已然成為國內外學者關注的焦點。為了更好地服務于國內在該領域的研究,本文將從關鍵技術、體系結構和應用三個方面深入分析和比較國內外在知識融合方面的研究現(xiàn)狀,并在此基礎上對我國知識融合研究進行述評,且提出針對性的建議,以期為我國在該領域的深入研究提供借鑒和參考。
知識融合;技術;體系結構
隨著大數(shù)據(jù)時代的到來,知識總量不斷增長,知識庫數(shù)量也隨之劇增,如何高效地獲取、處理和利用知識已成為知識服務領域研究的重點課題。為解決這一難題,國內外學者對知識融合這一新概念展開了廣泛而深入的研究,通過知識融合來提高知識的利用率,最終實現(xiàn)知識服務。知識融合是在信息融合的基礎上發(fā)展而來的一種新的融合概念,其目的是不僅僅將大量繁雜的數(shù)據(jù)進行高效快速處理以獲取、滿足用戶在海量知識中獲取、處理并利用數(shù)據(jù)的需求,還有利于實現(xiàn)知識服務,促進知識創(chuàng)新。本文通過對國內外文獻的調研、歸類、整合、分析,發(fā)現(xiàn)目前對于知識融合的研究主要集中在關鍵技術、體系結構、應用實踐這三個方面。
1.1國外研究概況
在web of science中以“knowledge fusion”為關鍵字進行主題檢索,共檢索到338篇相關文章,經(jīng)人工閱讀后篩選出77篇相關論文。筆者發(fā)現(xiàn),目前,國外對知識融合的研究主要集中在體系結構的組建和優(yōu)化方面,主要通過多Agent、網(wǎng)格計算和中間件等技術進行異構知識的映射和轉換,在特定知識環(huán)境中實現(xiàn)某種程度的融合。
1.2國內研究概況
近五年,國內在知識融合方面的研究也逐漸開展起來,雖起步晚但關注度極高。筆者通過對國家自然科學基金網(wǎng)站和全國哲學社會科學規(guī)劃辦公室網(wǎng)站進行調研,得到我國有關知識融合研究方面的國家級基金項目的立項資助情況,如表所示。
此外,通過對CNKI、維普、萬方等數(shù)據(jù)庫的檢索,發(fā)現(xiàn)關于知識融合研究的作者也系上述項目的研究成員,并且發(fā)表的論文大多是上述項目的研究成果。因此,國內知識融合的研究較為集中。
表2011 ~2015年國家級基金在“知識融合”研究方面的立項情況
在知識融合關鍵技術方面,國內外學者主要集中于基于語義規(guī)則、基于貝葉斯網(wǎng)絡、基于D-S理論和基于知識挖掘的知識融合三個方面,從知識融合的融合算法著手研究。在這一領域,國外的研究早于國內,而國內的研究更為具體。
2.1國外關鍵技術研究方面
國外學者對知識融合關鍵技術的研究主要基于上述三方面,且在此基礎上,有學者基于異構多粒度的規(guī)則知識來研究知識融合算法、基于圖劃分提出本體知識融合模型以及基于蟻群算法研究知識分類方法等,從多角度進行研究。
在基于語義規(guī)則方面,E.Gregoire[1]在標準邏輯設定中,引入一組語義定義的新方法來融合不一致知識源,這些方法將兩種偏好標準結合起來以處理沖突信息,在基于語義的實現(xiàn)路徑中盡量減少公式和概念的遺漏。J.E.Gouth[2]提出了基于知識空間理論的新型知識融合方法,將知識空間中的對象結點在不同粒度的結構中表示。
在基于貝葉斯網(wǎng)絡方面,為了實現(xiàn)多個貝葉斯知識源的融合,解決在不確定環(huán)境下的知識融合問題,E.Santos[3]等人將概率模型表示成貝葉斯知識基礎,并提出貝葉斯知識融合算法。該算法允許將多個貝葉斯知識基礎融合成單個貝葉斯知識基礎,同時保留所有輸入源中的知識。
在基于D-S理論方面,D.Andrade等人[4]研究了3個組合規(guī)則,即原始的D-S規(guī)則、墨菲規(guī)則和基于非精確狄利克模型的規(guī)則。經(jīng)研究發(fā)現(xiàn),D-S規(guī)則和墨菲規(guī)則有匯聚行為,但與新需求不一致,而狄利克模型則具備用于合作知識發(fā)現(xiàn)與數(shù)據(jù)挖掘或者生物計算領域的潛力。
2.2國內關鍵技術研究方面
知識融合的算法研究是國內學者研究的重點,具有一定規(guī)模。如,周芳等人[5]借鑒信息融合的思路,將信息融合中的方法引入到知識融合領域中,提出了三種知識融合算法,分別是:基于Bayes準則、基于D-S證據(jù)理論和基于模糊集理論。同時,周芳[6]等人還基于模糊集理論提出知識融合算法,其思想是按照給定的融合函數(shù)將模糊化后位于[0,1]上的數(shù)據(jù)進行融合,然后再對新生成的數(shù)據(jù)進行處理。
國內在基于語義規(guī)則、基于貝葉斯網(wǎng)絡、基于D-S理論和基于知識挖掘的知識融合研究方面有一定的進展。如,張玉潔[7]將貝葉斯融合方法和貝葉斯網(wǎng)絡引入到知識融合中,利用評分的方法,在不需要原始數(shù)據(jù)的情況下,將具有相同節(jié)點的貝葉斯網(wǎng)絡融合,達到知識融合的目的。宋建勛等[8]提出D-S證據(jù)理論知識融合算法思想,通過提取不同觀測結果決策信任函數(shù)融合,并根據(jù)實際需求規(guī)則對組合后的信任函數(shù)進行判斷,實現(xiàn)知識融合與決策優(yōu)化。韓立巖、周芳[9]提出了一種基于D-S證據(jù)理論新的知識融合方法。該方法主要包括數(shù)學建模、知識融合以及結果分析與決策三個步驟。
國內在知識融合的關鍵技術研究方面擴展到交叉學科,從多個角度綜合分析。如:蔣黎黎[10]等研究了基于粒度計算理論的知識融合模型。緱錦[11]提出了基于遺傳算法的知識融合算法,在遺傳算法基礎上,從本體論角度提出了新的知識融合算法。徐賜軍[12]提出了基于元知識構建、知識測度的知識融合模型。徐曉等[13]對知識和數(shù)據(jù)挖掘技術融合提出了一種新的建模思想,將知識嵌入到粗糙集中,形成制造決策的知識融合粗糙集模型。
2.3國內外研究異同比較
總體來看,國內外學者對知識融合關鍵技術的研究主要集中在基于語義規(guī)則、基于貝葉斯網(wǎng)絡、基于D-S理論和基于知識挖掘四方面,構建了相應的模型,并應用于實際中,且成功的案例有很多。與國外相比,國內對關鍵技術的研究更為具體和廣泛,但僅停留在表面,未能深入挖掘。
在知識融合關鍵技術的理論研究基礎上,需要開發(fā)和設計出基于實際問題的知識融合體系結構,以檢驗理論的正確性以及為投入實際應用奠定基礎,使知識融合的研究具有建設性意義。在體系結構研究方面,國外一直處于領先地位。
3.1國外體系結構研究方面
國外在知識融合方面最具代表性、引用較多的系統(tǒng)是Preece A D的KRAFT(Knowledge Reuse and Fusion/Transform)項目。[14]該項目主要研究知識融合模型架構以及優(yōu)化問題。旨在研究分布式架構如何支持某種特殊類型知識的轉化和重用,以及如何將其用于約束條件解決問題或者數(shù)據(jù)檢索,來融合這種知識以獲得附加價值。繼KRAFT系統(tǒng)之后,A.Nikolov等人開發(fā)了知識融合系統(tǒng)KnoFUSS。[15]該系統(tǒng)允許選擇綜合面向融合過程子任務的方法,也允許選擇最佳方法,這取決于領域以及任務的具體內容。此外,Heffner M等[16]研究了知識融合的技術創(chuàng)新組織,旨在提供一個指導綜合知識管理框架,包括融合過程的知識創(chuàng)新和技術創(chuàng)新。
3.2國內體系結構研究方面
國內在知識融合與知識共享方面較有影響力的項目是中國科學院的NKI項目,[17]是國家知識基礎設施項目。NKI在知識科學方面,對如何建立和維護本體結構進行了研究,并且對知識庫的一致性、完整性和結構性問題進行了深入討論。此外魯慧民等[18]提出以主題圖來表示知識,充分考慮所處語境,并在此基礎上提出了分布式知識融合體系結構以及對應的基于本體的遺傳融合算法,同時還建立了系統(tǒng)評估和參數(shù)校正機制。
3.3國內外研究異同比較
目前,在知識融合體系結構研究方面,國內外均上升到一個良好的趨勢,在體系結構構建細節(jié)及量化方面均有所提高。但相比國外學者的研究,國內的研究尚不成熟,雖已開發(fā)出屬于自己的體系結構,但仍處于對國外體系結構研究的基礎上進行拓展階段。造成這種現(xiàn)象產(chǎn)生的原因是國內對于知識融合研究的起步較晚,研究人員有限,研究成果影響力不夠大。
4.1國外應用研究方面
在計算機網(wǎng)絡應用方面,A.Smirnov等人[19]研究了融合分布式知識源的知識源網(wǎng)絡方法,對知識源網(wǎng)絡構建方法用于知識融合、多Agent結構和基于該方法的知識源網(wǎng)絡知識融合系統(tǒng)的研究原型作了系統(tǒng)分析,并討論了知識融合技術的概念及其在電子制造領域的應用。在近似知識領域,B.Dunin-Keplicz等[20]開發(fā)了利于保障融合知識的系統(tǒng),使用模糊集和關系的一般式來研究分布異構中知識的融合。
在軍事領域,國外的研究比較深入和具體。其中,美國軍事領域對知識融合的研究較為全面,具有代表性的項目為KFEWMS和ARPIKSE。[11]它的主要研究內容完全以知識融合為核心,包括構建分布式知識融合體系結構和對象化知識的共享與集成。即通過對分布式異構知識庫的結構化再組織,為軍方的各類行動提供基于知識的輔助決策信息。由于涉及軍方,公開資料極為有限,故筆者的研究較為基礎。
4.2國內應用研究方面
國內學者將知識融合應用于計算機網(wǎng)絡領域也取得了一些成績。如,緱錦等人[21]基于網(wǎng)格平臺展示了知識融合框架,該框架建議使用半結構化范式,強調對網(wǎng)格環(huán)境中分布式知識源的標注。胡思康等人[22]提出網(wǎng)頁知識融合框架結合網(wǎng)頁文本中的知識,將網(wǎng)頁文本抽取轉化成三元語義網(wǎng)絡作為知識表示。
國內將知識融合應用于實際的領域較為廣泛,在交叉學科領域的應用較為成熟。如:王利明、常鵬翱[23]討論了從學科分立到知識融合,進而分析了法學學科的分立與融合;甘健侯、夏躍龍[24]研究基于多源異構民族信息資源的知識融合算法,進而應用到我國民族信息資源的整合;朱森良等[25]將知識融合應用于自主式智能系統(tǒng);康耀紅[26]將知識融合應用于數(shù)據(jù)融合理論與應用,指出信息融合是一個處理過程,并且把信息融合定義為一個廣泛的概念,指出信息融合是一個綜合的處理過程;潘泉等[27]將知識融合主要用于軍事方面,與軍事用途密切相關。
4.3國內外研究異同比較
就筆者所研究范圍看,國外主要將知識融合應用于計算機網(wǎng)絡領域以及國家軍事領域,發(fā)揮了知識融合極大的效用;國內不僅將知識融合應用于上述兩方面,還應用于一些交叉學科中,并取得了一定的成績。但國內的研究不夠深入不夠徹底,未能發(fā)揮知識融合的最大作用。隨著研究時間的推進,國內研究知識融合的學者不斷增加,這將使我國知識融合的研究更為深入和具體。
5.1相關研究述評
知識融合在知識服務中扮演著重要角色,是圖書情報工作研究的重點內容之一。筆者通過閱讀大量文獻,并對此進行歸納、總結、對比和分析,發(fā)現(xiàn)國內外在知識融合方面的研究存在一定差異,國內的研究尚且存在以下幾點不足。①知識融合的融合算法精度不夠。雖然我國在知識融合關鍵技術研究方面較為成熟,融合算法也多樣化、全面化,但其精度、效率還有待進一步提升。②知識融合體系結構不成熟,尚未形成一個專門、統(tǒng)一、完善的知識融合系統(tǒng)模型。國內學者在體系結構研究過程中,雖然在嘗試擺脫國外已有研究的限制,打造符合我國圖書情報領域的系統(tǒng)模型,但通用的模型還未建立。③知識融合沒有充分應用到圖書情報的知識服務中。目前,國內學者將知識融合多應用于計算機網(wǎng)絡結構、軍事領域等知識管理領域中。未來,還會在制造、醫(yī)療、環(huán)境、經(jīng)濟、科技等領域中交叉運用。圖書情報領域應作為引領者,將知識融合應用到知識服務中去。
5.2未來研究重點
針對國內在知識融合領域研究的不足,未來,我國的研究應重點把握以下四方面:①深入研究知識融合的關鍵技術、改進融合算法,使其更精確更高效;②建立一個通用的知識融合體系結構,推動各學科領域的相關研究;③將知識融合應用于更多交叉學科,充分發(fā)揮知識融合對知識服務實現(xiàn)的關鍵作用;④在大數(shù)據(jù)環(huán)境下,隨著現(xiàn)代知識總量與知識庫的劇增,知識融合應明確目標,充分發(fā)揮其功效。此外,國內對知識融合的研究起步較晚,研究人員有限。因此,在這一領域,國內學者應培養(yǎng)更多的科技創(chuàng)新人才,以便更深入、更具體、更系統(tǒng)地對知識融合進行研究。
[1]Gregoire E.Minimizing both dropped formulas and concepts knowledge fusion[C]//Defense and Security Symposium,International Society for Optics and Photonics.Tallahassee:WATAMPress,2006:62420.
[2]Gouth J E.Fusing knowledge resources in knowledge space[J].Dynamics Continuous Discrete and ImpulsiveSystems-SeriesB-Applications&Algorithms,2007(14):825-828.
[3]Santos E,et al.Fusing multiple bayesian knowledge sources[J].International Journal of Approximate Reasoning,2011,52(7):935-947.
[4]Andrade D,et al.Knowledge fusion using Dempster-Shafer theory and the imprecise Dirichlet model[C]// IEEE Conference on Soft Computing in Industrial Application,Smcia’08.Madley:IEEE,2008:142-148.
[5]周芳,等.多源知識融合處理算法[J].北京航空航天大學學報,2013(1):109-114.
[6]周芳,等.基于模糊集理論的知識融合方法研究[J].北京理工大學學報(社會科學版),2013(3):67-73.
[7]張玉潔.基于評分的貝葉斯網(wǎng)融合方法[D].昆明:云南大學,2011.
[8]宋建勛,等.基于D-S證據(jù)理論的多特征數(shù)據(jù)融合算法[J].火力與指揮控制,2010(7):96-98,108.
[9]韓立巖,周芳.基于D-S證據(jù)理論的知識融合及其應用[J].北京航空航天大學學報,2006(1):65-68,73.
[10]蔣黎黎,等.基于粒度計算理論的知識融合模型研究[J].計算機應用研究,2012(10):3697-3700.
[11]緱錦.知識融合中若干關鍵技術研究[D].杭州:浙江大學,2005.
[12]徐賜軍,等.基于本體的知識融合框架[J].計算機輔助設計與圖形學學報,2010(7):1230-1236.
[13]徐曉,等.制造決策的知識融合粗糙集模型[J].華南理工大學學報(自然科學版),2011(8):36-41.
[14]PreeceAD,etal.KRAFT:Anagentarchitecturefor knowledge fusion[J].Int Journal of Cooperative InformationSystems,2001,10(1-2):171-195.
[15]Nikolov A,et al.KnoFuss:A comprehensive architechire for knowledge fusion[C]//Proceedings of the 4th International Conference on Knowledge Capture. SanFrancisco:ACM,2007:185-186.
[16]Heffner M,Sharif N.Knowledge fusion for technological innovation in organizations[J].Journal of Knowledge Management,2008(12):79-93.
[17]Nengfu Xie,et al.A knowledge fusion model for web Information[C]//2005 IEEE/WIC/ACM International Conference on Web Intelligence.Halifax:IEEE,2005:67-72.
[18]魯慧民,等.一種基于擴展主題圖的分布式知識融合[J].吉林大學學報(理學版),2009(3):543-547.
[19]Smirnov A,et al.Ksnet-approach to knowledge fusion distributed sources[J].Computing and Informatics,2012,22(2):105-142.
[20]Dunin-Keplicz B,et al.Tractable approximate knowledge fusion using the horn fragment of serial propositional dynamic logic[J].International Journal of Approximate Reasoning,2010,51(3):346-362.
[21]Gou Jin,et al.A knowledge fusion framework in the grid environment[M].Krakow:Springer,2004:503-506.
[22]HuSikang,CaoYuanda.Web text knowledge fusion[C]//Second Pacific-Asia Conference on Web Mining and Web-based Application.Madison:IEEE,2009:171-174.
[23]王利明,常鵬翱.從學科分立到知識融合——我國法學學科30年之回顧與展望[J].法學,2008(12):58-67.
[24]夏躍龍.多源異構民族信息資源知識融合算法研究[D].昆明:云南師范大學,2014.
[25]朱森良,等.自主式智能系統(tǒng)[M].杭州:浙江大學出版社,2000.
[26]康耀紅.數(shù)據(jù)融合理論與應用[M].西安:西安電子科技大學出版社,1997.
[27]潘泉,等.信息融合理論的基本方法與進展[J].自動化學報,2003(4):599-615.
Comparison Analysis on Knowledge Fusion Research Status at Home and Abroad
Yang Rui-xian,Zhu Tian-tian
During the process of the realization of knowledge service,Big Data has broaden the width and breadth,while also brought new problems to knowledge service at the same time.Knowledge fusion,as an effective approach of knowledge collecting, analyzing,and handling,has become the focus of scholars both at home and abroad.In order to better serve the domestic research in this field,the article analyzes corresponding research from the aspects of key technology,system structure and application at home and abroad.Based on above research,it reviews knowledge fusion research status of our country to provide reference and reference for in-depth study.
Knowledge Fusion;Technology;System Structure
G252.8
A
1005-8214(2016)08-0042-04
楊瑞仙(1982-),女,博士后,鄭州大學信息管理學院副教授,研究方向:信息計量、知識組織;朱甜甜(1994-),女,鄭州大學信息管理學院本科生。
2015-12-30[責任編輯]張雅妮
本文系河南省教育廳人文社科一般項目“基于計量分析的科研關系揭示與融合研究”(項目編號:2016-gh-128)研究成果之一。