廖禮
摘 要 本體論近年來受到信息科學領(lǐng)域的廣泛關(guān)注。本體論在Web上的應用導致了語義Web的誕生,語義Web 代表了下一代Web 的發(fā)展和趨勢,它是面向文檔所表示的數(shù)據(jù),將賦予信息資源更明確、更完備的語義信息, 解決Web信息共享時的語義問題, 從而實現(xiàn)世界范圍內(nèi)的知識共享和智能信息集。本文就本體論與語義Web的研究現(xiàn)狀做了一個簡單的綜述,旨在為今后本體論與語義Web的發(fā)展產(chǎn)生一定的影響。
關(guān)鍵詞 本體論 語義Web
中圖分類號:TP393 文獻標識碼:A
1本體論
本體論最早是一個哲學的范疇,是對自然存在及其本質(zhì)的研究,它所反映的是事物本質(zhì)的、科學的內(nèi)涵。后來隨著人工智能的發(fā)展,被人工智能界賦予了一些新的定義。目前在計算機界被廣泛接受的是Gruber在1993年對本體論的定義,即它是一種共享的概念化的形式化明確說明。本體論有5個要素:元語、類、關(guān)系、函數(shù)、公理和實例,其中公理可以看作是本體論中的約束。本體論通過這5個要素嚴格、正確地刻畫所描述的對象。其目標是捕獲相關(guān)的領(lǐng)域的知識,提供對該領(lǐng)域知識的共同理解,確定該領(lǐng)域內(nèi)共同認可的詞匯,并從不同層次的形式化模式上給出這些詞匯和詞匯之間相互關(guān)系的明確定義。本體不僅可以形成對資源、知識等的統(tǒng)一認識,而且支持的推理機制是計算機“理解與處理”的基礎(chǔ)。近年來被廣泛用于知識表示、知識共享、知識集成、知識重用和知識管理等領(lǐng)域中。
2語義Web
2.1語義Web的定義
萬維網(wǎng)標準化組織W3C對語義Web的定義為:語義Web是建立在RDF與其它定義的標準基礎(chǔ)之上,對Web上的數(shù)據(jù)所進行的一種抽象表示。語義Web 被稱為第三代互聯(lián)網(wǎng)。1998年,Tim Berners-Lee首次提出Web的概念。他認為,語義Web并不是一個孤立的Web 而是對當前Web 的擴展,它包含了文檔或文檔的一部分,描述了事物間的明顯關(guān)系,且包含語義信息,以利于機器自動處理,從而使計算機之間以及人類能更好地彼此合作。Tim Berners-Lee還為未來的Web發(fā)展提出了基于語義的體系結(jié)構(gòu),如圖1所示。
2.2目前Web信息檢索的缺點
計算機能夠識別網(wǎng)頁的結(jié)構(gòu),但并不理解網(wǎng)頁的語義。目前大多數(shù)的搜索引擎都是對網(wǎng)頁中的文本進行簡單匹配的,檢索效率低,很難滿足普通用戶基于自然語言的檢索要求,也不具備語義推理能力,無法實現(xiàn)智能化的檢索。
2.3基于本體論的語義Web
在語義Web 中,本體論具有非常重要的地位,是解決語義層次上Web信息共享和交換的基礎(chǔ)。本體論在Web上完成其信息定義后,還能有效地幫助其完成Web 數(shù)據(jù)管理,突破以僅僅只是符號和數(shù)據(jù)管理,還能進行語義上的處理和管理。
基于本體論的Web環(huán)境下的語義檢索系統(tǒng)的結(jié)構(gòu)模型能很好的解決這個問題。其特點有:(1)不是基于關(guān)鍵詞匹配的檢索, 而是問答式的。(2)檢索的處理對象是網(wǎng)絡信息資源, 它們是異構(gòu)的, 非結(jié)構(gòu)化的。(3)系統(tǒng)具備自然語言的語義分析能力。(4)系統(tǒng)具有一定的推理能力,是智能化的知識庫。其流程是:切分句子與自動分詞—>詞性標注—>詞匯語義標注—>句法分析—>知識抽取。
語義Web 服務又是另一種以語義Web和本體論為基礎(chǔ)的一個重要的應用基礎(chǔ)研究領(lǐng)域。主要目標是克服傳統(tǒng)Web服務語義操作能力的局限,使服務的發(fā)現(xiàn)、執(zhí)行以及動態(tài)組合能夠智能的完成。目前主要的研究框架是基于本體論思想的OWL-S( Web Ontology Language for Service)。它使用一系列基本的類和屬性來描述服務, 提供了一個可共享的框架, 目的是使計算機對服務可“理解”,以便利服務的發(fā)現(xiàn)、調(diào)用、互操作、復合、驗證以及執(zhí)行監(jiān)控等。Web 服務技術(shù)是在現(xiàn)有的Web 技術(shù)Internet 的基礎(chǔ)上,通過制定新的協(xié)議和標準組成的。Web 服務的核心協(xié)議標準包括: SOAP、WSDL、UDDI 等。其特點有:(1)可描述(2)可發(fā)布(3)可查找(4)可綁定(5)可調(diào)用(6)可組合。
3總結(jié)
基于本體論的語義模型是信息表示、交換和處理標準化的一種全新模式,這種模式為信息的交流與對話提供方便,使數(shù)據(jù)的表示得到統(tǒng)一,從而能使信息的共享和重用更加有效。
參考文獻
[1] 李善平,尹奇,胡玉杰,郭鳴,付相君.本體論研究綜述[J].計算機研究與發(fā)展,2004(7).
[2] 東野廣升,馮麗雅.語義Web 與Ontology研究.Researches In Library Science ,2006(05).
[3] 梁曄,周海燕.本體論語義web[J].北京聯(lián)合大學學報(自然科學版),2007,3(1).
[4] 張麗萍.語義web、本體論與信息檢索[J].圖書與情報,2007(3).
[5] 陳森博,石振國,王春明.基于本體論的Web知識檢索及其應用研究[J].電腦知識與技術(shù),2009(18).
[6] 耿麗麗,余雪麗.基于本體的語義web服務通信協(xié)議的研究[J].電腦開發(fā)與運用,2007(1).
[7] 焦玉英,張璐.基于ontology的語義檢索模型架構(gòu)[J].圖書情報論壇,2006(02).endprint