朱成兵
(臺(tái)州職業(yè)技術(shù)學(xué)院 機(jī)電工程學(xué)院,浙江 臺(tái)州 318000)
語(yǔ)義網(wǎng)理論研究
朱成兵
(臺(tái)州職業(yè)技術(shù)學(xué)院 機(jī)電工程學(xué)院,浙江 臺(tái)州 318000)
語(yǔ)義網(wǎng)是對(duì)當(dāng)前萬(wàn)維網(wǎng)的延伸和擴(kuò)展.本文首先闡述了語(yǔ)義網(wǎng)的概念,然后對(duì)語(yǔ)義網(wǎng)的體系結(jié)構(gòu)進(jìn)行了分析.最后,指出了語(yǔ)義網(wǎng)在智能信息檢索、企業(yè)間數(shù)據(jù)交換及知識(shí)管理、Web服務(wù)等領(lǐng)域的應(yīng)用價(jià)值.
語(yǔ)義網(wǎng);本體;Web服務(wù)
萬(wàn)維網(wǎng)創(chuàng)始人Tim Berners-Lee將萬(wàn)維網(wǎng)的演化分為兩個(gè)階段[1],在第一個(gè)階段,萬(wàn)維網(wǎng)應(yīng)該是一個(gè)有利于人們進(jìn)行信息交換和相互合作的強(qiáng)大工具.萬(wàn)維網(wǎng)在最初十年的發(fā)展里,基本上實(shí)現(xiàn)了這個(gè)目標(biāo):它以HTml頁(yè)面的方式向人提供了大量可閱讀的信息;在第二個(gè)階段,這種合作應(yīng)該延伸到機(jī)器.也就是說(shuō),連接到萬(wàn)維網(wǎng)上的機(jī)器也應(yīng)該能夠分析萬(wàn)維網(wǎng)上的所有數(shù)據(jù)——包括內(nèi)容、鏈接以及人與機(jī)器之間的交互.如何實(shí)現(xiàn)萬(wàn)維網(wǎng)的第二階段目標(biāo)正是目前學(xué)術(shù)界研究的熱點(diǎn).實(shí)現(xiàn)這一目標(biāo)的難點(diǎn)在于傳統(tǒng)的H T ml語(yǔ)言本身的固有缺陷,這種標(biāo)記語(yǔ)言的標(biāo)簽集只是對(duì)內(nèi)容的顯示格式做了標(biāo)記,由于缺乏針對(duì)數(shù)據(jù)內(nèi)容的標(biāo)簽,其數(shù)據(jù)的表現(xiàn)格式和數(shù)據(jù)內(nèi)容糅合在一起.HTml語(yǔ)言的這種特點(diǎn)決定了萬(wàn)維網(wǎng)上的信息內(nèi)容很難被機(jī)器所理解,從而制約了一些需要對(duì)萬(wàn)維網(wǎng)上的海量數(shù)據(jù)進(jìn)行自動(dòng)化處理應(yīng)用的開(kāi)發(fā).雖然近年來(lái)人們?cè)谧匀徽Z(yǔ)言處理(NLP)、機(jī)器學(xué)習(xí)等領(lǐng)域做出了大量的努力,提出了基于概率統(tǒng)計(jì)、向量空間等多種方法來(lái)增強(qiáng)機(jī)器對(duì)文本信息的理解能力,但其最終的處理效果還不夠理想.從上述分析可知:由于當(dāng)前廣泛使用的H T ml存在諸多的弊端,因此為了充分發(fā)揮萬(wàn)維網(wǎng)海量數(shù)據(jù)存儲(chǔ)的優(yōu)勢(shì),就需要以一種機(jī)器可識(shí)別和理解的規(guī)范化格式交換web資源信息.
萬(wàn)維網(wǎng)的創(chuàng)始人Tim Berners-Lee提出的有關(guān)下一代萬(wàn)維網(wǎng)的構(gòu)想——語(yǔ)義網(wǎng).語(yǔ)義網(wǎng)是一個(gè)夢(mèng)想:期望Web上的數(shù)據(jù)通過(guò)另一種不同于現(xiàn)在的方式描述和鏈接,使這些數(shù)據(jù)不僅能以各種靈活的方式展現(xiàn)出來(lái),也能被不同的應(yīng)用程序所自動(dòng)處理、綜合、重用.在語(yǔ)義網(wǎng)中,網(wǎng)頁(yè)中所蘊(yùn)含的語(yǔ)義信息能使計(jì)算機(jī)完成大部分的自動(dòng)化處理工作.
Tim Berners-Lee并沒(méi)有給出語(yǔ)義網(wǎng)的嚴(yán)格數(shù)學(xué)定義,只是在和當(dāng)代萬(wàn)維網(wǎng)的對(duì)比中,給出了如下的描述:語(yǔ)義網(wǎng)并不是一個(gè)從無(wú)到有、孤立發(fā)展的萬(wàn)維網(wǎng),而是對(duì)當(dāng)前萬(wàn)維網(wǎng)的延伸和擴(kuò)展,語(yǔ)義網(wǎng)上的信息具有定義良好的含義,計(jì)算機(jī)能根據(jù)概念的定義聲明和邏輯推理規(guī)則發(fā)現(xiàn)資源對(duì)象的含義,使得機(jī)—機(jī)之間以及人—機(jī)之間都能夠更有效地合作處理;在語(yǔ)義網(wǎng)中定義和鏈接的數(shù)據(jù)能被各種不同的應(yīng)用以更為有效的方式查詢(xún)、重用和集成.總結(jié)起來(lái),語(yǔ)義網(wǎng)具有以下幾個(gè)顯著特征:
(1)文檔對(duì)象VS現(xiàn)實(shí)世界對(duì)象:語(yǔ)義網(wǎng)不僅是一個(gè)存儲(chǔ)文檔對(duì)象集合的網(wǎng)絡(luò),它更是一個(gè)描述現(xiàn)實(shí)世界對(duì)象資源關(guān)系的網(wǎng)絡(luò).
(2)人可讀VS機(jī)器可讀:和當(dāng)代萬(wàn)維網(wǎng)相比較,語(yǔ)義網(wǎng)的另一個(gè)顯著特征就是其包含了更多機(jī)器可閱讀和理解的語(yǔ)義信息.
(3)HTml和語(yǔ)義網(wǎng)的關(guān)系:萬(wàn)維網(wǎng)作為世界上最大的信息儲(chǔ)藏所,其中蘊(yùn)含的信息量超過(guò)世界上任何一個(gè)圖書(shū)館,在這一點(diǎn)上,HTml功不可沒(méi),正是通過(guò)HTml中的超鏈接,才得以將世界上的各種信息資源鏈接在一起.但豐富多彩的現(xiàn)實(shí)世界中還存在著各種復(fù)雜的關(guān)聯(lián)關(guān)系,這就要求語(yǔ)義網(wǎng)不僅要能反映資源之間的超鏈接關(guān)系,而且還應(yīng)能描述資源對(duì)象之間的豐富而又復(fù)雜的關(guān)聯(lián)關(guān)系,對(duì)這種復(fù)雜關(guān)聯(lián)關(guān)系的描述正是語(yǔ)義網(wǎng)的優(yōu)勢(shì)所在.
根據(jù)上面的描述,人們給語(yǔ)義網(wǎng)下這樣的定義:語(yǔ)義網(wǎng)就是機(jī)器可以理解數(shù)據(jù)含義的下一代萬(wàn)維網(wǎng),其上的“語(yǔ)義”信息蘊(yùn)含在各資源節(jié)點(diǎn)的邏輯聯(lián)系中.
3.1 語(yǔ)義網(wǎng)的體系結(jié)構(gòu)
信息資源根據(jù)其所處層次的不同,可以被劃分成不同的階或者勢(shì),其中現(xiàn)實(shí)世界中未經(jīng)加工處理的信息屬于零階,在整個(gè)信息層次結(jié)構(gòu)中處于最底層;網(wǎng)頁(yè)資源信息處在第一階;在對(duì)HTml頁(yè)面經(jīng)過(guò)初次加工之后,所獲取的網(wǎng)頁(yè)標(biāo)引或索引信息處在第二階;有關(guān)信息資源對(duì)象的元數(shù)據(jù)或模式信息則是屬于第三階的信息;而邏輯推理、真值證明等信息理應(yīng)擁有更高的階值,在信息層次結(jié)構(gòu)中,階值越低的信息越具體詳實(shí),較適合于人為處理;階值越高的信息其抽象程度越高,則更適合于機(jī)器的自動(dòng)化處理.因此,語(yǔ)義網(wǎng)首要解決的問(wèn)題就是建立起合理的信息層次結(jié)構(gòu),使其上面的信息是結(jié)構(gòu)良好且有序的.Tim Berners-Lee在Xml 2000大會(huì)上描述了語(yǔ)義網(wǎng)的基本體系結(jié)構(gòu),如圖1所示.
3.2 UNI和Unicode(編碼層)
WEB環(huán)境下的各應(yīng)用之間不可避免地需要相互通信,直接或間接地以機(jī)器可讀的格式傳遞信息.這些信息中很大一部分是對(duì)Web上資源的描述,因此,首先應(yīng)該以明確的方式來(lái)標(biāo)識(shí)這些資源對(duì)象.語(yǔ)義網(wǎng)采用統(tǒng)一資源標(biāo)識(shí)符,URI (Uniform ResourceI dentifier)來(lái)標(biāo)識(shí)資源及其屬性,URI是一個(gè)Internet標(biāo)準(zhǔn),記載于RFC 2396中.它和萬(wàn)維網(wǎng)常用的統(tǒng)一資源定位符URL以及統(tǒng)一資源名稱(chēng)URN的區(qū)別在于URI能表示所有可以字符串作為標(biāo)識(shí)符的資源信息,它既能表示網(wǎng)絡(luò)可達(dá)的資源,又能描述網(wǎng)絡(luò)不可達(dá)的資源,URL和URN都是URI的子集.另外,由于語(yǔ)義網(wǎng)的最終目的是要構(gòu)建一個(gè)全球信息的網(wǎng)絡(luò),在這個(gè)網(wǎng)絡(luò)上應(yīng)能涵蓋各種語(yǔ)言和文字的信息資源,所以它采用編碼層作為字符的編碼解決方案.這一層位于語(yǔ)義網(wǎng)中的最底層,是整個(gè)語(yǔ)義網(wǎng)的基石,它成功地解決了萬(wàn)維網(wǎng)上資源的定位和跨地區(qū)字符編碼格式的問(wèn)題.
3.3 Xml、Name Space和Xml Schema(語(yǔ)法層)
說(shuō)起當(dāng)代互聯(lián)網(wǎng)的蓬勃發(fā)展,HTml的確立下了赫赫戰(zhàn)功.可是,HTml在制定之初就蘊(yùn)藏了許多危機(jī),隨著萬(wàn)維網(wǎng)的不斷發(fā)展,這些危機(jī)不但沒(méi)有減弱,反而越來(lái)越突出,甚至已然成為制約H T ml繼續(xù)發(fā)展的障礙.歸納起來(lái),H T ml語(yǔ)言主要存在以下幾個(gè)方面的問(wèn)題:
(1)數(shù)據(jù)內(nèi)容和數(shù)據(jù)表示不分,這是HTml最大的問(wèn)題所在.
(2)HTml內(nèi)部的結(jié)構(gòu)性和條理性較差.
(3)HTml的標(biāo)簽固定僵化,用戶(hù)不能自行擴(kuò)展,導(dǎo)致很多的特殊信息無(wú)法表示,這就使得HTml很難滿(mǎn)足信息共享最大化的要求.
源于對(duì)HTml語(yǔ)言現(xiàn)存問(wèn)題的分析,人們?cè)谡Z(yǔ)義網(wǎng)發(fā)展之初,就決定將Xml作為其語(yǔ)法層.和HTml一樣,Xml也是一種置標(biāo)語(yǔ)言,都屬于SGml的子語(yǔ)言集.但Xml最大的特點(diǎn)在于它是一種可擴(kuò)展的置標(biāo)語(yǔ)言,提供了一個(gè)標(biāo)準(zhǔn),根據(jù)這個(gè)標(biāo)準(zhǔn),用戶(hù)可以根據(jù)實(shí)際需要定義自己的置標(biāo)語(yǔ)言,并為你的這個(gè)置標(biāo)語(yǔ)言規(guī)定它特有的一套標(biāo)簽.準(zhǔn)確的說(shuō),Xml 是一種源置標(biāo)語(yǔ)言,它允許你根據(jù)它所提供的規(guī)則,制定各種各樣的置標(biāo)語(yǔ)言,并可以通過(guò)文檔類(lèi)型定義或Xml Schema來(lái)約束這些標(biāo)簽的內(nèi)部組織結(jié)構(gòu).但另一方面,由于X ml標(biāo)簽可以由用戶(hù)自行定制,這樣就可能會(huì)造成標(biāo)簽命名沖突的情況,為了解決這個(gè)問(wèn)題,W3C的X ml小組制定了有關(guān)命名空間(Name Space)的標(biāo)準(zhǔn)[2].例如:用戶(hù)可以聲明如下
它表明author這個(gè)標(biāo)簽是在K所代表的Name Space:http://foo.bar.com/x ml/customer.dtd中詳細(xì)聲明的.這樣即使其他人也自定義了author標(biāo)簽,只要它們的Name Space不同,也不會(huì)造成命名沖突.因此,這一層通過(guò)Xml的特性,實(shí)現(xiàn)了文檔對(duì)自身結(jié)構(gòu)的描述,實(shí)現(xiàn)了跨應(yīng)用的語(yǔ)法互操作層,這是傳統(tǒng)的H T ml語(yǔ)言所無(wú)法完成的.
3.4 RDF和RDF Schema(元數(shù)據(jù)層)
Xml提供了Web數(shù)據(jù)編碼的語(yǔ)法依據(jù),而RDF則規(guī)定了相關(guān)資源的語(yǔ)義描述框架.正如其名,RDF并不是一種新的語(yǔ)言,而是一個(gè)開(kāi)放的元數(shù)據(jù)描述框架,它屬于語(yǔ)義網(wǎng)絡(luò)中的元數(shù)據(jù)層.在RDF資源描述框架中主要涉及到以下三個(gè)概念[3]:
資源:資源泛指可通過(guò)URI標(biāo)識(shí)的任何事物.
特性:特性是描述某個(gè)資源的性質(zhì)、特征、屬性或關(guān)系.
陳述:陳述是有關(guān)具體資源對(duì)象特性的具體描述.
任何復(fù)雜的系統(tǒng)都可以通過(guò)合理的分解操作,簡(jiǎn)化成一組三元組(或陳述)集合.RDF是基于這一思想的:被描述的事物,具有一些屬性,而這些屬性各有其值,資源可以通過(guò)枚舉該資源的相關(guān)屬性及屬性取值來(lái)描述.R D F通過(guò)特定的術(shù)語(yǔ)來(lái)區(qū)分陳述中的各個(gè)組成部分,基于RDF的資源描述是由若干條資源陳述組成,并把這些陳述用特定的語(yǔ)法(如Xml,N3等)表示出來(lái).
和Xml類(lèi)似,RDF描述模型只是提供了一種與領(lǐng)域無(wú)關(guān)的通用數(shù)據(jù)描述方式,有關(guān)特定域元數(shù)據(jù)的定義和它們的語(yǔ)義信息描述還需要制定額外的標(biāo)準(zhǔn)或規(guī)范.
這個(gè)額外的措施就是RDFSchema,實(shí)際上在RDF中只定義了少量常用的建模原語(yǔ),如RDF:Resource、RDF: Property、RDF:Statement、RDF:Subject等,其并沒(méi)有給出與具體應(yīng)用領(lǐng)域相關(guān)的建模原語(yǔ),而RDFSchema規(guī)范則進(jìn)一步定義了與具體應(yīng)用領(lǐng)域相關(guān)的建模原語(yǔ),能為特定目標(biāo)的應(yīng)用提供一個(gè)共同的基礎(chǔ).在RDFSchema中,最基本的建模原語(yǔ)包括:Class,Subclass-of和Property等.有了這些原語(yǔ)之后,你就可以構(gòu)建與具體領(lǐng)域相關(guān)的RDF數(shù)據(jù)描述模型了.此外,RDFSchema還可以對(duì)RDF數(shù)據(jù)給出一定程度的解釋和合理性驗(yàn)證.
3.5 Ontology Vocabulary(詞匯層)
RDFSchema可以定義類(lèi)、子類(lèi)、超類(lèi),并且可以定義特性和子特性,以及它們的約束,包括特性所適用的領(lǐng)域和特性的取值范圍等,因此,在某種意義上說(shuō),RDFSchema本身就是一種簡(jiǎn)單的本體語(yǔ)言.但是RDFSchema對(duì)特定應(yīng)用領(lǐng)域的概念關(guān)系的描述能力還比較弱,有必要進(jìn)一步的擴(kuò)展.因此,在語(yǔ)義網(wǎng)絡(luò)體系結(jié)構(gòu)中的第三層就是對(duì)RDF Schema層的擴(kuò)展——本體層.
本體這一概念最初起源于哲學(xué)領(lǐng)域,古希臘哲學(xué)家亞里士多德從哲學(xué)的角度對(duì)本體做了如下的定義:“本體是對(duì)世界上客觀存在物的系統(tǒng)地描述,即存在論,是客觀存在的一個(gè)系統(tǒng)的解釋或說(shuō)明,關(guān)心的是客觀現(xiàn)實(shí)的抽象本質(zhì)”.在近一、二十年來(lái),本體論已逐漸被引用于知識(shí)表示、共享和重用以及其它相關(guān)領(lǐng)域.在人工智能界,最早給出Ontology定義的是Neches等人,他們將Ontology定義為“給出構(gòu)成相關(guān)領(lǐng)域詞匯的基本術(shù)語(yǔ)和關(guān)系,以及利用這些術(shù)語(yǔ)和關(guān)系構(gòu)成的規(guī)定這些詞匯外延和規(guī)則的定義”.Neches認(rèn)為:“本體定義了組成主題領(lǐng)域的詞匯表的基本術(shù)語(yǔ)及其關(guān)系,以及結(jié)合這些術(shù)語(yǔ)和關(guān)系來(lái)定義詞匯表外延的規(guī)則.”后來(lái)在信息系統(tǒng)、知識(shí)系統(tǒng)等領(lǐng)域,越來(lái)越多的人在研究本體時(shí),給出了許多不同的定義.其中最著名并引用最廣的定義是由Gruber提出的:“本體是概念模型的明確的規(guī)范化說(shuō)明”[4],這個(gè)定義主要包含以下四層含義:
(1)概念化:客觀世界中現(xiàn)象的抽象模型;
(2)明確:概念及它們之間聯(lián)系都被精確定義;
(3)形式化:精確的數(shù)學(xué)描述,便于計(jì)算機(jī)的自動(dòng)處理;
(4)共享:本體中所反映的知識(shí)是大部分使用者所共同認(rèn)可的.
雖然不同研究者對(duì)本體有不同的描述,但是從內(nèi)涵上看,他們對(duì)本體的認(rèn)識(shí)是一致的,都是把本體當(dāng)作某個(gè)領(lǐng)域內(nèi)(可以是特定領(lǐng)域的,也可以是更廣的范圍)不同主體(人、代理、機(jī)器等)之間進(jìn)行交流(對(duì)話(huà)、互操作、共享等)的一種基礎(chǔ)設(shè)施,即通過(guò)本體所提供定義良好的領(lǐng)域概念結(jié)構(gòu),來(lái)描述概念以及領(lǐng)域中的各種關(guān)系,以便在不同應(yīng)用之間達(dá)成資源共享.
Ontology提供了語(yǔ)義交換的橋梁,能夠在不同的智能體之間達(dá)成有關(guān)術(shù)語(yǔ)概念的共識(shí),而對(duì)概念共享和理解恰恰是構(gòu)建語(yǔ)義網(wǎng)的關(guān)鍵,因此,本體層在語(yǔ)義網(wǎng)體系結(jié)構(gòu)中,處于核心支配地位,為其它各層提供基礎(chǔ)服務(wù).
3.6 Logic、Proof&Trust(邏輯層)
在語(yǔ)義網(wǎng)絡(luò)體系結(jié)構(gòu)中,邏輯層的目標(biāo)就是提供一種規(guī)則描述方法,邏輯主要通過(guò)能由計(jì)算機(jī)自動(dòng)推理的規(guī)則集來(lái)反映,這些規(guī)則集則通過(guò)各種機(jī)器可所識(shí)別的邏輯描述語(yǔ)言表示出來(lái).描述邏輯標(biāo)記語(yǔ)言(Description LogicmarkupLanguage,DLml)就是這樣的一種方法,它通過(guò)DTD封裝了描述邏輯中的邏輯連接詞,可將基于描述邏輯的形式化知識(shí)嵌入到被描述的文檔中.針對(duì)語(yǔ)義網(wǎng)上的各種不同類(lèi)型的應(yīng)用,邏輯層可能會(huì)采用多種邏輯語(yǔ)言的實(shí)現(xiàn)形式,這一點(diǎn)就和互聯(lián)網(wǎng)中的TCP/IP協(xié)議的模型中的每一層都會(huì)針對(duì)不同的硬件和軟件系統(tǒng)采用不同的實(shí)現(xiàn)類(lèi)似.
目前有關(guān)語(yǔ)義網(wǎng)的研究主要集中于前三層的研究,對(duì)Proof和Trust這兩部分內(nèi)容在概念上目前還沒(méi)有一個(gè)成熟的說(shuō)法.但是語(yǔ)義網(wǎng)的研究者普遍認(rèn)為Proof和Trust將是下一代萬(wàn)維網(wǎng)的重要概念,Proof層主要是計(jì)算機(jī)對(duì)其經(jīng)過(guò)推理所得的結(jié)論,自動(dòng)的給出一個(gè)合理的解釋.由于Web所特有的開(kāi)放性,使得任何人都能很方便的發(fā)布信息,因此,在語(yǔ)義網(wǎng)絡(luò)中,還需要構(gòu)建一個(gè)Trust層,用以對(duì)源信息以及推理的可信度提供有效的衡量和評(píng)價(jià).
目前,語(yǔ)義網(wǎng)技術(shù)正逐漸引起越來(lái)越多人們的關(guān)注,基于語(yǔ)義網(wǎng)技術(shù)的應(yīng)用研究也越來(lái)越多,如智能信息檢索、企業(yè)間數(shù)據(jù)交換及知識(shí)管理、Web服務(wù)等[5].
4.1 智能信息檢索
海量信息檢索一直是信息學(xué)領(lǐng)域的重要研究課題.但是,萬(wàn)維網(wǎng)上松散雜亂的信息描述方法使得信息檢索面臨了種種窘境.因此要改進(jìn)信息檢索效果,就必須對(duì)萬(wàn)維網(wǎng)上的信息進(jìn)行整理和重新規(guī)范.當(dāng)代萬(wàn)維網(wǎng)上保留有高速發(fā)展期間產(chǎn)生的大量普通HTml頁(yè)面,整理這些信息的實(shí)質(zhì)性問(wèn)題就是如何從HTml頁(yè)面中提取出語(yǔ)義信息,構(gòu)建出頁(yè)面內(nèi)容的本體結(jié)構(gòu),并通過(guò)資源描述框架模型來(lái)建立頁(yè)面的索引信息,前人對(duì)傳統(tǒng)萬(wàn)維網(wǎng)信息內(nèi)容模型、信息檢索和信息提取、計(jì)算語(yǔ)言學(xué)、機(jī)器學(xué)習(xí)等方面展開(kāi)了大量的研究,并取得了很多成果,為網(wǎng)絡(luò)信息的整理奠定了很好的基礎(chǔ)[6].一種可行的方法就是采用本體自學(xué)習(xí)系統(tǒng),實(shí)現(xiàn)本體的自動(dòng)或半自動(dòng)提取,盡可能減少人的參與程度.
4.2 企業(yè)間數(shù)據(jù)交換及知識(shí)管理
企業(yè)間的數(shù)據(jù)交換和企業(yè)內(nèi)的知識(shí)管理一直是基于萬(wàn)維網(wǎng)的電子商務(wù)和ERP系統(tǒng)所著重解決的問(wèn)題,現(xiàn)有很多項(xiàng)目[7]都圍繞著企業(yè)萬(wàn)維網(wǎng)知識(shí)管理而展開(kāi),這些項(xiàng)目潛在的假設(shè)就是:企業(yè)提供的萬(wàn)維網(wǎng)信息結(jié)構(gòu)可以轉(zhuǎn)化成為一個(gè)巨大的知識(shí)庫(kù),這種轉(zhuǎn)化的重要基礎(chǔ)就是利用基于本體的元數(shù)據(jù)結(jié)構(gòu)來(lái)對(duì)企業(yè)發(fā)布的信息或企業(yè)的內(nèi)部文檔進(jìn)行標(biāo)注.圍繞這一假設(shè),需要開(kāi)發(fā)一系列的相關(guān)技術(shù)和工具:如企業(yè)知識(shí)的建模、標(biāo)注工具、本體的構(gòu)建工具、本體的推理工具等.Ontoweb就是這樣的一個(gè)項(xiàng)目,它的目標(biāo)在于激勵(lì)和支持語(yǔ)義網(wǎng)技術(shù)從學(xué)術(shù)界向工業(yè)界的轉(zhuǎn)化,同時(shí)也向工業(yè)界證實(shí)本體在知識(shí)管理、電子商務(wù)以及企業(yè)信息集成方面所具有的潛在價(jià)值.
4.3 Web服務(wù)
當(dāng)代萬(wàn)維網(wǎng)正在從一個(gè)文本、圖片、音頻、視頻的靜態(tài)信息提供者向服務(wù)的提供者轉(zhuǎn)變,這種轉(zhuǎn)變體現(xiàn)了“網(wǎng)絡(luò)就是計(jì)算機(jī),軟件就是服務(wù)”的思想.產(chǎn)業(yè)界目前推行的WebServices技術(shù),就是通過(guò)萬(wàn)維網(wǎng)向消費(fèi)者提供了網(wǎng)絡(luò)服務(wù)功能.由于在Web環(huán)境下的分布式計(jì)算涉及到平臺(tái)的異構(gòu)性,因此它的核心技術(shù)包括Xml作為數(shù)據(jù)傳輸和交換的標(biāo)準(zhǔn)格式,以SOAP作為發(fā)送和接收Xml數(shù)據(jù)的基本消息協(xié)議,底層的傳輸則采用HTTP、FTP、SMT P等Internet協(xié)議,服務(wù)的描述、查找和發(fā)布則采用了WSDL、DISCO、UDDI等協(xié)議.當(dāng)前,WebService并沒(méi)有以語(yǔ)義網(wǎng)絡(luò)為基礎(chǔ),基本上還是采用固定的標(biāo)準(zhǔn)化分類(lèi)方式來(lái)描述服務(wù)的功能、提供者以及獲取服務(wù)的方式,由于WebServices技術(shù)只在語(yǔ)法層面上限定了服務(wù)描述所采用的協(xié)議,因此它們對(duì)服務(wù)的語(yǔ)義描述能力非常有限,而且缺少必要的靈活性.學(xué)術(shù)界在語(yǔ)義網(wǎng)研究中提出了一些基于本體的服務(wù)描述語(yǔ)言如O WL等[8],這些語(yǔ)言為Semantic Web和WebServices的結(jié)合提供了一個(gè)良好的契機(jī).通過(guò)創(chuàng)建基于本體的服務(wù)描述,使得WebService能夠透明的被計(jì)算機(jī)所理解,同時(shí)這種描述能夠被A-gent程序自動(dòng)發(fā)現(xiàn)和處理,增強(qiáng)了消費(fèi)者和WebServices之間的可交互性.
語(yǔ)義網(wǎng)的研究是人類(lèi)探索如何有效利用知識(shí)信息的一次變革,它作為一種智能網(wǎng)絡(luò)技術(shù)最終能理解人類(lèi)語(yǔ)言,它的實(shí)現(xiàn)必將促進(jìn)人類(lèi)對(duì)知識(shí)的高效利用.
〔1〕Berners-Lee T ,F(xiàn)ischetti M.Weaving the web:The original design and ultimate destiny of the World Wide Web by its inventor.Harper,San Francisco,1998.
〔2〕T Bray,J Paoli,C Sperberg -McQueen.Extensible markup language(xml).W3C,1998.
〔3〕Frank Manola,Ericmiller.RDFprimer.W3C Working Draft[S].田春虎.國(guó)內(nèi)語(yǔ)義Web研究綜述.情報(bào)學(xué)報(bào),2005,24(2):243-249.
〔4〕王竹曉,殷兆麟,張凝,渠本哲,邢寶燕.基于結(jié)構(gòu)相似性的語(yǔ)義網(wǎng)信息檢索.計(jì)算機(jī)工程與設(shè)計(jì),2006,27(13):2438-2440.
〔5〕董慧,趙霞.基于語(yǔ)義網(wǎng)的本體轉(zhuǎn)換模型研究.情報(bào)科學(xué).2006,25(1):36-42.
〔6〕劉琴.語(yǔ)義Web上的Onto1ogy表示語(yǔ)言研究.計(jì)算機(jī)工程與設(shè)計(jì).2006,27(12):2166-2168.
TP391
A
1673-260X(2010)04-0018-03