錢曉雯 華 英
中圖分類號(hào):TP2文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1671-7597(2009)1210115-01
隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,遠(yuǎn)程教育越來(lái)越受到人們的關(guān)注。答疑系統(tǒng)作為網(wǎng)絡(luò)教育平臺(tái)的一個(gè)重要組成部分,在老師和學(xué)生之間的交流方面發(fā)揮著重要的作用。傳統(tǒng)的答疑系統(tǒng)比較集中在答疑方式和答疑系統(tǒng)的實(shí)時(shí)交互方面,對(duì)其中的關(guān)鍵部分-語(yǔ)義的理解,涉及的不是很多。
針對(duì)上面的問(wèn)題,本文提出用領(lǐng)域本體作為語(yǔ)義理解的基礎(chǔ)。本體(ontology)是一種用來(lái)描述概念以及概念和概念之間關(guān)系的模型,領(lǐng)域本體是本體的一種,它包含該領(lǐng)域的比較完整的知識(shí)和豐富的語(yǔ)義關(guān)系,把這些資源通過(guò)一種方法應(yīng)用到問(wèn)答查詢系統(tǒng)中,使得一定程度上解決目前答疑系統(tǒng)中語(yǔ)義的理解不足的問(wèn)題成為可能。
在問(wèn)答查找系統(tǒng)中,針對(duì)特定領(lǐng)域的答疑,需要建立相應(yīng)的領(lǐng)域本體。領(lǐng)域本體一般是由該領(lǐng)域的專家來(lái)建立。領(lǐng)域本體定義了該領(lǐng)域的一組術(shù)語(yǔ),這些術(shù)語(yǔ)稱之為概念。概念和概念之間的關(guān)系描述了該領(lǐng)域的概念結(jié)構(gòu)。
目前已有的領(lǐng)域本體很多,出于對(duì)各自問(wèn)題域和具體工程的考慮,構(gòu)造領(lǐng)域本體的過(guò)程也是各不相同的。由于沒(méi)有一個(gè)標(biāo)準(zhǔn)的構(gòu)造方法,不少研究人員從實(shí)踐出發(fā),提出了不少有益于構(gòu)造本體的標(biāo)準(zhǔn),其中最有影響的是Gruber于1995年在文獻(xiàn)中提出的5條規(guī)則:
1.明確性和客觀性:本體應(yīng)該用自然語(yǔ)言對(duì)術(shù)語(yǔ)給出明確、客觀的語(yǔ)義定義。2.完全性:所給出的定義是完整的,完全能表達(dá)所描述的術(shù)語(yǔ)的含義。3.一致性:由術(shù)語(yǔ)得出的推論與術(shù)語(yǔ)本身的含義是相容的,不會(huì)產(chǎn)生矛盾。4.最大單調(diào)可擴(kuò)展性:向本體中添加通用或?qū)S玫男g(shù)語(yǔ)時(shí),不需要修改已有的內(nèi)容。5.最小承諾:對(duì)待建模對(duì)象給出盡可能少的約束。
當(dāng)前對(duì)構(gòu)造本體的方法和性能評(píng)估還沒(méi)有一個(gè)統(tǒng)一的標(biāo)準(zhǔn),這是一個(gè)需要進(jìn)一步研究的方向。目前對(duì)于特定的應(yīng)用,本體的構(gòu)造方法不完全相同。但在構(gòu)造特定領(lǐng)域本體的過(guò)程中,有一點(diǎn)是得到大家公認(rèn)的,那就是需要該領(lǐng)域?qū)<业膮⑴c。下面,針對(duì)我們的答疑應(yīng)用,采用語(yǔ)義網(wǎng)絡(luò)的描述方法來(lái)構(gòu)造領(lǐng)域本體。
領(lǐng)域本體的開(kāi)發(fā)和完善是一個(gè)反反復(fù)復(fù)不斷補(bǔ)充的過(guò)程。領(lǐng)域本體中的概念應(yīng)該貼近于要研究的專業(yè)領(lǐng)域中的客觀實(shí)體和關(guān)系法則。它的構(gòu)造要經(jīng)過(guò)五個(gè)步驟:
1.確定領(lǐng)域本體的專業(yè)領(lǐng)域和范疇。可以通過(guò)確定專業(yè)領(lǐng)域和范疇作為開(kāi)發(fā)領(lǐng)域本體的起點(diǎn)。首先,要明確構(gòu)建的領(lǐng)域本體將覆蓋的專業(yè)領(lǐng)域、應(yīng)用本體的目的、本體應(yīng)該在哪些方面發(fā)揮作用以及它的系統(tǒng)維護(hù)者與應(yīng)用對(duì)象。
2.復(fù)用現(xiàn)有的本體。如果系統(tǒng)需要和其它的應(yīng)用平臺(tái)進(jìn)行互操作,而這個(gè)應(yīng)用平臺(tái)又與特定的領(lǐng)域本體或相關(guān)概念聯(lián)系在一起,那么復(fù)用現(xiàn)有的本體是行之有效的方法。許多現(xiàn)成的本體,例如前面提到的Ontolingua的
本體文庫(kù)、DAML的本體文庫(kù)UNSPSC、和DMOZ等,可以導(dǎo)入到本體開(kāi)發(fā)系統(tǒng)中,本體的格式轉(zhuǎn)換也并不困難。
3.列出本體涉及領(lǐng)域中的重要術(shù)語(yǔ)以及術(shù)語(yǔ)的屬性與屬性值。領(lǐng)域本體是描述概念以及概念與概念之間的關(guān)系,首先要列舉出該領(lǐng)域中的所有概念以及對(duì)該概念的詳細(xì)解釋,在特定領(lǐng)域,這些概念就是有關(guān)的專業(yè)術(shù)語(yǔ)。除此之外,針對(duì)每個(gè)概念,要列出它所有可能的屬性,每個(gè)屬性都有對(duì)應(yīng)的屬性值。
4.定義關(guān)聯(lián)結(jié)點(diǎn)。為了對(duì)概念和概念之間的關(guān)聯(lián)關(guān)系進(jìn)行詳細(xì)的說(shuō)明,需要對(duì)概念定義關(guān)聯(lián)結(jié)點(diǎn)。例如,為了說(shuō)明概念“內(nèi)模式”和“外模式”的區(qū)別,在概念“內(nèi)模式”下存在一個(gè)關(guān)聯(lián)結(jié)點(diǎn):區(qū)別,該結(jié)點(diǎn)關(guān)聯(lián)另外一個(gè)概念“內(nèi)模式”。并需要對(duì)該關(guān)聯(lián)結(jié)點(diǎn)詳細(xì)說(shuō)明。
5.定義概念之間的各種關(guān)系。在領(lǐng)域本體中,概念和概念之間通過(guò)關(guān)系來(lái)交互。在知網(wǎng)中,一共描述了概念之間的8種關(guān)系;上下位關(guān)系、同義關(guān)系、反義關(guān)系、對(duì)義關(guān)系、屬性-宿主關(guān)系、整體部分關(guān)系、材料-成品關(guān)系、事件-角色關(guān)系。
知網(wǎng)可以看成是一個(gè)龐大的通用本體,構(gòu)建這樣的本體是件非常費(fèi)時(shí)費(fèi)力的事情。針對(duì)特定領(lǐng)域答疑系統(tǒng)的特點(diǎn),在我們構(gòu)建的領(lǐng)域本體中使用了四種關(guān)系:繼承關(guān)系、部分關(guān)系、相關(guān)關(guān)系和同義關(guān)系,其中的繼承關(guān)系可以看成是知網(wǎng)中的上下位關(guān)系。
1.繼承關(guān)系(is_a)。繼承表示概念之間的包含和被包含關(guān)系,也可以看成是概念之間的泛化和特化關(guān)系。如果概念Ci是Cj的一種特殊概念,那么我們說(shuō)概念Ci是概念Cj的特化,概念Cj是概念Ci的泛化,概念Ci繼承于概念Cj。概念都有它自己的屬性。如果兩個(gè)概念間存在繼承關(guān)系,那么繼承的概念將擁有被繼承概念的所有屬性。例如,概念Cj繼承于概念Ci。那么概念Cj將擁有概念Ci的所有屬性,另外還可能有它區(qū)別于概念Cj的特殊屬性。
如果概念Cj同時(shí)繼承于Ci和Ck。這是一種多重繼承(與面向?qū)ο蟮母拍罘浅O嗨?。
2.整體部分關(guān)系(part of)。概念和概念之間存在著整體部分關(guān)系。如果概念Cj是概念Ci的一個(gè)組成部分,那么我們說(shuō)概念Ci和概念Cj之間存在整體部分關(guān)系。在數(shù)據(jù)庫(kù)領(lǐng)域中,概念“前像”、“后像”都是概念“運(yùn)行記錄”的組成部分,所以“運(yùn)行記錄”和“前像”、“后像”之間是整體部分關(guān)系。
3.相關(guān)關(guān)系(relevant of)。相關(guān)關(guān)系表明概念和概念由于某個(gè)主題而相互關(guān)聯(lián)。概念 “前像”和“后像”由于都是“運(yùn)行記錄”的一部分而存在一種相關(guān)關(guān)系。相關(guān)關(guān)系可由繼承關(guān)系和部分關(guān)系中導(dǎo)出, 所以圖中可以不畫(huà)出來(lái)。
4.同義關(guān)系(synonymy of)。在一個(gè)領(lǐng)域中,一個(gè)概念可能有幾種不同的表示方式,也就是可以用不同的詞語(yǔ)來(lái)表示一個(gè)相同的概念。例如:“數(shù)據(jù)庫(kù)管理系統(tǒng)”和“DBMS”、“聚集”和“簇集”都是同一概念的兩種不同的說(shuō)法,所以這兩個(gè)概念之間存在同義關(guān)系。在圖中,同義關(guān)系用一根不帶箭頭的實(shí)線相連,繼承關(guān)系和部分關(guān)系是兩種最主要的關(guān)系,相關(guān)關(guān)系可以從繼承關(guān)系和部分關(guān)系中體現(xiàn)出來(lái)。出現(xiàn)同義關(guān)系的概念不是很多。
應(yīng)用上面的四種關(guān)系,我們可以把領(lǐng)域中的概念構(gòu)建成一個(gè)具有等級(jí)的網(wǎng)絡(luò)結(jié)構(gòu)。構(gòu)建的過(guò)程是一個(gè)概念不斷細(xì)化或泛化的過(guò)程。下面介紹構(gòu)建等級(jí)網(wǎng)絡(luò)結(jié)構(gòu)的方法。建立一個(gè)等級(jí)網(wǎng)絡(luò)體系有3種可行的方法。
自頂向下法:由某一領(lǐng)域中最大的概念開(kāi)始,通過(guò)逐層的添加子概念將這些概念細(xì)化。最終得到本體的等級(jí)網(wǎng)絡(luò)結(jié)構(gòu)。
自底向上法:由最底層、最細(xì)小的概念定義開(kāi)始,將這些細(xì)化的概念一層一層的組織在更加綜合的概念之下,形成一個(gè)等級(jí)網(wǎng)絡(luò)結(jié)構(gòu)。
綜合法:首先定義很多非常顯而易見(jiàn)的概念,然后分別將它們向上層進(jìn)行恰當(dāng)?shù)貧w納和向下層進(jìn)行細(xì)化,構(gòu)成一個(gè)等級(jí)網(wǎng)絡(luò)結(jié)構(gòu)。
至于具體在實(shí)踐中采取什么方法構(gòu)建等級(jí)網(wǎng)絡(luò)結(jié)構(gòu), 主要取決于于開(kāi)發(fā)人員對(duì)專業(yè)領(lǐng)域的個(gè)人觀點(diǎn)。由于綜合法是從一些最普通的概念入手,比較符合人的習(xí)慣,所以綜合法對(duì)本體開(kāi)發(fā)者而言最便捷。
參考文獻(xiàn):
[1]Ontology Development 101:A Guide to Creating Your First Ontology.http://protege.standford.edu/publications/ontology_development/ontology101noy-mcguinness.htm.