【摘 要】在研究現(xiàn)有本體構(gòu)建方法的基礎(chǔ)上,針對戰(zhàn)斗機領(lǐng)域本體的構(gòu)建需求,分析了戰(zhàn)斗機領(lǐng)域本體的構(gòu)建范圍、屬性和關(guān)系類型等。描述了戰(zhàn)斗機領(lǐng)域本體構(gòu)建的方法和步驟,結(jié)合本體重用、基于互信息的本體半自動構(gòu)建和人工校核的方式,實現(xiàn)對領(lǐng)域本體的快速有效構(gòu)建。
【關(guān)鍵詞】領(lǐng)域本體;本體構(gòu)建;戰(zhàn)斗機;敘詞表;互信息
1.引言
近幾年,國內(nèi)外不少學(xué)者對領(lǐng)域本體的構(gòu)建進行了探索研究,有的已建立了可投入應(yīng)用的本體。但是對于戰(zhàn)斗機領(lǐng)域本體的構(gòu)建,未有太多研究成果。借鑒現(xiàn)有的領(lǐng)域本體構(gòu)建方法,要么工作量大、時間長,要么本體質(zhì)量不高,適應(yīng)性不強。本文在分析基于本體工程和敘詞表領(lǐng)域本體構(gòu)建方法的基礎(chǔ)上,結(jié)合本體重用、基于互信息的本體半自動構(gòu)建和人工校核的方式,提出了一種更有效率的戰(zhàn)斗機領(lǐng)域本體構(gòu)建方法。
2.本體的定義
1991年Neches等人最早給出本體在計算機科學(xué)中的定義:“給出構(gòu)成相關(guān)領(lǐng)域詞匯的基本術(shù)語和關(guān)系,以及利用這些術(shù)語和關(guān)系構(gòu)成的規(guī)定這些詞匯外延規(guī)則的定義”[2]。1993年Gruber定義本體為“概念模型的明確的規(guī)范說明”[1]。1997年Borst進一步完善為“共享概念模型的形式化規(guī)范說明”[3]。Studer等人對上述兩個定義進行了深入研究,認為本體是共享概念模型的明確的形式化規(guī)范說明[4],這也是目前對本體概念的統(tǒng)一看法。
3.本體的構(gòu)建方法
國內(nèi)外在本體構(gòu)建方法的研究上,主要針對以下兩種:一是從知識工程的角度,探討本體的構(gòu)建方法,稱為本體工程;二是探討利用現(xiàn)有的敘詞表資源,直接向本體轉(zhuǎn)化的方法。
3.1 本體工程
本體工程方法的主要特點是強調(diào)構(gòu)建本體時要按照一定的規(guī)范和標準,比較著名的方法包括TOVE法、骨架法和七步法等。
TOVE法。加拿大Toronto大學(xué)企業(yè)集成實驗室基于在商業(yè)過程和活動建模領(lǐng)域內(nèi)開發(fā)TOVE項目本體的經(jīng)驗,通過本體建立指定知識的邏輯模型。用一階邏輯構(gòu)造了形式化的集成模型,包含企業(yè)設(shè)計本體、項目本體、調(diào)度本體或服務(wù)本體。
骨架法。專門用來建立企業(yè)本體,為企業(yè)本體建模過程提供了指導(dǎo)性的方針,主要有以下5個階段:①確定本體應(yīng)用的目的和范圍;②本體分析;③本體表示;④本體評價;⑤本體的建立。
七步法。斯坦福大學(xué)開發(fā)的領(lǐng)域本體構(gòu)建方法,具體包括7個階段:①確定本體的領(lǐng)域和范圍;②考慮復(fù)用現(xiàn)有的本體;③列出本體中的重要術(shù)語;④定義類和類的等級體系;⑤定義類的屬性;⑥定義屬性的槽;⑦創(chuàng)建實例。
目前本體工程中尚沒有權(quán)威的方法論,缺乏標準化的管理和制約。以上幾種方法均是在本體構(gòu)建項目中總結(jié)出來的。
3.2 基于敘詞表的本體構(gòu)建
敘詞表收錄了某一領(lǐng)域的所有敘詞和非敘詞,并按照一定順序排列。敘詞表的語義關(guān)系包括“用、代、屬、分、參”,分別用來表示敘詞之間的等同、等級、相關(guān)等語義關(guān)系。由于敘詞表包含豐富的領(lǐng)域概念和一定的語義關(guān)系,在表達知識結(jié)構(gòu)上與本體有著天然聯(lián)系,包含了本學(xué)科領(lǐng)域中相對比較完整的術(shù)語,因此,國內(nèi)外很多學(xué)術(shù)機構(gòu)都在嘗試基于敘詞表進行本體的構(gòu)建,研究重點在于敘詞表向本體轉(zhuǎn)換的方法。
4.戰(zhàn)斗機領(lǐng)域本體構(gòu)建
4.1 本體構(gòu)建思路
本研究在深入考察現(xiàn)有的本體構(gòu)建方法和現(xiàn)有領(lǐng)域資源的基礎(chǔ)上,提出構(gòu)建戰(zhàn)斗機領(lǐng)域本體的指導(dǎo)方法。核心思想是,從本體工程的基本思想出發(fā),借助敘詞表和其他語義資源,結(jié)合本體重用、基于互信息的本體半自動構(gòu)建和人工校核的方式,完成領(lǐng)域本體的構(gòu)建。
本研究方法的意義在于,可以重用已有本體規(guī)范的術(shù)語和本體關(guān)系,同時引入半自動本體構(gòu)建方法,降低了領(lǐng)域?qū)<沂止?gòu)建本體的工作量;保留人工校核和專家評價,以保證本體構(gòu)建結(jié)果的準確性和專業(yè)性。
圖4-1 戰(zhàn)斗機領(lǐng)域本體構(gòu)建方法框架圖
4.2 本體構(gòu)建步驟
4.2.1 確定本體的領(lǐng)域和范圍
在本體構(gòu)建之初,確定本體的領(lǐng)域和范圍是非常重要的。戰(zhàn)斗機領(lǐng)域本體的范圍需要覆蓋型號研制全生命期、全部專業(yè)領(lǐng)域涉及的術(shù)語和術(shù)語關(guān)系。
(1)戰(zhàn)斗機領(lǐng)域本體的型號覆蓋范圍能夠覆蓋三代和四代戰(zhàn)斗機相關(guān)型號。
(2)戰(zhàn)斗機領(lǐng)域本體的生命期覆蓋范圍能夠覆蓋型號研制的全生命期,包括:立項論證、方案設(shè)計、工程研制、設(shè)計定型、生產(chǎn)定型。
(3)戰(zhàn)斗機領(lǐng)域本體的專業(yè)覆蓋范圍能夠覆蓋型號研制全部專業(yè)領(lǐng)域,包括:總體、氣動、結(jié)構(gòu)、強度、飛行控制、飛行力學(xué)、機電與推進系統(tǒng)、航電、武器、飛行試驗。
4.2.2 本體頂層設(shè)計
由于領(lǐng)域本體構(gòu)建是一個從無到有的過程,因此需要對領(lǐng)域本體的頂層框架進行設(shè)計。
4.2.2.1 本體頂層分類設(shè)計
本體頂層分類通過自頂向下展開的方式進行設(shè)計,首先確定以“戰(zhàn)斗機”為核心的一級分類,然后確定各專業(yè)的二級分類。本體的頂層分類將作為后續(xù)術(shù)語選取和劃分的基本依據(jù)。
戰(zhàn)斗機領(lǐng)域本體的一級類劃分如下:
(1)飛行器:進一步劃分為“機體”、“飛行器管理系統(tǒng)”、“任務(wù)管理系統(tǒng)”、“公共管理系統(tǒng)”。
(2)飛行原理:進一步劃分為“空氣動力學(xué)”、“飛行力學(xué)”。
戰(zhàn)斗機領(lǐng)域本體中進行二級類劃分的專業(yè)如下:總體、氣動、強度、結(jié)構(gòu)、飛行控制、機電系統(tǒng)、推進系統(tǒng)、航電系統(tǒng)、武器系統(tǒng)、飛行試驗。
4.2.2.2 術(shù)語基礎(chǔ)內(nèi)容設(shè)計
術(shù)語是本體的基本組成單位,定義術(shù)語基礎(chǔ)內(nèi)容及其標準是非常重要的。戰(zhàn)斗機領(lǐng)域本體的術(shù)語基礎(chǔ)內(nèi)容包括:
(1)術(shù)語:術(shù)語名稱本身,應(yīng)是領(lǐng)域內(nèi)對某一概念較為統(tǒng)一、正式的常用叫法。
(2)術(shù)語定義:對一個術(shù)語的準確、完整、詳細的解釋和描述。
4.2.2.3 術(shù)語間關(guān)系類型設(shè)計
本體中的關(guān)系體現(xiàn)了術(shù)語與術(shù)語之間的聯(lián)系,戰(zhàn)斗機領(lǐng)域本體的術(shù)語間關(guān)系類型包括:
(1)同義關(guān)系:術(shù)語間在意義層面上相同或相似則構(gòu)成同義關(guān)系。
(2)上下位關(guān)系:如果兩個術(shù)語中,一個術(shù)語是另一個術(shù)語的子類,那么就說它們之間存在上下位關(guān)系。如“戰(zhàn)斗機”是“飛機”的下位詞,而“飛機”是“戰(zhàn)斗機”的上位詞。
(3)屬性關(guān)系:事物本身所固有的性質(zhì)。如“速度”是“飛機”的一個屬性。
(4)相關(guān)關(guān)系:術(shù)語之間存在的不包含在以上三類關(guān)系中的其他關(guān)系,統(tǒng)一劃歸為相關(guān)關(guān)系。
4.2.3 本體構(gòu)建
本體構(gòu)建的核心工作體現(xiàn)在術(shù)語選取和術(shù)語關(guān)系構(gòu)建上,因此需要選取合適的資源,配合可行的技術(shù)路線來完成。
4.2.3.1 術(shù)語選取
術(shù)語選取的主要目的是得到領(lǐng)域重要術(shù)語,這是本體構(gòu)建的重點和難點之一。本研究采用以詞典選取為主,從語義資源中提取關(guān)鍵詞為輔的方式來完成術(shù)語選取工作:
(1)根據(jù)本體頂層分類,從語義資源中抽取能代表該領(lǐng)域的頂層術(shù)語。本研究選擇從《航空百科詞典》的以下分類中選取頂層術(shù)語:航空器、總體參數(shù)、飛行器結(jié)構(gòu)、飛行器設(shè)計、強度分析與試驗、推進系統(tǒng)、航空發(fā)動機、飛行控制系統(tǒng)、航空電子系統(tǒng)、航空機電系統(tǒng)、飛機飛行操縱系統(tǒng)、飛機燃油系統(tǒng)、懸掛發(fā)射裝置、飛行試驗。
(2)從各類語義資源中初步選取能加入頂層術(shù)語分類下的領(lǐng)域術(shù)語。術(shù)語選取資源包括《航空百科詞典》和《飛機設(shè)計手冊》。其中,以《航空百科詞典》為主選擇術(shù)語,以《飛機設(shè)計手冊》中提取的關(guān)鍵詞為輔作為對術(shù)語的驗證和補充。
(3)由本體工程師對初步選取的術(shù)語進行校核,剔除其中領(lǐng)域無關(guān)的術(shù)語。
(4)請領(lǐng)域?qū)<覍徍舜_認,對領(lǐng)域術(shù)語的選取進行驗證。
4.2.3.2 術(shù)語關(guān)系構(gòu)建
建立術(shù)語關(guān)系,在本體構(gòu)建過程中是關(guān)鍵環(huán)節(jié)。傳統(tǒng)的本體關(guān)系構(gòu)建工作主要采用人工方式,由領(lǐng)域?qū)<彝瓿?,人力和時間投入巨大。為實現(xiàn)對領(lǐng)域本體的快速有效構(gòu)建,本研究結(jié)合本體重用、基于互信息的本體半自動構(gòu)建和人工校核的方法,以如下技術(shù)路線實現(xiàn)本體關(guān)系構(gòu)建:
(1)本體重用:在本體構(gòu)建過程中,首先采用本體重用的方式,利用已有資源,以減低人工投入,并盡可能保證結(jié)果的權(quán)威性、可靠性。本研究將選取的戰(zhàn)斗機領(lǐng)域術(shù)語分別與以下已有本體進行匹配:NASA敘詞表、航空科技資料主題詞表、國防科學(xué)技術(shù)敘詞表。
(2)半自動構(gòu)建:在本體重用的基礎(chǔ)上,引入了兩種提取相關(guān)術(shù)語的計算方法,實現(xiàn)對本體關(guān)系的半自動構(gòu)建。
方法一、基于詞典術(shù)語定義提取術(shù)語相關(guān)關(guān)系:匹配術(shù)語和術(shù)語定義,以得到術(shù)語的相關(guān)術(shù)語。凡在某術(shù)語的術(shù)語定義中出現(xiàn)且出現(xiàn)次數(shù)滿足一定閥值要求的術(shù)語,認為是該術(shù)語的相關(guān)術(shù)語。
方法二、基于互信息提取術(shù)語相關(guān)關(guān)系:通過計算互信息,得到術(shù)語的相關(guān)術(shù)語。兩個術(shù)語之間的互信息滿足一定閥值要求,認為二者語義相關(guān),是相關(guān)術(shù)語?;バ畔⒌乃枷胧牵簩τ趦蓚€術(shù)語,其互信息為M(x,y)=log(p(x,y)/p(x)p(y))。其中,p(x,y)為術(shù)語在語料中的共現(xiàn)頻率,信息值大說明術(shù)語間相關(guān)度高。
(3)人工校核:最后,由專家對本體構(gòu)建結(jié)果進行校核、確認。
圖4-2 戰(zhàn)斗機領(lǐng)域本體術(shù)語關(guān)系構(gòu)建技術(shù)路線
4.2.4 本體表示
本研究選用W3C推薦的OWL作為本體表示語言,其通用性及出色的語義表達能力,能夠很好的支持機器對文檔的推理,為本體的進一步應(yīng)用打下了基礎(chǔ)。
4.2.5 本體評價
通過制定本體評價標準對所建本體進行評價,并使本體通過領(lǐng)域?qū)<覐膶I(yè)角度進行的審核和評價。依據(jù)評價結(jié)果對本體構(gòu)建結(jié)果進行修正和進化。
5.結(jié)論
本文對領(lǐng)域本體構(gòu)建方法進行了研究,在借鑒業(yè)界已有理論和方法的基礎(chǔ)上,提出針對戰(zhàn)斗機領(lǐng)域本體的構(gòu)建方法與技術(shù)方案。結(jié)合本體重用、基于互信息的本體半自動構(gòu)建和人工校核的方式,提出了一種更有效率的戰(zhàn)斗機領(lǐng)域本體構(gòu)建方法,實現(xiàn)將術(shù)語間關(guān)系構(gòu)建盡可能通過計算機自動完成,減少領(lǐng)域?qū)<业墓ぷ髁?。通過本方法,初步構(gòu)建出了戰(zhàn)斗機領(lǐng)域本體。但是,由于各領(lǐng)域本體需求差異,本方法能否用于其他領(lǐng)域的本體構(gòu)建,有待進一步檢驗。
參考文獻:
[1]Gruber.A Translation Approach to Portable Ontologies[J].Knowledge Aequisition,1993,5(2):199-220.
[2]Neches R,F(xiàn)ikes R.E,Gruber TR.Enabling Technology for Knowledge Sharing[J].Al Magazine.1991(03)36-56.
[3]Borst W.N.Construction of Engineering Ontologies for Knowledge Sharing and Reuse.PhDthesis[D].University of Twente Enschede,1997.
[4]Studer R,Benjamins V.R,F(xiàn)ensel D.Knowledge Engineering,Principles and Methods[J].Data andKnowledge Engineering,1998,25(l-2):161-197.