梁振霖,胡 斌
(華中科技大學(xué)管理學(xué)院,湖北 武漢 430074)
本體論(ontology)最早屬哲學(xué)的范疇,是一種對存在的系統(tǒng)化解釋,20世紀(jì)80年代末本體開始被引入人工智能領(lǐng)域,到20世紀(jì)90年代初國際計算機(jī)界為了就本體的定義和一些公理及規(guī)范化表述達(dá)成共識召開了多次研討會,其中最著名的定義是GRUBER在1993年提出的“本體論是對概念模型的精確描述”,因此有人把本體論工程稱為連接信息系統(tǒng)與哲學(xué)之間的紐帶。NICOLA把概念模型定義為:C=<D,W,R>,其中D為一個領(lǐng)域,W為該領(lǐng)域中相關(guān)事物狀態(tài)的集合,R為領(lǐng)域空間<D,W>上概念關(guān)系的集合,本體論即為采用某種語言對概念模型的描述[1]。本體提供清楚且正式的語義信息,且本體是自然描述某個領(lǐng)域的概念、概念的屬性及其概念之間的關(guān)系,因此可以方便地共享和復(fù)用。
本體的構(gòu)建即把現(xiàn)實的領(lǐng)域問題抽象為一組概念及概念之間的關(guān)系[2],并準(zhǔn)確地轉(zhuǎn)化為計算機(jī)可以理解的語義[3]。目前在國際上關(guān)于醫(yī)學(xué)、保健和產(chǎn)品銷售的詞匯已經(jīng)有了通用的本體庫,但在很多領(lǐng)域還是缺乏能廣泛使用的本體。國內(nèi)學(xué)者對本體的研究已有10多年,與國外相比在理論研究和實踐構(gòu)建上都存在一定的差距。陸汝鈴等從實用的角度對本體進(jìn)行了如下定義:“本體是關(guān)于某個主題的形式化和說明性表示,包括它的論域、論域中諸對象的名稱、定義及相互關(guān)系”。曹存根的團(tuán)隊建立了植物學(xué)本體、關(guān)于人的頂層本體,研究了基于本體的知識獲取方法。張維明對領(lǐng)域本體的表示、推理和集成進(jìn)行了研究。整體而言目前國內(nèi)對本體的研究仍處于起步階段,特別是在領(lǐng)域本體構(gòu)建方面缺少能得到大家認(rèn)可的貢獻(xiàn),因此本體在它最初提出來時的優(yōu)勢無法體現(xiàn),這也是目前本體研究遭遇瓶頸階段的一個重要原因?,F(xiàn)階段本體論發(fā)展必須由各領(lǐng)域?qū)<以谧约侯I(lǐng)域內(nèi)建立信息完備的領(lǐng)域本體,擴(kuò)充各個領(lǐng)域的本體庫,達(dá)到領(lǐng)域知識復(fù)用的目的。
在模擬系統(tǒng)開發(fā)上本體已經(jīng)有了研究成果[4],且因其良好的概念層次結(jié)構(gòu)和對邏輯推理的支持而得到了廣泛的應(yīng)用[5]。陳剛等設(shè)計并實現(xiàn)了虛擬領(lǐng)域本體構(gòu)造[6],該系統(tǒng)在領(lǐng)域知識庫中只保存最基本的領(lǐng)域本體,當(dāng)用戶需要新的領(lǐng)域本體時,由系統(tǒng)經(jīng)過分析用戶提出的具體需求后對已有的領(lǐng)域本體進(jìn)行重新組合或增減,從而在現(xiàn)有領(lǐng)域本體的基礎(chǔ)上動態(tài)地構(gòu)造出新的領(lǐng)域本體。因此,將本體用于管理系統(tǒng)模擬領(lǐng)域,可基于已封裝了功能和數(shù)據(jù)的模擬服務(wù)組件,用本體描述領(lǐng)域概念、模擬需求,以及模擬組件的屬性,根據(jù)實際場景及需求,實時匹配和組合模擬服務(wù)組件[7-8],更智能化地應(yīng)對復(fù)雜環(huán)境,建立面向服務(wù)的模擬模型。筆者將初步構(gòu)建出管理系統(tǒng)模擬中離散事件模型的領(lǐng)域本體,并驗證領(lǐng)域本體的準(zhǔn)確性。
按照領(lǐng)域依賴程度,本體可以分為以下4種:
(1)頂層本體(top-level ontology)。描述最普通的概念及概念之間的關(guān)系,它完全獨立于特定的問題和領(lǐng)域,是具有普遍意義的描述客觀世界常識的本體。
(2)領(lǐng)域本體(domain ontology)。描述特定領(lǐng)域中的概念及概念之間的關(guān)系。
(3)任務(wù)本體(tast ontology)。描述特定任務(wù)或行為中的概念及概念之間的關(guān)系。
(4)應(yīng)用本體(application ontology)。描述依賴于特定領(lǐng)域和任務(wù)的概念及概念之間的關(guān)系。
其中領(lǐng)域本體和任務(wù)本體在同一研發(fā)層次,它們都能引用頂層本體中定義的詞匯來描述自己的詞匯,應(yīng)用本體既能引用領(lǐng)域本體中的概念,也能引用任務(wù)本體中的概念。這四者的關(guān)系可用圖形表示,如圖1所示。
圖1 按照領(lǐng)域依賴程度的本體分類
對離散事件模擬模型的本體表達(dá)屬于領(lǐng)域本體這一層次。
構(gòu)建領(lǐng)域本體的基本思路如下:
(1)需求分析。構(gòu)建領(lǐng)域本體要反映出用戶對系統(tǒng)功能的需求,要明確創(chuàng)建本體的范圍;
(2)制定計劃。制定本體構(gòu)建計劃先列出領(lǐng)域內(nèi)所有相關(guān)的概念和覆蓋的知識,在工作的每個階段明確計劃中要達(dá)到的工作目標(biāo),對任務(wù)層層分解,以便有效地控制和協(xié)調(diào);
(3)構(gòu)建本體。用本體語言表示出領(lǐng)域本體的主要概念,揭示概念間的各種關(guān)系;
(4)評價本體。對構(gòu)建好的本體,從正確性和有效性方面進(jìn)行評價,確定本體是否能有效應(yīng)用;
(5)本體進(jìn)化。隨著領(lǐng)域知識的增加和應(yīng)用需求的發(fā)展,開發(fā)者需要對已建本體進(jìn)行更新,增加新的概念和概念之間的關(guān)系;
(6)復(fù)用本體。本體最大的特點就是其良好的復(fù)用性,由于概念的明確性,一個內(nèi)容層次清晰的本體能在領(lǐng)域內(nèi)得到很好的復(fù)用,目前國外有一些很好的本體庫已經(jīng)得到領(lǐng)域內(nèi)的公認(rèn)并被大量引用。
領(lǐng)域本體開發(fā)流程如圖2所示。
圖2 領(lǐng)域本體開發(fā)流程
根據(jù)系統(tǒng)自變量(一般指時間變量)發(fā)生的變化是離散型還是連續(xù)型,系統(tǒng)模型可以分為離散系統(tǒng)模型和連續(xù)系統(tǒng)模型。離散系統(tǒng)模型的特點是狀態(tài)變量在隨離散變化自變量改變時有時會呈現(xiàn)突變現(xiàn)象,而連續(xù)系統(tǒng)模型的狀態(tài)變量隨著連續(xù)變化的自變量發(fā)生連續(xù)的改變。目前離散模擬是最成熟的模擬方法,在現(xiàn)實生活中有著更普遍的意義,例如銀行顧客到達(dá)的事件、工業(yè)工程中原材料流入加工等都屬于離散事件模型。
表1列出離散系統(tǒng)模型中的一些基本概念[9]。
以銀行排隊系統(tǒng)為例,顧客就是離散系統(tǒng)模型中的實體,系統(tǒng)的資源主要有銀行服務(wù)人員和自動取款機(jī)兩種,實體和資源的屬性主要有數(shù)目、等待時間和服務(wù)時間、資源處于空閑還是繁忙狀態(tài)等。銀行排隊系統(tǒng)中的事件有3種,即顧客到達(dá)、服務(wù)開始和服務(wù)結(jié)束,活動有兩類,即排隊活動和服務(wù)活動。表2列出了銀行排隊系統(tǒng)模型的基本術(shù)語。
到目前為止,本體工程中比較有名的幾種方法包括 TOVE法、Methontology方法、骨架法、IDEF-5法和7步法等,這些方法大多是手工構(gòu)建領(lǐng)域本體,仍處于相對不成熟的階段,領(lǐng)域本體的建設(shè)還處于探索期,因此構(gòu)建過程中還存在著很多問題。唐愛民等對如何基于國防敘詞表來構(gòu)建國防領(lǐng)域本體進(jìn)行了研究,他們結(jié)合Enterprise方法、Methontology方法和軟件開發(fā)模型即“瀑布模型”提出了一種基于敘詞表的領(lǐng)域本體構(gòu)建方法,最后通過《國防科學(xué)技術(shù)敘詞表》成功構(gòu)建了軍用飛機(jī)領(lǐng)域本體的原型[10]。
領(lǐng)域本體的詳細(xì)設(shè)計過程也可稱為領(lǐng)域本體的具體構(gòu)建過程,是該方法中最核心、最關(guān)鍵的步驟,本體的一般開發(fā)過程包括:
(1)定義本體的類。根據(jù)表1中列出的術(shù)語,可以定義 Entity、Resource、Attributes、Event、Activity、Process、System State、Simulation Clock 和Statistical counter這9個類。
(2)在分類學(xué)(子類-超類)層次上基本類如圖3所示。
這些類從OWL語言的規(guī)則上講是不相交的,因此在protégé中需要聲明基本類與其他類的關(guān)系,如圖4所示,例如對Activity類聲明,它與其他類的關(guān)系是Disjoint classes。
(3)定義屬性并描述這些屬性的允許值如圖5所示。
圖3 離散事件模型的基本類
圖4 聲明基本類與其他類的關(guān)系
圖5 對實體類屬性的描述
(4)填充屬性值形成實例。本體開發(fā)采用迭代步驟,最初定義粗略的本體,接著修改并細(xì)化進(jìn)化的本體,隨后填充細(xì)節(jié),如圖6所示。再將銀行排隊系統(tǒng)的領(lǐng)域術(shù)語加入到最初構(gòu)建的本體中,如圖7所示。
圖6 離散事件模型的本體
圖7 離散事件模型的本體關(guān)系圖
本體中的部分關(guān)系視圖如圖8所示,其中Queue up和Line up是等價關(guān)系;排隊活動是Activity的子類,同時也是The bank line up simulation model的子類;Discrete simulation model是后兩者的父類。
圖8 排隊活動的關(guān)系圖
筆者將離散模擬模型領(lǐng)域概念羅列出來,基于敘詞表的本體構(gòu)建原理,使用protégé 4.0建立離散模擬模型的領(lǐng)域本體,定義了概念之間的關(guān)系和概念屬性的取值,使得模型關(guān)系能清晰地展現(xiàn),有利于不同領(lǐng)域?qū)W者了解該模型,進(jìn)而基于已封裝了功能和數(shù)據(jù)的模擬服務(wù)組件,實時匹配組合模擬服務(wù)組件。本體是體現(xiàn)現(xiàn)實世界的模型,因此對建好的領(lǐng)域本體還需要根據(jù)現(xiàn)實應(yīng)用和實際情況的發(fā)展進(jìn)行擴(kuò)充。
[1] 趙波,陶躍華.本體論及本體論在計算機(jī)科學(xué)技術(shù)中的應(yīng)用[J]. 云南師范大學(xué)學(xué)報,2002,22(6):5-7.
[2] 于江德,李學(xué)鈺,樊孝忠.信息抽取中領(lǐng)域本體的設(shè)計和實現(xiàn)[J].電子科技大學(xué)學(xué)報,2008,37(5):746-749.
[3] NICOLA A D,MISSIKOFF M,NAVIGLI R.A software engineering approach to ontology building[J].Information Systems,2009,34(2):258 -275.
[4] TRAN Q N N,LOW G.MOBMAS:a methodology for ontology-based multi-agent systems development[J].Information and Software Technology,2008,50(7/8):697-722.
[5] 鄧志鴻,唐世渭,張銘,等.Ontology研究綜述[J].北京大學(xué)學(xué)報:自然科學(xué)版,2002,38(5):730-738.
[6] 陳剛,陸汝鈴,金芝.基于領(lǐng)域知識重用的虛擬領(lǐng)域本體構(gòu)造[J]. 軟件學(xué)報,2003,14(3):350-355.
[7] TSAI W T,SUN X,HUANG Q,et al.An ontologybased collaborative service - oriented simulation framework with microsoft robotics studio[J].Simulation Modelling Practice and Theory,2008(16):1392-1414.
[8] 張童,劉云生,查亞兵.基于本體的仿真服務(wù)定制與組合[J].國防科技大學(xué)學(xué)報,2007,29(4):105-109.
[9] 胡斌,周明.管理系統(tǒng)模擬[M].北京:清華大學(xué)出版社,2008:17-98.
[10] 唐愛民,真溱.基于敘詞表的領(lǐng)域本體構(gòu)建研究[J].現(xiàn)代圖書情報技術(shù),2005(4):1-5.