周育偉,楊朝紅,王宏宇
(陸軍裝甲兵學(xué)院信息通信系,北京 100072)
智能化浪潮洶涌而來(lái),加速著人類社會(huì)的進(jìn)步和發(fā)展,智能化技術(shù)是改變世界的顛覆性技術(shù)之一。世界各軍事強(qiáng)國(guó)在軍事領(lǐng)域?qū)θ斯ぶ悄艿膽?yīng)用都給予了大力的支持。同時(shí),戰(zhàn)場(chǎng)信息獲取從匱乏轉(zhuǎn)向過(guò)載甚至“爆炸”,使指揮員在面臨海量信息的時(shí)候無(wú)法快速?zèng)Q策,忽略一些重要的信息,如何將信息優(yōu)勢(shì)轉(zhuǎn)化為決策優(yōu)勢(shì)是一個(gè)關(guān)鍵問(wèn)題。
知識(shí)是對(duì)信息的抽象和組織,因此相對(duì)于信息,知識(shí)能更好的指導(dǎo)人的決策和行動(dòng),可以將信息優(yōu)勢(shì)轉(zhuǎn)為認(rèn)知優(yōu)勢(shì),進(jìn)而轉(zhuǎn)換為決策優(yōu)勢(shì),輔助指揮員進(jìn)行決策,由于軍事領(lǐng)域的特殊性,面向軍事領(lǐng)域知識(shí)圖譜的構(gòu)建,前期一般采用自頂向下的方式構(gòu)建知識(shí)圖譜,這就需要對(duì)本體層進(jìn)行研究和構(gòu)建。
本文基于本體的概念和構(gòu)建方法,探討目前軍事領(lǐng)域本體構(gòu)建的現(xiàn)狀,歸納已有的軍事領(lǐng)域本體,構(gòu)建一個(gè)涵蓋多維度、多層次的軍事領(lǐng)域本體。
本體這一概念最早源于哲學(xué)領(lǐng)域,意為“對(duì)世界上客觀事物的系統(tǒng)描述,即存在論”,后來(lái)隨著人工智能的發(fā)展,1998 年被德國(guó)學(xué)者Stude 引入到了人工智能領(lǐng)域,并賦予了新的概念“本體是共享概念模型的形式化規(guī)范說(shuō)明”。這個(gè)定義包含了四層含義:
⑴共享(Share):本體中所蘊(yùn)含的知識(shí)是為大多數(shù)人認(rèn)可的,其表達(dá)的是共性的知識(shí)。
⑵概念化(Conceptualization):本體所表述的知識(shí)是客觀的現(xiàn)實(shí)世界的一個(gè)抽象概念模型。
⑶明確性(Explicit):指本體中全部的術(shù)語(yǔ)、屬性及公理在使用前都必須有明確的定義。
⑷ 形式化(Formal):指本體可以被計(jì)算機(jī)所理解,具有機(jī)器可讀性。
可以說(shuō)本體是對(duì)某一個(gè)領(lǐng)域進(jìn)行描述的術(shù)語(yǔ)集合,是從世界存在的客觀事物抽象出來(lái)的概念模型,這個(gè)模型包含了概念和概念之間的關(guān)系和屬性以及對(duì)它們的約束、公理等,本體就相當(dāng)于是知識(shí)圖譜的骨骼,實(shí)體則是對(duì)知識(shí)圖譜按照本體骨架進(jìn)行填充的血肉。
將本體定義為六元組:
其中,C 表示概念集,A表示各個(gè)概念的屬性集,R 表示關(guān)系,A表示各個(gè)關(guān)系的屬性集,H 表示概念層次,用來(lái)說(shuō)明概念集的層次劃分。例如,H(C1,C2)表示C1是C2 的子概念,X 表示公理集,用來(lái)約束概念與概念之間的關(guān)系或是概念與關(guān)系的屬性值。
常用的本體構(gòu)建方法包括以下幾種方法:七步法、METHONTOLOGY 法、KACTUS工程法、SENSUS法、骨架法、TOVE 法、IDEF-5 法,其中七步法較其他幾種方法更為成熟。
對(duì)于軍事領(lǐng)域本體構(gòu)建,有很多學(xué)者進(jìn)行了研究。雷玉霞等人提出了軍事領(lǐng)域知識(shí)本體的設(shè)計(jì)思想,給出了一些用于知識(shí)庫(kù)中知識(shí)的語(yǔ)義一致性、完備性和精確性的公理。程英迅對(duì)軍事訓(xùn)練領(lǐng)域的數(shù)據(jù)進(jìn)行研究,提出了軍事訓(xùn)練定義的六元組結(jié)構(gòu),構(gòu)建了軍事訓(xùn)練本體,開(kāi)發(fā)了分布式數(shù)據(jù)庫(kù)搜索引擎。彭明輝基于搜狗的軍事新聞報(bào)道語(yǔ)料對(duì)軍事領(lǐng)域情感本體進(jìn)行了構(gòu)建,基于該本體構(gòu)建了軍事領(lǐng)域情感傾向性分析平臺(tái)。蔣維等人提出了建立本體的5 個(gè)步驟,實(shí)現(xiàn)了本體建立過(guò)程部分功能自動(dòng)完成,但是未進(jìn)行本體的檢驗(yàn)和更新。楊建池等人構(gòu)建了用于作戰(zhàn)仿真的軍事領(lǐng)域核心本體。鐘誠(chéng)等人對(duì)軍事倉(cāng)儲(chǔ)領(lǐng)域本體進(jìn)行了構(gòu)建,并結(jié)合骨架法提出了一種優(yōu)化的領(lǐng)域本體構(gòu)建流程。李坤等人將軍事領(lǐng)域本體劃分為5 類二級(jí)本體,并對(duì)每類二級(jí)本體進(jìn)行了具體的劃分,設(shè)計(jì)了類的屬性,但是并未給出類間的關(guān)系,添加了本體實(shí)例,完成了軍事領(lǐng)域本體庫(kù)的存儲(chǔ)。陳立峰等人分析了軍事通信領(lǐng)域本體的特點(diǎn),給出了軍事通信領(lǐng)域構(gòu)建的方法。鄒燁翰對(duì)軍事條令條例的本體進(jìn)行研究,針對(duì)美軍《任務(wù)清單》進(jìn)行本體構(gòu)建。雷瑛等人對(duì)多源軍事數(shù)據(jù)進(jìn)行分析將軍事數(shù)據(jù)本體劃分為機(jī)構(gòu)、人員、裝備、物資、環(huán)境、設(shè)施和理論法規(guī)7 類二級(jí)本體。劉煜澄對(duì)包括萬(wàn)國(guó)兵器網(wǎng)、關(guān)系性能數(shù)據(jù)庫(kù)存儲(chǔ)的兵器數(shù)據(jù)進(jìn)行分析構(gòu)建了兵器本體。張清輝等人構(gòu)建了軍事信息服務(wù)本體,并驗(yàn)證了所構(gòu)建本體模型的有效性。
當(dāng)前本體構(gòu)建的工具有Protégé、WebOneto、KAON、WebODE等工具。其中,Protégé具有支持中文語(yǔ)言,通過(guò)圖形化界面進(jìn)行構(gòu)建,支持推理及軟件的擴(kuò)展,操作簡(jiǎn)單等多種優(yōu)勢(shì),成為構(gòu)建本體的第一選擇。七步法目前成熟度較高,而且七步法是基于本體構(gòu)建工具Protégé 進(jìn)行本體構(gòu)建的方法,故借鑒七步法提出一種軍事領(lǐng)域本體構(gòu)建的方法并使用Protégé 工具對(duì)軍事領(lǐng)域本體進(jìn)行構(gòu)建。圖1 展示了結(jié)合七步法的軍事領(lǐng)域本體構(gòu)建的流程。
圖1 軍事領(lǐng)域本體構(gòu)建流程
⑴明確軍事領(lǐng)域本體的領(lǐng)域和范圍
明確軍事本體對(duì)應(yīng)的邊界、業(yè)務(wù)功能域、用途、描述的信息內(nèi)容、使用和維護(hù)本體的對(duì)象。
⑵收集軍事概念和數(shù)據(jù)資源
在構(gòu)建軍事本體前,依據(jù)軍語(yǔ)、各類戰(zhàn)備工程數(shù)據(jù)庫(kù)標(biāo)注、軍事報(bào)文、交換文件、戰(zhàn)場(chǎng)情報(bào)等,收集環(huán)境作戰(zhàn)數(shù)據(jù)。
⑶現(xiàn)有本體可重用性構(gòu)建
對(duì)現(xiàn)有本體進(jìn)行分析和完善,提高可重用性。可重用本體具有重要的意義,一方面可對(duì)現(xiàn)有本體進(jìn)行拓展,減少很多不必要的研發(fā)工作,提高本體構(gòu)建的效率。另一方面,可以為現(xiàn)有本體提供經(jīng)驗(yàn)性的指導(dǎo)以及設(shè)計(jì)上的啟發(fā)和幫助。
⑷本體的分析表達(dá)
對(duì)于不可重用的現(xiàn)有本體,需要對(duì)收集到的軍語(yǔ)、標(biāo)注、標(biāo)準(zhǔn)進(jìn)行數(shù)據(jù)分析,提取核心概念、概念屬性以及概念間的關(guān)系。
⑸構(gòu)建本體
首先,采用自頂向下的方法定義類和類的繼承關(guān)系,即從軍事領(lǐng)域最基本的概念開(kāi)始,逐層細(xì)化。例如從條令條例的概念開(kāi)始,細(xì)化為共同條令、外軍作戰(zhàn)條令、專業(yè)條例等。然后,類定義完之后需要對(duì)類的屬性以及類之間的關(guān)系進(jìn)行定義,比如定義作戰(zhàn)編隊(duì)和戰(zhàn)區(qū)之間的所屬關(guān)系等。最后,基于軍事業(yè)務(wù)規(guī)則,對(duì)類的屬性進(jìn)行限制,包括屬性的類型,屬性的定義域和值域。如對(duì)一個(gè)連隊(duì)的人數(shù)進(jìn)行約束,不能超過(guò)軍事知識(shí)的范圍,符合軍事領(lǐng)域知識(shí)的規(guī)范。
⑹本體整合和實(shí)例化
對(duì)軍事本體進(jìn)行整合,采用一致性規(guī)約化方法對(duì)來(lái)自不同兵種、不同業(yè)務(wù)領(lǐng)域的軍事本體進(jìn)行重定義和語(yǔ)義化處理,以免影響數(shù)據(jù)共享和融合,確認(rèn)本體后可抽取數(shù)據(jù)進(jìn)行實(shí)例化。
⑺本體評(píng)估和修正
經(jīng)過(guò)明確領(lǐng)域,搜集概念等步驟,可以初步構(gòu)建一個(gè)本體。但構(gòu)建本體并非是一蹴而就的任務(wù),在構(gòu)建的過(guò)程中會(huì)受到構(gòu)建者自身認(rèn)知的限制,因此可能會(huì)存在一定的差錯(cuò)和冗余,因此需要對(duì)本體進(jìn)行評(píng)估和修正。一方面可以經(jīng)過(guò)調(diào)研和請(qǐng)教領(lǐng)域內(nèi)的專家進(jìn)行探討,記錄評(píng)價(jià)意見(jiàn),從本體的一致性、明確性、可擴(kuò)展性等方面進(jìn)行綜合評(píng)價(jià),另一方面可以使用Protégé內(nèi)自帶的推理機(jī)進(jìn)行本體的一致性檢驗(yàn)。軍事領(lǐng)域本體的構(gòu)建隨著業(yè)務(wù)需求變化而擴(kuò)展迭代更新,以保證滿足軍事業(yè)務(wù)需求,與時(shí)俱進(jìn),實(shí)現(xiàn)高性能,高可用。
通過(guò)總結(jié)、歸納已有軍事領(lǐng)域本體,以及對(duì)裝備手冊(cè)等數(shù)據(jù)來(lái)源進(jìn)行分析,并咨詢領(lǐng)域?qū)<?,共設(shè)置四級(jí)本體樹(shù)。一級(jí)本體包含武器裝備、戰(zhàn)場(chǎng)環(huán)境、軍用物資、人物、條令條例、設(shè)施和組織機(jī)構(gòu)共7大類,二至四級(jí)本體是對(duì)上一級(jí)本體的具體劃分。
以武器裝備為例,考慮到作戰(zhàn)中可能涉及的各類裝備,按照領(lǐng)域用途將武器裝備本體分為遙感裝置、保密裝備、電子對(duì)抗裝備、軍械裝備、偵察觀測(cè)裝備、陸軍裝備、海軍裝備、空軍裝備、工程裝備、防化裝備、指揮通信裝備、彈藥導(dǎo)彈、多棲裝備和保障裝備共14 個(gè)二級(jí)本體。以偵察觀測(cè)裝備為例,下設(shè)指揮鏡、方向盤(pán)、望遠(yuǎn)鏡、步兵潛望鏡、測(cè)距機(jī)、炮兵聲測(cè)系統(tǒng)、炮兵測(cè)地系統(tǒng)、炮兵鏡、炮兵防空兵夜視設(shè)備、經(jīng)緯儀、輕武器夜視設(shè)備、雷達(dá)等14 個(gè)三級(jí)本體,雷達(dá)本體下設(shè)機(jī)械掃描雷達(dá)和電掃描雷達(dá)2個(gè)四級(jí)本體。
在對(duì)軍事領(lǐng)域本體的概念進(jìn)行定義之后,需要對(duì)本體的關(guān)系和屬性進(jìn)行定義。在Protégé軟件中,關(guān)系為對(duì)象屬性(Object Property)即表示本體類與類之間的關(guān)系,屬性為數(shù)據(jù)屬性(Data Property)即表示本體類所具有的性質(zhì),一條事實(shí)可以用三元組(定義域,對(duì)象/數(shù)據(jù)屬性,值域)進(jìn)行表示,對(duì)于對(duì)象屬性來(lái)講,值域是一個(gè)本體概念,對(duì)于數(shù)據(jù)屬性而言,值域是一個(gè)定義好的數(shù)據(jù)類型。例如三元組(轟炸機(jī),搭載,導(dǎo)彈)表示了本體概念“轟炸機(jī)”作為定義域,“搭載”作為關(guān)系,“導(dǎo)彈”作為值域的一條事實(shí)“轟炸機(jī)搭載了導(dǎo)彈”,這樣“轟炸機(jī)”類的實(shí)體和“導(dǎo)彈”類的實(shí)體就可以擁有“搭載”這個(gè)關(guān)系。軍事領(lǐng)域本體設(shè)置以下五類關(guān)系:
作戰(zhàn)關(guān)系 主要用來(lái)描述作戰(zhàn)過(guò)程中的行動(dòng)關(guān)系。包括:支援、協(xié)同、指揮、干擾、保障等關(guān)系。
人員關(guān)系 主要用來(lái)描述人員與人員、組織、裝備和物資的關(guān)系。包括:上級(jí)、下級(jí)、平級(jí)、配備、隸屬、任職、管理、維修、研發(fā)等關(guān)系。
裝備關(guān)系 主要用來(lái)描述裝備作戰(zhàn)單元和組織機(jī)構(gòu)等之間的關(guān)系。包括:編配、配屬、搭載、生產(chǎn)、使用、消耗、部件等關(guān)系。
位置關(guān)系 主要用來(lái)表示方位的關(guān)系。包括:東、西、南、北、東西等關(guān)系。
其他關(guān)系 主要是一些共性的關(guān)系,如:組成、屬于、包含等通用的關(guān)系。
數(shù)據(jù)屬性的類型設(shè)計(jì)主要用來(lái)約束屬性值的數(shù)據(jù)類型,在定義屬性類型時(shí)需要對(duì)屬性名、屬性值和屬性的數(shù)據(jù)類型進(jìn)行定義,數(shù)據(jù)屬性將本體類與數(shù)據(jù)類型進(jìn)行關(guān)聯(lián),Protégé 中提供了多種數(shù)據(jù)類型。以導(dǎo)彈類本體為例,其主要屬性定義如表1所示。
表1 導(dǎo)彈類屬性類型設(shè)計(jì)(部分)
考慮到個(gè)體的主觀意識(shí)影響,并且本體構(gòu)建是一個(gè)隨著構(gòu)建者認(rèn)知不斷加深而重復(fù)修正的一個(gè)過(guò)程,在本體構(gòu)建的過(guò)程中會(huì)產(chǎn)生一定的概念、關(guān)系、屬性和公理等方面的沖突或冗余,故而需要對(duì)已經(jīng)構(gòu)建好的本體進(jìn)行一致性、準(zhǔn)確性和可滿足性等方面的檢測(cè)。構(gòu)建本體的過(guò)程中參照《軍語(yǔ)》等專業(yè)術(shù)語(yǔ)概念進(jìn)行構(gòu)建,將有歧義的本體概念降到最低,同時(shí)邀請(qǐng)領(lǐng)域?qū)<疫M(jìn)行點(diǎn)評(píng)修改,提高本體構(gòu)建的準(zhǔn)確性,構(gòu)建好的本體保存為OWL格式的文件,然后使用Protégé軟件中自帶的Pellet 推理機(jī)進(jìn)行本體的一致性檢測(cè)。Protégé 軟件內(nèi)置的Pellet 推理機(jī)是一種基于Tableau算法的描述邏輯推理機(jī),Pellet推理機(jī)可以根據(jù)本體結(jié)構(gòu)生成斷言概念結(jié)構(gòu),確定本體元素與元素之間是否存在相互否定的關(guān)系,從而實(shí)現(xiàn)描述邏輯一致性檢驗(yàn)的目的。構(gòu)建好軍事領(lǐng)域本體后就可以根據(jù)本體進(jìn)行實(shí)體抽取、關(guān)系抽取、屬性抽取等任務(wù)完成軍事領(lǐng)域知識(shí)圖譜的構(gòu)建,為智能問(wèn)答、輔助決策等下游任務(wù)提供基礎(chǔ)。
本文對(duì)軍事領(lǐng)域已有本體進(jìn)行了歸納總結(jié),借鑒七步法提出了軍事領(lǐng)域本體構(gòu)建的流程,復(fù)用已有的軍事領(lǐng)域本體,對(duì)包括裝備手冊(cè)在內(nèi)的數(shù)據(jù)進(jìn)行分析總結(jié),使用Protégé 構(gòu)建了一個(gè)涵蓋范圍廣、多層次的軍事領(lǐng)域本體,為下一步基于軍事領(lǐng)域知識(shí)圖譜的構(gòu)建做鋪墊。但是考慮到軍事領(lǐng)域本體構(gòu)建的質(zhì)量要求高,因此構(gòu)建的全過(guò)程都是依靠人工的,因而構(gòu)建過(guò)程緩慢,之后會(huì)對(duì)半自動(dòng)以及自動(dòng)構(gòu)建本體展開(kāi)研究和探討。