于彤++劉靜++朱玲++董燕++賈李蓉++楊碩++譚麗娜
摘要:描述邏輯是一種面向計(jì)算機(jī)知識(shí)表示的邏輯語(yǔ)言,主要用于描述概念分類以及概念之間的關(guān)系。因其表達(dá)能力強(qiáng)、邏輯嚴(yán)謹(jǐn)、支持自動(dòng)推理等特點(diǎn),在本體工程中得到了廣泛應(yīng)用。本文結(jié)合中醫(yī)藥知識(shí)體系的具體案例介紹描述邏輯的概念、特點(diǎn)和表達(dá)方式,并探討其在中醫(yī)藥領(lǐng)域的應(yīng)用價(jià)值。
關(guān)鍵詞:描述邏輯;中醫(yī)藥;本體;知識(shí)表示
在計(jì)算機(jī)科學(xué)領(lǐng)域,本體是針對(duì)一個(gè)概念體系的正式而明確的規(guī)范。傳統(tǒng)的本體構(gòu)建方法包括框架系統(tǒng)(frames)和語(yǔ)義網(wǎng)絡(luò)(semanticnetwork)等。這些方法在語(yǔ)義上缺乏嚴(yán)謹(jǐn)性,實(shí)際應(yīng)用效果并不盡如人意。近年來(lái),描述邏輯(description logics,DL)以其強(qiáng)大的表達(dá)能力和可計(jì)算性的保證,已逐漸取代上述兩種本地構(gòu)建方法而成為新的主流。
DL為中醫(yī)藥知識(shí)體系的系統(tǒng)梳理提供了嚴(yán)謹(jǐn)?shù)倪壿嬆P?。它不僅能有效處理中醫(yī)藥領(lǐng)域的復(fù)雜知識(shí),對(duì)中醫(yī)藥概念體系進(jìn)行精確描述和規(guī)定,而且將有助于提升中醫(yī)藥領(lǐng)域本體的規(guī)范性。但中醫(yī)藥信息學(xué)者在本體工程實(shí)踐中尚未充分利用DL的表達(dá)能力,有關(guān)DL在中醫(yī)藥領(lǐng)域應(yīng)用的文獻(xiàn)較少。筆者將結(jié)合中醫(yī)案例介紹DL的概念、特點(diǎn)和表達(dá)方式,并探討DL在中醫(yī)藥領(lǐng)域的應(yīng)用價(jià)值,為構(gòu)建基于DL的中醫(yī)藥領(lǐng)域本體提供參考。
1 描述邏輯的基本概念
DL是一類形式化知識(shí)表示語(yǔ)言的統(tǒng)稱,可用于對(duì)概念定義及特征進(jìn)行形式化描述,并據(jù)此實(shí)現(xiàn)概念之間關(guān)系的自動(dòng)推理,因而適用于領(lǐng)域概念化和本體設(shè)計(jì)。DL技術(shù)產(chǎn)生于20世紀(jì)80年代,在90年代取得了一系列理論和算法上的突破,從21世紀(jì)開(kāi)始則趨于實(shí)用化。經(jīng)過(guò)20余年的發(fā)展,DL已成為成熟的知識(shí)表示系統(tǒng)。
根據(jù)DL,一個(gè)知識(shí)體系中包括3種基本組件:概念(concept)、角色(role)和個(gè)體(individual)。其中,“個(gè)體”對(duì)應(yīng)某個(gè)具體的對(duì)象;“概念”對(duì)應(yīng)由兩個(gè)或多個(gè)對(duì)象所構(gòu)成的集合,這些對(duì)象被稱為這一“概念”的實(shí)例(instance);“角色”則表示某種個(gè)體之間的二元關(guān)系。例如,“病人”屬于一個(gè)概念,某位病人“張三”屬于個(gè)體;“四君子湯”屬于一個(gè)概念,“張三”某次服用的一副“四君子湯”則是一個(gè)個(gè)體;若“張三”被診斷為“腎虛”,則可以說(shuō)“腎虛”屬于一個(gè)概念,而“張三”的臨床表現(xiàn)屬于“腎虛”的一個(gè)實(shí)例;“治療”“臨床表現(xiàn)”等二元關(guān)系則屬于角色。DL為表達(dá)領(lǐng)域?qū)嶓w之間的關(guān)系提供了多種手段。
1.1 蘊(yùn)含(i nc lusi on)關(guān)系
DL可表達(dá)概念或角色之間的蘊(yùn)含關(guān)系( )。例如,“中藥 藥物”表明“藥物”這一概念囊括(subsume)了“中藥”這一概念;又如,“治療 影響”表明“治療”關(guān)系是一種特殊的“影響”關(guān)系。
1.2 等價(jià)(equivalence)關(guān)系
DL可表達(dá)概念或角色之間的等價(jià)關(guān)系( )。例如,“病人;患者”表明“病人”和“患者”是同義的概念;又如,“治;治療”表明“治”和“治療”是同義的角色。
1. 3 隸屬(type)關(guān)系
DL可表達(dá)“個(gè)體”和“概念”之間的隸屬關(guān)系(∈)。個(gè)體是從某個(gè)(或某些)概念延伸出來(lái)的一個(gè)特殊的實(shí)例,而這個(gè)(這些)概念被稱為該個(gè)體的類型(type)。例如,“人參∈中藥”表明人參屬于一種中藥;“氣虛證∈證候”表明氣虛證屬于一種證候。
1.4 個(gè)體關(guān)聯(lián)關(guān)系
DL可通過(guò)斷言(assertion)表示個(gè)體之間的二元關(guān)系??蓪ⅰ八木訙薄叭藚ⅰ薄皻馓撟C”等領(lǐng)域?qū)嶓w表示為個(gè)體,再通過(guò)“包含”“治療”等角色表達(dá)個(gè)體之間的關(guān)聯(lián)關(guān)系,如(人參,治療,氣虛證)(四君子湯,包含,人參)等。
2 描述邏輯的表達(dá)方式舉例
DL為表達(dá)復(fù)雜的領(lǐng)域知識(shí)提供了豐富的表達(dá)方式。如表1所示,DL提供“合?。?)”“析取( )”“非( )”“存在量詞( )”“全稱量詞( )”等構(gòu)造算子(constructor),用于通過(guò)簡(jiǎn)單概念和角色來(lái)構(gòu)造復(fù)雜概念。例如,可將“疏肝劑”這一概念表示為“方劑 疏.肝”;又如,“中醫(yī)典籍 作者.中醫(yī)”表示“中醫(yī)典籍的作者僅能為中醫(yī)”??梢?jiàn),DL是一種側(cè)重于描述“疏肝湯”之類復(fù)雜概念的邏輯語(yǔ)言,這也是“描述邏輯”名稱的由來(lái)。下面對(duì)DL的表達(dá)方式進(jìn)行具體介紹。
2.1 互斥關(guān)系
DL可被用于定義兩個(gè)概念是互斥的。在DL中,A
B表示概念A(yù)和B是互斥的;即任意A的實(shí)例不可能同時(shí)是B的實(shí)例。例如,可通過(guò)“寒;一熱”表示“寒”和“熱”兩者之間沒(méi)有交集。
2.2 全稱約束
在DL中,全稱量詞V表示“僅僅”“只”等意思。例如,“方劑 包含.中藥”表示“任意方劑所包含的僅能是中藥(它不能包含西藥)”的概念,即“任意一種方劑都僅能與中藥發(fā)生‘包含關(guān)系”;又如,“水 克.火”表示“屬水者僅能克火”的意思。
2.3 存在約束
在DL中,存在量詞 表示“存在”的意思。例如,“方劑 包含.中藥”描述“任意方劑都‘存在一些組成成分”的概念,即“每種方劑都與某些中藥存在‘包含關(guān)系”。
2.4 角色互逆
在DL中,一個(gè)角色可被聲明為另一個(gè)角色的逆角色。P為Q的逆角色,則任意形如(x,P,y)的陳述蘊(yùn)含形如(y,Q,x)的陳述。DL使用負(fù)號(hào)來(lái)表示逆角色,P-Q即表示P為Q的逆角色。例如,“被治療;治療”表達(dá)“治療”和“被治療”之間的互逆關(guān)系。
2.5 角色的定義域和值域
通過(guò)DL可以描述各種角色的定義域(約束角色適用的主體的取值范圍)和值域(約束屬性適用的客體的取值范圍)。例如,“ 治療.
藥物”表示“治療”的定義域?yàn)樗幬?,?治療.疾病”表示“治療”的值域?yàn)榧膊。═表示包含所有事物的類型)。
3 描述邏輯的應(yīng)用價(jià)值
近年來(lái),本體成為實(shí)現(xiàn)生物醫(yī)學(xué)術(shù)語(yǔ)規(guī)范化的一項(xiàng)新興技術(shù),它幫助交互各方對(duì)特定領(lǐng)域內(nèi)共用的概念、術(shù)語(yǔ)以及概念分類建立一致的理解,從而支持知識(shí)的表示與共享。目前,生物醫(yī)學(xué)領(lǐng)域已出現(xiàn)了數(shù)百個(gè)本體,著名的UMLS、SNOMED CT、Gene Ontology等生物醫(yī)學(xué)術(shù)語(yǔ)系統(tǒng)都體現(xiàn)了本體的設(shè)計(jì)理念和方法。本體技術(shù)在中醫(yī)藥領(lǐng)域也得到了成功應(yīng)用,建成了溫病學(xué)、傳統(tǒng)針灸、中醫(yī)脾胃病、中醫(yī)證候、中藥、中醫(yī)古籍等方面的一系列本體。DL作為目前國(guó)際上主流的本體表示方法,在中醫(yī)藥領(lǐng)域具有廣闊的應(yīng)用前景。
DL在中醫(yī)藥領(lǐng)域的核心作用在于構(gòu)建領(lǐng)域本體以及基于本體的知識(shí)庫(kù),從而系統(tǒng)性地存儲(chǔ)和管理中醫(yī)藥領(lǐng)域知識(shí),為知識(shí)服務(wù)系統(tǒng)提供穩(wěn)定的知識(shí)來(lái)源。中醫(yī)藥知識(shí)體系具有結(jié)構(gòu)復(fù)雜、表達(dá)方式多樣、模糊性強(qiáng)等特點(diǎn),DL為中醫(yī)藥領(lǐng)域提供了高級(jí)的知識(shí)建模手段。基于DL,可對(duì)中醫(yī)證候?qū)W等復(fù)雜知識(shí)進(jìn)行清晰表達(dá),有利于梳理證候、疾病、癥狀、中藥、方劑、治法、出處等之間錯(cuò)綜復(fù)雜的關(guān)聯(lián)關(guān)系,建立以本體為主框架的中醫(yī)藥知識(shí)體系。因此,DL為中醫(yī)藥本體知識(shí)庫(kù)系統(tǒng)的構(gòu)建提供了解決方案。
DL在保證可計(jì)算性的前提下,提供了強(qiáng)大的表達(dá)能力?;贒L的理論,己出現(xiàn)了FaCT、Racer、Pellet等一系列實(shí)用的推理機(jī),在實(shí)際應(yīng)用中均表現(xiàn)出良好的性能。在未來(lái),有可能將中醫(yī)辨證論治的知識(shí)存入知識(shí)庫(kù)中,基于DL實(shí)現(xiàn)中醫(yī)藥知識(shí)的自動(dòng)推理,從而改進(jìn)臨床決策支持系統(tǒng)的效果,幫助臨床醫(yī)師做出更準(zhǔn)確的診斷。
基于DL的邏輯模型可為語(yǔ)義關(guān)系賦予更加確切的含義。例如,假設(shè)在本體中具有“中藥,治療,疾病”這樣一條語(yǔ)義關(guān)系,若這條關(guān)系意味著“任何中藥都能治療某種疾病”,則對(duì)應(yīng)的DL公式為“中藥 治療.疾病”。嚴(yán)謹(jǐn)?shù)腄L公式可用于自動(dòng)檢測(cè)本體中的錯(cuò)誤。例如,“方劑”和“中藥”之間的關(guān)系一般是“某方劑是由某些中藥組成的”,兩者之間不可能出現(xiàn)“治療”關(guān)系。可通過(guò)DL規(guī)定“方劑和中藥之間只能存在‘由……組成關(guān)系”,指導(dǎo)推理機(jī)找出本體中的錯(cuò)誤,藉此保持本體內(nèi)邏輯關(guān)系的一致性。例如,若機(jī)器發(fā)現(xiàn)形如“方劑,治療,中藥”的語(yǔ)義關(guān)系,則可將其作為一個(gè)錯(cuò)誤呈現(xiàn)給系統(tǒng)管理員,由管理員檢查錯(cuò)誤的原因并修改。另外,DL還能支持本體自動(dòng)轉(zhuǎn)換、自動(dòng)重構(gòu)等方法的實(shí)現(xiàn),促進(jìn)中醫(yī)藥本體的規(guī)范化。
DL與語(yǔ)義網(wǎng)(semantic web)技術(shù)有密切聯(lián)系。語(yǔ)義網(wǎng)是一個(gè)機(jī)器可以理解且人機(jī)共享的信息空間,為在互聯(lián)網(wǎng)環(huán)境中進(jìn)行語(yǔ)義信息和結(jié)構(gòu)性知識(shí)的交換提供了理想的解決方案。DL為語(yǔ)義網(wǎng)技術(shù)體系之中的萬(wàn)維網(wǎng)本體語(yǔ)言O(shè)WL提供理論基礎(chǔ),對(duì)OWL的設(shè)計(jì)和語(yǔ)義定義起到指導(dǎo)作用。因此,基于DL構(gòu)建的知識(shí)庫(kù)與互聯(lián)網(wǎng)具有天然的結(jié)合點(diǎn),有利于通過(guò)互聯(lián)網(wǎng)對(duì)中醫(yī)藥知識(shí)進(jìn)行廣泛傳播,
4 小結(jié)
DL是近年來(lái)知識(shí)表示領(lǐng)域的研究熱點(diǎn),因其表達(dá)能力強(qiáng)、邏輯嚴(yán)謹(jǐn)、支持自動(dòng)推理等特點(diǎn),在本體工程中得到廣泛的應(yīng)用。DL為中醫(yī)藥領(lǐng)域提供了高級(jí)的知識(shí)建模手段,使領(lǐng)域本體在邏輯上更加嚴(yán)謹(jǐn),應(yīng)用上更為可行。在中醫(yī)藥領(lǐng)域中應(yīng)用DL,需要分析實(shí)際的語(yǔ)言環(huán)境,理解語(yǔ)義關(guān)系的確切內(nèi)涵和用法,進(jìn)而決定邏輯模型的設(shè)計(jì)??蛇x擇中醫(yī)證候?qū)W等涉及復(fù)雜概念體系和領(lǐng)域邏輯的子學(xué)科開(kāi)展DL的示范性應(yīng)用研究,最終建立完整的中醫(yī)藥邏輯模型,為中醫(yī)藥領(lǐng)域的知識(shí)表示與共享奠定基礎(chǔ)。