,,
“本體”一詞最早出現(xiàn)在哲學(xué)領(lǐng)域,指事物的本源和本質(zhì)。近年“本體”在人工智能、計(jì)算機(jī)語(yǔ)言以及數(shù)據(jù)庫(kù)理論中起到越來(lái)越重要的作用,同時(shí)也引發(fā)信息工程、知識(shí)工程、圖書情報(bào)等領(lǐng)域的關(guān)注和研究。在信息科學(xué)領(lǐng)域,最早給出Ontology定義的Neches等人認(rèn)為,本體定義了組成主題領(lǐng)域的詞匯表的基本術(shù)語(yǔ)及其關(guān)系,以及結(jié)合這些術(shù)語(yǔ)和關(guān)系來(lái)定義詞匯表外延的規(guī)則[1]??梢?jiàn),本體不僅表示術(shù)語(yǔ)概念,還能揭示語(yǔ)義關(guān)系,這對(duì)知識(shí)組織的發(fā)展具有重要意義。
中醫(yī)源遠(yuǎn)流長(zhǎng),是我國(guó)傳統(tǒng)文化的國(guó)粹,經(jīng)絡(luò)、穴位更是中醫(yī)貢獻(xiàn)給世人的無(wú)價(jià)之寶,經(jīng)絡(luò)、穴位在防病治病、保健養(yǎng)生方面的作用令人稱奇。通過(guò)建立經(jīng)穴本體,發(fā)現(xiàn)經(jīng)絡(luò)、穴位、病癥之間的某種關(guān)聯(lián),既能為中醫(yī)科學(xué)提供相關(guān)證據(jù),也能體現(xiàn)本體知識(shí)組織的作用。經(jīng)絡(luò)、穴位、病癥等主題的概念、術(shù)語(yǔ)比較成熟、清晰、明確,有利于本體詞匯的搜集整理。本文選擇經(jīng)穴治療領(lǐng)域,作為本體構(gòu)建實(shí)驗(yàn)及知識(shí)組織增值測(cè)試的對(duì)象。通過(guò)構(gòu)建經(jīng)穴治療領(lǐng)域本體,以及本體間語(yǔ)義關(guān)系推理和可視化展示,表現(xiàn)出經(jīng)絡(luò)、穴位和病癥預(yù)防、治療之間的相互關(guān)系,體現(xiàn)知識(shí)組織的價(jià)值。掌握構(gòu)建領(lǐng)域本體基本方法(如語(yǔ)義關(guān)系的建立方法),測(cè)試本體構(gòu)建后的擴(kuò)展研究,檢測(cè)能否通過(guò)語(yǔ)義關(guān)系對(duì)本體進(jìn)行數(shù)據(jù)分析及相關(guān)專業(yè)研究,可實(shí)現(xiàn)知識(shí)組織的增值。
目前,領(lǐng)域本體構(gòu)建有骨架法、評(píng)價(jià)法、METHONTOLOGY法、七步法、五步循環(huán)法等方法。本實(shí)驗(yàn)采用的是斯坦福大學(xué)醫(yī)學(xué)院開(kāi)發(fā)的七步法,分別是:確定本體的專業(yè)領(lǐng)域和范疇,考慮復(fù)用現(xiàn)有本體的可能性,列出本體中的重要術(shù)語(yǔ),定義類和類的等級(jí)體系,定義類的屬性,定義屬性的分面,創(chuàng)建實(shí)例。本體構(gòu)建的工具是支持owl語(yǔ)言的Protégé軟件[2]。
本文以七步法為基礎(chǔ),結(jié)合其他本體構(gòu)建方法的優(yōu)點(diǎn),最終確定經(jīng)絡(luò)治療知識(shí)本體構(gòu)建思路。具體實(shí)施分為前期分析調(diào)研、中期本體知識(shí)庫(kù)建設(shè)、后期邏輯推理及可視化展示3部分。前期工作包括確定經(jīng)穴治療知識(shí)本體的專業(yè)領(lǐng)域,選擇經(jīng)穴治療知識(shí)本體所需涉及的相關(guān)領(lǐng)域,考察現(xiàn)有與經(jīng)穴治療領(lǐng)域相關(guān)的可借鑒的本體系統(tǒng),確定經(jīng)穴治療領(lǐng)域本體來(lái)源。中期工作主要是經(jīng)穴治療本體庫(kù)的建設(shè),具體包括5個(gè)步驟:在需求分析基礎(chǔ)上,以經(jīng)穴治療相關(guān)研究文獻(xiàn)為基礎(chǔ),明確經(jīng)穴治療知識(shí)本體的核心概念集;對(duì)核心概念集依照自頂向下的原則進(jìn)行擴(kuò)展,建立等級(jí)層次關(guān)系;定義本體的屬性,包括對(duì)象類型屬性和數(shù)值類型屬性;定義屬性的分面,主要是進(jìn)一步定義屬性值的類型、屬性的定義域和值域以及屬性之間限制關(guān)系、傳遞關(guān)系等;創(chuàng)建實(shí)例。后期主要是邏輯檢測(cè)、推理和可視化,即在最后階段用推理機(jī)制對(duì)該本體中的概念及實(shí)例進(jìn)行一致性和沖突檢測(cè),以確保邏輯上的正確性。此外,為挖掘經(jīng)穴治療之間其他的隱性關(guān)系,可以利用本體系統(tǒng)中的推理功能,將隱含其中的知識(shí)顯性化,發(fā)掘本體的知識(shí)增值功能。
建立經(jīng)穴治療領(lǐng)域本體,首先要明確經(jīng)穴治療的概念。所謂經(jīng)穴治療,是指通過(guò)對(duì)中醫(yī)科學(xué)中的經(jīng)絡(luò)與穴位的刺激,達(dá)到保健、防病、治病效果的目的。經(jīng)穴包括經(jīng)絡(luò)和穴位。經(jīng)絡(luò)是經(jīng)脈與絡(luò)脈的總稱,意指周身氣血運(yùn)行的通道,是古人在長(zhǎng)期生活保健和醫(yī)療實(shí)踐中逐漸發(fā)現(xiàn)并形成理論的,以手、足三陰和三陽(yáng)經(jīng)以及任、督二脈為主體,網(wǎng)羅遍布全身的綜合系統(tǒng)。經(jīng)絡(luò)內(nèi)聯(lián)五臟六腑,外布形體官竅、四肢百骸,溝通表里、上下、內(nèi)外,將人體的各部分連接成有機(jī)的、與自然界密不可分的整體。穴位,俗稱穴道,為人體臟腑經(jīng)絡(luò)氣血輸注出入的處所。它通過(guò)經(jīng)絡(luò)與臟腑密切相關(guān),可反映各臟腑生理或病理的變化,也可接受各種刺激(如針、灸、按摩、電針、藥物注射等),以調(diào)整各臟腑功能達(dá)到治療的效果[3]。治療是采取各種方法治愈疾病、保養(yǎng)身體,恢復(fù)健康,增強(qiáng)體質(zhì)的過(guò)程。在經(jīng)穴治療本體構(gòu)建中,本實(shí)驗(yàn)主要采取的是物理方法,不涉及藥物、藥材食用的方法。本實(shí)驗(yàn)中經(jīng)穴治療知識(shí)本體的領(lǐng)域分析有4個(gè)核心概念:經(jīng)絡(luò)、穴位、方法、疾病,運(yùn)用到構(gòu)建本體的protégé軟件中即得出了本實(shí)驗(yàn)領(lǐng)域的4個(gè)大類。
明確領(lǐng)域分析和確定核心概念后,對(duì)現(xiàn)有與經(jīng)穴治療領(lǐng)域相關(guān)的本體系統(tǒng)、敘詞系統(tǒng)、主題詞表等進(jìn)行調(diào)研。胡兆芹編寫的《本體與知識(shí)組織》一書發(fā)現(xiàn)與醫(yī)學(xué)有關(guān)的本體系統(tǒng)有UMLS(一體化醫(yī)學(xué)語(yǔ)言系統(tǒng))、TCMLS(中醫(yī)藥一體化語(yǔ)言系統(tǒng))、CUMLS(中文一體化醫(yī)學(xué)語(yǔ)言系統(tǒng))。由于本實(shí)驗(yàn)是經(jīng)穴治療領(lǐng)域,因此更關(guān)注TCMLS和CUMLS。TCMLS是中醫(yī)藥一體化語(yǔ)言系統(tǒng),由中國(guó)中醫(yī)科學(xué)院中醫(yī)藥信息研究所建設(shè),截至2006年共編錄12 862個(gè)類,完成40余萬(wàn)詞匯的收集與整理,11萬(wàn)概念詞的編輯、定義、關(guān)聯(lián)關(guān)系的建立。它含有126種語(yǔ)義類型、75種語(yǔ)義關(guān)系,是目前世界上最大的傳統(tǒng)醫(yī)藥本體[4]。
CUMLS是2000年中國(guó)醫(yī)學(xué)科學(xué)院醫(yī)學(xué)信息研究所創(chuàng)建的知識(shí)組織系統(tǒng),由醫(yī)學(xué)詞表、語(yǔ)義網(wǎng)、構(gòu)建工具和平臺(tái)組成。醫(yī)學(xué)詞表主要來(lái)源于《醫(yī)學(xué)主題詞表(中文版)》(MeSH中文版)《中國(guó)中醫(yī)藥學(xué)主題詞表》《中國(guó)圖書館分類法·醫(yī)學(xué)專業(yè)分類表》等,共收錄醫(yī)學(xué)主題詞3萬(wàn)余條、醫(yī)學(xué)術(shù)語(yǔ)10萬(wàn)余條、醫(yī)學(xué)詞匯素材30余萬(wàn)條,融合了自然語(yǔ)言、主題語(yǔ)言和分類語(yǔ)言等情報(bào)語(yǔ)言[5]。
本實(shí)驗(yàn)中出現(xiàn)的本體概念主要采用TCMLS和CUMLS。但詞表僅是本體概念的一個(gè)來(lái)源,還有一些病例、病案、以及理論文獻(xiàn)、圖書期刊也是經(jīng)穴治療領(lǐng)域知識(shí)本體建設(shè)的補(bǔ)充。因此,本實(shí)驗(yàn)參考了《中醫(yī)養(yǎng)生大辭典》《黃帝內(nèi)經(jīng)經(jīng)絡(luò)養(yǎng)生寶典》《黃帝內(nèi)經(jīng)中的經(jīng)絡(luò)養(yǎng)生》《全身經(jīng)絡(luò)速查手冊(cè)》等中醫(yī)藥文獻(xiàn)、百科全書、百度百科,并通過(guò)CNKI以“穴位治療”“穴位療法”等關(guān)鍵詞,共檢出355篇論文。通過(guò)人工抽詞、篩選,也獲得了一些本實(shí)驗(yàn)需要的本體概念。
本實(shí)驗(yàn)的領(lǐng)域本體知識(shí)庫(kù)采用的是protégé軟件,需要遵循類、對(duì)象屬性、數(shù)據(jù)屬性、屬性約束等規(guī)則,構(gòu)建步驟分為類和類的層次體系的構(gòu)建、類的屬性的構(gòu)建、實(shí)例創(chuàng)建等。
經(jīng)穴治療領(lǐng)域本體的類主要為經(jīng)絡(luò)、穴位、疾病、方法。除了superclasses(父類)之外,還有子類、兄弟類等。因此,我們要在4個(gè)superclasses(父類)的基礎(chǔ)上,進(jìn)一步進(jìn)行概念分析,列出子類、兄弟類等概念,確定本實(shí)驗(yàn)本體庫(kù)的類及其層次體系。
在經(jīng)絡(luò)體系中,經(jīng)絡(luò)是經(jīng)脈和絡(luò)脈的總稱。經(jīng)指經(jīng)脈,猶如直通的徑路,是經(jīng)絡(luò)系統(tǒng)中的主干;絡(luò)指絡(luò)脈,猶如網(wǎng)絡(luò),是經(jīng)脈的細(xì)小分支。經(jīng)在深部,絡(luò)在淺表。經(jīng)絡(luò)包括十二經(jīng)脈、奇經(jīng)八脈、十二經(jīng)別、十二經(jīng)筋、十五絡(luò)脈[5]。十二經(jīng)脈是經(jīng)絡(luò)系統(tǒng)的主題,也稱為正經(jīng);奇經(jīng)八脈的“奇”有“異”的意思,是指與十二經(jīng)脈不同而“別道奇行”的八條經(jīng)脈,包括任脈、督脈、沖脈、帶脈、陰蹺脈、陽(yáng)蹺脈、陰維脈、陽(yáng)維脈;十二經(jīng)別是十二經(jīng)脈在胸、腹及頭部的重要支脈,溝通臟腑,加強(qiáng)表里經(jīng)的聯(lián)系;十二經(jīng)筋均起始于四肢末端,結(jié)聚于關(guān)節(jié)、骨骼部,走向軀干頭面,即行于體表,不入內(nèi)臟;十五絡(luò)脈,是十二經(jīng)脈在四肢以及軀干前、后、側(cè)三部的重要支脈,起溝通表里和滲灌氣血的作用。由于穴位主要存在于十二經(jīng)脈和奇經(jīng)八脈上,所以本實(shí)驗(yàn)中經(jīng)絡(luò)大類只選用了十二經(jīng)脈與奇經(jīng)八脈兩個(gè)子類(subclass)。
穴位,也叫腧穴,分為經(jīng)穴和經(jīng)外穴兩大類。根據(jù)我國(guó)國(guó)家標(biāo)準(zhǔn)GB12346-90《經(jīng)穴部位》,人體共有361個(gè)經(jīng)穴、48個(gè)經(jīng)外穴[6]。分布在十二經(jīng)絡(luò)和奇經(jīng)八脈的任脈和督脈上的穴位,稱為經(jīng)穴,共有361處,經(jīng)穴和經(jīng)外穴總共為409處。在穴位這一父類中,由于主要是個(gè)體,所以穴位是唯一沒(méi)有子類、只有個(gè)體的大類。
疾病,是指在一定病因作用下身體調(diào)節(jié)功能紊亂而發(fā)生的異常生命活動(dòng)過(guò)程,以及由病因引發(fā)一系列代謝、功能、結(jié)構(gòu)的變化,表現(xiàn)為癥狀、體征和行為的異常[7]。對(duì)于疾病的分類,有中醫(yī)和西醫(yī)兩大醫(yī)療體系。本實(shí)驗(yàn)設(shè)計(jì)的“經(jīng)穴治療”“經(jīng)絡(luò)”“穴位”的概念體系源自中醫(yī),本實(shí)驗(yàn)中所說(shuō)的“疾病”對(duì)應(yīng)的是中醫(yī)范疇內(nèi)的疾病。因此,本實(shí)驗(yàn)在疾病本體的選擇上,主要以《中國(guó)分類主題詞表》中“R25/278 中醫(yī)各科及中醫(yī)急癥學(xué)”中關(guān)于中醫(yī)各類病癥的主題詞為主,并加入了各醫(yī)科圖書、論文、醫(yī)案等資料中出現(xiàn)的病癥及相關(guān)說(shuō)法。作為“疾病”的子類,主要有中醫(yī)內(nèi)科學(xué)、中醫(yī)外科學(xué)、中醫(yī)婦產(chǎn)科學(xué)、中醫(yī)兒科學(xué)、中醫(yī)腫瘤科學(xué)、中醫(yī)骨傷科學(xué)、中醫(yī)皮膚科學(xué)與性病學(xué)、中醫(yī)泌尿?qū)W、中醫(yī)神經(jīng)病學(xué)與精神病學(xué)九類[8]。由于有些類需要細(xì)分,特將“疾病”體系列成下表,具體如圖1所示。
圖1 經(jīng)穴治療領(lǐng)域本體疾病類別體系框架
方法,主要是指對(duì)經(jīng)絡(luò)穴位使用的方法,主要包括針?lè)ā⒕姆?、推拿、按摩、拔罐。各種外治方法中還分各種類別,例如拔罐按照罐的材質(zhì)還可以細(xì)分為竹管罐、玻璃罐、土罐等拔罐方法,但作為實(shí)驗(yàn)性研究,只取以上5種大類方法,不作細(xì)分。
根據(jù)上述類別概念以及類的層次體系的劃分,在protégé中進(jìn)行建設(shè),如圖2所示。
圖2 經(jīng)穴治療領(lǐng)域本體疾病類別體系
建立上述類別與類的層級(jí)關(guān)系后,對(duì)類的屬性進(jìn)行定義。類的屬性多種多樣,protégé中最常見(jiàn)的屬性有對(duì)象屬性和數(shù)據(jù)屬性,還包括subproperty和annotation。
3.2.1 類的對(duì)象屬性
對(duì)象屬性(object property)是類的重要屬性,對(duì)象屬性也叫關(guān)系屬性,一般連接兩個(gè)個(gè)體(實(shí)例),是本體具有語(yǔ)義關(guān)系的關(guān)鍵。由于對(duì)象屬性的關(guān)聯(lián),使得不同的本體之間有了關(guān)系,因此對(duì)象屬性也可以稱為外部屬性。
在本實(shí)驗(yàn)中,對(duì)象屬性的確定主要是通過(guò)各類之間的實(shí)際關(guān)系,以及參照相關(guān)中醫(yī)本體建設(shè)的語(yǔ)義關(guān)系,具體確定為以下四組。經(jīng)絡(luò)與穴位是“擁有”和“存在于”的關(guān)系,方法與穴位之間是“作用”與“使用”的關(guān)系,穴位與疾病之間是“使用”與“對(duì)應(yīng)”的關(guān)系,經(jīng)絡(luò)與疾病之間是“影響”與“被影響”的關(guān)系。同時(shí),這四對(duì)類間關(guān)系為互逆(inverse)關(guān)系。
在四大類八個(gè)關(guān)系中,穴位類是高頻類,與其他三個(gè)類都有語(yǔ)義關(guān)系;其次是疾病和經(jīng)絡(luò)類,這兩大類都分別與兩個(gè)類別產(chǎn)生聯(lián)系;低頻類是方法類,只與穴位類產(chǎn)生聯(lián)系。
在軟件中設(shè)置對(duì)象屬性時(shí),對(duì)屬性的定義域和值域要進(jìn)行限定。本實(shí)驗(yàn)中8個(gè)對(duì)象屬性對(duì)應(yīng)的定義域和值域如表1所示。
表1 經(jīng)穴治療領(lǐng)域本體對(duì)象屬性
3.2.2 類的數(shù)據(jù)屬性
概念(類)的數(shù)據(jù)屬性(datatype property)即概念(類)自身所擁有的特征。如果一個(gè)概念(類)擁有某種屬性,則這個(gè)概念(類)的子類及其實(shí)例均有此種屬性。數(shù)據(jù)屬性也成為內(nèi)部屬性。在進(jìn)行屬性構(gòu)建時(shí),應(yīng)對(duì)擁有某種屬性的最大的類添加數(shù)據(jù)屬性并給予賦值。
protégé是在JAVA環(huán)境下運(yùn)行的,所以對(duì)于類的數(shù)據(jù)屬性的值也是與JAVA數(shù)據(jù)類型相符的。主要包括整數(shù)類型、字符類型、浮點(diǎn)類型、邏輯類型,選項(xiàng)值為byte,short,int,long,char,string,float,double,boolean等。
在本實(shí)驗(yàn)中添加數(shù)據(jù)屬性時(shí),由于類別的數(shù)據(jù)屬性均為名稱,屬于字符類型,所以數(shù)據(jù)屬性的確定比較簡(jiǎn)便單一。具體賦值如表2所示。
3.2.3 屬性約束
屬性約束主要是為屬性添加限制條件,定義了類和類的屬性后,就根據(jù)具體情況為這些類和屬性添加屬性約束。由于protégé的版本不同,屬性約束也不同。Protege4.1主要的屬性約束包括兩種:第一種是定義被約束屬性的屬性值類型,即對(duì)數(shù)據(jù)屬性賦予屬性值,其中常見(jiàn)的賦值類型有int,boolean,byte,datatime,decimal,string,float,double等;第二種屬性約束可以定義被約束屬性的取值方式,如在創(chuàng)建對(duì)象限制,選擇對(duì)象屬性與類進(jìn)行對(duì)應(yīng)時(shí),出現(xiàn)的some,only,min,max,exactly等限制類型。
表2 經(jīng)穴治療領(lǐng)域本體數(shù)據(jù)屬性表
添加實(shí)例是本體開(kāi)發(fā)過(guò)程中工作量較為繁重的一部分,需將經(jīng)穴治療領(lǐng)域中專有名詞按照類進(jìn)行標(biāo)引并提取出來(lái)。通過(guò)軟件工具與人工評(píng)估取舍的方法,最終確定了721個(gè)實(shí)例,包括穴位名稱409個(gè),病例名稱293個(gè)。整個(gè)經(jīng)穴本體庫(kù)需要輸入的類和實(shí)例數(shù)量如表3所示。本實(shí)驗(yàn)使用protégé將所有實(shí)例概念添加到每一個(gè)類及其子類中,并在實(shí)例編輯界面直接添加每個(gè)實(shí)例的屬性關(guān)系,讓實(shí)例與實(shí)例之間建立語(yǔ)義關(guān)系。
表3 經(jīng)穴治療領(lǐng)域本體類別、實(shí)例數(shù)量
Protégé作為本體建設(shè)軟件平臺(tái)的優(yōu)點(diǎn)在于方便檢索、推理和可視化展示。本實(shí)驗(yàn)在進(jìn)行完大類建設(shè)、屬性建設(shè)及實(shí)例輸入后,經(jīng)穴治療本體建設(shè)的前期工作基本完成。然后要實(shí)現(xiàn)本體建設(shè)的目的,發(fā)現(xiàn)經(jīng)絡(luò)、穴位與疾病之間的密切關(guān)系,驗(yàn)證本體建設(shè)的知識(shí)增值。為了保證可視化展示的效果,僅選用“流涕”和“咳嗽”兩種疾病作為檢索詞進(jìn)行展示。
例如在檢索框中輸入“流涕”,結(jié)果如圖3所示。展開(kāi)“大椎”,出現(xiàn)與“大椎”有關(guān)的疾病“咳嗽”“大椎”及所屬的脈絡(luò)“督脈”“大椎”所使用的方法“艾灸”等。通過(guò)語(yǔ)義相關(guān),證明了大椎穴不僅能治療流涕,還能治療咳嗽,如圖4所示。然后將各個(gè)類的層次再往下展開(kāi),會(huì)發(fā)現(xiàn)在各個(gè)本體概念之間的關(guān)系已全部建立,如圖5所示。
由于只選取了與“流涕”和“咳嗽”相關(guān)的概念,所以其他本體概念沒(méi)有顯示。圖5中帶箭頭的實(shí)線表示類別之間的關(guān)系,帶箭頭的虛線表示的是關(guān)系屬性。
語(yǔ)義關(guān)系的揭示是本體建設(shè)的重點(diǎn)。通過(guò)實(shí)驗(yàn)和圖示結(jié)果可推論出多種語(yǔ)義關(guān)系,發(fā)現(xiàn)經(jīng)穴治療中的相關(guān)關(guān)聯(lián),為中醫(yī)經(jīng)穴治療提供一定的數(shù)據(jù)支持。例如,通過(guò)按摩屬于“足太陽(yáng)膀胱經(jīng)”的“風(fēng)門”“肺俞”能治療“咳嗽”,通過(guò)艾灸督脈的大椎能治療咳嗽與流涕,按摩手太陰肺經(jīng)的“魚(yú)際”能治療咳嗽,按摩“足太陽(yáng)膀胱經(jīng)”對(duì)肺系疾病及咳嗽也能產(chǎn)生影響。
通過(guò)圖中的直線與虛線,我們能通過(guò)數(shù)據(jù)統(tǒng)計(jì)分析哪個(gè)概念是高頻詞匯。例如在本實(shí)驗(yàn)中“大椎”的關(guān)系線就多于“風(fēng)門”與“肺俞”,說(shuō)明“大椎”在這個(gè)本體框架中屬于活躍詞匯、高頻詞匯。同時(shí),這種高頻詞匯的統(tǒng)計(jì),能夠?qū)χ嗅t(yī)穴位研究提供新的角度。例如通過(guò)對(duì)“足太陽(yáng)膀胱經(jīng)”上穴位的統(tǒng)計(jì),發(fā)現(xiàn)經(jīng)絡(luò)上的“風(fēng)門”和“肺俞”的穴位數(shù)多于“手太陰肺經(jīng)”上的穴位數(shù),可見(jiàn)“足太陽(yáng)膀胱經(jīng)”穴位對(duì)“咳嗽”的影響也很大。這打破了人類常識(shí)中的“肺系疾病”只與“手太陰肺經(jīng)”相關(guān)聯(lián)的印象,為治療“咳嗽”疾病提供了新的角度。
圖3 經(jīng)穴治療領(lǐng)域本體實(shí)驗(yàn)初期展示
圖4 經(jīng)穴治療領(lǐng)域本體實(shí)驗(yàn)中期展示
圖5 經(jīng)穴治療領(lǐng)域本體實(shí)驗(yàn)結(jié)果展示
領(lǐng)域本體是領(lǐng)域概念及概念間詳細(xì)關(guān)系的一種形式化描述,是語(yǔ)義網(wǎng)發(fā)展的重要基礎(chǔ)[9]。從知識(shí)組織角度來(lái)看,領(lǐng)域本體的建設(shè)為知識(shí)組織的規(guī)范化、語(yǔ)義化提供了可能,特別是protégé軟件的可視化展示與檢索,讓人們更加直觀地體驗(yàn)了本體的語(yǔ)義化展示。本實(shí)驗(yàn)通過(guò)經(jīng)穴治療領(lǐng)域本體的建設(shè),探索了本體建設(shè)的具體步驟,并且通過(guò)語(yǔ)義分析、本體概念統(tǒng)計(jì)分析等方法,實(shí)現(xiàn)了本體建設(shè)的知識(shí)增值。
與傳統(tǒng)的知識(shí)組織方法比較,本體構(gòu)建在知識(shí)組織方面具有以下特點(diǎn)。一是范圍廣:由于各種關(guān)系的增加,語(yǔ)義外延的擴(kuò)大,相同詞匯下知識(shí)量大于各種敘詞表的詞匯;二是層次深:本體在概念揭示上,比元詞、主題詞、關(guān)鍵詞等更靈活,不拘泥于詞匯的外在形式,更關(guān)注于詞匯內(nèi)在含義,因此在概念深度方面比其他詞匯要深;三是關(guān)聯(lián)度強(qiáng):本體構(gòu)建最大的特點(diǎn)就是語(yǔ)義間的關(guān)聯(lián),關(guān)系屬性在不同本體之間的建立,使得本體擁有了復(fù)雜的語(yǔ)義關(guān)系,實(shí)現(xiàn)了知識(shí)組織的增值;四是擴(kuò)展性強(qiáng):本體構(gòu)建使用的protégé軟件可以將建成的本體,生成owl或者rdf格式,方便構(gòu)建好的本體在語(yǔ)義網(wǎng)或者其他數(shù)據(jù)網(wǎng)站上使用,實(shí)現(xiàn)數(shù)據(jù)間的關(guān)聯(lián)。
總之,知識(shí)領(lǐng)域本體的構(gòu)建,實(shí)現(xiàn)了知識(shí)組織從形式到內(nèi)容、到語(yǔ)義關(guān)系的不斷突破。借助互聯(lián)網(wǎng)技術(shù),本體成為語(yǔ)義網(wǎng)建設(shè)的核心和關(guān)鍵。形式化、標(biāo)準(zhǔn)化的領(lǐng)域本體為信息系統(tǒng)之間的互操作提供了良好的工具[10],對(duì)本體形式化的應(yīng)用也將成為知識(shí)組織研究領(lǐng)域的下一個(gè)目標(biāo)。
中華醫(yī)學(xué)圖書情報(bào)雜志2018年2期