摘要:本文以\"中醫(yī)方證研究與新藥開發(fā)決策服務(wù)平臺\"的近11萬條病因病機(jī)術(shù)語為研究范圍,探討構(gòu)建中醫(yī)病因病機(jī)本體的研究思路,從而促進(jìn)中醫(yī)病因病機(jī)術(shù)語的規(guī)范化、標(biāo)準(zhǔn)化、信息化;加快中醫(yī)藥信息基礎(chǔ)數(shù)據(jù)庫的構(gòu)建過程;提高文獻(xiàn)檢索的效率。
關(guān)鍵詞:中醫(yī)病因病機(jī);本體;術(shù)語標(biāo)準(zhǔn)化研究
病機(jī)學(xué)的定義為:研究疾病發(fā)生、發(fā)展和變化的基本規(guī)律的中醫(yī)基礎(chǔ)學(xué)科,是具有中醫(yī)特色的病理學(xué)。根據(jù)這一定義,病機(jī)學(xué)的內(nèi)容應(yīng)包括病因?qū)W、發(fā)病學(xué)、病機(jī)的構(gòu)成和分類、審察病機(jī)的原則和方法等[1]。
病因病機(jī)理論是中醫(yī)學(xué)關(guān)于人體疾病產(chǎn)生的原因及其發(fā)生、發(fā)展、變化、轉(zhuǎn)歸的機(jī)制和基本規(guī)律的理論,是中醫(yī)學(xué)基礎(chǔ)理論的重要組成部分[2]。在科學(xué)技術(shù)迅猛發(fā)展的今天,面對西醫(yī)學(xué)和其它傳統(tǒng)醫(yī)學(xué)的激烈競爭和挑戰(zhàn),如何逐步實現(xiàn)中醫(yī)學(xué)現(xiàn)代化、標(biāo)準(zhǔn)化、信息化,是我們面臨的緊迫的戰(zhàn)略任務(wù)。
1國內(nèi)外中醫(yī)病因病機(jī)術(shù)語標(biāo)準(zhǔn)化的研究現(xiàn)狀
據(jù)不完全統(tǒng)計,國內(nèi)已經(jīng)發(fā)表的中醫(yī)標(biāo)準(zhǔn)出版物共72個,其中標(biāo)準(zhǔn)機(jī)構(gòu)制定的為9個,包括術(shù)語標(biāo)準(zhǔn)4個、醫(yī)療標(biāo)準(zhǔn)30個、針灸標(biāo)準(zhǔn)8個、管理標(biāo)準(zhǔn)30個[3]。
國外已開展的中醫(yī)標(biāo)準(zhǔn)化相關(guān)工作包括,世界衛(wèi)生組織所制定的相關(guān)標(biāo)準(zhǔn), 如W HO相關(guān)中醫(yī)標(biāo)準(zhǔn)、W H O 針灸標(biāo)準(zhǔn)等, FDA對針灸管理的相關(guān)標(biāo)準(zhǔn), 一些國家開展的關(guān)于傳統(tǒng)醫(yī)藥標(biāo)準(zhǔn)的工作, 如英國、荷蘭、西班牙、菲律賓等[3]。
但上述標(biāo)準(zhǔn)中,大部分是針對疾病、征候以及治法術(shù)語進(jìn)行分類,僅涉及了部分病因、病機(jī)術(shù)語,范圍較小。
2國內(nèi)外醫(yī)學(xué)本體的研究進(jìn)展
1998年,Studer為本體給出的定義為\"共享概念模型的明確的形式化規(guī)范說明\",這是迄今為止關(guān)于本體的獲得較多公認(rèn)的規(guī)范定義[4]。在醫(yī)學(xué)領(lǐng)域,很早就引入了本體的概念。國外醫(yī)學(xué)術(shù)語研究已有較為成熟的醫(yī)學(xué)術(shù)語本體包括UMLS(Unified Medical Language System,一體化醫(yī)學(xué)語言系統(tǒng))[5]、SNOMED CT(Systematized Nomenclature of Medicine -- Clinical Terms)醫(yī)學(xué)系統(tǒng)命名法-臨床術(shù)語[6]。
UMLS是美國國家醫(yī)學(xué)圖書館 (NLM)從1986年開始研究的一項長期開發(fā)項目,第13版約有來自60多醫(yī)學(xué)詞典系列的2百萬生物醫(yī)學(xué)術(shù)語。
UMLS的目標(biāo)是幫助研究人員從大量的數(shù)據(jù)來源中查詢和整合電子生物醫(yī)學(xué)信息,并能容易地連接到單獨(dú)的信息系統(tǒng)的開發(fā)中去,例如:基于計算機(jī)的病人記錄,生物數(shù)據(jù)庫,事實數(shù)據(jù)庫和專家系統(tǒng)等。NLM正在將UMLS用于自己的PubMed文獻(xiàn)查詢數(shù)據(jù)庫和ClinicalTrials.gov臨床試驗系統(tǒng)。
SNOMED CT是當(dāng)前國際上廣為使用的一種臨床醫(yī)學(xué)術(shù)語標(biāo)準(zhǔn),收錄有超過344000個概念,涵蓋了臨床醫(yī)學(xué)的大多數(shù)方面,由美國病理學(xué)家協(xié)會的SNOMED-RT和英國國家衛(wèi)生局的臨床術(shù)語標(biāo)準(zhǔn)合并而成。其經(jīng)過系統(tǒng)組織編排,便于計算機(jī)處理的醫(yī)學(xué)術(shù)語,涵蓋大多數(shù)方面的臨床信息,如疾病、癥狀、操作、微生物、藥物等。采用該術(shù)語集,可以協(xié)調(diào)不同的學(xué)科、專業(yè)對于臨床數(shù)據(jù)的標(biāo)引、存儲、檢索和聚合,有助于組織病歷。
上海中醫(yī)藥大學(xué)醫(yī)學(xué)信息化標(biāo)準(zhǔn)化研究室已經(jīng)開展了中醫(yī)頂層本體[7]、證候本體的探索[8]、治則治法本體[9]、方劑本體的探索[10]等多項課題的研究。本研究是在我研究室原有的基礎(chǔ)上進(jìn)一步構(gòu)建病因病機(jī)本體。
3構(gòu)建中醫(yī)病因病機(jī)本體
我們根據(jù)Gruber在1995年提出的5條本體構(gòu)建的規(guī)則[11],結(jié)合中醫(yī)病因病機(jī)理論的特點(diǎn),運(yùn)用美國斯坦福大學(xué)開發(fā)的Protégé本體編輯器,以近11萬條病因病機(jī)術(shù)語為研究范圍,試著構(gòu)建中醫(yī)病因病機(jī)本體。具體如下。
3.1本體構(gòu)建原則 ①明確性和客觀性,②完整性,③一致性,④最大單向可擴(kuò)展性,⑤最少約束性。
3.2本體構(gòu)建方法與步驟
3.2.1確立本體的專業(yè)領(lǐng)域和范圍 本研究以\"中醫(yī)方證研究與新藥開發(fā)決策服務(wù)平臺\"[12](簡稱方證平臺)收集的近11萬條病因病機(jī)術(shù)語為研究對象。同時,以中醫(yī)病因病機(jī)術(shù)語相關(guān)的專著、標(biāo)準(zhǔn)等為規(guī)范病機(jī)術(shù)語標(biāo)準(zhǔn),如《中醫(yī)臨床診療術(shù)語·疾病部分》和《中醫(yī)臨床診療術(shù)語·證候部分》中的病因病機(jī)術(shù)語1824條,《中醫(yī)大辭典》中的病因病機(jī)術(shù)語1288條等作為標(biāo)準(zhǔn)病因病機(jī)術(shù)語參考。
3.2.2建立本體概念框架 以中醫(yī)病因病機(jī)領(lǐng)域本體知識為基礎(chǔ),構(gòu)成中醫(yī)病因病機(jī)領(lǐng)域問題的理論框架。
3.2.3定義類和類的等級體系 按照中醫(yī)基礎(chǔ)理論將病因分為外感病因、內(nèi)傷病因、病理性因素、其他病因;病機(jī)分為基本病機(jī)、系統(tǒng)病機(jī),基本病機(jī)包括邪正盛衰、陰陽失調(diào)、氣血失調(diào)、津液失調(diào),系統(tǒng)病機(jī)包括外感熱病病機(jī)、內(nèi)生五氣病機(jī)、臟腑病機(jī)、經(jīng)絡(luò)病機(jī)、疾病的傳變、疾病的轉(zhuǎn)歸等,見圖1。
圖1 病因病機(jī)本體的等級體系圖
3.2.4定義類的屬性 屬性體現(xiàn)的是概念之間的關(guān)系。屬性有兩種:對象屬性和數(shù)據(jù)屬性。對象屬性連接個體與個體(連接兩個類),數(shù)據(jù)屬性將個體(類)與XML框架中的具體數(shù)據(jù)類型關(guān)聯(lián)。以\"痰火擾心\"為例, 在病因病機(jī)本體中,如下定義\"痰火擾心\":\"痰火擾心\"有病位、病因、關(guān)系等屬性(對象屬性),其中病位的屬性值為\"心\"、病因的屬性值為\"痰\"和\"火\"、關(guān)系的屬性值為\"擾\"。病因病機(jī)本體中的其他術(shù)語概念都按照這一模式定義,具體實例,見圖2。
3.2.5創(chuàng)建實例 采用中醫(yī)藥文獻(xiàn)學(xué)研究、語義學(xué)研究及計算機(jī)數(shù)據(jù)分析、關(guān)聯(lián)及類聚等方法,將上述近11萬條病因病機(jī)術(shù)語導(dǎo)入SQL Server 2005數(shù)據(jù)庫。然后,參照相關(guān)的病因病機(jī)術(shù)語專著,以計算機(jī)本體理論為指導(dǎo)原則,通過計算機(jī)預(yù)處理與人工審核交替循環(huán)進(jìn)行的方式。按照中醫(yī)學(xué)理論,逐條分析,對相關(guān)的病因病機(jī)術(shù)語進(jìn)行語義分析、定義、定位,從描述性的中醫(yī)病因病機(jī)語句中標(biāo)注、切割出規(guī)范化的單一語義的病因病機(jī)術(shù)語。參考UMLS、SNOMED CT等醫(yī)學(xué)本體,分析規(guī)范化后的中醫(yī)病因病機(jī)術(shù)語的分類體系和病因病機(jī)術(shù)語間的相互關(guān)系,運(yùn)用本體構(gòu)建工具protégé4.2等構(gòu)建中醫(yī)病因病機(jī)本體。
4結(jié)論
中醫(yī)理論博大精深,浩如煙海,經(jīng)過歷代的發(fā)展,存在某種程度的概念和表述的不統(tǒng)一、不規(guī)范問題,如何依托先進(jìn)的信息技術(shù),使中醫(yī)信息標(biāo)準(zhǔn)化、規(guī)范化,達(dá)到知識共享的目的,是近年來的熱點(diǎn)問題之一。
本體技術(shù)是一項興起于人工智能領(lǐng)域的新技術(shù),其采用XML結(jié)構(gòu)化和計算機(jī)可讀性語言有助于表達(dá)豐富的專業(yè)領(lǐng)域知識,將成為文本信息查詢、醫(yī)學(xué)自然文本處理、電子病歷數(shù)據(jù)開發(fā)、海量醫(yī)學(xué)信息挖掘等醫(yī)學(xué)信息學(xué)工程的有力的指導(dǎo)工具。
本文通過嘗試構(gòu)建中醫(yī)病因病機(jī)本體,開展關(guān)于中醫(yī)病因病機(jī)標(biāo)準(zhǔn)化研究的探討,促進(jìn)中醫(yī)疾病概念體系定義更加明確,結(jié)構(gòu)更為清晰,層次更為清楚,有利于對中醫(yī)病因病機(jī)信息進(jìn)行語義層面的檢索,提高中醫(yī)病因病機(jī)信息的查詢率,促進(jìn)病因病機(jī)等中醫(yī)術(shù)語的規(guī)范化、信息化。
參考文獻(xiàn):
[1]成肇智,等.病機(jī)學(xué)是中醫(yī)學(xué)理論體系的核心[J].中國醫(yī)藥學(xué)報.1994.9(5):5-8
[2]譚達(dá)全.中醫(yī)病因病機(jī)理論研究方法的再思考[J].湖南中醫(yī)雜志.2013.1(29):2-5
[3]崔蒙,等.中醫(yī)標(biāo)準(zhǔn)化發(fā)展戰(zhàn)略研究[J].世界科學(xué)技術(shù)-中醫(yī)藥現(xiàn)代化.2006.4(8):17-20
[4] Studer R, Benjamins V.R, Fensel D. Data and Knowledge Engineering [J]. Principles and Methods 1998, 25(12):161-197.
[5]National Institutes of Health Human Services .UMLS主頁 [EB/OL] .[2013-3-6].http://www.nlm.nih.gov/research/umls/quickst sdo.org /snomed-ct/.
[6] Jan-Eric Slot. SNOMED CT主頁[EB/OL] [2013-4].http://www.iht art.html.
[7]高成勉,包含飛,周強(qiáng).本體構(gòu)建原則及其在中醫(yī)頂層本體構(gòu)建中的應(yīng)用[J].醫(yī)學(xué)信息,2008,(05):581-583.
[8]李明,朱邦賢,周強(qiáng),等.中醫(yī)證候本體表達(dá)模式的構(gòu)建研究[J].上海中醫(yī)藥雜志,2013,47(1):7-11.
[9]侯玉,張昌林,周強(qiáng),等.Protégé在構(gòu)建中醫(yī)治則治法本體中的運(yùn)用[J].醫(yī)學(xué)信息,2007,(11):1866-1871.
[10]于靜,孫秀麗,車立娟,等.中醫(yī)方劑本體構(gòu)建過程中的概念形式化研究[J].數(shù)理醫(yī)藥學(xué)雜志,2011,(05):572-575.
[11]T.R. Gruber.Towards Principles For the Design of Ontologies Used for Knowledge Sharing [J].International Journal of Human Computer Studies, 1995,43:907-928.
[12]朱邦賢,包來發(fā),陳曉,等.中醫(yī)方證現(xiàn)代研究服務(wù)平臺建設(shè)構(gòu)想的實現(xiàn)[J].上海中醫(yī)藥雜志,2009,03:49-52.
編輯/張燕