賈李蓉++李海燕++劉靜++董燕++劉麗紅
摘要:中醫(yī)藥術(shù)語規(guī)范化是信息化的基礎(chǔ)。隨著中醫(yī)藥信息化的發(fā)展,術(shù)語系統(tǒng)也隨之發(fā)展起來。中國中醫(yī)科學院中醫(yī)藥信息研究所在術(shù)語規(guī)范化和標準化的研究方面一直走在行業(yè)前列,該所研制的中國中醫(yī)藥學主題詞表、中醫(yī)藥學語言系統(tǒng)和中醫(yī)臨床術(shù)語系統(tǒng)都已具有一定規(guī)模,其應用與推廣工作也在進行中。
關(guān)鍵詞:中醫(yī)藥;術(shù)語系統(tǒng);術(shù)語規(guī)范化;中醫(yī)藥學主題詞表;中醫(yī)藥學語言系統(tǒng);中醫(yī)臨床術(shù)語系統(tǒng)
自20世紀中葉以來,科技術(shù)語的數(shù)目呈現(xiàn)出指數(shù)增長態(tài)勢,尤以生命科學和信息科學最為突出。術(shù)語激增,帶給人們理解上的困難,隨之而來的是使用混亂和交流障礙。對于中醫(yī)藥學科而言,信息化的發(fā)展,對于其術(shù)語概念的規(guī)范要求越來越高。術(shù)語系統(tǒng)則是實現(xiàn)名詞術(shù)語規(guī)范化的有效手段。中國中醫(yī)科學院中醫(yī)藥信息研究所自20世紀80年代起開始研制中醫(yī)藥學主題詞表,在中醫(yī)藥學科的術(shù)語系統(tǒng)構(gòu)建中邁出了探索的一步。到21世紀初,我所又借鑒國際先進技術(shù)和方法,分別針對不同應用環(huán)境,研制了中醫(yī)藥學語言系統(tǒng)和中醫(yī)臨床術(shù)語系統(tǒng)。目前,這三大術(shù)語系統(tǒng)都已具一定規(guī)模,其應用與推廣工作也在進行中。
1 中國中醫(yī)藥學主題詞表
《中國中醫(yī)藥學主題詞表》是我國第一部中醫(yī)藥專業(yè)詞表,被國內(nèi)外醫(yī)學及中醫(yī)藥學信息界廣泛采用。本詞表以其科學性、適用性以及與MeSH詞表的兼容性獲得使用者好評。它的誕生標志著中醫(yī)藥學信息處理和信息服務跨入計算機信息時代,并以其獨特的學術(shù)內(nèi)涵和廣泛的兼容性為中醫(yī)藥信息產(chǎn)品在國內(nèi)外推廣應用創(chuàng)造重要條件,提供技術(shù)保障。
1.1 研究歷程
中醫(yī)藥學主題詞表的研究起步于20世紀70年代,發(fā)展于80年代。早在1976年,國家科學技術(shù)委員會領(lǐng)導的“748工程”《漢語主題詞表》中,已將中醫(yī)藥學內(nèi)容置于重要位置。1984年,原中國中醫(yī)研究院中醫(yī)藥圖書情報中心(現(xiàn)中國中醫(yī)科學院中醫(yī)藥信息研究所)開始著手進行中醫(yī)藥學專業(yè)主題詞表的編纂。經(jīng)過反復修改與論證,《中醫(yī)藥學主題詞表》于1987年問世。此后經(jīng)過多年的實踐與應用,于1996年以機讀版和印刷版的形式出版了修訂版,更名為《中國中醫(yī)藥學主題詞表》。2004年12月,國家中醫(yī)藥管理局將修訂1996年版《中國中醫(yī)藥學主題詞表》列為標準化研究項目,經(jīng)過廣泛調(diào)研國內(nèi)外醫(yī)學主題詞表的理論、方法和經(jīng)驗,進行了大量的詞頻分析及用戶反饋意見分析后,出版了《中國中醫(yī)藥學主題詞表》2008版。2013年,我所設(shè)立課題項目《中國中醫(yī)藥學主題詞表網(wǎng)絡(luò)版研制與修訂》,基于近5年中醫(yī)藥學文獻主題詞標引和檢索實踐,在詞頻統(tǒng)計、共詞分析以及用戶反饋意見分析等基礎(chǔ)上進行選詞與修訂,建立中醫(yī)藥學主題詞表管理系統(tǒng),實現(xiàn)網(wǎng)絡(luò)發(fā)布,同時培養(yǎng)中醫(yī)藥學主題詞表維護的專門人才。2015年底將完成該詞表網(wǎng)絡(luò)版的發(fā)布,正式投入使用。
1.2 詞表結(jié)構(gòu)
《中國中醫(yī)藥學主題詞表》由字順表、樹形結(jié)構(gòu)表、副主題詞表、出版類型表、醫(yī)學家姓名附表、索引表6個部分構(gòu)成。
1.2.1 字順表又稱為主表。指將全部主題詞及入口詞按漢語拼音順序排列而生成的印刷版或電子版表。主題詞款目結(jié)構(gòu)為漢語拼音、主題詞名稱、主題詞英譯名、樹型結(jié)構(gòu)號、主題詞定義、標引及編目注釋及參加項。
1.2.2 樹形結(jié)構(gòu)表又稱范疇表。指將主題詞按中醫(yī)藥學學科分類劃分為15個子類目及二級子類目,列出隸屬于該類目的全部主題詞,按屬分關(guān)系逐級展開,呈樹形結(jié)構(gòu),每個主題詞均有雙字母數(shù)字標識以顯示主題詞的級別;該詞表的分類方式可以與MeSH詞表的分類相兼容。
1.2.3 副主題詞表包括1個專題副主題詞表及3個編目副主題詞表。專題副主題詞表收錄了副主題詞93個,其中MeSH副主題詞83個,中醫(yī)藥學副主題詞10個,分別為中醫(yī)藥療法、中西醫(yī)結(jié)合療法、針灸療法、按摩療法、穴位療法、氣功療法、中醫(yī)病機、針灸效應、氣功效應、生產(chǎn)和制備。在標引和檢索時用副主題詞對主題詞進行限定,使主題方面更加專指,每個副主題詞均有明確的定義和范圍,對其允許組配的主題詞類目有嚴格的規(guī)定。
1.2.4 出版類型表收錄MeSH詞表中出版類型44個,供標引與檢索使用。
1.2.5 醫(yī)學家姓名附表收錄醫(yī)學家姓名59條,按漢語拼音順序排列。本表供書本式檢索工具書編制索引及書籍主題編目使用,在數(shù)據(jù)庫的標引及檢索時做主題姓名標引和檢索的參考。
1.2.6 索引表 為幫助用戶多途徑快速檢查主題詞,本詞表編制了3種主題詞索引表,包括漢語拼音索引、漢字筆畫索引、英(拉?。h對照索引。
1.3 詞表應用
《中國中醫(yī)藥學主題詞表》是中醫(yī)藥文獻數(shù)據(jù)庫建設(shè)與檢索的重要工具,自1984年研制以來,主要應用于中醫(yī)藥文獻數(shù)據(jù)庫的建設(shè)與檢索,采用與MeSH表聯(lián)合使用的方法,進行中醫(yī)藥學文獻的主題標引。主要應用于中國生物醫(yī)學文獻服務系統(tǒng)(SinoMed)、中國中醫(yī)藥期刊文獻數(shù)據(jù)庫、萬方醫(yī)學網(wǎng)等數(shù)據(jù)庫的標引與檢索。
2 中醫(yī)藥學語言系統(tǒng)
由于歷史沿革等原因,中醫(yī)藥學術(shù)語存在不規(guī)范、不統(tǒng)一現(xiàn)象,同物異名、同名異物現(xiàn)象很多,給中醫(yī)藥數(shù)字化和信息化提出了不小的難題。在中醫(yī)藥各領(lǐng)域、各類型數(shù)據(jù)庫的發(fā)展過程中,亟需將描述同物同類的概念整合、規(guī)范,從而使中醫(yī)藥學語言系統(tǒng)建設(shè)成為中醫(yī)藥信息化發(fā)展的必然基礎(chǔ)。2002年,中國中醫(yī)科學院中醫(yī)藥信息研究所開始研制中醫(yī)藥學語言系統(tǒng)。
2.1 研制歷程
中醫(yī)藥學語言系統(tǒng)的研制經(jīng)歷了建設(shè)初始、迅速發(fā)展、國際標準化3個發(fā)展階段。
2.1.1 建設(shè)初始階段主要是對中醫(yī)藥學語言系統(tǒng)的構(gòu)建進行方法學研究。方青用本體論的方法提出了建立中醫(yī)藥語言系統(tǒng)的方案。尹愛寧等從中醫(yī)藥學語言系統(tǒng)復雜度的約定方法、多學科交融與碰撞方法及本體論與詮釋論關(guān)聯(lián)應用的方法進行研究,為建立中醫(yī)藥學語言系統(tǒng)提供新思路、新方法。
2.1.2 迅速發(fā)展階段對中醫(yī)藥學語言系統(tǒng)進行大規(guī)模的術(shù)語數(shù)據(jù)采集和加工,包括現(xiàn)代中醫(yī)藥術(shù)語以及古代中醫(yī)藥術(shù)語,崔蒙等從語義類型和語義關(guān)系兩個角度出發(fā),對系統(tǒng)中的低質(zhì)量數(shù)據(jù)進行數(shù)據(jù)清洗,提出基于語義網(wǎng)絡(luò)的數(shù)據(jù)清洗策略,并對語義關(guān)系進行分析整理,重點增加了中醫(yī)特有的語義關(guān)系,如“開竅于……”“與……相表里”等。朱玲等根據(jù)古籍特點,從中醫(yī)古籍分類、古籍概念定義、與現(xiàn)代系統(tǒng)兼容等方面探討中醫(yī)古籍語言系統(tǒng)構(gòu)建的關(guān)鍵問題與對策。但系統(tǒng)中的術(shù)語數(shù)據(jù)仍存在很多質(zhì)量問題。
2.1.3 國際標準化階段2008年以后,李海燕等通過參加國際標準化組織健康信息技術(shù)委員會(ISO/TC215)的工作,推進中醫(yī)藥學語言系統(tǒng)語義網(wǎng)絡(luò)的國際標準化發(fā)展,《ISO/TS 17938:2014中醫(yī)藥學語言系統(tǒng)語義網(wǎng)絡(luò)框架》國際標準以中醫(yī)藥學語言系統(tǒng)為基礎(chǔ),重新定義了中醫(yī)藥學語言系統(tǒng)的語義類型、語義概念及它們之間的語義關(guān)系。該標準不僅規(guī)范和支持了中醫(yī)藥學語言系統(tǒng)的建設(shè),還為中醫(yī)藥學術(shù)語系統(tǒng)和本體創(chuàng)建提供了語義標準,為中醫(yī)藥學語言系統(tǒng)和統(tǒng)一的醫(yī)學語言系統(tǒng)的映射提供了支持,對于中醫(yī)藥學術(shù)語信息的交換具有重要意義。
2.2 主要組成
2.2.1 基礎(chǔ)詞庫 是整個中醫(yī)藥學語言系統(tǒng)的核心組成部分,是在對現(xiàn)存各種主題詞表、分類表、數(shù)據(jù)庫、工具書中有關(guān)詞匯進行分析、選擇和組織的基礎(chǔ)上產(chǎn)生的一個大型詞庫。本系統(tǒng)基礎(chǔ)詞庫涵蓋可控詞表與中醫(yī)藥學科系統(tǒng)及與中醫(yī)藥學科相關(guān)聯(lián)的生物、植物、化工等自然與人文科學專業(yè)詞匯。基礎(chǔ)詞庫建立在全面、廣泛、準確、嚴謹?shù)幕A(chǔ)上,最終形成超級基礎(chǔ)詞庫。詞條屬性符合中醫(yī)藥學科自然語言與可控詞的雙重屬性。用準確、完整的方式揭示與表達中醫(yī)藥學科及相關(guān)術(shù)語。這個系統(tǒng)可以相當于統(tǒng)一醫(yī)學語言系統(tǒng)(UMLS)的超級敘詞表和專家詞典。
2.2.2 語義網(wǎng)絡(luò)是構(gòu)建語言系統(tǒng)概念詞相互關(guān)系的權(quán)威規(guī)則。中醫(yī)藥學語義網(wǎng)絡(luò)綜合各類可控詞表的特征,以中醫(yī)藥學科及相關(guān)學科的概念為主干,同時對照UMLS結(jié)構(gòu)和特點,設(shè)計中醫(yī)藥學語言系統(tǒng)網(wǎng)絡(luò)結(jié)構(gòu)。整體結(jié)構(gòu)符合中醫(yī)藥學結(jié)構(gòu)特點,同時能滿足現(xiàn)有中醫(yī)藥信息數(shù)字化需求,以中醫(yī)藥學為基礎(chǔ),涉及與其相關(guān)聯(lián)的學科,如醫(yī)學、生物學、制藥工藝等。語義網(wǎng)絡(luò)是通過語義類型,為出現(xiàn)在中醫(yī)藥學語言系統(tǒng)基礎(chǔ)詞庫中的所有概念提供一種目錄組織結(jié)構(gòu)。目前,中醫(yī)藥學語義網(wǎng)絡(luò)是由127種語義類型和58種語義關(guān)系組成。
2.3 應用
中醫(yī)藥學語言系統(tǒng)作為中醫(yī)藥領(lǐng)域收詞范圍最廣的一個術(shù)語系統(tǒng),其應用范圍很廣。目前該系統(tǒng)主要應用于數(shù)據(jù)處理、自然語言處理、知識檢索、專業(yè)詞表編制、本體建設(shè)等方面。
在數(shù)據(jù)處理方面主要應用于數(shù)據(jù)庫建設(shè)支持。中醫(yī)藥語言系統(tǒng)被用于數(shù)據(jù)庫建設(shè)中信息抽取的標準化、規(guī)范化、結(jié)構(gòu)化處理。在知識檢索方面主要應用于文獻檢索。我所開發(fā)了基于中醫(yī)藥學語言系統(tǒng)的文獻檢索服務平臺,該平臺以中醫(yī)藥學語言系統(tǒng)為基礎(chǔ),提供中醫(yī)藥文獻檢索、術(shù)語檢索及相關(guān)檢索等多種功能,將中醫(yī)藥文獻進行關(guān)聯(lián)檢索及關(guān)聯(lián)性研究,為使用者開擴思路。在本體建設(shè)方面,朱玲等利用中醫(yī)藥學語言系統(tǒng)構(gòu)建傳統(tǒng)針灸知識本體是有益的嘗試。基于中醫(yī)藥學語言系統(tǒng)針灸部分術(shù)語體系,構(gòu)建了傳統(tǒng)針灸知識本體,揭示了針灸概念之間的隱性關(guān)系。
3 中醫(yī)臨床術(shù)語系統(tǒng)
中醫(yī)臨床術(shù)語系統(tǒng)依據(jù)中醫(yī)臨床特色,確定了中醫(yī)臨床術(shù)語的概念、術(shù)語間的語義關(guān)系,并參考醫(yī)學系統(tǒng)命名法臨床術(shù)語(SNOMED CT)的結(jié)構(gòu)構(gòu)建了大型臨床術(shù)語系統(tǒng)。目前該系統(tǒng)收錄概念詞11萬多條,術(shù)語30萬多個,每個概念包括概念詞、概念屬性、概念定義、相關(guān)概念、概念狀態(tài)等信息。為解決中醫(yī)臨床術(shù)語缺乏統(tǒng)一標準,規(guī)范化、系統(tǒng)化程度較低,機讀效能低下等問題提供了幫助。
3.1 構(gòu)建方法與原則
中醫(yī)臨床術(shù)語系統(tǒng)的研制借鑒了國際先進的醫(yī)學臨床術(shù)語集SNOMED CT的建設(shè)模式,并與中醫(yī)臨床、語言學和信息學專家深入研究中醫(yī)學特有理論體系和臨床診療思路,采用本體論的方法,構(gòu)建中醫(yī)臨床術(shù)語系統(tǒng)。
系統(tǒng)構(gòu)建需遵循4項原則。(1)中醫(yī)原則:以中醫(yī)臨床診療理論為中醫(yī)臨床標準術(shù)語系統(tǒng)研制的指導思想;(2)共識原則:爭取得到中醫(yī)臨床醫(yī)生的普遍認同;(3)質(zhì)量原則:通過設(shè)置多級審查、交叉互審的控制環(huán)節(jié),以保證術(shù)語的質(zhì)量;(4)實用原則:強調(diào)術(shù)語的實用性,以臨床用戶的實用為術(shù)語系統(tǒng)建設(shè)的基本原則,為系統(tǒng)最終用戶提供最大的便利性。
3.2 概念框架
中醫(yī)臨床術(shù)語系統(tǒng)的概念框架是參考SNOMEDCT的結(jié)構(gòu)模式,并根據(jù)中醫(yī)臨床診療特點構(gòu)建。2002年最初構(gòu)建中醫(yī)臨床術(shù)語系統(tǒng)時,采用了12個軸的主體框架。經(jīng)過10余年的發(fā)展,國內(nèi)研究者對中醫(yī)臨床術(shù)語頂層概念分類的探索也一直在進行,并于2011年向國際標準化組織中醫(yī)藥技術(shù)委員會(ISO/TC 249)提交了“中醫(yī)臨床術(shù)語分類結(jié)構(gòu)”國際標準項目建議。2013年,根據(jù)ISO/TC249/WG5專家意見,名稱調(diào)整為“中醫(yī)臨床術(shù)語系統(tǒng)分類結(jié)構(gòu)” (Categories of TCMClinical Terminological System)。2014年1月,該項目通過立項投票。該標準針對中醫(yī)臨床術(shù)語提出分類規(guī)則,并確定分類結(jié)構(gòu),將中醫(yī)臨床術(shù)語頂層概念分為17個大類,見表1。
3.3 應用
中醫(yī)藥信息化發(fā)展涉及信息平臺、電子健康檔案、遠程醫(yī)療系統(tǒng)、電子病歷等建設(shè),其核心內(nèi)容是要實現(xiàn)醫(yī)療信息的交流與共享。實現(xiàn)醫(yī)療信息系統(tǒng)的互通互用,需要一系列語義交換標準,而中醫(yī)臨床術(shù)語則是中醫(yī)醫(yī)療信息系統(tǒng)的基礎(chǔ)部分。該系統(tǒng)可支持中醫(yī)臨床信息建設(shè)、中醫(yī)臨床數(shù)據(jù)利用。
支持中醫(yī)臨床信息建設(shè),主要體現(xiàn)在臨床信息系統(tǒng)的開發(fā)應用,如電子病歷、臨床數(shù)據(jù)數(shù)字化、護士工作站等。支持中醫(yī)臨床術(shù)語的應用,主要體現(xiàn)在可支持中醫(yī)臨床數(shù)據(jù)的數(shù)理統(tǒng)計與數(shù)據(jù)挖掘方面。該系統(tǒng)更加方便于對臨床數(shù)據(jù)進行有效的科學研究,以促進臨床科研一體化發(fā)展。未來還可應用于衛(wèi)生管理系統(tǒng)、醫(yī)療保險系統(tǒng)等。
4 小結(jié)
我所在術(shù)語規(guī)范化研究中做了很多工作,中醫(yī)藥三大術(shù)語系統(tǒng)是這些工作成果的部分展現(xiàn)?!吨袊嗅t(yī)藥學主題詞表》是中醫(yī)藥文獻控制和組織的重要方法之一,它從主題的角度揭示中醫(yī)藥學及其相關(guān)學科文獻內(nèi)容,是中醫(yī)藥文獻主題標引和檢索的重要手段;中醫(yī)藥學語言系統(tǒng)則是集合中醫(yī)藥所有術(shù)語及其相關(guān)學科的大而全的術(shù)語系統(tǒng),為各術(shù)語系統(tǒng)間的術(shù)語建立統(tǒng)一的映射標準,用于支持各個術(shù)語系統(tǒng)和中醫(yī)藥信息系統(tǒng)交換;中醫(yī)臨床術(shù)語系統(tǒng)是針對中醫(yī)臨床診療特點所設(shè)計的,其涵蓋和應用范圍主要側(cè)重于臨床電子病歷規(guī)范化和臨床診療信息標準化。
上述三大術(shù)語系統(tǒng)在中醫(yī)藥領(lǐng)域的不同方面都發(fā)揮了重要的作用。我們將繼續(xù)發(fā)展和完善三大術(shù)語系統(tǒng),使之能在中醫(yī)藥信息化的發(fā)展過程中起到更好的作用。