1.北京航空航天大學(xué)軟件學(xué)院,北京 100191; 2.中國中醫(yī)科學(xué)院中醫(yī)藥信息研究所,北京100700;
3.中國科學(xué)院計(jì)算技術(shù)研究所,北京100190)
摘要:目的 將中醫(yī)病案文本信息環(huán)境、知識(shí)需求、知識(shí)需求常見行為及現(xiàn)有的知識(shí)環(huán)境有機(jī)結(jié)合起來,建立一個(gè)相互聯(lián)系、相互支撐的嵌入式知識(shí)智能在線提示系統(tǒng)。方法 系統(tǒng)利用了量表、規(guī)則提示和異名病癥術(shù)語發(fā)現(xiàn)的方法,集成了文本提取、術(shù)語自動(dòng)獲取、術(shù)語檢索、術(shù)語發(fā)現(xiàn)和智能提示的功能。內(nèi)容本研究提出了一種在中醫(yī)臨床應(yīng)用上的智能在線提示系統(tǒng)。它通過收集關(guān)于藥物、方劑、癥狀、診斷等相關(guān)數(shù)據(jù),集成了強(qiáng)大的數(shù)據(jù)庫詞典,并利用量表和規(guī)則,對(duì)醫(yī)療病案實(shí)現(xiàn)了智能化在線分析。最后,用100份病案數(shù)據(jù)對(duì)系統(tǒng)進(jìn)行了試驗(yàn)。結(jié)果 量表證候提示實(shí)驗(yàn),召回率為63.33%,準(zhǔn)確率為76.00%;病癥異名發(fā)現(xiàn)實(shí)驗(yàn),召回率為58.06%,準(zhǔn)確率為77.78%。結(jié)論 該系統(tǒng)可以提供即時(shí)的中醫(yī)藥知識(shí)服務(wù),提高用戶的知識(shí)查詢、利用的效率。本研究也揭示了臨床量表的制定與臨床實(shí)際存在一定的差距。
關(guān)鍵詞:智能在線提示系統(tǒng);嵌入式知識(shí)服務(wù);中醫(yī)臨床;量表;異名術(shù)語發(fā)現(xiàn)
Intelligent Online Clinic Alert System and it's Application in TCM
SUN Meng1, LI Yuan-bai2, YANG Yang2, LIAN Chao-jie2, CAO Cun-gen3
(1. Beijing University of Aeronautics and Astronautics Software College, Beijing 100191, China; 2.China Chinese Academy of Sciences TCM Information Institute, Beijing 100700, China; 3. Chinese Academy of Science Computing Technolog Institute, Beijing 100190, China)
Abstract:Objective The paper's aim is to build an inter-connected, mutual supported embedded intelligent online clinic alert system,which associated with TCM's medical record text information environment,knowledge requirement's common behavior and existing knowledge environment. Methods The system adopts the methods of scale table,rule promptness and Symptom terminologies'synonyms detection.It also integrates the functions of text extraction and terminologies'automatic acquisition,searching,detection and intelligent promptness. Content This research proposes an Intelligent Online Clinic Alert System which are applied on Traditional Chinese Clinical Medicine. By collecting the data of herbs,prescriptions,systems and diagnosis,the system builds a strong dictionary and achieves intelligent online analysis by scales and rules.At last,100 medical records are used to test the system. Results The recall and accuracy rates of the syndrome prompted experiment by scale table are 63.33% and 76.00%.The recall and accuracy rates of the symptom terminologies'synonyms detection experiment are 58.06% and 77.78%. Conclusions The system can provide instant Chinese medical knowledge service,which improves the effectiveness of knowledge searching and utilization.
Key words:Intelligent Online Clinic Alert System, Embedded Knowledge Services, Clinical Medicine, Scale Table, Symptom Terminologies'Synonyms Detection
1系統(tǒng)研究背景
1.1相關(guān)工作 隨著全球信息化浪潮和中醫(yī)國際化的發(fā)展,中醫(yī)數(shù)字化和標(biāo)準(zhǔn)化研究日益深入,應(yīng)用現(xiàn)代的計(jì)算機(jī)技術(shù)和因特網(wǎng)進(jìn)行中醫(yī)交流、教學(xué)、科研的需求不斷增加。智能中醫(yī)診斷信息處理技術(shù)作為中醫(yī)現(xiàn)代化的重要內(nèi)容,也越來越引起科技界的高度重視。
朱文峰在《中醫(yī)(輔助)診療系統(tǒng)的研究》[1]一文中提到,在原有\(zhòng)"辨證論治電腦系統(tǒng)\"的基礎(chǔ)上,研制成\"WF-Ⅲ中醫(yī)(輔助)診療系統(tǒng)\"。該診療系統(tǒng)在分析研究中醫(yī)診斷治療思維原理和方法的基礎(chǔ)上,建立起辨證論治與辨病論治整體方案,病、證、癥結(jié)合,理、法、方、藥俱備,在中醫(yī)醫(yī)療、科研以及教學(xué)等方面具有廣泛的實(shí)用性。
徐元景、牛欣在《中醫(yī)輔助診療系統(tǒng)的研制》[2]一文中提到,在原有的TCMCADS生成系統(tǒng)的基礎(chǔ)上,從中醫(yī)的脈診和舌診數(shù)字化入手,可采集并重現(xiàn)中醫(yī)的脈圖、舌圖,并建立了以中醫(yī)教材為基礎(chǔ)的中醫(yī)診療數(shù)據(jù)庫,為中醫(yī)師臨床工作提供易用的輔助診療系統(tǒng)平臺(tái),也為中醫(yī)學(xué)生和海外中醫(yī)師提供遠(yuǎn)程的交流和學(xué)習(xí)平臺(tái)。
朱文峰在《創(chuàng)立以證素為核心的辨證新體系》[3]一文中提到,在揭示辨證原理與規(guī)律的基礎(chǔ)上,構(gòu)建以證素為核心的辨證新體系。認(rèn)為\"證素\"是通過對(duì)\"證候\"的辨識(shí)而確定的病位和病性,是構(gòu)成\"證名\"的基本要素也是辨證的核心和關(guān)鍵;證素辨證可涵蓋以往諸種辨證方法的實(shí)質(zhì)內(nèi)容,為把握靈活復(fù)雜的\"證\"找到了執(zhí)簡(jiǎn)馭繁的要領(lǐng),便于臨床操作。
瞿年清、謝夢(mèng)洲在《中醫(yī)智能(輔助)診療系統(tǒng)的設(shè)計(jì)》[4]一文提到,經(jīng)過不斷完善2002年\"WF-Ⅲ中醫(yī)(輔助)診療系統(tǒng)\",系統(tǒng)診療的智能和準(zhǔn)確性都不斷提高。新系統(tǒng)優(yōu)化并重新排列了癥狀、證素、證名以及其計(jì)量標(biāo)準(zhǔn),新增了自動(dòng)問診模式,使用更方便,診療更準(zhǔn)確。
周小青、梁昊、雷麗萍在《癥狀計(jì)量與證素辨證》[5]一文中提到,從癥狀計(jì)量角度闡述計(jì)量診斷如何與證素辨證結(jié)合,提高診斷的準(zhǔn)確性。
孫萌等在《中風(fēng)方劑數(shù)據(jù)初步分析》[6]一文中提到,通過數(shù)據(jù)統(tǒng)計(jì)分析、頻繁項(xiàng)集挖掘等現(xiàn)代技術(shù),對(duì)現(xiàn)有中醫(yī)典籍中治療中風(fēng)的方劑進(jìn)行了用藥統(tǒng)計(jì)分析、頻繁項(xiàng)分析、中醫(yī)典籍分布分、朝代分布分析等處理,可以了解中風(fēng)方劑的從漢代到近現(xiàn)代時(shí)間的發(fā)展脈絡(luò),對(duì)中風(fēng)方劑的用藥特點(diǎn)有深層認(rèn)識(shí),為臨床醫(yī)師提供中風(fēng)方劑應(yīng)用和研究提供參考。
1.2臨床科研人員圍繞文獻(xiàn)、圍繞知識(shí)、圍繞系統(tǒng)的知識(shí)服務(wù)方式浪費(fèi)巨大時(shí)間、精力 目前中醫(yī)藥的知識(shí)服務(wù)模式,雖然越來越個(gè)性化、定制化,但仍然是臨床科研人員尋找多來源的知識(shí)系統(tǒng)過程。一方面臨床科研人員,需要適應(yīng)不同的系統(tǒng),適應(yīng)不同的知識(shí)服務(wù)方式,獲取的知識(shí)后整合方能應(yīng)用,即使有的知識(shí)需求很簡(jiǎn)單,但在尋找知識(shí)系統(tǒng)、整合多來源、多方式的知識(shí)仍然浪費(fèi)大量時(shí)間和精力。另一方面中醫(yī)藥信息人員仍然是在建立功能越來越強(qiáng)大的知識(shí)服務(wù)系統(tǒng),盡管系統(tǒng)提供越來越深層次的知識(shí)服務(wù)功能,但卻逐漸喪失了服務(wù)的易用性。中醫(yī)藥臨床科研人員需要更加簡(jiǎn)單的知識(shí)環(huán)境,知識(shí)服務(wù)的效率需要進(jìn)一步提高。
1.3應(yīng)用中醫(yī)藥病案文本時(shí)需要即時(shí)即地被提供相關(guān)知識(shí)服務(wù) 目前越來越多的臨床數(shù)據(jù)脫離紙質(zhì)形式,而是以病案文本的形式存儲(chǔ)。無論是臨床人員還是科研人員,在書寫、閱讀、應(yīng)用病案文本的不同內(nèi)容時(shí),非常需要同步獲取知識(shí)服務(wù),需求不甚復(fù)雜,而且有重復(fù)性,但以目前的知識(shí)服務(wù)條件,卻無法快速提供答案。
因此,系統(tǒng)需要根據(jù)中醫(yī)藥病案文本的信息環(huán)境和問題,把整合后的知識(shí)信息即時(shí)推送給用戶,形成嵌入病案文本的知識(shí)服務(wù)模式。
本文提出了一種在中醫(yī)臨床應(yīng)用上的智能在線提示系統(tǒng)。它通過收集關(guān)于藥物、方劑、癥狀、診斷等相關(guān)數(shù)據(jù),集成了強(qiáng)大的數(shù)據(jù)庫詞典,并利用量表和規(guī)則,對(duì)醫(yī)療病案實(shí)現(xiàn)了智能化在線分析,從而滿足上述需求。
2系統(tǒng)概況
系統(tǒng)采用為N客戶/服務(wù)器模型。服務(wù)器端的數(shù)據(jù)庫存儲(chǔ)所有中醫(yī)臨床相關(guān)知識(shí),包括數(shù)據(jù)庫詞典、規(guī)則和量表??蛻舳顺绦蚴褂肑ava語言編寫,負(fù)責(zé)提供中醫(yī)臨床的智能在線提示服務(wù)。
系統(tǒng)主要分為三大功能模塊:文本載入模塊在客戶端提取病案文本;術(shù)語搜索匹配模塊和服務(wù)器端數(shù)據(jù)庫詞典進(jìn)行交互,對(duì)相關(guān)操作進(jìn)行響應(yīng);智能提示模塊和服務(wù)器端的規(guī)則和量表數(shù)據(jù)進(jìn)行交互,在客戶端執(zhí)行分析,呈現(xiàn)結(jié)果給用戶。
2.1功能1:病案文本獲取 首先,點(diǎn)擊\"啟動(dòng)取詞\"按鈕,按鈕文字變成\"停止取詞\",此時(shí)進(jìn)入取詞狀態(tài)。此時(shí)切換到其他任意程序的界面,比如記事本,Word或者瀏覽器。然后用鼠標(biāo)框選文本,并按下熱鍵Alt+Z,系統(tǒng)自動(dòng)獲得鼠標(biāo)所選文本。如果用戶提取的內(nèi)容有誤,比如少選了某句話,可以再次用熱鍵進(jìn)行文本提取。
2.2功能2:中醫(yī)術(shù)語標(biāo)注 考慮到病歷的文本可能很長(zhǎng),用戶需要知道他所感興趣的詞條的大致位置,從而更好的指導(dǎo)接下來的操作,因此系統(tǒng)需要對(duì)病歷中出現(xiàn)的中醫(yī)術(shù)語進(jìn)行標(biāo)注,和原文本區(qū)分開。此外,用戶可在甄選類別區(qū)域,提前選擇他感興趣的詞條的類型,選擇后系統(tǒng)只會(huì)在數(shù)據(jù)庫相應(yīng)的表中進(jìn)行匹配。
單擊\"中醫(yī)術(shù)語標(biāo)注\"按鈕,系統(tǒng)會(huì)對(duì)文本進(jìn)行如下處理:①尋找文本中是否有詞語和數(shù)據(jù)庫存儲(chǔ)的術(shù)語完全匹配,并將這些關(guān)鍵詞在文本中用藍(lán)色標(biāo)注出來。例如,在下圖中可以看到,文本中的\"肥胖\"等病癥術(shù)語已經(jīng)在病歷載入?yún)^(qū)用藍(lán)色標(biāo)注出。②尋找文本中是否有量表癥狀,并更新量表信息。在本例中,在按下\"術(shù)語標(biāo)注\"按鈕后,系統(tǒng)已經(jīng)自動(dòng)獲取了病案文本中的量表癥狀信息。見圖1。
圖1 對(duì)病歷文本的術(shù)語進(jìn)行標(biāo)注
2.3功能3:中醫(yī)術(shù)語獲取 考慮到用戶僅對(duì)文本的某些詞條感興趣,系統(tǒng)會(huì)將以當(dāng)前光標(biāo)位置為中心一定范圍內(nèi)的出現(xiàn)的詞條,在結(jié)果展示窗口按照類別逐條顯示并對(duì)每個(gè)詞條提供鏈接,從而減少了用戶在結(jié)果展示區(qū)定位該詞條的時(shí)間。由于已經(jīng)對(duì)文本進(jìn)行標(biāo)注,用戶將很容易定位。如果用戶想進(jìn)一步查看該詞條信息,可以點(diǎn)擊相應(yīng)的鏈接,進(jìn)入詞典窗口。
系統(tǒng)還提供類似搜索引擎的搜索服務(wù):在\"病歷載入?yún)^(qū)\"輸入一個(gè)關(guān)鍵字或詞,然后點(diǎn)擊\"中醫(yī)術(shù)語查詢\"按鈕,系統(tǒng)可以檢索到包含數(shù)據(jù)庫中該詞的所有詞條,并在結(jié)果展示窗口按照類別逐條顯示,并對(duì)每個(gè)詞條提供鏈接。如果想進(jìn)一步查看該詞條信息,可以點(diǎn)擊相應(yīng)的鏈接。
系統(tǒng)在詞典窗口顯示術(shù)語相關(guān)的知識(shí)信息,不同的詞條以不同的選項(xiàng)卡顯示。如果用戶對(duì)某一詞條解釋內(nèi)容中的某些術(shù)語感興趣,可以在該界面直接進(jìn)行二次檢索查詢:①點(diǎn)擊\"查詢\"按鈕對(duì)該詞條的內(nèi)容進(jìn)行檢索標(biāo)注。例如,在下圖中點(diǎn)擊\"查詢\"按鈕后,\"躁擾不寧\"詞條內(nèi)容中和數(shù)據(jù)庫術(shù)語一致的詞語會(huì)被用藍(lán)色標(biāo)注出。②之后點(diǎn)擊該詞語將光標(biāo)移到該詞語附近的位置,并點(diǎn)擊\"提取詞語\"按鈕,右側(cè)會(huì)出現(xiàn)相應(yīng)的詞語。例如,點(diǎn)擊左側(cè)文本框的\"躁擾不寧\"將光標(biāo)移到該處,然后點(diǎn)擊\"提取詞語\"按鈕,右側(cè)會(huì)按照類型顯示出出現(xiàn)在\"躁擾不寧\"附近的術(shù)語。單擊下側(cè)區(qū)域的詞條鏈接可以繼續(xù)進(jìn)行查詢。見圖2。
圖2 詞典窗口
2.4功能4:異名術(shù)語發(fā)現(xiàn) 將語料庫文本輸入系統(tǒng)中,在菜單中點(diǎn)擊\"病癥術(shù)語異名發(fā)現(xiàn)\",即可對(duì)現(xiàn)有文本進(jìn)行異名發(fā)現(xiàn)操作。結(jié)果在異名發(fā)現(xiàn)窗口中顯示,左側(cè)為新發(fā)現(xiàn)的異名,右側(cè)為新異名對(duì)應(yīng)的正名。
2.5功能5:量表證候提示 根據(jù)量表方法,對(duì)病案中的患者所屬的證候進(jìn)行智能提示。首先,系統(tǒng)會(huì)檢索量表癥狀是否在病案文本中出現(xiàn)。如果出現(xiàn),系統(tǒng)會(huì)記錄其所代表的證候的相應(yīng)分值,會(huì)統(tǒng)計(jì)得到各個(gè)證候的總分值。對(duì)于總分值達(dá)到10分的證候,系統(tǒng)會(huì)做出提示。以上面\"患者形體肥胖……\"病案文本為例,單擊\"量表證候計(jì)算\"按鈕,彈出量表窗口。左側(cè)以身體部位為分類顯示量表癥狀,右側(cè)顯示量表癥狀的統(tǒng)計(jì)結(jié)果:各個(gè)證候的得分情況和證候要素提示。
可以看到檢索到的\"喉中痰鳴\"\"口臭\"等量表癥狀已經(jīng)在左側(cè)被勾選出。右側(cè)顯示了量表癥狀的統(tǒng)計(jì)情況,其中內(nèi)風(fēng)、內(nèi)火、痰濕、血瘀、氣虛、陰虛證候得分分別為10、26、41、15、0、5,其中證候要素\"內(nèi)風(fēng)\"、\"內(nèi)火\"、\"痰濕\"、\"血瘀\"得分大于等于10,系統(tǒng)將這些證候標(biāo)紅提示。
該窗口還支持對(duì)量表癥狀的重新計(jì)算:用戶可在左側(cè)的選框重新勾選量表癥狀,然后點(diǎn)擊\"重新計(jì)算\"按鈕,可以獲得新的統(tǒng)計(jì)結(jié)果。
2.6功能6:診療規(guī)則提示 根據(jù)診療規(guī)則方法,進(jìn)行智能提示。首先,系統(tǒng)會(huì)檢索每條規(guī)則中的癥狀是否在病案文本中出現(xiàn)。一旦在規(guī)則中作為條件的癥狀在病案中出現(xiàn),該條規(guī)則會(huì)被觸發(fā),系統(tǒng)會(huì)提示相應(yīng)的診斷和檢查項(xiàng)目。
3系統(tǒng)中的關(guān)鍵技術(shù)
現(xiàn)在分析系統(tǒng)中運(yùn)用的方法的合理性,以及這些方法是如何實(shí)現(xiàn)來滿足需求的。
3.1量表方法 在醫(yī)學(xué)領(lǐng)域,學(xué)者們引入了量表的方法,用一種疾病和其他疾病或正常人群作比較,一種疾病的不同程度作比較,便形成了等級(jí)。這就是醫(yī)用量表最基本的概念。
中醫(yī)癥狀量表方法是以統(tǒng)計(jì)學(xué)概率論為基礎(chǔ),依據(jù)有關(guān)醫(yī)學(xué)理論將癥狀、體征及各種化驗(yàn)結(jié)果進(jìn)行量化。通過概率運(yùn)算,使其成為診斷和鑒別診斷的重要依據(jù),成為重要的輔助診斷方法。
在本系統(tǒng)中,將病案文本中出現(xiàn)的癥狀和量表中的癥狀進(jìn)行匹配。如果匹配成功,將其對(duì)應(yīng)證型、數(shù)值標(biāo)記。通過統(tǒng)計(jì),計(jì)算出各種證型的分值總和。如果一種證型的總分值超過量表規(guī)定的界限,則向醫(yī)生提示該證型。
3.2規(guī)則提示方法 中醫(yī)學(xué)的診斷學(xué)知識(shí)可以表示成規(guī)則集合。換言之,通過患者的癥狀,醫(yī)生可以推斷患者的病證,而這一基于經(jīng)驗(yàn)和統(tǒng)計(jì)得到的診斷,本研究采用合取范式形式的規(guī)則進(jìn)行表示。也就是說,系統(tǒng)可以根據(jù)從病案文本檢索到的病癥術(shù)語和其存儲(chǔ)的規(guī)則集合,可以判斷哪些證型、病因或檢查需要被執(zhí)行,并向醫(yī)生提示這些結(jié)果。
例如規(guī)則:If occurs(病癥A) occurs(病癥B) occurs(病癥C) then prompt(中風(fēng))
意思是如果病案文本中同時(shí)檢測(cè)到\"病癥A\"\"病癥B\"和\"病癥C\",則系統(tǒng)會(huì)向醫(yī)生提出相應(yīng)的病證提示\"中風(fēng)\"。
再例如規(guī)則:If occurs(病癥A) !occurs(病癥B) occurs(病癥C) then prompt(嘔吐)
意思是如果病案文本中同時(shí)出現(xiàn)\"病癥A\"和\"病癥C\",且沒有出現(xiàn)\"病癥B\",則系統(tǒng)會(huì)向用戶提出相應(yīng)的提示\"嘔吐\"。
有時(shí)會(huì)出現(xiàn)規(guī)則的沖突,例如規(guī)則1:If occurs(病癥A)then prompt(中風(fēng))和規(guī)則2:If occurs(病癥A) occurs(病癥B)then prompt(嘔吐)。這種情況下系統(tǒng)會(huì)優(yōu)先選擇條件中邏輯運(yùn)算符多的規(guī)則,在本例中系統(tǒng)激活規(guī)則2。
3.3異名病癥術(shù)語發(fā)現(xiàn)方法 中醫(yī)學(xué)病癥術(shù)語存在著大量的同義異名的現(xiàn)象,例如\"腦卒中\(zhòng)"和\"腦中風(fēng)\"。如果不能很好的解決病癥術(shù)語的非規(guī)范性帶來的問題,將異名病癥識(shí)別出來,系統(tǒng)將很難準(zhǔn)確地處理病歷。
然而,目前的技術(shù)只能識(shí)別名稱完整、定義明確的標(biāo)準(zhǔn)術(shù)語,通用的做法是將標(biāo)準(zhǔn)術(shù)語整理好存入數(shù)據(jù)庫中,識(shí)別時(shí)將文檔中的文本和數(shù)據(jù)庫中的詞條進(jìn)行匹配。由于漢語語義的模糊性及其所帶來的巨大數(shù)量的衍生詞匯,通過語義分析在有限的上下文內(nèi)判斷出異名術(shù)語難度很大。因此本研究從另一個(gè)角度出發(fā),通過行業(yè)相關(guān)的豐富的語料文檔庫和已有的正異名術(shù)語表,不斷發(fā)現(xiàn)語料庫未識(shí)別的異名術(shù)語,擴(kuò)充已有的異名術(shù)語表。
通過大量的瀏覽病癥名稱發(fā)現(xiàn),病癥名稱大都由兩部分構(gòu)成,即\"對(duì)象詞\"和\"表現(xiàn)詞\"。本文定義對(duì)象詞為病癥的病變主體的名詞詞匯,定義表現(xiàn)詞為指描述對(duì)象主體表現(xiàn)情況的詞匯。例如,\"腦卒中\(zhòng)"中對(duì)象詞是\"腦\",表現(xiàn)詞是\"卒中\(zhòng)"。
病癥術(shù)語異名現(xiàn)象的原因,大都是病癥術(shù)語中對(duì)象詞和表現(xiàn)詞的近義詞造成的。例如,\"口唇紫暗\"和\"口唇紫紺\",其中\(zhòng)"紫暗\"和\"紫紺\"是近義詞。據(jù)此可以設(shè)計(jì)一種方法,將未被發(fā)現(xiàn)的異名癥狀發(fā)現(xiàn)。
系統(tǒng)需要:①病癥正異名術(shù)語表,可用來構(gòu)造對(duì)象詞和表現(xiàn)詞的近義詞表。②對(duì)象詞的近義詞表。每項(xiàng)兩個(gè)詞,對(duì)象異名和對(duì)象正名,例如\"目\"和\"眼\"。③表現(xiàn)詞的近義詞表。每項(xiàng)兩個(gè)詞,表現(xiàn)異名和表現(xiàn)正名,例如\"中風(fēng)\"和\"卒中\(zhòng)"。
方法步驟:①將語料庫的病案文本,以標(biāo)點(diǎn)、數(shù)字和現(xiàn)有術(shù)語為間隔,將其拆分成一段段的短語。理論上異名應(yīng)該存在在這些短語中。②掃描每段短語,如果其中存在一個(gè)對(duì)象近義詞和一個(gè)表現(xiàn)近義詞,且兩個(gè)詞語的間隔不超過兩個(gè)字時(shí),將這兩個(gè)詞以及它們之間的部分提取出來,作為候選異名。間隔不超過兩個(gè)字的原因是防止兩個(gè)詞來源于兩個(gè)不同異名的情況,且通常情況下,異名病癥不會(huì)很長(zhǎng)。③對(duì)每個(gè)候選詞條,看它們的對(duì)象詞、表現(xiàn)詞二元組的原義,是否和已有的正名對(duì)應(yīng)。如果對(duì)應(yīng),則該異名很可能和該正名對(duì)應(yīng),否則它便不是個(gè)合適的異名,將其淘汰。
經(jīng)過上述三個(gè)步驟,可以從語料庫中發(fā)現(xiàn)較為貼切的異名病癥名稱。系統(tǒng)管理人員可以通過該方法,發(fā)現(xiàn)術(shù)語并進(jìn)行人工篩除,能夠便利快捷的充實(shí)數(shù)據(jù)庫,減輕病癥術(shù)語的非規(guī)范性對(duì)系統(tǒng)的影響。
算法步驟示例:
For(每條短語){
For(每個(gè)對(duì)象詞異名)
For(每個(gè)表現(xiàn)詞異名){
If(短語包含對(duì)象詞異名短語包含表現(xiàn)詞異名)then
If(兩詞間隔不超過2個(gè)字)then提取作為候選異名;
}
}
For(每個(gè)候選異名){
A1=候選異名中對(duì)象詞對(duì)應(yīng)的正名;
A2=候選異名中表現(xiàn)詞對(duì)應(yīng)的正名;
For(每個(gè)癥狀正名){
B1=癥狀正名中對(duì)象詞對(duì)應(yīng)的正名;
B2=癥狀正名中表現(xiàn)詞對(duì)應(yīng)的正名;
If (A1==B1 A2==B2 癥狀正名候選異名) then 候選異名成為新異名;
}
}
4 系統(tǒng)評(píng)測(cè)實(shí)驗(yàn)
4.1量表提示實(shí)驗(yàn) 本研究所采用的量表為北京中醫(yī)藥大學(xué)東直門醫(yī)院的高穎等編寫的《缺血性中風(fēng)證候要素診斷量表》[7]。使用系統(tǒng)對(duì)于10個(gè)出自中風(fēng)相關(guān)論文的病案,運(yùn)用量表方法進(jìn)行了分析,結(jié)果如下。其中標(biāo)紅的證候是系統(tǒng)提示的證候。
病歷病癥描述原文:①患者于1994年3月4日在勞動(dòng)中突然暈倒,不省人事,語不能發(fā),二便失禁,雙側(cè)肢體不用,于發(fā)病40min后住進(jìn)洛陽市某醫(yī)院,經(jīng)20d的搶救,才睜開雙目,1個(gè)月后形如植物人,出院回家。四肢癱瘓,語不能言,二便失禁,不會(huì)飲食,飲水則嗆,面目癡呆,沒有表情,舌體瘦小,質(zhì)淡暗紅,脈:沉、弦、細(xì)、弱。②于9月10日下午出診返家途中,突發(fā)昏仆,被路過人發(fā)現(xiàn)抬回。請(qǐng)醫(yī)治療至第2d神志稍有清醒,但很快又進(jìn)入昏迷狀態(tài),且出現(xiàn)壯熱、陣發(fā)性呼吸困難?!裰净杳?,面紅目赤,瞳孔小如針尖,左肢偏癱,呼吸不規(guī)則,時(shí)有憋氣,憋氣時(shí)面唇紫紺,夜晚發(fā)作更甚,口渴喂水能吞咽,大便自發(fā)病至今未解,小便給予導(dǎo)尿。舌質(zhì)紅,苔黃厚少津,脈弦數(shù)有力。③2006 年12 月21 日, 因操勞過度, 晚飯后, 突發(fā)右側(cè)肢體無力, 跌倒在地, 呼之不應(yīng), 小便失禁, 家人按人中, 刺十宣, 大聲呼喚后蘇醒, 右側(cè)偏癱,急送至本院, 因在發(fā)病3 h內(nèi), 試用巴曲酶溶栓治療, 第2d, 因口鼻出血, 而停用。予以甘露醇、甘油果糖降低顱壓, 依達(dá)拉奉針腦保護(hù)劑, 清除自由基, 川穹嗪針改善血循環(huán)等治療。因是本院家屬, 早期請(qǐng)中醫(yī)會(huì)診及康復(fù)介入。診見半身不遂,口舌歪斜, 語言蹇澀, 吞咽嗆咳。舌胖有瘀斑、苔白, 脈結(jié)代。④患者5 h前卒然昏仆, 不省人事, 左半身不遂, 舌口歪斜, 伴有惡心嘔吐, 面赤氣粗, 舌質(zhì)紅, 苔黃膩, 脈弦大有力。⑤患者于8 h前突然昏倒, 意識(shí)不清, 遂左側(cè)上下肢癱瘓, 口眼歪斜, 口角流涎, 舌強(qiáng)語謇, 面色潮紅, 腹?jié)M嘔惡, 便干溲閉, 舌紅、苔膩, 脈滑有力。⑥患者因情志不暢, 隨即昏倒在地, 神志不清, 右上下肢不能活動(dòng), 口舌歪斜, 面赤氣粗, 痰聲漉漉, 躁擾不寧, 腹部脹滿, 嘔惡時(shí)作, 兩便閉, 舌體大、質(zhì)暗紅, 苔白膩, 脈洪大有力。⑦患者形體肥胖,高血壓病史5年。因3h前家庭糾紛突感頭痛,左側(cè)肢體活動(dòng)不利,繼而昏仆,不省人事,家屬急送醫(yī)院,經(jīng)西藥常規(guī)搶救治療1d,病情仍未緩解,伴鼻鼾痰鳴、煩躁不寧、氣粗口臭、腹脹,家屬言其3d未大便,舌紅或暗紅、苔黃膩,脈弦滑數(shù)。⑧收內(nèi)科住院治療。會(huì)診后決定輸液消栓治療。但1w后患者仍不清醒,右側(cè)肢體癱瘓,檢查項(xiàng)強(qiáng)口噤。大小便失禁需兩個(gè)人服侍。舌苔厚膩,脈弦數(shù),喉中痰鳴。⑨因頭暈, 伴左上肢活動(dòng)障礙2 d人院。患者晨起時(shí), 突感頭暈口唇麻木, 左上肢不能上舉, 左手指抓握無力。平時(shí)嗜睡, 鼾聲大。食納佳, 大便偏干結(jié)。⑩因流涎.失語1d人院?;颊哂懈哐獕翰∈? 年。失語當(dāng)日晨, 覺頭昏, 兩下肢麻木。午餐后突然舌寵不能語, 伴流涎。
經(jīng)過統(tǒng)計(jì)可得,被原文標(biāo)出且被系統(tǒng)提示的證候共計(jì)19個(gè),被原文標(biāo)出但沒有被系統(tǒng)提示的證候共計(jì)11個(gè),沒有被原文標(biāo)出但被系統(tǒng)提示的證候共計(jì)6個(gè)。因此,量表證候提示實(shí)驗(yàn)的召回率為63.33%,準(zhǔn)確率為76.00%。
可以看到,系統(tǒng)所提示的癥候比較接近論文中注明的癥候,這說明量表方法是有效的。然而,某些病歷的最終得出的量表評(píng)分與病歷中醫(yī)生所做的證候判斷有所出入,究其原因,主要有以下幾個(gè)方面:①用詞非規(guī)范性造成的理解差異。由于中醫(yī)癥狀名稱用語簡(jiǎn)練,含義豐富,加工人員對(duì)微小的差異理解不同就會(huì)造成這種正異名的匹配與量表癥狀定義的不符,進(jìn)而造成量表評(píng)分與病歷中證候判斷的出入。另一方面,本研究使用的病歷來自于文獻(xiàn)數(shù)據(jù)庫,均為臨床醫(yī)生對(duì)醫(yī)療實(shí)踐的記述。由于每位作者習(xí)慣的不同,在描述病患癥狀時(shí)所使用的具體詞匯、語法、語句隨意性強(qiáng),差異較大。這是造成量表評(píng)分與病歷中證候判斷的有所出入的重要原因。②醫(yī)生對(duì)中風(fēng)的不同理解。醫(yī)生對(duì)于中風(fēng)治療有自己的理解,證候的判定可能與量表規(guī)則并不一致。③量表規(guī)則的局限。量表規(guī)則規(guī)定,只有在證候得分超過10分時(shí)予以提示,這樣某些證候得分即使不為0,也不會(huì)提示。例如第4個(gè)病歷,內(nèi)火9分,痰濕8分,然而并未提示。④病歷文本的局限。顯然,越是完整的病歷,系統(tǒng)相應(yīng)的量表提示越準(zhǔn)確。病歷文本過短,會(huì)對(duì)實(shí)驗(yàn)造成顯著影響。第9、10個(gè)病歷就是如此。
4.2病癥異名發(fā)現(xiàn)實(shí)驗(yàn) 首先對(duì)已有正異名進(jìn)行人工分析,得到對(duì)象詞和表現(xiàn)詞的近義詞表。已有正異名共計(jì)175個(gè),從中得到對(duì)象近義詞52個(gè),表現(xiàn)近義詞91個(gè)。
系統(tǒng)對(duì)于上述10個(gè)出自中風(fēng)相關(guān)論文的病案進(jìn)行了病癥異名發(fā)現(xiàn)實(shí)驗(yàn)。病案中未被發(fā)現(xiàn)的病癥共計(jì)31個(gè),系統(tǒng)發(fā)現(xiàn)了18個(gè),召回率為58.06%。其中又有14個(gè)和正名準(zhǔn)確對(duì)應(yīng),準(zhǔn)確率為77.78%。
見表2。
經(jīng)研究,發(fā)現(xiàn)造成召回率和準(zhǔn)確率降低的原因有以下幾點(diǎn):①只能在現(xiàn)有正名的基礎(chǔ)上發(fā)現(xiàn)異名。這樣,一些未計(jì)入數(shù)據(jù)庫的正名和其對(duì)應(yīng)的異名就無法被發(fā)現(xiàn)。②癥狀\"描述\"和\"名稱\"的界限不清。許多癥狀只是描述,并非嚴(yán)格意義上的病證名稱。③無對(duì)象詞或多表現(xiàn)詞。例如\"抽搐\"、\"脈沉細(xì)\"一類的詞語,前者由于缺少對(duì)象無法被發(fā)現(xiàn),后者由于其多義性無法被對(duì)應(yīng)到一個(gè)唯一的正名。
總體看來,該方法還是能有效處理中醫(yī)學(xué)上病癥異名發(fā)現(xiàn)的問題。已有的正名和對(duì)象、表現(xiàn)近義詞越全,異名發(fā)現(xiàn)的召回率和準(zhǔn)確率越高。
5結(jié)論
本研究的創(chuàng)新點(diǎn)在于把可嵌入式知識(shí)服務(wù)的概念引入到中醫(yī)藥領(lǐng)域,結(jié)合中醫(yī)藥領(lǐng)域的知識(shí)特點(diǎn)和知識(shí)結(jié)構(gòu),為中醫(yī)藥臨床科研提供知識(shí)服務(wù)。
本研究提出了一種在中醫(yī)臨床應(yīng)用上的智能在線提示系統(tǒng),它圍繞個(gè)人病案知識(shí)活動(dòng)鏈路,實(shí)現(xiàn)中醫(yī)藥數(shù)據(jù)整合、知識(shí)單元提取、病案信息環(huán)境識(shí)別、嵌入知識(shí)服務(wù)模式構(gòu)建,并以部分中醫(yī)病案文本為范例,實(shí)現(xiàn)部分嵌入式知識(shí)服務(wù),形成知識(shí)服務(wù)工具。
本系統(tǒng)具有很好的推廣應(yīng)用前景,它可以降低醫(yī)生的誤診率,增加中醫(yī)臨床教研中學(xué)生的練習(xí)機(jī)會(huì)和效率,以及實(shí)現(xiàn)病案的自動(dòng)化分析。另外,本系統(tǒng)的設(shè)計(jì)理念同樣可應(yīng)用于其他領(lǐng)域,完成類似的智能提示任務(wù)。
參考文獻(xiàn):
[1]朱文峰.中醫(yī)(輔助)診療系統(tǒng)的研究[J].中國中醫(yī)基礎(chǔ)醫(yī)學(xué)雜志,2003,9(10).
[2]徐元景,牛欣.中醫(yī)輔助診療系統(tǒng)的研制.世界科學(xué)技術(shù)[J].中藥現(xiàn)代化,2003,5(3).
[3]朱文鋒.創(chuàng)立以證素為核心的辨證新體系[J].湖南中醫(yī)學(xué)院學(xué)報(bào),2004.06.
[4]瞿年清,謝夢(mèng)洲.中醫(yī)智能(輔助)診療系統(tǒng)的設(shè)計(jì).朱文鋒學(xué)術(shù)思想研討會(huì)暨中醫(yī)診斷師資班30周年紀(jì)念大會(huì)論文集[C].2012.
[5]周小青,梁昊,雷麗萍.癥狀計(jì)量與證素辨證.朱文鋒學(xué)術(shù)思想研討會(huì)暨中醫(yī)診斷師資班30周年紀(jì)念大會(huì)論文集[C].2012.
[6]高穎等,缺血性中風(fēng)證候要素診斷量表編制及方法學(xué)探討[J].中醫(yī)雜志,2011(24):2097-2101.
[7]孫萌等.中風(fēng)方劑數(shù)據(jù)初步分析[J].中國中醫(yī)藥信息雜志,2013.12.
編輯/王海靜