李曉澤,孫國強(qiáng),周奕,呂強(qiáng),胡紅濮
隨著人們對醫(yī)療及健康的需求不斷增加,醫(yī)務(wù)人員除需確保診斷思路、治療方案質(zhì)量外,還要跟進(jìn)并更新醫(yī)學(xué)領(lǐng)域前沿知識以提高臨床決策效率,因此各類醫(yī)療及健康系統(tǒng)對臨床指南知識庫的需求日益凸顯[1]。臨床指南凝聚著眾多權(quán)威醫(yī)學(xué)專家診治經(jīng)驗(yàn)及達(dá)成的共識,包含大量推理嚴(yán)謹(jǐn)?shù)呐R床思維和循證醫(yī)學(xué)證據(jù),是權(quán)威的臨床指導(dǎo)意見集合[2],可為臨床診斷及治療疾病提供科學(xué)依據(jù),對于臨床決策具有重要指導(dǎo)意義[3];但有調(diào)查結(jié)果顯示,多數(shù)醫(yī)生由于紙質(zhì)或文本形式的臨床指南查閱耗時、使用不便而并沒很好地利用臨床指南[4],因此臨床實(shí)踐過程中仍存在臨床指南利用率低等問題。
借助自然語言處理、機(jī)器學(xué)習(xí)算法、知識圖譜等新興技術(shù)將臨床指南數(shù)字化、可視化、自動化并與各業(yè)務(wù)系統(tǒng)模型深度融合而應(yīng)用于臨床決策支持系統(tǒng)(clinical decision support system,CDSS)或醫(yī)療信息化工具可使臨床指南知識的獲取由醫(yī)生需要、尋求指南建議的被動查找模式轉(zhuǎn)變?yōu)閿?shù)據(jù)異常時觸發(fā)提示的主動預(yù)警模式,有利于保證臨床指南切實(shí)、便捷、高效、精準(zhǔn)地應(yīng)用,具有重要現(xiàn)實(shí)意義和發(fā)展前景。本研究以高血壓為例,探討了知識驅(qū)動下臨床指南可視化模型的構(gòu)建流程及規(guī)則,現(xiàn)報道如下。
1.1 臨床指南數(shù)字化的研究背景 臨床指南在醫(yī)療領(lǐng)域及臨床決策中的重要地位催化并衍生出了一系列臨床指南數(shù)字化模型研究,而隨著20 世紀(jì)末循證醫(yī)學(xué)的興起、發(fā)展[2]及計(jì)算機(jī)技術(shù)的高速發(fā)展,研究者嘗試將臨床指南知識進(jìn)行數(shù)字化。目前,國際上已出現(xiàn)近二十余種臨床指南數(shù)字化模型[5-6],如歐洲的PRODIGY(Prescribing RatiOnally with Decision-support In General-practice studY)模型[7]及美國的Arden(Arden Syntax For Medical Logic Modules)模 型[8]、GEM(Guideline Elements Model)模型、GDL(Guideline Definition Language)模型、GLIF(Guideline Interchange Format)[9]、SAGE(Sharable Active Guideline Environment)模型[10]等。臨床指南數(shù)字化模型將基于文本形式的臨床指南知識表達(dá)為計(jì)算機(jī)能夠識別的語言,在一定程度上解決了臨床指南數(shù)字化問題[11],但目前國內(nèi)外在臨床實(shí)踐中得到長期、廣泛應(yīng)用的臨床指南數(shù)字化模型并不多,而由于臨床指南數(shù)字化模型尚存在一些局限性[12],因此臨床指南數(shù)字化模型的應(yīng)用并沒有得到預(yù)期的普及效果。有研究表明,影響臨床指南數(shù)字化模型普及的一個重要原因是大多數(shù)臨床指南數(shù)字化模型采用了基于工程化的語言,而臨床醫(yī)生對工程語言較難理解,更無法直接對臨床指南知識進(jìn)行數(shù)字化模型構(gòu)建[11]。
SAGE 于2002 年開始作為斯坦福醫(yī)學(xué)信息學(xué)中心、梅奧診所等共同合作的研究項(xiàng)目,其研發(fā)目的是在繼承現(xiàn)有本體特征和構(gòu)建醫(yī)學(xué)標(biāo)準(zhǔn)的基礎(chǔ)上構(gòu)建基于臨床指南的決策支持系統(tǒng)的互操作分布式模型,最終目標(biāo)是建立一個能夠在異構(gòu)的CDSS 中執(zhí)行臨床指南的架構(gòu)。SAGE 模型是眾多臨床指南數(shù)字化模型中較為有效的一種,但也存在部分問題未能很好地解決,如臨床醫(yī)生習(xí)慣使用自然語言進(jìn)行描述、無法直接利用醫(yī)學(xué)知識建模、必須通過與知識工程師協(xié)作才可完成建模,知識工程師需先與醫(yī)生溝通并理解醫(yī)學(xué)邏輯后才可建模、并需與醫(yī)生確認(rèn),建模過程時間成本較高等[13]。
1.2 臨床指南數(shù)字化模型的基礎(chǔ)理論與應(yīng)用 本體知識表達(dá)能力強(qiáng)、推理性能高,可實(shí)現(xiàn)知識表達(dá)與計(jì)算機(jī)的統(tǒng)一、互操作并支持語義網(wǎng)絡(luò)、知識共享,因此其被廣泛用于對相關(guān)領(lǐng)域知識進(jìn)行明確的形式化、規(guī)范化描述。本體知識是整合、組織醫(yī)學(xué)領(lǐng)域相關(guān)知識的一種有效方法,SAGE 模型即是將本體知識應(yīng)用于醫(yī)學(xué)領(lǐng)域[14]?;诒倔w知識的數(shù)字化模型是傳統(tǒng)數(shù)據(jù)庫技術(shù)與人工智能技術(shù)相結(jié)合的產(chǎn)物[15],其作為一種新的知識表示和存儲系統(tǒng),不僅包含了傳統(tǒng)數(shù)據(jù)庫所能處理的簡單陳述性事實(shí)知識[16],還能夠?qū)崿F(xiàn)特定領(lǐng)域推理性、過程性知識的表示及存儲,是研發(fā)及完善CDSS 的基礎(chǔ)。
CDSS 是臨床指南數(shù)字化在現(xiàn)代醫(yī)學(xué)信息交叉領(lǐng)域的一個代表性應(yīng)用,其作為輔助醫(yī)務(wù)人員形成臨床決策的系統(tǒng)軟件,可通過智能信息技術(shù)而有效提高醫(yī)療質(zhì)量及醫(yī)療決策效率、降低醫(yī)療差錯率及醫(yī)療費(fèi)用,還可通過與患者病歷相結(jié)合(作為信息輸入)而提供針對性建議,繼而指導(dǎo)臨床實(shí)踐、規(guī)范診療流程[17],有利于減輕醫(yī)務(wù)人員負(fù)擔(dān)。因此,CDSS 不僅是臨床指南數(shù)字化模型的實(shí)際應(yīng)用,還可從根本上保證知識源的權(quán)威性及可靠性。
知識驅(qū)動下臨床指南可視化模型針對大多數(shù)臨床指南數(shù)字化模型基于工程化語言而不易被醫(yī)生理解、應(yīng)用的問題,通過借鑒語義分析及本體知識理論,以知識驅(qū)動為視角,通過將文本形式的臨床指南按照適合臨床指南表達(dá)的模型進(jìn)行建模而形成可視化流程、規(guī)則庫,最終使文本形式的臨床指南轉(zhuǎn)變?yōu)橐子跈z索及推理的知識庫。知識驅(qū)動下臨床指南可視化模型以文本形式的臨床指南為基礎(chǔ),通過可視化表達(dá)、對指南規(guī)則的解讀及本體建模、邏輯寫入而形成可被計(jì)算機(jī)識別、執(zhí)行及調(diào)用的核心接口模塊,當(dāng)人機(jī)接口與用戶端接入并滿足預(yù)設(shè)條件時就會自動觸發(fā)推理引擎,最終形成CDSS(見圖1)。知識驅(qū)動下臨床指南可視化模型通過將臨床指南知識進(jìn)行流程化、可視化而形成醫(yī)務(wù)人員可直接看懂并能有效輔助系統(tǒng)研發(fā)人員更好地理解臨床指南知識的模型,克服了臨床指南數(shù)字化模型需基于工程化語言的問題,是一種很有借鑒意義的醫(yī)學(xué)信息化方法,也是醫(yī)學(xué)知識轉(zhuǎn)化過程中較為優(yōu)先且關(guān)鍵的一步,有利于促進(jìn)醫(yī)學(xué)知識的充分利用。
理想的知識驅(qū)動下臨床指南可視化模型應(yīng)支持單元化建模[13],即將臨床指南中部分復(fù)雜的醫(yī)學(xué)邏輯系統(tǒng)拆分為多個功能獨(dú)立的子程序,進(jìn)而從整體上降低知識庫系統(tǒng)與子程序的耦合度,方便在臨床指南中部分知識或邏輯變動時無需進(jìn)行整體修改、僅需局部調(diào)整相應(yīng)子程序及規(guī)則或添加必要的子程序,或要表達(dá)同一知識內(nèi)容時僅需調(diào)用同一子程序接口、避免重復(fù)定義子程序等。支持單元化建模的知識驅(qū)動下臨床指南可視化模型有利于避免臨床指南更新及系統(tǒng)升級而帶來的二次開發(fā)、建模重構(gòu)、知識維護(hù)等,且方便了初始建模階段團(tuán)隊(duì)協(xié)作、有利于降低系統(tǒng)工程時間成本。
圖1 知識驅(qū)動下臨床指南可視化模型的總體架構(gòu)Figure 1 Overall framework of Knowledge-driven Visualization Model of Clinical Guideline
為使醫(yī)生、知識工程師及系統(tǒng)研發(fā)人員等角色對知識驅(qū)動下臨床指南可視化模型有一致的理解,本研究通過借鑒SAGE 模型構(gòu)建方法、應(yīng)用流程圖式表達(dá)模型、結(jié)合國家相關(guān)流程圖標(biāo)準(zhǔn)并多次與臨床醫(yī)生互動而初步擬定了一套規(guī)范化流程圖表達(dá)形式及表達(dá)規(guī)則(見表1):(1)某種疾病的臨床指南可能包括多種情況下的疾病診斷、治療或管理步驟,因此每個步驟應(yīng)根據(jù)臨床思維復(fù)雜度定義為若干個子程序;(2)每個子程序原則上只完成某個環(huán)節(jié)(如診斷)相對獨(dú)立且單一的功能;(3)每個子程序需有一個開端框并可有多個終止框;(4)子程序默認(rèn)遵循從上到下、從左到右的表達(dá)規(guī)則,并應(yīng)盡量避免交叉與循環(huán);(5)為與開端框區(qū)分,終止框邊框進(jìn)行加粗處理;(6)子程序間若存在先后性邏輯關(guān)系,則需在開端框或終止框標(biāo)明。
表1 知識驅(qū)動下臨床指南可視化模型規(guī)范化流程圖表達(dá)形式及表達(dá)規(guī)則Table 1 Expression forms and rules in the normalized flowchart of Knowledge-driven Visualization Model of Clinical Guideline
本研究以高血壓為例,基于《中國高血壓防治指南(2018年修訂版)》[18]及《國家基層高血壓防治管理指南》[19]中的語義關(guān)系,通過本體知識理論將文本形式的臨床指南知識構(gòu)建為知識驅(qū)動下臨床指南可視化模型,現(xiàn)將疾病診斷環(huán)節(jié)中的關(guān)鍵步驟“高血壓人群篩查”“心血管風(fēng)險分層”作為對象,說明如下。
4.1 高血壓人群篩查子程序構(gòu)建流程及規(guī)則 (1)收集并錄入待測個體收縮壓(SBP)、舒張壓(DBP)、身高、體質(zhì)量、腰圍等關(guān)鍵信息,并根據(jù)規(guī)則1(P1)分為血壓正常(P1=0)、正常高值血壓(P1=1)、高血壓(P1=2);(2)血壓正常且無危險因素的待測個體根據(jù)規(guī)則2(P2)被判斷為一般人群,血壓正常且伴有危險因素(P2=1)的待測個體被判斷為易患人群且P2 可返回值(P2_level=n),返回值為n 則表明命中了n 項(xiàng)危險因素;(3)正常高值血壓待測個體被判斷為易患人群;(4)高血壓人群根據(jù)規(guī)則3(P3)判斷為單純收縮期高血壓及高血壓1、2、3 級并進(jìn)入“心血管風(fēng)險水平分層”子程序。高血壓人群篩查子程序適用于年齡>18 歲的男性和女性,主要功能是篩查人群中高血壓患者并進(jìn)行高血壓分級,其構(gòu)建流程及規(guī)則見圖2、表2~4。
表2 高血壓人群篩查子程序構(gòu)建規(guī)則1(血壓分類)Table 2 Rule 1 of subprogram of Screening for Hypertension(blood pressure classification)
表3 高血壓人群篩查子程序構(gòu)建規(guī)則2(危險因素)Table 3 Rule 2 of subprogram of Screening for Hypertensio(risk factors)
表4 高血壓人群篩查子程序構(gòu)建規(guī)則3(高血壓分級)Table 4 Rule 3 of subprogram of Screening for Hypertension(classification of hypertension)
4.2 心血管風(fēng)險分層子程序構(gòu)建流程及規(guī)則 (1)對初診為高血壓患者涉及的5 大類關(guān)鍵指標(biāo)(包括危險因素、靶器官損傷、血糖情況、是否伴有并發(fā)癥、慢性腎臟病)進(jìn)行導(dǎo)入;(2)依次通過規(guī)則4(P4)、規(guī)則5(P5)、規(guī)則6(P6)、規(guī)則7(P7)、規(guī)則(P8)對5 大類指標(biāo)進(jìn)行判斷,其中P4、P5 可返回值(P4/5_level=n),返回值為n 則表明命中了n 類關(guān)鍵指標(biāo);(3)最后進(jìn)入綜合分析模型并進(jìn)行心血管風(fēng)險分層,包括低危、中危、中/高危、高危、高/很高危、很高危共6 種風(fēng)險等級。心血管風(fēng)險分層子程序同樣適用于年齡>18 歲的男性和女性,主要功能是對初診高血壓患者進(jìn)行心血管風(fēng)險分層,其構(gòu)建流程及規(guī)則見圖3、表5~6。
綜上所述,臨床指南數(shù)字化對臨床診療模式、疾病照護(hù)等有明顯改善作用,但臨床指南數(shù)字化模型仍存在不足、普及效果不佳;知識驅(qū)動下臨床指南可視化模型以臨床思維為出發(fā)點(diǎn),不拘泥于使用工具或技術(shù),力求真實(shí)地還原臨床指南知識,通過與計(jì)算機(jī)流程模型相結(jié)合而有助于揭示臨床指南中存在的沖突或錯誤、減少后期維護(hù)及升級造成的工作負(fù)擔(dān)、輔助CDSS 研發(fā)者無礙地理解醫(yī)學(xué)知識,從而解決了從臨床指南到計(jì)算機(jī)模型轉(zhuǎn)化過程中遇到的主要困難,并為醫(yī)學(xué)信息化及醫(yī)生輔助診斷系統(tǒng)的開發(fā)提供了參考。知識驅(qū)動下的臨床指南可視化模型的構(gòu)建流程及規(guī)則是醫(yī)學(xué)領(lǐng)域與計(jì)算機(jī)領(lǐng)域之間的一座“橋梁”,對當(dāng)今及未來基于臨床指南知識的CDSS 研發(fā)及應(yīng)用具有深遠(yuǎn)意義。
圖2 高血壓人群篩查子程序構(gòu)建流程及規(guī)則Figure 2 Construction process and rules of the subprogram of Screening for Hypertension
表5 心血管風(fēng)險分層子程序構(gòu)建規(guī)則4(危險因素)Table 5 Rule 4 of subprogram of Cardiovascular Risk Stratification(risk factors)
表6 心血管風(fēng)險分層子程序構(gòu)建規(guī)則5(靶器官損傷)Table 6 Rule 5 of subprogram of Cardiovascular Risk Stratification(target organ damage)
圖3 心血管風(fēng)險分層子程序構(gòu)建流程及規(guī)則Figure 3 Construction process and rules of subprogram of Cardiovascular Risk Stratification