陳 強
(常州市第二人民醫(yī)院常州213164)
丁臘春 王 譯
(鎮(zhèn)江市第四人民醫(yī)院鎮(zhèn)江212001)
殷偉東
(南京市衛(wèi)生信息中心南京210003)
電子病歷不僅反映患者基本病情,也反映治療過程與治療質(zhì)量。電子病歷的使用在提高醫(yī)生錄入效率的同時也帶來一系列負面問題。醫(yī)護人員如未認真落實病歷書寫規(guī)章制度,或濫用病例模板,嚴重拷貝,則會嚴重影響病歷質(zhì)量,甚至危及醫(yī)療質(zhì)量[1]。電子病歷總體水平在體現(xiàn)診療質(zhì)量的同時,也反映醫(yī)療管理水平與效果,同時從側面驗證醫(yī)療機構的醫(yī)療水平。因此各醫(yī)療機構在電子病歷書寫質(zhì)量上都十分重視,采用計算機技術來輔助進行質(zhì)量的控制與管理,取得一定成效。
2.1.1 知識庫 現(xiàn)有的電子病歷均支持結構化與自然語音錄入方式,但各醫(yī)療機構在結構化上均存在較大困難,主要表現(xiàn)為部分醫(yī)生的長期習慣與個性化需求難以統(tǒng)一,特別在專家的身上體現(xiàn)的更為明顯,因此現(xiàn)有的電子病歷記錄常常為半結構化狀態(tài)。如何更好地利用醫(yī)療機構現(xiàn)有電子病歷半結構化數(shù)據(jù)就成為醫(yī)學信息學的一項重要的任務。醫(yī)學領域規(guī)范的結構化數(shù)據(jù)集合形式可稱為知識庫,知識庫的低級狀態(tài)是單表(分類字典)集合,高級形態(tài)是多個醫(yī)學字典按標準術語、語義關系鏈接成類似神經(jīng)的網(wǎng)狀結構醫(yī)學本體[2]。
2.1.2 本體庫 醫(yī)學本體是以醫(yī)學指南、共識、藥品知識、檢驗知識、檢查知識等按繼承關系構建的醫(yī)療標準術語集。以指南共識為基礎,結合臨床醫(yī)生實際工作經(jīng)驗形成可以共享并再利用的知識,為醫(yī)療領域知識圖譜、大數(shù)據(jù)及后結構化應用奠定基礎。本項目按照7步法的流程構建術語本體庫,提取出相關概念建立領域描述本體模型,形成由概念、屬性、實例以及相關概念之間關系組成的本體庫[3]。具體流程,見圖1。
圖1 醫(yī)學術語本體庫構建
按照病案質(zhì)控的要求理解病案語義,是可以對醫(yī)療文本數(shù)據(jù)進行語義分析及提取的一種人工智能技術,可利用醫(yī)學術語本體庫及語料庫進行模型構建與訓練,能達到的分詞準確率達99%,命名實體識別的準確率達97%,在對醫(yī)學文本充分結構化的基礎上,仍能最大程度保留文本中的語義及關聯(lián),從而使由計算機對病歷的內(nèi)涵進行分析與質(zhì)控變得可行[4],見圖2。
圖2 自然語言處理流程
2.3.1 基本原則 利用本體模型對多樣性的醫(yī)療數(shù)據(jù)進行歸類。如對于同一疾病的多種不同描述及不同系統(tǒng)中對于同一術語的不同表述。針對醫(yī)學表述的復雜多性,以及不同診療標準下疾病、指標、治療等醫(yī)學術語表達不一致的問題,采用標準醫(yī)學術語本體為基礎,通過數(shù)據(jù)清洗流程將醫(yī)學自然語言進行規(guī)范化、結構化與標準化。
2.3.2 清洗過程 本系統(tǒng)將電子病歷文書中的詞匯及醫(yī)生自己按照個人語言習慣或經(jīng)驗輸入的醫(yī)院自有詞匯與本體模型的標準術語集進行對比分析,通過系統(tǒng)自動將類似詞匯之間建立映射關系并標注出來。由醫(yī)生或?qū)B毠芾韱T進行對比分析與確認,并把經(jīng)確認的術語加入到醫(yī)院自己個性化的術語集中,形成醫(yī)院獨有標準術語集。當系統(tǒng)找不到對應的映射關聯(lián)時,可以由醫(yī)生或?qū)B毠芾韱T通過手工方式拆分詞組和短句,與標準本體術語集進行對比分析,將具有相同語義的詞匯之間建立映射關系[5]。
診療知識圖譜的構建需要整合臨床規(guī)范知識,同時為了實現(xiàn)知識歸類,對其中涉及的術語進行規(guī)范化、結構化與標準化,最大限度處理與歸類電子診療記錄。構建關于疾病診斷治療的知識圖譜,從而實現(xiàn)疾病的人工智能輔助診斷[6]。通過構建疾病診斷、治療及康復知識庫和醫(yī)療領域的本體模型。疾病診斷、治療及康復知識庫是有關疾病起因、治療、用藥、康復、飲食、運動、休息、禁忌、等知識,是診療知識庫的核心內(nèi)容;醫(yī)療領域的本體模型是有關疾病的起因、治療、用藥、康復、飲食、運動、休息、禁忌等因素之間的相互關系構建神經(jīng)網(wǎng)絡圖譜模型。
使用的診療模型利用真實臨床數(shù)據(jù)作為訓練數(shù)據(jù),從而解決了利用知識庫構建模型難以適應多變的真實個體且無法實現(xiàn)精準化的問題;且診療模型不是對疾病、治療方案等的“是”與“否”的判斷,會綜合考量患者病情及變化,進而在提供決策建議的同時對主次要性進行分析與排序。在此基礎上開發(fā)人工智能病歷質(zhì)控系統(tǒng),建立利用已知的患者病情、治療等信息對后續(xù)臨床處置提供決策建議的人工智能模型。以真實臨床病歷作為數(shù)據(jù)基礎,利用自然語言處理引擎結構化臨床病歷,整合多任務學習、高稀疏學習及在線學習構建模型,既為醫(yī)生提供臨床決策支持,進而提高臨床診療效率及質(zhì)量;也可以實現(xiàn)對臨床路徑的合理性及充分性的精準分析,提升臨床病歷質(zhì)量。快速擴充病種,解決病歷質(zhì)控人員無法對各科室專業(yè)內(nèi)容進行分析與評判的難題。
3.1.1 內(nèi)涵 形式質(zhì)量控制主要是針對病歷書寫的格式、完整度及時效性進行質(zhì)控。格式是指電子病歷書寫是否按規(guī)范,完整度是指對缺項、漏項進行合理性評估。時效性是指按照診療規(guī)范規(guī)定的時間內(nèi)完成病歷記錄,對于沒有按時完成的文書以消息方式推送提醒警示[7]。
3.1.2 主題 形式質(zhì)控監(jiān)控主題包完整性、時效性和流程規(guī)范性監(jiān)控。對病程錄、手術記錄、出院記錄等建立一系列質(zhì)量監(jiān)控體系[8]。通過監(jiān)控電子病歷中的入院時間、病歷書時間、手術時間、手術記錄時間、醫(yī)囑時間等時間點的時效性,實時提醒醫(yī)生在規(guī)定的時間內(nèi)完成文書錄入及相關操作的時間合理性。實現(xiàn)事前、事中與事后的一體化監(jiān)測提醒與考核,將傳統(tǒng)終末質(zhì)控前置到臨床各階段的過程質(zhì)控,使質(zhì)控工作貫穿整個診療環(huán)節(jié)。
病歷內(nèi)涵質(zhì)量控制是病歷質(zhì)控中最為重要、最為復雜的內(nèi)容,一般由資歷較高的醫(yī)生進行,是醫(yī)療質(zhì)量文書的最后抬頭環(huán)節(jié)。如何通過信息技術實現(xiàn)電子病歷文書內(nèi)涵質(zhì)量的有效監(jiān)控成為病歷質(zhì)控中的重點和難點。通過人工智能算法分析半結構化文本,快速找到病歷內(nèi)涵缺陷。具體思路是基于醫(yī)學術語本體,通過對海量數(shù)據(jù)進行深度機器學習,在知識圖譜的基礎上更深入地構建一個具有診斷能力的智能模型,從而系統(tǒng)才能實現(xiàn)基于人工智能內(nèi)涵質(zhì)控。
利用自然語言處理技術和一系列診療算法,充分理解病案內(nèi)容細節(jié)和邏輯關系,不僅僅能夠檢查出病案書寫錯誤、信息矛盾等缺陷,還能夠核控醫(yī)生診療決策中的全面性和合理性,及時向醫(yī)生和質(zhì)控人員反饋質(zhì)控情況。根據(jù)不良事件風險詞,系統(tǒng)每日凌晨自動對所有在院患者電子病歷進行篩查,將病歷中有記載不良事件風險詞的高?;颊咦鳛橐伤撇涣际录A警[9]。同時,從醫(yī)囑中發(fā)現(xiàn)如“完成記錄超時、不完整、醫(yī)生超權限”等醫(yī)療不良事件,自動標注生成風險記錄、及時提醒責任醫(yī)生進行修改與完善。同時病區(qū)電子病歷質(zhì)控員、病案室也會定時查看提示的疑似問題病歷,重點觀察問題病歷,通過病案室總控、病歷質(zhì)控管理員具體管理、病區(qū)病歷質(zhì)控員及醫(yī)生共同努力,及時發(fā)現(xiàn)病歷中存在的問題,提高病歷書寫質(zhì)量。
系統(tǒng)以大數(shù)據(jù)與人工智能技術為核心,通過本體模型對電子病歷語義進行分析理解及診療路徑合規(guī)、合理性評估,查找電子病歷缺陷內(nèi)容及標識原因,實現(xiàn)對電子病歷全程質(zhì)量把關與控制。通過信息技術在電子病歷質(zhì)控系統(tǒng)中預設質(zhì)控規(guī)則及知識圖譜模型匹配,實現(xiàn)質(zhì)量控制自動識別、事前提醒并進行預警,及時將問題情況反饋臨床醫(yī)師,從而提高電子病歷的及時性與質(zhì)量內(nèi)涵,促進醫(yī)療核心制度的嚴格按規(guī)執(zhí)行,減少病歷質(zhì)量缺陷,提升管理水平[10]。