■ 王 淑陳 敏凌琦鳴于廣軍
基于臨床數(shù)據(jù)中心的專(zhuān)病研究系統(tǒng)建設(shè)與實(shí)踐
■ 王 淑①陳 敏①凌琦鳴①于廣軍①
電子病歷 智慧醫(yī)院 專(zhuān)病數(shù)據(jù)庫(kù) 專(zhuān)病研究系統(tǒng)
臨床數(shù)據(jù)中心的電子病歷是醫(yī)療過(guò)程中產(chǎn)生和記錄的完整、詳細(xì)的臨床信息資源,包含疾病癥狀、治療過(guò)程及康復(fù)情況。以電子病歷的文本、疾病特征、病情特征和病情轉(zhuǎn)歸等信息為基礎(chǔ),依托大數(shù)據(jù)、語(yǔ)義分析、數(shù)據(jù)挖掘等技術(shù),形成基于疾病的專(zhuān)病數(shù)據(jù)庫(kù),構(gòu)建新型智慧電子病歷分析服務(wù)型知識(shí)庫(kù)體系,為臨床輔助決策和疾病研究提供信息服務(wù)和數(shù)據(jù)支撐。
Author's address:Children's Hospital of Shanghai, No.355, Luding Road, Putuo District, Shanghai, 200062, PRC
智慧醫(yī)院是數(shù)字化醫(yī)院發(fā)展的新階段,其核心是利用互聯(lián)網(wǎng)及信息技術(shù),匯集完整的健康與診療數(shù)據(jù),融合生命科學(xué),以電子病歷、個(gè)人健康檔案為基礎(chǔ),借助物聯(lián)化對(duì)自然人進(jìn)行多源信息采集,通過(guò)互聯(lián)化保障信息有效傳輸與存儲(chǔ)、智能化對(duì)多源信息進(jìn)行處理與決策,建立臨床數(shù)據(jù)中心,進(jìn)而促進(jìn)醫(yī)學(xué)模式、服務(wù)模式以及醫(yī)療需求實(shí)現(xiàn)變化與轉(zhuǎn)變[1-2]。
臨床數(shù)據(jù)中心以患者主索引(EMPI)為主線實(shí)時(shí)、準(zhǔn)確獲取患者臨床數(shù)據(jù),以標(biāo)準(zhǔn)、全面、統(tǒng)一的格式組織、整合數(shù)據(jù)并提供集中存儲(chǔ),為臨床數(shù)據(jù)共享提供了統(tǒng)一的平臺(tái)支撐[3],涵蓋患者歷次就診記錄、門(mén)診處方、住院醫(yī)囑、電子病歷、檢查化驗(yàn)報(bào)告、影像資料等。通常,臨床數(shù)據(jù)中心分別從時(shí)間維度和臨床活動(dòng)維度,以患者為主線,通過(guò)清晰、友好的統(tǒng)一視圖展現(xiàn)臨床數(shù)據(jù),讓臨床工作者在短時(shí)間內(nèi)對(duì)患者個(gè)體化就診有全面了解。同時(shí),視圖提供可視化導(dǎo)航模式,優(yōu)化操作流程,并作為臨床決策支持基礎(chǔ),實(shí)現(xiàn)輔助改善醫(yī)療服務(wù)質(zhì)量、減少醫(yī)療差錯(cuò)、提高臨床診療水平,為決策提供信息支持、降低醫(yī)療成本[4-5]。
上海市兒童醫(yī)院針對(duì)智慧醫(yī)院的構(gòu)建,于2015年提出智慧醫(yī)院的“5R”模型[6],分別為PRM、EMR、SRIS、HRP、RHIN,其核心是以患者為中心,改善患者體驗(yàn);以醫(yī)生為中心,提升質(zhì)量與安全;以科學(xué)問(wèn)題為中心,從基礎(chǔ)與臨床的割裂轉(zhuǎn)型到轉(zhuǎn)化醫(yī)學(xué);以績(jī)效為核心,從傳統(tǒng)管理轉(zhuǎn)型到專(zhuān)業(yè)化管理;共享與業(yè)務(wù)協(xié)同,從孤島作戰(zhàn)轉(zhuǎn)型到網(wǎng)絡(luò)協(xié)作。從信息化建設(shè)角度,構(gòu)建智慧醫(yī)院的核心是構(gòu)建臨床數(shù)據(jù)中心,為患者、臨床、科研、管理服務(wù),通過(guò)集成平臺(tái)、CDSS、大數(shù)據(jù)、移動(dòng)互聯(lián)等技術(shù)手段,從經(jīng)驗(yàn)醫(yī)學(xué)轉(zhuǎn)型到循證醫(yī)學(xué),建立專(zhuān)病數(shù)據(jù)庫(kù)、臨床隨訪數(shù)據(jù)庫(kù)、生物樣本庫(kù)等,從而提供以醫(yī)療安全為核心、智能為特色、數(shù)據(jù)全程集成共享為標(biāo)志的醫(yī)療服務(wù)。
目前,隨著醫(yī)療服務(wù)體系不斷完善、服務(wù)能力逐步提升,大多數(shù)醫(yī)療機(jī)構(gòu)已經(jīng)有了比較成熟的電子病歷系統(tǒng),通過(guò)結(jié)構(gòu)化電子病歷建立臨床專(zhuān)病數(shù)據(jù)庫(kù),借助數(shù)據(jù)指標(biāo)搜索引擎進(jìn)行目標(biāo)患者查找,并加入CRF表單采集的數(shù)據(jù),整合患者檢查檢驗(yàn)數(shù)據(jù)等,用于支持臨床科研的回顧性和前瞻性分析。但由于臨床信息的復(fù)雜性和靈活性,現(xiàn)有結(jié)構(gòu)化錄入技術(shù)無(wú)法滿足臨床對(duì)于病歷信息的要求,致使臨床信息中仍存在大量以敘述性文本為主要形式的非結(jié)構(gòu)化病史數(shù)據(jù),而傳統(tǒng)的基于結(jié)構(gòu)化電子病歷的臨床專(zhuān)病數(shù)據(jù)庫(kù)缺乏對(duì)非結(jié)構(gòu)化病史數(shù)據(jù)的有效處理。同時(shí),由于醫(yī)療領(lǐng)域非結(jié)構(gòu)化電子病歷的自然語(yǔ)言描述有其獨(dú)特性,與一般中文描述不同,存在大量醫(yī)學(xué)專(zhuān)用詞匯和經(jīng)驗(yàn)描述,對(duì)于利用數(shù)據(jù)挖掘技術(shù)從EMR中發(fā)現(xiàn)知識(shí)用于輔助醫(yī)療決策等方面的成熟應(yīng)用很少,特別是對(duì)于電子病歷的語(yǔ)義分析研究和臨床輔助診療研究有待于進(jìn)一步深入[7]。
上海市兒童醫(yī)院針對(duì)電子病歷的語(yǔ)義分析,以自然語(yǔ)言解析技術(shù)為基礎(chǔ),結(jié)合臨床、藥學(xué)、檢查檢驗(yàn)等醫(yī)療專(zhuān)業(yè)詞庫(kù),分析病歷上下文關(guān)系,構(gòu)建了基于自然語(yǔ)言處理的電子病歷信息語(yǔ)義分析模型,并根據(jù)醫(yī)療特點(diǎn)和疾病特征通過(guò)不同的指標(biāo)匹配模式,運(yùn)用模式匹配和疾病特征挖掘技術(shù),完成疾病、癥狀、治療過(guò)程及康復(fù)情況的分析挖掘。通過(guò)醫(yī)療疾病的語(yǔ)義解析和分析系統(tǒng)的構(gòu)建,實(shí)現(xiàn)中文電子病歷的后結(jié)構(gòu)化,利用疾病特征提取工具,挖掘病歷中相關(guān)疾病臨床表現(xiàn)和患者的轉(zhuǎn)歸情況等,與已有的結(jié)構(gòu)化醫(yī)療數(shù)據(jù)互通,形成全維度專(zhuān)病數(shù)據(jù)庫(kù),實(shí)現(xiàn)臨床對(duì)于疾病癥狀、疾病、治療關(guān)聯(lián)規(guī)則分析,支持疾病預(yù)測(cè)、疾病聚類(lèi)、疾病嚴(yán)重程度評(píng)估,輔助臨床進(jìn)行各類(lèi)型治療,為臨床的回顧性和前瞻性研究提供服務(wù)。
電子病歷是臨床數(shù)據(jù)中心主要的臨床信息來(lái)源,其數(shù)據(jù)記錄格式與一般的文本記錄不同,包含臨床體征、藥品、檢查、檢驗(yàn)等專(zhuān)業(yè)醫(yī)療用詞,其中病程記錄主要采用非結(jié)構(gòu)化的自由文本存儲(chǔ),因此通過(guò)自然語(yǔ)言處理技術(shù)對(duì)病程記錄的后結(jié)構(gòu)化處理以及病情特征的提取非常關(guān)鍵,對(duì)于疾病研究起著至關(guān)重要的作用。而其中分詞技術(shù)是中文自然語(yǔ)言處理的基礎(chǔ)和關(guān)鍵技術(shù),對(duì)于中文電子病歷的分析和挖掘起著重要作用[8]。雖然目前分詞技術(shù)也已有較大發(fā)展,但是中文電子病歷為術(shù)語(yǔ)化文本,混合有大量專(zhuān)業(yè)名詞、縮略語(yǔ)、英文縮寫(xiě)、慣用語(yǔ)、測(cè)量數(shù)字等,歧義切分及未登錄問(wèn)題成為中文電子病歷分詞面臨的兩大難題。機(jī)械分詞具有快速切分的優(yōu)勢(shì),但因無(wú)法識(shí)別未登錄詞和無(wú)法有效消除切分歧義導(dǎo)致切分準(zhǔn)確率有限。基于統(tǒng)計(jì)模型的分詞方法通過(guò)大規(guī)模的訓(xùn)練語(yǔ)料,可以解決歧義切分及未登錄詞識(shí)別問(wèn)題。
上海市兒童醫(yī)院專(zhuān)病電子病歷后結(jié)構(gòu)化模型將基于詞典詞性標(biāo)注的分詞方法和基于統(tǒng)計(jì)分析的分詞方法有機(jī)結(jié)合起來(lái),既能發(fā)揮機(jī)械分詞切分速度快、效率高的特點(diǎn),又利用了統(tǒng)計(jì)分析方法能夠識(shí)別出未登錄詞的優(yōu)點(diǎn)。電子病歷后結(jié)構(gòu)化整體處理流程如圖1所示。
在對(duì)中文電子病歷進(jìn)行分詞處理后,運(yùn)用疾病指標(biāo)庫(kù),基于模式匹配技術(shù),完成疾病特征挖掘?;谥笜?biāo)庫(kù)的模式匹配主要分為6大類(lèi),分別為檢查、檢驗(yàn)、癥狀體征、基本信息、治療、疾病指標(biāo)。自定義疾病特征提取工具在電子病歷后結(jié)構(gòu)化的基礎(chǔ)上,根據(jù)分詞后的擴(kuò)展醫(yī)療詞性,完成6大類(lèi)指標(biāo)的分析挖掘,構(gòu)建全維度臨床專(zhuān)病數(shù)據(jù)庫(kù)。兒童專(zhuān)病研究系統(tǒng)病歷中患者癥狀體征的挖掘,主要通過(guò)癥狀同義詞、癥狀描述和持續(xù)時(shí)間的解析,完成患者體征的過(guò)程畫(huà)像;檢查、檢驗(yàn)類(lèi)指標(biāo)主要通過(guò)身體部位解析和描述詞解析,以及結(jié)合病歷中提及的外院檢查結(jié)果,分析醫(yī)療過(guò)程中醫(yī)生關(guān)注過(guò)的患者檢查檢驗(yàn)指標(biāo);基本信息、治療、疾病類(lèi)指標(biāo)通過(guò)病歷中家族史和既往史解析,以及藥物、治療和查房記錄解析,最終完成患者治療指標(biāo)解析。疾病特征解析模型如圖2所示。
圖1 電子病歷后結(jié)構(gòu)化處理流程
圖2 疾病特征解析模型
通過(guò)電子病歷的文本挖掘和疾病特征挖掘,可以形成基于疾病的專(zhuān)病數(shù)據(jù)庫(kù),為臨床的輔助決策和疾病研究提供信息服務(wù)和數(shù)據(jù)支撐[9]。因而通過(guò)自然語(yǔ)言處理技術(shù)對(duì)電子病歷數(shù)據(jù)進(jìn)行后結(jié)構(gòu)化處理,然后結(jié)合專(zhuān)病知識(shí)庫(kù),運(yùn)用模式匹配、指標(biāo)分析等技術(shù)提取電子病歷中疾病特征指標(biāo),再整合結(jié)構(gòu)化醫(yī)療數(shù)據(jù)搭建全面完整的臨床專(zhuān)病數(shù)據(jù)庫(kù)。專(zhuān)病數(shù)據(jù)庫(kù)整體架構(gòu)如圖3所示。
兒童專(zhuān)病數(shù)據(jù)庫(kù)基于中文語(yǔ)義分析和數(shù)據(jù)挖掘技術(shù),以臨床病歷的深層語(yǔ)義理解和疾病特征提取為最終目標(biāo),建立具有可互操作性的臨床病歷結(jié)構(gòu)化數(shù)據(jù)管理架構(gòu),從而封裝文本病歷和結(jié)構(gòu)化病歷2種異質(zhì)性臨床數(shù)據(jù)源。
基于臨床數(shù)據(jù)中心的兒童專(zhuān)病研究系統(tǒng)面向臨床科研,以建設(shè)智慧醫(yī)院臨床研究為中心,通過(guò)專(zhuān)病數(shù)據(jù)庫(kù)為臨床科研提供2大模塊的應(yīng)用服務(wù):一是通過(guò)全維度專(zhuān)病數(shù)據(jù)庫(kù)綜合搜索引擎,建立臨床研究隊(duì)列;二是在專(zhuān)病數(shù)據(jù)庫(kù)的專(zhuān)病指標(biāo)庫(kù)基礎(chǔ)上,通過(guò)數(shù)據(jù)處理、數(shù)據(jù)挖掘、模型訓(xùn)練、模型評(píng)估等研究過(guò)程,實(shí)現(xiàn)專(zhuān)病的應(yīng)用示范服務(wù)構(gòu)建,為提高疾病的診治水平提供大數(shù)據(jù)支撐與服務(wù)。以兒童肺炎專(zhuān)病數(shù)據(jù)庫(kù)為例,以肺炎專(zhuān)病數(shù)據(jù)庫(kù)為核心,形成了肺炎重癥非重癥分析、肺炎病原分析、肺炎藥物療效及不良反應(yīng)評(píng)價(jià)和基于氣候的兒童診療行為分析4個(gè)應(yīng)用示范服務(wù)。
上海市兒童醫(yī)院通過(guò)對(duì)臨床電子病歷的文本分析和知識(shí)提取嘗試,建立可互操作性的臨床病歷結(jié)構(gòu)化數(shù)據(jù)管理架構(gòu),并最終為構(gòu)建以疾病特征分析為目的的通用專(zhuān)病數(shù)據(jù)庫(kù)奠定應(yīng)用研究基礎(chǔ)。后續(xù),在智慧醫(yī)院“5R”模型的指導(dǎo)下,將進(jìn)一步建設(shè)兒童腫瘤專(zhuān)病數(shù)據(jù)系統(tǒng)、川崎病專(zhuān)病系統(tǒng)等臨床業(yè)務(wù)需要的服務(wù)平臺(tái),以推進(jìn)智慧醫(yī)院建設(shè)為目標(biāo),依托大數(shù)據(jù)、語(yǔ)義分析、數(shù)據(jù)挖掘等技術(shù),結(jié)合兒童醫(yī)院的臨床業(yè)務(wù)和科研需求,構(gòu)建面向臨床醫(yī)療的科研大數(shù)據(jù)服務(wù)平臺(tái),開(kāi)展面向患者、醫(yī)生、科研、管理人員的應(yīng)用示范研究,建設(shè)在大數(shù)據(jù)環(huán)境下新型專(zhuān)業(yè)診療的新型服務(wù)模式,支撐從健康、治療到轉(zhuǎn)歸跟蹤的全程服務(wù)體系,從而獲取有價(jià)值的醫(yī)療知識(shí),為疾病預(yù)防、診斷和治療提供實(shí)驗(yàn)依據(jù)和輔助決策服務(wù),為智慧醫(yī)療探索理論基礎(chǔ)、積累實(shí)踐經(jīng)驗(yàn)。
圖3 專(zhuān)病數(shù)據(jù)庫(kù)整體技術(shù)架構(gòu)
[1] 林鑫,許鳳娟,李會(huì)玲.公立醫(yī)院數(shù)字化病案管理實(shí)踐探討[J].中國(guó)醫(yī)院管理,2015,35(11):64-65.
[2] 陳一君,沈曉明,李相宗,等.智慧化醫(yī)療設(shè)備管理系統(tǒng)的研究與應(yīng)用[J].中國(guó)醫(yī)院管理,2013,33(10):61-62.
[3] 李曦柯,施榮華,許丹,等.基于全面互聯(lián)互通和深度智能化建設(shè)醫(yī)院信息集成平臺(tái)[J].計(jì)算技術(shù)與自動(dòng)化,2016(2):125-129.
[4] 景慎旗,劉云,繆姝妹,等.基于臨床數(shù)據(jù)中心的醫(yī)院知識(shí)服務(wù)系統(tǒng)構(gòu)建[J].醫(yī)學(xué)信息學(xué)雜志,2017,38(2):83-87.
[5] Weil G, Motamed C, Eghiaian A, et al. The use of a clinical database in an anesthesia unit: focus on its limits[J]. Journal of Clinical Monitoring and Computing,2015,29(1):163-167.
[6] 詹遠(yuǎn).于廣軍:智慧醫(yī)院體現(xiàn)以人為本的核心建設(shè)智慧醫(yī)院的5R構(gòu)想[EB/OL].(2015-12-01)[2017-04-20].http://news.familydoctor. com.cn/a/201512/859589.html.
[7] Wang B, Guang-Ming YE, Tang ZR, et al. Hospital informatization construction based on new electric medical record system[J]. Hospital Administration Journal of Chinese People's Liberation Army,2013,29(1):91-96.
[8] Gu DX, Liang CY, Li XG, et al. Intelligent technique for knowledge reuse of dental medical records based on case-based reasoning[J]. Journal of Medical Systems, 2010,34(2):213-222.
[9] 井立強(qiáng),王艷萍,焦敬義,等.基于CDSS臨床知識(shí)庫(kù)應(yīng)用與實(shí)踐[J].中國(guó)衛(wèi)生信息管理雜志,2015(2):176-182.
electric medical record, smart hospital, special disease database, special disease research system
The clinical data center of the electronic medical record is a complete and detailed clinical information resource generated and recorded in the healthcare provision, including the symptoms of the disease, the course of treatment and the rehabilitation. By digging the electronic medical records of the text, disease characteristics, disease condition and outcome, it can form a disease-based database for clinical decision-making and disease research to provide information services and data support to achieve a new type of intelligent electronic medical records analysis services of knowledge based system.
2017-06-19](責(zé)任編輯 鮑文琦)
Construction and practice of special disease research system based on clinical data center / WANG Shu, CHEN Min, LING Qiming, YU Guangjun // Chinese Hospitals. -2017,21(8):16-18
國(guó)家863計(jì)劃項(xiàng)目(2015AA020105-02);國(guó)家自然科學(xué)基金面上項(xiàng)目(71473164)
①上海市兒童醫(yī)院,200062 上海市瀘定路355號(hào)
于廣軍:上海市兒童醫(yī)院院長(zhǎng)、研究員、博士
E-mail:gjyu@shchildren.com.cn