鄒濤
摘要:為深度挖掘現(xiàn)有醫(yī)院信息系統(tǒng)數(shù)據(jù)資源,提升醫(yī)療數(shù)據(jù)的利用率,為醫(yī)院管理層的科學(xué)決策提供數(shù)據(jù)支撐。本院以醫(yī)院各項業(yè)務(wù)系統(tǒng)平臺為基礎(chǔ),構(gòu)建主題數(shù)據(jù)倉庫,最終搭建出包含分析、預(yù)測、監(jiān)測、診療、健康管理的醫(yī)療大數(shù)據(jù)綜合應(yīng)用平臺。通過該平臺,有效解決了原始數(shù)據(jù)難以抽取、整合、清洗、處理的問題,有效整合數(shù)據(jù)資源,加快了各項數(shù)據(jù)的讀取速度。通過對醫(yī)療數(shù)據(jù)的多種方式利用,提升了數(shù)據(jù)的利用率。
關(guān)鍵詞:深度挖掘;醫(yī)療大數(shù)據(jù);綜合應(yīng)用平臺;數(shù)據(jù)倉庫
中圖分類號:R197? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標(biāo)識碼:B? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? DOI:10.3969/j.issn.1006-1959.2019.05.011
文章編號:1006-1959(2019)05-0028-03
Abstract:In order to deeply explore the existing hospital information system data resources, improve the utilization of medical data, and provide data support for the scientific decision-making of hospital management. Based on the hospital's various business system platforms, the hospital built a thematic data warehouse, and finally built a comprehensive medical data platform including analysis, forecasting, monitoring, diagnosis and treatment, and health management. Through the platform, the problem of difficult to extract, integrate, clean and process the original data is effectively solved, the data resources are effectively integrated, and the reading speed of each data is accelerated. Increased data utilization through the use of multiple ways of medical data.
Key words:Deep mining;Medical big data;Integrated application platform;Data warehouse
隨著信息技術(shù)的普及,各行各業(yè)信息化建設(shè)也日益完善。醫(yī)院信息化經(jīng)過最近十多年的建設(shè),各級醫(yī)院也上線了諸如醫(yī)院管理信息系統(tǒng)(Hospital Information System,HIS)、臨床檢驗信息系統(tǒng)(Laboratory Information System,LIS)、醫(yī)學(xué)影像管理系統(tǒng)(Picture Archiving and Communication Systems,PACS)、病案管理信息系統(tǒng)、合理用藥系統(tǒng)、院內(nèi)感染檢測系統(tǒng)等各種業(yè)務(wù)信息系統(tǒng),極大程度上促進了醫(yī)院的快速發(fā)展。與此同時,醫(yī)院各種信息系統(tǒng)均產(chǎn)生了大量的應(yīng)用數(shù)據(jù),據(jù)分析,到2020年,醫(yī)療數(shù)據(jù)將急劇增長到35 ZB,相當(dāng)于2009年數(shù)據(jù)量的44倍,已經(jīng)具有大數(shù)據(jù)“4V”的特點,至少從規(guī)模上醫(yī)療數(shù)據(jù)已逐漸變得足夠“大”[1]。雖然數(shù)據(jù)量已經(jīng)很大,但是目前對數(shù)據(jù)的使用仍然不甚理想,如何整合數(shù)據(jù)資源、提高數(shù)據(jù)的利用率,儼然已經(jīng)成為當(dāng)前醫(yī)院急需解決的問題??紤]到醫(yī)院信息系統(tǒng)種類繁多,各自采用的數(shù)據(jù)庫與開發(fā)語言不盡相同,數(shù)據(jù)格式也多種多樣,導(dǎo)致系統(tǒng)之間數(shù)據(jù)信息難以交互[2],這也為數(shù)據(jù)的整合利用加大了難度。因此,實現(xiàn)諸多系統(tǒng)間的協(xié)同交互以及信息共享,采用有效的方式對數(shù)據(jù)進行集中管理與整理具有重要意義[3]。我院經(jīng)過近15年的信息化建設(shè),目前已經(jīng)建立起相對完善的醫(yī)院信息系統(tǒng),同時每年業(yè)務(wù)數(shù)據(jù)進入高速增長模式,現(xiàn)有信息系統(tǒng)已累積了海量的醫(yī)療數(shù)據(jù),這為大數(shù)據(jù)分析打下了堅實的基礎(chǔ)。但是數(shù)據(jù)利用率較低,已經(jīng)不能滿足醫(yī)院管理和發(fā)展的需要。因此我院于2018年建立了基于數(shù)據(jù)倉庫的醫(yī)療大數(shù)據(jù)綜合應(yīng)用平臺,這也標(biāo)志著醫(yī)院信息化發(fā)展進入了新的時代。
1醫(yī)療大數(shù)據(jù)綜合應(yīng)用平臺介紹
我院的醫(yī)療大數(shù)據(jù)綜合應(yīng)用平臺利用Hadoop技術(shù)和網(wǎng)絡(luò)爬蟲技術(shù)解決數(shù)據(jù)訪問速度慢的難題,實現(xiàn)了上億數(shù)據(jù)的秒級顯示。平臺創(chuàng)建過程中不需要HIS或第三方廠家提供接口,同時能整合不同格式、不同廠家的病史數(shù)據(jù),并采用專業(yè)的IDE開發(fā)設(shè)計工具,無需編程即可實現(xiàn)數(shù)據(jù)的利用和呈現(xiàn)。大數(shù)據(jù)綜合應(yīng)用平臺在生產(chǎn)業(yè)務(wù)系統(tǒng)的大平臺上進行主題數(shù)據(jù)倉庫的構(gòu)建和分析,包括數(shù)據(jù)倉庫的設(shè)計,OLAP前端展示和數(shù)據(jù)挖掘。該平臺通過預(yù)先建立的數(shù)據(jù)通道,利用多數(shù)據(jù)源ETL工具將HIS、LIS、PACS等業(yè)務(wù)系統(tǒng)的數(shù)據(jù)抽取、錄入、整合到數(shù)據(jù)中心去,然后再建立相應(yīng)的運算模型,創(chuàng)建數(shù)據(jù)倉庫,最后再進行各類的數(shù)據(jù)挖掘和分析。具體的平臺構(gòu)成和總體流程見圖1和圖2。
2系統(tǒng)功能
2.1信息集成平臺? 通過集成平臺的高可用性和數(shù)據(jù)一致性,在保證業(yè)務(wù)連續(xù)性、數(shù)據(jù)完整性、消息可靠性的同時,最大限度的保障了平臺中的數(shù)據(jù)與原始數(shù)據(jù)的一致性,有效提升了集成平臺整體的實施效果。集成平臺不需要各業(yè)務(wù)系統(tǒng)提供接口,還能整合不同格式、不同廠家的業(yè)務(wù)數(shù)據(jù),將業(yè)務(wù)系統(tǒng)的數(shù)據(jù)轉(zhuǎn)入到集成平臺中去,極大地減輕了HIS、LIS、PACS等系統(tǒng)的數(shù)據(jù)庫訪問壓力。目前的主流業(yè)務(wù)系統(tǒng)包括HIS、EMR、LIS、RIS、PACS、合理用藥、院內(nèi)感染等20個系統(tǒng)已經(jīng)全部納入到集成平臺。
2.2數(shù)據(jù)挖掘? 平臺系統(tǒng)支持海量數(shù)據(jù)高速處理,支持主流的數(shù)據(jù)庫連接,查詢時間少于2 s。數(shù)據(jù)挖掘[4]系統(tǒng)是基于數(shù)據(jù)倉庫的智能分析系統(tǒng),數(shù)據(jù)的大量處理主要是在晚上或空閑時間處理,完全不影響主機和帶寬的速度。通過ETL數(shù)據(jù)抽取工具將業(yè)務(wù)數(shù)據(jù)庫的原始數(shù)據(jù)進行抽取,然后進行數(shù)據(jù)清洗整合,自動處理、過濾數(shù)據(jù),為數(shù)據(jù)挖掘提供基礎(chǔ)數(shù)據(jù)。數(shù)據(jù)挖掘主要包括多維分析、管理駕駛艙、固定報表打印等功能。
多維分析通過分析工具無需編程即可實現(xiàn)所需分析、分析數(shù)量為字段的數(shù)據(jù)分析顯示,并滿足排序、計算、切片、上鉆、下鉆、行列切換、重新分組、展開、單元格支持Excel公式計算、占比、負(fù)數(shù)紅字顯示或括號顯示、支持n/n分析原則等要求。
管理駕駛艙可以進行歷史數(shù)據(jù)分析、總體趨勢分析以及明細(xì)分析,及時掌握各項數(shù)據(jù)的變化、發(fā)展情況。
固定報表打印可以將經(jīng)常需要的一些數(shù)據(jù)做成固定報表的格式,實現(xiàn)統(tǒng)計數(shù)據(jù)的秒級顯示,方便查閱、打印。
2.3臨床數(shù)據(jù)中心? 臨床數(shù)據(jù)中心是科研平臺的基礎(chǔ),其能夠滿足深層次利用臨床數(shù)據(jù)的需要,故需要以臨床科研需求作為導(dǎo)向建立科研數(shù)據(jù)平臺[5]。其主要是以患者為中心、在醫(yī)院范圍內(nèi)制作的縱向多媒體記錄,包含患者所有重要的臨床數(shù)據(jù),可集成院內(nèi)各科室臨床信息系統(tǒng),實現(xiàn)所有臨床診療數(shù)據(jù)的整合與集中展現(xiàn),并為決策提供支持信息??梢詫⑨t(yī)院內(nèi)部科室患者不同階段的HIS、LIS、PACS、病史等資料整合在一起,構(gòu)建成一個大的數(shù)據(jù)中心。醫(yī)生登錄系統(tǒng)后可以查閱整合后的患者健康檔案信息,實現(xiàn)醫(yī)院患者健康檔案信息之間的互聯(lián)互通,提供醫(yī)患溝通診療方案,方便醫(yī)生詳細(xì)了解和分析患者所有的健康信息。
2.4 強大的IDE工具? 綜合應(yīng)用平臺提供了包括BIPAD、BIword、BIexcel等BI配置工具,用于設(shè)置各種統(tǒng)計圖形、儀表盤、表格統(tǒng)計、olap分析,解決數(shù)據(jù)利用和呈現(xiàn)需要編程的難題。同時實現(xiàn)了自定義分析指標(biāo),滿足靈活多變的各種指標(biāo)提取需求,支持用戶根據(jù)業(yè)務(wù)需要自定義選取指標(biāo)和時間段等組合的高級查詢分析,支持自定義書寫短信、電子郵件模板,采用多種靈活的方式給領(lǐng)導(dǎo)的決策支持?jǐn)?shù)據(jù)更全面、客觀和準(zhǔn)確。
2.5異構(gòu)數(shù)據(jù)錄入? 一般在做數(shù)據(jù)庫后臺統(tǒng)計的時候,只有表中有相應(yīng)字段名的時候才能用查詢語句進行數(shù)據(jù)查詢,但是經(jīng)常會遇到一些數(shù)據(jù)并沒有存在于數(shù)據(jù)庫的表中。異構(gòu)數(shù)據(jù)錄入支持將系統(tǒng)數(shù)據(jù)庫中沒有字段的數(shù)據(jù)進行自由錄入,依據(jù)用戶自定義模版設(shè)置錄入指標(biāo)數(shù)據(jù),然后與業(yè)務(wù)系統(tǒng)進行對接生成新的指標(biāo),最終形成滿足需求的統(tǒng)計報表。對于這部分指標(biāo),只要定時進行數(shù)據(jù)的更新,就能滿足數(shù)據(jù)挖掘的要求。
2.6移動醫(yī)療APP應(yīng)用? 移動醫(yī)療APP包含基本的管理功能和業(yè)務(wù)功能,管理功能包括醫(yī)院的介紹、通知、公告、網(wǎng)站等。業(yè)務(wù)功能包括本院患者、醫(yī)患溝通、預(yù)約掛號等,也可以管理本人的患者,它整合了患者的各項就診資料,可以隨時查看、了解。管理者所管理的工作文件不再是傳統(tǒng)的PDF、WORD等不可變動的文件。它是結(jié)構(gòu)化的,會隨著數(shù)據(jù)庫的數(shù)據(jù)變化而變化。強大的移動辦公功能能夠隨時、隨地方便快捷的利用數(shù)據(jù)進行管理、質(zhì)控、隨訪、監(jiān)控,提高了數(shù)據(jù)利用率。
3應(yīng)用效果
目前,我院已經(jīng)將院內(nèi)的HIS、LIS、PACS、合理用藥、院內(nèi)感染監(jiān)控系統(tǒng)、護理不良事件上報系統(tǒng)等業(yè)務(wù)系統(tǒng)全部接入大數(shù)據(jù)綜合應(yīng)用平臺中去,并完成歷史數(shù)據(jù)的導(dǎo)入。共完成數(shù)據(jù)挖掘常用指標(biāo)500多條,固定報表模型70多張,并在不斷的完善中。
大數(shù)據(jù)綜合應(yīng)用平臺建設(shè)完成上線后,給醫(yī)院、職工、患者均帶來了極大的好處。職能科室提高了工作效率,方便了科室之間的協(xié)同辦公,減少了失誤,讓互聯(lián)互通不再困難。同時大幅度提高了醫(yī)療數(shù)據(jù)的利用率,為醫(yī)院的決策管理、科研教學(xué)提供強大的數(shù)據(jù)支撐。大幅度提高了醫(yī)院為患者服務(wù)的能力,極大改善了醫(yī)患關(guān)系,也幫助患者改善了就醫(yī)體驗,降低就醫(yī)成本,從而減少醫(yī)患矛盾。最終提高了醫(yī)院整體信息化管理水平,真正發(fā)揮出了醫(yī)院信息化為患者服務(wù)、幫助醫(yī)院管理、提高工作效率的巨大作用。
參考文獻:
[1]汪鵬,吳昊,羅陽,等.醫(yī)療大數(shù)據(jù)應(yīng)用需求分析與平臺建設(shè)構(gòu)想[J].中國醫(yī)院管理,2015,35(6):40-42.
[2]劉晶,左秀然,楊國良.基于云平臺的醫(yī)院大數(shù)據(jù)中心構(gòu)建研究[J].中國數(shù)字醫(yī)學(xué),2016,11(7):14-16.
[3]傅周冰.大數(shù)據(jù)背景下的醫(yī)院集成平臺協(xié)同與數(shù)據(jù)融合利用探析[J].信息與電腦(理論版),2018(10):127-128.
[4]Berzal F,Nicolfás Matín.Data mining:concepts and techniques by Jiawei Han and Micheline Kamber[J].ACM SIGMOD Record,2002,31(2):66-68.
[5]伍君賢.基于交換協(xié)同平臺的醫(yī)院信息系統(tǒng)數(shù)據(jù)集成應(yīng)用研究[J].中國數(shù)字醫(yī)學(xué),2015,7(23):78-79.
收稿日期:2018-11-19;修回日期:2018-11-29
編輯/王朵梅