廖 亮
?
數(shù)據(jù)挖掘技術(shù)在醫(yī)療信息管理中的應(yīng)用
廖 亮
本文闡述了數(shù)據(jù)挖掘技術(shù)的基本概念,結(jié)合醫(yī)院信息數(shù)據(jù)的特點(diǎn),探討數(shù)據(jù)挖掘技術(shù)在醫(yī)療信息管理中的應(yīng)用。
隨著計(jì)算機(jī)技術(shù)的發(fā)展及其在醫(yī)療行業(yè)應(yīng)用的深入,各級醫(yī)院都建設(shè)了醫(yī)院信息系統(tǒng),特別是大型醫(yī)院,隨著建設(shè)數(shù)字化醫(yī)院和無紙化辦公概念的引入,醫(yī)院對醫(yī)療信息系統(tǒng)依賴程度越來越高,建設(shè)的系統(tǒng)越來越多,也越來越復(fù)雜。就目前而言,簡單的對數(shù)據(jù)的查詢已經(jīng)逐漸無法滿足醫(yī)院管理者的需求,如何從大量的醫(yī)療數(shù)據(jù)中提取有助服務(wù)臨床和領(lǐng)導(dǎo)管理決策的數(shù)據(jù)顯得越來越重要,醫(yī)療數(shù)據(jù)挖掘由此應(yīng)運(yùn)而生。
數(shù)據(jù)挖掘(Data mining),是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、事先未知的、潛在有用的信息和知識的過程,其主要特點(diǎn)是對數(shù)據(jù)庫中的大量數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析和其他模型化處理,并從中提取輔助決策的關(guān)鍵性數(shù)據(jù)。數(shù)據(jù)挖掘是數(shù)據(jù)庫知識發(fā)現(xiàn)(Knowledge-Discovery in Databases,簡稱:KDD)中的重要技術(shù),它不是用規(guī)范的數(shù)據(jù)庫查詢語音(如SQL)進(jìn)行查詢,而是對查詢的內(nèi)容進(jìn)行模式的總結(jié)和內(nèi)在規(guī)律的搜索。
醫(yī)療數(shù)據(jù)挖掘和其他領(lǐng)域的挖掘有所不同,其數(shù)據(jù)主要來源與病人診療過程中獲得的,包括了與病人的談話記錄,各種儀器的圖片或影像數(shù)據(jù),檢驗(yàn)檢查數(shù)據(jù)等。具體特征歸納如下:
種類多 醫(yī)療數(shù)據(jù)主要來源于醫(yī)院日常經(jīng)營,包括有醫(yī)院管理中的人財(cái)物數(shù)據(jù),也有來自臨床的診療過程中如出入院、檢查、診療、醫(yī)囑等信息,數(shù)據(jù)類型包含有文字的、圖片的、語音的、數(shù)值的、動態(tài)影像等。
數(shù)量大 隨著國家全民醫(yī)保時代的來臨及人們對醫(yī)療保健的重視,到醫(yī)院就診人數(shù)與日俱增,加上越來越多的醫(yī)院高科技大型醫(yī)療設(shè)備(如MRI,PET,大C臂等)的投入使用,而這些大型設(shè)備每天都會產(chǎn)生上千兆字節(jié)的數(shù)據(jù)。
非完整性 病案登記信息不完整可能導(dǎo)致病例信息的不完整性,以及不同醫(yī)生在診療過程對醫(yī)學(xué)信息的表達(dá)和記錄具有不確定性和模糊性,有一定的主觀性。
冗余性 醫(yī)學(xué)數(shù)據(jù)庫有成型的數(shù)據(jù)模板,有大量的醫(yī)學(xué)數(shù)據(jù)倉庫,每天都有大量相同或相近的數(shù)據(jù)產(chǎn)生,造成了醫(yī)療數(shù)據(jù)的大量冗余。
隱私性 醫(yī)學(xué)信息包含大量的病人隱私信息,在數(shù)據(jù)挖掘過程總,既要對醫(yī)療數(shù)據(jù)進(jìn)行合理挖掘應(yīng)用,又要注重保護(hù)數(shù)據(jù)的安全性和機(jī)密性。
通過將海量的、模糊的、不完整的、冗余的原始醫(yī)療數(shù)據(jù)進(jìn)行清理和過濾,轉(zhuǎn)換為合適挖掘的形式,然后根據(jù)數(shù)據(jù)挖掘的目標(biāo)和數(shù)據(jù)特征,采用合適的技術(shù)和工具,建立合適的數(shù)據(jù)模型,運(yùn)用于實(shí)際問題。
在臨床醫(yī)療活動中的應(yīng)用
隨著醫(yī)療信息化的發(fā)展,各大醫(yī)院都逐步建立了自己的電子病歷(EMR)系統(tǒng),通過建立合適的數(shù)據(jù)挖掘模型,分析電子病歷里的數(shù)據(jù),將不同病種的各種檢驗(yàn)檢查結(jié)果及各種病癥情況對應(yīng),形成一個龐大的醫(yī)療診斷知識倉庫,醫(yī)生在診斷病人時可以根據(jù)病人所做檢驗(yàn)檢查結(jié)果及病癥情況,結(jié)合醫(yī)療知識庫快速進(jìn)行診斷,提高醫(yī)生診斷效率。同時,還能記錄不同病種不同年齡段病人數(shù),方便醫(yī)生以后進(jìn)行統(tǒng)計(jì)分析。
在醫(yī)保系統(tǒng)中的應(yīng)用
國家對醫(yī)保投入逐年加大,可以說迎來了全民醫(yī)保時代,住院病人中各類醫(yī)保病人比例越來越高,醫(yī)保收入在醫(yī)院營業(yè)收入比重也越來越大。然現(xiàn)在醫(yī)保種類繁多,各種醫(yī)保政策也不盡相同,如何幫助醫(yī)生控制各類醫(yī)保病人費(fèi)用總數(shù)及自費(fèi)比例,已成為醫(yī)院管理一項(xiàng)重要工作。
利用數(shù)據(jù)挖掘技術(shù)建立醫(yī)院HIS與各類醫(yī)保的數(shù)據(jù)接口,建立藥品、材料、診療項(xiàng)目等的對照表,制作醫(yī)囑、費(fèi)用傳輸模塊,實(shí)現(xiàn)HIS與醫(yī)保系統(tǒng)之間數(shù)據(jù)上傳與下載,便于醫(yī)保中心跟醫(yī)院對醫(yī)保病人進(jìn)行實(shí)時審核、監(jiān)管等;通過數(shù)據(jù)挖掘技術(shù)在醫(yī)生站開醫(yī)囑時,根據(jù)病人醫(yī)保類型、醫(yī)生級別等,提示或限制藥品、診療等的使用;制作醫(yī)保病人費(fèi)用查詢報(bào)表,使各科室能實(shí)時了解本科室醫(yī)保病人費(fèi)用情況,合理控制醫(yī)療費(fèi)用,同時,醫(yī)院醫(yī)保部門能實(shí)時了解各科室醫(yī)保病人自費(fèi)藥品、材料等指標(biāo)情況,便于對科室的監(jiān)督管理、醫(yī)保政策的把握。
在醫(yī)院管理中的應(yīng)用
通過對各類醫(yī)療數(shù)據(jù)進(jìn)行挖掘,可形成功能完整的數(shù)據(jù)報(bào)表系統(tǒng),為管理者們提供高可信的醫(yī)療數(shù)據(jù),對醫(yī)院管理決策、控制醫(yī)療費(fèi)用、控制醫(yī)療成本、分析經(jīng)濟(jì)效益、規(guī)范醫(yī)生醫(yī)療行為提高醫(yī)療服務(wù)質(zhì)量等起到重要的作用;
通過對門急診病人就診時間、排隊(duì)等候時間、就診情況進(jìn)行分析,制定合理的政策提高醫(yī)療服務(wù)質(zhì)量,合理優(yōu)化門診就醫(yī)流程;根據(jù)挖掘得出的結(jié)論,對全院醫(yī)護(hù)人員配置進(jìn)行相應(yīng)調(diào)整,合理安排人力資源,杜絕人力資源浪費(fèi)和短缺。
在醫(yī)院市場分析中的應(yīng)用
對病人來源、年齡、病種等信息進(jìn)行挖掘統(tǒng)計(jì),分析病人的區(qū)域特性、疾病特性、年齡特性等特征,制定合理的市場開拓政策,拓展醫(yī)療市場。
在科研活動中的應(yīng)用
數(shù)據(jù)挖掘技術(shù)在醫(yī)療科研中應(yīng)用也比較廣泛,如分析歷史病例資料輔助科研論文的撰寫,在基因研究中對基因序列功能構(gòu)成的預(yù)測和分類預(yù)測,新藥研發(fā)過程中采用數(shù)據(jù)挖掘技術(shù)進(jìn)行系統(tǒng)設(shè)計(jì),以及腫瘤學(xué)、肝病學(xué)等??祁I(lǐng)域研究。
隨著醫(yī)療信息化的不斷發(fā)展,醫(yī)院數(shù)據(jù)量日益龐大,如何提取各類型數(shù)據(jù)間的關(guān)聯(lián),發(fā)現(xiàn)其規(guī)律,從繁雜的數(shù)據(jù)中提供對決策者有用的數(shù)據(jù),是當(dāng)今醫(yī)療信息發(fā)展的一個重要研究方向。隨著醫(yī)療數(shù)據(jù)挖掘技術(shù)不斷深入,在醫(yī)院醫(yī)療活動中的應(yīng)用越將來越廣泛,對醫(yī)院管理者做出明智決策,對醫(yī)生的診斷和治療,臨床、藥品、信息等合理化管理,對人類疾病和健康研究都起著極為重要的作用。
廖 亮
南華大學(xué)附屬南華醫(yī)院信息科廖亮,本科,工程師。
10.3969/j.issn.1001-8972.2016.11.017