陳曉妍 孫向東 陸傳統(tǒng) 唐玲 張暉 翁可為 王侃
摘要:本文介紹了基于循證醫(yī)學(xué)的海量數(shù)據(jù)挖掘系統(tǒng)設(shè)計(jì)及應(yīng)用。該系統(tǒng)利用區(qū)域衛(wèi)生信息平臺(tái)中的相關(guān)數(shù)據(jù),對(duì)傳染病、慢性病,及門(mén)急診等指標(biāo)的分析預(yù)測(cè),實(shí)現(xiàn)了基于循證醫(yī)學(xué)的醫(yī)學(xué)數(shù)據(jù)挖掘分析,較大地提升了區(qū)域醫(yī)療決策水平。
關(guān)鍵詞:數(shù)據(jù)挖掘;循證醫(yī)學(xué);區(qū)域衛(wèi)生信息平臺(tái);分析平臺(tái)
1 引言
隨著大數(shù)據(jù)時(shí)代的到來(lái),數(shù)據(jù)挖掘和模式識(shí)別已經(jīng)逐漸成為新的醫(yī)學(xué)科學(xué)研究范式。而臨床大數(shù)據(jù)集具有數(shù)據(jù)格式多樣、復(fù)雜且難于統(tǒng)一,使得很大一部分臨床數(shù)據(jù)得不到有效的利用。因此,如何根據(jù)循證醫(yī)學(xué)特點(diǎn),合理利用數(shù)據(jù)挖掘技術(shù),獲取有價(jià)值的治療證據(jù)是循證醫(yī)學(xué)的關(guān)鍵所在。
寧波市區(qū)域衛(wèi)生信息平臺(tái)自2013年建設(shè)開(kāi)始,目前已接入市屬8家醫(yī)療機(jī)構(gòu)和鄞州區(qū)、海曙區(qū)、江東區(qū)、江北區(qū)、鎮(zhèn)海區(qū)、奉化市、余姚市、慈溪市、寧??h、奉化縣等區(qū)市縣級(jí)平臺(tái)以及市級(jí)公共衛(wèi)生專(zhuān)業(yè)機(jī)構(gòu),實(shí)現(xiàn)了醫(yī)療服務(wù)信息和公共衛(wèi)生服務(wù)信息的采集與交換。
本文從循證醫(yī)學(xué)視角出發(fā),構(gòu)建電子健康檔案和電子病歷信息資源整合與挖掘的宏觀模型和數(shù)據(jù)分析系統(tǒng),對(duì)數(shù)據(jù)采集、數(shù)據(jù)挖掘等幾環(huán)節(jié)進(jìn)行設(shè)計(jì),把紛繁復(fù)雜的醫(yī)療數(shù)據(jù)轉(zhuǎn)變成有價(jià)值的信息,初步實(shí)現(xiàn)了對(duì)醫(yī)學(xué)數(shù)據(jù)的交融擴(kuò)展及挖掘分析的目的,為醫(yī)學(xué)科學(xué)研究、臨床診療、衛(wèi)生決策、公眾服務(wù)制定提供依據(jù),其中包括:①幫助尋找最佳藥物組合及標(biāo)準(zhǔn)化治療方法,提高診療效果;②預(yù)測(cè)慢性疾病風(fēng)險(xiǎn),查明罹患疾病幾率;③協(xié)助醫(yī)院評(píng)估、監(jiān)測(cè)和提高患者治療的安全性;④優(yōu)化醫(yī)院資源利用等等。
2 系統(tǒng)的架構(gòu)及功能
系統(tǒng)采用B/S結(jié)構(gòu)、面向?qū)ο蟮脑O(shè)計(jì),以C#作為開(kāi)發(fā)工具結(jié)合MSSQLServer數(shù)據(jù)庫(kù)技術(shù)開(kāi)發(fā)而成。系統(tǒng)由數(shù)據(jù)采集、數(shù)據(jù)管理、數(shù)據(jù)應(yīng)用、平臺(tái)訪問(wèn)、平臺(tái)管理五大類(lèi)模塊組成[1]。
平臺(tái)功能可分為智能報(bào)表分析、動(dòng)態(tài)表單管理、動(dòng)態(tài)數(shù)據(jù)庫(kù)管理、動(dòng)態(tài)數(shù)據(jù)庫(kù)管理以及動(dòng)態(tài)數(shù)據(jù)接口管理。系統(tǒng)采用高性能的緩存機(jī)制,確保網(wǎng)站訪問(wèn)速度;采用強(qiáng)大的安全機(jī)制,防止各種注入式攻擊等漏洞;系統(tǒng)充分考慮了底層大數(shù)據(jù)量并發(fā)的性能問(wèn)題。
3 系統(tǒng)的應(yīng)用
3.1統(tǒng)計(jì)分析 統(tǒng)計(jì)數(shù)據(jù)分為傳染病數(shù)據(jù)、高血壓數(shù)據(jù)及門(mén)急診數(shù)據(jù)三大類(lèi)別,各類(lèi)數(shù)據(jù)可根據(jù)時(shí)間、地區(qū)、患者年齡、患者淶源、性別、職業(yè)、疾病等進(jìn)行分項(xiàng)統(tǒng)計(jì)。數(shù)據(jù)展示形式可分為曲線圖、柱狀圖、餅圖、漏斗圖等。
3.1.1傳染病統(tǒng)計(jì) 系統(tǒng)可將傳染病報(bào)告例數(shù)按年份、月份、地區(qū)、年齡、性別、職業(yè)、疾病病種進(jìn)行分項(xiàng)統(tǒng)計(jì);圖1、圖2中分別顯示了2011年~2014年傳染病報(bào)告例數(shù)的逐月分析和按病種分析。
3.1.2 高血壓統(tǒng)計(jì) 根據(jù)系統(tǒng)對(duì)已進(jìn)行登記管理的高血壓人群相應(yīng)地區(qū)、年齡、性別的統(tǒng)計(jì)分析,我們可以對(duì)高血壓病的易感人群開(kāi)展重點(diǎn)防控。見(jiàn)圖3。
3.1.3門(mén)急診分析 門(mén)急診統(tǒng)計(jì)可以對(duì)寧波市屬各醫(yī)療機(jī)構(gòu)及全市總門(mén)急診量進(jìn)行逐月統(tǒng)計(jì)。見(jiàn)圖4。
3.2 數(shù)據(jù)預(yù)測(cè)
3.2.1 算法介紹 數(shù)據(jù)預(yù)測(cè)采用了移動(dòng)平均算法,移動(dòng)平均法是用一組最近的實(shí)際數(shù)據(jù)值來(lái)預(yù)測(cè)未來(lái)一期或幾期內(nèi)數(shù)據(jù)的一種常用方法。移動(dòng)平均法適用于即期預(yù)測(cè)、能有效地消除預(yù)測(cè)中的隨機(jī)波動(dòng)。
移動(dòng)平均法是一種簡(jiǎn)單平滑預(yù)測(cè)技術(shù),它的基本思想是:根據(jù)時(shí)間序列資料、逐項(xiàng)推移,依次計(jì)算包含一定項(xiàng)數(shù)的序時(shí)平均值,以反映長(zhǎng)期趨勢(shì)的方法。因此,當(dāng)時(shí)間序列的數(shù)值由于受周期變動(dòng)和隨機(jī)波動(dòng)的影響,起伏較大,不易顯示出事件的發(fā)展趨勢(shì)時(shí),使用移動(dòng)平均法可以消除這些因素的影響,顯示出事件的發(fā)展方向與趨勢(shì)(即趨勢(shì)線),然后依趨勢(shì)線分析預(yù)測(cè)序列的長(zhǎng)期趨勢(shì)[2-3]。
移動(dòng)平均法可以分為:簡(jiǎn)單移動(dòng)平均和加權(quán)移動(dòng)平均,系統(tǒng)采用的是簡(jiǎn)單移動(dòng)平均算法。簡(jiǎn)單移動(dòng)平均的各元素的權(quán)重都相等。簡(jiǎn)單的移動(dòng)平均的計(jì)算公式如下:
Ft=(At-1+At-2+At-3+…+At-n)/n
在此公式中,oFt表示對(duì)下一期的預(yù)測(cè)值;on表示移動(dòng)平均的時(shí)期個(gè)數(shù);oAt-1表示前期實(shí)際值;oAt-2,At-3和At-n分別表示前兩期、前三期直至前n期的實(shí)際值。
3.2.2 預(yù)測(cè)效果
3.2.2.1傳染病預(yù)測(cè) 根據(jù)2011年1月~2014年12月這一段時(shí)間的傳染病數(shù)據(jù),運(yùn)用移動(dòng)平均算法對(duì)數(shù)據(jù)進(jìn)行處理,預(yù)測(cè)2015年度寧波市傳染病發(fā)病數(shù)量預(yù)測(cè),見(jiàn)圖5。
3.2.2.2 門(mén)急診預(yù)測(cè) 在寧波市某醫(yī)院2014年門(mén)急診量數(shù)據(jù)的基礎(chǔ)上,運(yùn)用移動(dòng)平均算法對(duì)2015年該院的門(mén)急診量進(jìn)行預(yù)測(cè),圖6為2014年該醫(yī)院的門(mén)急診量統(tǒng)計(jì),預(yù)測(cè)結(jié)果見(jiàn)圖7。
4 討論
該數(shù)據(jù)挖掘系統(tǒng)有效地利用了區(qū)域衛(wèi)生信息平臺(tái)中的海量數(shù)據(jù),采用海量檢索、人工智能和統(tǒng)計(jì)學(xué)等方法對(duì)寧波地區(qū)傳染病、慢性病中涉及的循證醫(yī)學(xué)統(tǒng)計(jì)指標(biāo)進(jìn)行分析,對(duì)醫(yī)院門(mén)急診量進(jìn)行預(yù)測(cè),有助于寧波地區(qū)醫(yī)療管理用戶更加合理、有效地配置衛(wèi)生資源及配套設(shè)施,為各項(xiàng)醫(yī)療計(jì)劃的制定,及決策的實(shí)施提供可靠的理論依據(jù)。隨著科技的進(jìn)步,數(shù)據(jù)挖掘技術(shù)在疾病診療、藥物應(yīng)用,及醫(yī)療決策支持中的挖掘應(yīng)用范圍會(huì)越來(lái)越廣,數(shù)據(jù)挖掘分析平臺(tái)將衍生出更多面向具體問(wèn)題的分析子平臺(tái),從而能夠更好的為疾病診療帶來(lái)保障。
參考文獻(xiàn):
[1] 孫向東,黃曉琴,朱春倫,等. 基于循證醫(yī)學(xué)的海量醫(yī)學(xué)數(shù)據(jù)挖掘分析方法研究[J]. 醫(yī)學(xué)信息學(xué)雜志,2015,(3):11-16.
[2]邱宏,陳靜. 移動(dòng)平均趨勢(shì)法在醫(yī)院門(mén)診量動(dòng)態(tài)分析中的應(yīng)用[J].寧夏醫(yī)學(xué)雜志,2012,34(9):932-934.
[3]陳輝,周雄輝,朱燕,等. 移動(dòng)平均季節(jié)指數(shù)法在預(yù)測(cè)門(mén)診量和出院人數(shù)中的運(yùn)用[J]. 中國(guó)衛(wèi)生統(tǒng)計(jì),2012,29(2):312.編輯/金昊天