肖劍容
摘 要 近年來(lái),醫(yī)療影像系統(tǒng)在醫(yī)院的普及越來(lái)越廣泛,醫(yī)療影像數(shù)據(jù)日益豐富,已經(jīng)有了大量的數(shù)據(jù)支撐,如何高效迅速地在海量數(shù)據(jù)中選擇有助于病人治療和醫(yī)學(xué)發(fā)展的數(shù)據(jù)成為醫(yī)療領(lǐng)域所關(guān)注的焦點(diǎn)問題。本文主要從兩個(gè)方面探討數(shù)據(jù)挖掘技術(shù)在醫(yī)學(xué)影像信息系統(tǒng)中的應(yīng)用:在病患就診檢查項(xiàng)目方面使用關(guān)聯(lián)方規(guī)則算法,在醫(yī)院設(shè)備類型檢查量方面使用時(shí)序算法。
關(guān)鍵詞 數(shù)據(jù)挖掘技術(shù);醫(yī)學(xué)影像信息系統(tǒng);應(yīng)用
隨著科學(xué)技術(shù)的發(fā)展,醫(yī)學(xué)影像信息系統(tǒng)日益普及,收集了大量的數(shù)據(jù),但醫(yī)療領(lǐng)域?qū)@些數(shù)據(jù)的利用程度不夠高,缺乏對(duì)數(shù)據(jù)的深度挖掘和分析,數(shù)據(jù)挖掘技術(shù)的應(yīng)用,有效緩解了這一問題,實(shí)現(xiàn)了對(duì)數(shù)據(jù)的深度挖掘和分析。
1 關(guān)于數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘是一個(gè),先將大量的、片面的、嘈雜的、模糊的現(xiàn)實(shí)數(shù)據(jù)收集起來(lái),再將其中蘊(yùn)含、但我們并未發(fā)現(xiàn)的有價(jià)值、有意義的信息提取出來(lái)的過程。
1.1 數(shù)據(jù)挖掘的三階段
一般情況下,數(shù)據(jù)挖掘技術(shù)主要分為三個(gè)階段,分別為:準(zhǔn)備數(shù)據(jù)階段、挖掘數(shù)據(jù)階段、表達(dá)結(jié)果和分析解釋階段。在準(zhǔn)備數(shù)據(jù)階段,具體由三個(gè)部分組成,分別為:數(shù)據(jù)集成部分、數(shù)據(jù)選擇部分和數(shù)據(jù)預(yù)處理部分。挖掘數(shù)據(jù)階段四個(gè)部分,分別為:確定數(shù)據(jù)挖掘目標(biāo)部分、選擇挖掘工具部分、挖掘操作部分和證實(shí)發(fā)掘部分。表達(dá)結(jié)果和分析解釋階段的要求,不僅將數(shù)據(jù)挖掘的操作結(jié)果展示出來(lái),還將信息進(jìn)行進(jìn)一步的過濾,經(jīng)過再處理的數(shù)據(jù)信息如果沒有達(dá)到標(biāo)準(zhǔn),則需要重復(fù)過濾,直至得到滿意結(jié)果[1]。
1.2 數(shù)據(jù)挖掘的工具
數(shù)據(jù)挖掘需要有專業(yè)的工具進(jìn)行操作,通常數(shù)據(jù)挖掘技術(shù)有關(guān)聯(lián)規(guī)則分析技術(shù)、人工精神網(wǎng)絡(luò)技術(shù)、決策樹分析技術(shù)、時(shí)序分析技術(shù)、聚類分析技術(shù)等。本文著重分析醫(yī)學(xué)影像系統(tǒng)中的關(guān)聯(lián)規(guī)則分析和時(shí)序分析技術(shù)的應(yīng)用。
2 醫(yī)學(xué)影像信息系統(tǒng)
近年來(lái),醫(yī)學(xué)領(lǐng)域逐漸信息化,醫(yī)院里醫(yī)療影像信息系統(tǒng)的應(yīng)用和普及越來(lái)越廣泛,醫(yī)療影像信息系統(tǒng)包括醫(yī)學(xué)影像信息系統(tǒng)和醫(yī)學(xué)圖像存檔與傳輸系統(tǒng)兩部分。對(duì)于病患的登記、檢查、拍片、報(bào)告編審、科室管理等是由醫(yī)學(xué)影像信息系統(tǒng)負(fù)責(zé)的;醫(yī)學(xué)圖像的獲取、傳輸、存儲(chǔ)、顯示查看和圖像的管理是由醫(yī)學(xué)圖像存檔與傳輸系統(tǒng)負(fù)責(zé)的。
目前有一應(yīng)用醫(yī)療影像信息系統(tǒng)多年的三甲醫(yī)院已經(jīng)積累了一百多萬(wàn)條檢查記錄,五百多萬(wàn)條影像記錄,海量的信息數(shù)據(jù)積累是完成準(zhǔn)確、科學(xué)的數(shù)據(jù)挖掘的前提[2]。
3 有關(guān)檢查項(xiàng)目關(guān)聯(lián)分析
3.1 關(guān)聯(lián)規(guī)則算法
檢查項(xiàng)目關(guān)聯(lián)分析用到關(guān)聯(lián)規(guī)則算法,其方法是從提供的數(shù)據(jù)及數(shù)據(jù)庫(kù)中進(jìn)行篩選,將數(shù)據(jù)在數(shù)據(jù)庫(kù)中出現(xiàn)的品讀關(guān)系分析出來(lái),在海量數(shù)據(jù)中找出數(shù)據(jù)集之間有意義有價(jià)值的聯(lián)系。在進(jìn)行數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘時(shí),需要將數(shù)據(jù)資料庫(kù)中各個(gè)事件當(dāng)作數(shù)據(jù)項(xiàng),而將幾個(gè)數(shù)據(jù)項(xiàng)組成一個(gè)特定的事務(wù)項(xiàng)集。例如,病患就診在醫(yī)學(xué)影像數(shù)據(jù)庫(kù)中,所進(jìn)行檢查的每個(gè)項(xiàng)目就是它的數(shù)據(jù)項(xiàng)集。微軟數(shù)據(jù)分析服務(wù)的關(guān)聯(lián)規(guī)則算法,有兩個(gè)步驟構(gòu)成:首先是將每個(gè)支持度大于等于是想定義的最小支持度閾值的頻繁項(xiàng)集找出來(lái),然后將滿足最小置信度的強(qiáng)關(guān)聯(lián)規(guī)則由頻繁項(xiàng)集產(chǎn)生出來(lái)。
3.2 數(shù)據(jù)準(zhǔn)備
在數(shù)據(jù)準(zhǔn)備時(shí),需要將數(shù)據(jù)進(jìn)行處理,這是因?yàn)閿?shù)據(jù)使用年限久遠(yuǎn),在每次對(duì)數(shù)據(jù)的利用、維護(hù)、轉(zhuǎn)移時(shí)沒有進(jìn)行數(shù)據(jù)校驗(yàn),可能會(huì)導(dǎo)致數(shù)據(jù)出現(xiàn)差錯(cuò),而且影像信息系統(tǒng)軟件普及率增高,醫(yī)療領(lǐng)域的工作人員在進(jìn)行數(shù)據(jù)的錄入時(shí)可能會(huì)出現(xiàn)失誤導(dǎo)致數(shù)據(jù)出錯(cuò)。以上的客觀或主管的因素都有可能導(dǎo)致數(shù)據(jù)質(zhì)量低,數(shù)據(jù)重復(fù)、數(shù)據(jù)缺失、數(shù)據(jù)錯(cuò)誤。為了確保數(shù)據(jù)有較高的質(zhì)量,需要在數(shù)據(jù)準(zhǔn)備時(shí)進(jìn)行數(shù)據(jù)處理,還可以管理醫(yī)院的檢查項(xiàng)目,對(duì)檢查項(xiàng)目進(jìn)行統(tǒng)一規(guī)范的處理。
3.3 頻繁項(xiàng)集和關(guān)聯(lián)規(guī)則
挖掘頻繁項(xiàng)集是關(guān)聯(lián)規(guī)則算法的第一任務(wù)。病患的檢查項(xiàng)目眾多,得到有用的項(xiàng)集和規(guī)則需要將模型的處理時(shí)間降低。通過某醫(yī)院挖掘出來(lái)的頻繁項(xiàng)集可得知,住院病人所檢查的最多的單個(gè)項(xiàng)目是頭顱CT平掃和胸部CR,而腎臟、輸尿管、膀胱、前列腺的彩超和肝、膽、脾、胰的彩超是同時(shí)做得最多的項(xiàng)目。關(guān)聯(lián)規(guī)則分析可以將病患在醫(yī)院就診時(shí)所檢查的各個(gè)項(xiàng)目的關(guān)聯(lián)度進(jìn)行分析,在此基礎(chǔ)上,再根據(jù)病患的疾病分析,就能為醫(yī)院的臨床路徑管理提供基礎(chǔ)[3]。
4 設(shè)備檢查量預(yù)報(bào)
當(dāng)前醫(yī)院影像科的數(shù)字成像設(shè)備已經(jīng)很成熟,數(shù)據(jù)庫(kù)原始項(xiàng)目信息表通過醫(yī)學(xué)影像信息系統(tǒng)和醫(yī)學(xué)圖像存檔與傳輸系統(tǒng)生成后,將其中各個(gè)類型的設(shè)備的每月檢查量提取出來(lái),建立設(shè)備的月檢查表,為時(shí)序模型的建立提供依據(jù)和基礎(chǔ)。
5 醫(yī)療影像數(shù)據(jù)庫(kù)
建立醫(yī)療影像數(shù)據(jù)庫(kù),首先要通過醫(yī)學(xué)影像信息系統(tǒng)和醫(yī)學(xué)圖像存檔與傳輸系統(tǒng)中的數(shù)據(jù)進(jìn)行分析,再與醫(yī)院放射科的管理需求分析結(jié)合起來(lái),確定數(shù)據(jù)庫(kù)的主題后,就能初步將醫(yī)療影像數(shù)據(jù)庫(kù)建立。將實(shí)例系統(tǒng)完善后,可以加入可視化技術(shù)和多維數(shù)據(jù)分析技術(shù),對(duì)醫(yī)療影像數(shù)據(jù)結(jié)果進(jìn)行展示和分析。
6 結(jié)束語(yǔ)
醫(yī)院運(yùn)用數(shù)據(jù)挖掘技術(shù)到醫(yī)療影像信息系統(tǒng)中,對(duì)其多年內(nèi)積累的數(shù)據(jù)進(jìn)行分析處理,挖掘出其中有用信息,運(yùn)用關(guān)聯(lián)規(guī)則算法對(duì)醫(yī)院內(nèi)病患的檢查項(xiàng)目進(jìn)行分析,將成為醫(yī)院臨床路徑管理改革完善的基礎(chǔ)。數(shù)據(jù)挖掘技術(shù)中的時(shí)序算法也會(huì)在嘗試與探索中逐漸投入使用,對(duì)于醫(yī)院的數(shù)據(jù)信息建設(shè),需要我們從實(shí)際情況出發(fā),不斷的探索創(chuàng)新,提高醫(yī)院的數(shù)據(jù)管理水平,提高管理效率,減輕人工管理的工作量,為醫(yī)療事業(yè)做出貢獻(xiàn)。
參考文獻(xiàn)
[1] 肖革新.公共衛(wèi)生數(shù)據(jù)中心存儲(chǔ)系統(tǒng)設(shè)計(jì)思路與實(shí)踐討論[J].信息網(wǎng)絡(luò)安全,2012,(2):71-73.
[2] 母曉梨.區(qū)域醫(yī)療影像數(shù)據(jù)中心存儲(chǔ)系統(tǒng)研究與設(shè)計(jì)[J].中國(guó)數(shù)字醫(yī)學(xué),2010,5(1):57-59.
[3] 周琳.醫(yī)院臨床數(shù)據(jù)中心存儲(chǔ)系統(tǒng)構(gòu)建分析[J].中國(guó)數(shù)字醫(yī)學(xué),2012,(1):75-78.