馮麗蕓
摘要:用數(shù)據(jù)挖掘的方法來研究目前與日俱增的醫(yī)保數(shù)據(jù)在我國目前還不是很多,但已具備一定的研究成果。該文對數(shù)據(jù)挖掘在我國醫(yī)保領(lǐng)域的應(yīng)用進(jìn)行了總結(jié)概述,從關(guān)聯(lián)規(guī)則發(fā)現(xiàn)、數(shù)據(jù)聚類、分類知識(shí)發(fā)現(xiàn)、序列模式發(fā)現(xiàn)以及其他數(shù)據(jù)挖掘方法在醫(yī)保中的應(yīng)用幾方面進(jìn)行綜述,最后對數(shù)據(jù)挖掘在醫(yī)保領(lǐng)域的應(yīng)用做了展望。
關(guān)鍵詞:數(shù)據(jù)挖掘; 醫(yī)保;關(guān)聯(lián)規(guī)則;聚類;分類;序列模式
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2014)05-0880-03
Review of Data Mining Application in Medical Insurance in Our Country
FENG Li-yun
(Software College of Jiangxi Normal University, Nanchang 330022, China)
Abstract: Using data mining method to study the data of growing health care in our country is not a lot, but has a certain research. In this paper, the application of data mining in the field of health care are summarized from the association rules discovery, data clustering, classification knowledge discovery, sequential pattern discovery, and other data mining methods are reviewed in the Medicare application areas. Finally, look into the future of application of data mining in health care field.
Key words: data mining; Health care; Association rule; clustering; classification; sequence pattern
醫(yī)療保險(xiǎn)是我國社會(huì)保障制度的重要組成部分,是關(guān)系百姓切身利益的一項(xiàng)民生工程。醫(yī)療保險(xiǎn)自1998年開始在我國實(shí)施,經(jīng)過十多年的發(fā)展和不斷完善,目前大部分人民已經(jīng)可以享受醫(yī)療保險(xiǎn)的優(yōu)惠政策。隨著經(jīng)濟(jì)的發(fā)展及互聯(lián)網(wǎng)的普及,信息技術(shù)已經(jīng)逐步滲透到醫(yī)藥行業(yè)中,醫(yī)保信息系統(tǒng)的應(yīng)用就是醫(yī)藥信息化的一個(gè)典型。醫(yī)保信息化在給我國醫(yī)保政策的管理和實(shí)施帶來了很多便利的同時(shí),龐大的數(shù)據(jù)壓力也成為一個(gè)有待解決的問題。數(shù)據(jù)挖掘是一種從數(shù)據(jù)庫中抽取和識(shí)別出有效的、新穎的、可理解的、事先不為人知的但又潛在有用的模式或知識(shí)的過程或技術(shù),這種技術(shù)為我們的決策和管理帶來很多便利。近年來,關(guān)于數(shù)據(jù)挖掘技術(shù)在醫(yī)保信息系統(tǒng)中的研究運(yùn)用與日俱增,該文對這些研究從研究方法進(jìn)行了概括分析,介紹了數(shù)據(jù)挖掘在醫(yī)保行業(yè)的已有成果和具有代表性的方法,并對未來的發(fā)展作了展望。
1 關(guān)聯(lián)規(guī)則發(fā)現(xiàn)
Apriori算法是一種挖掘關(guān)聯(lián)規(guī)則的頻繁項(xiàng)集算法,其核心思想是通過候選集生成和情節(jié)的向下封閉檢測兩個(gè)階段來挖掘頻繁項(xiàng)集。算法已經(jīng)被廣泛的應(yīng)用到商業(yè)、網(wǎng)絡(luò)安全等各個(gè)領(lǐng)域。
文獻(xiàn)[3] 通過對醫(yī)院歷年醫(yī)保病人數(shù)據(jù)采用Apriori數(shù)據(jù)挖掘的方法,分析醫(yī)保費(fèi)用與相關(guān)因素間的規(guī)則,得出醫(yī)保費(fèi)用分析的規(guī)則集。該規(guī)則集顯示與醫(yī)保病人費(fèi)用關(guān)聯(lián)最大的是特定出院科室和住院天數(shù)這兩因素的組合。文獻(xiàn)[1]針對醫(yī)?;疬\(yùn)營過程中出現(xiàn)的就醫(yī)聚集行為,提出基于頻繁模式挖掘的一致行為挖掘算法CBM,實(shí)驗(yàn)表明該算法比Apriori和Eclat具有更好的性能,能有效檢測就醫(yī)聚集行為。文獻(xiàn)[2]對 Apriori 算法進(jìn)行的具有針對性的改進(jìn),將改進(jìn)的算法應(yīng)用于醫(yī)?;楣ぷ髦?, 挖掘算法產(chǎn)生的規(guī)則可使稽查人員重點(diǎn)稽查該規(guī)則所指向的醫(yī)保行為, 極大的提高了醫(yī)?;楣ぷ鞯男省N墨I(xiàn)[4]對社會(huì)醫(yī)療保險(xiǎn)基金收支情況進(jìn)行了研究,在建立數(shù)據(jù)倉庫時(shí)選用維度建模方法建立星型模型,重新組織了來源數(shù)據(jù)的
結(jié)構(gòu)關(guān)系;數(shù)據(jù)挖掘階段選用Apriori算法并對其進(jìn)行了改進(jìn),進(jìn)行關(guān)聯(lián)規(guī)則挖掘。文獻(xiàn)[7]在深入分析研究了經(jīng)典關(guān)聯(lián)規(guī)則Apriori算法的基礎(chǔ)上提出并實(shí)現(xiàn)了關(guān)聯(lián)規(guī)則生成算法,通過實(shí)驗(yàn)對Apriori經(jīng)典算法和關(guān)聯(lián)規(guī)則算法進(jìn)行了算法效率的分析比較。將改進(jìn)的關(guān)聯(lián)規(guī)則算法應(yīng)用于某礦業(yè)集團(tuán)的醫(yī)療保險(xiǎn)數(shù)據(jù)中,為礦業(yè)集團(tuán)完善醫(yī)療保險(xiǎn)制度提供了很好的輔助決策支持。文獻(xiàn)[27]針對OLAM兼有0LAP多維分析的靈活性、在線性和對數(shù)據(jù)挖掘的深入處理數(shù)據(jù)等特點(diǎn),在醫(yī)療保險(xiǎn)系統(tǒng)中設(shè)計(jì)并實(shí)現(xiàn)了OLAM應(yīng)用模型。該模型使用浙江省某市醫(yī)療保險(xiǎn)數(shù)據(jù)庫中2005年的醫(yī)保數(shù)據(jù),建立了以醫(yī)療保險(xiǎn)費(fèi)用和診斷項(xiàng)目為主題的數(shù)據(jù)倉庫,從多維角度分析數(shù)據(jù)倉庫中的數(shù)據(jù),并且運(yùn)用了Apriori算法挖掘出一些潛在的關(guān)聯(lián)規(guī)則例如人們特別關(guān)注的“騙?!毙袨椋瑸獒t(yī)療決策提供科學(xué)有效的依據(jù)。
FP的全稱是Frequent Pattern,在算法中使用了一種稱為頻繁模式樹(Frequent Pattern Tree)的數(shù)據(jù)結(jié)構(gòu)。FP-tree是一種特殊的前綴樹,由頻繁項(xiàng)頭表和項(xiàng)前綴樹構(gòu)成。FP-Growth算法基于以上的結(jié)構(gòu)加快整個(gè)挖掘過程。
文獻(xiàn)[8]將FP-growth算法用于基本醫(yī)療保險(xiǎn)數(shù)據(jù)的挖掘,根據(jù)課題特點(diǎn)提出了自動(dòng)確定最小支持度的增量式FP-growth挖掘算法,并用實(shí)驗(yàn)驗(yàn)證了改進(jìn)算法的有效性。文獻(xiàn)[5]通過對醫(yī)療保險(xiǎn)信息系統(tǒng)的數(shù)據(jù)倉庫的設(shè)計(jì)、數(shù)據(jù)的整合以及數(shù)據(jù)挖掘的技術(shù)分析,實(shí)證研究關(guān)聯(lián)規(guī)則挖掘算法在醫(yī)保信息挖掘的可能性與必要性。利用編碼、解碼技術(shù)和SQL的聚集函數(shù),實(shí)現(xiàn)基于SQL的FP-Growth算法,該算法突破機(jī)器內(nèi)存對數(shù)據(jù)挖掘的處理效率問題,實(shí)現(xiàn)了對海量數(shù)據(jù)挖掘的高效挖掘。
文獻(xiàn)[6]基于數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù),經(jīng)過大量重復(fù)的數(shù)據(jù)清洗工作,從醫(yī)院信息系統(tǒng)數(shù)據(jù)庫中抽取三個(gè)醫(yī)保年度的數(shù)據(jù),建立醫(yī)保費(fèi)用數(shù)據(jù)倉庫和相應(yīng)的多維數(shù)據(jù)模型。對建立的多維數(shù)據(jù)模型采用關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘算法進(jìn)行挖掘分析,得出結(jié)論
文獻(xiàn)[9]以廣州市某大型三甲醫(yī)院的信息系統(tǒng)為主要數(shù)據(jù)源,其后臺(tái)數(shù)據(jù)庫系統(tǒng)采用 SQL SERVER 2008。建立醫(yī)保費(fèi)用分析的數(shù)據(jù)倉庫,采用關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘算法進(jìn)行挖掘分析。
2 數(shù)據(jù)聚類
聚類就是將數(shù)據(jù)項(xiàng)分組成多個(gè)類或簇,類之間的數(shù)據(jù)差別應(yīng)盡可能大,類內(nèi)的數(shù)據(jù)差別應(yīng)盡可能小,即為“最小化類間的相似性,最大化類內(nèi)的相似性”原則。聚類算法有劃分法、層次法、基于密度、網(wǎng)格、模型的方法。其中,劃分聚類法比較有代表性,文獻(xiàn)[10]在分析了模糊數(shù)據(jù)挖掘的相關(guān)概念和技術(shù)的基礎(chǔ)上,使用模糊聚類方法進(jìn)行醫(yī)療保險(xiǎn)子系統(tǒng)的劃分,給出了劃分結(jié)果,并且將模糊數(shù)據(jù)挖掘應(yīng)用到醫(yī)療保險(xiǎn)系統(tǒng)中,是數(shù)據(jù)挖掘技術(shù)在醫(yī)療保險(xiǎn)領(lǐng)域應(yīng)用的一次嘗試;文獻(xiàn)[11]以貴陽市醫(yī)療保險(xiǎn)業(yè)務(wù)為背景,研究運(yùn)用 O-Cluster 算法,構(gòu)建數(shù)據(jù)挖掘模型并對模型進(jìn)行解釋,反映數(shù)據(jù)間隱含的聯(lián)系。文獻(xiàn)[17] 使用K-均值、K-中心點(diǎn)、Ward等幾種聚類算法分析了醫(yī)保評(píng)估模型,并對幾種聚類方法進(jìn)行了比較,實(shí)驗(yàn)證明Ward聚類算法成簇效果佳,用戶容易理解。文獻(xiàn)[14]分析了數(shù)據(jù)挖掘和模糊數(shù)據(jù)挖掘的相關(guān)概念和技術(shù),開發(fā)設(shè)計(jì)了B/S架構(gòu)的醫(yī)療保險(xiǎn)系統(tǒng),在此基礎(chǔ)上嘗試使用模糊數(shù)據(jù)挖掘技術(shù)進(jìn)行醫(yī)療保險(xiǎn)子系統(tǒng)的劃分,給出劃分結(jié)果。文獻(xiàn)[18]使用基于凝聚層次聚類(hierarchieal clustering)的ward方法、K-Means和K一中心點(diǎn)對醫(yī)保參保人進(jìn)行聚類,在此之后對得出的聚類模型從健康和經(jīng)濟(jì)狀況兩方面進(jìn)行了評(píng)估。
3 分類知識(shí)發(fā)現(xiàn)
分類就是構(gòu)造一個(gè)分類函數(shù),把具有某些特征的數(shù)據(jù)項(xiàng)映射到某個(gè)給定的類別上,分類方法可分為單一分類算法和組合單一分類算法。單一的分類方法主要包括:決策樹、貝葉斯、人工神經(jīng)網(wǎng)絡(luò)、K-近鄰、支持向量機(jī)和基于關(guān)聯(lián)規(guī)則的分類等;另外還有用于組合單一分類方法的集成學(xué)習(xí)算法,如Bagging和Boosting等。
主要的決策樹算法有ID3、C4.5(C5.0)、CART、PUBLIC、SLIQ和SPRINT算法等。它們在選擇測試屬性采用的技術(shù)、生成的決策樹的結(jié)構(gòu)、剪枝的方法以及時(shí)刻,能否處理大數(shù)據(jù)集等方面都有各自的不同之處。文獻(xiàn)[12]利用決策樹C4.5挖掘算法對醫(yī)療保險(xiǎn)系統(tǒng)數(shù)據(jù)進(jìn)行分析,找出影響就醫(yī)公平的關(guān)鍵因素,輔助決策者進(jìn)行政策參數(shù)的最優(yōu)化設(shè)置。通過數(shù)據(jù)準(zhǔn)備、歸納決策樹、決策樹剪枝、抽取規(guī)則等步驟得出住院費(fèi)用是決定人員就醫(yī)壓力的最重要因素。文獻(xiàn)[13]使用決策樹算法及SQL Server 2005中包含的一種混合的決策樹算法分析研究了某市的基本醫(yī)療保險(xiǎn)數(shù)據(jù)樣本,找出隱含的有效信息,并在此基礎(chǔ)上提出了完善基本醫(yī)療保險(xiǎn)的對策建議。文獻(xiàn)[32]使用決策樹、神經(jīng)網(wǎng)絡(luò)等分類算法分析了我國某市的數(shù)據(jù)挖掘樣本,以此作為醫(yī)療保險(xiǎn)監(jiān)管部門對各參保單位的賬戶進(jìn)行考察的依據(jù)。
4 序列模式發(fā)現(xiàn)
序列挖掘或稱序列模式挖掘,是指從序列數(shù)據(jù)庫中發(fā)現(xiàn)蘊(yùn)涵的序列模式。最早是由Agrawal等人提出的,它的最初動(dòng)機(jī)是針對帶有交易時(shí)間屬性的交易數(shù)據(jù)庫中發(fā)現(xiàn)頻繁項(xiàng)目序列一發(fā)現(xiàn)某一時(shí)間段內(nèi)客戶的購買活動(dòng)規(guī)律。
文獻(xiàn)[15]將序列模式挖掘算法與醫(yī)療保險(xiǎn)數(shù)據(jù)庫結(jié)合起來,將基于周期時(shí)間約束的序列模式挖掘算法應(yīng)用與醫(yī)療保險(xiǎn)數(shù)據(jù)庫中。在分析基于約束序列模式挖掘算法的基礎(chǔ)上,重點(diǎn)研究了基于時(shí)間粒度的挖掘算法PCSmine,并修改優(yōu)化了算法中的HP.CSB數(shù)據(jù)結(jié)構(gòu),使用neucleaning算法預(yù)處理醫(yī)療保險(xiǎn)數(shù)據(jù)庫,實(shí)驗(yàn)表明算法提高運(yùn)行效率。文獻(xiàn)[16]首先利用數(shù)據(jù)抽取、轉(zhuǎn)換及裝載工具獲取有效數(shù)據(jù),通過建立多維模型,運(yùn)用數(shù)據(jù)分析和數(shù)據(jù)挖掘方法生成各種報(bào)表及圖形,建立了智能醫(yī)院醫(yī)保業(yè)務(wù)決策支持系統(tǒng)架構(gòu)和數(shù)據(jù)倉庫模型。文中使用解放軍第309醫(yī)院2007、2008和2009三個(gè)年度的各科室月度醫(yī)保病人總費(fèi)用來預(yù)測2010年1月的科室醫(yī)保病人總費(fèi)用。采用SQL Server 2008中的時(shí)序分析方法來進(jìn)行數(shù)據(jù)挖掘。SQL Server 2008 Analysis Services中的時(shí)間序列分析使用的算法是決策樹算法的特例。在文獻(xiàn)[17] 采用自動(dòng)回歸整合移動(dòng)平均ARIMA(AtoRegression Integrated Moving Average)模型,建立醫(yī)保結(jié)算費(fèi)用預(yù)測模型,實(shí)現(xiàn)對醫(yī)保結(jié)算總費(fèi)用的預(yù)測,并能詳細(xì)到各區(qū)縣、各級(jí)別醫(yī)院醫(yī)保結(jié)算費(fèi)用的預(yù)測,為醫(yī)?;鸨O(jiān)管提供方向。文獻(xiàn)[32]應(yīng)用了幾種數(shù)據(jù)挖掘的算法分析了我國某市的數(shù)據(jù)挖掘樣本,使用時(shí)序算法對各參保單位的賬戶使用情況進(jìn)行回歸以及預(yù)測,以此作為醫(yī)療保險(xiǎn)監(jiān)管部門對各參保單位的賬戶進(jìn)行考察的依據(jù)。
5 其他應(yīng)用
以下為數(shù)據(jù)挖掘在社會(huì)醫(yī)保方面的一些研究及應(yīng)用。一般結(jié)合數(shù)據(jù)倉庫,一并分析。
文獻(xiàn)[19]基于動(dòng)態(tài)數(shù)據(jù)倉庫和SOA技術(shù),利用數(shù)據(jù)挖掘分析技術(shù),針對影響基金管理中的主要環(huán)節(jié)和基金運(yùn)行中的風(fēng)險(xiǎn)的主要因素,建立醫(yī)保基金風(fēng)險(xiǎn)防控基礎(chǔ)技術(shù)平臺(tái),對防范和化解基金風(fēng)險(xiǎn)起到支撐作用。
文獻(xiàn)[20]基于一個(gè)醫(yī)?;痫L(fēng)險(xiǎn)防控平臺(tái)數(shù)據(jù)倉庫的構(gòu)建過程,提出一套適應(yīng)該平臺(tái)變化需求的元數(shù)據(jù)管理解決方案,分別從數(shù)據(jù)源層、數(shù)據(jù)倉庫、分析應(yīng)用層、ETL過程幾方面對元數(shù)據(jù)進(jìn)行了分析,探討了其中元數(shù)據(jù)集成方案和管理功能的設(shè)計(jì)。
文獻(xiàn)[21]試著應(yīng)用數(shù)據(jù)挖掘技術(shù)發(fā)現(xiàn)醫(yī)保系統(tǒng)中有用的模式和規(guī)則構(gòu)建現(xiàn)代醫(yī)院信息平臺(tái)。經(jīng)過數(shù)據(jù)預(yù)處理、數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘、評(píng)估所得到的模式模型知識(shí)、發(fā)現(xiàn)知識(shí)的鞏固與運(yùn)用等過程構(gòu)建了基于數(shù)據(jù)挖掘技術(shù)的現(xiàn)代醫(yī)院信息平臺(tái)。
文獻(xiàn)[22]首先闡述了在醫(yī)療保險(xiǎn)管理上面臨的一些問題,針對這些問題采用數(shù)據(jù)倉庫(DW)與數(shù)據(jù)挖掘(DM)技術(shù),對醫(yī)保系統(tǒng)、HIS 系統(tǒng)歷史的、現(xiàn)在的數(shù)據(jù)進(jìn)行過濾、整合、存儲(chǔ)以分析使用病提出了相應(yīng)的實(shí)施方法。
文獻(xiàn)[23]從采集醫(yī)療保險(xiǎn)數(shù)據(jù)信息、建設(shè)數(shù)據(jù)倉庫、以及最后的開發(fā)和利用三方面進(jìn)行闡述,探討在醫(yī)療保險(xiǎn)管理中數(shù)據(jù)信息的價(jià)值和功能,以及在計(jì)算機(jī)系統(tǒng)建設(shè)過程中應(yīng)注意的問題,旨在為醫(yī)療保險(xiǎn)計(jì)算機(jī)管理系統(tǒng)的建設(shè)提供參考意見。
文獻(xiàn)[24]用powerbuilder開發(fā)工具的分布式對象實(shí)現(xiàn)三層結(jié)構(gòu)式的醫(yī)保數(shù)據(jù)傳輸;定點(diǎn)醫(yī)療機(jī)構(gòu)的客戶端通過互聯(lián)網(wǎng)訪問應(yīng)用服務(wù)器上的數(shù)據(jù)傳輸服務(wù)端,醫(yī)保數(shù)據(jù)庫服務(wù)器設(shè)置為不能訪問互聯(lián)網(wǎng),也不能被互聯(lián)網(wǎng)訪問。應(yīng)用三層結(jié)構(gòu)式可以安全地傳輸醫(yī)保數(shù)據(jù)。
文獻(xiàn)[25]利用商業(yè)智能工具實(shí)時(shí)提取數(shù)據(jù),并建立分析模型及各種分析統(tǒng)計(jì)結(jié)果的圖形和報(bào)表。 首先是對醫(yī)保數(shù)據(jù)進(jìn)行預(yù)處理,使醫(yī)保數(shù)據(jù)屬性更完整;然后,利用商業(yè)智能系統(tǒng)的ETL功能對數(shù)據(jù)進(jìn)行清洗并對原醫(yī)保中心導(dǎo)出來的數(shù)據(jù)與南方醫(yī)院原HIS 系統(tǒng)導(dǎo)出來的相關(guān)數(shù)據(jù),進(jìn)行自動(dòng)的配備、核算和查找;最后,再次用商業(yè)智能系統(tǒng)對上面形成的患者數(shù)據(jù)建模分析。此系統(tǒng)實(shí)現(xiàn)了對醫(yī)保中心數(shù)據(jù)和醫(yī)院數(shù)據(jù)庫數(shù)據(jù)的自動(dòng)化的抽取、匹配,并對醫(yī)保收入和工作量、醫(yī)保患者費(fèi)用等進(jìn)行了多維度、多角度的靈活統(tǒng)計(jì)和分析。
文獻(xiàn)[26]通過對醫(yī)療保險(xiǎn)系統(tǒng)數(shù)據(jù)的分析,建立相應(yīng)的數(shù)據(jù)模型,為醫(yī)療保險(xiǎn)系統(tǒng)提供決策支持依據(jù)。通過數(shù)據(jù)挖掘方法為醫(yī)療保險(xiǎn)系統(tǒng)建立了數(shù)據(jù)倉庫,利用單因素方差分析方法進(jìn)行數(shù)據(jù)結(jié)構(gòu)設(shè)計(jì),并對其進(jìn)行分析和研究。這里以醫(yī)院的綜合實(shí)力作為方差分析的因素,即影響住院費(fèi)用的因素。
文獻(xiàn)[28]社會(huì)醫(yī)療保險(xiǎn)是社會(huì)保險(xiǎn)中最復(fù)雜的一個(gè)險(xiǎn)種,醫(yī)療保險(xiǎn)資金管理的一個(gè)關(guān)鍵因素就是在個(gè)人、單位繳納金額和個(gè)人享受保險(xiǎn)待遇的設(shè)定之間構(gòu)建一種平衡。數(shù)據(jù)挖掘是信息社會(huì)廣泛應(yīng)用的一門技術(shù),我國醫(yī)療保險(xiǎn)正處在改革的過程中,利用數(shù)據(jù)挖掘的分類技術(shù)對醫(yī)療保險(xiǎn)的數(shù)據(jù)進(jìn)行分析處理,能夠更好的把握醫(yī)療改革的方向,為醫(yī)療保險(xiǎn)的決策提供科學(xué)有效的依據(jù)。
文獻(xiàn)[33]以美國 Ox International 公司的醫(yī)療保險(xiǎn)業(yè)務(wù)為背景,在已開發(fā)的信息系統(tǒng)基礎(chǔ)上,提出了面向分析的數(shù)據(jù)倉庫與數(shù)據(jù)挖掘的解決方案。該方案從決策角度出發(fā),建立多維數(shù)據(jù)模型,將系統(tǒng)中的歷史數(shù)據(jù)加以處理,并有組織的存放到數(shù)據(jù)倉庫中。在此基礎(chǔ)上,利用OLAP 和數(shù)據(jù)挖掘技術(shù),對數(shù)據(jù)倉庫中的數(shù)據(jù)進(jìn)行各種復(fù)雜分析。文件[29]亦是。
文獻(xiàn)[30]首先描述了數(shù)據(jù)挖掘可用于醫(yī)療保險(xiǎn)行業(yè)的關(guān)鍵技術(shù)現(xiàn)狀,其次闡述了數(shù)據(jù)挖掘技術(shù)在醫(yī)療保險(xiǎn)行業(yè)中應(yīng)用的國內(nèi)外現(xiàn)狀和基于數(shù)據(jù)挖掘的決策支持系統(tǒng)研究現(xiàn)狀,最后進(jìn)行了總結(jié),討論和分析了在的醫(yī)療保險(xiǎn)信息系統(tǒng)中應(yīng)用數(shù)據(jù)挖掘技術(shù)的工作重點(diǎn)。
文獻(xiàn)[31]以貴陽市社會(huì)保障局醫(yī)療保險(xiǎn)業(yè)務(wù)數(shù)據(jù)中城鎮(zhèn)居民統(tǒng)籌基金支付情況為目標(biāo),利用聚類分析法,通過搭建oracle 數(shù)據(jù)倉庫平臺(tái),并在此平臺(tái)上進(jìn)行主題數(shù)據(jù)倉庫構(gòu)建與設(shè)計(jì),進(jìn)行聯(lián)機(jī)分析得出城鎮(zhèn)居民統(tǒng)籌基金支付情況。
除了以上的研究,目前國內(nèi)還有些學(xué)者從數(shù)據(jù)挖掘的技術(shù)角度對醫(yī)保管理信息系統(tǒng)進(jìn)行了實(shí)施,主要用到的技術(shù)有ETL、數(shù)據(jù)倉庫、OLAP等。
6 總結(jié)與展望
本文對數(shù)據(jù)挖掘技術(shù)在社會(huì)醫(yī)保方面的應(yīng)用進(jìn)行了分析和總結(jié),分為關(guān)聯(lián)規(guī)則發(fā)現(xiàn)、數(shù)據(jù)聚類、分類知識(shí)發(fā)現(xiàn)、序列模式發(fā)現(xiàn)以及數(shù)據(jù)挖掘在醫(yī)保中的應(yīng)用幾方面。
在醫(yī)保領(lǐng)域中數(shù)據(jù)挖掘技術(shù)的研究和應(yīng)用主要包括數(shù)據(jù)挖掘技術(shù)與領(lǐng)域知識(shí)的結(jié)合和算法設(shè)計(jì)與改進(jìn)兩個(gè)主要方面。隨著醫(yī)保基金風(fēng)險(xiǎn)防控的需求的不斷更新,可以發(fā)現(xiàn)更多的數(shù)據(jù)挖掘應(yīng)用場景,將數(shù)據(jù)挖掘技術(shù)更廣泛地應(yīng)用到醫(yī)保領(lǐng)域中。目前就診序列模式挖掘基于相似度的等長序列模式,可以研究擴(kuò)展到不等長模式的挖掘;此外可以進(jìn)一步提高一致行為模式挖掘的效率。
參考文獻(xiàn):
[1] 何俊華,張靜誼,熊赟,朱揚(yáng)勇.醫(yī)保就醫(yī)聚集行為挖掘[J].計(jì)算機(jī)應(yīng)用與軟件,2011,28(7).
[2] 劉凱,趙躍龍.關(guān)聯(lián)規(guī)則挖掘在醫(yī)?;橹械膽?yīng)用研究[J].科技信息,2007(33).
[3] 黃晶晶.數(shù)據(jù)挖掘技術(shù)在醫(yī)院醫(yī)保費(fèi)用分析中的研究與應(yīng)用[D].廣州:南方醫(yī)科大學(xué),2009.
[4] 石萌.數(shù)據(jù)挖掘在醫(yī)療保險(xiǎn)參保人員老齡化問題中的研究[D].貴州:貴州財(cái)經(jīng)學(xué)院,2010.
[5] 簡偉光.數(shù)據(jù)整合與數(shù)據(jù)挖掘技術(shù)在醫(yī)療保險(xiǎn)信息系統(tǒng)的研究與應(yīng)用[J].實(shí)踐與經(jīng)驗(yàn),2010.
[6] 朱彥華.醫(yī)保人群醫(yī)療費(fèi)用的數(shù)據(jù)挖掘與分析[D].廣州:華南理工大學(xué),2012.
[7] 梁愛琴.數(shù)據(jù)挖掘關(guān)聯(lián)算法在醫(yī)保系統(tǒng)中的應(yīng)用[D].北京:北京工業(yè)大學(xué),2008.
[8] 劉江超.數(shù)據(jù)挖掘算法在醫(yī)保數(shù)據(jù)上的應(yīng)用研究[D].湖南:國防科學(xué)技術(shù)大學(xué),2009.
[9] 朱彥華.醫(yī)保人群醫(yī)療費(fèi)用的數(shù)據(jù)挖掘與分析[D].廣東:華南理工大學(xué),2012.
[10] 王艷春,秦剛,陳毓.數(shù)據(jù)挖掘在醫(yī)保系統(tǒng)中的應(yīng)用[J].長春理工大學(xué)學(xué)報(bào),2007,30(2).
[11] 李納.社會(huì)保障體系中醫(yī)療保險(xiǎn)的數(shù)據(jù)挖掘與聯(lián)機(jī)分析研究[D].貴州:貴州財(cái)經(jīng)學(xué)院,2011.
[12] 張婧,王書海.C4.5算法在醫(yī)療保險(xiǎn)數(shù)據(jù)挖掘中的應(yīng)用研究[J].石家莊鐵道學(xué)院學(xué)報(bào)(自然科學(xué)版),2008,21(2). (下轉(zhuǎn)第901頁)
(上接第882頁)
[13] 李冉冉,盧仿先.決策樹算法在基本醫(yī)療保險(xiǎn)中的應(yīng)用研究[J].企業(yè)技術(shù)開發(fā),2008,27(5).
[14] 秦剛.數(shù)據(jù)挖掘在醫(yī)保系統(tǒng)中的應(yīng)用[D].吉林:長春理工大學(xué),2006.
[15] 常帥.序列模式挖掘在醫(yī)療保險(xiǎn)上的應(yīng)用[D].河南:鄭州大學(xué),2011.
[16] 林濟(jì)南.基于商務(wù)智能的醫(yī)院醫(yī)保業(yè)務(wù)決策支持系統(tǒng)的研究[J].計(jì)算機(jī)與現(xiàn)代化,2009,9.
[17] 高臻耀,張敬誼,林志杰,熊斌,朱揚(yáng)勇.一個(gè)醫(yī)?;痫L(fēng)險(xiǎn)防控平臺(tái)中的數(shù)據(jù)挖掘技術(shù)[J].計(jì)算機(jī)應(yīng)用與軟件,2011,28(8).
[18] 何俊華.數(shù)據(jù)挖掘技術(shù)在醫(yī)保領(lǐng)域中的研究與應(yīng)用[D].上海:復(fù)旦大學(xué),2011.
[19] 秦德霖,高震耀.面向服務(wù)的上海醫(yī)?;痫L(fēng)險(xiǎn)防控平臺(tái)的研究[J].計(jì)算機(jī)應(yīng)用與軟件,2011,28(4).
[20] 王月,王偉俊,童慶,熊赟,朱揚(yáng)勇.一個(gè)醫(yī)保數(shù)據(jù)倉庫的元數(shù)據(jù)管理解決方案[J].計(jì)算機(jī)應(yīng)用與軟件,2011,28(8).
[21] 王順民.構(gòu)建基于數(shù)據(jù)挖掘技術(shù)的現(xiàn)代醫(yī)院信息平臺(tái)[J].制造業(yè)自動(dòng)化,2011,33(3).
[22] 張勇,趙峻,于冬.淺談醫(yī)保系統(tǒng)與醫(yī)院信息系統(tǒng)的數(shù)據(jù)挖掘[J].科學(xué)管理,2012,27(7).
[23] 王愛榮.淺析醫(yī)療保險(xiǎn)數(shù)據(jù)信息的采集、開發(fā)和利用[J].中國衛(wèi)生經(jīng)濟(jì),2004,23(1).
[24] 韋振錦,方華,成春艷.三層結(jié)構(gòu)在醫(yī)保數(shù)據(jù)傳輸中的應(yīng)用[J].廣西科學(xué)院學(xué)報(bào),2007,23(4).
[25] 嚴(yán)靜東,張才明.依托商業(yè)智能系統(tǒng)的醫(yī)院醫(yī)保費(fèi)用分析[J].醫(yī)院數(shù)字化,2009,30(4).
[26] 王春才,韓貴東,楊玉東,李英韜,張羽醫(yī).保數(shù)據(jù)倉庫的單因素方差分析與應(yīng)用[J].長春理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2007,30(4).
[27] 張良燕,龔衛(wèi)華,黃德才,劉端陽.OLAM技術(shù)在醫(yī)療保險(xiǎn)系統(tǒng)中的應(yīng)用研究[J].2007,35(5).
[28] 石萌.分類模型在社會(huì)醫(yī)療保險(xiǎn)中的應(yīng)用研究[J].科技與生活,2010,3.
[29] 董韌毅.基于數(shù)據(jù)倉庫的醫(yī)療保險(xiǎn)信息決策支持系統(tǒng)研究[D].江蘇:南京航空航天大學(xué),2008.
[30] 萬芳.論數(shù)據(jù)挖掘在醫(yī)療保險(xiǎn)決策支持中的應(yīng)用[J].科技創(chuàng)業(yè)家,2011.
[31] 張莎莎,李偉.數(shù)據(jù)挖掘在城鎮(zhèn)醫(yī)保中的應(yīng)用[J].電腦知識(shí)與技術(shù),2013,8.
[32] 李冉冉.數(shù)據(jù)挖掘在我國城鎮(zhèn)基本醫(yī)療保險(xiǎn)中的應(yīng)用研究[D].湖南:湖南大學(xué),2008.
[33] 向春.醫(yī)療保險(xiǎn)信息系統(tǒng)的數(shù)據(jù)倉庫與數(shù)據(jù)挖掘研究[D].江蘇:南京航空航天大學(xué),2007.