吳恒亮 于本海 翟宇翔 張巍巍
【摘要】隨著社會(huì)醫(yī)療保險(xiǎn)數(shù)據(jù)量的急劇增長和復(fù)雜程度的不斷提高,搭建大數(shù)據(jù)分析平臺(tái),借助大數(shù)據(jù)創(chuàng)新審計(jì)技術(shù)和方法、轉(zhuǎn)變審計(jì)模式已是當(dāng)務(wù)之急。在梳理現(xiàn)有研究的基礎(chǔ)上,結(jié)合湖北等地區(qū)的實(shí)踐情況,以醫(yī)療保險(xiǎn)審計(jì)為例,從技術(shù)、管理和模型等三個(gè)維度提出了“自上而下”的大數(shù)據(jù)審計(jì)建設(shè)實(shí)施路徑,包括大數(shù)據(jù)文化建設(shè)、總體規(guī)劃、團(tuán)隊(duì)組建、平臺(tái)搭建、流程設(shè)計(jì)以及難題突破等五個(gè)方面,旨在為各地區(qū)開展醫(yī)保大數(shù)據(jù)審計(jì)工作提供參考。
【關(guān)鍵詞】大數(shù)據(jù);醫(yī)保審計(jì);實(shí)施路徑;大數(shù)據(jù)審計(jì)平臺(tái)
【中圖分類號(hào)】F239【文獻(xiàn)標(biāo)識(shí)碼】A【文章編號(hào)】1004-0994(2019)24-0105-6
【基金項(xiàng)目】國家自然科學(xué)基金項(xiàng)目(項(xiàng)目編號(hào):71974131);教育部人文社會(huì)科學(xué)研究青年基金項(xiàng)目(項(xiàng)目編號(hào):18YJC630196);山東省社會(huì)科學(xué)規(guī)劃研究項(xiàng)目(項(xiàng)目編號(hào):18CKJJ04);山東工商學(xué)院財(cái)富管理特色建設(shè)項(xiàng)目(項(xiàng)目編號(hào):2019ZBKY016)
一、引言
據(jù)人社部統(tǒng)計(jì),截至目前,我國醫(yī)保參保人數(shù)超過13億人,參保覆蓋率已達(dá)到95%以上,每年醫(yī)保基金收入超過1萬億元。但醫(yī)保詐騙案件卻層出不窮,造成了醫(yī)?;鸬木薮髶p失。審計(jì)署在2017年醫(yī)保基金的專項(xiàng)審計(jì)工作中,共發(fā)現(xiàn)欺詐、違法和違規(guī)問題金額超過15億元,約占抽查資金總金額的0.46%。研究醫(yī)保欺詐審計(jì)問題,關(guān)系到我國社會(huì)醫(yī)療保險(xiǎn)制度能否持續(xù)、健康地發(fā)展,具有重要的經(jīng)濟(jì)價(jià)值和現(xiàn)實(shí)意義。
在傳統(tǒng)計(jì)算機(jī)醫(yī)保審計(jì)模式下,主要采用SQL數(shù)據(jù)庫查詢技術(shù)來獲取醫(yī)保欺詐線索,僅限于對(duì)結(jié)構(gòu)化醫(yī)保數(shù)據(jù)的處理和分析[1]。隨著醫(yī)保覆蓋面的不斷擴(kuò)大,醫(yī)保數(shù)據(jù)呈現(xiàn)出規(guī)模大、多樣化、異構(gòu)性、高價(jià)值和低密度等大數(shù)據(jù)特征,對(duì)醫(yī)保審計(jì)數(shù)據(jù)的采集、存儲(chǔ)、分析和處理等工作提出了巨大挑戰(zhàn)。同時(shí),國內(nèi)人口流動(dòng)日益頻繁,居民異地就醫(yī)需求增長迅速,跨省、跨市醫(yī)保就醫(yī)結(jié)算正逐步推行。如果仍以市或縣級(jí)為單位,采用“各自為政”“單兵作戰(zhàn)”的組織模式進(jìn)行審計(jì),勢(shì)必造成大量醫(yī)保欺詐行為被漏審,影響審計(jì)質(zhì)量和監(jiān)督效果。面對(duì)海量、多源、異質(zhì)的醫(yī)保數(shù)據(jù),為突破傳統(tǒng)審計(jì)技術(shù)瓶頸,克服傳統(tǒng)抽樣、離散、“單兵作戰(zhàn)”審計(jì)模式帶來的局限性和缺陷,緩解審計(jì)任務(wù)繁重和力量不足之間的矛盾,審計(jì)機(jī)關(guān)只能通過引入新技術(shù)、創(chuàng)新審計(jì)方法、轉(zhuǎn)變審計(jì)模式來化解當(dāng)前遇到的困境。
二、文獻(xiàn)綜述
(一)醫(yī)保欺詐識(shí)別方法研究
醫(yī)保欺詐識(shí)別是開展醫(yī)保審計(jì)工作的關(guān)鍵和重點(diǎn)。國外對(duì)醫(yī)保欺詐識(shí)別問題的研究起步較早,實(shí)證研究較多,主要采用統(tǒng)計(jì)分析、數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)等方法,如神經(jīng)網(wǎng)絡(luò)[2]、邏輯回歸[3]、主成分分析[4]、貝葉斯[5]、聚類分析[6]、關(guān)聯(lián)規(guī)則[7]、支持向量機(jī)[8]、異常檢測(cè)[9]等。國內(nèi)文獻(xiàn)定性研究較多,主要集中在欺詐類型、欺詐原因分析及防范對(duì)策等方面[10]。近年來,國內(nèi)一些學(xué)者開始利用統(tǒng)計(jì)模型、數(shù)據(jù)挖掘等技術(shù)進(jìn)行實(shí)證研究。史徑宇等[11]通過引入指標(biāo)權(quán)重改進(jìn)聚類分析算法,采用無監(jiān)督學(xué)習(xí)方法實(shí)現(xiàn)了醫(yī)保欺詐識(shí)別;邱瑞[12]采用頻繁模式挖掘算法對(duì)醫(yī)保騙保行為進(jìn)行了模式挖掘;陳清鳳等[13]將主成分分析、K-Means聚類方法和判別分析等三種方法相結(jié)合建立了醫(yī)保欺詐識(shí)別模型。
(二)大數(shù)據(jù)環(huán)境下的醫(yī)保審計(jì)研究
國外政府和學(xué)者對(duì)大數(shù)據(jù)環(huán)境下醫(yī)保等領(lǐng)域的政府審計(jì)研究多側(cè)重于大數(shù)據(jù)審計(jì)的具體操作層面,包括大數(shù)據(jù)環(huán)境下的審計(jì)模型、審計(jì)安全、主要制約因素及解決方法等方面[14]。英國、美國、挪威等國家在審計(jì)實(shí)務(wù)中已經(jīng)廣泛應(yīng)用數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等技術(shù)和工具[15]。
相比而言,國內(nèi)學(xué)者對(duì)醫(yī)保等領(lǐng)域的大數(shù)據(jù)審計(jì)研究更偏重于理論,如必要性和挑戰(zhàn)性[16]、模式轉(zhuǎn)變[17]、政策建議[18]等,指導(dǎo)大數(shù)據(jù)審計(jì)實(shí)踐的研究相對(duì)較少。劉國城、王會(huì)金[15]指出,未來的研究應(yīng)基于“數(shù)據(jù)科學(xué)”和“工程學(xué)”視角,從技術(shù)層面開展大數(shù)據(jù)在審計(jì)中的應(yīng)用研究;鄭偉等[19]從大數(shù)據(jù)審計(jì)的邏輯流程以及大數(shù)據(jù)平臺(tái)的網(wǎng)絡(luò)架構(gòu)和應(yīng)用架構(gòu)等方面探討了在大數(shù)據(jù)環(huán)境下進(jìn)行數(shù)據(jù)式審計(jì)的操作路徑;陳偉、居江寧[1]基于大數(shù)據(jù)可視化技術(shù)對(duì)醫(yī)院藥品加成問題進(jìn)行了挖掘分析??偟膩砜矗瑖鴥?nèi)學(xué)術(shù)界有關(guān)醫(yī)保等領(lǐng)域的大數(shù)據(jù)審計(jì)研究,無論在內(nèi)容深度還是廣度上都有待進(jìn)一步提高。
從我國醫(yī)保等領(lǐng)域的大數(shù)據(jù)審計(jì)實(shí)踐來看,大數(shù)據(jù)技術(shù)在政府審計(jì)中的應(yīng)用尚處于起步和探索階段,缺乏成熟的大數(shù)據(jù)審計(jì)技術(shù)方案和可借鑒的經(jīng)驗(yàn),只有部分地區(qū)的審計(jì)機(jī)關(guān)真正開啟了大數(shù)據(jù)審計(jì)的探索和建設(shè)工作,在醫(yī)保領(lǐng)域開展大數(shù)據(jù)審計(jì)工作的地區(qū)更少。
本文依據(jù)大數(shù)據(jù)審計(jì)在其他領(lǐng)域應(yīng)用的經(jīng)驗(yàn)和教訓(xùn),結(jié)合湖北、山東、天津、河南、河北、江蘇、浙江等地區(qū)在醫(yī)保等領(lǐng)域的大數(shù)據(jù)審計(jì)實(shí)踐情況,從技術(shù)、管理和模型三個(gè)維度,提出了“自上而下”的醫(yī)保大數(shù)據(jù)審計(jì)建設(shè)實(shí)施路徑,包括大數(shù)據(jù)文化建設(shè)、總體規(guī)劃、團(tuán)隊(duì)組建、平臺(tái)搭建、流程設(shè)計(jì)以及難題突破等五個(gè)方面,梳理總結(jié)了部分省市的優(yōu)秀做法,并針對(duì)各省市存在的問題提出了合理化建議,以期對(duì)各地區(qū)審計(jì)機(jī)關(guān)開展醫(yī)保大數(shù)據(jù)審計(jì)工作提供指導(dǎo)和參考。
三、實(shí)施醫(yī)保大數(shù)據(jù)審計(jì)的路徑分析和建議
(一)建設(shè)大數(shù)據(jù)審計(jì)文化,做好實(shí)施醫(yī)保大數(shù)據(jù)審計(jì)的思想準(zhǔn)備
大數(shù)據(jù)審計(jì)文化建設(shè)就是要在整個(gè)審計(jì)機(jī)關(guān)建立一種“用大數(shù)據(jù)說話、用大數(shù)據(jù)管理以及用大數(shù)據(jù)決策”的價(jià)值觀和制度體系,讓大數(shù)據(jù)成為開展各項(xiàng)審計(jì)工作的基礎(chǔ)。
建設(shè)大數(shù)據(jù)審計(jì)文化,要擺脫傳統(tǒng)醫(yī)保審計(jì)思維桎梏,轉(zhuǎn)變審計(jì)理念,將大數(shù)據(jù)思維和理念引入審計(jì)機(jī)關(guān),不斷提高醫(yī)保審計(jì)人員的整體素質(zhì)。一方面,應(yīng)定期組織專家講座、培訓(xùn)、經(jīng)驗(yàn)交流會(huì)等活動(dòng),從領(lǐng)導(dǎo)層到每一個(gè)基層審計(jì)人員,全面提高其對(duì)醫(yī)保大數(shù)據(jù)審計(jì)的認(rèn)識(shí),將大數(shù)據(jù)思維融入審計(jì)機(jī)關(guān)文化建設(shè)中。另一方面,應(yīng)設(shè)立專項(xiàng)基金,鼓勵(lì)醫(yī)保審計(jì)人員利用大數(shù)據(jù)搞“科研”,對(duì)優(yōu)秀項(xiàng)目給予資金、人員、數(shù)據(jù)和政策等方面的支持,營造良好的大數(shù)據(jù)審計(jì)氛圍。在具體醫(yī)保審計(jì)項(xiàng)目中,應(yīng)鼓勵(lì)審計(jì)人員積極運(yùn)用大數(shù)據(jù)分析技術(shù)開展醫(yī)保審計(jì)工作,通過項(xiàng)目實(shí)踐不斷積累成功經(jīng)驗(yàn)。
(二)注重頂層設(shè)計(jì),統(tǒng)一編制包括醫(yī)保在內(nèi)的大數(shù)據(jù)審計(jì)平臺(tái)建設(shè)總體規(guī)劃
目前,我國政府審計(jì)機(jī)關(guān)審計(jì)職責(zé)范圍廣泛,涉及財(cái)政、地稅、社保、醫(yī)保等多個(gè)專業(yè)領(lǐng)域,醫(yī)保審計(jì)僅是其監(jiān)督職責(zé)之一。雖然不同專業(yè)審計(jì)在內(nèi)容、方法等方面存在一些差異,但在計(jì)劃制定、方案實(shí)施、組織管理等活動(dòng)上具有相似性和一致性。如果大數(shù)據(jù)審計(jì)建設(shè)不做總體規(guī)劃,只考慮在醫(yī)保或其他單個(gè)專業(yè)領(lǐng)域內(nèi),或者只在市或縣級(jí)范圍內(nèi)實(shí)施,勢(shì)必造成“信息孤島”現(xiàn)象,破壞審計(jì)業(yè)務(wù)的系統(tǒng)性和整體性,也會(huì)出現(xiàn)重復(fù)投資建設(shè)、系統(tǒng)擴(kuò)展難和集成難等問題。從實(shí)踐調(diào)查來看,多數(shù)省市審計(jì)機(jī)關(guān)能夠意識(shí)到總體規(guī)劃的必要性,但有些地區(qū)審計(jì)機(jī)關(guān)對(duì)于如何開展總體規(guī)劃并不清楚,有些則急于在大數(shù)據(jù)審計(jì)方面實(shí)現(xiàn)單點(diǎn)突破而使規(guī)劃流于形式,甚至還有不少地級(jí)市、縣級(jí)審計(jì)機(jī)關(guān)正著手或已開展市縣級(jí)大數(shù)據(jù)審計(jì)平臺(tái)建設(shè)工作,而只有少數(shù)幾個(gè)省市能從全省角度出發(fā),制定真正意義上的大數(shù)據(jù)審計(jì)總體規(guī)劃。
綜上所述,審計(jì)機(jī)關(guān)在實(shí)施大數(shù)據(jù)審計(jì)之前,應(yīng)該站在全局的高度,從全省審計(jì)總體業(yè)務(wù)出發(fā),做好頂層設(shè)計(jì),制定全省統(tǒng)一的大數(shù)據(jù)審計(jì)平臺(tái)建設(shè)總體規(guī)劃,建立全省統(tǒng)一的大數(shù)據(jù)審計(jì)平臺(tái)。湖北省審計(jì)廳在“金審二期”工程的基礎(chǔ)上,構(gòu)建了如圖1所示的大數(shù)據(jù)審計(jì)平臺(tái)應(yīng)用系統(tǒng)架構(gòu)[20]。從系統(tǒng)功能來看,架構(gòu)中的系統(tǒng)可以分為兩類:一是審計(jì)管理方面的系統(tǒng),二是不同專業(yè)領(lǐng)域的審計(jì)分析系統(tǒng)??偟膩砜?,該架構(gòu)遵循了系統(tǒng)獨(dú)立性設(shè)計(jì)的原則,既能保證各個(gè)子系統(tǒng)的相對(duì)獨(dú)立,又能保證各個(gè)子系統(tǒng)通過共享數(shù)據(jù)實(shí)現(xiàn)互聯(lián)互通,從而形成一個(gè)有機(jī)整體,這樣可以大大提高平臺(tái)的靈活性和可變性,對(duì)構(gòu)建和實(shí)施省市縣三級(jí)審計(jì)機(jī)關(guān)協(xié)同審計(jì)組織模式[17],實(shí)現(xiàn)審計(jì)工作的統(tǒng)一監(jiān)管和調(diào)控提供了技術(shù)支撐和保障。
(三)組建醫(yī)保審計(jì)大數(shù)據(jù)分析團(tuán)隊(duì)
1.成立專門的醫(yī)保審計(jì)大數(shù)據(jù)分析部門。在大數(shù)據(jù)環(huán)境下,醫(yī)保審計(jì)工作模式的變化必然要求審計(jì)機(jī)關(guān)對(duì)組織結(jié)構(gòu)做出適應(yīng)性的改變和調(diào)整。審計(jì)機(jī)關(guān)需要成立一個(gè)專門的醫(yī)保審計(jì)大數(shù)據(jù)分析部門,主要由數(shù)據(jù)管理員、數(shù)據(jù)分析建模師和業(yè)務(wù)數(shù)據(jù)分析師等組成,負(fù)責(zé)數(shù)據(jù)采集、整理、清理以及分析模型構(gòu)建等工作,通過集中分析、篩選疑點(diǎn),為審計(jì)計(jì)劃制定、實(shí)施方案組織等提供重要依據(jù)。數(shù)據(jù)分析建模師由擁有大數(shù)據(jù)分析技術(shù)和經(jīng)驗(yàn)的人員擔(dān)任,業(yè)務(wù)數(shù)據(jù)分析師是指具有豐富醫(yī)保審計(jì)經(jīng)驗(yàn)的業(yè)務(wù)人員。構(gòu)建模型以數(shù)據(jù)分析建模師為主導(dǎo),業(yè)務(wù)數(shù)據(jù)分析師給予業(yè)務(wù)支持。
2.為醫(yī)保審計(jì)項(xiàng)目小組設(shè)置大數(shù)據(jù)分析員角色。在傳統(tǒng)的醫(yī)保審計(jì)工作模式下,為完成某項(xiàng)審計(jì)計(jì)劃安排的審計(jì)任務(wù),需要成立審計(jì)項(xiàng)目小組,包括組長、主審和組員等角色。在大數(shù)據(jù)審計(jì)模式下,雖然對(duì)“總體分析”發(fā)現(xiàn)的疑點(diǎn)可以進(jìn)行“分散核查”,但也同樣需要成立審計(jì)項(xiàng)目小組,且在該項(xiàng)目組中需要增設(shè)大數(shù)據(jù)分析員角色,專門負(fù)責(zé)審計(jì)項(xiàng)目的數(shù)據(jù)現(xiàn)場(chǎng)采集、清理、存儲(chǔ)、模型應(yīng)用以及結(jié)果分析等相關(guān)工作。
(四)做好技術(shù)選型,搭建醫(yī)保大數(shù)據(jù)審計(jì)技術(shù)基礎(chǔ)平臺(tái)
大數(shù)據(jù)平臺(tái)建設(shè)是實(shí)施醫(yī)保大數(shù)據(jù)審計(jì)的基礎(chǔ),選擇和搭建一個(gè)適合自己的醫(yī)保大數(shù)據(jù)平臺(tái)對(duì)審計(jì)機(jī)關(guān)來說至關(guān)重要,技術(shù)選型失敗會(huì)大大增加項(xiàng)目實(shí)施風(fēng)險(xiǎn)。調(diào)查發(fā)現(xiàn),目前各省市審計(jì)機(jī)關(guān)由于缺乏大數(shù)據(jù)技術(shù)知識(shí)、經(jīng)驗(yàn)和相關(guān)人才,在建設(shè)方式、技術(shù)選擇和產(chǎn)品選型等方面存在諸多誤區(qū),比如認(rèn)為利用傳統(tǒng)的數(shù)據(jù)庫系統(tǒng)即可建立大數(shù)據(jù)平臺(tái),將Hadoop技術(shù)等同于大數(shù)據(jù)平臺(tái),盲目迷信大數(shù)據(jù)能力及服務(wù)商大數(shù)據(jù)產(chǎn)品性能等。
首先,審計(jì)機(jī)關(guān)應(yīng)該確定如何搭建醫(yī)保大數(shù)據(jù)平臺(tái),即采取何種建設(shè)方式。目前,我國企業(yè)進(jìn)行大數(shù)據(jù)平臺(tái)建設(shè)主要采取三種方式,即本地自建大數(shù)據(jù)平臺(tái)、使用云服務(wù)商提供的大數(shù)據(jù)服務(wù)以及購買大數(shù)據(jù)集成產(chǎn)品等。從各地區(qū)審計(jì)機(jī)關(guān)調(diào)查來看,多數(shù)省市選擇采用第一種方式,相對(duì)而言,該種方式對(duì)技術(shù)人才的要求較高,實(shí)施難度較大,成本也較高,但從長遠(yuǎn)來看,平臺(tái)的靈活性、兼容性、擴(kuò)展性、經(jīng)濟(jì)性以及維護(hù)性等更加理想。部分省市采取折中方案,即在原有平臺(tái)的基礎(chǔ)上擴(kuò)展大數(shù)據(jù)分析功能來構(gòu)建大數(shù)據(jù)審計(jì)平臺(tái),如天津市審計(jì)局在2017年采取公開招標(biāo)的方式,為其聯(lián)網(wǎng)審計(jì)監(jiān)督平臺(tái)(“一張網(wǎng)”管理系統(tǒng))采購數(shù)據(jù)分析服務(wù)。該種方式是否適合還要看原有基礎(chǔ)平臺(tái)是否采用大數(shù)據(jù)技術(shù)或具備大數(shù)據(jù)采集、存儲(chǔ)和處理能力,否則只是權(quán)宜之計(jì),非長久之策。
其次,審計(jì)機(jī)關(guān)需要從自己的實(shí)際情況出發(fā),選擇適合自己的技術(shù)路徑。由于醫(yī)保大數(shù)據(jù)平臺(tái)承擔(dān)著從醫(yī)保數(shù)據(jù)采集、存儲(chǔ)、分析到可視化等各項(xiàng)處理任務(wù),就目前來看,單純依靠某項(xiàng)技術(shù)或某個(gè)產(chǎn)品是不現(xiàn)實(shí)的,需要綜合不同的大數(shù)據(jù)技術(shù)和產(chǎn)品,構(gòu)建一個(gè)完善的大數(shù)據(jù)生態(tài)系統(tǒng)。而且,不同技術(shù)或產(chǎn)品由于側(cè)重點(diǎn)不同,在功能和性能上都存在著一些差異,需要進(jìn)行區(qū)分和篩選。
審計(jì)機(jī)關(guān)在技術(shù)選型時(shí)需要做好以下兩方面的工作:一是對(duì)自身的信息化現(xiàn)狀、數(shù)據(jù)情況、大數(shù)據(jù)應(yīng)用的業(yè)務(wù)場(chǎng)景、技術(shù)力量等方面進(jìn)行全方位的梳理和評(píng)估,找準(zhǔn)自己的需求定位。一般來說,數(shù)據(jù)源的特點(diǎn)、數(shù)據(jù)采集方式和數(shù)據(jù)分析的應(yīng)用場(chǎng)景等幾個(gè)方面基本決定了醫(yī)保大數(shù)據(jù)平臺(tái)的技術(shù)選型。二是根據(jù)定義的功能和性能需求進(jìn)行技術(shù)選型或產(chǎn)品選型,全面評(píng)估待選大數(shù)據(jù)技術(shù)或產(chǎn)品是否滿足自己的功能需求,是否滿足醫(yī)保大數(shù)據(jù)審計(jì)所規(guī)定的技術(shù)指標(biāo)要求,如可靠性、擴(kuò)展性、高效性、容錯(cuò)性、開源性、安全性、易用性、數(shù)據(jù)挖掘能力、R和Python語言的支持能力等。
(五)設(shè)計(jì)醫(yī)保大數(shù)據(jù)審計(jì)流程
大數(shù)據(jù)環(huán)境下,醫(yī)保審計(jì)技術(shù)、方法和模式的轉(zhuǎn)變,必然帶來審計(jì)流程的變化。因此,需要做好大數(shù)據(jù)環(huán)境下醫(yī)保審計(jì)流程的設(shè)計(jì)工作。醫(yī)保大數(shù)據(jù)分析主要包括數(shù)據(jù)采集與清理、數(shù)據(jù)存儲(chǔ)與管理、算法選擇與設(shè)計(jì)、構(gòu)建分析模型、欺詐分析、檢查結(jié)果可視化和欺詐決策等環(huán)節(jié),如圖2所示。
1.數(shù)據(jù)采集與清理。這一環(huán)節(jié)是整個(gè)流程的起點(diǎn),要明確數(shù)據(jù)來源,積極拓寬數(shù)據(jù)采集范圍,廣泛運(yùn)用大數(shù)據(jù)抽取與集成技術(shù),通過多種采集方式來獲取醫(yī)保數(shù)據(jù)。采集的原始數(shù)據(jù)往往是“臟數(shù)據(jù)”“亂數(shù)據(jù)”,必須經(jīng)過數(shù)據(jù)清洗、數(shù)據(jù)變換和數(shù)據(jù)集成等清理環(huán)節(jié),以滿足大數(shù)據(jù)分析技術(shù)和算法對(duì)數(shù)據(jù)的要求。
2.數(shù)據(jù)存儲(chǔ)與管理。對(duì)經(jīng)過預(yù)處理的醫(yī)保數(shù)據(jù),根據(jù)數(shù)據(jù)規(guī)模、結(jié)構(gòu)類型以及訪問的實(shí)效性等特點(diǎn),分別選擇適合的大數(shù)據(jù)存儲(chǔ)與管理技術(shù)工具(如分布式文件系統(tǒng)HDFS、分布式數(shù)據(jù)庫MPP、非關(guān)系型數(shù)據(jù)庫NoSQL等)予以存儲(chǔ)。
3.算法選擇與設(shè)計(jì)及模型構(gòu)建。醫(yī)保欺詐行為種類繁多,檢測(cè)方法各不相同。數(shù)據(jù)分析建模師需要根據(jù)不同欺詐行為的外在表現(xiàn)和特征,選擇適合的數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)方法和算法以構(gòu)建模型,然后通過模型評(píng)估、參數(shù)調(diào)整以獲取最優(yōu)的分析模型。
4.欺詐分析。業(yè)務(wù)數(shù)據(jù)分析師(即醫(yī)保審計(jì)業(yè)務(wù)人員)使用欺詐分析模型完成具體的欺詐檢測(cè)工作,并將發(fā)現(xiàn)的疑點(diǎn)提交人工復(fù)核。
5.檢測(cè)結(jié)果可視化及欺詐決策。使用大數(shù)據(jù)可視化技術(shù),將模型分析結(jié)果以圖形方式展示給業(yè)務(wù)數(shù)據(jù)分析師和首席數(shù)據(jù)官,進(jìn)而達(dá)到欺詐決策支持的目的。
(六)突破醫(yī)保大數(shù)據(jù)審計(jì)難題
在醫(yī)保大數(shù)據(jù)審計(jì)流程中,數(shù)據(jù)采集和分析模型構(gòu)建是最為關(guān)鍵、最為困難的兩個(gè)環(huán)節(jié),下面重點(diǎn)對(duì)這兩個(gè)問題進(jìn)行闡述。
1.破解醫(yī)保大數(shù)據(jù)審計(jì)“數(shù)據(jù)采集”難題。
(1)醫(yī)保數(shù)據(jù)來源。醫(yī)保數(shù)據(jù)涉及參保人信息、基金運(yùn)行管理數(shù)據(jù)、參保人在醫(yī)院、藥店以及基層醫(yī)療機(jī)構(gòu)接受醫(yī)療服務(wù)時(shí)所產(chǎn)生的各種信息,如患者病歷檔案、住院信息、處方信息、檢查項(xiàng)目和購藥信息等,還包括藥企、藥店進(jìn)銷數(shù)據(jù)、社保、民政、工商、公安以及從互聯(lián)網(wǎng)上獲取的數(shù)據(jù)等。其中,醫(yī)院、藥店、醫(yī)保機(jī)構(gòu)、藥企以及基層醫(yī)療機(jī)構(gòu)等信息系統(tǒng)是醫(yī)保大數(shù)據(jù)審計(jì)的主要數(shù)據(jù)來源。當(dāng)前,由于我國醫(yī)保長時(shí)間的城鄉(xiāng)割裂,醫(yī)保管理存在以統(tǒng)籌區(qū)域(多數(shù)是縣級(jí))為單位、各自獨(dú)立以及所采用的信息系統(tǒng)技術(shù)不一致等問題,醫(yī)保數(shù)據(jù)表現(xiàn)出多源、標(biāo)準(zhǔn)不統(tǒng)一、數(shù)據(jù)量大、數(shù)據(jù)質(zhì)量低等特點(diǎn),給醫(yī)保審計(jì)數(shù)據(jù)采集和清理工作帶來很大的困難。
(2)數(shù)據(jù)采集方式。目前,審計(jì)機(jī)關(guān)主要采取由被審計(jì)單位手工報(bào)送數(shù)據(jù)的方式進(jìn)行數(shù)據(jù)采集,存在不報(bào)送、報(bào)送不及時(shí)、報(bào)送不全面、數(shù)據(jù)質(zhì)量低等問題,對(duì)拓展醫(yī)保審計(jì)廣度和深度,提升醫(yī)保審計(jì)監(jiān)督質(zhì)量和效率造成了嚴(yán)重的負(fù)面影響。在大數(shù)據(jù)環(huán)境下,必須堅(jiān)持“數(shù)據(jù)先行”原則,采取定期報(bào)送、按需收集和在審計(jì)中收集等多種數(shù)據(jù)收集方式,積極做好醫(yī)保數(shù)據(jù)采集工作。一方面要加強(qiáng)對(duì)被審計(jì)單位報(bào)送數(shù)據(jù)的督導(dǎo)工作,對(duì)不按規(guī)定報(bào)送數(shù)據(jù)的單位要及時(shí)反饋、協(xié)調(diào)解決。例如,山東省審計(jì)廳專門制定了定期報(bào)送數(shù)據(jù)的規(guī)章制度,對(duì)數(shù)據(jù)報(bào)送中出現(xiàn)的問題及時(shí)反饋給當(dāng)?shù)仡I(lǐng)導(dǎo),或向省政府報(bào)告,將其納入重點(diǎn)審計(jì)整改范圍,逐步破解了“數(shù)據(jù)報(bào)送難”問題[21]。另一方面,開發(fā)與被審計(jì)單位信息系統(tǒng)的數(shù)據(jù)接口,利用計(jì)算機(jī)平臺(tái)直接從被審計(jì)單位采集或采取上傳的方式收集原始的醫(yī)保審計(jì)數(shù)據(jù),提高數(shù)據(jù)采集效率和質(zhì)量,保證數(shù)據(jù)的真實(shí)性,防止“假賬真審”。
(3)數(shù)據(jù)清理問題。可以利用數(shù)據(jù)分析、數(shù)據(jù)挖掘等技術(shù)和工具進(jìn)行醫(yī)保數(shù)據(jù)整理、清理和標(biāo)準(zhǔn)化工作,克服數(shù)據(jù)不準(zhǔn)確、不一致以及數(shù)據(jù)缺失等帶來的弊端。例如,湖北省審計(jì)廳采用文本挖掘和分詞技術(shù),基于醫(yī)學(xué)詞匯包,將1700多家醫(yī)院對(duì)“床位費(fèi)”的2300多種不同表達(dá)方式,全部轉(zhuǎn)換成“床位費(fèi)”[22]。又如,山東省審計(jì)廳從該省衛(wèi)計(jì)委及其所屬單位采集的醫(yī)保數(shù)據(jù),由于來源眾多,涉及340多個(gè)不同版本、不同結(jié)構(gòu)的信息系統(tǒng),為此該廳專門成立了一支“破譯團(tuán)隊(duì)”,按照編碼規(guī)則編寫數(shù)據(jù)轉(zhuǎn)換腳本,對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理形成醫(yī)保標(biāo)準(zhǔn)數(shù)據(jù)表[21]。
2.破解醫(yī)保大數(shù)據(jù)審計(jì)“數(shù)據(jù)分析”難題。
(1)分析模型是醫(yī)保審計(jì)大數(shù)據(jù)平臺(tái)的核心組件和引擎。不同專業(yè)審計(jì)由于在審計(jì)目標(biāo)、內(nèi)容和數(shù)據(jù)等方面存在較大差異,審計(jì)方法必然會(huì)有所不同,細(xì)化不同專業(yè)領(lǐng)域的審計(jì)分析模型將是未來研究的重點(diǎn)[16]。在醫(yī)保領(lǐng)域,傳統(tǒng)審計(jì)模式下主要是構(gòu)建查詢分析模型,隨著云計(jì)算、大數(shù)據(jù)和人工智能技術(shù)的不斷發(fā)展,工業(yè)界、學(xué)術(shù)界提出了許多適合大數(shù)據(jù)環(huán)境的醫(yī)保審計(jì)建模方法,可以對(duì)醫(yī)保數(shù)據(jù)進(jìn)行深度挖掘和分析,實(shí)現(xiàn)查詢型向挖掘型分析方法的轉(zhuǎn)變,如下表所示。但是,由于種種原因,這些方法和技術(shù)多數(shù)還停留在學(xué)術(shù)研究和實(shí)驗(yàn)階段。
調(diào)查發(fā)現(xiàn),目前很多地區(qū)審計(jì)機(jī)關(guān)對(duì)醫(yī)保審計(jì)大數(shù)據(jù)分析存在認(rèn)識(shí)不清、認(rèn)識(shí)不到位的問題。第一,有些省市仍然停留在傳統(tǒng)的數(shù)據(jù)分析思維上,有些甚至將查詢分析型審計(jì)誤認(rèn)為是大數(shù)據(jù)分析審計(jì)。第二,大多數(shù)省市所采取的大數(shù)據(jù)分析技術(shù)比較單一,應(yīng)用最多的技術(shù)是數(shù)據(jù)關(guān)聯(lián)比對(duì)分析,但其本質(zhì)仍是SQL數(shù)據(jù)庫查詢技術(shù),只不過建立在大數(shù)據(jù)分析平臺(tái)基礎(chǔ)之上,采用分布式數(shù)據(jù)存儲(chǔ)和檢索技術(shù),使其吞吐量、執(zhí)行效率和查詢范圍有了比較大的提升。第三,應(yīng)用數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)等大數(shù)據(jù)分析技術(shù)的案例還比較少,其中湖北、山東等地區(qū)在醫(yī)保大數(shù)據(jù)審計(jì)建模方面積極探索、大膽嘗試,已經(jīng)取得了一定成效。例如,湖北省審計(jì)廳在醫(yī)保大數(shù)據(jù)審計(jì)中,利用大數(shù)據(jù)分析工具R-Studio和聚類分析方法,從1700多家醫(yī)院中鎖定了7家治療項(xiàng)目總費(fèi)用明顯異常的醫(yī)院,作為審計(jì)疑點(diǎn)和線索[22]??偟膩砜矗壳拔覈ㄡt(yī)保在內(nèi)的各種專業(yè)審計(jì)所采用的分析技術(shù)手段還非常有限,遠(yuǎn)遠(yuǎn)沒有發(fā)揮出大數(shù)據(jù)分析技術(shù)的作用。因此,大數(shù)據(jù)分析模型的構(gòu)建和應(yīng)用,將是未來各個(gè)審計(jì)機(jī)關(guān)研究的重點(diǎn)和急需攻破的難題。
(2)破解“數(shù)據(jù)分析”難題的關(guān)鍵是大數(shù)據(jù)分析人才的培養(yǎng)。當(dāng)前,很多審計(jì)機(jī)關(guān)已經(jīng)積累了大量的醫(yī)保數(shù)據(jù),部分省市也建立了大數(shù)據(jù)基礎(chǔ)平臺(tái),但大數(shù)據(jù)分析人才嚴(yán)重缺乏,分析團(tuán)隊(duì)組建都是基于現(xiàn)有計(jì)算機(jī)人員和審計(jì)業(yè)務(wù)骨干,這些人員并不具備大數(shù)據(jù)分析所需要的技能和素質(zhì),已成為制約其持續(xù)發(fā)展的重要瓶頸。因此,加大大數(shù)據(jù)分析人才的培養(yǎng)力度,快速高效地培養(yǎng)醫(yī)保大數(shù)據(jù)審計(jì)所需要的各類人才,是審計(jì)機(jī)關(guān)開展醫(yī)保大數(shù)據(jù)審計(jì)工作的當(dāng)務(wù)之急和長遠(yuǎn)發(fā)展之策。
目前,獲取醫(yī)保大數(shù)據(jù)審計(jì)分析人才的途徑主要有以下幾種:①依靠人才引進(jìn)。近年來,我國大數(shù)據(jù)市場(chǎng)規(guī)模增長迅速,大數(shù)據(jù)人才缺口非常大,供需矛盾非常突出。顯然,通過人才引進(jìn)來獲得經(jīng)驗(yàn)豐富的大數(shù)據(jù)分析人才還是比較困難的。②培訓(xùn)現(xiàn)有的計(jì)算機(jī)和醫(yī)保審計(jì)業(yè)務(wù)人員。與傳統(tǒng)數(shù)據(jù)分析相比,大數(shù)據(jù)分析需要掌握的知識(shí)和技術(shù)更加寬泛,涉及數(shù)學(xué)、計(jì)算機(jī)、統(tǒng)計(jì)分析、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)以及自然語言處理等多個(gè)領(lǐng)域的綜合知識(shí),學(xué)習(xí)門檻較高,需要投入大量的學(xué)習(xí)時(shí)間,并不斷積累實(shí)踐經(jīng)驗(yàn)。因此,在短時(shí)間內(nèi)通過技術(shù)培訓(xùn)提升醫(yī)保審計(jì)人員大數(shù)據(jù)分析能力也不太現(xiàn)實(shí)。③加強(qiáng)與國內(nèi)高校和科研機(jī)構(gòu)的合作。高校和科研機(jī)構(gòu)具有人才和技術(shù)優(yōu)勢(shì),湖北省審計(jì)廳能在短時(shí)間內(nèi)取得醫(yī)保大數(shù)據(jù)審計(jì)建模方面的突破,主要是源于該廳與武漢大學(xué)計(jì)算機(jī)學(xué)院開展了大數(shù)據(jù)技術(shù)合作[20]。因此,審計(jì)機(jī)關(guān)必須走出去,積極尋求和開展技術(shù)合作,這是審計(jì)機(jī)關(guān)短時(shí)間內(nèi)提升醫(yī)保大數(shù)據(jù)分析建模能力,實(shí)現(xiàn)快速起步的有效途徑。當(dāng)然,從長遠(yuǎn)發(fā)展來看,前兩種人才培養(yǎng)方式也必須同時(shí)推進(jìn),缺一不可。
四、結(jié)語
在云計(jì)算、大數(shù)據(jù)、人工智能等技術(shù)不斷發(fā)展和進(jìn)步的今天,基于數(shù)據(jù)挖掘和人工智能的大數(shù)據(jù)分析技術(shù)必將成為提高醫(yī)保審計(jì)質(zhì)量和效能的重要驅(qū)動(dòng)力。因此,探索大數(shù)據(jù)環(huán)境下的醫(yī)保審計(jì)新模式、新技術(shù)和新方法,是我國各級(jí)審計(jì)機(jī)關(guān)和學(xué)術(shù)界亟須研究的重要課題。本文在文獻(xiàn)梳理和對(duì)各省市大數(shù)據(jù)審計(jì)實(shí)踐調(diào)查的基礎(chǔ)上,針對(duì)醫(yī)保審計(jì)目前存在的問題和難題,提出了指導(dǎo)審計(jì)機(jī)關(guān)進(jìn)行醫(yī)保大數(shù)據(jù)審計(jì)的基本思路,以期在學(xué)術(shù)界和審計(jì)機(jī)關(guān)的共同努力下,讓醫(yī)保大數(shù)據(jù)審計(jì)在各級(jí)審計(jì)機(jī)關(guān)中早日落地,從而破解傳統(tǒng)醫(yī)保審計(jì)模式和方法在大數(shù)據(jù)環(huán)境下面臨的困境和難題。
主要參考文獻(xiàn):
[1]陳偉,居江寧.基于大數(shù)據(jù)可視化技術(shù)的審計(jì)線索特征挖掘方法研究[J].審計(jì)研究,2018(1):16~21.
[2] He H.,Wang J.,Graco W.,et al. Application of neural networks to detection of medical fraud[J].Expert Systems with Applications,1997(4):329~336.
[3] Liou F. M.,Tang Y. C.,Chen J. Y. Detecting hospital fraud and claim abuse through diabetic outpatient services[J].Health Care Management Science,2008(4):353~358.
[4] Brockett P. L.,Derrig R. A.,Golden L. L.,et al. Fraud classification using principal component analysis of RIDITs[J].Journal of Risk & Insurance,2010(3):341~371.
[5]Bayerstadler A.,Van Dijk L.,Winter F. Bayesian multinomial latent variable modeling for fraud and abuse detection in health insurance[J].Insurance:Mathematics and Economics,2016(71):244~252.
[6] Hillerman T.,Souza J. C. F.,Reis A. C. B.,et al. Applying clustering and AHP methods for evaluating suspect healthcare claims[J].Journal of Computational Science,2017(19):97~111.
[7] Verma A.,Taneja A.,Arora A. Fraud detection and frequent pattern matching in insurance claims using data mining techniques:Tenth International Conference on Contemporary Computing[C]. IEEE Computer Society,2017.
[8] Kirlidog M.,Asuk C. A fraud detection approach with data mining in health insurance[J].ProcediaSocial and Behavioral Sciences,2012(62):989~994.
[9] Van Capelleveen G.,Poel M.,Mueller R. M.,et al. Outlier detection in healthcare fraud:A case study in the medicaid dental domain[J].Inter? national Journal of Accounting Information Sys? tems,2016(21):18~31.
[10]林源.國內(nèi)外醫(yī)療保險(xiǎn)欺詐研究現(xiàn)狀分析[J].保險(xiǎn)研究,2010(12):115~122.
[11]史徑宇,冉松靈,李晨萍.醫(yī)保欺詐行為的主動(dòng)發(fā)現(xiàn)——基于引進(jìn)指標(biāo)權(quán)重的聚類分析算法[J].數(shù)學(xué)建模及其應(yīng)用,2016(1):54~59.
[12]邱瑞.基于頻繁模式挖掘算法的醫(yī)保欺詐預(yù)警研究[J].產(chǎn)業(yè)與科技論壇,2017(17):62~64.
[13]陳清鳳,朱寧,朱畝鑫.大數(shù)據(jù)下醫(yī)保欺詐的有效識(shí)別模型[J].汕頭大學(xué)學(xué)報(bào)(自然科學(xué)版),2018(1):40~48.
[14] Alles M.,Gray G. L. Incorporating big data in audits:Identifying inhibitors and a research agenda to address those inhibitors[J].International Journal of Accounting Information Systems,2016(22):44~59.
[15]劉國城,王會(huì)金.大數(shù)據(jù)審計(jì)平臺(tái)構(gòu)建研究[J].審計(jì)研究,2017(6):36~41.
[16]陳偉,SMIELIAUSKAS Wally.大數(shù)據(jù)環(huán)境下的電子數(shù)據(jù)審計(jì):機(jī)遇、挑戰(zhàn)與方法[J].計(jì)算機(jī)科學(xué),2016(1):8~13.
[17]魏祥健.大數(shù)據(jù)環(huán)境下政府審計(jì)模式轉(zhuǎn)變[J].財(cái)會(huì)月刊,2016(22):64~67.
[18]劉夢(mèng)溪.基于大數(shù)據(jù)的天津市預(yù)算執(zhí)行審計(jì)探索與實(shí)踐[J].審計(jì)研究,2018(1):22~27.
[19]鄭偉,張立民,楊莉.試析大數(shù)據(jù)環(huán)境下的數(shù)據(jù)式審計(jì)模式[J].審計(jì)研究,2016(4):20~27.
[20]劉明亮,周剛,劉燕.揚(yáng)起大數(shù)據(jù)風(fēng)帆走好信息化之路——湖北省審計(jì)廳探索大數(shù)據(jù)審計(jì)紀(jì)實(shí)[J].中國審計(jì),2015(5):11~20.
[21]王松寶,孟翔燕.山東:強(qiáng)化審計(jì)質(zhì)量控制的探索與實(shí)踐[J].中國審計(jì),2017(11):15~20.
[22]湖北省審計(jì)學(xué)會(huì)課題組,陳智斌等.大數(shù)據(jù)技術(shù)在審計(jì)全覆蓋中的應(yīng)用研究——以湖北省醫(yī)保審計(jì)實(shí)踐為例[J].審計(jì)研究,2018(1):11~15.
作者單位:1.山東工商學(xué)院管理科學(xué)與工程學(xué)院,山東煙臺(tái)264005;2.遼寧工程技術(shù)大學(xué)工商管理學(xué)院,遼寧葫蘆島125105;3.上海應(yīng)用技術(shù)大學(xué)經(jīng)濟(jì)與管理學(xué)院,上海201418;4.煙臺(tái)市審計(jì)局,山東煙臺(tái)264000