王光偉,鄔華瓊,蘇莉民(.重慶市長(zhǎng)壽區(qū)人民醫(yī)院,重慶 400;.重慶市墊江縣中醫(yī)院,重慶 40800;.重慶市人民醫(yī)院,重慶 40000)
Benford定律審計(jì)分析方法及應(yīng)用思考
王光偉1,鄔華瓊2,蘇莉民3
(1.重慶市長(zhǎng)壽區(qū)人民醫(yī)院,重慶 401220;2.重慶市墊江縣中醫(yī)院,重慶 408300;3.重慶市人民醫(yī)院,重慶400020)
計(jì)算機(jī)輔助審計(jì)的數(shù)據(jù)分析技術(shù)主要是依據(jù)數(shù)據(jù)分析模型進(jìn)行,本文重點(diǎn)對(duì)數(shù)值分析方法中的Benford定律,以SQL數(shù)據(jù)庫(kù)技術(shù)和Excel函數(shù)運(yùn)用介紹了計(jì)算機(jī)輔助審計(jì)的數(shù)據(jù)分析技術(shù)模型,并以某醫(yī)院2015年業(yè)務(wù)收入數(shù)據(jù)首位數(shù)字分布情況及與Benford定律分布進(jìn)行了對(duì)比分析,最后對(duì)Benford定律審計(jì)分析方法的運(yùn)用進(jìn)行分析討論。
計(jì)算機(jī)輔助審計(jì);數(shù)據(jù)分析;審計(jì)技術(shù)模型;方法運(yùn)用
計(jì)算機(jī)輔助審計(jì)的數(shù)據(jù)分析技術(shù)(CAATs)主要是依據(jù)數(shù)據(jù)分析模型進(jìn)行,面向數(shù)據(jù)的計(jì)算機(jī)輔助審計(jì)技術(shù)有一種叫數(shù)值分析法,是根據(jù)被審計(jì)數(shù)據(jù)中某字段數(shù)據(jù)值的分布情況、出現(xiàn)頻率等對(duì)該字段進(jìn)行分析,從而發(fā)現(xiàn)審計(jì)線索的一種數(shù)據(jù)處理方法。常用的數(shù)值分析方法主要有重號(hào)分析、斷號(hào)分析、Benford法則分析。
Benford定律是指一個(gè)沒(méi)有人為規(guī)則限制生成的一組數(shù)據(jù)數(shù)列,數(shù)列的首位數(shù)字n之和遵循lg(1+1/n)的規(guī)律,數(shù)字1出現(xiàn)的頻率為lg(1+1/1)的絕對(duì)數(shù)30.103%,數(shù)字2出現(xiàn)的頻率為lg(1+1/2)的絕對(duì)數(shù)17.609%,等等。因此,根據(jù)班福(Benford)定律“人們處理較小數(shù)字開(kāi)頭的數(shù)值的頻率較大”建立審計(jì)分析模型。如門診收入、住院收入、記賬憑證金額等利用SQL或
根據(jù)審計(jì)人員掌握計(jì)算機(jī)輔助審計(jì)技能的不同情況,筆者采用SQL查詢語(yǔ)句或Excel數(shù)據(jù)分析工具,摸索了計(jì)算機(jī)輔助審計(jì)常用的數(shù)值分析方法技術(shù)模型,增強(qiáng)審計(jì)準(zhǔn)確性,提高了審計(jì)工作效率。
2.1SQL查詢首位數(shù)字出現(xiàn)的頻率
主要以substing函數(shù)生成收入數(shù)據(jù)的首位數(shù)字,按首位數(shù)字分組后,用聚合函數(shù)count求各數(shù)字之和,即可收入數(shù)據(jù)首位數(shù)字1-9每個(gè)數(shù)字出現(xiàn)的頻率。
2.2Excel運(yùn)用COUNTA()函數(shù)功能
在Excel環(huán)境下,left()取出收入數(shù)據(jù)首位數(shù)字,用條件求和函數(shù)COUNTIF()求各數(shù)字之和,最后求出首位數(shù)字1-9每個(gè)數(shù)字出現(xiàn)的頻率。
按照班福定律推測(cè),醫(yī)院收入數(shù)據(jù)符合班福定律的條件要求,因此其首位數(shù)字分布也應(yīng)該符合這個(gè)規(guī)律。表1列出了某醫(yī)院2015年門診收費(fèi)明細(xì)、住院收費(fèi)明細(xì)和住院預(yù)交款明細(xì)數(shù)據(jù)首位數(shù)字的分布情況,三個(gè)數(shù)據(jù)系列總體上與班福定律相似,低數(shù)字出現(xiàn)頻率高于高數(shù)字。門診收費(fèi)明細(xì)、住院收費(fèi)明細(xì)和住院預(yù)交款明細(xì)數(shù)據(jù)首位數(shù)字分布與班福定律分布的相關(guān)系數(shù)分別為0.698、0.889、0.982,雖然住院預(yù)交款明細(xì)數(shù)據(jù)的相關(guān)系數(shù)高達(dá)0.982,但其首位數(shù)字分布與班福定律分布存在明顯差距。
表1 門診住院收費(fèi)明細(xì)數(shù)據(jù)班福定律數(shù)字分析表
明細(xì)收費(fèi)數(shù)據(jù)的首位數(shù)字分布與班福定律分布差異較大,因?yàn)槊骷?xì)費(fèi)用數(shù)據(jù)受到較多的人為規(guī)則的限制,特別是住院預(yù)交款數(shù)據(jù),那么,以病人為對(duì)象對(duì)明細(xì)收費(fèi)數(shù)據(jù)匯總后的首位數(shù)字分布是否更好?
表2為按病人匯總的收費(fèi)數(shù)據(jù)首位數(shù)字分布情況。第一行為未剔除掛號(hào)費(fèi)的門診病人匯總收費(fèi)數(shù)據(jù),第二行為剔除只有掛號(hào)費(fèi)沒(méi)有檢查費(fèi)藥品費(fèi)后的門診病人匯總收費(fèi)數(shù)據(jù),第三行為出院病人住院費(fèi)用數(shù)據(jù),三個(gè)數(shù)據(jù)系列首位數(shù)字分布與班福定律分布非常近似,特別是剔除只有掛號(hào)費(fèi)后的門診病人費(fèi)用匯總數(shù)據(jù)首位數(shù)字分布的相關(guān)系數(shù)達(dá)到0.999 1,幾乎與班福定律分布折線圖重合。出院病人費(fèi)用首位數(shù)字分布與班福定律分布略有差異,折線圖下降趨勢(shì)比班福定律分布折線略為平緩。
表2 門診住院收費(fèi)數(shù)據(jù)按病人匯總班福定律數(shù)字分析表
班福定律被譽(yù)為第一數(shù)字定律,要求數(shù)據(jù)系列必須是描述同一主體的同一現(xiàn)象,并且沒(méi)有人為規(guī)則的限制,不能設(shè)定最大值和最小值。
醫(yī)院明細(xì)收費(fèi)數(shù)據(jù)庫(kù)中存在大量金額為負(fù)數(shù)的記錄,即退費(fèi)記錄,使用明細(xì)收費(fèi)數(shù)據(jù)進(jìn)行首位數(shù)字分布分析時(shí),應(yīng)將負(fù)數(shù)記錄與相應(yīng)的正數(shù)記錄抵銷,才能得出正確的首位數(shù)字分布情況。
對(duì)該醫(yī)院2015年住院收費(fèi)明細(xì)進(jìn)行審計(jì)分析時(shí),發(fā)現(xiàn)11 月18日有一筆明細(xì)數(shù)據(jù)金額為9 152 580元,數(shù)量為61 017.2次,項(xiàng)目名稱為骨折手法整復(fù)術(shù),同時(shí)存在一筆負(fù)數(shù)沖抵記錄。經(jīng)詳細(xì)調(diào)查發(fā)現(xiàn),屬于記費(fèi)人員錄入病人費(fèi)用數(shù)量時(shí),誤錄為收費(fèi)編碼“6102702”,雖然屬于偶然操作誤差,并及時(shí)給予了更正,但說(shuō)明信息系統(tǒng)設(shè)計(jì)存在缺陷,沒(méi)有進(jìn)行總金額錄入控制,已給HIS軟件公司提出整改意見(jiàn)。
對(duì)班福定律審計(jì)分析法,以上述醫(yī)院實(shí)際業(yè)務(wù)數(shù)據(jù)進(jìn)行的測(cè)試說(shuō)明,醫(yī)院收入數(shù)據(jù)的首位數(shù)字分布總體上符合較小數(shù)字的大于較大數(shù)字的可能性大的規(guī)律,出現(xiàn)的差異可能是具體的業(yè)務(wù)規(guī)則影響了首位數(shù)字分布特點(diǎn)。對(duì)醫(yī)院收入數(shù)據(jù)的首位數(shù)字分布與班福定律分布存在的差異要作客觀具體的評(píng)價(jià),有差異并不代表必然存在差錯(cuò)或舞弊,要全面分析準(zhǔn)確理解。
主要參考文獻(xiàn)
[1]陳偉,張金誠(chéng),QIU Ro-Bin.計(jì)算機(jī)輔助審計(jì)技術(shù)(CAATs)研究綜述[J].計(jì)算機(jī)科學(xué),2007(10):290-294.
[2]應(yīng)里孟.數(shù)據(jù)式審計(jì)常用的數(shù)據(jù)分析方法[J].中國(guó)農(nóng)業(yè)會(huì)計(jì),2011 (9):14-15.
[3]狄為,施鵬仙.基于Benford定律的會(huì)計(jì)舞弊發(fā)現(xiàn)研究[J].會(huì)計(jì)之友,2010(9):73-75.
[4]王光偉,鄔華瓊,蘇利民,等.計(jì)算機(jī)輔助審計(jì)常用的數(shù)據(jù)分析模型[J].中國(guó)管理信息化,2016(5):42-43.
10.3969/j.issn.1673-0194.2016.17.019
F239
A
1673-0194(2016)17-0046-03
2016-05-06
中國(guó)衛(wèi)生經(jīng)濟(jì)學(xué)會(huì)2015中標(biāo)課題(CHEA1516080702)。Excel查詢數(shù)字出現(xiàn)的頻率,其查詢結(jié)果會(huì)發(fā)現(xiàn),如果有人為的故意則破壞了這個(gè)定律,審計(jì)人員必須以此為線索作深入調(diào)查,以獲取證據(jù)。