葉曾靜
摘 要:通過數(shù)據(jù)挖掘技術(shù),不僅可以發(fā)現(xiàn)數(shù)據(jù)的顯現(xiàn)關(guān)系還可以發(fā)現(xiàn)數(shù)據(jù)的潛在關(guān)系,節(jié)約了大量人力物力,極大便捷了審計工作。
關(guān)鍵詞:數(shù)據(jù)挖掘;審計數(shù)據(jù)分析
一、引言
以前,審計人員基本是運用決策樹、線性回歸等方法,再結(jié)合MATLAB、R語言等進行結(jié)構(gòu)化數(shù)據(jù)分析,卻忽略了對非結(jié)構(gòu)化數(shù)據(jù)的分析;并且,一般采用的是因果關(guān)系的思考方法,但數(shù)據(jù)之間的關(guān)系極其復雜,深入分析會消耗大量的人力與物力。而數(shù)據(jù)挖掘不僅可以進行非結(jié)構(gòu)化數(shù)據(jù)分析,還能自動發(fā)現(xiàn)潛在問題,增強審計的客觀性與可靠性。在大數(shù)據(jù)環(huán)境下,平臺提供數(shù)據(jù)挖掘模型,審計人根據(jù)審計目標的不同,進行多維數(shù)據(jù)的挖掘與分析,節(jié)省人力物力,轉(zhuǎn)換審計數(shù)據(jù)分析的思維。
二、傳統(tǒng)的審計實施框架
首先,審計準備階段。在開始審計前,審計人員核查被審計單位的內(nèi)部以及外部文件,包括紙質(zhì)和電子等形式的文件,對財務(wù)報表上所包含的信息進行審查。然后,檢查被審計單位的有形資產(chǎn),例如存貨的盤點、固定資產(chǎn)的盤點等。詢問相關(guān)人員后,了解被審計單位的信息以及內(nèi)部控制的運行情況。通過函證了解被審計單位的財務(wù)信息及相關(guān)披露信息,以及了解被審計單位現(xiàn)存情況。最后,對于一些數(shù)據(jù)化的文件借助計算機輔助審計技術(shù)驗證其準確性。
其次,審計實施階段。一般,通過對企業(yè)的會計憑證、會計賬務(wù)與財務(wù)報告進行核查,對于有形資產(chǎn)實地進行勘查等,審計人員自身實施審查和取證。目前,對于中小企業(yè),普遍的情況是自身會計制度不健全,對于憑證、賬本等資料的保存并不完善,雖然大部分的企業(yè)已經(jīng)采用會計電算化,但電算化與非電算化的信息的結(jié)合還不是很好,導致審計人員很難將兩者結(jié)合運用,增加了審計時間;對于大企業(yè),會計制度比較健全,但數(shù)據(jù)繁多,靠審計人員人工審查將耗費大量的時間。
最后,審計終結(jié)階段。審計人員依據(jù)之前的實施階段審計出的情況反映在工作底稿上最終給出審計意見。
三、傳統(tǒng)審計程序下會出現(xiàn)的風險
通過上一部分,我們可以了解到整個審計程序,但從中也能發(fā)現(xiàn),現(xiàn)在的審計實施階段還存在著大量的風險。比較明顯的幾點。第一,被審計單位文件數(shù)據(jù)保存不完善,沒有最初的會計憑證,審計人員很難判斷被審計單位的會計分錄與財務(wù)報告中的數(shù)據(jù)是否真實可靠。第二,非財務(wù)信息很難真實了解,傳統(tǒng)程序下,非財務(wù)信息一般是通過被審計單位內(nèi)部人員來了解,而這些人員一般基于心理壓力,很難真實反饋甚至是不配合。第三,數(shù)據(jù)繁雜審計人員難以在短時間內(nèi)了解清楚,在繁雜的數(shù)據(jù)下,審計人員只能憑經(jīng)驗著重審查某些地方,被查出的地方一般是表面的問題,難以追其根源,且被審計單位可能存在虛假數(shù)據(jù)的情況,加大了審計難度;隨著數(shù)據(jù)總體的增加,手工審計明顯力不從心了。
四、數(shù)據(jù)挖掘技術(shù)有效避免大部分傳統(tǒng)下的風險
目前,大部分運用的是Hadoop框架。第一階段,審計數(shù)據(jù)采集階段。審計人員一般從三個方面采集。第一,結(jié)構(gòu)化數(shù)據(jù),是指被審計單位的財務(wù)數(shù)據(jù)和業(yè)務(wù)數(shù)據(jù),是審計數(shù)據(jù)的基礎(chǔ)。第二,通過互聯(lián)網(wǎng)、各大社交網(wǎng)站等尋找非結(jié)構(gòu)數(shù)據(jù)。第三,內(nèi)部審計資料和內(nèi)部管理數(shù)據(jù),通過內(nèi)部控制管理了解被審計單位。采集到上述的資料,整合到數(shù)據(jù)庫為下一階段的數(shù)據(jù)處理做準備。第二階段,這一階段是運用數(shù)據(jù)挖掘與人工審計和單節(jié)點審計的最大區(qū)別點,首先對數(shù)據(jù)進行預(yù)處理,把數(shù)據(jù)集成,進行清洗去除冗余的數(shù)據(jù)最后進行數(shù)據(jù)質(zhì)量檢查,在這期間數(shù)據(jù)會通過基礎(chǔ)數(shù)據(jù)庫、標準數(shù)據(jù)庫到達數(shù)據(jù)倉庫,這樣,整個數(shù)據(jù)都已準備完畢,接下來結(jié)合統(tǒng)計分析、數(shù)據(jù)挖掘、數(shù)據(jù)可視化到達數(shù)據(jù)分析階段。
在第二階段與第三階段中間的數(shù)據(jù)分析是對最后審計人員能找到審計疑點的重要一環(huán)。審計人員運用不同的方法進行挖掘分析,找出其中的異常關(guān)系,作為判斷舞弊的有效審計證據(jù)。在此部分,介紹兩種方法。第一種關(guān)聯(lián)分析。關(guān)聯(lián)分析將各個知識進行關(guān)聯(lián),運用推理規(guī)則和語義分析等技術(shù)來展現(xiàn)文本信息之間是否存在某種隱含的關(guān)系。第二種則為文本聚類。首先,采用文本聚類的算法找出以特殊形式藏在大數(shù)據(jù)之中難以發(fā)覺的信息,推測是否有舞弊和違規(guī)行為;其次,進行文本聚類,將每一類文本進行具體的分析、比較和總結(jié),找出異常數(shù)據(jù)的原因。最后再進行結(jié)果可視化,以簡單便于理解地方式表達出來,結(jié)果可視化通過可視化的視覺符號,例如網(wǎng)狀圖、樹狀圖、思維圖、坐標等,將各文本之間的關(guān)系清晰地展示出來,審計人員根據(jù)不同的審計目標,進行多維度分析。
由此可見,大數(shù)據(jù)時代下的數(shù)據(jù)挖掘技術(shù),能夠提高審計數(shù)據(jù)分析能力,找出隱藏的問題,降低審計風險。
參考文獻:
[1]胡珊珊.數(shù)據(jù)挖掘技術(shù)在現(xiàn)代審計中的應(yīng)用研究[J].老區(qū)建設(shè),2015(08):44-45.
[2]程平,張雅頔.大數(shù)據(jù)時代基于云會計的審計實施框架構(gòu)建[J].會計之友,2015(24):134-136.
[3]謝志明,蔡琴,李俊杰.云計算與大數(shù)據(jù)體系下的審計模式轉(zhuǎn)變[J].財會月刊,2016(04):68-70.
[4]胡洪斌.大數(shù)據(jù)時代數(shù)據(jù)式審計方法重構(gòu)[J].財會通訊,2017(19):117-119.
[5]張志恒,成雪嬌.大數(shù)據(jù)環(huán)境下基于文本挖掘的審計數(shù)據(jù)分析框架[J].會計之友,2017(16):117-120.
[6]賴麗珍.大數(shù)據(jù)背景下云審計平臺系統(tǒng)的構(gòu)建[J].財務(wù)與會計,2017(03):43-45.
[7]肖雅文,王佳.基于數(shù)據(jù)挖掘的審計體系構(gòu)建[J].現(xiàn)代商業(yè),2018(25):140-141.
[8]陳天佑. 數(shù)據(jù)挖掘技術(shù)在稅務(wù)審計中的應(yīng)用研究[D].江西財經(jīng)大學,2019.
[9]張娟. 大數(shù)據(jù)環(huán)境下內(nèi)部審計信息化研究[D].北京交通大學,2019.
[10]霍欣.大數(shù)據(jù)審計下統(tǒng)計分析方法研究[J].財經(jīng)界,2020(10):227-228.
[11]王良,鮑喜,王云,周建成,張海超.基于數(shù)據(jù)挖掘算法的審計數(shù)據(jù)分析及案例應(yīng)用[J].中國注冊會計師,2020(06):101-105.
[12]太自紅.關(guān)聯(lián)規(guī)則算法在審計數(shù)據(jù)分析中的運用[J].審計與理財,2020(05):18-19.