李新平
摘要:信息化社會(huì)累積了大量電子數(shù)據(jù),如何審計(jì)這些電子數(shù)據(jù)的研究與應(yīng)用是近幾年來審計(jì)領(lǐng)域需要面對(duì)的熱點(diǎn)問題。本文首先分析了可視化技術(shù)電子數(shù)據(jù)審計(jì)方法的重要性;其次對(duì)大數(shù)據(jù)的特點(diǎn)以及相關(guān)的技術(shù)進(jìn)行了分析,同時(shí)闡述了可視化技術(shù)的電子數(shù)據(jù)審計(jì)措施,為今后的大數(shù)據(jù)環(huán)境電子數(shù)據(jù)審計(jì)提供理論基礎(chǔ)。
關(guān)鍵詞:大數(shù)據(jù);數(shù)據(jù)可視化;電子數(shù)據(jù);審計(jì)
隨著計(jì)算機(jī)網(wǎng)絡(luò)和信息科技技術(shù)的快速發(fā)展和興起,信息社會(huì)的構(gòu)建完成,數(shù)據(jù)累積已經(jīng)達(dá)到了海量,從結(jié)果數(shù)據(jù)到半結(jié)構(gòu)數(shù)據(jù)甚至非結(jié)構(gòu)數(shù)據(jù)的飛速變化、發(fā)展和累積,都昭示著我國(guó)社會(huì)已經(jīng)面臨大數(shù)據(jù)時(shí)代。在這種背景下,電子數(shù)據(jù)的審計(jì)面臨著巨大的機(jī)遇和挑戰(zhàn)。國(guó)家早在2013年就已經(jīng)指出要以積極的態(tài)度學(xué)習(xí)國(guó)外先進(jìn)的大數(shù)據(jù)分析技術(shù),并充分結(jié)合自身發(fā)展的實(shí)際情況將大數(shù)據(jù)技術(shù)積極應(yīng)用于審計(jì)信息化建設(shè)中,讓我國(guó)的審計(jì)工作更加方便和科學(xué)。
數(shù)據(jù)可視化是指將數(shù)據(jù)信息用可以直觀感知的圖形圖像表現(xiàn)出來,使得人們可以直接在原本紛繁復(fù)雜的數(shù)據(jù)中非??焖俑咝У靥崛∮杏眯畔?,以便能迅速地做出正確決策。數(shù)據(jù)可視化是一種快捷有效的圖形化審計(jì)手段,可以幫助審計(jì)人員清晰地傳達(dá)和接受信息,迅速發(fā)現(xiàn)問題,提高效率。本文將首先分析可視化技術(shù)電子數(shù)據(jù)審計(jì)方法的重要性;其次對(duì)大數(shù)據(jù)的特點(diǎn)以及相關(guān)的技術(shù)進(jìn)行了分析,同時(shí)闡述了可視化技術(shù)的電子數(shù)據(jù)審計(jì)措施,為今后的大數(shù)據(jù)環(huán)境電子數(shù)據(jù)審計(jì)提供一些理論基礎(chǔ)。
一、基于數(shù)據(jù)可視化的電子數(shù)據(jù)審計(jì)方法
現(xiàn)在的大數(shù)據(jù)環(huán)境各種新技術(shù)如云計(jì)算、物聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)等的推動(dòng)下已經(jīng)發(fā)生了爆炸式的增長(zhǎng),數(shù)據(jù)累積呈現(xiàn)出了指數(shù)級(jí)的升高。如何在海量數(shù)據(jù)中進(jìn)行有效分析,將數(shù)據(jù)的分析結(jié)果以直觀的、可視的形式進(jìn)行表達(dá),是當(dāng)前計(jì)算機(jī) IT 界和學(xué)術(shù)界等研究的熱點(diǎn)。
(一)大數(shù)據(jù)概述
大數(shù)據(jù)的定義在目前來說沒有一個(gè)統(tǒng)一的定義,國(guó)內(nèi)外學(xué)術(shù)界還沒有完全達(dá)成一致,但是它已經(jīng)開始呈現(xiàn)自己的特點(diǎn),具有獨(dú)一無二的特征。綜合表述的話,大數(shù)據(jù)(big data),是指海量的網(wǎng)絡(luò)或電子數(shù)據(jù),既包括在互聯(lián)網(wǎng)上累積呈現(xiàn)的結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)以及非結(jié)構(gòu)化的數(shù)據(jù)。這種電子數(shù)據(jù)具有種類繁多的信息價(jià)值,是一種重要的信息資產(chǎn),具有較高的開發(fā)價(jià)值,需要一定的技術(shù)手段進(jìn)行處理或分析。我國(guó)對(duì)大數(shù)據(jù)的定義主要采用的是國(guó)務(wù)院于2015年頒發(fā)的行動(dòng)綱要中的定義:大數(shù)據(jù)的主要特征為容量大、存取速度快且具有較高的應(yīng)用價(jià)值,其是一類數(shù)據(jù)集合。而且在該發(fā)展行動(dòng)綱要中已經(jīng)清晰表明了這新一代信息技術(shù)和服務(wù)業(yè)態(tài)能夠成為發(fā)現(xiàn)新知識(shí)、創(chuàng)造新價(jià)值、提升新能力的發(fā)展新方向,可以采集、存儲(chǔ)以及分析大量、格式多樣的數(shù)據(jù)信息,更好的為社會(huì)為國(guó)家做出貢獻(xiàn)。
大數(shù)據(jù)主要具有大量(Volume)、多樣(Variety)、快速(Velocity)、真實(shí)(Veracity) 4個(gè)特點(diǎn)。
(二)數(shù)據(jù)可視化工具
數(shù)據(jù)可視化是當(dāng)前大數(shù)據(jù)研究的一個(gè)重要研究方向,起源于 1960 年計(jì)算機(jī)圖形學(xué)。簡(jiǎn)單地講,數(shù)據(jù)可視化就是通過圖形化的直觀手段,將復(fù)雜的數(shù)據(jù)模型表現(xiàn)出來。大數(shù)據(jù)可視化目前常用的工具主要有R語(yǔ)言、D3.js、Processing.js、TABLEAU、DATAWATCH、大數(shù)據(jù)魔鏡、Qlikview、SAS、SAP Business Object、水晶易表、IBM Cognos、Microsoft Excel等開源工具或者工具軟件。
這些工具比起早期的柱狀圖、餅狀圖等簡(jiǎn)單的數(shù)據(jù)分析而言是用來處理較為復(fù)雜的或較大規(guī)模的非結(jié)構(gòu)化數(shù)據(jù),它們的主要目的和功能就是幫助數(shù)據(jù)使用人員通過數(shù)據(jù)的直觀觀察,快速洞察數(shù)據(jù)中的規(guī)律,清晰有效地提取數(shù)據(jù)信息,把數(shù)據(jù)的各個(gè)屬性值以多維數(shù)據(jù)的形式直觀呈現(xiàn),將數(shù)據(jù)的各種屬性和變量直接展現(xiàn)出來,幫助使用人員從不同的維度觀察分析數(shù)據(jù),協(xié)助數(shù)據(jù)使用人員對(duì)數(shù)據(jù)進(jìn)行更深入更全面更細(xì)化的觀察和分析。
在大數(shù)據(jù)技術(shù)研究的推動(dòng)下,數(shù)據(jù)可視化的含義已經(jīng)明顯的擴(kuò)大和延伸,并且其由單一的展示圖表轉(zhuǎn)變成為能夠分析、展現(xiàn)圖表的綜合體。
(三)電子數(shù)據(jù)審計(jì)原理
數(shù)據(jù)可視化技術(shù)能夠在大數(shù)據(jù)環(huán)境下更加簡(jiǎn)潔的將海量被審計(jì)的數(shù)據(jù)信息表達(dá)出來,審計(jì)人員也能夠通過數(shù)據(jù)可視化技術(shù)發(fā)現(xiàn)大數(shù)據(jù)中存在的問題以及被審計(jì)數(shù)據(jù)信息中的模式,目前數(shù)據(jù)可視化可以成為審計(jì)的重要環(huán)節(jié)和手段。圖1是程偉提出的電子數(shù)據(jù)審計(jì)原理示意圖,筆者認(rèn)為這個(gè)簡(jiǎn)單的可視化流程示意圖已經(jīng)清晰演示了在大量的需要被處理和被表達(dá)的信息的前提下,數(shù)據(jù)可視化是一個(gè)非常有效快速簡(jiǎn)潔的結(jié)果呈現(xiàn)工具,能夠幫助用戶清晰明了的理解復(fù)雜概念或者數(shù)據(jù)。
(四)大數(shù)據(jù)分析原理
大數(shù)據(jù)分析是實(shí)現(xiàn)和應(yīng)用大數(shù)據(jù)價(jià)值的重要途徑,只有通過多維度、詳細(xì)的數(shù)據(jù)分析才可以發(fā)現(xiàn)總結(jié)大數(shù)據(jù)中出現(xiàn)的規(guī)律,才能更好地實(shí)現(xiàn)基于數(shù)據(jù)的決策,才能基于實(shí)際情況去理解現(xiàn)實(shí)、對(duì)未來進(jìn)行合理的預(yù)測(cè)。
大數(shù)據(jù)現(xiàn)有的分析數(shù)據(jù)源包括但不限制于結(jié)構(gòu)化數(shù)據(jù)、多媒體數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)、移動(dòng)數(shù)據(jù)以及日志數(shù)據(jù)等。通過對(duì)這些數(shù)據(jù)的抽取、轉(zhuǎn)換、過濾、排序、處理和加載,最后利用數(shù)據(jù)可視化工具進(jìn)行數(shù)據(jù)的可視化轉(zhuǎn)換,為使用人員提供直觀數(shù)據(jù)結(jié)果。
在現(xiàn)代社會(huì)中,審計(jì)人員在大數(shù)據(jù)環(huán)境下開展審計(jì)工作具有一定的難度,海量和復(fù)雜的數(shù)據(jù)讓審計(jì)數(shù)據(jù)的分析和解讀更加困難。而數(shù)據(jù)可視化的分析方法能夠在一定程度上幫助審計(jì)人員對(duì)海量的數(shù)據(jù)進(jìn)行分析和探索,其不僅讓審計(jì)工作人員能夠更加直觀的分析審計(jì)數(shù)據(jù),同時(shí)也能幫助工作人員深入分析和了解審計(jì)數(shù)據(jù)。利用數(shù)據(jù)可視化分析方法分析數(shù)據(jù)信息的基本流程主要是利用可視化軟件將需要審計(jì)的數(shù)據(jù)轉(zhuǎn)變?yōu)楦有蜗蟮膱D像內(nèi)容,幫助他們從總體上系統(tǒng)地理解和分析被審計(jì)數(shù)據(jù)的內(nèi)涵和特征。另外,也可以審計(jì)人員與可視化軟件進(jìn)行交互,自我設(shè)定輸出的可視化圖形和圖像,從不同的角度和層面獲得對(duì)被審計(jì)數(shù)據(jù)的理解,達(dá)到全面地分析被審計(jì)數(shù)據(jù)的目的。
二、電子數(shù)據(jù)審計(jì)方法對(duì)比
電子數(shù)據(jù)可視化的審計(jì)手段基于數(shù)據(jù)可視化工具使用上。大數(shù)據(jù)可視化目前常用的工具主要有 R語(yǔ)言、D3.js、Processing.js、TABLEAU、DATAWATCH、大數(shù)據(jù)魔鏡、Qlikview、SAS、SAP Business Object、水晶易表、IBM Cognos、Microsoft Excel等開源工具或者工具軟件。
開源工具使用起來較為復(fù)雜,目前常用的基于SQL的數(shù)據(jù)查詢方法一般是通過對(duì)被審計(jì)對(duì)象的專業(yè)審計(jì)分析,構(gòu)建相關(guān)SQL語(yǔ)句,在數(shù)據(jù)庫(kù)或?qū)徲?jì)軟件中運(yùn)行SQL命令,這就需要審計(jì)人員具有一定的計(jì)算機(jī)技術(shù),可以編寫SQL命令。這在無形中提高了審計(jì)條件,增加了審計(jì)難度,在實(shí)際的審計(jì)工作中并不推薦使用。
而市場(chǎng)上現(xiàn)有的數(shù)據(jù)可視化工具中對(duì)審計(jì)人員最友好的應(yīng)該是TABLEAU,該類數(shù)據(jù)可視化工具軟件是比較簡(jiǎn)單的一類軟件,其完美結(jié)合了數(shù)據(jù)運(yùn)算和圖表分析內(nèi)容,用戶只需要在數(shù)字畫布上放入大量的數(shù)據(jù)信息既能夠直接獲取到已經(jīng)制好的圖表信息。這對(duì)審計(jì)人員的其他技術(shù)要求非常低,使用方法和用戶界面也比較友好。
至于專業(yè)的審計(jì)軟件,使用范圍不是很廣,被審計(jì)對(duì)象不一定會(huì)購(gòu)買專業(yè)的審計(jì)軟件,而且專業(yè)軟件的友好性要比商業(yè)化的數(shù)據(jù)可視化軟件低。
三、總結(jié)
大數(shù)據(jù)環(huán)境下審計(jì)工作不得不面臨被審計(jì)單位的大數(shù)據(jù)累積,審計(jì)人員需要改變傳統(tǒng)審計(jì)觀念,學(xué)習(xí)掌握新的審計(jì)技術(shù),利用數(shù)據(jù)可視化技術(shù)這一重要手段,從整體上把握被審計(jì)數(shù)據(jù)情況,快速發(fā)現(xiàn)可疑數(shù)據(jù),推動(dòng)審計(jì)工作在新時(shí)代中的前進(jìn)。
參考文獻(xiàn):
[1]陳偉.計(jì)算機(jī)輔助審計(jì)原理及應(yīng)用(第三版)[M].清華大學(xué)出版社,2016.
[2]陳偉,Wally Smieliauskas.大數(shù)據(jù)環(huán)境下的電子數(shù)據(jù)審計(jì):機(jī)遇、挑戰(zhàn)與方法[J].計(jì)算機(jī)科學(xué),2016,43 (1):8-13,34.
[3]陳世敏.大數(shù)據(jù)分析與高速數(shù)據(jù)更新[J].計(jì)算機(jī)研究與發(fā)展,2015,52 (2):333-342.
[4]張引,陳敏,廖小飛.大數(shù)據(jù)應(yīng)用的現(xiàn)狀與展望[J].計(jì)算機(jī)研究與發(fā)展,2013,50 (11):216-233.
[5]謝然.大數(shù)據(jù)可視化之美[J].互聯(lián)網(wǎng)周刊,2014 (6):32-34.