• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于大數(shù)據(jù)背景下的社會審計探索

    2018-09-10 03:48:21曾堯
    企業(yè)科技與發(fā)展 2018年7期
    關(guān)鍵詞:數(shù)據(jù)可視化大數(shù)據(jù)

    曾堯

    【摘 要】目前,我國審計領(lǐng)域的大數(shù)據(jù)技術(shù)和方法僅停留在理論上的呼吁與倡導(dǎo)層面,社會審計亟待運用科學(xué)的大數(shù)據(jù)分析方法創(chuàng)新現(xiàn)有審計分析思維,以適應(yīng)海量數(shù)據(jù)的持續(xù)增長。文章應(yīng)用最流行的大數(shù)據(jù)分析語言和成熟的統(tǒng)計分析、數(shù)據(jù)挖掘算法,為審計業(yè)務(wù)部門提供探索性的數(shù)據(jù)分析思路,為審計數(shù)據(jù)分析的拓展做出貢獻。

    【關(guān)鍵詞】統(tǒng)計模型;大數(shù)據(jù);數(shù)據(jù)可視化

    【中圖分類號】F239 【文獻標(biāo)識碼】A 【文章編號】1674-0688(2018)07-0033-03

    1 目的和意義

    伴隨國家審計大數(shù)據(jù)的逐漸形成,傳統(tǒng)審計的思維方式和數(shù)據(jù)分析方法成為現(xiàn)出效率低、范圍窄的弊端,探索大數(shù)據(jù)環(huán)境下的審計方法已是當(dāng)務(wù)之急。隨著云計算、移動互聯(lián)網(wǎng)等新技術(shù)的不斷推廣,全球社會經(jīng)濟發(fā)展迎來了新機遇和新挑戰(zhàn),大數(shù)據(jù)時代的來臨,不僅是體量的擴充,更是數(shù)據(jù)思維的轉(zhuǎn)變,面對因數(shù)據(jù)思維轉(zhuǎn)變所帶來的分析模式及分析要求的變化,審計人員需應(yīng)時而變以適應(yīng)大數(shù)據(jù)導(dǎo)致的新變革。

    2 使用的軟件及研究方法介紹

    本文主要使用R語言處理數(shù)據(jù)。一方面,由于被審計單位多樣,數(shù)據(jù)標(biāo)準(zhǔn)不一,所以審計人員必須做大量的數(shù)據(jù)處理和清洗工作(統(tǒng)稱審計預(yù)處理),而R語言對數(shù)據(jù)處理的強大性能可以滿足多樣的審計預(yù)處理需求。此外,審計預(yù)處理往往需要多個步驟,審計人員在數(shù)據(jù)庫中保存為中間表的傳統(tǒng)做法對大數(shù)據(jù)表進行操作時,不僅占用存儲空間,效率也較低,而R語言可以通過多種形式靈活保存中間結(jié)果,十分快捷、方便。另一方面,R語言具備強大的數(shù)據(jù)可視化功能,被公認為行業(yè)中的佼佼者,可以滿足一般圖形展示要求。對于高級數(shù)據(jù)圖形展示,會用到gplot2數(shù)據(jù)包,其理念是將繪圖與數(shù)據(jù)分離,以圖層作圖的理念,并把常見的統(tǒng)計變換融入繪圖中,可以創(chuàng)建優(yōu)雅、信息豐富、定制化的圖形。

    3 樣本的選擇實證分析

    3.1 對A市高速公路數(shù)據(jù)的描述

    通過對A市高速現(xiàn)場的各個路口采樣,我們對A市高速公路的各個收費站出現(xiàn)的問題數(shù)進行分類與匯總,首先繪制箱線圖(如圖1所示),直觀明了地表明在某一方面表現(xiàn)極其異常的收費站名稱。其次可以將各收費站按照其所屬中心進行匯總,繪制星圖,不僅可以觀察與比較各個所屬中心的表現(xiàn)情況,還可以直觀地看到各個所屬中心在不同問題方面的表現(xiàn)情況。此外,對于不同貨車車型在不同時間段內(nèi)的超限比率進行分析時,我們也可以使用箱線圖(如圖2所示)。

    由圖1可知,該收費站在入口大客車出口變小客車問題上極為異常,需要重點檢查與加強管理。由圖2的雷達圖我們可以直觀地了解到所屬中心為1號、4號、10號、18號、19號、22號、24號、28號、30號、40號、50號的問題很少,而26號問題最多,具體又可以表現(xiàn)為入口貨車出口變客車、車型貨車變客車及車型大客車變小客車問題較為嚴重,23號所屬中心只是入口貨車出口變客車問題嚴重。

    對24個行車時段進行了聚合,按照1~6、7~12、13~18、19~24時段分為深夜、上午、下午和晚上4個分類變量。由此對某月份所有超載記錄的貨車進行了箱線圖繪畫(如圖3所示),并在途中顯示了各個分類下的均值點,可以看到貨車15號的超限比率最高,而所有車型都是在深夜超限率最高,這也對高速部門整治有了精確方向。

    散點圖分析時,我們選取其中某個收費站某一天(2月27日)的數(shù)據(jù),分車型畫出收費與里程關(guān)系的散點圖(如圖4所示),擬合曲線并將置信區(qū)間設(shè)置為90%,追蹤具體到車牌號的異常值的信息(如圖5所示)。

    從圖4中可以看出1、2、3、4類車型擬合曲線最好,因其代表車型為客車,是按照里程數(shù)計費,所以很少存在偏差,而其他車型在擬合的曲線外仍存在較多離散的點,因其代表車型為貨車,收費標(biāo)準(zhǔn)不僅依據(jù)里程數(shù),更受到載重量及是否超限的影響,而擬合曲線時僅考慮了里程數(shù),所以擬合效果不是特別好,針對離散最為嚴重的紫色圓圈內(nèi)的點追蹤車牌后可以得到圖5,不難看出車型全為大貨車,經(jīng)查詢也發(fā)現(xiàn)其大都是超限所致,從而也印證了前面的說法。

    3.2 對A市高速公路數(shù)據(jù)的實證分析

    3.2.1 因子分析模型

    應(yīng)用因子分析模型,對314個收費站進行降維處理:將9個變量合并為2個復(fù)合因子,且重新命名為免費問題因子和收費問題因子。根據(jù)擬合的統(tǒng)計公式得到了在2個因子上的得分,畫出散點圖(如圖6所示),直觀地展示出314個收費站中特別異常的收費站。根據(jù)各個收費站的年通行次數(shù)即權(quán)重,原點的大小代表了收費站的年通行量大?。凰{色深淺表示了各個收費站免費軍車通行次數(shù)的等級。免費軍車通行次數(shù)等級的劃分標(biāo)準(zhǔn)是選取了上下四分位數(shù)和中位數(shù)為劃分依據(jù)。X坐標(biāo)軸代表了收費問題因子的得分大小,Y坐標(biāo)軸表示了免費因子的得分。得到了問題比較多的9個收費站。收費站在坐標(biāo)軸得分大于0表示該收費站的問題大于平均水平,小于0表示低于平均水平,可以看出年通行量較大的收費站收費問題更大。

    3.2.2 Kmeans模型聚類分析

    如今,信息技術(shù)飛速發(fā)展,大多數(shù)企業(yè)、機關(guān)、事業(yè)單位及其他組織的財務(wù)、業(yè)務(wù)信息早已實現(xiàn)了電算化,脫離了傳統(tǒng)的紙質(zhì)記錄。在此背景下,審計工作也日益依賴計算機的協(xié)助。在計算機審計中,傳統(tǒng)的查找異常、發(fā)現(xiàn)審計線索的方法主要有排序、篩選、查找重號、查找斷號、分類、分層等。但在當(dāng)下數(shù)據(jù)量越來越大、數(shù)據(jù)維度越來越復(fù)雜的情況下,許多異常數(shù)據(jù)混雜在海量的數(shù)據(jù)中,要用這些略顯原始的方法將它們一一找出來,多少顯得力不從心。因此,我們希望能夠通過將統(tǒng)計方法引入審計工作中,利用統(tǒng)計模型對數(shù)據(jù)有一個宏觀的把握,從而查出異常,進而發(fā)現(xiàn)審計線索。

    我們?nèi)市高速2017年某一個月的出口收費站流水?dāng)?shù)據(jù),共2 000余萬條記錄進行試驗,考慮到計算機內(nèi)存處理能力的限制,需要對這些數(shù)據(jù)進行壓縮。于是使用R語言取其中所有超限記錄,再選取出口站編號、最終車種、最終車型3個變量作為分類變量,對分得的每一類都計算其行駛里程、車貨總重、通行次數(shù),得到壓縮后的數(shù)據(jù)記錄約4 000條,之后采用Kmeans聚類算法進行聚類,結(jié)果如圖7所示。

    圖7中文字表示坐標(biāo)軸含義,如第一行各圖的縱坐標(biāo)和第一列各圖的橫坐標(biāo)是“行駛里程”,以此規(guī)律可讀出其他各圖的橫、縱坐標(biāo)含義。圖1中的圓點即壓縮后的數(shù)據(jù)點,它們的顏色表示它們在Kmeans聚類算法中被歸入的類別(見表1)。

    3.2.3 面板模型分析

    根據(jù)各收費站2017年的最終收費金額及總的通行次數(shù)先建立面板數(shù)據(jù)進行動態(tài)分析(如圖8所示)。

    由圖8可知,各收費站最終收費金額一年中整體走勢較平穩(wěn),在2月份(春節(jié)期間)全部收費站收費金額均下降,縱向比較來說有幾個收費站的收費金額明顯高于其他收費站。這是由很多因素決定的,其中經(jīng)濟因素是最不容忽視的,從中我們可以看出區(qū)域經(jīng)濟發(fā)展的不均衡性及需要加強管理的地區(qū)。

    下面我們將各收費站2017年1年間的最終收費金額對通行次數(shù)、車貨總重、行駛里程等變量進行了建模分析。

    最終收費金額=X1×通行次數(shù);R方=39.43%。

    最終收費金額=X2×車貨總重;R方=69.57%。

    最終收費金額=X2×行駛里程;R方=61.95%。

    說明通行次數(shù)每增加1次,各收費站收費平均增加X1元。其中,通行次數(shù)的變化可以解釋最終收費金額變化的39.43%;車貨總重的變化可以解釋最終收費金額變化的69.57%;行駛里程的變化可以解釋最終收費金額變化的61.59%;說明收費站的最終收費金額與車貨總重關(guān)系最密切。

    4 結(jié)論與啟發(fā)

    大數(shù)據(jù)時代的審計方法應(yīng)該結(jié)合我國社會審計的信息化條件,一方面將傳統(tǒng)成熟的數(shù)據(jù)分析方法繼續(xù)融入審計實踐中,形成面向數(shù)字化平臺的海量數(shù)據(jù)分析機制,另一方面結(jié)合科學(xué)的統(tǒng)計數(shù)據(jù)分析方法與工具特征研究如何將這些技術(shù)應(yīng)用到審計創(chuàng)新,為將來社會審計使用這些技術(shù)提供前期積累和準(zhǔn)備。通過實證分析發(fā)現(xiàn),年通行量較大的收費站收費問題更大,行駛里程、車貨總重、通行次數(shù)3個指標(biāo)都顯著大于其他類別,應(yīng)作為審計重點加以審查。通過面板分析發(fā)現(xiàn),收費站的最終收費金額與車貨總重關(guān)系最密切。收費站流量預(yù)測是一個很值得分析的問題,統(tǒng)計學(xué)上所提到的很多模型都可以用來對其進行預(yù)測,我們嘗試過采用一些其他模型,時間問題還沒有形成系統(tǒng)的結(jié)果,沒有辦法呈現(xiàn)。后期若條件允許,在流量預(yù)測方向上還有很多可以深入分析拓展的內(nèi)容。我們對高速數(shù)據(jù)的分析,目前僅限于微觀層面上,后期若結(jié)合宏觀數(shù)據(jù)分析一些收費站問題出現(xiàn)的原因,會是一個很好的思路。

    參 考 文 獻

    [1]邵松長.淺議大數(shù)據(jù)環(huán)境下企業(yè)內(nèi)部審計工作的轉(zhuǎn)型提升[J].財會學(xué)習(xí),2018(11):145,147.

    [2]馬志娟,梁思源.大數(shù)據(jù)背景下政府環(huán)境責(zé)任審計監(jiān)督全覆蓋的路徑研究[J].審計研究,2015(5):28-34.

    [3]周霞,林津翹,華峰.大數(shù)據(jù)時代企業(yè)內(nèi)部審計新常態(tài)研究[J].中國內(nèi)部審計,2017(3):13-17.

    [4]王茂森.大數(shù)據(jù)背景下政府審計工作的挑戰(zhàn)及解決策略研究[J].財會學(xué)習(xí),2018(13):168.

    [5]王昊,趙越,石楷文,等.審計方法于大數(shù)據(jù)時代的革新[J].市場周刊,2018(5):123-124.

    [責(zé)任編輯:鄧進利]

    猜你喜歡
    數(shù)據(jù)可視化大數(shù)據(jù)
    移動可視化架構(gòu)與關(guān)鍵技術(shù)綜述
    大數(shù)據(jù)時代背景下本科教學(xué)質(zhì)量動態(tài)監(jiān)控系統(tǒng)的構(gòu)建
    可視化:新媒體語境下的數(shù)據(jù)、敘事與設(shè)計研究
    我國數(shù)據(jù)新聞的發(fā)展困境與策略研究
    科技傳播(2016年19期)2016-12-27 14:53:29
    基于R語言的大數(shù)據(jù)審計方法研究
    大數(shù)據(jù)環(huán)境下基于移動客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
    新聞世界(2016年10期)2016-10-11 20:13:53
    基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
    科技視界(2016年20期)2016-09-29 10:53:22
    數(shù)據(jù)+輿情:南方報業(yè)創(chuàng)新轉(zhuǎn)型提高服務(wù)能力的探索
    中國記者(2016年6期)2016-08-26 12:36:20
    數(shù)據(jù)可視化在新聞生產(chǎn)中的應(yīng)用研究
    今傳媒(2016年3期)2016-03-28 00:30:43
    漾濞| 瑞金市| 房产| 庄河市| 清丰县| 河北省| 白城市| 泰来县| 临江市| 玉山县| 新郑市| 呈贡县| 腾冲县| 拉孜县| 哈巴河县| 左贡县| 庆安县| 墨脱县| 望谟县| 白朗县| 广汉市| 六安市| 富阳市| 白山市| 平昌县| 义乌市| 西丰县| 甘洛县| 章丘市| 海兴县| 米易县| 喀喇沁旗| 龙陵县| 澎湖县| 滨州市| 盱眙县| 金沙县| 尼勒克县| 奈曼旗| 平顶山市| 休宁县|