[摘 要] 信息技術(shù)全面發(fā)展的今天,決策支持系統(tǒng)的應(yīng)用范圍越來越廣,作用越來越大。同時(shí),審計(jì)行業(yè)風(fēng)險(xiǎn)模型不斷演變,風(fēng)險(xiǎn)導(dǎo)向?qū)徲?jì)的概念日益流行。審計(jì)亟待利用現(xiàn)有的強(qiáng)大的財(cái)務(wù)數(shù)據(jù)倉庫來進(jìn)行業(yè)務(wù)處理,利用信息技術(shù)進(jìn)行有效的審計(jì)決策。本文探討了用于風(fēng)險(xiǎn)導(dǎo)向?qū)徲?jì)決策支持系統(tǒng)的數(shù)據(jù)倉庫從數(shù)據(jù)預(yù)處理到物理模型設(shè)計(jì)的全過程,詳細(xì)介紹了概念模型設(shè)計(jì)、邏輯模型設(shè)計(jì)和物理模型設(shè)計(jì),并進(jìn)一步闡述了審計(jì)決策支持系統(tǒng)的運(yùn)行思路及其數(shù)據(jù)倉庫建模時(shí)需考慮的特色技術(shù)。
[關(guān)鍵詞] 決策支持系統(tǒng);審計(jì);風(fēng)險(xiǎn)導(dǎo)向;數(shù)據(jù)倉庫
[中圖分類號(hào)]F239.1[文獻(xiàn)標(biāo)識(shí)碼]A[文章編號(hào)]1673-0194(2008)20-0060-03
1 引 言
隨著信息技術(shù)的高速發(fā)展,財(cái)務(wù)信息系統(tǒng)應(yīng)用的規(guī)模、范圍和深度不斷擴(kuò)大。近年來由于數(shù)據(jù)采集技術(shù)的更新,審計(jì)業(yè)務(wù)中也在不斷建立強(qiáng)大的財(cái)務(wù)數(shù)據(jù)庫,而大量的數(shù)據(jù)背后隱藏著許多重要的信息,人們希望系統(tǒng)能夠提供更高層次的數(shù)據(jù)分析功能,自動(dòng)和智能地將待處理的數(shù)據(jù)轉(zhuǎn)化為有用的信息和知識(shí),以便更好地利用這些數(shù)據(jù)。在審計(jì)風(fēng)險(xiǎn)模型不斷演變的今天,風(fēng)險(xiǎn)導(dǎo)向?qū)徲?jì)的概念日益流行,審計(jì)亟待利用現(xiàn)有的強(qiáng)大的財(cái)務(wù)數(shù)據(jù)倉庫來進(jìn)行業(yè)務(wù)處理,利用信息技術(shù)進(jìn)行有效的審計(jì)決策。
數(shù)據(jù)倉庫和數(shù)據(jù)挖掘是近年來信息領(lǐng)域中迅速發(fā)展起來的新技術(shù),是在在充分利用已有數(shù)據(jù)資源的基礎(chǔ)上,通過高效算法的設(shè)計(jì),從大規(guī)模數(shù)據(jù)庫中提取知識(shí)、挖掘規(guī)律、輔助決策等,是涉及數(shù)據(jù)庫、統(tǒng)計(jì)分析、人工智能、模式識(shí)別、高性能計(jì)算、神經(jīng)網(wǎng)絡(luò)和數(shù)據(jù)可視化等技術(shù)的前沿交叉學(xué)科,同時(shí)也是未來信息基礎(chǔ)設(shè)施的核心技術(shù)。
對(duì)已經(jīng)積累的審計(jì)信息資源建立數(shù)據(jù)倉庫,進(jìn)行再開發(fā)和深層挖掘是對(duì)中國(guó)風(fēng)險(xiǎn)導(dǎo)向?qū)徲?jì)資源的有效保護(hù)、利用和提升,是中國(guó)審計(jì)研究領(lǐng)域中的一項(xiàng)重要任務(wù)。
2 數(shù)據(jù)的特殊性和特殊需求
2. 1項(xiàng)目數(shù)據(jù)
來自審計(jì)業(yè)務(wù)中的歷史數(shù)據(jù)包含兩種類型,分別是被審計(jì)企業(yè)財(cái)務(wù)報(bào)表和重大審計(jì)案例數(shù)據(jù)表。原始采集數(shù)據(jù)以財(cái)務(wù)系統(tǒng)導(dǎo)出的Excel表提供。被審計(jì)企業(yè)財(cái)務(wù)報(bào)表記錄了每個(gè)被審計(jì)企業(yè)的基本財(cái)務(wù)信息、財(cái)務(wù)指標(biāo)、財(cái)務(wù)預(yù)測(cè)等內(nèi)容,重大審計(jì)案例表描述某地區(qū)一段時(shí)間范圍內(nèi)出現(xiàn)審計(jì)失敗的匯總信息。
2. 2候補(bǔ)數(shù)據(jù)
隨著審計(jì)決策系統(tǒng)項(xiàng)目的進(jìn)展,尤其是新的風(fēng)險(xiǎn)模型的不斷定義和審計(jì)方法的不斷更新,系統(tǒng)開發(fā)將逐步得到新的風(fēng)險(xiǎn)敏感數(shù)據(jù)、風(fēng)險(xiǎn)預(yù)測(cè)結(jié)果和風(fēng)險(xiǎn)審計(jì)效率等信息。屆時(shí),系統(tǒng)項(xiàng)目將把這些數(shù)據(jù)納入統(tǒng)一的數(shù)據(jù)倉庫視圖。
2. 3數(shù)據(jù)特點(diǎn)
審計(jì)風(fēng)險(xiǎn)模型中的財(cái)務(wù)數(shù)據(jù)具有待分析維度多、組織結(jié)構(gòu)不規(guī)范、編碼復(fù)雜等特點(diǎn)。
2. 4特殊需求
建立用于風(fēng)險(xiǎn)導(dǎo)向?qū)徲?jì)決策支持的數(shù)據(jù)倉庫的目標(biāo)是對(duì)審計(jì)過程獲得的財(cái)務(wù)數(shù)據(jù)進(jìn)行有效組織和建模,基于數(shù)據(jù)倉庫開發(fā)風(fēng)險(xiǎn)導(dǎo)向下的審計(jì)決策支持系統(tǒng),研究被審計(jì)單位財(cái)務(wù)數(shù)據(jù)在由時(shí)間、規(guī)模、行業(yè)、地域等維度組成的空間中的分布特征和變化趨勢(shì),挖掘?qū)е聦徲?jì)失敗的高危因素,發(fā)現(xiàn)財(cái)務(wù)數(shù)據(jù)上的敏感區(qū)域,分析歷史審計(jì)方法和審計(jì)風(fēng)險(xiǎn)的相關(guān)性,揭示風(fēng)險(xiǎn)導(dǎo)向?qū)徲?jì)下的不同行業(yè),在不同時(shí)間、不同規(guī)模、不同區(qū)域下的風(fēng)險(xiǎn)因素,提出可行和有效的審計(jì)措施。
總之,數(shù)據(jù)倉庫是面向主題的、集成的、時(shí)變的和非易失的單一站點(diǎn)的一致數(shù)據(jù)存儲(chǔ)。它能夠?qū)⒎植荚诓煌倪壿嬑锢砦恢蒙系母鞣N數(shù)據(jù)進(jìn)行加工,形成多維的、面向分析的環(huán)境,以更好地為決策者提供各種有效的數(shù)據(jù)分析,起到?jīng)Q策支持的作用。
3 數(shù)據(jù)倉庫的設(shè)計(jì)考慮
3. 1建模考慮
在清晰了解用于風(fēng)險(xiǎn)導(dǎo)向?qū)徲?jì)決策支持的數(shù)據(jù)處理特殊需求之后,下一步要做的是數(shù)據(jù)倉庫模型的設(shè)計(jì)。數(shù)據(jù)倉庫建模事關(guān)后期在線分析處理(OLAP)和在線分析挖掘(OLAM)的實(shí)現(xiàn),又和最終用戶的使用細(xì)節(jié)密切相關(guān),所以是整個(gè)系統(tǒng)的關(guān)鍵問題。在這一步中,結(jié)合具體的系統(tǒng)環(huán)境,主要需要考慮以下4個(gè)方面的問題:
(1)數(shù)據(jù)倉庫模型是否支持全部應(yīng)用模式;
(2)數(shù)據(jù)倉庫模式的設(shè)計(jì)是否統(tǒng)籌考慮審計(jì)風(fēng)險(xiǎn)因素?cái)?shù)據(jù)處理效率和數(shù)據(jù)粒度的沖突問題;
(3)數(shù)據(jù)模式的可擴(kuò)充性;
(4)數(shù)據(jù)倉庫模式的設(shè)計(jì)應(yīng)提供足夠的冗余度以實(shí)現(xiàn)歷史數(shù)據(jù)組織和操作型數(shù)據(jù)的并行。
3. 2建模方法
“實(shí)體-聯(lián)系”數(shù)據(jù)模型是聯(lián)機(jī)事務(wù)處理(OLTP)通用數(shù)據(jù)模型。但數(shù)據(jù)倉庫需要支持聯(lián)機(jī)分析處理(OLAP),因而必須采用多維數(shù)據(jù)模型。該模型有3種形式:星形模型、雪花模型、事實(shí)星座模型。這里只介紹最基本的星型模型。星形模型的數(shù)據(jù)倉庫包括:一個(gè)大的、包含大批數(shù)據(jù)、不含冗余的中心表(事實(shí)表),一組小的附屬表(維表),每維一個(gè)。在這種模式中,維表圍繞中心表顯示在射線上,形狀很像星云爆發(fā)并由此得名。星形模型圖如圖1所示。
4 數(shù)據(jù)倉庫設(shè)計(jì)的過程
數(shù)據(jù)倉庫的設(shè)計(jì)可分為4個(gè)步驟:數(shù)據(jù)預(yù)處理、數(shù)據(jù)倉庫概念模型設(shè)計(jì)、數(shù)據(jù)倉庫邏輯模型設(shè)計(jì)、數(shù)據(jù)倉庫物理模型設(shè)計(jì)。
4. 1原始財(cái)務(wù)數(shù)據(jù)預(yù)處理
被審計(jì)企業(yè)財(cái)務(wù)數(shù)據(jù)從對(duì)被審計(jì)單位進(jìn)行審計(jì)時(shí)采集,粗錄入數(shù)據(jù)難免有各種錯(cuò)誤,可能不完整或不一致。數(shù)據(jù)預(yù)處理技術(shù)可以大大提高數(shù)據(jù)的質(zhì)量,從而有助于提高其后的挖掘過程的精度和性能。由于高質(zhì)量的決策必然依賴于高質(zhì)量的數(shù)據(jù),因此財(cái)務(wù)數(shù)據(jù)預(yù)處理是知識(shí)發(fā)現(xiàn)過程的重要步驟。數(shù)據(jù)預(yù)處理的通用技術(shù)如圖2所示。
4. 2概念模型的設(shè)計(jì)
和關(guān)系數(shù)據(jù)庫的建模過程一樣,進(jìn)行數(shù)據(jù)倉庫設(shè)計(jì)首先需界定系統(tǒng)邊界。建立一個(gè)用于決策分析的數(shù)據(jù)倉庫,從技術(shù)角度講,無法在設(shè)計(jì)之初就得到詳細(xì)而明確的需求,但是仍可根據(jù)項(xiàng)目目標(biāo)界定方向性的問題,如有哪些決策目標(biāo)、待分析的數(shù)據(jù)對(duì)象、數(shù)據(jù)源狀況等??梢該?jù)此劃定當(dāng)前的大致系統(tǒng)邊界,然后集中精力進(jìn)行最需要部分的開發(fā)。概念模型設(shè)計(jì)在原有的數(shù)據(jù)庫基礎(chǔ)上建立了一個(gè)較為穩(wěn)固的概念模型。
在這一步中,首先確定系統(tǒng)所包含的主題域,即審計(jì)風(fēng)險(xiǎn)的統(tǒng)計(jì)量(應(yīng)收賬款、資產(chǎn)負(fù)債率、利潤(rùn)率),然后對(duì)主題域內(nèi)容進(jìn)行較明確的描述,包括時(shí)間、行業(yè)、 規(guī)模、地域等維度的屬性組。
4. 3邏輯模型設(shè)計(jì)的特殊考慮
根據(jù)概念模型確定的主題域,結(jié)合項(xiàng)目背景,設(shè)計(jì)數(shù)據(jù)倉庫的維表和事實(shí)表的邏輯模型。維表設(shè)計(jì)中一個(gè)很重要的問題是維粒度的層次劃分。粒度指的是數(shù)據(jù)倉庫中數(shù)據(jù)單元的細(xì)節(jié)程度或綜合程度的級(jí)別。細(xì)節(jié)程度越高,粒度級(jí)就越低;相反,細(xì)節(jié)程度越低,粒度級(jí)就越高。例如,時(shí)間維按照粒度層次由高到低可劃分為年、季度、月、周、日5個(gè)等級(jí)。粒度層次劃分適當(dāng)與否直接影響到數(shù)據(jù)倉庫重要存儲(chǔ)的數(shù)據(jù)量、查詢方法和數(shù)據(jù)倉庫整個(gè)體系結(jié)構(gòu)。事實(shí)表描述用戶關(guān)心的主題信息,比如應(yīng)收賬款的大小、主營(yíng)業(yè)務(wù)收入的多少等。維表和事實(shí)表通過公共碼聯(lián)系在一起,形成一個(gè)完整的主題域。事實(shí)表依靠外鍵和維表建立聯(lián)系。例如,主營(yíng)業(yè)務(wù)收入事實(shí)表與時(shí)間維表的聯(lián)系就是依靠外鍵聯(lián)系實(shí)現(xiàn)的。時(shí)間維度表的設(shè)計(jì)見表1。
行業(yè)維度表的設(shè)計(jì)劃分了農(nóng)、林、牧、漁業(yè),采掘業(yè),制造業(yè),電力、煤氣及水的生產(chǎn)和供應(yīng)業(yè),建筑業(yè),交通運(yùn)輸、倉儲(chǔ)業(yè),信息技術(shù)業(yè),批發(fā)和零售貿(mào)易、金融、保險(xiǎn)業(yè)、房地產(chǎn)業(yè),社會(huì)服務(wù)業(yè)、傳播與文化產(chǎn)業(yè),綜合類等,參見表2。
規(guī)模維度的設(shè)計(jì)劃分了員工數(shù)、銷售量、資產(chǎn)總額,參見表3。
地區(qū)維度的設(shè)計(jì)劃分了地區(qū)、省、市、縣四級(jí)粒度,參見表4。
事實(shí)表包含所有維表的主碼,并統(tǒng)計(jì)計(jì)數(shù)、計(jì)和、平均等量, 參見表5。
4. 4物理模型的特殊考慮
物理模型是指數(shù)據(jù)在數(shù)據(jù)倉庫中的存放形式和數(shù)據(jù)的組織。目前的數(shù)據(jù)倉庫都是建立在關(guān)系型數(shù)據(jù)庫的基礎(chǔ)上,其數(shù)據(jù)存放是由數(shù)據(jù)庫系統(tǒng)進(jìn)行管理的,因此物理模型設(shè)計(jì)主要考慮物理數(shù)據(jù)庫的設(shè)計(jì),包括數(shù)據(jù)的存儲(chǔ)表結(jié)構(gòu)、索引策略、數(shù)據(jù)的存放位置和存儲(chǔ)分配。
5 有關(guān)完整的風(fēng)險(xiǎn)導(dǎo)向?qū)徲?jì)決策支持系統(tǒng)設(shè)計(jì)
審計(jì)決策支持系統(tǒng)利用微軟公司提供的集成開發(fā)環(huán)境.NET框架和新一代面向?qū)ο蟮拈_發(fā)語言C#來開發(fā)。ASP.NET是微軟公司繼ASP之后推出的一項(xiàng)新技術(shù),使用.NET框架提供的編程類庫構(gòu)建而成,用于創(chuàng)建管理和部署Web應(yīng)用程序。在.NET體系結(jié)構(gòu)中,XML作為一種實(shí)現(xiàn)應(yīng)用間無逢連接的手段,用于多種應(yīng)用間的數(shù)據(jù)采集與合并,以及不同應(yīng)用間的互操作和協(xié)同工作。ASP.NET中構(gòu)造的解析器MSXML能夠處理很多XML任務(wù),利用XML和ASP.NET開發(fā)基于Web的動(dòng)態(tài)應(yīng)用程序已成為網(wǎng)絡(luò)應(yīng)用的主流。完整運(yùn)行方式設(shè)計(jì)見圖3。
數(shù)據(jù)倉庫從理論到技術(shù)包括很多方面,其全面實(shí)施需要大量的人力、資源和時(shí)間。本文結(jié)合風(fēng)險(xiǎn)導(dǎo)向?qū)徲?jì)的理念,探討數(shù)據(jù)倉庫模型設(shè)計(jì)的過程和審計(jì)決策支持系統(tǒng)運(yùn)行方式,力求為審計(jì)信息化的進(jìn)一步發(fā)展提供新的思路。
主要參考文獻(xiàn)
[1] 劉汝焯. 計(jì)算機(jī)審計(jì)技術(shù)和方法[M]. 北京:清華大學(xué)出版社,2004.
[2] 劉勇軍, 聶規(guī)劃. 基于.NetWeb Service的知識(shí)管理系統(tǒng)的實(shí)現(xiàn)[J]. 武漢理工大學(xué)學(xué)報(bào):信息與管理工程版,2006(2).
[3] 蔣益?。?計(jì)算機(jī)審計(jì)數(shù)據(jù)處理方法探討[J]. 商業(yè)會(huì)計(jì):下半月,2006(9).
[4] 李祎,胡建華,周楓. 基于數(shù)據(jù)倉庫的決策支持系統(tǒng)的分析與研究[J]. 電腦知識(shí)與技術(shù):學(xué)術(shù)交流,2006(2b).