饒 偉 陳少靜
(建信金融科技有限責任公司Big Data中心 北京 100033)
審計作為國家治理和公司治理的必要環(huán)節(jié),受到了國家、政府、社會及企業(yè)組織等多層面的關注和重視.1998年國家審計署提出審計信息化建設意見,得到了時任國務院總理朱镕基的充分肯定和重視.審計署開始規(guī)劃和籌備國家層面的審計信息化工程,并于2005年11月15日通過了國家發(fā)改委組織的金審工程一期建設項目竣工驗收.2018年6月國家審計署啟動并完成了金審工程3期項目的采購[1].國家審計信息化建設已經(jīng)完成了3個階段的建設工作,進入配套管理升級和應用建設階段.其中,數(shù)據(jù)安全管理和應用模式是當前和今后建設和完善的重點工作.
審計信息化是以業(yè)務需求為驅(qū)動,以數(shù)據(jù)支撐和知識服務為基礎的系統(tǒng)工程.近年我國的審計信息化建設多以平臺建設、輔助服務建設、數(shù)據(jù)中臺建設為主[2-5].從審計信息化的業(yè)務需求來看,審計信息化的核心是數(shù)據(jù)資產(chǎn)的有效管理和利用.葉席軍[6]在財政預算審計系統(tǒng)設計和實現(xiàn)中就是圍繞數(shù)據(jù)搭建的數(shù)據(jù)源、數(shù)據(jù)采集、數(shù)據(jù)存儲、數(shù)據(jù)挖掘和數(shù)據(jù)結(jié)果可視化的5層系統(tǒng)架構(gòu),審計信息化的數(shù)據(jù)資產(chǎn)的安全管理都是滿足數(shù)據(jù)交互和審計業(yè)務數(shù)據(jù)分析需求[7].王傳合、趙利軍[8]根據(jù)等保2.0的要求提出了綜合數(shù)據(jù)簽名、數(shù)據(jù)加密、身份認證、數(shù)據(jù)防恢復、數(shù)據(jù)匿名、數(shù)據(jù)備份等多技術的數(shù)據(jù)安全保護措施.勾德杰[9]在數(shù)據(jù)資產(chǎn)質(zhì)量管理中將數(shù)據(jù)分析模型分為精確模型、統(tǒng)計模型和自定義模型3類,并針對性地設計了檢測模型管理模塊,有效控制用戶創(chuàng)建符合業(yè)務邏輯的數(shù)據(jù)分析模型.審計數(shù)據(jù)分析和數(shù)據(jù)挖掘的特殊性在于業(yè)務過程中的需求不確定,建模分析需要使用大量的貼源數(shù)據(jù)進行實驗性的分析,這顯然不符合數(shù)據(jù)安全管理的要求.金晨[10]將審計數(shù)據(jù)分析平臺直接搭建在生產(chǎn)數(shù)據(jù)之上,所有用戶均在生產(chǎn)真實數(shù)據(jù)上進行實驗性數(shù)據(jù)建模分析,顯然對于海量的審計數(shù)據(jù)集中安全管理來說是非常不適當?shù)?因此,在實踐落地過程中,審計數(shù)據(jù)管理平臺大多設計了對應的數(shù)據(jù)加工監(jiān)控、數(shù)據(jù)權限管理和審批流程.例如國家稅務總局在金稅工程中引入了數(shù)據(jù)加工監(jiān)控工程來實時或間隔監(jiān)控數(shù)據(jù)加工情況[11].周媛[12]對金盾工程和智慧警務中的信息安全問題進行了SWAT-AHP分析,針對分析結(jié)果在制度建設、一線人員的安全意識教育、安全技術引入、安全人才培養(yǎng)和軟硬件建設等多方面提出了全方面建議.張超[13]在山東省移動大數(shù)據(jù)分析系統(tǒng)中應用了層級式多租戶管理,利用統(tǒng)一權限管理對租戶數(shù)據(jù)權限和資源權限進行集中授權管理.李慶陽[14]在數(shù)據(jù)資產(chǎn)管理平臺中加入了用戶身份認證和權限審批、策略管理等模塊實現(xiàn)數(shù)據(jù)安全管理和應用.
綜上所述,一方面審計數(shù)據(jù)管理和應用模式不僅大大影響了審計數(shù)據(jù)分析技術的推廣應用,也嚴重制約了審計人員在數(shù)據(jù)實驗性使用過程中進行實驗分析.另一方面審計數(shù)據(jù)建模分析的不確定性嚴重制約審計數(shù)據(jù)分析應用的擴展性和共享性.針對上述審計業(yè)務數(shù)據(jù)分析需求與審計數(shù)據(jù)安全管理要求之間的矛盾,結(jié)合審計信息化建設的具體實踐,本文提出以審計數(shù)據(jù)標準化為基礎,通過審計數(shù)據(jù)結(jié)構(gòu)隔離與審計實驗分析數(shù)據(jù)漂白相結(jié)合的數(shù)據(jù)安全管理模式,有效地降低了審計數(shù)據(jù)分析的用戶使用的安全管理約束.同時,將實驗數(shù)據(jù)分析從應用數(shù)據(jù)分析中分離,針對性地提高了數(shù)據(jù)應用分析的使用效率,降低了數(shù)據(jù)應用分析過程中用戶實驗分析導致的生產(chǎn)系統(tǒng)故障發(fā)生率.
信息化審計的最大特點就是審計的大數(shù)據(jù)化[15],大數(shù)據(jù)化審計簡單概括就是對獲取的數(shù)據(jù)進行標準化處理,再提供給業(yè)務部門進行各種數(shù)據(jù)建模分析需求[16].基于審計數(shù)據(jù)結(jié)構(gòu)隔離與審計實驗分析數(shù)據(jù)漂白相結(jié)合的審計信息化的數(shù)據(jù)安全管理與應用模式的基本設計主要分為3層,如圖1所示.
圖1 審計信息化的數(shù)據(jù)安全管理與應用模式設計圖
第1層為數(shù)據(jù)采集和標準化層,主要是將審計所需的報送數(shù)據(jù)還原成原始數(shù)據(jù).再通過審計數(shù)據(jù)標準化模板轉(zhuǎn)換成審計標準數(shù)據(jù)后集中存儲.
第2層為安全隔離層,主要是將生產(chǎn)數(shù)據(jù)進行結(jié)構(gòu)隔離和數(shù)據(jù)漂白,對數(shù)據(jù)和數(shù)據(jù)表結(jié)構(gòu)進行分離管理,分別存儲為實驗數(shù)據(jù)庫和應用數(shù)據(jù)庫.實驗數(shù)據(jù)區(qū)提供標準化后的數(shù)據(jù)表結(jié)構(gòu)給用戶進行實驗性的審計數(shù)據(jù)建模分析,包括模型新建及測試工作,模型運行結(jié)果均為非真實數(shù)據(jù)結(jié)果.應用數(shù)據(jù)區(qū)提供真實數(shù)據(jù),但數(shù)據(jù)表結(jié)構(gòu)為轉(zhuǎn)換后統(tǒng)一的、無業(yè)務邏輯的數(shù)據(jù)表,用戶只能在應用數(shù)據(jù)區(qū)運行轉(zhuǎn)換后的數(shù)據(jù)分析模型,并得到無業(yè)務邏輯的數(shù)據(jù)分析結(jié)果.
第3層為業(yè)務應用層,通過數(shù)據(jù)轉(zhuǎn)換和還原,將應用數(shù)據(jù)分析結(jié)果還原成具有業(yè)務邏輯的數(shù)據(jù)分析結(jié)果.
基于結(jié)構(gòu)隔離和數(shù)據(jù)漂白相結(jié)合的審計數(shù)據(jù)安全管理與應用模式的主要特點可概括如下:
1)將數(shù)據(jù)治理和數(shù)據(jù)標準化工作集中在底層處理,用戶使用的均是標準化后的數(shù)據(jù),降低了數(shù)據(jù)使用的難度,提高了數(shù)據(jù)使用效率,減少了審計過程中實驗數(shù)據(jù)分析造成的生產(chǎn)系統(tǒng)故障.
2)對審計所需的標準化后的數(shù)據(jù)進行了2種處理,即數(shù)據(jù)漂白和結(jié)構(gòu)隔離.漂白后的數(shù)據(jù)有生產(chǎn)數(shù)據(jù)表結(jié)構(gòu),但無真實數(shù)據(jù).因此,可提供給審計人員進行數(shù)據(jù)分析實驗,并可以將比較好的數(shù)據(jù)分析模型保存至業(yè)務數(shù)據(jù)分析模型庫中,或者與其他審計項目組及審計人員共享、復用.應用數(shù)據(jù)區(qū)存儲的是標準的生產(chǎn)數(shù)據(jù),但進行了數(shù)據(jù)表格式的轉(zhuǎn)換處理,數(shù)據(jù)表名均為無業(yè)務邏輯的Table1,Table2,Table3……字段名也是無業(yè)務邏輯的Column1,Column2,Column3……無業(yè)務表名和字段名與生產(chǎn)真實表名和字段名的對應關系通過多套映射表進行轉(zhuǎn)換和還原.
3)審計數(shù)據(jù)分析模型在應用數(shù)據(jù)區(qū)運行時,完全無業(yè)務邏輯,數(shù)據(jù)結(jié)果只有通過同一套轉(zhuǎn)換映射表才能還原成具有業(yè)務邏輯的結(jié)果.因此,整個應用數(shù)據(jù)存儲和分析區(qū)的數(shù)據(jù)和模型即使發(fā)生了泄露,在無配套映射轉(zhuǎn)換表的情況下僅僅只是一堆沒有業(yè)務意義的數(shù)據(jù).
審計數(shù)據(jù)建模分析是審計過程中的主要工作之一,也是除了現(xiàn)場審計核查工作外,非現(xiàn)場審計的最核心、最基礎的必備工作.根據(jù)審計信息化的數(shù)據(jù)管理框架,將審計的數(shù)據(jù)分析劃分為應用數(shù)據(jù)庫和實驗數(shù)據(jù)庫.在審計數(shù)據(jù)建模分析應用中,可利用數(shù)據(jù)管理框架,提高審計數(shù)據(jù)建模分析的通用性、共享性和針對性.
如圖2所示,基于分析原子的審計數(shù)據(jù)建模分析主要由3部分組成:
圖2 基于分析原子的審計數(shù)據(jù)建模分析
1)基于知識庫的業(yè)務需求理解處理;
2)基于實驗數(shù)據(jù)庫的分析原子匹配;
3)基于應用數(shù)據(jù)庫的分析原子組合及數(shù)據(jù)映射關系轉(zhuǎn)換和還原.
例如業(yè)務部門提出需求——“轉(zhuǎn)移虧損情況核查審計”.通過審計知識庫中現(xiàn)有制度分析及案例事件提取情況,將該需求理解為:“少數(shù)股東凈資產(chǎn)收益率遠低于母公司股東凈資產(chǎn)收益率,存在企業(yè)通過子公司轉(zhuǎn)移虧損的情況.”再通過規(guī)則庫匹配對應需求理解的相關規(guī)則和指標為:ROE差異≤-10%;少數(shù)股東損益<0.進一步拆分或匹配分析原子、ROE計算和少數(shù)股東損益計算.如果匹配上現(xiàn)有規(guī)則和指標的分析原子,直接提取相關分析原子腳本,并按業(yè)務需求規(guī)則進行分析原子組合,生成審計數(shù)據(jù)分析業(yè)務模型.如果未能匹配,則繼續(xù)拆分或者新建分析原子.
業(yè)務審計數(shù)據(jù)分析模型以ROE差異指標模型為例:
1)ROE差異=(少數(shù)股東ROE-母公司ROE)/母公司ROE×100%;
2)ROE=稅后利潤/所有者權益×100%;
3)稅后利潤=利潤總額-所得稅;
4)匹配現(xiàn)有分析原子庫,所有分析原子均能匹配;
5)提取所有的分析原子,組合成審計數(shù)據(jù)分析業(yè)務模型.
實驗數(shù)據(jù)庫模型腳本以及轉(zhuǎn)化應用數(shù)據(jù)庫腳本情況如表1所示:
表1 業(yè)務數(shù)據(jù)分析需求拆分與模型轉(zhuǎn)換
注:“—”表示此分析原子為直接可獲取數(shù)據(jù),無需進一步拆解.
運行該數(shù)據(jù)模型,數(shù)據(jù)模型結(jié)果為index01=-12.5%.
數(shù)據(jù)模型結(jié)果還原成業(yè)務審計數(shù)據(jù)分析模型結(jié)果為:ROE差異=-12.5%.業(yè)務審計數(shù)據(jù)分析模型結(jié)果符合業(yè)務需求篩查要求,將結(jié)果記錄標記為疑點結(jié)果.
通過數(shù)據(jù)結(jié)構(gòu)隔離和數(shù)據(jù)漂白的轉(zhuǎn)換與還原映射關系表,將數(shù)據(jù)分析原子組合的業(yè)務模型轉(zhuǎn)換成應用數(shù)據(jù)庫中可以運行的數(shù)據(jù)分析模型,以及將數(shù)據(jù)分析模型結(jié)果還原成業(yè)務分析結(jié)果.其中,數(shù)據(jù)結(jié)構(gòu)隔離和數(shù)據(jù)標牌的轉(zhuǎn)換與還原映射關系如表2所示:
表2 轉(zhuǎn)換與還原映射關系表
從上述分析介紹和實踐案例中可以看出,審計信息化的數(shù)據(jù)安全管理架構(gòu)和應用模式針對性地解決了審計數(shù)據(jù)安全管理和業(yè)務需求的矛盾點——審計數(shù)據(jù)和審計分析業(yè)務邏輯保密與審計數(shù)據(jù)分析模型共享之間的矛盾.在審計數(shù)據(jù)標準化后,將標準數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)和真實數(shù)據(jù)進行分離.真實數(shù)據(jù)保存在應用數(shù)據(jù)庫中,但應用數(shù)據(jù)庫中無業(yè)務表結(jié)構(gòu).真實的表結(jié)構(gòu)保存在實驗數(shù)據(jù)庫中,但實驗數(shù)據(jù)庫中無真實數(shù)據(jù).因此,實驗數(shù)據(jù)庫可直接開放給所有用戶用于新建數(shù)據(jù)分析原子.用戶通過數(shù)據(jù)分析原子的組合形成業(yè)務分析模型,通過數(shù)據(jù)結(jié)構(gòu)映射關系表將數(shù)據(jù)分析模型結(jié)果還原成業(yè)務需求的結(jié)果.
這種數(shù)據(jù)安全管理模式的特點如下:
1)將數(shù)據(jù)的表結(jié)構(gòu)和真實數(shù)據(jù)進行隔離,最大限度地保障了審計數(shù)據(jù)安全、審計數(shù)據(jù)分析模型邏輯安全,且對數(shù)據(jù)隱私作了一定保護.
2)由于實驗數(shù)據(jù)庫中無真實業(yè)務數(shù)據(jù),因此可開放給所有用戶使用,可激勵所有業(yè)務人員進行數(shù)據(jù)分析原子的開發(fā)和驗證.
3)應用數(shù)據(jù)庫中無真實的數(shù)據(jù)表名稱和表結(jié)構(gòu),因此在業(yè)務數(shù)據(jù)庫中運行模型的模型邏輯和模型結(jié)果均無業(yè)務意義.因此,對真實數(shù)據(jù)增加了一層保密機制.
4)應用數(shù)據(jù)庫中運行的數(shù)據(jù)分析模型均是由實驗數(shù)據(jù)庫建立完成的數(shù)據(jù)分析原子組合而成,因此應用數(shù)據(jù)庫的運行模型從根本上規(guī)避了由于用戶實驗性數(shù)據(jù)分析導致的生產(chǎn)系統(tǒng)故障問題.
5)數(shù)據(jù)表名、表結(jié)構(gòu)的隔離是通過幾套映射表進行轉(zhuǎn)換,只有隔離和還原過程使用同一套映射表才能得到運行模型的業(yè)務結(jié)果.
6)由于數(shù)據(jù)隔離與還原映射表、標準化后的數(shù)據(jù)表結(jié)構(gòu)和標準化后的表數(shù)據(jù)3部分內(nèi)容同時滿足權限要求,才能得到真實的審計數(shù)據(jù)分析模型和模型的業(yè)務結(jié)果.因此,建議針對這3部分建立對應的管理機制,提升審計信息化數(shù)據(jù)安全管理能力和應用水平.
腳本1:
create table 模型結(jié)果_ROE差異 as
select
t02.集團名稱,
t02.單位名稱,
t02.股東性質(zhì),
(t02.指標值-t01.指標值)/t01.指標值×
100 as ROE差異率_百分比
from (
select
集團股東表.集團名稱,
集團股東表.股東性質(zhì),
集團股東表.是否母公司,
財務指標_ROE.單位名稱,
財務指標_ROE.賬套編號,
財務指標_ROE.賬套名稱,
財務指標_ROE.年度,
財務指標_ROE.指標值
from
財務指標_ROE
inner join
集團股東表
on 集團股東表.股東名稱=財務指標_
ROE.單位名稱
where
集團股東表.是否母公司=‘是’
or 集團股東表.是否母公司=‘Y’
)t01
inner join (
select
集團股東表.集團名稱,
集團股東表.股東性質(zhì),
集團股東表.是否母公司,
財務指標_ROE.單位名稱,
財務指標_ROE.賬套編號,
財務指標_ROE.賬套名稱,
財務指標_ROE.年度,
財務指標_ROE.指標值
from
財務指標_ROE
inner join
集團股東表
on 集團股東表.股東名稱=財務指標_
ROE.單位名稱
where
集團股東表.是否母公司=‘否’
or 集團股東表.是否母公司=‘N’
)t02 on t01.集團名稱=t02.集團名稱
where
(t01.集團名稱 like ‘%XXXXX%’
//設定待查集團名稱
or t01.單位名稱 like ‘%XXXXX%’)
//設定集團母公司名稱
and t01.年度=‘XXXX’ //設定年份
腳本2:
create table 財務指標_ROE as
select
財務指標_稅后利潤.單位名稱,
財務指標_稅后利潤.賬套編號,
財務指標_稅后利潤.賬套名稱,
財務指標_稅后利潤.年度,
財務指標_稅后利潤.科目名稱,
財務指標_稅后利潤.科目編碼,
財務指標_稅后利潤.金額/財務指標_所有
者權益.金額×100 as 指標值
from
財務指標_利潤總額
inner join
財務指標_所有者權益
on 財務指標_稅后利潤.單位名稱=財務指
標_所有者權益.單位名稱
and 財務指標_稅后利潤.賬套編號=財務
指標_所有者權益.賬套編號
and 財務指標_稅后利潤.賬套名稱=財務
指標_所有者權益.賬套名稱
and 財務指標_稅后利潤.年度=財務指標_
所有者權益.年度
and 財務指標_稅后利潤.科目編碼=財務
指標_所有者權益.科目編碼
腳本3:
create table 財務指標_稅后利潤 as
select
財務指標_利潤總額.單位名稱,
財務指標_利潤總額.賬套編號,
財務指標_利潤總額.賬套名稱,
財務指標_利潤總額.年度,
財務指標_利潤總額.科目名稱,
財務指標_利潤總額.科目編碼,
財務指標_利潤總額.指標值-財務指標_利潤所得稅費用.指標值 as 指標值
from
財務指標_利潤總額
inner join
財務指標_利潤所得稅費用
on 財務指標_利潤總額.單位名稱=財務指
標_利潤所得稅費用.單位名稱
and 財務指標_利潤總額.賬套編號=財務
指標_利潤所得稅費用.賬套編號
and 財務指標_利潤總額.賬套名稱=財務
指標_利潤所得稅費用.賬套名稱
and 財務指標_利潤總額.年度=財務指標_
利潤所得稅費用.年度
and 財務指標_利潤總額.科目編碼=財務指
標_利潤所得稅費用.科目編碼
腳本4:
create table 財務指標_利潤總額 as
select
科目余額.單位名稱,
科目余額.賬套編號,
科目余額.賬套名稱,
科目余額.年度,
科目余額.科目名稱,
科目余額.科目編碼,
科目余額.期末余額 as 指標值
from
科目余額
where
科目余額.科目名稱 like ‘%所有者權益
(或股東權益)合計%’
腳本5:
create table 財務指標_利潤所得稅費用 as
select
科目余額.單位名稱,
科目余額.賬套編號,
科目余額.賬套名稱,
科目余額.年度,
科目余額.科目名稱,
科目余額.科目編碼,
科目余額.期末余額 as 指標值
from
科目余額
where
科目余額.科目名稱 like ‘%減:所得稅費用%’
腳本6:
create table 財務指標_所有者權益 as
select
科目余額.單位名稱,
科目余額.賬套編號,
科目余額.賬套名稱,
科目余額.年度,
科目余額.科目名稱,
科目余額.科目編碼,
科目余額.期末余額 as 指標值
from
科目余額
where
科目余額.科目名稱 like ‘%所有者權益
(或股東權益)合計%’
腳本7:
create table 模型結(jié)果_index01 as
select
t02.column1,
t02.column1,
t02.column6,
(t02.column7-t01.column7)/t01.column7
×100 as ROE差異率_百分比
from (
select
table2.column1,
table2.column6,
table2.column5,
table1.column1,
table1.column2,
table1.column3,
table1.column4,
table1.column7
from
table1
inner join
table2
on table2.column2=table1.column1
where
table2.column5=‘是’
or table2.column5=‘Y’
)t01
inner join (
select
table2.column1,
table2.column6,
table2.column5,
table1.column1,
table1.column2,
table1.column3,
table1.column4,
table1.column7
from
table1
inner join
table2
on table2.column2=table1.column1
where
table2.column5=‘否’
or table2.column5=‘N’
)t02 on t01.column1=t02.column1
where
(t01.column1 like ‘%XXXXX%’
//設定待查column1
or t01.column1 like ‘%XXXXX%’)
//設定集團母公司名稱
and t01.column4=‘XXXX’ //設定年份