[摘 要] 本文主要討論了財會信息資源在信息技術和網(wǎng)絡環(huán)境下建立元數(shù)據(jù)標準的必要性。由于企業(yè)信息化程度的提高,各類組織和機構已經(jīng)保存了大量的財務和會計領域的信息資源。要對這些數(shù)量巨大的、非標準化的財會信息資源進行研究和挖掘,長期保存并充分利用這些財會信息資源,目前的技術關鍵是要構建完善的財會信息資源數(shù)據(jù)倉庫,以便利用各種信息處理工具和OLAP工具對這些資源進行數(shù)據(jù)挖掘和分析研究。而數(shù)據(jù)倉庫的建立,需要有一個規(guī)范的元數(shù)據(jù)標準,需要構建在財會信息領域的元數(shù)據(jù)規(guī)范。為了便于財會資源的檢索和管理,開發(fā)和應用財會信息資源領域的元數(shù)據(jù)標準,是非常必要的。
[關鍵詞] 財會信息資源;元數(shù)據(jù);數(shù)據(jù)倉庫
[中圖分類號]F232[文獻標識碼]A[文章編號]1673-0194(2008)17-0004-03
一、引 言
隨著企業(yè)會計信息化程度的提升,企業(yè)以及有關管理機構已經(jīng)逐步擺脫了經(jīng)濟業(yè)務的手工處理,走上了企業(yè)信息化的道路。多年來這些企業(yè)和組織都已經(jīng)累積了大量的財務和會計方面的業(yè)務數(shù)據(jù)和管理信息。在企業(yè)的信息系統(tǒng)數(shù)據(jù)庫及其他業(yè)務相關的存儲介質中,保存了大量的會計和財務活動形成的各種以電子文檔形式存在的財會數(shù)據(jù)和財會信息,以及與電子文檔相關聯(lián)的其他介質文檔。這些數(shù)據(jù)和信息是企業(yè)的業(yè)務經(jīng)營的信息資源,是一種很有價值的財富。無論是企業(yè)制定經(jīng)濟發(fā)展戰(zhàn)略,還是經(jīng)濟決策方案的選擇等都需要充分利用這些數(shù)據(jù)和信息。企業(yè)已經(jīng)存在的豐富的財會信息資源,如果不去加以充分利用,則是對資源的浪費。因此,如何充分利用財會信息資源,讓這些寶貴的資源為企業(yè)的經(jīng)營和發(fā)展作出貢獻,是企業(yè)實施信息化以后所面臨的重要課題。
國際著名IT咨詢公司高德納(Gartner)將元數(shù)據(jù)管理列入2008年十大戰(zhàn)略性IT技術,高德納認為“元數(shù)據(jù)是信息基礎設施的基礎,在整個IT系統(tǒng),如服務登記和寄存、Web語義、配置管理數(shù)據(jù)庫(CMDB)、經(jīng)營服務登記,以及應用開發(fā)系統(tǒng)內比比皆是。在業(yè)內人士看來,元數(shù)據(jù)不僅僅關系到信息管理,其應用范圍非常廣泛,可以說,元數(shù)據(jù)無處不在。
二、 財會信息資源管理的要求
具體地講,財會信息資源就是指各類經(jīng)濟組織在財務、會計等管理活動中形成的各種數(shù)據(jù)和信息,一般以各種格式的電子文檔方式表達。如數(shù)據(jù)文件方式存在的憑證、報表、交易記錄等;以多媒體文檔存在的會議錄音、掃描紙質文件的圖像等,所有這些可以按時間序列表達的數(shù)據(jù)和信息,是企業(yè)在長期經(jīng)營過程中逐步累積起來的,對企業(yè)制定發(fā)展戰(zhàn)略,進行經(jīng)濟決策,編制全面預算等都是至關重要的。
隨著企業(yè)IT信息化建設如火如荼地進行了數(shù)十年,大多數(shù)企業(yè)逐漸擁有了ERP、CRM、SCM等系統(tǒng)。在企業(yè)的這些分散的業(yè)務系統(tǒng)里存放著大量珍貴的數(shù)據(jù)。由于原來企業(yè)各業(yè)務系統(tǒng)建設的出發(fā)點,都只考慮單系統(tǒng)自身的完整性和一致性,當企業(yè)想從全局層次上把這些分散的系統(tǒng)有機地集成起來的時候,人們會發(fā)現(xiàn)這種工作的難度很大。在網(wǎng)絡環(huán)境中,企業(yè)的這些財會信息資源是以各種不同格式的數(shù)字化電子文檔存在于各個信息系統(tǒng)中,要充分利用這些財會信息資源,應該進行數(shù)據(jù)的整合,即建立一個集中分布式的、異構、可擴充、可集成、有統(tǒng)一數(shù)據(jù)模型、有多種角度視圖的、可交換的和安全可靠的復合數(shù)據(jù)庫系統(tǒng)或數(shù)據(jù)倉庫系統(tǒng)。這種數(shù)據(jù)集中管理、充分共享的數(shù)據(jù)系統(tǒng)將成為企業(yè)各業(yè)務系統(tǒng)、各部門之間協(xié)同工作的數(shù)據(jù)中心,是企業(yè)甚至行業(yè)的信息中心。
信息是現(xiàn)代企業(yè)的重要資源,是企業(yè)運用科學管理、決策分析的基礎。目前,大多數(shù)企業(yè)花費大量的資金和時間來構建聯(lián)機事務處理(OLTP)的業(yè)務系統(tǒng)和辦公自動化系統(tǒng),用來記錄事務處理的各種相關數(shù)據(jù)。據(jù)統(tǒng)計,每經(jīng)過2~3年時間數(shù)據(jù)量就會成倍增長,這些數(shù)據(jù)蘊含著巨大的商業(yè)價值,而企業(yè)所關注的通常只占在總數(shù)據(jù)量的2%~4%。因此,企業(yè)仍然沒有最大化地利用已存在的數(shù)據(jù)資源,以至于浪費了時間和資金,也失去制定關鍵商業(yè)決策的最佳契機。企業(yè)希望通過各種技術手段,把數(shù)據(jù)轉換為信息和知識,為企業(yè)經(jīng)營決策服務,一個有效的元數(shù)據(jù)方案可以幫助企業(yè)實現(xiàn)ETL(Extract-Transform-Load)過程。能夠按照統(tǒng)一的規(guī)則集成并提高數(shù)據(jù)的價值,完成數(shù)據(jù)從數(shù)據(jù)源向目標數(shù)據(jù)倉庫轉化的過程,是實施數(shù)據(jù)倉庫的重要步驟。
三、 什么是元數(shù)據(jù)
元數(shù)據(jù)是描述其他數(shù)據(jù)或數(shù)據(jù)集的數(shù)據(jù),或者說是描述數(shù)據(jù)及其環(huán)境的數(shù)據(jù)。它是一種廣泛存在的現(xiàn)象,在許多領域有其具體的定義和應用,例如傳統(tǒng)的書目數(shù)據(jù)、產品目錄、人事檔案等都有元數(shù)據(jù)的蹤影。
元數(shù)據(jù)是一種編碼體系,為各種形態(tài)的數(shù)字化資源和資源集合提供規(guī)范的、普遍的描述方法和檢索工具。同時,元數(shù)據(jù)也為各類分布式的、多種類型數(shù)字化資源構成的信息資源體系(如財會信息資源)提供數(shù)據(jù)整合和管理的有效工具。
一般來說,元數(shù)據(jù)有兩方面的用途。首先,元數(shù)據(jù)能提供基于用戶的信息,如記錄數(shù)據(jù)項的業(yè)務描述信息的元數(shù)據(jù)能幫助用戶使用數(shù)據(jù)。其次,元數(shù)據(jù)能支持系統(tǒng)對數(shù)據(jù)的管理和維護,如關于數(shù)據(jù)項存儲方法的元數(shù)據(jù)能支持系統(tǒng)以最有效的方式訪問數(shù)據(jù)。具體來說,在數(shù)據(jù)倉庫系統(tǒng)中,元數(shù)據(jù)機制主要支持以下5類系統(tǒng)管理功能:
(1)描述哪些數(shù)據(jù)在數(shù)據(jù)倉庫中,即對進入數(shù)據(jù)倉庫的數(shù)據(jù)進行標識。
(2)對要進入數(shù)據(jù)倉庫中的數(shù)據(jù)和從數(shù)據(jù)倉庫中產生的數(shù)據(jù)進行定義。
(3)記錄根據(jù)業(yè)務事件發(fā)生而隨之進行的數(shù)據(jù)抽取工作時間安排。
(4)記錄并檢測系統(tǒng)數(shù)據(jù)一致性的要求和執(zhí)行情況。
(5)衡量數(shù)據(jù)質量。
元數(shù)據(jù)對信息資源或數(shù)據(jù)集等數(shù)據(jù)對象的屬性予以描述,使信息資源或數(shù)據(jù)資源等對象能夠被識別、檢索,能夠追蹤資源在使用過程中的變化,實現(xiàn)簡單高效地管理海量數(shù)據(jù)和在網(wǎng)絡化環(huán)境中實現(xiàn)信息資源的一體化組織以及對這些信息資源的有效管理。
元數(shù)據(jù)在數(shù)據(jù)倉庫中起到了非常重要的作用:在數(shù)據(jù)的采集和提取時,元數(shù)據(jù)對資源進行描述和標識;在數(shù)據(jù)轉換、提煉、存儲時,元數(shù)據(jù)起了橋梁的作用;在進行數(shù)據(jù)檢索和利用時,元數(shù)據(jù)可以幫助用戶快速、準確地獲得數(shù)據(jù)。
四、 財會信息資源元數(shù)據(jù)標準
為了在財會信息資源領域更好地運用元數(shù)據(jù),為財會信息資源領域的數(shù)據(jù)中心和數(shù)據(jù)倉庫的建設服務,使不同的數(shù)據(jù)倉庫和數(shù)據(jù)中心之間能夠更好地進行信息交換和共享,實現(xiàn)信息的聯(lián)機檢索,需要對財會信息資源領域的元數(shù)據(jù)使用建立一種規(guī)范。
元數(shù)據(jù)標準是某一特定領域或專業(yè)團體為了使用元數(shù)據(jù)來管理、描述和保存他們的豐富多樣的資源,根據(jù)自身特殊的、多樣化的需求,專門地計劃、倡議和制定的標準,其目標旨在規(guī)范和統(tǒng)一本領域的元數(shù)據(jù)應用和管理,提高本領域的數(shù)據(jù)共享程度,便于相關信息資源的充分利用。不同領域有不同的元數(shù)據(jù)標準,如國土資源元數(shù)據(jù)標準、電子政務元數(shù)據(jù)標準等。
財會信息資源元數(shù)據(jù)標準是適用于財會信息資源領域的元數(shù)據(jù)標準。財會信息資源元數(shù)據(jù)標準可以按標準系統(tǒng)的結構要素及其發(fā)生作用的有效范圍劃分為3個不同的層次,即核心層、一般應用層和具體應用層。
核心層財會信息資源元數(shù)據(jù)標準主要規(guī)范財會信息資源通用的屬性表達,相當于國家標準,其有效范圍比較廣泛。
一般應用層財會信息資源元數(shù)據(jù)標準主要規(guī)范某一具體領域的元數(shù)據(jù)應用,如財政領域、稅務領域、審計領域等,相當于行業(yè)標準。
具體應用層的財會信息資源元數(shù)據(jù)標準主要是對具體的業(yè)務所應用的元數(shù)據(jù)規(guī)范,應用的范圍很廣,相當于企業(yè)標準。
財會信息資源元數(shù)據(jù)標準的層次關系如圖1所示。
五、制定財會信息資源元數(shù)據(jù)標準的必要性
財會信息資源是企業(yè)在長期的信息化過程中由于各項經(jīng)濟業(yè)務的發(fā)生而形成的信息資源,這是一個非常龐大的信息資源,要能夠有效地對這些資源進行管理和利用,要將各種不同來源和不同結構的數(shù)據(jù)整合到數(shù)據(jù)倉庫,必須建立一套便于檢索的簡便的代碼系統(tǒng),這就需要設計面向財會信息資源的元數(shù)據(jù);為了實現(xiàn)對不同的數(shù)據(jù)庫、數(shù)據(jù)倉庫進行適當?shù)恼?,以實現(xiàn)商業(yè)智能系統(tǒng)(BI)和聯(lián)機分析處理(OLAP),就需要規(guī)范不同來源的基本數(shù)據(jù),就需要制定財會信息資源的元數(shù)據(jù)標準。
1. 元數(shù)據(jù)標準的制定是實現(xiàn)財會信息資源檢索的需要
制定財會信息技術元數(shù)據(jù)標準可以為財會信息資源的挖掘和利用提供便利。企業(yè)或政府部門在利用財會信息進行經(jīng)濟決策時,需要構建財會信息數(shù)據(jù)倉庫或數(shù)據(jù)中心,決策人員在進行經(jīng)濟決策時,需要從數(shù)據(jù)倉庫中檢索和獲取大量的為決策所需要的各種數(shù)據(jù)和信息。元數(shù)據(jù)體系的建立,可以對這些信息資源進行準確的標識和合理的描述,可以幫助財務決策人員實現(xiàn)各種OLAP方案,可以形成各種多維的數(shù)據(jù)報表和透視表,能夠更快、更精確地檢索到他們所需要的數(shù)據(jù)和信息。
2. 構建企業(yè)業(yè)務系統(tǒng)與決策支持系統(tǒng)聯(lián)系的需要
財會信息資源元數(shù)據(jù)標準為企業(yè)業(yè)務系統(tǒng)的面向應用的應用型數(shù)據(jù)和財務分析或財務決策支持系統(tǒng)需要的面向主體的決策型數(shù)據(jù)之間架起了一座溝通的橋梁。企業(yè)業(yè)務系統(tǒng)在日常業(yè)務中采集各種業(yè)務信息,同時也生產了各種決策和分析所需要的信息。但是,業(yè)務應用系統(tǒng)是為了業(yè)務管理這一主要目標的需求而建立的,將這些應用型數(shù)據(jù)轉化為數(shù)據(jù)倉庫所存儲的信息存在著復雜的轉換過程,元數(shù)據(jù)在這個轉換過程中,起了非常重要的作用。即將數(shù)據(jù)根據(jù)元數(shù)據(jù)所表示的主題詞進行重新組合和轉換。數(shù)據(jù)倉庫或數(shù)據(jù)中心由于數(shù)據(jù)鏈非常龐大,在數(shù)據(jù)管理上需要劃分成不同的層次進行,也需要按不同的主題進行重新整合,依據(jù)財會信息資源的特定主題或特征進行數(shù)據(jù)管理,需要通過元數(shù)據(jù)予以描述。通過統(tǒng)一數(shù)據(jù)口徑、完善指標體系、建立統(tǒng)一數(shù)據(jù)視圖,可確保數(shù)據(jù)的完整性、準確性、一致性,從而有效地在各個業(yè)務系統(tǒng)內進行數(shù)據(jù)的轉換和整理工作。
3. 財會信息資源的長期保存的需要
由于信息技術的普及,使企業(yè)累計了大量的財會信息和數(shù)據(jù),這些信息的保存方法與傳統(tǒng)的保存方法有很大的區(qū)別。信息與承載信息的物理載體出現(xiàn)了分離狀態(tài),數(shù)字資源的長期保存與傳統(tǒng)的信息保存或收藏有很大的區(qū)別,傳統(tǒng)的信息保存是將信息連同信息的載體一起保存的,如碑刻、書籍等,而數(shù)字化的信息資源的保存僅僅保存信息資源而不保存相關的物理載體,財會信息資源的生存并不取決于其載體的壽命,而是取決于該資源的內容能否經(jīng)常地被從一個載體轉到另一個載體的可能性。數(shù)字化的財會信息資源是以一定格式的電子文檔方式保存的,由于產生這些電子文檔的應用程序不同,文件格式便存在著很大的差異,應用系統(tǒng)的頻繁升級和轉換,給這些資源的長期保存帶來了很大的問題。應用元數(shù)據(jù)描述資源的相關屬性,可以比較好地完成這種信息資源的轉換,能夠隨著時間的流逝來跟蹤數(shù)據(jù)結構的變化。統(tǒng)一標準的元數(shù)據(jù)方案,對信息資源能夠得到長期保存至關重要。
4. 保證財會信息資源質量的需要
對于已經(jīng)建設有BI/DW系統(tǒng)的企業(yè)而言,企業(yè)內部分散著數(shù)十種系統(tǒng)的情況是很普遍的現(xiàn)象。這些企業(yè)的業(yè)務人員和決策層所關注的一些統(tǒng)計報表和指標,往往是經(jīng)過許多業(yè)務系統(tǒng)和若干數(shù)據(jù)處理環(huán)節(jié)而形成的。當最末端的數(shù)據(jù)發(fā)生異常時,在沒有元數(shù)據(jù)管理系統(tǒng)的情況下,需要許多單位和部門(包括軟件集成商)的人共同參與,利用手工的方式去逐級查找數(shù)據(jù)出錯的原因。這種方式不僅不利于問題的及時發(fā)現(xiàn),而且一旦出現(xiàn)問題,很難在短時間內定位問題,甚至根本不可能定位問題的所在。而利用元數(shù)據(jù)管理系統(tǒng)的系統(tǒng)分析等功能,可以很容易地定位問題,再配合監(jiān)控規(guī)則的設置,使問題發(fā)現(xiàn)的及時性大大提高。元數(shù)據(jù)管理系統(tǒng)可在統(tǒng)一數(shù)據(jù)視圖上進行指標一致性分析,可對關鍵業(yè)務的監(jiān)控規(guī)則進行設置和管理。隨著數(shù)據(jù)量的不斷積累,數(shù)據(jù)質量的問題日益突出,元數(shù)據(jù)管理平臺可作為全企業(yè)的數(shù)據(jù)質量管理的基礎平臺。
總之,充分利用財會信息資源和長期保存這些資源都需要有應用于財會信息資源領域的元數(shù)據(jù)標準,按照財會信息資源元數(shù)據(jù)標準錄入的財會信息資源,可以比較方便地進行聯(lián)機檢索和數(shù)據(jù)共享,也可以比較可靠地進行各種數(shù)據(jù)轉換和存儲,有利于財會信息資源的充分利用,有利于保證財會信息資源的質量。
主要參考文獻
[1] DCMI推薦標準. ANSI/NISO Z39.85-2001 Dublin Core Metadata Element Set(都柏林核心元素集1.1版)[S/OL]. http://dublincore.org/documents/dces/,2003-06-02.
[2] 國家標準化管理委員會. GB/T 19581-2004 信息技術 會計核算軟件數(shù)據(jù)接口[S]. 2006.
[3] 劉煒,李大玲,夏翠娟. 元數(shù)據(jù)與知識本體[J]. 圖書館雜志,2004(6).
[4] 王張琦,朱建國. 財務決策中的元數(shù)據(jù)應用[J]. 會計之友,2006(4):55-57.
[5] Gartner. 十大戰(zhàn)略性技術問鼎2008[N]. 中國計算機報,2007-11-02.