摘要:文章概述性的介紹了決策支持系統(tǒng)的數(shù)據(jù)分析技術(shù)、數(shù)據(jù)挖掘和數(shù)據(jù)倉庫相關(guān)技術(shù),基于傳統(tǒng)決策支持系統(tǒng)的缺點不足之處,提出了一種基于數(shù)據(jù)倉庫技術(shù)的決策支持系統(tǒng),介紹了其設(shè)計方案和開發(fā)方法。
關(guān)鍵詞:數(shù)據(jù)倉庫;決策支持系統(tǒng);DSS;OLAP;DM;DW
中圖分類號:TP311.131 文獻標識碼:A 文章編號:1007-9599 (2012) 09-0000-02
一、引言
決策支持系統(tǒng)是在管理學和運籌學的基礎(chǔ)上,以計算機技術(shù)和信息技術(shù)作為手段,通過人機交互實現(xiàn)管理決策活動。但隨著市場經(jīng)濟和計算機技術(shù)的迅猛發(fā)展,各行各業(yè)競爭日益激烈,在企業(yè)基于數(shù)據(jù)庫技術(shù)的傳統(tǒng)決策支持系統(tǒng)已達不到要求的背景條件下,建立基于數(shù)據(jù)倉庫的決策支持系統(tǒng)是必然的。數(shù)據(jù)倉庫技術(shù)的有點可以提高決策支持系統(tǒng)的能力,實現(xiàn)對企業(yè)信息的高度集成化、合理和有效的管理目的。
二、決策支持系統(tǒng)的相關(guān)技術(shù)
(一)數(shù)據(jù)分析技術(shù)(OLAP)。數(shù)據(jù)分析技術(shù)OLAP應用與聯(lián)機事務處理(OLTP)的應用不同。數(shù)據(jù)分析技術(shù)OLAP側(cè)重于對高層管理和分析人員提供決策支持,是可以設(shè)計應對復雜的分析操作,在分析人員的分析要求操作下,采用靈活快速地進行查詢處理,并且可以針對大數(shù)據(jù)量和類型復雜的數(shù)據(jù)進行查詢處理。最終以直觀易懂的形式提供查詢結(jié)果給高層管理人員以制定決策。數(shù)據(jù)分析技術(shù)OLAP還具有多維數(shù)據(jù)分析的特點,通過對多維數(shù)據(jù)進行鉆取、剖切和旋轉(zhuǎn)來實現(xiàn)對數(shù)據(jù)庫所提供的數(shù)據(jù)進行深入的多維數(shù)據(jù)分析,成功為決策者提供準確的決策支持依據(jù)。決策支持是多維結(jié)構(gòu)的支柱以及數(shù)據(jù)分析技術(shù)OLAP的核心。數(shù)據(jù)分析技術(shù)的多維數(shù)據(jù)分析特點可以與數(shù)據(jù)倉庫的多維數(shù)據(jù)組織相互結(jié)合、相互補充。設(shè)計中可以采用數(shù)據(jù)分析技術(shù)與數(shù)據(jù)倉庫技術(shù)相結(jié)合解決傳統(tǒng)決策支持系統(tǒng)中大量數(shù)據(jù)處理的問題。(二)數(shù)據(jù)挖掘技術(shù)(DM)。數(shù)據(jù)挖掘技術(shù)主要基于人工智能、統(tǒng)計學和機器技術(shù)等技術(shù)。數(shù)據(jù)挖掘技術(shù)是一種決策支持過程,可以自動化的分析企業(yè)的原有數(shù)據(jù),對其進行歸納性的推理,挖掘出其中的潛在模式,輔助決策人員做出正確的決策。數(shù)據(jù)挖掘的對象可以是數(shù)據(jù)庫、文件系統(tǒng),以及以其他組織在一起的數(shù)據(jù)集合,例如web數(shù)據(jù)資源和數(shù)據(jù)倉庫。數(shù)據(jù)挖掘首先應具有用于挖掘的數(shù)據(jù)源,在基于明確挖掘目標的前提下,結(jié)合各個專業(yè)人員參與,同時配有大量的資金是實現(xiàn)數(shù)據(jù)挖掘的關(guān)鍵。實現(xiàn)數(shù)據(jù)挖掘具有一定困難,難度在于數(shù)據(jù)積累的缺少、構(gòu)建業(yè)務模型、缺少有經(jīng)驗的實施者、各類人員之間的溝通障礙和初期資金投入較大等。雖然具有以上難度,但數(shù)據(jù)挖掘技術(shù)的前景由于其技術(shù)優(yōu)點還是被普遍看好的。(三)數(shù)據(jù)倉庫技術(shù)(DW)。數(shù)據(jù)倉庫是一個數(shù)據(jù)集合,數(shù)據(jù)集合具有集成的、隨時間變化、不可更新和面向主題的特點。數(shù)據(jù)倉庫可以支持企業(yè)的決策分析處理。數(shù)據(jù)倉庫存放的是靜態(tài)的歷史數(shù)據(jù),和傳統(tǒng)的數(shù)據(jù)庫相比,只能定時的刷新和添加。數(shù)據(jù)倉庫的結(jié)構(gòu)比較簡單,為中高層的管理人員提供決策支持。數(shù)據(jù)倉庫具有訪問頻率低和訪問量高的特點。數(shù)據(jù)倉庫與數(shù)據(jù)庫相比,數(shù)據(jù)倉庫訪問量高于數(shù)據(jù)庫的訪問量,數(shù)據(jù)倉庫的訪問響應時間要求相比數(shù)據(jù)庫并不高,不像數(shù)據(jù)庫要求響應時間要在幾秒鐘內(nèi)??梢詰獙Σ煌瑢哟蔚墓芾砣藛T,通過采用數(shù)據(jù)倉庫技術(shù)進行決策分析,可以提高管理決策的質(zhì)量和效果。
三、傳統(tǒng)決策支持系統(tǒng)的缺點與不足
(一)沒有有效的分析工具。首先應了解企業(yè)決策的過程,該過程包括提出問題、分析問題和解決問題的循環(huán)。而在其中的分析過程實質(zhì)上是對數(shù)據(jù)信息不斷的抽取過程,并對大量的分散數(shù)據(jù)進行快速綜合的分析,最終捕獲決策的相關(guān)信息。傳統(tǒng)的決策支持系統(tǒng)過于注重抽象的理論研究,不夠重視的分析工具,使分析工具不夠有效,所以得不到相應有效的分析結(jié)果。(二)統(tǒng)一性和完整性的不足。傳統(tǒng)決策支持系統(tǒng)的系統(tǒng)結(jié)構(gòu)是以模型庫、數(shù)據(jù)庫、方法庫所組成。但模型庫、數(shù)據(jù)庫和方法庫在決策支持系統(tǒng)開發(fā)過程中都是被獨立設(shè)計的,這樣在系統(tǒng)結(jié)構(gòu)上就存在統(tǒng)一性和完整性的不足,應用效果的并不理想。(三)數(shù)據(jù)源分析缺點。傳統(tǒng)決策支持系統(tǒng)是直接利用關(guān)系數(shù)據(jù)庫中的數(shù)據(jù)進行數(shù)據(jù)處理,只能對原始數(shù)據(jù)進行一般的匯總加工,提供決策的信息不足以滿足決策支持系統(tǒng)的需要。數(shù)據(jù)庫中的數(shù)據(jù)源由于抽取的數(shù)據(jù)各個部門沒有統(tǒng)一的格式標準,造成分析的不穩(wěn)定性;這樣在沒有統(tǒng)一標準的前題下,沒有統(tǒng)一格式的數(shù)據(jù)利用率就會很低,并且數(shù)據(jù)的可信度也會降低,會無法轉(zhuǎn)化為對決策者有用的決策信息。傳統(tǒng)決策支持系統(tǒng)是對存儲的數(shù)據(jù)在固定的期限內(nèi)才會進行提取分析,這時所累計的大量數(shù)據(jù)進行詳細的分析必然會導致分析效率的下降,給分析人員帶來大量的工作內(nèi)容,但如果不能進行詳細的分析,必然會導致有用的信息不能得到有效的分析利用嗎,從而提供準確有效的決策信息。(四)部件使用不理想。傳統(tǒng)決策支持系統(tǒng)的各部件中,可以直接使用的只有成形的商品軟件數(shù)據(jù)部件,而對于其他部件就無法直接使用,雖然計算機語言可以對傳統(tǒng)決策支持系統(tǒng)的接口進行設(shè)計和開發(fā),但這必然浪費大量的時間、人力和財力。
四、數(shù)據(jù)倉庫技術(shù)在決策支持系統(tǒng)構(gòu)建中的應用
設(shè)計思路是結(jié)合數(shù)據(jù)分析技術(shù)、數(shù)據(jù)挖掘和數(shù)據(jù)倉庫以及模型庫,建立一個綜合的決策支持系統(tǒng),該決策支持系統(tǒng)具有更強的決策屬性。實施這樣的決策支持系統(tǒng)是一個系統(tǒng)工程,也是一個一次性工程,因為不同的行業(yè)、不同的企業(yè)都會由于自身特點而有很大的不同。在這里試圖尋找出的共同的特點,把握其規(guī)律,為企業(yè)提供參考。現(xiàn)提出模型構(gòu)建如下。(一)系統(tǒng)的總體結(jié)構(gòu)?;跀?shù)據(jù)倉庫技術(shù)的決策支持系統(tǒng)首先應具有性能優(yōu)良的數(shù)據(jù)分析技術(shù)(OLAP),這是因為數(shù)據(jù)分析處理系統(tǒng)是整個決策支持系統(tǒng)中數(shù)據(jù)的重要來源,這樣才能夠建立完善的數(shù)據(jù)倉庫(DW),使其包括大量的、穩(wěn)定的、歷史性的本地內(nèi)部、本地外部以及遠程數(shù)據(jù),數(shù)據(jù)倉庫對數(shù)據(jù)分析處理系統(tǒng)數(shù)據(jù)庫中的數(shù)據(jù)進行集成、轉(zhuǎn)換和綜合等處理,之后將數(shù)據(jù)重新組合,構(gòu)成面向全局的數(shù)據(jù)視圖,為決策支持系統(tǒng)提供數(shù)據(jù)存儲和組織的基礎(chǔ);目前各個數(shù)據(jù)模型已有一定成熟的技術(shù),可以為之后的分析將以上所述數(shù)據(jù)重新組合。采用多維的數(shù)據(jù)模型同時結(jié)合和數(shù)據(jù)數(shù)據(jù)分析技術(shù)(OLAP)可以為用戶實現(xiàn)多維的數(shù)據(jù)分析,使用戶以更接直接可靠的分析數(shù)據(jù);數(shù)據(jù)挖掘(DM)是以數(shù)據(jù)倉庫技術(shù)(DW)和多維數(shù)據(jù)庫中大量的數(shù)據(jù)作為分析基礎(chǔ),可以自動的發(fā)現(xiàn)這些數(shù)據(jù)中存在的潛在模式,再基于這些分析出來的潛在模式作為基礎(chǔ)自動的做出分析預測。數(shù)據(jù)挖掘(DM)中發(fā)現(xiàn)的知識可以直接用于指導數(shù)據(jù)分析技術(shù)(OLAP)的分析處理,而數(shù)據(jù)分析技術(shù)(OLAP)分析得出的知識也可以立即補充到系統(tǒng)的知識庫中形成循環(huán)。
在決策支持系統(tǒng)中,數(shù)據(jù)倉庫是DSS的基礎(chǔ),完成對決策主題數(shù)據(jù)的存儲和整合,數(shù)據(jù)數(shù)據(jù)分析技術(shù)(OLAP)可以分析多維數(shù)據(jù),數(shù)據(jù)挖掘(DM )的作用是挖掘數(shù)據(jù)庫以及數(shù)據(jù)倉庫中的知識。其中模型庫可以配以多個廣義模型組合起來輔助系統(tǒng)決策,決策支持系統(tǒng)利之后再利用知識推理的方式進行定性的分析,最終做出綜合的決策。可以看出集成數(shù)據(jù)倉庫、數(shù)據(jù)分析和數(shù)據(jù)挖掘的綜合決策支持系統(tǒng),這些技術(shù)相互補充、相互依賴,不僅可以發(fā)揮各自的輔助決策優(yōu)勢,同時結(jié)合還實現(xiàn)更高效的輔助決策。簡單的說,我們可以概括的總結(jié)為DSS=DW+OLAP+DM(二)數(shù)據(jù)倉庫系統(tǒng)的建立。1.數(shù)據(jù)倉庫系統(tǒng)的構(gòu)成。一個完整的數(shù)據(jù)倉庫包數(shù)據(jù)獲取部分、管理部分、括倉庫部分、分析工具四部分。數(shù)據(jù)獲取部分包括內(nèi)部數(shù)據(jù)庫、外部數(shù)據(jù)庫、聯(lián)機數(shù)據(jù)及其他和上述數(shù)據(jù)的抽取、轉(zhuǎn)換盒裝載;管理部分包括數(shù)據(jù)倉庫管理工具、數(shù)據(jù)建模工具、數(shù)據(jù)維護模塊和倉庫定義元數(shù)據(jù)庫;倉庫部分包括綜合數(shù)據(jù)、當前數(shù)據(jù)和歷史數(shù)據(jù);分析工具則包括用戶查詢工具、OLAP工具、DM工具和c/s工具。2.數(shù)據(jù)倉庫的建立。數(shù)據(jù)倉庫的建立應圍繞如何對數(shù)據(jù)來源的分析處理、如何構(gòu)造數(shù)據(jù)倉庫本身、如何對數(shù)據(jù)的轉(zhuǎn)化與綜合過程的定義、如何從數(shù)據(jù)倉庫中提供獲取用戶所需信息。數(shù)據(jù)倉庫的建立過程如下圖:
(1)項目規(guī)劃:軟件項目實施具有一定的風險性,前期的規(guī)劃是一個重要環(huán)節(jié),可著重規(guī)劃人員安排、投入、實施進度等內(nèi)容。(2)系統(tǒng)分析:對現(xiàn)有系統(tǒng)的進行分析,了解存在的問題再哪里。(3)數(shù)據(jù)倉庫建模:根據(jù)終端用戶的需要,相應的在數(shù)據(jù)倉庫中為存儲的數(shù)據(jù)建立模型。(4)數(shù)據(jù)的獲取和集成。①選擇數(shù)據(jù)源:與傳統(tǒng)應用系統(tǒng)的信息來源不同,數(shù)據(jù)倉庫的信息來源應從公司終端用戶的需求出發(fā),在各種數(shù)據(jù)庫系統(tǒng)中選出所需的數(shù)據(jù)源。②數(shù)據(jù)源數(shù)據(jù)的標準化:在對所選擇的數(shù)據(jù)源進行深入分析后,必須針對不同應用系統(tǒng)中進行數(shù)據(jù)源數(shù)據(jù)的標準化處理,避免數(shù)據(jù)的命名和結(jié)構(gòu)沖突以及內(nèi)容含義不一致的情況。③邏輯處理:針對數(shù)據(jù)源到數(shù)據(jù)倉庫過程所建數(shù)據(jù)模型必須經(jīng)過轉(zhuǎn)化和綜合性的邏輯處理,該過程包括計算出所需轉(zhuǎn)化合并的數(shù)據(jù)數(shù)量、需要綜合的數(shù)據(jù)文件范圍以及轉(zhuǎn)化和綜合性所需的時間等。④生成中間數(shù)據(jù):中間數(shù)據(jù)不僅起到確定原始數(shù)據(jù)的作用,同時中間數(shù)據(jù)還描述了數(shù)據(jù)的轉(zhuǎn)化和綜合性的邏輯處理,從而定義了數(shù)據(jù)倉庫所需的數(shù)據(jù)模型。(5)構(gòu)建數(shù)據(jù)倉庫。①數(shù)據(jù)導入:數(shù)據(jù)需分別經(jīng)過抽取過程、轉(zhuǎn)換過程、清洗過程,之后數(shù)據(jù)便會從聯(lián)機事務處理系統(tǒng)、外部數(shù)據(jù)和脫機數(shù)據(jù)存儲介質(zhì)中被導入到數(shù)據(jù)倉庫。其中的抽取過程是數(shù)據(jù)導入的關(guān)鍵,抽取過程分為:數(shù)據(jù)的獲取,從外部數(shù)據(jù)源或內(nèi)部數(shù)據(jù)源數(shù)據(jù)系統(tǒng)中獲取決策支持系統(tǒng)用戶所需的數(shù)據(jù)。在經(jīng)過數(shù)據(jù)的過濾,可以將掉不需要的信息數(shù)據(jù)過濾掉。之后進行數(shù)據(jù)凈化,凈化后DSS用戶所需的數(shù)據(jù)質(zhì)量將有效的提高。最后進行整合和裝載,將數(shù)據(jù)進行轉(zhuǎn)換并將數(shù)據(jù)按規(guī)則組織數(shù)據(jù),所得到的新數(shù)據(jù)裝載到數(shù)據(jù)倉庫中去。②優(yōu)化Dw系統(tǒng):采用優(yōu)化器進行優(yōu)化,得到最優(yōu)的查詢方案。③提供查詢方案:生成所需的終端用戶應用軟件,為其提供查詢工具等。(6)DSS應用編碼:根據(jù)前面收集的數(shù)據(jù),編寫決策支持系統(tǒng)程序。(7)系統(tǒng)測試與運行:程序結(jié)果收集后,對這些數(shù)據(jù)進行測試,檢驗結(jié)果是否滿足決策支持系統(tǒng)的需求, 如測試不合格,返回DSS應用編碼步驟,也可返回到倉庫建模步驟。(8)后期維護與升級。在基于數(shù)據(jù)倉庫技術(shù)的決策支持系統(tǒng)構(gòu)建過程中,由于不同的企業(yè)會有不同的需求和不同的問題,但總體的思路是統(tǒng)一的,結(jié)合企業(yè)的不同特點,不斷的進行系統(tǒng)的后期維護與升級,為企業(yè)開發(fā)提供高效的支持決策系統(tǒng)。
五、結(jié)論
由于數(shù)據(jù)倉庫時數(shù)據(jù)庫技術(shù)的最新內(nèi)容,且其中的數(shù)據(jù)具有高度的一致性和完整性,結(jié)合準確有效的方法模型,在加上強大的分析工具,致使基于數(shù)據(jù)倉庫相關(guān)技術(shù)的決策支持系統(tǒng),在面對實際問題時能夠比照傳統(tǒng)的支持決策系統(tǒng)為管理決策者提供更加準確、全面、有效的輔助信息。
參考文獻:
[1]李書濤.決策支持系統(tǒng)原理與技術(shù)[M].北京:北京理工大學出版社,1996
[2]林宇.數(shù)據(jù)倉庫原理與實現(xiàn)[M].人民郵電出版社,2003,1
[3]李玲.數(shù)據(jù)倉庫技術(shù)在決策支持系統(tǒng)中的應用[J].湖北郵電技術(shù),2006,6