張軍玲
提要傳統(tǒng)的基于數(shù)據(jù)庫的決策支持系統(tǒng)存在數(shù)據(jù)分散、數(shù)據(jù)不統(tǒng)一、數(shù)據(jù)可分析能力低等缺點。為了解決傳統(tǒng)決策支持系統(tǒng)中存在的問題,本文提出了利用數(shù)據(jù)倉庫技術(shù)建立決策支持系統(tǒng)的解決方案,并分析了基于數(shù)據(jù)倉庫技術(shù)的決策支持系統(tǒng)的開發(fā)過程。
關(guān)鍵詞:數(shù)據(jù)倉庫;決策支持;數(shù)據(jù)挖掘
中圖分類號:F407.67文獻(xiàn)標(biāo)識碼:A
決策支持系統(tǒng)(DSS)是由電子數(shù)據(jù)處理系統(tǒng)(EDPS)、管理信息系統(tǒng)(MlS)逐步發(fā)展而來的,用于支持半結(jié)構(gòu)化決策,允許決策者直接干預(yù),并能接受決策者的直觀判斷的動態(tài)交互式計算機系統(tǒng)。決策支持系統(tǒng)作為一門新興的信息技術(shù),能夠為企業(yè)提供各種決策信息,為許多商業(yè)問題提供解決方案,從而提高了決策的質(zhì)量和效率。
一、傳統(tǒng)決策支持系統(tǒng)的不足
(一)傳統(tǒng)決策支持系統(tǒng)缺乏內(nèi)在的統(tǒng)一性和完整性。傳統(tǒng)的決策支持系統(tǒng)是以模型庫、數(shù)據(jù)庫、方法庫所組成的系統(tǒng)結(jié)構(gòu)。但是在決策支持系統(tǒng)開發(fā)過程中,模型庫、數(shù)據(jù)庫和方法庫往往被獨立的設(shè)計與實現(xiàn),從而使傳統(tǒng)的決策支持系統(tǒng)在系統(tǒng)結(jié)構(gòu)上很難達(dá)到內(nèi)在的統(tǒng)一性和完整性,因而應(yīng)用效果并不理想。
(二)傳統(tǒng)決策支持系統(tǒng)缺乏有效的分析工具。企業(yè)決策是一個提出問題——分析問題——解決問題的循環(huán)過程。分析過程實質(zhì)上是一種對數(shù)據(jù)信息不斷抽取的過程,即要對大量分散的數(shù)據(jù)進(jìn)行快速綜合分析,然后從中捕獲與決策相關(guān)的信息。而傳統(tǒng)的決策支持系統(tǒng)往往側(cè)重于抽象的理論研究,缺乏有效的分析工具,因而也得不到有效的分析結(jié)果。
(三)傳統(tǒng)決策支持系統(tǒng)沒有充足的數(shù)據(jù)源。傳統(tǒng)的決策支持系統(tǒng)所進(jìn)行的數(shù)據(jù)處理是直接利用關(guān)系數(shù)據(jù)庫中的數(shù)據(jù),只對原始數(shù)據(jù)進(jìn)行一般的加工和匯總,致使決策所需信息不足,難以滿足決策支持系統(tǒng)的需要。數(shù)據(jù)庫中的數(shù)據(jù)還存在以下缺點:①缺乏組織性。從各個部門抽取的數(shù)據(jù)沒有統(tǒng)一的格式標(biāo)準(zhǔn),數(shù)據(jù)雜亂且不穩(wěn)定;②數(shù)據(jù)的利用率低。由于數(shù)據(jù)缺少統(tǒng)一標(biāo)準(zhǔn),難以轉(zhuǎn)化為有用的信息,原始數(shù)據(jù)定義的不一致性導(dǎo)致其可信度降低;③數(shù)據(jù)存儲不完整。決策支持系統(tǒng)只有對較長一段時間的完整數(shù)據(jù)進(jìn)行分析才會有較高的預(yù)測率;④缺乏綜合的數(shù)據(jù)。數(shù)據(jù)庫中存儲的是進(jìn)行事務(wù)處理時積累的大量細(xì)節(jié)數(shù)據(jù),如果對這些細(xì)節(jié)數(shù)據(jù)進(jìn)行分析必然會影響分析效率,同時也需要分析人員花費大量的時間和精力,結(jié)果忽略了有用的信息,因此往往要求對這些細(xì)節(jié)數(shù)據(jù)進(jìn)行不同程度的綜合。
(四)傳統(tǒng)決策支持系統(tǒng)人機接口開發(fā)不理想。傳統(tǒng)決策支持系統(tǒng)的各部件中,只有數(shù)據(jù)部件有成熟的商品軟件可以直接使用,其他部件及部件的接口和集成問題需要自行設(shè)計和開發(fā)。計算機語言對傳統(tǒng)決策支持系統(tǒng)的接口技術(shù)和集成技術(shù)的支持能力有限,研制新語言也需很大代價。
二、數(shù)據(jù)倉庫、OLAP及數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)倉庫是一個用于更好地支持企業(yè)決策分析的、面向主題的、集成的、不可更新的、隨時間不斷變化的數(shù)據(jù)集合,具有以下特點:
1、面向主題的。數(shù)據(jù)倉庫中的數(shù)據(jù)是面向主題進(jìn)行組織的。主題是一個抽象的概念,在邏輯意義上,它是在較高層次上對分析對象的數(shù)據(jù)的一個完整、一致的描述,能統(tǒng)一地刻畫各個分析對象所涉及的企業(yè)的各項數(shù)據(jù),以及數(shù)據(jù)之間的聯(lián)系。
2、集成的。數(shù)據(jù)倉庫將多個異構(gòu)數(shù)據(jù)源集成在一起,使用數(shù)據(jù)清理和數(shù)據(jù)集成技術(shù),確保命名約定、編碼結(jié)構(gòu)、屬性度量等的一致性,極大地克服了基于關(guān)系數(shù)據(jù)庫決策支持系統(tǒng)數(shù)據(jù)分散且不易集成的缺點。
3、穩(wěn)定的。數(shù)據(jù)倉庫的數(shù)據(jù)主要供企業(yè)決策分析,所涉及的數(shù)據(jù)操作主要是數(shù)據(jù)查詢,一旦某個數(shù)據(jù)進(jìn)入數(shù)據(jù)倉庫以后,一般情況下將被長期保留,給決策支持系統(tǒng)提供了大量的數(shù)據(jù)源,充分滿足了決策支持系統(tǒng)的需要。
4、反映歷史變化。數(shù)據(jù)倉庫中的數(shù)據(jù)通常包含歷史信息,系統(tǒng)記錄了企業(yè)從過去某一時點到目前的各個階段的信息,通過這些信息,可以對企業(yè)的發(fā)展歷程和未來趨勢做出定量分析和預(yù)測。
OLAP是針對特定問題的聯(lián)機數(shù)據(jù)訪問和數(shù)據(jù)分析而產(chǎn)生的一種技術(shù),它滿足決策支持系統(tǒng)從多種角度對數(shù)據(jù)進(jìn)行快速、一致、交互地分析,克服傳統(tǒng)決策支持系統(tǒng)交互能力差的弊病,使決策者能夠?qū)?shù)據(jù)進(jìn)行深入觀察。
數(shù)據(jù)挖掘是指從大量數(shù)據(jù)中發(fā)現(xiàn)潛在的、有價值的及未知的關(guān)系、模式和趨勢,并以易被理解的方式表示出來。在決策支持系統(tǒng)中通過數(shù)據(jù)挖掘發(fā)現(xiàn)數(shù)據(jù)之間的復(fù)雜聯(lián)系,以及這種聯(lián)系對決策產(chǎn)生的影響。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘都是決策支持技術(shù),但兩者的輔助決策方式不同。數(shù)據(jù)倉庫是在數(shù)據(jù)庫的基礎(chǔ)上發(fā)展起來的,它將傳統(tǒng)數(shù)據(jù)庫中大量的、詳細(xì)的、不同格式的數(shù)據(jù)按照決策需求進(jìn)行集成和重新組織,從而可以為不同需求的用戶提供統(tǒng)一的數(shù)據(jù)源。數(shù)據(jù)挖掘是通過知識的關(guān)聯(lián),挖掘現(xiàn)有數(shù)據(jù)中隱含的信息,給用戶提供更為深入和豐富的信息,可以讓用戶在決策分析中使用。將數(shù)據(jù)倉庫和數(shù)據(jù)挖掘結(jié)合起來,實現(xiàn)兩者的優(yōu)勢互補,能夠為用戶提供更為有力的決策支持。
三、基于數(shù)據(jù)倉庫的決策支持系統(tǒng)體系結(jié)構(gòu)
傳統(tǒng)的決策支持系統(tǒng)大都建立在數(shù)據(jù)庫基礎(chǔ)上,數(shù)據(jù)庫系統(tǒng)主要用于聯(lián)機事務(wù)處理,它主要對大量面向具體應(yīng)用、事務(wù)驅(qū)動的細(xì)節(jié)數(shù)據(jù),進(jìn)行著以事務(wù)處理為主的數(shù)據(jù)處理工作,存在于一種適應(yīng)企業(yè)特定應(yīng)用服務(wù)、以單一數(shù)據(jù)資源為中心的數(shù)據(jù)環(huán)境。要提高分析和決策的效率和有效性,必須把分析型的細(xì)節(jié)數(shù)據(jù)提取出來,重新組織建立一個綜合的、便于分析的處理環(huán)境,只有對大量異構(gòu)數(shù)據(jù)進(jìn)行綜合的、多角度的、多層次的分析處理,才能為企業(yè)高層管理者提供決策信息,數(shù)據(jù)倉庫技術(shù)的引入為以上問題的解決帶來了新的契機。
數(shù)據(jù)倉庫將來自各個異構(gòu)數(shù)據(jù)源的信息進(jìn)行集成,從事物歷史和發(fā)展的角度來組織和存儲數(shù)據(jù),并以聯(lián)機分析工具(OLAP)和數(shù)據(jù)挖掘工具為手段,形成一整套可操作、可實施的決策支持系統(tǒng)可行方案,供用戶進(jìn)行數(shù)據(jù)分析、發(fā)現(xiàn)知識,并輔助決策支持。數(shù)據(jù)倉庫技術(shù)不僅使決策支持系統(tǒng)跨入了一個新階段,而且在許多領(lǐng)域都發(fā)揮著一定的作用,為用戶提供面向分析的全局性、綜合性、動態(tài)性、多層次信息,從而拓寬了決策支持系統(tǒng)的應(yīng)用領(lǐng)域和應(yīng)用范圍。
數(shù)據(jù)倉庫對內(nèi)、外部數(shù)據(jù)源進(jìn)行抽取、凈化和轉(zhuǎn)換,將數(shù)據(jù)重新組合成面向全局的數(shù)據(jù)視圖,為決策支持系統(tǒng)提供數(shù)據(jù)存儲和組織的基礎(chǔ),解決了以往決策支持系統(tǒng)中數(shù)據(jù)不一致的問題。OLAP從數(shù)據(jù)倉庫中的集成數(shù)據(jù)出發(fā),構(gòu)建面向分析的多維數(shù)據(jù)模型,再使用多維分析方法從多個不同的角度對多維數(shù)據(jù)進(jìn)行分析、比較,為用戶提供了一個多維數(shù)據(jù)分析,便于用戶以更接近自然的方式分析數(shù)據(jù)。數(shù)據(jù)挖掘以數(shù)據(jù)倉庫和多維數(shù)據(jù)模型中的大量數(shù)據(jù)為基礎(chǔ),自動地發(fā)現(xiàn)數(shù)據(jù)中的潛在模式,并以這些模式為基礎(chǔ)自動做出預(yù)測,數(shù)據(jù)挖掘中發(fā)現(xiàn)的知識可以直接用于指導(dǎo)聯(lián)機分析(OLAP)的分析處理,而數(shù)據(jù)挖掘和聯(lián)機分析處理得出的新知識也可以立即補充到系統(tǒng)的知識庫中。數(shù)據(jù)倉庫的優(yōu)勢彌補了以往決策支持系統(tǒng)的不足,較好地協(xié)調(diào)了數(shù)據(jù)、模型、方法、知識之間的關(guān)系,使現(xiàn)行系統(tǒng)中的數(shù)據(jù)庫資源得到充分利用,從而使整個系統(tǒng)形成一個有機的整體,提高了系統(tǒng)的集成性。
四、基于數(shù)據(jù)倉庫的決策支持系統(tǒng)開發(fā)過程
決策支持系統(tǒng)的開發(fā)主要是進(jìn)行系統(tǒng)分析、系統(tǒng)初步設(shè)計、系統(tǒng)詳細(xì)設(shè)計、各部件程序編制和系統(tǒng)集成?;跀?shù)據(jù)倉庫的決策支持系統(tǒng)的開發(fā)就要以數(shù)據(jù)倉庫的開發(fā)為核心,其開發(fā)過程實質(zhì)上是一個數(shù)據(jù)驅(qū)動的過程,可概括為以下幾個方面:(1)確定開發(fā)數(shù)據(jù)倉庫工程的目標(biāo)及制定計劃;(2)建立技術(shù)環(huán)境,選擇實現(xiàn)數(shù)據(jù)倉庫的軟硬件資源;(3)根據(jù)決策需求確定主題,進(jìn)行數(shù)據(jù)建模,選擇數(shù)據(jù)源,對數(shù)據(jù)倉庫的數(shù)據(jù)進(jìn)行邏輯結(jié)構(gòu)設(shè)計;(4)設(shè)計數(shù)據(jù)倉庫中的數(shù)據(jù)庫,基于用戶的需求,著重于某個主題,開發(fā)數(shù)據(jù)倉庫中數(shù)據(jù)的物理存儲結(jié)構(gòu),即設(shè)計多維數(shù)據(jù)結(jié)構(gòu)的事實表和維表;(5)設(shè)計從信息源中抽取數(shù)據(jù)、清理數(shù)據(jù)、格式化數(shù)據(jù)、綜合數(shù)據(jù)、裝載數(shù)據(jù)的數(shù)據(jù)轉(zhuǎn)換程序,從而將數(shù)據(jù)組織成恰當(dāng)?shù)母袷酱鎯Φ綌?shù)據(jù)倉庫中;(6)定義元數(shù)據(jù),即表示、定義數(shù)據(jù)的意義及系統(tǒng)各組成部件之間的關(guān)系;(7)開發(fā)用戶決策的數(shù)據(jù)分析工具,建立結(jié)構(gòu)化的決策支持查詢,實現(xiàn)和使用數(shù)據(jù)倉庫的數(shù)據(jù)分析工具,包括優(yōu)化查詢工具、統(tǒng)計分析工具、C/S工具、OLAP工具等,通過分析工具實現(xiàn)決策支持需求;(8)管理數(shù)據(jù)倉庫環(huán)境,并定期進(jìn)行數(shù)據(jù)更新,使數(shù)據(jù)倉庫正常運行。
數(shù)據(jù)倉庫技術(shù)為決策支持系統(tǒng)的研制與開發(fā)提供了一種有效、可行的體系化解決方案,一個完整的決策支持系統(tǒng)應(yīng)集成數(shù)據(jù)倉庫、OLAP和數(shù)據(jù)挖掘三種信息處理技術(shù)。基于數(shù)據(jù)倉庫、OLAP和數(shù)據(jù)挖掘等技術(shù)的決策支持系統(tǒng)在大數(shù)據(jù)量的情況下,為快捷、自動地進(jìn)行決策提供了一個新的思路。它既能夠提供自動的定量分析,也可以提供定性數(shù)據(jù),使得決策者能夠獲取可靠的決策依據(jù)。隨著數(shù)據(jù)倉庫、OLAP和數(shù)據(jù)挖掘技術(shù)的不斷發(fā)展和完善,決策支持系統(tǒng)必然有更廣闊的應(yīng)用前景。
(作者單位:西安歐亞學(xué)院信息工程學(xué)院)