[摘要] 現(xiàn)有第三方物流企業(yè)的信息管理系統(tǒng)普遍采用傳統(tǒng)的關(guān)系型數(shù)據(jù)庫,隨著大量關(guān)系數(shù)據(jù)的聚集,借助關(guān)系模型分析數(shù)據(jù)已明顯不足。提出一種基于數(shù)據(jù)倉庫技術(shù)的解決方案,遵循維度建模方法建立了一個運輸為主題的多維數(shù)據(jù)模型,并采用網(wǎng)絡(luò)環(huán)境下的B/S模式展示其結(jié)果。系統(tǒng)在某物流企業(yè)中實際應(yīng)用,取得了良好效果。
[關(guān)鍵詞] 第三方物流 網(wǎng)絡(luò)環(huán)境 數(shù)據(jù)倉庫 數(shù)據(jù)分析
一、數(shù)據(jù)倉庫的設(shè)計
數(shù)據(jù)倉庫是一個面向主題的、集成的、非易失的、隨時間變化的用來支持管理人員決策的數(shù)據(jù)集合。數(shù)據(jù)倉庫建立的過程實際上是從傳統(tǒng)的以數(shù)據(jù)為中心的操作性系統(tǒng)結(jié)構(gòu)轉(zhuǎn)移到以數(shù)據(jù)倉庫為中心的體系結(jié)構(gòu)的過程。
1.數(shù)據(jù)倉庫體系結(jié)構(gòu)。創(chuàng)建數(shù)據(jù)倉庫是在原有的數(shù)據(jù)庫基礎(chǔ)上進行的,要分析原有的數(shù)據(jù)庫系統(tǒng)中所有數(shù)據(jù),在原有系統(tǒng)基礎(chǔ)上建立新的數(shù)據(jù)倉庫,再選定主題,進行統(tǒng)計分析和數(shù)據(jù)挖掘。數(shù)據(jù)倉庫體系結(jié)構(gòu)如圖1所示。
數(shù)據(jù)倉庫的主要數(shù)據(jù)來源于原有的各種關(guān)系型數(shù)據(jù)庫,首先從原始數(shù)據(jù)庫中提取相關(guān)數(shù)據(jù),然后進行數(shù)據(jù)的清洗和轉(zhuǎn)換,進入到數(shù)據(jù)倉庫中存儲,數(shù)據(jù)倉庫中的數(shù)據(jù)是各個系統(tǒng)的原始數(shù)據(jù),保證了數(shù)據(jù)倉庫的最小粒度數(shù)據(jù),有利于數(shù)據(jù)挖掘的應(yīng)用。在數(shù)據(jù)倉庫的基礎(chǔ)上,分別進行數(shù)據(jù)分析,并以報表的形式展示給相關(guān)授權(quán)者使用,以輔助決策。
2.業(yè)務(wù)建模。以為運輸為主題,進行業(yè)務(wù)流程分析,在分析已有數(shù)據(jù)庫表結(jié)構(gòu)的基礎(chǔ)上,說明表之間的關(guān)系,從而為數(shù)據(jù)倉庫的實現(xiàn)打下基礎(chǔ)。圖2表述了運輸業(yè)務(wù)流程圖。
3.數(shù)據(jù)倉庫主題設(shè)計。主題是指用戶使用數(shù)據(jù)倉庫進行決策時所關(guān)心的重點方面。數(shù)據(jù)倉庫中的數(shù)據(jù)是按照一定的主題域進行組織的。根據(jù)第三方物流企業(yè)的需求特點,提出運輸、倉儲和財務(wù)三個主題。其中以運輸為核心的主題設(shè)計,通過對運輸中相關(guān)數(shù)據(jù)的分析,可以得到相應(yīng)主題的分析結(jié)果,這些數(shù)據(jù)信息有助于做出決策。
二、數(shù)據(jù)倉庫系統(tǒng)實現(xiàn)
第三方物流數(shù)據(jù)倉庫設(shè)計時采用星型模型來表示多維概念模型,該模型包括一個事實表,每一個事實表的每一個維度都有一個維表。事實表的每一個元組都包含有指向各個維表的外鍵和一些相應(yīng)的測量數(shù)據(jù)。在實際的設(shè)計中,根據(jù)運輸主題、倉儲主題和財務(wù)主題的需要,建立事實表和維度表。然后,從各數(shù)據(jù)源中抽取數(shù)據(jù),集成到數(shù)據(jù)倉庫中。本文僅以運輸主題為例,講解事實表的設(shè)計、維度表的設(shè)計和以借閱事實表為中心的數(shù)據(jù)倉庫模型。
1.事實表的設(shè)計。事實表是星型模型的核心,內(nèi)容可以分為兩部分:鍵和詳細(xì)指標(biāo)。事實表通過鍵將各維度表組織起來,共同滿足用戶的查詢需求,根據(jù)不同主題設(shè)定的邏輯模型,可有不同的事實表。在第三方物流數(shù)據(jù)倉庫的設(shè)計中,對運輸事實的描述構(gòu)成了數(shù)據(jù)倉庫的事實表,它包括的數(shù)據(jù)是從聯(lián)機事務(wù)處理系統(tǒng)中獲得的真實信息,面向不同的主題需建立不同的事實表,其中核心主題運輸?shù)氖聦嵄戆ǎ嚎蛻艟S、貨物維、日期標(biāo)識、合同維、車輛維等。
2.維度表的設(shè)計。所謂維就是分析問題的角度,不同的決策人員會從不同的角度看待數(shù)據(jù)。運輸數(shù)據(jù)是多維的,對不同的決策要求,可以通過選取不同的維度來導(dǎo)航到相應(yīng)的目的。
3.以運輸事實表為中心的數(shù)據(jù)倉庫模型?!熬S表—事實表”構(gòu)成的星型模型。維表和事實表關(guān)聯(lián)起來可使數(shù)據(jù)倉庫的復(fù)雜查詢直接通過各維的層次比較、上鉆及下鉆等操作完成。維表和事實表的關(guān)聯(lián)是通過維度的鍵值來實現(xiàn)的,中間是事實表,周圍是維度表,星型圖建模技術(shù)可以為數(shù)據(jù)倉庫建立完善的模型。圖3描述了以運輸事實表為中心的星型數(shù)據(jù)模型。
三、第三方物流數(shù)據(jù)倉庫的數(shù)據(jù)分析
根據(jù)前面的數(shù)據(jù)倉庫設(shè)計的需求分析,以及用戶對數(shù)據(jù)的處理需求,在已經(jīng)創(chuàng)建的以事實表和維表為基礎(chǔ)的,建立一個能夠滿足用戶對數(shù)據(jù)的各種分析統(tǒng)計要求的統(tǒng)計體系,其中以維表為統(tǒng)計縱橫坐標(biāo),以事實作為統(tǒng)計數(shù)據(jù)來源。
在第三方物流數(shù)據(jù)倉庫中,對數(shù)據(jù)倉庫統(tǒng)計分析的數(shù)據(jù)展現(xiàn)使用了目前市場主流開發(fā)工具Visual Studio .NET 2003,并采用B/S模式來構(gòu)架整個展現(xiàn)系統(tǒng),這樣系統(tǒng)對客戶端的要求,以及對系統(tǒng)的維護性和數(shù)據(jù)的安全性,都可以達到用戶的要求。
現(xiàn)階段隨著物流信息化管理水平的不斷提高,海量歷史數(shù)據(jù)已經(jīng)成為物流企業(yè)重要的經(jīng)濟資源。本文針對目前第三方物流企業(yè)信息化建設(shè)中存在的主要問題,提出一種基于數(shù)據(jù)倉庫技術(shù)的解決方案,并遵循維度建模方法建立了一個運輸主題的多維數(shù)據(jù)模型,可以方便地從大量繁雜的數(shù)據(jù)中提煉出真正有價值的信息和知識,幫助決策者進行決策。
參考文獻:
[1]蘇新寧楊建林:數(shù)據(jù)倉庫和數(shù)據(jù)挖掘[M].北京:清華大學(xué)出版社,2005