摘 要: 為了讓經(jīng)營范圍分布較廣的商家能更好地了解自己的經(jīng)營狀況,通過電子商務(wù)系統(tǒng)中的OLAP系統(tǒng)進(jìn)行分析和設(shè)計并加以展示,同時使用OLAP多維數(shù)據(jù)分析技術(shù)對銷售數(shù)據(jù)進(jìn)行分析從而獲得相關(guān)的信息。結(jié)果表明,利用OLAP技術(shù)能幫助商家深入全面地分析業(yè)務(wù)數(shù)據(jù),提高經(jīng)營管理水平。
關(guān)鍵詞: 聯(lián)機(jī)分析處理; 數(shù)據(jù)倉庫; 電子商務(wù)系統(tǒng); 分布式
中圖分類號:TP319 文獻(xiàn)標(biāo)志碼:A 文章編號:1006-8228(2013)11-12-03
0 引言
在電子商務(wù)系統(tǒng)中,企業(yè)或許并不只關(guān)注每一筆的銷售情況,還需要知道這樣的一些分析結(jié)果,如:
企業(yè)銷售分析:提供各企業(yè)的銷售情況,實現(xiàn)按銷售額、銷售數(shù)量等的查詢分析并展示結(jié)果,使企業(yè)能基于展示的結(jié)果能進(jìn)行分析和控制決策。
企業(yè)客戶分析:提供一段時間之內(nèi)每個客戶購買的金額、數(shù)量、以及客戶的基本信息,基于這些數(shù)據(jù)企業(yè)可以挖掘出優(yōu)質(zhì)客戶、有潛質(zhì)的客戶、大眾客戶、喜歡退換貨的客戶等,對他們提供不同的服務(wù)來滿足不同類型客戶的需求。
銷售時間及地區(qū)分布分析:對系統(tǒng)中的各類商品以及各個商品在不同時間不同地區(qū)的銷售情況進(jìn)行統(tǒng)計分析,并對各個企業(yè)在不同時間不同地區(qū)的銷售情況進(jìn)行分析,使企業(yè)能夠了解各類商品的銷售旺季、淡季的情況,有利于對各項商業(yè)活動進(jìn)行合理的安排。
行業(yè)銷售分析:提供整個行業(yè)的銷售情況,對整個系統(tǒng)中的所有企業(yè)的銷售情況進(jìn)行監(jiān)控并統(tǒng)計分析,實現(xiàn)按省份、服裝種類、企業(yè)規(guī)模、注冊資本、企業(yè)銷售額等查詢并展示結(jié)果。
本文探討在多數(shù)據(jù)倉庫環(huán)境下利用OLAP系統(tǒng)進(jìn)行多維分析來獲得以上數(shù)據(jù)。
1 數(shù)據(jù)倉庫
數(shù)據(jù)倉庫是為企業(yè)所有級別的決策制定過程提供支持的所有類型數(shù)據(jù)的戰(zhàn)略集合。它是單個數(shù)據(jù)存儲,出于分析性報告和決策支持的目的而創(chuàng)建。為企業(yè)提供需要業(yè)務(wù)智能來指導(dǎo)業(yè)務(wù)流程改進(jìn)和監(jiān)視時間、成本、質(zhì)量和控制[1-3]。
數(shù)據(jù)倉庫環(huán)境有單一中央集成和分布式兩種類型。大部分企業(yè)建立和支持單一的中央集成數(shù)據(jù)倉庫環(huán)境,但是在某些特定場合,建立分布式數(shù)據(jù)倉庫環(huán)境可能更能滿足需要,能取得更高的經(jīng)濟(jì)效益。
分布式數(shù)據(jù)倉庫技術(shù)的特點:
⑴ 整體代價低。對于一個數(shù)據(jù)倉庫,當(dāng)采用分布式技術(shù)時,軟、硬件代價要比采用大的、中央集成的技術(shù)代價低。
⑵ 存放在數(shù)據(jù)倉庫中的數(shù)據(jù)量理論上無限制。如果數(shù)據(jù)倉庫中的數(shù)據(jù)量將要超過分布式處理器的限制時,只要在網(wǎng)中加入另一個處理器即可,這也符合企業(yè)的發(fā)展趨勢。
⑶ 研制、見效周期短。在短期內(nèi)局部數(shù)據(jù)倉庫就能建好、運行并使用局部組織受益。
⑷ 具有實時性。每個局部群體具有獨立的控制權(quán),為數(shù)據(jù)倉庫具有實時性提供了保障。
2 OLAP的定義
OLAP(聯(lián)機(jī)分析處理)概念最早是由關(guān)系數(shù)據(jù)庫之父E.F.Codd于1993年提出的,是根據(jù)用戶的特殊需求而進(jìn)行的聯(lián)機(jī)數(shù)據(jù)分析,幫助決策者進(jìn)行及時有效的分析、判斷和預(yù)測,獲得更高的效率[4]。
聯(lián)機(jī)分析處理(OLAP)技術(shù)與數(shù)據(jù)倉庫有著非常緊密的聯(lián)系,它是數(shù)據(jù)倉庫的檢驗型分析工具。
全局與局部的OLAP系統(tǒng)基于各自的數(shù)據(jù)倉庫,相互獨立,基本不發(fā)生數(shù)據(jù)交互。
如圖1所示,OLAP系統(tǒng)一般采用三層C/S(客戶/服務(wù)器)結(jié)構(gòu)。三層C/S結(jié)構(gòu)包括:數(shù)據(jù)倉庫服務(wù)器、OLAP服務(wù)器和客戶端。最上層是客戶端,負(fù)責(zé)用戶查詢要求的輸入和OLAP分析結(jié)果的圖形化輸出。客戶端只與中間的應(yīng)用層發(fā)生聯(lián)系,使客戶端與服務(wù)器無直接關(guān)系,這樣簡化了用戶的操作,也使得維護(hù)和遷移比較容易。中間層是OLAP服務(wù)器,它是整個系統(tǒng)的核心。這一層集成了數(shù)據(jù)采集匯總處理、系統(tǒng)業(yè)務(wù)邏輯處理等功能,完成數(shù)據(jù)倉庫中數(shù)據(jù)的綜合,并對其進(jìn)行分析,最終將分析結(jié)果以多維視圖的形式表達(dá)出來。系統(tǒng)的底層是數(shù)據(jù)倉庫服務(wù)器,完成各種數(shù)據(jù)的收集、組織和存儲。
3 OLAP分析
3.1分布式數(shù)據(jù)倉庫
OLAP應(yīng)用是目前數(shù)據(jù)倉庫上的重要應(yīng)用之一,是決策分析的關(guān)鍵。要對電子商務(wù)系統(tǒng)中的企業(yè)、行業(yè)進(jìn)行OLAP分析,它們的特點如下。
企業(yè)特點:①企業(yè)本身規(guī)模較小,多以直營店、代理以及聯(lián)盟的方式參與商業(yè)活動;②企業(yè)的組織結(jié)構(gòu)復(fù)雜,級別劃分明確,一般擁有多家門店,客戶也以企業(yè)為主,關(guān)系比較固定;③企業(yè)業(yè)務(wù)模式涉及了采購、倉儲、銷售、配送、財務(wù)以及其他支撐業(yè)務(wù)。
行業(yè)特點:①企業(yè)作為一個獨立的組織機(jī)構(gòu),以商品的進(jìn)銷存為業(yè)務(wù)鏈條,參與行業(yè)商務(wù)活動;②行業(yè)中的每一個企業(yè)具有相同的業(yè)務(wù)模式,均涉及商品的進(jìn)、銷、存等業(yè)務(wù);③企業(yè)在整個行業(yè)中具有多重身份,企業(yè)之間的業(yè)務(wù)關(guān)聯(lián)構(gòu)成了整個行業(yè)商務(wù)網(wǎng)絡(luò)。
由于電子商務(wù)中各企業(yè)分布較為廣泛,故建立分布式數(shù)據(jù)倉庫更合適。圖2為系統(tǒng)設(shè)計圖。
3.2 概念模型
界定系統(tǒng)邊界 經(jīng)過對系統(tǒng)的分析,明確了多維分析展現(xiàn)系統(tǒng)的邊界是企業(yè)和行業(yè)的數(shù)據(jù)倉庫和多維分析展現(xiàn)系統(tǒng)。
確定主題域 對于服裝銷售行業(yè)來說,系統(tǒng)的主題主要包括銷售主題、顧客主題、商品主題。系統(tǒng)核心是對服裝銷售進(jìn)行管理,因此多維數(shù)據(jù)模型設(shè)計主要針對銷售這一主題建立事實表。經(jīng)過與決策人員的交流和查閱相關(guān)資料,最后確定了顧客來源、商品大類、商品中類、商品小類、時間、地區(qū)等相關(guān)維度。
3.3 邏輯模型
常見的邏輯模型有星型模型(Star schema)和雪花模型(Snowflake schema)兩種。星型模型是多維數(shù)據(jù)模型的一種典型結(jié)構(gòu)。它把事實表放在中心,維度表分布在事實表的周圍,維度表通過主關(guān)鍵字與事實表連接。星型模型通過預(yù)連接和適當(dāng)?shù)臄?shù)據(jù)冗余,為用戶訪問和分析過程簡化了數(shù)據(jù)。雪花模型進(jìn)一步層次化星形模型的維度表,使得原來的維度表又被擴(kuò)展成更小的事實表,形成局部層次化區(qū)域,它是星型模型的擴(kuò)展。根據(jù)對上述兩種邏輯模型的對比分析,以及結(jié)合多維分析展現(xiàn)系統(tǒng)的結(jié)構(gòu)特點,最后將邏輯模型確定為星型模型。顧客主題、銷售主題星型模型分別為圖3、圖4所示。
3.4 物理模型
完成了邏輯模型設(shè)計后,便可以開始設(shè)計多維數(shù)據(jù)倉庫物理模型。多維數(shù)據(jù)倉庫物理模型設(shè)計同關(guān)系數(shù)據(jù)庫物理模型設(shè)計類似。定義數(shù)據(jù)標(biāo)準(zhǔn),在定義物理實體、關(guān)系和字段之前需明確命名規(guī)則。
3.5 多維數(shù)據(jù)集設(shè)計
系統(tǒng)設(shè)計的維表及相應(yīng)的層次如下。
時間維 時間維可以說是各個數(shù)據(jù)倉庫中必須具備的一個維。在服裝銷售中,分析不同時間的銷售情況的最基礎(chǔ)維度就是時間維度。本系統(tǒng)中時間維的層次關(guān)系主要包含年、季度、月、星期和日等層次。
地理維 地理維也是多維數(shù)據(jù)集中常見維,本系統(tǒng)在設(shè)計時主要考慮行政區(qū)域地理層次,包括全國、?。ㄖ陛犑?、自治區(qū)等)、市(地區(qū))這些層次。
顧客維 根據(jù)業(yè)務(wù)分析的需要和原數(shù)據(jù)庫中顧客事實表的存儲,本系統(tǒng)設(shè)計顧客維包括顧客年齡、顧客來源、顧客級別、消費級別。
商品維 本系統(tǒng)中,商品的分類是決策人員關(guān)注的另一個重點。商品分類主要將商品按照業(yè)務(wù)要求劃分為不同類別,本系統(tǒng)共劃分了大類、中類、小類三個層次。大類包括男裝、女裝、配飾、圖書、鞋、包等;中類是大類下的細(xì)分,比如女裝又分為上裝、褲子、裙子、套裝等;小類是商品的具體明細(xì),如女裝褲子又可以分為九分褲、七分褲、五分褲、靴褲等。
根據(jù)所選的主題,設(shè)計的模型,進(jìn)行OLAP分析。實現(xiàn)鉆取、切片、切塊、旋轉(zhuǎn)多維分析操作。
3.6 OLAP展示結(jié)果
3.6.1 利潤—銷售額分析
圖5為企業(yè)000001的利潤—銷售額分析圖。
3.6.2 客戶價值分析
圖6為客戶價值分析圖。
根據(jù)客戶價值不同,將客戶分為鉆石客戶、黃金客戶、白銀客戶、銅鈑客戶、鐵皮客戶。
3.6.3 行業(yè)商品分析
如圖7所示為行業(yè)商品分析圖。
4 結(jié)束語
現(xiàn)在企業(yè)有越來越多的歷史數(shù)據(jù)難以管理和利用,于是基于數(shù)據(jù)倉庫技術(shù)的OLAP技術(shù)得以廣泛應(yīng)用。多維數(shù)據(jù)分析(OLAP分析)作為決策支持系統(tǒng)提供的主要分析手段之一,通過對多維形式組織起來的數(shù)據(jù)采取鉆取、切片、切塊、旋轉(zhuǎn)等操作來剖析,使決策者能從多個角度、多個側(cè)面觀察數(shù)據(jù)倉庫的數(shù)據(jù),從而深入地了解包含在數(shù)據(jù)中的信息內(nèi)涵。本文闡述了多數(shù)據(jù)倉庫環(huán)境下OLAP處理技術(shù)的思想,有利于對分布廣泛的連鎖式企業(yè)進(jìn)行經(jīng)營分析。
參考文獻(xiàn):
[1] 張懿.數(shù)據(jù)倉庫在電子商城系統(tǒng)中的應(yīng)用研究[D].蘇州大學(xué),2005.
[2] 任力偉,丁偉杰,孫大鵬等.數(shù)據(jù)倉庫技術(shù)在服裝銷售領(lǐng)域的應(yīng)用研究[J].數(shù)字技術(shù)與應(yīng)用,2012.11:64-65
[3] 葉政.面向大型服飾企業(yè)銷售決策的分布式數(shù)據(jù)倉庫設(shè)計[D].浙江大學(xué)碩士學(xué)位論文,2006.
[4] 陳娟.數(shù)據(jù)倉庫在服裝銷售系統(tǒng)中的應(yīng)用[D].湖南碩士學(xué)位論文,2010.