摘要:結(jié)合數(shù)字化校園的業(yè)務(wù)流程,給出了在數(shù)據(jù)倉庫環(huán)境下構(gòu)建的數(shù)字化校園體系結(jié)構(gòu)圖,并重點闡述了數(shù)字化校園數(shù)據(jù)倉庫邏輯模型的設(shè)計,為高校數(shù)字化校園的建立提供了可行性方案。
關(guān)鍵字:數(shù)據(jù)倉庫;數(shù)字化校園;模型
中圖分類號:TP311.13 文獻(xiàn)標(biāo)識碼:A文章編號:1009-3044(2009)36-10257-02
Design the Digital Campus Based on Data Warehouse
WANG Yan-ping, CHANG Xian-fa
(Heyuan Polytechnic, Heyuan 517000, China)
Abstract: Combine the business processes of the digital campus, give an architecture map of digital campus which is based on data warehouse environment, and focus on the digital campus data warehouse logical model design, provide a feasibility plan for the establishment of digital campus colleges and universities.
Key words: data warehouse; digital campus; model
高校數(shù)字化校園數(shù)據(jù)主要存儲在關(guān)系型數(shù)據(jù)庫中,這些系統(tǒng)中,大量的數(shù)據(jù)和數(shù)據(jù)模型,都是反映歷屆學(xué)生的學(xué)習(xí)成績和教師的教學(xué)任務(wù)以及教學(xué)計劃,已開發(fā)的數(shù)據(jù)庫系統(tǒng)基本上是面向事務(wù)處理(OLTP)的簡單的管理信息系統(tǒng)。隨著高校對決策信息需求的日益廣泛、復(fù)雜和迫切,這些傳統(tǒng)的數(shù)據(jù)庫系統(tǒng)存在的問題也越來越明顯。
1 數(shù)據(jù)倉庫環(huán)境下的數(shù)字化校園結(jié)構(gòu)設(shè)計
1.1 數(shù)據(jù)倉庫技術(shù)
數(shù)據(jù)倉庫之父Bill Inmon在1991年出版的“Building the Data Warehouse”一書中所提出的定義被廣泛接受——數(shù)據(jù)倉庫(Data Warehouse)是一個面向主題的(Subject Oriented)、集成的(Integrated)、相對穩(wěn)定的(Non-Volatile)、反映歷史變化(Time Variant)的數(shù)據(jù)集合,用于支持管理決策(Decision Making Support)。
1.2 數(shù)字化校園框架
基于當(dāng)前高等院校校園網(wǎng)的基本設(shè)施和已有的各種應(yīng)用服務(wù),一個基于通用的統(tǒng)一身份認(rèn)證和統(tǒng)一信息展示的數(shù)字化校園解決方案的總體框架。這個框架能夠集成各種校園網(wǎng)中的應(yīng)用。各個子系統(tǒng)在數(shù)字化校園中的位置如圖1所示。
1.3 數(shù)字化校園數(shù)據(jù)倉庫體系結(jié)構(gòu)設(shè)計
在對數(shù)字化校園各個子系統(tǒng)進(jìn)行深入調(diào)研和需求分析的基礎(chǔ)上,針對數(shù)據(jù)倉庫的三個基本功能,提出了一個集中式數(shù)據(jù)倉庫(數(shù)字化校園數(shù)據(jù)倉庫)、分布式數(shù)據(jù)庫(各個部門數(shù)據(jù)庫)等適合數(shù)字化校園的數(shù)據(jù)倉庫體系結(jié)構(gòu),如圖2所示。
該系統(tǒng)由五個部分組成:
1) 數(shù)據(jù)源:來源于操作性數(shù)據(jù)庫,本文主要以SQL Server 2000作為數(shù)據(jù)庫的管理工具。其主要是完成日常業(yè)務(wù)處理,其數(shù)據(jù)將成為數(shù)據(jù)倉庫的數(shù)據(jù)源。
2) 多數(shù)據(jù)源集成:將來自于不同數(shù)據(jù)源(SQL、Oracle等)的數(shù)據(jù)通過SQL Server 2000數(shù)據(jù)轉(zhuǎn)換服務(wù)進(jìn)行導(dǎo)入,目的數(shù)據(jù)庫是SQL Server 2000數(shù)據(jù)庫。
3) 中心數(shù)據(jù)倉庫:在已有業(yè)務(wù)系統(tǒng)的基礎(chǔ)上,通過數(shù)據(jù)的抽取、轉(zhuǎn)換、加載,建立數(shù)字化校園數(shù)據(jù)倉庫。
4) OLAP分析服務(wù)器:通過建立OLAP分析服務(wù)器,從數(shù)據(jù)倉庫中提取數(shù)據(jù),創(chuàng)建和處理數(shù)據(jù)立方體,在不同粒度級別上存儲和管理信息,完成數(shù)據(jù)的統(tǒng)計和分析。
5) 決策支持工具:是面向用戶的數(shù)據(jù)需求的前端服務(wù),提供一個可以供用戶訪問的接口,是用戶能夠方便地瀏覽數(shù)據(jù)倉庫中的數(shù)據(jù)立方體,支持各種OLAP和DM操作。SQL Server 2000 Analysis Services支持來自關(guān)系數(shù)據(jù)源和多維數(shù)據(jù)源這兩者的數(shù)據(jù)挖掘,并且與第三方工具(如挖掘模型查看器組件)一起使用。
2 數(shù)字化校園數(shù)據(jù)倉庫邏輯模型設(shè)計
在數(shù)字化校園系統(tǒng)中的,各個應(yīng)用子系統(tǒng)的數(shù)據(jù)是建立在關(guān)系數(shù)據(jù)庫的基礎(chǔ)上。因此,在數(shù)據(jù)倉庫的邏輯設(shè)計中采用了關(guān)系模型。無論是主題還是主題之間的聯(lián)系都是用關(guān)系表示的。數(shù)據(jù)倉庫的邏輯模型描述了數(shù)據(jù)倉庫的主題以及主題之間的邏輯實現(xiàn)。
2.1 多維表的設(shè)計
在數(shù)字化校園中的數(shù)據(jù)庫,以學(xué)籍管理系統(tǒng)為例,訪問數(shù)字化校園的學(xué)籍管理系統(tǒng)后等到的關(guān)于學(xué)生的基本信息如表1所示。
2.2 事實表的設(shè)計
數(shù)字化校園數(shù)據(jù)挖掘模型的設(shè)計采用星型架構(gòu),對于等級數(shù)據(jù)通過星型模式加以描述。對學(xué)生這一主題,可建立如圖3所示的星型架構(gòu)。
在學(xué)生等級事實維表中存儲七個維表,通過這幾個維表的主鍵,就將事實表和維表連接在一起,形成星型模式完全用二維關(guān)系表示數(shù)據(jù)的多維概念建立星型模型后,就可以在關(guān)系數(shù)據(jù)庫中模擬數(shù)據(jù)的多維查詢,通過維表的主鍵,對事實表和每一個維作連接操作,一次查詢就可以得到數(shù)據(jù)的值以及對數(shù)據(jù)的多維描述。
3 結(jié)束語
本文介紹了基于數(shù)據(jù)倉庫環(huán)境下建立的數(shù)字化校園結(jié)構(gòu)設(shè)計,如何更好地利用所建立的數(shù)字化校園的數(shù)據(jù)倉庫,是數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)的有機結(jié)合。把數(shù)據(jù)挖掘技術(shù)應(yīng)用在高校數(shù)字化校園中,為高校管理者提供決策依據(jù),從而達(dá)到提高教學(xué)質(zhì)量的目的。
參考文獻(xiàn):
[1] 陳文偉,黃金才.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘[M].北京:人民郵電出版社,2004.
[2] 彭木根.數(shù)據(jù)倉庫技術(shù)與實現(xiàn)[M].北京:電子工業(yè)出版社,2002.
[3] 羅運模.SQL Server 2000數(shù)據(jù)倉庫應(yīng)用與開發(fā)[M].北京:人民郵電出版社,2001.
[4] 崔靜.數(shù)字化校園信息資源建設(shè)探討[J].山東社會科學(xué),2007(8).