摘 要 提出基于數(shù)據(jù)倉(cāng)庫(kù)的解決方案。以數(shù)據(jù)倉(cāng)庫(kù)及OIAP為工具實(shí)現(xiàn)題庫(kù)管理系統(tǒng),給出了題庫(kù)管理系統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu),并對(duì)事實(shí)表、維表以及多維數(shù)據(jù)模型進(jìn)行了設(shè)計(jì),為如何充分利用現(xiàn)有的數(shù)據(jù)為題庫(kù)管理系統(tǒng)的管理和決策服務(wù)提供新的思路和途徑。
關(guān)鍵詞 題庫(kù)管理系統(tǒng);數(shù)據(jù)倉(cāng)庫(kù);OLAP;多維數(shù)據(jù)模型
中圖分類號(hào)TP311.52 文獻(xiàn)標(biāo)識(shí)碼A 文章編號(hào)1673—9671—f2009)122—0015—01
計(jì)算機(jī)應(yīng)用技術(shù)的日益發(fā)展為教育技術(shù)學(xué)的研究與發(fā)展帶來(lái)了新的機(jī)遇,利用計(jì)算機(jī)題庫(kù)系統(tǒng)平臺(tái)取代傳統(tǒng)的紙張考試模式,具備公正、安全、高效的特點(diǎn),題庫(kù)系統(tǒng)的建設(shè)和自動(dòng)組卷、閱卷系統(tǒng)的創(chuàng)建很大程度上減輕了考試各環(huán)節(jié)的工作強(qiáng)度并消除地域差異。然而試題庫(kù)的建設(shè)是一項(xiàng)復(fù)雜而又系統(tǒng)的工程,很多高校在信息化的建設(shè)中,陸續(xù)建立了題庫(kù)管理系統(tǒng),但由于每位教師在出卷中由于各自的個(gè)性原因,很難保證所出的試題都是優(yōu)質(zhì)的和合理的,加上每次考試后沒(méi)有合理的對(duì)考試情況進(jìn)行分析研究,使題庫(kù)系統(tǒng)不夠?qū)I(yè)化、智能化、缺少?zèng)Q策與分析功能,為了充分發(fā)揮這些數(shù)據(jù)的效用,迅速、準(zhǔn)確、有效、適量地提供用戶所需的信息,支持管理決策,實(shí)現(xiàn)數(shù)據(jù)一信息一知識(shí)的轉(zhuǎn)變,就必須運(yùn)用數(shù)據(jù)倉(cāng)庫(kù)技術(shù)。
1 數(shù)據(jù)倉(cāng)庫(kù)概念和與數(shù)據(jù)庫(kù)的區(qū)別
數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)面向主題的、集成的、反映歷史變化、相對(duì)穩(wěn)定的數(shù)據(jù)集合,用于支持管理決策。數(shù)據(jù)倉(cāng)庫(kù)具有面向主題、高度集成、相對(duì)穩(wěn)定、反映歷史變化四個(gè)最重要的特征。 數(shù)據(jù)庫(kù)是面向事務(wù)的設(shè)計(jì),它一般存儲(chǔ)在線交易數(shù)據(jù)。數(shù)據(jù)倉(cāng)庫(kù)是面向主題的設(shè)計(jì),它一般存儲(chǔ)的是歷史數(shù)據(jù)。數(shù)據(jù)庫(kù)設(shè)計(jì)一般采用符合范式的規(guī)則用來(lái)避免冗余,數(shù)據(jù)倉(cāng)庫(kù)是采用反范式的方式來(lái)設(shè)計(jì)為了引入冗余。數(shù)據(jù)庫(kù)是為捕獲數(shù)據(jù)而設(shè)計(jì),數(shù)據(jù)倉(cāng)庫(kù)是為分析數(shù)據(jù)而設(shè)計(jì),它的兩個(gè)基本元素是維表和事實(shí)表。維是看問(wèn)題的角度,如時(shí)間,部門(mén),維表放的就是這些東西的定義,事實(shí)表里放著要查詢的數(shù)據(jù),同時(shí)有維的ID。 單從概念上講,有些晦澀。任何技術(shù)都是為應(yīng)用服務(wù)的,結(jié)合題庫(kù)管理系統(tǒng)可以很容易地理解。以學(xué)生考試成績(jī)?yōu)槔?。?shù)據(jù)庫(kù)是事務(wù)系統(tǒng)的數(shù)據(jù)平臺(tái),學(xué)生每次的考試成績(jī)都會(huì)被寫(xiě)人數(shù)據(jù)庫(kù)記錄下來(lái),在這里,我們可以簡(jiǎn)單理解為用數(shù)據(jù)庫(kù)記帳。數(shù)據(jù)倉(cāng)庫(kù)是分析系統(tǒng)的數(shù)據(jù)平臺(tái),它從事務(wù)系統(tǒng)獲取數(shù)據(jù),并做進(jìn)一步的匯總、加工,為決策者提供決策依據(jù)。比如,學(xué)生的考試成績(jī)分布如何,哪些知識(shí)點(diǎn)失分較多,有哪些類型,男女比例如何,這些多角度信息便于教師全面掌握該次考情況及試題屬性,以便進(jìn)一步研究這些信息為管理決策者提供了決策支持。
2 試題庫(kù)的OLAP分析
1)什么是OLAP。OLAP(聯(lián)機(jī)分析處理)是使分析人員、管理人員或執(zhí)行人員能夠從多角度對(duì)信息進(jìn)行快速、一致、交互地存取,從而獲得對(duì)數(shù)據(jù)進(jìn)一步了解的軟件技術(shù)。滿足決策支持或者滿足在多維環(huán)境下特定的查詢和報(bào)表需求是JAP的目標(biāo),它的技術(shù)核心是“維”這個(gè)概念。
“維”是人們觀察客觀世界的角度,是一種高層次的類型劃分?!熬S”有時(shí)會(huì)包含相當(dāng)復(fù)雜的層次關(guān)系。通過(guò)把一個(gè)實(shí)體的多項(xiàng)重要的屬性定義為多個(gè)維(dimension),使用戶能對(duì)不同維上的數(shù)據(jù)進(jìn)行比較。因此OLAP也可以說(shuō)是多維數(shù)據(jù)分析工具的集合。
OLAP的基本多維分析操作有鉆取(roll up Id611 down)、切片(slice)和切塊(dice)、以及旋轉(zhuǎn)(pivct)、drill across、drill through等。
鉆取是改變維的層次,變換分析的力度。它包括向上鉆取(roll up)和向下鉆取(drill down)。roll up是在某一維上將低層次的細(xì)節(jié)數(shù)據(jù)概括到高層次的匯總數(shù)據(jù),或者減少維數(shù);而drill down則相反,它從匯總數(shù)據(jù)深入到細(xì)節(jié)數(shù)據(jù)進(jìn)行觀察或增加新維。
切片和切塊是在一部分維上選定值后,關(guān)心度量數(shù)據(jù)在剩余維上的分布。如果剩余的維只有兩個(gè),則是切片;如果有三個(gè),則是切塊。
旋轉(zhuǎn)是變換維的方向,即在表格中重新安排維的放置。
2)試題庫(kù)的0LAPSY析框架如圖1所示。
首先我們從試題庫(kù)中通過(guò)某種算法抽取試題資源,然后對(duì)考試結(jié)果從多個(gè)維進(jìn)行分析研究,便于教師與管理人員掌握情況并進(jìn)行決策,對(duì)優(yōu)化后的試題再重新人庫(kù)。所以本系統(tǒng)的任務(wù)是如何酞考試試卷中進(jìn)行統(tǒng)計(jì)信息;二是如何進(jìn)行OLAP的決策來(lái)完善試題庫(kù)。
3)試題庫(kù)的OLAP析模塊劃分。試題庫(kù)的OLAP~析模型分為試題得分率分析、試題對(duì)比分析、試題多維分析三個(gè)模塊。試題得分率分析主要從試題^庫(kù)時(shí)間、類型、知識(shí)點(diǎn)等角度來(lái)分析試題的得分率情況,多角度分析試題,能夠讓教師全面掌握該次考考試情況以便作出分析決策,從而改善試題庫(kù)的質(zhì)量。試題對(duì)比分析主要從試題的知識(shí)點(diǎn),難易程度角度對(duì)比試題被答對(duì)的情況,從而改善知識(shí)點(diǎn)的疏漏及調(diào)整試題的難度。試題多維分析主要通過(guò)切片、切塊、旋轉(zhuǎn)和鉆取等操作綜合各個(gè)維度來(lái)觀察一道試題的量,分析全面,定位準(zhǔn)確,便于教師更容易準(zhǔn)確地得出結(jié)論。三個(gè)功能模塊如圖2所示。
3 設(shè)計(jì)多維數(shù)據(jù)集的模式(以客觀題為倒)星型雪花架構(gòu)
設(shè)計(jì)多維數(shù)據(jù)集的模式采用ROLAP(relational online analyticalprocessing),可以采用SQL數(shù)據(jù)庫(kù)來(lái)實(shí)現(xiàn),將多維結(jié)構(gòu)化分為事實(shí)表與維度表兩類。本系統(tǒng)的實(shí)現(xiàn)采用星型雪花模型,維度表與事實(shí)表關(guān)聯(lián),維度表彼此之間沒(méi)有關(guān)聯(lián)。以試題得分率統(tǒng)計(jì)事實(shí)表為中心。 需要注意的是以得分率為度量。對(duì)于知識(shí)點(diǎn)維、入庫(kù)時(shí)間維、類型維,難度維,學(xué)科維度和用戶維的粒度劃分要符合細(xì)度,如知識(shí)要?jiǎng)澐值秸?、?jié),時(shí)間維劃分為到年、月,難度劃分到難、較難、中、較容易、容易等,得分率受到試題知識(shí)點(diǎn),難易程度,試題類型等因素的影響,體現(xiàn)了事實(shí)表和維度表的關(guān)系。
4 結(jié)語(yǔ)
目前很多高校的題庫(kù)管理系統(tǒng)都是操作型管理系統(tǒng),缺少對(duì)題庫(kù)的分析與決策。為改善試題質(zhì)量,提高教師的工作效率需建立新的合理、有效的數(shù)據(jù)倉(cāng)庫(kù)模型。本文就題庫(kù)管理系統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)的建立、OLJAP分析與模塊的劃分進(jìn)行了一些有益探索。