【摘要】利用數(shù)據(jù)挖掘技術(shù),針對現(xiàn)在學(xué)分制的高校教務(wù)管理系統(tǒng)進(jìn)行改革和創(chuàng)新,先將數(shù)據(jù)挖掘的概念引入到教務(wù)管理系統(tǒng)的使用中,分析了其實現(xiàn)的可行性。針對教務(wù)管理系統(tǒng)中的高校統(tǒng)考課程成績這一項數(shù)據(jù)進(jìn)行整理和建模。
【關(guān)鍵詞】教務(wù)管理;數(shù)據(jù)挖掘
一、引言
隨著信息技術(shù)在高校管理中的應(yīng)用,日常使用中教學(xué)管理系統(tǒng)會遺留下海量的數(shù)據(jù),這些數(shù)據(jù)已經(jīng)形成一個關(guān)于教學(xué)信息的數(shù)據(jù)庫。在現(xiàn)代化建設(shè)的的條件下,如果對這些海量數(shù)據(jù)進(jìn)行分析和挖掘,就可以發(fā)現(xiàn)對教務(wù)管理、學(xué)生管理當(dāng)中有規(guī)律并具有指導(dǎo)意義的信息。
數(shù)據(jù)挖掘作為一種工具,將其應(yīng)用于高校的教學(xué)管理工作,可以幫助管理者從以往的數(shù)據(jù)中發(fā)現(xiàn)隱藏的規(guī)律或模式,為決策提供信息支持,從而不斷提高教學(xué)管理質(zhì)量,促進(jìn)教育管理的進(jìn)一步改革、完善和發(fā)展,從而提高管理的科學(xué)性、針對性和高效率。不管是國內(nèi)還是國外,越來越多的高校利用數(shù)據(jù)挖掘等等技術(shù)進(jìn)行決策系統(tǒng)的構(gòu)建,為更高的決策提供數(shù)據(jù)基礎(chǔ)。
二、數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的定義
數(shù)據(jù)倉庫是決策支持系統(tǒng)(dss)和聯(lián)機(jī)分析應(yīng)用數(shù)據(jù)源的結(jié)構(gòu)化數(shù)據(jù)環(huán)境。數(shù)據(jù)倉庫研究和解決從數(shù)據(jù)庫中獲取信息的問題。數(shù)據(jù)倉庫的特征在于面向主題、集成性、穩(wěn)定性和時變性。數(shù)據(jù)倉庫不僅僅是是一個簡單的數(shù)據(jù)集合,還是一個決策系統(tǒng),它將相關(guān)聯(lián)的的數(shù)據(jù)重新組織,并且為其找出一定的規(guī)律,從而對以后的數(shù)據(jù)進(jìn)行預(yù)測,以供最終用戶直接完成對數(shù)據(jù)的查詢、分析與決策[1][2]。這些元素被收集在模型下,例如:
預(yù)測:估計銷售量、預(yù)測服務(wù)器負(fù)載或服務(wù)器停機(jī)時間;
風(fēng)險和概率:選擇目標(biāo)郵遞的最佳客戶、確定風(fēng)險方案的可能保本點、將概率分配給診斷或其他結(jié)果;
建議:確定哪些產(chǎn)品有可能一起銷售并生成建議;
查找序列:分析購物車中的客戶選擇,并預(yù)測接下來可能發(fā)生的事件;
分組:將客戶或事件劃分到相關(guān)的項目分類,分析和預(yù)測相關(guān)性。
目前,常用的數(shù)據(jù)挖掘分析方法有:關(guān)聯(lián)規(guī)則分析、聚類分析、分類分析、特征、變化和偏差分析、web頁挖掘等幾種[3]。
三、數(shù)據(jù)挖掘在教務(wù)管理中的應(yīng)用
隨著時代的發(fā)展,對學(xué)生的要求也越來越趨向于個性化、多元化。學(xué)生可以自主選擇自己感興趣的課程,感興趣的老師。這樣就導(dǎo)致學(xué)校在定制人才培養(yǎng)方案的時候出現(xiàn)的盲區(qū)。或者我們可以通過調(diào)查問卷的方式提取學(xué)生的個人特征、學(xué)習(xí)情況和興趣愛好。并對學(xué)校的教學(xué)計劃、課程設(shè)置以及資源分配進(jìn)行統(tǒng)籌。這樣的方式會耗費大量的時間和精力,并有在這樣的過程中,也會因為收調(diào)查的人群不同而得到不一樣的結(jié)果。針對這種部分代表全部的方式,得到的結(jié)果也會有所誤差。利用信息化的教務(wù)管理系統(tǒng),我們在正常使用下就已經(jīng)留下了學(xué)生信息、課程設(shè)置、成績等等的大量信息。
在教務(wù)管理中運(yùn)用不同的數(shù)據(jù)挖掘方法可以挖掘出相關(guān)的有價值的信息知識。按照不同的關(guān)聯(lián)規(guī)則,對數(shù)據(jù)的分類也是不一樣的,從而反應(yīng)出的映射類別也是不一樣的。選擇合適的方法能夠優(yōu)化速度,更準(zhǔn)確的預(yù)測,為決策提供更為精確的數(shù)據(jù)。按照不同的關(guān)聯(lián)規(guī)則提取數(shù)據(jù),并用對提取數(shù)據(jù)進(jìn)行分析[4]。
例如存在A+B—C的規(guī)則。那么根據(jù)學(xué)生的A行為和B行為就可以推出可能要發(fā)生的C行為,這樣就可以及時制定策略去鼓勵或遏制C行為的產(chǎn)生。以A學(xué)生和B學(xué)生在一起的行為來說,推導(dǎo)出A和B在一起是起著積極作用還是負(fù)面的影響,進(jìn)而可以選定學(xué)生之間的關(guān)聯(lián),促進(jìn)學(xué)生之間的互助行為。通過這樣的規(guī)律就可以更好的在學(xué)校內(nèi)使用互幫互助的學(xué)生集合。并且利用分類規(guī)則對于學(xué)生的分類和判斷,可以對于不同的學(xué)生采用不同的教學(xué)方法和教學(xué)課程,可以進(jìn)一步實施分層次教學(xué),提高教學(xué)質(zhì)量。另外,利用數(shù)據(jù)挖掘技術(shù)挖掘教務(wù)管理系統(tǒng)中積累的有用信息,可以使學(xué)校的相關(guān)院系針對人才培養(yǎng)方案,進(jìn)行課程的調(diào)節(jié)。通過選課率、通過率及相關(guān)信息,鼓勵和引導(dǎo)學(xué)生選擇互補(bǔ)的課程,這有利于學(xué)生整體素質(zhì)的提高,也有利于教學(xué)資源的合理分配。
四、模型的建立
大部分的學(xué)校選用學(xué)分制的教務(wù)系統(tǒng),采取分專業(yè)、分班教學(xué)的方式來測量學(xué)生的學(xué)習(xí)情況,在繁雜的的教務(wù)系統(tǒng)中,以統(tǒng)考課程成績作為數(shù)據(jù)倉庫的基礎(chǔ)數(shù)據(jù),利用數(shù)據(jù)挖掘的相關(guān)方法對學(xué)生的成績進(jìn)行分析和歸類,并對課程的選擇進(jìn)行預(yù)測,更好的為學(xué)校制定人才培養(yǎng)方案提供基礎(chǔ)數(shù)據(jù)和預(yù)測數(shù)據(jù)。進(jìn)一步的為學(xué)校的管理者提供決策支持,更好的、更準(zhǔn)確的制定學(xué)校的發(fā)展方案。于此同時也可以為學(xué)校提高教學(xué)質(zhì)量、優(yōu)化教學(xué)資源提供可靠的數(shù)據(jù)依據(jù)。
首先,在基于B/S的三層體系結(jié)構(gòu)中,表示層、中間層、數(shù)據(jù)層被分割成三個相對獨立的單元。利用數(shù)據(jù)倉庫的三層體系結(jié)構(gòu),搭建屬于高校統(tǒng)考課程成績數(shù)據(jù)倉庫的應(yīng)用模型的體系[5]。
其中,這三層結(jié)構(gòu)由五部分組成,如圖4-1所示。
其中,五個部分分別是:
(1)數(shù)據(jù)源,包含著以后分析所需要的所有基礎(chǔ)數(shù)據(jù)。例如學(xué)生基本信息、試卷信息、題型信息、課程信息、教師信息等。
(2)ETL階段,即數(shù)據(jù)的抽取、轉(zhuǎn)換、裝載和刷新,數(shù)據(jù)的來自于不用的數(shù)據(jù)源,在不同的數(shù)據(jù)源中的信息表述也不盡相同,這些數(shù)據(jù)在抽取的過程中需要進(jìn)行過濾,得到質(zhì)量高的信息,并針對不同表述的數(shù)據(jù)轉(zhuǎn)換成同種的格式,方便后面數(shù)據(jù)的刷新,并裝載到另一層的數(shù)據(jù)倉庫中。
(3)中心數(shù)據(jù)倉庫,即高校統(tǒng)考課程成績數(shù)據(jù)倉庫。這個中心數(shù)據(jù)倉庫內(nèi)存放的是經(jīng)過清洗和轉(zhuǎn)換以后的數(shù)據(jù),在經(jīng)過進(jìn)一步加工以后存儲于多維數(shù)據(jù)庫中,學(xué)生可以利用數(shù)據(jù)的分析進(jìn)行課程的選擇,從而達(dá)到?jīng)Q策支持的效果。
(4)OLAP服務(wù)層,利用OLAP技術(shù)或是DM技術(shù)對統(tǒng)考成績數(shù)據(jù)倉庫中的數(shù)據(jù)進(jìn)行查詢訪問,得到輔助決策信息。
(5)信息展示層,利用數(shù)據(jù)分析工具得到的知識通過各種可視化的信息展示技術(shù),比如有圖標(biāo)、文本、視頻、聲音等方法將分析結(jié)果更加直觀和全面的展示給用戶。
其中題型難度表,分?jǐn)?shù)表,考試狀態(tài)信息表作為表述的元素。
在教務(wù)系統(tǒng)中,針對課程成績某一功能,利用數(shù)據(jù)挖掘技術(shù),將其應(yīng)用于某個課程成績中,將學(xué)生成績數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)換、加載,完成數(shù)據(jù)的匯總。并使用OLAP技術(shù)對學(xué)生成績進(jìn)行全方位、多角度的分析,例如:學(xué)生的總結(jié)性評估、學(xué)生的個性特征等等,通過這些信息更好的完善學(xué)習(xí)方法,提高學(xué)習(xí)的成效。準(zhǔn)確判斷學(xué)生合作學(xué)習(xí)和解決問題的能力,洞察學(xué)生的學(xué)習(xí)動態(tài)。
五、結(jié)語
利用數(shù)據(jù)挖掘技術(shù),能幫助大學(xué)管理人員更好地分析數(shù)據(jù),從而將潛藏的、有用的信息和知識,從大量的數(shù)據(jù)中提取出來。為后面的決策優(yōu)化速度和準(zhǔn)確性等。數(shù)據(jù)挖掘在教務(wù)系統(tǒng)中的運(yùn)用,也需要通過慢慢的研究來進(jìn)行進(jìn)一步的提高。
參考文獻(xiàn)
[1]Jiawei HAN,Mieheline Kamber.數(shù)據(jù)挖掘慨念與技術(shù)[J].范明,孟小峰,譯.北京:機(jī)械工業(yè)出版社,2004:l-160.
[2]David Hand,Heikki Mannila,PadhraicSmv th.數(shù)據(jù)挖掘原理[J].張銀奎,廖麗,宋俊等,譯.北京:機(jī)械工業(yè)出版社,2003.
[3]劉紅巖,陳劍,陳國青著.數(shù)據(jù)挖掘中的數(shù)據(jù)分類算法綜述[J].清華大學(xué)學(xué)報汨然科學(xué)版,2002,1.
[4][美]融chard J.Roeger.數(shù)據(jù)挖掘教程[M].北京:清華大學(xué)出版社,2003.
[5]余英澤.一種新型數(shù)據(jù)分析技術(shù)——數(shù)據(jù)挖掘口].計算機(jī)與現(xiàn)代化,2000(1).
作者簡介:
高捷(1987—),女,江蘇淮安人,碩士,助教,江蘇財經(jīng)職業(yè)技術(shù)學(xué)院教師,研究方向:計算機(jī)應(yīng)用技術(shù)。
蔡清龍(1981—),男,江蘇淮安人,碩士,講師,江蘇財經(jīng)職業(yè)技術(shù)學(xué)院教師,研究方向:財務(wù)管理。