李思瑤
摘要:在信息化急速發(fā)展的今天,許多工作都在計算機系統(tǒng)的輔助下得到了高效率的發(fā)展和進步。隨著高校學(xué)生人數(shù)的急劇增長,給高校教學(xué)管理工作增添了許多困難。本文力求將數(shù)據(jù)挖掘應(yīng)用在高校教學(xué)管理中,利用數(shù)據(jù)挖掘技術(shù)有效的挖掘教學(xué)管理資料中隱藏的重要信息,為學(xué)院安排教學(xué)工作提供科學(xué)決策依據(jù),從而提高高校教學(xué)管理系統(tǒng)的使用效率。
關(guān)鍵詞:數(shù)據(jù)挖掘 教學(xué)管理 關(guān)聯(lián)規(guī)則 決策樹
數(shù)據(jù)挖掘是從大量的數(shù)據(jù)中挖掘有趣模式和知識的過程。數(shù)據(jù)源包括Web、數(shù)據(jù)庫、動態(tài)流入系統(tǒng)的數(shù)據(jù)或其他信息存儲庫。雖然是一門新興學(xué)科,但其研究具有廣泛的應(yīng)用前景。本文旨在尋找數(shù)據(jù)挖掘技術(shù)與教學(xué)管理系統(tǒng)這兩者的聯(lián)結(jié)點,尋求如何在教學(xué)管理系統(tǒng)中使用數(shù)據(jù)挖掘技術(shù)。本文主要對學(xué)生成績數(shù)據(jù)庫、教學(xué)評價數(shù)據(jù)庫進行挖掘。
一、教務(wù)管理信息化建設(shè)成果及問題
隨著我國高校信息化的迅猛發(fā)展,信息技術(shù)在高校教學(xué)管理中應(yīng)用的普及。全國絕大部分高校已經(jīng)建立校園網(wǎng)并使用現(xiàn)代化的教學(xué)管理手段。利用信息技術(shù)更有效的為高校日常教學(xué)管理服務(wù)。已經(jīng)成為當(dāng)代教學(xué)管理人員進行日常教學(xué)管理的重要手段之一。
從國內(nèi)高校使用的教學(xué)管理系統(tǒng)的情況來看,雖然系統(tǒng)中保存著課程、師生信息、成績等大量的數(shù)據(jù)信息。但絕大部分管理人員只對這些大量積累的數(shù)據(jù)采取導(dǎo)入、查詢、刪除和備份等操作。雖然該系統(tǒng)在一定程度上大幅度地提高了教務(wù)管理效率,但該系統(tǒng)不具備為管理人員提供能科學(xué)性、理論性的綜合分析學(xué)生、教師情況的信息,且對于長時間積累的大量數(shù)據(jù)中所隱含的信息不能有效的處理。不能充分發(fā)揮信息技術(shù)的潛能。難以為教學(xué)管理決策提供科學(xué)、理論的依據(jù)。
二、數(shù)據(jù)挖掘系統(tǒng)的實現(xiàn)目標
目前高校的教學(xué)管理系統(tǒng)能夠完成高?,F(xiàn)階段教務(wù)工作所涉及的教學(xué)管理以及數(shù)據(jù)信息等工作。具有對數(shù)據(jù)的儲存、修改、查詢、備份等功能。但是該系統(tǒng)的使用,讓教學(xué)管理人員的工作仍處于簡單的數(shù)據(jù)操作狀態(tài)中。該系統(tǒng)很難做到對存儲的數(shù)據(jù)進行多角度分析,這些常年積累的數(shù)據(jù)隱藏著未知的規(guī)律或者模式。這些未知的規(guī)律或者模式卻因未經(jīng)發(fā)現(xiàn)而不能使用。
為了解決這一問題。本文通過對筆者所在單位使用的正方管理系統(tǒng)中已有的數(shù)據(jù)庫進行整理、連接,使用數(shù)據(jù)挖掘工具,從而設(shè)計出能夠挖掘隱藏知識的新一代教學(xué)管理系統(tǒng)。本文設(shè)計的教學(xué)管理挖掘系統(tǒng)主要有兩方面的應(yīng)用:
1.教學(xué)評價中的應(yīng)用。學(xué)院每學(xué)期均組織學(xué)生、教師進行教學(xué)評價,評價后的數(shù)據(jù)除了用于對教師的教學(xué)質(zhì)量評級外不做其他用途。使用決策樹算法,建立教學(xué)評價模型,幫助教學(xué)管理人員有效地、正確地使用每學(xué)期積累的教學(xué)評價數(shù)據(jù),找出影響教師教學(xué)效果的因素,從而在提高教學(xué)質(zhì)量、加強教學(xué)效果、合理分配教學(xué)資源等方面,提供科學(xué)理論依據(jù)。
2.課程設(shè)置中的應(yīng)用。各個系部的專業(yè)課程設(shè)置均為循序漸進的,即課程與課程間有一定的先后順序關(guān)系。但是有些課程開設(shè)的先后順序并不能從經(jīng)驗上判斷。致使相關(guān)課程開課的先后順序不清。故使用關(guān)聯(lián)規(guī)則算法建立課程設(shè)置模型。為人才培養(yǎng)方案的制定提供科學(xué)理論依據(jù)。顯得尤為必要。
三、高校教學(xué)挖掘系統(tǒng)構(gòu)建
(一)數(shù)據(jù)挖掘模型的構(gòu)建過程
1.確定挖掘目標。該步驟是進行數(shù)據(jù)挖掘的第一步。進行挖掘前首要一步就是能夠明確問題,確定挖掘目的,認清目標是正確建立挖掘的先決條件。本系統(tǒng)所挖掘的信息是教學(xué)評價評分和學(xué)生成績。目的是通過對教學(xué)評價的評分和學(xué)生期末成績進行分析,找出影響教師課堂教學(xué)效果的因素以及課程設(shè)置的先后順序。2.數(shù)據(jù)選擇。該步驟是對所需數(shù)據(jù)進行收集、篩選。3.據(jù)預(yù)處理。該步驟是需要對存儲在數(shù)據(jù)庫中的數(shù)據(jù)進行清理、去噪、刪去無效數(shù)據(jù)、填補不完整的域等操作。這些操作的目的是為了保證數(shù)據(jù)的正確、完整和一致性。4.數(shù)據(jù)轉(zhuǎn)換。將處理過的數(shù)據(jù)轉(zhuǎn)換成為一個數(shù)據(jù)模型,根據(jù)數(shù)據(jù)的特點選擇建立相應(yīng)的數(shù)據(jù)挖掘模型。5.數(shù)據(jù)挖掘。按照挖掘模型。選擇適合的算法對數(shù)據(jù)進行挖掘,以期獲取有用的知識。6.生成分類規(guī)則。對挖掘得到的信息進行解釋、評價,將得到的結(jié)果生成分類規(guī)則。在評價階段,為了便于用戶的理解,系統(tǒng)將篩選出有價值的信息使用可視化的方法將結(jié)果呈現(xiàn)。7.知識的應(yīng)用。將挖掘出的知識應(yīng)用到實際教學(xué)中,以期待找到提高教師授課水平的關(guān)鍵因素和正確的課程設(shè)置順序,從而提高學(xué)院的整體教學(xué)水平、提高教學(xué)質(zhì)量。
(二)主要功能模塊介紹
登錄模塊:本系統(tǒng)的使用者根據(jù)身份的不同。有著不同的使用權(quán)限。本系統(tǒng)的使用者主要包括管理員和教師。管理員的職責(zé)是對系統(tǒng)平臺進行日常管理和維護,系統(tǒng)管理員可以實現(xiàn)擁有最高權(quán)限。教師身份是系統(tǒng)平臺的使用者,可以對平臺的信息進行挖掘,并對挖掘后的知識進行查詢、使用,其使用權(quán)限次于系統(tǒng)管理員。
數(shù)據(jù)預(yù)處理模塊:在數(shù)據(jù)預(yù)處理子功能模塊中,主要是可以依據(jù)挖掘需要,對數(shù)據(jù)進行預(yù)處理操作。主要的操作包括數(shù)據(jù)的選擇、數(shù)據(jù)的缺失值處理、數(shù)據(jù)冗余的處理、數(shù)據(jù)的離散化處理等?;跊Q策樹算法的教學(xué)評價模塊:該模塊是使用lD3算法實現(xiàn)的。該模塊主要用于對每學(xué)期學(xué)院組織的教學(xué)評價分數(shù)進行分析。找尋影響教師教學(xué)效果的因素?;陉P(guān)聯(lián)規(guī)則的課程設(shè)置模塊:該模塊是使用Apriori算法實現(xiàn)的。學(xué)生在校學(xué)習(xí)期間,課程之間是有一定相互聯(lián)系的,部分課程是有前后順序關(guān)系的。該模塊主要是對課程實行數(shù)據(jù)挖掘,找尋課程與課程間的關(guān)聯(lián)。并分析各個課程間的相關(guān)性。該模塊主要使用學(xué)生成績數(shù)據(jù),利用關(guān)聯(lián)規(guī)則挖掘滿足給定條件的支持度和置信度課程問的關(guān)聯(lián),得到有價值的發(fā)現(xiàn)、規(guī)律,為科學(xué)、合理設(shè)置課程順序。提供有力的數(shù)據(jù)支持。
數(shù)據(jù)挖掘技術(shù)在教學(xué)管理系統(tǒng)中的應(yīng)用,除了本文所涉及的教學(xué)評價和課程設(shè)置外,還有許多待開發(fā)、研究的方向。在今后的學(xué)習(xí)、研究中??梢赃M一步開發(fā)新的應(yīng)用系統(tǒng)。例如:學(xué)生選課的興趣研究、學(xué)生高考成績對大學(xué)階段考試成績的影響、課程設(shè)置與學(xué)生就業(yè)方向的關(guān)系、挖掘影響教師科研水平的因素、學(xué)生就業(yè)情況與在校期間成績的聯(lián)系等課題的研究。