袁小玲,李 瑞
(陜西財(cái)經(jīng)職業(yè)技術(shù)學(xué)院,陜西咸陽,712000)
數(shù)據(jù)挖掘技術(shù)在高職院校學(xué)生成績管理中的應(yīng)用分析與探究
袁小玲,李 瑞
(陜西財(cái)經(jīng)職業(yè)技術(shù)學(xué)院,陜西咸陽,712000)
學(xué)生成績管理工作是高職院校學(xué)生管理工作的重要組成部分,目前大部分高職院校所采用的都是人工管理加簡單的學(xué)生成績處理系統(tǒng)。這種管理方法沒有辦法從大量的學(xué)生成績信息中提取更多有用的信息,將數(shù)據(jù)挖掘技術(shù)應(yīng)用在學(xué)生成績管理中可以從大量零散看似毫無聯(lián)系的數(shù)據(jù)中,找出數(shù)據(jù)內(nèi)在和潛在的一些聯(lián)系并總結(jié)出規(guī)律,為各學(xué)校改變教學(xué)方法和教學(xué)手段提供有利的依據(jù)。
成績管理;數(shù)據(jù)挖掘;決策樹
目前很多高職院校對于學(xué)生成績的管理,通常都是由教師批閱學(xué)生試卷并將學(xué)生成績輸入到學(xué)校的成績管理系統(tǒng)中,由系統(tǒng)依據(jù)學(xué)生分?jǐn)?shù)的分部情況作出分析,統(tǒng)計(jì)各分?jǐn)?shù)段的人數(shù)以及成績大概分部情況。至于學(xué)生成績中得那些知識是得分點(diǎn)和那些是失分點(diǎn)沒有辦法分析,以及學(xué)習(xí)本課程的必要性和重要性無法分析,大量的學(xué)生成績只是簡單存放在學(xué)生管理系統(tǒng)中,造成很大的系統(tǒng)資源的浪費(fèi)。如何將學(xué)生的成績更加有效的利用起來成了目前學(xué)生成績管理系統(tǒng)需要解決的重要問題。
隨著近兩年各高職院校學(xué)生人數(shù)的不斷增加,每個學(xué)校目前正在運(yùn)行的各種數(shù)據(jù)管理系統(tǒng)都面臨著學(xué)生數(shù)據(jù)信息量過于龐大的問題,一般數(shù)據(jù)管理系統(tǒng)對于數(shù)據(jù)只能完成一些簡單查詢、統(tǒng)計(jì)、存儲和檢索功能,無法從大量存放的數(shù)據(jù)中自動提取出那些有用的隱藏在數(shù)據(jù)背后的那些信息,數(shù)據(jù)大量堆積信息利用率過低,使得這些數(shù)據(jù)變成系統(tǒng)的負(fù)擔(dān),如何利用已經(jīng)有的數(shù)據(jù),挖掘出事物之間的內(nèi)在聯(lián)系并總結(jié)出經(jīng)驗(yàn),為學(xué)校改變教學(xué)策略提高教學(xué)質(zhì)量提供可靠的依據(jù)是每一個學(xué)校都面臨的問題。
高職院校的考試題目除了個別科目采用統(tǒng)一的數(shù)據(jù)試題庫的形式考試,絕大部分都是由代課老師們自己出考試題目,試題中知識點(diǎn)的覆蓋率,合理性,教學(xué)難點(diǎn)和重點(diǎn)是否有體現(xiàn),學(xué)生考試完后從試題中反饋回來的除了考試成績和成績及格率優(yōu)秀率等數(shù)據(jù)外沒有反饋出任何關(guān)于試卷質(zhì)量信息,以及學(xué)生對于教學(xué)中各知識點(diǎn)的掌握情況都沒有體現(xiàn)出來,這樣的考試成績對于提高教學(xué)質(zhì)量和改變教學(xué)方法根本提供不了有效的幫助。
在當(dāng)今社會隨著數(shù)據(jù)庫和人工智能技術(shù)的不斷發(fā)展,數(shù)據(jù)挖掘技術(shù)的應(yīng)用范圍也越來越廣泛,數(shù)據(jù)挖掘技術(shù)可以對已經(jīng)有的數(shù)據(jù)進(jìn)行總結(jié)、分析、統(tǒng)計(jì)和推理,來發(fā)現(xiàn)這些事物之間的內(nèi)在聯(lián)
系,對事物的發(fā)展趨勢進(jìn)行推測。
在學(xué)生成績管理系統(tǒng)中應(yīng)用數(shù)據(jù)挖掘技術(shù)很有意義,數(shù)據(jù)挖掘技術(shù)可以更加科學(xué)的分析學(xué)生成績與各種學(xué)習(xí)影響因素之間隱藏的內(nèi)在聯(lián)系,例如分析學(xué)生考試成績和其它相關(guān)數(shù)據(jù),數(shù)據(jù)挖掘技術(shù)可以回答例如“在教學(xué)過程中那些教學(xué)內(nèi)容的課時分配不足,那些課程在開設(shè)順序上應(yīng)該調(diào)整,那種教學(xué)方式更適合那一門課程”等問題。這些都是現(xiàn)行成績管理系統(tǒng)無法做到的。通過數(shù)據(jù)挖掘工具對學(xué)生的學(xué)習(xí)成績進(jìn)行處理,可以客觀及時的給出對學(xué)生的評價結(jié)果,分析出學(xué)生在教學(xué)過程中那個環(huán)節(jié)接受能力較差,以及學(xué)生更喜歡那種方式的教學(xué)方式。好的信息反饋會更加有利于老師及時改正教學(xué)方式和調(diào)整教學(xué)內(nèi)容,為學(xué)校管理工作者改進(jìn)教育制度、進(jìn)行教學(xué)改革提供科學(xué)的參考依據(jù)。
數(shù)據(jù)挖掘可以在多種類型的數(shù)據(jù)存儲方式上進(jìn)行,例如:關(guān)系數(shù)據(jù)庫、數(shù)據(jù)倉庫、事務(wù)數(shù)據(jù)庫和網(wǎng)絡(luò)數(shù)據(jù)庫,其中關(guān)系數(shù)據(jù)庫具有完備的數(shù)學(xué)理論基礎(chǔ)和非常廣泛的普及度,是數(shù)據(jù)挖掘技術(shù)研究的最主要的數(shù)據(jù)形式。
將數(shù)據(jù)挖掘技術(shù)應(yīng)用在學(xué)生成績管理系統(tǒng)中能從以下多個方面來改變現(xiàn)行系統(tǒng)的不足。(1)在成績方面,學(xué)生成績是衡量學(xué)生學(xué)習(xí)好壞的最直接的方法關(guān)系到學(xué)生獎學(xué)金等各方面評定??茖W(xué)合理的評測學(xué)生成績會更加有利于調(diào)動學(xué)生學(xué)習(xí)的積極性。目前的系統(tǒng)只能對成績進(jìn)行統(tǒng)計(jì)只能給出成績字面層次的信息,數(shù)據(jù)挖掘技術(shù)不但可以統(tǒng)計(jì)出學(xué)生成績個分?jǐn)?shù)段的分布情況、及格率和優(yōu)秀率等基本情況,還可以通過對學(xué)生本學(xué)期成績、以前多次考試成績和學(xué)生多個學(xué)期的平時成績進(jìn)行分析、比對和挖掘,推測出該學(xué)生后面學(xué)習(xí)情況的大概趨勢、和影響學(xué)生學(xué)習(xí)的潛在因素等信息。這樣可以更加合理的給出學(xué)生的綜合評定成績。(2)考試方面,考試在教學(xué)環(huán)節(jié)必不可少的環(huán)節(jié),現(xiàn)行系統(tǒng)從考試中得到的只有成績,數(shù)據(jù)挖掘技術(shù)可以結(jié)合學(xué)生成績和試題中各知識點(diǎn)的分部情況,分析出那些內(nèi)容在以后的教學(xué)中要加強(qiáng)練習(xí),試題的難易程度等信息為教師改變教學(xué)方法提供重要依據(jù)。(3)教學(xué)評價。教學(xué)評價是對于老師工作的一種肯定,科學(xué)的評價可以更好激發(fā)老師工作的潛力。現(xiàn)行評定方法大多是學(xué)生成績加學(xué)生問卷,這種方法過于主觀會打擊教師的工作熱情,結(jié)合成績、試題難易度和學(xué)生平時成績等多做信息可以挖掘出更多數(shù)據(jù)之間內(nèi)在聯(lián)系。(4)課程設(shè)置,學(xué)生的學(xué)習(xí)是循序漸進(jìn)的,課程之間也有著聯(lián)系和先后順序,基礎(chǔ)課程沒有學(xué)好會影響到后面專業(yè)課程的學(xué)習(xí),每個學(xué)期學(xué)生學(xué)習(xí)課程的多少也會影響學(xué)生的學(xué)習(xí)效果。利用管理系統(tǒng)中現(xiàn)有的學(xué)生成績數(shù)據(jù)結(jié)合數(shù)據(jù)挖掘技術(shù)可以得出一些非常有價值的規(guī)則和信息,放映出影響學(xué)生成績的部分因素,在此基礎(chǔ)上,將課程設(shè)置做出更加合理的安排
如何對學(xué)生的成績進(jìn)行更加全面的分析和處理,找到影響學(xué)生學(xué)習(xí)成績的各種潛在因素呢?如經(jīng)過對學(xué)生成績數(shù)據(jù)進(jìn)行分析找出諸如“學(xué)生入校成績各科成績對于學(xué)生在學(xué)習(xí)本專業(yè)相關(guān)課程的學(xué)習(xí)影響有多大”、“每學(xué)期所開設(shè)的課程是否合理是否搭配科學(xué)”等問題真正答案。
進(jìn)行數(shù)據(jù)挖掘的大概有以下幾個工作步驟:
(1)問題定義: 按照用戶的要求,確定挖掘知識的類型,挖掘模式和方法等。
(2)準(zhǔn)備數(shù)據(jù),包括集成數(shù)據(jù)、清理數(shù)據(jù)、轉(zhuǎn)換數(shù)據(jù)和數(shù)據(jù)歸約。其中集成數(shù)據(jù)是將零散存放的數(shù)據(jù)集中在一個數(shù)據(jù)存儲中,數(shù)據(jù)清理主要是元組和空缺值的處理,轉(zhuǎn)換數(shù)據(jù)的目的是將數(shù)據(jù)處理成適合數(shù)據(jù)挖掘的形式。數(shù)據(jù)歸約的目的是在不影響挖掘結(jié)果的前提下縮小挖掘規(guī)模。
(3)數(shù)據(jù)挖掘:參照最終目標(biāo)和各算法的特點(diǎn),選擇挖掘方法
(4)模式解釋和知識評價:去除多余模式,將有意義的模式轉(zhuǎn)化成用戶可理解的語言。
數(shù)據(jù)挖掘技術(shù)是針對特定應(yīng)用數(shù)據(jù)分析處理的過程。如何選擇數(shù)據(jù)挖掘方法,是根據(jù)用戶實(shí)際期望得到的知識類型和具體的數(shù)據(jù)挖掘目標(biāo)來決定的。在數(shù)據(jù)挖掘技術(shù)中,有神經(jīng)網(wǎng)絡(luò)法、貝葉斯法、粗糙集和決策樹法等方法,最為典型的方法是決策樹法,決策樹(Decision Tree)是用于預(yù)測和分類的主要技術(shù),決策樹方法是以實(shí)例為基礎(chǔ)的歸納學(xué)習(xí)算法,通過一組沒有次序、沒有規(guī)則的實(shí)例中推理出決策樹表現(xiàn)形式的分類規(guī)則。
學(xué)生成績數(shù)據(jù)庫的數(shù)據(jù)一般覆蓋的面積比較廣,包括的類型也很多,例如:課程信息、試題信息、成績信息、教師信息等,這些數(shù)據(jù)有連續(xù)屬性也有分散屬性數(shù)據(jù)。決策樹方法對于處理連續(xù)和離散型數(shù)據(jù)相對其它方法更好,決策樹方法能夠清楚的表現(xiàn)出各個屬性的重要程度,并且計(jì)算量相對來說不是很大,能夠生成普通用戶都可以很好理解的規(guī)則。將決策樹方法應(yīng)用到成績管理系統(tǒng)中,對學(xué)生成績進(jìn)行更深層次的分析和挖掘,提取出隱藏在數(shù)據(jù)之中的有用的信息。這些信息對于學(xué)校在評定教師工作和學(xué)生學(xué)習(xí)狀態(tài)將有著很大的幫助。
數(shù)據(jù)挖掘技術(shù)和學(xué)生成績管理相結(jié)合使用,可以更好的掌握學(xué)生的學(xué)習(xí)情況,為學(xué)校在制定各種獎勵制度提供更加可靠的參考依據(jù),為管理者在開設(shè)課程時提供更加合理的參考信息。同時對于教師教學(xué)的改變,學(xué)生學(xué)習(xí)方法的改變等諸多方都會提供很好的參考依據(jù)。這些改變會對各高職院校教學(xué)管理水平的改進(jìn)和教學(xué)質(zhì)量的提高提供有著很大的幫助,為穩(wěn)定學(xué)校教學(xué)秩序,進(jìn)一步改善考風(fēng)、學(xué)風(fēng)、教風(fēng),改善題庫和課程建設(shè)等具有重要意義。
[1]劉美玲,李熹,李永勝.數(shù)據(jù)挖掘技術(shù)在高校教學(xué)與管理中的應(yīng)用[J]計(jì)算機(jī)工程與設(shè)計(jì),2010,(5):1130-1133
[2] 潘鋒.淺談數(shù)據(jù)挖掘技術(shù)在高校管理中的應(yīng)用[J].重慶科技學(xué)院學(xué)報(bào)(社會科學(xué)版),2008,(4):100-101
The research and application of data mining technology in the student management in Higher Vocational Colleges
Yuan Xiaoling,Li Rui
(Shaanxi Vocational College of Finance and Economics,Shaanxi Xianyang,712000)
Students management work is an important part of student management work in higher vocational colleges,the most part of the higher vocational colleges are artificial and student achievement management system simple.This management method have no way to extract more useful information from a large number of student achievement information, the application of data mining technology in the management of student achievement can be from a large number of scattered seemingly disparate data,find out the intrinsic and potential data links and summed up the law,provide the advantageous basis for schools to change teaching method and teaching means.
performance management;data mining;decision tree