湖南省湘西職業(yè)技術(shù)學(xué)院計(jì)算機(jī)系 黃 青
數(shù)據(jù)挖掘技術(shù)在學(xué)生成績(jī)管理中的應(yīng)用研究
湖南省湘西職業(yè)技術(shù)學(xué)院計(jì)算機(jī)系 黃 青
在學(xué)校的管理工作中,學(xué)生成績(jī)管理是非常重要的一個(gè)環(huán)節(jié)。當(dāng)前我國(guó)一些學(xué)校在對(duì)學(xué)生成績(jī)進(jìn)行管理的過(guò)程中,雖然利用了相關(guān)的成績(jī)處理系統(tǒng),但是對(duì)人工管理的依賴(lài)性還比較大,這種管理方法不僅工作效率低, 容易出錯(cuò),而且很難有效的對(duì)學(xué)生成績(jī)進(jìn)行分析,從而獲取更多有價(jià)值的信息。如果學(xué)校能夠充分利用數(shù)據(jù)挖掘技術(shù),可以進(jìn)一步完善成績(jī)管理系統(tǒng),從而挖掘更多隱秘的信息。因此本文在分析數(shù)據(jù)挖掘技術(shù)應(yīng)用優(yōu)勢(shì)的基礎(chǔ)上,還具體分析了如何才能根據(jù)數(shù)據(jù)挖掘技術(shù)設(shè)計(jì)一個(gè)合理的成績(jī)管理系統(tǒng)。
數(shù)據(jù)挖掘技術(shù);學(xué)生;成績(jī)管理
我國(guó)學(xué)校主要是由教師將學(xué)生的考試成績(jī)逐一輸入到成績(jī)管理系統(tǒng)中,從而由該系統(tǒng)對(duì)分?jǐn)?shù)進(jìn)行分析,從而了解各分?jǐn)?shù)段的人數(shù)等基本信息,但是目前所應(yīng)用的系統(tǒng)不僅不能對(duì)得分點(diǎn)與失分點(diǎn)進(jìn)行具體的分析,而且也不能對(duì)學(xué)習(xí)情況以及相關(guān)的影響因素進(jìn)行分析。在信息不全面的情況下,教師就很難開(kāi)展教學(xué)策略的改革,而且單純將成績(jī)存儲(chǔ)于系統(tǒng)中造成了資源的浪費(fèi),不利于解決成績(jī)管理系統(tǒng)問(wèn)題,更是不利于教學(xué)質(zhì)量的提高。
目前各大學(xué)校使用的成績(jī)管理系統(tǒng)存在一定的缺陷,它只能對(duì)基礎(chǔ)的信息進(jìn)行統(tǒng)計(jì),而利用數(shù)據(jù)挖掘技術(shù)后,不僅可以對(duì)及格率和優(yōu)秀率等信息進(jìn)行統(tǒng)計(jì),而且還能對(duì)某個(gè)階段的學(xué)習(xí)成績(jī)進(jìn)行分析,從而了解學(xué)生在一個(gè)時(shí)期內(nèi)的學(xué)習(xí)情況以及相關(guān)的影響因素,總之,利用數(shù)據(jù)挖掘技術(shù)可以更客觀、全面的評(píng)定學(xué)生成績(jī)。同時(shí),利用數(shù)據(jù)挖掘技術(shù)能夠了解學(xué)生在考試中到底存在哪些方面的不足,從而對(duì)學(xué)生進(jìn)行針對(duì)性的學(xué)習(xí),并了解試題的難易程度是否符合學(xué)生當(dāng)前的學(xué)習(xí)狀況[1]。在此基礎(chǔ)上利用數(shù)據(jù)挖掘技術(shù)可以更合理的進(jìn)行教學(xué)評(píng)價(jià),從各個(gè)方面挖掘更多的信息,從而給予教師客觀、全面的評(píng)價(jià)。此外,利用數(shù)據(jù)挖掘技術(shù)能夠真實(shí)反映成績(jī)影響因素,獲取更多的有價(jià)值信息,從而有利于教師做出更合理的課程安排。
3.1 數(shù)據(jù)挖掘過(guò)程的設(shè)計(jì)
只有合理設(shè)計(jì)數(shù)據(jù)挖掘過(guò)程,才能創(chuàng)建一個(gè)合理的學(xué)生成績(jī)管理系統(tǒng),一般來(lái)說(shuō)數(shù)據(jù)挖掘較為復(fù)雜,可分為以下六個(gè)步驟:
第一個(gè)步驟是確定數(shù)據(jù)源。在整個(gè)系統(tǒng)的創(chuàng)建中,數(shù)據(jù)源是重要的基礎(chǔ)部分。對(duì)學(xué)生成績(jī)進(jìn)行統(tǒng)計(jì)與分析的過(guò)程中,面向?qū)ο筝^為廣泛, 不僅僅是一個(gè)個(gè)體,而是不同類(lèi)型的學(xué)生 ,例如,對(duì)于教務(wù)處而言,需要對(duì)全校學(xué)生的學(xué)習(xí)成績(jī)進(jìn)行分析, 以便了解他們的學(xué)習(xí)情況 ,而對(duì)各個(gè)系別而言,他們需要對(duì)本系學(xué)生的學(xué)習(xí)成績(jī)進(jìn)行分析,以掌握更多的相關(guān)信息[2]。他們不僅面向?qū)ο蟛灰粯?,而且?shù)據(jù)挖掘目的也有所差異;第二步驟是選定模型。選定模型主要是指針對(duì)挖掘的問(wèn)題選擇對(duì)應(yīng)的方法 ,并為該種挖掘方法,選擇有效的算法,算法的選擇尤其重要,因?yàn)樗苯佑绊懼诰蛐畔⒌馁|(zhì)量[3];第三個(gè)步驟是采集數(shù)據(jù)。采集數(shù)據(jù)需要投入大量的精力,因此開(kāi)發(fā)者在對(duì)信息進(jìn)行收集的過(guò)程中,部分?jǐn)?shù)據(jù)是可以直接獲取的,但是部分?jǐn)?shù)據(jù)需要通過(guò)實(shí)踐調(diào)查獲??;第四個(gè)步驟是數(shù)據(jù)預(yù)處理。開(kāi)發(fā)者需要對(duì)各種數(shù)據(jù)進(jìn)行預(yù)處理,并根據(jù)結(jié)果創(chuàng)建一個(gè)分析數(shù)據(jù)模型,這是非常關(guān)鍵的一個(gè)環(huán)節(jié),只有做好了數(shù)據(jù)預(yù)處理工作,才能有效提高信息的質(zhì)量;第五個(gè)步驟是數(shù)據(jù)挖掘。數(shù)據(jù)挖掘過(guò)程中充分體現(xiàn)了算法的具體的應(yīng)用 ,開(kāi)發(fā)者將通過(guò)這一環(huán)節(jié)深入的挖掘已經(jīng)經(jīng)過(guò)預(yù)處理的信息[4];第六個(gè)步驟是解釋和評(píng)價(jià)。解釋和評(píng)價(jià)主要是指對(duì)挖掘結(jié)果 進(jìn)行一個(gè)綜合的分析、驗(yàn)證,并從中獲取真正有效的信息 ,從而將根據(jù)數(shù)據(jù)信息改進(jìn)教學(xué)策略,以獲取更好的教學(xué)效果。
3.2 數(shù)據(jù)挖掘的基本方法
系統(tǒng)需要選擇合理的挖掘算法,這是至關(guān)重要的一步,經(jīng)過(guò)對(duì)不同的算法進(jìn)行比較后發(fā)現(xiàn),最佳的算法有兩種。
第一種算法是關(guān)聯(lián)分析法。應(yīng)用關(guān)聯(lián)分析法,主要是為了能夠挖掘出各種隱含的數(shù)據(jù)關(guān)系。在具體的應(yīng)用中,需要先提供一組集合,進(jìn)而對(duì)其進(jìn)行統(tǒng)計(jì)與分析,推導(dǎo)出數(shù)據(jù)的關(guān)聯(lián)性 。對(duì)數(shù)據(jù)庫(kù)系統(tǒng)進(jìn)行建設(shè)的過(guò)程中 ,可應(yīng)用的關(guān)聯(lián)規(guī)則有很多,開(kāi)發(fā)者需要根據(jù)實(shí)際需求進(jìn)行合理的選擇。通常情況下 可根據(jù)“可信度”,或者“支持度”這樣的一個(gè)閩值,淘汰無(wú)效或者意義不大的關(guān)聯(lián)規(guī)則。同時(shí),關(guān)聯(lián)規(guī)則算法需要遵循一定的步驟,首先,有關(guān)人員應(yīng)當(dāng)搜尋所有的頻繁項(xiàng)集,即支持度不超過(guò)最小支持度的集合;其次,頻繁項(xiàng)集之間形成的所有關(guān)聯(lián)規(guī)則必須要滿(mǎn)足最小置信度,或者滿(mǎn)足最小支持度[5]。在實(shí)際的教學(xué)中,教師應(yīng)用以上這種方法對(duì)課程教學(xué)與成績(jī)相關(guān)性進(jìn)行分析,可以獲取更多有效的信息,對(duì)于教學(xué)質(zhì)量的提高具有重要的意義。
第二種算法是決策樹(shù)算法。決策樹(shù)算法是建立在實(shí)例上的一種有效方法,不僅可以用來(lái)對(duì)數(shù)學(xué)進(jìn)行預(yù)測(cè)與分類(lèi),而且還可以用來(lái)對(duì)數(shù)據(jù)進(jìn)行預(yù)處理與挖掘。一般來(lái)說(shuō)主要由兩大部分組成:一是樹(shù)的生成,二是樹(shù)的剪枝。有關(guān)人員在利用決策樹(shù)算法對(duì)數(shù)據(jù)信息的分類(lèi)規(guī)則進(jìn)行挖掘的時(shí)候,主要是以“if—then”的形式表示規(guī)則使用。而且這種具有自身的優(yōu)勢(shì),從數(shù)據(jù)處理的角度來(lái)看,它的處理速度非???,從結(jié)果的角度來(lái)看 ,分類(lèi)準(zhǔn)確率也很高,更重要的是算法可以容易轉(zhuǎn)換為 SQL 語(yǔ)句。
學(xué)校將數(shù)據(jù)挖掘技術(shù)應(yīng)用于學(xué)生成績(jī)管理管理中,可以對(duì)學(xué)成成績(jī)進(jìn)行客觀、全面的分析,從而使教師能夠全面掌握學(xué)生的學(xué)習(xí)狀況,了解學(xué)生的知識(shí)薄弱環(huán)節(jié),從而加強(qiáng)對(duì)學(xué)生進(jìn)行這一方面的培訓(xùn),并為課程開(kāi)設(shè)提供真實(shí)的數(shù)據(jù)依據(jù)。同時(shí),通過(guò)數(shù)據(jù)分析結(jié)果,教師可以了解教學(xué)策略存在哪些不足,從而作出相應(yīng)的改變,以此有效改進(jìn)教學(xué)方法。總之,數(shù)據(jù)挖掘技術(shù)的應(yīng)用可以有效促進(jìn)教學(xué)水平的提高,而且還能促進(jìn)教學(xué)秩序的穩(wěn)定,以改善學(xué)校的考風(fēng)、學(xué)風(fēng)、教風(fēng)。
[1]劉春陽(yáng).數(shù)據(jù)挖掘技術(shù)在高校成績(jī)管理中的應(yīng)用研究[D].學(xué)位論文:大連交通大學(xué),2013,07(16):196-198.
[2]趙輝.數(shù)據(jù)挖掘技術(shù)在學(xué)生成績(jī)分析中的研究及應(yīng)用[D].學(xué)位論文:大連海事大學(xué),2014,09(16):98-100.
[3]康艷霞.數(shù)據(jù)挖掘技術(shù)在學(xué)生成績(jī)分析中的應(yīng)用研究[D].學(xué)位論文:華東師范大學(xué),2014,06(15):109-111.
[4]曲萍.數(shù)據(jù)挖掘技術(shù)在高校學(xué)生成績(jī)管理中的應(yīng)用研究[J].網(wǎng)絡(luò)與信息,2013,10(25):80-82.
[5]劉軍.決策樹(shù)分類(lèi)算法的研究及其在教學(xué)分析中的應(yīng)用[J].河海大學(xué),2015,02(16):380-383.
黃青(1983—),女,苗族,大學(xué)本科,工程碩士,湖南省湘西職業(yè)技術(shù)學(xué)院計(jì)算機(jī)系講師,研究方向:計(jì)算機(jī)應(yīng)用、控制工程。