郭俊亮
(銅仁職業(yè)技術(shù)學(xué)院信息工程學(xué)院,銅仁 554300)
數(shù)據(jù)挖掘在高校分析學(xué)生學(xué)情中的應(yīng)用
郭俊亮
(銅仁職業(yè)技術(shù)學(xué)院信息工程學(xué)院,銅仁 554300)
學(xué)生的期末考試成績出來以后,只能從結(jié)果上看掛科還是沒有掛科,教師難以獲取深層次的因素,針對(duì)此現(xiàn)狀,利用數(shù)據(jù)挖掘的ID3算法對(duì)學(xué)生的一些基本屬性進(jìn)行數(shù)據(jù)挖掘,可以找出其中一些有用的信息,為教師的上課管理、學(xué)生的學(xué)習(xí)等提供數(shù)據(jù)支持。
決策樹;數(shù)據(jù)挖掘;學(xué)生學(xué)習(xí);ID3
學(xué)生的期末考試成績出來以后,老師和學(xué)生都只能看見這門課程表面的成績,學(xué)生的成績是和一些因素有關(guān)系的,例如學(xué)生對(duì)這門課程的學(xué)習(xí)興趣,教師對(duì)這門課程的授課方式,影響學(xué)生學(xué)習(xí)的一些課外因素,這些都是是有很大的關(guān)聯(lián)的,不能等掛科以后,才去分析原因。
通過數(shù)據(jù)挖掘技術(shù)可以從一些數(shù)據(jù)中發(fā)現(xiàn)隱藏的規(guī)律和模式,將數(shù)據(jù)挖掘與學(xué)生的平時(shí)的一些信息進(jìn)行組合,可以找到學(xué)生的一些發(fā)展變化規(guī)律,加以利用可以提高學(xué)生們的學(xué)習(xí)成績,提高授課教師的教學(xué)水平和學(xué)生的學(xué)習(xí)成績。
ID3算法是決策樹技術(shù)中的一個(gè)經(jīng)典的算法,在算法的運(yùn)行過程中,要計(jì)算屬性的信息熵與信息的增益,然后通過增益高的屬性進(jìn)行分類。
學(xué)生的期末考試成績會(huì)受到多方面因素的影響,學(xué)生的主觀努力程度是很重要的因素,但是,同時(shí)也會(huì)受到其他方面因素的影響,例如,學(xué)生不喜歡教師的授課方式,家庭的經(jīng)濟(jì)情況、是否戀愛等,這些都影響學(xué)生的學(xué)習(xí)成績,所以,通過ID3算法將學(xué)生的基本信息和學(xué)習(xí)基本狀況聯(lián)系起來,可以構(gòu)建一個(gè)預(yù)測學(xué)生是否期末掛科的決策樹。
2.1 數(shù)據(jù)處理
根據(jù)數(shù)據(jù)挖掘的目的和需要,獲取學(xué)生的家庭經(jīng)濟(jì)情況、喜歡不喜歡教師的授課方式、出勤情況、作業(yè)情況、是否戀愛、共計(jì)5列屬性,通過類別分析,對(duì)35名學(xué)生的情況屬性進(jìn)行數(shù)據(jù)離散化,如表1所示。
表1 樣本學(xué)生的基本屬性
2.2 決策樹的構(gòu)建
根據(jù)樣本數(shù)據(jù),以期末是否掛科為目標(biāo)構(gòu)建決策樹。
(1)計(jì)算樣本數(shù)據(jù)“是否掛科”分類的信息熵
(2)樣本數(shù)據(jù)屬性的信息熵和信息增益
鑒于我國絕大多數(shù)AMI患者直接就診于基層醫(yī)院,而基層醫(yī)院的診治現(xiàn)狀又極不規(guī)范,因此,規(guī)范化胸痛中心建設(shè)應(yīng)該立足于建立區(qū)域協(xié)同救治模式。
以“喜歡不喜歡教師的授課方式”為例計(jì)算信息熵?!跋矚g不喜歡教師的授課方式”屬性有兩個(gè)值{A,B},所以決策樹分為兩個(gè)子集,分別計(jì)算其信息熵如下:
同樣,可以計(jì)算出“家庭經(jīng)濟(jì)情況”、“出勤情況”、“作業(yè)情況”、“是否戀愛”的信息熵。
可以分別計(jì)算出個(gè)屬性的信息增益如下:
可以得到結(jié)果是:“作業(yè)情況”是最大的增益效益屬性,應(yīng)按照“作業(yè)情況”的屬性進(jìn)行分類。
(3)重復(fù)以上步驟既可以構(gòu)建一個(gè)決策樹。
2.3 分析
根據(jù)決策樹,可以提取分類規(guī)則
(1)if作業(yè)情況=C and出勤情況=C and是否戀愛=A喜歡不喜歡教師的授課方式=B學(xué)生掛科的比率是80%。
(2)if作業(yè)情況=C and出勤情況=C and是否戀愛=A喜歡不喜歡教師的授課方式=A學(xué)生掛科的比率是70%。
(3)if作業(yè)情況=C and出勤情況=B and是否戀愛=A喜歡不喜歡教師的授課方式=A學(xué)生掛科的比率是60%。
將數(shù)據(jù)挖掘技術(shù)應(yīng)用于預(yù)測學(xué)生期末掛科的中,能夠提高、改進(jìn)教師的教學(xué)方式,增加學(xué)生對(duì)授課教師的認(rèn)同感,也增加學(xué)生對(duì)所學(xué)課程的興趣,學(xué)生在學(xué)習(xí)和課外時(shí)。同時(shí),學(xué)生在學(xué)習(xí)和課外時(shí)間的分配上也有了一個(gè)深刻的認(rèn)識(shí)。
[1]丁保忠.數(shù)據(jù)挖掘技術(shù)在學(xué)生綜合信息管理系統(tǒng)中的應(yīng)用研究[D].河北:河北科技大學(xué)碩士論文,2013,04.
[2]韓家煒.數(shù)據(jù)挖掘概念與技術(shù)[M].范明,譯.北京:機(jī)械工業(yè)出版社,2012:172-173.
[3]曾雪峰.計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)開發(fā)及其在檔案信息管理中的運(yùn)用研究[J].科技創(chuàng)新與應(yīng)用,2016,27(9):285-285.
Application of Data Mining in the Analysis of College Students'Learning Situation
GUO Jun-liang
(Department of Information Engineering,Tongren Polytechnic College,Tongren 554300)
After the final exam scores are post,it can only be seen fail or not from the exam results,it is difficult for teachers to acquire deep-seated factors,in this situation,some basic properties of the ID3 data mining algorithm based on data mining for the students,which can find out some useful information,to provide data support for the school management and teachers the students'learning.
郭俊亮(1987-),男,山西臨汾人,碩士,研究方向?yàn)槲锫?lián)網(wǎng)與大數(shù)據(jù)
2017-04-14
2017-06-11
1007-1423(2017)17-0060-03
10.3969/j.issn.1007-1423.2017.17.012
Decision Tree;Data Mining;Student Learning;ID3