摘 要:文中簡(jiǎn)單介紹了數(shù)據(jù)挖掘技術(shù)之決策樹(shù)的概念,并對(duì)以本校電子系2011級(jí)學(xué)生所開(kāi)設(shè)的課程考試成績(jī)作為測(cè)試數(shù)據(jù)進(jìn)行分析,為教務(wù)管理提供及時(shí)準(zhǔn)確的信息及工作重點(diǎn)指導(dǎo)。
關(guān)鍵詞:數(shù)據(jù)挖掘;決策樹(shù);教學(xué)
目前國(guó)內(nèi)高等職業(yè)學(xué)?;径家呀⑵鹦@網(wǎng)絡(luò),廣大教師和學(xué)生都充分享受到了校園網(wǎng)絡(luò)帶來(lái)的便利。怎么利用信息技術(shù)更好地為教學(xué)管理服務(wù),是我們當(dāng)前面臨的一個(gè)新問(wèn)題。數(shù)據(jù)挖掘在教育領(lǐng)域的應(yīng)用相對(duì)較少。將數(shù)據(jù)挖掘技術(shù)引入到學(xué)校學(xué)生信息管理之中,利用數(shù)據(jù)挖掘技術(shù)對(duì)已有的數(shù)據(jù)進(jìn)行分析管理,找出影響學(xué)生成績(jī)的各種因素間的內(nèi)存聯(lián)系,已是大勢(shì)所趨。
1 數(shù)據(jù)挖掘技術(shù)——決策樹(shù)技術(shù)
決策樹(shù)是一種歸納學(xué)習(xí)算法,它是以實(shí)例為基礎(chǔ)的。是從一組無(wú)規(guī)則、無(wú)次序的元組中推理出用決策樹(shù)來(lái)表示形式的分類規(guī)則。它采用的是自頂向下的遞歸方法,在決策樹(shù)的每個(gè)內(nèi)部結(jié)點(diǎn)進(jìn)行其屬性值的比較,根據(jù)不同的屬性值從該結(jié)點(diǎn)向下分枝,葉結(jié)點(diǎn)就是要學(xué)習(xí)劃分的類。從決策樹(shù)的根到葉結(jié)點(diǎn)之間的一條路徑就對(duì)應(yīng)著一條合取規(guī)則,因此,整個(gè)決策樹(shù)實(shí)際上就對(duì)應(yīng)著一組析取表達(dá)式的規(guī)則。
ID3算法的具體方法是:先檢測(cè)所有的屬性,檢測(cè)完后選擇信息增益最大的那個(gè)屬性用來(lái)產(chǎn)生決策樹(shù)的結(jié)點(diǎn),并由該屬性的不同取值建立分枝,然后再對(duì)各分枝的子集進(jìn)行遞歸調(diào)用同樣的方法建立決策樹(shù)結(jié)點(diǎn)的分枝,一直到所有的子集僅僅包含相同類別的數(shù)據(jù)為止。最后就能得到一棵決策樹(shù),用它可以來(lái)對(duì)新的樣本進(jìn)行分類。ID3算法方法簡(jiǎn)單,算法理論清晰,具有較強(qiáng)的學(xué)習(xí)能力。尤其適用于較小的數(shù)據(jù)集,但對(duì)噪聲較為敏感,在較大數(shù)據(jù)集處理時(shí)效果欠佳。
2 決策樹(shù)技術(shù)在課程評(píng)價(jià)中的應(yīng)用
1)數(shù)據(jù)清理
建立決策樹(shù),分析課程類型、考查方式、是否需要重修及試卷難度等屬性對(duì)其總體的影響。本文以我校電子系2011級(jí)學(xué)生所開(kāi)設(shè)的課程考試成績(jī)作為測(cè)試數(shù)據(jù),提取成績(jī)表中的部分字段如表1所示。
因此,對(duì)于課程A可加強(qiáng)學(xué)生對(duì)于非必修課程的重視程度,任課教師應(yīng)該最大程度地調(diào)動(dòng)學(xué)生對(duì)這些課程的學(xué)習(xí)熱情;對(duì)于課程B,一方面教師在出卷時(shí)考慮一下難度的比例,另一方面可以多培養(yǎng)學(xué)生開(kāi)動(dòng)腦筋,解決難題的能力,可以從多培養(yǎng)學(xué)生的動(dòng)手能力等方面多下功夫。
3 結(jié)語(yǔ)
綜上,運(yùn)用挖掘技術(shù)對(duì)于數(shù)據(jù)的處理能夠?yàn)槲覀兘虒W(xué)提供及時(shí)而又準(zhǔn)確的信息,可以為教師的教學(xué)及教學(xué)管理部門對(duì)于教學(xué)的工作重點(diǎn)的把握起指導(dǎo)作用。
參考文獻(xiàn):
[1]高飛.數(shù)據(jù)挖掘技術(shù)在中職校選課系統(tǒng)中的應(yīng)用研究[D].揚(yáng)州大學(xué),2012.
科技經(jīng)濟(jì)市場(chǎng)2014年2期