卜陽
[摘要]本文基于高職教學(xué)的特點,利用學(xué)生考試成績、教學(xué)質(zhì)量調(diào)查表等各類屬性通過數(shù)據(jù)挖掘的決策樹技術(shù)進(jìn)行特征分類。以雜亂無序的數(shù)據(jù)為根本,由決策樹結(jié)構(gòu)建立教學(xué)質(zhì)量評價的分類模型。決策樹的若干節(jié)點與各個教學(xué)質(zhì)量屬性相對應(yīng),其分支表示各個屬性的取值判斷,通過分類結(jié)果用以學(xué)校的教學(xué)質(zhì)量評價。
[關(guān)鍵詞]數(shù)據(jù)挖掘技術(shù);決策樹算法;教學(xué)質(zhì)量評價
[中圖分類號]G640 [文獻(xiàn)標(biāo)識碼]A [文章編號]1671- 5918( 2018)21-0032-03
doi:10.3969/j.issn.1671-5918.2018.21.015 [本刊網(wǎng)址]http://www.hbxh.net
一、引言
高職教育教學(xué)管理正在與計算機網(wǎng)絡(luò)技術(shù)不斷融合,形成了網(wǎng)絡(luò)化校園、信息化校園、智慧化校園,增強了教學(xué)管理水平,提高了工作效率。隨著學(xué)校辦學(xué)的規(guī)模不斷擴大,各種系統(tǒng)和數(shù)據(jù)庫的廣泛使用,在使用過程中產(chǎn)生了海量的數(shù)據(jù)信息。我們可以通過這些技術(shù)在其中發(fā)現(xiàn)有價值的數(shù)據(jù)信息。
二、FP - growth算法
數(shù)據(jù)挖掘是利用已有知識數(shù)據(jù)并通過預(yù)測未發(fā)生的事務(wù)的走勢與行為,從而做出一定的決策性判斷,并從大量數(shù)據(jù)里面發(fā)現(xiàn)潛在的,可利用的知識。
FP- growth算法是一個被普遍使用的歸納推理計算方法。FP-growth算法是建立于FP-tree的結(jié)構(gòu)上,避免了像傳統(tǒng)Apriori算法生成大量的候選項集,提高了運行效率。而且FP- growth算法是通過樹型結(jié)構(gòu)顯示各個分支情況,并產(chǎn)生If -Then的判斷結(jié)果,更加便于使用者理解和使用。
FP-growth算法主要包括三個步驟,它反映了FP-growth算法的過程,Insert階段的任務(wù)是形成FP-tree,Search階段獲取條件模式基,用于下階段的遞歸計算。
三、教學(xué)質(zhì)量評價
教學(xué)質(zhì)量評價是高職學(xué)校教學(xué)中一個基本的反饋機制,是教師優(yōu)化教學(xué)過程、調(diào)控教學(xué)行為、改善教學(xué)方法、增強教學(xué)效果的重要手段。對教學(xué)質(zhì)量進(jìn)行評價,不僅能夠指導(dǎo)教師覺察自己在教學(xué)過程中可能存在的偏差,促成教師自身的發(fā)展和教育水平的提高,而且能夠使學(xué)校相關(guān)管理部門獲取有用的信息,為下一步?jīng)Q策發(fā)展提供重要依據(jù)。
四、FP-growth算法在教學(xué)質(zhì)量評價中的應(yīng)用
(一)設(shè)計思路
課堂教學(xué)質(zhì)量的評價一直是學(xué)校教學(xué)監(jiān)管系統(tǒng)的重要構(gòu)成部分。我們可以通過像學(xué)生的考試成績的數(shù)據(jù)來對老師的教學(xué)質(zhì)量進(jìn)行一個定量方面的打分,也可以通過如調(diào)查問卷形式的學(xué)生對老師教學(xué)工作的測評進(jìn)行一個主觀意義上定性的評價。通過對量和質(zhì)的結(jié)合,利用數(shù)據(jù)挖掘技術(shù)發(fā)現(xiàn)影響教學(xué)的各種因素,為教學(xué)管理部門提供相應(yīng)的輔助支持,進(jìn)一步促進(jìn)教學(xué)部門的管理效率。
(二)模型建立與數(shù)據(jù)處理
1.建立成績與教學(xué)質(zhì)量評價模塊
根據(jù)教務(wù)系統(tǒng)中與教學(xué)相關(guān)的數(shù)據(jù),建立基礎(chǔ)數(shù)據(jù)模型,該模型由教師ID、教師職稱、班級、考試科目、平均成績等屬性組成。經(jīng)過數(shù)據(jù)轉(zhuǎn)化和加載后,采用決策樹算法,計算出那些和成績分析評估特征最為相關(guān)的屬性作為決策樹的根結(jié)點,然后采用迭代遞歸的方法將剩余屬性進(jìn)行分類,構(gòu)造一個決策樹。
首先需要建立教師情況數(shù)據(jù)表。如表1所示:
按照考試成績劃分為三個等級:A等級為大于80分的區(qū)間,B等級為70分到80分的區(qū)間,C等級為小于70分的區(qū)間,根據(jù)成績等級作為評價教師教學(xué)質(zhì)量的一個指標(biāo)。然后,建立一個描述教師教學(xué)質(zhì)量的分類模型,該模型以學(xué)生的計算機國家一級考試成績?yōu)橐罁?jù),根據(jù)成績高低形成教學(xué)質(zhì)量評估結(jié)果,然后利用決策樹所形成的分類模型,形成IF-THEN分類規(guī)則。
2.學(xué)生對教師教學(xué)質(zhì)量的評價模塊
建立學(xué)生對教師教學(xué)質(zhì)量評價的調(diào)查表。具體內(nèi)容包括以下幾點:
(1)備課充分,教學(xué)無隨意性;
(2)嚴(yán)格執(zhí)行作息時間,無遲到、早退現(xiàn)象;
(3)教學(xué)態(tài)度端正、認(rèn)真;
(4)尊重學(xué)生,做學(xué)生的知心人、好朋友;
(5)師生關(guān)系融洽、和諧;
(6)課堂大膽管理,方法得當(dāng);
(7)課堂管理能調(diào)動廣大學(xué)生的積極性;
(8)教學(xué)經(jīng)驗豐富,能吸引學(xué)生;
(9)教學(xué)語言準(zhǔn)確、規(guī)范、生動;
(10)教學(xué)方法靈活,充滿激情,能感染學(xué)生;
(11)教學(xué)創(chuàng)新能力強;
(12)學(xué)生能真正學(xué)到相應(yīng)的知識和技能。
針對以上評價內(nèi)容,采用調(diào)查問卷的形式,在問卷星網(wǎng)站上制作相關(guān)的調(diào)查問卷。采用單選與多選的題目形式,對護(hù)理系2016級405名學(xué)生進(jìn)行了調(diào)查。生成了403份調(diào)查問卷,有兩人未參加問卷調(diào)查,問卷的答案真實有效,有說服力。為了方便下一步數(shù)據(jù)處理,筆者結(jié)合問卷的內(nèi)容和教學(xué)評教的相關(guān)標(biāo)準(zhǔn),在等級上設(shè)置了A、B、C、D四個等級,A為最佳,D為一般,將403份調(diào)查問卷歸類分檔,形成了評教信息表。
(三)利用決策樹FP-growth算法,找出分類規(guī)則
1.數(shù)據(jù)處理
筆者以江蘇省徐州醫(yī)藥分院護(hù)理系2016級師生為調(diào)查對象,針對學(xué)生的成績和評教信息表的內(nèi)容,結(jié)合教務(wù)系統(tǒng)和學(xué)生管理系統(tǒng)相關(guān)數(shù)據(jù),根據(jù)相關(guān)教師信息情況,去除掉重復(fù)的內(nèi)容,整理制作了和本次研究相關(guān)的三個數(shù)據(jù)表,分別是教師基本情況表、學(xué)生成績表、學(xué)生評教表。
筆者通過SQL Server 2014進(jìn)行數(shù)據(jù)庫的建立,將教師信息表、學(xué)生成績表和評教信息表匯集為一個總表,刪除無用、空白或者重復(fù)的信息,形成一個精簡過的、新的數(shù)據(jù)表,從而方便我們下一步數(shù)據(jù)分析。然后將數(shù)據(jù)表中文字表述的內(nèi)容制定對應(yīng)的數(shù)據(jù)標(biāo)準(zhǔn),以便于計算機讀取、識別。如:將學(xué)生成績分成幾個區(qū)間,相應(yīng)的區(qū)間分別按照“優(yōu)良中差”的形式定義等級,然后用英文字母代替文字表述的等級。數(shù)據(jù)表生成的具體情況,下面通過教師職稱屬性舉例說明(newtable為新建數(shù)據(jù)總表)。
按照職稱屬性取值,SQL語句表述為:
Update newtable set technical title=a where technical title=lecturer
Update newtable set technical title=b where technical title=associate professor
Update newtable set technical title = c where technical title =professor
Update newtah le set technical title = d where technical title =assistant
按照這個思路,將所有數(shù)據(jù)按以上規(guī)則整理后,進(jìn)而形成便于分析處理的數(shù)據(jù)集合。
2.數(shù)據(jù)分析
針對此次教學(xué)質(zhì)量評價的數(shù)據(jù)分析要求,筆者利用Tom-cat6.0構(gòu)建了網(wǎng)絡(luò)服務(wù)器,通過Eclipse Jee Mars來設(shè)計開發(fā)平臺,通過數(shù)據(jù)挖掘技術(shù)中FP-growth算法嵌入到評價平臺中,經(jīng)過挖掘分析找到對于教學(xué)質(zhì)量評價有價值的關(guān)聯(lián)規(guī)則的數(shù)據(jù)條目。挖掘出的數(shù)據(jù)條目較多,通過篩選和整理,現(xiàn)列舉出幾條有價值的規(guī)則:
規(guī)則1:職稱與評價分?jǐn)?shù)的關(guān)聯(lián):高職稱對應(yīng)的成績均高于“良好”;
規(guī)則2:性別與評價分?jǐn)?shù)的關(guān)聯(lián):教師性別為“男”分?jǐn)?shù)均高于“良好”,教師性別為“男”學(xué)生評價均有“師生關(guān)系融洽、和諧”評教條目;
規(guī)則3:年齡與評價分?jǐn)?shù)的關(guān)聯(lián):年齡在40歲以上成績均為“優(yōu)秀”;
規(guī)則4:學(xué)歷與評價分?jǐn)?shù)的關(guān)聯(lián):如果教師學(xué)歷為:“碩士”,則成績?yōu)椤傲己谩币陨?,如果學(xué)歷為“碩士”則學(xué)生評教表均有“教學(xué)創(chuàng)新能力強”條目;
規(guī)則5:人員類別與評價分?jǐn)?shù)的關(guān)聯(lián):通過對相關(guān)數(shù)據(jù)的分析,教學(xué)人員的類別與教學(xué)質(zhì)量評價沒有必然的聯(lián)系。
通過以上的挖掘,我們可以得到以下結(jié)論:
(1)年齡在40歲左右的教師有著很好的教學(xué)效果,評價分?jǐn)?shù)比較高,支持度、可信度較高。這說明學(xué)校中青年教師的不斷成長,已經(jīng)成為學(xué)校教學(xué)的支柱,也符合學(xué)校人才發(fā)展的方向。
(2)具有高職稱高學(xué)歷的老師,學(xué)生評價的分?jǐn)?shù)較高,取得考試成績也更優(yōu)秀。
(3)男性教師有較寬廣的知識面,在教學(xué)中善于啟發(fā)學(xué)生的潛在能力,具有很好的教學(xué)創(chuàng)新能力。
五、結(jié)束語
本文通過實例表述了數(shù)據(jù)挖掘中的決策樹技術(shù)在教學(xué)質(zhì)量評價中的應(yīng)用。通過FP - growth算法找出影響教學(xué)質(zhì)量的相關(guān)分類規(guī)則,為學(xué)校進(jìn)行教學(xué)監(jiān)督評價提供依據(jù),進(jìn)一步推動學(xué)校的學(xué)科建設(shè)和教學(xué)改革。
參考文獻(xiàn):
[1]李云.數(shù)據(jù)挖掘技術(shù)在中學(xué)教務(wù)管理系統(tǒng)中的應(yīng)用研究[D].貴陽:貴州大學(xué),2008.
[2]盛偉翔,龍佳麗.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)[J].電腦知識與技術(shù),2007(3).
[3]陳安,陳寧,周龍驤,數(shù)據(jù)挖掘技術(shù)及應(yīng)用[M].北京:科學(xué)出版社,2006:11-12.
[4]趙松.Apriori算法的改進(jìn)及應(yīng)用[D].哈爾濱:哈爾濱理T大學(xué),2006.
[5]安穎.基于Apriori算法的興趣集加權(quán)關(guān)聯(lián)規(guī)則挖掘[J].北京聯(lián)合大學(xué)學(xué)報(自然科學(xué)版),2008,22(4):44-47
[6]岳學(xué)軍,李曉黎.Web應(yīng)用程序開發(fā)教程——ASP.NET+SQL Server[M].北京:人民郵電出版社,2009.
[7]張紅艷,都娟.關(guān)聯(lián)規(guī)則中Apriori算法的應(yīng)用[J].數(shù)字技術(shù)與應(yīng)用,2011(8).
[8]鄺濤.基于決策樹技術(shù)在高校成績分析中的應(yīng)用研究[J].新鄉(xiāng)學(xué)院學(xué)報,2011(2).