余楨偉 孫玉珠
(江蘇科技大學蘇州理工學院 江蘇省張家港市 215600)
隨著高等教育普及化,高校教學管理迎來了新問題,大學生因無法完成學業(yè)而退學給個人和家庭都造成了很大損失。為了讓學生盡早意識并解決學習中存在的問題,各高校建立了學業(yè)預(yù)警機制,基于教育大數(shù)據(jù)的學業(yè)預(yù)警研究成為了當下高等教育研究熱點。大部分高校以往屆學生的考試成績作為主要數(shù)據(jù)來源,通過計算學生掛科門數(shù)或取得學分數(shù),對比預(yù)警標準,考察學生是否會被預(yù)警。這種 “事后預(yù)警”無法對學生學業(yè)情況有效地跟進和及時反饋。
本文運用Apriori 算法分析數(shù)據(jù)來研究和構(gòu)建學生學業(yè)預(yù)警模型,對學生掛科課程預(yù)警展開研究。以教務(wù)系統(tǒng)中的真實成績數(shù)據(jù)為基礎(chǔ)分析課程之間的關(guān)聯(lián)關(guān)系。目的在于優(yōu)化現(xiàn)有的學業(yè)預(yù)警機制,體現(xiàn)預(yù)警的時間預(yù)先性,分析課程成績之間的關(guān)聯(lián)度,輔助高校教學管理部門提高教育教學管理水平,幫助學生更好的規(guī)劃完成學業(yè)。
本文所使用的原始數(shù)據(jù)來自江蘇某獨立學院教務(wù)系統(tǒng)2016年以來所有學生的學業(yè)成績數(shù)據(jù)。根據(jù)高校學生手冊,將預(yù)警生定義為:學生每學期必修課程掛科數(shù)量在2 到4 門之間的學生定義為預(yù)警警示的學生;一學年必修課程掛科數(shù)量在4 門及以上的學生視為退學預(yù)警的學生。為便于探究,選取該校2017 級船舶與海洋專業(yè)(以下簡稱船海專業(yè))學生學業(yè)成績進行挖掘分析。在數(shù)據(jù)選取時除去學生補考和重修的成績,只保留學生初修成績。
在學生成績表里,大部分課程是百分制形式(0-100 分),少數(shù)課程采用五級制(優(yōu)秀、良好、中等、及格、不及格)。為方便數(shù)據(jù)標準化,將百分制統(tǒng)一轉(zhuǎn)換成五級制。優(yōu)秀、良好、中等、及格、不及格分別設(shè)定為:成績大于90,成績介于80 到90,成績介于70 到80,成績介于60 到70,成績小于60。再將成績數(shù)據(jù)基于學號進行行列互換。
為方便后續(xù)分析,對轉(zhuǎn)換后的成績數(shù)據(jù)進行離散化處理。課程只列舉10 門,課程與代碼之間的對應(yīng)關(guān)系如表1 所示。分別用A、B、C、D 和E 來代表課程成績中的優(yōu)秀、良好、中等、及格、不及格。
表1:課程與代碼對應(yīng)關(guān)系表
表2:離散化后的學生成績數(shù)據(jù)
表3:船海專業(yè)預(yù)警學生成績數(shù)據(jù)
并且為了簡化表格,把表中列出的全部的課程用代碼來表示,離散化后的數(shù)據(jù)表如表2 所示,以下為部分樣本。
根據(jù)本文對學業(yè)預(yù)警的界定,在第一學期掛科兩門及以上的情況需要予以關(guān)注。基于預(yù)處理后的學生學業(yè)成績數(shù)據(jù),得到預(yù)警警示學生的名單。將上述轉(zhuǎn)換后的學生學業(yè)成績表與預(yù)警警示學生名單關(guān)聯(lián),得到預(yù)警學生的成績數(shù)據(jù)。對2017 級船海專業(yè)學生一學年里預(yù)警學生成績數(shù)據(jù)進行代碼化和離散化處理,取其中部分學生的13 門課程數(shù)據(jù)如表3 所示。
挖掘?qū)W生課程成績?yōu)椤癊”(“不及格”)的課程之間的關(guān)系。設(shè)置最小支持度大小為50%,最小置信度大小為70%。因為這些數(shù)據(jù)是預(yù)警學生的成績數(shù)據(jù),所以掛科課程會很多,由表里面課程成績?yōu)椴患案竦臄?shù)據(jù)進行變換后得到事務(wù)數(shù)據(jù)庫,再用Apriori 關(guān)聯(lián)規(guī)則算法依次求出候選項集、頻繁項集等。這里在課程之間先后關(guān)系限制和最小支持度與最小置信度的規(guī)則限制下,從這些頻繁項集中得出對應(yīng)的規(guī)則共14 條,抽選出若干條強關(guān)聯(lián)規(guī)則來作以下分析。
規(guī)則1:{船舶流體力學1}→{船舶阻力與推進},該規(guī)則的支持度為100%,置信度為76.92%。支持度越大,說明在預(yù)警學生中該兩門課程同時不及格非常普遍,且前置課程不及格導致后置課程不及格可能性比較大,為76.92%。
規(guī)則2:{船舶結(jié)構(gòu)力學1} →{船舶阻力與推進}的置信度為76.92%,支持度為100%。說明當預(yù)警學生的船舶結(jié)構(gòu)力學1 不及格時,該生的船舶阻力與推進也極有可能不及格。
規(guī)則3:{ 船舶流體力學1,船舶結(jié)構(gòu)力學1 }→{船舶阻力與推進}的置信度大小為76.92%,支持度為100%。在預(yù)警警示學生里面,當船舶流體力學1 和船舶結(jié)構(gòu)力學1 課程都掛科的時候,該生的船舶阻力與推進課程也極有可能會不及格。
由以上結(jié)果可知,在學生第一學期掛科的情況下,需要警示學生下一學期極大概率會不及格的課程,用以提醒教學管理部門要充分考慮好課程的先修與后繼關(guān)系來調(diào)整安排授課計劃,減少學生后繼課程掛科的概率。
結(jié)合學生日常學業(yè)情況分析,一部分原因是部分課程作為先修課程難度較大,二是學生學習態(tài)度不認真,松懈了自己所修課程,老師需要及時地督促學生吸收理解所學知識,同時重視學生對基礎(chǔ)知識的掌握。學校教學管理部門可以探索修訂教學計劃安排,加強學生理解專業(yè)知識的能力,強調(diào)基礎(chǔ)知識的鞏固。教師在教學上,學生在學習中都要高度重視先修課程的教學與學習。
在Weka 中運用關(guān)聯(lián)規(guī)則算法對前面整理好的學生離散化成績數(shù)據(jù)進行關(guān)聯(lián)規(guī)則挖掘,找出學生被預(yù)警情況和掛科之間的關(guān)系,對前期樣本挖掘結(jié)果進行驗證。
將船海專業(yè)預(yù)警學生成績離散化后的數(shù)據(jù)表導入Weka 后,在分類面板里面選擇Associate 子面板,選擇其中的Apriori 算法,修改屬性設(shè)置,將其中的選項“output itemsets”選擇為“True”,其他保留默認設(shè)置,執(zhí)行數(shù)據(jù)挖掘。通過該實驗挖掘出的相關(guān)規(guī)則如下:
對比分析以上結(jié)果,表示前面得出的學業(yè)成績預(yù)警是有效的,樣本挖掘結(jié)果可靠。在船海專業(yè)課程關(guān)系里,課程船舶流體力學1,船舶結(jié)構(gòu)力學1 和船舶阻力與推進仍然是強關(guān)聯(lián)規(guī)則。
本文研究發(fā)現(xiàn),教學管理部門和任課教師要高度重視先修課程的教學,尤其要注意有先修課程掛科兩門及以上情況的學生,激勵學生努力趕上,先修課程沒有學好的情況下,雖然會加大后繼課程的學習難度,但學生如能及時努力,也有機會達到學業(yè)合格要求。教學管理部門要在重視先修和后繼課程之間關(guān)聯(lián)關(guān)系的基礎(chǔ)上制定教學計劃,修訂人才培養(yǎng)方案,更加科學合理的編排課程教學順序。