楊東?!″X瑩
[摘?????????? 要]? 考試成績是評價教學質量的重要指標,對學生考試成績的準確預測可以幫助教師提前預估學生學習效果并及時調整教學方法和策略?;仡櫪脭?shù)據(jù)挖掘算法搭建學生考試成績預測模型的關鍵步驟,重點討論該模型在高職教育中的應用方法、關鍵要點以及如何根據(jù)預測結果來優(yōu)化調整后續(xù)的教學工作并提高學生培養(yǎng)質量。
[關鍵詞考試成績;預測;數(shù)據(jù)挖掘;高職教育
[中圖分類號]G712?? ? [文獻標志碼]? A??? ? [文章編號]? 2096-0603(2018)34-0001-03
一、引言
近年來,我國出臺了一系列政策來支持發(fā)展現(xiàn)代職業(yè)教育,希望培養(yǎng)大批技能型人才來服務于經(jīng)濟社會的發(fā)展。同時,“中國制造2025”計劃的提出,也將帶來新一輪的制造業(yè)升級,對具有“工匠精神”的應用型人才的迫切需求向高等職業(yè)教育提出了越來越高的要求。在我國,高職院校是培養(yǎng)應用技能型人才的主要基地,其在高等職業(yè)教育系統(tǒng)內的重要地位不言而喻。隨著我國高等教育招生規(guī)模的逐年擴大,高職院校也在快速發(fā)展,但依然面臨著生源質量不高等一系列問題。在高考中,高職院校的分數(shù)線普遍低于本科,是最后一個批次錄取。進入高職院校就讀的學生往往高考成績不夠理想,其知識基礎、學習習慣、自我約束力、自我激勵等主客觀因素都存在很大的改善空間[1]。因此,學生求知欲不強、缺乏刻苦鉆研的精神、與教師的課堂互動不積極等現(xiàn)象普遍存在于高職院校的教學過程中。最終的結果體現(xiàn)在教學質量不高,學生實際能力難以滿足社會的需要。
在高等教育中,學生的考試成績往往是評價教學質量的重要依據(jù)之一,考試分數(shù)能夠在一定程度上反映學生對專業(yè)知識的掌握程度[2]。然而在實際教學中,期末考試往往意味著該門課程教學過程的完結,在考試結束后即使知曉了學生的分數(shù),也再沒有機會對已經(jīng)結束的教學過程進行調整和優(yōu)化。因此,許多高校教師迫切希望使用更加有預見性的工具,在教學過程中能夠隨時評估教學質量,從而可以根據(jù)預先評估的結果對教學進行實時調整,強化優(yōu)勢,彌補不足,進一步改善教學質量。事實上,在學生參加期末考試且分數(shù)真正揭曉之前,其學習效果并非無跡可尋,而是隱藏在一系列“蛛絲馬跡”中,例如學生自身的特點、前導課程的成績、出勤統(tǒng)計、聽課狀態(tài)、平時作業(yè)完成情況等,這些特征都與其考試成績有著千絲萬縷又難以解釋的聯(lián)系。具有多年教學經(jīng)驗的教師能夠憑經(jīng)驗從這些特征中得到一些模糊的“感覺”,然而僅僅憑主觀經(jīng)驗和感覺來評估學生的學習效果,其準確性和科學性都是值得商榷的。
為了解決這個問題,學者提出使用數(shù)據(jù)挖掘算法來搭建學生考試成績預測模型,通過對學生成績的預測,來提前評估教學質量。數(shù)據(jù)挖掘技術是一種深層次的數(shù)據(jù)分析方法,通過仔細分析大量數(shù)據(jù)來揭示有意義的新的關系、趨勢和模式的過程,其任務就是發(fā)現(xiàn)隱藏在數(shù)據(jù)中潛在的模式,為決策提供支持[3,4]。所以數(shù)據(jù)挖掘技術非常適合用于揭示學生考試成績與其他相關因素之間隱含的非線性的復雜關系,其搭建的成績預測模型是將教師的一些主觀經(jīng)驗和感覺以數(shù)學的形式進行量化描述。近幾年,決策樹、核Fisher判別分析、人工神經(jīng)網(wǎng)絡、貝葉斯網(wǎng)絡、支持向量機、多元回歸分析等數(shù)據(jù)挖掘算法已經(jīng)用于實現(xiàn)學生成績預測模型的搭建,并取得了良好的效果[1,4-6]。然而,大部分學者的研究重點放在如何在“技術”上取得突破(例如,各種數(shù)據(jù)挖掘算法的應用、改進與創(chuàng)新),卻很少有學者討論應用該模型的初衷——如何在“教育”(特別是高職教育)中基于該模型的預測結果來優(yōu)化調整后續(xù)的教學工作并提高學生培養(yǎng)質量。
為了能夠更好地將“技術”服務于“教育”,本文在作者前期研究成果的基礎上,首先回顧了利用數(shù)據(jù)挖掘算法搭建學生成績預測模型的主要步驟,然后分析討論了在高職教學中應用預測模型的若干關鍵問題,如使用模型的目的和方法、如何根據(jù)預估的成績采取有針對性的措施來優(yōu)化當前的教學過程等。
二、建立學生考試成績預測模型的主要步驟
在不同的教學場景,教師對成績預測的要求也不盡相同,一部分教師僅僅希望知曉學生的成績是否能夠及格,而另一部分教師則希望看到學生考試成績具體分數(shù)的預測結果。根據(jù)采集到的數(shù)據(jù)和預測結果的不同類型,成績預測可以轉化為分類、關聯(lián)分析、回歸分析等問題,因此建立預測模型所采用的數(shù)據(jù)挖掘算法、輸入和輸出數(shù)據(jù)的形式也不同。在目前的研究中,更多的是把預測模型假設為“黑箱”,影響考試成績的因素是黑箱的輸入,考試成績作為黑箱的輸出,則搭建預測模型的問題可以簡化對黑箱功能函數(shù)的逼近[7]。
無論采用哪種數(shù)據(jù)挖掘算法,其建立預測模型的框架是類似的,包含的主要步驟為:
(一)數(shù)據(jù)收集
學生考試成績與影響成績的因素之間的復雜關系隱藏在樣本數(shù)據(jù)中,最終的模型也是通過數(shù)據(jù)挖掘算法對樣本數(shù)據(jù)訓練而得到的,因此數(shù)據(jù)是模型搭建的核心要素之一。需要收集的數(shù)據(jù)范圍主要是學生的考試成績和那些對成績影響比較大的要素,比較常用的包括學生個人信息(性別、生源地、入學成績等)、教學過程中的相關信息(前導課程的成績、學生的出勤統(tǒng)計、平時作業(yè)分數(shù)等)等。
(二)數(shù)據(jù)預處理
收集到的原始樣本數(shù)據(jù)可能會存在缺失、冗余、不在合理區(qū)間等現(xiàn)象,直接使用這些不規(guī)范的數(shù)據(jù)會影響預測模型的準確性和泛化能力,因此需要在使用之前對數(shù)據(jù)進行篩選、補充等預處理操作,有些數(shù)據(jù)挖掘算法還要求對數(shù)據(jù)做進一步的采樣、離散化、歸一化等操作。
(三)確定輸入特征變量
輸入特征變量代表模型輸入數(shù)據(jù)的維度屬性,應該從原始樣本數(shù)據(jù)中選擇那些對學生考試成績影響最大的一組變量。
(四)建立預測模型
采用某種數(shù)據(jù)挖掘算法對訓練數(shù)據(jù)集進行訓練,得到預測模型。
(五)優(yōu)化模型參數(shù)
預測模型中會包含某些參數(shù)(不同的數(shù)據(jù)挖掘算法所使用的參數(shù)不同),這些參數(shù)會對模型的性能產(chǎn)生比較大的影響,因此需要基于不同的參數(shù)組合反復訓練模型,并利用驗證數(shù)據(jù)集的測試結果選擇一組最優(yōu)的參數(shù)組合,用于訓練最終的預測模型。
(六)進行學生成績預測
利用搭建好的模型對學生成績進行預測(如果是進行實驗,則可以對測試數(shù)據(jù)集進行測試,并基于測試結果進行評價)。
三、在高職教學中應用成績預測模型的若干關鍵
問題
使用數(shù)據(jù)挖掘算法搭建學生考試成績預測模型在技術上已經(jīng)趨于成熟,作為專業(yè)教師,我們還應該關注如何在高職教學中應用這種模型工具來輔助教學。
(一)明確使用預測模型的目的
作為在高職教學一線工作的教師,我們需要意識到,對學生考試成績進行預測僅僅是一種手段,而高職教育的最終目的是為了通過高質量教學來培養(yǎng)動手能力強的應用技能型人才。因此,在應用預測模型時,不應該僅僅沉迷于建立一個預測精度高的數(shù)學模型,卻忽略了教學的本質——建立模型并進行成績預測并不是工作的終點,恰恰相反,這才是后續(xù)一系列重要教學工作的起點。教師需要根據(jù)預測的結果來綜合評估每個學生的學習狀態(tài)和整體教學效果,并根據(jù)學生的不同狀態(tài)因材施教,切實根據(jù)學生個體作個性化的指導。對有可能不及格的學生及時找出原因,有針對性地采取具體措施提高他們的學習成績;對成績優(yōu)異的學生則可以引導其進行更深入的自主學習或者參與課外項目。
(二)模型輸入特征變量的選擇
預測模型的準確性與數(shù)據(jù)挖掘算法的特點、模型參數(shù)及輸入特征變量的選擇息息相關。為了得到盡可能準確的預測結果,教師應根據(jù)講授課程的實際情況,從學生的自身特點、前導課程的成績、教學過程數(shù)據(jù)等信息中提取出一組對成績影響最大的關鍵因素作為輸入的特征變量。這里需要注意的是,不同的學校、課程和學生有其獨特性,對成績影響最大的關鍵因素也不盡相同,不能盲目地將其他成績預測模型的輸入特征變量全盤照搬過來。如對于深圳信息職業(yè)技術學院物流管理專業(yè)的學生來講,深圳市外的生源普遍好于深圳本市的生源,女同學的平均成績高于男同學,因此在我們搭建的學生成績預測模型中,生源地和性別作為兩個與成績相關性很強的屬性被選擇成為輸入變量特征中的成員要素,這些都是針對本校學生的自身特點而定制的[1]。但是對于其他高校的某些專業(yè)來講,生源地和性別對成績的影響未必如此突出,需要任課教師重新考慮是否將它們納入輸入特征變量的選擇范圍內。
除了依靠教師的經(jīng)驗選擇輸入特征變量外,還可以借助于特定的特征遴選方法[4]、主成分分析[8]等方式選擇或加工得到最優(yōu)的一組屬性特征(在數(shù)據(jù)挖掘領域,特征選擇是一個比較重要的研究領域),這些方法不僅有助于得到一個更高預測精度的模型,還從客觀上幫助教師辨識出對學生成績潛在影響較大的那些因素,它們會成為教師開展后續(xù)工作的重要參考依據(jù)。
(三)提高學生成績的舉措
對預測成績較差、有可能不及格的學生,教師應給予較多的關注,并采取有效的措施幫助他們提高成績。
1.找出學生成績欠佳的根本性原因
學生某門課程的成績欠佳是有多方面原因的,既有個體性原因(學習方法不當、家庭變故等),也有普遍性原因(教師的教學方法不當?shù)龋?,多種因素錯綜復雜地糾纏在一起,很難將全部因素進行量化處理。因此在采取明確的教學措施之前,可以通過與學生交流或向學生輔導員調研的方式了解其成績欠佳的根本性原因,基于具體原因開展有針對性的工作,可以避免眉毛胡子一把抓,從而最終高效解決問題。
2.及時優(yōu)化教學方法和教學設計
如果預測結果顯示大部分學生有可能不通過考試或成績欠佳,則警示的是一種整體性的教學效果不理想,此時教師需要及時調整教學方法和教學設計。面對任課教師所展現(xiàn)出的不同的教學方法、態(tài)度和風格,學生對該門課程的學習積極性也會有所不同。高職學生的特點決定了他們往往覺得理論性較強的課程比較枯燥,排斥機械死板、照本宣科的授課模式。而幽默風趣的講解風格搭配上多案例、多實操的教學形式,會激發(fā)學生的學習興趣,活躍課堂氛圍,學生在這種輕松的氛圍中接受新知識的意愿也較強。因此,教師應努力強化自己的教學基本功,積極優(yōu)化教學設計,力求在課堂上實現(xiàn)理論與實際案例相結合,同時適度運用多媒體和信息化技術提升學生的感性認知,在輕松的課堂氣氛中提高學生學習的效果。
3.增加師生互動,提高學生自信心
當前高職院校在讀學生,他們的特點是思維開放、接受新鮮事物快、自尊心強、比較排斥傳統(tǒng)說教式的管理方法。有部分學生成績不佳是因為對學習新知識主觀能動性差,厭學情緒嚴重。在面對這類學生時,教師要根據(jù)學生的特點因勢利導,應避免面對面的直接批評教育,轉而采取相對委婉的態(tài)度和迂回的策略。可以在課堂上有針對性地增加與這些學生的互動,以正面鼓勵的方式提升他們的自信心,激發(fā)他們對學習的興趣。
4.關注特別的學生個體
對于那些在主觀上樂于學習,但由于自身基礎知識薄弱、家庭變故等客觀原因而造成成績欠佳的學生,任課教師也應給予特別的關注——可以用課下個別輔導的方式彌補其基礎知識的不足,還可以采取談心的方式對其心理進行疏導,使他們恢復到正常的學習狀態(tài)。
(四)引導成績優(yōu)異的學生拓展能力
如果成績預測模型是基于回歸分析建立的,教師可以利用它來估計學生考試成績的具體分數(shù),如果預測的分數(shù)較高,則表明該學生對課程內容理解深入,從一定程度上反映出該學生具有較強的學習能力。對于這類學生,教師可以引導其進行更深入的自主學習和課外學習,如鼓勵他們參加相關的技能大賽、協(xié)助教師進行課程建設、參與教研科研項目等。在學生學有余力的情況下指導他們參與課外項目,有利于學生儲備更廣泛的知識技能,增強未來職業(yè)發(fā)展的競爭力。
四、結束語
基于高職院校生源和課程體系的特點,為教學一線的教師提供預測學生考試成績的工具可以幫助教師提前評估教學效果,優(yōu)化教學方法和策略。本文回顧了使用數(shù)據(jù)挖掘算法搭建學生成績預測模型的關鍵步驟,分析在高職教育中應用該模型的方法和關鍵問題,最后重點討論在得到預測結果后如何采取具體的教學措施來提高教學質量。
雖然基于數(shù)據(jù)挖掘算法搭建學生考試成績預測模型的方法在技術上已經(jīng)日趨成熟,但是如何將模型更好地與教學相結合還需要更深入的研究。相信經(jīng)過在實踐中不斷的摸索,學生考試預測模型會成為高職教師對學生因材施教、改善學生學習效果并挖掘其成長潛力的有力工具。
參考文獻:
[1]楊東海,胡凌,錢瑩.基于核Fisher判別分析的高職學生考試成績預測[J].中國教育信息化,2016(16):76-79.
[2]黃建明.貝葉斯網(wǎng)絡在學生成績預測中的應用[J].計算機科學,2012(S3):280-282.
[3]王光宏,蔣平.數(shù)據(jù)挖掘綜述[J].同濟大學學報(自然科學版),2004(2):246-252.
[4]孫力,程玉霞.大數(shù)據(jù)時代網(wǎng)絡教育學習成績預測的研究與實現(xiàn):以本科公共課程統(tǒng)考英語為例[J].開放教育研究,2015(3):74-80.
[5]吳青,羅儒國.基于在線學習行為的學習成績預測及教學反思[J].現(xiàn)代教育技術,2017,27(6):18-24.
[6]孫毅,劉仁云,王松,等.基于多元線性回歸模型的考試成績評價與預測[J].吉林大學學報(信息科學版),2013(4):404-408.
[7]邱文教.基于人工神經(jīng)網(wǎng)絡的學習成績預測[J].計算機與信息技術,2010(4):5-6.
[8]譚常春,張雪蓮,胡俊迎.基于Adaptive-Lasso的本科成績統(tǒng)計分析[J].應用概率統(tǒng)計,2016(5):541-550.
◎編輯 張 慧