摘要:本研究主要通過收集和分析混合式教學模式下學習者的多維數(shù)據(jù),構建全面、立體的學習者畫像,并基于這些數(shù)據(jù),結合機器學習算法,建立教學預警系統(tǒng),以發(fā)現(xiàn)學業(yè)困難學生。研究中,首先建立學習者畫像的特征標簽體系,形成了對學習者全面而深入的描繪;隨后,運用決策樹、線性判別分析、支持向量機等多種分類學習算法,建立了教學預警模型;通過對多種模型的評估,選擇了性能最佳的支持向量機模型作為教學預警系統(tǒng)的核心組件。結果顯示,這樣的系統(tǒng)可以幫助教師及時發(fā)現(xiàn)學生的學習問題,并采取干預措施,從而提高教學質量和學生的學業(yè)成績。
關鍵詞:學習者畫像;教學預警;機器學習;分類算法;混合式教學
中圖分類號:TP311 文獻標識碼:A
文章編號:1009-3044(2024)22-0107-03
開放科學(資源服務)標識碼(OSID)
0 引言
隨著信息技術的發(fā)展,線上教學平臺如超星學習通、中國大學MOOC、騰訊課堂、云班課、釘釘、學習強國以及虛擬學習空間等得到廣泛應用,為教學培訓提供了新的教學途徑。學習者只需通過互聯(lián)網(wǎng)就可以隨時隨地進行在線學習。軟硬件和技術支持不斷更新使得在線教育學習資源日益豐富多樣,學習變得多源和便捷。此外,通過網(wǎng)絡共享教育資源,不僅拓寬了教育的覆蓋面,更促進了教育的公平與普及,讓更多人有機會接觸到優(yōu)質的教育資源。
然而,在突破了傳統(tǒng)的教育面對面的教育模式的同時,也暴露出一些問題。由于線上教學是通過網(wǎng)絡和多媒體設備來實現(xiàn)的,缺少教師和學習者的面對面交流,教學的直觀性、感性認識不夠;教師無法觀察到學習者的實際學習狀態(tài),無法全面地把控整個學習過程,學習者個性化需求也無法及時滿足。同時,線上學習模式比較單一,一定程度上降低了學習者的學習興趣,學習期間存在“刷課”的情況。
因此,如何準確把握學習者的學習狀態(tài),提升線上教學的質量,成了研究的重點。在這一背景下,學習者畫像和教學預警兩個領域顯得尤為關鍵,值得深入探索。學習者畫像是通過收集和分析學習者的學習行為、學習態(tài)度等多維度的數(shù)據(jù),形成對學習者全面、立體的描述;而教學預警則是提前發(fā)現(xiàn)和解決學習問題的重要工具。
本研究以在線學習者為核心研究對象,通過收集和分析學習者的學習行為、學習態(tài)度等多維度的數(shù)據(jù),構建一個全面且詳盡的學習者畫像。通過應用數(shù)據(jù)挖掘與機器學習算法,本研究從數(shù)據(jù)驅動和學習分析的角度,定量地研究學習者的學習規(guī)律,全面地了解學習者的學習情況。以為學習者提供更優(yōu)質的在線教育為目標導向進行研究,促進學習者的個性化學習和實現(xiàn)基于學習者畫像的學情預警。學習者畫像和教學預警是預警學情和提供個性化學習策略的重要數(shù)據(jù)支撐和決策依據(jù)。
1 相關研究
1.1 學習者畫像理論
學習者畫像是用戶畫像技術在教育領域的重要應用。它通過收集和分析學習者的個人基本信息、學習行為數(shù)據(jù)、學習結果數(shù)據(jù)等多維度數(shù)據(jù),形成對學習者全面、立體的描述。學習者畫像技術可以幫助教師更深入地理解學生,從而提供更有針對性的教學,在教育技術領域中被廣泛應用。
通過分析學習者畫像,教師可以針對性地研究每個學生的學習狀態(tài)和學習需求,并根據(jù)每個學生的需求和能力調整教學策略,這將大大提高教學效果。在實際教學中,學習者畫像不僅可以幫助教師改進教學策略,也可以幫助學生更好地理解自己的學習過程。
肖君等人[1]從目標( Object)、數(shù)據(jù)( Data)、分析( Analysis)、服務( Service) 四個角度提出“ODAS”開放學習分析概念模型,并給出了基于 “ODAS” 的在線學習者畫像構建流程,這是一個以目標為導向的循環(huán)系統(tǒng)框架,分為五個關鍵階段:
1) 畫像目標層:明確畫像構建的目標,如學習者群體識別、學習者特征分析和學習者評價等。
2) 數(shù)據(jù)收集層:根據(jù)畫像目標收集大數(shù)據(jù),包括學習者的基本信息、各類行為日志以及調查數(shù)據(jù)等。
3) 標簽分析層:根據(jù)畫像目標抽取畫像標簽庫中的標簽進行數(shù)據(jù)分析。標簽由學習者畫像模型決定,通過對數(shù)據(jù)進行標簽化處理得到。
4) 畫像服務層:標簽分析結果的輸出,包括分析報告、個性化推薦、預警等服務形式。
5) 應用與評估層:將畫像服務應用于教學,并通過評估判斷是否達到了最初的畫像目標,如果沒有則進行下一輪的畫像分析應用,構成閉環(huán)。
1.2 教學預警
通過對學生的學習行為、學習態(tài)度和學習成績等進行數(shù)據(jù)分析,教學預警可以提前發(fā)現(xiàn)并解決學生可能會遇到的學習問題,并提供有針對性的幫助。借助教學預警,教師可以全面了解學生的學習狀況,預測學生的學習風險,同時根據(jù)學生反饋調整教學策略,滿足學生的學習需求。因此,教學預警在提高教學質量、保障學生學習效果以及提升學生的學習體驗和自我管理能力方面發(fā)揮著重要的作用。
教學預警的相關研究主要關注如何有效收集和分析學生的學習數(shù)據(jù),精確識別學生的學習困難,以及設計有效的預警機制和干預策略。李景奇等人[2] 使用多元線性回歸方法和綜合指標加權方法,設計了一個教學大數(shù)據(jù)預警平臺。劉博鵬等人[3]通過數(shù)據(jù)挖掘技術,利用學生的行為、個人屬性和歷史成績等數(shù)據(jù)對學生成績進行預警。
一些研究者已經(jīng)開始探索如何將學習者畫像和教學預警相結合,以提供更全面和個性化的教學支持。成亞玲、譚愛平[4]從學習者的基本屬性、知識掌握情況、學習行為和學習情緒四個維度刻畫在線開放課程學習者群體畫像和個體畫像,在此基礎上設計了基于學習者畫像的在線開放課程學習預警模型,分別從學習行為、學業(yè)成就、學習情緒三個方面給出了預警策略。王春華[5]通過構建學習者畫像模型,提出了精準教學干預策略。
盡管現(xiàn)有的學習者畫像與教學預警的研究已取得了一定的成果,但大多數(shù)只給出了預警策略,缺乏深入的定量化分析。基于這一點,本研究將采用機器學習的方法,對學習者畫像數(shù)據(jù)進行深入挖掘和分析,為教學預警的設計提供定量化的依據(jù)。同時,也將進一步研究如何將學習者畫像與教學預警應用到各種教學環(huán)境和模式中,以滿足不同類型學習者的需求。
2 教學案例研究
本研究選擇了某高校開設的高等數(shù)學課程作為研究案例。該課程采用了線上線下混合式教學模式,共有502名不同專業(yè)的學生參與了該課程,他們分別來自5個不同的專業(yè),其中,女生127人,男生375人;來自普高的學生291人,來自職高的學生211人。接下來將借鑒基于“ODAS”的開放學習者畫像構建流程進行畫像構建,并以畫像數(shù)據(jù)為基礎進行教學預警研究。
2.1 圖像目標層
本研究的主要目標是構建一個學業(yè)預警系統(tǒng),該系統(tǒng)能夠根據(jù)學生的個人基本情況和學習行為表現(xiàn),預測學生的學業(yè)風險。具體而言,大學生面臨的一個主要學業(yè)風險是期末成績不及格的問題。這一問題不僅會影響學生的學習綜合測評,還可能對他們的學業(yè)進度產(chǎn)生直接影響,甚至影響畢業(yè)。因此,本研究的目的是根據(jù)學生的學習行為等數(shù)據(jù)預測其不及格的風險,以提供給教師和學生及時且準確的預警,為教師提供教學參考,同時幫助學生更好地應對潛在的學業(yè)問題。
2.2 數(shù)據(jù)收集層
為了實現(xiàn)教學預警目標,本研究收集了參與本課程學生的各種數(shù)據(jù),包括基本信息、學習行為、學習結果等。這些數(shù)據(jù)從多個來源獲得,如學校教務系統(tǒng)、“超星學習通”在線學習平臺和線下課堂授課等。 具體數(shù)據(jù)如下:
1) 教務系統(tǒng)數(shù)據(jù):學校教務系統(tǒng)提供了學生的基本信息,如姓名、學號、性別、年齡、專業(yè)、班級等,這些數(shù)據(jù)是學生基本屬性的直觀反應,有助于了解學生的基本背景和學習環(huán)境。
2) 線下課堂數(shù)據(jù):在課堂教學中,授課教師詳細記錄了學生的包括考勤、課堂討論等情況,同時教師也對學生進行了客觀評價。這些數(shù)據(jù)是學習行為的最直觀體現(xiàn)。
3) 線上平臺數(shù)據(jù):通過“超星學習通”等平臺的后臺記錄,收集了學生在線學習的詳細數(shù)據(jù),如在線視頻學習情況、任務點完成情況、作業(yè)完成情況和得分等。平臺數(shù)據(jù)量巨大,能夠很好地發(fā)現(xiàn)學習者的學習行為的細節(jié)。
4) 期末考試數(shù)據(jù):課程結束時,通過閉卷考試評估學生的學習效果,并收集了學生的考試成績數(shù)據(jù)??荚嚦煽兪呛饬繉W生學習效果的重要指標。
通過以上方式,全面收集了學生的各類數(shù)據(jù),為后續(xù)的預警分析提供了有力支撐。這些數(shù)據(jù)來源多樣、內容豐富,能夠綜合反映學生的學習狀況和學業(yè)風險。
2.3 畫像標簽層
數(shù)據(jù)收集層獲得的數(shù)據(jù)較為復雜,需要構建統(tǒng)一且規(guī)范化的標簽體系,以全面描繪學習者的特征。對目標預測影響較小的數(shù)據(jù),如學生年齡(因為學生均為大一學生,年齡差別不大),可以刪除。最終,從基本屬性特征、學習行為特征、學習評價特征、學習結果特征四個方面構建畫像標簽體系。畫像標簽體系如表格1所示。
按照上述的畫像標簽體系,需要處理多源數(shù)據(jù),以“學號”和“姓名”為標識,按照畫像標簽體系進行數(shù)據(jù)的提取和融合。在融合的數(shù)據(jù)集中,需要分析空值和異常數(shù)據(jù)產(chǎn)生的原因,并進行相應的填補和刪除,以形成統(tǒng)一規(guī)范的數(shù)據(jù)集。
2.4 學業(yè)預警系統(tǒng)
本研究的核心目標是構建一個學業(yè)預警系統(tǒng),該系統(tǒng)能夠根據(jù)學生的個人基本信息和學習行為表現(xiàn)來預測其成績不及格的風險。為了實現(xiàn)這一目標,預警系統(tǒng)將采用多種機器學習分類算法,如決策樹、判別分析、邏輯回歸分類、支持向量機(SVM) 、樸素貝葉斯分類、最近鄰分類(KNN) 等。這些分類算法各有優(yōu)點,可以用來處理不同的問題,通過對比這些方法的表現(xiàn),可以找到最適合解決本問題的模型。同時,通過使用多種方法,可以提高模型的魯棒性,避免因為單一模型的缺陷導致的預測錯誤。
首先,使用已有的統(tǒng)一規(guī)范數(shù)據(jù)集,以期末成績“是否不及格”為響應值,以其他畫像標簽作為預測變量,采用5折交叉驗證的方式對模型進行訓練。這種驗證方法可以將數(shù)據(jù)集分成5份,其中4份用于訓練模型,1份用于測試模型。這個過程將重復5次,每次使用不同的數(shù)據(jù)作為測試集,其余的數(shù)據(jù)作為訓練集。通過這種方式,可以更準確地評估模型的性能和泛化能力。
其次,對訓練模型進行評估。訓練的目標是找到能夠準確地描述學習者特征與學業(yè)風險之間關系的參數(shù)。模型訓練完成后,需要對多個不同模型進行評估,以找到最優(yōu)的模型。根據(jù)模型的預測結果,將計算以下評估指標:
1) 準確率:表示預測正確的樣本數(shù)占總樣本數(shù)的比例。準確率直觀地評估模型的預測能力。
2) 精確率:又稱查準率,表示在所有被預測為正例的樣本中,真正為正例的樣本比例。
3) 召回率:在所有正樣本中,預測正確所占的比例。召回率用于評估模型對正樣本的識別能力。
4) F1值:F1值是準確率和召回率的調和平均值,用于綜合評價模型的準確性和穩(wěn)健性。F1值越大,說明模型的表現(xiàn)越好。
幾種分類模型的評估結果如表2所示。
通過表2中數(shù)據(jù)可以看出,線下判別分析(LDA) 和支持向量機(SVM) 在整體分類性能上表現(xiàn)較為突出。具體而言,SVM以83.1%的準確率和88.7%的F1值展現(xiàn)了優(yōu)秀的分類能力,同時在精確率上也達到了最高的87.4%。這些指標均表明SVM在分類任務中具有較高的穩(wěn)定性和準確性。
為了更直觀地揭示SVM模型的分類效果,筆者進一步展示了模型的混淆矩陣和ROC曲線,分別如圖1和圖2所示?;煜仃囂峁┝岁P于模型在不同類別上分類結果的詳細信息,而ROC曲線則展示了模型在不同分類閾值下的性能變化。
從圖1可以清晰地看出,SVM模型在分類過程中具有較高的準確度和可靠性,能夠很好地識別不及格的同學。圖2的ROC曲線,它展示了模型在不同分類閾值下的性能變化,ROC曲線下的面積(AUC=0.89) 較高,說明模型的分類性能較好。通過這兩張圖,我們能夠更全面地評估SVM模型的分類效果,為后續(xù)的優(yōu)化工作提供有力的參考。
鑒于SVM模型在多個評估指標上的優(yōu)秀表現(xiàn),我們選擇使用SVM模型作為我們的主要預警模型。SVM模型不僅能夠準確預測學生的學業(yè)風險,還能有效地描述學生特征與學業(yè)風險之間的關系,為教育預警提供有力的支持。
2.5 應用與評估層
學業(yè)預警系統(tǒng)建立并訓練完畢后,可以將其應用于實際的教學環(huán)境中。預警系統(tǒng)會對每個學生進行學業(yè)風險評估,評估學生目前學習狀態(tài)下,預測未來考試成績不及格的風險。教師可以根據(jù)評估結果提供個性化的教學建議和干預措施。例如,對于風險較高的學生,教師可以研究其畫像,發(fā)現(xiàn)學習中存在的問題,給予更多的學習資源和指導。
學業(yè)預警系統(tǒng)并非一成不變,學業(yè)預警系統(tǒng)與教學實踐相輔相成。在應用過程中,會不斷收集學生的反饋和學習成果數(shù)據(jù),以此檢驗預警系統(tǒng)的準確性,并進行必要的維護和優(yōu)化。同時,也會對預警系統(tǒng)的應用效果與預設的目標進行對比,以評估系統(tǒng)是否達到了預期目標。如果預警系統(tǒng)的應用效果不佳,或者未能達到預設的目標,將對系統(tǒng)進行進一步的調整和優(yōu)化。
3 結論
本研究主要聚焦于構建學習者畫像,通過機器學習的方法深入挖掘畫像數(shù)據(jù)的潛在價值,來提前發(fā)現(xiàn)并解決學生可能遇到的學業(yè)問題。通過對學生的基本信息、學習行為和學習結果等數(shù)據(jù)進行挖掘分析,設計出了一套學業(yè)預警系統(tǒng),能夠有效地預測學生的學業(yè)風險。這一系統(tǒng)不僅幫助教師及時發(fā)現(xiàn)學生的學習困難,并提供針對性的幫助,同時也能讓學生更好地了解自己的學習狀態(tài),并據(jù)此調整學習方法和策略。
在未來的工作中,計劃收集更多的學習者數(shù)據(jù),進一步優(yōu)化預警系統(tǒng),以更好地適應各種教學環(huán)境,滿足更多類型學習者的需求。還將繼續(xù)研究如何提高系統(tǒng)的預測準確性和應用效果,以便為學習者提供更個性化和全面的學習支持。同時,也會考慮開發(fā)新的預測算法,以提高預警的準確性和穩(wěn)健性。
參考文獻:
[1] 肖君,喬惠,李雪嬌.大數(shù)據(jù)環(huán)境下在線學習者畫像的構建[J].開放教育研究,2019,25(4):111-120.
[2] 李景奇,卞藝杰,黃波.教學大數(shù)據(jù)監(jiān)測預警平臺設計與應用[J].計算機應用與軟件,2019,36(1):111-116.
[3] 劉博鵬,樊鐵成,楊紅.基于數(shù)據(jù)挖掘技術的學生成績預警應用研究[J].四川大學學報(自然科學版),2019,56(2):267-272.
[4] 成亞玲,譚愛平.基于學習者畫像的在線開放課程學習預警研究[J].當代職業(yè)教育,2022(4):102-112.
[5] 王春華.基于學習者畫像的精準教學干預研究[J].濟南大學學報(社會科學版),2023,33(2):136-146.
【通聯(lián)編輯:王 力】