王文晶,閆俊伢
(山西工程科技職業(yè)大學(xué)信息工程學(xué)院,山西 太原 030619)
國(guó)際人工智能教育大會(huì)2020(AIED),大會(huì)主旨將人工智能與教育深度融合,實(shí)現(xiàn)“增強(qiáng)智能賦能教育”。Marbouti等(2016)通過(guò)挖掘本科生的課堂測(cè)驗(yàn)、考試、作業(yè)等,使用樸素貝葉斯、人工神經(jīng)網(wǎng)絡(luò)等組合為一個(gè)模型,并對(duì)學(xué)習(xí)成績(jī)達(dá)到好的預(yù)測(cè)效果。Leah P.Macfadyen 等對(duì)在線生物課程數(shù)據(jù)進(jìn)行多元回歸分析、Logistic 分析以及社會(huì)網(wǎng)絡(luò)分析,開發(fā)預(yù)警系統(tǒng)。Lily Sun 構(gòu)建基于學(xué)習(xí)行為的模型,利用學(xué)習(xí)成績(jī)對(duì)學(xué)習(xí)的效果進(jìn)行驗(yàn)證。維也納大學(xué)的學(xué)者通過(guò)搭建在線學(xué)習(xí)平臺(tái),對(duì)平臺(tái)產(chǎn)生的學(xué)習(xí)數(shù)據(jù)進(jìn)行分析后,對(duì)學(xué)生學(xué)習(xí)效果進(jìn)行評(píng)價(jià)。
隨著人工智能的快速發(fā)展,如何使用大數(shù)據(jù)技術(shù)對(duì)在線學(xué)習(xí)產(chǎn)生的海量數(shù)據(jù)進(jìn)行深度挖掘,對(duì)教學(xué)效果進(jìn)行精準(zhǔn)測(cè)試,是當(dāng)前智能教育研究的熱點(diǎn)。近幾年,我國(guó)將學(xué)習(xí)分析技術(shù)應(yīng)用于在線學(xué)習(xí)方面的論文數(shù)量呈現(xiàn)上升趨勢(shì)。數(shù)據(jù)挖掘技術(shù)采用的模型沒(méi)有固定模型,比較多樣化。如陳晉音利用神經(jīng)網(wǎng)絡(luò)的方法分析上線學(xué)習(xí)行為,對(duì)學(xué)生的成績(jī)進(jìn)行預(yù)測(cè),分析學(xué)習(xí)行為,得出學(xué)習(xí)者的學(xué)習(xí)規(guī)律。牟智佳通過(guò)學(xué)生的學(xué)習(xí)行為和心理學(xué)、教學(xué)學(xué)理論,構(gòu)建基于學(xué)習(xí)行為序列的識(shí)別模型,將學(xué)習(xí)者分類,并進(jìn)行干預(yù)和提出學(xué)習(xí)策略。通過(guò)文獻(xiàn)對(duì)國(guó)內(nèi)外情況進(jìn)行研究對(duì)比,從文獻(xiàn)數(shù)量上看,2007年之前比較少,2015年以后論文數(shù)量逐漸快速增長(zhǎng),表明在線學(xué)習(xí)行為的研究,不斷受到關(guān)注和重視。從文獻(xiàn)學(xué)科分布,該學(xué)科作為一個(gè)交叉研究領(lǐng)域,基于數(shù)據(jù)挖掘的學(xué)習(xí)診斷研究受到了教育學(xué)、教育信息技術(shù)、計(jì)算機(jī)科學(xué)等不同學(xué)科的廣泛關(guān)注。從關(guān)鍵詞高頻度看,通過(guò)高頻詞看出“網(wǎng)絡(luò)學(xué)習(xí)行為”和“在線學(xué)習(xí)/網(wǎng)絡(luò)遠(yuǎn)程/教育”是學(xué)術(shù)界關(guān)注的焦點(diǎn),同時(shí)反映出網(wǎng)絡(luò)學(xué)習(xí)行為主要研究慕課平臺(tái)的自主學(xué)習(xí)行為。
通過(guò)參閱文獻(xiàn),發(fā)現(xiàn)目前在線研究的落腳點(diǎn)基本都是與成績(jī)相關(guān)的學(xué)習(xí)行為的數(shù)據(jù)分析。例如,研究學(xué)習(xí)者參與線上教學(xué)活動(dòng)地活躍度,相比之下,在線學(xué)習(xí)行為序列以及行為各要素之間的規(guī)律研究較少,并且行為序列更能反映學(xué)習(xí)者的認(rèn)知過(guò)程。同時(shí),相關(guān)研究缺乏通用的框架,忽略學(xué)習(xí)行為投入的多層次和多維度特點(diǎn)。
本研究用數(shù)據(jù)挖掘方法探究以下兩個(gè)問(wèn)題:①學(xué)習(xí)者在自主學(xué)習(xí)的過(guò)程中,分析哪些行為序列與成績(jī)?yōu)檎嚓P(guān),以期獲得與成績(jī)有顯著相關(guān)的關(guān)鍵序列。②通過(guò)對(duì)在線學(xué)習(xí)行為聚類分析,探究不同行為序列的學(xué)習(xí)者在學(xué)習(xí)效果上的差異。
收集268 名同學(xué)SPOC 平臺(tái)和MOOC 平臺(tái)中“智能信息處理”和“編譯技術(shù)”兩門課程的數(shù)據(jù),包括學(xué)習(xí)者產(chǎn)生或者發(fā)布的數(shù)據(jù)。利用數(shù)據(jù)處理流水線Logstash 工具,采集學(xué)生日常在兩個(gè)平臺(tái)生成的數(shù)據(jù)日志,例如課程數(shù)據(jù)、作業(yè)數(shù)據(jù)、考試數(shù)據(jù)、觀看教學(xué)視頻等,利用Elasticsearch 軟件,對(duì)數(shù)據(jù)進(jìn)行清洗、抽取。通過(guò)交互序列分析軟件GSEQ 工具進(jìn)行頻次矩陣統(tǒng)計(jì),得到關(guān)于學(xué)習(xí)者數(shù)據(jù)的231 個(gè)行為序列。通過(guò)參閱文獻(xiàn)中學(xué)習(xí)行為分類的方法,同時(shí)結(jié)合在線學(xué)習(xí)的特點(diǎn)和學(xué)生學(xué)習(xí)行為的特征,本文將在線學(xué)習(xí)劃分為四種:訪問(wèn)課程行為、參與討論行為、學(xué)習(xí)資源行為、測(cè)試學(xué)習(xí)效果行為。將231 個(gè)行為序列分別劃分到四類行為中,如表1所示。
表1 行為序列分類和編碼
通過(guò)分析工具SPSS20.0,得到18個(gè)課程訪問(wèn)序列和成績(jī)之間的關(guān)聯(lián)表,具體如表2 所示。CJGW、LYCJ、CJTZ 與成績(jī)有顯著的關(guān)聯(lián),CJGW、LYCJ 相關(guān)系數(shù)分別0.567 和0.543,三個(gè)學(xué)習(xí)行為顯著概率均為0.000,表明這兩種行為序列轉(zhuǎn)換與課程成績(jī)有顯著的正相關(guān)關(guān)聯(lián)。學(xué)習(xí)者在關(guān)注自己學(xué)習(xí)進(jìn)度的情況下,會(huì)針對(duì)自己薄弱的環(huán)節(jié)進(jìn)行學(xué)習(xí),例如再次進(jìn)行課程學(xué)習(xí)和參與一些學(xué)習(xí)主題的討論,對(duì)提高學(xué)習(xí)成績(jī)有顯著的作用,學(xué)習(xí)者在教師授課前,主動(dòng)對(duì)教學(xué)內(nèi)容預(yù)習(xí)、計(jì)劃,這些行為都是積極有效的。CJTZ 學(xué)習(xí)序列沒(méi)有與成績(jī)有顯著的關(guān)聯(lián),顯著性為0.002,相對(duì)查看學(xué)習(xí)進(jìn)度頁(yè)面后,再進(jìn)行課件學(xué)習(xí),對(duì)成績(jī)的促進(jìn)起更重要的作用。
表2 課程訪問(wèn)行為與成績(jī)相關(guān)分析
由表3可得出,學(xué)習(xí)者通過(guò)網(wǎng)頁(yè)->查看課件資源,與成績(jī)的相關(guān)系數(shù)為0.823,顯著率為0.000,與成績(jī)有極高的相關(guān)度。通過(guò)數(shù)據(jù)顯示,學(xué)習(xí)者在課程資源上預(yù)習(xí),投入時(shí)間和精力,學(xué)習(xí)成績(jī)會(huì)更好學(xué)習(xí)者先查找網(wǎng)絡(luò)資源然后參與討論,此序列與成績(jī)相關(guān)系數(shù)為0.712,顯著率為0.000。學(xué)習(xí)者學(xué)習(xí)完教師的課件文檔轉(zhuǎn)至討論發(fā)帖,表明學(xué)習(xí)者對(duì)課程的掌握程度以及吸收、轉(zhuǎn)換知識(shí)的程度。CJBC 與課程成績(jī)相關(guān)系數(shù)為-0.415,顯著率為0.000,負(fù)相關(guān)表明學(xué)習(xí)者可能在觀看視頻中可能出現(xiàn)拖動(dòng)進(jìn)度條或者學(xué)習(xí)頻次低,或者掛線。其他兩個(gè)行為序列與成績(jī)?yōu)榈投认嚓P(guān)(0.462和0.456),涉及到共享資源學(xué)習(xí)和其他序列之間的轉(zhuǎn)換,反映出學(xué)習(xí)者學(xué)習(xí)的多樣性,但學(xué)習(xí)成績(jī)較中等,說(shuō)明學(xué)習(xí)者的行為為低層次投入的序列轉(zhuǎn)換。
表3 資源學(xué)習(xí)行為序列與成績(jī)相關(guān)分析
從表4 可看出,三個(gè)測(cè)試行為序列與學(xué)習(xí)者成績(jī)有低相關(guān)度,也反映出學(xué)習(xí)者在測(cè)試之前的行為序列蹤跡。LCBC 行為序列表明,學(xué)生在測(cè)試之前,通過(guò)課件文檔,復(fù)習(xí)所學(xué)內(nèi)容,然后進(jìn)行測(cè)試,學(xué)習(xí)效果會(huì)得到提升,符合學(xué)習(xí)者學(xué)習(xí)規(guī)律。BCCJ 行為序列表明學(xué)習(xí)者測(cè)試后對(duì)學(xué)習(xí)進(jìn)度進(jìn)行追溯,可看出學(xué)習(xí)者比較重視學(xué)習(xí)情況和知識(shí)點(diǎn)的掌握程度,間接與成績(jī)發(fā)生關(guān)聯(lián)。CJGW 行為序列表明學(xué)生在進(jìn)行測(cè)試完成后,發(fā)現(xiàn)問(wèn)題,重新返回查看文檔,這個(gè)動(dòng)作序列被不斷重復(fù),一方面,表明學(xué)習(xí)成績(jī)的導(dǎo)向性導(dǎo)致學(xué)習(xí)者不斷重復(fù)學(xué)習(xí)資料,另一方面,也表明課件是學(xué)習(xí)者學(xué)習(xí)課程的重要資料,也是測(cè)試的依據(jù)。
表4 學(xué)習(xí)行為序列與成績(jī)相關(guān)分析
表5 中可看出,新討論主題->上傳共享資源行為序列與成績(jī)相關(guān)性最高,說(shuō)明學(xué)習(xí)者通過(guò)討論方式對(duì)知識(shí)有更好的理解,循循漸進(jìn)的學(xué)習(xí),對(duì)知識(shí)有更深的理解,從而進(jìn)一步發(fā)帖,表明對(duì)教學(xué)知識(shí)點(diǎn)的深入掌握,同時(shí)也表明對(duì)學(xué)習(xí)有高的積極性和學(xué)習(xí)動(dòng)機(jī)。LTGW 行為序列與成績(jī)相關(guān)度為0.006,表明此序列轉(zhuǎn)換與成績(jī)沒(méi)有關(guān)聯(lián),同時(shí)反映出討論參與行為與學(xué)習(xí)效果是由強(qiáng)的關(guān)聯(lián)關(guān)系。通過(guò)研究LTGW 行為序列的學(xué)習(xí)者參與的討論和發(fā)表的主題,基本偏離主體內(nèi)容,可能是由于學(xué)習(xí)者缺乏知識(shí)的建構(gòu)和成績(jī)導(dǎo)向的引導(dǎo),導(dǎo)致學(xué)習(xí)者的參與度較低。
表5 參與行為序列與成績(jī)相關(guān)分析
由于單變量分析不一定能正確反映學(xué)習(xí)者的情況,故本文又采用多元線性回歸方法,探討行為序列對(duì)學(xué)習(xí)效果的影響。根據(jù)聚類分析結(jié)果得到,訪問(wèn)課程行為參與數(shù)(C)、學(xué)習(xí)行為序列參與數(shù)(S)、參與行為序列參與數(shù)(I)、學(xué)習(xí)資源行為參與數(shù)(R)四類行為序列特征。通過(guò)聚類方法對(duì)行為序列特征進(jìn)行聚類分析,聚類結(jié)果為四類,如表6 所示。在聚類分析中,各個(gè)行為序列都有顯著性,都為0.000,同時(shí)可看出,聚類選取的變量比較合理,但是各個(gè)行為序列變量在不同類之間的顯著性有所差別。故在此基礎(chǔ)上,對(duì)四類行為序列的參與程度做相關(guān)分析,如圖1所示。
表6 聚類結(jié)果
圖1為四類學(xué)習(xí)者參與訪問(wèn)課程、學(xué)習(xí)行為、參與行為序列、學(xué)習(xí)資源四種活動(dòng)的參與數(shù)。學(xué)習(xí)者參與程度最高的是C活動(dòng),參與數(shù)最低的I活動(dòng),每一類學(xué)習(xí)者體現(xiàn)到不同的學(xué)習(xí)行為上的數(shù)據(jù)也不同,這就體現(xiàn)出學(xué)習(xí)者在線學(xué)習(xí)中的個(gè)性化、差異化,具體如下:
第一類,學(xué)習(xí)自主型,共計(jì)5人,占總?cè)藬?shù)3.9%,此類學(xué)習(xí)者人數(shù)占比是最低的,參加C1R1S1I1的均值均高于其他三類,活躍度較高,能夠充分利用在線學(xué)習(xí)提供的資源來(lái)重構(gòu)知識(shí),主動(dòng)學(xué)習(xí)者,有強(qiáng)的自主學(xué)習(xí)動(dòng)力,較少依賴教師,有較好的學(xué)習(xí)習(xí)慣。
第二類,游離型,共51人,占總?cè)藬?shù)39.6%,此類學(xué)習(xí)者討論參與數(shù)高于第三類和第四類學(xué)習(xí)者,參與行為序列高于平均水平,參加討論活動(dòng)的積極性較高,參與學(xué)習(xí)的時(shí)長(zhǎng)也高于總體平均水平,但參與課程測(cè)試、訪問(wèn)課程資源次數(shù)較低,不活躍,所以需要提供給此類學(xué)習(xí)者學(xué)習(xí)策略和有效的個(gè)性化學(xué)習(xí)路徑,從而提升學(xué)習(xí)動(dòng)機(jī)和自身自控能力。
第三類,順應(yīng)型,學(xué)習(xí)者的重心放在測(cè)試、資源和課程學(xué)習(xí)上,共21 人,占總數(shù)16.1%,從圖1 可看出,此類學(xué)習(xí)者對(duì)資源和課程訪問(wèn)的序列值相對(duì)高,有可能只是跟隨教師進(jìn)行淺層次的學(xué)習(xí),學(xué)習(xí)積極性較高,但是參與討論行為較少,對(duì)此類學(xué)習(xí)者,應(yīng)考慮推薦更優(yōu)質(zhì)的資源和個(gè)性化學(xué)習(xí)方案。
圖1 各類學(xué)習(xí)者參與行為序列活動(dòng)數(shù)
第四類,低投入型,共178 人,占總?cè)藬?shù)40.4%,此類學(xué)習(xí)者比其他三個(gè)類別參與學(xué)習(xí)序列值低,在平臺(tái)中缺乏學(xué)習(xí)動(dòng)力,不是很重視成績(jī)的高低,只是為了完成教師布置的任務(wù),由于此類人數(shù)占比大,所以教師更應(yīng)關(guān)注此類學(xué)習(xí)者,加強(qiáng)教學(xué)設(shè)計(jì)、注重情境教學(xué),激發(fā)其對(duì)知識(shí)的渴望和學(xué)習(xí)動(dòng)力,并實(shí)時(shí)跟蹤其學(xué)習(xí)路徑,推薦有效的學(xué)習(xí)路徑和教學(xué)策略。
本文將在線學(xué)習(xí)行為投入理論與行為序列聚類結(jié)果相結(jié)合,研究基于學(xué)習(xí)序列與成績(jī)之間的關(guān)聯(lián),從而幫助學(xué)習(xí)者建立正確的學(xué)習(xí)行為模式,進(jìn)而提高學(xué)習(xí)效果。首先使用單一相關(guān)分析四類學(xué)習(xí)行為與成績(jī)之間的關(guān)聯(lián),然后用多元線性回歸方法,確定四類學(xué)習(xí)行為中影響學(xué)習(xí)效果的關(guān)鍵行為序列,并分析行為序列變量對(duì)學(xué)習(xí)效果的影響。由于本模型的實(shí)驗(yàn)樣本是建立在兩門計(jì)算機(jī)專業(yè)課程的數(shù)據(jù)上,選取的學(xué)科樣本和年級(jí)有一定的局限性,所以收集的數(shù)據(jù)不能完全反映在線學(xué)習(xí)的全貌,下一步將增大樣本的數(shù)量,進(jìn)一步完善分析結(jié)果。同時(shí)采用多種學(xué)習(xí)分析技術(shù)進(jìn)行對(duì)比實(shí)驗(yàn),遵循個(gè)性化偏好和差異,給學(xué)習(xí)者量身定做有效的個(gè)性化學(xué)習(xí)路徑。