樂惠驍 范逸洲 賈積有 汪瓊
摘要:基于中國大學MOOC平臺上《翻轉課堂教學法》MOOC中17204名學習者的行為日志數(shù)據,在為學習者的頁面訪問記錄賦予有意義的行為編碼標簽,建立其學習路徑模型后,使用統(tǒng)計和共現(xiàn)分析的方法,研究其中優(yōu)秀學習者的學習行為模式特點。研究發(fā)現(xiàn),優(yōu)秀學習者總行為序列長度顯著高于其他學習者,上線學習的次數(shù)顯著地多于其他學習者;但是每次上線學習發(fā)生的有意義的交互行為的數(shù)量與其他學習者相仿,學習時長也相仿;其參與和回答教師的提問、復習已學過的內容、參與論壇互動的行為在其總學習行為中占比更多,而學習全新內容、參與測驗、把握全局等行為的占比較少。研究用共現(xiàn)分析的方法分析了學習者每次上線產生的行為之間的共現(xiàn)關系,發(fā)現(xiàn)優(yōu)秀的慕課學習者在學習新內容時更少發(fā)生走神和中斷的情況,且其每次上線的目的更鮮明,學習主題更突出。研究的發(fā)現(xiàn)揭示了優(yōu)秀慕課學習者學習行為模式的特征,有助于改進慕課教學。此外,共現(xiàn)分析的方法也為行為數(shù)據的挖掘提供了新的思路。
關鍵詞:慕課;行為模式;學習路徑;共現(xiàn)分析
中圖分類號:G434 文獻標識碼:A
一、引言
慕課這一概念自2008年提出至今,已經經歷了10年的發(fā)展,在線開放課程已經成為如今教育的重要一部分。教育部在《2018年教育信息化和網絡安全工作要點》中強調要形成國家教育資源公共服務體系,認定第二批國家精品在線開放課程(MOOC)500門以上,體現(xiàn)了在線開放課程正在逐步融入主流、常態(tài)的高等教育體系。在慕課發(fā)展的過程中,如何提升慕課的教學質量向來是研究的焦點。
目前,對于“如何提升慕課教學質量”的回答主要集中于兩方面。一方面從政策建議入手,以教學系統(tǒng)的制度變革等手段在宏觀上來推進慕課教學質量的提升;另一方面,也是如今被討論得更多的,是健全和完善慕課平臺的學習支持服務,為學習者提供更加全面、個性化的學習指導和更好的人機交互體驗,或使用策略來激發(fā)學習者的學習動機,以此類方法提升教學質量。在與后者相關的研究視域下,提升慕課教學質量的問題成為了一個工程問題——如何設計能有效支持學習者學習的系統(tǒng)并實現(xiàn)它。在技術高度發(fā)達的今日,各種技術的應用愈發(fā)成熟,對于教育技術研究者來說這個問題的難點更多地在于設計上。大多數(shù)學者的選擇是在教學理論和教學經驗的基礎上進行設計。然而,歸納式的教學理論是否能很好地貼合大量涌現(xiàn)的慕課教學的實際場景是—個值得商榷的問題。在這種抽象的理論到實際設計過程中,真實的、來自實踐的經驗是彌補理論到實踐之間溝壑的重要依據。在數(shù)據技術愈加完善的今日,慕課平臺上的學習者行為數(shù)據無疑是這些依據的重要來源。行為是經典心理學關注的焦點,對行為的研究能揭示學習者學習的一般規(guī)律,利用數(shù)據挖掘的手段對慕課平臺上產生的學習行為數(shù)據進行分析,有助于加深對慕課教學的理解。
在這樣的背景下,我們開展了這項研究。本研究以中國大學慕課《翻轉課堂教學法MOOC》中的學習者產生的行為數(shù)據為研究對象,使用數(shù)據挖掘的方法探究優(yōu)秀慕課學習者行為模式的特點。本研究是數(shù)據驅動的研究,關注的問題是優(yōu)秀的慕課學習者在在線課程平臺中學習行為模式的特點。本文對“優(yōu)秀的慕課學習者”的操作定義是按照慕課課程評價標準,獲得了優(yōu)秀評價的學習者,即最后的結業(yè)成績達到了80分以上的學習者。這一部分的學習者是具有相當?shù)拇硇院吞厥庑缘膶W習者群體。其代表性在于,他們是課程希望培養(yǎng)的學習者,其學習表現(xiàn)滿足了教學方的期望。他們自身的學習特點(如學習策略等)有著一定的特殊性,對他們的行為數(shù)據進行研究可以提供關于“如何促進學習”的有效信息。通過對比他們與其他學習者的學習行為模式,揭示他們的特征,可以幫助研究者更好地理解真實的慕課教學。
二、相關研究
已有許多學者開展了基于學習行為數(shù)據的研究。大多數(shù)的研究致力于建立起一種“行為模式一學業(yè)表現(xiàn)”的關系,揭示平臺中學習者活動的行為并予以分析,研究中難點在于:如何對學習行為進行表征和建模;如何探究行為模式與學習者學業(yè)表現(xiàn)之間的關系。
對學習行為建模中重要的一步在于從數(shù)據中提取需要的特征。研究者可以根據數(shù)據集中的字段信息或理論需要,結合字段的信息形成需要的變量來表征某些行為模式的特征。如賈積有等提出在線學習活動指數(shù)OLAI這一指標來表征學習者參與在線學習活動時的特征;如今對于學習行為的研究不再局限于對靜態(tài)的屬性分析,許多研究者已經開展了對于學習者行為的動態(tài)特征,即行為序列的研究。對行為序列的研究中一種常用的方法是給用戶行為進行編碼:如楊現(xiàn)民等對用戶的頁面瀏覽行為進行編碼,用滯后序列分析的方法尋找值得解讀的行為模式。對于序列行為的研究,可以采用時間序列的方法用離散隨機過程表征學習者的行為序列,并進行進一步的數(shù)據挖掘,如Maldonado等使用時間序列的方法從數(shù)據中尋找有理論價值的行為模式,Davis等也做了相似的研究,用離散隨機過程對學習者的學習行為進行建模,并以狀態(tài)間的轉移為基本單位分析學習者在線學習行為的模式。
另一個重點在于如何發(fā)現(xiàn)行為模式與學業(yè)表現(xiàn)之間的關系。經典的研究方法是是采用相關分析、因果分析等統(tǒng)計手段探究表征學習模式的變量與表征學業(yè)成就的變量之間的關系,并給予理論解讀。如賈積有等對北京大學六門慕課的數(shù)據進行分析并探究學習活動行為對學業(yè)成績的影響。如今,越來越多的研究也加入了一些數(shù)據挖掘的方法,如聚類分析,主要解決研究者單純從現(xiàn)有模型出發(fā)無法從數(shù)據中有效提取信息的問題:如李爽等通過相關分析、LSA和聚類分析等手段研究學習者行為與課程成績的關系以及行為模式和特征,王改花等用特征聚類的方法對網絡學習者進行分類。Vaessen等采用聚類和回歸算法研究智能學習系統(tǒng)中學習者的求助策略與學習成績的關系。其中,聚類分析可以在數(shù)據層面將學習者的一些信息挖掘出來,并給予研究者以啟發(fā)。
三、研究設計
(一)研究問題和框架
本研究的研究問題是優(yōu)秀的慕課學習者在慕課平臺中的行為模式的特點是什么。更具體地說,是要回答兩個問題:
1.優(yōu)秀的慕課學習者在線行為序列的長度以及各類行為占比與其他學習者相比有什么不同?
2.優(yōu)秀的慕課學習者每一次上線學習產生的各類有行為的共現(xiàn)(Co-Occurence)情況與其他學習者相比有什么不同?
研究用基于規(guī)則的機器自動標注的方法為學習者產生的行為數(shù)據賦予有意義的編碼,并為其建立學習路徑模型。研究將數(shù)據集中的學習者按照最終學業(yè)表現(xiàn)分為了四組,并探究各組成員在線行為中各類有意義行為占行為總數(shù)的比的差別。通過對行為編碼的共現(xiàn)分析回答第二個問題。
(二)數(shù)據集
研究的對象是中國大學慕課上《翻轉課堂教學法》MOOC共計13期的學習者,時間跨度從2015年3月至2017年12月。他們所有學習課程期間的瀏覽頁面記錄被系統(tǒng)后臺頁面所記錄并形成了數(shù)據集。數(shù)據集中能提供的信息包括瀏覽記錄編號、學習者編號、學期編號、學業(yè)成績、上線時間、下線時間和瀏覽頁面的名稱。該課程在平臺上有較大的影響力和相對較大的學習者群體。然而,在線教學情境復雜,學習者組成相當多元且表現(xiàn)出的學習行為也相當駁雜,故研究最終只保留最終獲得了成績且上線學習次數(shù)超過3次的17204名學習者作為研究對象,因為他們在課程中花費的精力相對來說更多,是在課程設計之初所期望的學習者對象。
(三)術語定義
1.學習路徑
學習路徑(Learning Path)是學習者完成教學活動時參與不同教學活動模塊的路徑記錄。例如,在—個基于Web的教學系統(tǒng)中,一個學習者的學習路徑可以用其訪問的頁面、在頁面中停留的時間、點擊的控件等人機交互行為來描述。在本文中,學習路徑中的基本元素是學習者的行為編碼,本文提出了以下幾種行為編碼來賦予學習者學習路徑中不同行為及意義,并形成了行為編碼詞典,如表1所示。
經過編碼后的學習路徑可以通過一個數(shù)字編碼的序列進行表示,如“024411117801111245550”表示的就是某學習者兩次登陸進行學習的學習路徑。如何在大量的頁面訪問中識別到有意義的信息,首先需要對每個學習者的學習記錄進行編碼,即為學習者訪問每個頁面的記錄打上有理論意義的標簽。在編碼過程中,有大量頁面停留時間在5秒及以下,本文將這些頁面訪問記錄識別為行為噪音并予以剔除。
2.RSBC
對于不同學習者,某個行為編碼在其所有學習路徑中所有行為中的占比(Ratio of Specific Behavior Codes,簡稱RSBC)是不一樣的。例如,對于學習者A,其學習路徑中的所有行為用“2441111780”這樣—個行為序列表示,則其“1”行為出現(xiàn)的頻數(shù)為4,而序列中所有行為的個數(shù)為10,故其編碼1的RSBC為25%。一個學習者不同編碼行為的RSBC是一個有意義的指標,通過對學習者不同編碼行為的RSBC的解讀,可以從學習者的行為中了解一個學習者的學習的常態(tài)。例如,有的學習者偏好以課程視頻為主要內容,快速瀏覽過整個課程獲取其需要的知識,也有的學習者喜好通過與同伴的交流和互動加深對知識的理解。深入挖掘一門課程中不同學習者RSBC的信息對揭示學習者的學習模式和策略有極大的意義。
四、數(shù)據挖掘和分析
(一)為學習者建立學習路徑模型
首先根據每個學習者的數(shù)據為課程平臺上的所有學習者建立學習路徑模型。將每個學習者每次進入課程的在線會話記錄編碼后合并,共得到17204條記錄。統(tǒng)計所有學習者的行為頻次及占比,結果如表2所示,表中的列表示行為編碼,為所有學習者每種行為出現(xiàn)的頻數(shù)以及其占行為總數(shù)的比。
(二)學習者分組
本文的研究問題是探究優(yōu)秀的慕課學習者的學習行為模式有什么樣的特點,本文采用比較研究的思路,依據學習者在平臺上的學業(yè)表現(xiàn)對學習者進行分組,并通過組間的學習行為之間的比較來研究優(yōu)秀學習者的學習行為模式的特點。研究將學習者分為以下四組:第一組為成績在[0,20)區(qū)間內的學習者,第二組為成績在[20,60)區(qū)間內的學習者,第三組為成績在[60,80)區(qū)間內的學習者,第四組為成績在[80,100]的學習者。從成績的直方圖分布來看這是一個U型(如圖1所示),即成績較差和較好的學習者較多,但是成績中等(20-60)分的學習者較少,故依此劃分了[0,20),[20,60)和[60,100]這三個區(qū)間。但是對于有獲得證書需要的學習者來說,是否獲得優(yōu)秀(80分)的評級是一個較為重要的變量,對其最終表現(xiàn)出的在線行為有著較強的影響,故最終將學習者群體劃分成了四個組,人數(shù)分別為8609、1596、2503、4496人。
(三)不同組學習者行為占比及行為序列長度的比較和解讀
研究對不同組學習者的RSBC和行為序列長度繪制箱形圖并比較,其結果如下頁圖2所示。
下頁圖2中有12張箱型圖,圖中依次是行為編碼0-9在不同組學習者的RSBC、行為序列長度以及成績的箱形圖。前10張小圖的縱軸為行為編碼的RSBC,橫軸為學習者分組1到4,分別是成績由低到高的四個組。箱形的上沿和下沿分別是該組樣本的上四分位數(shù)和下四分位數(shù),箱形中間的黑線表示其樣本的中位數(shù)。(文中若如無特殊說明,所報告的組間均值差異均通過了顯著性水平為0.05的雙樣本t檢驗)
1.不同組學習者行為序列長度和時長的比較和解讀
行為序列長度指學習者學習路徑中各編碼數(shù)量的總和,學習者在平臺上有意義的訪問頁面的行為越多,則其行為序列的長度也就越長。四組學習者的行為序列長度的均值大小為又X4>X3>X2>X1。需要說明的是,所有編碼在不同的學習者組中出現(xiàn)的頻數(shù)的均值的大小的排序均為X4>X3>X2>X1,即優(yōu)秀的慕課學習者的與平臺發(fā)生交互的次數(shù)更多。
第四組學習者的行為序列長度明顯高于前三組,這說明第四組學習者與平臺發(fā)生的交互更多。以所有學習者為樣本,學習者的行為序列的長度與其學習成績有極強的正相關,其皮爾遜相關系達到了0.8,且在0.05的顯著性水平下顯著,是預測學習者表現(xiàn)的一個十分有效的指標。
此外,各組學習者的所有學習行為序列的長度、一學期中的上線次數(shù)、每次上線發(fā)生的有意義交互行為的數(shù)量中蘊藏著許多有價值的信息。以每次的信號行為,即頁面停留時間在45分鐘以上的行為,作為一次學習者一次線上學習的開始和結束,可以統(tǒng)計每個學習者上線學習的次數(shù)以及每次上線發(fā)生的交互行為的數(shù)量。圖3左側的箱形圖展示的是四組學習者上線學習次數(shù)的統(tǒng)計結果,四組學習者的上線學習次數(shù)的均值大小為X4>X3>X2>X1,一結果說明成績越好的學習者,其上線參與學習的次數(shù)越多。但是,各組學習者上線學習的過程中他們與平臺進行交互的行為頻數(shù)是否有差異呢?圖3右邊圖的結果顯示四組學習者每次上線與平臺發(fā)生有意義交互行為的次數(shù)之間的差異并不大:四組均值分別為14.95、15.41、14.57、15.21。
統(tǒng)計各組學習者每次上線學習的時長,發(fā)現(xiàn)其差別也不大。四組的均值分別為34.35分鐘、33.69分鐘、32.36分鐘和35.47分鐘,第四組學習者的平均每次上線時長稍長于其他幾組。
2.不同組學習者各RSBC差異的比較
從編碼1的RSBC來看,四組學習者的編碼1的RSBC的均值大小為X1>X2>X4>X3。編碼1是學習新內容的行為,由表2可知,在所有學習者中,編碼1的RSBC達到了23.6%,在學習者的所有學習行為中占有很大的比重。四組學習者間的差異也顯示了,成績較差的兩組學生(組1、組2)的編碼1的RSBC較高,其觀看新內容在所有學習行為中占有了很大的比重;而成績達到了及格及以上的兩組學生(組3、組4)其編碼1的RSBC又相對較低,而成績較好的那組(組4)的RSBC更高。
編碼2的意義是復習已經學過的內容。各組編碼2的RSBC的均值差異情況為為X4>X3>X2>X1,除1、2兩組之間的均值差異外,其余各組之間的均值差異皆通過了顯著性水平為0.05的雙樣本t檢驗。這一結果說明學業(yè)表現(xiàn)更好的學習者的所有學習行為中的復習行為所占的比例相對來說更高,且第四組學習者的編碼2的RSBC是所有組中最大的。
編碼3的意義是瀏覽和回答課堂討論區(qū)中的教師提問。各組編碼3的RSBC的均值情況為X4>X3>X2>X1。這說明學業(yè)表現(xiàn)更好的學習者的所有學習行為中瀏覽和回答課堂討論區(qū)中教師的提問這一行為在其所有學習行為中的占比會更高。
編碼4的RSBC代表的是參與論壇互動(發(fā)帖或者回帖)在學習者的學習行為中所占的比例。在整個學習者群體中,編碼4的RSBC的平均值是4.6%,是一個占比相對較小的行為。四組學習者的編碼4的RSBC的均值的情況為X4>X3>X2>X1。這說明成績更好的學生所有學習行為中參與論壇互動的行為比例在四組中是最高的。
編碼5的RSBC代表的是參與測驗這一行為在學習者的學習行為中所占的比例,整個學習者群體的編碼5的RSBC的均值呈現(xiàn)一個倒U型的分布:均值大小為X3>X2>X4>X1。這一結果有許多值得解讀的地方:優(yōu)秀學習者的學習行為中測驗行為對應的編碼的RSBC并沒有成績中等的兩組(組2、組3)高,說明這兩組的學習者在參與測驗上所花費的時間相對來說會比最優(yōu)秀的學習者更多。值得注意的是,這種“更多”是一種“相對”的行為占比上的更多,而非“絕對”的行為數(shù)量。各組學習者樣本的編碼5出現(xiàn)的平均頻數(shù)為:X4>X3>X2>X1,值分別為109.6、86.7、45.5、7.8。對這一現(xiàn)象可以給出這樣一種可能的解釋:優(yōu)秀的慕課學習者更愿意參加測驗,但是他們也會花費相對其他學習者更多的精力在獲取成績以外的地方。
編碼6的RSBC是學習者瀏覽公告、評分標準、課程日歷、章節(jié)介紹、章節(jié)回顧等行為在學習者所有行為中所占的比例。四組學習者的編碼6的RSBC的均值大小為X1>X2>X3>X4。說明優(yōu)秀學習者的瀏覽公告等與知識內容不直接相關的這些行為在其所有學習行為中占比相對其他組來說更少。
編碼7出現(xiàn)的頻數(shù)是最少的學習行為。對各組的編碼7的RSBC的均值之間的差異進行t檢驗,在0.05的顯著性水平下發(fā)現(xiàn)只有第一組學習者的編碼RSBC高于其他三組學習者,但是其他三組學習者的組間并無顯著差異。對于第一組學習者,由于其課程的參與度不高,其各種行為會呈現(xiàn)出更散亂、隨機的特征。但是其余三組學習者的編碼7普遍較低,說明其求助行為在總行為中的占比較少。
編碼8出現(xiàn)的頻數(shù)也不高,其RSBC的均值與編碼7的情況相反,在0.05顯著性水平的t檢驗下,發(fā)現(xiàn)只有第四組學習者RSCB的均值顯著高于其他三組,這一發(fā)現(xiàn)暗示了優(yōu)秀學習者的學習行為中中斷或走神所占的比例會比其他學習者高。對于這一問題的發(fā)生機制,會在后文進行探討。
編碼9的RSBC是尋找行為在學習學者所有行為中的比例,在0.05顯著性水平的t檢驗下,第四組學習者的RSBC僅與第一組學習者有顯著差異,且第四組高于第一組。與對編碼7的情況的解讀相似,對于這種情況的一種猜想是:第一組學習者的課程參與度不高,其學習行為更為隨意,目的性更少。而第四組學習者每次學習的目的性更強,在不熟悉頁面間導航結構的情況下更容易出現(xiàn)尋找行為。
3.對各組學習者編碼8的RSBC差異的因果推斷
結合之前關于優(yōu)秀學習者上線更為頻繁的結論,不難發(fā)現(xiàn)優(yōu)秀學習者的總在線時長更長。這給解釋編碼8的情況——優(yōu)秀的慕課學習者的走神和中斷行為提出了新的問題:從學習疲勞理論的角度來看,高強度的學習導致學習疲勞會使學習者產生抑郁情緒,情緒沮喪、心情郁悶、動機缺乏、效能感降低等反應,頻繁的上線學習導致的學習疲勞可能是走神和中斷現(xiàn)象出現(xiàn)的一個原因。毫無疑問,優(yōu)秀的慕課學習者更易發(fā)生學習疲勞。那么,優(yōu)秀學習者的編碼8的RSBC偏高是否能由其長時間頻繁的學習所解釋呢?
研究使用傾向得分匹配方法(PSM)對數(shù)據集中的學習者個體進行匹配,需要控制的混淆變量是每次的平均在線時長和登錄次數(shù)。理論上而言,傾向得分匹配方法(PSM)通過再抽樣或基于接受干預的概率(即傾向值)將未被干預的成員與被干預的成員進行匹配來平衡數(shù)據,經過傾向得分匹配方法處理后,以成績是否超過80分作為原因變量,處理組(80分以上的學習者)與控制組(80分以下學習者)的學習者的平均在線時長和登錄次數(shù)是一致的。
使用Logit模型估計傾向值,使用遺傳算法匹配前三組中傾向值與第四組相近的學習者,最終匹配到4496名處理組的學習者和2101名控制組的學習者,匹配的效果如表3所示。
從表3來看,經過匹配后,可以發(fā)現(xiàn)控制組和處理組的這兩個變量的值幾乎相同,偏差均在5%以內,匹配效果較好,可以認為已經在數(shù)據中控制了這兩個變量。
對匹配后的控制組和處理組的編碼8的RSBC進行t檢驗,檢驗結果顯示控制組編碼8的RSBC為0.0161,處理組的編碼8的RSBC為0.0147,且在0.01的a值下顯著。
控制了學習疲勞這一因素后的結果與未控制的結果恰恰相反。結果表明若比較兩個平均在線時長和上線次數(shù)都相似的優(yōu)秀學習者和普通學習者,優(yōu)秀學習者發(fā)生走神、中斷等行為的頻率在統(tǒng)計意義上會比普通學習者更低,他們的學習會顯得更專注。
4.優(yōu)秀學習者行為占比及行為序列長度的特征
至此,研究能回答第一個研究問題,并對優(yōu)秀慕課學習者的特點有—個大概的描述:首先,優(yōu)秀的慕課學習者在平臺上的活動更多,在線時間更長,與平臺的內容發(fā)生的交互更多。但是其有記錄的每次上線學習過程中與平臺發(fā)生的有記錄的行為次數(shù)、在線時長與其他學習者相仿,但是其上線學習的次數(shù)明顯高于其他學習者。其次,比較其在平臺中的各種行為的占比與其他學習者的區(qū)別,他們參與和回答教師的提問、復習已學過的內容、參與論壇互動的行為的占比更多,而學習全新內容、參與測驗、把握全局等行為的占比較少。一點有意思的發(fā)現(xiàn)是,他們的走神和中斷行為的占比比其他學習者更多,但是若控制了學習疲勞這一變量,則他們發(fā)生走神、中斷等行為的頻率比普通學習者更少,表明他們的學習更專注,而中斷、走神等行為的偏高可能是他們調節(jié)自身認知狀態(tài)的一種表現(xiàn)。要進一步了解其特點,需要進行下一步更深入的挖掘。
(四)不同組學習者一次學習中各行為的共現(xiàn)分析和解讀
從之前的分析中可以發(fā)現(xiàn),優(yōu)秀的慕課學習者每次上線學習過程中與平臺發(fā)生的有記錄的行為次數(shù)與其他學習者相差不大,但是其每次上線的學習行為模式是否會有差別?統(tǒng)計學習者每一次上線記錄(以信號行為為分割)中的各行為編碼的共現(xiàn)次數(shù)并對其進行共現(xiàn)分析,可以從中發(fā)現(xiàn)學習者的一次線上學習過程中,哪幾類行為更傾向于同時出現(xiàn)。
在共現(xiàn)分析中,因為信號行為標志著一次在線學習的開始和結束,故對其信號行為的分析意義不大,本研究只研究編碼為1-9的各行為的共現(xiàn)情況,并對結果進行可視化。
1.可視化方法
對學習者一次學習行為中各行為的共現(xiàn)情況進行分析的第一步是計算其各編碼之間的支持度。
某一或某組學習者,其整個課程的學習過程中編碼行為X和編碼行為Y在某一次上線學習中同時出現(xiàn)的概率可以用關聯(lián)規(guī)則R:X→Y的支持度來表示:
其中,L為學習者一次上線產生的學習路徑中包含了編碼Y的記錄的集合count(X U L),表示在一次上線中某學習路徑同時含有編碼X和Y的次數(shù),IDI表示在所有的上線記錄構成的集合中出現(xiàn)的,含有編碼Y的一次上線記錄的個數(shù)。
可以用圖的方式對四組學習者的各編碼行為間的共現(xiàn)關系進行可視化??梢暬乃悸窞橛脠D的頂點表示1-9的行為編碼,頂點間邊的長度表征編碼間的共現(xiàn)關系,兩個編碼同時出現(xiàn)的頻率越大,頂點間邊的長度越小,兩個頂點的距離越近(如圖4所示)。
圖中有連線的頂點表示其代表的兩個編碼之間的支持度大于0.7,即在一次學習中共同出現(xiàn)的概率大于0.7。
2.學習者行為編碼共現(xiàn)情況
從圖中可以發(fā)現(xiàn),四組學習者的一次學習行為編碼的共現(xiàn)情況有一些普遍的規(guī)律:
(1)四組學習者中編碼8(走神或中斷)和編碼9(尋找行為)與編碼2(復習)、5(參加測驗)、6(把握全局)、7瞇助)的共現(xiàn)概率較大,說明學習者在進行復習、參加測驗、瀏覽公告、在論壇尋求幫助等行為時有很大概率走神、中斷學習或者在頁面中迷航。
(2)圖中四組學習者的編碼2、5、6、7彼此之間的距離都很近,說明這幾類行為在一次學習中同時發(fā)生的概率很高。這可能是學習者學習的—種共同的模式:有計劃地在某次上線時專門進行復習并參加測試。
除此以外,能在圖4中能發(fā)現(xiàn)優(yōu)秀學習者的一些特點:
前三組學習者的編碼1(學習新內容)與編碼8和9都有連線,說明其一次學習中在學習新內容時更易發(fā)生走神、中斷和在頁面中迷航的情況。然而對于第四組學習者,即優(yōu)秀的慕課學習者而言,他們的編碼1與編碼8、9沒有連線,說明其在學習新內容時相對更不容易發(fā)生走神和中斷的情況。而除此以外,優(yōu)秀學習者與其他學習者一樣,其編碼8與編碼2、5、6、7的共現(xiàn)較多,在進行復習、參加測驗、瀏覽公告、在論壇尋求幫助等行為時容易走神。
同時,第四組學習者的編碼1與3(回答教師的提問)的距離是最近的,說明優(yōu)秀慕課學習者學習新內容和回答教師提問更易在一次學習中同時發(fā)生。
更重要的是,優(yōu)秀的慕課學習者每次上線學習的主題更突出。從圖中可以發(fā)現(xiàn),對與其他幾組學習者相比,第四組學習者的編碼1與其他編碼的距離普遍顯得更遠,僅與編碼3距離相對較近。這說明除了回答教師提問外,優(yōu)秀慕課學習者的學習新內容的行為是較為獨立地,與其他行為共現(xiàn)的概率不高,這暗示了他們的每一次上線學習可能都有較強的目的性和專一性——只學新內容,或者只復習。第四組學習者編碼4(參與論壇互動)的情況也印證了這一猜想:它與其他的編碼的距離也較遠,說明該行為發(fā)生的獨立性也更高。如前文所說,編碼2、5、6、7可以被視作一種學習主題(復習并參加測試),而在各組學習者行為呈現(xiàn)出的共現(xiàn)情況來看,由于第四組的編碼1和4的距離較遠,可以將第四組學習者的編碼1和編碼4也視作兩種獨立的每次上線學習主題的核心:以學習新知識為主題或者以論壇互動為主題。而其他學習者的編碼1和4的距離很近,并不能劃分出獨立的學習主題。故可以認為,優(yōu)秀的慕課學習者每次上線學習的主題更突出。
3.優(yōu)秀學習者一次上線中各行為編碼共現(xiàn)的特點
至此,優(yōu)秀的慕課學習者的特點又增添了更多的細節(jié):首先,他們與其他學習者一樣,會有計劃地在一次學習中同時進行復習、提問求助、參加測試,而且容易在期間發(fā)生走神和頁面間的迷航。但是他們在學習新的學習內容時更專注,不易發(fā)生學習中斷的情況,對頁面間的結構也更了解。同時,他們更傾向于在學習新內容的同時回答教師的提問,而且他們每次學習的主題更突出。
五、結語
優(yōu)秀的學習者的學習模式有什么樣的特點?通過上述的分析,可以總結出以下幾點:
首先,從學習投入上看,研究發(fā)現(xiàn)優(yōu)秀的慕課學習者在在慕課平臺上產生的有意義的交互行為的數(shù)量顯著地多于其他學習者,故其學習投入比其他學習者更多,這是優(yōu)秀學習者的一個重要特征。
其次,從學習策略上看,具體到RSBC,優(yōu)秀的慕課學習者的學習策略有著這樣的特點:
第一,參與和回答教師的提問、復習已學過的內容、參與論壇互動的行為的占比更多,而學習全新內容、參與測驗、把握全局等行為的占比較少。
第二,從編碼間共現(xiàn)分析的結果來看,他們的每次上線學習顯得更有目的性,學習的主題更鮮明。
第三,他們更傾向于在學習新內容的“同時”去回答教師的提問。事實上,在課程設計時學習者回答教師提問是穿插在新的教學內容之中的,優(yōu)秀的學習者更傾向于遵從這種教學的引導,而這種遵從也能促進他們的學習。
第四,優(yōu)秀的慕課學習者的走神和中斷行為高于其他學習者。經過進一步分析,結果表明如果控制了學習疲勞這一因素,優(yōu)秀的慕課學習者發(fā)生走神和中斷的頻率會比其他學習者更低,他們的學習會更加專注。結合共現(xiàn)分析的結果來看,他們在學習新內容時的走神和中斷卻更少。優(yōu)秀的慕課學習者每次上線產生的有意義編碼序列的長度與其他學習者相仿,但是他們的上線學習次數(shù)更多。這暗示著優(yōu)秀的慕課學習者在高學習投入的學習過程中更專注,且偏好用休息等方式及時調整自身的狀態(tài),避免在學習新內容時發(fā)生學習疲勞的情況。
從優(yōu)秀的慕課學習者表現(xiàn)出的學習策略來看,引導學習者參與論壇互動和進行復習,是有效促進學習者學習的手段,慕課設計者可以在設計中更多地加以考慮。
需要說明的是,本課程的設計中論壇互動是評價的一部分,學習者可能會以成績?yōu)槟康娜ミM行論壇互動。在數(shù)據中,暫時沒有辦法將這兩部分的效應進行分離。優(yōu)秀的慕課學習者,在本文的操作定義的語境下只是成績得到了優(yōu)秀的學習者,但是他們是由兩部分可能的人構成的:真正以學習知識和內容為目標的學習者與以獲得證書為目標的功利學習者——雖然他們表現(xiàn)出相同的行為,但是其學習動機與最終的習得的效果一定有差別。然而成績較低的第一組學習者中可能也不乏學習投入較高,但是不愿意參加測試的學習者,因為他們將課程作為獲取學習資源的平臺而不愿參加到學習評價中來。本研究并沒有辦法將這兩類“優(yōu)秀學習者”在數(shù)據層面上分離開來,這是研究的一大缺憾。
作者簡介:
樂惠驍:在讀碩士,研究方向為人工智能與教育、學習分析(interesting@pku.edu_cn)。
范逸洲:在讀博士,研究方向為學習分析(yizhou0034@126.com).
賈積有:博士,教授,研究方向為人工智能與教育(ljy@pku.edu.cn)。
汪瓊:博士,教授,研究方向為e-Learning學習環(huán)境與學習設計(wangqiong@pku.edu.cn)。