楊孟嬌,侯麗媛
(內(nèi)蒙古廣播電視大學,呼和浩特,010011)
開放教育為學習者自主學習提供了海量學習資源,但是因為學習者面臨工學矛盾以及本身的主觀惰性,使得不同學習者的學習行為存在差異。因此掌握學習者的學習行為現(xiàn)狀、學習特征,是提升開放教育教學質量、為學習者提供更好的學習支持服務的基礎與前提。對學習者在線學習行為的研究已經(jīng)是熱點與重點。洪宣容等人從學習者特征、在線學習行為、在線學習資源、現(xiàn)有學習支持服務、在線學習評價等方面對成人在線學習進行了現(xiàn)狀研究。薛瑞璇將學習行為分為外顯行為和內(nèi)隱行為兩種,外顯行為主要有學習者登錄、瀏覽、發(fā)帖提問、參與討論等具體操作行為;內(nèi)隱行為主要有初始能力分析、學習風格分析、學習動機分析和自我效能感分析等。舒忠梅等人基于數(shù)據(jù)挖掘,將學習行為分為全面發(fā)展型、均衡發(fā)展型等七個類型。丁鵬飛基于學生學習特征將學生聚類劃分成分別命名為被動型、游離型、徒勞無功型、學有余力型,并對不同類型學生的學習投入模式及其行為特征進行分析。楊國龍構建了網(wǎng)絡教育學習者學習行為差異化分析模型,聚類并分析了內(nèi)向場獨立、內(nèi)向場依存、外向場獨立與外向場依存四類學習者群體的特征差異。王紅梅等對408名學習者的學習行為數(shù)據(jù)進行分析,探究開放學習環(huán)境中學習行為投入與認知投入的關系。田娜以“程序設計語言C”的65個學生為樣本,對學生完成課時數(shù)量、瀏覽次數(shù)、登錄次數(shù)等指標進行聚類分析。王蕾對開放教育學習者的登錄、瀏覽、交互、檢索等各類數(shù)據(jù)進行分析研究, 就如何提高學生參與在線學習的積極性提出改進路徑和建議。
作為開放教育的主陣地,國家開放大學學習網(wǎng)是國家開放大學以及全國各分部的主要學習平臺,開放教育學習者的學習行為主要也集中在此。本文充分利用國家開放大學學習網(wǎng)的數(shù)據(jù),以內(nèi)蒙古分部的學習者為研究對象,提取學習者學習行為的特征參數(shù),運用主成分分析和K值聚類算法,探究開放教育學習者學習行為特征與規(guī)律,篩選出主要指標以及評估結果偏低的學習者,針對性提出有效措施,以期為學習者提供更好的學習支持服務、教學服務。
本文的數(shù)據(jù)來源于國家開放大學學習網(wǎng),選取內(nèi)蒙古分部2018年秋到2020年春四個學期的32萬多條學習者學習行為數(shù)據(jù),原始數(shù)據(jù)表包括了22個指標(表1)。由于國開學習平臺上獲取的為原始數(shù)據(jù),包括了所有選課以及未選課的學習者學習行為數(shù)據(jù),故研究刪除了選課數(shù)為零的無效數(shù)據(jù);對于原始數(shù)據(jù)存在個別變量缺失的問題,通過將缺失值替換為變量的平均值進行缺失數(shù)據(jù)處理,經(jīng)過處理最終得到有效數(shù)據(jù)186 497條。
表1 指標名稱
研究對象設定為學習者,所以表1中指標1到10均為無關變量,學習者姓名替換為序號即可;研究的內(nèi)容為學習者學習行為,因此只關注學習者學習平臺的相關行為,不考慮教師的相關行為,包括形考評閱數(shù)和教師回帖數(shù);提交形考數(shù)與完成形考課程數(shù)存在較大關聯(lián),而且完成形考更為重要,所以也不考慮提交形考數(shù)。因此本文重點研究的是反映學習者學習積極性、完成度、參與度等特征的多項指標,并基于原始數(shù)據(jù)確定如下指標。
1.學習平臺登錄次數(shù)、學習平臺在線天數(shù)
學習平臺登錄次數(shù)是指一個學期內(nèi)學習者登錄國開學習網(wǎng)的次數(shù),學習平臺在線天數(shù)是指一個學期內(nèi)學習者國開學習網(wǎng)的在線天數(shù)。由于不同學期、不同學習者的選課數(shù)量不同,在此將學習平臺登錄次數(shù)設定為平均每門課程的登錄次數(shù),將學習平臺在線天數(shù)設定為平均每門課程的在線天數(shù)。
LN
=LN
/n
(1)
ON
=ON
/n
(2)
式中:LN
表示學習平臺平均登錄次數(shù);LN
是原始數(shù)據(jù)中學習平臺登錄次數(shù),也就是總次數(shù);n
是每個學習者選課數(shù)量;ON
是學習平臺平均在線天數(shù);ON
是原始數(shù)據(jù)中學習平臺在線天數(shù),也就是總天數(shù)。2.行為數(shù)、瀏覽數(shù)
行為數(shù)是指一個學期內(nèi)學習者在國開學習網(wǎng)學習的所有行為數(shù),包括瀏覽學習資源數(shù)、發(fā)帖數(shù)、回帖數(shù)、完成作業(yè)等行為數(shù);瀏覽數(shù)是指一個學期內(nèi)學習者瀏覽學習文本資源、視頻資源等的數(shù)量。在此將行為數(shù)設定為平均每門課程的行為數(shù),將瀏覽數(shù)設定為平均每門課程的瀏覽數(shù)。
B
=B
/n
(3)
R
=R
/n
(4)
式中:B
表示行為數(shù);B
是原始數(shù)據(jù)中行為總數(shù);R
是瀏覽數(shù);B
是原始數(shù)據(jù)中的瀏覽數(shù),也就是瀏覽總數(shù)。3.形考完成率、形考及格率
形考完成率是指一個學期內(nèi)學習者在學習平臺完成形考課程數(shù)與選課數(shù)的比值;形考及格率是指一個學期內(nèi)學習者在學習平臺形考及格課程數(shù)與完成形考課程數(shù)的比值。
C
=C
/n
(5)
P
=P
/C
(6)
式中:C
表示形考完成率;C
是原始數(shù)據(jù)中完成形考課程數(shù);P
是形考及格率;P
是原始數(shù)據(jù)中形考及格課程數(shù)。4.發(fā)帖數(shù)、回帖數(shù)
發(fā)帖數(shù)是指一個學期內(nèi)學習者在學習平臺網(wǎng)上教學環(huán)節(jié)、討論區(qū)等發(fā)布帖子數(shù)量;回帖數(shù)是指一個學期內(nèi)學習者在學習平臺網(wǎng)上教學環(huán)節(jié)、討論區(qū)等回復他人帖子的數(shù)量。在此將發(fā)帖數(shù)設定為平均每門課程的發(fā)帖數(shù),將回帖數(shù)設定為平均每門課程的回帖數(shù)。
PN
=PN
/n
(7)
RN
=RN
/n
(8)
式中:PN
表示發(fā)帖數(shù);PN
是原始數(shù)據(jù)中的發(fā)帖數(shù),也就是發(fā)帖總數(shù);RN
是回帖數(shù);RN
是原始數(shù)據(jù)中的回帖數(shù),也就是回帖總數(shù)。通過公式(1)到(8)分別對原始數(shù)據(jù)進行處理,得到本文研究樣本數(shù)據(jù)。
因子分析是指研究從變量群中提取共性因子的方法,它是在盡可能降低原有信息損失的前提下,將本質相同的變量歸入一個因子,可以減少變量的數(shù)量,也就是指標降維。本文選擇主成分分析法進行因子分析。
采用KMO法和巴特利特法對數(shù)據(jù)的可行性進行檢驗。表2中,KMO值為0.774,大于0.6,表示樣本數(shù)據(jù)各指標之間具有較好的相關性,適用于因子分析。巴特利特球形度檢驗顯著性水平為0.000,表示拒絕零假設,樣本數(shù)據(jù)變量之間存在相關性,適合進行主成分分析。
表2 KMO和巴特利特檢驗結果
根據(jù)公因子方差可以判斷公因子對各個指標的說明程度,提取公因子方差越大,公因子對對應指標的說明程度越大,公因子方法越小表示該指標的重要度越低,一般指標的提取公因子方差小于0.4,就可以認為重要度較低,可以在因子分析中刪除,因此由表3可以判斷將回帖數(shù)刪除不予分析。重新進行KMO(0.771)和巴特利特檢驗(0.000),結果均可行。
表3 公因子方差
可以通過碎石圖確定最優(yōu)主因子的數(shù)量,橫坐標的組件號即為因子的數(shù)量,縱坐標是因子特征值,將因子特征值連線,較為陡峭的部分就是應該提取的主因子數(shù)量。由圖1可知,前面兩個因子的特征值較大且連線較陡,可以確定為主因子。
圖1 碎石圖
主成分分析的目的是指標降維,但是同時也要盡可能地減少信息損失。因此在碎石圖確定主因子數(shù)量的基礎上,要求累積方差貢獻率達到85%以上,各成分在因子分析中的總方差解釋結果如表4所示。由表4可知,兩個主因子的累積方差貢獻率為71.445%,未達到85%。由于成分3、4的特征值大于0.5,因此可以將成分3、4也確定為主因子,累積方差貢獻率達到89.936%,符合要求。
表4 總方差解釋
分析成分矩陣(表5),可以得知:主因子1與瀏覽數(shù)、行為數(shù)相關性較強,與其他指標均存在不同程度的相關性;主因子2與形考及格率和形考完成率有較強的相關性,與學習平臺在線天數(shù)也存在弱相關。
表5 成分矩陣
k
個對象作為初始的聚類中心(質心),然后計算每個數(shù)據(jù)與各個聚類中心的距離,離哪個聚類中心近,就劃分到那個聚類中心所屬的集合。聚類中心以及分配給它們的對象就代表一個聚類。每分配一個樣本,聚類的聚類中心會根據(jù)聚類中現(xiàn)有的對象被重新計算,直到滿足某個終止條件。終止條件可以是沒有(或最小數(shù)目)對象被重新分配給不同的聚類,沒有(或最小數(shù)目)聚類中心再發(fā)生變化,誤差平方和局部最小。圖2 K均值聚類算法流程
根據(jù)因子分析的結果,分別對行為數(shù)、瀏覽數(shù)、形考完成率和形考及格率進行聚類,分析學習者的學習行為特征。將學習行為評價結果分為4類:高、較高、一般、偏低。圖3將四個指標的評價結果相同的一類用線相連接,可以看出行為數(shù)、瀏覽數(shù)的聚類結果為偏低的占比較高,形考及格率的聚類結果為高的占比較高。具體聚類結果見表6到表9。
圖3 不同指標下各聚類結果占比
以行為數(shù)作為指標的聚類結果(表6),平均每門課程的行為數(shù)在0到159次的學習者占比最高,達到72.3%,評價結果偏低;行為數(shù)在159到470次的學習者占比為21.5%,評價結果一般;僅有6.2%的學習者的行為數(shù)在470以上,評價結果為較高或高。
表6 以行為數(shù)作為指標的聚類結果
以瀏覽數(shù)作為指標的聚類結果(表7),平均每門課程的瀏覽數(shù)在0到87次的學習者占比最高,達到70.9%,評價結果偏低;瀏覽數(shù)在87到265次的學習者占比為22.4%,評價結果一般;有5.5%的學習者的瀏覽數(shù)在265到600次之間,評價結果為較高;僅有1.2%的學習者的瀏覽數(shù)在600以上,評價結果為高。
表7 以瀏覽數(shù)作為指標的聚類結果
以形考完成率作為指標的聚類結果(表8),整體評價結果偏高,每門課程的形考完成率在85%到100%之間的學習者占比最高,達到32.3%,評價結果為高;形考完成率在57%到83%之間的學習者占比為31.9%,評價結果較高;但是也有12.6%的學習者的形考完成率在28%以下。
表8 以形考完成率作為指標的聚類結果
以形考及格率作為指標的聚類結果(表9),整體評價結果很高,形考及格率在50%以上的達到88.3%,每門課程的形考及格率在85%到100%之間的學習者占比最高,達到71.2%,評價結果為高;形考及格率在50%到83%之間的學習者占比為17.1%,評價結果較高;僅有8.6%的學習者的形考及格率在15%以下。
表9 以形考及格率作為指標的聚類結果
基于對數(shù)據(jù)進行分析、挖掘,應用主成分分析和K均值聚類分析方法,對開放教育學習者的學習行為進行了科學聚類分析,其學習行為現(xiàn)狀如下:學習者的學習行為數(shù)、瀏覽數(shù)水平整體偏低,但是形考作業(yè)整體情況較好,無論是完成率還是及格率都達到了較高的水平。通過分析可以對國開學習網(wǎng)在線行為數(shù)和瀏覽數(shù)不高、形考作業(yè)完成率低、形考作業(yè)及格率偏低的學習者進行準確地識別,針對這類學習者可以采取定時提醒督促學習和完成作業(yè)、提供針對性輔導等措施,提高其學習積極性以及學習的有效性?;诒疚牡难芯績?nèi)容及研究結論,通過國開學習網(wǎng)、學生教務和考務系統(tǒng)等提取更多有效的、有價值的學習行為特征指標,結合學習者自身屬性特征、學習支持服務等,可以建立更加科學、完善的開放教育學習者學習行為評價體系,對開放教育管理人員、教師、學習支持服務人員以及學習者本身均有積極意義。