□阮進(jìn)軍 慈 尚 汪祥舜
國家從2019年開始實施高職院校擴招計劃,越來越多的退役軍人、新型職業(yè)農(nóng)民、高中畢業(yè)同等學(xué)歷背景的學(xué)生進(jìn)入高職院校學(xué)習(xí),相對于高職院校傳統(tǒng)生源而言,他們的年齡跨度,教育背景、學(xué)習(xí)方式和學(xué)習(xí)能力等方面的差異性更加突出。在線教學(xué)平臺由于具有課程教學(xué)資源豐富、學(xué)習(xí)時間和學(xué)習(xí)方式靈活等特點,能較好地適應(yīng)高職院校擴招學(xué)生的學(xué)習(xí)需求,因此眾多高職院校將在線教學(xué)平臺運用到社會擴招學(xué)生的教育教學(xué)過程中。但是在線教學(xué)平臺在實際應(yīng)用中,存在著一些共性的問題,例如教師和學(xué)生缺乏互動,教師無法準(zhǔn)確掌握學(xué)生的學(xué)習(xí)狀態(tài),不能對學(xué)生進(jìn)行個性化輔導(dǎo);寬松的學(xué)習(xí)環(huán)境容易導(dǎo)致部分學(xué)生不能規(guī)律性地完成課程學(xué)習(xí),存在突擊學(xué)習(xí)的情況,學(xué)習(xí)效果不好。因此,對在線教學(xué)平臺中大量學(xué)生在線學(xué)習(xí)行為數(shù)據(jù)進(jìn)行挖掘和分析,可以促進(jìn)教師優(yōu)化在線教學(xué)資源的設(shè)置,改進(jìn)在線教學(xué)方法,提升學(xué)生在線學(xué)習(xí)的效率和效果。本文將構(gòu)建基于K-Means算法的學(xué)生在線學(xué)習(xí)行為分析模型,通過分析在線教學(xué)平臺中的學(xué)生學(xué)習(xí)行為數(shù)據(jù),建立學(xué)生學(xué)習(xí)行為與學(xué)習(xí)狀態(tài)之間的關(guān)系模型,幫助教師更好地掌握學(xué)生在線學(xué)習(xí)的狀況,提高學(xué)生在線學(xué)習(xí)的效率。
K-Means聚類算法具有簡單易行、可擴展等特點,是聚類分析中較為常用的一種算法[1]。它利用迭代求解的方式,通過計算每個對象和各聚類中心距離的方法,將對象劃歸到與之距離最短的聚類中心,每次迭代結(jié)束后,聚類中心都會根據(jù)當(dāng)前聚類中的所有對象被重新計算,直到所有對象中沒有被再次重新分配到不同聚類的對象(或小于指定的閾值),聚類中心無變化(或小于指定的閾值)。K-Means算法的流程[2]如表1所示。
表1K-Means算法流程
(一)社會擴招學(xué)生在線學(xué)習(xí)行為數(shù)據(jù)采集及預(yù)處理。通過某職業(yè)技術(shù)學(xué)院在線教學(xué)平臺為2019級社會擴招學(xué)生開設(shè)的教學(xué)課程,對學(xué)生的在線學(xué)習(xí)行為數(shù)據(jù)進(jìn)行采集,獲得了學(xué)生學(xué)習(xí)各門線上課程時的所有訪問與操作信息以及課程的考核成績信息。學(xué)生在線學(xué)習(xí)行為的具體屬性比較多,包括學(xué)員課時學(xué)習(xí)記錄、觀看視頻記錄、作業(yè)完成情況、查詢搜索課程資料、查詢話題列表、發(fā)布話題、回答話題、筆記記錄、瀏覽課程公告等,每個具體的學(xué)習(xí)行為屬性字段結(jié)構(gòu)都比較復(fù)雜,例如學(xué)生的課時學(xué)習(xí)記錄的數(shù)據(jù)表結(jié)構(gòu)如表2所示,因此首先要對每個學(xué)習(xí)行為數(shù)據(jù)進(jìn)行第一步分析和篩選,去除不需要的字段,保留必要字段。上述學(xué)員課時學(xué)習(xí)記錄行為數(shù)據(jù)可以只留下userId、courseId和learnTime,即學(xué)員ID、課程ID和學(xué)習(xí)時間。最后為了確保數(shù)據(jù)的完整性、一致性,再使用自然語言處理技術(shù)來對原始數(shù)據(jù)進(jìn)行預(yù)處理,
將經(jīng)過文本預(yù)處理后的數(shù)據(jù),以結(jié)構(gòu)化的形式存儲在數(shù)據(jù)庫中,便于后續(xù)的分析和處理[3]。
表2 學(xué)員課時學(xué)習(xí)記錄字段
(二)社會擴招學(xué)生在線學(xué)習(xí)行為分析?;贙-Means的社會擴招學(xué)生在線學(xué)習(xí)行為分析過程分為分析聚類階段和行為類別判斷階段,分析過程如圖1所示。
圖1 基于K-Means的社會擴招學(xué)生在線學(xué)習(xí)行為分析過程
1.分析聚類階段。本次研究抽取了某職業(yè)技術(shù)學(xué)院2019級887名社會擴招學(xué)生1個完整學(xué)期的在線教學(xué)平臺《計算機應(yīng)用基礎(chǔ)》課程學(xué)習(xí)行為數(shù)據(jù),首先經(jīng)過初步預(yù)處理后存儲在數(shù)據(jù)庫中,利用數(shù)據(jù)挖掘技術(shù)與學(xué)生的成績關(guān)系進(jìn)行相關(guān)性分析,從而發(fā)現(xiàn)并選取與成績正相關(guān)較大的屬性特征。經(jīng)過分析,我們保留了課時學(xué)習(xí)記錄、觀看視頻記錄、作業(yè)完成情況、發(fā)布話題、回答話題、查詢話題列表6個特征屬性,作為社會擴招學(xué)生在線學(xué)習(xí)行為特征的研究屬性,形成了待評價的學(xué)生學(xué)習(xí)行為特征數(shù)據(jù)集,然后再選取不同的K值,利用K-Means聚類算法對學(xué)生的學(xué)習(xí)行為特征數(shù)據(jù)進(jìn)行多次聚類分析,本例中當(dāng)K=4時聚類效果較好,最終將2019級在線學(xué)習(xí)《計算機應(yīng)用基礎(chǔ)》這門課程的社會擴招學(xué)生劃分為4種類型的學(xué)習(xí)群體,我們分別用ABCD進(jìn)行表示。具體情況如下:
A類學(xué)生人數(shù)最多(517人),占總體學(xué)員總數(shù)的58.29%,這部分學(xué)生基本都能完成課程學(xué)時學(xué)習(xí),作業(yè)完成度較高,但是互動環(huán)節(jié)比較欠缺,尤其是主動發(fā)布話題和回答話題的積極性不高,學(xué)習(xí)成績大部分處于中等水平,我們把他們標(biāo)注為被動學(xué)習(xí)型。
B類學(xué)生有115人,占比僅次于A類學(xué)生,標(biāo)注為主動學(xué)習(xí)型。這個類型的學(xué)生不僅能完成課程學(xué)習(xí)和作業(yè),同時會經(jīng)常瀏覽和查詢論壇中的各類話題,但是主動發(fā)布話題的積極性不高,學(xué)習(xí)成績大部分處于中等偏上水平。
C類學(xué)生標(biāo)注為學(xué)習(xí)落后型,他們的特點是能勉強完成基本的課程學(xué)時學(xué)習(xí),觀看視頻記錄較差,作業(yè)完成度較低,幾乎不參與任何互動環(huán)節(jié),學(xué)習(xí)成績基本上都比較差。
D類學(xué)生人數(shù)最少,我們標(biāo)注為學(xué)習(xí)積極型,這一類學(xué)生大部分能做到反復(fù)觀看教學(xué)視頻,高質(zhì)量完成作業(yè),積極參與話題的互動,尤其是能主動發(fā)布話題,積極回答其他同學(xué)提出的各類問題,他們的學(xué)習(xí)成績大都能達(dá)到優(yōu)秀等級。
2.行為類別判斷階段。首先提取需要判斷的某個學(xué)生《計算機應(yīng)用基礎(chǔ)》課程近一個學(xué)習(xí)周期的學(xué)習(xí)行為數(shù)據(jù),經(jīng)過初步預(yù)處理后選取和上一步分析聚類階段相同6個特征屬性,再計算該學(xué)生的學(xué)習(xí)行為特征數(shù)據(jù)與上一步得到的4個聚類中心的距離,將與之最近的聚類類型定義為該學(xué)生當(dāng)前的學(xué)習(xí)行為類型。根據(jù)這個學(xué)習(xí)行為類別的判斷結(jié)果,教師可以掌握學(xué)生的在線學(xué)習(xí)狀況,對于B和D類型的學(xué)生,他們的學(xué)習(xí)習(xí)慣和學(xué)習(xí)狀態(tài)只需要繼續(xù)保持即可,對于A類學(xué)生教師要加強與他們的互動,提升他們主動學(xué)習(xí)的積極性,對于C類學(xué)生,教師則需要經(jīng)常提醒他們增加在線學(xué)習(xí)時間、提升學(xué)習(xí)效率,必要時要對他們進(jìn)行學(xué)情預(yù)警,防止這部分學(xué)生不能按時、按要求完成課程學(xué)習(xí)。
為了幫助教師更好地掌握高職院校社會擴招學(xué)生在線學(xué)習(xí)行為狀態(tài),本文提出了基于K-Means的社會擴招學(xué)生在線學(xué)習(xí)行為分析模型,該模型能根據(jù)學(xué)生在線學(xué)習(xí)的歷史數(shù)據(jù),幫助教師分析和掌握學(xué)生的學(xué)習(xí)行為狀態(tài),以便及時調(diào)整課程在線教學(xué)方法,提升學(xué)生的在線學(xué)習(xí)效率。