聶志成 蔣志輝
(1.湖南科技學院 教學質(zhì)量管理處,湖南永州 425199;2.長沙師范學院 信息科學與工程學院,湖南長沙 410100)
隨著信息技術與教育的深度融合的持續(xù)推進與迅速發(fā)展,層出不窮的教育教學理論和技術被運用到教學過程的指導中來。建構主義學習理論指出新的教學模式應該以學生為中心,學生不能僅僅作為外部刺激的接受者和知識的灌輸對象,學生應該有能力主動加工信息,成為知識意義的建構者[1]。為了使學生的成為課堂的真正“主人”,教學者就需要改變傳統(tǒng)的講授式、灌輸式的教學方式。作為混合學習中被運用的最多的教學模式之一,協(xié)作學習越來越多地被廣泛地應用到E-learning 和傳統(tǒng)課堂教學中。協(xié)作學習是以現(xiàn)代社會心理學、教育社會學、認知心理學等為基礎,以協(xié)調(diào)與調(diào)適教學中的人際關系為基點,以目標設計為先導,以師生、師師、生生合作為動力,以小組為基本活動方式,以團體成績?yōu)樵u價標準,以標準參照評價為基本手段,旨在提高學習成績、改善班級氣氛、形成良好的心理品質(zhì)和社會技能,極富創(chuàng)意與實效的教學理論與策略體系[2]。作為一種教學理論和策略體系,學習者參與協(xié)作學習的學習成效已經(jīng)被眾多研究證明要超越于傳統(tǒng)的、個人的學習方式[3]。
在協(xié)作學習開展的過程中,教學者會給學習小組提出一個問題或者一項任務由學習小組依靠團隊的力量來完成。相較于傳統(tǒng)的個人學習模式,協(xié)作學習要求小組成員在學習中扮演不同的角色,在其交流、協(xié)作、對話中通過貢獻自己的“觀點”、陳述自己的思想、共同完成最終學習任務[4-5]。因此,對于協(xié)作學習,小組成員之間的合作對于最后學習的成效將起著決定性的影響。為了提升小組成員之間的合作效率以及小組協(xié)作學習最終成效。國內(nèi)外眾多研究者展開了對于協(xié)作學習分組策略的實驗研究。相關研究成果對于改善E-learning 中協(xié)作學習的分組策略提供了非常重要的參考價值。但是現(xiàn)存有關協(xié)作學習分組策略的研究大多數(shù)是針對E-learning 開展的,網(wǎng)絡課程與課堂教學在收集學習者的數(shù)據(jù)時有所不同,前者可以利用網(wǎng)絡學習平臺收集學習者的“事實型”數(shù)據(jù),例如性別、年齡、興趣愛好等等,以及“行為型”數(shù)據(jù),例如學習日期、學習內(nèi)容、學習持續(xù)時間等等。而在課堂教學中,教師缺少相應的條件來收集學習者的數(shù)據(jù)信息。因此,教師如何在協(xié)作學習理論和學習風格理論雙重指導下,科學獲取并分析學習者的學習風格數(shù)據(jù)便成為了問題解決的關鍵所在。本文針對上述問題從數(shù)據(jù)挖掘的視角出發(fā),根據(jù)Dunn 學習風格理論設計學習者學習風格調(diào)查問卷來收集所需數(shù)據(jù)[6],并應用k-means 聚類算法和層次聚類算法相結合的方式對學習者學習風格數(shù)據(jù)進行分析,最后得出學習者分類結果。為了驗證該分類策略的有效性,本文將H 師范大學教育技術學專業(yè)2016 級的46 名本科生作為研究對象來開展協(xié)作學習分組策略研究。
協(xié)作學習作為一種重要的教學策略,不僅對于改變課堂教學中的師生關系、生生關系有著十分重要的意義,更對提升學習績效有著積極影響。但是與此同時,每一個學生個體都有不一樣的學習風格,將不同風格的學習者組織在一起開展協(xié)作學習必定會產(chǎn)生不一樣的學習結果。因此,教學者在選擇開展協(xié)作學習時,需要對不同學習者的不同學習風格展開分析與研究,選擇或設計合適的協(xié)作學習分組策略以保證最佳的學習效果。
作為協(xié)作學習教學模式開展的首要環(huán)節(jié),協(xié)作學習小組的分組策略近些年受到眾多研究者的重視。Yi-Chun Chan 等人提出一種由改善的k-NN 算法和GA 算法相結合的機制,來對學習者的學習風格進行識別與分類[7]。唐杰等的研究在分析伙伴模型研究的基礎上,綜合學習者個性特征和 mCSCL中的學習的特殊性構建了mCSCL 環(huán)境下協(xié)作分組的伙伴模型[8]。李浩君等提出了一種基于 KNN 的mCSCL 學習伙伴分組理論,為移動端在線學習者動態(tài)推薦最佳學習伙伴[9]。胡慧等提出基于學習能力、興趣愛好和理解水平的,基于改進蟻群算法的協(xié)作學習分組算法[10]。馬艷云等根據(jù)網(wǎng)絡協(xié)作學習者的個性化特征和協(xié)作特征在引入團隊協(xié)作學習量表解決學生協(xié)作能力判斷的前提下,提出基于學習者特征聚類和協(xié)作特征選擇的GSDBK-means 分組算法對學習者進行分組,以期達到提高網(wǎng)絡協(xié)作學習效果的目的[11]。
聚類分析簡稱聚類,是一個把數(shù)據(jù)對象劃分成子集的過程,而每個子集是一個簇,并且同一個簇中的對象彼此相似,但與其他簇中的對象不相似[12]。聚類分析已經(jīng)廣泛地應用于許多領域:在商務智能應用中,聚類可以用來把大量客戶分組,其中組內(nèi)的客戶具有非常類似的特征;在圖像識別應用中,聚類可以在手寫字符識別系統(tǒng)中發(fā)現(xiàn)簇或“子類”;在Web 搜索應用中,聚類可以將搜索結果分組,乃至把 Web 文檔聚類成一個文檔主題;在E-learning 應用中,聚類通??梢杂脕硗诰蜻h程學習者的群體特點,進而基于此為課程資源建設及教學過程的改進提供思考與幫助。
同時,聚類算法也有很多,通常很難通過一個簡潔的分類去區(qū)別其運用到方法與策略,這是因為這些類別在分析中可能開成重疊,進而在表述過程中的一種方法往往具有多類另的特征的涵蓋。一般而言,主要的基本聚類方法可以歸納為劃分方法、層次方法、基于密度的方法和基于網(wǎng)格的方法等四大類,其各自的特點如表1 所示。
表1 聚類方法一般特點描述
在數(shù)據(jù)挖掘過程中,網(wǎng)絡課程與傳統(tǒng)課堂教學在收集學習者的學習風格數(shù)據(jù)時有所不同,前者可以利用網(wǎng)絡學習平臺收集學習者的“事實型”數(shù)據(jù);后者由于傳統(tǒng)課堂教學實施過程受其環(huán)境的影響,常常很難借助網(wǎng)絡平臺來收集學習者的一些行為數(shù)據(jù)信息。為保證研究的所有本文采集調(diào)查問卷的方式收集學習者的數(shù)據(jù)信息,其好處有兩點:一是該方式簡單、便捷、效率高、可操作性強,二是該方式收集的數(shù)據(jù)比較完整,臟數(shù)據(jù)和噪聲數(shù)據(jù)很少,這為接下來的數(shù)據(jù)預處理打開了方便之門。而對于數(shù)據(jù)預處理過程,本文主要對收集到的原始數(shù)據(jù)進行數(shù)據(jù)變換。最后,本文利用k-means 聚類算法和基于層次的聚類算法分別對預處理后的數(shù)據(jù)進行聚類分析,這將為教學者提供精準教學策略,制定學習者的個性化、差異化學習策略,尤其是為教學過程中實施小組合作學習進行分組(分層)策略提供了重要的參考依據(jù)與實踐借鑒。
數(shù)據(jù)挖掘的成功與否,數(shù)據(jù)準備情況起到了至關重要的作用與影響。數(shù)據(jù)準備受多方面影響:一是所需處數(shù)據(jù)來源于不同數(shù)據(jù)源,如何確保不同數(shù)據(jù)源中數(shù)據(jù)的綜合性、質(zhì)量、時效性、及易用性,其處理方式可能就要牽涉到數(shù)據(jù)倉庫的相關技術與思想;另一方面就是受限于數(shù)據(jù)挖掘者對工具的使用及數(shù)據(jù)的分析經(jīng)驗。譬如如何從紛繁復雜的數(shù)據(jù)中厘清數(shù)據(jù)間的關系,并從這些關系中聚合、衍生出對研究有意義的指標[12]。Dunn 學習風格理論認為學習風格的形成受多層面多種因素的影響(具體如表 2 所示)。故而本研究設計的調(diào)查問卷共有30 個問題,其中每一個要素成分對應一或兩個問題,并且每一個問題有 A、B、C 三個選項(如表3所示)。
表2 學習風格構成要素
表3 學習風格調(diào)查問卷
本研究的調(diào)查對象是H 師范大學教育技術學專業(yè)2016 年級在校本科生,共發(fā)放46 份調(diào)查問卷,回收問卷43 份,回收率為93.5%,其中有效問卷43 份,有效率為100%。
低質(zhì)量的數(shù)據(jù)將導致低質(zhì)量的挖掘結果,而現(xiàn)實中數(shù)據(jù)極易受到噪聲、缺失值和不一致數(shù)據(jù)的侵擾,因此數(shù)據(jù)預處理是數(shù)據(jù)挖掘必不可少的一個階段,其能提高數(shù)據(jù)質(zhì)量,從而提高挖掘的準確率和效率。數(shù)據(jù)預處理主要有數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)歸約和數(shù)據(jù)變換四個步驟。數(shù)據(jù)預處理的每個步驟都有各自不同任務,本文結合了收集到的原始數(shù)據(jù)特點,對原始數(shù)據(jù)進行數(shù)據(jù)變換以及主成分分析。
(1)數(shù)據(jù)變換
表4 原始數(shù)據(jù)表
表5 數(shù)據(jù)變換后的數(shù)據(jù)表
從表 4 可知,每一個數(shù)據(jù)元組S 有30 個屬性,分別為 A1、A2、A3、……、A10、A29、A30,屬性 A取 值 的 集 合 為 {a,b,c} , 即 是 Si=(A1,A2,A3,……,A10,A29,A30),其中 i={1,2,3,4, ……,43}。換句話說,每一個調(diào)查問卷的問題A 有a、b、c 三個選項。由于聚類算法需要用到屬性 A 的值進行計算,但是a、b、c 為不是具體的值,無法滿足計算的要求,因此本文把集合{a,b,c}賦予具體的等差數(shù)列集合{1,2,3},最后把原始數(shù)據(jù)表中數(shù)據(jù)值a、b、c 一一對應變換成1、2、3,具體如表5 所示。
(2)主成分分析
主成分分析(PCA)就是試圖在力保數(shù)據(jù)信息丟失最少的原則下,對這種多變量的數(shù)據(jù)表進行最佳綜合簡化,也就是說,對高維變量空間進行降維處理,其基本過程是:①為了消除不同變量在數(shù)量級和量綱上的差異,將原始數(shù)據(jù)進行標準化處理;②求標準化數(shù)據(jù)矩陣的相關矩陣;③求相關矩陣的特征值和特征向量;④根據(jù)特征值計算方差貢獻率與累計方差貢獻率,根據(jù)前幾個主成分累計方差貢獻率大于 80%的原則,確定主成分 C1、C2……Cm;⑤構建綜合評價函數(shù);⑥根據(jù)綜合評價函數(shù)計算總得分,然后排序并評價。從圖1 可以看得,前10 個主成分的累積方差貢獻率所占的比重比較大,同時結合計算分析每個成分的特征值(如圖2 所示),發(fā)現(xiàn)前14 個成分累計方差貢獻率81%,因此原始數(shù)據(jù)可以進行維歸約為前 14 個主要成分,即 Si=(A1,A2,A3,……,
圖1 主成分分析碎石圖
A12,A13,A14)。這也進一步表明學習者得學習風格主要受到環(huán)境、情感、社會這三個刺激層面的影響。
圖2 成分特征值
(1)用k-means聚類分析查看數(shù)據(jù)對象的區(qū)域分布
k 均值(k-means)聚類又稱為動態(tài)聚類,其計算的原理與方法都較為簡單。因為無需進行距離矩陣輸入。即首先根據(jù)分析進行聚類的分類個數(shù)(N)的指定,然后就可以隨機選擇N 個樣本作為初始中心,通過計算、分析各樣本與其類中心間的距離來進行歸類,將所有的樣本都按此方法進行計算分析歸類。最后再將此過程進行重復,直到類中心不同發(fā)生變化,趨于相對穩(wěn)定。由此觀之,k-means 聚類一個關鍵點是是確定聚類的分類個數(shù)N。
圖3 樣本熱圖
圖4 k-means 聚類效果圖
在本研究中,我們首先從數(shù)據(jù)中提取 10 個變量的樣本數(shù)值,進行其歐氏距離矩陣的要相關計算,然后根據(jù)其計算機結果可以對其進行矩陣熱圖的繪制(如圖3 所示),從圖3 中可以看到顏色越深表示樣本間距離越近,大致上可以區(qū)分出四到五個區(qū)塊,即 N={4,5}。由于輪廓系數(shù)(silhouette coefficient)方法結合了凝聚度和分離度,因此可以以此來判斷聚類的優(yōu)良性,其值在-1 到+1 之間取值,值越大表示聚類效果越好。依據(jù)這個原理,本文用四個簇參量和五個簇參變量,反復計算在每個簇個數(shù)條件下的輪廓系數(shù),當輪廓系數(shù)取最大時,其相應的簇個數(shù)是最好的。
表6 學習風格調(diào)查問卷
經(jīng)過輪廓系數(shù)的計算,如表 6 所示,本文取N=4,也就是說把數(shù)據(jù)集分為四個子簇,為了進一步顯示聚類的效果,結合研究過程中的多維標度和聚類的結果,先將數(shù)據(jù)用 MDS 進行降維,然后采用不同的形狀對原本的分類進行標注,對聚類的結果也用不同的顏色來予以區(qū)分顯示(如圖 4 所示)。從圖4 可知,聚類結果很清晰,但是也可發(fā)現(xiàn)在簇1、3、4 上的有交集,這充分表明交集上的點所代表的學習者學習風格具有多變性,也進一步說明這部分學習者的學習風格更容易受到各種內(nèi)外因素影響。
(2)使用層次聚類對數(shù)據(jù)對象進行分組
層次聚類可以將數(shù)據(jù)對象組成層次結構或簇的“樹”使得數(shù)據(jù)對象的隱藏部分特征顯化,如數(shù)據(jù)對象是小簇(該簇中所有數(shù)據(jù)對象可以視為離群點)。本研究利用層次聚類對數(shù)據(jù)對象進行分組,這對為一些學習者制定個性化的學習策略,以及優(yōu)化教師的教學策略,特別是課堂教學中小組合作學習的分組策略,有著重要的指導性意義。在課堂中開展小組合作學習時,教師往往需要根據(jù)不同的學習任務采取同質(zhì)分組策略和異質(zhì)分組策略進行分組[13]。同質(zhì)分組是異質(zhì)分組的基礎,而層次聚類能為同質(zhì)分組提供參考,故而在本文中,層次聚類把數(shù)據(jù)對象分成4 個簇,如圖5 所示,每個簇即是一個同質(zhì)的分組。但是,每個簇的大小不一致,所以我們又可以對大的簇(簇2、簇3、簇4)進行拆分小簇。質(zhì)言之,也就是可以將學習者較多的同質(zhì)學分組進行拆分。
圖5 層次聚類樹狀圖
Kolb 根據(jù)學習者對學習環(huán)節(jié)的偏愛程度認為有四種主導的學習風格類型,它們分別是:以抽象概括和主動實驗為主的聚合思維型,以具體經(jīng)驗和反思性觀察為主的發(fā)散思維型,以反思性觀察和抽象的概括為主的同化型和以主動的實驗和具體經(jīng)驗為主的順應型[14]。因此,依據(jù)Kolb 學習風格理論[14],上述的 k-means 聚類和層次聚類把學習風格數(shù)據(jù)對象分成四個簇,即分成四種類型的學習風格小組,是合理的、科學的。
學習者的學習風格受眾多因素的影響,而且各因素對其影響程度也存在明顯迥異,從而到使在選擇學習風格分析量表時,存在很大程度的主觀性和隨意性?;诖?,本研究在先前研究的基礎之上,結合數(shù)據(jù)挖掘中的聚類分析來展開對學習者學習風格的分析與探討,并確定了影響學習者學習風格的主要刺激層面因素,也間接地解決了當下課堂教學中開展小組合作(協(xié)作)學習的分組隨意性等客觀現(xiàn)實問題。這不僅是對具體教育情境的直面回應,更是展現(xiàn)大數(shù)據(jù)時代背景下信息技術與課堂教學有機融合的典型應用。誠然,研究中還存在一些問題值得商榷,如數(shù)據(jù)來源單一、數(shù)據(jù)量較少以及聚類效率較低等研究問題,致使研究結果的普適性與成果推廣還需展開更深層次的思考。因此,在后續(xù)的研究中將會拓寬數(shù)據(jù)收集的渠道,并在數(shù)據(jù)分析手段上將采用高維度聚類算法提高聚類的質(zhì)量與水平。為實現(xiàn)更為有效地協(xié)作學習分組提供完善的數(shù)據(jù)支撐,進而為提升學習者協(xié)作學習體檢與感知奠定基礎,滿足學習者和教師的個性化需求,為打造優(yōu)質(zhì)協(xié)作學習分組策略提供支持。