王改花 傅鋼善
【摘要】網(wǎng)絡(luò)學(xué)習(xí)已成為互聯(lián)網(wǎng)+時(shí)代教育發(fā)展的重要組成,如何對(duì)網(wǎng)絡(luò)學(xué)習(xí)者的學(xué)習(xí)行為與成績(jī)進(jìn)行預(yù)測(cè),依據(jù)預(yù)測(cè)結(jié)果實(shí)施學(xué)業(yè)預(yù)警,并為教學(xué)決策提供依據(jù),是網(wǎng)絡(luò)教育需要解決的問(wèn)題之一,也是教育大數(shù)據(jù)研究的重要問(wèn)題。本研究采用數(shù)據(jù)挖掘技術(shù)中的決策樹(shù)方法對(duì)網(wǎng)絡(luò)學(xué)習(xí)者的學(xué)習(xí)行為與成績(jī)進(jìn)行了預(yù)測(cè),構(gòu)建了適應(yīng)性學(xué)習(xí)系統(tǒng)學(xué)習(xí)干預(yù)模型,研究發(fā)現(xiàn)總成績(jī)不及格的最高概率是男生、學(xué)習(xí)時(shí)間跨度表現(xiàn)較差的最高概率是碩士生、學(xué)習(xí)總時(shí)長(zhǎng)表現(xiàn)較差的最高概率是男生、平均每次在線(xiàn)學(xué)習(xí)停留時(shí)長(zhǎng)表現(xiàn)較差的最高概率是男理科生、討論交流表現(xiàn)較差的最高概率是藝術(shù)生、學(xué)習(xí)筆記表現(xiàn)較差的最高概率是女藝術(shù)生、接受反饋數(shù)量較高的最高概率是男生。
【關(guān)鍵詞】? 決策樹(shù);數(shù)據(jù)挖掘;網(wǎng)絡(luò)學(xué)習(xí);學(xué)習(xí)行為;學(xué)習(xí)成績(jī);學(xué)習(xí)干預(yù);適應(yīng)性學(xué)習(xí);學(xué)業(yè)預(yù)警;教學(xué)決策
【中圖分類(lèi)號(hào)】? G434? ? ? 【文獻(xiàn)標(biāo)識(shí)碼】? A? ? ? 【文章編號(hào)】 1009-458x(2019)2-0039-10
一、引言
截至2017年12月,中國(guó)在線(xiàn)教育用戶(hù)規(guī)模達(dá)1.55億,較2016年底增加1,754萬(wàn)人,年增長(zhǎng)率為18.8%;在線(xiàn)教育使用率為20.1%,年增長(zhǎng)率為12.7%(中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心, 2018)。網(wǎng)絡(luò)學(xué)習(xí)已成為互聯(lián)網(wǎng)+時(shí)代教育發(fā)展的重要組成。《教育信息化“十三五”規(guī)劃》明確指出,依托網(wǎng)絡(luò)學(xué)習(xí)空間逐步實(shí)現(xiàn)對(duì)學(xué)生日常學(xué)習(xí)情況的大數(shù)據(jù)采集和分析,優(yōu)化教學(xué)模式(中華人民共和國(guó)教育部, 2016)。目前關(guān)于教育大數(shù)據(jù)的研究與實(shí)踐正處于起步探索階段,推進(jìn)教育大數(shù)據(jù)普及應(yīng)用是當(dāng)前的研究熱點(diǎn)。教育大數(shù)據(jù)研究與實(shí)踐一方面對(duì)掌握教育發(fā)展現(xiàn)狀、制定科學(xué)教育政策、配置合理的教育資源等具有重要意義;另一方面對(duì)實(shí)現(xiàn)個(gè)性化學(xué)習(xí)、優(yōu)化教學(xué)、多元學(xué)業(yè)評(píng)價(jià)、實(shí)時(shí)學(xué)習(xí)預(yù)警等具有重要意義。如何對(duì)網(wǎng)絡(luò)學(xué)習(xí)者的學(xué)習(xí)行為與成績(jī)進(jìn)行預(yù)測(cè),依據(jù)預(yù)測(cè)結(jié)果實(shí)施學(xué)業(yè)預(yù)警,并為教學(xué)決策提供依據(jù),是網(wǎng)絡(luò)教育需要解決的問(wèn)題之一(徐鵬, 等, 2013; Macfadyen & Dawson, 2010),也是教育大數(shù)據(jù)研究的重要問(wèn)題(Kostopoulos, et al., 2017)。數(shù)據(jù)挖掘是大數(shù)據(jù)采集和分析的重要技術(shù)手段。
二、研究綜述
對(duì)采用數(shù)據(jù)挖掘方法預(yù)測(cè)網(wǎng)絡(luò)學(xué)習(xí)者學(xué)習(xí)表現(xiàn)的研究進(jìn)行分析,可發(fā)現(xiàn)如下特點(diǎn):第一,已有研究主要采用決策樹(shù)、回歸分析、神經(jīng)網(wǎng)絡(luò)、樸素貝葉斯、支持向量機(jī)、時(shí)序分析、聚類(lèi)等算法,其中決策樹(shù)與回歸分析用得最多。第二,研究?jī)?nèi)容主要集中在成績(jī)預(yù)測(cè)理論模型的構(gòu)建、成績(jī)預(yù)測(cè)模型的實(shí)證研究、算法準(zhǔn)確性的對(duì)比、算法的開(kāi)發(fā)、預(yù)警因素研究、綜述研究等。關(guān)于成績(jī)預(yù)測(cè)理論模型的構(gòu)建,這類(lèi)研究主要采用數(shù)據(jù)挖掘技術(shù)從理論上構(gòu)建成績(jī)預(yù)測(cè)模型(Ohia, 2011;武法提, 2016; 王林麗, 等, 2016; 牟智佳, 等, 2017a);關(guān)于成績(jī)預(yù)測(cè)模型的實(shí)證研究,這類(lèi)研究主要開(kāi)發(fā)成績(jī)預(yù)測(cè)系統(tǒng)或?qū)崿F(xiàn)成績(jī)預(yù)測(cè)模型,并將其應(yīng)用于教學(xué)實(shí)踐中(Macfadyen & Dawson, 2010; Xing, et al., 2015; 馬杰, 等, 2014; 王亮, 2015; 孫力, 等, 2015, 2016; 陳子健, 等, 2017);關(guān)于算法準(zhǔn)確性的對(duì)比研究,這類(lèi)研究主要是通過(guò)對(duì)比幾種不同的預(yù)測(cè)算法,來(lái)發(fā)現(xiàn)預(yù)測(cè)準(zhǔn)確性最高的算法(Kostopoulos, et al., 2017; Romero, et al., 2013; Costa, et al., 2017; 牟智佳, 等, 2017b);關(guān)于算法開(kāi)發(fā),這類(lèi)研究主要是結(jié)合幾種數(shù)據(jù)挖掘的算法構(gòu)建一種集成分類(lèi)器,從而提升分類(lèi)的準(zhǔn)確性(Kotsiantis, et al., 2010; Huang & Fang, 2013);關(guān)于預(yù)警因素研究,這類(lèi)研究主要是探索哪些屬性和因素能夠較好地預(yù)測(cè)學(xué)習(xí)者學(xué)習(xí)績(jī)效(Romero, et al., 2013; Pursel, et al., 2016; Barba, et al., 2016; 傅鋼善, 等, 2014; 趙慧瓊, 等, 2017; 牟智佳, 等, 2017b);關(guān)于綜述研究,這類(lèi)研究主要是對(duì)基于數(shù)據(jù)挖掘的學(xué)習(xí)預(yù)警研究進(jìn)行文獻(xiàn)綜述(肖巍, 等, 2018)。第三,研究工具主要是Weka,其次還有SPSS、SQL Sever 2008 Data Mining、SSAS等。第四,使用的預(yù)測(cè)分析變量主要有人口學(xué)變量、個(gè)人背景信息、學(xué)習(xí)行為參與變量,用這些變量來(lái)預(yù)測(cè)學(xué)習(xí)者的總成績(jī)(通過(guò)或未通過(guò)),對(duì)學(xué)習(xí)者行為表現(xiàn)的預(yù)測(cè)相對(duì)較少。第五,研究對(duì)象主要是大學(xué)生,數(shù)量大多數(shù)是介于100~500人之間,數(shù)量相對(duì)較小。第六,研究正處于起步階段,是未來(lái)重要的研究領(lǐng)域,但國(guó)內(nèi)研究與國(guó)外研究相比,國(guó)內(nèi)研究相對(duì)起步要晚,研究的廣度與深度有待加強(qiáng)。因此本研究采用數(shù)據(jù)挖掘技術(shù)中的決策樹(shù)方法對(duì)網(wǎng)絡(luò)學(xué)習(xí)者的學(xué)習(xí)行為與成績(jī)進(jìn)行預(yù)測(cè),設(shè)計(jì)適應(yīng)性學(xué)習(xí)系統(tǒng)學(xué)習(xí)干預(yù)模型,以期為教師了解學(xué)習(xí)者的群體特征與改善教學(xué)決策提供數(shù)據(jù)依據(jù),同時(shí)為適應(yīng)性推送服務(wù)和有效學(xué)習(xí)提供理論基礎(chǔ)。
三、研究方法
(一)研究對(duì)象
自2002年以來(lái),“現(xiàn)代教育技術(shù)”大規(guī)模在線(xiàn)開(kāi)放課程與時(shí)俱進(jìn)、不斷更新,先后以國(guó)家精品網(wǎng)絡(luò)課程、國(guó)家精品資源共享課、中國(guó)大學(xué)MOOC、國(guó)家精品在線(xiàn)開(kāi)放課程等多種形式的大規(guī)模在線(xiàn)開(kāi)放課程開(kāi)展網(wǎng)絡(luò)學(xué)習(xí)。2017年被認(rèn)定為首批國(guó)家精品在線(xiàn)開(kāi)放課程。課程豐富的特色資源,靈活多樣的教學(xué)方法和行之有效的學(xué)習(xí)活動(dòng),受到學(xué)習(xí)者的普遍好評(píng)。
本研究對(duì)象為2012~2013學(xué)年第二學(xué)期參加“現(xiàn)代教育技術(shù)”在線(xiàn)開(kāi)放課程學(xué)習(xí)的陜西師范大學(xué)2,687名大三師范類(lèi)本科生和210名教育碩士,共計(jì)2,897名。在實(shí)際學(xué)習(xí)過(guò)程中,有56名學(xué)習(xí)者由于種種原因沒(méi)有成功注冊(cè)參與在線(xiàn)開(kāi)放課程的學(xué)習(xí),因此有效學(xué)習(xí)人數(shù)為2,841名。通過(guò)前期數(shù)據(jù)清洗(即處理原始數(shù)據(jù)中的噪聲數(shù)據(jù)、無(wú)關(guān)數(shù)據(jù)、缺失值、臟數(shù)據(jù)、孤立點(diǎn)等),研究對(duì)象共剩余2,801名,其中性別分布為943名男生,1,858名女生;學(xué)科背景分布為1,399名理科生,995名文科生,407名藝術(shù)生;學(xué)歷分布為2,657名本科生,144名碩士。為了確保研究結(jié)果的可信,本研究還進(jìn)行了兩次驗(yàn)證,驗(yàn)證結(jié)果與本研究結(jié)果一致,本文呈現(xiàn)的是第一次的驗(yàn)證結(jié)果。
(二)數(shù)據(jù)收集與分析
決策樹(shù)是一種常用的數(shù)據(jù)挖掘分類(lèi)方法,常用于預(yù)測(cè)模型,它通過(guò)將大量數(shù)據(jù)有目的地分類(lèi),從中找到一些具有商業(yè)價(jià)值的、潛在的信息。決策樹(shù)的結(jié)構(gòu),顧名思義,就像一棵樹(shù),它利用樹(shù)結(jié)構(gòu)將數(shù)據(jù)記錄進(jìn)行分類(lèi),樹(shù)的一個(gè)葉節(jié)點(diǎn)就代表某個(gè)條件下的一個(gè)記錄集,根據(jù)記錄字段的不同取值建立樹(shù)的分支;在每個(gè)分支子集中重復(fù)建立下層節(jié)點(diǎn)和分支,便可生成一棵決策樹(shù)(唐華松, 等, 2001)。決策樹(shù)方法的優(yōu)點(diǎn)在于形式簡(jiǎn)單,計(jì)算復(fù)雜度不高,易于實(shí)現(xiàn),輸出結(jié)果易于理解;數(shù)據(jù)的準(zhǔn)備工作簡(jiǎn)單,能夠同時(shí)處理數(shù)據(jù)型和常規(guī)型屬性,在相對(duì)短的時(shí)間內(nèi)能夠?qū)Υ笮蛿?shù)據(jù)源做出可行且效果良好的結(jié)果;易于通過(guò)靜態(tài)測(cè)試來(lái)對(duì)模型進(jìn)行評(píng)測(cè),可以測(cè)定模型可信度(王國(guó)平, 2014, p.142)?;谖墨I(xiàn)綜述與決策樹(shù)的優(yōu)點(diǎn),本研究采用決策樹(shù)方法對(duì)網(wǎng)絡(luò)學(xué)習(xí)行為與成績(jī)進(jìn)行預(yù)測(cè)。
本研究的研究工具為SQL Sever 2008 Data Mining,采用Microsoft SQL Server Analysis Services中的Microsoft決策樹(shù)算法。該算法是一種混合決策樹(shù)算法,支持分類(lèi)與回歸兩種任務(wù),可以對(duì)離散屬性或連續(xù)屬性進(jìn)行預(yù)測(cè)性建模,本研究對(duì)離散屬性進(jìn)行預(yù)測(cè)性建模。數(shù)據(jù)挖掘的過(guò)程為問(wèn)題定義、數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘、模型評(píng)價(jià)。
1. 問(wèn)題定義
本研究采用決策樹(shù)挖掘模型對(duì)不同性別(UserSex,男、女)、不同學(xué)科背景(Department,文科、理科、藝術(shù))、不同學(xué)歷(Edulevel,本科、碩士)的學(xué)習(xí)者群體學(xué)習(xí)行為特征及總成績(jī)進(jìn)行評(píng)估與預(yù)測(cè),以期讓教師能夠更加清晰深入地了解每類(lèi)學(xué)習(xí)者群體的特征,為教育決策提供實(shí)證數(shù)據(jù)依據(jù)。
2. 數(shù)據(jù)準(zhǔn)備
為了建立學(xué)習(xí)者模型,必須收集大量的學(xué)習(xí)者信息數(shù)據(jù),進(jìn)行數(shù)據(jù)預(yù)處理。因此,需要對(duì)模型中所有需要的歷史數(shù)據(jù)進(jìn)行分析和處理,以便充分挖掘出學(xué)習(xí)者的關(guān)鍵行為特征。本研究選取了三類(lèi)特征數(shù)據(jù):①學(xué)習(xí)者基本特征,即學(xué)習(xí)者資料數(shù)據(jù),該特征數(shù)據(jù)集包括2,841條記錄,每條記錄包括21個(gè)特征;②學(xué)習(xí)者行為特征,即學(xué)習(xí)者的學(xué)習(xí)行為特征數(shù)據(jù),該特征數(shù)據(jù)集包含9張表、2,548,709條記錄、137個(gè)行為特征;③學(xué)習(xí)者學(xué)習(xí)效果特征,即學(xué)習(xí)者成績(jī),該特征集包含6張表、55,957條記錄。
3. 數(shù)據(jù)預(yù)處理
數(shù)據(jù)預(yù)處理是數(shù)據(jù)挖掘前期重要的、不可忽視的環(huán)節(jié)。據(jù)統(tǒng)計(jì),在完整的數(shù)據(jù)挖掘過(guò)程中,數(shù)據(jù)預(yù)處理要花費(fèi)60%左右的時(shí)間,而后的挖掘工作僅占總工作量的10%左右(元昌安, 2009, p. 40)。數(shù)據(jù)預(yù)處理主要包括數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)變換、數(shù)據(jù)規(guī)約。通過(guò)數(shù)據(jù)預(yù)處理,本研究提取了9個(gè)特征,分別為學(xué)習(xí)時(shí)間跨度(TotalTime,簡(jiǎn)稱(chēng)TT),即學(xué)習(xí)者從第一次登錄系統(tǒng)到最后一次退出系統(tǒng)的時(shí)間周期;學(xué)習(xí)總時(shí)長(zhǎng)(OnlineMinute,簡(jiǎn)稱(chēng)OM),即學(xué)習(xí)者在該網(wǎng)絡(luò)學(xué)習(xí)平臺(tái)上累積的學(xué)習(xí)時(shí)間長(zhǎng)短;學(xué)習(xí)次數(shù)(LoginNum,簡(jiǎn)稱(chēng)LN),即學(xué)習(xí)者登錄學(xué)習(xí)平臺(tái)的次數(shù);平均每次在線(xiàn)學(xué)習(xí)停留時(shí)長(zhǎng)(AverageTimePerLogin,簡(jiǎn)稱(chēng)ATPL),即學(xué)習(xí)者平均每次學(xué)習(xí)持續(xù)的時(shí)間長(zhǎng)度;重復(fù)學(xué)習(xí)率(KnowledgePerRepeat,簡(jiǎn)稱(chēng)KPR),即學(xué)習(xí)者平均對(duì)每個(gè)知識(shí)點(diǎn)重復(fù)學(xué)習(xí)的次數(shù);討論交流(簡(jiǎn)稱(chēng)BBS),即參與BBS討論交流的特征;學(xué)習(xí)筆記(簡(jiǎn)稱(chēng)Blog),即學(xué)習(xí)者參與數(shù)字學(xué)習(xí)筆記的特征;接收反饋數(shù)量(SmsInfo,簡(jiǎn)稱(chēng)SI),即學(xué)習(xí)者在學(xué)習(xí)過(guò)程中接收督促學(xué)習(xí)信息的數(shù)量;總成績(jī)(ScoreTotal,簡(jiǎn)稱(chēng)ST),即學(xué)習(xí)者學(xué)習(xí)總成績(jī)。
數(shù)據(jù)清洗,即處理原始數(shù)據(jù)中的噪聲數(shù)據(jù)、無(wú)關(guān)數(shù)據(jù)、缺失值、臟數(shù)據(jù)、孤立點(diǎn)等。例如:教育碩士的學(xué)歷信息有誤,通過(guò)SQL語(yǔ)言改正;刪除只注冊(cè)但并未進(jìn)行學(xué)習(xí)的學(xué)習(xí)者信息、交換生與休學(xué)生信息、考試權(quán)限為0的學(xué)習(xí)者信息;刪除教師、其他用戶(hù)(除陜西師范大學(xué))、管理者信息;刪除空缺值信息等。
數(shù)據(jù)集成,即將兩個(gè)或多個(gè)數(shù)據(jù)源中的數(shù)據(jù),存放在一個(gè)一致的數(shù)據(jù)庫(kù)中,重點(diǎn)考慮數(shù)據(jù)一致性和冗余。
數(shù)據(jù)變換,即將數(shù)據(jù)變換為適合于數(shù)據(jù)挖掘的形式。包括數(shù)據(jù)泛化、數(shù)據(jù)規(guī)范化、特征構(gòu)造、數(shù)據(jù)離散化。①數(shù)據(jù)泛化,即使用概念分層,用高層概念替換低層或原始數(shù)據(jù)。本研究對(duì)專(zhuān)業(yè)通過(guò)高層概念學(xué)科背景“理科、文科、藝術(shù)”實(shí)現(xiàn)泛化。文科包括歷史文化學(xué)院、文學(xué)院、外國(guó)語(yǔ)學(xué)院、政治經(jīng)濟(jì)學(xué)院、心理學(xué)院、教育學(xué)院,理科包括化學(xué)化工學(xué)院、計(jì)算機(jī)科學(xué)學(xué)院、旅游與環(huán)境學(xué)院、數(shù)學(xué)與信息科學(xué)學(xué)院、物理學(xué)與信息技術(shù)學(xué)院、生命科學(xué)學(xué)院、新聞與傳播學(xué)院(教育技術(shù)學(xué)專(zhuān)業(yè)),藝術(shù)包括音樂(lè)學(xué)院、美術(shù)學(xué)院、體育學(xué)院。②數(shù)據(jù)規(guī)范化,即將原來(lái)的度量值轉(zhuǎn)換為無(wú)量綱的值。本研究選取最大—最小規(guī)范化,使連續(xù)型數(shù)據(jù)取值范圍為[0-1]。③特征構(gòu)造,即利用已知屬性,構(gòu)造新的屬性,以便更好地刻畫(huà)數(shù)據(jù)的特性,幫助數(shù)據(jù)挖掘過(guò)程。其目的是幫助提高精度和對(duì)高維數(shù)據(jù)結(jié)構(gòu)的理解。但數(shù)據(jù)集的特征維數(shù)并非越高越好,維數(shù)太高容易導(dǎo)致維災(zāi)難,維數(shù)太低又不能有效獲取數(shù)據(jù)集中的重要信息。本研究構(gòu)造的特征包括學(xué)習(xí)時(shí)間跨度(如公式1)、平均每次在線(xiàn)學(xué)習(xí)停留時(shí)長(zhǎng)(如公式2)、重復(fù)學(xué)習(xí)率(如公式3)、討論交流(討論交流與學(xué)習(xí)者的發(fā)主帖數(shù)量、點(diǎn)擊量、被回帖數(shù)量以及回帖數(shù)量、點(diǎn)擊量特征密切相關(guān),且考慮到不同低維特征反映高維特征的重要性不同,為其設(shè)置不同的權(quán)重,如公式4)、學(xué)習(xí)筆記(學(xué)習(xí)筆記與學(xué)習(xí)者的學(xué)習(xí)筆記數(shù)量、更新量、點(diǎn)擊量密切相關(guān),且考慮到不同低維特征反映高維特征的重要性不同,為其設(shè)置不同的權(quán)重,如公式5)、總成績(jī)(總成績(jī)由網(wǎng)上作業(yè)成績(jī)、實(shí)踐技能成績(jī)、網(wǎng)上考試成績(jī)、期末筆試成績(jī)構(gòu)成,如公式6)。④數(shù)據(jù)離散化,決策樹(shù)要求數(shù)據(jù)是分類(lèi)屬性,因此需要對(duì)數(shù)值進(jìn)行離散化。無(wú)監(jiān)督離散化方法主要有等寬離散化、等頻離散化、K均值離散化,K均值性能最好,因此本研究選取K均值離散化方法,結(jié)果如表1、表2所示。
公式1:學(xué)習(xí)時(shí)間跨度=學(xué)習(xí)者最后一次退出平臺(tái)時(shí)間-學(xué)習(xí)者第一次登陸平臺(tái)時(shí)間…(1)
公式2:平均每次在線(xiàn)學(xué)習(xí)停留時(shí)長(zhǎng)=學(xué)習(xí)總時(shí)長(zhǎng)/學(xué)習(xí)次數(shù)…(2)
公式3:重復(fù)學(xué)習(xí)率[=k=0n]學(xué)習(xí)者每個(gè)知識(shí)點(diǎn)重復(fù)學(xué)習(xí)次數(shù)/學(xué)習(xí)者學(xué)習(xí)知識(shí)點(diǎn)總數(shù)…(3)
公式4:討論交流=0.6×(0.4×發(fā)主題帖數(shù)量+0.3×主題帖點(diǎn)擊量+0.3×主題帖被回帖數(shù)量)+0.4×(0.4×回帖數(shù)量+0.6×回帖點(diǎn)擊量)…(4)
公式5:學(xué)習(xí)筆記=0.5×數(shù)量+0.3×更新量+0.2×點(diǎn)擊量…(5)
公式6:總成績(jī)=0.1×網(wǎng)上作業(yè)成績(jī)+0.2×實(shí)踐技能成績(jī)+0.2×網(wǎng)上考試成績(jī)+0.5×期末筆試成績(jī)…(6)
數(shù)據(jù)規(guī)約,即通過(guò)使用編碼或變換,得到原始數(shù)據(jù)的歸約或壓縮表示。例如將在線(xiàn)總時(shí)長(zhǎng)數(shù)據(jù)進(jìn)行無(wú)損歸約,將原始數(shù)據(jù)“005-01-01 17∶09∶03.877”變換單位為分鐘的數(shù)據(jù)。
四、研究結(jié)果
(一)總成績(jī)決策樹(shù)數(shù)據(jù)挖掘結(jié)果
1. 挖掘結(jié)構(gòu)
挖掘結(jié)構(gòu)如圖1所示。
2. 挖掘模型
將UserNum設(shè)為“鍵”列,用于唯一標(biāo)識(shí)事例表中的每條記錄;將UserSex、Department、EduLevel作為“輸入”列,作為發(fā)現(xiàn)數(shù)據(jù)模式的基礎(chǔ);將ScoreTotal作為“可預(yù)測(cè)”列,對(duì)學(xué)習(xí)者的學(xué)習(xí)成績(jī)進(jìn)行預(yù)測(cè)。將測(cè)試事例的百分比設(shè)定為30%,即記錄中的70%將被用于定型該數(shù)據(jù)挖掘,30%被用于測(cè)試模型。如圖2所示。
3. 數(shù)據(jù)挖掘結(jié)果
Microsoft 決策樹(shù)查看器提供兩種視圖“決策樹(shù)”“依賴(lài)關(guān)系網(wǎng)絡(luò)”?!皼Q策樹(shù)”視圖結(jié)果如圖3、圖4、圖5、圖6所示,特點(diǎn)是生成一棵形如二叉或多叉樹(shù)的決策樹(shù)。該樹(shù)是水平布局,根節(jié)點(diǎn)在最左邊,每一個(gè)節(jié)點(diǎn)包含一個(gè)柱狀條,用不同顏色來(lái)代表不同的狀態(tài)。樹(shù)的葉子節(jié)點(diǎn)代表某一類(lèi)別值,非葉子節(jié)點(diǎn)代表某個(gè)一般屬性的一個(gè)測(cè)試,測(cè)試的輸出構(gòu)成該非葉子節(jié)點(diǎn)的多個(gè)分支。從根節(jié)點(diǎn)到葉子節(jié)點(diǎn)的每條路徑形成一條分類(lèi)規(guī)則,一棵決策樹(shù)能夠方便地轉(zhuǎn)化為一系列分類(lèi)規(guī)則。可以依據(jù)分類(lèi)規(guī)則直觀地對(duì)未知類(lèi)別進(jìn)行預(yù)測(cè)。各節(jié)點(diǎn)的背景色表示所選狀態(tài)的事例的密集程度,顏色越深表示該事例越多。通過(guò)決策樹(shù)的樹(shù)形可視化,可以了解每個(gè)葉子節(jié)點(diǎn)的分類(lèi)規(guī)則所需要的最重要的變量?!耙蕾?lài)關(guān)系網(wǎng)絡(luò)”視圖結(jié)果,如圖7所示,特點(diǎn)是可以顯示挖掘模型中輸入屬性和預(yù)測(cè)屬性間的依賴(lài)關(guān)系。每條邊有一個(gè)權(quán)值,它與左邊的滑塊相關(guān)。通過(guò)調(diào)整查看器左側(cè)的滑塊可以查看依賴(lài)關(guān)系強(qiáng)度,若向下拉動(dòng)滑塊,則查看器中只會(huì)顯示最強(qiáng)鏈接。通過(guò)調(diào)整左側(cè)滑塊,可以發(fā)現(xiàn),成績(jī)與學(xué)科背景的關(guān)系最密切,其次是性別,最后是學(xué)歷。
圖3是學(xué)習(xí)者總成績(jī)?yōu)锳的決策樹(shù),所提取的最重要的規(guī)則為1條:IF UserSex='女'AND Edulevel='碩士 ' THEN ScoreTotal='A'。得到以下結(jié)論:總成績(jī)得A的最高概率是女碩士生;性別是最重要的變量,其次是學(xué)歷變量,最后是學(xué)科背景。
圖4為總成績(jī)?yōu)锽的決策樹(shù),所提取的最重要的規(guī)則為2條:①I(mǎi)F Department= '文科' AND UserSex= '女 ' THEN TotalScore= ' B ';②IF Department= '理科' AND UserSex= '非男 ' THEN TotalScore= ' B '。得到以下結(jié)論:總成績(jī)得B的最高概率是文科女生,其次是理科女生;學(xué)科背景是最重要的變量,其次是性別變量,與學(xué)歷變量沒(méi)有關(guān)系。
圖5所示為總成績(jī)?yōu)镃的決策樹(shù),所提取的最重要的規(guī)則為1條:IF Department= '藝術(shù) ' THEN TotalScore= ' C? '。得到以下結(jié)論:總成績(jī)得C的最高概率是藝術(shù)生;學(xué)科背景是最重要的變量,其次是性別變量,與學(xué)歷變量沒(méi)有關(guān)系。
圖6為總成績(jī)?yōu)镈的決策樹(shù),所提取的最重要的規(guī)則為2條:①I(mǎi)F UserSex= ' 男? '? THEN TotalScore= ' D ' ;②IF UserSex= ' 女 '? AND Department= ' 藝術(shù) ' THEN TotalScore=' D ' 。 得到以下結(jié)論:總成績(jī)?yōu)镈的最高概率是男生,其次是女藝術(shù)生;性別是最重要的變量,其次是學(xué)科背景變量,與學(xué)歷變量沒(méi)有關(guān)系。
圖7為總成績(jī)決策樹(shù)依賴(lài)關(guān)系圖。
通過(guò)上述“決策樹(shù)”和“依賴(lài)關(guān)系網(wǎng)絡(luò)”能得到以下結(jié)論:成績(jī)與學(xué)科背景的關(guān)系最密切,文科生得較高分的概率高,藝術(shù)生得低分的概率高;其次是性別,女生得較高分的概率高,男生得較低分的概率高;學(xué)歷對(duì)總成績(jī)的影響很小,僅與總成績(jī)得A的關(guān)系密切,本科生與碩士生并沒(méi)有顯著差異。
根據(jù)數(shù)據(jù)挖掘結(jié)果,小結(jié)如表3。
(二)行為特征決策樹(shù)數(shù)據(jù)挖掘結(jié)果
學(xué)習(xí)者學(xué)習(xí)時(shí)間跨度決策樹(shù)、學(xué)習(xí)總時(shí)長(zhǎng)決策樹(shù)、學(xué)習(xí)次數(shù)決策樹(shù)、平均每次在線(xiàn)學(xué)習(xí)停留時(shí)長(zhǎng)決策樹(shù)、重復(fù)學(xué)習(xí)率決策樹(shù)、學(xué)習(xí)筆記決策樹(shù)、討論交流決策樹(shù)、接收反饋數(shù)量決策樹(shù)的數(shù)據(jù)挖掘過(guò)程與方法和總成績(jī)決策樹(shù)的數(shù)據(jù)挖掘過(guò)程與方法一致。由于數(shù)據(jù)挖掘結(jié)果圖片與規(guī)則較多,故在此不再詳細(xì)呈現(xiàn),小結(jié)如表4,具體結(jié)論如下:
學(xué)習(xí)時(shí)間跨度決策樹(shù)結(jié)論:①學(xué)習(xí)時(shí)間跨度為“高”的最高概率是本科生;學(xué)歷是最重要的變量,與學(xué)科背景、性別無(wú)關(guān)。②學(xué)習(xí)時(shí)間跨度為“中”的最高概率是本科生;學(xué)歷是最重要的變量,其次是性別變量,最后是學(xué)科背景。③學(xué)習(xí)時(shí)間跨度為“低”的最高概率是碩士生;學(xué)歷是最重要的變量,其次是學(xué)科背景變量,與性別無(wú)關(guān)。
學(xué)習(xí)總時(shí)長(zhǎng)決策樹(shù)結(jié)論:①學(xué)習(xí)總時(shí)長(zhǎng)為“高”的最高概率是女文科碩士與女理科碩士,其次是女藝術(shù)生;性別是最重要的變量,其次是學(xué)科背景變量,最后是學(xué)歷。②學(xué)習(xí)總時(shí)長(zhǎng)為“中”的決策樹(shù)找不到任何拆分,即學(xué)習(xí)總時(shí)長(zhǎng)為“中”與學(xué)歷、學(xué)科背景、性別均無(wú)關(guān)。③學(xué)習(xí)總時(shí)長(zhǎng)為“低”的最高概率是男生;性別是最重要的變量,其次是學(xué)科背景變量,最后是學(xué)歷。
學(xué)習(xí)次數(shù)決策樹(shù)結(jié)論:學(xué)習(xí)次數(shù)決策樹(shù)找不到任何拆分,即學(xué)習(xí)次數(shù)與性別、學(xué)科背景、學(xué)歷并無(wú)關(guān)系。
平均每次在線(xiàn)學(xué)習(xí)停留時(shí)長(zhǎng)決策樹(shù)結(jié)論:①平均每次在線(xiàn)學(xué)習(xí)停留時(shí)長(zhǎng)為“高”的最高概率是女生,其次是男文科生與男藝術(shù)生;性別是最重要的變量,其次是學(xué)科背景,與學(xué)歷無(wú)關(guān)。②平均每次在線(xiàn)學(xué)習(xí)停留時(shí)長(zhǎng)為“中”的決策樹(shù),找不到任何拆分,即平均每次在線(xiàn)學(xué)習(xí)停留時(shí)長(zhǎng)為“中”與學(xué)歷、學(xué)科背景、性別均無(wú)關(guān)。③平均每次在線(xiàn)學(xué)習(xí)停留時(shí)長(zhǎng)為“低”的最高概率是男理科生;性別是最重要的變量,其次是學(xué)科背景變量,與學(xué)歷無(wú)關(guān)。
重復(fù)學(xué)習(xí)率決策樹(shù)結(jié)論:①重復(fù)學(xué)習(xí)率為“高”的最高概率是文科生與理科生;學(xué)科背景是最重要的變量,與性別、學(xué)歷無(wú)關(guān)。②重復(fù)學(xué)習(xí)率為“中”決策樹(shù)找不到任何拆分,即重復(fù)學(xué)習(xí)率為“中”與學(xué)歷、學(xué)科背景、性別均無(wú)關(guān)。③重復(fù)學(xué)習(xí)率為“低”的最高概率是藝術(shù)生;學(xué)科背景是最重要的變量,與性別、學(xué)歷無(wú)關(guān)。
討論交流決策樹(shù)結(jié)論:①討論交流為“高”的最高概率是文科生與理科生;學(xué)科背景是最重要的變量,與性別、學(xué)歷無(wú)關(guān)。②討論交流為“中”的決策樹(shù)與討論交流為“低”的決策樹(shù)找不到任何拆分,即討論交流為“中”或“低”與學(xué)歷、學(xué)科背景、性別均無(wú)關(guān)。③討論交流為“無(wú)”的最高概率是藝術(shù)生,其次是文科女碩士與理科女碩士;學(xué)科背景是最重要的變量,其次是性別變量,最后是學(xué)歷。
學(xué)習(xí)筆記決策樹(shù)結(jié)論:①學(xué)習(xí)筆記為“高”的最高概率是女文科生與女理科生;性別是最重要的變量,其次是學(xué)科背景變量,與學(xué)歷無(wú)關(guān)。②學(xué)習(xí)筆記為“中”的決策樹(shù)與學(xué)習(xí)筆記為“低”的決策樹(shù)找不到任何拆分,即學(xué)習(xí)筆記為“中”或“低”與學(xué)歷、學(xué)科背景、性別均無(wú)關(guān)。③學(xué)習(xí)筆記為“無(wú)”的最高概率是女藝術(shù)生;性別是最重要的變量,其次是學(xué)科背景變量,與學(xué)歷無(wú)關(guān)。
接收反饋數(shù)量決策樹(shù)結(jié)論:①接收反饋數(shù)量為“高”的最高概率是男生;性別是最重要的變量,與學(xué)科背景、學(xué)歷無(wú)關(guān)。②接收反饋數(shù)量為“中”的決策樹(shù)找不到任何拆分,即接收反饋數(shù)量為“中”與學(xué)歷、學(xué)科背景、性別均無(wú)關(guān)。③接收反饋數(shù)量為“低”的最高概率是男碩士生,其次是女文科生與女理科生;性別是最重要的變量,其次是學(xué)歷、學(xué)科背景。
(三)數(shù)據(jù)挖掘模型評(píng)估
由于數(shù)據(jù)挖掘選取的測(cè)試數(shù)據(jù)可能存在一定的偶然性和必然性,并不能保證挖掘出的結(jié)果是正確和適用的,因此需要對(duì)挖掘出的模型進(jìn)行評(píng)估和檢驗(yàn)。在Microsoft SQL Server Analysis Services的挖掘準(zhǔn)確性圖表中提供了用來(lái)度量所創(chuàng)建模型質(zhì)量和精確性的工具,可以通過(guò)提升圖來(lái)進(jìn)行模型驗(yàn)證。本研究所有挖掘模型的預(yù)測(cè)概率介于70.25%~95.10%之間,說(shuō)明建立的所有挖掘模型具有比較高的可靠性和準(zhǔn)確性。
五、研究結(jié)論與討論
(一)數(shù)據(jù)挖掘結(jié)果原因分析與討論
本研究通過(guò)建立數(shù)據(jù)挖掘模型、結(jié)果分析、模型驗(yàn)證,發(fā)現(xiàn)采用決策樹(shù)方法可以較好地預(yù)測(cè)網(wǎng)絡(luò)學(xué)習(xí)行為與成績(jī),能夠較好地解釋目前網(wǎng)絡(luò)學(xué)習(xí)中的一些現(xiàn)象,例如男生或藝術(shù)生總成績(jī)?nèi)菀壮霈F(xiàn)危機(jī),男生接受反饋數(shù)量較多等;同時(shí)也有一些新的發(fā)現(xiàn),例如女碩士生與文科女生學(xué)業(yè)成績(jī)表現(xiàn)較好,藝術(shù)生討論交流表現(xiàn)較差,女藝術(shù)生學(xué)習(xí)筆記表現(xiàn)較差等。依據(jù)研究結(jié)果,下面將從數(shù)據(jù)挖掘結(jié)果原因分析與在線(xiàn)學(xué)習(xí)群體干預(yù)策略角度展開(kāi)討論。
第一,男生或藝術(shù)生總成績(jī)存在危機(jī)的概率高,總成績(jī)與學(xué)科背景的關(guān)系最密切,其次是性別。已有研究表明沉浸狀態(tài)對(duì)學(xué)習(xí)有積極影響(Salanova, 2006),本研究行為特征數(shù)據(jù)挖掘結(jié)果表明男生與藝術(shù)生的行為參與度相對(duì)較差,男生與藝術(shù)生總成績(jī)表現(xiàn)較差,容易出現(xiàn)學(xué)習(xí)危機(jī)。對(duì)藝術(shù)生和男生的干預(yù)策略是在課程內(nèi)容方面提供更多的干預(yù)和幫助,為其提供小步調(diào)的學(xué)習(xí)推送服務(wù),包括學(xué)習(xí)通知、課程內(nèi)容、學(xué)習(xí)資源、學(xué)習(xí)基本情況、學(xué)業(yè)風(fēng)險(xiǎn)評(píng)估等,提高其學(xué)習(xí)行為參與度,從而提高學(xué)業(yè)成績(jī)。
第二,碩士生的學(xué)習(xí)時(shí)間跨度表現(xiàn)較差。本研究中的碩士是成人聯(lián)考碩士,需要兼顧工作、學(xué)業(yè)與家庭,因此參與網(wǎng)絡(luò)學(xué)習(xí)的時(shí)間和精力非常有限。對(duì)碩士生的干預(yù)策略是在碩士生注冊(cè)學(xué)習(xí)之后,持續(xù)通過(guò)短信、微信、郵件等形式提醒碩士生及時(shí)參與課程學(xué)習(xí)。
第三,男生的學(xué)習(xí)總時(shí)長(zhǎng)表現(xiàn)較差、接受反饋數(shù)量較多,男理科生的平均每次在線(xiàn)學(xué)習(xí)停留時(shí)長(zhǎng)表現(xiàn)較差。調(diào)查發(fā)現(xiàn)男生對(duì)待網(wǎng)絡(luò)學(xué)習(xí)的態(tài)度、自覺(jué)性、認(rèn)真與努力程度相對(duì)較弱,且在網(wǎng)絡(luò)學(xué)習(xí)中更容易注意力分散,易被無(wú)關(guān)信息干擾(如網(wǎng)絡(luò)游戲、新聞、社交等),自控能力較弱。因此對(duì)這類(lèi)學(xué)習(xí)者就要給其推送更多有意思的資源和活動(dòng),提高其對(duì)學(xué)習(xí)課程的興趣和學(xué)習(xí)動(dòng)機(jī),同時(shí)通過(guò)各種途徑加大對(duì)其學(xué)習(xí)的監(jiān)控與調(diào)節(jié)力度。
第四,藝術(shù)生的重復(fù)學(xué)習(xí)率、討論交流表現(xiàn)較差,女藝術(shù)生的學(xué)習(xí)筆記表現(xiàn)較差。原因并非藝術(shù)生認(rèn)知能力差,而是學(xué)習(xí)習(xí)慣較差,自我調(diào)控能力較弱,因此藝術(shù)生在網(wǎng)絡(luò)學(xué)習(xí)過(guò)程中互動(dòng)表現(xiàn)也較弱(傅鋼善, 等, 2014)。因此,對(duì)藝術(shù)生的干預(yù)策略是設(shè)計(jì)更多的協(xié)作學(xué)習(xí)活動(dòng),采用基于問(wèn)題的學(xué)習(xí)、基于項(xiàng)目的學(xué)習(xí)、基于探究的學(xué)習(xí)等方法增加交互行為,讓其體驗(yàn)協(xié)作的樂(lè)趣和好處,同時(shí)增加參與討論交流的提醒或獎(jiǎng)懲措施;對(duì)女藝術(shù)生的干預(yù)策略是改進(jìn)學(xué)習(xí)策略,尤其是提供反思策略的指導(dǎo)與幫助,并設(shè)置提醒和獎(jiǎng)懲措施提醒其參加學(xué)習(xí)筆記活動(dòng)。
(二)創(chuàng)建適應(yīng)性學(xué)習(xí)干預(yù)模型
通過(guò)數(shù)據(jù)挖掘結(jié)果,可以為學(xué)習(xí)者創(chuàng)建適應(yīng)性學(xué)習(xí)系統(tǒng),在適應(yīng)性學(xué)習(xí)系統(tǒng)中搭建學(xué)習(xí)干預(yù)模型,如圖8所示。傳統(tǒng)學(xué)習(xí)管理系統(tǒng)通常為所有學(xué)習(xí)者呈現(xiàn)完全相同的課程,而不考慮學(xué)習(xí)者的個(gè)體特征、情況和需求,這種一刀切的方法往往導(dǎo)致挫敗感、學(xué)習(xí)困難和高輟學(xué)率(Dagger, et al., 2005)。適應(yīng)性學(xué)習(xí)系統(tǒng)為探索個(gè)性化、適應(yīng)性的學(xué)習(xí)干預(yù)提供了可能。
1. 時(shí)間維度視角
在學(xué)習(xí)的不同階段(學(xué)習(xí)前、學(xué)習(xí)中、學(xué)習(xí)后)提供不同的干預(yù)策略。適應(yīng)性學(xué)習(xí)系統(tǒng)中的學(xué)習(xí)干預(yù)模型是不斷更新、實(shí)時(shí)分析、循環(huán)進(jìn)行的,伴隨著學(xué)習(xí)的不同階段(學(xué)習(xí)前、學(xué)習(xí)中、學(xué)習(xí)后)提供不同的干預(yù)策略。學(xué)習(xí)者在學(xué)習(xí)的某一階段不存在學(xué)習(xí)危機(jī),但有可能在下一階段存在學(xué)習(xí)危機(jī)。一旦出現(xiàn)學(xué)習(xí)危機(jī),及時(shí)給予恰當(dāng)?shù)母深A(yù),從而實(shí)現(xiàn)學(xué)習(xí)者的有效學(xué)習(xí),提高學(xué)習(xí)效果。在學(xué)習(xí)前,干預(yù)的方式是群體干預(yù)。適應(yīng)性學(xué)習(xí)系統(tǒng)內(nèi)僅有學(xué)習(xí)者的人口學(xué)特征數(shù)據(jù),根據(jù)已有研究(表3與表4)中的學(xué)習(xí)者群體差異特征給予群體干預(yù),具體干預(yù)策略見(jiàn)本文數(shù)據(jù)挖掘結(jié)果原因分析與討論部分。在學(xué)習(xí)中,干預(yù)的方式有群體干預(yù)和個(gè)體干預(yù)。通過(guò)學(xué)習(xí)者的人口學(xué)特征和行為特征進(jìn)行數(shù)據(jù)挖掘,根據(jù)預(yù)測(cè)結(jié)果,對(duì)存在學(xué)習(xí)危機(jī)的學(xué)習(xí)群體和個(gè)體,教師及時(shí)做出教學(xué)決策并制定干預(yù)措施,教學(xué)決策包括群體差異指導(dǎo)、因材施教、不同獎(jiǎng)懲機(jī)制等,干預(yù)措施包括學(xué)習(xí)進(jìn)度提示器、數(shù)字儀表盤(pán)、彈幕、提示窗口、資源推送、短信、微信、電子郵件、學(xué)習(xí)策略指導(dǎo)等。在學(xué)習(xí)后,干預(yù)的方式有群體干預(yù)和個(gè)體干預(yù),一方面,根據(jù)數(shù)據(jù)挖掘結(jié)果與學(xué)習(xí)者的表現(xiàn),對(duì)學(xué)習(xí)者的學(xué)業(yè)成績(jī)進(jìn)行多元評(píng)價(jià);另一方面,對(duì)學(xué)習(xí)者模型進(jìn)行調(diào)節(jié),完善數(shù)據(jù)挖掘模型,進(jìn)入新一輪的數(shù)據(jù)挖掘循環(huán)。
2. 課程開(kāi)發(fā)者視角
開(kāi)發(fā)適應(yīng)性學(xué)習(xí)系統(tǒng),完善干預(yù)措施小工具,包括學(xué)習(xí)進(jìn)度提示器、數(shù)字儀表盤(pán)、彈幕、提示窗口、資源推送、短信、微信、電子郵件、學(xué)習(xí)策略指導(dǎo)等。學(xué)習(xí)進(jìn)度提示器能夠清晰地顯示學(xué)習(xí)進(jìn)度,并提醒學(xué)習(xí)是否達(dá)標(biāo)。數(shù)字儀表盤(pán)能夠可視化地呈現(xiàn)學(xué)習(xí)者學(xué)習(xí)活動(dòng)和任務(wù)完成情況,幫助學(xué)習(xí)者自我反思和評(píng)價(jià);同時(shí)學(xué)習(xí)者也可以看到其他學(xué)習(xí)者的數(shù)字儀表盤(pán),以便學(xué)習(xí)者之間互相督促學(xué)習(xí)。彈幕、提示窗口能夠?qū)崟r(shí)或間斷地為學(xué)習(xí)者提供提醒反饋和適應(yīng)性資源推送,與短信、微信、電子郵件等無(wú)縫對(duì)接,通過(guò)多種途徑給學(xué)習(xí)者以提醒和監(jiān)督,尤其是對(duì)存在學(xué)習(xí)危機(jī)的學(xué)習(xí)者,提醒其學(xué)習(xí)活動(dòng)的表現(xiàn)、知識(shí)內(nèi)容的表現(xiàn)、行為特征的表現(xiàn)。學(xué)習(xí)策略指導(dǎo)為學(xué)習(xí)者提供包括信息素養(yǎng)策略、反思總結(jié)策略、資源管理策略、合作交流策略、自我調(diào)節(jié)策略等學(xué)習(xí)策略的指導(dǎo),尤其是為容易出現(xiàn)學(xué)習(xí)危機(jī)或行為參與度低的學(xué)習(xí)者提供學(xué)習(xí)策略資源推送。
3. 教師視角
首先,教師應(yīng)實(shí)施群體差異指導(dǎo)、因材施教、不同獎(jiǎng)懲機(jī)制等教學(xué)策略。具體干預(yù)策略見(jiàn)本文數(shù)據(jù)挖掘結(jié)果原因分析與討論部分。其次,充分發(fā)揮教師的主導(dǎo)作用。網(wǎng)絡(luò)學(xué)習(xí)的優(yōu)勢(shì)是能夠?qū)崿F(xiàn)自主學(xué)習(xí),但是其弊端是弱控制性,包括學(xué)習(xí)資格獲取的弱控制性、管理方式的弱控制性、教學(xué)過(guò)程的弱控制性、師生關(guān)系的弱控制性、考核方式的弱控制性等(衷克定, 2011, pp. 21-25)。網(wǎng)絡(luò)學(xué)習(xí)使學(xué)習(xí)者缺乏時(shí)間認(rèn)知、容易產(chǎn)生惰性、交互行為存在滯后、提交作業(yè)存在抄襲等,這些不僅會(huì)影響學(xué)習(xí)者的行為狀態(tài),而且會(huì)影響網(wǎng)絡(luò)學(xué)習(xí)效果。因此要充分發(fā)揮教師的主導(dǎo)作用,教師要及時(shí)回復(fù)學(xué)習(xí)者的留言,可適當(dāng)安排即時(shí)交流時(shí)間或直播,積極對(duì)學(xué)習(xí)者的行為狀態(tài)進(jìn)行調(diào)控,采用多種途徑激發(fā)學(xué)習(xí)者的學(xué)習(xí)動(dòng)機(jī)等。
4. 學(xué)習(xí)者視角
首先,建議學(xué)習(xí)者自覺(jué)提高網(wǎng)絡(luò)學(xué)習(xí)參與度,增加學(xué)習(xí)時(shí)間跨度,養(yǎng)成記錄反思筆記的良好習(xí)慣,對(duì)于復(fù)雜的知識(shí)增加重復(fù)學(xué)習(xí)次數(shù),積極參與討論交流,提高自己對(duì)網(wǎng)絡(luò)學(xué)習(xí)的歸屬感和沉浸性以及自身學(xué)習(xí)效果。其次,建議學(xué)習(xí)者自覺(jué)改進(jìn)學(xué)習(xí)策略:根據(jù)教師教學(xué)安排循序漸進(jìn)地完成學(xué)習(xí)任務(wù),在網(wǎng)絡(luò)學(xué)習(xí)前確立明確的學(xué)習(xí)目標(biāo),制定明確的學(xué)習(xí)計(jì)劃(尤其是學(xué)習(xí)時(shí)間、學(xué)習(xí)內(nèi)容等的制定),并嚴(yán)格按照學(xué)習(xí)計(jì)劃完成學(xué)習(xí)任務(wù);積極對(duì)自己的情感體驗(yàn)進(jìn)行調(diào)控,尤其是那些對(duì)網(wǎng)絡(luò)學(xué)習(xí)持消極態(tài)度的學(xué)習(xí)者,要經(jīng)常參與討論交流、反思筆記等交互,從中獲得學(xué)習(xí)的成功感和歸屬感;對(duì)自己的行為和心理進(jìn)行及時(shí)控制、調(diào)節(jié)和評(píng)價(jià)。
六、結(jié)語(yǔ)
本研究采用數(shù)據(jù)挖掘技術(shù)中的決策樹(shù)方法對(duì)網(wǎng)絡(luò)學(xué)習(xí)者的學(xué)習(xí)行為與成績(jī)進(jìn)行了預(yù)測(cè),構(gòu)建了適應(yīng)性學(xué)習(xí)系統(tǒng)學(xué)習(xí)干預(yù)模型,為適應(yīng)性學(xué)習(xí)系統(tǒng)提供了實(shí)證依據(jù)。當(dāng)然,本研究還存在一些不足,有待改進(jìn)。首先,研究結(jié)論有待進(jìn)一步驗(yàn)證。本研究的研究對(duì)象僅是陜西師范大學(xué)參加“現(xiàn)代教育技術(shù)”在線(xiàn)開(kāi)放課程學(xué)習(xí)的學(xué)習(xí)者,研究對(duì)象的范圍有局限性,應(yīng)在后續(xù)研究中擴(kuò)大研究對(duì)象范圍,對(duì)研究結(jié)論進(jìn)行驗(yàn)證與完善,得到更科學(xué)可靠的研究結(jié)論。其次,適應(yīng)性學(xué)習(xí)系統(tǒng)的學(xué)習(xí)干預(yù)模型有待進(jìn)一步完善。本研究?jī)H根據(jù)實(shí)證研究數(shù)據(jù)從理論上設(shè)計(jì)了學(xué)習(xí)干預(yù)模型,并沒(méi)有在網(wǎng)絡(luò)學(xué)習(xí)中實(shí)際使用,在后續(xù)研究中有待開(kāi)發(fā)適應(yīng)性學(xué)習(xí)系統(tǒng),對(duì)學(xué)習(xí)干預(yù)模型進(jìn)行驗(yàn)證與完善,并提高預(yù)測(cè)的準(zhǔn)確性。最后,研究數(shù)據(jù)有待進(jìn)一步深度挖掘。本研究尚未對(duì)“現(xiàn)代教育技術(shù)”在線(xiàn)開(kāi)放課程后臺(tái)數(shù)據(jù)進(jìn)行完整的數(shù)據(jù)挖掘,仍然有大量的潛在模式?jīng)]有被發(fā)現(xiàn),未來(lái)研究的重點(diǎn)應(yīng)該關(guān)注多種數(shù)據(jù)挖掘技術(shù),如利用Web數(shù)據(jù)挖掘技術(shù)對(duì)文本信息進(jìn)行知識(shí)發(fā)現(xiàn),利用異常檢驗(yàn)技術(shù)發(fā)現(xiàn)一些特殊的學(xué)習(xí)者(如網(wǎng)絡(luò)學(xué)習(xí)欺詐行為)、利用時(shí)間序列分析發(fā)現(xiàn)學(xué)習(xí)者隨時(shí)間變化而變化的規(guī)律等。
[參考文獻(xiàn)]
陳子健,朱曉亮. 2017. 基于教育數(shù)據(jù)挖掘的在線(xiàn)學(xué)習(xí)者學(xué)業(yè)成績(jī)預(yù)測(cè)建模研究[J]. 中國(guó)電化教育(12):75-81,89.
傅鋼善,王改花. 2014. 基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)學(xué)習(xí)行為與學(xué)習(xí)效果研究[J]. 電化教育研究(9):53-57.
馬杰,趙蔚,張潔,等. 2014. 基于學(xué)習(xí)分析技術(shù)的預(yù)測(cè)模型構(gòu)建與實(shí)證研究[J]. 現(xiàn)代教育技術(shù)(11):30-38.
牟智佳,武法提. 2017a. 教育大數(shù)據(jù)背景下學(xué)習(xí)結(jié)果預(yù)測(cè)研究的內(nèi)容解析與設(shè)計(jì)取向[J]. 中國(guó)電化教育(7):26-32.
牟智佳,武法提. 2017b. MOOC學(xué)習(xí)結(jié)果預(yù)測(cè)指標(biāo)探索與學(xué)習(xí)群體特征分析[J]. 現(xiàn)代遠(yuǎn)程教育研究(3):58-66,93.
孫力,程玉霞. 2015. 大數(shù)據(jù)時(shí)代網(wǎng)絡(luò)教育學(xué)習(xí)成績(jī)預(yù)測(cè)的研究與實(shí)現(xiàn)——以本科公共課程統(tǒng)考英語(yǔ)為例[J]. 開(kāi)放教育研究(3):74-80.
孫力,張凱,丁波. 2016. 基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)教育學(xué)習(xí)成績(jī)細(xì)分預(yù)測(cè)的研究與實(shí)現(xiàn)——以本科成人學(xué)位英語(yǔ)考試為例[J]. 中國(guó)遠(yuǎn)程教育(12):22-29.
唐華松,姚耀文. 2001. 數(shù)據(jù)挖掘中決策樹(shù)算法的探討[J]. 計(jì)算機(jī)應(yīng)用研究(8):21-22,25.
王國(guó)平,郭偉宸,汪若君. 2014. IBM SPSS Modeler數(shù)據(jù)與文本挖掘?qū)崙?zhàn)[M]. 北京:清華大學(xué)出版社:142.
王亮. 2015. 學(xué)習(xí)分析技術(shù)建立學(xué)習(xí)預(yù)測(cè)模型[J]. 實(shí)驗(yàn)室研究與探索(1):215-218,246.
王林麗,葉洋,楊現(xiàn)民. 2016. 基于大數(shù)據(jù)的在線(xiàn)學(xué)習(xí)預(yù)警模型設(shè)計(jì)——“教育大數(shù)據(jù)研究與實(shí)踐專(zhuān)欄”之學(xué)習(xí)預(yù)警篇[J]. 現(xiàn)代教育技術(shù)(7):5-11.
武法提,牟智佳. 2016. 基于學(xué)習(xí)者個(gè)性行為分析的學(xué)習(xí)結(jié)果預(yù)測(cè)框架設(shè)計(jì)研究[J]. 中國(guó)電化教育(1):41-48.
肖巍,倪傳斌,李銳. 2018. 國(guó)外基于數(shù)據(jù)挖掘的學(xué)習(xí)預(yù)警研究:回顧與展望[J]. 中國(guó)遠(yuǎn)程教育(2):70-78.
徐鵬,王以寧. 2013. 大數(shù)據(jù)視角分析學(xué)習(xí)變革——美國(guó)《通過(guò)教育數(shù)據(jù)挖掘和學(xué)習(xí)分析促進(jìn)教與學(xué)》報(bào)告解讀及啟示[J]. 遠(yuǎn)程教育雜志(6):11-17.
元昌安. 2009. 數(shù)據(jù)挖掘原理與SPSS Clementine應(yīng)用寶典[M]. 北京:電子工業(yè)出版社:40.
趙慧瓊,姜強(qiáng),趙蔚,等. 2017. 基于大數(shù)據(jù)學(xué)習(xí)分析的在線(xiàn)學(xué)習(xí)績(jī)效預(yù)警因素及干預(yù)對(duì)策的實(shí)證研究[J]. 電化教育研究(1):62-69.
中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心. 2018-03-05. 第41次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》[EB/OL]. [2018-05-15]. http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201803/t20180305_70249.htm
中華人民共和國(guó)教育部. 2016-06-07. 教育部關(guān)于印發(fā)《教育信息化“十三五”規(guī)劃》的通知(教技〔2016〕2號(hào))[EB/OL]. [2018-03-14].http://www.moe.edu.cn/srcsite/A16/s3342/201606/t20160622_2693 67. html
衷克定, 2011. 在線(xiàn)學(xué)習(xí)與發(fā)展[M]. 北京:高等教育出版社:21-25.
Barba, P. G., Kennedy, G. E. & Ainley, M. D. (2016). The role of students motivation and participation in predicting performance in a MOOC motivation and participation in MOOCs. Journal of Computer Assisted Learning, 32(3), 218-231.
Costa, E. B., Fonseca, B., Santana, M. A., de Araújo, F. F. & Rego, J. (2017). Evaluating the effectiveness of educational data mining techniques for early prediction of students academic failure in introductory programming courses. Computers in Human Behavior, 73, 247-256.
Dagger, D., Wade, V. & Conlan, O. (2005). Personalisation for all: making adaptive course composition easy. Educational Technology & Society, 8(3), 9-25.
Huang, S. & Fang, N. (2013). Predicting student academic performance in an engineering dynamics course: a comparison of four types of predictive mathematical models. Computer & Education, 61, 133-145.
Karampiperis, P., & Sampson, D. G. (2005). Adaptive learning resources sequencing in educational hypermedia systems. Educational Technology & Society, 8 (4), 128-147.
Kostopoulos, G., Lipitakis, A. D., Kotsiantis, S. & Gravvanis, G. (2017). Predicting Student Performance in Distance Higher Education Using Active Learning. In G. Boracchi, L. Iliadis, C. Jayne & A. Likas (Eds.) Communications in Computer and Information Science (pp. 75- 86). Cham: Springer.
Kotsiantis, S., Patriarcheas, K. & Xenos, M. (2010). A combinational incremental ensemble of classifiers as a technique for predicting students performance in distance education. Knowledge-Based Systems, 23 (6), 529-535.
Macfadyen, L. P. & Dawson, S. (2010). Mining LMS data to develop an “early warning system” for educators: a proof of concept. Computer & Education, 54 (2), 588-599.
Ohia U. O. (2011). A model for effectively assessing student learning outcomes. Contemporary Issues in Education Research, 4 (3), 25-32.
Pursel, B. K., Zhang, L., Jablokow, K. W., Choi G.W. & Velegol, D. (2016). Understanding MOOC students: motivations and behaviours indicative of MOOC completion. Journal of Computer Assisted Learning, 32(3), 202-217.
Romero, C., López, M. I., Luna, J. M. & Ventura, S. (2013). Predicting students final performance from participation in on-line discussion forums. Computer & Education, 68, 458-472.
Salanova, M., Bakker, A. B. & Llorens, S. (2006). Flow at work: evidence for an upward spiral of personal and organizational resources. Journal of Happiness Studies, 7(1), 1-22.
Xing, W., Guo, R., Petakovic, E. & Goggins, S. (2015). Participation-based student final performance prediction model through interpretable genetic programming: integrating learning analytics, educational data mining and theory. Computers in Human Behavior, 47(C), 168-181.
收稿日期:2018-03-15
定稿日期:2018-08-09
作者簡(jiǎn)介:王改花,博士研究生,實(shí)驗(yàn)師;傅鋼善,教授,博士生導(dǎo)師。陜西師范大學(xué)教育學(xué)院(710062)。
責(zé)任編輯 張志禎