王良周 于衛(wèi)紅
【摘 要】
學(xué)習(xí)分析作為教育信息化的新浪潮,是教育大數(shù)據(jù)的主要應(yīng)用領(lǐng)域。泛在網(wǎng)絡(luò)下的學(xué)習(xí)大數(shù)據(jù)高速增長,線上線下的學(xué)習(xí)形式不斷革新,關(guān)于學(xué)習(xí)分析的研究也隨著大數(shù)據(jù)理念的發(fā)展而不斷變化。本文通過文獻分析法,著重從大數(shù)據(jù)的視角,對國內(nèi)外學(xué)習(xí)分析的研究現(xiàn)狀進行綜述。首先介紹學(xué)習(xí)分析及相關(guān)概念的發(fā)展,從大數(shù)據(jù)視角探討學(xué)習(xí)分析發(fā)展的驅(qū)動力;然后對比國內(nèi)外在大數(shù)據(jù)和云計算技術(shù)驅(qū)動下形成的學(xué)習(xí)分析框架、應(yīng)用領(lǐng)域和關(guān)鍵技術(shù),介紹了整合的學(xué)習(xí)分析系統(tǒng)平臺;最后分析大數(shù)據(jù)創(chuàng)新給學(xué)習(xí)分析帶來的機遇和挑戰(zhàn)。
【關(guān)鍵詞】 學(xué)習(xí)分析; 教育大數(shù)據(jù); 數(shù)據(jù)挖掘 ;智慧學(xué)習(xí)
【中圖分類號】 G434 【文獻標識碼】 A 【文章編號】 1009—458x(2015)03—0031—07
一、引言
信息時代,大數(shù)據(jù)的出現(xiàn)正給各個領(lǐng)域的發(fā)展帶來深刻的影響。在商業(yè)領(lǐng)域,大數(shù)據(jù)研究已經(jīng)初具規(guī)模,其成果正改變著商務(wù)活動的營銷和運營模式。同樣,在教育和科研領(lǐng)域,教育大數(shù)據(jù)和教育云時代已經(jīng)到來。
學(xué)習(xí)分析和教育數(shù)據(jù)挖掘,是教育大數(shù)據(jù)的兩個主要應(yīng)用領(lǐng)域。美國新媒體聯(lián)盟(NMC)在地平線報告中連續(xù)四年把學(xué)習(xí)分析作為影響教育發(fā)展的趨勢和關(guān)鍵技術(shù)[1][2][3]。2011年以來,為了促進學(xué)習(xí)分析的發(fā)展和學(xué)者之間的學(xué)術(shù)交流,每年都會舉行一屆學(xué)習(xí)分析與知識國際會議(International Conference on Learning Analytics and Knowledge,LAK)。2013年夏,美國學(xué)習(xí)分析研究會SOLAR、IEDMS等在斯坦福大學(xué)建立了斯坦福學(xué)習(xí)分析夏季學(xué)院,為學(xué)習(xí)分析研究和應(yīng)用培訓(xùn)提供支持。目前,分析技術(shù)在大學(xué)教與學(xué)中的應(yīng)用進展非常迅速,學(xué)習(xí)分析已經(jīng)成為教育信息化的一個新浪潮。在2014年美國高等教育信息化協(xié)會(EDUCAUSE)發(fā)布的“高等教育信息化十大戰(zhàn)略技術(shù)”研究報告中,對學(xué)習(xí)分析的使用情況作了統(tǒng)計:35%的學(xué)校建立了課程層面的分析架構(gòu);35%的學(xué)校建立了業(yè)務(wù)績效的分析架構(gòu);32%的學(xué)校建立了學(xué)位指導(dǎo)的分析架構(gòu);47%的學(xué)校建立了業(yè)務(wù)情報報告儀表盤[4]。隨著教育大數(shù)據(jù)和教育云計算的發(fā)展,學(xué)習(xí)分析成為了教育信息化與教學(xué)互動的“深度融合”[5]。
目前,國際上關(guān)于學(xué)習(xí)分析的研究方向主要集中在學(xué)習(xí)分析服務(wù)框架、分析方法、工具與可視化工具領(lǐng)域;國內(nèi)主要集中于綜述和應(yīng)用分析[6]。國內(nèi)的顧小清[7]、李青[8]、馬曉玲[9]、韓順平[10]、吳永和[11]、祝智庭[12]、張羽[13]等學(xué)者從不同角度對學(xué)習(xí)分析的研究和發(fā)展做了綜述。本文著重從大數(shù)據(jù)創(chuàng)新的角度,介紹大數(shù)據(jù)背景下學(xué)習(xí)分析的概念、驅(qū)動力,對比學(xué)習(xí)分析框架和應(yīng)用,分析大數(shù)據(jù)創(chuàng)新給學(xué)習(xí)分析帶來的趨勢和挑戰(zhàn)。
二、學(xué)習(xí)分析與相關(guān)概念
(一)學(xué)習(xí)分析的定義與發(fā)展
學(xué)習(xí)分析的定義源于美國高等教育信息化協(xié)會的“下一代的挑戰(zhàn)”,其將學(xué)習(xí)分析定義為:使用數(shù)據(jù)和模型預(yù)測學(xué)生收獲和行為具備處理這些信息的能 力[14]。2011年,首屆學(xué)習(xí)分析與知識國際會議將學(xué)習(xí)分析定義為:測量、收集、分析和報告關(guān)于學(xué)習(xí)者及其學(xué)習(xí)情景的數(shù)據(jù),以期了解和優(yōu)化學(xué)習(xí)和學(xué)習(xí)發(fā)生的情境[15]。新媒體聯(lián)盟也有相似的定義:利用松散耦合的數(shù)據(jù)收集工具和分析技術(shù),研究分析學(xué)習(xí)者學(xué)習(xí)參與、學(xué)習(xí)表現(xiàn)和學(xué)習(xí)過程的相關(guān)數(shù)據(jù),進而對課程教學(xué)和評價進行實時修正[16]??梢哉f,學(xué)習(xí)分析在許多方面指的是應(yīng)用于教育領(lǐng)域的“大數(shù)據(jù)”分 析[17]。從這些定義可以看出,學(xué)習(xí)分析的研究對象是學(xué)生及其學(xué)習(xí)情境,研究的基礎(chǔ)是教育活動中產(chǎn)生的海量學(xué)習(xí)數(shù)據(jù)和學(xué)習(xí)分析過程中產(chǎn)生的中間數(shù)據(jù),研究的目標是評估和預(yù)測學(xué)生活動,發(fā)現(xiàn)潛在問題,為教育活動相關(guān)者提供決策支持,以優(yōu)化和設(shè)計學(xué)習(xí)過程和學(xué)習(xí)情境。
美國學(xué)習(xí)分析研究會、學(xué)習(xí)分析與知識國際會議、美國高等教育信息化協(xié)會、英國開放大學(xué)知識化研究所(KMI)等學(xué)術(shù)機構(gòu)和會議推動了學(xué)習(xí)分析的發(fā)展[18]。學(xué)習(xí)分析與知識國際會議召開的時間、地點和主題見表1。從會議的主題變化可以看出,學(xué)習(xí)分析已經(jīng)由概念發(fā)展到應(yīng)用,由理論研究發(fā)展到實踐研究。學(xué)習(xí)分析是在大數(shù)據(jù)背景下發(fā)展的分析技術(shù),第五屆學(xué)習(xí)分析與知識國際會議已經(jīng)明確將大數(shù)據(jù)作為主要議題。
表1 LAK歷年召開時間、地點和會議主題
[LAK\&時間\&地點\&主題\&LAK11\&2011年2月27日至3月1日\&加拿大阿爾伯達省班芙市\&學(xué)習(xí)分析技術(shù)、社會和教學(xué)等維度的整合\&LAK12\&2012年4月29日至5月2日\&加拿大溫哥華市\&學(xué)習(xí)分析技術(shù)、知識建模和表征、知識工作和分析等領(lǐng)域的現(xiàn)狀及發(fā)展策略\&LAK13\&2013年4月8日至4月12日\&比利時勒芬市\&學(xué)習(xí)分析辯證法\&LAK14\&2014年3月24日至3月28日\&美國印第安納波利斯市\&學(xué)習(xí)分析研究、理論與實踐整合\&LAK15\&2015年3月16日至3月25日\&美國紐約波基普西市\&縮放:大數(shù)據(jù),大影響\&]
(二)學(xué)習(xí)分析與相關(guān)概念
相比商業(yè)、物理、生物、氣候等領(lǐng)域,分析技術(shù)應(yīng)用于學(xué)習(xí)領(lǐng)域較晚。學(xué)習(xí)分析、學(xué)術(shù)分析、教育數(shù)據(jù)挖掘、行為分析都是分析方法在教育領(lǐng)域的特定應(yīng)用。Angela等比較了分析、商業(yè)分析、學(xué)術(shù)分析、學(xué)習(xí)分析、預(yù)測分析和行為分析的定義和關(guān)注維度,認為教育數(shù)據(jù)挖掘、學(xué)習(xí)分析、學(xué)術(shù)分析是教育大數(shù)據(jù)分析中最接近的概念[19]。Ferguson(2012)通過三個問題回答了教育數(shù)據(jù)挖掘、學(xué)習(xí)分析、學(xué)術(shù)分析的區(qū)別[20]。教育數(shù)據(jù)挖掘主要關(guān)注的是“如何從學(xué)習(xí)大數(shù)據(jù)集中提取有用信息”這一技術(shù)挑戰(zhàn),學(xué)習(xí)分析則主要關(guān)注“如何優(yōu)化在線學(xué)習(xí)機會”這一教育挑戰(zhàn),而學(xué)術(shù)分析則關(guān)注“如何在國家或國際層面上最大程度地改進學(xué)習(xí)機會和教育結(jié)果”這一政治經(jīng)濟挑戰(zhàn)[21][22]。 G.Siemens和Long對學(xué)習(xí)分析與學(xué)術(shù)分析進行了界定[23]。學(xué)術(shù)分析側(cè)重智能分析在教育領(lǐng)域的應(yīng)用,強調(diào)的是機構(gòu)、區(qū)域、國際層面上的分析,直接受益者是管理機構(gòu)、投資者、政府部門和教育機構(gòu)。而學(xué)習(xí)分析主要關(guān)注的是課程和部門的分析,直接受益者是學(xué)習(xí)者、導(dǎo)師和部門管理者。相比學(xué)術(shù)分析和教育數(shù)據(jù)挖掘,學(xué)習(xí)分析更加強調(diào)對學(xué)習(xí)過程和學(xué)習(xí)情境的實時優(yōu)化[24]。
G.Siemens、Baker詳細分析了學(xué)習(xí)分析與教育數(shù)據(jù)挖掘的聯(lián)系和區(qū)別[25][26],認為這兩個概念都是數(shù)據(jù)驅(qū)動下的教育領(lǐng)域的分析技術(shù),其在研究內(nèi)容和研究者方面有重疊,目標都是通過數(shù)據(jù)分析指導(dǎo)和促進教與學(xué)[27]。Bienkowski在通過學(xué)習(xí)分析與教育數(shù)據(jù)挖掘促進教與學(xué)的報告中對以上學(xué)者的觀點做了詳盡的說明[28]。下面通過表2比較教育數(shù)據(jù)挖掘與學(xué)習(xí)分析[29][30]??梢钥闯?,學(xué)習(xí)分析與教育數(shù)據(jù)挖掘在側(cè)重點、起源和分析方法上都有不同。教育數(shù)據(jù)挖掘?qū)嶋H上強調(diào)自動發(fā)現(xiàn),因此,它側(cè)重于模型和發(fā)現(xiàn)模式,關(guān)注各個組成部分以及他們之間的關(guān)系。學(xué)習(xí)分析盡管也強調(diào)自動發(fā)現(xiàn),但更關(guān)注情境和特定干預(yù),注重個性化和自適應(yīng)[31]。教育數(shù)據(jù)挖掘重點依賴聚類技術(shù),同時也很依賴智能輔導(dǎo)系統(tǒng),更加重視建立模型。而學(xué)習(xí)分析更加強調(diào)社會干預(yù),如普遍應(yīng)用社會網(wǎng)絡(luò)分析以及話語分析[32]。
(三)從大數(shù)據(jù)視角看學(xué)習(xí)分析的驅(qū)動力
Ferguson認為大數(shù)據(jù)技術(shù)、教育、政治和經(jīng)濟因素是驅(qū)動學(xué)習(xí)分析發(fā)展的主要動力[33]。G.Siemens、RyanS.J.d.Bake等從技術(shù)發(fā)展角度分析了促進學(xué)習(xí)分析發(fā)展的主要因素,概括為:教育數(shù)據(jù)量劇增、數(shù)據(jù)格式多樣化、計算能力加強、分析工具發(fā) 展[34][35]。從大數(shù)據(jù)視角,可以將學(xué)習(xí)分析的驅(qū)動力概括為三類:數(shù)據(jù)驅(qū)動、技術(shù)驅(qū)動、需求和利益驅(qū)動。
1. 數(shù)據(jù)驅(qū)動
智能手機、平板電腦、傳感器等電子設(shè)備在學(xué)習(xí)情境中的應(yīng)用已經(jīng)相當(dāng)普遍,基于泛在網(wǎng)絡(luò)的學(xué)習(xí)數(shù)據(jù)劇增是驅(qū)動學(xué)習(xí)分析的重要因素。我們處在普適計算時代,移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等泛在網(wǎng)絡(luò)改變了學(xué)習(xí)方式,也為學(xué)習(xí)分析提供了豐富的數(shù)據(jù)來源。學(xué)習(xí)管理系統(tǒng)LMS中存儲著大量學(xué)生學(xué)習(xí)數(shù)據(jù),學(xué)生在線學(xué)習(xí)保留有大量學(xué)習(xí)軌跡信息,社交網(wǎng)絡(luò)中的學(xué)習(xí)行為更是呈現(xiàn)出急劇增長的數(shù)據(jù)流趨勢[36]。這些數(shù)據(jù)來源廣泛,數(shù)量巨大,而且數(shù)據(jù)格式多種多樣。目前常用的學(xué)習(xí)分析數(shù)據(jù)主要來自于數(shù)據(jù)倉庫中的基本信息數(shù)據(jù),來自于網(wǎng)絡(luò)服務(wù)器的用戶瀏覽日志,以及來自于學(xué)習(xí)網(wǎng)站和系統(tǒng)挖掘的其他文本數(shù)據(jù),例如博客、評論、搜索詞等。需要強調(diào)的是,數(shù)據(jù)驅(qū)動下的學(xué)習(xí)分析技術(shù),也帶來了學(xué)習(xí)分析的數(shù)據(jù)挑戰(zhàn)。
2. 技術(shù)驅(qū)動
大數(shù)據(jù)關(guān)鍵技術(shù)和社會分析技術(shù)是學(xué)習(xí)分析的支撐技術(shù),是驅(qū)動學(xué)習(xí)分析的關(guān)鍵因素。學(xué)習(xí)分析過程中面臨海量數(shù)據(jù)的采集、存儲、分析問題,需要根據(jù)社會分析方法,在人的干預(yù)下優(yōu)化學(xué)習(xí)情境,這些問題離不開強有力的技術(shù)支持。云計算技術(shù)、物聯(lián)網(wǎng)技術(shù)、語義web技術(shù)、移動互聯(lián)網(wǎng)技術(shù)、數(shù)字媒體技術(shù)都是大數(shù)據(jù)基礎(chǔ)平臺與支撐技術(shù)。在教育云平臺和在線學(xué)習(xí)環(huán)境下,利用物聯(lián)網(wǎng)和云存儲技術(shù)采集和存儲海量相關(guān)數(shù)據(jù),利用語義web技術(shù)(關(guān)聯(lián)數(shù)據(jù)技術(shù))管理和利用相關(guān)數(shù)據(jù)。移動互聯(lián)網(wǎng)設(shè)備已經(jīng)進入學(xué)習(xí)環(huán)境,利用移動互聯(lián)網(wǎng)技術(shù)可以方便地實現(xiàn)在線記筆記、資源分享。還可以通過增強現(xiàn)實技術(shù)虛擬學(xué)習(xí)環(huán)境。在云計算方面,云文件系統(tǒng)(GFS,HDFS等)、NoSQL 數(shù)據(jù)庫、Mapreduce計算模式、apache hadoop等開源工具都是大數(shù)據(jù)下學(xué)習(xí)分析需要利用的技術(shù)工具[37]。這些先進技術(shù),使得基于大樣本的、個性化定制的學(xué)習(xí)分析成為可能。
3. 需求與利益驅(qū)動
個性化、多樣化的學(xué)習(xí)需求帶來直接的經(jīng)濟、社會利益,需求與利益是驅(qū)動學(xué)習(xí)分析的核心因素。從個人角度看,個性化學(xué)習(xí)方案的制定需要參考學(xué)習(xí)分析系統(tǒng)對個人的分析建議;從企業(yè)角度看,基于智能分析決策的學(xué)習(xí)系統(tǒng)和產(chǎn)品更有市場競爭力;從教育機構(gòu)角度看,學(xué)習(xí)分析結(jié)果可以作為決策的依據(jù)。這些利益需求驅(qū)動了學(xué)習(xí)分析的發(fā)展。
三、學(xué)習(xí)分析的框架、技術(shù)、應(yīng)用
(一)學(xué)習(xí)分析整體框架
很多學(xué)者從不同角度為學(xué)習(xí)分析設(shè)計了整體框架。大多數(shù)框架關(guān)注的是學(xué)習(xí)分析可用的數(shù)據(jù)、利益相關(guān)者、分析流程、分析工具、制約與限制等方面。Brown and Malcolm認為,學(xué)習(xí)分析的核心在于收集和分析學(xué)習(xí)數(shù)據(jù),主要包括數(shù)據(jù)收集、分析、學(xué)生學(xué)習(xí)、受益方和干預(yù)五個要素[38]。G.Siemens提出了一個工作流引擎驅(qū)動的學(xué)習(xí)框架??蚣苡蓴?shù)據(jù)采集、分析、預(yù)測、調(diào)整四個工作流組成。其中數(shù)據(jù)包括學(xué)習(xí)者發(fā)布的數(shù)據(jù),智能語義和關(guān)聯(lián)數(shù)據(jù),個人資 料[39]。通過總結(jié)Baker和Dron,Anderson等人的知識管理模型,Tanya Elians提出了一個由四個技術(shù)資源和三個循環(huán)階段組成的改進的學(xué)習(xí)分析框架[40]。四個技術(shù)資源指計算機、人、理論、組織機構(gòu)。三個循環(huán)階段包括六個活動:數(shù)據(jù)收集(選擇與采集)、數(shù)據(jù)處理(整合與預(yù)測)、知識應(yīng)用(使用和優(yōu)化)。
M.A. Chatti等認為學(xué)習(xí)分析的主要步驟是數(shù)據(jù)采集與預(yù)處理、數(shù)據(jù)分析與行動、后續(xù)處理。他們提出了一個由四個維度組成的學(xué)習(xí)分析參考模型(見圖1)。該模型將學(xué)習(xí)分析分成數(shù)據(jù)與環(huán)境、技術(shù)、利益相關(guān)者、目標四個維度,并從各個維度分析了學(xué)習(xí)分析面臨的機遇和挑戰(zhàn)。與之相似,Greller and Drachsler提出了一個由利益相關(guān)者、目標、數(shù)據(jù)、工具、內(nèi)部限制和外部約束六個關(guān)鍵維度組成的學(xué)習(xí)分析框架(見圖2)[41]。他們認為,學(xué)習(xí)分析的利益相關(guān)者包括數(shù)據(jù)主體(學(xué)習(xí)者)和數(shù)據(jù)客體(教師、導(dǎo)師、教育管理者),學(xué)習(xí)分析的數(shù)據(jù)來自于被保護和公開的學(xué)習(xí)活動及學(xué)習(xí)環(huán)境數(shù)據(jù),學(xué)習(xí)分析的目的在于預(yù)測學(xué)習(xí)結(jié)果和幫助學(xué)習(xí)者反思,采用的分析工具包括教學(xué)理論、機器學(xué)習(xí)技術(shù)和可視化工具,學(xué)習(xí)分析的實施過程應(yīng)考慮個人隱私和倫理道德[42]。
圖1 Chatti等的學(xué)習(xí)分析參考模型
圖2 Greller等的學(xué)習(xí)分析框架
Dirk Ifenthaler[43]等著重考慮了學(xué)生、學(xué)習(xí)、課程之間的關(guān)系,設(shè)計了一個融合多源信息的分析框架(見圖3)。該框架整合了在線學(xué)習(xí)環(huán)境中的分析數(shù)據(jù)(包括個人特征、社會網(wǎng)絡(luò)、物理數(shù)據(jù)、課程數(shù)據(jù)、反饋數(shù)據(jù)),引進了學(xué)習(xí)分析引擎、個性化和自適應(yīng)引擎、報告引擎三個處理階段。該框架強調(diào)了學(xué)習(xí)環(huán)境中數(shù)據(jù)的異構(gòu)性和多源性,將數(shù)據(jù)、分析工具、環(huán)境連接為一個具有反饋環(huán)節(jié)的閉合系統(tǒng)。可以說,它是一種面向服務(wù)的架構(gòu)。
學(xué)習(xí)分析的整體框架多種多樣,這些框架為學(xué)習(xí)分析應(yīng)用和實現(xiàn)提供了重要指導(dǎo)。但是,每個框架都有局限性,經(jīng)過實踐驗證的框架仍然很稀少[44]。
(二)整合的學(xué)習(xí)分析系統(tǒng)
目前企業(yè)和研究團體已經(jīng)開發(fā)出多種多樣的學(xué)習(xí)分析系統(tǒng)和平臺。有些是單獨的學(xué)習(xí)分析系統(tǒng),更多的是嵌入到學(xué)習(xí)管理系統(tǒng)LMS和MOOCs平臺中的分析工具。一般來說,學(xué)習(xí)分析工具不能單獨存在,常作為“插件”嵌入其他在線學(xué)習(xí)環(huán)境中。美國學(xué)習(xí)分析研究會的學(xué)者提出一個整合的學(xué)習(xí)分析系統(tǒng)(見圖4)[45],主要包括四部分:分析引擎;適應(yīng)內(nèi)容和個性化引擎;干預(yù)引擎;儀表盤,報告和可視化工具。
圖4 SOLAR整合的學(xué)習(xí)分析系統(tǒng)
1. 分析引擎
分析引擎是學(xué)習(xí)分析系統(tǒng)的核心部分。它整合了多個數(shù)據(jù)處理和分析模塊,是學(xué)習(xí)分析系統(tǒng)的神經(jīng)中樞。分析引擎包括數(shù)據(jù)處理、數(shù)據(jù)分析等核心功能,集成諸如預(yù)測、聚類、模式發(fā)現(xiàn)、趨勢分析等應(yīng)用模塊。分析引擎處理來自學(xué)習(xí)管理系統(tǒng)、社會網(wǎng)絡(luò)、物理世界中的學(xué)習(xí)軌跡數(shù)據(jù),數(shù)據(jù)倉庫中的學(xué)生基本信息和外部用戶指令數(shù)據(jù),通過社會網(wǎng)絡(luò)分析、話語分析、模式發(fā)現(xiàn)、機器學(xué)習(xí)等學(xué)習(xí)分析技術(shù),形成分析結(jié)果,以報告、可視化等技術(shù)提供給用戶。用戶根據(jù)這些分析結(jié)果做出判斷和干預(yù)[46][47]。
2. 適應(yīng)內(nèi)容和個性化引擎
適應(yīng)內(nèi)容和個性化指的是系統(tǒng)能夠根據(jù)學(xué)習(xí)分析的反饋和個人習(xí)慣偏好優(yōu)化學(xué)習(xí)過程、教學(xué)設(shè)計和學(xué)習(xí)內(nèi)容的能力。例如,系統(tǒng)根據(jù)學(xué)生愛好給學(xué)生的選課建議,系統(tǒng)根據(jù)用戶習(xí)慣改善學(xué)生的學(xué)習(xí)體驗,系統(tǒng)根據(jù)用戶偏好推薦合適的內(nèi)容,等等。適應(yīng)內(nèi)容和個性化引擎將分析引擎、系統(tǒng)開發(fā)者、學(xué)習(xí)資料提供者聯(lián)系起來,在出版商等開發(fā)者的參與下,對學(xué)習(xí)內(nèi)容進行適應(yīng)性和個性化定制與推送。
3. 干預(yù)引擎
干預(yù)引擎使用分析引擎產(chǎn)生的預(yù)測模型,追蹤學(xué)習(xí)者的學(xué)習(xí)軌跡,提供自動的人為的教育干預(yù)。干預(yù)引擎通過鏈接給學(xué)習(xí)者提供學(xué)習(xí)內(nèi)容、社交伙伴、導(dǎo)師等資源;通過社交工具,教師可以與學(xué)生互動交流;通過預(yù)測分析,對問題學(xué)生提前引導(dǎo),對“特別”學(xué)生特殊培養(yǎng)。
4. 儀表盤,報告和可視化工具
學(xué)習(xí)儀表盤呈現(xiàn)可視化的分析數(shù)據(jù)和報告,方便個人對教學(xué)和學(xué)習(xí)作出決策。學(xué)習(xí)儀表盤包括四個用戶視圖:學(xué)習(xí)者視圖、教育者視圖、研究者視圖和機構(gòu)視圖。不同視圖視角不同,但相互關(guān)聯(lián)。根據(jù)不同利益相關(guān)者的需求,提供不同的數(shù)據(jù)展示。
參考SOLAR學(xué)習(xí)分析系統(tǒng),吳永和等人從學(xué)習(xí)分析系統(tǒng)輸入輸出角度,將整個系統(tǒng)分為數(shù)據(jù)層、分析層、報告層、干預(yù)與適應(yīng)層[48]。數(shù)據(jù)層主要獲取學(xué)習(xí)者相關(guān)學(xué)習(xí)數(shù)據(jù),然后送入系統(tǒng)分析層由分析引擎進行數(shù)據(jù)分析,之后在儀表盤上按學(xué)習(xí)者、教學(xué)者、管理者三大利益相關(guān)者需求產(chǎn)生可視化報告, 并在此基礎(chǔ)上對學(xué)習(xí)者進行干預(yù),完成自適應(yīng)過程[49]。另外他們還認為,學(xué)習(xí)分析系統(tǒng)的技術(shù)特征應(yīng)該包括功能模塊化、報告可視化、數(shù)據(jù)多源化,這種觀點具有很好的參考價值。
(三)學(xué)習(xí)分析的關(guān)鍵技術(shù)與應(yīng)用領(lǐng)域
學(xué)習(xí)分析是教育理論、技術(shù)、可視化展示相互協(xié)同完成的結(jié)果。整體的框架和系統(tǒng)中已經(jīng)包含了這些要素,下面詳細介紹學(xué)習(xí)分析的應(yīng)用領(lǐng)域和關(guān)鍵技術(shù)。
Marie Bienkowski[50]等人認為學(xué)習(xí)分析應(yīng)用領(lǐng)域包括:用戶模型(知識、行為、體驗),用戶建檔,領(lǐng)域關(guān)鍵概念模型和領(lǐng)域知識內(nèi)容模型,趨勢分析模型,適應(yīng)性和個性化模型。不同的應(yīng)用模型需要不同的分析數(shù)據(jù)和分析方法。通過情境模擬和參考相關(guān)文獻,可看到學(xué)習(xí)分析主要應(yīng)用領(lǐng)域包括:① 用戶模型;② 學(xué)習(xí)者行為與情感分析; ③ 預(yù)測與評估;④ 結(jié)構(gòu)發(fā)現(xiàn)與關(guān)系挖掘;⑤ 趨勢分析與活動干預(yù);⑥ 適應(yīng)性和個性化;⑦ 監(jiān)督與控制[51][52](見表3)。
表3 學(xué)習(xí)分析應(yīng)用領(lǐng)域
[應(yīng)用模型\&目的\&所需數(shù)據(jù)\&主要方法\&用戶模型\&構(gòu)建基礎(chǔ)數(shù)據(jù)倉庫\&學(xué)生與課程基本信息、問卷等基礎(chǔ)數(shù)據(jù)(例如姓名、成績、興趣、專業(yè)等)\&數(shù)據(jù)采集與存儲、
數(shù)據(jù)倉庫、云存儲、
可視化技術(shù)等\&學(xué)習(xí)者行為與情感分析
\&學(xué)生知識管理、學(xué)生行為描述與分類\&在線用戶的學(xué)習(xí)行為數(shù)據(jù)(學(xué)習(xí)偏好,瀏覽路徑,學(xué)習(xí)痕跡等交互數(shù)據(jù))\&數(shù)據(jù)倉庫技術(shù),話語分析、情緒分析等社會化分析法,學(xué)習(xí)分析儀表盤等可視化工具\&預(yù)測與評估\&預(yù)測和估計未知參數(shù)\&可以獲得的與估測變量相關(guān)的樣本數(shù)據(jù)\&分類、回歸、潛在知識發(fā)現(xiàn)等有監(jiān)督的機器學(xué)習(xí)和統(tǒng)計方法\&結(jié)構(gòu)發(fā)現(xiàn)與關(guān)系挖掘\&識別用戶模式、優(yōu)化系統(tǒng)和學(xué)習(xí)過程\&大量樣本數(shù)據(jù),數(shù)據(jù)倉庫、網(wǎng)絡(luò)采集的各種用戶、行為數(shù)據(jù)\&聚類、因子分析、社會網(wǎng)絡(luò)分析、領(lǐng)域結(jié)構(gòu)發(fā)現(xiàn)等無監(jiān)督算法,關(guān)聯(lián)規(guī)則挖掘、序列模式挖掘、模型發(fā)現(xiàn)\&趨勢分析與活動干預(yù)\&研究者感興趣的趨勢預(yù)測\&取決于研究者感興趣的問題,需要時間序列數(shù)據(jù)\&時間序列分析、隨機過程分析、話語分析、情緒分析等社會化分析法,人為干預(yù)、簡化人類判斷等\&適應(yīng)性和個性化\&提高系統(tǒng)適應(yīng)性、改善系統(tǒng)、提供個性化建議和服務(wù)\&歷史數(shù)據(jù)和學(xué)生基本信息,學(xué)習(xí)行為等數(shù)據(jù)\&內(nèi)容導(dǎo)航、推薦系統(tǒng)、web挖掘、機器學(xué)習(xí)算法\&監(jiān)督與控制\&監(jiān)督、控制、優(yōu)化、反思學(xué)習(xí)過程和情境\&分析后的數(shù)據(jù)、可視化結(jié)果\&人類判斷、可視化工具等\&]
四、大數(shù)據(jù)背景下學(xué)習(xí)分析的機遇與挑戰(zhàn)
大數(shù)據(jù)背景下,學(xué)習(xí)分析的概念、框架和應(yīng)用都會隨著大數(shù)據(jù)的創(chuàng)新而發(fā)展。同時,大數(shù)據(jù)思維方式和技術(shù)革新也給學(xué)習(xí)分析帶來了機遇和挑戰(zhàn)。
(一)大數(shù)據(jù)創(chuàng)新帶來的學(xué)習(xí)分析機遇
1. 直接的價值利益
大數(shù)據(jù)創(chuàng)新公司分為三類:基于數(shù)據(jù)的公司、基于技術(shù)的公司、基于思維的公司。大數(shù)據(jù)背景下學(xué)習(xí)分析的價值鏈創(chuàng)新也包括這三個層次的創(chuàng)新[53]。其一,學(xué)習(xí)管理系統(tǒng)和在線平臺上采集的學(xué)習(xí)者相關(guān)數(shù)據(jù)本身具有很大的價值?;跀?shù)據(jù)本身的數(shù)據(jù)公司, 它們沒有能力或者側(cè)重點不在分析數(shù)據(jù)上,它們可以直接出售數(shù)據(jù)給第三方。其二,處理大數(shù)據(jù)的云計算、物聯(lián)網(wǎng)等先進技術(shù)掌握在少量高科技公司手中。它們掌握了技術(shù)但缺乏數(shù)據(jù),主要通過專業(yè)的分析技術(shù)獲得利益。其三,學(xué)習(xí)分析是一種社會化分析,自適應(yīng)、個性化的學(xué)習(xí)需求是推動學(xué)習(xí)分析的真正動力?;谒季S創(chuàng)新的公司通過學(xué)習(xí)分析創(chuàng)造新的需求和服務(wù)模式,從模式創(chuàng)新中獲得利益。
2. 學(xué)習(xí)與教育方式的革新
數(shù)字媒體和分析技術(shù)的發(fā)展,使學(xué)習(xí)和教育方式日趨多元化和立體化。學(xué)習(xí)分析也逐漸融合到在線學(xué)習(xí)、混合式學(xué)習(xí)、協(xié)同學(xué)習(xí)、虛擬化學(xué)習(xí)中。學(xué)習(xí)分析強調(diào)基于上下文情境和人為干預(yù),重視適應(yīng)性和個性化服務(wù),要求環(huán)境與用戶、教與學(xué)良好互動,是智能教學(xué)的最佳實踐。例如,大規(guī)模開放課程平臺中,利用學(xué)習(xí)分析技術(shù)挖掘用戶信息,根據(jù)用戶興趣推薦課程和資料;翻轉(zhuǎn)課堂和游戲化學(xué)習(xí)過程中,學(xué)習(xí)分析儀表盤上的結(jié)果使學(xué)習(xí)者能夠根據(jù)目標和學(xué)習(xí)習(xí)慣主動學(xué)習(xí)。
3. 對其他學(xué)習(xí)科學(xué)的影響
學(xué)習(xí)分析對其他學(xué)習(xí)科學(xué)的研究具有積極影響。學(xué)術(shù)分析、教育數(shù)據(jù)挖掘與學(xué)習(xí)分析交叉融合,它們的方法和思想很多時候可以互相借鑒。學(xué)習(xí)分析融入MOOCs學(xué)習(xí)環(huán)境、學(xué)習(xí)管理系統(tǒng)、智能導(dǎo)師系統(tǒng),使這些系統(tǒng)更加智能化。游戲和游戲化學(xué)習(xí)、翻轉(zhuǎn)課堂、多模態(tài)學(xué)習(xí)、量化自我等學(xué)習(xí)科學(xué)領(lǐng)域的新技術(shù)同樣受學(xué)習(xí)分析技術(shù)的影響。
(二)大數(shù)據(jù)時代學(xué)習(xí)分析面臨的挑戰(zhàn)
大數(shù)據(jù)時代的學(xué)習(xí)分析數(shù)據(jù)多源異構(gòu)、分布廣泛、動態(tài)增長[54];大數(shù)據(jù)背景下的學(xué)習(xí)分析需要強大的數(shù)據(jù)存儲與分析能力;大數(shù)據(jù)視角下的學(xué)習(xí)分析關(guān)注用戶需求,以服務(wù)為中心;大數(shù)據(jù)管理思維下的法律和制度尚待完善。正是這些問題,使大數(shù)據(jù)時代的學(xué)習(xí)分析面臨挑戰(zhàn)。
1. 數(shù)據(jù)與技術(shù)挑戰(zhàn)
海量的、非結(jié)構(gòu)化的學(xué)習(xí)軌跡數(shù)據(jù),難以被典型數(shù)據(jù)庫軟件工具捕捉、儲存、管理和分析,大數(shù)據(jù)技術(shù)創(chuàng)新才能解決學(xué)習(xí)分析中的基礎(chǔ)問題。數(shù)據(jù)與技術(shù)挑戰(zhàn),就是指選取什么數(shù)據(jù),建立什么模型,如何處理數(shù)據(jù)的問題。首先,雖然大數(shù)據(jù)關(guān)注的是數(shù)據(jù)的關(guān)系而非因果,但因為系統(tǒng)的復(fù)雜性,混沌世界發(fā)現(xiàn)的規(guī)律常常出現(xiàn)“蝴蝶效應(yīng)”,如果不加選擇地利用不合理的數(shù)據(jù),讓數(shù)據(jù)主宰人類決策,必將導(dǎo)致荒謬。其次,被廣泛接受和檢驗的整體框架仍然有待完善,針對特定情境、特定問題、特定用戶的學(xué)習(xí)分析模型和實現(xiàn)較為稀缺。怎樣定義問題,如何選擇模型,選擇哪種算法更有效,這些都是開放的問題。最后,云計算等大數(shù)據(jù)關(guān)鍵技術(shù)尚不成熟,在大數(shù)據(jù)存儲、計算方面還存在很多問題,這些問題也是學(xué)習(xí)分析的主要技術(shù)挑戰(zhàn)。
2. 制度和管理能力限制
學(xué)習(xí)分析不是純粹的技術(shù)問題,還涉及人的干預(yù)和優(yōu)化。制度和管理技能方面的缺陷,直接制約學(xué)習(xí)分析的應(yīng)用。其一,學(xué)習(xí)分析需要花費大量的人力、物力,高額的成本對于一般教育機構(gòu)來說難以接受。其二,學(xué)習(xí)分析需要聰明的消費者來使用數(shù)據(jù),傳統(tǒng)的教師和管理者可能不具備分析和使用數(shù)據(jù)的能力,甚至抵觸學(xué)習(xí)分析工具的使用。其三,學(xué)習(xí)和教育是一個社會化過程,研究和發(fā)展適應(yīng)性和個性化的分析方案是學(xué)習(xí)分析的永恒話題。
3. 道德與安全挑戰(zhàn)
大數(shù)據(jù)背景下的學(xué)習(xí)分析,面臨道德與安全的挑戰(zhàn)。學(xué)習(xí)分析的道德與安全挑戰(zhàn)分為三類:數(shù)據(jù)位置和數(shù)據(jù)解釋問題;許可、隱私管理和匿名化問題;數(shù)據(jù)分類和管理問題[55]。學(xué)習(xí)分析需要獲取用戶信息,管理用戶數(shù)據(jù),不可避免會涉及用戶隱私。另外,和學(xué)習(xí)分析相關(guān)的法律制度、道德引導(dǎo)、安全技術(shù)尚未明晰。例如,google曾因為使用 Apps for Education套件掃描了數(shù)以百萬計的學(xué)生的電子郵件信息,并將之用于創(chuàng)建“隱蔽”的廣告配置文件而遭起訴。
五、總結(jié)與展望
大數(shù)據(jù)的管理思維變革給學(xué)習(xí)分析帶來了機遇和挑戰(zhàn)。隨著云教育平臺、MOOCs等的應(yīng)用,學(xué)習(xí)分析的形式和應(yīng)用將更加廣泛。學(xué)習(xí)分析是教育信息化的新浪潮,在應(yīng)用中存在各種挑戰(zhàn)。面對這些挑戰(zhàn),需要將信息化技術(shù)與教學(xué)過程結(jié)合起來,制定明晰的使用規(guī)范和管理制度,注重數(shù)據(jù)安全與隱私保 護[56][57]。傳統(tǒng)教與學(xué)方式的轉(zhuǎn)變需要一個過程,學(xué)習(xí)分析技術(shù)的大規(guī)模應(yīng)用需要利益相關(guān)者的共同努力。
[參考文獻]
[1][16] JOHNSON L, ADAMS BECKER S, WITCHEY H, et al. The NMC Horizon Report: 2011 Museum Edition [J]. Austin, Texas: The New Media Consortium, 2011.
[2][17] JOHNSON L, ADAMS S, CUMMINS M, et al. The NMC horizon report: 2013 higher education edition [J]. 2013.
[3] JOHNSON L, ADAMS S, CUMMINS M, et al. The NMC horizon report: 2012 higher education edition, Austin [J].http://www.nmc org/publications/2013-horizon-report-higher-ed, 2013.
[4] 劉永貴,鄭旭東. 美國高等教育信息化的進展與趨勢——EDUCASUE 年度高等教育信息化十大戰(zhàn)略議題解讀 [J]. 開放教育研究,2009,14(6):122-126.
[5][26][29][34] SIEMENS G, D BAKER R S. Learning analytics and educational data mining: towards communication and collaboration; proceedings of the Proceedings of the 2nd international conference on learning analytics and knowledge, F, 2012 [C]. ACM.
[6][11][14][18][30][36][48][49] 吳永和,陳丹,馬曉玲,et al. 學(xué)習(xí)分析:教育信息化的新浪潮 [J]. 遠程教育雜志,2013,31(4):11-19.
[7] 顧小清,張進良,蔡慧英. 學(xué)習(xí)分析: 正在浮現(xiàn)中的數(shù)據(jù)技術(shù)[J]. 遠程教育雜志,2012(1):18-25.
[8] 李青,王濤. 學(xué)習(xí)分析技術(shù)研究與應(yīng)用現(xiàn)狀述評 [J]. 中國電化教育,2012(8):129-133.
[9] 馬曉玲,邢萬里,馮翔. 學(xué)習(xí)分析系統(tǒng)構(gòu)建研究 [J]. 華東師范大學(xué)學(xué)報(自然科學(xué)版),2014.
[10][46] 魏順平. 學(xué)習(xí)分析技術(shù),挖掘大數(shù)據(jù)時代下教育數(shù)據(jù)的價 值[J]. 現(xiàn)代教育技術(shù),2013,(2):5-11.
[12] 祝智庭,沈德梅. 學(xué)習(xí)分析學(xué)智慧教育的科學(xué)力量[J]. 電化教育研究,2013,5(03).
[13][51] 張羽,李越. 基于 MOOCs 大數(shù)據(jù)的學(xué)習(xí)分析和教育測量介紹 [J]. 清華大學(xué)教育研究,2013,(4):22-26.
[15][25] SIEMENS G, LONG P. Penetrating the fog: Analytics in learning and education [J]. Educause Review, 2011, 46(5): 30-32.
[19] VAN BARNEVELD A, ARNOLD K E, CAMPBELL J P. Analytics in higher education: Establishing a common language [J]. EDUCAUSE Learning Initiative, 2012.
[20][22][33][56] FERGUSON R. The state of learning analytics in 2012: A review and future challenges [J]. Knowledge Media Institute, Technical Report KMI-2012, 2012, 1(2012.
[27][35] BAKER R, SIEMENS G. Educational data mining and learning analytics [J]. Cambridge Handbook of the Learning Sciences:, 2014.
[28] BEHREND T S, WIEBE E N, LONDON J E, et al. Cloud computing adoption and usage in community colleges [J]. Behaviour & Information Technology, 2011, 30(2): 231-40.
[31][32] 魏雪峰,宋靈青. 學(xué)習(xí)分析:更好地理解學(xué)生個性化學(xué)習(xí)過程——訪談學(xué)習(xí)分析研究專家 George Siemens 教授 [J]. 中國電化教育,2013,(9):1-4.
[37][54] 孟小峰,慈祥. 大數(shù)據(jù)管理:概念,技術(shù)與挑戰(zhàn) [J]. 計算機研究與發(fā)展,2013,50(1):146-169.
[38] BROWN M. Learning analytics: the coming third wave [J]. EDUCAUSE Learning Initiative Brief, 2011, 1-4.
[39] SIEMENS G. What are learning analytics [J]. Retrieved March, 10(2011).
[40] ELIAS T. Learning analytics: Definitions, processes and potential [J]. Learning, 2011, 23(134-148).
[41] GRELLER W, DRACHSLER H. Translating learning into numbers: A generic framework for learning analytics [J]. 2012.
[43] IFENTHALER D, WIDANAPATHIRANA C. Development and Validation of a Learning Analytics Framework: Two Case Studies Using Support Vector Machines [J]. Technology, Knowledge and Learning, 1-20.
[45][47] SIEMENS G, GASEVIC D, HAYTHORNTHWAITE C, et al. Open Learning Analytics: an integrated & modularized platform [J]. Proposal to design, implement and evaluate an open platform to integrate heterogeneous learning analytics techniques, 2011.
[52][57] BIENKOWSKI M, FENG M, MEANS B. Enhancing teaching and learning through educational data mining and learning analytics: An issue brief [J]. US Department of Education, Office of Educational Technology, 2012, 1-57.
[53] 維克托,邁爾,肯尼思,et al. 大數(shù)據(jù)時代——生活,工作與思維的大變革 [M]. 杭州:浙江人民出版社,2013.
[55] SLADE S, PRINSLOO P. Learning Analytics Ethical Issues and Dilemmas [J]. American Behavioral Scientist, 2013, 57(10): 1510-1529.
收稿日期:2014-11-15
作者簡介:王良周,研究生;于衛(wèi)紅,副教授,博士。大連海事大學(xué)交通運輸管理學(xué)院(116026)。
責(zé)任編輯 石 子
責(zé)任校對 石 子