李葆萍 周 穎
?
基于大數(shù)據(jù)的教學(xué)評價研究*
李葆萍 周 穎
(北京師范大學(xué)教育技術(shù)學(xué)院,北京 100088)
文章基于教育大數(shù)據(jù)的視角,結(jié)合教育評價活動的轉(zhuǎn)型,對教育大數(shù)據(jù)的采集、可視化分析與呈現(xiàn)技術(shù)等開展了研究。文章認(rèn)為,教育大數(shù)據(jù)技術(shù)推動了教育評價中數(shù)據(jù)驅(qū)動決策的實現(xiàn),為多方參與教育評價、實現(xiàn)發(fā)展性學(xué)生評估提供了良好的支持。平板電腦、數(shù)碼筆、可穿戴設(shè)備等能夠?qū)崟r地將不同類型的學(xué)習(xí)數(shù)據(jù)數(shù)字化,實現(xiàn)了對學(xué)生學(xué)習(xí)全過程數(shù)據(jù)的采集,為教育領(lǐng)域中實現(xiàn)基于數(shù)據(jù)分析與理性證據(jù)的教育評估與決策提供了數(shù)據(jù)基礎(chǔ)。各類可視化分析工具能夠在稀疏的教育大數(shù)據(jù)中過濾、挖掘各類隱含的教育信息和規(guī)律,幫助我們理解學(xué)生個人知識體系的構(gòu)建過程,探索學(xué)生個體的社會學(xué)習(xí)網(wǎng)絡(luò)的演化規(guī)律,揭示教育事件在特定時空呈現(xiàn)的特征。
教育大數(shù)據(jù);教育評價;發(fā)展性評估;數(shù)據(jù)采集;可視化分析
數(shù)據(jù)(Data)是按照一定規(guī)則排列組合的物理符號,可以表現(xiàn)為符號、文字、數(shù)字、語音、圖像、視頻等形式,是信息的表現(xiàn)形式和載體。2001年高德納咨詢公司在研究報告中指出,人類社會數(shù)據(jù)爆炸從三個維度展開:一是同一類型的數(shù)據(jù)量在快速增大,二是數(shù)據(jù)增長的速度在加快,三是數(shù)據(jù)的來源和新的數(shù)據(jù)種類在不斷增加——上述事實清楚地說明人類真正進入到了大數(shù)據(jù)時代[1]。
關(guān)于大數(shù)據(jù)的定義暫時還沒有達(dá)成共識,現(xiàn)存的定義主要從大數(shù)據(jù)具備的性質(zhì)出發(fā)進行界定。目前,研究界認(rèn)可的是大數(shù)據(jù)應(yīng)當(dāng)滿足3V特點,即規(guī)模性(Volume)、多樣性(Variety)和高速性(Velocity)[2];隨后,不同的機構(gòu)將其擴展成為4V,如IBM提出的準(zhǔn)確性(Veracity)以及IDC提出的價值性(Value)等[3]。大數(shù)據(jù)立足于對大量數(shù)據(jù)的深度挖掘與科學(xué)分析,尋求數(shù)據(jù)背后的隱含關(guān)系與價值,使得人們可以從基于小樣本數(shù)據(jù)的推測或基于感性的偏好性選擇轉(zhuǎn)向基于數(shù)據(jù)分析與理性證據(jù)的決策[4]。當(dāng)前,大數(shù)據(jù)正不斷地深入教育領(lǐng)域,對一些“數(shù)據(jù)密集型”的教育業(yè)務(wù)如考試、學(xué)習(xí)分析等產(chǎn)生了強勁的沖擊。
教育評價指的是在系統(tǒng)、科學(xué)、全面地搜集、整理、處理和分析教育信息的基礎(chǔ)上,對教育的價值做出判斷的過程。從個人層面來看,教育評價的目的在于了解學(xué)生的發(fā)展情況,對學(xué)生的學(xué)習(xí)情況進行客觀總結(jié)、對教師的教學(xué)質(zhì)量進行評估;從宏觀來看,評價的目的更在于促進教育改革,提高整個國家的教育質(zhì)量[5]。我國《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010-2020年)》指出:“要改進教育教學(xué)評價,根據(jù)培養(yǎng)目標(biāo)和人才理念,建立科學(xué)、多樣的評價標(biāo)準(zhǔn)。開展由政府、學(xué)校、家長及社會各方面參與的教育質(zhì)量評價活動。做好學(xué)生成長記錄,完善綜合素質(zhì)評價,探索促進學(xué)生發(fā)展的多種評價方式?!泵绹?010年發(fā)布的《國家教育技術(shù)計劃》()中強調(diào)各級各類教育系統(tǒng)要利用技術(shù)來測量、評價學(xué)習(xí)過程,教育管理者應(yīng)該利用技術(shù)來收集學(xué)習(xí)過程中的實時數(shù)據(jù),為持續(xù)改善學(xué)習(xí)效果提供依據(jù)[6]。
中美兩國的重要教育文件都揭示了教育評價在整個國家教育系統(tǒng)中的重要地位,并預(yù)示著教育評價將在理念、內(nèi)容、方式等方面的轉(zhuǎn)型取向,在現(xiàn)代教育價值趨于多元化的基礎(chǔ)上,教育評價方式面臨全面轉(zhuǎn)變的現(xiàn)實需要[7]。這種轉(zhuǎn)變主要表現(xiàn)在如下方面:①做好學(xué)生成長記錄、收集學(xué)生學(xué)習(xí)過程中的實時數(shù)據(jù)等評價措施的提出,體現(xiàn)了評價理念從以往“經(jīng)驗主義”向“數(shù)據(jù)主義”轉(zhuǎn)變的趨勢;②完善綜合素質(zhì)評價、探索促進學(xué)生發(fā)展的多種評價方式以及提供持續(xù)改善學(xué)習(xí)效果等評價目標(biāo)的提出,體現(xiàn)了評價內(nèi)容從以往注重認(rèn)知水平的“總結(jié)性評價”向綜合素養(yǎng)的“發(fā)展性評價”轉(zhuǎn)變的趨勢;③政府、學(xué)校、家長及社會各方面參與的評價主體的提出,體現(xiàn)了評價方式從“單一封閉”向“多元開放”轉(zhuǎn)變的趨勢。事實上,上述教育評價的轉(zhuǎn)型并非全新的理念和思想。依據(jù)數(shù)據(jù)所提供的證據(jù)進行判定是實證主義的基本思想,發(fā)展性原則一直是教育評價本身應(yīng)有之義,學(xué)生的自我評價、家長的校外評價[8]也是很多學(xué)校采取的評價方式之一。然而近幾年來,這些思想在國家教育綱要性文件中被顯著地提及,說明其在過去落實的力度欠缺,或者說直至今日這些思想的落實方才具備可操作性的條件,這就是現(xiàn)代信息技術(shù)和大數(shù)據(jù)在教育領(lǐng)域中應(yīng)用的用武之地。
教育評價是為了讓我們更好地了解學(xué)生、審視我們的課堂和教學(xué)過程。在傳統(tǒng)的教育環(huán)境下,了解學(xué)生的主要方法為問卷調(diào)查、課堂行為觀察、考試、作業(yè)分析等。這些方法存在著耗時長、數(shù)據(jù)不準(zhǔn)確、過程型數(shù)據(jù)遺漏或者無法采集等多種弊端,建立在這種不完整數(shù)據(jù)之上所獲得的分析結(jié)果只能揭示某些特定的問題,缺乏綜合性。此外,不同來源的數(shù)據(jù)之間難以整合,因為采集成本等原因,獲得的數(shù)據(jù)缺少持續(xù)性,導(dǎo)致數(shù)據(jù)內(nèi)部隱含的信息連接被割裂。比如學(xué)生作業(yè)水平和學(xué)生課堂學(xué)習(xí)行為之間的所存在關(guān)系的挖掘;學(xué)生閱讀能力對其數(shù)學(xué)學(xué)科表現(xiàn)的影響分析等都難以實現(xiàn)。因而教師往往只能根據(jù)經(jīng)驗來處理教學(xué)問題,這些都對于科學(xué)、精準(zhǔn)地了解學(xué)生,做出教學(xué)決策甚至制定教育政策造成不利影響。教育大數(shù)據(jù)的應(yīng)用則為克服現(xiàn)有教育評價中的不足提供了效果良好的解決方案。
1 大數(shù)據(jù)推動數(shù)據(jù)驅(qū)動的教學(xué)決策
數(shù)據(jù)驅(qū)動決策在教育中是指收集、分析、報告和使用數(shù)據(jù)用于教育教學(xué)改進的過程[9]。比如美國普渡大學(xué)的“課程信號燈”(Course Signals)項目是國際知名的大數(shù)據(jù)診斷學(xué)生、提供教育決策的典型案例之一[10]。如圖1所示,“課程信號燈”系統(tǒng)主要以成果算法為基礎(chǔ),對學(xué)生課程表現(xiàn)、課程努力程度、前期學(xué)業(yè)歷史、學(xué)習(xí)者特征等數(shù)據(jù)進行采集和計算,實現(xiàn)對課程的實時預(yù)測。預(yù)測結(jié)果將通過紅、黃、綠三種顏色信號燈的形式,呈現(xiàn)在學(xué)生的學(xué)習(xí)頁面以及教師的課程控制頁面中——紅燈表示課程學(xué)習(xí)中存在極大的失敗可能性;黃燈表示在課程學(xué)習(xí)中存在一定的問題,有失敗的可能;綠燈表示學(xué)習(xí)成功的幾率很高。根據(jù)不同的信號顯示,教師通過發(fā)送電子郵件、短信以及面談等方式對學(xué)生學(xué)習(xí)進行適當(dāng)?shù)母深A(yù),還可以通過“課程信號燈”系統(tǒng)自帶的推薦學(xué)習(xí)導(dǎo)師與學(xué)習(xí)資源模塊,對學(xué)習(xí)者學(xué)習(xí)提供適當(dāng)?shù)膸椭?,以促進其在課程學(xué)習(xí)中取得成功。
2 大數(shù)據(jù)促進了學(xué)生發(fā)展性評估
早在1940年,美國史密斯—泰勒報告中就指出教育評價不能只測量學(xué)生的某些能力和特征,而應(yīng)該根據(jù)教育目標(biāo)來評價學(xué)生發(fā)展及成長的進程和水平,這是發(fā)展性評價理念在現(xiàn)代教育評價中的確立。發(fā)展性評價是指通過系統(tǒng)地搜集評價信息和進行分析,對學(xué)生的教育活動進行價值判斷,實現(xiàn)其發(fā)展目標(biāo)的過程。發(fā)展性評估主要發(fā)揮評價診斷的功能,突出評價的過程,重視學(xué)生的個性差異,因此,其往往要和學(xué)生的學(xué)習(xí)過程緊密結(jié)合,進行長期追蹤。如北京、成都、深圳等地的中小學(xué)校,以發(fā)展性評價理念為指導(dǎo),持續(xù)跟蹤學(xué)生歷次考試成績,通過時間序列分析、聚類分析等手段,對學(xué)生的學(xué)習(xí)數(shù)據(jù)進行挖掘,構(gòu)建學(xué)生的學(xué)科知識地圖,進行學(xué)習(xí)風(fēng)格和學(xué)習(xí)行為分析,最終完成對每個學(xué)生的學(xué)習(xí)力診斷[11]。
2015年成立的北京市未來教育高精尖創(chuàng)新中心,正致力于利用學(xué)生學(xué)習(xí)全過程的大數(shù)據(jù)分析,幫助學(xué)生發(fā)現(xiàn)并提升優(yōu)勢學(xué)科、診斷和補救劣勢學(xué)科,以適應(yīng)新型的學(xué)生評價機制,實現(xiàn)個性化、差異化的學(xué)生發(fā)展目標(biāo)。
3 大數(shù)據(jù)提供了多方參與評價的途徑
過去的學(xué)生評價主要是針對學(xué)生的學(xué)業(yè)水平測試,評價主要由學(xué)校相關(guān)部門和教師完成,整個評價體系呈現(xiàn)出封閉性的特征。當(dāng)前強調(diào)學(xué)生的發(fā)展性評價和綜合素質(zhì)評價,評價活動貫穿學(xué)生的整個學(xué)習(xí)過程,覆蓋學(xué)生在校園內(nèi)外的學(xué)習(xí)活動和行為表現(xiàn)。多種來源、結(jié)構(gòu)不同的數(shù)據(jù)匯總將用來分析學(xué)生的綜合素質(zhì),并通過數(shù)據(jù)的不斷積累,使各類參數(shù)和模型得以確立,以提高分析的精確性??梢娊逃髷?shù)據(jù)直接產(chǎn)生于各種教育活動(包括教學(xué)活動、管理活動、科研活動、校園活動等),每個教育利益相關(guān)者既是教育數(shù)據(jù)的生產(chǎn)者也是教育數(shù)據(jù)的消費者[12],基于開放性大數(shù)據(jù)的評價活動,為那些能夠掌握和提供學(xué)生不同情境下學(xué)習(xí)數(shù)據(jù)的多方主體共同參與評價活動架設(shè)了橋梁??梢哉f,數(shù)據(jù)是驅(qū)動教育評估轉(zhuǎn)型變革的核心因素。研究認(rèn)為,從用戶的視角來看,在教育評價活動中很容易從數(shù)據(jù)的入口和使用,即數(shù)據(jù)的采集和分析兩個方面感受到大數(shù)據(jù)帶來的變化。
1 教學(xué)評價數(shù)據(jù)的采集類型
2013年頒布的《教育部關(guān)于推進中小學(xué)教育質(zhì)量綜合評價改革的意見》強調(diào)要改革評價方式,將定量與定性評價相結(jié)合,注重全面客觀地收集信息,根據(jù)數(shù)據(jù)和事實進行分析判斷[13]。該意見說明,教育質(zhì)量評價不再單一地依托考試成績,而是要將學(xué)生發(fā)展的所有信息收集、整理、分析并得出結(jié)論性的認(rèn)識,也就是說要基于“數(shù)據(jù)”和“證據(jù)”對教育質(zhì)量做出評價[14]。在當(dāng)前倡導(dǎo)的以學(xué)生為中心的學(xué)習(xí)環(huán)境中,學(xué)生學(xué)習(xí)“數(shù)據(jù)”和“證據(jù)”的主要產(chǎn)生途徑如圖1所示。其中,學(xué)生在學(xué)校內(nèi)外的學(xué)習(xí)過程數(shù)據(jù)包括學(xué)習(xí)交互、學(xué)習(xí)行為、學(xué)習(xí)路徑、各類過程性學(xué)習(xí)檔案等,學(xué)習(xí)者個性數(shù)據(jù)則包括學(xué)生的生理、情感、認(rèn)知狀態(tài)數(shù)據(jù)等,以及各類以考試、作業(yè)、作品等形式展現(xiàn)的學(xué)習(xí)成果。
2 教學(xué)評價數(shù)據(jù)的采集技術(shù)
為了實現(xiàn)“數(shù)據(jù)”+“證據(jù)”為基礎(chǔ)的教育評價,學(xué)校采取了很多評價數(shù)據(jù)采集措施,如考試、問卷、作業(yè)檔案袋等。然而這類信息多是采集學(xué)生的學(xué)習(xí)結(jié)果信息或者狀態(tài)信息(如學(xué)習(xí)風(fēng)格),屬于靜態(tài)信息,而學(xué)生在學(xué)習(xí)過程中實時產(chǎn)生的諸多動態(tài)信息如學(xué)習(xí)路徑、學(xué)習(xí)行為等未能實現(xiàn)有效采集。不完整的數(shù)據(jù)采集勢必會影響評價結(jié)果的準(zhǔn)確度和可信度,也會制約大數(shù)據(jù)下教育評價的實施,因而教育全過程數(shù)據(jù)的采集研究是大數(shù)據(jù)應(yīng)用與教育評價的關(guān)鍵要素。
目前,智能學(xué)習(xí)環(huán)境以及具有數(shù)據(jù)采集能力的學(xué)習(xí)終端如平板電腦、智能手機、數(shù)碼筆、可穿戴設(shè)備等的應(yīng)用,為破解學(xué)生學(xué)習(xí)數(shù)據(jù)采集難題提供了技術(shù)方案。
圖1 學(xué)生學(xué)習(xí)大數(shù)據(jù)來源
圖2 數(shù)碼筆結(jié)構(gòu)圖
平板電腦是一種便攜的智能設(shè)備,很多學(xué)校將其配備給學(xué)生開展數(shù)字化學(xué)習(xí)。通過平板電腦中電子教材系統(tǒng)、數(shù)字資源系統(tǒng)、作業(yè)與考試系統(tǒng)和互動交流系統(tǒng)可以記錄和生成學(xué)習(xí)行為大數(shù)據(jù)[15],主要包括海量的學(xué)習(xí)內(nèi)容序列節(jié)點數(shù)據(jù)、海量的學(xué)習(xí)資源序列節(jié)點數(shù)據(jù)、海量的練習(xí)評測序列節(jié)點數(shù)據(jù)和海量的互動交流序列節(jié)點數(shù)據(jù)等。這些數(shù)據(jù)涵蓋了學(xué)生在學(xué)習(xí)過程中所產(chǎn)生的所有學(xué)習(xí)行為數(shù)據(jù),再結(jié)合平板電腦環(huán)境感知數(shù)據(jù)能夠?qū)W(xué)生進行多元深層次評價,從而發(fā)現(xiàn)學(xué)生真正的不足和潛能。
一些學(xué)校也嘗試在學(xué)生最自然的紙筆環(huán)境下采集學(xué)習(xí)數(shù)據(jù),而數(shù)碼筆可以幫助實現(xiàn)這樣的目標(biāo)。如圖2所示,數(shù)碼筆與普通筆的外形和使用方法完全一致,所不同的是數(shù)碼筆內(nèi)置高速攝像機,書寫時壓力傳感器可以把筆尖的信息傳遞到攝像機,從而實時記錄和采集筆跡的軌跡。利用數(shù)碼筆可以實時記錄學(xué)生在紙筆環(huán)境下的學(xué)習(xí)行為,并對學(xué)生的學(xué)習(xí)狀態(tài)和教師教學(xué)提供診斷信息。如數(shù)碼筆采集的XXX同學(xué)在語文課堂學(xué)習(xí)文言文的記錄和診斷信息如下:
XXX同學(xué)從45秒處畫了個小人。1分50秒點斷第一段結(jié)束,2分50秒開始點斷第二段,估計是一分鐘通讀。3分30秒點斷結(jié)束,同時有回看,將前邊疑難斷點點出,說明其有回看意識和整合文段的意識。4分49秒翻頁,第一篇點斷完畢。
5分15秒完成第二篇第一段點斷,同時有回讀。6分32秒大體完成第二篇點斷,7分52秒回到第一頁。此后一直沒有動作,直到教師朗讀指令發(fā)出。16分59秒開始畫小人,18分50秒小人畫完,同時還完善了前邊畫的小人,說明這2分鐘該生在走神。
22分20秒開始翻譯,翻譯速度很快,“就之而不見所畏焉”一句不會翻譯,主要是不了解此話所代表的含意,缺少認(rèn)知背景。
數(shù)碼筆也可以在教師批閱作業(yè)或試卷的同時,將每個學(xué)生的平時作業(yè)及考試信息以數(shù)字化的方式記錄下來,結(jié)合課堂學(xué)習(xí)行為表現(xiàn)能夠為學(xué)生和教師提供個性化的評價和學(xué)習(xí)分析診斷。
學(xué)生學(xué)習(xí)的全過程大數(shù)據(jù)除了我們熟知的課堂中的學(xué)習(xí)數(shù)據(jù)以外,還包括課堂外學(xué)習(xí)數(shù)據(jù)和學(xué)生的個人生活、心理等狀態(tài)數(shù)據(jù)。盡管人們早已認(rèn)識到這類數(shù)據(jù)的重要性,但現(xiàn)實中卻難以精準(zhǔn)采集這類數(shù)據(jù)。學(xué)習(xí)分析專家Siemens教授指出,學(xué)習(xí)分析所需的數(shù)據(jù)主要來源于學(xué)習(xí)管理系統(tǒng)、鍵盤數(shù)據(jù)、瀏覽器數(shù)據(jù)等學(xué)生操作電腦的數(shù)據(jù),缺少對現(xiàn)實情境中學(xué)習(xí)過程數(shù)據(jù)的捕捉,從而導(dǎo)致分析者難以深入了解學(xué)習(xí)和教學(xué)過程[16]。2007年凱文·凱利提出了量化自我的概念,就是用實時測量或記錄的方法,測試、量化和記錄個人的生命數(shù)據(jù)(如飲食、運動、睡眠、情緒等),并通過數(shù)據(jù)反饋進行自我調(diào)整[17]。量化自我概念的提出和大數(shù)據(jù)密切相關(guān),其中傳感器網(wǎng)絡(luò)、可穿戴技術(shù)、移動終端等對量化自我起關(guān)鍵作用。
教育領(lǐng)域也可使用RFID芯片、眼動儀以及可穿戴設(shè)備如各種手環(huán)等技術(shù),真實地采集學(xué)生在教室內(nèi)外的學(xué)習(xí)信息和學(xué)生的日常行為數(shù)據(jù),供精確化學(xué)習(xí)分析和個性化教育評估與管理的使用。如眼動技術(shù)通過對眼動軌跡的記錄,從中提取諸如注視點、注視時間和次數(shù)、眼跳距離、瞳孔大小等數(shù)據(jù),從而研究個體的內(nèi)在認(rèn)知過程。有研究就采用眼動儀采集2~3歲嬰幼兒對圖畫書頁面區(qū)域的注視點個數(shù)、注視注視點時間長度、回視等行為數(shù)據(jù)和生理數(shù)理,用來評估其圖畫書閱讀的注意力水平、閱讀喜好、讀圖能力、閱讀理解能力等[18]。手環(huán)等設(shè)備則可以實時地記錄學(xué)生的位置信息、運動數(shù)據(jù)和身體健康指標(biāo)等,可以隨時將這些數(shù)據(jù)與學(xué)生的學(xué)業(yè)表現(xiàn)關(guān)聯(lián),用來分析、預(yù)測不同類型學(xué)生的學(xué)習(xí)表現(xiàn)和發(fā)展。
采集到教育大數(shù)據(jù)以后,需要通過數(shù)據(jù)挖掘和分析技術(shù)來提取數(shù)據(jù)中蘊含的教學(xué)信息以便開展教學(xué)評價。除了常規(guī)的教育統(tǒng)計手段外,還可對大數(shù)據(jù)構(gòu)成的數(shù)據(jù)立方體進行多維度的下鉆或上卷操作以提煉出更深層次的知識需求,促使聚類分析和關(guān)聯(lián)分析等數(shù)據(jù)挖掘技術(shù)越來越多地應(yīng)用于學(xué)生的教學(xué)評價當(dāng)中。
如根據(jù)歷次試題答題情況對學(xué)生進行聚類分析,可以確定學(xué)生的基本類型并幫助甄別表現(xiàn)異常的學(xué)生。若聚類結(jié)果發(fā)現(xiàn)部分學(xué)生多次解答難度高的題目能夠保持正確,而難度低的題目錯誤率較高,可能這部分學(xué)生是因為粗心造成,可以對其答題注意力狀態(tài)進行輔導(dǎo);部分學(xué)生若長期聚類在同一知識點答題正確率起伏較大的區(qū)間,則可能這部分學(xué)生存在抄襲或者隨意選擇的情況,可以進一步關(guān)聯(lián)其它數(shù)據(jù)對其進行分析和診斷。再如對學(xué)科不同知識點得分情況進行關(guān)聯(lián)和回歸分析,就能精準(zhǔn)地進行教學(xué)歸因分析,如B知識點得分低,是因為A知識點得分低,那么應(yīng)當(dāng)先解決A知識點的學(xué)習(xí)問題等。
上述這些數(shù)據(jù)分析很多是基于結(jié)構(gòu)性數(shù)據(jù)的分析,它能夠確定或者否定我們對教學(xué)問題的預(yù)期性判斷。然而教育大數(shù)據(jù)具有非結(jié)構(gòu)化、稀疏性等特征,難以像結(jié)構(gòu)化數(shù)據(jù)的方式構(gòu)建出其內(nèi)部的正式關(guān)系,或者使用先驗的模型來進行分析,這就需要我們在教學(xué)評價領(lǐng)域引入新的數(shù)據(jù)分析技術(shù)。在當(dāng)前大數(shù)據(jù)環(huán)境下,信息可視化分析可以通過可視化圖形呈現(xiàn)數(shù)據(jù)中隱含的信息和規(guī)律,建立起符合人類的認(rèn)知規(guī)律的心理映像,成為人們分析復(fù)雜問題的強有力工具[19]。
教育領(lǐng)域中的大數(shù)據(jù)主要包括師生基本信息數(shù)據(jù)、課業(yè)測試與作業(yè)數(shù)據(jù)、校園實錄數(shù)據(jù),課程資源數(shù)據(jù)[20]、課外學(xué)習(xí)數(shù)據(jù)、學(xué)生身體健康數(shù)據(jù)、社會行為數(shù)據(jù)等。這些數(shù)據(jù)主要以文本、網(wǎng)絡(luò)(圖)、時空數(shù)據(jù)等信息類型呈現(xiàn),基于大數(shù)據(jù)的學(xué)習(xí)評估可以引入相應(yīng)的可視化分析工具。
使用文本可視化分析工具,能夠?qū)⑽谋局刑N含的語義特征(如詞頻與重要度、邏輯結(jié)構(gòu)、主題聚類、動態(tài)演化規(guī)律等)直觀地展示出來??梢允褂没谖谋镜恼Z義結(jié)構(gòu)可視化技術(shù),以樹形結(jié)構(gòu)或者放射性層次圓環(huán)結(jié)構(gòu)來展示文本結(jié)構(gòu)、文本相似度統(tǒng)計、修辭結(jié)構(gòu)以及相應(yīng)的文本內(nèi)容等。還可以結(jié)合文本的空間、時間屬性,進一步展示主題的合并和分支關(guān)系以及演變,并借助文本可視化分析工具,通過大數(shù)據(jù)對學(xué)生知識點和學(xué)科知識體系的評估,能夠迅速了解學(xué)生的知識掌握狀態(tài)以及學(xué)生個人知識體系的發(fā)展進化狀態(tài)。
網(wǎng)絡(luò)關(guān)聯(lián)關(guān)系是大數(shù)據(jù)中最常見的關(guān)系,在聯(lián)通主義的影響下,學(xué)生學(xué)習(xí)活動的社會性和連結(jié)性日益凸顯,學(xué)生者—學(xué)習(xí)資源—資源的提供者—使用者—學(xué)習(xí)硬件—學(xué)習(xí)場所等以前呈現(xiàn)出弱連接甚至無連接的信息和結(jié)點越來越密切地關(guān)聯(lián)在一起、越來越頻繁地發(fā)生互動。通過關(guān)聯(lián)分析,可以將學(xué)習(xí)者個人信息數(shù)據(jù)、學(xué)習(xí)者學(xué)習(xí)內(nèi)容數(shù)據(jù)、學(xué)習(xí)者社會性學(xué)習(xí)交互數(shù)據(jù)、學(xué)習(xí)設(shè)備數(shù)據(jù)等多維度數(shù)據(jù)關(guān)聯(lián)在一起,計算之間的關(guān)聯(lián)度,使用如H狀樹、圓錐樹、氣球圖、放射圖、雙曲樹等來表征這類信息。評估和揭示學(xué)生的學(xué)習(xí)網(wǎng)絡(luò)關(guān)聯(lián),有助于辨識學(xué)生社會學(xué)習(xí)網(wǎng)絡(luò)的構(gòu)建和演化規(guī)律,有助于以學(xué)習(xí)者為中心的學(xué)習(xí)方式的實現(xiàn)。如圖4所示,采集了社會化學(xué)習(xí)資源平臺上與一個知識點關(guān)聯(lián)的行為數(shù)據(jù)和用戶數(shù)據(jù),構(gòu)建成該知識點的網(wǎng)絡(luò)關(guān)聯(lián),借此可以評估不同學(xué)習(xí)者的學(xué)習(xí)參與度和貢獻度等。
圖4 基于知識的社會網(wǎng)絡(luò)可視化分析
時空數(shù)據(jù)是指帶有地理位置與時間標(biāo)簽的數(shù)據(jù),傳感器與移動終端的迅速普及使得時空數(shù)據(jù)成為典型的教育大數(shù)據(jù)。這類數(shù)據(jù)更多地反映了學(xué)習(xí)者在學(xué)校以外的學(xué)習(xí)行為,揭示和補充了教育教學(xué)這個復(fù)雜系統(tǒng)的真實的狀態(tài)數(shù)據(jù)。將教育數(shù)據(jù)的時間流與地圖進行融合,可以立體地展示教育事件在特定時空呈現(xiàn)的特征,預(yù)測未來的發(fā)展,為教育決策提供有力的支持。如在美國匹茲堡教育網(wǎng)站上,可以通過“動態(tài)地圖”把復(fù)雜的數(shù)據(jù)轉(zhuǎn)化為形象直觀的圖像,用不同顏色的圖標(biāo)表示不同的學(xué)校狀態(tài),綠色的圖標(biāo)表示這個學(xué)校超過平均水平,橙色的表示平均水平,而紅色的就是預(yù)警學(xué)校了。通過圖5展示的這種可視化分析方式,直觀顯示不同地區(qū)學(xué)校的教育質(zhì)量,能有效支持科學(xué)的教育決策。
圖5 教育時空數(shù)據(jù)的可視化分析
教育是一個復(fù)雜系統(tǒng),對教學(xué)問題進行科學(xué)的評價和精確的診斷干預(yù)是極具挑戰(zhàn)性的任務(wù)。借助現(xiàn)代化的教育教學(xué)技術(shù)得以保留和采集的教育大數(shù)據(jù),為完成這樣的任務(wù)提供了很好的基礎(chǔ)環(huán)境。盡管如此,應(yīng)該認(rèn)識到基于全學(xué)習(xí)過程的教育大數(shù)據(jù),在數(shù)據(jù)類型上具有半結(jié)構(gòu)化和非結(jié)構(gòu)化的特征,在數(shù)據(jù)容量上具備海量和天量的特征,在數(shù)據(jù)處理上具有實時性的特征,過去常規(guī)的數(shù)據(jù)采集和分析技術(shù)難以滿足大數(shù)據(jù)背景下的需求。這就要求在教學(xué)評估領(lǐng)域快速積累有關(guān)爆炸式的大數(shù)據(jù)采集、存儲、清洗等方面的知識和技術(shù),在教育數(shù)據(jù)采集的質(zhì)和量之間進行有效權(quán)衡;同時,加強對教育大數(shù)據(jù)所揭示出的新的學(xué)習(xí)和教育規(guī)律的研究,將其吸納于教學(xué)評價、學(xué)生學(xué)習(xí)模式的構(gòu)建和驗證之中,以提升教育大數(shù)據(jù)挖據(jù)的效率和質(zhì)量。此外,雖然教育大數(shù)據(jù)在對學(xué)生進行個性化、差異化、精確化教學(xué)診斷方面具有潛力,但也應(yīng)建立數(shù)據(jù)采集、使用和公開規(guī)范,以保護學(xué)生、教師的隱私和安全等。
[1]涂子沛.大數(shù)據(jù)[M].桂林:廣西師范大學(xué)出版社,2012:55-56.
[2]Grobelnik M. Big data computing: Creating revolutionary breakthroughs in commerce, science and society[OL].
[3]孟小峰,慈祥.大數(shù)據(jù)管理:概念技術(shù)與挑戰(zhàn)[J].計算機研究與發(fā)展,2013,(1):146-169.
[4]鄭燕林,柳海民.大數(shù)據(jù)在美國教育評價中的應(yīng)用路徑分析[J].中國電化教育,2015,(7):25-31.
[5][8]王道俊,王漢瀾.教育學(xué)[M].北京:人民教育出版社,1999:290-293.
[6]周由游,施建國.技術(shù)推動學(xué)習(xí)的新模式——美國國家教育技術(shù)計劃的啟示[J].中國電化教育,2011,(10):54-58.
[7]戚業(yè)國,杜瑛.教育價值的多元與教育評價范式的轉(zhuǎn)變[J].華東師范大學(xué)學(xué)報(教育科學(xué)版),2011,(2):11-18.
[9]University of New Mexico College of Education. Data-based decision making for student success[OL].
[10]Pistilli M D, Arnold K E. In practice: Purdue signals: Mining real-time academic data to enhance student success[J]. About Campus, 2010,(3):22-24.
[11]臺灣網(wǎng)奕.clouDAS云端診斷分析服務(wù)[OL.]
[12][20]楊現(xiàn)民,唐斯斯,李冀紅.教育大數(shù)據(jù)的技術(shù)體系框架與發(fā)展趨勢——“教育大數(shù)據(jù)研究與實踐專欄”之整體框架篇[J].現(xiàn)代教育技術(shù),2016,(1):5-12.
[13]教育部.關(guān)于推進中小學(xué)教育質(zhì)量綜合評價改革的意見[Z].北京:教育部,2013:2-10.
[14]覃明勇.“數(shù)據(jù)+證據(jù)”:中小學(xué)教育質(zhì)量綜合評價的呈現(xiàn)與表達(dá)方法[J].廣西教育學(xué)院學(xué)報,2014,(6):196-199.
[15]章怡,牟智佳.電子書包中的教育大數(shù)據(jù)及其應(yīng)用[J].科技與出版,2014,(5):117-119.
[16]魏雪峰,宋靈青.學(xué)習(xí)分析:更好地理解學(xué)生個性化學(xué)習(xí)過程——訪談學(xué)習(xí)分析研究專家George Siemens教授[J].中國電化教育,2013,(9):1-4.
[17]陳然,楊成.量化自我:大數(shù)據(jù)時代教育領(lǐng)域研究新機遇[J].現(xiàn)代教育技術(shù),2014,(11):5-11.
[18]金慧慧.2-3歲嬰幼兒圖畫書閱讀眼動水平研究[D].上海:華東師范大學(xué),2010:83.
[19]任磊,杜一,馬帥,等.大數(shù)據(jù)可視分析綜述[J].軟件學(xué)報,2014,(9):1909-1936.
編輯:小西
Research on Educational Evaluation based on Big Data
LI Bao-ping ZHOU Ying
Based on the perspective of educational big data and the transformation of educational evaluation activity, the collection and visual analysis and presentation technique of big data in education area were discussed in this paper. The paper stated that big data promoted the realization of data-driven decision making in education evaluation, provided good support for multi-stakeholder participation in education evaluation and developmental student evaluation. Tablet computer, digital pen, and wearable devices can digitalize the different kinds of learning data in real-time, which made the data collection during the whole process of students’ learning and provided data base for the data-driven and evidence-based education evaluation and decision. All kinds of visual analysis tools can filter and dig all kinds of implicit education information and rules in the sparse educational data,which helped us understand the construction process of the students’ personal knowledge system, explore the evolution law of the students’ individual social learning network, and reveal the characteristics of educational events under certain time-space conditions.
educational big data; education evaluation; developmental assessment; data collection; visual analysis
G40-057
A
1009—8097(2016)06—0005—07
10.3969/j.issn.1009-8097.2016.06.001
本文受2014年度北京市教育科學(xué)十二五規(guī)劃青年課題“北京市中小學(xué)師生對智慧教室環(huán)境感知研究”(項目編號:CJA14186)資助。
李葆萍,博士,研究方向為智慧學(xué)習(xí)環(huán)境、平板電腦教學(xué),郵箱為libp@bnu.edu.cn。
2016年3月12日