杜婧敏,方海光,2,李維楊,仝賽賽
(1.首都師范大學(xué)教育技術(shù)系,北京100048;2.北京師范大學(xué)智慧學(xué)習(xí)研究院,北京100875)
教育大數(shù)據(jù)研究綜述
杜婧敏1,方海光1,2,李維楊1,仝賽賽1
(1.首都師范大學(xué)教育技術(shù)系,北京100048;2.北京師范大學(xué)智慧學(xué)習(xí)研究院,北京100875)
教育大數(shù)據(jù)不僅僅是大數(shù)據(jù)在教育領(lǐng)域應(yīng)用,而且通過教育領(lǐng)域反向驅(qū)動(dòng)大數(shù)據(jù)技術(shù)分化為獨(dú)立的分支,從而帶來了對(duì)傳統(tǒng)教育技術(shù)領(lǐng)域長(zhǎng)期研究問題解決的新途徑,甚至可以跨越傳統(tǒng)個(gè)性化學(xué)習(xí)的精確邏輯推理過程而直接分析全樣本學(xué)習(xí)者特征。這樣來促進(jìn)教育管理科學(xué)化變革、促進(jìn)教學(xué)模式改革、促進(jìn)個(gè)性化教育變革、促進(jìn)教育評(píng)價(jià)體系改革、促進(jìn)科學(xué)研究變革等。這些主要依托于教育大數(shù)據(jù)的兩項(xiàng)關(guān)鍵技術(shù):教育數(shù)據(jù)挖掘和學(xué)習(xí)分析。但是我國(guó)的教育大數(shù)據(jù)研究與應(yīng)用尚處于起步階段,缺乏前期的規(guī)范化和系統(tǒng)化頂層設(shè)計(jì),面臨許多層次的挑戰(zhàn),如應(yīng)用挑戰(zhàn)、安全與隱私問題、運(yùn)營(yíng)挑戰(zhàn)等,因此,特別需要從教育大數(shù)據(jù)整體進(jìn)行規(guī)劃和由上至下的系統(tǒng)綜合研究。
教育大數(shù)據(jù);教育變革;數(shù)據(jù)挖掘;學(xué)習(xí)分析
移動(dòng)互聯(lián)網(wǎng)技術(shù)相比較PC時(shí)代的互聯(lián)網(wǎng)有著本質(zhì)的區(qū)別,伴隨著數(shù)據(jù)時(shí)代帶動(dòng)的非線性大數(shù)據(jù)增長(zhǎng)過程,社會(huì)生活和城市建設(shè)過程中的教育系統(tǒng)也在高速發(fā)展過程中,這完全不同于過去的二十年間的信息技術(shù)對(duì)教育教學(xué)的改變進(jìn)程。聯(lián)合國(guó)在2012年發(fā)布的大數(shù)據(jù)白皮書《BigData forDevelopment:Challenges&Opportunities》中指出大數(shù)據(jù)的出現(xiàn)將會(huì)對(duì)社會(huì)各個(gè)領(lǐng)域產(chǎn)生深刻影響[1]。無論國(guó)內(nèi)外都開始了對(duì)大數(shù)據(jù)的研究,起步略有早晚之分,但從政策到區(qū)域再到機(jī)構(gòu)的發(fā)展方式是共識(shí)?!秶?guó)民經(jīng)濟(jì)和社會(huì)發(fā)展第十二個(gè)五年規(guī)劃綱要》中提出:“重點(diǎn)研究……海量信息處理及知識(shí)挖掘的理論與方法……”。美國(guó)教育部于2012年10月發(fā)布的《通過教育數(shù)據(jù)挖掘和學(xué)習(xí)分析促進(jìn)教與學(xué)》中指出通過對(duì)教育大數(shù)據(jù)的挖掘與分析,促進(jìn)美國(guó)高等院校及K-12學(xué)校教學(xué)系統(tǒng)的變革[2]。2015年8月31日國(guó)務(wù)院發(fā)布的《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》中指出“數(shù)據(jù)已成為國(guó)家基礎(chǔ)性戰(zhàn)略資源”,并在啟動(dòng)的十大工程之一“公共服務(wù)大數(shù)據(jù)工程”中明確提出要建設(shè)教育大數(shù)據(jù)。目前,教育大數(shù)據(jù)的重要性已經(jīng)提升到國(guó)家戰(zhàn)略層面,教育大數(shù)據(jù)中心建設(shè)和區(qū)域數(shù)據(jù)共建共享應(yīng)用成為主要的建設(shè)模式,對(duì)個(gè)體學(xué)習(xí)全過程數(shù)據(jù)分析和精準(zhǔn)數(shù)據(jù)評(píng)測(cè)學(xué)習(xí)成為主要的應(yīng)用場(chǎng)景,從而通過宏觀和微觀的兩方面建設(shè),帶動(dòng)教育領(lǐng)域的廣泛關(guān)注和重視。
大數(shù)據(jù)的3V定義基本是從大數(shù)據(jù)的特征出發(fā),即:規(guī)模性(Volume)、多樣性(Variety)和高速性(Velocity).目前比較認(rèn)可是4V定義,如國(guó)際數(shù)據(jù)公司(IDC)認(rèn)為,大數(shù)據(jù)是符合4V特征的數(shù)據(jù)集,即在3V基礎(chǔ)上增加價(jià)值性 (Value)[3]。而IBM認(rèn)為大數(shù)據(jù)必然具有真實(shí)性(Veracity)[4]。維基百科對(duì)大數(shù)據(jù)的定義是:“巨量資料(Big Data),或稱大數(shù)據(jù)、海量資料,指的是所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營(yíng)決策更積極目的的資訊”[5]。
另一方面,教育大數(shù)據(jù)的定義最早從產(chǎn)生教育大數(shù)據(jù)的主體出發(fā),將教育大數(shù)據(jù)分為廣義的和狹義的兩類:廣義的教育大數(shù)據(jù)泛指所有來源于日常教育活動(dòng)中人類的行為數(shù)據(jù);狹義的教育大數(shù)據(jù)是指學(xué)習(xí)者行為數(shù)據(jù)[2]。也有研究指出教育大數(shù)據(jù)指整個(gè)教育活動(dòng)過程中所產(chǎn)生的以及根據(jù)教育需要采集到的,一切用于教育發(fā)展并可創(chuàng)造巨大潛在價(jià)值的數(shù)據(jù)集合[6]。
基于以上研究,可以認(rèn)為教育大數(shù)據(jù)的定義包含三層含義:第一個(gè)含義,教育大數(shù)據(jù)是教育領(lǐng)域的大數(shù)據(jù),是面向特定教育主題的多類型、多維度、多形態(tài)的數(shù)據(jù)集合;第二個(gè)含義,教育大數(shù)據(jù)是面向教育全過程的數(shù)據(jù),通過數(shù)據(jù)挖掘和學(xué)習(xí)分析支持教育決策和個(gè)性化學(xué)習(xí);第三個(gè)含義,教育大數(shù)據(jù)是一種分布式計(jì)算架構(gòu)方式,通過數(shù)據(jù)共享的各種支持技術(shù)達(dá)到共建共享的思想。也就是說,我們把教育大數(shù)據(jù)定義為:面向教育全過程時(shí)空的多種類型的全樣本的數(shù)據(jù)集合。教育大數(shù)據(jù)不僅僅是建設(shè)教育大數(shù)據(jù)中心,不僅僅是分析全過程學(xué)習(xí)數(shù)據(jù),更多的是一種共享的生態(tài)思想。
與用傳統(tǒng)方法收集的教育數(shù)據(jù)相比,教育大數(shù)據(jù)有更強(qiáng)的實(shí)時(shí)性、連續(xù)性、綜合性和自然性,并使用不同的應(yīng)用程序來分析和處理不同復(fù)雜度和深度的數(shù)據(jù)。傳統(tǒng)教育數(shù)據(jù)收集的大多是階段性的數(shù)據(jù),而且大多在用戶知情的情況下收集,使用的分析方法也通常是簡(jiǎn)單的統(tǒng)計(jì)分析方法。教育大數(shù)據(jù)收集的是整個(gè)教育教學(xué)過程中靜態(tài)和動(dòng)態(tài)的所有數(shù)據(jù),可以在不影響教師和學(xué)生活動(dòng)的情況下,連續(xù)記錄整個(gè)教學(xué)活動(dòng)的所有數(shù)據(jù),如教學(xué)資料、互動(dòng)反映和學(xué)生在每個(gè)知識(shí)點(diǎn)上停留的時(shí)間等。
教育大數(shù)據(jù)是一種新的架構(gòu)和思維基礎(chǔ),可以弱化分析模型直接進(jìn)入研究目標(biāo)進(jìn)行分析,還可以通過數(shù)據(jù)聚集對(duì)“小現(xiàn)象”進(jìn)行規(guī)律研究,還可以對(duì)個(gè)體進(jìn)行多維度數(shù)據(jù)融合研究,再可以對(duì)目標(biāo)對(duì)象進(jìn)行時(shí)間序列和空間維度動(dòng)態(tài)分析。面對(duì)具體教育業(yè)務(wù),教育大數(shù)據(jù)技術(shù)對(duì)教育的管理、教學(xué)、學(xué)習(xí)、科研和評(píng)價(jià)等都產(chǎn)生了很大的影響。教育大數(shù)據(jù)的業(yè)務(wù)分析如圖1所示。
圖1 教育大數(shù)據(jù)的業(yè)務(wù)分析
1.教育大數(shù)據(jù)對(duì)教育管理的支持
傳統(tǒng)的教育決策制定形式常被形象的稱為 “拍腦袋”決策,是指決策者常常不顧實(shí)際情況,以自己有限的理解、假想、推測(cè)依據(jù)直覺、沖動(dòng)或趨勢(shì)來制定政策。這種來自決策者“頭腦發(fā)熱”決策,經(jīng)常處于朝令夕改的尷尬境地,教育大數(shù)據(jù)正可以幫助解決這種不足。
大數(shù)據(jù)時(shí)代,教育者將更加依賴于數(shù)據(jù)和分析,而不是直覺和經(jīng)驗(yàn);同樣,教育大數(shù)據(jù)還將改變領(lǐng)導(dǎo)力和管理的本質(zhì)。服務(wù)管理、數(shù)據(jù)科學(xué)管理將取代傳統(tǒng)的行政管理、經(jīng)驗(yàn)管理。技術(shù)不斷發(fā)展,教育數(shù)據(jù)挖掘與分析不斷深入,不僅要著眼于已有的確定關(guān)系,更要探尋隱藏的因果關(guān)系。利用大數(shù)據(jù)技術(shù)可以深度挖掘教育數(shù)據(jù)中的隱藏信息,可以暴露教育過程中存在的問題,提供決策來優(yōu)化教育管理。大數(shù)據(jù)不僅可以運(yùn)行和維護(hù)各教育機(jī)構(gòu)的人事信息、教育經(jīng)費(fèi)、辦學(xué)條件和服務(wù)管理的數(shù)據(jù),而且可以長(zhǎng)期積累所有類型教育機(jī)構(gòu)的數(shù)據(jù),利用統(tǒng)計(jì)分析、應(yīng)用模型等技術(shù)將數(shù)據(jù)轉(zhuǎn)換為知識(shí),最終為教育者和學(xué)習(xí)者提供科學(xué)的決策。
2.教育大數(shù)據(jù)對(duì)教學(xué)模式的支持
教育大數(shù)據(jù)推進(jìn)實(shí)現(xiàn)智慧學(xué)習(xí)。教師在智慧教學(xué)環(huán)境下,利用大數(shù)據(jù)技術(shù)可以更深入的了解每一個(gè)學(xué)習(xí)者的學(xué)習(xí)狀況,并且與學(xué)習(xí)者的溝通更加通暢,教師的整個(gè)教學(xué)過程和學(xué)習(xí)者的學(xué)習(xí)過程更加精準(zhǔn)化和智能化。教師對(duì)教學(xué)過程的掌握從依靠經(jīng)驗(yàn)轉(zhuǎn)向以教育數(shù)據(jù)分析為支撐,學(xué)生對(duì)于自己學(xué)習(xí)狀況的了解從模糊發(fā)展到心中有數(shù),可以更好的認(rèn)識(shí)自我、發(fā)展自我、規(guī)劃自我。大數(shù)據(jù)技術(shù)可以幫助教師及時(shí)調(diào)整教學(xué)計(jì)劃和教學(xué)方法,有利于教師自身能力提高和職業(yè)發(fā)展。
3.教育大數(shù)據(jù)對(duì)個(gè)性化學(xué)習(xí)的支持
除了學(xué)生學(xué)習(xí)的行為可以被記錄下來外,學(xué)生在學(xué)習(xí)資源上的數(shù)據(jù)也可以被精確記錄下來,如點(diǎn)擊資源的時(shí)間、停留多久、問題回答正確率、重復(fù)次數(shù)、參考閱讀、回訪率和其他資源信息,通過大數(shù)據(jù)可以定制個(gè)人學(xué)習(xí)報(bào)告,分析學(xué)習(xí)過程潛在的學(xué)習(xí)規(guī)律,還可以找到學(xué)生的學(xué)習(xí)特點(diǎn)、興趣愛好和行為傾向,并一目了然教育狀態(tài)信息。大數(shù)據(jù)技術(shù)使教育圍繞學(xué)習(xí)者展開,使傳統(tǒng)的集體教育方式轉(zhuǎn)向?yàn)閭€(gè)性學(xué)習(xí)方式。同時(shí)還伴隨著教育者和學(xué)習(xí)者思維方式的改變,進(jìn)一步朝著個(gè)性化學(xué)習(xí)的方向邁出重要的一大步,使得精準(zhǔn)的個(gè)性化學(xué)習(xí)成為可能。
4.教育大數(shù)據(jù)對(duì)教育評(píng)價(jià)的支持
教育評(píng)價(jià)正在從“經(jīng)驗(yàn)主義”走向“數(shù)據(jù)主義”,從“宏觀群體”評(píng)價(jià)走向“微觀個(gè)體”評(píng)價(jià),從“單一評(píng)價(jià)”走向“綜合評(píng)價(jià)”[7]。教育大數(shù)據(jù)下教育評(píng)價(jià)的變化,不僅表現(xiàn)在評(píng)價(jià)思想,還包括評(píng)價(jià)方法,不僅包括對(duì)學(xué)生的評(píng)價(jià),還包括對(duì)教學(xué)管理、評(píng)估質(zhì)量等具體水平的評(píng)價(jià)。教學(xué)評(píng)估不再僅僅是由考試成績(jī)和紀(jì)律幫助教師評(píng)價(jià)的主觀傳統(tǒng)意義上的感受,而由大量的數(shù)據(jù)感知得到,為實(shí)現(xiàn)教學(xué)評(píng)價(jià)的公正提供了依據(jù),優(yōu)化了教學(xué)方向。教育評(píng)價(jià)可以是多元化的,而不是僅停留在知識(shí)掌握程度這一單一維度。
5.教育大數(shù)據(jù)對(duì)科學(xué)研究的支持
教育大數(shù)據(jù)使得從追求單向因果性轉(zhuǎn)向追求復(fù)雜的多元相關(guān)性,并用直觀的圖形等表達(dá)方式體、系統(tǒng)、清晰、簡(jiǎn)潔地展現(xiàn)。這種新理念、新思維的創(chuàng)生,是實(shí)現(xiàn)教育創(chuàng)新和發(fā)展不可缺少的手段、工具和方法論[8]。教育大數(shù)據(jù)時(shí)代,科學(xué)研究將從隨機(jī)抽樣、探討因果關(guān)系走向全部數(shù)據(jù)、尋找相關(guān)關(guān)系。大數(shù)據(jù)技術(shù)減少了研究資金的浪費(fèi),在某些問題上,數(shù)據(jù)分析為研究人員提供了個(gè)性化的服務(wù),可以提高了研究的效率和成果的可靠性。大數(shù)據(jù)依賴于自動(dòng)、連續(xù)的記錄和搜集的數(shù)據(jù)比傳統(tǒng)調(diào)查數(shù)據(jù)更加客觀和中立。大數(shù)據(jù)還將改變傳統(tǒng)學(xué)術(shù)研究的過程,信息系統(tǒng)依賴于自動(dòng)同步,連續(xù)獲得持續(xù)的行為數(shù)據(jù),這意味著學(xué)術(shù)研究和信息技術(shù)、課題研究與實(shí)踐聯(lián)系在一起。
教育大數(shù)據(jù)具有轉(zhuǎn)換層次的四個(gè)過程特征:數(shù)據(jù)、信息、知識(shí)、智慧。教育大數(shù)據(jù)技術(shù)采集的海量教育元數(shù)據(jù),經(jīng)過抽取、轉(zhuǎn)換、加載,聯(lián)機(jī)分析處理和統(tǒng)計(jì)分析等過程,轉(zhuǎn)換為教育信息,又經(jīng)過數(shù)據(jù)可視化將教育數(shù)據(jù)呈現(xiàn)出來,最后形成教育決策來指導(dǎo)教育者和學(xué)習(xí)的教學(xué),這個(gè)過程數(shù)據(jù)完成了從數(shù)據(jù)到信息、知識(shí)和智慧的演變。教育大數(shù)據(jù)轉(zhuǎn)換層次模型如圖2所示。
圖2 教育大數(shù)據(jù)轉(zhuǎn)換層次模型
目前在教育大數(shù)據(jù)領(lǐng)域中有很多研究領(lǐng)域,比較主要的是數(shù)據(jù)挖掘和學(xué)習(xí)分析。兩者既有相同之處,又存在一定差異。
1.教育大數(shù)據(jù)和數(shù)據(jù)挖掘
數(shù)據(jù)挖掘就是從大量的、有噪聲的、不完全的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中提取有效的、新穎的、潛在有用的知識(shí)的非平凡過程[9]。目前認(rèn)可度較高的一種處理模型是Fayyad等人設(shè)計(jì)的多處理階段模型,在此不再贅述。在大數(shù)據(jù)時(shí)代處理數(shù)據(jù)理念上有三大轉(zhuǎn)變:抽樣到全體、絕對(duì)精確到效率、因果到相關(guān)[10]。大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘繼承于傳統(tǒng)數(shù)據(jù)挖掘又不同于傳統(tǒng)數(shù)據(jù)挖掘。首先是分析對(duì)象不同,傳統(tǒng)數(shù)據(jù)分析的對(duì)象是在已知的數(shù)據(jù)范圍中易處理的數(shù)據(jù),而基于大數(shù)據(jù)的數(shù)據(jù)挖掘?qū)ο髸r(shí)包括非結(jié)構(gòu)化數(shù)據(jù)的全部數(shù)據(jù),不能保證原始數(shù)據(jù)是完整的、清洗過和沒有錯(cuò)誤的。其次是分析基礎(chǔ),傳統(tǒng)分析是建立在關(guān)系數(shù)據(jù)模型之上的,是在系統(tǒng)內(nèi)就創(chuàng)立的主題之間的關(guān)系基礎(chǔ)上進(jìn)行的,而在大數(shù)據(jù)分析中,絕大部分分析基于縱裂數(shù)據(jù)庫之外。再其次是分析效率,傳統(tǒng)數(shù)據(jù)處理過程中需要等待抽取、轉(zhuǎn)換、加載等工作完成。而大數(shù)據(jù)分析是對(duì)數(shù)據(jù)進(jìn)行實(shí)時(shí)分析。最后是硬件差別,在傳統(tǒng)數(shù)據(jù)處理中所使用硬件比較昂貴。而大數(shù)據(jù)處理過程加入了對(duì)分析軟件的使用,所以硬件成本較低。
近幾年出現(xiàn)了許多有關(guān)教育數(shù)據(jù)挖掘(EDM)的文獻(xiàn)。研究者對(duì)EDM研究的主題范圍集中在使用數(shù)據(jù)挖掘提高機(jī)構(gòu)效率和促進(jìn)學(xué)生的學(xué)習(xí)過程。但是教育數(shù)據(jù)挖掘領(lǐng)域內(nèi)還存在更廣泛的話題,例如,在課程管理系統(tǒng)內(nèi)(CMS)學(xué)生的退出和保留、個(gè)性化推薦系統(tǒng)、以及學(xué)生學(xué)習(xí)評(píng)價(jià)。
教育數(shù)據(jù)挖掘可以向教育者、學(xué)習(xí)者、教育管理者、家長(zhǎng)及教育研究者提供決策幫助,最終提高學(xué)習(xí)者的學(xué)習(xí)水平?;诮逃髷?shù)據(jù)的數(shù)據(jù)挖掘過程即將學(xué)習(xí)結(jié)果、學(xué)習(xí)內(nèi)容、學(xué)習(xí)資源與教學(xué)行為等教育原始數(shù)據(jù)使用多種技術(shù),如聚類、關(guān)系挖掘和模型構(gòu)建等,最終達(dá)到預(yù)測(cè)學(xué)習(xí)者發(fā)展趨勢(shì)、促進(jìn)有效學(xué)習(xí)的目標(biāo)。具體過程如圖3所示。
圖3 基于教育大數(shù)據(jù)的數(shù)據(jù)挖掘過程
教育大數(shù)據(jù)公認(rèn)的特征之一是規(guī)模性,面對(duì)海量數(shù)據(jù),可以采取分布式文件的系統(tǒng)進(jìn)行并行運(yùn)算。對(duì)于半結(jié)構(gòu)化或非結(jié)構(gòu)化的數(shù)據(jù),可以采用自然語言理解和信息抽取等方式將其轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)。對(duì)于雜質(zhì)較多的數(shù)據(jù),可以在數(shù)據(jù)挖掘時(shí)進(jìn)行數(shù)據(jù)清洗。對(duì)于實(shí)時(shí)產(chǎn)生的數(shù)據(jù)可以使用自動(dòng)獲取效率優(yōu)先的方式來采集數(shù)據(jù)[11]。
2.教育大數(shù)據(jù)和學(xué)習(xí)分析
新媒體聯(lián)盟(New Media Consortium)將學(xué)習(xí)分析定義為:利用松散耦合的數(shù)據(jù)收集工具和分析技術(shù),研究分析學(xué)習(xí)者學(xué)習(xí)參與、學(xué)習(xí)表現(xiàn)和學(xué)習(xí)過程的相關(guān)數(shù)據(jù),進(jìn)而對(duì)課程、教學(xué)和評(píng)價(jià)進(jìn)行實(shí)時(shí)修正[2]??傊?,學(xué)習(xí)分析運(yùn)用多種方法采集、存儲(chǔ)和分析學(xué)習(xí)者數(shù)據(jù),如移動(dòng)終端的數(shù)據(jù)和現(xiàn)場(chǎng)智能數(shù)據(jù)等,再使用多種技術(shù)來分析處理這些數(shù)據(jù),最終應(yīng)用于教育者和學(xué)習(xí)者,產(chǎn)生評(píng)估、預(yù)測(cè)和干預(yù)?;诮逃髷?shù)據(jù)的學(xué)習(xí)分析過程如圖4所示。
教育大數(shù)據(jù)學(xué)習(xí)的具體應(yīng)用體現(xiàn)在評(píng)估、預(yù)測(cè)和干預(yù)。評(píng)估是指基本統(tǒng)計(jì)分析及其可視化、發(fā)現(xiàn)問題學(xué)生、學(xué)生社交網(wǎng)絡(luò)分析與應(yīng)用,預(yù)測(cè)是指學(xué)生分類、學(xué)生模型的構(gòu)建、預(yù)測(cè)學(xué)生成績(jī),干預(yù)是指對(duì)教師的教學(xué)方法提供改進(jìn)意見。教育大數(shù)據(jù)在學(xué)習(xí)分析中還有其他應(yīng)用,如表1所示[12]。除此之外,大數(shù)據(jù)在學(xué)習(xí)分析中的應(yīng)用還包括學(xué)生分組與協(xié)作、社交網(wǎng)絡(luò)分析、開發(fā)概念圖、課件制作、規(guī)劃和調(diào)度等。
圖4 基于教育大數(shù)據(jù)的學(xué)習(xí)分析過程
表1 大數(shù)據(jù)在學(xué)習(xí)分析中的應(yīng)用
1.教育大數(shù)據(jù)的技術(shù)挑戰(zhàn)
教育大數(shù)據(jù)在實(shí)際應(yīng)用存在很多技術(shù)瓶頸,如:在數(shù)據(jù)的采集時(shí)數(shù)據(jù)挖掘和學(xué)習(xí)分析的重要環(huán)節(jié),在這一環(huán)節(jié)有很多技術(shù)挑戰(zhàn);面對(duì)海量教育數(shù)據(jù),數(shù)據(jù)的存儲(chǔ)、處理和分析都存在技術(shù)考驗(yàn);另外由于目前沒有統(tǒng)一的數(shù)據(jù)規(guī)范,不同系統(tǒng)之間的兼容也是一大問題。從全局考慮,我國(guó)的教育大數(shù)據(jù)系統(tǒng)應(yīng)遵循頂層設(shè)計(jì)原則,由教育部對(duì)數(shù)據(jù)格式、數(shù)據(jù)存儲(chǔ)等問題制定統(tǒng)一規(guī)范,下級(jí)企業(yè)、學(xué)校按照統(tǒng)一規(guī)范去設(shè)計(jì)自己的系統(tǒng),這帶來了新的技術(shù)挑戰(zhàn)。
2.教育大數(shù)據(jù)的安全與隱私挑戰(zhàn)
在倫理道德方面,教育大數(shù)據(jù)面臨著數(shù)據(jù)安全與保護(hù)隱私的挑戰(zhàn)。教育大數(shù)據(jù)不僅是一種寶貴的教育收益,而且有關(guān)學(xué)習(xí)者和教育工作者的隱私權(quán),其潛在的安全和隱私甚至是無法用常用辦法評(píng)估出來,甚至無法通過獨(dú)立的方法進(jìn)行評(píng)估。如果教育大數(shù)據(jù)處理不當(dāng)將導(dǎo)致嚴(yán)重的安全漏洞,甚至是影響區(qū)域教育政策的制定。教育數(shù)據(jù)所有權(quán)究竟屬于學(xué)習(xí)者還是運(yùn)行平臺(tái)或是雙方共享,這是互聯(lián)網(wǎng)教育和教育大數(shù)據(jù)發(fā)展所面臨的必然問題。如何保證所有權(quán)歸屬、如何判定所有權(quán)歸屬,這些仍是需要深慮的問題。
3.教育大數(shù)據(jù)的價(jià)值挑戰(zhàn)
教育大數(shù)據(jù)技術(shù)挖掘出教育數(shù)據(jù)的巨大價(jià)值,但是數(shù)據(jù)的權(quán)屬問題不是傳統(tǒng)的財(cái)產(chǎn)、知識(shí)產(chǎn)權(quán)等可以涵蓋的,數(shù)據(jù)成為國(guó)家間爭(zhēng)奪的資源,人口紅利、地大物博、經(jīng)濟(jì)實(shí)力、文化優(yōu)勢(shì)等都體現(xiàn)為數(shù)據(jù)資源儲(chǔ)備和數(shù)據(jù)服務(wù)影響力。教育大數(shù)據(jù)是一種無形資產(chǎn),國(guó)家應(yīng)當(dāng)保障教育大數(shù)據(jù)不外泄并不被惡意使用,而且還要兼顧部分?jǐn)?shù)據(jù)向公眾開放,發(fā)揮其應(yīng)用的社會(huì)價(jià)值,做到適當(dāng)?shù)木C合評(píng)估來進(jìn)行價(jià)值平衡,這也是前所未有的一種挑戰(zhàn)。
[1]Big Data for Development:Challenges&Opportunities[DB/OL].2012-05-01.http://www.unglobalpulse.org/ sites/default/files/BigDataforDevelopment-UNGlobalPulse-June2012.pdf.
[2]徐鵬,王以寧,劉艷華等.大數(shù)據(jù)視角分析學(xué)習(xí)變革——美國(guó) 《通過教育數(shù)據(jù)挖掘和學(xué)習(xí)分析促進(jìn)教與學(xué)》報(bào)告解讀及啟示[J].遠(yuǎn)程教育雜志,2013(6):11-17.
[3]Barw ick H.The“four Vs”of Big Data.Implementing Information Infrastructure Symposium[EB/OL].2012-10-02.http://www.computerworld.com.au/article/396198/ iiis_four_vs_big_data/.
[4]IBM.What is big data/[EB/OL].2012-10-02.http: //www-01.ibm.com/software/data/big data/.
[5]大數(shù)據(jù)[EB/OL].http://zh.w ikipedia.org/w iki/大數(shù)據(jù),2013-06-28.
[6]楊現(xiàn)民,唐斯斯,李冀紅.發(fā)展教育大數(shù)據(jù):內(nèi)涵、價(jià)值和挑戰(zhàn)[J].現(xiàn)代遠(yuǎn)程教育研究,2016(1):50-61.
[7]余勝泉.突破與轉(zhuǎn)型:數(shù)字校園及其智慧化發(fā)展趨勢(shì)[J].中小學(xué)管理,2015(5):4-8.
[8]胡弼成,王祖霖.“大數(shù)據(jù)”對(duì)教育的作用、挑戰(zhàn)及教育變革趨勢(shì)——大數(shù)據(jù)時(shí)代教育變革的最新研究進(jìn)展綜述[J].現(xiàn)代大學(xué)教育,2015(4):98-104.
[9]王惠中,彭安群.數(shù)據(jù)挖掘研究現(xiàn)狀及發(fā)展趨勢(shì)[J].工礦自動(dòng)化,2011,37(2):29-32.
[10]維克托·邁爾·舍恩伯格,肯尼思·庫克耶.大數(shù)據(jù)時(shí)代[J].中國(guó)電力教育,2013(5).
[11]魏順平.基于大數(shù)據(jù)的教育決策支持案例分享[EB/OL].2016-01-14.http://learning.sohu.com/20160114/ n434551706.shtm l.
[12]Sin K,Muthu L.APPLICATION OF BIG DATA IN EDUCATION DATA MINING AND LEARNING ANALYTICS-A LITERATURE REVIEW[J].Ictact Journalon Soft Computing,2015.
(編輯:王曉明)
TP393
:A
:1673-8454(2016)19-0001-04