張鵬高 羅蘭
摘 要:“數(shù)據(jù)變革思維,分析驅(qū)動教育”的大數(shù)據(jù)時代已經(jīng)來臨。大數(shù)據(jù)的獨特性,以及其對思維、商業(yè)、管理帶來的變革深入人心,大數(shù)據(jù)也引領(lǐng)了一次教育變革,利用教育數(shù)據(jù)挖掘技術(shù)和統(tǒng)計分析技術(shù),構(gòu)建教育數(shù)據(jù)統(tǒng)計模型,探索教育變量之間的相關(guān)關(guān)系,為教育教學(xué)決策提供有效支持服務(wù),對于進一步深化教育領(lǐng)域綜合改革具有深遠的意義。
關(guān)鍵詞:大數(shù)據(jù);教育決策支持;教育綜合改革
中圖分類號:TP393 文獻標(biāo)志碼:A 文章編號:1673-8454(2014)19-0003-03
一、引言
隨著時代的變遷,科技的發(fā)展日新月異,給我們的生活帶來了巨大改變,我們已經(jīng)跨入了一個全新的信息化時代。近些年來,網(wǎng)絡(luò)信息技術(shù)正在以前所未有的速度包圍我們,從物聯(lián)網(wǎng)到移動互聯(lián)網(wǎng)再到社交網(wǎng)絡(luò)等各種媒介的出現(xiàn),使互聯(lián)網(wǎng)的領(lǐng)域和應(yīng)用都得到了很大的擴展,數(shù)據(jù)擴張的同時也開啟了又一次的時代轉(zhuǎn)型,拉開了大數(shù)據(jù)時代的帷幕。并且計算機和網(wǎng)絡(luò)的快速發(fā)展,對大數(shù)據(jù)的量化、收集、分析、處理技術(shù)的實現(xiàn)使得人們對大數(shù)據(jù)的認識進一步加深,個人也能更好地從結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)中提煉目標(biāo)信息,因此,大數(shù)據(jù)對政治、經(jīng)濟、文化、生活等各方面都帶來了革新與挑戰(zhàn)。在這次變革中,教育行業(yè)也深受影響,不管是教育管理模式還是工作思維方式,以及教育學(xué)習(xí)行為與教學(xué)管理評估等,都因大數(shù)據(jù)而有了新的機遇。
二、大數(shù)據(jù)概念及主要特性
大數(shù)據(jù)這一概念雖然提出不久,卻是在某種程度上得到了大家的一致認可而發(fā)展迅速。截至目前,學(xué)術(shù)界對給出如下定義:大數(shù)據(jù)(big data)或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無法通過目前主流軟件工具,在合理時間內(nèi)達到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊。全球知名咨詢公司麥肯錫最早提出了“大數(shù)據(jù)時代”已經(jīng)到來。實際上,許多發(fā)達國家的研究機構(gòu)和大企業(yè)公司都已經(jīng)把大數(shù)據(jù)作為獲取有效信息的來源以及調(diào)整部署重要決策的戰(zhàn)略依據(jù)。而大數(shù)據(jù)處理技術(shù)也已成為信息挖掘、整理、分析的工具。大數(shù)據(jù)相比于傳統(tǒng)的數(shù)據(jù)概括起來有四個特點,業(yè)界將其歸納為4個“V”:
1.數(shù)據(jù)規(guī)模體量巨大
數(shù)據(jù)規(guī)模體量巨大即為第一個“V”——Volume(大量)。在2007年的研究中就已經(jīng)得到人類大約儲存了超過300艾字節(jié)的數(shù)據(jù),相當(dāng)于 3000個壓縮成1GB數(shù)字電影,近幾年,全球數(shù)據(jù)存儲量更是呈現(xiàn)爆炸式增長,互聯(lián)網(wǎng)數(shù)據(jù)正在以每年50%的速率在增長,據(jù)Gartner預(yù)測,到2020年,全球數(shù)據(jù)量將達到35ZB,等于80億塊4TB硬盤。
2.數(shù)據(jù)類型多樣
數(shù)據(jù)類型多樣即第二個“V”——Variety(多樣)。數(shù)據(jù)類型的多樣性主要是指,區(qū)別于傳統(tǒng)的數(shù)字型數(shù)據(jù),大數(shù)據(jù)的數(shù)據(jù)類型不但包括數(shù)字型數(shù)據(jù)也包括非數(shù)字型數(shù)據(jù),即包括結(jié)構(gòu)化數(shù)據(jù)也包括非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù),因此在整理數(shù)據(jù)、分析數(shù)據(jù)上又增加了一定難度,如果想要得到有價值的信息,必須了解圖像、視頻、網(wǎng)絡(luò)日志、聊天記錄、語音通話、地理位置信息等等各種形式的數(shù)據(jù)處理技術(shù)。
3.數(shù)據(jù)處理速度快
數(shù)據(jù)處理速度快為第三個“V”——Velocity(高速)。大數(shù)據(jù)中的1秒定律,就是解釋了可從各種類型的數(shù)據(jù)中快速獲得高價值的信息,這一點也是和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不同。人類儲存信息量的增長速度比世界經(jīng)濟的增長速度快4倍,而計算機數(shù)據(jù)處理能力的增長速度則比世界經(jīng)濟的增長速度快9倍。
4.數(shù)據(jù)蘊含高價值回報
只要能正確合理地分析利用數(shù)據(jù)就能找到數(shù)據(jù)中隱藏的巨大價值為第四個“V”——Value(價值)。大數(shù)據(jù)里蘊含著豐富的信息資源早就有目共睹了,不管是谷歌對流感來臨時的預(yù)測,F(xiàn)arecast對美國國內(nèi)航班的票價預(yù)測系統(tǒng),還是沃爾瑪?shù)钠【婆c尿不濕的營銷策略,都是來自于它們對大數(shù)據(jù)里隱藏價值的敏銳提取。
三、教育大數(shù)據(jù)的來源
教育領(lǐng)域的大數(shù)據(jù)可以從廣義和狹義兩方面來說,廣義的教育大數(shù)據(jù)指所有來源于日常教育活動中教師、學(xué)生等人員的行為數(shù)據(jù),狹義的教育大數(shù)據(jù)則是指學(xué)習(xí)者行為數(shù)據(jù),它主要來源于學(xué)生管理系統(tǒng),在線學(xué)習(xí)平臺和課程管理平臺等。目前,教育部正在著力建設(shè)國教育管理信息系統(tǒng),該系統(tǒng)以科學(xué)發(fā)展觀為指導(dǎo),全面貫徹落實《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010-2020年)》和《教育信息化十年發(fā)展規(guī)劃(2011-2020年)》對教育管理信息化建設(shè)的總體要求,以服務(wù)國家教育改革發(fā)展中心任務(wù)為目標(biāo),以建立教育管理信息系統(tǒng)和基礎(chǔ)數(shù)據(jù)庫為核心內(nèi)容,以建設(shè)“兩級建設(shè)、五級應(yīng)用”(即建設(shè)國家和省兩級數(shù)據(jù)中心,系統(tǒng)在中央、省、地市、縣和學(xué)校五級開展應(yīng)用)為重點,全面建成覆蓋全國各級教育行政部門和各級各類學(xué)校的國家教育管理信息系統(tǒng),內(nèi)容涵蓋學(xué)前、義務(wù)教育、高中教育、職業(yè)教育、高等教育等各個學(xué)習(xí)階段的學(xué)生、教師、學(xué)校資產(chǎn)與經(jīng)費的全樣本個體數(shù)據(jù),為實現(xiàn)教育管理現(xiàn)代化提供堅實的技術(shù)支持和數(shù)據(jù)支撐。國家教育管理信息系統(tǒng)的建設(shè)原則為:“統(tǒng)籌規(guī)劃、統(tǒng)一建設(shè)、集中運行、分步推進”。該系統(tǒng)是教育領(lǐng)域大數(shù)據(jù)的主要來源。其架構(gòu)如圖1所示。
以國家教育管理信息系統(tǒng)形成的教育基礎(chǔ)數(shù)據(jù)庫為核心,吸收社會外圍國民經(jīng)濟數(shù)據(jù)、互聯(lián)網(wǎng)數(shù)據(jù)、國外比較數(shù)據(jù)等,建立數(shù)據(jù)關(guān)聯(lián),形成教育大數(shù)據(jù),為教育決策提供支持和服務(wù)。
四、大數(shù)據(jù)時代的教育決策支持服務(wù)平臺
決策支持系統(tǒng)(Decision Support System)是以管理科學(xué)、運籌學(xué)、控制論和行為科學(xué)為基礎(chǔ),以計算機技術(shù)、通信技術(shù)和仿真技術(shù)為手段,針對半結(jié)構(gòu)化的決策問題,支持決策活動的人機系統(tǒng)。教育決策支持服務(wù)平臺則主要是利用分析模型分析教育管理信息系統(tǒng)里所有的教育大數(shù)據(jù),為教育決策者提供一些備選方案,以提高教育政策的質(zhì)量,進行有效地計劃評價和監(jiān)督的人機教育系統(tǒng)。該系統(tǒng)是國家教育管理信息系統(tǒng)的核心系統(tǒng)之一。
1.教育決策支持服務(wù)平臺的技術(shù)架構(gòu)
教育數(shù)據(jù)倉庫與數(shù)據(jù)服務(wù)支撐平臺的整體技術(shù)架構(gòu)以教育事業(yè)全局為視角,基于SOA的理念,采用柔性架構(gòu)設(shè)計思想和分層體系架構(gòu),以“滿足當(dāng)前應(yīng)用、擴展未來需求”為出發(fā)點,全面涵蓋教育決策支持服務(wù)各個方面的數(shù)據(jù)分析應(yīng)用需求,并能靈活適應(yīng)功能、分析內(nèi)容的動態(tài)追加和變更,滿足系統(tǒng)未來變化的需要。架構(gòu)的主要內(nèi)容以及相互之間的邏輯關(guān)系如圖2所示。
2.教育決策支持服務(wù)平臺的角色定位
在教育決策支持服務(wù)平臺建設(shè)過程中有三個互動關(guān)聯(lián)的角色:
一是教育用戶,包括各級教育管理部門和各級各類學(xué)校機構(gòu),他們的角色定位是提供自身掌握的數(shù)據(jù)及決策需求,是教育決策支持服務(wù)平臺的使用者;
二是專家團隊,包括致力于教育決策研究的專家和科研院所,他們的角色定位是根據(jù)教育用戶需求和提供的數(shù)據(jù),利用自身的科研優(yōu)勢,建立數(shù)據(jù)模型,提出研究分析報告成果;
三是研發(fā)團隊,主要是指致力于大數(shù)據(jù)分析平臺開發(fā)的廠商,他們的角色定位是對專家團隊建立的數(shù)據(jù)模型和分析報告進行技術(shù)實現(xiàn)。
3.教育決策支持服務(wù)平臺的主要功能
(1)提供教育宏觀決策服務(wù)
通過對歷史統(tǒng)計數(shù)據(jù)的分析,形成對我國教育發(fā)展?fàn)顩r各方面的趨勢分析,給國家制訂長遠規(guī)劃提供數(shù)據(jù)理論依據(jù)。
(2)提供教育動態(tài)監(jiān)管、預(yù)警服務(wù)
根據(jù)教育大數(shù)據(jù)實時變化情況,多平臺、多時相、多波段和多源數(shù)據(jù)實時掌控教育動態(tài),為各種教育專項工程提供全程監(jiān)管、預(yù)警服務(wù)。
(3)提供突發(fā)應(yīng)急事件解決方案
以教育大數(shù)據(jù)為基礎(chǔ),利用各種常用的分析方法,如優(yōu)化方法、預(yù)測方法、蒙特卡方法、矩陣方程求根法等,根據(jù)結(jié)果比較分析可以得出各種備選方案,對突發(fā)事件進行全面智能分析尋找最優(yōu)解決方案。
(4)提供輿情分析服務(wù)
通過對教育輿情數(shù)據(jù)進行深度挖掘,得到影響輿情的主要因素和強相關(guān)性變量數(shù)據(jù),結(jié)合教育大數(shù)據(jù),科學(xué)規(guī)范地制作圖表與列表,進而清晰、直觀、簡潔、深刻、形象地表現(xiàn)輿情事件,并提出相應(yīng)的分析報告和應(yīng)對策略。
(5)國內(nèi)外教育綜合比較分析
通過對國內(nèi)外同類教育綜合指標(biāo)的比較,進行差異化分析,優(yōu)化我國教育的發(fā)展方向。
(6)提供教育個體綜合評價、教育管理、教學(xué)質(zhì)量評價服務(wù)
通過教育大數(shù)據(jù)挖掘產(chǎn)生的知識與信息,傳遞給知識庫管理系統(tǒng),使系統(tǒng)智能化、知識化,實現(xiàn)對教育規(guī)律、決策規(guī)律以及模型、方法、數(shù)據(jù)等方面知識的存儲和管理,進而對教育個體、教育管理、教學(xué)質(zhì)量進行評價,促進教育綜合改革的進一步深化。
(7)提供公眾數(shù)據(jù)服務(wù)
教育大數(shù)據(jù)來源于教育群體,也服務(wù)于教育群體,通過對公眾需求的調(diào)研和對教育大數(shù)據(jù)的挖掘、分析,形成可供公眾查詢的成果,打造“陽光政府”。
五、結(jié)束語
“路漫漫其修遠兮,吾將上下而求索”,實現(xiàn)中國夢,教育任重道遠。大數(shù)據(jù)是客觀存在,同時又在不斷地衍生變化著,人類認知范圍內(nèi)的“大數(shù)據(jù)”永遠只是冰山一角?!吨泄仓醒腙P(guān)于全面深化改革若干重大問題的決定》提出了“深化教育領(lǐng)域綜合改革”的戰(zhàn)略部署,是促進教育公平的重大舉措,我們必須懷著謙恭之心、嚴謹之心、證偽之心去認知、挖掘、分析教育大數(shù)據(jù),找出其內(nèi)在的規(guī)律,為教育領(lǐng)域綜合改革提供科學(xué)的決策依據(jù),按照中央改革決策部署,銳意進取、勇于創(chuàng)新,加快制度建設(shè),不斷完善中國特色社會主義現(xiàn)代教育體系,不斷提高中國教育現(xiàn)代化水平,努力辦好人民滿意的教育。
參考文獻:
[1]Romero & Ventura.Educational Data Mining:A Survey from 1995to 2005[J].Expert Systems with Applications.2007(33):125-146.
[2]蔣玉蘭,周磊.關(guān)于開放教育學(xué)生流失情況的調(diào)研報告[J].寧波廣播電視大學(xué)學(xué)報,2006(3):50-56.
[3](英)Viktor,Kenneth著,盛楊燕,周濤譯.大數(shù)據(jù)時代——生活、工作與思維的大變革[M].浙江:浙江人民出版社,2013.
[4]尹春華,顧培亮.決策支持系統(tǒng)研究現(xiàn)狀與發(fā)展趨勢[J].決策借鑒,2002(4):42.
[5]宋允輝.數(shù)據(jù)庫知識發(fā)現(xiàn)技術(shù)在集成質(zhì)量決策支持系統(tǒng)中的研究與應(yīng)用[DB].中國優(yōu)秀博碩士學(xué)位論文全文數(shù)據(jù)庫,2003.
[6]Dringus&Ellis.Using Data Mining as a Strategy forAssessing Asynchronous Discussion Forums[J].Computer &Education Journal,2005 (45):141–160.
[7]Baker&Yacef.The State of Educational Data Mining in2009:A Review and Future Visions[EB/OL].http://www.educationaldatamining.org/JEDM/images/articles/vol1/issue1/JEDMVol1Issue1_BakerYacef.pdf.
[8]李婷,傅鋼善.國內(nèi)外教育數(shù)據(jù)挖掘研究現(xiàn)狀及趨勢分析[J].現(xiàn)代教育技術(shù),2010(10):21-25.
[9]徐鵬,王以寧,劉艷華,張海.大數(shù)據(jù)視角分析學(xué)習(xí)變革——美國《通過教育數(shù)據(jù)挖掘和學(xué)習(xí)分析促進教與學(xué)》報告解讀及啟示[J].遠程教育雜志,2013(6):11-17.
(編輯:王曉明)