孫 慶
上海市大數(shù)據(jù)中心
通過搭建先進(jìn)的信息化環(huán)境、引用新技術(shù)新設(shè)備進(jìn)課堂、開發(fā)使用眾多的教育應(yīng)用軟件系統(tǒng),高效支持教育教學(xué)業(yè)務(wù)活動(dòng)的開展,的確是推動(dòng)基礎(chǔ)教育信息化建用發(fā)展的必要手段,更是基礎(chǔ)教育信息化建設(shè)硬實(shí)力的重要體現(xiàn)。然而,隨著教育信息化應(yīng)用的持續(xù)深入,必然會(huì)形成大量的基于信息化的教育應(yīng)用成果和大量的教育業(yè)務(wù)數(shù)據(jù)積累。匯集數(shù)量巨大、種類繁多的教育業(yè)務(wù)數(shù)據(jù),形成教育數(shù)據(jù)資產(chǎn)并科學(xué)地加以利用,將會(huì)更好地支持教育教學(xué)工作的開展,有效推動(dòng)教育教學(xué)的創(chuàng)新與發(fā)展。科學(xué)利用教育數(shù)據(jù)資源并有效促進(jìn)教育事業(yè)發(fā)展,則是基礎(chǔ)教育信息化建設(shè)應(yīng)用軟實(shí)力的一種重要體現(xiàn)。而利用數(shù)據(jù)分析技術(shù),開展教育數(shù)據(jù)分析,從已有的教育數(shù)據(jù)中挖掘出更具價(jià)值的新的知識(shí)信息[1],用以支持教育教學(xué)業(yè)務(wù)的開展,正是實(shí)現(xiàn)數(shù)據(jù)賦能教育最重要的方法和途徑。數(shù)據(jù)分析技術(shù)可以在教育質(zhì)量監(jiān)測分析、學(xué)生成長發(fā)展評(píng)價(jià)、教育管理決策支持等教育應(yīng)用業(yè)務(wù)領(lǐng)域中發(fā)揮積極的作用。面向不同的教育應(yīng)用場景及其具體的問題解決需求,我們應(yīng)當(dāng)合理選擇數(shù)據(jù)分析技術(shù)來開展專門的教育數(shù)據(jù)分析,以確保最終能夠獲得并展示出富有價(jià)值的教育數(shù)據(jù)分析結(jié)果。當(dāng)然,開展教育數(shù)據(jù)分析,要有完善的教育數(shù)據(jù)分析系統(tǒng)支持環(huán)境。在實(shí)施區(qū)域性教育行業(yè)云平臺(tái)建設(shè)時(shí),應(yīng)當(dāng)將教育數(shù)據(jù)分析系統(tǒng)的環(huán)境建設(shè)也一并納入其中。
就學(xué)科教學(xué)質(zhì)量測評(píng)而言,基于考試成績開展數(shù)據(jù)分析,就是要挖掘出隱藏在考試成績背后的新的知識(shí)信息。利用這些被發(fā)現(xiàn)的新的知識(shí)信息,可以為教師有效地調(diào)整學(xué)科的教學(xué)策略和教學(xué)方法提供科學(xué)的決策依據(jù)。圍繞教學(xué)質(zhì)量測評(píng)實(shí)施的數(shù)據(jù)分析,很重要的一件事情就是要準(zhǔn)確地展示出被試學(xué)生群體的學(xué)科考試成績的分布狀況和總體特征,并據(jù)此對(duì)區(qū)域內(nèi)各所學(xué)校的學(xué)科教學(xué)質(zhì)量進(jìn)行深入分析與綜合比較(同樣,也可以對(duì)同一所學(xué)校某個(gè)年級(jí)的不同班級(jí)的學(xué)科教學(xué)質(zhì)量進(jìn)行分析與比較)。根據(jù)分析比較后反饋的信息,就可以全面了解區(qū)域內(nèi)每所學(xué)校(或校內(nèi)同年級(jí)各班)的學(xué)科教學(xué)質(zhì)量表現(xiàn)的趨勢特征,以及學(xué)校間(或校內(nèi)各班級(jí))在學(xué)科教學(xué)質(zhì)量上存在的差異性,并據(jù)此對(duì)學(xué)校(或班級(jí))的學(xué)科教學(xué)提出改進(jìn)要求,從而為有效管控和提升學(xué)科教學(xué)質(zhì)量的整體發(fā)展水平提供支撐。而描述性數(shù)據(jù)分析技術(shù),就是實(shí)現(xiàn)上述教學(xué)質(zhì)量測評(píng)管控最為常用的數(shù)據(jù)分析技術(shù)。
例如,通過計(jì)算獲取學(xué)生群體的考試平均分、中位數(shù)等集中量數(shù),就可以概括地了解被試學(xué)生群體考試情況的中心趨勢。而對(duì)極差、標(biāo)準(zhǔn)差等差異量數(shù)計(jì)算分析,就可以度量出被試學(xué)生群體考試情況的離散趨勢。利用計(jì)算得到的這些描述性度量數(shù)值,配以圖形化展示(如盒裝圖)就可以準(zhǔn)確、直觀、清晰地將基于考試成績分析的結(jié)果呈現(xiàn)給教研人員和教學(xué)管理者,從而為研究制定學(xué)科教學(xué)質(zhì)量管控措施提供科學(xué)的決策依據(jù)。
加強(qiáng)“五育并舉”,促進(jìn)學(xué)生德智體美勞全面發(fā)展,是當(dāng)前教育改革發(fā)展的重點(diǎn)。全面關(guān)注、綜合評(píng)價(jià)學(xué)生在校學(xué)習(xí)期間各方面的表現(xiàn),可以為有效地指導(dǎo)學(xué)生更好地成長發(fā)展提供價(jià)值參考和決策依據(jù)。我們可以從各類教育應(yīng)用業(yè)務(wù)系統(tǒng)中,獲取學(xué)生在各個(gè)方面的成長發(fā)展情況,如學(xué)科成績、體測結(jié)果、社會(huì)實(shí)踐情況、活動(dòng)競賽成果等,甚至還可以通過學(xué)生綜合素質(zhì)評(píng)價(jià)系統(tǒng),同時(shí)獲取由系統(tǒng)平臺(tái)匯總的上述各類學(xué)生成長發(fā)展數(shù)據(jù)。這些數(shù)據(jù)分別記載著學(xué)生在不同成長領(lǐng)域內(nèi)的發(fā)展信息。面向促進(jìn)學(xué)生全面成長的教學(xué)和育人需求,研究評(píng)價(jià)模型,設(shè)計(jì)分析算法,對(duì)上述這些數(shù)據(jù)實(shí)施深度計(jì)算分析,從中挖掘出與學(xué)生成長發(fā)展相關(guān)的潛在規(guī)律或隱藏問題,將能為從教者調(diào)整教學(xué)策略、改變育人模式,更好地培養(yǎng)和促進(jìn)學(xué)生的全面發(fā)展給予科學(xué)的參考依據(jù)和正確的教改導(dǎo)向。而這就是數(shù)據(jù)挖掘技術(shù)在基礎(chǔ)教育中的具體應(yīng)用體現(xiàn)。利用數(shù)據(jù)挖掘技術(shù)開展教育數(shù)據(jù)分析,可能是某一育人領(lǐng)域內(nèi),面向某種具體教育應(yīng)用而開展的教育數(shù)據(jù)分析,也可能是面向?qū)W生綜合發(fā)展而開展的跨領(lǐng)域教育數(shù)據(jù)分析。
比如,為了綜合評(píng)估學(xué)生學(xué)業(yè)水平與體質(zhì)健康的整體發(fā)展?fàn)顩r,深入探究兩者間的發(fā)展變化是否存在著制約關(guān)系,從而為學(xué)校調(diào)整教學(xué)育人模式(甚至是教育理念)提供決策依據(jù),就可能需要針對(duì)學(xué)生考試成績和學(xué)生體測結(jié)果這兩大不同領(lǐng)域的教育業(yè)務(wù)數(shù)據(jù)開展相關(guān)性分析。通過嘗試挖掘出隱藏在這兩大教育業(yè)務(wù)數(shù)據(jù)背后的,但還不為我們所知的有關(guān)影響學(xué)生成長發(fā)展的新的知識(shí)信息,便可以此為決策依據(jù),更為科學(xué)、精準(zhǔn)地來規(guī)劃和推動(dòng)學(xué)校在教學(xué)育人模式方面的變革與創(chuàng)新。
在教育管理業(yè)務(wù)活動(dòng)中引入數(shù)據(jù)分析技術(shù),可以為實(shí)施精準(zhǔn)的教育管理與制定科學(xué)的教育發(fā)展規(guī)劃提供源于數(shù)據(jù)實(shí)證的管理操作支持與規(guī)劃決策參考。對(duì)于涉及人、財(cái)、物管理的行政性教育事務(wù)工作,制定并執(zhí)行科學(xué)、規(guī)范、合理的管理制度與配套政策,是避免產(chǎn)生重大失誤,確保工作有序開展和保障教育機(jī)構(gòu)長期穩(wěn)定運(yùn)行的重要條件。相關(guān)工作制度和配套政策的研究與制定,需要基于具體的工作規(guī)則要求和與之相關(guān)的現(xiàn)狀實(shí)情分析。特別是對(duì)于那些需要量化管理、精準(zhǔn)施策、準(zhǔn)確管控的行政性事務(wù)管理工作,在研究制定制度和策略的時(shí)候,往往先要按照具體的工作要求和相關(guān)的業(yè)務(wù)規(guī)則對(duì)大量的相關(guān)業(yè)務(wù)數(shù)據(jù)實(shí)施計(jì)算分析,而后用獲取的精準(zhǔn)的數(shù)據(jù)分析結(jié)果來支持制度及政策的制定、調(diào)整和執(zhí)行。
例如,面對(duì)公辦中小學(xué)教職工績效工資計(jì)算的復(fù)雜構(gòu)成因子,以及與這些構(gòu)成因子所對(duì)應(yīng)的大量的人員數(shù)據(jù)信息,我們可以利用規(guī)則性數(shù)據(jù)分析方法,計(jì)算分析得到教職人員績效工資發(fā)放的最優(yōu)基數(shù),并以此為基準(zhǔn)核算出每個(gè)人的月度績效工資。在充分滿足學(xué)??冃ЧべY分配方案的前提下,精確發(fā)放核定下?lián)艿娜藛T績效工資,進(jìn)而在確??冃ЧべY全年發(fā)放總量與年度下?lián)芙?jīng)費(fèi)總量持平的同時(shí),實(shí)現(xiàn)每一位教職人員的實(shí)際收入最大化。這個(gè)例子中提到的規(guī)則性數(shù)據(jù)分析方法,在基礎(chǔ)教育管理工作中雖然很少被使用到,但它的確非常適合那些需要通過精確測算來對(duì)學(xué)校行政管理事務(wù)開展進(jìn)行決策的教育應(yīng)用場景。
數(shù)據(jù)分析可以應(yīng)用于不同的行業(yè)領(lǐng)域,用以支撐行業(yè)相關(guān)業(yè)務(wù)活動(dòng)的高效開展,并能為行業(yè)機(jī)構(gòu)的事業(yè)發(fā)展和重大變革提供科學(xué)的決策依據(jù)。但是,在將數(shù)據(jù)分析應(yīng)用于不同的行業(yè)時(shí),應(yīng)當(dāng)基于各個(gè)行業(yè)的具體應(yīng)用需求來選擇不同的數(shù)據(jù)分析技術(shù)和實(shí)現(xiàn)方法,并形成具有行業(yè)特征的數(shù)據(jù)分析應(yīng)用。就基礎(chǔ)教育行業(yè)而言,數(shù)據(jù)分析技術(shù)的選型和使用,不但要符合基于教育數(shù)據(jù)開展測評(píng)分析(如教育統(tǒng)計(jì)、教育測量、教育評(píng)價(jià)等)的教育統(tǒng)計(jì)與教育測評(píng)理論[2],而且還要能夠?yàn)榻逃脩簦ń處?、教育管理者等)?zhǔn)確地解讀數(shù)據(jù)分析結(jié)果,提供便捷有效的方式與途徑。除此之外,如何基于量化方式深層次支持教育管理決策和教學(xué)改革實(shí)踐,同樣也需要選擇適合可用的數(shù)據(jù)分析技術(shù)。而統(tǒng)計(jì)分析、數(shù)據(jù)挖掘和數(shù)據(jù)可視化這三種數(shù)據(jù)分析技術(shù)[3],在研判學(xué)校教學(xué)質(zhì)量、促進(jìn)學(xué)生成長發(fā)展、支持教育規(guī)劃決策等方面發(fā)揮著積極的作用,是能夠有效滿足基礎(chǔ)教育應(yīng)用實(shí)際需求的三種常用數(shù)據(jù)分析技術(shù)。
統(tǒng)計(jì)分析技術(shù)可以分為描述性統(tǒng)計(jì)分析、相關(guān)性統(tǒng)計(jì)分析等數(shù)據(jù)分析技術(shù)。描述性統(tǒng)計(jì)分析技術(shù)基于對(duì)數(shù)據(jù)的描述,開展數(shù)據(jù)趨勢分析,展示數(shù)據(jù)特征。這種技術(shù)常用在學(xué)科教學(xué)質(zhì)量測評(píng)分析之中。它將學(xué)科考試分?jǐn)?shù)作為統(tǒng)計(jì)分析的數(shù)據(jù)對(duì)象,利用描述性分析匯總技術(shù),挖掘分析隱藏在數(shù)據(jù)背后的與學(xué)科教學(xué)質(zhì)量相關(guān)的知識(shí)信息,從而可以為學(xué)校、教師發(fā)現(xiàn)教學(xué)問題和調(diào)整教學(xué)策略提供數(shù)據(jù)支持。在基于考試分?jǐn)?shù)開展描述性匯總分析時(shí),通過計(jì)算獲取用于展現(xiàn)考試分?jǐn)?shù)中心趨勢特征和離散趨勢特征的度量值,就可以準(zhǔn)確、有效地了解和把握同年級(jí)學(xué)生群體(學(xué)校、班級(jí))的學(xué)科學(xué)業(yè)水平的總體定位和個(gè)體間差異狀況,從而為教學(xué)管理部門在區(qū)域?qū)用妫ɑ蛐<?jí)層面)針對(duì)性地實(shí)施教學(xué)質(zhì)量管控提供決策依據(jù)。如表1所示,用于反映考試分?jǐn)?shù)中心趨勢特征的度量值,由平均分、中位數(shù)和眾數(shù)三個(gè)集中量數(shù)構(gòu)成;用于反映考試分?jǐn)?shù)離散趨勢特征的度量值,則由全距、標(biāo)準(zhǔn)差和中間四分位數(shù)極差三個(gè)差異量數(shù)構(gòu)成。計(jì)算和分析這些描述性匯總統(tǒng)計(jì)量數(shù),為實(shí)施區(qū)域性學(xué)科教學(xué)質(zhì)量的測評(píng)管控提供數(shù)據(jù)支撐,是描述性統(tǒng)計(jì)分析技術(shù)在教育測評(píng)分析中的具體應(yīng)用實(shí)踐。
表1 考試分?jǐn)?shù)描述性匯總統(tǒng)計(jì)分析統(tǒng)計(jì)量數(shù)
而相關(guān)性統(tǒng)計(jì)分析是用來衡量數(shù)據(jù)之間的密切相關(guān)程度的一種統(tǒng)計(jì)分析技術(shù)。在教育評(píng)價(jià)中,我們可以利用相關(guān)性統(tǒng)計(jì)分析技術(shù),對(duì)不同教育業(yè)務(wù)數(shù)據(jù)系列之間的量化趨勢關(guān)系實(shí)施計(jì)算分析,揭示出數(shù)據(jù)之間可能存在的潛在相關(guān)性規(guī)律,并借此形成面向特定教育研究主題的教育評(píng)價(jià)結(jié)論。例如, 在評(píng)估試卷的命題質(zhì)量時(shí),可以通過計(jì)算試題得分與試卷總分的相關(guān)系數(shù),來評(píng)估每道試題對(duì)整份試卷測試目標(biāo)達(dá)成度的貢獻(xiàn)大小,并據(jù)此為有效地評(píng)估試卷命題質(zhì)量提供科學(xué)的參照依據(jù)。如圖1所示,在一次試卷命題質(zhì)量分析過程中,以每個(gè)學(xué)生的試卷總分和某道試題的得分為兩組不同的數(shù)據(jù)系列,通過計(jì)算這兩組變量的相關(guān)系數(shù)(Pearson系數(shù))后發(fā)現(xiàn),有8道試題的得分與試卷總分的相關(guān)系數(shù)值達(dá)到了0.7以上,試題得分與試卷總分呈現(xiàn)出高度的正相關(guān)性。這說明了這些試題在評(píng)價(jià)(或說區(qū)分)學(xué)生的學(xué)業(yè)水平時(shí),起到了積極的作用,可以認(rèn)為這些試題的命題質(zhì)量是相對(duì)較高的。
圖1 試題得分與試卷總分的相關(guān)性分析(Pearson相關(guān)分析)
數(shù)據(jù)挖掘從某種意義上說是一個(gè)知識(shí)發(fā)現(xiàn)的過程,也就是要從已有的數(shù)據(jù)中提取出新的知識(shí)信息。這個(gè)過程包括了挖掘前的數(shù)據(jù)準(zhǔn)備,執(zhí)行數(shù)據(jù)挖掘算法,評(píng)估挖掘(模式)結(jié)果,以及展示挖掘獲取的知識(shí)信息[4]。面向教育應(yīng)用而言,如果希望通過數(shù)據(jù)挖掘獲取新的有價(jià)值的知識(shí)信息,并用以驗(yàn)證面向某類教育主題的經(jīng)驗(yàn)性或研究性假設(shè),或?yàn)橄嚓P(guān)教育業(yè)務(wù)活動(dòng)的開展提供決策支持,那么可以考慮參照數(shù)據(jù)挖掘的實(shí)施過程,逐步執(zhí)行各項(xiàng)技術(shù)操作,并最終獲取經(jīng)數(shù)據(jù)挖掘后得到的知識(shí)結(jié)果。然而,需要指出的是,單從技術(shù)實(shí)現(xiàn)的角度看,數(shù)據(jù)挖掘的技術(shù)與實(shí)現(xiàn)途徑雖然有一套泛化而全能的方法和系統(tǒng),以及與之配套的眾多的軟件工具(產(chǎn)品),但是其是否適合特定領(lǐng)域的挖掘需求是要視情況而定的。特別是針對(duì)基礎(chǔ)教育行業(yè)、源于教育應(yīng)用需求的數(shù)據(jù)挖掘任務(wù),其實(shí)并沒有現(xiàn)成的方法和系統(tǒng)可以直接加以引用。
單從面向教育需求開展數(shù)據(jù)分析的角度來看,如果想通過數(shù)據(jù)挖掘達(dá)到探尋教育潛在規(guī)律、解決教育實(shí)際問題和促進(jìn)教育創(chuàng)新發(fā)展之目的,那么,如圖2所示,至少要在三個(gè)方面做好數(shù)據(jù)挖掘的規(guī)劃與實(shí)施。第一,確定教育主題。定位數(shù)據(jù)挖掘所面向的教育現(xiàn)實(shí)問題,明確實(shí)施數(shù)據(jù)挖掘的目的和教育意義所在。第二,挖掘模式選型。圍繞面向教育主題開展數(shù)據(jù)挖掘所涉及的教育業(yè)務(wù)領(lǐng)域及其用于分析的相關(guān)數(shù)據(jù)來源,明確實(shí)施數(shù)據(jù)挖掘的興趣點(diǎn)所在,規(guī)劃設(shè)計(jì)好具體的挖掘分析業(yè)務(wù)模型,并為數(shù)據(jù)挖掘可能的結(jié)果設(shè)定預(yù)期。然后,在此基礎(chǔ)上選擇確定所要使用的挖掘技術(shù)和實(shí)現(xiàn)方法。第三,組織提供數(shù)據(jù)。從各教育業(yè)務(wù)領(lǐng)域的系統(tǒng)中抽取用于挖掘分析的源數(shù)據(jù),形成面向挖掘分析的教育主題數(shù)據(jù)倉庫或數(shù)據(jù)集市,繼而基于確立的挖掘模式實(shí)施面向特定教育主題的數(shù)據(jù)挖掘分析。當(dāng)然,在這三項(xiàng)工作完成之后,我們還需要用準(zhǔn)確、有效的方式來展示挖掘分析的結(jié)果,清晰直觀地呈現(xiàn)出通過數(shù)據(jù)挖掘所獲取的新的知識(shí)信息,更加有效地支持教育教學(xué)應(yīng)用。
圖2 面向教育主題的數(shù)據(jù)挖掘分析實(shí)施過程
下面圖3和圖4所展示的是一個(gè)以面向?qū)W生全面發(fā)展為主題,研究學(xué)生學(xué)業(yè)水平與體質(zhì)健康之間是否存在著內(nèi)在關(guān)系的數(shù)據(jù)挖掘?qū)嶒?yàn)項(xiàng)目的挖掘成果。該項(xiàng)目以學(xué)科教學(xué)質(zhì)量監(jiān)測分析系統(tǒng)的學(xué)生考試成績,以及體質(zhì)健康監(jiān)測管理系統(tǒng)的學(xué)生體測成績作為分析數(shù)據(jù)。該項(xiàng)目的挖掘模式為通過排序?qū)W科考試成績對(duì)學(xué)生進(jìn)行分類,然后針對(duì)學(xué)業(yè)水平較高(成績排名為前25%)和學(xué)業(yè)水平較低的兩大學(xué)生群體(成績排名為后25%),專門就學(xué)科考試成績和體測成績做關(guān)聯(lián)性分析。按照設(shè)計(jì)的算法模型,開展挖掘分析后,發(fā)現(xiàn)了一個(gè)令人感興趣的頻繁模式(Frequent Pattern):就體測成績優(yōu)良率而言,學(xué)業(yè)水平較高的學(xué)生群體遠(yuǎn)高于學(xué)業(yè)水平較低的學(xué)生群體;反觀體測成績不合格率,學(xué)業(yè)水平較低的學(xué)生群體則明顯高于學(xué)業(yè)水平較高的學(xué)生群體。該數(shù)據(jù)挖掘?qū)嶒?yàn)項(xiàng)目,對(duì)區(qū)域內(nèi)初中和高中兩個(gè)學(xué)段內(nèi)的多個(gè)年級(jí)都分別進(jìn)行了相同的挖掘分析,最后得到的結(jié)果都非常相似。從這個(gè)面向教育主題的數(shù)據(jù)挖掘?qū)嶒?yàn)項(xiàng)目中所提取到的知識(shí)信息,否定了所謂的“學(xué)習(xí)好的學(xué)生,體質(zhì)健康差;學(xué)習(xí)差的學(xué)生,體質(zhì)健康好”的主觀經(jīng)驗(yàn)性假設(shè)。同時(shí),也給了學(xué)校和教師一個(gè)重要的提示,那就是在關(guān)注那些考試成績較差的學(xué)生的學(xué)業(yè)水平的同時(shí),不要忘記還應(yīng)適當(dāng)?shù)仃P(guān)心一下他們的體質(zhì)健康。
圖3 學(xué)業(yè)成績優(yōu)良的學(xué)生的體測成績分布
圖4 學(xué)業(yè)成績較差的學(xué)生的體測成績分布
數(shù)據(jù)可視化技術(shù)就是通過繪制圖形的方式,直觀、清晰地展示數(shù)據(jù)信息,它可以幫助人們更加快速、準(zhǔn)確地理解數(shù)據(jù)和數(shù)據(jù)分析結(jié)果所包含的信息。上文所述的學(xué)生學(xué)業(yè)水平與體質(zhì)健康的數(shù)據(jù)挖掘項(xiàng)目就采用了數(shù)據(jù)可視化技術(shù),用圖表的方式直觀、有效地呈現(xiàn)了挖掘的數(shù)據(jù)結(jié)果。傳統(tǒng)的電子表格軟件,如Excel,一般都具有圖表制作的功能,可以將二維表格內(nèi)的數(shù)據(jù)轉(zhuǎn)換成各種類型的圖表,用圖形化的方式更加形象地向我們展示數(shù)據(jù)的總體特征、變化趨勢和關(guān)鍵信息。但是,當(dāng)數(shù)據(jù)量規(guī)模不斷增大、數(shù)據(jù)可視化要求變得更加復(fù)雜時(shí),受限于電子表格軟件系統(tǒng)的處理能力,我們就需要選擇使用專門的數(shù)據(jù)可視化工具軟件,如Power BI、Tableau、Highcharts等來繪制數(shù)據(jù)圖表,來完成處理更加復(fù)雜、呈現(xiàn)更為豐富的數(shù)據(jù)可視化操作。而這類專門的數(shù)據(jù)可視化軟件都具有連接各類數(shù)據(jù)源(文件或數(shù)據(jù)庫)的能力,并能快速分析和可視化數(shù)據(jù),創(chuàng)建出我們所需要的圖表。數(shù)據(jù)可視化技術(shù)是開展教育數(shù)據(jù)分析的一種特殊方式,它為進(jìn)一步深入挖掘展示教育業(yè)務(wù)數(shù)據(jù)的內(nèi)涵價(jià)值提供了新的途徑。被可視化處理的教育數(shù)據(jù),有時(shí)甚至還可以更直接、更深刻地揭示出隱藏在其后的教育現(xiàn)實(shí)問題。
圖5是一張多年前,某地區(qū)域內(nèi)的公辦小學(xué)的師生配比統(tǒng)計(jì)分析圖表。這是當(dāng)時(shí)基于教師和學(xué)生管理系統(tǒng)的師生實(shí)時(shí)數(shù)據(jù)信息匯總分析得到的統(tǒng)計(jì)結(jié)果數(shù)據(jù),并以可視化的方式用圖表的形式展示出來。該圖表清晰、直觀地呈現(xiàn)出全區(qū)各所小學(xué)之間在師生配比上的差異,尤其是位于圖表兩端的學(xué)校的巨大差異,相當(dāng)引人注目。經(jīng)數(shù)據(jù)可視化后,透露出學(xué)校教師數(shù)量配備不平衡的問題,這種方式遠(yuǎn)比枯燥的統(tǒng)計(jì)數(shù)值來得更加直接與透徹,進(jìn)而從堅(jiān)持教育公平和推進(jìn)優(yōu)質(zhì)教育均衡發(fā)展的觀點(diǎn)來看,數(shù)據(jù)可視化后的這張統(tǒng)計(jì)圖表所呈現(xiàn)出來的顯著差別,也許還會(huì)給區(qū)域的教育行政管理部門提供更多的啟示。
圖5 學(xué)校師生比統(tǒng)計(jì)分析數(shù)據(jù)可視化展示
數(shù)據(jù)分析技術(shù)應(yīng)用于教育業(yè)務(wù)領(lǐng)域時(shí),既要有可供計(jì)算分析的各類教育數(shù)據(jù)信息,也要有能夠支持開展教育數(shù)據(jù)計(jì)算分析的技術(shù)環(huán)境[5]。為此,我們需要構(gòu)建圍繞不同教育主題的數(shù)據(jù)倉庫,用于存儲(chǔ)從不同數(shù)據(jù)源抽取、清理、加載的各種教育數(shù)據(jù)信息。同時(shí),還要建設(shè)、部署各種數(shù)據(jù)查詢、分析和展示系統(tǒng)(工具),支持基礎(chǔ)教育用戶開展基于教育數(shù)據(jù)信息、面向教育應(yīng)用主題、引用不同數(shù)據(jù)分析技術(shù)的教育數(shù)據(jù)分析實(shí)踐活動(dòng)。如此,形成完善的教育數(shù)據(jù)分析系統(tǒng)環(huán)境,為有效運(yùn)用數(shù)據(jù)分析技術(shù)、充分滿足教育應(yīng)用實(shí)際創(chuàng)設(shè)必要的條件。然而,教育數(shù)據(jù)分析系統(tǒng)環(huán)境的建設(shè),具有一定的技術(shù)難度,系統(tǒng)構(gòu)成也存在相當(dāng)?shù)膹?fù)雜性。除去計(jì)算、存儲(chǔ)等底層硬件資源的建設(shè)部署外,還要選型配置數(shù)據(jù)倉庫工具,以及選購或設(shè)計(jì)開發(fā)相關(guān)的數(shù)據(jù)分析軟件系統(tǒng)(工具)。因此,應(yīng)當(dāng)將其納入?yún)^(qū)域性教育行業(yè)云平臺(tái)體系的建設(shè)范疇,作為區(qū)教育云的數(shù)據(jù)中臺(tái)加以建設(shè),并整合嵌入至區(qū)教育行業(yè)云平臺(tái)之中。
值得一提的是,隨著教育信息化的建用發(fā)展,越來越多的教育應(yīng)用軟件系統(tǒng)被建成并投入實(shí)際應(yīng)用,而軟件的運(yùn)行又積累了大量的教育業(yè)務(wù)數(shù)據(jù),這為開展教育數(shù)據(jù)分析提供了大量的源于教育教學(xué)實(shí)際的可用的分析數(shù)據(jù)。另外,通過常態(tài)化運(yùn)行的教育軟件系統(tǒng),還能獲取與之相關(guān)的業(yè)務(wù)領(lǐng)域的全量教育數(shù)據(jù)信息,甚至是實(shí)時(shí)的全量教育數(shù)據(jù)信息。這使得開展基于全部數(shù)據(jù)樣本的數(shù)據(jù)分析及研究成為可能。毋庸置疑,這比傳統(tǒng)的基于問卷調(diào)查(或填報(bào)數(shù)據(jù)報(bào)表)獲取有限的抽樣數(shù)據(jù)而開展的數(shù)據(jù)分析,在形成科學(xué)、全面、可信的分析結(jié)果上,將更具優(yōu)勢。當(dāng)然,要達(dá)到這一目的,就一定要做好教育數(shù)據(jù)分析系統(tǒng)環(huán)境與教育行業(yè)云平臺(tái)整合對(duì)接的設(shè)計(jì)和建設(shè)工作,以便在教育應(yīng)用業(yè)務(wù)系統(tǒng)和數(shù)據(jù)分析系統(tǒng)之間建立起高效的數(shù)據(jù)交換通道,確保為教育數(shù)據(jù)分析的實(shí)施提供真實(shí)可用、標(biāo)準(zhǔn)規(guī)范、數(shù)量充足的分析數(shù)據(jù)。
在教育行業(yè)中,尤其是基礎(chǔ)教育行業(yè)中,有眾多的教育應(yīng)用場景需要用到數(shù)據(jù)分析技術(shù),如學(xué)科教育質(zhì)量監(jiān)測分析、中小學(xué)生成長發(fā)展評(píng)價(jià),甚至是教育行政管理決策等。通過引用數(shù)據(jù)分析技術(shù),不但可以有效地支持教學(xué)科研業(yè)務(wù)活動(dòng)的開展,而且還可以科學(xué)有序地推動(dòng)教育教學(xué)的創(chuàng)新與發(fā)展,更可以準(zhǔn)確高效地提升教育管理工作的實(shí)效。針對(duì)教育應(yīng)用而言,統(tǒng)計(jì)分析、數(shù)據(jù)挖掘、數(shù)據(jù)可視化是三種較為常用的數(shù)據(jù)分析技術(shù)。無論選用哪一種數(shù)據(jù)分析技術(shù)開展教育數(shù)據(jù)分析,都應(yīng)當(dāng)明確開展數(shù)據(jù)分析的目標(biāo)定位和意義所在,應(yīng)當(dāng)規(guī)劃設(shè)計(jì)出面向具體應(yīng)用的教育數(shù)據(jù)分析模型,并基于應(yīng)用實(shí)際選擇適合的數(shù)據(jù)分析技術(shù)和具體的技術(shù)實(shí)現(xiàn)途徑。除此之外,還應(yīng)當(dāng)有效地做好教育源數(shù)據(jù)信息的采集工作,務(wù)必確保用于分析的數(shù)據(jù)的質(zhì)量與總量。需要再次強(qiáng)調(diào)的是,構(gòu)建完善的教育數(shù)據(jù)分析系統(tǒng)環(huán)境,并將其整合進(jìn)區(qū)域性教育行業(yè)云平臺(tái)體系建設(shè)之中,這項(xiàng)工作也非常重要。其原因在于,這是推動(dòng)教育數(shù)據(jù)分析技術(shù)進(jìn)入常態(tài)化應(yīng)用并確保順利輸出分析結(jié)果的重要基礎(chǔ)性保障。
科學(xué)、合理地運(yùn)用數(shù)據(jù)分析技術(shù),使之與教育教學(xué)實(shí)現(xiàn)真正的融合,并向我們反饋未知但卻富有價(jià)值的新的教育知識(shí)信息,繼而為推動(dòng)教育教學(xué)的創(chuàng)新與發(fā)展提供來自教育數(shù)據(jù)信息的原動(dòng)力。運(yùn)用數(shù)據(jù)分析技術(shù),讓數(shù)據(jù)賦能教育成為現(xiàn)實(shí)。用好數(shù)據(jù)分析技術(shù),使教育數(shù)字化轉(zhuǎn)型不再遙遠(yuǎn)。