張華麗,楊華勇,楊 帆
(武漢科技大學(xué)城市學(xué)院 信息工程學(xué)部,湖北 武漢 430083)
“不得不承認(rèn),對(duì)于學(xué)生,我們知道得太少”,該問題是美國10大教育類年會(huì)中出鏡率最高的核心議題。同樣,該問題也適用于中國教育者在教學(xué)實(shí)踐過程中的反思。傳統(tǒng)教學(xué)模式下,教師通過課堂教學(xué)過程中與學(xué)生的互動(dòng)交流,以及課后作業(yè)和答疑,了解學(xué)生的思想動(dòng)態(tài)、學(xué)習(xí)態(tài)度及教學(xué)效果,該方式需要教師花費(fèi)大量時(shí)間和精力,同時(shí)效果并不理想,效率較為低下。維克托·邁爾·舍恩伯格曾經(jīng)大膽預(yù)測(cè):“在不久的將來,世界許多單純依靠人類判斷力的領(lǐng)域都會(huì)被計(jì)算機(jī)系統(tǒng)所改變甚至取代?!币虼?,在大數(shù)據(jù)技術(shù)高速發(fā)展的今天,有必要將大數(shù)據(jù)技術(shù)引入到教育教學(xué)環(huán)節(jié)中,通過大數(shù)據(jù)技術(shù)手段采集、存儲(chǔ)、分析與挖掘教學(xué)過程數(shù)據(jù),讓數(shù)據(jù)更好地服務(wù)于教學(xué)[1]。
大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)的區(qū)別在于其數(shù)據(jù)包容性更強(qiáng),數(shù)據(jù)定義更加廣泛,原來人們沒有重視,或者缺乏技術(shù)與方法進(jìn)行收集的信息,現(xiàn)在都可作為“數(shù)據(jù)”進(jìn)行采集、存儲(chǔ)與分析[2]。將大數(shù)據(jù)應(yīng)用于教學(xué)環(huán)節(jié)中,在關(guān)注教學(xué)過程與教學(xué)結(jié)果的基礎(chǔ)上,需要更多地關(guān)注教學(xué)過程中的微觀數(shù)據(jù)。同時(shí),這些數(shù)據(jù)的產(chǎn)生完全是過程性的,包括教師課堂教學(xué)過程、學(xué)生完成作業(yè)過程、師生或生生之間的互動(dòng)過程等,對(duì)相關(guān)數(shù)據(jù)的整合、分析與利用,能夠解答教育過程中的許多疑問。由于這些數(shù)據(jù)是在“自然”狀態(tài)下收集的,收集過程是自然、主動(dòng)、客觀與真實(shí)的[3-4],所以其具有更高的參考價(jià)值。
在當(dāng)前的應(yīng)試教育環(huán)境下,考察教學(xué)結(jié)果與教學(xué)質(zhì)量的通用方式是考試,但考試分?jǐn)?shù)能否反映學(xué)習(xí)與教學(xué)過程,以及能否體現(xiàn)素質(zhì)教育質(zhì)量,答案顯然是否定的[5]。但通過采取相關(guān)技術(shù),可以得到相對(duì)更多與更客觀的教學(xué)數(shù)據(jù),教學(xué)過程中的課堂講授、師生互動(dòng)等教學(xué)各個(gè)環(huán)節(jié)都滲透著這些大數(shù)據(jù)。
當(dāng)前教學(xué)數(shù)據(jù)數(shù)字化存在的主要問題體現(xiàn)在以下幾個(gè)方面:
(1)教育信息資源分布分散與利用率不高。目前我國教育信息資源還無法統(tǒng)一進(jìn)行收集、存儲(chǔ)與管理,各教育管理部門、教學(xué)單位都采用獨(dú)立的信息設(shè)備與信息系統(tǒng),缺乏統(tǒng)一標(biāo)準(zhǔn),所收集的數(shù)據(jù)參差不齊,無法實(shí)現(xiàn)統(tǒng)一利用。
(2)對(duì)教學(xué)微觀數(shù)據(jù)數(shù)字化重視程度不高。當(dāng)前,教育信息化得到了業(yè)界高度重視且發(fā)展迅速,如慕課、翻轉(zhuǎn)課堂、微課和教育云等,有條件的學(xué)校也部署了相關(guān)教學(xué)輔助管理軟件[6-7]。但在教育信息化研究與實(shí)踐過程中,人們更多關(guān)注的是教學(xué)內(nèi)容生產(chǎn)、教學(xué)行為控制與教學(xué)結(jié)果考評(píng),而對(duì)于教學(xué)環(huán)節(jié),特別是教學(xué)的微觀行為數(shù)據(jù)化重視程度不夠。
傳統(tǒng)教學(xué)信息化系統(tǒng)側(cè)重于教學(xué)數(shù)據(jù)的結(jié)構(gòu)化管理,數(shù)據(jù)來源主要集中于教學(xué)單位線下數(shù)據(jù)的采集與錄入,更側(cè)重于顯性數(shù)據(jù)管理[8]。隨著大數(shù)據(jù)的快速發(fā)展,數(shù)據(jù)存儲(chǔ)技術(shù)、存儲(chǔ)手段等都發(fā)生了重大變化。其中,智慧教學(xué)動(dòng)態(tài)生成性數(shù)據(jù)具有多源、異構(gòu)、非完整性、非一致性等特征[9],很多學(xué)者對(duì)其進(jìn)行了大量研究。王冬青等[9]提出智慧教學(xué)動(dòng)態(tài)生成性數(shù)據(jù)采集模型,通過對(duì)教學(xué)過程與行為的分析,確定數(shù)據(jù)采集規(guī)范與標(biāo)準(zhǔn),并采用軟硬件結(jié)合的方式實(shí)現(xiàn)教學(xué)數(shù)據(jù)采集;夏先進(jìn)[10]借鑒檔案管理模式,參考檔案分類的思路與方法,能夠?qū)崿F(xiàn)數(shù)據(jù)的精細(xì)化管理;李婷[11]對(duì)教學(xué)全過程數(shù)據(jù)進(jìn)行采集與分析,構(gòu)建內(nèi)部教學(xué)質(zhì)量監(jiān)控體系,可實(shí)現(xiàn)對(duì)已發(fā)現(xiàn)數(shù)據(jù)的價(jià)值分析。此外,還有眾多特定教學(xué)場(chǎng)景的數(shù)據(jù)采集模式,如教學(xué)儀器數(shù)據(jù)采集[12-14]、GIS數(shù)據(jù)采集[13]、手持掃描儀數(shù)據(jù)采集[15]等。本文探討教學(xué)過程數(shù)據(jù)采集,側(cè)重于微觀數(shù)據(jù)、過程數(shù)據(jù)和廣義數(shù)據(jù)的采集與存儲(chǔ)。
倡導(dǎo)與強(qiáng)化教育數(shù)據(jù)收集的標(biāo)準(zhǔn)化,以便對(duì)教學(xué)過程數(shù)據(jù)進(jìn)行比較,提高數(shù)據(jù)分析結(jié)果的有效性、可視性與可讀性,從而及時(shí)有效地改進(jìn)教學(xué)服務(wù);研究并改進(jìn)學(xué)科數(shù)據(jù)模型,讓模型能夠體現(xiàn)教學(xué)內(nèi)容,從而優(yōu)化教學(xué)過程,使教學(xué)過程更加符合科學(xué)規(guī)律;通過建立綜合過程記錄模型、學(xué)習(xí)輔助模型、內(nèi)容推薦模型、知識(shí)關(guān)聯(lián)模型及效果評(píng)估模型,提高教學(xué)效率與教學(xué)效果。
(1)評(píng)估多元化。改變傳統(tǒng)單一的考試評(píng)估方式,利用教學(xué)過程微觀數(shù)據(jù)對(duì)學(xué)生學(xué)習(xí)行為進(jìn)行多元化評(píng)估,通過對(duì)過程數(shù)據(jù)的挖掘,發(fā)現(xiàn)教學(xué)過程和教學(xué)成果的因果關(guān)系,使結(jié)果評(píng)價(jià)更加科學(xué)化。
(2)教學(xué)效果評(píng)估過程化。綜合分析教學(xué)過程與學(xué)習(xí)行為,讓過程數(shù)據(jù)參與結(jié)果評(píng)估,改變單一的成績(jī)?cè)u(píng)價(jià)模式。教學(xué)過程數(shù)據(jù)形成的大數(shù)據(jù)能夠?yàn)榻虒W(xué)決策提供可靠的數(shù)據(jù)支撐。
(3)教學(xué)精確化與科學(xué)化。利用大數(shù)據(jù)技術(shù)采集與存儲(chǔ)教學(xué)全過程微觀數(shù)據(jù),可為教學(xué)研究與教學(xué)評(píng)估提供科學(xué)依據(jù),讓教學(xué)評(píng)價(jià)由“結(jié)果性評(píng)價(jià)”變?yōu)椤斑^程性評(píng)價(jià)”。教育管理者可通過分析大數(shù)據(jù),加強(qiáng)教學(xué)引導(dǎo),調(diào)整發(fā)展策略,使教育過程管理更加精細(xì)化與科學(xué)化。
(4)提倡個(gè)性化教學(xué)。利用大數(shù)據(jù)技術(shù),可幫助教師發(fā)現(xiàn)學(xué)生興趣點(diǎn),從而采取更有效的教學(xué)方式與教學(xué)手段,做到因材施教。通過個(gè)性化教學(xué),可充分發(fā)揮學(xué)生的主觀能動(dòng)性,提高學(xué)生學(xué)習(xí)效率。
實(shí)現(xiàn)教學(xué)數(shù)據(jù)的采集和利用,在了解教學(xué)規(guī)律的基礎(chǔ)上,利用有效的技術(shù)手段與先進(jìn)的管理思想,實(shí)現(xiàn)教學(xué)相長(zhǎng),提高教學(xué)質(zhì)量。
(1)研究教學(xué)微觀數(shù)據(jù)收集的技術(shù)手段。如何客觀、全面與便捷地收集教學(xué)活動(dòng)微觀數(shù)據(jù)是課題研究的出發(fā)點(diǎn)和核心內(nèi)容,教學(xué)過程中收集的微觀數(shù)據(jù)越細(xì)致,數(shù)據(jù)來源越可靠,數(shù)據(jù)真實(shí)性越高,數(shù)據(jù)對(duì)教學(xué)決策與教學(xué)研究的指導(dǎo)價(jià)值則越高。
(2)制定數(shù)據(jù)收集范圍與數(shù)據(jù)集。為了規(guī)范數(shù)據(jù)收集范圍和元數(shù)據(jù)屬性集合,需要制定教學(xué)數(shù)據(jù)的收集范圍與數(shù)據(jù)集。收集范圍確定要收集的數(shù)據(jù)業(yè)務(wù)范圍,即教學(xué)管理環(huán)節(jié)與教學(xué)過程中哪些數(shù)據(jù)需要采集;數(shù)據(jù)集是指需要收集的常量數(shù)據(jù),其中最關(guān)鍵的是制定教學(xué)術(shù)語數(shù)據(jù)集。
(3)建立大數(shù)據(jù)模型,制定數(shù)據(jù)存儲(chǔ)規(guī)范。教學(xué)過程數(shù)據(jù)來源多樣,類型復(fù)雜,如何實(shí)現(xiàn)數(shù)據(jù)的標(biāo)準(zhǔn)化存儲(chǔ),以方便數(shù)據(jù)利用,需要設(shè)計(jì)數(shù)據(jù)存儲(chǔ)模型,并制定數(shù)據(jù)存儲(chǔ)規(guī)范。
(4)制定數(shù)據(jù)利用接口規(guī)范。存儲(chǔ)的大數(shù)據(jù)最終用于教學(xué)服務(wù),為教學(xué)決策與教學(xué)過程提供數(shù)據(jù)支撐材料,所以需要制定數(shù)據(jù)利用的接口規(guī)范,并確定接口調(diào)用的技術(shù)手段,以SAAS方式向教育工作者提供數(shù)據(jù)服務(wù)。
大數(shù)據(jù)具有體量大(Volume)、種類多(Variety)、速度快(Velocity)、易變性(Variability)、真實(shí)性(Veracity)和價(jià)值密度低(Value)六大特性[16]。大數(shù)據(jù)環(huán)境下的教學(xué)數(shù)據(jù)數(shù)字化相比于傳統(tǒng)的教學(xué)數(shù)據(jù)數(shù)字化,在研究視角、研究目標(biāo)與研究方法上都有非常大的區(qū)別,因此要以更開闊的視野看待大數(shù)據(jù)對(duì)傳統(tǒng)教學(xué)模式的影響與可能產(chǎn)生的變革。
教學(xué)活動(dòng)流的分析過程包括數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)分析與預(yù)測(cè)建議4個(gè)關(guān)鍵環(huán)節(jié),4個(gè)環(huán)節(jié)既相互獨(dú)立,又緊密關(guān)聯(lián)、相輔相成。
目前主要的教學(xué)管理系統(tǒng)還是采用傳統(tǒng)的關(guān)系數(shù)據(jù)庫對(duì)持久化數(shù)據(jù)進(jìn)行存儲(chǔ)與管理,傳統(tǒng)關(guān)系數(shù)據(jù)庫對(duì)于小規(guī)模數(shù)據(jù)和結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ)與處理具有較大優(yōu)勢(shì),而對(duì)于海量、異構(gòu)的教學(xué)過程數(shù)據(jù),關(guān)系型數(shù)據(jù)庫則顯得力不從心。隨著近幾年大數(shù)據(jù)技術(shù)發(fā)展越來越成熟,學(xué)習(xí)與開發(fā)成本也越來越低。將大數(shù)據(jù)技術(shù)應(yīng)用于教學(xué)過程中,能夠有效解決海量異構(gòu)數(shù)據(jù)的存儲(chǔ)與分析難題。大數(shù)據(jù)主要有兩個(gè)特點(diǎn):①海量數(shù)據(jù),即數(shù)據(jù)體量巨大,從TB級(jí)別躍升到PB級(jí)別;②數(shù)據(jù)格式復(fù)雜,無法使用傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)描述所有數(shù)據(jù)格式。要實(shí)現(xiàn)復(fù)雜、海量教學(xué)數(shù)據(jù)的數(shù)字化存儲(chǔ),其關(guān)鍵技術(shù)主要包括:
(1)異構(gòu)數(shù)據(jù)存儲(chǔ)。異構(gòu)數(shù)據(jù)也即復(fù)雜類型數(shù)據(jù),其沒有統(tǒng)一的數(shù)據(jù)結(jié)構(gòu)。異構(gòu)數(shù)據(jù)庫系統(tǒng)是相關(guān)多個(gè)數(shù)據(jù)庫系統(tǒng)的集合,可以實(shí)現(xiàn)數(shù)據(jù)的共享與透明訪問。異構(gòu)數(shù)據(jù)庫的各個(gè)組成部分在實(shí)現(xiàn)數(shù)據(jù)共享的同時(shí),每個(gè)數(shù)據(jù)庫系統(tǒng)仍能保持自身應(yīng)用特性的完整性及安全性。
(2)大數(shù)據(jù)存儲(chǔ)。大數(shù)據(jù)改變了人們的思維模式、生活方式與工作方式。大數(shù)據(jù)技術(shù)可以“數(shù)據(jù)化”教師與學(xué)生的行為表現(xiàn),深入挖掘?qū)W生成長(zhǎng)規(guī)律。近幾年,隨著大數(shù)據(jù)技術(shù)的高速發(fā)展,產(chǎn)生了很多優(yōu)秀的開源大數(shù)據(jù)框架,這些框架已被廣泛應(yīng)用于大規(guī)模實(shí)際生產(chǎn)中。
(3)數(shù)據(jù)挖掘與利用。如何讓數(shù)據(jù)說話,從數(shù)據(jù)中發(fā)現(xiàn)價(jià)值是教學(xué)數(shù)據(jù)數(shù)字化的關(guān)鍵。數(shù)據(jù)挖掘技術(shù)已廣泛應(yīng)用于各個(gè)領(lǐng)域,可將其它行業(yè)的先進(jìn)經(jīng)驗(yàn)引入教育行業(yè),并結(jié)合教育教學(xué)特點(diǎn),提高數(shù)據(jù)挖掘效率,使教學(xué)數(shù)據(jù)價(jià)值最大化。
教學(xué)過程數(shù)據(jù)采集貫穿教學(xué)全過程,借助教學(xué)管理平臺(tái)、網(wǎng)絡(luò)課程教學(xué)平臺(tái)與移動(dòng)應(yīng)用等技術(shù)手段,收集教學(xué)過程中的所有數(shù)據(jù)。
圖1 數(shù)據(jù)化教學(xué)過程設(shè)計(jì)
(1)課程預(yù)習(xí)。課程預(yù)習(xí)階段,學(xué)生預(yù)習(xí)的介質(zhì)不再局限于單一教材,學(xué)生可以通過網(wǎng)絡(luò)搜索引擎、微課、視頻公開課、專業(yè)論壇等網(wǎng)絡(luò)工具,收集學(xué)習(xí)資料;通過小組討論,激發(fā)學(xué)習(xí)興趣,提高自學(xué)能力;最后整理素材,撰寫預(yù)習(xí)報(bào)告。在預(yù)習(xí)過程中,需要收集預(yù)習(xí)全過程數(shù)據(jù),如搜索關(guān)鍵字、瀏覽過的網(wǎng)頁和論壇、小組討論過程記錄、預(yù)習(xí)耗時(shí)、已解決問題等信息,這些材料不僅能幫助教師了解學(xué)生預(yù)習(xí)動(dòng)態(tài),確定課堂教學(xué)重難點(diǎn),還可作為教學(xué)素材。
(2)課程教學(xué)。以學(xué)生課前預(yù)習(xí)數(shù)據(jù)為依據(jù),教師制定科學(xué)、合理的教學(xué)計(jì)劃,有的放矢地幫助學(xué)生解決學(xué)習(xí)難點(diǎn)問題,加深對(duì)知識(shí)的理解,培養(yǎng)知識(shí)運(yùn)用能力。課堂教學(xué)采集數(shù)據(jù)主要包括:①課堂紀(jì)律數(shù)據(jù),如學(xué)生到課情況、課堂紀(jì)律、學(xué)生參與程度等;②教學(xué)過程數(shù)據(jù),如教學(xué)內(nèi)容數(shù)據(jù)、教學(xué)板書、課堂筆記、師生互動(dòng)情況、教學(xué)過程素材、初步教學(xué)效果評(píng)估等。
(3)課后復(fù)習(xí)。課后復(fù)習(xí)主要包括課后答疑、課后作業(yè)、學(xué)生反饋、效果評(píng)估與知識(shí)拓展等內(nèi)容。課后復(fù)習(xí)過程中產(chǎn)生的數(shù)據(jù)可以幫助學(xué)生鞏固課堂內(nèi)容,同時(shí)幫助教師了解課堂教學(xué)效果。
教學(xué)過程數(shù)據(jù)采集借助各教學(xué)單位已有的信息化設(shè)備和信息化系統(tǒng),通過定義標(biāo)準(zhǔn)的數(shù)據(jù)采集與接收接口,采集教學(xué)過程數(shù)據(jù)并進(jìn)行統(tǒng)一存儲(chǔ)。教學(xué)過程數(shù)據(jù)主要包括的數(shù)據(jù)類型如表1所示。
表1 教學(xué)過程數(shù)據(jù)類型
由于教學(xué)過程數(shù)據(jù)的多樣性與多元化,要將教學(xué)過程的微觀數(shù)據(jù)全部進(jìn)行存儲(chǔ),采用單一的數(shù)據(jù)存儲(chǔ)模式已無法滿足需求。通過對(duì)教學(xué)過程數(shù)據(jù)類型的分析,可以采用分布式文件存儲(chǔ)、關(guān)系型數(shù)據(jù)庫存儲(chǔ)與異構(gòu)型數(shù)據(jù)存儲(chǔ)3種方式存儲(chǔ)教學(xué)過程數(shù)據(jù)。
圖2 教學(xué)過程數(shù)據(jù)存儲(chǔ)方式
大數(shù)據(jù)是指類型復(fù)雜的海量數(shù)據(jù),即其數(shù)據(jù)結(jié)構(gòu)已無法使用傳統(tǒng)關(guān)系型數(shù)據(jù)庫進(jìn)行描述與存儲(chǔ)。近幾年,隨著大數(shù)據(jù)技術(shù)的高速發(fā)展,形成了很多優(yōu)秀的開源大數(shù)據(jù)框架,并已被廣泛應(yīng)用于大規(guī)模實(shí)際生產(chǎn)中。Hadoop是一個(gè)分布式系統(tǒng)基礎(chǔ)架構(gòu),可實(shí)現(xiàn)對(duì)海量數(shù)據(jù)的存儲(chǔ)與分析,其利用HDFS存儲(chǔ)數(shù)據(jù),并使用MapReduce對(duì)海量數(shù)據(jù)進(jìn)行計(jì)算[20];Apache Spark 是專為大規(guī)模數(shù)據(jù)處理而設(shè)計(jì)的一個(gè)快速、通用的計(jì)算引擎,適用于數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)等需要迭代的MapReduce的算法[21]。
本文通過分析當(dāng)前教育教學(xué)中面臨的問題,提出教學(xué)過程數(shù)據(jù)數(shù)字化的研究?jī)?nèi)容與研究目標(biāo),并結(jié)合當(dāng)前大數(shù)據(jù)發(fā)展實(shí)際,研究實(shí)現(xiàn)教學(xué)過程數(shù)據(jù)數(shù)字化的技術(shù)手段。通過采集與存儲(chǔ)教學(xué)過程微觀數(shù)據(jù),讓數(shù)據(jù)輔助教學(xué)過程,從而提高教學(xué)質(zhì)量,并為教學(xué)評(píng)價(jià)提供數(shù)據(jù)支撐。隨著數(shù)據(jù)挖掘與人工智能技術(shù)的高速發(fā)展,以數(shù)字化方式存儲(chǔ)的教學(xué)過程數(shù)據(jù)將為教育發(fā)展提供強(qiáng)大的推動(dòng)力。