隨著人們對(duì)知識(shí)的需求不斷增加且變得越發(fā)迫切,知識(shí)發(fā)現(xiàn)研究日益受到關(guān)注,而基于大數(shù)據(jù)的知識(shí)發(fā)現(xiàn)有助于挖掘課堂教學(xué)行為和教師實(shí)踐性知識(shí)的數(shù)據(jù)樣貌,為理解教育教學(xué)現(xiàn)象及其本質(zhì)提供深刻的洞見(jiàn)。首都師范大學(xué)教授王陸結(jié)合團(tuán)隊(duì)22年來(lái)扎根中小學(xué)課堂的實(shí)踐,深入淺出地介紹了基于大數(shù)據(jù)的知識(shí)發(fā)現(xiàn)視頻課例中數(shù)據(jù)分析與挖掘的三種促進(jìn)教師專業(yè)發(fā)展的應(yīng)用模式。
作者簡(jiǎn)介
王陸 首都師范大學(xué)教育技術(shù)研究所所長(zhǎng)
首都師范大學(xué)現(xiàn)代教育技術(shù)重點(diǎn)實(shí)驗(yàn)室主任
北京市基礎(chǔ)教育信息化實(shí)驗(yàn)教學(xué)示范中心主任
引言
大數(shù)據(jù)即巨量的資料,指的是專業(yè)領(lǐng)域中所創(chuàng)造的大量非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)。什么是非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)?就視頻課例這一特定的研究情境來(lái)說(shuō),典型的非結(jié)構(gòu)化數(shù)據(jù)就是我們?cè)谡n堂中所錄下來(lái)的課堂錄像;半結(jié)構(gòu)化數(shù)據(jù)就是包含圖形、符號(hào)、數(shù)據(jù)等形式的文檔,如教師課前撰寫(xiě)的教學(xué)設(shè)計(jì)方案文本以及課后撰寫(xiě)的反思文本。
在視頻課例研究中,我所在團(tuán)隊(duì)開(kāi)發(fā)的靠譜COP項(xiàng)目研究成果包含了兩大類型數(shù)據(jù)——非結(jié)構(gòu)化型數(shù)據(jù)和半結(jié)構(gòu)化型數(shù)據(jù),分別對(duì)應(yīng)了課堂教學(xué)行為大數(shù)據(jù)和實(shí)踐性知識(shí)大數(shù)據(jù)。在搞清楚什么是大數(shù)據(jù)、課堂教學(xué)行為大數(shù)據(jù)、實(shí)踐性知識(shí)大數(shù)據(jù)后,我將從四個(gè)方面對(duì)視頻課例進(jìn)行分析和探究。
洞見(jiàn)大數(shù)據(jù)知識(shí)發(fā)現(xiàn)
的新見(jiàn)解
知識(shí)發(fā)現(xiàn)是指從數(shù)據(jù)集中提取有效的、新穎的、潛在有用的、可理解的模式的非平凡過(guò)程。同時(shí),隨著計(jì)算與網(wǎng)絡(luò)通信技術(shù)、觀測(cè)與傳感儀器以及數(shù)字存儲(chǔ)的發(fā)展,教育學(xué)科同很多學(xué)科一樣,正在從數(shù)據(jù)貧乏轉(zhuǎn)變?yōu)閿?shù)據(jù)富集的研究領(lǐng)域,一種新的透鏡——大數(shù)據(jù)正在影響著研究者看待和認(rèn)識(shí)教育教學(xué)問(wèn)題的方式,也逐漸形成了從數(shù)據(jù)中提取新知識(shí)的有效途徑?!白寯?shù)據(jù)說(shuō)話”開(kāi)始成為教育學(xué)研究領(lǐng)域的一種理論主張,基于大數(shù)據(jù)的知識(shí)發(fā)現(xiàn)為教育學(xué)的研究找到了新起點(diǎn),也將獲得更深刻的洞見(jiàn)。
數(shù)據(jù)是知識(shí)發(fā)現(xiàn)的基礎(chǔ)與前提,數(shù)據(jù)處理的理論、方法與技術(shù)勢(shì)必影響知識(shí)發(fā)現(xiàn)的過(guò)程與結(jié)果。大數(shù)據(jù)的知識(shí)發(fā)現(xiàn)主要取決于兩個(gè)關(guān)鍵部分:一是數(shù)據(jù)獲取能力,即對(duì)數(shù)據(jù)獲得、共享、整合、分析以及構(gòu)建預(yù)測(cè)模型的能力,要獲取足夠多、足夠復(fù)雜、足夠蘊(yùn)含復(fù)雜關(guān)系的數(shù)據(jù);二是數(shù)據(jù)分析能力,即將精細(xì)的概率模型、統(tǒng)計(jì)推理、數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)相結(jié)合。
當(dāng)然,知識(shí)發(fā)現(xiàn)不可能無(wú)中生有地創(chuàng)造知識(shí),數(shù)據(jù)、信息、實(shí)物、現(xiàn)象之間普遍存在的各種關(guān)系是進(jìn)行知識(shí)發(fā)現(xiàn)的基本依據(jù),盡管在現(xiàn)實(shí)世界中有些關(guān)系是顯性的、直接的、較為容易發(fā)現(xiàn)的,甚至可以觀測(cè)到的,但是絕大部分關(guān)系還是隱性的,隱藏在我們數(shù)據(jù)信息事物和現(xiàn)象中,不容易被發(fā)現(xiàn)。其基本關(guān)系可以分為五種:因果關(guān)系,因時(shí)間而形成,是歸納、演繹等知識(shí)發(fā)現(xiàn)方法的基礎(chǔ);相似關(guān)系,因特征相似而形成,是類比、想象、聯(lián)想等知識(shí)發(fā)現(xiàn)方法的基礎(chǔ);結(jié)構(gòu)關(guān)系,因空間而形成,是系統(tǒng)、綜合等知識(shí)發(fā)現(xiàn)方法的基礎(chǔ);邏輯關(guān)系,因邏輯而形成,是分類、比較等知識(shí)發(fā)現(xiàn)方法的基礎(chǔ);數(shù)量關(guān)系,因數(shù)據(jù)而形成,是統(tǒng)計(jì)學(xué)、數(shù)學(xué)等知識(shí)發(fā)現(xiàn)方法的基礎(chǔ)。
大數(shù)據(jù)時(shí)代知識(shí)發(fā)現(xiàn)的思維模式超越了傳統(tǒng)數(shù)據(jù)分析和數(shù)據(jù)演繹的思維局限性,特別強(qiáng)調(diào)三個(gè)特點(diǎn)。1.整體兼顧部分:從方法論上看,“全數(shù)據(jù)模式”注重運(yùn)用整體方法把握事物,但要克服其局限性,兼顧部分,深化認(rèn)識(shí),重視還原事物的層次性。2.量化整合質(zhì)化:從內(nèi)容上看,質(zhì)化研究與量化研究應(yīng)該是統(tǒng)一的、相互補(bǔ)充的——質(zhì)化研究為量化研究奠定基礎(chǔ),是量化研究的依據(jù);而量化研究是質(zhì)化研究的具體化,使質(zhì)化研究更為科學(xué)、準(zhǔn)確。3.因果強(qiáng)調(diào)相關(guān):因果關(guān)系是客觀存在的,是我們認(rèn)識(shí)世界本質(zhì)的邏輯前提;即便大數(shù)據(jù)更側(cè)重強(qiáng)調(diào)相關(guān)關(guān)系,也始終離不開(kāi)對(duì)因果關(guān)系的追求,這是由思維的本性所決定的,側(cè)重相關(guān)分析并沒(méi)有否定因果分析。
目前,我們正生活在數(shù)據(jù)的海洋中。然而,數(shù)據(jù)不等同于信息,信息也不等同于知識(shí),知識(shí)更不等同于智慧。如果我們不能將數(shù)據(jù)轉(zhuǎn)化成信息,再轉(zhuǎn)化為知識(shí),再涌現(xiàn)出智慧的方法與技術(shù),那么我們就會(huì)身處數(shù)據(jù)的海洋,卻忍受著知識(shí)的饑渴。此時(shí),基于大數(shù)據(jù)的知識(shí)發(fā)現(xiàn)服務(wù)應(yīng)運(yùn)而生。我所在團(tuán)隊(duì)開(kāi)發(fā)的靠譜COP項(xiàng)目就是一種知識(shí)發(fā)現(xiàn)服務(wù),著眼于課堂教學(xué)行為大數(shù)據(jù)和實(shí)踐性知識(shí)大數(shù)據(jù),兩組數(shù)據(jù)相互影響,實(shí)踐性知識(shí)決定了教師課堂教學(xué)行為,而教師課堂教學(xué)行為的改進(jìn),可以反作用于實(shí)踐性知識(shí),強(qiáng)化甚至重構(gòu)實(shí)踐性知識(shí)。兩組大數(shù)據(jù)的常模數(shù)據(jù)庫(kù)集群為深度的視頻課例研究奠定了堅(jiān)實(shí)的基礎(chǔ)。
破解基于視頻課例的知識(shí)發(fā)現(xiàn)方法
視頻課例一般具有四個(gè)工具屬性:一是可以跨越時(shí)空限制被反復(fù)觀看。視頻課例分析能夠提供研究者一種來(lái)自研究場(chǎng)域的、永久的且可以支持研究者重復(fù)觀察的研究資料,從而使得研究者可以發(fā)現(xiàn)傳統(tǒng)觀察方式無(wú)法獲得的、但也許很重要的線索與知識(shí)。二是能夠忠實(shí)地記錄復(fù)雜課堂教學(xué)的細(xì)節(jié)以及口語(yǔ)數(shù)據(jù)以外(動(dòng)作、表情等)的事件信息。三是視頻課例記錄可避免教師自陳資料中發(fā)生的社會(huì)期望偏差。二、三兩個(gè)工具屬性可有效降低因研究者自身的經(jīng)驗(yàn)和自信而造成的個(gè)人主觀意見(jiàn)所形成的確認(rèn)偏差,從而提高研究的可靠性。四是允許跨領(lǐng)域分析并可用于不同分析方法。視頻課例分析并不限定于特定的研究方法,可用于民族志、言語(yǔ)分析、互動(dòng)分析、會(huì)話分析等研究中,也可以經(jīng)過(guò)適當(dāng)編碼、計(jì)數(shù)等轉(zhuǎn)換程序后,同時(shí)使用量化與質(zhì)性等方法。因此,視頻課例為教育教學(xué)研究開(kāi)辟了新的空間和新的領(lǐng)域。
基于大數(shù)據(jù)的視頻課例知識(shí)發(fā)現(xiàn)方法包括資料收集、資料管理和資料分析三個(gè)階段,包括“現(xiàn)象—表征—樣貌—知識(shí)”循環(huán)往復(fù)的知識(shí)發(fā)現(xiàn)路徑。
一、現(xiàn)象
教學(xué)現(xiàn)象是理解與研究課堂教學(xué)活動(dòng)規(guī)律與本質(zhì)的重要切入點(diǎn)。然而,無(wú)論是進(jìn)入課堂的研究者,還是身處課堂的廣大中小學(xué)教師,即使有了研究的意識(shí),面對(duì)復(fù)雜多變的教學(xué)現(xiàn)象,也不知如何研究,從而導(dǎo)致了當(dāng)前的教學(xué)規(guī)律更多的是研究者通過(guò)主觀臆想或演繹推論得出的,較少是從復(fù)雜、多變的教學(xué)現(xiàn)象的觀察研究中得出的。
那么,教學(xué)現(xiàn)象是如何形成的呢?教學(xué)現(xiàn)象是由教學(xué)行為導(dǎo)致的,教學(xué)現(xiàn)象因課堂教學(xué)行為的差異性而具有豐富性和多樣性;大數(shù)據(jù)自身蘊(yùn)含的模式與關(guān)系就可以對(duì)復(fù)雜的現(xiàn)象產(chǎn)生知識(shí)洞見(jiàn)。
在日常的課堂觀察中,我們往往會(huì)有這樣的評(píng)價(jià):優(yōu)秀教師的課堂教學(xué)很深入、很有效;低水平教師的課堂教學(xué)很淺顯,有效性很差。但評(píng)價(jià)從何得出呢?我們往往無(wú)法詳細(xì)列舉。但有了大數(shù)據(jù)的輔助——教學(xué)行為轉(zhuǎn)換序列網(wǎng)絡(luò)關(guān)系圖,我們就可以很容易地對(duì)其進(jìn)行描述。教學(xué)行為轉(zhuǎn)換序列網(wǎng)絡(luò)關(guān)系圖分為六個(gè)層次,從低到高依次為記憶、理解、運(yùn)用、分析、評(píng)價(jià)、創(chuàng)造,通過(guò)研究發(fā)現(xiàn),優(yōu)秀教師的課堂教學(xué)不僅在低級(jí)階層有很多的認(rèn)知活動(dòng)(記憶、理解、運(yùn)用),同時(shí)在高級(jí)階層仍然有很多認(rèn)知活動(dòng)(分析、評(píng)價(jià)、創(chuàng)造),而且低級(jí)階層和高級(jí)階層之間有很多的互動(dòng);但低水平教師的課堂教學(xué)大部分停留在記憶和理解階層。由此我們便可以對(duì)之前的評(píng)價(jià)進(jìn)行詳細(xì)的描述。
二、表征
表征是數(shù)據(jù)信息的呈現(xiàn)方式,特指當(dāng)事物從“感性存在”轉(zhuǎn)變?yōu)椤皵?shù)字存在”時(shí)數(shù)據(jù)所構(gòu)成的事物表象。大數(shù)據(jù)是對(duì)真實(shí)世界的表征與映射,由于任何形式的表征都會(huì)帶來(lái)信息的丟失,所以一般主張應(yīng)該直接對(duì)視頻課例進(jìn)行編碼而略過(guò)表征的環(huán)節(jié)。本文對(duì)此不作贅述。
三、樣貌
樣貌指意義上的表象,意為真實(shí)世界中的知識(shí)可計(jì)算與可視化地賦予數(shù)據(jù)的外貌。編碼體系和記號(hào)體系兩大類方法可以有效賦予課堂教學(xué)行為以數(shù)據(jù)的樣貌。編碼體系方法要求確定要觀察的具體項(xiàng)目,然后對(duì)準(zhǔn)備觀察的具體項(xiàng)目進(jìn)行編碼。編碼體系通常采用時(shí)間取樣法,觀察在特定的時(shí)間內(nèi)發(fā)生的特定行為,并以行為編碼表示。記號(hào)體系也叫項(xiàng)目清單,是指預(yù)先列出一些需要觀察并且有可能發(fā)生的行為,觀察者在每一種要觀察的事件或行為發(fā)生時(shí)做個(gè)記號(hào)。
除此之外,人工智能機(jī)器學(xué)習(xí)等算法可以有效賦予實(shí)踐性知識(shí)以數(shù)據(jù)的樣貌。例如我所在團(tuán)隊(duì)從六個(gè)維度(教育信念、自我知識(shí)、人際知識(shí)、策略知識(shí)、情境知識(shí)、反思知識(shí))對(duì)實(shí)踐性知識(shí)數(shù)據(jù)進(jìn)行了分析,結(jié)果顯示,新手教師和成熟教師的人際知識(shí)增長(zhǎng)最快,而勝任教師策略知識(shí)增長(zhǎng)最快。
四、知識(shí)
知識(shí)是人類在改造世界和社會(huì)實(shí)踐中獲得的認(rèn)識(shí)與經(jīng)驗(yàn)的綜合,傳統(tǒng)的知識(shí)生產(chǎn)方式主要是理論驅(qū)動(dòng)式的生產(chǎn)模式,這是一種精英化的知識(shí)生產(chǎn)方式。隨著大數(shù)據(jù)智能時(shí)代的到來(lái),已經(jīng)形成了從人類獲取與產(chǎn)生的各種數(shù)據(jù)中提取知識(shí)的新途徑,數(shù)據(jù)驅(qū)動(dòng)的知識(shí)已經(jīng)成為認(rèn)識(shí)人和社會(huì)的全新的知識(shí)來(lái)源。大數(shù)據(jù)為什么可以產(chǎn)生數(shù)據(jù)驅(qū)動(dòng)的知識(shí)呢?這是因?yàn)榇髷?shù)據(jù)具有三大特性:精準(zhǔn)數(shù)據(jù)追溯能力、協(xié)同數(shù)據(jù)驅(qū)動(dòng)能力、可視化數(shù)據(jù)決策能力。大數(shù)據(jù)解釋了一種新的知識(shí)發(fā)現(xiàn)路徑,從海量的數(shù)據(jù)中挖掘出其背后具有規(guī)律性的“小模式”。例如,我所在團(tuán)隊(duì)針對(duì)福建省廈門市思明區(qū)教師三年的成長(zhǎng)路徑數(shù)據(jù)挖掘出十條有效的發(fā)展路徑(見(jiàn)下表),這就是大數(shù)據(jù)背后發(fā)現(xiàn)的“小模式”,也是數(shù)據(jù)的一種高級(jí)表達(dá)形式。
從“現(xiàn)象—表征—樣貌—知識(shí)”的知識(shí)發(fā)現(xiàn)路徑,我們經(jīng)歷了經(jīng)驗(yàn)科學(xué)、理論科學(xué)、計(jì)算(實(shí)證)科學(xué)、數(shù)據(jù)驅(qū)動(dòng)型(大數(shù)據(jù))科研四代范式。當(dāng)前我們正經(jīng)歷著第四代范式,與第三代研究范式相比較,其分析思路從“假設(shè)—驗(yàn)證”變?yōu)榱恕鞍l(fā)現(xiàn)—總結(jié)”,分析過(guò)程從“定性—定量—再定性”變?yōu)榱恕岸俊ㄐ浴?,邏輯關(guān)系從“分布理論—概率保證—總體推斷”變?yōu)榱恕皩?shí)際分布—總體特征—概率判斷”??梢哉f(shuō),隨著研究水平的提高以及數(shù)據(jù)可得性、易得性的提升,我們的知識(shí)研究已經(jīng)發(fā)生了根本性的轉(zhuǎn)變。